登录
首页 > 家电新闻 > 图像编辑领域的ImageNet?苹果用Nano Banana开源一个超大数据集

图像编辑领域的ImageNet?苹果用Nano Banana开源一个超大数据集

发布时间:2025-10-28 17:18:31

苹果在大模型和大模型应用上总是慢人一步。

Apple Intelligence 发布也已经一年多了,除去其仍未能在国行设备上提供服务外,功能上也很难称得上有多好用。

就拿视觉生成类功能举例子,苹果的图像生成大概是这个画风:



但在开放研究领域里,苹果似乎一整个脱胎换骨,在纯粹的研究中经常会有一些出彩的工作。

但这次苹果发布的研究成果的确出人意料:

他们用谷歌的 Nano-banana 模型做个了视觉编辑领域的 ImageNet。



对于苹果用纳米香蕉和 Gemini 的事情,引发了网友遐想:



在文本引导的图像编辑的工作中,GPT4-o 和谷歌 Nano-banana 都能够实现令人惊艳的编辑效果,保留原图像的特征,实现高质量的新图像的生成。尤其是 Nano-banana,真正能被成为图像编辑的里程碑和新标杆。

但目前在研究界仍然缺乏针对图像编辑的,来自真实图像的大规模,高质量的开放数据集。

为此,来自苹果的研究团队提出Pico-Banana-400K,一个包含 40 万张图像的基于指令的图像编辑综合数据集。

Copyright 2012-2025 家电库 版权所有  京ICP备20132067号-1