Copyright 2012-2025 家电库 版权所有 京ICP备20132067号-1
苹果在大模型和大模型应用上总是慢人一步。
Apple Intelligence 发布也已经一年多了,除去其仍未能在国行设备上提供服务外,功能上也很难称得上有多好用。
就拿视觉生成类功能举例子,苹果的图像生成大概是这个画风:

但在开放研究领域里,苹果似乎一整个脱胎换骨,在纯粹的研究中经常会有一些出彩的工作。
但这次苹果发布的研究成果的确出人意料:
他们用谷歌的 Nano-banana 模型做个了视觉编辑领域的 ImageNet。

对于苹果用纳米香蕉和 Gemini 的事情,引发了网友遐想:

在文本引导的图像编辑的工作中,GPT4-o 和谷歌 Nano-banana 都能够实现令人惊艳的编辑效果,保留原图像的特征,实现高质量的新图像的生成。尤其是 Nano-banana,真正能被成为图像编辑的里程碑和新标杆。
但目前在研究界仍然缺乏针对图像编辑的,来自真实图像的大规模,高质量的开放数据集。
为此,来自苹果的研究团队提出Pico-Banana-400K,一个包含 40 万张图像的基于指令的图像编辑综合数据集。