当地时间8月26日
google宣布了其最新的
图象天生及编纂模子
Gemini 2.5 Flash Image
(代号“Nano Banana”纳米喷鼻蕉)
模子一经宣布
便引发广泛关注
?
凭据google官方表述
Gemini 2.5 Flash Image
焦点亮点是图象编纂能力
?
这一模子可以将多张图象
混淆到一张图象中
连结高度的脚色一致性
另有能利用天然语言
举行有针对于性的修改
并充实使用Gemini的“知识贮备”
来天生及编纂图象

Gemini 2.5 Flash Image于文生图与图象编纂两个场景均位列榜首
图源:36氪
?
除了了脚色一致性
于衬着文本方面
该模子可以正确天生
包罗清楚易读且位置合理的
文本的图片
?
于物理知识方面
模子体现也较为精彩
凭据google的案例
向模子输入
气球飘向神仙掌的图象后
提醒其
想象天生下一个可能的情况
从画面来看
模子可以或许预判
气球爆炸后的物理特性

?
有媒体报导称
该模子各方面体现可谓优异
不管是脚色的一致性
提醒词的追随
物理逻辑的真实性
另有是画面审美方面
都连结了水准

针对于深度伪造图象日趋增多
致使用户难以鉴别
收集信息真实性的问题
google为AI天生的图象
添加视觉水印
并于元数据中嵌入标识信息
?
有业内子士体现
这次google新模子的宣布
不仅是一次技术进级
或者将资助google缩小
与OpenAI之间的差距
?
参考:杭州日报、第一财经、腾讯新闻、36氪
-星空电竞