AI热点 4小时前 157 阅读 0 评论

一个火爆外网的AI模型,吊打sd、flux?!

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

最近,一个叫 nano-banana 的神秘 AI 生图模型火了!


说它神秘,是因为到现在也没有公司出来认领这个模型。


而且它的火爆也不是靠什么营销,而是凭借它出色的性能大家的“口口相传”。


甚至有网友评价它是人物一致性新王AI 图片编辑史诗级升级



比如产品替换任务,它可以完成的非常出色。





多张照片的组合,效果也是非常惊艳。





还有给它一张照片,生成多视角图。



是不是真挺不错的?


凭借着出色的效果,nano-banana 在内网、外网各个平台都收获了一波好评。






大波网友们已经玩的是不亦乐乎了,在 LMArena 上疯狂 roll 图。


有人用它来做 3D 手办,有人用它来构建电影分镜图……


nano-banana 到底有多强大,值得大家纷纷自发进行口碑营销?


我们来看更多整理好的实际案例~


在这之前,先插播一个网传消息:nano-banana 大概率是来自 Google 的模型。


首先是有网友爆出 nano-banana 正在参加内部灰度测试。



再加上 Logan 在前两天的 Google 发布会之前在 X 上发了个香蕉表情。



还有好奇的网友直接去问它的创造者是谁。



一、实测案例


nano-banana 不仅仅是图像编辑功能有了进步,更是全方位性能的显著提升。


其中最受称赞的是它的人物一致性,甚至达到了以假乱真的地步。


先来看一个简单的例子。


使用 prompt :创建一张某人直视前方的照片。



简直像图片中的人物自己转过了头,真实感拉满。


人物组合


把不同人物组合在一起并指定动作、表情。




人物、物品组合


给人物换上某一物品,并指定人物动作。



即使人物有拖影,它也能处理得很和谐。



水中效果也很好。



多张图片多元素组合


有了 nano-banana ,你可以发挥你天马行空的想象力,随意组合场景、物品、人物、穿着等各种元素,生成独一无二的图片。





把上面 4 个元素组合起来的效果:



图片修复


你有没有陈旧泛黄的老照片?nano-banana 可以帮上忙。




一键就可以还原色彩高清细节。




即使是这种局部曝光低到到肉眼看不清的照片,它也能修复的很好。让图片中的人立刻生动了过来。




插画变手办


目前 nano-banana 最出圈的用法就是插画变手办。


由于 nano-banana 生成的图几乎没有“AI 感”,完全看不出来是生成的。


生成的手办图真实,质感好,特征也保持的完整,很多网友都用它来做 3D 手办,还包括很多非 AI 圈的创作者。


是真的已经火出圈了。




电影分镜图



用上面这张初始图像,构造出一个完整的电影世界。


我们需要做的就是输入 prompt ,就能对该人物进行各种编辑。


比如:


“创建一个场景,主体在现有环境中奔跑,16:9”



效果确实明显比 Qwen 好一些。


还能有更多进阶要求。


比如使用 prompt :


“提供该主题的 4 幅 B 卷镜头蒙太奇,16:9:


1.站在外面(背对镜头)


2.坐进一辆白色跑车的驾驶座


3.在街道中央坐上一辆哑光金色的马车


4.站立,仰望天空,双臂向上伸展(背对镜头)”



上面这个输出效果也是让人很惊喜了,几乎实现了 prompt 中的所有要求。


来看看生成的所有分镜吧:



二、快速上手


nano-banana 目前还未正式发布,但它已经上线 LMArena 双盲测试,可以在 “battle” 模式下使用。


值得一提的是,由于 “battle” 模式不能指定使用模型,我们需要循环提示,直到 nano-banana 出现。


不过有个小技巧是你选择 nano-banana 越多,它出现的次数就越多。


我们先来到 LMArena 官网。


LMArena 链接:


https://lmarena.ai/


下拉窗口选择 “battle” 模式。



然后在对话窗中选择图像生成就开始创作了。



实测 nano-banana 输出概率很高,甚至有人第一次就测到 nano-banana 。


三、最后一句


不得不说真挺震撼的,就冲它实测出来的效果,nano-banana 就值得它的缩写:nb 。



nano-banana 能做的还有更多,感兴趣的小伙伴赶紧去试试吧~


文章来自于微信公众号“JackCui”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!