AI热点 3月前 71 阅读 0 评论

一致性对标Nano Banana,国产Vidu Q1同时支持7张参考 | 实测

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

最近AI生图赛道简直卷疯了!


从Nano Banana的爆火,到即梦AI 4.0,豆包4.0接连上线,一直专注于视频大模型的Vidu也按捺不住了:


Vidu Q1参考生图堂堂登场!同时支持7张参考。


主体一致性比起谷歌Nano Banana也毫不逊色。


(Nano Banana最多支持3张参考图)



量子位抢先实测了这款模型,它的表现相当不错——能够自由引用的7张参考图,带来了极高的可操作性。


用简单的自然语言描述即可。



或者是直接生成时尚大片,现场拍摄啥的都省了。



我们探索了很多有趣的玩法,提示词、图片都放在下面了,一起来看一下!


7张参考图,能怎么玩?


我们实测了几种玩法,比如让各种违和的元素凑成一张和谐的画面、或者是制作时尚大片……


可以说,只要有创意,万物皆可合成。


万物皆可合成


无论是让秦始皇骑北极熊在上海喝柠檬水:




还是让李白坐火箭成功登月:




参考图一放,就看Vidu Q1参考生图的结果是否符合想象。


潮流单品秒变OOTD


既然有那么多参考,岂不是可以直接全套换装?


所有单品一键上身,是时候展现搭配之力了(摩拳擦掌)。




用这套提示词,不管是地中海还是西海岸通通可行。


在线试衣再也不是问题。




一个人也能拍时尚大片


光是换装还不够,更进一步,生成一张海报级别的写真如何?




看,只需要简单的提示词,背景、光影、构图都可以随意调整。


合照?不,是大合照


双人合照已经满足不了需求了,来点更多的?


让少年漫主角齐聚一堂怎么样。




即使画风差别过大,甚至跨了一个次元,也可以自然地出现在同一个画面里。




更多玩法等待探索


当然,更有趣的玩法还有很多。


基本上Nano banana能做的,Vidu Q1参考生图也可以。


无论是小某书爆火的手办生成。



还是设计稿变3D立体效果。



又或者最经典的主体替换。



同类产品多数仅支持1-3张参考图,且很多不能支持同一类型的多元素参考,比如同时参考多个人物。


而Vidu Q1参考生图可同时支持7张参考图,并在多人、多场景、多次生成下,依旧保证人物/主体的面貌与特征不跑偏。



测试数据全面超越Flux Kontext,直接对标Nano Banana。


一致性能力评分全场最佳。



最后让我们简单介绍一下Vidu Q1参考生图的使用方法。


在参考生图页面,支持7张参考图片,上传后会显示在下方的输入栏,可以拖动和更改提示词。


也可以输入【@】选择图片。



点击创建主体可以输入自己的常用数据,或许三视图效果更佳。



目前仅有1080p分辨率,可选择生成图片的宽高比和生成数量,最多可一次生成4张。



Vidu Q1参考生图现已全球同步上线,欢迎大家在评论区分享自己的作品~


实测地址:https://www.vidu.cn/create/reference2image


文章来自于“量子位”,作者“不圆”。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!