AI热点 1月前 107 阅读 0 评论

对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

作者头像
快科技

AI技术专栏作家 | 发布了 246 篇文章

快科技5月21日消息,在今年的I/O开发者大会上,谷歌发布第三代视频生成模型Veo 3。

据悉,Veo 3对标OpenAI的Sora,具备生成视频的同时同步嵌入音效的能力。

谷歌表示,Veo 3不仅可以基于文本和图像提示生成高质量的视频,还能为人物对白、鸟鸣或街头交通等场景配上相应的音效,实现更逼真的视听体验。

谷歌DeepMind产品副总裁Eli Collins表示:从文字和图像提示,到真实世界物理效果与精准的唇形同步,Veo 3的表现都非常出色。”

目前,该模型主要面向美国地区的Gemini Ultra订阅用户,每月收费249.99美元。

此外,Veo 3也将纳入谷歌面向企业客户的Vertex AI平台。

除了Veo 3外,谷歌还发布了多个与生成式AI相关的新产品,包括升级版图像生成模型Imagen 4、电影制作辅助工具Flow。

此外,谷歌还宣布对原来的Veo 2进行更新,并新增支持通过文字提示对视频中物体进行增删的功能。

目前,生成式AI在图像和视频创作领域的应用日益普及。

不过值得注意的是,谷歌在AI图像生成领域的历史并非一帆风顺。

2024年,谷歌因Imagen 3模型生成带有历史错误的图像内容而遭遇广泛批评,随后被迫重新发布该工具。

谷歌联合创始人Sergey Brin后来坦承,问题源于测试不充分”。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!