AI热点 4月前 225 阅读 0 评论

火山引擎明日发布全新豆包视频生成模型,支持无缝多镜头叙事

作者头像

AI技术专栏作家 | 发布了 246 篇文章

IT之家 6 月 10 日消息,字节跳动火山引擎官方公众号今日宣布,将在 6 月 11 日发布全新豆包视频生成模型

据介绍,全新豆包视频生成模型具备多项“硬核能力”,IT之家附示例如下:

  • 支持无缝多镜头叙事,即通过高效的模型结构,多模态位置编码和多任务统一建模,模型可以支持独特且稳定的多镜头表达。

  • 支持多动作及随心运镜,即充分学习了丰富的场景、主体及行为动作,可以更准确地响应用户精细指令,流畅生成多主体多动作及随心运镜的复杂视频内容。

  • 支持稳定运动与真实美感,即画面与主体动态效果更自然,结构性更好,崩坏率更低,可根据指令生成写实、动漫、影视、广告等不同风格的视频内容。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!