AI热点 3月前 137 阅读 0 评论

可灵AI发布全新2.0模型:上线多模态视频编辑功能

作者头像
快科技

AI技术专栏作家 | 发布了 246 篇文章

快科技4月16日消息,据报道,可灵AI在北京举行灵感成真”2.0模型发布会,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。

据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。

3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)登陆图生视频(Image to Video)赛道榜首。

值得注意的是,本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景等在内的多维度复杂创意,直接高效地传达给AI。

基于MVL理念,可灵AI推出多模态编辑功能。MMW将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。

基于MVL这一全新交互方式,快手副总裁、可灵AI负责人张迪发布全新的可灵2.0大师版,这一版本全面升级视频及图像创作可控生成与编辑能力,并上线全新的多模态视频编辑功能。

此外,可图2.0文生图能力也全面升级,包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格等。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!