AI热点 3小时前 154 阅读 0 评论

百度升级文心助手AIGC创作能力:支持8种模态 一键调用多工具

作者头像
快科技

AI技术专栏作家 | 发布了 246 篇文章

快科技10月15日消息,据媒体报道,百度搜索近日宣布对文心助手进行全面升级,显著增强其AIGC多模态创作与智能任务解决能力。

目前,该平台已支持AI图片、视频、音乐、播客等8种内容形态的生成,并支持用户一键调用多种工具,应对生活、健康、教育、工作等多场景需求。

数据显示,百度搜索用户通过文心助手日均生成的AIGC内容量已突破千万。与此同时,百度还发布了行业首个开放式实时互动数字人智能体,具备高逼真形象、低延时交互与情感识别能力,可提供专业内容与服务陪伴。

在内容创作方面,文心助手实现了从短内容到长视频的全链路覆盖。用户输入一段话,即可生成一部3分钟的剧情短片,AI自动完成情节设计、角色塑造、场景搭建、镜头调度及配乐全过程。

此外,助手还集成一句话写歌”MV制作”名场面模仿秀”等创意功能,并提供超过30种特效模板。未来还将上线音乐数字人分身,进一步拓展创作边界。

在视频生成技术上,百度自研模型蒸汽机”(文心专精)实现重大突破,率先在行业内支持AI长视频的实时交互生成。该模型基于流式视频技术,突破传统AI视频10秒左右的时长限制,实现无限时长”生成,速度也领先于国内主流同类模型。

用户只需上传一张图片并输入提示词,即可启动生成流程,实时预览推理画面,并可在任意节点暂停或修改提示词,实现对剧情、画面与转场的全程干预。这一能力标志着AI视频从单向生成”迈入双向共创”阶段,打造出真正意义上的无限画布”式创作体验。

本次升级还同步推出了可交互数字人与开放世界动态构建两大功能。数字人支持双向沉浸互动,适用于AI导购、教育、陪伴等场景;开放世界则允许用户在AI生成的地图、景点甚至宇宙空间中自由探索,进一步拓展AIGC在虚实融合场景中的落地可能性。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!