机器之心报道
编辑:杨文、泽南
AI超级实用的落地,只有这家玩明白了。
前几天,奥特曼在采访中透露,亲自体验 GPT-5 后,被其强大的能力吓到。有个自己都搞不懂的问题,模型却能一下答出来,那一刻他甚至觉得自己在擅长的领域也有些「无力」。
尽管 AI 进展飞快,但总有人质疑:真正落地的 AI 不多,很多所谓的新技术,可能只是炒作。
目光转向刚刚开幕的世界人工智能大会 WAIC,我们会发现 AI 实用化的落地应用其实并不少。

智驾正被全网热议,会场内外,有很多无人驾驶车辆忙碌的身影,它们是大会的官方接驳车辆。

走进展区,数字人主播正在与人们互动,TA 们语气自然,知识渊博,反应比你还快,可以说已经达到了顶级主播的水准。

这一波展示,像是把我们一下拉进了未来世界。更有意思的是,这些贴近我们生活且有用的 AI 技术都来自一家公司,而且是全栈自研的。
中国最火 RoboTaxi 出海,半年拿下两城
在今年的世界人工智能大会(WAIC)上,百度萝卜快跑入选「中国人工智能产业创新成果展」,成为本届大会的「国家队」代表之一。此外,大会还传来好消息 —— 百度等一批科技公司获得了上海智能网联汽车示范运营牌照,Robotaxi 正式驶入浦东核心区。
不知从何时开始,国内大街上穿梭的萝卜快跑成为了稀松平常的事物。在社交网络上一些有关新鲜事物的话题下,不时可以看到对于无人出租的好评。


出行服务是自动驾驶商业化落地的关键场景,就在今年,全球无人驾驶行业展现出了前所未有的发展速度,Waymo、特斯拉、萝卜快跑等玩家的进展不断。轰轰烈烈的 RoboTaxi 大潮中,萝卜快跑做到了覆盖范围广,用户口碑好。
截至目前,萝卜快跑已为全球用户提供了超过 1100 万次出行服务,仅在国内,他们的无人驾驶车队就已驶入北京、深圳、武汉、重庆等十多个城市,如果拉出一条最近业务扩展的时间线,你会发现它的发展速度很快。
今年 3 月,萝卜快跑首次出海,宣布与迪拜道路交通局(RTA)签署战略合作协议,在迪拜市区开展无人驾驶规模化测试和服务。双方计划在迪拜部署超过 1000 辆无人驾驶汽车。萝卜快跑还宣布与阿联酋自动驾驶出行公司 Autogo 达成战略合作,打造阿布扎比地区规模最大的无人车队。
6 月,香港特别行政区运输署发布消息称,萝卜快跑已获批在香港东涌的指定路段和时段开展测试,进⼀步丰富其自动驾驶应用场景。这是自去年 11 月萝卜快跑获批香港首个自动驾驶车辆先导牌照后在港发展的最新进展。
短短半年内,萝卜快跑的测试范围从最初的机场周边逐步延伸至北大屿山核心区域,如今已深入东涌城市生活圈,测试范围已延伸至交通情境更复杂的道路。

萝卜快跑在香港已开始测试。
就在 7 月 15 日,萝卜快跑与 Uber 达成了战略合作伙伴关系,计划未来将无人驾驶出行服务拓展至美国及中国内地以外的全球多个市场。
这就意味着以后 RoboTaxi 会无缝融入人们的日常生活。服务上线后,乘客将可以用 Uber App 呼叫到由萝卜快跑提供服务的无人驾驶车辆。数千辆萝卜快跑会接入 Uber 的全球出行网络。据介绍在今年年底前,双方将率先在亚洲和中东地区部署萝卜快跑第六代无人驾驶车,未来将逐步扩展至全球更多市场。

在技术逐渐成熟,政策支持的加持下,萝卜快跑的商业模式已经获得了进一步验证,预示着中国自动驾驶技术已经具备快速复制和落地的能力。
也许再过不了多久,我们的出行方式就会因为 RoboTaxi 发生转变。
AI 老罗带货 5500 万后,百度又放大招
除了萝卜快跑,百度还在数字人上下足了功夫。
前不久的 618 大促,百度的罗永浩数字人在社交平台刷屏。
直播间里,AI 老罗和 AI 朱萧木插科打诨、段子频出,叭叭地讲了 6 个多小时,共吸引超 1300 万人次观看,GMV 更是突破 5500 万元,一度创下数字⼈直播带货新纪录。
没想到,短短一个月,百度的数字人技术又升级了。
这次 WAIC 上,百度发布新一代数字人技术 NOVA,预计在今年 10 月份上线,超头主播能力复刻将进入规模化量产时代。这也意味着,普通用户也能像大主播一样专业带货了。
NOVA 的技术亮点之一就是剧本模式的升级。
过去,数字人主播只能照着脚本念台词,语气生硬、表情刻板,但现在的 NOVA 依托文心 4.5 Turbo 的大师级剧本模式,将普通脚本升级为剧本,可以根据商品信息、参考知识以及人设要求等,实时调整主播的语调、表情和动作。

前段时间刷到冯唐的视频号,越看越不对劲,里面的动作来来回回就那几个,点头、摆手,还一卡一卡的。说实话,传统数字人之所以一眼假,很大程度上是因为动作僵硬。
NOVA 数字人在动作生成上也进行了改进,不再是简单的动作复制,而是能够贴合话术场景精准生成符合语义的复杂动作,甚至在业界首次实现双人互动。直播中,俩数字人可以随时插话、打断而不穿帮。
此外,NOVA 的语音克隆技术也达到了新的高度,能够完美复刻主播的声音和气口,甚至连口头禅都能准确捕捉。
就以罗永浩数字人为例,它在直播中时不时蹦出一句老罗经典口头禅「听懂了没?」「明白了吧?」,随便抛出的金句也都是熟悉的老罗的味道。
在双人讲品中,俩数字人也可以默契配合,无缝接话,不会说了下句忘了上句。讲到激动处它们可以手舞足蹈、语速加快;商品卖爆时能兴奋到声调拔高,已经达到与真人主播难辨真假的程度。
据了解,这样的高效复刻能力,仅需要 10 分钟的真人样本。也就说,你传 10 分钟自己的视频,NOVA 能还你一个超真实的数字人,实现声音、动作与氛围的精准匹配。
Nova 数字人技术的另一大突破就是 AI 大脑的升级,让数字人能够向顶级主播水平进阶——搭载的 AI 大脑可实时接收直播数据并自主决策,调度多智能体完成问答互动,并结合热点输出风格化内容。
在问答环节,AI 大脑的高效性和精准度又让数字人能够快速回应观众提问。同时,基于用户的历史行为,AI 大脑能够主动发起问题,引导观众在直播中互动,并通过多轮追问和解答有效引导用户的购买意向。
AI 大脑还通过智能决策和多智能体协同,实现了更为灵活的互动方式。比如,基于直播间实时热度及转化情况,灵活调度助播专家、运营专家、场控专家等多个角色智能体, 实现智能发福袋、开价、控库存等玩法,提升带货转化。

对于观众和直播者来说,数字人技术带来了真正实用级的体验。
百度全栈自研背后
要打造「数百万个超级应用」
不论是加速出海的智驾,还是不断制造爆款的数字人,百度的 AI 应用背后都是一套全栈自研的技术体系在提供支撑。值得一提的是,本次 WAIC,百度的智算集群和飞桨深度学习平台,与萝卜快跑一起入选了「中国人工智能产业创新成果展」,这无疑也是对百度 AI 全栈能力的又一强力肯定。
从 AI 掀起第一个浪头时,百度就意识到了 AI 的真正价值在于应用,而不仅仅是技术的炫技。
基于这一战略思维,百度成功布局了一个庞大的 AI 应用矩阵。
除了萝卜快跑和 Nova 数字人这两大代表成果外,百度还在传统搜索、网盘以及智能办公等多个领域,实现 AI 应用的全面落地。
例如,今年 3 月份百度正式上线的秒哒平台,以 「⼀句话做应用 + 多智能体协作 + 多工具调用 」的技术组合,颠覆了传统开发流程。用户可以通过自然语言描述需求,自动生成完整功能代码,极大提升了开发效率。
而百度文库和百度网盘的升级版,则通过多模态的 AI 能力提升了内容管理、知识创作和共享的效率,推动了 AI 技术在传统产品中的深度应用。
百度之所以能够在 AI 应用层面持续推进,正是依托其强大的 AI 全栈自研架构。作为国内最早投身 AI 研发的企业之一,百度从算力、框架、模型到应用构建起一个完整的 AI 生态系统。

百度的 AI 全栈架构首先在算力层面实现关键突破,核心支撑来自自研的昆仑芯 P800 和百舸 AI 异构计算平台。
今年,百度成功点亮国内首个全自研三万卡集群,支持多个千亿参数大模型全量训练,同时满足千家客户百亿参数大模型的高效精调需求。这一成果不仅保障了国产算力供给,还显著降低了训练与推理成本。在算力管理方面,百舸平台通过兼容多芯片、适配主流框架、异构资源调度等方式,实现了高达 99.5% 的有效训练时长,并优化了推理效率与稳定性。
在框架层,飞桨作为国内首个自主研发的深度学习平台,成为了国内外多个行业的技术基础。飞桨框架具备高度的灵活性,能够支持大规模的 AI 模型训练和推理任务,同时与百度的其他技术组件深度融合,提升了模型训练的效率。飞桨不仅支持多种硬件平台,还为开发者提供了简洁易用的接口,极大降低了 AI 技术的应用门槛。
此外,飞桨还是中国市场上唯一可与全球两大主流深度学习框架美国 TensorFlow 、 PyTorch 正面交锋的深度学习框架,这意味着中国打造了自主可控的人工智能操作系统。
在模型层,百度构建了以文心大模型为核心的多层次模型体系,持续推动生成式 AI 能力向产业落地。文心大模型具备跨模态、强推理、低成本等核心特性,广泛应用于搜索、推荐、智能助手等互联网产品中,同时赋能制造、金融、能源、城市治理等多个行业。
2025 年 4 月,百度发布文心 4.5 Turbo 和 X1 Turbo 两大旗舰模型,推理速度提升显著,价格分别下降 80% 和 50%,在多个权威评测中达到 SOTA 水平。近期发布的 IDC 报告显示,文心大模型在 8 大维度调研中独占 7 项满分,综合实力最强。
2025 年 6 月,百度正式开源文心 4.5 系列模型,覆盖 47B、3B 等参数规模,提供 MoE 与稠密结构版本,成为国内少有的完全开源的通用大模型。这一系列进展不仅体现百度在模型层的技术领先,也为推动 AI 大模型的普惠化和产业落地提供了坚实支撑。
与传统的「技术炫技」不同,百度的 AI 全栈架构始终聚焦于如何将技术应用于实际需求中,并且通过灵活的技术整合将 AI 应用推向更广泛的市场。正如百度 CEO 李彦宏所言:「我们不只是要推出一个超级应用,而是要打造数百万个超级有用的应用。」
越来越多的实践证明,百度「AI 超级有用」的道路是对的, 且越走越宽了。随着全栈架构持续演进,百度的目标不止于打造明星产品,而是让 AI 真正「飞入寻常百姓家」,成为驱动现实场景创新的底层动力。