撰文 | 程书书编辑 | 李信马题图 | 豆包 AI
2023年5月,英伟达创始人黄仁勋在ITF World半导体大会上断言:“AI的下一个浪潮是具身智能。” 这一判断迅速被产业趋势所验证,从在春晚舞台上扭秧歌,到不久前机器人大会上跳舞和打拳击赛,具身智能正以前所未有的速度进入公众视野。
图源:春晚视频截图
在这个关乎未来的赛道,腾讯、阿里、字节、京东、美团等互联网巨头悉数入场,它们不再满足于云端的算法竞争,而是希望将AI“装进身体”。投资、自研、生态共建……一场 AI 时代的 “抢滩登陆战” 已然打响。
01.AI大模型引爆具身智能
什么是具身智能?
具身智能概念最早可追溯至1950年,根据全国科学技术名词审定委员会定义,具身智能(Embodied Artificial Intelligence, EAI)是指一种基于物理实体进行感知和行动的智能系统,其通过智能体与环境的交互来获取信息、理解问题、作出决策并执行行动,从而展现出智能行为和适应性。
其与传统人工智能存在差异,后者主要指存在于计算机程序、云端服务器中的虚拟智能,依赖于抽象的符号计算和数据处理,而具身智能则更注重通过物理实体的感知、运动以及与外部环境的交互来实现认知,从而构成“感知-思考-行动”的闭环。
现在很多人将具身智能等同于人形机器人,实际上,具身智能系统的实现形式并非局限于人形结构,而是可根据场景需求适配多样化智能实体。例如具备环境感知能力的智能扫地机器人、用于高空作业的无人机、已进入路测阶段的自动驾驶汽车等,都是具身智能的具体应用载体。
2022年12月,谷歌发布机器人大模型 RT-1,“大模型 + 机器人”概念兴起。随后,微软于2023年2月发表论文,公布 ChatGPT 应用于机器人的研究成果,展示了大模型提升机器人人机交互能力的潜力。
同年7月,基于RT-1研究成果,Google融合了视觉语言模型(VLM)和RT-1中收集的大量机器人真实动作数据,提出了视觉语言动作(VLA)模型RT-2,它可以从网络和机器人数据中学习到大量知识,并将这些知识转化为机器人控制的通用指令。使得机器人也能像 ChatGPT一样理解自然语言,并根据自然语言做出一系列动作,能数学推理、能辨认人物、也能泛化到各种新环境、新任务。
RT-2 展现出的各项能力,刷新了大众对传统机器人模型的认知,也让市场看到了通过堆叠人工智能(AI)算力,可以实现人机多轮交互的高度智能化,不仅能完成文本、图片甚至视频生成,还能应用到硬件尤其是具有运动能力的硬件上——即所谓的“具身智能”,其中最直观的产品就是人形机器人。
不久前的2025世界机器人大会发布了《人形机器人十大潜力应用场景》,描绘了人形机器人应用于各行各业的未来图景,包括工业通用操作、汽车制造、3C制造、船舶制造、石油化工、电力生产、安全应急、商业服务等。
图源:2025世界机器人大会
随着AI大模型与机器人技术的深度融合,场景通用性持续提升,人形机器人商业化进程不断加速。与此同时,产业政策也在及时跟进、密集出台。
2023年11月,国家工信部印发《人形机器人创新发展指导意见》,指出人形机器人有望成为计算机、智能手机、新能源汽车之后,又一颠覆性产品。2024年1月,工信部等七部门联合印发《关于推动未来产业创新发展的实施意见》,人形机器人位列“创新标志性产品”之首。
今年3月5日,国务院总理李强在《2025年政府工作报告》中首次提及具身智能,将其列为未来产业的重点发展方向之一。此后,地方政府也纷纷出台相关政策,推动具身智能产业的发展。例如,北京市计划到2027年实现不少于100项规模化应用,深圳市则提出到2027年相关企业超过1200家,产业规模达到1000亿元以上等。
在技术突破、市场需求与政策支持的多重驱动下,具身智能产业进入快速发展阶段。第二届中国人形机器人与具身智能产业大会发布的《2025人形机器人与具身智能产业研究报告》显示,2025年中国具身智能市场规模预计达52.95亿元,占全球约27%;人形机器人市场规模预计达82.39亿元,占全球约50%,展现出广阔的发展前景。
02.巨头卡位
资本市场上,具身智能赛道也是持续升温。
高工机器人产业研究所数据显示,2025年上半年国内具身智能产业链上下游共发生144次融资事件,融资金额达195亿元,平均单笔融资规模1.35亿元。随着资本热度与产业布局双升温,阿里、美团、腾讯、京东等互联网大厂在具身智能领域动作愈发活跃,各自展开独特卡位。
出手最早、节奏最快的美团,自2024年以来已累计投资7家具身智能企业,完成8次出手,采用“广撒网”策略实现全赛道覆盖。在硬件本体方面,美团投资了宇树科技和银河通用;在具身智能模型领域,布局了它石智航;在“硬件+模型”一体化方向,则押注自变量机器人和星海图。
其投资逻辑始终紧扣“本地生活服务”场景。它石智航聚焦“低空+地面”协同技术,擅长在餐饮后厨、商场仓储等复杂环境中执行任务;星海图研发“轻量化具身智能模组”,其低功耗行为决策算法可适配外卖柜、自动点餐机等高频服务终端;自变量机器人则构建统一感知、规划与控制的一体化架构,在2025世界机器人大会上,仅用一个模型就完成了制作香囊、分拣快递、家务清洁等跨场景复杂任务,展现出强大的泛化能力。
这种围绕场景的精准布局与美团战略高度契合。CEO王兴曾明确表示,美团将持续深化与被投企业的协同,强化自动化配送等关键能力迭代。美团买药与银河通用联合打造的“人形机器人智慧药房”,正是“投资+业务”协同模式的典型范例。通过具身智能投资,美团正着力解决其人力密集型业务的效率痛点。
如果说美团是“早布局”,那京东则以“快节奏、高密度”著称。曾一日(7月21日)内宣布领投逐际动力、众擎机器人、千寻智能三家具身智能企业,两个月内领投5家。
京东的投资聚焦“硬件+大脑”与“量产能力”,核心目标明确:服务于自身的零售与物流体系。例如,逐际动力推出的LimX VGM技术,可通过人类操作视频实现机器人行为学习,无需真机样本即可泛化部署,其TRON 1双足机器人已在巡检、安防、配送等场景开展规模化应用。众擎机器人则已完成产品量产,正加速推进规模化交付,计划将生产团队能力提升五倍。
不仅如此,京东还同步推进自研布局:2025年3月成立具身智能专项部门,并挖来商汤科技副总裁沈徽担任负责人;7月推出“JoyInside平台”,旨在将京东大模型能力嵌入各类机器人硬件,构建“硬件+软件+服务”的生态闭环。
图源:京东官方
相较京东与美团的高调出击,腾讯与阿里则采取更为克制和平台化的策略。
腾讯明确“不做硬件,只做伙伴”的定位。马化腾曾表示:“腾讯希望成为所有机器人厂商的合作伙伴。” 2025年世界人工智能大会上,腾讯推出具身智能开放平台 Tairos(钛螺丝),提供从基础模型、数据采集、训练仿真到真机部署的全栈式模块化能力,赋能行业开发者。其投资路径也印证了这一理念——参与宇树科技、智元机器人等明星项目的中后期融资,重在生态协同而非控制权。
阿里巴巴和蚂蚁集团则展现出“投资+自研+生态共建”的立体化布局。蚂蚁集团不仅投资了宇树科技、星海图、灵心巧手等产业链关键环节企业,更成立了全资子公司蚂蚁灵波科技,专注于人形机器人研发。该公司已在浦东建设人形机器人开放训练场,联合大模型、传感器、灵巧手等上下游企业,构建覆盖感知、决策、操控、安全的技术闭环,并向家庭服务、养老护理、医疗辅助等场景延伸。
字节跳动虽未以公司主体直接出手,但其关联基金锦秋基金已投资宇树科技、乐享智能、因克斯等企业。与此同时,字节正悄然推进自研机器人项目。据披露,其机器人研发团队已从2023年的约50人扩展至150人,自主研发的机器人产量累计超千台,显示出其“以投促研、以研带产”的长期意图。
结语
互联网大厂们在具身智能领域,选择了不同的战略布局和发展路径,这些差异化的战略,既反映了各自的核心优势和业务需求,也塑造着中国具身智能产业的未来格局。
随着技术不断成熟和应用场景持续拓展,具身智能有望成为继移动互联网之后的下一个重要技术平台。对大厂们来说,如何平衡投资成本与回报周期,还有实现技术突破与商业落地的有效结合,将成为决定其战略成败的关键。
往期推荐
汽车之家818全球购车节背后,看“AI+出海”策略下中国汽车产业的升级和突围
万兴科技IPO:高毛利难掩净亏损
新知音救得了岚图汽车?
END
本文来自微信公众号 “DoNews”(ID:ilovedonews),作者:程书书,36氪经授权发布。