未来的AI竞争,将不再是芯片与模型的简单比拼,而是生态协同能力的全面较量。
从单点突破到集群突围,人工智能的竞争正从芯片与模型的单打独斗,升级为产业链的生态较量。
OpenAI与英伟达、Oracle的千亿美元级合作震动全球科技界,几乎同时,当DeepSeek新版大模型发布的余音未落,华为便迅速宣布昇腾硬件完成适配;中国的阶跃星辰联合华为昇腾、沐曦等近十家芯片企业成立“模芯生态创新联盟”。这两大事件揭示了一个共同趋势:AI产业正从以往的技术单点突破,转向软硬件协同的生态竞争。
国际巨头通过资本与技术的强绑定构筑护城河,而中国企业在自主可控的迫切需求下,正以系统思维推动国产算力与模型深度融合。这种不约而同的战略转向,标志着全球人工智能竞争已进入生态时代。
全球联盟:软硬件一体化成为核心战略
科技巨头正在经历从技术竞争到生态联盟的范式转变。在美国,OpenAI与英伟达、Oracle的合作规模令人惊叹。
OpenAI已承诺在未来五年向Oracle云服务投入3000亿美元,而英伟达则计划逐步向OpenAI投资1000亿美元,以部署至少10GW的AI算力集群。
这一合作远超普通的商业采购,涉及从芯片、系统到AI工厂的全方位协同。英伟达CEO黄仁勋甚至公开宣称,OpenAI有望成为“下一个万亿美元级超大规模公司”。
这些合作背后是全球AI算力需求的爆发式增长。据透露,OpenAI计划部署的算力基础设施可能容纳500万至1000万枚英伟达下一代Rubin系列芯片,其规模之大,足以重塑整个产业链的格局。
中国路径:构建自主可控的算力生态
在地缘政治因素影响下,中国AI产业选择了一条以自主可控为核心的生态建设之路。今年以来,多家中国大模型公司宣布其训练硬件已全面转向国产算力,而“模芯生态创新联盟”的成立更是这一趋势的集中体现。
这一联盟横跨模型、芯片和平台全链路,首批成员包括华为昇腾、沐曦、天数智芯、燧原科技等国产芯片企业。
联盟的目标十分明确:打造从硬件、AI模型到基础设施的完整创新生态系统,减少中国AI生态系统的碎片化问题。
系统思维一直是中国产业从后发地位迈向先进水平的宝贵经验,如今在AI领域正得到充分体现。随着英伟达H20面临“断供”风险,国产算力已从备选项升级为必选项,推动着“国芯”与“国模”的深度融合。
技术突破:国产芯片多路突围
国产AI芯片已突破单点技术瓶颈,进入规模化应用与生态培育阶段。
伯恩斯坦发布的报告预计,中国国产AI芯片销售额将从去年的60亿美元猛增至160亿美元,市场份额从29%提升至42%,增速达112%。
技术路线的多元化是中国芯片突围的显著特征。华为通过昇腾系列产品及超节点架构,在系统级设计上弥补单卡性能的不足。
阿里平头哥的PPU芯片在能效比上实现对英伟达部分产品的超越。沐曦、壁仞、燧原等企业则分别在GPGPU、存算一体等技术方向展开探索。
华为近期公布的AI芯片三年迭代路线图,首次将晶圆级芯片、存算一体架构等前沿技术纳入量产路径,显示出中国企业与英伟达形成代际竞争的决心。
集群创新:超节点架构弥补单卡性能差距
在单卡性能短期内难以超越的情况下,中国AI产业选择了以系统架构创新弥补组件差距的路径。
超节点和集群技术成为中国企业实现弯道超车的重要方向。
华为CloudMatrix 384超节点整合384颗最新的昇腾910C芯片,已累计部署300多套。
阿里云推出的磐久128超节点AI服务器,单柜支持128个AI计算芯片,同等机房空间内可部署的算力规模较传统方案提升了3倍以上。
华为轮值董事长徐直军直言:“只有依靠超节点和集群,才会规避中国的芯片制造工艺受限,能够为中国的AI算力提供源源不断的算力支持和供给。”
这种超节点架构突破传统互联瓶颈与共享协议限制,正成为多样化算力集群技术未来演进的必然趋势。
协同适配:从“可用”到“好用”的关键一步
软硬件适配曾是国产算力发展的最大瓶颈。过去,芯片开发周期需要两年以上,而模型迭代速度只有半年到一年,如果让芯片厂商去适配模型,必然导致低效。
阶跃星辰在Step 3模型的开发阶段,就主动服务国产芯片特性,跳出单纯的大模型企业视角,将模型和硬件视为相互协同的系统。
其采用的多矩阵分解注意力机制,能够把推理过程中的键值缓存用量大幅降低93.7%,对国产芯片更加友好。
结果显示,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%。沐曦创始人陈维良评价:“阶跃星辰对于国产芯片的了解深度,已经不亚于芯片企业本身。”
生态共赢:互联网巨头的战略转向
腾讯、阿里等互联网巨头近期也纷纷表态加速国产AI芯片的适配工作,这种大厂联动态正重塑国产AI芯片产业的发展逻辑。
腾讯集团汤道生表示:“我们正与多家国产芯片厂商合作适配各种AI模型,因为模型规模有大有小,从数十亿到上百、上千亿参数,不同场景所需的芯片配置不同。”
阿里巴巴CEO吴泳铭则在财报会议上透露,阿里已采取“后备方案”,与多家合作伙伴携手构建多元化的供应链储备。
互联网巨头的适配决策,证明国产芯片已通过“训练—推理”混合架构满足实际业务需求。
这种“技术突破驱动场景验证,场景验证反哺资本投入”的模式,正在推动国产芯片在垂直领域形成市场优势。
挑战仍存:训练环节与开发生态待突破
尽管国产AI芯片在推理侧取得显著进展,但基于国产芯片的训练仍是行业难题。
大模型的“大”主要体现在训练阶段数据和参数量的庞大。目前,美国大模型公司在训练环节使用的芯片集群规模已达到10万卡,而国内大模型往往使用以英伟达芯片为主的万卡集群。
目前明确使用全国产算力的芯片集群是科大讯飞与华为共建的“飞星二号”,能够达到万卡级别,但考虑到华为单卡算力的劣势,其在总算力上仍然难以同英伟达集群媲美。
除了芯片集群的困难,大模型企业想要在国产芯片上进行训练,也需要根据芯片不同的架构去重新构建底层工具链,其难度同样巨大。
工具链的开发人才由于要掌握硬件知识,往往比大模型的人才更加稀缺。
全球AI竞争已进入生态对生态的新阶段。在这个新阶段中,单一技术或产品的优势,正在被产业链协同创新的力量所取代。
中国AI产业依靠“系统思维”和“集群式突围”策略,在短短几年内构建起从芯片、模型到应用的完整生态体系。
而美国科技巨头则通过资本与技术的深度绑定,巩固其在全球市场的领先地位。
未来的AI竞争,将不再是芯片与模型的简单比拼,而是生态协同能力的全面较量。
本文来自微信公众号“竞合人工智能”,作者:竞合,36氪经授权发布。