AI热点 11小时前 98 阅读 0 评论

大摩建模“AI推理工厂”:无论是英伟达还是华为芯片,都能盈利,平均利润率超50%

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

AI推理不仅是一场技术革命,更是一门可以被精确计算且回报丰厚的生意。 

AI推理,是一门利润惊人的生意。

摩根士丹利最新发布的重磅报告,首次通过精密的财务模型,给全球AI算力竞赛的回报率算清了经济账。结论是:一座标准的“AI推理工厂”,无论采用哪家巨头的芯片,其平均利润率普遍超过50%。

其中,英伟达GB200以近78%的利润率毫无悬念地封王,而谷歌和华为的芯片也“稳赚不赔”。然而,被市场寄予厚望的AMD,其AI平台在推理场景下却录得严重亏损。

01

盈利榜单:冰火两重天

大摩的模型测算结果,折射出AI硬件巨头们在真实商业场景下的盈利能力分化,谱写出一首清晰的“冰与火之歌”。

火焰,属于英伟达、谷歌、亚马逊和华为。

报告显示,采用英伟达旗舰产品GB200 NVL72的“AI工厂”,盈利能力达到了恐怖的77.6%,一骑绝尘。这不仅源于其无与伦比的计算、内存和网络性能,还得益于其在FP4精度等领域的持续创新和CUDA软件生态的深厚壁垒,展现了绝对的市场统治力。

谷歌自研的TPU v6e pod则以74.9%的利润率紧随其后,证明了顶级云厂商通过软硬件协同优化,完全有能力构建起极具经济效益的AI基础设施。

同样,AWS的Trn2 UltraServer也以62.5%的利润率,华为的昇腾CloudMatrix 384平台也取得了47.9%的利润率。

冰水,则意外地泼向了AMD。

报告最具颠覆性的结论,莫过于AMD在推理场景下的财务表现。大摩测算数据显示,采用其MI300X和MI355X平台的“AI工厂”,利润率分别为-28.2%和-64.0%。

亏损的核心原因在于高昂成本与产出效率的严重失衡。报告数据显示,一个MI300X平台的年度总拥有成本(TCO)高达7.74亿美元,与英伟达GB200平台的8.06亿美元处于同一水平线。

这意味着,运营AMD方案的前期投入和持续开销是顶级的,但在模型所模拟的、占未来AI市场85%份额的推理任务中,其token产出效率所能创造的收入,远不足以覆盖其高昂的成本。

02

“100MW AI工厂模型”

建模AI工厂,量化投资回报

支撑上述结论的,是摩根士丹利首创的一套标准化分析框架——“100MW AI工厂模型”。它将不同技术路径的AI解决方案,置于同一商业维度下进行量化评估,其核心在于三大支柱:

1. 标准化的“算力单元”: 模型以100兆瓦(MW)的电力消耗作为“AI工厂”的基准单位。这是一个中等规模数据中心的典型功耗,足以驱动约750个高密度AI服务器机架。

2. 精细化的“成本账本”: 模型全面核算了总拥有成本(TCO),主要包括:

基建成本:每100MW约6.6亿美元的资本开支,用于建设数据中心及配套电力设施,按10年折旧。

硬件成本:总额可高达3.67亿至22.73亿美元的服务器系统(含AI芯片),按4年折旧。

运营成本:基于不同冷却方案的电源使用效率(PUE)和全球平均电价计算得出的持续电费。

综合估算,一座100MW“AI工厂”的年均TCO在3.3亿至8.07亿美元之间。

3. 市场化的“收入公式”: 收入与token产出直接挂钩。模型基于各硬件的公开性能数据计算TPS(每秒处理token数),并参考OpenAI、Gemini等主流API定价,设定了每百万token 0.2美元的公允价格。同时,考虑到现实中70%的设备利用率,使得收入预测更贴近商业现实。

03

未来战场:生态之争与产品路线图

值得一提的是,在揭示了诸多硬核能力之后,负责人表示,GenFlow 2.0还有更多模式,将在正式上线时推出。

盈利能力的背后,是更深层次的战略博弈。报告揭示,未来的AI战场,焦点将集中在技术生态的构建和下一代产品的布局上。

在非英伟达阵营,一场关于“连接标准”的战争已经打响。以AMD为首的厂商力推UALink,强调其对低延迟的严格规定对AI性能至关重要;而以博通为代表的力量则主张采用更开放、灵活的以太网方案。这场争论的胜负,将决定谁能建立起一个可与英伟达NVLink抗衡的开放生态。

与此同时,英伟达正以清晰的路线图巩固其领先地位。报告提到,其下一代平台“Rubin”正按计划推进,预计2026年第二季度进入大规模量产,同年第三季度相关服务器就将开始放量。这无疑给所有竞争者设定了一个不断移动的、更高的追赶目标。

总而言之,摩根士丹利的这份报告,为狂热的AI市场注入了一剂“商业理性”。它雄辩地证明,AI推理不仅是一场技术革命,更是一门可以被精确计算且回报丰厚的生意。

对于全球的决策者和投资者而言,前文两张盈利图表,将对AI时代算力投资提供相当大的参考价值。

本文来自微信公众号“硬AI”,作者:Kozmon,编辑:硬AI,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!