AI热点 4小时前 120 阅读 0 评论

AI应用开发商怨声载道:部署成本水涨船高

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

在本周MIT报告揭露“绝大多数企业投资AI尚未盈利”引发市场哗然之际,另一项出乎意料的现象也浮出水面:企业部署先进人工智能成本下降的趋势在2025年突然停滞。

作为背景,2024年OpenAI、Anthropic、谷歌等AI巨头曾集体将旗舰模型的API调用价格下调超90%。谷歌CEO桑达尔·皮查伊甚至乐观预言,AI很快会“像空气一样,便宜到不值得计量”。

然而,现实却远比预期残酷。从今年初开始,企业部署AI的成本几乎未见下降。Anthropic最新旗舰模型反而大幅涨价,OpenAI的GPT-5生成费用与前代持平,仅输入费用下降一半。由于推理、AI代理等功能天然消耗更多算力(以token计价),不少企业在忍耐半年后终于开始抱怨“时代变了”。

企业账单膨胀 但收入却没跟上

知情人士透露,财务软件开发商Intuit去年支付给微软Azure的账单约2000万美元,主要用于调用OpenAI模型支撑聊天机器人功能。今年,这一数字预计将飙升至3000万美元。

更令人担忧的是,AI支出增速已远远超过公司营收增速,引发其可持续性质疑。开销增加的根源在于Intuit近期上线了更复杂的簿记代理功能,能够自动为交易分类并维护资产负债表。

提供 “AI代理”定制服务的General Agency公司首席执行官Mohammed Nasir也表示,过去几年里AI成本一直在下降,但过去几个月里公司并没有看到成本下降方面出现实质性进展。

与此同时,被称为“AI编程神器”的Cursor,近期也开始按照用户实际使用量追加收费,毫不意外地引发了用户社区的暴怒。

软件服务和咨询公司Pynest的产品经理Pavel Bantsevich也介绍称,有一家建筑公司客户在云端构建了一个AI预测分析工具,一开始每月费用不到200美元。但一旦开始被大量使用,费用很快就激增至每月1万美元,即便转成自托管,每月的成本也要达到7千美元。

上游巨头逆势受益

在应用开发者苦苦支撑之际,上游模型商与云厂商却从中获益。微软Azure在截至6月的季度营收增长39%,超出指引数个百分点。CEO萨提亚·纳德拉透露,AI代理相关的token生成量同比增长7倍,是推动营收加速的主要动力。

OpenAI首席执行官奥尔特曼也在上周透露,公司通过API销售模型的业务,目前已经实现盈利——尽管这种算法里应该没有包含AI训练成本和高昂的人员成本。

尽管增长显著,由于正在进行的巨额投资,微软和其他云服务巨头也面临提高利润率的压力。纳德拉也在近期安抚股东称,微软已经找到在英伟达芯片上更高效运行OpenAI模型的方法,因此利润率有所改善。

开发者抱怨“压力山大”

面对过去半年利润惨遭严重压缩的应用开发者而言,现在正处在一个相当难熬的阶段。

AI编程工具开发商Replit的首席执行官Amjad Masad本月早些时候表示:“现在有点令人不安的是,token价格并没有下降。那些大型公司因规模效应,经济状况确实有所好转,但他们实际上并没有降低价格。所以令人担忧的是,我们是否已经达到了一个稳定状态?”

Masad还质疑称,那些大模型开发者是否已经形成“寡头垄断”,因此无需面对降价压力。

作为这些AI工具的客户,眼下也处于尴尬的等待状态。

独立应用开发者Ky-nam Nguyen透露,此前他每月为Cursor固定支付60美元,无需受到任何应用限制。但在本月涨价后,他在短短两天内就用完了套餐里的所有限额。他感慨称,现在只能庆幸没有签年付计划,否则几乎没怎么用却要支付很多钱。

公司回应

对于旗舰模型近期的涨价,Anthropic的一位发言人回应称,客户愿意为该公司的模型支付更高价格,因为这会转化成“可衡量的业务成果”。

这名发言人也承认,推理模型在思考时可能会迅速消耗大量tokens,但也强调使用这些模型的公司正在向他们的客户收费以适应这些成本。

OpenAI的发言人则回应称,由于GPT-5比此前的模型更加智能,客户获得的“性价比”实际上有所提升。该发言人还强调数个近期降价的产品,例如专注于数学和编程的纯文本模型o3。

OpenAI总裁布洛克曼也在上周表示,公司正致力于让GPT-5更加便宜,但前提是得先把运行模型的成本降下来。

本文来自微信公众号“财联社AI daily”,作者:史正丞,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!