AI热点 7小时前 58 阅读 0 评论

深度|Agent时代的云服务会有什么不同?

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


“云服务的核心用户,正在被AI Agent所取代。”


在一场仅有少数头部机构参与的AI Infra闭门会上,一位顶尖AI公司创始人的这句话,让在场的许多云服务资深人士陷入了长久的沉默


这份沉默,并非源于对未来的迷茫,恰恰相反,它源于一种对「未来」过早、过快到来的恐惧


因为就在这间会议室之外,一个由AI驱动的全新世界正以惊人的速度膨胀——10月29日谷歌的母公司Alphabet 宣布第三季度其云业务部门的销售额同比增长 33.5%,达到 152 亿美元,高于预期的 148 亿美元。


其竞争对手微软云收入为 491 亿美元,增长 26%(按固定汇率计算增长 25%),达到 3920 亿美元。


而在沙利文(Frost & Sullivan)在其最新的报告中表示,2025年上半年,中国全栈AI云服务市场规模达259亿元,其中阿里云以30.2%市场份额位居第一,百度智能云以22.5%的市场份额位居第二。


两家合计份额占比超50%,中国AI云双雄格局日渐成型。


这股狂飙突进的浪潮,正是那份沉默的背景音。


它意味着,一个为「人」服务的时代正在被强行画上句号


长期以来,当我们谈论云服务时,我们谈论的是一个稳定、可预测的世界。


从物理服务器到虚拟机,再到容器和Serverless,其核心哲学从未改变:为人类开发的应用提供可靠的「水电煤」。AWS、GCP、百度智能云和阿里云们的崛起,正是这个范式下规模化与标准化的胜利。


但「用户」的改变,颠覆了这一切。


当交互的主体从碳基生物(人)变为硅基「生物」(Agent)时,整个云服务的底层逻辑、技术栈乃至商业模式,都将发生一场剧烈的、不可逆转的范式革命。


为人的交互习惯、访问模式、数据生产方式而设计的整个大厦,其地基正在被彻底动摇



用户变了


这场革命的起点,是一个简单却极具颠覆性的事实: 交互的主体变了。


在传统互联网和移动互联网中,系统的所有设计都围绕着一个核心——人的行为模式。


人的反应速度是毫秒级,人的决策有极限,人的注意力是稀缺资源。


因此,基础设施追求的是高QPS(每秒查询率)、低延迟,以满足人类“点击-反馈”的交互循环。


但Agent打破了这一切。


一位嘉宾在会上分享了一组令人震惊的对比:


一个拥有100万日活用户的APP,在人类主导的时代,其同时在线峰值可能也就1万人。为了应对这1万人的短连接请求,一个三人研发团队,借助成熟的云服务,可以轻松搞定。


但换到今天,如果做一个Agent产品,同样是100万DAU,1万同时在线,而每个用户都启动了一个需要长时间运行的Agent,这意味着什么?


意味着你需要在一瞬间,为每个Agent启动一个相互隔离的沙盒环境


这就意味着,你的后台需要同时支撑‘一万个沙盒’的并发。


一个五人团队,有可能去运维一个万级节点的集群吗?


绝无可能。


这不再是量的变化,而是质的飞跃。



困难变了


改变所带来的,是一系列全新的、过去从未遇到过的技术挑战,它们共同构成了新一代AI 云服务的核心议题


首先是天文数字级的并发


Agent是「机器」不需要休息,它可以7x24小时不间断地执行任务,可以同时开启成百上千个进程。


这种「暴力美学」式的交互方式,对基础设施的弹性伸缩、快速启动和资源隔离能力提出了前所未有的要求。


旧有的、为人类设计的服务器架构,在Agent的「机海战术」面前,如同马其顿方阵面对现代化的钢铁洪流,不堪一击。


其次是成本结构的彻底倒挂


“在我们的成本结构里,Token的消耗是服务器成本的100倍。”另一位头部AI应用公司的创始人这样表示。


这意味着,在Agent时代,算力的成本不再是主要矛盾,「智力」的成本——即调用大模型进行思考和决策的成本——成为了悬在所有从业者头上的达摩克利斯之剑。


任何不能从系统层面、从底层优化Token效率的云服务,都将在商业上被判死刑。


最后是长周期任务的状态保持


人类执行任务是线性的,而Agent执行任务可能是分布式的、可中断的。


一个Agent可能在调用搜索API后,需要等待几个小时才能继续下一步的浏览器操作。


这就要求基础设施必须具备「状态缓存」的能力——在Agent「离开」时,能完整地保存其工作环境(如浏览器会话),并在它「回来」时,能瞬间恢复现场,接着往下执行。


这是一种过去在无状态(Stateless)服务设计中极少被考虑的复杂问题。


这些挑战环环相扣,共同指向一个结论:我们无法用旧地图找到新大陆。


Agent时代的云服务需要被彻底重塑。



需求变了


为Agent设计云服务,需要一套全新的思维和技术栈。


它不再是模糊的「云」,而是被拆解为三个清晰、可感知的核心模块: Agent友好的工具、Agent友好的环境、以及Agent友好的计算。


首先是Agent友好的工具
“Agent需要的不是信息,而是能力。”一位技术专家指出。


这意味着要从让AI「阅读网页」,转向为AI建立一个由无数可靠、可调用的「技能」组成的宇宙。


这套「能力库」与传统工具的根本区别在于:它不再返回供人阅读的网页,而是直接返回机器可读的结构化结果(如JSON)。


它将世界封装成 query_flight() 这样的精准「技能」,从而绕开了开放互联网中充满污染、低效且昂贵的「浏览」过程,实现了从「猜测」到「确信」的飞跃。


其次是Agent友好的环境
如果说「能力」是Agent的大脑,执行环境就是它行动的「数字肉身」。


过去的SaaS给你工具,而Sales Agent要直接给你客户,这需要真实的「行为」能力。


一个Agent友好的环境,必须能为这些行为提供一个高匿踪、可持久化、且具备成本效率的「沙盒」。


它要能伪装身份以防封禁,能缓存状态以支持长周期任务,并通过记录重复操作来大幅优化昂贵的Token消耗。


最后是Agent友好的计算


在计算层面,Agent的崛起引发了一场从「傻快」到「聪明地快」的革命。


评价标准从「每秒Token数」等物理指标,变成了「任务成功率」(如Tool Use成功率)等业务指标;优化目标也从单纯追求速度,变为针对性地提升任务成功率;最终,计算平台从被动的「Token管道」,进化为与模型、应用深度耦合,共同对最终业务结果负责的「性能引擎」。


谁能称王


面对上述一系列「不可能完成」的任务,一个自然而然的问题浮出水面:什么样的玩家,才有资格坐上牌桌,去争夺Agent时代AI 云服务的王冠?


这不是一个靠单点技术突破就能取胜的战场,而是一场对组织能力、战略耐性、技术深度和生态广度的极限考验。


结合我们在一线观察和与业内顶尖人士的交流,我们认为,胜利者必须具备以下三个不可或缺的特质


长期的技术积累与人才储备:核心技术(如分布式计算、大模型、AI芯片)无法一蹴而就,需要长期的研发投入和人才梯队建设。


拥有垂直整合能力: 只有能够对芯片、框架、模型、应用进行跨层优化的“全栈玩家”,才能从根本上解决系统性的成本和效率问题。


拥有真实业务的数据: Agent技术必须在海量的、真实的用户场景和复杂的网络环境中进行测试和迭代,才能真正成熟。


这三个条件,如同一道道天堑,横亘在所有入局者面前。


它们共同构成了一个极其苛刻的、非此即彼的过滤器。


现在,我们不妨和大家一起以这三个条件作为筛选清单,来审视当下的中国云厂商列表。


当我们把这张清单套在所有潜在的竞争者身上时,我们会发现什么?


有多少公司能真正满足这全部三个、缺一不可的条件?


答案,或许你已经心中有数,只有那两家:百度和阿里。


这并非主观臆断,而是市场、资本乃至全球科技巨头用行动投出的共识票。


无论是沙利文发布的《中国全栈AI云服务市场报告2025H1》,还是IDC的《中国AI公有云服务市场份额2024》,结论都惊人地一致:百度智能云与阿里云以超过50%的合计份额,牢牢占据了中国AI云市场的前两名,双雄格局已经形成。


这种共识甚至超越了专业的市场报告,当《福布斯》盘点中国AI玩家时,也只点名了这两家,并将百度比作化身「bAIdu」的新物种。


就连苹果在中国寻找AI合作伙伴时,也被频频爆料只在这两者之间做「二选一」。


从机场广告牌的贴身肉搏,到顶级合作的终极角逐,种种迹象都表明,聚光灯已牢牢锁定了这两位主角。


而这屡屡登顶的背后,不仅是它们对AI战略的长期投入,更深层的原因在于,它们率先洞察并实践了Agent时代AI基础设施的终极形态——只有全栈,才是真正的AI云。


所谓「全栈」,是指从底层自研芯片,到算力平台,再到大模型和上层应用开发的全链路垂直整合能力。


在今天牌桌上的许多玩家,如火山引擎,更像是「模型服务商」,它们在某些环节表现出色,但缺乏完整的自研闭环。


而百度和阿里,是国内唯二真正走通了全栈路线的厂商。 



在这条通往王座的路上,两位主角选择了不同的起点,却走向了同一个终局。


百度无疑是那个走得最早、也最偏执的「AI原生玩家」。


它的故事,始于一种近乎信仰的、对技术终局的判断。


早在2013年,当行业还在为移动互联网的红利狂欢时,百度便成立了深度学习研究院,将AI的火种悄然埋下。


2020年,当大多数云厂商还在贩卖「算力」这一初级资源时,百度智能云率先喊出「云智一体」的口号,并将其作为唯一的战略。


这并非一句简单的口号,而是一次彻底的自我革命: 它要做的不是「Cloud+AI」,而是从内核重构,打造一张为AI而生的云。



这种「AI原生」的顶层设计,贯穿了百度整个技术栈,形成了一套从芯片到应用,能够层层优化、环环相扣的四级火箭架构。 


第一级,是自研的昆仑芯 ,它为整个架构提供了最坚实的算力基座。2025年,百度不仅点亮了国内首个自研万卡集群,更成功点亮了全自研的3万卡集群,这种规模的自主算力,让百度在源头上摆脱了「卡脖子」的焦虑。 


第二级,是百舸AI计算平台 ,它如同一套精密的传动系统,将底层澎湃的算力高效、无损地输送上去。 


第三级,是千帆大模型平台 ,这是整个架构的「智慧引擎」。它不仅栖息着文心大模型等150多个强大的模型灵魂,更重要的是,它是一个不折不扣的「Agent工厂」,配备了完善的开发工具链和独有的AI搜索组件,让企业能以极低的门槛,创造出属于自己的Agent。


 第四级,也是最关键的一级,是庞大的应用生态 。从百度APP、百度文库等拥有亿级用户的「国民应用」,到深入千行百业的产业实践,构成了最强大「数据熔炉」和「练兵场」。海量的真实用户反馈,如同一股强大的数据流,反向驱动着从模型到芯片的全栈技术进行快速迭代,形成了一个任何“单点玩家”都无法企及的、恐怖的自我强化飞轮。


而另一位主角,阿里云,则上演了一出「云端帝国」的AI觉醒


作为中国云计算市场的开创者,阿里手握最雄厚的云基础设施和最广阔的商业场景,它的路径与百度恰好相反,是一条「由云向智」的演进之路。


当AI浪潮来袭,阿里依托其强大的云端优势,迅速构建起自己的全栈能力:


向下,它投入巨资研发自研芯片


向上,它打造了PAI-灵骏智算服务,并推出了通义大模型家族百炼一站式平台


这是另一条同样通往全栈的道路,一条从庞大「商业场景」出发,倒灌回「核心技术」的道路。


于是,我们看到了两条截然不同却又殊途同归的进化路线: 百度是「AI-driven Cloud」,从一个AI的内核,向外生长出一朵云;阿里是「Cloud-driven AI」,在一个云的帝国之上,嫁接和培育出AI的大脑。


尽管路径不同,但「全栈闭环”」是他们共同的信仰。


这种系统性的优势,最终无可辩驳地体现在了商业回报的地震波上。


2025年上半年,百度核心AI业务收入同比飙升36%,增速在一众云厂商中一骑绝尘,展现了「AI原生」的惊人爆发力。


这份成绩单的背后,是百度智能云已经获得TOP 10手机厂商、中国市场销量TOP15汽车品牌、TOP10新能源车企等的共同选择,并同时获得具身智能行业渗透率第一。


尤其在金融这块最难啃、也最能检验成色的硬骨头上,百度智能云更是在2025年前9个月的大模型项目中,将中标数量和中标金额的「双料冠军」尽收囊中。



胜负已分


从最早的战略远见,到最深的技术护城河,再到最快的市场增长和最硬核的行业认可,百度与阿里,用两种不同的方式,共同诠释了「全栈AI云」的真正含义,也清晰地定义了Agent时代胜利者的画像


在这场围绕「Agent 云服务王冠」的隐秘战争中,那些只提供单一零件的公司,无论其技术在某个点上多么优秀,都将因无法解决系统性的成本与效率难题,而最终面临被「整合」的命运。


这并非宣告竞争的终结,恰恰相反,它预示着一个更高维度竞争的开始。


 当百度智能云和阿里云这两大玩家将「全栈AI云」确立为行业基座时,它们就不再仅仅是「云服务商」,而是新一代数字世界的「操作系统定义者」。


未来,所有的Agent应用,都将像今天的APP一样,生长在这两大智能操作系统之上。


开发者们将不再从零开始搭建复杂的AI能力,而是直接调用平台封装好的「系统能力」;企业们也将不再为高昂的「智力成本」而焦虑,因为系统级的优化将带来普惠的智能。


这不再是一场开放的、百花齐放的「大乱斗」,而是一场属于全栈巨头的、赢家通吃的「天堂之战」。


因为,这,就是Agent时代的技术主权——是基础设施革命的最终章,也是下一个数字文明的开篇序曲


文章来自于“01Founder”,作者 “一直在路上的Max”。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!