还记得三个月前那个让全网欢呼的AI Agent吗?
2025年3月,Manus横空出世,凭借一段“智能体自主完成任务”的演示视频,一夜之间成为科技圈宠儿。发布一周内,200万用户挤破头预约,内测码被炒至10万,仿佛AI的下一个ChatGPT时刻已经到来。
然而,这场狂欢仅仅持续了130天。当第一批用户真正体验产品时,美好的幻想被实际使用感受击碎。人们发现,号称全能助手的产品底层技术完全依赖大模型API拼接,实测过程中只执行少数标准化任务,面对复杂场景常常束手无措。
实际上,Manus的困境并非孤例。另一家明星Agent企业澜码科技早在2025年初就因融资断裂,停发员工薪资数月,目前正寻求并购机会。
虽然通用智能体被广泛认为是实现AGI的必经之路,但现实却给了这个美好愿景沉重一击。行业报告预测,到2027年,约40%的AI Agent项目可能因成本失控或商业模式不清晰而被淘汰。
那么,通用Agent赛道的窘境,是否折射了整个Agent行业的困局?未来的Agent要怎么做,才能被市场买单?
01 通用智能体:从被追捧到被群嘲
在让Manus一夜爆红的那段视频里,智能体能自动筛选简历、分析股票、规划旅行,甚至能像人类一样“思考”复杂任务。此后,内测邀请码一码难求,资本蜂拥而至,硅谷顶级风投Benchmark领投7500万美元,公司估值飙升至5亿美元。媒体争相报道,称其为下一代人机协作的范式。
一时间,Manus成了AI创业的标杆,仿佛它真的能改变世界。
然而,狂热的追捧之下,质疑声悄然浮现。
随着时间推移,用户发现Manus的实际体验远不如宣传那般惊艳。热度迅速消退,访问量逐月下滑。
一方面,Manus的核心能力并非自研,而是依赖OpenAI的GPT-4和Anthropic的Claude等第三方大模型,自己只做封装。业内人士嘲讽它是“AI套壳智能体”——能拆解任务,但执行时依赖预设的RPA,一旦遇到意外情况,就会直接卡壳。比如,大规模用户涌入后,Manus的响应速度明显变慢,算力瓶颈凸显。有用户反馈Manus经常在复杂任务中卡壳,给出不合理的答案。
另一方面,高昂的价格让不少用户望而却步。19-199美元/月的定价甚至与ChatGPT等头部大语言模型持平,但其实测效果又远被甩在身后。失衡的性价比让不少付费用户感到自己被欺骗了。比如,Manus号称能完成电商比价等复杂任务,但在实际操作过程中漏掉拼多多、天猫数据,核心数据甚至出现事实错误;金融建模时,Manus仍使用2023年的β值,与实时市场严重脱节,偏差超过15%;视频能力上,输入指令“猫狗和谐相处的温馨画面”,Manus却给出了一个狗头猫身的“弗兰肯斯坦”式生物。
可以说,那些花高价订阅(19-199美元/月)的用户,等来的不是一个智能助手,而是一堆随时可能出错的模型能力的剪辑与拼接。
实际上,Manus风评直下并非偶然,它的困境折射出整个通用AI Agent赛道的集体困局——技术未成熟就急于商业化,资本催熟泡沫掩盖产品缺陷。
Gartner预测,到2027年,40%的智能体项目将因“成本过高、商业价值不明”被淘汰。
而当潮水退去,裸泳者才将现形。Manus的故事,或许正是这场大浪淘沙的开端。
02 深陷困局的Agent公司,有什么通病
就在几个月前,Manus的爆火让人们以为通用智能体的时代已经来临,创业者们前赴后继地涌入这个赛道,仿佛只要给自己的产品贴上Agent标签,就能轻松获得资本青睐。然而现实是,大批通用AI Agent产品折戟沉沙,行业初期的浮躁与泡沫逐渐显露。
为什么通用Agent没有像大语言模型那样让市场持续振奋?
因为市面上槽点偏多的通用AI Agent产品本质上都只是大模型的一层皮。它们调用GPT-4或Claude等头部模型API,加上一个定制的前端界面,就称自己是Agent了。这种模式开发门槛低、上线速度快,但也意味着同质化严重、护城河稀薄。同类产品都空洞地执行着“接收输入→调用模型→解析输出→展示结果”的统一流程,没有竞争力,而一旦大模型接口价格上涨或政策变化,就可能难以为继。
进一步讲,通用Agent的大模型依赖症导致它却缺乏统一的底层架构设计,常常陷入泛而不精的宏大叙事,缺乏明确产品定位。
通用Agent,其实在民间还流传着一个不太雅观的称号——缝合怪。就是说,产品为了展示多功能性,强行整合RPA、爬虫、数据分析工具,导致系统臃肿,无法真正适应复杂任务,用户在实际体验过程中效果不佳。麦当劳与IBM合作开发的AI Agent,因在真实餐厅环境中频繁出错,最终被放弃。由于技术效果与业务需求之间存在落差,当企业发现投入巨资引入的Agent产品并没有带来预期的效率提升,自然会放弃继续投入。
没有人愿意买单,用户留存率和转化率少,但通用Agent的成本却不低。与专业Agent相比,通用Agent依赖多个大模型API,token消耗量更大。且由于任务泛化性更高,通用Agent产品开发和维护都需要持续投入大量算力和工程资源。然而,很多创业公司在起步阶段盲目采用互联网时代“先圈用户后变现”的免费获客模式,忽视了通用Agent服务的高成本特性。而这种高成本、低转化的矛盾则直接导致了,一旦融资跟不上、公司很快就会陷入现金流危机。
不难看出,通用Agent创业的泡沫正在破裂,那些无法实现商业化、仅靠讲故事和堆模型吸引资本的公司注定逃不过被淘汰的命运。
但通用智能体不被看好,能代表Agent这条路已经封死了吗?
03 赢家,靠“技术+场景”筑起护城河
当前AI Agent领域正经历一场残酷的洗牌——高昂的研发成本、模糊的商业化路径,让不少玩家黯然退场。然而,在一片“哀鸿遍野”中,仍有像GenSpark、Salesforce这样的企业逆势增长,不仅活了下来,还跑通了可持续的商业模式。
为什么Agent赛道冰火两重天,我们或许可以从这些成功盈利公司的生存模式来一探究竟。
首先,小而美优于大而全。
许多AI Agent的失败,源于试图打造万能助手,结果既无法超越通用大模型,又难以在具体场景中真正落地。他们过分追求技术的通用性和智能度,却忽略了企业客户真正关心的问题——我买这个东西,到底能做什么?
与盲目追求通用智能的做法不同,一些Al Agent公司选择在垂直领域深耕,针对痛点提供定制化解决方案,将智能体嵌入到客户的业务流程中,建立技术和数据壁垒。
比如今年突然闯进公众视野的Agent黑马——Genspark。这家公司员工仅仅二十人,却在Super Agent上线45天后便实现了3600万美元的年度经常性收入。
一个重要的原因是找准了专业赛道。
Genspark最初做AI搜索,但发现该领域已被Google、Perplexity等巨头垄断,于是果断转型AI Agent,聚焦办公自动化、数据分析和文件管理等企业刚需场景。
据悉,Genspark验证效率比传统搜索引擎提升60%,虚假信息过滤率高达98%。实际应用场景中,金融行业客户使用GenSpark后,投资研究报告撰写时间从3天缩短至8小时;学术机构用户反馈,使用GenSpark进行文献综述时,效率提升了50%。
靠着在垂类领域做到极致,半路转行的Genspark得以在Agent竞赛突出重围。
其次,解锁付费意愿很重要。
解决了做什么后,另一个问题就是:这个AI到底能帮客户赚多少钱,或者省多少钱?
许多通用Agent公司沉迷于炫技,却忽略了企业运营的真正痛点——ROI(投资回报率)。当每个产品都号称自己有Agent能力,破局者靠什么脱颖而出?
关键在于帮助客户定义AI的价值锚点。Salesforce的Agentforce之所以能在上线一年内吸引5000家机构部署、实现10亿美元年化收入,就是兼具可解释和按需付费两个特性:可解释,每个AI决策都能回溯推理过程,让企业清楚知道“AI为什么这么判断”,降低信任门槛;按需付费,除了会员制,平台还提供了按对话次数付费的商业模式,让企业选择更灵活、成本结构更透明。
深度绑定业务流程的AI Agent因直接解决了企业痛点,从而获得持续的商业收入。这也说明了,企业客户不只为Agent的概念买单,而是为可量化、可审计、可省钱的解决方案买单。
最后,数据反哺、社区创新建立生态护城河。
技术日新月异,企业想要存活,必须保持竞争力,让产品越用越聪明。要与时俱进,上述成功部署、受到市场认可的专业型Agent产品还要进一步在真实场景中收集大量的用户反馈,构建数据闭环,建立社区网络,才能进一步反哺智能体快速迭代。
医疗Agent PathChat通过分析显微镜图像和患者数据,帮助医生快速识别肿瘤,在积累了大量独家医学数据后,将识别准确率从78.1%提高到89.5%,进一步巩固专业护城河;Salesforce推出的Agent平台允许开发者创建各种行业Agent应用,第三方的加入丰富了平台功能,反过来又吸引更多企业客户采用Salesforce的AI方案。
将单一产品上升为生态系统的Agent公司,将更难被撼动。
简言之,那些在Al Agent寒冬中依然挺立的企业虽各有高招,但无不是将技术与场景深度结合的务实者。而那些一味追逐风口、忽视用户需求的投机者,终将被历史淘汰。Manus的故事或许还无法轻易定调,但它留给业界的讨论是有价值的:Al Agent的使命,在于成为人类的得力助手,而不是资本游戏中的空中楼阁。
任何不想只是昙花一现的技术,唯有脚踏实地、聚焦场景、创造价值,才能真正走出困局,迎来属于自己的春天。
本文来自微信公众号 “脑极体”(ID:unity007),作者:珊瑚,36氪经授权发布。