AI热点 2周前 172 阅读 0 评论

深度|Agent 全球爆发,Agent Infra是否是搭上这趟快车的关键?

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


图片来源:Unsplash


01 AI Agent 引爆元年:从开源Agent框架到未来企业新势力


京东云于今年 7 月正式开源了JoyAgent‑JDGenie,这是业内首个“完整产品级”通用多智能体系统——覆盖前端/后端/智能体框架/执行引擎以及众多子 Agent(如报告、代码、PPT 智能体);在权威 GAIA 基准测试中取得 75.15% 整体准确率,,显著超越 OWL、OpenManus 等同类开源产品。真正实现了Agent开发的“开箱即用”


在这之前,黑马公司 Flowith 发布了其革命性 Agent 产品 Neo,号称世界首款支持“三无限”的智能体:无限步骤:可持续运行复杂任务秒拆解、精准执行(如定时生成报告、持续爬取信息等);无限上下文:支持百万 token 的任务历史记忆,能处理上万字对话与内容生成;无限工具:可并行调用多个工具,从搜索引擎、代码执行器到图像生成器,协同工作生成最终结果


KPMG也于今年6月发布了 Workbench多Agent 平台,初期就已部署 50 个智能体,并预计扩展到近千个,广泛服务于税务、审计、咨询等领域。我们见证着 AI Agent 逐渐成为智能化运营的基础构件,而非科研实验室的边缘项目。


论是 Flowith 的无限执行力、Manus 的通用拆解能力,KPMG 的企业级落地,还是如 OpenAI、Google、字节跳动、智谱、MiniMax等模型厂商也纷纷入局Agent,均指向一个趋势:AI Agent 正从单一对话工具,迈向能够主动执行任务、联动服务、实时反馈的“数字生产力”时代。


AI Agent 落地面临的四大核心痛点


尽管 Agent 应用正迅速崛起,要实现实际落地仍面临许多关键挑战:


1. 稳定性与执行链路断裂


真实业务环境中,Agent 容易因为算力资源波动、调用延迟、外部数据获取超时而出现“掉链子”现象,造成用户体验的“用几次就废”。同时缺乏高可用云节点、弹性算力调度与边缘加速,会放大这些不稳定性,导致长任务执行中断或输出不连贯。


2. 数据质量差与接入复杂


内部文档与业务数据分散在不同系统,存在多版本、冗余、缺乏标准化的问题;实时网络数据更新无法及时同步,导致模型使用过期或错误信息。再加上没有统一的数据接入与清洗机制,检索精度和推理可信度都大打折扣。


3. 模型管理分散、推理性能难优化


Agent 通常需要调用多种大模型(通用、垂直、专用微调),但缺乏统一接入与管理平台。模型版本切换慢、策略路由缺失、推理延迟高,都会影响业务实时响应能力,也增加了调优与迭代成本。


4. 调试、监控与合规部署困难


跨云、跨系统的 Agent 缺乏全链路可观测性与审计能力,问题难以复现。金融、医疗、政企等场景下,数据与推理过程无法在合规框架内运行,更增加了部署阻力与安全风险。


这些交织的痛点都指向一个核心问题:想让 Agent 能在真实业务中稳定落地,需要一套专为它设计的基础设施:Agent Infra。这个基础设施不仅要提供稳健的执行环境,还需能高效管理模型、支撑多样工具调用,以及保证数据的精准供给和安全合规。


真正的 Agent Infra 应具备以下关键能力:


  • 弹性与容灾的运行环境(Environment)


  • 模型入口与路由的可控体系(Tools/Model Layer)


  • 高质量、低延迟的数据供给与检索(Context/Data Layer)


  • 安全审计与多 Agent 协同能力(Security & Orchestration)


满足这些基础设施要求,看似统一,但实现难度巨大。这正是市场上大多数 Agent 项目卡在 PoC 阶段、无法规模化落地的关键。


目前,针对此类痛点,业界已经有公司交出了令人满意的答卷。 小宿科技从创立初期就深耕AI基础设施行业,目前已经服务了全球近千家客户,覆盖了国内超过一半的头部原生应用,并成为全球 Agent Infra 领域的佼佼者。


为何小宿科技能在如此短的时间内抓住机遇获得巨大的成功?或许我们可以从其旗下产品的分布了解一二:


  • IaaS(AI云服务):小宿AI云,AI云全栈服务平台。提供全球化云与算力资源,支持私有化/混合云部署、弹性 GPU 调度、边缘节点加速、Agent 沙盒,以及全链路监控与容灾能力,为 Agent 执行链路提供稳定的“地基”。


  • MaaS(模型服务):小宿模型聚合平台,一站式模型聚合管理平台。实现统一模型接入与版本管理,通过策略化路由、A/B 分流、回退机制与推理监控,保障推理过程的稳定性与迭代速度。


  • DaaS(数据服务):小宿智能搜索,专为Agent设计的智能搜索与数据服务。多源实时接入、结构化与多模态检索、去重与版本管理、证据溯源,以及低延迟查询,确保 Agent 持续、准确、实时地获取信息。



小宿科技这三层 Infra 产品构建了面向 AI Agent时代的全链路技术底座:IaaS 层提供全球化、高性能、合规可控的云、算力及Agent沙盒服务,MaaS+DaaS层通过“智能搜索 + 模型聚合”赋能 Agent 的信息获取与推理能力,打通了“可靠的运行环境 + 可控的模型治理 + 高质量的实时数据”的 Agent 运行逻辑,并解决了“感知 → 收集 → 推理 → 反馈”各环节的关键痛点,真正实现了为AI智能体而设计的 Agent Infra。


02 为什么 AI Agent 的真正竞争,将落在“联网检索 + 实时数据接入”能力上


随着 AI Agent技术的快速发展,我们正在见证一个全新的趋势——AI Agent 不再满足于简单的“会说话”,而是积极向“能行动、能决策”转型。当一个 Agent 要制定策略、给出建议、完成操作时,它必须能够随时检索获取最新信息,最终成为行动链中的关键一环。


所以,在蓬勃发展的的AI Agent应用背后,智能搜索已经成为了一种刚需。


补充知识盲区,用最新数据支撑判断


LLM 知识滞后:模型训练过程中只能使用一定历史内容(如半年甚至更早),无法获取当天政策、新闻、法规或市场动态。Agent 如要生成执行式建议或完整报告,必须接入最新信息,否则输出只能停留在“旧时代的结论”。


深度检索:通过联网搜索,模型能力逐步走向任务驱动型的“查找 → 学习调研 → 内容生成/知识综合/结构化输出”闭环流程。例如,OpenAI 的 ChatGPT Deep Research 与 Anthropic 的 Claude Research 均已将网页搜索能力内嵌于模型系统中,通过自动搜、自动聚合,再结合 LLM 生成报告级输出,为用户提供可信、实时、可复用的信息基础



面向用户:RAG让知识检索更“聪明”


Retrieval-Augmented Generation 是检索增强生成流程:Agent 会先检索信息(如网页、文档、数据库),将结果反馈给 LLM,后者据此生成更准确、专业的回答。


当 Agent 接到一个宏观任务(比如“计划巴黎度假行程”)时,它会通过任务识别、拆分和多轮执行进入一个精细的多级任务流程:


Macrotask(宏任务):计划巴黎度假行程


Subtask(子任务):订去巴黎的机票 → 比较可选择的机票 → 订下最合适的机票


Subtask:安排住宿 → 比较可选择的酒店 → 订下最合适的酒店


图示中展示出传统搜索只能覆盖“Find”(查找)阶段,而结合联网智能体的能力,可进入上述等更深层次的任务


为了支持这种层级任务执行,Agent 必须接入多种数据源协同检索能力:网页搜索:检索实时航班或酒店报价;知识库 / 企业数据库:查询机票政策或酒店评价审核流程;向量检索引擎:针对历史用户偏好或文本内容提供语义匹配建议


借助一体化检索平台,智能 Agent 即能自动识别任务层级、分解子任务、并依据不同来源提供检索结果支持,从而避免信息偏差与上下文断裂。


面向企业:为什么 B2B Agent 离不开AI搜索?


从金融、通信、制造、保险资管到医疗等多个行业,越来越多企业正积极搭建并运营自己的内部 AI Agent,以实现客服自动化、市场洞察、财务分析、研发支持等一系列业务协同与效率提升。在这些企业级 Agent 实际运作过程中,为了保持智能体具备 实时性、高效性和准确决策能力,离不开外部联网数据的持续获取与动态更新。



03 小宿智能搜索,全方面赋能AI Agent的数据获取


2025 年,Agent 与搜索的深度融合已成必然。作为全球领先的AI Agent基础设施服务商,小宿科技旗下智能搜索服务已携手 Lemon AI、魔搭 MCP 广场、Coze平台、MCP.so等开源与企业级 Agent 平台,为开发者和产品团队提供一站式的AI Agent基础设施解决方案。无论是自主推理、自动执行任务,还是实时浏览网页数据,小宿智能搜索都能以高时效、高准确、高结构化的检索能力,成为背后最强大的信息推手。目前,小宿科技AI Agent基础设施服务——智能搜索,模型聚合,全栈 AI 云——已合作海内外近千家企业,搜索服务月调用量更是达数亿次。能被客户信任并选择,离不开小宿智能搜索杰出的数据能力,以及专精 Agent 开发痛点的市场定位。



全球化数据覆盖 + 合规保障,多语种无死角


小宿智能搜索原生支持包括中文、英文、西班牙语、葡萄牙语在内的 35+ 主流语种,为跨国场景提供统一的查询体验。无论 Agent 面对哪种语言的内容,都能获得本地化、符合法规要求的数据服务,帮助企业与开发者轻松应对 GDPR、CCPA 等多国监管标准。



多模态搜索,一站式满足 Agent 的多样数据需求


小宿智能搜索不仅支持纯文本检索,还集成了“文搜图”“图搜文”“图搜图”“视频检索”功能。Agent 可以用一句自然语言输入召回相关图文并茂的结果,也可上传图片反查相似场景,甚至精准定位视频片段——所有检索模式在同一 API 下无缝切换,让多模态 Agent 在知识获取时更具灵活性与深度。



长摘要总结,关键信息一览无余


小宿智能搜索打破传统“摘要式”检索的限制,直接获取网页、PDF、报告等内容的完整正文,并支持以 Markdown 等格式输出,自动高亮与查询意图最相关的关键词与段落。无论是数十页的行业白皮书,还是纷繁复杂的法规条款,Agent 都能在一行调用中获取全量信息,而不是向用户答复“如需获取更多信息,请点击相关链接”。



智能召回 + 精准排序,内容质量远超主流搜索引擎


依托自研的千亿级向量语义索引和多阶段排序模型,小宿智能搜索能根据 Agent 的查询意图,精准召回最相关内容,并通过语义打分与可读性评估,提供更契合任务需求的结果。在Search Arena的客观评测中,使用 DeepSeekR1 对 SmartSearch 与 某海外主流搜索引擎SearchAPI搜索结果进行逐项评分,涵盖“有用性、相关性、深度、引用、推理与准确性”等维度,结果显示:小宿智能搜索在 44% 的查询中被评判为优于友商(友商 为 41%,还有 15% 被评为一致表现)。这充分体现了小宿智能搜索在理解查询意图、提供多维深入内容与保障表达准确清晰度方面的优势。



高可用 + 低延迟,Agent 系统稳定可靠


小宿智能搜索提供秒级响应,SLA 达 99.9%。灵活部署与智能路由容灾机制可在节点故障时秒级切换,保障 Agent 在并发高峰或跨地域编排场景中的持续稳定运行,让智能体的运行永不停摆。



结语


支撑 Agent 从“会说话”到“会做事”,靠的不只是模型,还需要稳定的 Agent Infra——AI云(IaaS)、模型管理(MaaS)、数据服务(DaaS)缺一不可。


小宿科技正是用这三层全链路基座,让每一个 Agent 都能稳定运行、快速落地,如果你正在搭建 Agent 应用,不妨试试小宿科技,让它立刻在稳定坚实的基础上动起来。


文章来自于微信公众号“Z Potentials”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!