AI热点 18小时前 170 阅读 0 评论

如何在企业中大规模应用Agent?|2025 ITValue Summit 前瞻对话「AI落地指南特别篇」②

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

当人工智能从实验室走向产业应用,我们正见证着一场静默却深刻的范式革命。

继大模型之后,Agent正成为这场智能革命中的明确技术路线。但如何构建真正的Agent、迎接Agentic AI,大多数人并不清楚。

但易点天下已经开始通过Agent交付实实在在的价值。

易点天下作为一家企业国际化智能营销服务商,凭借多年来在营销服务领域的行业Know-How,以及近几年在AI Agent方面积累的技术基础,在前不久发布了其AI Drive2.0数智营销解决方案及首个全球多渠道全托管AI营销专家-AdsGo.ai。

以AdsGo.ai,以及此前发布的KreadoAI、Funsdata、Cycor、CyberGrow等产品为矩阵,易点天下将复杂营销工作流通过Multi-Agent和 AI Workflow来封装成一个7x24小时不间断工作的AI智能体系。

其中,新发布的AdsGo.ai通过内部互相串联的、能够理解商家目标,自主分析市场,制定并执行策略营销的垂类AI Agent,实现"程序化自动化"到"智能化自动化"的跨越,让用户只需要专注于自己的核心业务,由AI agent 即可自动完成“一键启动、长期运转”的管家式营销服务。

数据显示,内测阶段,AdsGo.ai帮助初创期和成长型企业实现广告策略多样性与投放效果提升5倍创意素材测试效率提升10倍,节省广告营销人力成本达65%,对比中级优化师AdsGo.ai的投放广告单次转化费用降低26%,链接点击率提升47%,放量效率提升132%。

在钛媒体2025 ITValue Summit前瞻之AI落地指南系列直播中,钛媒体联合创始人刘湘明与易点天下首席产品官张奥迪对话,围绕AI Agent应用落地阶段,以及AI中台如何构建等话题展开了讨论。

在张奥迪看来,当前Agent在应用广度上已经实现了全岗位渗透,具体来看,Agent已经覆盖了包括产研(AI Coding提效)、创意(AIGC素材生成)、运营(标准化流程自动化)、信息化(审批/知识库)等在内的企业内部多个环节,并触达所有关键岗位;Agent在应用深度上,已经从项目立项自动化到SEO全链路执行(关键词挖掘→落地页优化→数据反馈),20+泛Agent(AI+RPA)与专业多Agent协同系统共同支撑了易点天下多项日常工作。

此外,Agent的应用还可以根据复杂程度分为泛Agent和专业Agent。

泛Agent更像是AI+RPA,像是一个自动化的工具,能够帮助员工完成一个垂直场景的工作。“目前易点天下已经交付了超过20个泛Agent的应用,比如所有项目立项的自动化是由Agent完成的,通过自动化的方式取代人工填写。”张奥迪进一步指出,“此外,在AI信息化方面,通过协同多个Agent,完成日常办公的信息调度工作。”

专业Agent方面,张奥迪认为,真正的Agent需具备意图理解、任务拆解、自主调动、长上下文记忆及多Agent状态感知的能力。“传统以模型为中心的AI应用,往往停留在问答或创意生成等浅层能力;而专业Agent则可通过多智能体协作、动态任务调度和状态感知能力,打通营销全链路,实现营销流程从投前洞察、素材生产、投放优化到数据分析的全链路重构。”张奥迪指出。

在此背景下,张奥迪认为,Agent的最终形态是实现“以目标为中心”,“以目标为中心”的模式下,企业不需要更多的进行编排,实现“以模型为中心+以任务为中心”,结合在了以目标为中心中,“比如,某些Agent可能是workflow的编排,某些则是以模型为中心做的Chat。但在Agent内部,只需要用户输入需求,就能自动化的拆解任务,自主调度AI工具/Agent,并且还要具备状态感知,才能调动起整体Agent的协同状态,还需要保持长的上下文记忆能力,”张奥迪进一步指出,“这时候,模型才能做到专业的Agent的,以目标为中心的结果导向。”

在对话中,张奥迪还分享了企业在建设Agent过程中需要注意的细节,在他看来,企业构建Agent应用需要“四步走”。

第一步,企业需要统一思想。“通过培训等方式,将企业内部人员对AI的认知拉齐。”张奥迪指出。

第二步,不要吝啬投资。在用AI的时候,省钱不应该是企业优先考虑的问题,“企业不必刻意省钱。AI工具要多用,消耗的Token越多越好,这样企业才能积累经验。”张奥迪给出了这样的建议。

第三步,梳理业务SOP。通过SOP梳理,企业才能寻找到真正适合AI应用,真正有AI需求的场景,并进一步深挖。

第四步,成立专职Agent研发团队。业务部门疲于KPI考核,不愿投入流程拆解,需成立专职Agent小组推动。“无论是内部抽调人员研发Agent,还是成立单独的部门做。”张奥迪表示。

“同时,企业还需要有拥抱变化的心态,即便踩到坑了,只要能快速的迭代,不管是认知上的迭代、组织思想上的迭代,还是工程建设上的迭代,最终才能做好。””张奥迪强调道。

附上本期直播时间轴,帮你快速跳转感兴趣的部分

00:28 Agent在企业中应用广度与深度

14:43 AI Agent从单点应用向着智能协同演进

22:50 AI Agent定义,什么是真正的AI Agent

49:03 Agent的大规模应用,对于企业的管理和组织带来的冲击有多大?

以下为对话实录,经笔者整理:

刘湘明:请先介绍一下易点天下应用Agent的情况,应用的深度和广度。

张奥迪:目前市场上现有的Agent/AI产品主要可以分为几类。首先是编码类的AI Coding,还有就是写分析报告类的,以及AI运营,包括建设各种Agent 的平台工具,还有就是内部的AI信息化。

首先我们在产研侧应用AI最广泛。受到交付率以及质量需求的影响,产研侧是最早应用AI Coding的环节;

第二个是,因为营销科技公司的属性,所以在素材创意方面,我们比较早的应用了AI相关产品。无论是图片类、视频类的,还是数字人类、TT素材等设计类的工作;

第三个是,AI运营类。通过AI工具帮助员工完成部分标准化、重复性的工作。

第四个是,AI信息化,包括了出差、请假审批,还有企业知识信息查询,物品领取、退还等等,包括我们各个部门的服务台。通过信息化的AI转型,我们提高了工作效率。

广度方面,AI几乎覆盖了所有的岗位,日常的关键场景。

深度方面,AI Agent已经能够处理近乎80%的工作场景。

刘湘明:是否有统计过易点在使用多少个Agent?

张奥迪:主要可以从两个层面来看,一个是泛Agent;另一个是垂直的、专业的Agent。

泛Agent化更像是AI+RPA,其实就是一个自动化的工具,能够帮助员工完成一个垂直场景的工作。那这里面我们交付很多。泛Agent化方面,我们交付了20多个产品,比如,产研协同流程里面有个项目立项,所有项目立项的自动化是由Agent完成的。完成立项后,立项的整个流程和细节,现在只需要把立项报告放到系统中,通过自动化的方式取代人工填写。此外,在AI信息化方面,通过协同多个Agent,完成日常办公的信息调度工作。

在垂直、专业Agent方面,协同办公的Agent完成之后,进而推进复杂的多个Agent(数字员工)之间交互。这个过程中,在多个Agent协同工作的过程中,保持目标的一致性是最难实现的。

刘湘明:AI Agent从单点应用向着智能协同演进,从模型为中心向着以目标为中心,在这个过程中,共分为几个阶段?每个阶段的具体能力有哪些?

张奥迪:首先,以模型为中心,就是单点能力。最早在大语言模型问世之后,推出了很多编排流的工具,我认为它是一个轻代码平台。平台中融入了很多AI节点和AI插件,这个过程中,我们可以通过简单的提示词,就做出一个AI chatbot。

当时,行业内很多认为这就是Agent平台,但你会发现,这个平台中,能力是碎片化的,且还是缺失目标感的,这时候我们依赖的仅仅是模型本身的能力提升。

当来到以任务为中心的时候,就出现了一些更复杂的工具,以及一些工程化的提示词,以及手工编排。结合在一起就变成:我会用很复杂的工作流的编排去收敛它的稳定态。其实我们做模型应用,我现在理解就是我们在“不确定中寻找确定性”。

因为大模型本来是生成式的,肯定会有一些幻觉,还有一些记忆的问题。如何解决?我们用我们历史的运营经验,变成一个标准的 workflow,然后再加上本身大模型的意图理解的能力,构建起以一个任务为中心的点,这个更像是AI+RPA的方式做自动化。这种类型的应用包括了合同识别、自动流转、智能客服等。

最后,我们就到了以目标为中心。这个过程更为复杂,企业不需要更多的进行编排,可能是以模型为中心,加上以任务为中心,结合在了以目标为中心里。比如,一些Agent可能是workflow的编排,一些是以模型为中心做的Chat,但在Agent入口,只需要我们输入需求,就能自动化的拆解,自主调度各类AI工具,或者Agent,并且还要具备状态感知,才能调动起整体Agent的协同状态,还需要保持长的上下文记忆能力。这时候,模型才能做到专业的Agent水平,以目标为中心的结果导向。

刘湘明:能否举个具体的例子?

张奥迪:以我们公司内部建设为例。最初我们处于以任务为中心的阶段,我们可以编排很多工具,比如在电商场景中的,换假发、抠背景图等,这就需要用到很多编排,可能是通过模型微调进行收敛,也可能是用comfyUI的方式,调参数进而收敛模型稳定性的状态,这也算是workflow的编排。在整个过程中,我们发现素材类的生产,可以把很多垂直类的效果场景单独拿出来,编排成一个稳定的workflow。

以目前通用Agent生产的素材,主要分为两步,第一步是生产出来,第二步还需要对素材进行编辑或剪辑。但当两步融为一体之后,就需要非常的垂直化。比如有很多的视频素材,需要做一个类似于故事绘本,首先需要将单点画面做出来,然后通过首尾帧一致性文生视频再进行拼接。这其实就是编排的以任务为中心的一个案例。

此外,我们在营销领域,以电商营销为例,现在的一些AI工具、电商站,其核心要么是通过买量投放,进行获客;要么是通过SEO。SEO里面有很多步骤,比如首先需要寻找关键词,通过一些工具寻找长尾关键词,进而建设落地页——如何将关键词“埋”到营销的内容页中,并将整个网站的布局做出来,让它更适合SEO。第三个是外链购买,第四个是数据反馈。

我们有一个刚对外发布的SEO的产品,刚发布就有大几百个网站开始使用了这个产品。这个产品其实就是通过workflow+MCP+自主调度多方 AI工具的能力,将前面提到的环节全部变成自动化的执行路径。最终实现:用户只需要将他的网站链接扔进来,就会自动完成关键词分析筛选和落地页建设。此外,在网站建设方面,我们可以调用一些编排能力强的AI工具,更好地建设网站布局。再加上易点员工帮助运营操盘,实现整个SEO路径的全部自动化和Agent化。

刘湘明:相当于在Agent大规模应用过程中,最核心、最有难度的一点是智能任务编排的系统建设,是这样么?

张奥迪:我认为它不是最难的,最难的是一开始人的思想理解。分为两点,第一点,员工会认为,Agent跟ChatGPT、DeepSeek等的区别是什么?员工会提出:我天天在用(ChatGPT等模型)然后你又让我建设Agent,为什么?

第二点,业务人员本身的精力都在完成KPI考核方面,如何有精力建设Agent?对于企业而言,Agent建设的过程是成本,当效果没有达到稳定预期的时候,是否还会继续投入,是个未知数。

第三点,推广Agent的过程中,我会要求大家梳理SOP,SOP如何梳理,为什么要梳理SOP,

这三个问题都需要通过组织的力量解决。比如需要贯彻思想,培训,让员工理解,拉齐大家的认知。这个过程中会发现,刚开始培训或拉齐认知的过程中,员工的认知参差不齐,有的人每天都在用很多AI工具;而有的员工遇见问题了并没有选择用AI工具,而是求助于其他同事。让大家切实感受到AI Chatbot与AI Agent是不一样的。

此外,我们会在一开始收集大量的零碎的需求。比如一些短剧团队,我们收集需求之后,会帮助他们建设一些短剧Agent,一开始会有选短剧,选品。另外,运营人员每天也会看大量短剧,总结数据,这件事完全可以使用大模型进行。员工输入短剧视频或者文本,总结出一个包括人物角色关系在内的,结构化的脑图和概要,让员工扫一眼就知道短剧的内容,就能增加运营人员的效率。此外,在短剧内部设置付费的关键点,AI可以剖析剧情的矛盾点和聚焦点,从而推荐出付费的关键点。

通过这些案例,用户就会发现Agent与一般Chat之间的差别。Agent能够串联起整个场景,人只作为一个像L2辅助驾驶一样的关键存在。这时候,员工就会产生观念上的改变,就会有一些主动找过来寻求开发Agent的需求,

第三个阶段,当正向反馈逐渐出现,就会发现其实踩了很多坑。第一个就是,很多需求并不是AI能够完成的。从一开始的不信任,到后来的神化AI。这就需要对AI有甄别的能力去筛选哪些AI能做,哪些做不了,此外,企业还需要专业的Agent建设的团队。易点从工程、算法、数据分析等部门抽调了一些同事,组成了Agent建设小组,专注于Agent建设。进而甄别业务部门提出的AI需求是否可行,这个过程需要业务部门提供详细的SOP的梳理,才能知道如何编排任务流,用哪些工具,才能达到最好的效果。

当宏观的收集到了所有的SOP,就能知道组织AI化的天花板在哪里,并且随着经验积累和大模型能力的提升,就能知道组织AI化的进程达到了百分之多少,我觉得这是很有意义的一件事。

刘湘明:一个合格的、真正的Agent到底是什么?

张奥迪:真正的Agent需要具备这几点能力。第一个是意图理解,需要理解用户的目标是什么。第二个是任务拆解,需要具备自主拆解任务的能力。第三个是自主调动,Agent需要知道每一步做什么,并调用相应的工具。第四个是长上下文记忆能力、理解能力,以及多Agent状态感知的能力。

所以,非常专业的Agent的建设是十分复杂的,并不是编排一个流就结束了。而是又回归到大型的工程建设,我觉得Agent的建设更像是集团化数据中心建设,是一个庞大的工程系统。

举个例子,我们在AI信息化的过程中,做了一个ALL IN ONE的AI——易鲸灵。当我开车时,我可以跟它说“帮我订个几点的会议室”,虽然它的架构不是最先进的,但它能满足我的需求。这个过程中,第一个Agent是意图理解,我们通过复杂的提示词(接近1000行)进行调度。设置提示词也需要技巧,因为当你获得一个稳定的提示词模板,再加上长上下文之后,这个模板又会变得不稳定,为什么会发生这样的情况呢?因为大模型会理解“我必须按照这种模板来做”,稍微换一下说话方式,大模型的理解力就会下降。

所以,在长上下文提示词构造里,需要构造多种口吻,比如反问、正向问、疑惑问等多个模板,让它能够理解这些问题模式,长期来看,对大模型的理解能力的增长有很大帮助。

回到刚刚提到的调度,抛出问题后,Agent会调度到下面十余个不用的Agent,比如会议场景,它就会调度到行政,会议预定等相应工具,调度飞书里面预定会议的接口。

除此之外,还需要判断很多因素,首先是,我需要跟谁组建会议,那个人行程跟我目前会议行程冲突码?进行信息检索;第二个,Agent会将会议间隙拿出来,组建会议,然后寻找哪些会议室是空闲的,另外还会询问用户参会人员规模,并匹配相应的会议室,最终选择出一个最佳的会议室,并预定这个会议室。在此过程中,需要我们收敛AI,制作工具,将稳定性做好。

再复杂的情况就是,需要多个Agent之间协同做一件事。定会议室场景中,因为整体链路短,所以Agent需要保持的记忆也短。但当我需要长上下文交互的时候,就会发现,原先使用的先问一个提示词,然后再自己结合上下文,混合成一个新的提示词的方式,已经超过了大模型本身的输入限制,会被截断。截断之后,就会发现模型的回答很蠢,这时候又要在大模型之外,连接缓存机制(每一个对话都有它自己的一套外部系统缓存,)这又到达另外一个复杂程度了。会发现要构造一个非常垂直或者专业化的Agent 解决复杂的长链路的场景,一定要把大模型当作操作系统来看,围绕它构造一个 native 的 AI 应用。

我觉得我们正在往一个非常复杂的Agent构建路程中前进,未来还会有更多的坑出现。包括大量Agent出现之后,还需要维护它,不断迭代。

Agent的管理也是一个问题。企业需要结合场景的难易程度,寻找适合的Agent建设工具,现在有大量的工具,目前仍处于“淘汰赛”阶段,明年可能还会出现新的工具。所以企业需要保持一个变化的心态建设Agent,但在组织内部,又需要有一个聚合,聚合到自己的平台。将零散的一些场景集合到自身平台上使用,当业务需要这些能力的时候,企业可以在Agent平台上统一构建一个开放接口给他使用。

在这个过程中也会遇见很多问题,比如算力成本问题。有些部门可能只需要用大语言模型,有些部门会用到多模态模型,企业需要构建分账体系,更像是商业化平台落地,最后你会发现,你构建的其实是一个AI中台。

AI中台底层能力是,接入大量服务商AI模型,再上一层,需要结合业务场景构建一些小的微调(模型),一些垂直领域场景,并没有能达到最好效果的通用化模型。再往上就是Agent建设,这一层会调用大量AI工具,寻找一些确定性的方式,再往上就是面向业务人员,通过接口调用Agent,完成工作。

刘湘明:有一个细节,上下文在某种意义上也需要进行分级和定义,这方面,易点天下如何处理的?

张奥迪:刚才我们聊到的所有方式,都是为了降低幻觉。以单点Agent为例,首先,每个Agent都会用到RAG,向量化检索知识库内容。我们在做易鲸灵的时候,会把每个业务日常的FAQ,以及经验等数据,维护在统一的文档池中,这就形成了企业级的知识库。将经验变成了可操作的稳定流,就让每个Agent都有了RAG的能力。

第二个,在长上下文应用中,在单点Agent中,外部存储的临时文件会结合RAG。但当多个Agent需要协同时,就需要把每个Agent里面外挂的知识库,以及上下文管理,提取出来,进行统一管理,进而在进行任务分配。这是当下我们遇见的最大挑战。

前不久,manus 发布了技术复盘,对于行业来说,是一个非常好的指引。里面暴露出了未来可能会遇见的问题。

我认为企业未来的壁垒是:企业内部可被AI模型利用的,私有的知识库。微调可能会是一个好的方向,但是在我看来,与微调相比,企业还不如把上下文和知识库RAG做好,会推进的快一些。

刘湘明:目前,一个Agent开发的流程和周期大概是什么样的?

张奥迪:流程方面,主要有两种。第一种是需要梳理企业内部所有的SOP;第二种是零散的收集需求,寻找真的AI需求,并将AI需求放在SOP中,观察进行到哪一步了。

第二步,对流程进行编排或者自主调度,进行规划,产出一个解决方案(可能是框架图,也可能是技术手段),并进行技术选型、工具选择,进而将这些工具接入到企业AI中台。

第三步,开发。在整体调度方面,我们有十余个员工,但具体制作Agent方面,1~2个员工就能制作一个相对简单的Agent,即便是复杂的工程化的Agent,十余个员工也足够。

Agent的建设与数据中台的建设类似。当Agent变多时,需要知道每个Agent的流向,以及相互的关联关系。这特别像数据中台建设过程中的数据血缘。此外,Agent也需要类似数据中台的质量监控。

当企业内部全部Agent化之后,就会存在特别多的Agent,这时候就需要类似数据中台的数据治理,定期对Agent清理一遍,将低热度(低使用频率)的Agent清理掉。并且,当AI能力不断提升之后,企业还需要将不同的、垂直的Agent合并成一个。整个过程就是传统的复杂工程的建设过程。

框架只是给了企业快速入场的平台,最终企业还需要脱离框架。因为现在Agent的框架还没有达到成熟态。AI应用还没有像数据中台似的,达到标准化建设阶段。还会有一些新的开源框架,以及规范出现,才能逐渐到达像数据中台建设那样的标准化。

刘湘明:Agent与传统的IT系统的关系,以及Agent团队与IT团队的关系是什么样的?

张奥迪:团队方面,因为大家都理解了一定要拥抱AI,所以大家都在想方设法的利用AI升级原有系统,这又回到了+AI和AI+的讨论中。

AI+是以AI为主导,这时候就需要统一的入口,统一的交互。可能会出现一个ALL IN ONE的调度中心(新入口)。

+AI是将传统的系统,例如BI、OA等,结合上AI需求或SOP,更像是助手的形式。比如在OA提交了立项申请,就可以通过AI助手自动填写。

所以,传统的交互跟AI的交互完全不排斥,大家不要为传统系统变成对话就是AI的错误认知。在应用AI的过程中,用户还是需要区别场景与用途。

这引出了另一个问题——场景的复杂度有多深?为什么行业内会存在“AI会首先颠覆SaaS”的观点?因为SaaS本身是要用通用解决定制化需求,为了尽可能的避免定制,所以SaaS软件会在通用上下很大功夫,会做的越来越复杂,最后还衍生出了软件培训师,需要对使用者进行培训才能使用。

而这件事恰恰是AI擅长的。比如,ChatGPT能将一段毫无逻辑、杂乱无章的话,结构化,并筛出逻辑,在软件学习领域,AI可以帮助企业降低SaaS软件的学习成本、使用成本。

刘湘明:Agent的大规模应用,对于企业的管理和组织带来的冲击有多大?

张奥迪:我认为会变成人机协同的范式。以产品经理为例,使用AI可以帮助其总结文档,并且协助其与开发人员交互。比如,现在产品经理可以利用Agent直接生成网页,从众多生成的网页中选择一个符合预期的,同步给前端工作人员。

整个过程,在弱化设计师参与的同时,也将产品语言与研发语言同步(原先需要产品人员与研发沟通需求,不断修改,现在只需要产品经理将生成的网页代码发给研发就能解决)。通过人机协同的方式,改变了原有的员工之间的配合模式。

不过使用AI也存在一些问题,比如AI会“献媚”。以产品策略撰写为例,我提供了方案,AI结合长上下文记忆理解等能力,会先赞赏你的方案,AI会用各种解释,阐释你的方案很不错。我现在在使用的过程中,就会明确跟AI说“不要献媚,请客观评价”。这也是人机协同的一个变化。

此外,组织关系也会随着AI应用变得更扁平。通过Agent助理,企业管理层可以筛选、评估、总结基层员工的汇报内容,进行风险预判,让管理者能优先处理更为重要、紧急的事。

刘湘明:企业如何构建Agent才能更好的实现目标?

张奥迪:第一步需要统一思想,需要通过培训等方式,将企业内部人员对AI的认知拉齐。

第二步,企业在用AI的时候,省钱不应该是优先考虑的问题,企业不必刻意省钱。AI工具要多用,消耗的Token越多越好,这样企业才能积累经验。

第三步,梳理业务SOP。

第四步,需要组织引领、推动Agent落地。无论是内部抽调人员研发Agent,还是成立单独的部门做。

按照这四步走,会有比较好的效果。同时,企业还需要有拥抱变化的心态,即便踩到坑了,只要能快速的迭代,不管是认知上的迭代、组织思想上的迭代,还是工程建设上的迭代,最终才能做好。

刘湘明:知识库的建设在个阶段开始比较好?

张奥迪:知识库已经足够了。只要企业能够将文档详细归类,并将日常FAQ和经验结构化的积累下来,就是一个好的企业知识库积累机制和状态。

另一方面,非结构化的数据未来会越来越重要。虽然现在没有一个完整的实践经验:非结构化数据会应用到数据中台,或者会给未来的营销效果提升非常多,但这是个趋势。

刘湘明:谢谢张总的分享。

张奥迪:谢谢。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!