Midjourney操作界面

AI Agent未来趋势解析:为何Coze的专家工作流模式不代表未来?

4.8
0热度
DeepSeek APP

推理模型强化后,Agent具备了自我规划能力,从传统的工作流设定模式衍生出自主创新、自主规划的新范式。企业开始思考能否运用Agent重新定义或落地新场景,这一探索过程也会受到C端的影响。新一代Agent与上一代以工作流为驱动的Agent在运作逻辑上存在何种差异?具体如何实现?企业又该构建怎样的工具箱?本文将深入分析AI Agent的未来趋势,助力企业对Agent工具的理解与落地实践。分享嘉宾





推理模型强化后,Agent具备了自我规划能力,从传统的工作流设定模式衍生出自主创新、自主规划的新范式。企业开始思考能否运用Agent重新定义或落地新场景,这一探索过程也会受到C端的影响。新一代Agent与上一代以工作流为驱动的Agent在运作逻辑上存在何种差异?具体如何实现?企业又该构建怎样的工具箱?本文将深入分析AI Agent的未来趋势,助力企业对Agent工具的理解与落地实践。

分享嘉宾|张扬  爱分析  联合创始人&首席分析师
内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。

01
新一代Agent运作模式的“变”与“不变”
过去人们所理解的Agent,大多是在用户输入(Input)后,在单一Agent的模式下进行任务分解、任务执行,包括函数调用(Function call)以及输出答案,例如去年较火的AutoGPT进入2025年之后,最大的变化是增加了更多的Agent不同的子Agent参与运作,并非仅有一个Agent处理全流程。与过去一个Agent解决完整问题相比,其最大优势在于解决问题的细分的子Agent增多,可理解为解决问题的应用专家更多,这使得解决问题的效率和深度都远超从前。至于为何过去是一个Agent而现在是多个Agent,核心原因在于存在任务分解过程。当用户输入一个问题后,会进行任务分解,这与推理模型的出现有较强的相关性。 
上图右边列出的内容展示了解题过程,即用户输入问题后具体的子任务分解情况,这与过去的专家工作流解决问题存在显著差异。其中核心不变的标准是:任何复杂的Agent任务,首先都涉及搜索以及对问题的理解,思维方式与问题理解可归为同一类别。但观察后续不同步骤,其确定性和相关性较低,即每个Agent在运作过程中,若将其视为工作流,每个任务对应的工作流均不相同。在任务拆解为待办事项或子任务的过程中,基本是基于模型自身推理能力生成合理的工作流,而非像过去那样通过固定的步骤来解决问题,这是新一代Agent与上一代Agent的最大区别。
例如同样是数据分析任务,可能由不同Agent分工完成:第一个Agent负责理解客户需求并将其转化为语义层表述;第二个Agent承担数据获取工作;第三个Agent则针对回传数据进行分析并生成分析报告。最后一个可能是负责根因分析的Agent,甚至可能存在用于任务检查的Agent。每个Agent都有其核心工作任务,这构成了任务拆解的基础。然而,这些Agent的组合与调度编排由模型自主控制,这与传统设定工作流的思路完全不同。
以上是Agent发生变化之处,但也存在不变之处:过去单一Agent运作遵循PDCA闭环,即使在多Agent协同完成单一任务时,依然是基于PDCA大闭环进行拆解。其中,问题理解与思维方式对应“P(计划)环节;具体工作执行包含“D(执行)“A(执行环节;最终仍存在“C(检查)环节,例如深度搜索中的验证数据、确认最终答案等均属于验证过程,并可能根据验证结果重新评估数据可靠性。由此可见,尽管Agent工作流的具体内容及子任务流的工作方式有所改变,但其始终围PDCA闭环执行任务,这便是Agent变化与不变的两个关键要点。
02
单一Agent工作流的具体实现过程
首先流程中存在一个分类器,在多数情况下,该分类器由大语言模型构建,而非推理模型,这体现了大语言模型的优势。大语言模型能够在任务分解后,高效匹配不同任务与最适合执行任务的Agent。新增的任务拆解过程则由推理模型完成。当选定某个Agent执行任务后,便涉及Agent间的协作,例如一个Agent任务结束后将工作交接给另一个Agent。在此过程中,保存所有对话记录及记忆至关重要,这些信息将被后续所有Agent调用,这构成了多Agent协作的完整流程,也是当前Agent与过去Agent的显著差异。由此可见,传统工作流方式在未来可能不再适用。
上图左侧展示的是Open AI的Agent逻辑。Open AI3月发布的Agent组件包含三个部分:
一是API,支持用户通过API进行调用;
二是Search Tools,既可以操控浏览器进行网络搜索,也能够实现本地文件检索,满足公网与内网本地内容的查找需求;
三是Agents SDK,用于实现Agent之间的协作机制。该逻辑中不存在预设工作流。
上图右侧为经典的Agent框架图,其中Planning模块采用思维链(COT)技术,通过推理模型的思维链实现任务拆解,如去年广泛使用的典型工具。一种是通过拖拉拽方式构建工作流形成Agent,此方式由专家基于经验设定;另一种是由模型自定义工作流,这两种方式截然不同。在推理模型出现前,无论是企业内部还是模型厂商,普遍认可专家基于经验设定工作流的模式。
如今,显著变化在于越来越多的Agent产品开始倾向于由模型创建功能流。例如,Coze近期发布的最新版本Agent,将原有专家创建工作流转变为双轨制:既支持模型创建工作流,又保留专家创建工作流。由此可见未来存在两条不同的技术路线,当前两种路线并行发展。这一态势对未来发展趋势影响重大。举例来说,若未来趋势是模型创建工作流,那么对于多数企业而言,当前专家创建工作流方案中哪些部分能够在未来复用,哪些部分无法复用,成为企业关注并亟待解决的问题。
在Agent运作过程中,存在两种不同的工作流构建思路与方式,专家工作流属于典型的低代码和零代码产品体系。从历史发展来看,低代码产品在中国市场始终未取得重大突破。低代码和零代码产品最初期望的最终用户是企业用户,尤其是企业业务人员,旨在让业务人员基于自身业务理解自行搭建应用,IT部门仅提供基础支撑平台,而非协助开发具体应用。然而在实际应用中,低代码和零代码产品的主要使用者多为厂商或其合作伙伴的交付人员,这些交付人员对该类产品的使用最为频繁。从厂商角度,低代码和零代码产品确实能够降低交付成本。但对于企业用户而言,其学习成本和使用门槛过高,导致企业用户对这类产品观感一般,在企业应用层面作用有限;而对于厂商来说,却是降低交付成本的有效方式。
从企业用户视角出发,即便不考虑专家工作流和模型工作流的技术发展趋势,仅就企业是否愿意采用低代码和零代码产品而言,专家工作流的应用前景也存在较大不确定性。专家工作流很可能最终仅成为厂商交付的工具,难以真正被企业用户所使用。若将专家工作流和模型工作流视为未来两大发展趋势,那么首要问题是明确长远发展趋势,并确定企业在当前阶段开发agent应用应遵循的思路。
参考上图三条曲线表明:在计算量较小、算力较低的应用场景下,采用“More Structure”模式,即对模型进行更多专家设定,模型表现更佳;随着算力提升,“Less Structure”模式,即减少控制和限制,表现逐渐变好;当算力近乎无穷大时,“Less Structure”模式优势更为显著。这一AI底层逻辑正获得越来越多的认可,例如,过去通过大量过程激励构建模型属于“More Structure”方式,而DeepSeek采用强化学习构建推理模型则属于“Less Structure”方式,目前强化学习这种限制较少的模式被普遍认为表现更优。
将这一思路应用于Agent,逻辑相同。在前期阶段,专家工作流可能表现更优,因为其中融入了专家的专业知识以及企业的专业经验。然而,随着算力提升,越过某个临界点后,模型创建的工作流可能效果更佳,这是可预见的情况。尽管当前算力发展迅速,但就agent的算力使用情况而言,若前期使用过如Grok3Open AI,会发现Agent的算力消耗约为聊天机器人对话的百倍级别。例如,一个聊天机器人对话若消耗100个Token,那么使用Agent时可能消耗约10万甚至更多Token。从上方图表可知,造成Token大量消耗的原因有二:
  • 一是使用Agent执行任务时步骤繁多,每一步可能都涉及模型间的交互;
  • 二是数据量庞大,搜索来源数量常以百计或数十计,这些上下文内容本身也极为庞大。
因此,若当前模型规模扩大10倍,模型生成的工作流效果可能远超专家工作流。这一临界点预示着未来模型创建工作流将逐步取代专家工作流。但在未来一到三年算力持续增长的阶段,专家工作流仍不可或缺。在此期间,建议将专家工作流从传统的拖拉拽式操作转变为提示词驱动模式,这可能是更高效的实现方式。同时,需遵循始终不变的PDCA闭环逻辑。具体而言,提示词应明确专家流程的步骤,包括使用的工具、展示方式等。其核心逻辑基于两点:
  • 无论是过去还是现在的AgentPDCA闭环始终是其运作的基本框架,专家工作流也应遵循该逻辑;
  • 提示词作为标准化示例,详细界定了解决特定问题的步骤,能够为模型提供可参考的学习样本。
R1模型训练过程中,虽使用的外部高质量数据较少,但从模型中蒸馏出了60万条思维链(COT)数据,这些数据是该模型的核心竞争力所在。而这些蒸馏数据质量的优劣,取决于前期积累的高质量数据,二者关联性极强。因此,从专家工作流的发展来看,这些提示词是极具价值的高质量数据。建议企业自2025年起开展Agent应用开发时,除采用拖拉拽方式设置工作流外,更应重视提示词的核心作用。提示词的积累与应用,或将成为企业内部创建更多Agent的重要知识来源。
03
企业应该构建什么样的工具箱
目前认为,企业需预置的工具链主要涵盖几个大类。第一个工具类别与知识相关,需配备两个检索工具:一是用于本地私有数据的检索和文件搜索工具,对应Open AI的File Search二是公网搜索工具,对应Open AIWeb Search API。第二个类别是自动化执行的流程工具,如Open AI的Operator,其他类似工具可能叫Computer Use,本质是模拟电脑操作。此外,企业已有的大量机器人流程自动化(RPA)资产,也可作为流程自动化工具调用。第三个类别是Agent协作工具,包括各类协作协议,目前此类工具较多。
除上述三类工具外,还建议配备与企业专属分析工具及API接口相关的工具。企业内部大量IT系统需要API接口,同时还需构建众多专属分析工具,例如Data Agent分析工具,从长远看,这是整个Agent体系可调用的工具组成部分。类似基于PDCA闭环和提示词开发的特定场景应用工具,也可纳入其中。例如企业专属的财务分析工具、设备运维工具、人力资源(HR)相关工具(如绩效辅导工具)等。这些工具基于企业过去搭建的Agent,可整合为工具箱,纳入Agent工具库。
综上所述,企业从当前角度出发,为未来Agent应用储备的工具箱核心类别包括检索工具、协作工具、自动化流程工具、API接口工具以及专属分析工具。这可能是当前企业落地Agent时需提前准备的内容

长按二维码,领取完整版视频实录和课件

毕业于清华大学及香港中文大学,杭州市金融科技创新项目应用案例专家评委,原投中集团副总裁。十余年金融行业从业经验,在爱分析媒体平台发文超过 500 篇,有很深的行业影响力。
注:点击左下角“阅读原文”,领取专家完整版实录和分享课件

点赞(0)

立即下载

相关下载

顶部