Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

4.8

0热度

自Agent火了以后，有关"记忆"的框架如雨后春笋般涌现，但绝大多数仍是为"单兵作战"设计，难以适应需要复杂协作、信息交互量暴增10倍的多智能体系统（MAS），为此，我非常荣幸地为大家带来G-Memory论文团队（来自新加坡国立大学、同济大学等顶尖学府）的亲笔解读。他们工作的独到之处，在于跳出"存得更多，记得更多"的内卷，另辟蹊径地首创了一套真正的"记忆管理"体系：通过G-Memory三层图架构，将MAS的记忆从杂乱的数据仓库，升华为能自我提炼与进化的"集体大脑"，从而一举解决MAS"高耗、健忘、难进化"的三大顽疾。下面，让我们深入了解他们是如何做到的。以下为作者投稿内容：

独木不成林，随着大型语言模型（LLM）驱动的智能体（Agent）遍地开花，我们很快发现，单打独斗的Agent能力终究有限。于是，借鉴人类团队协作的智慧，多智能体系统（MAS）应运而生，通过分工合作，展现出远超单个智能体的强大认知和执行能力。

然而，在满心欢喜地部署MAS解决复杂问题时，你是否也遇到了这些令人头疼的瓶颈：

团队"失忆症"：智能体团队完成一个任务后，宝贵的合作经验、失败教训就随风而逝了。下次遇到类似问题，依然从零开始，无法"吃一堑，长一智"。
经验"太简陋"：现有的记忆机制要么过于简单，只记录一个最终结果；要么直接照搬单智能体的记忆模式，面对MAS冗长复杂的交互（token消耗可达单智能体的10倍以上！），反而造成信息过载，效果甚微。
缺乏"进化力"：由于没有好的记忆和复盘机制，智能体团队无法自我迭代和进化，始终停留在"开发者设定"的初始水平，潜力被严重压抑。

别再让你的智能体团队"健忘"了！来自 新加坡国立大学、同济大学、UCLA、A*STAR、南洋理工大学 的研究团队重磅推出 G-Memory，一个专为多智能体系统设计的开创性分层记忆框架，让你的Agent团队不仅能干活，更能持续成长和进化！

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

论文标题: G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems

论文链接: https://arxiv.org/abs/2506.07398 [1]

代码链接: https://github.com/bingreeky/GMemory [2]

问题的核心：为何MAS需要专属记忆？

在深入了解G-Memory之前，我们必须先直面一个根本问题：既然现在单智能体已经存在相当多的Memory架构设计，为什么不能简单地把单智能体的记忆方法嫁接到MAS上？

答案藏在下面这张图里。

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

添加图片注释，不超过 140 字（可选）

可以看到，MAS为了完成任务，其内部的多轮、多角色沟通会产生海量的交互文本。如果像单智能体那样，将所有历史记录不加区分地塞进记忆库，不仅成本高昂，更会让LLM在冗余信息中迷失方向，难以提取真正有价值的经验。

因此，一个理想的MAS记忆系统必须能够：

存储（Store）：高效记录冗长的多智能体交互历史。
检索（Retrieve）：精确找到与当前任务最相关的"过往经验"。
管理（Manage）：对经验进行抽象和提炼，形成可指导未来的"高层智慧"。

这正是G-Memory诞生的使命。

G-Memory: 独创三层图记忆架构

受组织记忆理论的启发，G-Memory创造性地设计了一个 三层图（Three-Tier Graph） 结构来管理MAS的集体记忆。这三层各司其职，又紧密相连，构成了智能体团队的"记忆宫殿"。可视化如图1所示。

第一层：交互图 (Interaction Graph) - "原始案卷"

作用：这是最底层的记忆，忠实地记录每一次任务中，所有智能体之间每一句对话、每一个动作的完整轨迹。它是所有高层记忆的"事实依据"。

第二层：查询图 (Query Graph) - "任务档案库"

作用：这一层将每个任务（Query）作为一个节点。它不仅存储了任务本身，还记录了任务的成败状态，并链接到对应的底层"交互图"。更重要的是，它还会建立节点间的连接，将语义上相似或有关联的任务联系起来，形成一个"任务关系网络"。

第三层：洞见图 (Insight Graph) - "智慧结晶"

作用：这是最高层的记忆，存储着从多次成功或失败的交互中提炼出的、具有普适性的经验和教训（Insights）。例如，"在操作物体前，必须先确认其状态"或"当进行网络搜索时，要警惕名称相似但实体不同的情况"。

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

G-Memory工作流：双向检索与动态进化

G-Memory的工作流如图2所示。当一个新任务到来时，G-Memory的记忆检索并非盲目捞取，而是一个高效的 双向遍历（Bi-directional Traversal） 过程：

1.定位：首先在 查询图 中找到与新任务最相似的历史任务节点，操作如下所示：

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

2.向上追溯 (Upward Traversal)：从这些历史任务节点出发，向上访问 洞见图，获取高屋建瓴的、普适性的"战略指导"，操作如下所示：

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

3.向下挖掘 (Downward Traversal)：同时，向下深入到对应的 交互图 中，利用LLM提取出最关键、最核心的"战术片段"（例如导致失败的关键一步或合作成功的核心对话），避免信息过载。操作如下所示：

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

当任务执行完毕，G-Memory会根据结果 动态更新 所有三层图，将新的交互、新的任务节点、以及可能产生的新"洞见"融入记忆体系，为每个智能体提供精简且高效的记忆支持：

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

如此循环往复，智能体团队的集体智慧便在一次次实战中不断积累和升华。

效果惊人：全面超越，成本可控

G-Memory是否只是听起来很美？实验数据给出了响亮的回答。在5个主流基准数据集、3种LLM和3个知名MAS框架上的大量实验证明，G-Memory是名副其实的"性能加速器"。5个数据集包括ALFWorld、SciWorld、PDDL、HotpotQA、FEVER等。单智能体Memory基线方法包括Voyager、MemoryBank、Generative Agents等，多智能体Memory基线方法包括来自MetaGPT、ChatDev、MacNet等系统的记忆模组。

性能提升显著：

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

从上表可以看出，无论是与无记忆、单智能体记忆还是其他简化的MAS记忆相比，G-Memory都带来了显著的性能提升。

在 Embodied Action (ALFWorld) 任务上，成功率最高提升 20.89%！
在 Knowledge QA (FEVER) 任务上，准确率最高提升 10.12%！

成本效益极高：

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

上图展示了性能与Token消耗的权衡。G-Memory总能在相似甚至更低的成本下，达到远超其他方法的性能水平，真正做到了"好钢用在刀刃上"。

案例分析：G-Memory如何"运筹帷幄"

让我们通过一个生动的案例，看看G-Memory在实战中是如何发挥作用的。

Agent不长记性咋整？试试G-Memory，可进化的有组织“集体大脑”

场景：ALFWorld + AutoGen 框架

当前任务：put a clean cloth in countertop (把一块干净的布放到台面上)。
G-Memory的检索结果：

相似任务 (Query Graph)：成功检索到历史任务 put a clean egg in microwave (把一个干净的鸡蛋放进微波炉)。两者都包含"先清洁、后放置"的核心逻辑。关
键轨迹 (Interaction Graph)：G-Memory不仅找到了这个相似任务，还从其交互图中提取出了一个 关键失败片段：在那个历史任务中，某个智能体在没有清洗鸡蛋的情况下，就试图将其放入微波炉，结果被其他智能体纠正。
高层洞见 (Insight Graph)：同时，它还检索到一条普适性洞见："在完成放置任务前，确保所有物品都处于所需状态（如清洁、加热等）"。

有了这些来自"集体记忆"的宝贵线索，智能体团队在执行新任务时，就能主动规避曾经犯过的错误，大大提高执行成功的概率。

总结与展望

G-Memory通过其创新的 三层图分层记忆架构，成功解决了当前多智能体系统普遍存在的"健忘"和"无法进化"的痛点。它作为一个即插即用的模块，能够无缝集成到主流MAS框架中，显著提升其在各类复杂任务上的性能，同时保持了极高的资源效率。

我们相信，G-Memory为构建能够持续学习、适应和演化的智能体团队铺平了道路。未来，我们期待看到G-Memory在更广泛的领域，如机器人长程规划、真实世界决策系统、协同AI助手等方面大放异彩，让多智能体系统真正拥有强大的"集体大脑"！

引用链接

[1]: https://arxiv.org/abs/2506.07398

[2]: https://github.com/bingreeky/GMemory

文章来自公众号“AI修猫Prompt”，作者“G-Memory研究团队”

本文分类：AI热点
本文标签：无
浏览次数：107 次浏览
发布日期：2025-06-16 09:16:40
本文链接：https://dify360.com/AIredian/jXq764pkr02Ww9687KQndGeaYAoZBOyl.html
声明：内容来源于公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱aichina360@163.com，并在邮箱中提供有效版权证明文件给我们，我们将第一时间进行处理。