Midjourney操作界面

Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”

4.8
0热度

自Agent火了以后,有关"记忆"的框架如雨后春笋般涌现,但绝大多数仍是为"单兵作战"设计,难以适应需要复杂协作、信息交互量暴增10倍的多智能体系统(MAS),为此,我非常荣幸地为大家带来G-Memory论文团队(来自新加坡国立大学、同济大学等顶尖学府)的亲笔解读。他们工作的独到之处,在于跳出"存得更多,记得更多"的内卷,另辟蹊径地首创了一套真正的"记忆管理"体系:通过G-Memory三层图架构

自Agent火了以后,有关"记忆"的框架如雨后春笋般涌现,但绝大多数仍是为"单兵作战"设计,难以适应需要复杂协作、信息交互量暴增10倍的多智能体系统(MAS),为此,我非常荣幸地为大家带来G-Memory论文团队(来自新加坡国立大学、同济大学等顶尖学府)的亲笔解读。他们工作的独到之处,在于跳出"存得更多,记得更多"的内卷,另辟蹊径地首创了一套真正的"记忆管理"体系:通过G-Memory三层图架构,将MAS的记忆从杂乱的数据仓库,升华为能自我提炼与进化的"集体大脑",从而一举解决MAS"高耗、健忘、难进化"的三大顽疾。下面,让我们深入了解他们是如何做到的。以下为作者投稿内容:


Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


独木不成林,随着大型语言模型(LLM)驱动的智能体(Agent)遍地开花,我们很快发现,单打独斗的Agent能力终究有限。于是,借鉴人类团队协作的智慧,多智能体系统(MAS)应运而生,通过分工合作,展现出远超单个智能体的强大认知和执行能力。

然而,在满心欢喜地部署MAS解决复杂问题时,你是否也遇到了这些令人头疼的瓶颈:


  • 团队"失忆症":智能体团队完成一个任务后,宝贵的合作经验、失败教训就随风而逝了。下次遇到类似问题,依然从零开始,无法"吃一堑,长一智"。
  • 经验"太简陋":现有的记忆机制要么过于简单,只记录一个最终结果;要么直接照搬单智能体的记忆模式,面对MAS冗长复杂的交互(token消耗可达单智能体的10倍以上!),反而造成信息过载,效果甚微。
  • 缺乏"进化力":由于没有好的记忆和复盘机制,智能体团队无法自我迭代和进化,始终停留在"开发者设定"的初始水平,潜力被严重压抑。


别再让你的智能体团队"健忘"了!来自 新加坡国立大学、同济大学、UCLA、A*STAR、南洋理工大学 的研究团队重磅推出 G-Memory,一个专为多智能体系统设计的开创性分层记忆框架,让你的Agent团队不仅能干活,更能持续成长和进化!


Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


论文标题: G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems

论文链接: https://arxiv.org/abs/2506.07398 [1]

代码链接: https://github.com/bingreeky/GMemory [2]


问题的核心:为何MAS需要专属记忆?


在深入了解G-Memory之前,我们必须先直面一个根本问题:既然现在单智能体已经存在相当多的Memory架构设计,为什么不能简单地把单智能体的记忆方法嫁接到MAS上?

答案藏在下面这张图里。


Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


添加图片注释,不超过 140 字(可选)


可以看到,MAS为了完成任务,其内部的多轮、多角色沟通会产生海量的交互文本。如果像单智能体那样,将所有历史记录不加区分地塞进记忆库,不仅成本高昂,更会让LLM在冗余信息中迷失方向,难以提取真正有价值的经验。

因此,一个理想的MAS记忆系统必须能够:


  1. 存储(Store):高效记录冗长的多智能体交互历史。
  2. 检索(Retrieve):精确找到与当前任务最相关的"过往经验"。
  3. 管理(Manage):对经验进行抽象和提炼,形成可指导未来的"高层智慧"。


这正是G-Memory诞生的使命。


G-Memory: 独创三层图记忆架构


受组织记忆理论的启发,G-Memory创造性地设计了一个 三层图(Three-Tier Graph) 结构来管理MAS的集体记忆。这三层各司其职,又紧密相连,构成了智能体团队的"记忆宫殿"。可视化如图1所示。


第一层:交互图 (Interaction Graph) - "原始案卷"


  • 作用:这是最底层的记忆,忠实地记录每一次任务中,所有智能体之间每一句对话、每一个动作的完整轨迹。它是所有高层记忆的"事实依据"。


第二层:查询图 (Query Graph) - "任务档案库"


  • 作用:这一层将每个任务(Query)作为一个节点。它不仅存储了任务本身,还记录了任务的成败状态,并链接到对应的底层"交互图"。更重要的是,它还会建立节点间的连接,将语义上相似或有关联的任务联系起来,形成一个"任务关系网络"。


第三层:洞见图 (Insight Graph) - "智慧结晶"


  • 作用:这是最高层的记忆,存储着从多次成功或失败的交互中提炼出的、具有普适性的经验和教训(Insights)。例如,"在操作物体前,必须先确认其状态"或"当进行网络搜索时,要警惕名称相似但实体不同的情况"。

Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


G-Memory工作流:双向检索与动态进化


G-Memory的工作流如图2所示。当一个新任务到来时,G-Memory的记忆检索并非盲目捞取,而是一个高效的 双向遍历(Bi-directional Traversal) 过程:


1.定位:首先在 查询图 中找到与新任务最相似的历史任务节点,操作如下所示:

Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


2.向上追溯 (Upward Traversal):从这些历史任务节点出发,向上访问 洞见图,获取高屋建瓴的、普适性的"战略指导",操作如下所示:

Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


3.向下挖掘 (Downward Traversal):同时,向下深入到对应的 交互图 中,利用LLM提取出最关键、最核心的"战术片段"(例如导致失败的关键一步或合作成功的核心对话),避免信息过载。操作如下所示:

Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


当任务执行完毕,G-Memory会根据结果 动态更新 所有三层图,将新的交互、新的任务节点、以及可能产生的新"洞见"融入记忆体系,为每个智能体提供精简且高效的记忆支持:

Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


如此循环往复,智能体团队的集体智慧便在一次次实战中不断积累和升华。


效果惊人:全面超越,成本可控


G-Memory是否只是听起来很美?实验数据给出了响亮的回答。在5个主流基准数据集、3种LLM和3个知名MAS框架上的大量实验证明,G-Memory是名副其实的"性能加速器"。5个数据集包括ALFWorld、SciWorld、PDDL、HotpotQA、FEVER等。单智能体Memory基线方法包括Voyager、MemoryBank、Generative Agents等,多智能体Memory基线方法包括来自MetaGPT、ChatDev、MacNet等系统的记忆模组。


性能提升显著:


Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


从上表可以看出,无论是与无记忆、单智能体记忆还是其他简化的MAS记忆相比,G-Memory都带来了显著的性能提升。


  • Embodied Action (ALFWorld) 任务上,成功率最高提升 20.89%
  • Knowledge QA (FEVER) 任务上,准确率最高提升 10.12%


成本效益极高:


Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”



上图展示了性能与Token消耗的权衡。G-Memory总能在相似甚至更低的成本下,达到远超其他方法的性能水平,真正做到了"好钢用在刀刃上"。


案例分析:G-Memory如何"运筹帷幄"


让我们通过一个生动的案例,看看G-Memory在实战中是如何发挥作用的。


Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”


场景:ALFWorld + AutoGen 框架


  • 当前任务put a clean cloth in countertop (把一块干净的布放到台面上)。
  • G-Memory的检索结果

  1. 相似任务 (Query Graph):成功检索到历史任务 put a clean egg in microwave (把一个干净的鸡蛋放进微波炉)。两者都包含"先清洁、后放置"的核心逻辑。
  2. 键轨迹 (Interaction Graph):G-Memory不仅找到了这个相似任务,还从其交互图中提取出了一个 关键失败片段:在那个历史任务中,某个智能体在没有清洗鸡蛋的情况下,就试图将其放入微波炉,结果被其他智能体纠正。
  3. 高层洞见 (Insight Graph):同时,它还检索到一条普适性洞见:"在完成放置任务前,确保所有物品都处于所需状态(如清洁、加热等)"。


有了这些来自"集体记忆"的宝贵线索,智能体团队在执行新任务时,就能主动规避曾经犯过的错误,大大提高执行成功的概率。


总结与展望


G-Memory通过其创新的 三层图分层记忆架构,成功解决了当前多智能体系统普遍存在的"健忘"和"无法进化"的痛点。它作为一个即插即用的模块,能够无缝集成到主流MAS框架中,显著提升其在各类复杂任务上的性能,同时保持了极高的资源效率。


我们相信,G-Memory为构建能够持续学习、适应和演化的智能体团队铺平了道路。未来,我们期待看到G-Memory在更广泛的领域,如机器人长程规划、真实世界决策系统、协同AI助手等方面大放异彩,让多智能体系统真正拥有强大的"集体大脑"!


引用链接

[1]: https://arxiv.org/abs/2506.07398

[2]: https://github.com/bingreeky/GMemory


文章来自公众号“AI修猫Prompt”,作者“G-Memory研究团队”

点赞(0)
顶部