阿里云开源通义DeepResearch:轻量级AI代理，性能比肩OpenAI

AI中国

AI技术专栏作家 | 发布了 246 篇文章

阿里云通义实验室今日宣布，已将通义DeepResearch完全开源。这款开创性的Web代理工具，以仅300亿参数（实际激活30亿）的轻量级规模，在性能上实现了对标OpenAI深度研究工具的突破。

通义DeepResearch在多项权威基准测试中表现卓越，包括在Humanity"s Last Exam中获得32.9分，在BrowseComp上取得45.3分，并在xbench-DeepSearch中斩获75.0的高分，这标志着开源AI智能体在复杂信息检索和推理领域取得了重大进展。

该代理专为处理多步、长周期的深度信息搜集任务而设计，支持128K的超长上下文。它能够将复杂问题高效分解，进行多步推理，并整合海量数据。其背后的技术创新包括智能体数据持续预训练和on-policy强化学习，这使得它在处理多轮交互和实时数据处理的场景中，如多日行程规划和法律文档分析，表现出强大的稳定性和可靠性。

通义DeepResearch提供两种推理模式:适用于轻量级任务的单模型ReAct模式，以及通过多Agent并行协作、支持算力扩展的Heavy模式。目前，该技术已在实际应用中落地，例如集成到高德地图，帮助用户规划个性化多日行程;同时，它也赋能法律助手“通义法睿”，显著提升了合同风险评估和案件分析的效率。

作为阿里云通义系列大模型生态的重要一环，通义DeepResearch的开源将极大地降低AI代理的开发门槛。该系列此前已开源超过200款不同参数规模的模型，并催生了Hugging Face平台上超过10万个二次开发模型。专家认为，此次开源将为开发者和小型团队提供强大的基础，帮助他们快速构建出特定领域的AI智能体。