阿里云通义实验室今日宣布,已将通义DeepResearch完全开源。这款开创性的Web代理工具,以仅300亿参数(实际激活30亿)的轻量级规模,在性能上实现了对标OpenAI深度研究工具的突破。

通义DeepResearch在多项权威基准测试中表现卓越,包括在Humanity"s Last Exam中获得32.9分,在BrowseComp上取得45.3分,并在xbench-DeepSearch中斩获75.0的高分,这标志着开源AI智能体在复杂信息检索和推理领域取得了重大进展。

该代理专为处理多步、长周期的深度信息搜集任务而设计,支持128K的超长上下文。它能够将复杂问题高效分解,进行多步推理,并整合海量数据。其背后的技术创新包括智能体数据持续预训练和on-policy强化学习,这使得它在处理多轮交互和实时数据处理的场景中,如多日行程规划和法律文档分析,表现出强大的稳定性和可靠性。

通义DeepResearch提供两种推理模式:适用于轻量级任务的单模型ReAct模式,以及通过多Agent并行协作、支持算力扩展的Heavy模式。目前,该技术已在实际应用中落地,例如集成到高德地图,帮助用户规划个性化多日行程;同时,它也赋能法律助手“通义法睿”,显著提升了合同风险评估和案件分析的效率。

作为阿里云通义系列大模型生态的重要一环,通义DeepResearch的开源将极大地降低AI代理的开发门槛。该系列此前已开源超过200款不同参数规模的模型,并催生了Hugging Face平台上超过10万个二次开发模型。专家认为,此次开源将为开发者和小型团队提供强大的基础,帮助他们快速构建出特定领域的AI智能体。