基础研究 4周前 100 阅读 0 评论

最强开源深度研究模型:MiroMind ODR , 以82.4分成绩超越OpenAI!

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

在人工智能领域,深度研究(Deep Research)技术正成为推动AGI(通用人工智能)发展的关键引擎。然而,现有模型往往面临闭源、可复现性差等挑战。

为此,由计算机视觉大牛代季峰领衔的团队,在加盟陈天桥旗下盛大网络后,首次亮相了重磅开源项目——MiroMind ODR(Open Deep Research)。

该项目不仅以GAIA测试82.4分的成绩超越OpenAI DeepResearch等一众模型,还实现了全栈开源,为社区带来前所未有的透明度和协作潜力。

四大模块

ODR 并非单一模型,而是覆盖深度研究全链路的开源生态系统,由四大核心组件构成:

MiroFlow

  • 功能:支持多工具调用的Agent框架,可扩展任意大语言模型(LLM)以实现工具辅助推理
  • 性能:在GAIA验证集上取得82.4分,超越现有商用API,为当前可复现性能最高的开源框架;

  • 亮点:框架设计稳定可复现,配置全公开,支持动态任务调度与长程研究逻辑。

MiroThinker

  • 原生支持工具调用与多步推理的深度研究核心模型;配合MiroFlow时,在GAIA-Text-103数据集上达到60.2% SOTA性能,接近OpenAI闭源模型水平;
  • 模型权重、训练代码、微调脚本全部开源,支持二次训练优化。

MiroVerse

  • 开源147K深度研究训练数据集,覆盖多学科复杂研究任务;

  • 团队承诺按月更新数据集,响应社区反馈构建动态高质量语料库。

MiroTrain / MiroRL

  • 开源训练基础设施,覆盖完整DR训练流程;
  • 支持长文本训练、工具增强的强化学习(RL),大幅降低复现门槛。

与部分“伪开源”项目不同,MiroMind ODR实现了彻底的开源承诺。其核心模型、训练数据、AI基础设施、DR Agent框架等全部组件均开放共享,确保社区可完全复现和迭代。

实测体验

目前,项目已开放Demo供用户体验。尽管处于早期阶段,仅支持单轮次英文对话,但其设计已显露出强大潜力:

界面简洁,用户可输入问题或选择推荐查询。

思考过程可视化,左侧工作流导览支持节点跳转,便于追踪推理逻辑。

集成联网搜索能力,实时获取外部信息辅助决策。

结果呈现清晰结构化,提升可读性。

核心人物

项目核心推手代季峰,现任清华大学电子工程系副教授,是计算机视觉与深度学习领域的国际权威。其学术成就包括:

论文总引用超6万次,代表作R-FCN目标检测算法和Deformable ConvNets被誉为“三大目标检测元模型之一”,性能超越Meta、谷歌等巨头模型。

主导开发InternVL多模态模型,Hugging Face下载量破千万,成为最具影响力的开源多模态基础模型之一。

代季峰的个人网站显示其清华背景(2009年学士、2014年博士),并曾任职微软亚洲研究院和商汤研究院。2024年加盟陈天桥旗下盛大网络,筹备新AI公司,目标打造“第二个DeepSeek”,聚焦AGI基础研究。其公司研发重点包括AI商业决策、算法茧房突破及老龄化AI服务。

MiroMind ODR的开源标志着深度研究进入透明化、协作化新时代。无论是开发者、研究者还是AI爱好者,均可参与这一旅程,共同塑造AGI未来。

体验地址:https://dr.miromind.ai/

GitHub:https://github.com/MiroMindAI

#AI开源项目推荐##github##AI技术##推理模型##AI推理#

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!