开源项目 9月前 • 168 阅读 • 0 评论

智源研究院开源全球领先具身智能项目：RoboBrain 2.0！

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

智源研究院正式推出具身智能领域里程碑式成果：通用具身大脑RoboBrain 2.0与全球首个具身智能SaaS开源框架RoboOS 2.0。

两大成果均以开源形式发布，引发全球技术社区热议。

其中32B版本凭借时空认知能力的突破，在多项权威基准测试中刷新纪录，为机器人从“单机智能”向“群体智能”演进提供关键技术路径。

攻克三大核心瓶颈

针对主流AI模型在物理场景中的三大瓶颈（空间理解精度不足、时间建模薄弱、长链推理欠缺），RoboBrain 2.0实现全面突破：

空间理解：精准点定位与边界框预测，三维空间关系推理与动态场景图构建。

时间建模：支持多步长期规划与闭环动态调整，多智能体行为协调能力。

长链推理:因果逻辑提取与决策透明化,多步链式推理支持复杂任务分解。

性能表现：

训练方面，RoboBrain 2.0采用的是多模态数据集和分阶段训练策略。

RoboBrain 2.0基于全面且多样化的多模态数据集，融合高分辨率图像、多视角视频序列、场景图、3D场景数据及复杂自然语言指令，能全面赋能机器人在具身环境中的感知、推理与行动能力。

RoboBrain 2.0使用智源自研的大模型训推一体框架FlagScale进行大规模分布式训练采用基础时空学习、具身时空增强、具身情境中的推理链训练三阶段递进式训练流程。

使模型能够生成推理链，支持复杂任务的逐步推理和决策，从而在具身情境中实现更高效、更准确的推理和规划能力。

时间推理:在多机器人规划(80.33)、Ego-Plan2(57.23)、RoboBench (72.16)中,展现卓越长程规划、闭环反馈及多智能体协作能力,领页跑Qwen2.5-VL、Claude等模型。

RoboBrain 2.0 7B模型分别以83.95分和85.75分登顶BLINK和CV-Bench基准测试。RoboBrain2.032B模型在RoboSpatial、RefSpatial-Bench以及SAT、Where2Place和ShareRobot-Bench上实现SOTA突破！

RoboBrain2.07B模型在Multi-Robot Planning以81.50分拔得头筹RoboBrain2.032B以80.33分紧随其后；RoboBrain2.032B在Ego-Plan2(57.23分)登顶,大幅领先GPT-4o等基线;RoboBrain2.07B模型则在RoboBench以72.16分寺魁,双模型凭借优异表现刷新性能上限。

依托跨本体大小脑协作框架RoboOS2.0的多本体规划能力RoboBrain2.0已实现多智能体间协作执行任务,支持商超厨房居家等多场景部署。

RoboOS 2.0：https://github.com/FlagOpen/RoboOS

RoboBrain 2.0:https://github.com/FlagOpen/RoboBrain2.0

#AI开源项目推荐##github##AI技术##智源开源#具身智能#

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

5月前 • 开源项目

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

5月前 • 开源项目

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

5月前 • 开源项目

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

5月前 • 开源项目

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

5月前 • 开源项目

AI的开源战略

AI的开源战略

5月前 • 开源项目

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 开源项目

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

5月前 • 开源项目

热门标签

手机游戏苹果大模型企业战略调整 AI前端上海稀宇科技 Microsoft365Copilot AI还原西游记电商视频生成 MindLoongGPT Seedream 4.0 纳米香蕉

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝