AI热点 1月前 97 阅读 0 评论

全球首款生成式人形机器人运动大模型发布:可根据指令生成跑步、舞蹈等连贯动作

作者头像
快科技

AI技术专栏作家 | 发布了 246 篇文章

快科技5月29日消息,今日上午,国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院,正式发布了全球首款生成式人形机器人运动大模型 龙跃”(MindLoongGPT)

龙跃大模型以自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。

也就是说,用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如以优雅的姿势递上一杯咖啡”、挥手致意”或上传一段参考视频,龙跃大模型即可自动解析语义并生成对应的连贯动作,并支持通过追加指令实时调整细节。

这一能力,在教育、服务机器人领域具有颠覆性意义。据介绍,龙跃大模型具有四大核心技术优势:

一是多模态交互、低门槛驱动。用户只需用自然语言驱动,模型即可一切行动听指挥”。

二是拟真度与时序一致性双突破。通过将人体动作视为时序语言”,生成的跑步、舞蹈等动作不仅流畅自然,更保留真实人体的惯性节奏。

三是结构生成与细节优化并重。模型采用分阶段生成策略,从全局姿态到局部关节角度均实现毫米级精度控制。

四是轻量化设计,赋能广泛场景。在保证性能的前提下,MindLoongGPT模型体积被压缩至同类型产品的1/3,可在教育机器人、智能穿戴设备等嵌入式平台实时运行,为产业落地铺平道路。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!