AI热点 3小时前 102 阅读 0 评论

刚刚,宇树机器人学会新功夫!帅是真帅,就是怕它打我

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

练习时长一年半,宇树机器人又进化了。



视频画面中,宇树 G1 机器人在空中翻转,划出一道完美的弧线,整个动作一气呵成,紧接着再连续后空翻。



别急,三个单手侧后翻也不在话下。



最后机器人摆出功夫姿势,打出一套漂亮拳法,然后另一条腿猛然抬起,做出标准的顶膝动作,堪比钢甲铁拳走进现实。


这要是一拳砸在我身上,不得青一块紫一块。(手动狗头)



加州大学伯克利分校博士生 Qiayuan Liao 发文称:「令人惊叹的结果!使用我们的开源代码,就可以轻松训练出这样的运动追踪策略:」



附上开源地址:

https://github.com/HybridRobotics/whole\_body\_tracking/


有趣的是,我们发现宇树这次发的视频里的许多招式,跟 10 月 10 日北京天桥艺术中心《天工开物》舞剧百场纪念现场颇为相似。


那场演出的谢幕现场,宇树科技的机器人和机器狗直接登台跟演员一起 C 位亮相,伴着谢幕音乐大秀动作。



有一说一,宇树机器人炫技出圈并非第一回了。


早在蛇年央视春晚的舞台上,16 个身穿大花棉袄、转着手绢、扭着东北大秧歌的宇树 H1 机器人,妥妥成了那晚最抢镜的顶流。


甚至最近宇树的人形机器人外观设计专利也获批授权。专利文件显示,这个机器人身着红棉袄、手持红手帕,跟今年春晚上那个「扭秧歌」的网红机器人颇为相似。


而在 X 平台上,宇树机器人的视频隔三差五就霸榜「热搜」。


比如我们之前报道过,南方科技大学主动智能系统实验室发的视频里,宇树 G1机器人被「暴力测试」的画面火出圈。



镜头里,宇树 G1 正在接受人类的「残酷蹂躏」,愣是屹立不倒站得稳稳当当,后来宇树官方也发布了同款动作视频。


甚至前阵子亚马逊 FAR 实习生 Zhen Wu 在 X 平台扔出的视频也收割了一波流量。



据 21 世纪财经报道,截至目前,宇树科技已经申请了近 10 项人形机器人相关专利,涵盖发明、实用新型与外观设计专利。


而在第四届全球数字贸易博览会上,宇树科技创始人兼 CEO 王兴兴透了个底,公司计划今年下半年推出一款身高 1.8 米的人形机器人。


王兴兴表示,今年上半年国内机器人行业发展迅速,「中国智能机器人相关企业平均增长率达 50% 到 100%」。



今年以来,宇树科技也对机器人算法进行了多次迭代,稳定性显著提升。


「我们把它定义为反重力模式,基本上机器人在任何干扰下都能自己恢复站立。算法升级后,理论上目前机器人可以完成各种舞蹈动作、武术动作。」


不过,话说回来,宇树机器人的视频也被不少网友吐槽存在过度包装的嫌疑。



而爱整花活的不止宇树一家。


众擎 PM01 的斧头帮舞、松延动力 N2 的连续后空翻……抛开国内这些人形机器人不说,这股秀肌肉的风潮已经席卷全球。


比如继跳完芭蕾舞之后,马斯克 10 月 4 日又在社交平台扔出一段特斯拉人形机器人「Optimus」学中国功夫的视频。



视频里,机器人跟专业人士对练,展示的是实战级自卫武术技巧,能精准应对每个招式并且反击,而不是单纯照猫画虎模仿动作。



截至发稿前,这则视频已经狂揽 3831 万播放量。


当时针对网友质疑机器人是不是远程遥控的,马斯克更是直接硬刚回应:「是 AI,不是遥控。」这意味着「Optimus」具备实时感知、判断和反应能力,能在复杂环境中自主应对对手的攻击。



而让这些机器人大秀动作的初衷,终究离不开营销二字。


想象一下你要向投资人、媒体和公众科普什么叫「全身协调控制」、「力矩传感器反馈」、「实时平衡算法」——你可以用 PPT 讲一小时技术原理,也可以让机器人在镜头前被人各种推搡却依然站得稳如泰山。


而后者的传播效率直接压倒性碾压前者。


炫技终归只是入场券。当秧歌、功夫、后空翻这些视觉冲击力拉满的动作都被玩了个遍,消费者和市场也终将回归理性:这些机器人到底能解决什么实际问题?能大规模进工厂吗?能进家庭吗?成本能降到多少?


对于这些问题,目前还没有哪家人形机器人厂商能给出准确的回答。


文章来自于“APPSO”,作者“APPSO”。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!