春晚上的宇树机器人武术表演《武 BOT》令人印象深刻。人形机器人 G1 和 H2 在快速奔跑中完成了穿插变阵和武术动作,展示了高动态、高协同的全自主集群控制技术。

北京通用人工智能研究院、宇树科技、上海交通大学和中国科技大学等机构的研究人员提出了一种名为 OmniXtreme 的新策略,使机器人能够执行各种极限动作,包括连续翻转、极限平衡以及霹雳舞。这种能力通过预训练一个基于流的生成控制策略,再进行驱动感知残差强化学习的后训练来实现。后训练对于成功迁移到真实世界至关重要。

研究人员花费了一整年时间深入研究通用跟踪和极端物理行为之间的障碍。在测试了数十台 G1 机器人后,他们找到了学习和物理执行能力方面的瓶颈。宇树科技联创和 CEO 王兴兴也是该论文的作者之一,论文的主要作者是 Yunshen Wang 和 Shaohang Zhu。

在人形机器人的运动控制领域,长期以来面临泛化壁垒的问题。当动作库的规模和多样性增加时,传统的统一强化学习策略往往会遭遇性能崩溃。OmniXtreme 框架将动作技能的学习与物理驱动的微调解耦,分为基于流的可扩展预训练和驱动感知的残差后训练两个阶段。








