返回新闻列表
具身智能爆火,AI如何让机器人实现"自主进化"?
14/2026-03

具身智能爆火,AI如何让机器人实现"自主进化"?

公告技术2026-03-14
2025年春节联欢晚会上,宇树科技的机器人与人类一同转手绢,跳秧歌舞的场景令人印象深刻。

"AI教父"英伟达黄仁勋多次强调AI的下一个浪潮是具身智能。今年,"具身智能"首次被写入政府工作报告中。

具身智能(Embodied Intelligence)是一个涉及人工智能、认知科学和机器人学的概念,是指将人工智能融入机器人等物理实体,赋予它们感知、学习和与环境动态交互的能力。

直白来说,就是让机器人像人类一样,能够在真实世界中精准感知、并且灵活应对。

如何才能做到这一点呢?也许让机器人拥有像人一样的自主进化能力是可行的方向。

今天,我们为大家导读一篇ICLR2025的Spotlight(聚光灯)技术论文。本文第一作者卢昊飞、第二作者吴哲,分别为清华大学人机交互实验室在读硕士与博士研究生,合作者包括蚂蚁数科高级算法专家李建树等人。

这篇论文的研究团队通过实验给出了肯定答案:结合强化学习与深度神经网络技术,机器人能够在极短时间内自动演化出适应当前环境的最优形态及控制策略,为具身智能的加速进化提供了全新的思路。

研究团队来自于清华大学与蚂蚁数科,他们为这一算法框架取名BodyGen。

实测效果显示,BodyGen可以实现60%的性能提升。

目前这一框架的代码已开源至GitHub仓库>>点击前往,欢迎大家体验~

01 为什么机器人需要"自主进化"

自然界生物通过数百万年的进化,获得了适应环境的完美身体结构与环境交互能力。然而,机器人的设计不但需要极其庞大的人类专家知识,且针对特定环境需要进行大量的实验、设计和迭代。

受自然界生物学启发,科学家提出形态控制协同设计(Co-Design)技术:让机器人模仿生物进化过程,在优化控制策略(大脑)的同时演化自身形态(形体结构、关节参数)从而适应复杂环境。

然而,这一领域长期面临两大难题:一是形体搜索空间巨大,在有限时间内下难以穷举所有可能的机器人形态;二是机器人形态与控制策略深度耦合,评估每一个候选形态设计需要大量计算资源。

清华大学与蚂蚁数科的研究团队提出BodyGen框架,利用强化学习实现了端到端的高效的形态-控制协同设计。

在这项工作中,将形体设计过程划分为两个连续阶段:形态设计阶段、环境交互阶段。

在形态设计阶段:研究引入Transformer(GPT-Style)自回归地构建机器人的形体结构并优化参数;

在环境交互阶段:同样使用Transformer(Bert-Style)对机器人的每一个关节信息进行集中处理并发送到对应关节马达,与环境交互并获得反馈。

在几轮的迭代后,BodyGen可以快速生成当前环境的最佳机器人形态和相应的控制策略。

02 BodyGen的三大技术点解读

1、机器人的"身体感知"系统:形体结构位置编码器TopoPE;

TopoPE就像机器人的"身体感知"系统,通过给机器人每个部位贴上"智能标签"。无论机器人的形状如何变化,这些标签都能帮助AI理解"这是腿"、"这是手臂"等。这样,即使机器人的形态发生变化,AI也能快速适应并控制新的身体结构。

2、机器人的"大脑中枢":基于Transformer的集中式的神经中枢处理网络MoSAT;

MoSAT就像机器人的"大脑中枢",它的工作方式很像人脑。

信息收集:首先收集机器人各个部位的信息,如位置、速度等。

中央处理:所有信息在"大脑"(Transformer网络)中进行交流和处理。

指令发送:处理后的信息转化为具体动作指令,告诉机器人如何移动。

3、奖励分配机制:时序信用分配机制下的协同设计。

BodyGen让AI同时负责两件事:设计机器人的身体和控制机器人的动作。

设计动作:AI可以给机器人"长出"新的肢体,"剪掉"不需要的部分,或保持现有结构。

控制动作:AI学习如何控制机器人的每个关节来完成任务(如行走、跳跃)。

设计一个好的机器人形态可能要等很久才知道效果好不好,比如设计了长腿,要等机器人学会走路才知道这设计是否合理。

BodyGen通过特殊的"奖励分配机制",让AI能够合理评估自己的设计决策,不会因为短期效果不明显就放弃可能很好的设计。

03 测试效果:60%性能提升

在10个不同任务种类的环境下(如爬行、地形穿越、游泳等),BodyGen生成的机器人形态相比于现有最优方法(如Transform2Act、NGE等)在环境适应性评分获得了60.03%的涨幅。

BodyGen 的平均参数量为1.43M,相较于其他基线算法更加轻量级。BodyGen的紧凑设计使其在保持生成能力的同时,显著降低了计算成本和存储需求,提升了训练的稳定性与效率。

这种高效的模型架构不仅减少了训练时的资源消耗,还提升了推理阶段的响应速度,使其更适用于资源受限的环境,甚至可在一台笔记本上借助CPU进行高效推理。

未来,团队计划通过物理模拟迁移技术推动BodyGen在实际场景中的应用。随着计算能力的提升,这一框架有望成为实现通用具身智能的重要路径,使机器人能够通过感知-行动闭环持续优化形态与行为策略,逐步实现自我设计与自动进化。