返回新闻列表
具身智能爆火,AI如何讓機器人實現"自主進化"?
14/2026-03

具身智能爆火,AI如何讓機器人實現"自主進化"?

公告技術2026-03-14
2025年春節聯歡晚會上,宇樹科技的機器人與人類一同轉手絹,跳秧歌舞的場景令人印象深刻。

"AI教父"英偉達黃仁勳多次強調AI的下一個浪潮是具身智能。今年,"具身智能"首次被寫入政府工作報告中。

具身智能(Embodied Intelligence)是一個涉及人工智能、認知科學和機器人學的概念,是指將人工智能融入機器人等物理實體,賦予它們感知、學習和與環境動態交互的能力。

直白來說,就是讓機器人像人類一樣,能夠在真實世界中精准感知、並且靈活應對。

如何才能做到這一點呢?也許讓機器人擁有像人一樣的自主進化能力是可行的方向。

今天,我們為大家導讀一篇ICLR2025的Spotlight(聚光燈)技術論文。本文第一作者盧昊飛、第二作者吳哲,分別為清華大學人機交互實驗室在讀碩士與博士研究生,合作者包括螞蟻數科高級算法專家李建樹等人。

這篇論文的研究團隊通過實驗給出了肯定答案:結合強化學習與深度神經網絡技術,機器人能夠在極短時間內自動演化出適應當前環境的最優形態及控制策略,為具身智能的加速進化提供了全新的思路。

研究團隊來自於清華大學與螞蟻數科,他們為這一算法框架取名BodyGen。

實測效果顯示,BodyGen可以實現60%的性能提升。

目前這一框架的代碼已開源至GitHub倉庫>>點擊前往,歡迎大家體驗~

01 為什麼機器人需要"自主進化"

自然界生物通過數百萬年的進化,獲得了適應環境的完美身體結構與環境交互能力。然而,機器人的設計不但需要極其龐大的人類專家知識,且針對特定環境需要進行大量的實驗、設計和迭代。

受自然界生物學啟發,科學家提出形態控制協同設計(Co-Design)技術:讓機器人模仿生物進化過程,在優化控制策略(大腦)的同時演化自身形態(形體結構、關節參數)從而適應複雜環境。

然而,這一領域長期面臨兩大難題:一是形體搜索空間巨大,在有限時間內下難以窮舉所有可能的機器人形態;二是機器人形態與控制策略深度耦合,評估每一個候選形態設計需要大量計算資源。

清華大學與螞蟻數科的研究團隊提出BodyGen框架,利用強化學習實現了端到端的高效的形態-控制協同設計。

在這項工作中,將形體設計過程劃分為兩個連續階段:形態設計階段、環境交互階段。

在形態設計階段:研究引入Transformer(GPT-Style)自回歸地構建機器人的形體結構並優化參數;

在環境交互階段:同樣使用Transformer(Bert-Style)對機器人的每一個關節信息進行集中處理並發送到對應關節馬達,與環境交互並獲得反饋。

在幾輪的迭代後,BodyGen可以快速生成當前環境的最佳機器人形態和相應的控制策略。

02 BodyGen的三大技術點解讀

1、機器人的"身體感知"系統:形體結構位置編碼器TopoPE;

TopoPE就像機器人的"身體感知"系統,通過給機器人每個部位貼上"智能標籤"。無論機器人的形狀如何變化,這些標籤都能幫助AI理解"這是腿"、"這是手臂"等。這樣,即使機器人的形態發生變化,AI也能快速適應並控制新的身體結構。

2、機器人的"大腦中樞":基於Transformer的集中式的神經中樞處理網絡MoSAT;

MoSAT就像機器人的"大腦中樞",它的工作方式很像人腦。

信息收集:首先收集機器人各個部位的信息,如位置、速度等。

中央處理:所有信息在"大腦"(Transformer網絡)中進行交流和處理。

指令發送:處理後的信息轉化為具體動作指令,告訴機器人如何移動。

3、獎勵分配機制:時序信用分配機制下的協同設計。

BodyGen讓AI同時負責兩件事:設計機器人的身體和控制機器人的動作。

設計動作:AI可以給機器人"長出"新的肢體,"剪掉"不需要的部分,或保持現有結構。

控制動作:AI學習如何控制機器人的每個關節來完成任務(如行走、跳躍)。

設計一個好的機器人形態可能要等很久才知道效果好不好,比如設計了長腿,要等機器人學會走路才知道這設計是否合理。

BodyGen通過特殊的"獎勵分配機制",讓AI能夠合理評估自己的設計決策,不會因為短期效果不明顯就放棄可能很好的設計。

03 測試效果:60%性能提升

在10個不同任務種類的環境下(如爬行、地形穿越、游泳等),BodyGen生成的機器人形態相比於現有最優方法(如Transform2Act、NGE等)在環境適應性評分獲得了60.03%的漲幅。

BodyGen 的平均參數量為1.43M,相比於其他基線算法更加輕量級。BodyGen的緊湊設計使其在保持生成能力的同時,顯著降低了計算成本和存儲需求,提升了訓練的穩定性與效率。

這種高效的模型架構不僅減少了訓練時的資源消耗,還提升了推理階段的響應速度,使其更適用於資源受限的環境,甚至可在一台筆記本上借助CPU進行高效推理。

未來,團隊計劃通過物理模擬遷移技術推動BodyGen在實際場景中的應用。隨著計算能力的提升,這一框架有望成為實現通用具身智能的重要路徑,使機器人能夠通過感知-行動閉環持續優化形態與行為策略,逐步實現自我設計與自動進化。