首頁 > 科技要聞 > 科技> 正文

英偉達和MIT研究出新“魔法”:讓機器人“推不倒”

騰訊科技 整合編輯:太平洋科技 發(fā)布于:2024-12-24 17:38

讓雙足機器人走路已經(jīng)不是難題,但是想讓它們表演“跳舞”或“打拳”,卻十分有挑戰(zhàn)。機器人的運動方式越接近人類,就越能夠自然融入人類環(huán)境,而無需改變?nèi)祟愒械纳詈凸ぷ骺臻g,因此,研究怎么讓機器人的運動能力更貼近人類,是一個長期課題。

但機器人姿態(tài)動作的改變背后,不僅涉及物理形態(tài)的變化,更涉及到控制精度、平衡保持和動作連貫性的深層考驗。

就像小孩學走路,站立和行走只需掌握重心轉移和平衡,而“轉身跳舞”則需全身協(xié)調,涉及手臂、腿部和核心肌肉的配合。機器人也面臨類似挑戰(zhàn)——行走僅需控制腿部,而跳舞或打拳則要求全身精準協(xié)同,任何細微延遲或誤差都會導致動作生硬、不連貫,甚至摔倒。

在這種全身控制方面,傳統(tǒng)的機器人控制系統(tǒng)就像“遙控車”,依靠提前寫好的“動作劇本”,逐幀執(zhí)行預設的動作指令。這種“定格動畫”式的控制方式在簡單任務中表現(xiàn)良好。

但當環(huán)境發(fā)生變化,或者需要執(zhí)行連續(xù)的動態(tài)動作時,問題就暴露了——動作僵硬、卡頓明顯。

12月18日,英偉達、MIT、加州大學聯(lián)合發(fā)布了一項最新研究,提出了讓機器人更能富有表現(xiàn)力的控制全身系統(tǒng)ExBody2,可以幫助機器人打破“固定劇本”帶來的運動局限,教會機器人如何靈活應變,ExBody2的工作方式則更像是一位智慧的“舞蹈教練”,不再拘泥于“每一幀的動作指令”,而是教會機器人理解“運動的節(jié)奏和方向”。

通過這種方式,ExBody2增強了雙足機器人的平衡和適應能力,使得它們在面對輕推、復雜地面等場景時能表現(xiàn)得更加穩(wěn)定。

簡單來說,ExBody2的控制邏輯更像人類的運動方式——人類在跳舞時不會死記每一步的具體位置,而是靠節(jié)奏感和動作的連貫性來完成整段舞蹈,它關注關鍵部位的運動節(jié)奏和方向,幫助機器人在動態(tài)環(huán)境中實時調整動作。得益于這種方法,讓機器人具備連續(xù)流暢和相對穩(wěn)定的運動能力,實現(xiàn)“即興表演”的效果。

在這項研究中,研究人員使用了宇樹G1和H1人形機器人進行測試:

(人類與G1機器人跳雙人舞)

(G1機器人戶外轉換步態(tài))

(機器人打拳)

此外,ExBody2不僅能在虛擬環(huán)境中訓練機器人,還能將這些技能遷移到現(xiàn)實世界中,在Sim2Real(從虛擬到現(xiàn)實)環(huán)節(jié)幫助機器人順利走向真實世界。

從虛擬課堂到真實表演:

機器人如何“上課”?

在傳統(tǒng)的機器人動作控制方法里,讓機器人模仿人類復雜的花式動作,就像讓大象去爬樹,不僅不切實際,還可能把它“累趴下”。就像一個人在跳舞時,每一步都要精確地盯著腳和手的每個動作,生怕出錯。這種“逐幀控制”的方法一旦某一幀出現(xiàn)偏差,后續(xù)的動作就會變得不穩(wěn)定,像是“連鎖反應”一樣讓動作越來越僵硬。

ExBody2的做法更像是讓機器人學會“跟著節(jié)奏跳舞”,而不是死記硬背每一個動作。它將控制邏輯拆分為關鍵點跟蹤(控制動作的關鍵位置)和速度控制(調整動作的節(jié)奏),兩者獨立運作。

相比傳統(tǒng)的“全局控制”,ExBody2采用了局部關鍵點映射,就像在機器人身上安裝了一個“局部導航系統(tǒng)”,每個動作只需要關心自己負責的部分,而不必關注全局。這樣一來,即使某個動作有輕微偏差,也不會“牽一發(fā)而動全身”,機器人依然能流暢完成動作。

除此之外,在動作設置上,ExBody2的設計者們也用了新思路:與其讓機器人挑戰(zhàn)不可能,不如給它挑選一些真正適合的動作。從海量的動作數(shù)據(jù)集中,他們像挑選課本一樣,把這些動作分門別類,做了“分級處理”。

(來源:論文《ExBody2: Advanced Expressive Humanoid Whole-Body Control》,不同數(shù)據(jù)集下機器人關鍵點跟蹤、關節(jié)精度和速度控制誤差評估;D₅₀、D₂₅₀、D₅₀₀、DCMU,是四種不同的數(shù)據(jù)集,代表從簡單到復雜的動作難度。)

他們將數(shù)據(jù)集分成了四個“動作難度包”:

D50:入門版,就像小學一年級的課本,內(nèi)容簡單易學,包括站立、行走等基本動作;

D250:進階版,開始加入跑步和簡單舞蹈動作,難度適中,剛好適合“穩(wěn)步進步”;

D500:高級版,包含了更復雜的動作,比如單腳跳躍和旋轉,稍顯棘手,但也更具挑戰(zhàn)性;

DCMU:完整版,囊括了所有動作,從普通的步態(tài)到高難度的翻滾和地板動作,幾乎“無所不包”,但也帶來了大量噪聲和不可完成的任務。

這種分級篩選的過程,就像為一個孩子挑選適齡的書籍一樣。大人不會指望一個剛剛學會認字的孩子去讀莎士比亞,機器人也一樣,學習過程需要逐步推進。如果一開始就讓它面對“高難度關卡”,它可能會在錯誤的嘗試中迷失方向,甚至徹底放棄。

有趣的是,實驗發(fā)現(xiàn),D250數(shù)據(jù)包表現(xiàn)最佳。它的難度設計恰到好處,既包含了多樣化的動作,又沒有加入那些讓機器人望而卻步的“極限挑戰(zhàn)”。與之相比:

D50數(shù)據(jù)包雖簡單高效,但內(nèi)容過于基礎,導致機器人難以應對稍復雜的任務;

D500和DCMU數(shù)據(jù)包則因動作過于復雜,增加了無效訓練的噪聲,拖累了整體效果。

D250就像一本結構合理的練習冊,既讓機器人有挑戰(zhàn),又不會讓它壓力過大。通過這樣的篩選,ExBody2為機器人打造了一條學習之路,讓它能夠穩(wěn)扎穩(wěn)打地掌握動作技能,最終在真實世界中自信地“展現(xiàn)舞姿”。

有了優(yōu)質的數(shù)據(jù)集,ExBody2的教學進入了第二階段,即“老師-學生”架構的核心過程,這里面包含在虛擬環(huán)境中的“老師機器人”和真實環(huán)境里的“學生機器人”兩種角色。

在這個架構中,“老師機器人”是主導者,它生活在一個虛擬環(huán)境里,擁有豐富的“特權信息”,比如關節(jié)的位置、速度和身體的物理反饋。就像一個經(jīng)驗豐富的舞蹈教練,老師機器人通過強化學習算法(PPO)不斷優(yōu)化自己的動作,從單腳跳到連續(xù)旋轉,每個細節(jié)都打磨到位。

“學生機器人”的學習條件就沒那么優(yōu)越了,它進入真實世界時,面臨的環(huán)境復雜且變化多端,沒有老師那樣的“特權信息”,只能依靠歷史數(shù)據(jù)和觀察到的反饋。這就像一個學生只能通過看錄像模仿舞蹈,而無法直接從教練那里獲得詳細指導。

為了彌補信息的缺失,ExBody2采用了一種叫“DAgger”的算法,它將老師的復雜指令簡化成學生能理解的觀察數(shù)據(jù)。這個過程類似于把一部高清視頻壓縮成清晰的GIF動畫,雖然少了一些細節(jié),但核心動作得以保留。

真實環(huán)境大考驗:

ExBody2如何從“課堂”走向“實戰(zhàn)”

ExBody2是不是一套真正“聰明”的機器人學習系統(tǒng),最終的檢驗要看它在真實環(huán)境中的表現(xiàn)。就像一個學生考試時,課堂上表現(xiàn)得再好,如果在考場上發(fā)揮失常,也不能算作優(yōu)秀的學習者。因此,ExBody2不僅在“課堂”中訓練機器人,還通過一系列的實際測試,檢驗機器人在不確定環(huán)境中的表現(xiàn),來驗證證明這套系統(tǒng)的“聰明之處”。

在這場考驗中,研究團隊設計了一場機器人間的“現(xiàn)場大比拼”。他們將機器人放置在各種動態(tài)環(huán)境中,比如不平的地面、動態(tài)的障礙物、突然的輕推等,模擬出真實世界中常見的突發(fā)情況。面對這些“考驗”,機器人需要做出迅速的反應,調整自己的站姿、步伐和動作節(jié)奏,保持穩(wěn)定并完成任務。

(人形機器人在現(xiàn)實世界中執(zhí)行各種富有表現(xiàn)力的全身動作)

最有趣的測試是“推擠測試”。在實驗中,研究人員故意輕輕推一下行走中的機器人,模擬在家庭環(huán)境中孩子不小心撞到機器人的場景。結果顯示,ExBody2的機器人反應相當靈敏,能迅速調整重心,穩(wěn)穩(wěn)站住腳跟。相比之下,采用傳統(tǒng)控制方法的機器人要么停滯不前,要么直接摔倒,顯得“手足無措”。這種穩(wěn)定性得益于系統(tǒng)的高效學習方法,使得機器人不僅能在理想環(huán)境中行動自如,還能在不確定的動態(tài)環(huán)境中靈活應變。

除了“推擠測試”,ExBody2的機器人還通過了“復雜地形行走”考驗。實驗室模擬了崎嶇的地面環(huán)境,比如帶有小臺階和傾斜的路面。普通機器人在這種環(huán)境中經(jīng)!澳_步不穩(wěn)”,容易滑倒。而ExBody2的機器人就像一個穿著防滑鞋的登山者,步伐穩(wěn)健,能夠調整步長和姿態(tài),從容跨越臺階和不規(guī)則的地面。這種表現(xiàn)背后的關鍵在于,機器人能夠“記住”之前的動作調整,并在遇到類似的環(huán)境時迅速做出“類似的反應”。這種記憶能力使它在不斷變化的環(huán)境中也能“步步為營”,不像傳統(tǒng)的機器人只會在固定的環(huán)境中反復做一成不變的動作。

這些測試不僅是在實驗室中做的“花架子”,也具備一定的實際意義。比如,當家中的清潔機器人在打掃地面時,地上突然出現(xiàn)了一個小玩具,普通的機器人可能會直接被卡住,或嘗試多次繞行,但ExBody2的機器人卻能迅速“明白”前方的變化,做出合理的繞行決策。

此外,在工業(yè)流水線中,這種“靈活反應”同樣至關重要。傳統(tǒng)的工業(yè)機器人只能在指定位置“拿放物件”,但如果流水線上突然出現(xiàn)了一塊偏移的物料,ExBody2的機器人會迅速調整位置,主動適應物料的位置變化,就像流水線上的“超級工人”,不再是一個“死板的機械手”。

為了驗證ExBody2在不同場景中的表現(xiàn),研究團隊還量化了幾項關鍵的性能指標,比如在關節(jié)位置精度(下表中的Eₘₚⱼₚₑ) 上,ExBody2的機器人誤差降低,而普通的機器人誤差則要高出數(shù)倍,這一差距直接反映在動作的精準度上。

在其它指標比如關鍵點位置誤差(Eₘₚₖₚₑ)、速度誤差(Eᵥₑₗ)方面,ExBody2均有優(yōu)勢。

(ExBody2與其他方法在宇樹G1和H1上的性能對比結果)

總結來看,ExBody2的成功不僅體現(xiàn)在課堂中的“標準化訓練”,更體現(xiàn)在真實環(huán)境中的“靈活應變”。通過應對“推擠”、“復雜地形”和“動態(tài)物料變化”等考驗,ExBody2的機器人展現(xiàn)了比傳統(tǒng)機器人更高的穩(wěn)定性和靈活性。配合關鍵指標的量化表現(xiàn),證明了這套系統(tǒng)的優(yōu)越性。無論是在家中還是在工廠,ExBody2的機器人都不再是“機械的螺絲工人”,而是能夠“見招拆招”的“智能工作伙伴”,不論是家用服務場景,還是工業(yè)生產(chǎn)場景,ExBody2給人形機器人帶來新的可能性。

本文來源:騰訊科技

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部
国产younv在线精品,先锋AV无码资源不卡,亚洲国产高清不卡在线播放,伊人久久东京av