機(jī)器人技術(shù)面臨的一大挑戰(zhàn)是,必須投入大量精力針對(duì)每個(gè)機(jī)器人、任務(wù)和環(huán)境訓(xùn)練機(jī)器學(xué)習(xí)模型。現(xiàn)在,由谷歌 DeepMind 和其他 33 家研究機(jī)構(gòu)聯(lián)合開展的一個(gè)新項(xiàng)目旨在通過創(chuàng)建一個(gè)通用的人工智能系統(tǒng)來應(yīng)對(duì)這一挑戰(zhàn),該系統(tǒng)可以與不同類型的物理機(jī)器人協(xié)同工作,并執(zhí)行多種任務(wù)。
谷歌機(jī)器人技術(shù)公司高級(jí)軟件工程師潘納格-桑凱蒂(Pannag Sanketi)告訴 VentureBeat:"我們觀察到,機(jī)器人是很好的專家,但卻是很差的通才。"通常情況下,你必須針對(duì)每項(xiàng)任務(wù)、機(jī)器人和環(huán)境訓(xùn)練一個(gè)模型。改變一個(gè)變量往往需要從頭開始。"
為了克服這個(gè)問題,使機(jī)器人的訓(xùn)練和部署變得更加簡(jiǎn)單快捷,這個(gè)名為 Open-X Embodiment 的新項(xiàng)目引入了兩個(gè)關(guān)鍵組件:一個(gè)包含多種機(jī)器人類型數(shù)據(jù)的數(shù)據(jù)集,以及一個(gè)能夠在各種任務(wù)中轉(zhuǎn)移技能的模型系列。研究人員在機(jī)器人實(shí)驗(yàn)室和不同類型的機(jī)器人上對(duì)這些模型進(jìn)行了測(cè)試,與常用的機(jī)器人訓(xùn)練方法相比,取得了卓越的效果。
結(jié)合機(jī)器人數(shù)據(jù)
Open X-Embodiment 項(xiàng)目的誕生源于這樣一種直覺:將來自不同機(jī)器人和任務(wù)的數(shù)據(jù)結(jié)合起來,可以創(chuàng)建一個(gè)優(yōu)于專用模型的通用模型,適用于所有類型的機(jī)器人。這一概念部分受到大型語言模型(LLMs)的啟發(fā),在大型通用數(shù)據(jù)集上進(jìn)行訓(xùn)練后,LLMs 可以與在狹窄的特定任務(wù)數(shù)據(jù)集上訓(xùn)練的小型模型相媲美,甚至更勝一籌。令人驚訝的是,研究人員發(fā)現(xiàn),同樣的原理也適用于機(jī)器人技術(shù)。
為了創(chuàng)建 "Open X-Embodiment "數(shù)據(jù)集,研究團(tuán)隊(duì)收集了來自不同國家 20 個(gè)機(jī)構(gòu)的 22 個(gè)機(jī)器人實(shí)例的數(shù)據(jù)。該數(shù)據(jù)集包含 100 多萬個(gè)事件中的 500 多種技能和 15 萬項(xiàng)任務(wù)的示例(一個(gè)事件是機(jī)器人每次嘗試完成一項(xiàng)任務(wù)時(shí)的一連串動(dòng)作)。
RT-2-X 在新技能(即訓(xùn)練數(shù)據(jù)集中未包含的新任務(wù))方面的成功率是 RT-2 的三倍。特別是,RT-2-X 在需要空間理解的任務(wù)上表現(xiàn)得更好,例如,分辨將蘋果移到布附近與放在布上的區(qū)別。
研究人員在一篇發(fā)布 Open X 和 RT-X 的博文中寫道:"我們的研究結(jié)果表明,與其他平臺(tái)的數(shù)據(jù)共同訓(xùn)練為 RT-2-X 注入了原始數(shù)據(jù)集中沒有的額外技能,使其能夠執(zhí)行新穎的任務(wù)。"
邁出機(jī)器人研究的未來步伐
展望未來,科學(xué)家們正在考慮將這些進(jìn)展與DeepMind開發(fā)的自我完善模型RoboCat的見解相結(jié)合的研究方向。RoboCat 可以學(xué)習(xí)在不同的機(jī)械臂上執(zhí)行各種任務(wù),然后自動(dòng)生成新的訓(xùn)練數(shù)據(jù),以提高其性能。
桑凱蒂認(rèn)為,另一個(gè)潛在的方向是進(jìn)一步研究不同的數(shù)據(jù)集混合物會(huì)如何影響跨實(shí)驗(yàn)泛化,以及改進(jìn)后的泛化是如何實(shí)現(xiàn)的。
該團(tuán)隊(duì)已經(jīng)開源了Open X-Embodiment數(shù)據(jù)集和RT-1-X模型的一個(gè)小版本,但沒有開源RT-2-X模型。他說:
"我們相信,這些工具將改變機(jī)器人的訓(xùn)練方式,并加速這一領(lǐng)域的研究。我們希望數(shù)據(jù)開源和提供安全但有限的模型能夠減少障礙,加快研究。機(jī)器人技術(shù)的未來有賴于讓機(jī)器人能夠相互學(xué)習(xí),最重要的是讓研究人員能夠相互學(xué)習(xí)。"
2025-02-22 08:53
2025-02-20 09:01
2025-02-20 09:01
2025-02-20 08:58
2025-02-20 08:58
2025-02-20 08:57
2025-02-20 08:56
2025-02-20 08:55
2025-02-19 11:51
2025-02-19 11:50