Dactyl AI的研究人員成功研究出一種自學(xué)算法,它能讓機(jī)器人的手具有很高的靈活性。他們研究出的算法使機(jī)器手能靈活地操縱一個立方體,這個過程在計算機(jī)模擬中相當(dāng)于進(jìn)行了百年的練習(xí)(盡管實際只有幾天的時間)。
機(jī)器人的手還遠(yuǎn)不及人類的敏捷,而且如果想應(yīng)用在工廠或倉庫里也顯得太笨拙了。即便如此,這項研究依然顯示了機(jī)器學(xué)習(xí)的潛力。它還表明,有一天,機(jī)器人可能會在虛擬世界中自學(xué)新技能,這將大大加快編程或訓(xùn)練它們的進(jìn)程。
這個機(jī)器人系統(tǒng)被稱為“Dactyl”,是由位于硅谷的非營利組織OpenAI的研究人員開發(fā)的。它使用了一個來自英國公司稱為“影子”的現(xiàn)成的機(jī)器手,一個普通的相機(jī),以及一個已經(jīng)掌握了一個龐大的多人在線視頻游戲的DotA算法,它使用了同樣的自學(xué)方法。
該算法使用一種稱為強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)技術(shù)。Dactyl的任務(wù)是操縱一個立方體,把不同的面翻到上面來。通過不斷的試錯,會產(chǎn)生預(yù)期的結(jié)果。
視頻顯示,Dactyl能夠非常敏捷地旋轉(zhuǎn)立方體。它自動地找出了人類常用的幾個抓點。但這項研究也顯示了人工智能還有很長的路要走:在經(jīng)過了數(shù)百年的虛擬訓(xùn)練之后,機(jī)器人成功地操縱了魔方的概率只有13/50,這遠(yuǎn)遠(yuǎn)超過了兒童所需要的時間。
麻省理工學(xué)院名譽(yù)教授、Rethink Robotics公司的創(chuàng)始人Rodney Brooks表示:“短期內(nèi),它不適合被應(yīng)用于工業(yè)流程,但研究依然是一件好事。” Rethink Robotics公司是一家生產(chǎn)更智能工業(yè)機(jī)器人的初創(chuàng)公司。
強(qiáng)化學(xué)習(xí)的靈感來自于動物通過積極反饋學(xué)習(xí)的方式。它最初在幾十年前就被提出了,但隨著人工神經(jīng)網(wǎng)絡(luò)的進(jìn)步,在最近幾年才被證明是可行的。Alphabet旗下的DeepMind利用強(qiáng)化學(xué)習(xí)技術(shù)創(chuàng)建了AlphaGo。這是一個計算機(jī)程序,它學(xué)會了高超的技能來玩極其復(fù)雜和微妙的棋盤游戲。
其他機(jī)器人研究人員對這種方法進(jìn)行了一段時間的測試,但由于模仿現(xiàn)實世界的復(fù)雜性和不可預(yù)測性,他們一直難有突破。OpenAI的研究人員通過在虛擬世界中引入隨機(jī)變量來解決這個問題,這樣機(jī)器人就可以學(xué)習(xí)如何解釋諸如摩擦、機(jī)器人硬件噪音以及立方體部分處于視線之外的問題。
該機(jī)器人背后的工程師之一Alex Ray表示,通過賦予它更強(qiáng)的處理能力和引入更多的隨機(jī)性,可以提高Dactyl的性能。“我認(rèn)為我們還沒有達(dá)到極限,”他說。Ray補(bǔ)充說,目前還沒有計劃將這項技術(shù)商業(yè)化。他的團(tuán)隊專注于開發(fā)最強(qiáng)的通用學(xué)習(xí)方法。
“這很難做好,”密歇根大學(xué)專門研究機(jī)器操縱的專家Dmitry Berenson說,“目前還不清楚最新的機(jī)器學(xué)習(xí)方法將會帶來多大影響。我們付出了很多努力來為特定的任務(wù)提供合適的方法。”但他認(rèn)為,模擬學(xué)習(xí)可能是非常有用的:“如果我們能夠真正地跨越‘現(xiàn)實差距’,學(xué)習(xí)就會變得更加容易。
2025-03-07 14:59
2025-03-05 15:37
2025-03-03 09:55
2025-03-03 09:51
2025-03-03 09:51
2025-03-03 09:49
2025-02-26 08:53
2025-02-25 10:56
2025-02-25 10:46
2025-02-25 10:29