在智能家居時代即將來臨的未來,購買家務機器人可能會成為常態。然而,當這些自動助手無法執行看似簡單的任務時,消費者可能會感到挫敗。此時,美國麻省理工學院電氣工程和計算機科學系的研究員 Andi Peng 及其團隊的研究就顯得尤為重要,他們正在研發一個新的方法來改善機器人的學習能力。
Peng女士和她的研究團隊創新性地構建了一個人機交互框架,該系統的核心特性是能夠生成反事實敘述,準確指出機器人要成功執行任務所需的改變。比如,當機器人無法識別一只特殊顏色的杯子時,該系統會為機器人提供可能的替代情景,也許,如果杯子是更常見的顏色,機器人就能成功識別。這些反事實解釋與人類反饋相結合,簡化了為機器人微調生成新數據的過程。
Peng女士闡釋道:“微調是優化已經熟練掌握一項任務的現有機器學習模型的過程,使其能夠執行另一項類似的任務。”
該系統的測試效果令人印象深刻,使用此方法訓練的機器人表現出了快速的學習能力,同時也減少了人類教師的投入時間。如果能在更廣泛的領域成功實施,這種創新的框架可能幫助機器人更快地適應新環境,最大程度地減少用戶對高級技術的需求。這項技術可能會成為推動通用機器人更好地幫助老年人或殘疾人的關鍵。
Peng女士表示:“最終目標是使機器人能夠在一個類似于人類的抽象層面上進行學習和發揮作用。”
機器人學習的一個主要難點是所謂的“分布轉移”,指的是機器人遇到在訓練過程中未見過的物體或空間的情況。為了解決這個問題,研究人員引入了一種名為“模仿學習”的方法。然而,這種方法仍有其局限性。
Peng女士說:“想象一下,我們必須用 30,000 個杯子進行示范,機器人才能夠拿起任何一只杯子。相比之下,我更希望只用一個杯子進行示范,然后教機器人如何拿起任何顏色的杯子。”
因此,他們的系統將識別哪些對象屬性對完成任務至關重要(比如杯子的形狀),哪些屬性則不是(比如杯子的顏色)。有了這些信息,該系統將生成合成數據,改變“非必要”的視覺元素,以優化機器人的學習過程。
為了評估這一框架的效果,研究人員進行了一項涉及人類用戶的測試,以確定系統的反事實解釋是否增強了他們對機器人任務表現的理解。
Peng女士說:“我們發現,人類天生就擅長這種形式的反事實推理。正是這種反事實元素使我們能夠將人類的推理能力無縫地轉化為機器人邏輯。”
在多次模擬中,機器人通過他們的方法學習得更快,表現優于其他技術,同時還減少了用戶示范的需求。
在未來,這個團隊計劃在實際的機器人上實施這個框架,并致力于通過生成機器學習模型來縮短數據生成時間。這種突破性的方法可能改變機器人的學習軌跡,為機器人更好地融入我們日常生活中的未來鋪平道路。
2025-04-21 12:14
2025-04-21 12:11
2025-04-18 08:54
2025-04-18 08:53
2025-04-17 08:16
2025-04-17 08:13
2025-04-16 10:55
2025-04-16 08:50
2025-04-14 14:57
2025-04-14 14:53