蹣跚學步的孩童,學會了跌倒后如何站起來,慢慢感受平衡,最終學會用雙腿走路,這個過程很大程度上是通過反復試驗學會的。但是,波士頓動力公司的Spot和Atlas等機器人并不是這樣的,他們被精心編碼處理特定的任務,結果可能會非常好,但是在軟件編程沒有設計到情況下,機器人可能就會無所適從。據國外媒體1月6日消息,來自中國浙江大學和英國愛丁堡大學的一個聯合研究小組稱,他們開發出了更好的方式來解決這樣的問題。
在最近發表在《科學機器人》雜志上的一篇論文中,聯合研究小組詳細介紹了一種人工智能強化方法,他們用這種方法讓自己的機器狗“絕影”學會如何走路和自主從跌倒中恢復過來。該團隊表示,他們首先在模擬環境中通過軟件訓練虛擬機器人。這個軟件由八名經過培訓以掌握特定技能的AI“專家”組成,例如,一個“專家”訓練機器人流利的行走,而另一個訓練機器人如何保持平衡。每次虛擬機器人成功完成一項任務時,團隊都會以虛擬積分獎勵它。這個過程聽起來與Google最近用來訓練MuZero算法的方法相同。
當八種專項技能培訓完成后,研究團隊開發了一個額外的神經網絡,有些類似于運動隊伍中的總教練管理,它將管理其他八種專項技能,在特定的情況下,還會根據需要對一種或者多種技能進行優先排序。最后,研究團隊會將軟件移植到原型機器人上進行實際測試。
論文作者之一李志斌(音)表示,他們研究的目標是創造更加智能化的機器人,這種機器人能夠在行進中更加靈活地根據實際情況自適應選擇技能,以便于處理未經訓練過的任務內容。目前,該團隊面臨的挑戰之一是如何減少模擬機器人訓練所需要的計算力,這樣研究才更具有實用性價值。
2025-04-18 08:54
2025-04-18 08:53
2025-04-17 08:16
2025-04-17 08:13
2025-04-16 10:55
2025-04-16 08:50
2025-04-14 14:57
2025-04-14 14:53
2025-04-09 12:40
2025-04-08 08:51