近日,百度強化學習團隊發布了四足機器人控制上的最新研究進展,采用自進化的步態生成器與強化學習聯合訓練,從零開始學習并掌握多種運動步態,一套算法解決包括獨木橋、跳隔板、鉆洞穴等多種場景控制難題。百度已開源全部仿真環境和訓練代碼,并公開相關論文。
完整仿真效果和真機視頻
足式機器人的控制一直是機器人控制領域的研究熱點,因為相比于常見的輪式機器人,足式機器人可以像人類一樣靈活地跨越障礙,極大地擴展機器人的活動邊界。波士頓動力(Boston Dynamics)此前對外發布了其商用的第一款四足機器人Spot,但是相關的控制算法一直沒有對外披露。而市面上商業產品采用的控制算法,大部分基于麻省理工學院(MIT)開源的第三代的四足控制算法,需要依賴大量專家經驗。
近日,百度強化學習團隊聯合小度機器人團隊,基于飛槳機器人控制算法框架PaddleRobotics,發布了四足機器人控制的最新進展。該算法首次提出基于自進化的步態生成器來引導強化學習訓練,通過自主學習,機器人能探索出合理的步態并穿越各種各樣的高難度場景。
這個算法到底有多厲害,先來一睹為快。
圖一、四足機器人步態展示
(注:演示真機為宇樹四足機器人產品)
2025-04-11 12:24
2025-04-11 12:23
2025-04-11 12:22
2025-04-11 12:21
2025-04-11 12:20
2025-04-11 12:20
2025-04-11 12:19
2025-04-11 12:18
2025-04-10 05:16
2025-04-10 05:15