適應(yīng)雙足機(jī)器人的快速電機(jī)適應(yīng)
2022-06-06 15:17:48
?
來源:
導(dǎo)讀 最近關(guān)于機(jī)器人行走的研究調(diào)查了如何制造能夠?qū)W習(xí)行走的機(jī)器人,而不是為特定地形設(shè)計控制器。arXiv org 上最近的一篇論文研究了一種基于
最近關(guān)于機(jī)器人行走的研究調(diào)查了如何制造能夠?qū)W習(xí)行走的機(jī)器人,而不是為特定地形設(shè)計控制器。arXiv.org 上最近的一篇論文研究了一種基于學(xué)習(xí)的雙足機(jī)器人方法。
A-RMA 的性能通過雙足機(jī)器人在幾個具有挑戰(zhàn)性的設(shè)置中得到展示,包括光滑的表面、泡沫和拉動有效載荷。圖片來源:arXiv:2205.15299 [cs.RO]
研究人員使用快速電機(jī)適應(yīng) (RMA) 對機(jī)器人進(jìn)行模擬訓(xùn)練。它是一種以向量為條件的自適應(yīng)策略,該向量在模擬中對特定于地形的信息進(jìn)行編碼。然而,對于雙足機(jī)器人來說,僅僅從可觀察狀態(tài)來精確估計部署時的特權(quán)外在因素通常是不可能的。因此,研究人員提出了 A-RMA,它使用從適應(yīng)模塊估計的不完美外在因素來微調(diào)基本策略,而不是以完美外在因素為條件。
A-RMA 顯示了超出訓(xùn)練期間所見地形的泛化能力,而無需額外的現(xiàn)實世界微調(diào)或校準(zhǔn)。
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!