可以模仿人類動作的機器人
史丹佛大學研究人員訓練和測試的機械臂基於兩個框架,這兩個框架一起運作可以幫助機械臂更快更容易地學會一些基礎技能。其中RoboTurk框架可以讓人們即時引導機械臂完成任務,這一引導可通過智慧手機或流覽器實現。而SURREAL則通過同時運行多項經驗學習來加速學習過程,這就允許機械臂同時學習多種任務。
(來源:機器人學習大會)
「結合RoboTurk和SURREAL,我們可以將從人類收集到的資料與大規模強化學習相結合,進而可以讓機器人做更多事。」Mandlekar說,他是開發框架研究團隊的成員。
團隊成員電腦科學博士生Yuke Zhu展示了如何通過他iPhone上面的app對系統進行操作。他可以通過揮動手機指導機械臂對周圍環境進行交互和探索。但這往往需要大量的手臂揮動或大量資料。就像父母教孩子如何刷牙一樣,人們可以對機械臂展示如何做特定任務。
但這些教學並不是完美的,甚至有時指令會出錯。此外,「人類在機器人教學方面絕不是最佳選擇,」Zhu說,「但目前這些經驗是機器人教學不可或缺的一部分。」
更快的平行學習
這些試驗無論是否失敗,都為我們提供了寶貴的資訊。通過RoboTurk手機的演示資訊將為機器人提供背景知識,並啟動它們的學習。而SURREAL則允許同時在全球範圍內運行數以千計的類比訓練,以加速學習進程。
研究團隊成員電腦科學博士生Linxi Fan說,「有了SURREAL,我們希望能加快機器人與環境互動的過程。」這些框架大大增加了可供機器人學習的資料量。
「通過對兩個框架的結合,我們提供了AI輔助的任務機制,通過這種機制可以讓人們遠離危險環境同時可以保持相似的任務執行水準。」博士後研究員Animesh Garg說,他參與了框架的開發。
該團隊還設想機器人在未來將成為日常生活中不可或缺的一部分:說明人們做家務,在製造過程中說明執行重複的裝配任務,或是完成可能對人類構成威脅的危險任務。
「你不用告訴機器人需要旋轉20度向前伸展10分米,」Zhu說,「你只需要告訴機器人你想要拿一個放在廚房的蘋果。」