- +1
斯坦福大學Aloha團隊出新作:“吼你牌”系統讓機器人洗盤子更干凈
·研發者稱,希望未來的研究能進一步讓機器人在自然形式的人類監督下不斷進步,最終讓任何人都能幫助教育機器人。
繼家務機器人火爆全網后,近日,斯坦福大學研發Mobile Aloha團隊又出新作——一款名為“Yell At Your Robot”(簡稱YAY Robot)的系統。有了這個系統,可以通過“喊話”來訓練機器人。

利用YAY技術調教訓練后,機器人在完成每個階段的成功率都有顯著提高。
目前,YAY Robot系統作為研究成果,已經在社交平臺上公開,系統也已開源。
通過喊話訓練機器人
根據論文介紹,YAY Robot系統是一個通過自然語言反饋,來改善機器人后期訓練的系統。在傳統方法訓練機器人的過程中,研究人員需要觀看機器人視頻,并且要為每個技能片段、事后動作,進行重新標注或一次性糾正,過程非常費力費時。
為了簡化這一過程,YAY Robot研發團隊采用了一種更有效的數據收集方法:現場解說。通過在機器人附近放置麥克風,操作人員可以先用語言說出機器人需要掌握的技能,然后遙控機器人進行同步操作,錄制的音頻可以與機器人的軌跡同步。
經過訓練后的YAY Robot可以在與用戶的互動中不斷改進,提升動作水平,即時調整策略,將語言更有機地融入機器人的學習過程中。研究人員表示,利用YAY技術調教訓練后,機器人在完成每個階段的成功率都有顯著提高。比如,在“準備混合食物”這一任務中,經過喊話訓練的機器人動作準確性提高了30%-45%、在“清洗盤子”任務中提高了15%-25%。尤其是在清洗盤子這項任務中,研究人員可以直觀地看到整個盤子表面的清潔效果,通過人類的口頭反饋經過微調之后的機器人清潔力度更強,范圍也變大了。

通過人類的口頭反饋經過微調之后的機器人清潔力度更強
YAY Robot還引入了實時語言糾正機制
YAY Robot系統是怎么做到的呢?
研發人員透露,整個YAY系統在架構上主要由高級策略和低級策略兩個部分組成。其中高級策略負責通過自然語言指令控制低級策略,低級策略則用于執行具體動作。

YAYRobot系統工作機制
此外,YAY系統引入了實時的語言糾正機制。當機器人的操作行為不理想時,操作人員會對YAY Robot系統說,“我想讓機器人稍微調整一下”,這些修正語言就會被記錄包含在未來的訓練數據收集中。
研究人員表明,YAY Robot的目標是通過不斷學習,最大可能的減少修正的需要,并隨著時間的推移,能與用戶的偏好保持一致。
為了提高機器人操作任務的性能,研究人員透露,YAY Robot系統每次要進行 20 次試驗,還對子任務的成功率進行測量。“我們的代碼實現了采集數據與處理這一過程的自動化,并且已經開源。”研究人員在論文中稱。
研究人員施露西在論文中展望,希望未來的研究能進一步讓機器人在人類的監督下不斷進步,最終讓任何人都能幫助教育機器人。
YAY Robot研究成果第一作者施露西本科畢業于大學計算機科學專業,曾在英偉達研究院與朱玉珂教授和 Jim Fan 博士合作,2023年3月加入斯坦福大學切爾西·費恩(Chelsea Finn)實驗室,同年8月受邀在谷歌DeepMind就AWE發表演講。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司