国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

清華團隊CoRL 2024摘得最佳論文獎,機器人模仿學習新突破!

   時間:2025-01-29 13:54 來源:ITBEAR作者:江紫萱

在近日閉幕的2024年度全球機器人學習頂級盛會CoRL(Conference on Robot Learning)上,來自中國清華大學的高陽教授團隊憑借出色研究成果,在X-Embodiment Workshop中榮獲最佳論文獎。該獎項不僅彰顯了團隊在機器人模仿學習領域的卓越貢獻,也標志著中國學者在全球機器人技術前沿探索中的顯著地位。

CoRL會議作為機器人學習領域的頂尖交流平臺,每年都會吸引來自世界各地頂尖學府的最新研究成果。此次獲獎的論文《Data Scaling Laws in Imitation Learning for Robotic Manipulation》,由高陽教授及其學生林凡淇、胡英東、盛平岳、Chuan Wen、游嘉誠共同完成。論文聚焦于模仿學習中數據規模定律的應用,特別是在實現零樣本泛化方面的潛力。

研究過程中,團隊通過精心設計的實驗方案,收集了超過4萬次人類演示數據,并在超過1.5萬次機器人實際操作中進行了驗證。實驗發現,策略的泛化能力關鍵在于環境和對象的多樣性,而非演示數量的簡單累積?;谶@一發現,團隊創新性地提出了一種高效數據收集策略,僅需四位采集者花費一下午時間,即可獲取足夠數據,使機器人在新環境和新對象上的任務成功率接近90%。

為了進一步驗證模型的泛化能力,研究團隊將機器人部署在多種野外環境中,包括火鍋店、咖啡館、電梯、噴泉等,這些環境在數據收集階段均未涉及。結果顯示,模型在這些全新環境中表現出色,泛化能力遠超預期。

論文詳細闡述了實驗設計過程,團隊使用手持夾持器(UMI)在不同環境中收集人類演示數據,并采用擴散策略(Diffusion Policy)對數據進行建模。實驗任務包括倒水、鼠標移動、疊毛巾和拔掉充電器等,通過改變訓練環境數量、物體數量和演示數量,深入研究了策略泛化性能的變化規律。

研究結果顯示,策略的泛化能力與訓練物體數量、環境數量和訓練環境-物體對數關系密切,符合冪律分布。隨著訓練物體和環境數量的增加,策略在未見過的物體和環境上的表現顯著提高。這一發現為機器人模仿學習領域提供了新的理論支撐和實踐指導。

獲獎團隊成員林凡淇和胡英東均為清華大學交叉信息研究院(IIIS)的博士生,他們的研究重點聚焦于具身智能領域,致力于通過大規模數據實現機器人的人類水平操作能力。盛平岳是IIIS姚班的本科生,對機器人技術、模仿學習和算法有著濃厚興趣。Chuan Wen同為IIIS博士生,與賓夕法尼亞大學GRASP實驗室保持密切合作,目前在伯克利人工智能研究(BAIR)擔任訪問學者。游嘉誠則是IIIS的一年級博士生。

高陽教授作為團隊指導老師,現任上海期智研究院PI及清華大學交叉信息研究院助理教授,專注于強化學習與機器人領域的研究。他領導的具身視覺與機器人實驗室(EVAR Lab)致力于利用人工智能技術賦能機器人,打造通用的具身智能框架。

CoRL 2024會議還宣布了其他最佳論文獲獎名單,包括Kuo-Hao Zeng等人的《PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators》和Franck Djeumou等人的《One Model to Drift Them All》。這些研究同樣在機器人學習領域取得了重要突破,為未來的技術發展提供了寶貴借鑒。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群