国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

螞蟻靈波開源LingBot系列模型,具身智能研發迎來新范式與新助力

   時間:2026-02-10 02:51 來源:快訊作者:柳晴雪

隨著具身智能技術的快速發展,傳統視覺-語言-動作(VLA)模型正面臨數據瓶頸與復雜場景適應性挑戰。物理世界動態數據的稀缺性,成為制約機器人智能化水平提升的關鍵因素。在此背景下,螞蟻靈波宣布開源LingBot系列模型,通過構建覆蓋感知、理解、模擬、行動的完整技術棧,為行業提供了一套可復用的具身智能基礎設施。

作為系列模型的核心突破,LingBot-VA首創"自回歸視頻-動作范式",通過融合視頻生成與運動控制技術,使機器人具備"先思后行"的決策能力。該模型采用Mixture-of-Transformers架構,將視覺推演(視頻流)與運動控制(動作流)解耦設計,既共享注意力機制又保持獨立計算。在執行任務前,系統會先模擬未來3-5秒的世界狀態變化,結合實時傳感器反饋形成閉環修正,最終輸出最優動作序列。這種設計使機器人在制作早餐、雙臂協作等長時序任務中的成功率提升20%,在RoboTwin 2.0基準測試中突破90%成功率。

支撐LingBot-VA的是三大技術創新機制:閉環推演系統通過持續校準模擬與現實的偏差,防止"幻覺漂移";異步推理管線實現動作預測與電機執行的并行處理,將響應延遲降低40%;自回歸訓練框架使模型能夠從有限的真實數據中學習復雜場景的時空關聯。這些特性使該模型在LIBERO終身學習基準上達到98.5%的平均成功率,顯著優于傳統VLA模型。

同步開源的LingBot-Depth空間感知模型,通過多光譜融合技術解決了透明/反光物體的識別難題。該模型采用神經輻射場(NeRF)與幾何約束相結合的方法,使透明物體抓取成功率從0提升至50%,在醫療試管插拔等精細操作中表現出色。其輸出的高精度深度信息可與LingBot-VLA無縫對接,形成"視覺-認知-執行"的增強回路。

作為機器人的"數字演練場",LingBot-World通過多階段訓練架構實現了近10分鐘的連續視頻生成能力。該模型采用時空注意力機制與動態物體建模技術,有效解決了長時生成中的物體變形、場景崩潰等問題。在模擬環境中,機器人可進行數萬次低成本試錯學習,將真實世界訓練效率提升3倍以上。這種"數字孿生"訓練方式,為具身智能的規模化部署提供了關鍵支撐。

LingBot-VLA作為認知中樞,基于2萬小時真實機器人操作數據訓練,支持9種主流雙臂機器人構型的零樣本遷移。該模型采用分層決策架構,將復雜任務分解為可執行的子動作序列,在GM-100基準測試中超越基線模型Pi0.5。其獨特的跨構型適應能力,使同一"大腦"可無縫切換至不同硬件平臺,顯著降低機器人系統的開發成本。

行業專家指出,螞蟻靈波的全棧開源策略打破了傳統具身智能研發的"煙囪式"局限。開發者既可單獨使用某個模塊解決特定問題,也能組合構建完整系統。這種開放生態有望加速技術迭代,推動具身智能從實驗室走向工業制造、醫療護理、家庭服務等真實場景。據測試數據顯示,采用LingBot系列模型的研發周期可縮短60%,工程化成本降低45%,為機器人大規模部署掃清了關鍵障礙。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群