前DeepSeek研究員、現小米MiMo大模型團隊負責人羅福莉,近日與北京大學科研團隊聯合攻克資源管理難題,共同研發出新一代統一資源管理系統ARL-Tangram。該成果已形成學術論文并正式發表,標志著小米在人工智能基礎設施領域取得重要突破。
研究團隊創新性地提出統一動作級公式框架,結合自主研發的彈性調度算法,使系統能夠智能適配異構計算資源。實驗數據顯示,在智能體強化學習任務中,該系統可將平均動作完成時間(ACT)提升4.3分,訓練步驟耗時最高縮短1.5倍,同時減少71.2%的外部資源調用。這種突破性優化為大規模AI模型訓練提供了更高效的資源調度方案。
這是羅福莉加入小米后發表的第二項重大技術成果。去年10月,她參與的MoE架構與強化學習融合研究論文已引發學界關注,該成果同樣由小米AI團隊與北京大學聯合完成。短短半年內連續產出高影響力論文,彰顯出這位青年科學家在跨學科研究領域的卓越能力。
在2025小米人車家全生態合作伙伴大會上,羅福莉首次以小米研究員身份公開亮相。她在社交平臺分享職業感悟時寫道:"智能的終極形態必然突破語言邊界,在物理世界產生真實影響。我們正在構建這樣的未來——讓AGI從實驗室走向千家萬戶。"這段宣言引發科技圈廣泛共鳴,目前已有超過千名行業專家參與相關技術討論。
據內部人士透露,ARL-Tangram系統已進入小米內部測試階段,首批應用場景涵蓋自動駕駛訓練、智能家居協同控制等復雜任務。該系統的資源調度效率較傳統方案提升顯著,有望成為小米AI生態建設的關鍵技術支撐。隨著研發團隊持續優化算法,這項成果或將推動整個行業對資源管理系統的認知革新。















