• 中文科技資訊 CWX中文科技資訊官方網站!

36天再推新!小米MiMo-V2.5系列大模型亮相,AI賽道加速狂飆

   時間:2026-04-23 20:52 來源:互聯網作者:顧雨柔

小米再次在大模型領域掀起波瀾。繼上月發布三款自研大模型后,這家科技巨頭于近日深夜正式推出新一代MiMo-V2.5系列,包含四款不同定位的模型:旗艦版MiMo-V2.5-Pro、通用版MiMo-V2.5,以及專注語音合成的V2.5-TTS Series和語音識別的V2.5-ASR。其中前兩款模型將于近期面向全球開發者開源,后兩者則進入最終測試階段。

新系列被定義為"智能體時代全棧解決方案",構建了覆蓋推理、多模態交互與語音處理的完整技術矩陣。旗艦型號MiMo-V2.5-Pro專為復雜智能體任務設計,在內部測試中展現出驚人能力:配合特定運行框架可穩定處理近千輪工具調用的超長任務,在保持邏輯連貫性的同時精準捕捉上下文隱含要求。該模型在AI編程智能體基準測試SWE-Bench Pro中取得57.2分,與行業頂尖模型Claude Opus 4.6僅相差0.1分;在小米自研的MiMo Coding Bench評測中,其得分從上一代的71.5分提升至73.7分,逐步縮小與頭部模型的差距。

技術團隊披露的實戰案例更具說服力。在實現完整SysY編譯器的挑戰中,V2.5-Pro僅用4.3小時完成672次工具調用,在隱藏測試集取得滿分成績,而人類開發者通常需要數周時間。另一個獨立開發Web視頻編輯器的任務中,該模型通過1868次工具調用構建出包含多軌道時間線、片段裁剪等功能的完整應用,最終生成8192行代碼。這些突破標志著長程任務處理能力發生質變,為智能體落地復雜應用場景奠定基礎。

通用型號MiMo-V2.5則聚焦多模態交互場景,支持視覺、聽覺與文本信息的一體化處理,上下文窗口擴展至100萬Token。相較于Pro版本,其平均推理速度提升30%,更適合對響應延遲敏感的實時交互場景。在評估智能體解決現實問題能力的Claw-eval多模態評測中,該模型取得23.8分,較前代提升50%。

成本優化成為新系列另一大亮點。通過深度優化Token利用率,V2.5-Pro在相同評測分數下較Kimi K2.6節省42%計算資源,V2.5較Muse Spark節省50%。配套的定價體系同步調整:取消復雜計費模式,推出"連續包月/包年"訂閱方案,并在每日零點至八點提供八折優惠。不同版本采用差異化消耗倍率,通用版保持1倍基準,旗艦版設定為2倍,整體使用成本顯著下降。

這種快速迭代能力源于小米對AI的戰略級投入。公司創始人雷軍今年3月宣布,未來三年將投入超600億元用于AI技術研發,為模型訓練提供充足算力支持。大模型團隊負責人羅福莉指出,行業正經歷從"對話交互"到"智能體范式"的劇烈轉變,小米需要抓住移動端智能體賽道的關鍵窗口期。

終端生態的協同效應開始顯現。小米澎湃OS 3 Beta版已向部分機型推送"龍蝦"智能體Xiaomi miclaw,新增人格體系、技能體系與跨設備同步功能,支持80余項系統工具調用。這種模型能力與終端體驗的雙向促進,正在形成獨特的競爭優勢——更強大的模型支撐更智能的終端服務,海量終端數據反哺模型持續優化。隨著600億投入逐步落地,小米的"月更模式"或許將重塑行業技術迭代節奏。

 
 
更多>同類內容
全站最新
熱門內容