36天再推新！小米MiMo-V2.5系列大模型亮相，AI賽道加速狂飆-互聯網-中文科技資訊

小米再次在大模型領域掀起波瀾。繼上月發布三款自研大模型后，這家科技巨頭于近日深夜正式推出新一代MiMo-V2.5系列，包含四款不同定位的模型：旗艦版MiMo-V2.5-Pro、通用版MiMo-V2.5，以及專注語音合成的V2.5-TTS Series和語音識別的V2.5-ASR。其中前兩款模型將于近期面向全球開發者開源，后兩者則進入最終測試階段。

新系列被定義為"智能體時代全棧解決方案"，構建了覆蓋推理、多模態交互與語音處理的完整技術矩陣。旗艦型號MiMo-V2.5-Pro專為復雜智能體任務設計，在內部測試中展現出驚人能力：配合特定運行框架可穩定處理近千輪工具調用的超長任務，在保持邏輯連貫性的同時精準捕捉上下文隱含要求。該模型在AI編程智能體基準測試SWE-Bench Pro中取得57.2分，與行業頂尖模型Claude Opus 4.6僅相差0.1分；在小米自研的MiMo Coding Bench評測中，其得分從上一代的71.5分提升至73.7分，逐步縮小與頭部模型的差距。

技術團隊披露的實戰案例更具說服力。在實現完整SysY編譯器的挑戰中，V2.5-Pro僅用4.3小時完成672次工具調用，在隱藏測試集取得滿分成績，而人類開發者通常需要數周時間。另一個獨立開發Web視頻編輯器的任務中，該模型通過1868次工具調用構建出包含多軌道時間線、片段裁剪等功能的完整應用，最終生成8192行代碼。這些突破標志著長程任務處理能力發生質變，為智能體落地復雜應用場景奠定基礎。

通用型號MiMo-V2.5則聚焦多模態交互場景，支持視覺、聽覺與文本信息的一體化處理，上下文窗口擴展至100萬Token。相較于Pro版本，其平均推理速度提升30%，更適合對響應延遲敏感的實時交互場景。在評估智能體解決現實問題能力的Claw-eval多模態評測中，該模型取得23.8分，較前代提升50%。

成本優化成為新系列另一大亮點。通過深度優化Token利用率，V2.5-Pro在相同評測分數下較Kimi K2.6節省42%計算資源，V2.5較Muse Spark節省50%。配套的定價體系同步調整：取消復雜計費模式，推出"連續包月/包年"訂閱方案，并在每日零點至八點提供八折優惠。不同版本采用差異化消耗倍率，通用版保持1倍基準，旗艦版設定為2倍，整體使用成本顯著下降。

這種快速迭代能力源于小米對AI的戰略級投入。公司創始人雷軍今年3月宣布，未來三年將投入超600億元用于AI技術研發，為模型訓練提供充足算力支持。大模型團隊負責人羅福莉指出，行業正經歷從"對話交互"到"智能體范式"的劇烈轉變，小米需要抓住移動端智能體賽道的關鍵窗口期。

終端生態的協同效應開始顯現。小米澎湃OS 3 Beta版已向部分機型推送"龍蝦"智能體Xiaomi miclaw，新增人格體系、技能體系與跨設備同步功能，支持80余項系統工具調用。這種模型能力與終端體驗的雙向促進，正在形成獨特的競爭優勢——更強大的模型支撐更智能的終端服務，海量終端數據反哺模型持續優化。隨著600億投入逐步落地，小米的"月更模式"或許將重塑行業技術迭代節奏。