• 中文科技資訊 CWX中文科技資訊官方網站!

小米MiMo-V2.5-Pro升級登場:長程推理強 10分鐘仿寫SBTI還省Token

   時間:2026-04-23 13:43 來源:快訊作者:沈瑾瑜

小米近期悄然上線了新一代旗艦模型MiMo-V2.5-Pro,這款在匿名測試階段以Hunter Alpha代號引發關注的模型,正式完成從V2到V2.5版本的迭代升級。伴隨模型更新,小米同步調整了用戶Token額度體系,所有用戶的Token使用配額被重置,此舉被開發者社區戲稱為"復活年輕人的第一個Coding Plan"。

在基礎能力測試中,新模型展現出顯著進步。面對"洗車"場景測試,模型不僅準確完成任務,還主動添加"注意剮蹭"的溫馨提示。通過分析其英文思考過程可見,模型先識別問題復雜性,再精準定位關鍵信息。當被問及"用戶駕駛車型"時,模型結合上下文給出正確推斷,印證其對細節的把握能力。不過在"父親為何崩潰"的情感推理測試中,初始回答未能通過,經2分鐘深度思考后才給出正確答案,暴露出零散線索整合能力的不足。

真正展現模型實力的場景出現在Vibe Coding開發測試中。當要求用10分鐘開發仿SBTI測試系統時,模型首先確認技術棧選擇,最終采用將JS/CSS內嵌HTML的最簡方案,僅用2分鐘就完成基礎架構開發。生成的頁面支持折疊展開功能,瀏覽器控制臺無報錯,搜索結果可清晰展示匯報路徑。盡管使用數據較為陳舊,但開發團隊認為這屬于數據源問題,不影響模型能力評估。

在復雜項目開發測試中,模型展現出強大的任務拆解能力。面對搭建Harness框架的挑戰,模型自動將項目分解為引擎、數據結構、界面、內容四大模塊,并制定四階段開發路線圖。特別在路線規劃環節,自動生成的"gsd-roadmapper"子智能體成功實現并行開發建議。整個項目從規劃到落地僅耗時10分鐘,最終成品完整復刻SBTI算法,支持30種題型和25種測試類型,實現數據與代碼分離的模塊化設計。

不過測試也暴露出模型的一些特性傾向。在開發過程中,模型更傾向于采用直接編碼而非調用預設技能,這種"最短路徑"策略雖提升效率,但未完全發揮框架的并行處理優勢。項目負責人解釋,這種選擇與模型優化目標相關——只要能完成任務,系統會優先選擇資源消耗更少的方式。

伴隨新模型發布,小米調整了Token計費策略。旗艦模型消耗額度從4倍降至最高2倍,非高峰時段享受8折優惠,連續包月用戶可再獲折扣。這種調整源于模型效率提升帶來的成本優化,測試數據顯示,在完成相同任務時,新模型資源消耗顯著降低。此舉引發行業連鎖反應,多家模型公司陸續跟進調整計費模式,市場逐漸形成新的定價標準。

 
 
更多>同類內容
全站最新
熱門內容