国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

小米MiMo-V2-Flash新模型發布:創新架構,性能超絕性價比拉滿

   時間:2025-12-18 00:04 來源:快訊作者:蘇婉清

小米近日正式推出全新開源大模型MiMo-V2-Flash,憑借3090億總參數與150億活躍參數的規模,采用專家混合架構(MoE)設計,在性能表現上與DeepSeek-V3.2、Kimi-K2等頭部開源模型形成有力競爭。該模型最引人注目的突破在于將推理速度提升至每秒150 tokens,同時將輸入成本壓縮至每百萬token僅0.1美元,輸出成本0.3美元,在性價比維度樹立了新標桿。

在基準測試中,MiMo-V2-Flash展現驚人實力:AIME 2025數學競賽與GPQA-Diamond科學知識測試均位列開源模型前兩名,編程能力尤為突出——在SWE-bench Verified真實軟件修復測試中取得73.4%的得分,超越所有開源競品,直逼GPT-5-High水平。多語言編程測試SWE-Bench Multilingual中,該模型以71.7%的解決率證明其跨語言開發能力。智能體任務測試顯示,其在通信類任務獲得95.3分,零售類79.5分,航空類66.0分,搜索代理任務在啟用上下文管理后得分從45.4躍升至58.3。

技術團隊通過兩項核心創新實現性能突破?;旌匣瑒哟翱谧⒁饬C制采用5層滑動窗口與1層全局注意力的激進配比,滑動窗口固定為128 token長度,使KV緩存存儲量減少近6倍,卻仍能支持256k超長上下文窗口。項目負責人羅福莉特別指出,實驗發現128窗口大小是性能與效率的最佳平衡點,盲目擴大窗口反而導致性能下降,同時強調實施該機制時sink values的必要性。另一項輕量級多Token預測(MTP)技術則打破傳統逐token生成模式,通過原生集成模塊實現并行預測,實測平均接受2.8-3.6個連續token,推理速度提升2-2.6倍,有效解決強化學習中長尾樣本導致的GPU空轉問題。

訓練階段采用FP8混合精度技術,在27萬億token數據上完成預訓練,原生支持32k序列長度。后訓練階段創新提出多教師在線策略蒸餾(MOPD),通過學生模型自主采樣、多專家教師實時反饋的方式,將訓練算力需求降至傳統方法的1/50。該架構支持動態接入新教師模型,形成"教學相長"的閉環進化系統。智能體強化學習擴展方面,研究團隊基于真實GitHub問題構建超10萬個驗證任務,在Kubernetes集群部署并發超萬個Pod,環境部署成功率達70%,并開發多模態驗證器通過視頻錄制確保代碼執行準確性。

對于開發者群體,MiMo-V2-Flash提供256k上下文窗口支持數百輪智能體交互,可無縫集成Claude Code、Cursor等主流開發環境。模型權重已在Hugging Face平臺以MIT協議開源,包含完整技術報告與推理代碼。目前該模型已通過API Platform限時免費開放,所有優化經驗同步分享至LMSYS博客,相關代碼貢獻給SGLang社區。這種全鏈條開源策略在國內科技企業中實屬罕見,為行業技術演進提供了重要參考。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群