国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

小米AI新突破:羅福莉領銜打造萬億參數模型,獲林俊旸力贊

   時間:2026-03-21 15:59 來源:快訊作者:顧雨柔

近日,全球AI領域迎來一則重磅消息:小米正式發布首款自研旗艦大模型Xiaomi MiMo-V2-Pro,同時推出MiMo-V2-Omni和MiMo-V2-TTS兩款配套模型。這一動作標志著小米正式加入大模型競爭賽道,引發行業廣泛關注。此前,一款名為Hunter Alpha的神秘模型在OpenRouter平臺引發猜測,如今真相浮出水面——它正是MiMo-V2-Pro的內部測試版本。

回溯至3月11日,OpenRouter平臺突然上線Hunter Alpha模型。該模型以"隱身模式"發布,未標注開發者信息且提供免費訪問權限。測試數據顯示,其具備1萬億參數規模和100萬token的上下文窗口,自稱"以中文訓練的中國AI模型"且知識截止時間為2025年5月。這些特征與DeepSeek此前模型風格高度相似,導致市場普遍猜測這是DeepSeek的秘密測試項目。然而,小米MiMo團隊近日正式認領該模型,揭開這場"烏龍事件"的真相。

此次發布的三款模型中,MiMo-V2-Pro作為旗艦基座模型備受矚目。該模型采用超大規模稀疏化設計,總參數達1萬億級,但單次推理僅激活420億參數。這種MoE(專家混合)架構通過動態激活部分子網絡,在保持計算效率的同時擴展模型容量。在注意力機制方面,創新性地引入分層組合的混合注意力結構,將局部窗口注意力與全局注意力相結合,既限制計算復雜度又保留長距離依賴關系,有效解決長上下文場景下的注意力退化問題。

技術突破帶來顯著性能提升。MiMo-V2-Pro的上下文窗口擴展至100萬token,支持在單次上下文中保留完整任務狀態、工具調用結果和歷史決策路徑。在匿名測試階段,該模型已展現出代碼生成、開發工具調用和自動化任務處理等強項。基準測試數據顯示,其在通用Agent能力評估(Claweval)中得分61.5,逼近Claude Opus 4.6;編碼能力更超越Claude Sonnet 4.6,接近Opus級別。定價策略同樣具有競爭力,256K上下文長度下輸入單價為每百萬1美元,輸出3美元;擴展至100萬上下文時,輸入單價僅2美元,輸出6美元,約為Claude Opus 4.6的五分之一。

小米AI團隊領軍人物羅福莉是這場技術突破的關鍵推手。這位畢業于北京大學計算語言學研究所的科研人才,曾主導開發阿里多語言預訓練模型VECO,并在DeepSeek期間參與MoE大模型DeepSeek-V2的核心開發。2025年11月加入小米后,她帶領團隊歷時數月訓練出1T基礎模型。在社交平臺分享中,羅福莉透露團隊曾設定"每天與AI對話少于100次可辭職"的硬性指標,這種高強度研發模式推動模型快速迭代。她特別強調混合注意力機制的創新價值,認為這種架構決策為智能體時代構建了結構性優勢。

行業對小米的AI轉型給予積極評價。前阿里巴巴通義千問核心技術負責人林俊旸在社交平臺點贊稱"太棒了",雷軍則在發布后第一時間宣布模型在全球大模型綜合智能排行榜Artificial Analysis上位列第八,按品牌排名超越xAI Grok。他坦言小米在AI領域長期保持低調,但實際進展超出外界想象。為支持AI戰略,小米計劃今年投入超過160億元研發資金,展現布局智能時代的決心。隨著MiMo-V2-Pro的正式發布,這場由神秘模型引發的行業猜想,最終演變為中國科技企業在大模型領域的又一次重要突破。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群