評測機構ClawBench近日公布了最新一期全球大型模型排行榜,北京三家人工智能企業的四款模型成功躋身全球前十,展現出中國AI領域的技術實力。其中,智譜科技研發的GLM-5-Turbo以93.9分的成績登頂榜首,字節跳動旗下的豆包模型Doubao-Seed-2.0-lite緊隨其后位列第二,同時憑借最低的使用成本成為全榜單中最具性價比的選擇。
小米公司在此次榜單中表現尤為亮眼,其MiMo-V2系列兩款模型同時上榜。MiMo-V2-Omni以第九名的成績入選,在運行速度測試中展現出顯著優勢;另一款升級版MiMo-V2-Pro雖未進入前十,但在復雜邏輯推理、長指令執行和多輪對話穩定性等專項測試中表現突出,在Model Rank專業排名中位居全球第五。據小米技術團隊透露,該模型通過優化注意力機制和知識蒸餾技術,顯著提升了長文本處理能力。
在反映企業綜合研發實力的LabRank實驗室評價體系中,小米同樣取得突破性進展。其Text Arena(ArenaExpert)項目位列全球第四,代碼生成專項Code Arena排名第五,綜合技術實力已躋身國際第一梯隊,與Anthropic、OpenAI、谷歌等頭部企業形成直接競爭。該評價體系通過模擬真實開發環境,對模型在代碼生成、數學推理、多語言處理等20余個維度進行綜合評估。
ClawBench榜單的權威性源于其獨特的評測機制。關聯的Text Arena榜單采用雙盲測試模式,所有參與評測的模型均隱藏身份信息,由全球超過5萬名真實用戶根據回答質量直接投票。這種設計有效避免了針對特定數據集的優化行為,確保評測結果更貼近實際應用場景。據機構負責人介紹,本輪評測共收集有效投票樣本超200萬份,覆蓋金融、醫療、教育等12個專業領域。
















