国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

ClawBench大模型榜單揭曉:智譜字節小米四款模型強勢躋身全球前十

   時間:2026-03-31 23:04 來源:天脈網作者:鐘景軒

評測機構ClawBench近日公布了最新一期全球大型模型排行榜,北京三家人工智能企業的四款模型成功躋身全球前十,展現出中國AI領域的技術實力。其中,智譜科技研發的GLM-5-Turbo以93.9分的成績登頂榜首,字節跳動旗下的豆包模型Doubao-Seed-2.0-lite緊隨其后位列第二,同時憑借最低的使用成本成為全榜單中最具性價比的選擇。

小米公司在此次榜單中表現尤為亮眼,其MiMo-V2系列兩款模型同時上榜。MiMo-V2-Omni以第九名的成績入選,在運行速度測試中展現出顯著優勢;另一款升級版MiMo-V2-Pro雖未進入前十,但在復雜邏輯推理、長指令執行和多輪對話穩定性等專項測試中表現突出,在Model Rank專業排名中位居全球第五。據小米技術團隊透露,該模型通過優化注意力機制和知識蒸餾技術,顯著提升了長文本處理能力。

在反映企業綜合研發實力的LabRank實驗室評價體系中,小米同樣取得突破性進展。其Text Arena(ArenaExpert)項目位列全球第四,代碼生成專項Code Arena排名第五,綜合技術實力已躋身國際第一梯隊,與Anthropic、OpenAI、谷歌等頭部企業形成直接競爭。該評價體系通過模擬真實開發環境,對模型在代碼生成、數學推理、多語言處理等20余個維度進行綜合評估。

ClawBench榜單的權威性源于其獨特的評測機制。關聯的Text Arena榜單采用雙盲測試模式,所有參與評測的模型均隱藏身份信息,由全球超過5萬名真實用戶根據回答質量直接投票。這種設計有效避免了針對特定數據集的優化行為,確保評測結果更貼近實際應用場景。據機構負責人介紹,本輪評測共收集有效投票樣本超200萬份,覆蓋金融、醫療、教育等12個專業領域。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群