中文大模型SuperCLUE測評：豆包緊追海外頂尖模型小米兩款模型入榜國產開源亮眼-業界資訊-虎科技

中文大模型SuperCLUE測評：豆包緊追海外頂尖模型小米兩款模型入榜國產開源亮眼

時間：2026-03-30 13:02 來源：快訊作者：沈如風

在最新發布的中文大模型基準測評SuperCLUE中，22款國內外主流模型展開激烈競爭，測評結果引發行業廣泛關注。本次測評圍繞數學推理、科學推理、代碼生成等六大核心任務展開，全面評估模型的綜合能力，為技術發展提供了重要參考依據。

海外閉源模型在總分排名中繼續占據優勢地位。Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)包攬前三名，展現出強大的技術實力。值得注意的是，字節跳動旗下豆包（Doubao-Seed-2.0-pro-260215(high)）以71.53分的成績緊隨其后，與第三名GPT-5.4僅相差0.95分，成功躋身全球第一梯隊。該模型在智能體任務規劃維度表現尤為突出，甚至反超部分海外競爭對手，位列全球前五。

國內科技企業在此次測評中表現亮眼。小米集團推出的MiMo-V2系列兩款模型均成功入圍榜單，其中MiMo-V2-Pro以60.67分的成績在閉源模型中名列前茅，特別是在數學推理任務中取得84.03分的高分。另一款開源版本MiMo-V2-Flash雖然總分49.97分排名相對靠后，但在代碼生成等特定場景中展現出獨特潛力，為開發者提供了新的選擇。

開源賽道成為本次測評的一大亮點。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等國產開源模型包攬開源榜單前三名，在性能表現上大幅領先海外同類開源模型。這一成果不僅體現了國內企業在開源技術領域的積累，也為全球開發者社區貢獻了重要力量，推動了行業技術的共同進步。

更多>同類內容

知乎2025：盈利與AI轉型并行，在番茄小紅書	科大訊飛Air2、BIGME B751C、BOOX Leaf5C：
百度貼吧抓蝦吧“封殺”人類發帖純AI交流	95后AI新星羅福莉談OpenClaw：開源框架點燃

国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

中文大模型SuperCLUE測評：豆包緊追海外頂尖模型 小米兩款模型入榜國產開源亮眼

中文大模型SuperCLUE測評：豆包緊追海外頂尖模型小米兩款模型入榜國產開源亮眼