国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

阿里通義千問升級推理模型,Qwen3-30B-A3B-Thinking-2507能力大幅提升并開源

   時間:2025-07-31 15:33 來源:ITBEAR作者:柳晴雪

阿里通義千問近期宣布了一項重大進展,正式推出了其最新的推理模型Qwen3-30B-A3B-Thinking-2507。相較于今年4月推出的Qwen3-30-A3B模型,新版本在多個關鍵領域實現了顯著提升。

在數學推理方面,Qwen3-30B-A3B-Thinking-2507在AIME25評測中取得了85.0的高分,這一成績彰顯了其強大的數學解題能力。同時,在代碼能力測試LiveCodeBench v6中,該模型也獲得了66.0的分數,兩項核心推理能力均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。

新模型在知識水平方面也取得了顯著進步。在GPQA和MMLU-Pro等評測中,Qwen3-30B-A3B-Thinking-2507的表現均優于其前身。這意味著它在處理廣泛的知識性問題時,能夠提供更準確、更全面的答案。

除了推理能力和知識水平外,Qwen3-30B-A3B-Thinking-2507在通用能力方面也表現出色。在寫作(WritingBench)、Agent能力(BFCL-v3)、多輪對話和多語言指令遵循(MultiIF)等評測中,該模型均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。這些結果表明,新模型在處理復雜、多變的場景時,能夠展現出更高的靈活性和適應性。

Qwen3-30B-A3B-Thinking-2507還支持更長的上下文理解。它原生支持256K tokens,并可擴展至1M tokens,這在處理大型文本或復雜對話時尤為重要。新模型的思考長度也有所增加,官方建議在處理高度復雜的推理任務時,設置更長的思考預算以充分發揮其潛力。

目前,Qwen3-30B-A3B-Thinking-2507已在魔搭社區和HuggingFace上開源,其輕量級的設計使得消費級硬件也能輕松實現本地部署。同時,該模型也在Qwen Chat上同步上線,用戶可以直接體驗其強大的推理和通用能力。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群