国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

阿里千問Qwen3-Coder-Next發布:以低推理成本解鎖高效編程智能體新可能

   時間:2026-02-04 09:44 來源:天脈網作者:江紫萱

阿里巴巴旗下千問團隊近日正式發布全新語言模型Qwen3-Coder-Next,這款專為編碼代理和本地開發場景設計的開放權重模型,通過創新架構與訓練方法在編程智能體領域展現出顯著優勢。該模型基于Qwen3-Next-80B-A3B-Base構建,采用混合注意力機制與專家混合(MoE)架構,在保持低推理成本的同時實現了強大的編程能力。

在訓練方法上,研究團隊突破傳統參數擴展模式,重點強化智能體訓練信號的擴展性。通過構建包含大規模可驗證編程任務和可執行環境的訓練體系,模型能夠直接從環境反饋中學習優化。具體訓練流程涵蓋四個階段:首先在代碼與智能體相關數據上進行持續預訓練,隨后利用高質量智能體軌跡數據進行監督微調,接著針對軟件工程、QA測試、Web/UX設計等領域開展專家訓練,最終將多領域專家能力蒸餾整合到單一可部署模型中。這種訓練范式特別強化了長程推理、工具調用和錯誤恢復能力,這些特性對現實編程場景至關重要。

性能評估顯示,該模型在多個權威編程智能體基準測試中表現突出。在SWE-Bench系列測試中,使用SWE-Agent框架時模型在Verified版本上取得超過70%的準確率,在多語言版本和更具挑戰性的Pro版本中仍保持競爭力。特別值得注意的是,盡管激活參數規模僅30億,其性能已可媲美激活參數多10-20倍的開源模型。在TerminalBench 2.0和Aider等基準測試中,模型同樣展現出優異表現。

效率分析圖表揭示,Qwen3-Coder-Next在性能與資源消耗間實現了更優平衡。在SWE-Bench-Pro測試中,30億激活參數版本的性能與參數量大數十倍的模型相當,展現出顯著的成本優勢。雖然全注意力架構的專有模型在絕對性能上仍占優勢,但該模型在低成本智能體部署場景中已處于領先位置,特別適合資源受限環境下的編程任務處理。

技術文檔顯示,模型開發團隊將持續優化推理決策能力,計劃擴展對更多編程任務類型的支持,并建立快速迭代機制根據用戶反饋持續改進。目前該模型已通過ModelScope和Hugging Face平臺開源,開發者可自由獲取模型權重及訓練代碼進行二次開發。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群