在AI編程能力的全球競技場上,中國科技企業正以驚人速度崛起。阿里巴巴最新發布的大語言模型Qwen 3.6-Plus,在國際權威評測平臺Code Arena的React專項榜單中以1452分位列全球第二,僅落后于Anthropic的Claude-Opus-4.6-Thinking(1540分),卻以4分優勢超越OpenAI最新模型GPT-5.0-High(1448分),更以12分差距領先Google的Gemini 3.1 Pro Preview(1440分)。這一成績標志著中國大模型在AI Coding領域首次實現與全球頂尖模型的正面交鋒并占據優勢。
Code Arena作為LMArena旗下專注AI編程能力的子榜單,采用真實用戶盲測與實時對抗機制,被業界視為衡量模型工程化能力的"試金石"。其React專項榜單聚焦Web開發場景,要求模型獨立完成從項目初始化到調試運行的全流程,考驗的是完整的工程思維而非單一代碼補全能力。這種嚴苛的評測標準,使得該榜單成為Agent時代衡量模型綜合實力的關鍵指標。
Qwen 3.6-Plus于4月2日正式發布,憑借原生多模態理解與推理能力,在代碼生成與Agent任務中展現出獨特優勢。測試數據顯示,該模型在多項權威編程評測中,以遠低于競爭對手的參數量(千問3.6系列參數規模顯著小于GLM-5、Kimi-K2.5等模型),實現了更高效的性能表現。特別是在處理復雜Web開發任務時,其端到端開發能力得到充分驗證,能夠自主完成需求分析、架構設計、代碼實現與錯誤修復等全鏈條工作。
這一突破性成果直接推動阿里巴巴在全球AI實驗室排名中升至第四位,緊隨Anthropic、OpenAI和Google之后。值得關注的是,Qwen 3.6-Plus在Code Arena總榜單中同樣位居國產模型首位,其代碼生成質量與工程化水平獲得國際認可。開發者社區反饋顯示,該模型在處理動態界面渲染、狀態管理等React核心特性時,展現出接近人類工程師的編碼邏輯與問題解決能力。
據阿里巴巴技術團隊透露,Qwen 3.6-Plus作為千問3.6系列的首發模型,后續將開源不同參數規模的版本以滿足多樣化需求。更值得期待的是,性能更強的旗艦模型Qwen 3.6-Max已完成研發,預計將于近期正式發布。這一系列動作表明,中國科技企業正在通過持續創新,重塑全球AI競爭格局。
















