阿里旗下千問大模型系列迎來重要更新,其最新預覽版Qwen3.5-Max-Preview正式登陸國際權威評測平臺LMArena,并在首輪測試中交出亮眼成績單。該模型以1464分的綜合得分躋身全球第一梯隊,推動阿里千問實驗室進入全球前五、國內榜首位置,標志著國產大模型在國際競爭中的技術突破。
在基礎能力專項評測中,該模型展現出強勁實力。通過去除風格控制變量的嚴格測試,其以1470分位列全球第六、國內第一,超越多數國際主流模型。在Arena Expert專家榜單中,Qwen3.5-Max-Preview以1498分排名第十,緊追GPT-5.4、Claude Opus 4.5等頭部模型,同時顯著領先于GPT-5.2-chat-latest等同類產品,形成差異化競爭優勢。
細分領域表現同樣可圈可點。數學能力測試中,該模型成功闖入全球前五,證明其在復雜邏輯運算方面的突破;文本處理領域則躋身全球前十,尤其在專家級任務中展現優異表現。與前代Qwen3-Max相比,新版本在創意寫作、數學推理、文體娛樂等高頻場景中實現全面提升,其中創意寫作提升57分、數學能力提升49分,整體文本處理能力提升45分,呈現均衡發展的技術特征。
技術架構方面,該模型延續了阿里大模型的技術積累。結合前代參數規模推測,Qwen3.5-Max或將成為阿里現有最大的閉源旗艦模型。今年以來,阿里已系統性開源Qwen3.5系列,形成覆蓋0.8B至397B參數的完整產品矩陣。其中3970億參數的Qwen3.5-Plus版本,憑借170億激活參數的創新設計,在同量級模型中表現突出。
目前發布的預覽版仍需接受正式版本的驗證考驗。隨著后續迭代升級,模型在復雜場景下的穩定性、多模態處理能力等關鍵指標,將成為決定其能否持續領跑國際競爭的重要因素。這場始于實驗室的技術突破,正在為國產大模型的商業化應用開辟新的可能性。















