昨晚,通義千問團隊在社交平臺X上發布了Qwen3.5系列小模型,包含0.8B、2B、4B、9B四個參數規模版本。這一消息引發廣泛關注,特斯拉創始人馬斯克在評論區留言稱“Impressive intelligence density(令人印象深刻的智能密度)”,相關話題迅速在國內社交媒體引發熱議。
Qwen3.5-9B的表現尤為亮眼。在GPQA Diamond測試中,該模型以90億參數達到與某1200億參數開源模型相近的81.7分。這種“以小搏大”的能力,源于其架構創新——通過融合“門控增量網絡”與“稀疏混合專家”技術,模型在推理時僅激活與任務相關的神經元,如同圖書館配備智能檢索系統,僅需調用核心藏書即可完成解答。這種設計顯著降低了計算資源消耗,使訓練成本與推理能耗大幅下降。
多模態處理能力是另一大突破。Qwen3.5采用“早期融合”架構,將文本、圖像、視頻數據在底層統一處理,而非傳統模型的“堆疊式”設計。這一改進使0.8B迷你模型在視覺任務中表現突出:在MathVista測試中取得62.2分,OCRBench測試達74.5分。開發者評價稱,這種設計讓本地AI應用真正具備實用價值。
硬件適配性提升帶來革命性變化。據測算,當前3萬美元硬件即可實現去年需20萬美元GPU才能達到的推理性能。更有開發者在iPhone 17 Pro上,通過MLX框架成功運行Qwen3.5-2B的6-bit版本,實現實時視覺理解與問答功能。這意味著用戶無需依賴云端,即可在本地設備運行具備多模態能力的AI模型,數據隱私與響應速度得到雙重保障。
端側部署優勢在可穿戴設備領域尤為明顯。阿里已將Qwen小模型集成至AI眼鏡,實現毫秒級視覺解析。這種設計解決了云端大模型的物理延遲問題——當用戶佩戴AI眼鏡詢問前方障礙物時,本地模型可即時響應,而無需等待數據上傳、計算與返回的全過程。類似技術正被應用于工業物聯網、醫療監測等對數據隱私敏感的場景。
硬件生態布局同步加速。3月2日,千問AI眼鏡開啟預售,G1系列疊加補貼后最低售價1997元,3月8日正式發售。在巴塞羅那MWC展會上,海外觀眾排隊體驗該產品,美國用戶特別稱贊其換電設計有效緩解續航焦慮。據內部消息,AI指環、AI耳機等新品將于年內陸續上市,形成覆蓋多場景的硬件矩陣。
底層技術協同是核心支撐。阿里平頭哥1月底推出的“真武810E”AI芯片,性能對標英偉達H20,已部署多個萬卡集群服務400余家客戶。該芯片與通義實驗室模型、阿里云算力形成“黃金三角”,實現從芯片架構到模型優化的全鏈路協同。這種深度耦合使Qwen3.5部署顯存占用降低60%,推理吞吐量提升19倍,為端側應用提供關鍵技術保障。
商業生態構建展現戰略野心。春節期間,千問APP“一句話下單”功能使用量近2億次,日活用戶達7352萬,增幅居國內AI應用首位。從聊天機器人到國民級生活助手,千問正通過硬件拓展服務邊界——想象未來佩戴AI眼鏡的用戶,掃一眼餐廳即可獲取評價并完成訂位,異國街頭菜單實時翻譯,騎行路線語音記錄,這些場景依賴的不僅是模型智能,更是背后覆蓋支付、出行、本地服務的龐大生態網絡。
















