國內人工智能領域迎來重要進展,智譜與華為攜手打造的GLM-Image圖像生成模型正式開源。該模型依托華為昇騰Atlas 800T A2計算設備與昇思MindSpore AI框架,實現了從數據處理到模型訓練的全鏈條國產化,成為首個在國產硬件生態中完成全流程訓練的頂尖多模態模型。
技術層面,GLM-Image突破性地實現了圖像生成與語言模型的深度耦合。通過創新性的"自回歸+擴散解碼器"混合架構,模型能夠精準捕捉文本指令與視覺元素間的復雜映射關系,在保持生成內容多樣性的同時,顯著提升了語義理解與圖像輸出的匹配度。這種架構設計為認知型生成技術提供了新的發展方向,既保證了創造性表達,又確保了跨模態協同的穩定性。
在國產化適配方面,該模型全程運行于華為昇騰生態體系,驗證了國產芯片與框架支撐大規模AI訓練的可行性。智譜與華為的聯合研發團隊通過優化算法與硬件的協同效率,成功解決了國產算力在復雜模型訓練中的性能瓶頸,為行業提供了可復制的技術范式。這種深度合作模式標志著中國AI產業在自主可控道路上取得實質性突破。
商業化應用展現出顯著優勢,GLM-Image的API調用成本降至每張圖片0.1元,較市場同類產品降低超過80%。這一價格策略源于模型架構的優化與國產硬件的成本控制,極大降低了中小企業接入先進生成式AI技術的門檻。據智譜透露,后續版本將進一步提升生成速度,持續優化用戶體驗。
回顧智譜的產品布局,其在多模態模型定價上始終保持行業領先地位。2025年8月推出的GLM-4.5V已將API價格壓至輸入2元/百萬tokens、輸出6元/百萬tokens;同年12月開源的GLM-4.6V系列更實現50%降幅,輸入成本降至1元/百萬tokens。這種持續降價策略與其技術迭代形成良性循環,推動生成式AI從實驗室走向大規模商用。















