在近日舉辦的昇騰生態(tài)媒體交流活動中,華為昇騰團隊向外界全面展示了其在AI生態(tài)建設(shè)領(lǐng)域的最新突破與戰(zhàn)略布局。作為昇騰AI計算架構(gòu)的核心組件,CANN(Compute Architecture for Neural Networks)的底層重構(gòu)成為關(guān)注焦點。該架構(gòu)通過自主創(chuàng)新實現(xiàn)了從指令集到編譯器的全棧自研,打破了傳統(tǒng)異構(gòu)計算架構(gòu)的耦合模式,為開發(fā)者提供了更靈活、高效的開發(fā)環(huán)境。
據(jù)技術(shù)專家介紹,CANN重構(gòu)工程僅用四個月便完成原計劃一年半的工作量,通過分層解耦設(shè)計使主流API接口與行業(yè)生態(tài)全面兼容。這種"拆解麻花團式軟件架構(gòu)"的創(chuàng)新方式,既保證了系統(tǒng)自主可控性,又通過兼容PyTorch、Triton等主流框架降低了開發(fā)者遷移成本。針對Python開發(fā)者群體,昇騰推出的PyPTO開源算子編程體系,在保持與Triton編程范式一致性的同時,實現(xiàn)了開發(fā)靈活性與計算性能的平衡。
在模型適配效率方面,昇騰展現(xiàn)出顯著優(yōu)勢。以DeepSeek系列模型為例,其最新發(fā)布的V4-Pro和V4-Flash版本在上下文處理能力上實現(xiàn)近十倍提升,通過KV Cache滑窗技術(shù)和壓縮算法優(yōu)化了計算資源消耗。昇騰團隊與模型方開展深度協(xié)同,使超節(jié)點全系列產(chǎn)品在模型發(fā)布后迅速完成適配,最短遷移周期壓縮至6小時。
生態(tài)建設(shè)方面,昇騰開源社區(qū)呈現(xiàn)爆發(fā)式增長。從初期9張體驗卡起步,目前已形成千卡級算力資源池,今年計劃向開發(fā)者提供4000張免費算力卡,其中超半數(shù)為最新昇騰950芯片。除硬件支持外,團隊設(shè)立2000萬元專項創(chuàng)新基金,重點激勵算子開發(fā)、框架優(yōu)化等領(lǐng)域的個人貢獻者。這種"真金白銀"的投入策略已見成效,社區(qū)月活躍開發(fā)者突破2000人,累計算子開發(fā)者超1.3萬,孵化出50多個開源項目,吸引中石油、南方電網(wǎng)等企業(yè)基于開源代碼開發(fā)行業(yè)解決方案。
面對AI Agent技術(shù)浪潮,昇騰團隊僅用一個月時間便開發(fā)出Model Agent工具鏈,實現(xiàn)模型檢索、量化、遷移到部署的全流程自動化。該工具將傳統(tǒng)需要數(shù)天的現(xiàn)場部署工作壓縮至"分鐘級模型定位、小時級運行驗證、天級部署完成"的新標準,顯著提升了客戶交付效率。
在生態(tài)健康度評估方面,昇騰建立了一套嚴格指標體系。通過全量特性支持率、主流模型算子覆蓋率等六大維度,要求對90余個開源社區(qū)的支持率維持在95%以上。技術(shù)專家坦言,當前仍存在需要改進的空間,但團隊正通過持續(xù)優(yōu)化實現(xiàn)從"技術(shù)可用"到"生態(tài)好用"的關(guān)鍵跨越。這種以開發(fā)者需求為導向的生態(tài)建設(shè)策略,正在為昇騰構(gòu)筑起獨特的競爭優(yōu)勢。















