在近期舉辦的CES 2026展會上,英偉達首席執行官黃仁勛就行業熱議的“是否能用低成本SRAM替代昂貴HBM”問題給出了明確回應。這一討論源于AI領域對降本增效的迫切需求——隨著SRAM加速器、GDDR推理方案及開放權重模型的興起,部分從業者認為這些技術可減少對英偉達高成本硬件的依賴。
SRAM(靜態隨機存取存儲器)憑借其基于觸發器的高速特性,在基準測試中展現出無延遲的訪問優勢,甚至被視為HBM(高帶寬內存)的潛在替代者。黃仁勛承認,對于特定工作負載,SRAM的速度表現“令人驚嘆”,但其致命缺陷在于容量限制——當前SRAM可容納的模型規模僅為HBM系統的百分之一。當AI模型因上下文擴展或功能增加而超出SRAM容量時,系統必須調用外部內存,導致效率優勢瞬間喪失。
他進一步指出,現代AI模型的多樣性加劇了硬件適配的難度。混合專家模型(MOE)、多模態任務、擴散模型及自回歸模型等架構對硬件的需求差異顯著:有的依賴顯存容量,有的依賴互連帶寬(如NVLink),且需求隨任務變化動態調整。若硬件過度優化某一特性(如純SRAM方案),一旦工作負載類型改變,昂貴的芯片將因無法兼容而閑置,造成資源浪費。
基于這一判斷,英偉達堅持選擇HBM作為核心內存方案。黃仁勛解釋,在共享數據中心場景中,硬件的靈活性直接決定經濟效益。盡管HBM的物料成本更高,但其能適配算法和模型架構的快速迭代,確保硬件在數周甚至數月的運營周期內保持高利用率。相比之下,專用硬件雖能在5%-10%的任務中表現極致,卻無法覆蓋其余90%的通用需求,長期來看反而增加成本。
針對“開放模型是否會削弱英偉達技術壁壘”的質疑,黃仁勛回應稱,開放并不等同于降低硬件要求。隨著開放模型整合更長上下文和更多模態,其內存占用同樣會呈指數級增長。英偉達選擇承擔HBM的高成本與復雜系統設計,正是為了保留“可選性”——既避免客戶被鎖定在狹窄的性能范圍,也保護自身硬件免受模型架構快速迭代的沖擊。這一策略的核心在于平衡短期成本與長期適應性,以應對AI技術演進的不確定性。















