在GTC 2026大會上,英偉達正式推出了專為智能體系統設計的Groq 3 LPX機架。這款新型機架聚焦于低延遲與長上下文處理需求,被定位為Vera Rubin平臺的AI推理加速器,預計將于今年下半年正式投入市場。
Groq 3 LPX機架采用全液冷散熱方案,基于MGX基礎設施架構構建。其核心配置包含32個1U計算托盤,每個托盤集成8顆Groq 3(LP30)芯片。每顆芯片搭載500MB片上SRAM,使得整個機架的片上存儲容量達到128GB,并實現40PB/s的SRAM帶寬。這種設計顯著優化了輸出生成速度,同時將系統響應延遲控制在極低水平。
在系統互聯方面,每顆LP30芯片通過96條112Gbps的C2C鏈路與其他組件連接。單個計算托盤可擴展至384GB DRAM內存,通過結構擴展邏輯與頭節點CPU實現內存資源整合。這種分層存儲架構既保證了片上SRAM的高效利用,又能在處理超大規模任務時提供DRAM作為補充支持。
據英偉達披露,Groq 3 LPX的部署將使Vera Rubin平臺的推理能效實現質的飛躍。每兆瓦功耗下的推理吞吐量可提升35倍,特別在處理萬億參數級模型時,能為運營商帶來最高10倍的營收增長空間。這一突破主要得益于芯片架構對長上下文處理的優化,以及系統級內存帶寬的指數級提升。















