在近日舉辦的英偉達GTC 2026大會上,黃仁勛的演講成為全場焦點。他宣布,AI已從訓練階段全面進入推理、智能體與物理AI融合的工業化時代,Token成為這一時代的關鍵商品,而光互聯與硅光子技術則是突破算力瓶頸的核心要素。英偉達正以“AI工廠”構建者的身份,推動自身從芯片供應商向AI基礎設施服務商轉型,并預計到2027年實現至少1萬億美元的營收目標。
黃仁勛指出,AI產業的重心已從“大模型訓練”轉向“推理落地、智能體研發與物理世界交互”,形成“能源→芯片→基礎設施→模型→應用”的五層架構。Token作為AI時代的核心生產資料,其消耗量將在推理與執行場景中呈指數級增長。英偉達的目標是成為“Token之王”,通過降低每Token成本構建競爭優勢。其邏輯在于,數據中心將不再是簡單的存儲中心,而是生產Token的“工廠”,每瓦Token吞吐量直接決定企業的運營成本。
這一變革正在重塑職場生態。未來,工程師的薪酬模式將演變為“年薪+Token預算”,Token成為科技行業招聘的核心籌碼。黃仁勛強調,英偉達的Token成本在全球范圍內具有不可替代性。即使競爭對手的架構免費,其1GW工廠15年的攤銷成本仍高達400億美元。只有運行最強的計算系統,才能實現最低的Token生產成本。數據中心的角色也隨之轉變,從存儲計算中心升級為生產Token的AI工廠,計算能力成為企業價值創造的核心指標。
大會上,英偉達發布了一系列硬件產品,覆蓋當前至長期的技術布局。其中,Vera Rubin超級AI平臺由七款芯片組成,涵蓋計算、網絡與存儲功能,是目前最先進的POD規模AI平臺。該平臺已全面投產,并獲得Anthropic、OpenAI、meta等企業及主要云服務商的支持,成為英偉達未來兩年營收的核心支柱。
針對推理場景的極致需求,英偉達推出了Groq 3 LPU芯片。這款專為低延遲設計的處理器搭載230MB片上SRAM,數據帶寬達80TB/s,首Token延遲低于0.1秒,推理性能是H100的10倍。其“確定性執行”模式確保輸出穩定性,適用于智能客服、自動駕駛等實時交互場景。該芯片預計于2026年三季度出貨,并通過3D堆疊技術集成至Feynman GPU核心,進一步降低延遲。
面向物理AI與世界模型,英偉達提前曝光了Feynman芯片架構。這款采用臺積電1.6nm制程的芯片,是全球首款量產級1nm時代產品,晶體管密度提升1.1倍。其搭載的硅光子光互連技術將帶寬密度提升10倍,傳輸能耗下降90%,突破超大規模AI集群的“互連墻”。Feynman的推理性能是Blackwell的5倍,單GPU算力達50 PFLOPS,能效比提升3.2倍。配套的NVLink-CXL 6.0技術實現跨節點1.2TB/s的數據傳輸,推動萬億參數模型訓練成本下降87%,推理延遲降低40%-85%,Token成本降至Blackwell的1/10。
在互聯技術領域,英偉達與臺積電合作推出全球首款CPO光電共封裝交換機——NVIDIA Spectrum-X Ethernet Switch。該技術將光模塊直接集成至芯片封裝,能耗僅為傳統銅纜的5%,大幅降低數據中心散熱壓力。目前,該產品已進入量產階段,標志著2026年成為硅光子技術商用元年。
英偉達的算力布局進一步延伸至太空領域。大會發布的“Space-1 Vera Rubin Module”軌道數據中心,算力是H100的25倍,可支持大語言模型在太空直接運行。這一模塊將拓展AI在航天、太空探索等領域的應用,實現太空場景下的實時數據處理與分析。
軟件層面,英偉達推出NemoClaw智能體基礎設施,優化開源AI智能體OpenClaw的安全性與輸出質量。其核心組件OpenShell通過沙箱環境限制智能體訪問權限,打造安全可控的運行邊界。NemoClaw定位為AI智能體的“操作系統”,提供企業級與開發者雙版本,降低智能體開發門檻。黃仁勛預測,未來每家SaaS公司都將轉型為“AaaS(智能體即服務)”,而NemoClaw將成為這一轉型的核心平臺。
針對物理AI的落地需求,英偉達升級了Project GR00T通用機器人基礎模型,支撐人形機器人的自主決策與動作執行。2026年,全球人形機器人量產規模將突破3萬臺,工業制造與特種作業場景占比超60%。單臺工業機器人可替代2-3名人工,年節省成本超15萬元。預計到2030年,全球量產規模將達100萬臺,市場規模突破萬億。Omniverse數字孿生平臺的升級,為機器人、自動駕駛等場景提供虛擬訓練環境,降低物理AI的研發與落地成本。















