在人工智能技術從實驗室走向產業應用的關鍵階段,算力供給模式的革新正引發行業深度變革。中科曙光近日在中關村論壇年會上推出全球首款無線纜箱式超節點scaleX40,這款集成40張GPU的算力設備以28PFLOPS(FP8精度)的算力表現,為AI算力市場提供了新的解決方案。
傳統算力市場存在明顯的斷層:數百卡級超節點雖性能強勁但部署成本高昂,8卡服務器雖成本可控卻難以滿足新興應用需求。中科曙光高級副總裁李斌指出,隨著OpenClaw等智能體技術推動AI應用從對話交互向任務執行轉型,算力需求正從訓練主導轉向推理服務主導。這種轉變要求算力基礎設施從"算力工廠"轉型為"Token工廠",在性能、成本與部署靈活性間尋找平衡點。
scaleX40的研發團隊經過市場調研發現,40卡規模既能支撐大模型訓練推理需求,又不會造成資源浪費。該設備采用無線纜正交架構,通過計算節點與交換節點的直接對插設計,將訪存帶寬提升至80TB/s以上,延遲降低近一個數量級。這種創新架構使設備可直接適配標準19英寸機柜,相比傳統超節點降低了80%的部署復雜度。
在性能對比測試中,scaleX40展現出顯著優勢:其訓練效率較5臺8卡服務器組合提升120%,推理性能最高提升330%,而硬件成本基本持平。這種突破得益于全棧協同優化,配套發布的ParaStor分布式存儲系統、ScaleFabric高速網絡及SothisAI管理平臺,構建起從存儲到應用層的完整解決方案。系統出廠前已完成800余個大模型的適配優化,開箱即可投入使用。
行業專家指出,當前AI算力需求呈現明顯分層特征。智源研究院敖玉龍在研討中提到,科研機構既需要單機般的易用性,又不得不面對大模型帶來的系統復雜性。中國電信王子瀟則預測,未來算力發展將呈現兩大趨勢:模型結構收斂推動ASIC芯片發展,互連協議統一提升節點擴展靈活性。這些變化都要求算力供給模式進行適應性調整。
中科曙光的產品矩陣布局印證了這種市場判斷。繼去年推出面向頂級訓練的scaleX640后,此次發布的scaleX40形成了覆蓋訓練到推理的全場景解決方案。李斌強調,這種分層供給策略既符合國家算力中心建設"有序、集約、綠色"的指導原則,也體現了產業鏈協同創新的思路。通過與芯片廠商、系統軟件開發商的深度合作,設備在特定算子優化上實現了30%以上的效率提升。
隨著AI技術加速滲透金融、醫療、制造等領域,算力可及性正成為制約產業智能化的關鍵因素。scaleX40的箱式設計使單臺設備占地面積縮減至0.5平方米,配合標準供電冷卻系統,顯著降低了中小企業部署門檻。這種"普惠型"算力供給模式,或將推動AI應用從技術驗證階段邁向規模化產業落地。















