国产美女野战在线播放-国产乱人av一区二区三区-日韩一区二区三区在线视频观看-小黄片无码在线观看视频-澳门蜜桃av成人av-久久青青草线视频免费观看-最新亚洲天堂资源av-国产大学生自拍三级视频-成人影院在线免费观看视频

  • 中文科技資訊 CWX中文科技資訊官方網(wǎng)站!

曙光scaleFabric破局AI算力網(wǎng)絡(luò)掣肘,開(kāi)啟國(guó)產(chǎn)智算“滿(mǎn)血”新時(shí)代

   時(shí)間:2026-03-14 01:02 來(lái)源:快訊作者:朱天宇

在人工智能算力競(jìng)爭(zhēng)日益激烈的當(dāng)下,如何讓中國(guó)自主研發(fā)的算力系統(tǒng)高效運(yùn)行于本土網(wǎng)絡(luò)環(huán)境,成為產(chǎn)業(yè)界關(guān)注的焦點(diǎn)。近日,中科曙光推出的首款原生無(wú)損RDMA高速網(wǎng)絡(luò)scaleFabric,為破解這一難題提供了創(chuàng)新方案。這款全棧自研的網(wǎng)絡(luò)架構(gòu),通過(guò)重構(gòu)底層通信機(jī)制,實(shí)現(xiàn)了AI集群性能的突破性提升,標(biāo)志著國(guó)產(chǎn)算力基礎(chǔ)設(shè)施邁入全新階段。

傳統(tǒng)AI集群建設(shè)中,網(wǎng)絡(luò)性能往往成為制約整體效率的關(guān)鍵瓶頸。以萬(wàn)卡規(guī)模集群為例,其通信需求堪比超大型城市的交通系統(tǒng),而現(xiàn)有技術(shù)方案存在明顯缺陷:基于以太網(wǎng)的RoCE方案需通過(guò)復(fù)雜流控機(jī)制模擬無(wú)損環(huán)境,導(dǎo)致部署周期長(zhǎng)達(dá)數(shù)月且運(yùn)維成本高昂;海外IB方案雖性能優(yōu)異,但面臨供應(yīng)鏈風(fēng)險(xiǎn)與成本壓力。這種技術(shù)困境,使得多數(shù)企業(yè)難以充分發(fā)揮算力潛力。

scaleFabric的創(chuàng)新之處在于其"原生無(wú)損"設(shè)計(jì)理念。該方案從物理層到協(xié)議棧實(shí)現(xiàn)全棧自主創(chuàng)新,采用112G PAM4高速Serdes技術(shù),構(gòu)建了包含交換芯片、網(wǎng)卡芯片及智能管理平臺(tái)的完整技術(shù)體系。其核心的信用流控機(jī)制,通過(guò)預(yù)先確認(rèn)接收端緩沖區(qū)空間,從根本上消除了數(shù)據(jù)丟包風(fēng)險(xiǎn)。這種設(shè)計(jì)使網(wǎng)絡(luò)通信從"被動(dòng)應(yīng)對(duì)擁塞"轉(zhuǎn)變?yōu)?主動(dòng)預(yù)防擁塞",為AI訓(xùn)練提供了穩(wěn)定可靠的通信保障。

在鄭州國(guó)家超算互聯(lián)網(wǎng)核心節(jié)點(diǎn)的實(shí)戰(zhàn)部署中,scaleFabric展現(xiàn)了驚人的效率優(yōu)勢(shì)。三套萬(wàn)卡集群僅用36小時(shí)即完成網(wǎng)絡(luò)調(diào)試,相比傳統(tǒng)RoCE方案數(shù)月的部署周期,效率提升達(dá)數(shù)十倍。這種突破源于其集中管控架構(gòu):子網(wǎng)管理系統(tǒng)可在3分鐘內(nèi)自動(dòng)完成全網(wǎng)拓?fù)浒l(fā)現(xiàn)與路由計(jì)算,實(shí)現(xiàn)"一鍵部署"。對(duì)于運(yùn)維人員而言,系統(tǒng)提供的數(shù)字孿生可視化界面與智能故障診斷功能,將復(fù)雜網(wǎng)絡(luò)管理轉(zhuǎn)化為標(biāo)準(zhǔn)化操作流程。

成本效益分析顯示,scaleFabric在多個(gè)維度實(shí)現(xiàn)優(yōu)化。通過(guò)高密度交換芯片設(shè)計(jì),其組網(wǎng)密度較同類(lèi)產(chǎn)品提升25%,使得同等規(guī)模集群所需硬件數(shù)量減少,綜合網(wǎng)絡(luò)成本降低約30%。更關(guān)鍵的是,其"即插即用"特性消除了對(duì)專(zhuān)業(yè)運(yùn)維團(tuán)隊(duì)的依賴(lài),將隱性成本轉(zhuǎn)化為可量化的系統(tǒng)效能提升。實(shí)測(cè)數(shù)據(jù)顯示,在工業(yè)仿真等并行計(jì)算場(chǎng)景中,該方案可使算力利用率提升20%以上,達(dá)到國(guó)際主流產(chǎn)品性能水平的96%-105%。

這款國(guó)產(chǎn)網(wǎng)絡(luò)方案的突破性不僅體現(xiàn)在技術(shù)指標(biāo),更在于其開(kāi)放的生態(tài)建設(shè)理念。中科曙光牽頭成立的"AIDC高速網(wǎng)絡(luò)工作組",已匯聚十余家軟硬件合作伙伴,共同推進(jìn)場(chǎng)景化解決方案開(kāi)發(fā)。scaleFabric原生兼容IB應(yīng)用生態(tài),支持PyTorch等主流框架無(wú)縫遷移,為科研機(jī)構(gòu)與企業(yè)用戶(hù)提供了靈活的技術(shù)選擇。在中國(guó)科學(xué)院計(jì)算技術(shù)研究所的測(cè)試中,該方案在單QP通信性能等關(guān)鍵指標(biāo)上達(dá)到國(guó)際領(lǐng)先水平,特別在國(guó)產(chǎn)CPU適配方面展現(xiàn)出獨(dú)特優(yōu)勢(shì)。

當(dāng)前,AI發(fā)展正從訓(xùn)練階段向推理階段延伸,對(duì)智算基礎(chǔ)設(shè)施提出更高要求??拼笥嶏w在鄭州超算節(jié)點(diǎn)的實(shí)踐表明,scaleFabric支撐的單機(jī)柜640卡集成方案,可有效滿(mǎn)足超大規(guī)模智算需求。這種技術(shù)突破正在推動(dòng)產(chǎn)業(yè)生態(tài)變革,隨著自主網(wǎng)絡(luò)標(biāo)準(zhǔn)的制定與優(yōu)化,中國(guó)AI算力正逐步擺脫對(duì)單一技術(shù)路線的依賴(lài),走出一條開(kāi)放協(xié)作的自主發(fā)展道路。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容
本欄最新