国产美女野战在线播放-国产乱人av一区二区三区-日韩一区二区三区在线视频观看-小黄片无码在线观看视频-澳门蜜桃av成人av-久久青青草线视频免费观看-最新亚洲天堂资源av-国产大学生自拍三级视频-成人影院在线免费观看视频

  • 中文科技資訊 CWX中文科技資訊官方網(wǎng)站!

中科曙光首款全棧自研400G無(wú)損高速網(wǎng)絡(luò),有哪些關(guān)鍵技術(shù)突破?

   時(shí)間:2026-03-14 01:14 來(lái)源:快訊作者:江紫萱

隨著人工智能技術(shù)的飛速發(fā)展,AI大模型訓(xùn)練對(duì)算力的需求呈現(xiàn)指數(shù)級(jí)增長(zhǎng),萬(wàn)卡集群已成為行業(yè)標(biāo)配。在這一背景下,網(wǎng)絡(luò)性能成為制約算力效率的關(guān)鍵因素。傳統(tǒng)InfiniBand(IB)網(wǎng)絡(luò)和RoCE網(wǎng)絡(luò)是當(dāng)前主流的兩種高速網(wǎng)絡(luò)方案,但前者長(zhǎng)期被國(guó)外企業(yè)壟斷,后者則存在技術(shù)短板和國(guó)產(chǎn)化瓶頸。如何突破技術(shù)封鎖,打造自主可控的高速網(wǎng)絡(luò),成為國(guó)內(nèi)科技企業(yè)面臨的重要課題。

3月12日,中科曙光正式發(fā)布首款全棧自研400G無(wú)損高速網(wǎng)絡(luò)產(chǎn)品——scaleFabric,標(biāo)志著國(guó)內(nèi)在高端計(jì)算網(wǎng)絡(luò)領(lǐng)域?qū)崿F(xiàn)重大突破。該產(chǎn)品采用國(guó)產(chǎn)InfiniBand原生無(wú)損RDMA技術(shù),專(zhuān)為大規(guī)模萬(wàn)卡集群設(shè)計(jì),可全面適配AI大模型訓(xùn)練、超算任務(wù)等高端場(chǎng)景,為國(guó)產(chǎn)算力網(wǎng)絡(luò)自主可控提供了核心支撐。中科曙光高級(jí)副總裁李斌表示,在AI算力需求每九個(gè)月翻一番的背景下,高速網(wǎng)絡(luò)已成為制約行業(yè)發(fā)展的關(guān)鍵瓶頸,而scaleFabric的推出正是為了解決這一痛點(diǎn)。

當(dāng)前,RDMA網(wǎng)絡(luò)已成為算力中心的事實(shí)標(biāo)準(zhǔn),但其實(shí)現(xiàn)路徑存在顯著差異。RoCE網(wǎng)絡(luò)通過(guò)在以太網(wǎng)上嫁接RDMA技術(shù),雖兼容IP生態(tài),但存在協(xié)議冗余、帶寬低、時(shí)延高等先天缺陷,難以滿(mǎn)足大規(guī)模集群需求。相比之下,IB網(wǎng)絡(luò)作為原生RDMA方案,具有協(xié)議棧精簡(jiǎn)、包頭信息短、有效載荷高等優(yōu)勢(shì),其交換機(jī)采用VCT交換技術(shù),時(shí)延可控制在300ns以?xún)?nèi),遠(yuǎn)優(yōu)于RoCE的500ns以上。中科曙光高速網(wǎng)絡(luò)互聯(lián)產(chǎn)品部總工程師萬(wàn)偉指出,在大規(guī)模集群場(chǎng)景下,網(wǎng)絡(luò)性能直接決定系統(tǒng)整體效率,IB技術(shù)是當(dāng)前最優(yōu)解。

scaleFabric的研發(fā)歷時(shí)三年,實(shí)現(xiàn)了從底層芯片到上層軟件的全棧自研。其核心包括兩顆自研芯片:網(wǎng)卡芯片支持400G高帶寬和自研RDMA引擎,交換芯片具備64T雙向交換容量和260ns轉(zhuǎn)發(fā)時(shí)延。產(chǎn)品系列涵蓋400G單口標(biāo)準(zhǔn)網(wǎng)卡、1U 80口液冷交換機(jī)和2U 80口風(fēng)冷交換機(jī),可靈活適配不同場(chǎng)景需求。測(cè)試數(shù)據(jù)顯示,scaleFabric在端到端時(shí)延、單端口帶寬等關(guān)鍵指標(biāo)上已達(dá)到國(guó)際頂尖水平,在3萬(wàn)卡集群實(shí)測(cè)中,網(wǎng)絡(luò)效率提升超40%,故障恢復(fù)時(shí)間縮短至毫秒級(jí)。

該產(chǎn)品的技術(shù)突破不僅體現(xiàn)在性能指標(biāo)上,更在于其完整的自主技術(shù)體系。通過(guò)自研112G SerDes IP、交換芯片、網(wǎng)卡等核心部件,中科曙光構(gòu)建了從硬件到軟件的自主生態(tài),徹底擺脫了對(duì)海外技術(shù)的依賴(lài)。萬(wàn)偉強(qiáng)調(diào),scaleFabric在兼容性方面也做了大量?jī)?yōu)化,可無(wú)縫對(duì)接主流通信庫(kù),支持HPC/AI應(yīng)用零代碼遷移,最大限度降低用戶(hù)遷移成本。針對(duì)IB協(xié)議組網(wǎng)規(guī)模限制的問(wèn)題,曙光通過(guò)技術(shù)創(chuàng)新將單子網(wǎng)支持規(guī)模提升至11.4萬(wàn)卡,較市面主流產(chǎn)品提升133%,同時(shí)組網(wǎng)成本下降30%。

目前,scaleFabric已在鄭州國(guó)家超算互聯(lián)網(wǎng)節(jié)點(diǎn)實(shí)現(xiàn)規(guī)?;渴穑兹f(wàn)卡集群僅用36小時(shí)即完成上線(xiàn),累計(jì)服務(wù)客戶(hù)超1萬(wàn)家,處理作業(yè)超10萬(wàn)次。這一成果的取得,源于中科曙光在IB技術(shù)領(lǐng)域的長(zhǎng)期積累。李斌透露,公司自2000年起便開(kāi)始使用Myrinet高速網(wǎng)絡(luò),2005年后全面切換至IB體系,對(duì)相關(guān)技術(shù)和應(yīng)用場(chǎng)景有著深刻理解。正是這種技術(shù)積淀,使得曙光能夠在自研過(guò)程中精準(zhǔn)改進(jìn)原有設(shè)計(jì),實(shí)現(xiàn)部分性能的超越。

在大算力領(lǐng)域,中科曙光的布局涵蓋核心計(jì)算芯片研發(fā)、硬件高效實(shí)現(xiàn)和系統(tǒng)級(jí)協(xié)同三個(gè)層面。公司特別強(qiáng)調(diào)算、存、傳的深度融合,通過(guò)與國(guó)內(nèi)產(chǎn)業(yè)鏈上下游緊密合作,共同構(gòu)建自主可控的算力生態(tài)。李斌表示,曙光不僅是scaleFabric的研發(fā)者,更是其最大用戶(hù),這種身份使得公司能夠始終以用戶(hù)需求為導(dǎo)向,持續(xù)優(yōu)化產(chǎn)品性能。萬(wàn)偉則透露,曙光計(jì)劃將關(guān)鍵技術(shù)開(kāi)放給合作伙伴,共同打造類(lèi)InfiniBand的網(wǎng)絡(luò)生態(tài),為中國(guó)AI算力發(fā)展提供更強(qiáng)支撐。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容
本欄最新