国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

華為數(shù)據(jù)存儲攜手中科弘云 推出AI推理加速方案 賦能多行業(yè)應(yīng)用

   時間:2025-12-23 19:46 來源:快訊作者:朱天宇

華為數(shù)據(jù)存儲與中科弘云近日聯(lián)合推出了一項(xiàng)AI推理加速解決方案,旨在通過軟硬件深度協(xié)同優(yōu)化,為長序列推理場景提供高效算力支撐。該方案以華為OceanStor A系列存儲為核心數(shù)據(jù)底座,結(jié)合中科弘云自主研發(fā)的HyperCN智算互聯(lián)網(wǎng)云服務(wù)平臺,構(gòu)建起覆蓋數(shù)據(jù)存儲、算力調(diào)度、推理加速的全棧能力體系。

在技術(shù)架構(gòu)層面,方案創(chuàng)新性地融合了華為UCM推理記憶數(shù)據(jù)管理技術(shù)與中科弘云平臺能力。通過KV Cache多級緩存管理機(jī)制,將推理過程中的關(guān)鍵數(shù)據(jù)持久化存儲于OceanStor A系列設(shè)備,實(shí)現(xiàn)推理記憶的全量保存與快速調(diào)用。這種設(shè)計(jì)有效減少了重復(fù)計(jì)算開銷,配合Prefix Cache與GSA稀疏加速算法,在長序列推理場景中可顯著降低首Token生成時延(TTFT)。實(shí)測數(shù)據(jù)顯示,在智能問答典型場景中,該方案使TTFT降低57.5%,且序列長度與優(yōu)化效果呈正相關(guān)關(guān)系。

針對復(fù)雜算力環(huán)境,方案構(gòu)建了異構(gòu)資源管理體系。系統(tǒng)支持英偉達(dá)、華為昇騰、寒武紀(jì)等多品牌AI芯片的協(xié)同調(diào)度,兼容MindSpore、vLLM、SGLang等主流開發(fā)框架,并通過Kubernetes容器編排技術(shù)實(shí)現(xiàn)與存儲系統(tǒng)的無縫對接。這種設(shè)計(jì)使得能源電力、智能制造等行業(yè)的用戶能夠靈活整合現(xiàn)有算力資源,避免硬件鎖定帶來的技術(shù)風(fēng)險。

在算力調(diào)度方面,方案采用細(xì)粒度資源池化策略,可根據(jù)業(yè)務(wù)需求動態(tài)分配計(jì)算資源。系統(tǒng)具備集群作業(yè)調(diào)度、實(shí)時健康監(jiān)測、故障自動恢復(fù)等運(yùn)維能力,支持分鐘級任務(wù)重啟與系統(tǒng)自愈。特別是在長文檔處理場景中,結(jié)合GSA稀疏加速算法后,當(dāng)序列長度達(dá)到39K時,系統(tǒng)并發(fā)處理能力提升86%,整體推理吞吐量增長36%,有效提升了復(fù)雜模型的生產(chǎn)部署效率。

為降低AI開發(fā)門檻,方案提供覆蓋全流程的端到端工具鏈,涵蓋數(shù)據(jù)標(biāo)注、模型訓(xùn)練、推理部署等關(guān)鍵環(huán)節(jié)。工具鏈同時支持傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)開發(fā)模式,實(shí)現(xiàn)AI資產(chǎn)的標(biāo)準(zhǔn)化管理。目前該方案已在國家實(shí)驗(yàn)室、能源電力、智能制造等領(lǐng)域啟動試點(diǎn)應(yīng)用,通過實(shí)際場景驗(yàn)證了其在復(fù)雜業(yè)務(wù)環(huán)境中的技術(shù)可行性。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群