鄔賀銓：2026年推理算力主導(dǎo)，智能體驅(qū)動(dòng)云網(wǎng)算全面升級(jí)變革-業(yè)界資訊-中文科技資訊

隨著人工智能與大模型技術(shù)的飛速發(fā)展，智能體正逐漸成為行業(yè)焦點(diǎn)。中國(guó)工程院院士鄔賀銓指出，到2026年，全球推理算力預(yù)計(jì)將占AI算力總負(fù)載的70%至80%，而中國(guó)的推理需求將是訓(xùn)練需求的8倍。這一趨勢(shì)標(biāo)志著算力應(yīng)用正從訓(xùn)練主導(dǎo)轉(zhuǎn)向推理和智能體主導(dǎo)，推動(dòng)算力架構(gòu)、應(yīng)用場(chǎng)景和商業(yè)模式發(fā)生深刻變革。智能體不再局限于簡(jiǎn)單的問(wèn)答，而是向深度思考、多步規(guī)劃和持續(xù)執(zhí)行方向發(fā)展，算力架構(gòu)也從注意力經(jīng)濟(jì)轉(zhuǎn)向生產(chǎn)力經(jīng)濟(jì)，商業(yè)模式則從成本中心轉(zhuǎn)變?yōu)閮r(jià)值引擎。

鄔賀銓強(qiáng)調(diào)，智能體并非單一的主機(jī)，而是一種能力和資源。在大模型的支持下，單個(gè)智能體通過(guò)感知、記憶、規(guī)劃、工具調(diào)用和行動(dòng)執(zhí)行形成閉環(huán)，成為專注于特定任務(wù)的智能單元。然而，單一智能體的應(yīng)用邊界和能力上限有限，缺乏跨智能體協(xié)作能力。因此，構(gòu)建多智能體協(xié)同系統(tǒng)成為突破局限的關(guān)鍵。通過(guò)統(tǒng)一協(xié)調(diào)器的調(diào)度，相關(guān)智能體可以組織起來(lái)，共享記憶和高級(jí)規(guī)劃，實(shí)現(xiàn)分布式、多角色、強(qiáng)協(xié)作的集體智能，處理復(fù)雜目標(biāo)。

多智能體在開(kāi)放網(wǎng)絡(luò)中的規(guī)模化互聯(lián)形成了智能體互聯(lián)網(wǎng)（IoA）。與傳統(tǒng)互聯(lián)網(wǎng)實(shí)現(xiàn)主機(jī)和信息互聯(lián)不同，IoA擴(kuò)展為智能體和能力的互聯(lián)。基于IPv6+，疊加新應(yīng)用層協(xié)議，IoA實(shí)現(xiàn)智能體的唯一標(biāo)識(shí)、自主發(fā)現(xiàn)、可信交互、協(xié)同執(zhí)行和按需組網(wǎng)。智能體互聯(lián)網(wǎng)以智能體群為互聯(lián)對(duì)象，支撐智能體即服務(wù)（AaaS）。AaaS將智能體和智能體群的能力云化封裝，通過(guò)API、SDK和低代碼平臺(tái)對(duì)外提供，支持租戶化、彈性調(diào)度、托管運(yùn)維和按需計(jì)費(fèi)服務(wù)。

面向消費(fèi)者的智能體（To C）主要有三種應(yīng)用模式。第一種是云上APP寄生智能體，依賴微信、釘釘?shù)人拗鰽PP，依托云端算力運(yùn)行，斷網(wǎng)不可用。這類智能體作為APP內(nèi)的AI插件和被動(dòng)助手，可基于用戶偏好自動(dòng)完成操作，將聊天工具升級(jí)為具備思考、寫(xiě)作、讀文件和控制設(shè)備能力的智能助手，但用戶無(wú)法選擇模型。第二種是終端OS原生智能體，預(yù)裝于手機(jī)操作系統(tǒng)，如中興通訊與字節(jié)跳動(dòng)聯(lián)合推出的豆包手機(jī)。這類智能體通過(guò)端云協(xié)同，按用戶意圖和偏好調(diào)度和聚合APP，自動(dòng)執(zhí)行業(yè)務(wù)流程，用戶可控性強(qiáng)，斷網(wǎng)仍可基礎(chǔ)運(yùn)行，但可能弱化APP界面，遭到應(yīng)用廠商抵制，且過(guò)度主動(dòng)可能違背用戶意愿。第三種是本地自治加云端輔助的智能體，不依賴APP，但需手動(dòng)安裝獨(dú)立PC軟件，如“龍蝦”AI私人管家。這類智能體決策和權(quán)限管理本地化，由用戶驅(qū)動(dòng)，基于授權(quán)按任務(wù)執(zhí)行，不主動(dòng)感知場(chǎng)景或服務(wù)，通過(guò)云上AaaS發(fā)現(xiàn)并協(xié)同其他智能體。

面向企業(yè)的智能體（To B）則有四大應(yīng)用模式。第一種是流程自動(dòng)化智能體，復(fù)刻人工邏輯，替代生產(chǎn)、運(yùn)維等標(biāo)準(zhǔn)化流程，提升效率。第二種是行業(yè)專家智能體，依托行業(yè)知識(shí)庫(kù)和知識(shí)圖譜，提供決策參謀方案。第三種是多智能體協(xié)同，整合供應(yīng)鏈、生產(chǎn)和物流等多領(lǐng)域智能體，實(shí)現(xiàn)跨環(huán)節(jié)協(xié)同。第四種是具身智能，支撐工業(yè)機(jī)器人等實(shí)體設(shè)備，完成感知、推理和物理執(zhí)行的閉環(huán)。

鄔賀銓指出，不同應(yīng)用模式在算力、精度和網(wǎng)絡(luò)需求上差異顯著。針對(duì)中小企業(yè)自建算力不足和數(shù)據(jù)隱私風(fēng)險(xiǎn)高的痛點(diǎn)，本地初算加云端精算成為最優(yōu)解，相當(dāng)于存算分離或聯(lián)邦計(jì)算，平衡成本與安全，實(shí)現(xiàn)算力應(yīng)用的平權(quán)化。

智能體業(yè)務(wù)與傳統(tǒng)互聯(lián)網(wǎng)業(yè)務(wù)存在本質(zhì)差異。驅(qū)動(dòng)主體從人工操作變?yōu)闄C(jī)器自主循環(huán)，時(shí)間節(jié)律從晝夜分明變?yōu)?×24小時(shí)不間斷運(yùn)行，空間分布從集中式變?yōu)槎帱c(diǎn)網(wǎng)狀、多并發(fā)級(jí)聯(lián)調(diào)用，會(huì)話從短對(duì)話、分鐘級(jí)變?yōu)殚L(zhǎng)上下文、小時(shí)或天級(jí)，流量從平穩(wěn)變?yōu)椤癟oken核爆”特征，單智能體Token消耗可達(dá)普通用戶的10至1000倍。

這些差異對(duì)算力、云和網(wǎng)絡(luò)提出了顛覆性要求。智能體需要GPU或NPU專用加速器，多智能體需同時(shí)占用多個(gè)隔離的“沙箱或進(jìn)程”，并發(fā)密度激增，長(zhǎng)上下文、多模態(tài)和批量推理對(duì)顯存和帶寬提出極高要求。盡管Token流量年增速高達(dá)330%，但通過(guò)小模型普及、極致壓縮與稀疏化、長(zhǎng)上下文優(yōu)化，智能體時(shí)代算力增速可控制在41%左右，實(shí)現(xiàn)效率與成本的平衡。云服務(wù)方面，智能體時(shí)代要求智能體原生云，優(yōu)先布局智能體原生架構(gòu)，構(gòu)建全局智能調(diào)度，搭建分布式記憶與向量引擎，深化“云—邊—端”協(xié)同，強(qiáng)化算力與網(wǎng)絡(luò)優(yōu)化。網(wǎng)絡(luò)方面，智能體使網(wǎng)絡(luò)流量從南北向?yàn)橹鬓D(zhuǎn)為東西向占比80%，QPS提升10至100倍。網(wǎng)絡(luò)需從行政區(qū)組網(wǎng)轉(zhuǎn)向智算中心、區(qū)域云、邊緣和終端四級(jí)架構(gòu)，采用SRv6、云網(wǎng)虛擬化與編排技術(shù)、流量AI預(yù)測(cè)與調(diào)度等技術(shù)，保障確定性與高可靠性。

国产美女野战在线播放-国产乱人av一区二区三区-日韩一区二区三区在线视频观看-小黄片无码在线观看视频-澳门蜜桃av成人av-久久青青草线视频免费观看-最新亚洲天堂资源av-国产大学生自拍三级视频-成人影院在线免费观看视频

鄔賀銓：2026年推理算力主導(dǎo)，智能體驅(qū)動(dòng)云網(wǎng)算全面升級(jí)變革