隨著人工智能與大模型技術(shù)的飛速發(fā)展,智能體正逐漸成為行業(yè)焦點(diǎn)。中國(guó)工程院院士鄔賀銓指出,到2026年,全球推理算力預(yù)計(jì)將占AI算力總負(fù)載的70%至80%,而中國(guó)的推理需求將是訓(xùn)練需求的8倍。這一趨勢(shì)標(biāo)志著算力應(yīng)用正從訓(xùn)練主導(dǎo)轉(zhuǎn)向推理和智能體主導(dǎo),推動(dòng)算力架構(gòu)、應(yīng)用場(chǎng)景和商業(yè)模式發(fā)生深刻變革。智能體不再局限于簡(jiǎn)單的問(wèn)答,而是向深度思考、多步規(guī)劃和持續(xù)執(zhí)行方向發(fā)展,算力架構(gòu)也從注意力經(jīng)濟(jì)轉(zhuǎn)向生產(chǎn)力經(jīng)濟(jì),商業(yè)模式則從成本中心轉(zhuǎn)變?yōu)閮r(jià)值引擎。
鄔賀銓強(qiáng)調(diào),智能體并非單一的主機(jī),而是一種能力和資源。在大模型的支持下,單個(gè)智能體通過(guò)感知、記憶、規(guī)劃、工具調(diào)用和行動(dòng)執(zhí)行形成閉環(huán),成為專注于特定任務(wù)的智能單元。然而,單一智能體的應(yīng)用邊界和能力上限有限,缺乏跨智能體協(xié)作能力。因此,構(gòu)建多智能體協(xié)同系統(tǒng)成為突破局限的關(guān)鍵。通過(guò)統(tǒng)一協(xié)調(diào)器的調(diào)度,相關(guān)智能體可以組織起來(lái),共享記憶和高級(jí)規(guī)劃,實(shí)現(xiàn)分布式、多角色、強(qiáng)協(xié)作的集體智能,處理復(fù)雜目標(biāo)。
多智能體在開(kāi)放網(wǎng)絡(luò)中的規(guī)模化互聯(lián)形成了智能體互聯(lián)網(wǎng)(IoA)。與傳統(tǒng)互聯(lián)網(wǎng)實(shí)現(xiàn)主機(jī)和信息互聯(lián)不同,IoA擴(kuò)展為智能體和能力的互聯(lián)。基于IPv6+,疊加新應(yīng)用層協(xié)議,IoA實(shí)現(xiàn)智能體的唯一標(biāo)識(shí)、自主發(fā)現(xiàn)、可信交互、協(xié)同執(zhí)行和按需組網(wǎng)。智能體互聯(lián)網(wǎng)以智能體群為互聯(lián)對(duì)象,支撐智能體即服務(wù)(AaaS)。AaaS將智能體和智能體群的能力云化封裝,通過(guò)API、SDK和低代碼平臺(tái)對(duì)外提供,支持租戶化、彈性調(diào)度、托管運(yùn)維和按需計(jì)費(fèi)服務(wù)。
面向消費(fèi)者的智能體(To C)主要有三種應(yīng)用模式。第一種是云上APP寄生智能體,依賴微信、釘釘?shù)人拗鰽PP,依托云端算力運(yùn)行,斷網(wǎng)不可用。這類智能體作為APP內(nèi)的AI插件和被動(dòng)助手,可基于用戶偏好自動(dòng)完成操作,將聊天工具升級(jí)為具備思考、寫(xiě)作、讀文件和控制設(shè)備能力的智能助手,但用戶無(wú)法選擇模型。第二種是終端OS原生智能體,預(yù)裝于手機(jī)操作系統(tǒng),如中興通訊與字節(jié)跳動(dòng)聯(lián)合推出的豆包手機(jī)。這類智能體通過(guò)端云協(xié)同,按用戶意圖和偏好調(diào)度和聚合APP,自動(dòng)執(zhí)行業(yè)務(wù)流程,用戶可控性強(qiáng),斷網(wǎng)仍可基礎(chǔ)運(yùn)行,但可能弱化APP界面,遭到應(yīng)用廠商抵制,且過(guò)度主動(dòng)可能違背用戶意愿。第三種是本地自治加云端輔助的智能體,不依賴APP,但需手動(dòng)安裝獨(dú)立PC軟件,如“龍蝦”AI私人管家。這類智能體決策和權(quán)限管理本地化,由用戶驅(qū)動(dòng),基于授權(quán)按任務(wù)執(zhí)行,不主動(dòng)感知場(chǎng)景或服務(wù),通過(guò)云上AaaS發(fā)現(xiàn)并協(xié)同其他智能體。
面向企業(yè)的智能體(To B)則有四大應(yīng)用模式。第一種是流程自動(dòng)化智能體,復(fù)刻人工邏輯,替代生產(chǎn)、運(yùn)維等標(biāo)準(zhǔn)化流程,提升效率。第二種是行業(yè)專家智能體,依托行業(yè)知識(shí)庫(kù)和知識(shí)圖譜,提供決策參謀方案。第三種是多智能體協(xié)同,整合供應(yīng)鏈、生產(chǎn)和物流等多領(lǐng)域智能體,實(shí)現(xiàn)跨環(huán)節(jié)協(xié)同。第四種是具身智能,支撐工業(yè)機(jī)器人等實(shí)體設(shè)備,完成感知、推理和物理執(zhí)行的閉環(huán)。
鄔賀銓指出,不同應(yīng)用模式在算力、精度和網(wǎng)絡(luò)需求上差異顯著。針對(duì)中小企業(yè)自建算力不足和數(shù)據(jù)隱私風(fēng)險(xiǎn)高的痛點(diǎn),本地初算加云端精算成為最優(yōu)解,相當(dāng)于存算分離或聯(lián)邦計(jì)算,平衡成本與安全,實(shí)現(xiàn)算力應(yīng)用的平權(quán)化。
智能體業(yè)務(wù)與傳統(tǒng)互聯(lián)網(wǎng)業(yè)務(wù)存在本質(zhì)差異。驅(qū)動(dòng)主體從人工操作變?yōu)闄C(jī)器自主循環(huán),時(shí)間節(jié)律從晝夜分明變?yōu)?×24小時(shí)不間斷運(yùn)行,空間分布從集中式變?yōu)槎帱c(diǎn)網(wǎng)狀、多并發(fā)級(jí)聯(lián)調(diào)用,會(huì)話從短對(duì)話、分鐘級(jí)變?yōu)殚L(zhǎng)上下文、小時(shí)或天級(jí),流量從平穩(wěn)變?yōu)椤癟oken核爆”特征,單智能體Token消耗可達(dá)普通用戶的10至1000倍。
這些差異對(duì)算力、云和網(wǎng)絡(luò)提出了顛覆性要求。智能體需要GPU或NPU專用加速器,多智能體需同時(shí)占用多個(gè)隔離的“沙箱或進(jìn)程”,并發(fā)密度激增,長(zhǎng)上下文、多模態(tài)和批量推理對(duì)顯存和帶寬提出極高要求。盡管Token流量年增速高達(dá)330%,但通過(guò)小模型普及、極致壓縮與稀疏化、長(zhǎng)上下文優(yōu)化,智能體時(shí)代算力增速可控制在41%左右,實(shí)現(xiàn)效率與成本的平衡。云服務(wù)方面,智能體時(shí)代要求智能體原生云,優(yōu)先布局智能體原生架構(gòu),構(gòu)建全局智能調(diào)度,搭建分布式記憶與向量引擎,深化“云—邊—端”協(xié)同,強(qiáng)化算力與網(wǎng)絡(luò)優(yōu)化。網(wǎng)絡(luò)方面,智能體使網(wǎng)絡(luò)流量從南北向?yàn)橹鬓D(zhuǎn)為東西向占比80%,QPS提升10至100倍。網(wǎng)絡(luò)需從行政區(qū)組網(wǎng)轉(zhuǎn)向智算中心、區(qū)域云、邊緣和終端四級(jí)架構(gòu),采用SRv6、云網(wǎng)虛擬化與編排技術(shù)、流量AI預(yù)測(cè)與調(diào)度等技術(shù),保障確定性與高可靠性。







