在人工智能領域,大模型的發展曾一度聚焦于“招式”的驚艷——能看、能寫、能答,仿佛無所不能。然而,當AI真正邁向規模化落地階段,一個現實問題逐漸浮現:僅靠“反應迅速”遠遠不夠,能否在復雜任務中保持狀態、串聯知識、形成長期記憶,成為決定AI能否從“工具”升級為“助手”的關鍵。這場變革,正推動企業AI的競爭從“拼招式”轉向“拼內功”。
華為數據存儲領域總裁謝黎明在近期的一場發布會上指出,企業AI的核心資產正在從“數據”向“知識與記憶”轉型。過去,企業數字化建設的核心是“存、管、用”數據;如今,隨著智能體深入業務系統,AI需面對的已非簡單的“對話”場景,而是三道更現實的挑戰:知識生成效率低、檢索不精準;推理成本高、速度慢;缺乏長期記憶能力,復雜任務難以閉環。這些問題,正成為制約AI落地的“隱形門檻”。
以知識管理為例,企業內部數據往往分散在文檔、表格、日志等不同系統中,格式各異且歷史包袱沉重。傳統方法抽取知識效率低下,檢索結果常“似是而非”,導致AI雖能回答問題,卻未真正理解業務邏輯。而在推理場景中,GPU顯存的昂貴與有限,疊加緩存命中率、數據調度效率等因素,使得企業常面臨“算力夠但等不起”的困境——模型能計算,業務卻因延遲而無法承受。更棘手的是,智能體在跨步驟、跨系統任務中極易“失憶”,記不住用戶偏好或前置決策,最終淪為“高級聊天機器人”。
針對這些痛點,華為在發布會上推出了面向AI推理時代的AI數據平臺(AIDP),試圖為“中心推理”場景提供系統性解決方案。謝黎明將其定義為“整合知識庫、KV Cache庫、記憶庫與統一緩存管理(UCM)的架構,直擊三大挑戰”。從技術架構看,AIDP采用“3+1”模式:知識庫負責知識生成與高質量檢索;KV Cache庫優化推理速度與成本;記憶庫支持長期記憶與復雜任務;UCM則統籌不同存儲介質間的數據流轉,確保高效協同。
這一平臺的核心價值,在于推動企業AI從“演示級”邁向“生產級”。例如,在知識管理層面,AIDP重構了知識抽取、向量化、索引與檢索的全鏈路,支持多模態數據,使知識生成效率提升2倍,檢索準確率超95%。在推理優化層面,通過將KV Cache從GPU顯存解耦至高性能存儲介質,并結合UCM的冷熱分層調度,首Token時延降低90%,推理吞吐提升2倍,顯著緩解了GPU成本壓力。而在記憶能力層面,記憶庫的引入讓智能體能夠記錄用戶偏好、延續任務狀態,并在長期互動中沉淀經驗,真正從“會說話”進化為“能做事”。
值得注意的是,AIDP并未采取“推倒重來”的激進策略,而是支持兩種部署模式:既可將知識庫、記憶庫與KV Cache能力一體化整合至OceanStor A800中,也可在現有OceanStor Dorado存儲上通過外置節點獨立部署。這種“平滑升級”的設計,既保護了企業既有投資,又降低了技術遷移風險,更貼合企業級應用的決策邏輯——可控、可持續的演進路徑,往往比“性能翻倍”的承諾更具吸引力。
從更宏觀的視角看,AIDP的推出標志著企業存儲角色的轉變。過去,存儲的核心指標是容量、性能與可靠性;如今,華為開始強調“知識、緩存、記憶”等新關鍵詞。這并非營銷話術的更新,而是基礎設施定位的升級:在AI時代,存儲不僅是數據的“倉庫”,更需成為模型的“神經系統”——高效組織知識、承接緩存、管理記憶,支撐智能體持續運行。正如謝黎明所言:“AI推理時代,存儲平臺的價值不在于‘喂數據’,而在于‘養記憶’。”
當AI從“會生成”邁向“會執行”,企業需要的不僅是更快的存儲,而是更懂AI邏輯的數據底座。華為的探索,或許為行業提供了一個新思路:在模型能力日益趨同的今天,誰能補上“長期記憶”與“穩定推理”的內功,誰就更有可能在智能體競爭中占據先機。
















