在5月20日的阿里云峰會上,一場關于云計算未來的深度變革被正式揭開。阿里云宣布完成了一次從底層芯片到上層產品入口的全棧技術重構,旨在打造一個面向AI時代的新型云底座。這一舉動不僅回應了外界對阿里云巨額投入的質疑,更展示了其在AI基礎設施領域的雄心壯志。
阿里云資深副總裁劉偉光指出,隨著Agent技術的突破,未來的云計算負載將發生根本性變化。傳統的穩態負載模式,即企業長期占用計算資源運行網站或數據庫,將逐漸被Agent的突發性和無規律性負載所取代。Agent能夠在毫秒間發起多次模型調用,并在任務完成后立即銷毀環境,這種模式對云計算資源提出了全新的挑戰。
為了應對這一挑戰,阿里云提出了“Agentic Cloud”的概念,區別于以往的“AI Native Cloud”。Agentic Cloud不僅關注模型的生產迭代,更致力于為智能體提供運行時所需的全套能力,包括沙箱環境、AI網關、記憶管理和安全防護等。這一變革意味著,阿里云正在從單純的算力提供者,轉變為Agent運行的操作系統。
在芯片層面,阿里云公布了自研芯片的路線圖,并發布了新一代訓推一體AI芯片真武M890。該芯片擁有144GB顯存和800GB/s的片間互聯帶寬,性能是上一代的3倍。配套發布的ICN Switch 1.0互聯芯片,則進一步提升了芯片間的通信效率。阿里云計劃在未來兩年內推出算力更強的真武V900和真武J900芯片,以與模型迭代節奏保持同步。
在模型與推理平臺方面,阿里云通過百煉平臺構建了大規模GPU資源集群,并針對Agent場景優化了技術棧。該平臺通過池調度提升GPU資源利用率,通過上下文緩存減少重復計算開銷,并通過吞吐彈性調度應對并發請求的波峰波谷。百煉平臺還引入了Agentic RL機制,基于Agent實際執行反饋進行強化學習,使模型在真實場景中持續迭代優化。
阿里云的最新模型Qwen3.7-Max在性能上也有了顯著提升。在三方機構的全球大模型盲測中,Qwen3.7-Max位列國產模型第一,與國際頂尖模型如GPT、Claude和Gemini不相上下。更令人矚目的是,Qwen3.7-Max在真武M890芯片上自主完成了生產級AI計算內核的編寫與調優,性能較官方版本提升10倍,充分展示了模型與芯片協同進化的潛力。
技術架構的重構也帶來了商業邏輯的轉變。阿里云預計,Agent驅動的MaaS收入將逐漸取代傳統的ECS收入,成為其最大的產品線。這一轉變意味著,阿里云的商業模式將從以虛擬機為計量單位的資源收入,全面切換為以Token為計量單位的AI收入。阿里云還通過開放生態策略,接入了多家第三方模型,以提供更具性價比的推理服務。
















