昇騰AI開發者峰會2026北京啟幕，共探Agentic AI新未來，攜手開發者共筑智能新篇章-手機產品-虎科技

昇騰AI開發者峰會在北京盛大舉行，本次峰會以“一起昇騰共綻光芒”為主題，吸引了全球眾多開發者與行業專家齊聚一堂，共同探討人工智能領域的前沿技術與發展趨勢。峰會旨在匯聚全球創新力量，打造一場面向開發者的思想盛宴，推動人工智能技術的交流與進步。

華為公司Fellow、半導體首席科學家廖恒在峰會上發表了重要演講。他指出，隨著Agentic AI的迅猛發展，華為在AI基礎設施層面已率先開啟超節點時代。在面向預訓練、推理Prefill與Decode等各類業務負載時，AI芯片的算力、內存帶寬、內存容量、互聯IO帶寬這四大核心指標，在不同應用場景下呈現出不同的優先級。其中，互聯能力更是直接決定了超節點的性能上限。廖恒介紹，昇騰950芯片憑借其出色的互聯能力，能夠構建出更高帶寬、更低延時且覆蓋范圍更廣的超節點，系統綜合性能與超節點規模和單芯片性能規格成正比。

在Agent時代，MoE模型推理對時延提出了極為嚴苛的要求，時延需壓縮至10毫秒、5毫秒甚至1毫秒級別。廖恒分析，EP的Dispatch-combine通信是制約時延的核心瓶頸。由于EP通信屬于All-to-All這種多對多的細粒度通信，單數據包大小僅7KB至14KB，且數據包交互頻次隨專家數量呈平方級增長，傳統網絡架構難以承載，無法實現低時延傳輸。因此，他建議EP通信應在Scale Up域里完成。對于通信方式的選擇，廖恒認為取決于通信的顆粒度：通信量小時，Load&Store內存語義優勢明顯；通信顆粒較大時，則建議使用DMA，同時要避免多個網絡流量路徑重疊。

Agentic AI的發展也給KV Cache帶來了巨大挑戰。一方面，模型調用頻次暴漲50至100倍；另一方面，序列長度從Chatbot典型的4k序列長度增長至接近1兆，提升了250倍。受此影響，KV Cache命中率突破95%。高命中率雖顯著降低了Prefill成本，但也導致KV Cache成本等比例提升。為應對這一挑戰，華為創新設計了搭載UB端口的SSU單元，通過直出接口接入UB網絡。該架構精簡了存儲系統、文件系統以及從文件系統名字中間轉換到SSD的邏輯扇區的轉換過程，消除了原路徑的諸多障礙，使NPU能夠直接命中SSU的KV Cache，SSU再通過UB網絡將數據傳送到NPU的片上內存，帶寬至少提升一個數量級。

華為昇騰計算產品部部長周斌在峰會上圍繞“圍繞易用性持續提升，打造從好用到易用的昇騰算力底座”這一主題發表演講。他從開發者視角全面介紹了昇騰軟件易用性建設的最新成果，涵蓋CANN全面開源開放、兼容主流開源生態、Mind系列軟件升級并開源貢獻三大方向，旨在持續降低開發門檻、提升開發效率，為AI開發者提供全流程高效開發體驗。

CANN作為昇騰軟件底座與生態核心，已實現全面開源開放，為開發者提供了完整、高效、開放的算子開發體系。目前，CANN已完成分層解耦與開源，開放了運行時、算子編譯等全層級接口，算子與通信庫支持獨立升級，已開源50余個源碼倉。在算子編程層面，昇騰針對不同開發者需求提供全棧支持：對于追求極致性能的工程師，提供Ascend C、CATLASS模板庫，支持對計算、訪存、流水等關鍵環節進行細粒度控制，充分釋放芯片性能；對于注重快速創新的AI算法工程師，支持TileLang、Triton等主流Tile編程生態，并推出PyPTO，以Tensor抽象簡化算法創新流程。為進一步降低開發門檻，昇騰全面擁抱Python生態，推出PyAsc、Python版CATLASS模板庫及PyPTO，讓開發者能夠以Python友好方式實現底層并行與高性能算子開發。

昇騰還打造了CANNBot算子智能體，將微架構優化經驗融入skill技能庫，支持Ascend C、CATLASS、Triton、TileLang、PyPTO等多種編程范式，覆蓋算子開發全流程。基于CANNBot，單個Vector算子生成僅需3小時，從生成到部署全流程1天內即可完成，相比傳統人工開發效率提升5倍以上。為助力業界Agent與大模型適配昇騰算子，昇騰還量身打造了專屬算子數據集與評測集：算子數據集覆蓋Vector、Cube、CV融合算子數據，通過高質量樣本與專業思維鏈幫助大模型理解算子寫法；算子評測集提供分級評測體系，覆蓋22類典型算子、內置4000+評測點，多維度評估算子生成的功能、精度與性能。

在兼容主流開源技術生態方面，昇騰以全面兼容主流開源生態為易用性改進的核心方向，讓開發者無需改變使用習慣即可高效調用昇騰硬件能力。在算子編程層面，昇騰實現了Triton和TileLang接口100%兼容，性能可達Ascend C的0.6 - 0.9倍，開發周期縮短至一周，已支持超600個Triton算子和300個TileLang算子，覆蓋主流模型關鍵算子樣例。北京大學計算機學院副研究員楊智提到，TileLang作為tile級編程框架，在DeepSeek V4的算子實踐中表現出高開發效率與高性能，使昇騰能夠全面支持DeepSeek V4推理，同時也證明了TileLang優秀的跨平臺能力，Developer模式下不同平臺的算子僅有少量代碼存在區別。未來，TileLang for Ascend還有廣闊的發展空間，如昇騰950的編程插件、torch.compile與Graph優化、超節點統一編程等。

在AI框架方面，昇騰全面支持PyTorch生態，實現2300多個API與社區對齊；圖模式加速實現40 +模型入圖能力對齊，分布式加速實現20 +主流大模型FSDP2開箱即用。訓練加速方面，昇騰與8 +強化學習社區建立合作，累計合入超萬行代碼。verl社區Maintainer侯正罡介紹，verl社區與昇騰深度合作，基于昇騰軟硬件實現fully Async，并在基礎架構上開展聯合創新和回饋社區，使強化學習訓練效率提升2倍以上。

在推理領域，昇騰全面適配LLM、多模態等核心場景，作為vLLM Project唯一自主創新硬件廠商、SGLang主倉唯一自主創新非GPU硬件廠商，原生合入主干代碼并貢獻關鍵特性，長序列場景首Token時延降低30%，xLLM框架也已原生支持昇騰。開源大模型推理引擎xLLM負責人劉童璇分享道，xLLM推理引擎如同操作系統般連接底層芯片與上層大模型應用，原生支持文本、圖像、視頻等全模態模型的推理加速，實現算力向模型智能高效轉化。其架構深度適配昇騰超節點技術優勢，推理性能出眾；同時開源大模型服務核心組件，構筑從推理引擎到上層服務的完整技術棧。未來，xLLM將緊跟技術趨勢持續迭代架構，深度適配昇騰950超節點產品，立足Al for System理念，從技術跟隨邁向標準引領，打造面向未來的智能超級大腦。

在Mind系列軟件全面升級方面，MindSpore面向超節點創新，進行組件化解耦，提升昇騰大模型圖模式、分布式競爭力；MindSpeed通過架構革新，解耦插件，靈活配合開源社區使用，快速使能昇騰算力；MindIE系列軟件棧全新升級，與生態充分融合，助力推理更快、更穩、更簡單；MindStudio開源開放并搭載智能助手，全流程提升了開發調試效率。

為共建繁榮開源生態，昇騰全面升級了開發者使能計劃。華為昇騰生態發展部部長張良在演講中詳細介紹了該計劃，包括社區體驗、開發工具、激勵權益三大方向。面向社區，昇騰優化了環境準備、部署、資料檢索等流程，實現一鍵自動部署，平均2分鐘即可跑通首個Demo。社區上線了1000 +昇騰卡，為每一位開發者提供初始100卡時的免費算力，基于一站式開發平臺即取即用；算子開發易用性提升，算子工程升級、開源昇騰skills倉庫，助力開發者高效開發、調試；加強開源社區CI/CD建設及Committer專家投入，提速開源貢獻的驗證及合入。面向開發工具，將數千名昇騰專家經驗沉淀成skills，搭建Agent工作流，提供全新Agentic開發體驗，開發者通過需求描述即可完成各類模型開發操作，大幅壓縮開發周期，讓新手也能輕松搞定復雜任務，加速創新想法落地。伴隨基礎軟件全面開源，昇騰轉向社區化運作，明確開發者成長與創新路徑。設立首批創新激勵基金，扶持算子、加速庫等領域創新探索；投放10000卡算力資源，支撐開源社區研發運維與實操體驗，充分保障開發者算力需求。

峰會現場還為杰出個人及團隊頒發了“昇騰開源貢獻杰出個人獎”及“昇騰開源合作杰出團隊獎”，以表彰近一年來昇騰開發者在昇騰技術創新、技術生態發展中的突出表現。11名個人杰出貢獻者獲得“昇騰開源貢獻杰出個人獎”榮譽，14個開源項目團隊分別獲得開源項目先鋒團隊獎、開源社區共建團隊獎及AI4S生態貢獻團隊獎。

昇騰AI開發者峰會2026北京啟幕，共探Agenti	對話未來智能CEO馬嘯：AI硬件成共識，聚焦
鄉村旅游“小而美”新業態崛起：從打卡到沉	阿里云峰會全棧升級高光背后：巨虧、動蕩、

国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

昇騰AI開發者峰會2026北京啟幕，共探Agentic AI新未來，攜手開發者共筑智能新篇章