国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

  • 虎科技 - 領先的互聯網科技媒體

昇騰AI開發者峰會2026北京啟幕:共探前沿技術,攜手開發者共筑AI新未來

   時間:2026-05-26 19:56 來源:天脈網作者:沈如風

近日,一場聚焦Agentic AI前沿技術的開發者盛會在北京成功舉辦。本次峰會以“一起昇騰 共綻光芒”為主題,匯聚了全球頂尖技術專家與開發者,共同探討AI技術發展趨勢,推動開發者生態建設邁向新高度。

在AI技術快速迭代的背景下,華為公司Fellow、半導體首席科學家廖恒在主題演講中深入剖析了Agentic AI時代對算力架構的全新要求。他指出,面向預訓練、推理等多樣化業務場景,AI芯片的算力、內存帶寬、內存容量及互聯IO帶寬四大核心指標需根據應用特點動態優化。其中,芯片互聯能力直接決定超節點系統的整體性能。通過昇騰950芯片的突破性互聯技術,可構建出覆蓋范圍更廣、帶寬更高、延遲更低的超節點架構,實現系統性能與芯片規格的乘積效應。

針對MoE模型推理的嚴苛時延要求,廖恒提出創新解決方案:將EP通信限定在Scale Up域內完成。由于EP通信呈現All-to-All的多對多細粒度特征,單數據包僅7-14KB且交互頻次隨專家數量呈平方級增長,傳統網絡架構難以滿足需求。通過優化通信方式選擇策略——小顆粒度通信采用Load&Store內存語義,大顆粒度通信使用DMA傳輸,并避免網絡流量路徑重疊,可有效突破時延瓶頸。

在KV Cache管理領域,華為推出搭載UB端口的SSU單元架構創新。該設計通過直連UB網絡實現NPU與SSU單元的高效數據交互,消除傳統存儲系統、文件系統及邏輯扇區轉換等中間環節,使帶寬提升至少一個數量級。面對模型調用頻次激增50-100倍、序列長度擴展250倍的挑戰,該架構成功將KVCache命中率提升至95%以上,在降低Prefill成本的同時實現系統性能優化。

華為昇騰計算產品部部長周斌在演講中重點介紹了軟件生態建設成果。CANN作為昇騰軟件核心,已實現全面開源開放,構建起覆蓋運行時、算子編譯等全層級的開放接口體系。針對不同開發者需求,昇騰提供差異化工具鏈:Ascend C與CATLASS模板庫支持性能極致優化,TileLang、Triton等主流生態接口實現快速創新,PyAsc等Python工具鏈則大幅降低開發門檻。特別推出的CANNBot算子智能體,通過集成微架構優化經驗,使單個Vector算子開發時間縮短至3小時,全流程效率提升5倍以上。

在開源生態兼容性方面,昇騰取得突破性進展。算子編程層面實現Triton和TileLang接口100%兼容,性能達到Ascend C的60%-90%,開發周期壓縮至一周以內。AI框架支持方面,昇騰與PyTorch生態深度融合,2300多個API實現社區對齊,40余個模型完成圖模式加速適配。北京大學計算機學院副研究員楊智在分享中證實,TileLang框架在DeepSeek V4算子開發中展現出卓越的跨平臺能力,不同平臺間代碼差異率不足5%。

推理領域生態建設同樣成果豐碩。昇騰作為vLLM Project和SGLang主倉唯一自主創新硬件合作伙伴,原生集成主干代碼并貢獻關鍵特性,使長序列場景首Token時延降低30%。開源大模型推理引擎xLLM負責人劉童璇介紹,該引擎已實現全模態模型推理加速支持,其架構深度適配昇騰超節點技術,推理性能達到行業領先水平。通過開源核心服務組件,xLLM構建起從引擎到上層服務的完整技術棧。

為持續賦能開發者社區,昇騰推出全面升級的開發者使能計劃。該計劃從社區體驗、開發工具、激勵權益三個維度進行優化:一鍵式開發環境部署將Demo運行時間縮短至2分鐘,1000+昇騰卡為開發者提供初始免費算力支持;Agent工作流將專家經驗轉化為自動化技能,使復雜模型開發周期壓縮60%以上;首批設立的創新激勵基金將重點扶持算子優化、加速庫開發等領域創新項目。

峰會特別設置頒獎環節,對在技術創新與生態建設中表現突出的個人及團隊進行表彰。來自全球的11位開發者榮獲“昇騰開源貢獻杰出個人獎”,14個開源項目團隊分別獲得開源項目先鋒團隊獎、開源社區共建團隊獎及AI4S生態貢獻團隊獎。這些獎項的設立,彰顯了昇騰構建開放共贏開發者生態的堅定決心。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群