國產(chǎn)開源大模型領(lǐng)域迎來重要突破——DeepSeek V4正式發(fā)布預(yù)覽版本并全面開源,其Pro與Flash雙版本模型同步上線API服務(wù)。這款基于華為昇騰國產(chǎn)算力架構(gòu)開發(fā)的模型,在性能表現(xiàn)與成本控制上均展現(xiàn)出強勁競爭力,標(biāo)志著國產(chǎn)大模型在推理環(huán)節(jié)實現(xiàn)關(guān)鍵技術(shù)自主化。
技術(shù)參數(shù)方面,DeepSeek V4 Pro版本以1.6T參數(shù)量、49B激活參數(shù)和33T預(yù)訓(xùn)練數(shù)據(jù)構(gòu)建起強大基座,上下文窗口長度突破性達(dá)到1M級別。其輕量化版本Flash則采用284B參數(shù)架構(gòu),在保持13B激活參數(shù)和32T預(yù)訓(xùn)練數(shù)據(jù)的同時,實現(xiàn)了同等規(guī)模的上下文處理能力。這種雙軌設(shè)計分別對應(yīng)網(wǎng)頁端/App的"專家模式"與"快速模式",滿足不同場景需求。
性能測試數(shù)據(jù)顯示,該模型在多維度評估中表現(xiàn)亮眼:Agentic Coding測評中,Pro版本交付質(zhì)量已接近Opus 4.6非思考模式水平,在開源模型中位居榜首;世界知識測試僅以微弱差距落后于閉源模型Gemini-Pro-3.1;推理性能更是在已公開評測的開源模型中獨占鰲頭。這些數(shù)據(jù)印證了官方宣稱的"性能比肩頂級閉源模型"并非虛言。
價格體系成為另一大亮點。當(dāng)前API服務(wù)定價顯示,Pro版本每百萬token輸入(緩存未命中)12元、輸出24元,F(xiàn)lash版本則低至輸入1元、輸出2元。盡管受高端算力限制,Pro版本初期服務(wù)吞吐量有限,但官方透露隨著下半年昇騰950超節(jié)點批量上市,成本有望進(jìn)一步下探。這種定價策略不僅在行業(yè)內(nèi)形成顯著優(yōu)勢,更得益于完全脫離CUDA生態(tài)的國產(chǎn)化適配,為后續(xù)價格調(diào)整預(yù)留充足空間。
值得關(guān)注的是,此次發(fā)布標(biāo)志著國產(chǎn)頂級開源大模型在關(guān)鍵技術(shù)領(lǐng)域?qū)崿F(xiàn)重要突破。通過完全基于華為昇騰架構(gòu)的開發(fā)路徑,DeepSeek V4成功擺脫對英偉達(dá)GPU的依賴,在推理環(huán)節(jié)構(gòu)建起自主可控的技術(shù)體系。這種技術(shù)路線選擇不僅降低了硬件成本,更為國產(chǎn)大模型生態(tài)的可持續(xù)發(fā)展提供了新范式。















