DeepSeek 正式發(fā)布全新系列模型 DeepSeek-V4 的預(yù)覽版本,并同步開源,為人工智能領(lǐng)域帶來新的突破。該模型具備百萬字超長上下文處理能力,在 Agent 能力、世界知識儲備以及推理性能方面均達到國內(nèi)開源領(lǐng)域的領(lǐng)先水平。
DeepSeek-V4 系列模型分為兩個版本:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。官方介紹,DeepSeek-V4 開創(chuàng)了一種全新的注意力機制,通過在 token 維度進行壓縮,并結(jié)合 DSA 稀疏注意力技術(shù),實現(xiàn)了全球領(lǐng)先的長上下文處理能力,同時大幅降低了對計算資源和顯存的需求。從即日起,100 萬上下文將成為 DeepSeek 所有官方服務(wù)的標準配置。
在 API 服務(wù)方面,DeepSeek 已同步完成更新。用戶只需將 model_name 修改為 deepseek-v4-pro 或 deepseek-v4-flash,即可調(diào)用相應(yīng)版本的模型服務(wù)。
DeepSeek-V4-Pro 在 Agent 能力上表現(xiàn)尤為突出。在 Agentic Coding 評測中,該模型已達到當(dāng)前開源模型的最佳水平,并在其他 Agent 相關(guān)評測中同樣取得優(yōu)異成績。目前,DeepSeek-V4-Pro 已成為公司內(nèi)部員工使用的 Agentic Coding 模型。據(jù)評測反饋,其使用體驗優(yōu)于 Sonnet 4.5,交付質(zhì)量接近 Opus 4.6 非思考模式,但與 Opus 4.6 思考模式仍存在一定差距。
在世界知識測評中,DeepSeek-V4-Pro 的表現(xiàn)同樣亮眼,大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型 Gemini-Pro-3.1。而在數(shù)學(xué)、STEM 以及競賽型代碼的測評中,該模型更是超越了所有已公開評測的開源模型,成績可與世界頂級閉源模型媲美。
相比之下,DeepSeek-V4-Flash 在世界知識儲備方面略遜于 Pro 版本,但其推理能力與之接近。由于模型參數(shù)和激活量較小,V4-Flash 能夠提供更快捷、經(jīng)濟的 API 服務(wù),滿足對成本和效率有較高要求的用戶需求。
在 Agent 測評中,DeepSeek-V4-Flash 在簡單任務(wù)上的表現(xiàn)與 Pro 版本不相上下,但在處理高難度任務(wù)時仍存在一定差距。這一特點使得 V4-Flash 更適合對計算資源有限制或?qū)θ蝿?wù)復(fù)雜度要求不高的場景。















