英偉達(dá)發(fā)布Nemotron 3系列開(kāi)放模型，同步開(kāi)源數(shù)據(jù)工具并收購(gòu)AI公司-軟件產(chǎn)品-虎科技

手機(jī)版

虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

英偉達(dá)發(fā)布Nemotron 3系列開(kāi)放模型，同步開(kāi)源數(shù)據(jù)工具并收購(gòu)AI公司

時(shí)間：2025-12-17 01:36 來(lái)源：快訊作者：江紫萱

英偉達(dá)近日正式推出NVIDIA Nemotron 3系列開(kāi)放模型，涵蓋Nano、Super和Ultra三種規(guī)模，旨在支持大規(guī)模多智能體系統(tǒng)的開(kāi)發(fā)與部署，實(shí)現(xiàn)高效的長(zhǎng)上下文推理能力。這一系列模型通過(guò)引入創(chuàng)新架構(gòu)和訓(xùn)練方法，為AI智能體應(yīng)用提供了更強(qiáng)大的技術(shù)支撐。

Nemotron 3 Nano作為該系列的小型模型，擁有300億參數(shù)，每次運(yùn)行最多激活30億參數(shù)，特別適合針對(duì)性強(qiáng)、計(jì)算成本效益高的任務(wù)。該模型在軟件調(diào)試、內(nèi)容摘要、AI助手工作流及信息檢索等場(chǎng)景中表現(xiàn)出色。相比之下，Super模型擁有約1000億參數(shù)，每個(gè)token最多激活100億參數(shù)，適用于需要多智能體協(xié)作的低延遲復(fù)雜任務(wù)。而Ultra模型則擁有約5000億參數(shù)，每個(gè)token最多激活500億參數(shù)，能夠處理深度研究和策略規(guī)劃等復(fù)雜AI工作流。

在技術(shù)架構(gòu)方面，Nemotron 3系列引入了混合Mamba-Transformer MoE架構(gòu)，結(jié)合跨交互式環(huán)境的強(qiáng)化學(xué)習(xí)，原生支持100萬(wàn)個(gè)token的上下文窗口。這種設(shè)計(jì)使得模型在多智能體應(yīng)用中能夠?qū)崿F(xiàn)高吞吐量和長(zhǎng)時(shí)域推理。具體而言，Mamba層擅長(zhǎng)高效序列建模，Transformer層則通過(guò)精細(xì)的注意力機(jī)制補(bǔ)充邏輯關(guān)系，而MoE路由在不增加計(jì)算成本的情況下顯著提升了有效參數(shù)數(shù)量。

為了提升模型的實(shí)際應(yīng)用能力，英偉達(dá)采用多環(huán)境強(qiáng)化學(xué)習(xí)訓(xùn)練方法，通過(guò)開(kāi)源庫(kù)NeMo Gym在多種環(huán)境中對(duì)模型進(jìn)行后訓(xùn)練。這種方法能夠生成在多步驟工作流程中表現(xiàn)可靠的模型，減少推理漂移，并處理智能體管道中的結(jié)構(gòu)化操作。Nemotron 3的百萬(wàn)級(jí)上下文容量使其在處理長(zhǎng)時(shí)間多步驟任務(wù)時(shí)能夠更精準(zhǔn)地關(guān)聯(lián)信息，支持對(duì)大型代碼庫(kù)、長(zhǎng)文檔和擴(kuò)展對(duì)話的持續(xù)推理。

在訓(xùn)練效率方面，Nemotron 3 Super和Ultra模型采用了基于NVIDIA Blackwell架構(gòu)的超高效4位NVFP4訓(xùn)練格式。這種格式顯著降低了顯存需求，加速了訓(xùn)練進(jìn)程，同時(shí)提高了模型質(zhì)量。英偉達(dá)還設(shè)計(jì)了更新的NVFP4算法，確保在25萬(wàn)億token的預(yù)訓(xùn)練數(shù)據(jù)集上實(shí)現(xiàn)準(zhǔn)確穩(wěn)定的訓(xùn)練。這一創(chuàng)新使得更大規(guī)模的模型能夠在現(xiàn)有基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練，而不會(huì)因更高精度格式犧牲準(zhǔn)確性。

為了支持開(kāi)發(fā)者構(gòu)建高性能AI智能體，英偉達(dá)還發(fā)布了面向?qū)I(yè)開(kāi)發(fā)者的訓(xùn)練數(shù)據(jù)集與前沿強(qiáng)化學(xué)習(xí)庫(kù)集合。這些資源包括3萬(wàn)億token規(guī)模的預(yù)訓(xùn)練、后訓(xùn)練及強(qiáng)化學(xué)習(xí)數(shù)據(jù)集，以及用于評(píng)估模型安全性和性能的NeMo evaluator。開(kāi)發(fā)者可以利用這些工具和數(shù)據(jù)集訓(xùn)練、增強(qiáng)和評(píng)估自己的Nemotron模型，從而加速開(kāi)發(fā)進(jìn)程。

Nemotron 3 Nano已上線Hugging Face平臺(tái)，并通過(guò)多個(gè)推理服務(wù)商提供支持。其Hugging Face地址為huggingface.co/nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8，體驗(yàn)地址為build.nvidia.com/nvidia/nemotron-3-nano-30b-a3b。Super和Ultra模型預(yù)計(jì)將于2026年上半年推出，這兩款更高性能的模型將成為開(kāi)源社區(qū)關(guān)注的重點(diǎn)產(chǎn)品。

英偉達(dá)的這一系列舉措不僅為開(kāi)發(fā)者提供了強(qiáng)大的技術(shù)工具，還通過(guò)開(kāi)源開(kāi)放的方式降低了開(kāi)發(fā)門(mén)檻。通過(guò)公開(kāi)訓(xùn)練數(shù)據(jù)、強(qiáng)化學(xué)習(xí)環(huán)境和訓(xùn)練代碼，英偉達(dá)希望更多開(kāi)發(fā)者能夠利用優(yōu)質(zhì)數(shù)據(jù)構(gòu)建更好的模型，從而推動(dòng)AI技術(shù)的進(jìn)步和應(yīng)用。這一戰(zhàn)略不僅有助于英偉達(dá)在AI領(lǐng)域保持領(lǐng)先地位，也為整個(gè)行業(yè)的發(fā)展注入了新的活力。

更多>同類(lèi)內(nèi)容

虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體 - 聚合優(yōu)質(zhì)的創(chuàng)新信息與人群,捕獲精選、深度、犀利的商業(yè)科技資訊，不錯(cuò)過(guò)互聯(lián)網(wǎng)的每個(gè)重要時(shí)刻。
合作微信：netspread，添加時(shí)務(wù)必注明虎科技
Copyright ? 2010-2021 HUKEJI.COM - All rights reserved. 魯ICP備11015305號(hào)-21

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群

周鴻祎嚴(yán)正聲明：玉紅惡意詆毀 360將依法追	萬(wàn)寧中國(guó)內(nèi)地市場(chǎng)大調(diào)整：線下門(mén)店及多平臺(tái)
太空成AI新戰(zhàn)場(chǎng)：馬斯克、貝佐斯、王堅(jiān)等大	60歲李國(guó)慶重返電商江湖攜“李享生活”能

国产国产乱老视频网站97|高中少女桑桑的日常小说|欧美高清v doso|男生和女生一起生孩子短视频|含精入睡的青梅HH|欲望都市游戏|夫妻主找奴

英偉達(dá)發(fā)布Nemotron 3系列開(kāi)放模型，同步開(kāi)源數(shù)據(jù)工具并收購(gòu)AI公司