英伟达发布Nemotron 3开源AI模型系列 Nano版领先同规模 黄仁勋强调开放创新

导读目录
Nemotron 3系列发布概览
根据 www.Todayusstock.com 报道,周一英伟达正式发布最新开源人工智能模型家族Nemotron 3,同时提供配套数据和库,致力于为各行业开发者构建透明、高效、可定制的智能体AI(agentic AI)系统。公司强调,新系列在速度、成本和智能水平上全面优于前代产品。
受此消息提振,英伟达股价周一开盘上涨超1%,报177.23美元。Nemotron 3 Nano已上线,另外两款更大规模版本计划于2026年上半年推出。
三个版本参数与定位对比
Nemotron 3系列涵盖Nano、Super和Ultra三个版本,参数规模与应用场景差异显著:
| 版本 | 参数规模 | 主要定位 | 上线时间 |
|---|---|---|---|
| Nemotron 3 Nano | 300亿 | 目标明确、高效率任务 | 已上线 |
| Nemotron 3 Super | 1000亿 | 多智能体、高精度推理 | 2026上半年 |
| Nemotron 3 Ultra | 约5000亿 | 复杂场景、强大推理引擎 | 2026上半年 |
全系列支持100万token上下文长度,在大型代码库、长文档、多小时对话等场景中显著提升事实一致性与推理能力。
突破性混合MoE架构解析
Nemotron 3引入创新混合潜在专家混合(latent Mixture-of-Experts,MoE)架构,结合选择性状态空间模型与Mamba-Transformer技术,大幅提升可扩展性和效率。
相比前代,该架构实现最多4倍token吞吐量提升,推理token生成量减少60%,显著降低延迟与成本。潜在MoE技术允许在相同成本下调用多达4倍专家数量,提升语义细节与多跳推理能力。
此外,模型采用多token预测(MTP)机制,一次前向计算可预测多个未来token,进一步加速长链推理、代码生成等场景。
效率与上下文能力提升
Nemotron 3 Nano在Artificial Analysis Intelligence Index v3.0中以52分位居同规模模型首位。100万token上下文能力使智能体无需文本切分,即可完整保留证据集、历史记录与多阶段计划,特别适用于企业级检索增强生成、合规分析及大型代码仓库理解。
生成式AI软件副总裁Kari Briski表示,混合Mamba-Transformer架构运行更快、内存占用更低,避免了传统注意力机制的高昂键值缓存成本。
黄仁勋与高管最新表态
英伟达创始人兼CEO黄仁勋强调:“开放式创新是人工智能进步的基础。通过Nemotron,我们正在把先进AI转变为一个开放平台,为开发者提供在大规模构建智能体系统时所必需的透明性和效率。”
Kari Briski补充:“我们认为,凭借全新的混合专家架构与100万token上下文,我们在服务高度灵活定制模型的开发者方面具备独特优势。”她将潜在MoE比喻为“厨师共用大厨房但拥有各自调料架”,突出共享核心与专属专家的平衡设计。
早期采用者与开放资源
Nemotron 3早期采用者包括埃森哲、CrowdStrike、德勤、安永、甲骨文云基础设施、Palantir、Perplexity、ServiceNow、西门子、Zoom等知名企业。
英伟达同步推出全新NeMoGym强化学习实验环境,并开放大规模后训练数据集、研究论文与示例提示词,承诺长期软件工程支持。Briski表示,此举旨在解决开发者面临的“开放、智能与效率”三重难题。
编辑总结
英伟达发布Nemotron 3开源模型系列,以突破性混合潜在MoE架构、100万token上下文及多token预测为核心亮点,实现效率与智能水平的双重跃升。Nano版已领先同规模模型,黄仁勋强调开放创新战略。公司通过大规模开放资源与NeMoGym环境,进一步巩固在开源AI领域的领先地位。早期众多企业采用显示市场认可度高,随着Super与Ultra版本2026年推出,英伟达有望在多智能体系统开发领域占据更主导位置,推动开源模型与闭源前沿模型的协同应用趋势。
【常见问题解答】
问题1:Nemotron 3系列有哪些版本及其区别?
系列包括Nano(300亿参数,已上线)、Super(1000亿参数)和Ultra(约5000亿参数,后两者2026上半年推出)。Nano注重效率,Super面向多智能体高精度推理,Ultra适用于最复杂场景,全系列支持100万token上下文。
问题2:Nemotron 3的核心技术创新是什么?
引入混合潜在MoE架构,结合Mamba-Transformer与选择性状态空间模型,实现4倍吞吐量提升、60%推理成本降低;潜在MoE允许相同成本下调用4倍专家;多token预测加速长序列生成。
问题3:黄仁勋对Nemotron 3的评价如何?
黄仁勋表示开放式创新是AI进步基础,Nemotron将先进AI转变为开放平台,为开发者提供大规模构建智能体系统所需的透明性和效率。
问题4:哪些企业已成为Nemotron 3早期采用者?
包括埃森哲、CrowdStrike、德勤、安永、甲骨文云、Palantir、Perplexity、ServiceNow、西门子、Zoom等,覆盖咨询、安全、云服务、数据分析等多领域。
问题5:英伟达为何选择开源Nemotron 3?
旨在解决开发者在开放、智能与效率间的取舍难题,提供可信赖、可深度定制的模型,同时公开大规模训练数据与NeMoGym环境,加速企业级多智能体系统创新,并与闭源模型形成互补。
英伟达收跌6.2%成交449亿美元 黄仁勋确认三星SK海力士美光通过HBM4认证
英伟达逆势收涨1.94%成交356亿美元 与现代汽车谈判韩国AI研发中心 巩固全球AI芯片领导地位
英伟达收跌3.62%成交336亿 完成KUMO AI收购布局AI新领域
英伟达推RTX Spark超级芯片挑战英特尔 PC处理器市场卷土重来 黄仁勋布局AI全场景
英伟达股价大涨6.26%成交463亿 全新RTX Spark芯片进军PC市场 黄仁勋AI战略全面布局
英伟达微软同步发布“个人电脑的新时代”预告 黄仁勋下周Computex或揭晓Arm架构PC芯片
英伟达NVDA跌1.45%成交608亿 微软同步预热神秘新品 联手推Arm架构PC芯片N1挑战x86格局
英伟达涨0.78%成交302亿!黄仁勋时隔7个月访韩 深化HBM与三星SK海力士合作
英伟达连续4天下跌1.05% 毛利率修复见顶+客户集中+高利率三重压力
英伟达股价微跌0.22% 连续三日回调 驱动程序升级至610.47分支
英伟达CEO黄仁勋:明年将继续快速增长 呼吁内存供应商提升产能 Vera CPU前景乐观
英伟达收跌1.90%却获Cestrian上调评级 财报超预期 华尔街平均目标价303美元
英伟达NVDA收跌1.77%成交446.58亿 财报超预期 AI算力上行周期远未结束
英伟达Q1营收816亿美元大超预期!800亿美元回购+分红大增仍遭卖出,Q2指引910亿不及最高预期
英伟达Q1营收暴增85%夜盘仍跌1%!Applied Digital签超大规模云租约大涨7%,Rocket Lab与财捷双双重挫
英伟达2027财年Q1营收816亿美元超预期 数据中心752亿暴增 AI需求持续强劲
英伟达盘后发布2027财年Q1财报 期权预期波动6.5%市值或变3500亿美元 Vera CPU交付OpenAI
英伟达Vera CPU交付Anthropic OpenAI SpaceX 甲骨文2026年部署数十万颗 Agent AI新硬件战线开启
英伟达NVDA收跌1.33%成交323亿 摩根士丹利预测Q1营收超预期30亿 周三财报即将揭晓
美股夜盘半导体光通信加密概念集体重挫 POET暴跌22% 英伟达英特尔领跌





