英伟达CES重磅发布Rubin AI平台,训练性能超Blackwell 3.5倍推理成本降10倍

导读目录
Rubin平台概述
根据 www.Todayusstock.com 报道,英伟达在CES 2026展会正式推出新一代AI平台Rubin,延续年度更新节奏。该平台集成六款全新芯片,专注于大幅降低AI推理成本与提升训练效率,首批系统将于2026年下半年交付。亚马逊AWS、谷歌云、微软和甲骨文云等头部云服务商将成为首波部署客户。黄仁勋强调,Rubin平台运行成本显著低于Blackwell,因为用更少组件即可实现同等甚至更高性能,标志英伟达在AI加速器领域的领先优势进一步巩固。
性能提升亮点
Rubin平台在多项关键指标上实现跃升。以下表格对比Rubin与前代Blackwell主要性能:
| 指标 | Rubin平台 | 对比Blackwell | 意义 |
|---|---|---|---|
| 训练性能 | 提升至更高水平 | 3.5倍 | 大幅缩短大型模型训练周期 |
| 运行AI软件性能 | 显著优化 | 5倍 | 推理效率大幅提高 |
| 推理代币生成成本 | 大幅下降 | 降低至多10倍 | 显著降低云服务商运营成本 |
| 训练混合专家模型(MoE)所需GPU | 大幅减少 | 减少4倍 | 降低客户资本支出门槛 |
新平台搭载的Vera CPU拥有88个核心,性能是竞品的2倍,专为代理推理设计。Rubin GPU配备第三代Transformer引擎,支持50 petaflops NVFP4计算能力,单卡带宽达3.6TB/s,NVL72机架级系统带宽更达260TB/s。
芯片测试进展
黄仁勋在CES现场披露,全部六款Rubin芯片已从制造合作伙伴处返回,并通过关键测试,验证了按计划部署的可行性。他表示:“AI竞赛已经开始,所有人都在努力达到下一个水平。”这一进展打消了市场对英伟达供应链与交付节奏的疑虑,强化其年度迭代能力。
五大创新技术
Rubin平台引入五大核心技术创新:第六代NVLink互连、第三代Transformer引擎、第三代机密计算、第二代RAS引擎以及Vera CPU。其中,机密计算首次实现跨CPU、GPU和NVLink的全域数据安全保护;RAS引擎支持实时健康监测与主动维护;机架采用模块化无线缆设计,组装维护速度比Blackwell快18倍。
生态系统支持
云服务巨头率先拥抱Rubin:亚马逊AWS、谷歌云、微软、甲骨文云将于2026年上线相关实例。CoreWeave、Lambda、NEBIUS、Nscale等新兴AI云厂商也将跟进。硬件伙伴包括思科、戴尔科技、惠普企业、联想集团、超微电脑,将推出多样化Rubin服务器。主要AI实验室高度认可:OpenAI CEO Sam Altman、Anthropic CEO Dario Amodei、Meta CEO扎克伯格均公开赞赏Rubin在扩展计算、提升推理与部署规模方面的突破。
市场影响解读
Rubin提前详尽披露正值华尔街对英伟达竞争压力与AI支出可持续性质疑之际,此举旨在巩固行业对英伟达硬件的长期依赖。英伟达维持数万亿美元AI市场规模预测,强调Rubin将加速机器人、医疗、重工业等全经济领域AI应用。微软下一代Fairwater超级工厂将大规模配备Rubin NVL72系统,显示头部客户资本支出意愿持续强劲。
编辑总结
英伟达Rubin平台以显著性能提升与成本优化延续AI芯片领导地位,训练与推理效率跃升直接响应新一代大模型需求。芯片测试顺利、生态伙伴广泛支持以及头部云厂商快速部署,共同强化英伟达年度迭代优势。尽管竞争加剧与支出放缓担忧存在,Rubin提前发布与强劲客户需求表明AI基础设施投资周期仍处上升通道,英伟达中长期增长前景稳固。
【常见问题解答】
问题1:Rubin平台为何能将推理成本降低10倍?
通过硬件架构优化、第三代Transformer引擎与自适应压缩技术,Rubin在相同任务下所需计算资源大幅减少,同时Vera CPU与高带宽NVLink提升整体能效。推理代币生成成本下降至多10倍,将直接降低云服务商运营支出,并推动更多AI应用商业化落地。
问题2:训练MoE模型所需GPU减少4倍意味着什么?
混合专家模型(MoE)是当前前沿大模型主流架构,参数规模巨大。Rubin通过更高训练性能与优化互连,使同等规模模型训练所需GPU数量锐减4倍,大幅降低客户训练成本与时间,有助于加速下一代超大规模AI模型开发。
问题3:黄仁勋为何选择CES而非GTC公布Rubin细节?
英伟达今年比往年更早、更详尽披露新产品,意在提前锁定客户规划与生态依赖,应对竞争压力。CES作为全球最大消费电子展,提供更广泛曝光,黄仁勋借此强化“AI竞赛已开始”的市场预期。
问题4:头部AI实验室为何高度评价Rubin?
Sam Altman、Dario Amodei、扎克伯格等一致认可Rubin在计算扩展、长记忆、可靠推理与规模部署方面的阶跃进步。这些正是训练与运行万亿参数级模型的关键瓶颈,Rubin效率提升将直接助力他们开发更强大AI系统。
问题5:Rubin发布对英伟达股价与竞争格局有何影响?
短期提振市场信心,缓解竞争与支出放缓担忧;中长期巩固英伟达在AI加速器领域的护城河。云厂商与AI实验室快速采用将带动2026-2027年收入增长,尽管竞争者加速追赶,英伟达年度迭代节奏与生态优势仍构成显著壁垒。
英伟达收跌6.2%成交449亿美元 黄仁勋确认三星SK海力士美光通过HBM4认证
微软CEO纳德拉重磅访谈:自研MAI大模型夺回AI控制权 拒绝卖GPU赚快钱 预言SaaS转向订阅+按量付费
英伟达逆势收涨1.94%成交356亿美元 与现代汽车谈判韩国AI研发中心 巩固全球AI芯片领导地位
英伟达收跌3.62%成交336亿 完成KUMO AI收购布局AI新领域
微软Build大会全栈押注AI智能体时代 Web IQ+Majorana 2量子芯片+Scout本地助手三大重磅发布
微软跌4.17% 特朗普AI模型审查令引发担忧 市场解读为短期情绪反应
英伟达推RTX Spark超级芯片挑战英特尔 PC处理器市场卷土重来 黄仁勋布局AI全场景
微软股价涨2.28%成交241亿 AI新模型+Surface Laptop Ultra携手英伟达
英伟达股价大涨6.26%成交463亿 全新RTX Spark芯片进军PC市场 黄仁勋AI战略全面布局
微软Build 2026开发者大会6月2日开幕 发布代码专用AI模型反击Cursor与Claude Code
英伟达微软同步发布“个人电脑的新时代”预告 黄仁勋下周Computex或揭晓Arm架构PC芯片
微软MSFT收涨5.45%成交346亿 与英伟达同步预热神秘新品 曲面屏硬件或亮相Build大会
英伟达NVDA跌1.45%成交608亿 微软同步预热神秘新品 联手推Arm架构PC芯片N1挑战x86格局
微软涨3.47%成交198亿!Build大会推自研AI代码模型 挑战Cursor与Claude
英伟达涨0.78%成交302亿!黄仁勋时隔7个月访韩 深化HBM与三星SK海力士合作
英伟达连续4天下跌1.05% 毛利率修复见顶+客户集中+高利率三重压力
英伟达股价微跌0.22% 连续三日回调 驱动程序升级至610.47分支
英伟达CEO黄仁勋:明年将继续快速增长 呼吁内存供应商提升产能 Vera CPU前景乐观
英伟达收跌1.90%却获Cestrian上调评级 财报超预期 华尔街平均目标价303美元
英伟达NVDA收跌1.77%成交446.58亿 财报超预期 AI算力上行周期远未结束





