英伟达CES 2026黄仁勋重磅演讲:Rubin平台推理成本降10倍,开启物理AI时代

导读目录
演讲主线概述
根据 www.Todayusstock.com 报道,北京时间1月6日,英伟达CEO黄仁勋在CES 2026主舞台发布重磅演讲。一年后,AI行业从2025年的愿景展示转向“如何实现”阶段。黄仁勋强调,开源模型如DeepSeek R1加速全球协作,尽管能力落后前沿半年,但每六个月追近一次,使用量爆发式增长。本次演讲围绕三条主线:基础设施重构解决长期推理瓶颈、模型向Agentic AI转型、能力嵌入自动驾驶与机器人等物理场景。
Rubin架构详解
Rubin平台首次完整披露性能数据,针对推理时代需求设计。以下表格对比Rubin与Blackwell关键指标:
| 指标 | Rubin | 对比Blackwell | 意义 |
|---|---|---|---|
| NVFP4推理性能 | 50 PFLOPS | 5倍 | 推理速度大幅提升 |
| 训练性能 | 35 PFLOPS | 3.5倍 | 训练效率跃升 |
| HBM4内存带宽 | 22 TB/s | 2.8倍 | 数据吞吐更强 |
| 单GPU NVLink带宽 | 3.6 TB/s | 翻倍 | 多卡协同更高效 |
| MoE训练所需GPU | 减少 | 1/4 | 成本大幅降低 |
| 推理token成本 | 降低 | 最高10倍 | 商用门槛降低 |
核心组件包括Vera CPU(88个Olympus核心、1.5TB内存)、NVLink 6、ConnectX-9、BlueField-4、Spectrum-6。NVL72机架含220万亿晶体管、260 TB/s带宽,支持机架级机密计算。
推理成本革命
黄仁勋强调“Test-time Scaling”:让AI“多想一会儿”而非单纯增大模型。Rubin GPU一次处理更多任务、记住更长上下文,减少GPU依赖,实现推理更快更省。微软Fairwater超级工厂将部署数十万Vera Rubin芯片,CoreWeave等云厂商2026年下半年提供实例。
上下文内存存储
针对KV Cache存储瓶颈,英伟达推出推理上下文内存存储平台,由BlueField-4驱动,结合Spectrum-X以太网与DOCA等软件,在GPU内存与传统存储间创建高速“第三层”。效果:在特定场景下token处理速度提升最高5倍,支持多轮对话、多智能体长期运行。
新一代DGX SuperPOD
新一代DGX SuperPOD由8个NVL72机架组成,总576个GPU。核心组件包括NVLink 6扩展网络、Spectrum-X以太网、推理上下文内存平台与Mission Control软件。新一代交换机引入共封装光学(CPO)技术,降低功耗延迟,提供开箱即用大规模AI集群方案。
开源AI全家桶
英伟达扩展Open Model Universe,开源六大领域模型与工具链,包括生物医学(Clara)、物理模拟(Earth-2)、Agentic AI(Nemotron)、物理AI(Cosmos)、机器人(GR00T)、自动驾驶(Alpamayo)。Nemotron系列覆盖推理、RAG、安全、语音,提供完整数据集、代码与模板,降低企业开发门槛。
物理AI落地
Cosmos开源物理世界基础模型,支持视频生成、轨迹预测。Alpamayo首个开源视觉-语言-行动推理模型,推动自动驾驶从规则向“像人思考”转型。DRIVE系统量产,2026年搭载梅赛德斯-奔驰CLA。GR00T生态吸引Boston Dynamics等领军企业,覆盖工业、手术、人形机器人。
编辑总结
英伟达CES 2026演讲标志从生成AI向Agentic与物理AI全面转型。Rubin平台通过架构创新将推理成本降至1/10、训练GPU需求降至1/4,结合上下文内存存储与SuperPOD,提供长期运行基础设施。开源全家桶与Cosmos、Alpamayo、GR00T加速落地,微软等巨头快速采用显示商用前景明朗。英伟达正构建推理时代完整生态,巩固AI基础设施领导地位。
【常见问题解答】
问题1:Rubin平台最大突破是什么?
通过Test-time Scaling,让AI“多想一会儿”经济可行。Rubin在推理性能5倍、成本降10倍、MoE训练GPU减至1/4,实现从生成向持续思考转型,解决长期运行瓶颈。
问题2:上下文内存存储平台如何工作?
在GPU内存与传统存储间创建高速共享层,由BlueField-4加速管理,结合Spectrum-X网络与软件优化。支持多节点上下文共享,token处理速度提升5倍,适合多轮对话与多智能体协作。
问题3:DGX SuperPOD有何意义?
将576个Rubin GPU扩展为标准化集群,提供开箱即用大规模方案。引入CPO技术降低功耗延迟,适用于超大规模训练与数千Agentic AI同时服务。
问题4:开源全家桶对行业影响多大?
覆盖六大领域完整资源,从数据集到部署模板,大幅降低企业与研究机构门槛。Nemotron系列强化RAG、安全、语音能力,加速Agentic AI商业化。
问题5:物理AI落地进展如何?
Cosmos生成物理视频、Alpamayo引入推理决策,DRIVE量产搭载奔驰CLA;GR00T吸引全球机器人领军企业。合成数据与开源工具链解决真实数据不足,物理AI“ChatGPT时刻”临近。
英伟达收跌6.2%成交449亿美元 黄仁勋确认三星SK海力士美光通过HBM4认证
英伟达逆势收涨1.94%成交356亿美元 与现代汽车谈判韩国AI研发中心 巩固全球AI芯片领导地位
英伟达收跌3.62%成交336亿 完成KUMO AI收购布局AI新领域
英伟达推RTX Spark超级芯片挑战英特尔 PC处理器市场卷土重来 黄仁勋布局AI全场景
英伟达股价大涨6.26%成交463亿 全新RTX Spark芯片进军PC市场 黄仁勋AI战略全面布局
英伟达微软同步发布“个人电脑的新时代”预告 黄仁勋下周Computex或揭晓Arm架构PC芯片
英伟达NVDA跌1.45%成交608亿 微软同步预热神秘新品 联手推Arm架构PC芯片N1挑战x86格局
英伟达涨0.78%成交302亿!黄仁勋时隔7个月访韩 深化HBM与三星SK海力士合作
英伟达连续4天下跌1.05% 毛利率修复见顶+客户集中+高利率三重压力
英伟达股价微跌0.22% 连续三日回调 驱动程序升级至610.47分支
英伟达CEO黄仁勋:明年将继续快速增长 呼吁内存供应商提升产能 Vera CPU前景乐观
英伟达收跌1.90%却获Cestrian上调评级 财报超预期 华尔街平均目标价303美元
英伟达NVDA收跌1.77%成交446.58亿 财报超预期 AI算力上行周期远未结束
英伟达Q1营收816亿美元大超预期!800亿美元回购+分红大增仍遭卖出,Q2指引910亿不及最高预期
英伟达Q1营收暴增85%夜盘仍跌1%!Applied Digital签超大规模云租约大涨7%,Rocket Lab与财捷双双重挫
英伟达2027财年Q1营收816亿美元超预期 数据中心752亿暴增 AI需求持续强劲
英伟达盘后发布2027财年Q1财报 期权预期波动6.5%市值或变3500亿美元 Vera CPU交付OpenAI
英伟达Vera CPU交付Anthropic OpenAI SpaceX 甲骨文2026年部署数十万颗 Agent AI新硬件战线开启
英伟达NVDA收跌1.33%成交323亿 摩根士丹利预测Q1营收超预期30亿 周三财报即将揭晓
美股夜盘半导体光通信加密概念集体重挫 POET暴跌22% 英伟达英特尔领跌





