英伟达200亿吸纳Groq SRAM技术 黄仁勋加速推理芯片布局 HBM需求不降反升

根据 黄金形态通APP 报道,英伟达(NVDA.US)已通过价值约200亿美元的非独占技术授权协议,从AI芯片初创公司Groq获取核心LPU(语言处理单元)技术,并吸纳其创始人Jonathan Ross、总裁Sunny Madra等多位关键人才。此举引发市场关注,特别是Groq标志性的片上SRAM架构被整合进英伟达的新型AI推理芯片设计中。投资者一度担忧此架构将削弱对HBM(高带宽内存)及DRAM等外部主内存的需求,导致供应链波动。但多家机构如KIS明确指出,此类担忧属于明显误读:SRAM并非HBM的替代品,而是针对超低延迟推理场景的专用互补路径,通过内存层级细分与异构计算,最终将显著扩大整个AI算力市场的总容量与需求规模。
导读目录
英伟达Groq技术授权与人才吸纳详情
2025年圣诞节前后,英伟达以约200亿美元现金完成对Groq核心资产的战略布局,包括获得Groq全部专利组合与推理技术栈的非独占永久授权,同时将Groq创始人Jonathan Ross(前谷歌TPU团队核心成员)、总裁Sunny Madra及大部分工程团队直接吸纳至英伟达。Groq公司实体保持独立运营,其云服务GroqCloud继续独立存在。此交易被视为英伟达迄今最大规模的技术收购案,旨在加速其在AI推理领域的专用优化布局。新一代推理芯片预计于2026年3月GTC开发者大会正式亮相,将深度融合Groq的LPU设计理念,针对大模型查询响应实现更低延迟与更高能效。英伟达CEO黄仁勋近期表示:“我们正在构建真正的AI工厂,而Groq的确定性架构为我们提供了关键拼图,帮助客户实现亚秒级响应。”
Groq片上SRAM架构核心优势
Groq的LPU采用确定性数据流架构,核心依赖大容量片上SRAM(单芯片约230MB,系统级带宽可达80TB/s级别),完全绕开传统GPU依赖的外部HBM。这一设计带来三大显著优势:一是超低延迟,首token响应时间可低至0.2秒,推理速度较英伟达H100 GPU快5-18倍;二是极高能效,通过静态编译调度避免动态调度浪费周期;三是规避HBM供应链瓶颈与高成本封装难题(如CoWoS)。但SRAM容量相对有限,更适合特定低延迟、确定性推理场景,而非海量参数模型的全面承载。
市场对HBM需求下降的误判分析
消息公布后,部分投资者担心SRAM主导的推理芯片将大幅压缩HBM需求,导致三星、SK海力士、美光等内存厂商承压。这种解读忽略了AI工作负载的分层本质:预填充(prefill)阶段需处理海量上下文,通常依赖大容量HBM;而解码(decode)阶段追求极致低延迟,才是SRAM真正发挥价值的场景。英伟达正推动异构路线,Groq技术更可能作为加速器补充GPU,而非全面取代。实际影响是内存需求从单一HBM向SRAM+HBM+GDDR7等多层次扩展,推动总市场规模增长。
KIS等机构观点与对比
多家机构对SRAM影响给出专业澄清,以下表格对比关键观点:
| 机构/来源 | 对SRAM与HBM关系判断 | 对整体内存需求预测 | 核心理由 |
|---|---|---|---|
| KIS | 互补而非替代 | 显著扩大总量 | 内存层级细分+异构计算趋势 |
| 摩根士丹利 | 针对不同推理阶段 | 2026-2028年HBM需求仍翻倍 | 预填充阶段仍依赖HBM |
| 高盛 | 差异化定位 | 中性至正面 | 低延迟场景打开新市场 |
| 市场散户主流观点 | 可能部分替代 | 短期承压 | 简单线性思维误判 |
对AI推理市场及内存供应链的影响
短期内,英伟达此举强化其在推理赛道的护城河,有望进一步拉大与AMD、Intel等竞争对手差距。中长期看,SRAM大规模商用将刺激台积电、GlobalFoundries等晶圆代工厂加大嵌入式SRAM工艺投入,同时推动HBM4、HBM3E向更高容量、更高带宽方向演进。整体AI内存市场有望从当前的“HBM独大”转向多元化供给格局,总出货量与营收规模均将获得结构性提升。
后期技术演进与潜在风险展望
展望2026-2027年,英伟达下一代Blackwell架构或已开始融入Groq式确定性调度元素,而推理专用芯片有望成为数据中心标配。风险点主要包括:技术整合进度不及预期、Groq原有客户流失引发声誉争议、以及地缘政治因素导致先进封装与内存供应链再度紧张。总体而言,本次交易对英伟达长期竞争力的正面影响远大于短期股价波动,HBM需求逻辑并未被根本动摇,反而在多场景需求驱动下更趋稳健。
编辑总结
英伟达以高溢价获取Groq核心技术与人才,实质上是为AI推理时代提前布局异构计算路径。SRAM架构的引入并非要取代HBM,而是将加速推动内存需求的结构性分层与总量扩张。市场对HBM需求下滑的担忧更多属于短期情绪化误读,基本面逻辑仍指向AI算力与内存市场的同步高增。后续需重点跟踪2026年GTC大会上新推理芯片的具体规格与落地进展。
常见问题解答
1. 英伟达为什么要花200亿美元买Groq的技术?
主要是为了快速补齐在超低延迟AI推理场景的短板。Groq的LPU架构在首token延迟和能效上大幅领先传统GPU,英伟达希望借此强化“AI工厂”战略,同时避免在推理专用芯片领域被新兴玩家弯道超车。黄仁勋本人多次强调推理将是未来算力消耗的最大场景,此次布局属于战略性前置投资。2. SRAM真的会取代HBM吗?
不会。SRAM和HBM服务于不同阶段:SRAM擅长超低延迟的token-by-token解码,容量有限;HBM则适合需要大上下文的预填充和训练阶段。两者是互补关系,未来数据中心很可能出现GPU+HBM+SRAM加速器的混合部署模式。3. 这对三星、SK海力士这些HBM厂商是利空吗?
短期股价可能承压,但中长期是利好。AI推理需求爆发会推高整体内存用量,HBM仍将是预填充与大模型训练的主力,新增的低延迟推理场景反而打开了新的增量市场,预计2026-2028年HBM需求仍将保持高速增长。4. Groq公司本身还存在吗?
存在。Groq只是把核心技术和大部分团队授权/并入英伟达,其云服务GroqCloud继续独立运营,现有客户仍可正常使用。交易本质是技术+人才收购,而非公司整体并购。5. 英伟达股价会因此大涨还是大跌?
短期波动取决于市场情绪与宏观环境。长期看,此举强化了英伟达在推理时代的领先地位,有助于巩固其AI芯片霸主格局,基本面逻辑偏正面。但需警惕高估值背景下任何执行不及预期的风险。
英伟达收跌6.2%成交449亿美元 黄仁勋确认三星SK海力士美光通过HBM4认证
英伟达逆势收涨1.94%成交356亿美元 与现代汽车谈判韩国AI研发中心 巩固全球AI芯片领导地位
英伟达收跌3.62%成交336亿 完成KUMO AI收购布局AI新领域
英伟达推RTX Spark超级芯片挑战英特尔 PC处理器市场卷土重来 黄仁勋布局AI全场景
英伟达股价大涨6.26%成交463亿 全新RTX Spark芯片进军PC市场 黄仁勋AI战略全面布局
英伟达微软同步发布“个人电脑的新时代”预告 黄仁勋下周Computex或揭晓Arm架构PC芯片
英伟达NVDA跌1.45%成交608亿 微软同步预热神秘新品 联手推Arm架构PC芯片N1挑战x86格局
英伟达涨0.78%成交302亿!黄仁勋时隔7个月访韩 深化HBM与三星SK海力士合作
英伟达连续4天下跌1.05% 毛利率修复见顶+客户集中+高利率三重压力
英伟达股价微跌0.22% 连续三日回调 驱动程序升级至610.47分支
英伟达CEO黄仁勋:明年将继续快速增长 呼吁内存供应商提升产能 Vera CPU前景乐观
英伟达收跌1.90%却获Cestrian上调评级 财报超预期 华尔街平均目标价303美元
英伟达NVDA收跌1.77%成交446.58亿 财报超预期 AI算力上行周期远未结束
英伟达Q1营收816亿美元大超预期!800亿美元回购+分红大增仍遭卖出,Q2指引910亿不及最高预期
英伟达Q1营收暴增85%夜盘仍跌1%!Applied Digital签超大规模云租约大涨7%,Rocket Lab与财捷双双重挫
英伟达2027财年Q1营收816亿美元超预期 数据中心752亿暴增 AI需求持续强劲
英伟达盘后发布2027财年Q1财报 期权预期波动6.5%市值或变3500亿美元 Vera CPU交付OpenAI
英伟达Vera CPU交付Anthropic OpenAI SpaceX 甲骨文2026年部署数十万颗 Agent AI新硬件战线开启
英伟达NVDA收跌1.33%成交323亿 摩根士丹利预测Q1营收超预期30亿 周三财报即将揭晓
美股夜盘半导体光通信加密概念集体重挫 POET暴跌22% 英伟达英特尔领跌





