黄金形态通APP下载

OpenAI首发Cerebras芯片模型 Codex-Spark速度提升15倍 标志减少对英伟达依赖关键一步

美股要聞4个月前 (02-13)111
导读目录发布概况模型核心技术特征与英伟达合作现状分析性能与速度权衡对比行业竞争与战略意义编辑总结发布概况根据黄金形态通APP报道,OpenAI本周四正式推出首个运行在Cerebras Systems晶圆级引擎芯片上的AI模型——GPT-5.3-Codex-Spark(简称Codex-Spark)。该模型专为实时编码场景优化,是OpenAI最新代码自动化工具C...

OpenAI首发Cerebras芯片模型 Codex-Spark速度提升15倍 标志减少对英伟达依赖关键一步

导读目录

发布概况

根据黄金形态通APP报道,OpenAI本周四正式推出首个运行在Cerebras Systems晶圆级引擎芯片上的AI模型——GPT-5.3-Codex-Spark(简称Codex-Spark)。该模型专为实时编码场景优化,是OpenAI最新代码自动化工具Codex的精简高速版本,旨在大幅提升响应速度。该发布标志着OpenAI在芯片供应商多元化战略上迈出实质性一步,同时也是2026年1月与Cerebras签署超100亿美元协议后的首项公开成果。目前该模型已向ChatGPT Pro订阅用户开放研究预览版,并通过Codex应用、命令行界面及Visual Studio Code扩展提供服务。OpenAI透露,Codex整体周活跃用户已突破100万,过去十天应用下载量超过100万次。

模型核心技术特征

Codex-Spark针对实时编码协作场景深度优化,OpenAI宣称生成速度较前代产品提升15倍,每秒可输出超过1000个token,带来“近乎即时”的交互体验。模型配备128000 token上下文窗口,但仅支持纯文本输入,不具备图像或多模态能力。Cerebras第三代晶圆级引擎(单芯片含4万亿晶体管)消除了传统GPU集群的通信瓶颈,使推理阶段延迟显著降低。OpenAI同时优化整个推理堆栈,包括持久WebSocket连接与Responses API改进,实现客户端-服务器往返开销减少80%,每token开销降低30%,首token时间缩短50%。Cerebras首席技术官Sean Lie表示,此次合作将探索快速推理带来的全新交互模式与用例,“这次预览仅仅是开始”。

英伟达合作现状分析

OpenAI与英伟达的关系正处于微妙阶段。2025年9月双方宣布战略合作意向,英伟达承诺最高投资1000亿美元,OpenAI计划利用数百万块英伟达GPU建设至少10吉瓦AI数据中心。然而五个月后,多方报道称该巨额交易实质性停滞。英伟达CEO黄仁勋1月下旬公开否认“存在戏剧性”,但双方关系明显降温。OpenAI同期加速多元化布局:与Cerebras签署超百亿美元协议、与AMD达成多年6吉瓦GPU部署合作、与博通签订定制芯片及网络组件采购协议。OpenAI发言人强调,英伟达仍是训练与核心推理堆栈首选,但公司将继续评估所有场景下最具性价比的芯片方案,体现出谨慎平衡供应商依赖与成本控制的策略。

性能与速度权衡对比

维度Codex-Spark完整版GPT-5.3-Codex主要差异
生成速度提升15倍,每秒>1000 token基准速度显著提速,交互更流畅
SWE-Bench Pro表现低于完整版更高复杂工程任务能力妥协
Terminal-Bench 2.0低于完整版更高自主多步骤编程能力减弱
上下文窗口128000 token相同或更大持平
输入支持仅文本可能多模态功能受限
定位实时编码协作全面高性能编码速度优先 vs 能力优先

上表显示,Codex-Spark以速度换取部分性能的策略清晰可见,OpenAI认为这是开发者保持创作流畅性的可接受权衡。

行业竞争与战略意义

Codex-Spark发布正值AI编码助手市场竞争白热化。谷歌、Anthropic、微软亚马逊均在AI编程工具上持续加码,Anthropic的Claude Cowork产品近期甚至引发传统软件股波动。OpenAI内部也面临多重挑战:安全对齐团队接连解散、研究员因广告引入等争议离职、与五角大楼合作引发伦理讨论。尽管如此,Codex应用展现强劲采用势头,周活跃用户周环比增长60%,超过32.5万开发者活跃使用。未来OpenAI计划融合快速交互与长期自主任务,构建支持多代理协调的完整编码生态。Cerebras合作不仅是技术尝试,更体现OpenAI在推理成本、延迟优化与供应商多元化上的战略前瞻。

编辑总结

OpenAI通过Codex-Spark在Cerebras硬件上的首秀,展现出对推理速度与用户体验的极致追求,同时明确推进芯片供应链多元化以降低对英伟达单一依赖的风险。尽管速度提升伴随性能妥协,该模型仍为实时编码场景带来显著价值。英伟达合作虽遇瓶颈,但双方在训练前沿模型上的互补关系短期难替代。叠加内部治理争议与外部激烈竞争,OpenAI需要在商业扩张与技术创新间找到平衡。Codex-Spark的成功落地,将直接检验专用推理硬件能否重塑开发者与AI的交互范式,并为行业提供供应商多元化可行路径的实证参考。

常见问题解答

问1:Codex-Spark为什么速度能提升15倍,主要靠什么实现?
答:核心在于Cerebras晶圆级引擎单芯片架构,消除了传统GPU集群的跨芯片通信开销,使推理延迟大幅降低。同时OpenAI优化了整个推理堆栈,包括持久连接与API改进,综合实现每秒超1000 token输出,带来近乎即时的编码交互体验。

问2:Codex-Spark性能下降是否意味着它不如前代模型实用?
答:并非完全如此。OpenAI将其定位为实时协作工具,在SWE-Bench Pro和Terminal-Bench 2.0等复杂任务基准上确实逊色,但牺牲部分深度能力换取极致速度,适合保持开发者创作流畅性的日常编码场景。公司认为这是合理权衡,未来版本有望逐步融合高性能与高速特性。

问3:OpenAI与英伟达的千亿美元合作为什么停滞?
答:2025年9月宣布的战略合作涉及巨额投资与大规模GPU部署,但五个月后报道称实质停滞。原因包括OpenAI加速与AMD、博通、Cerebras等替代供应商合作,意在降低单一依赖;同时可能涉及投资条款、控制权或战略分歧。英伟达仍强调关系稳定,但双方公开表态均趋谨慎。

问4:Cerebras芯片与英伟达GPU在AI应用中定位有何不同?
答:英伟达GPU在训练大规模模型的大并行计算中仍具绝对优势,适合分布式高吞吐场景。Cerebras晶圆级引擎则专攻推理阶段,单芯片设计大幅减少通信延迟,更适合对响应速度敏感的消费者级实时应用,如编码助手。OpenAI当前策略是将英伟达用于训练核心,将Cerebras等用于特定推理优化。

问5:Codex-Spark发布对AI编码助手市场意味着什么?
答:标志OpenAI在速度与体验层面发起新一轮攻势,意在巩固市场领先地位。面对Anthropic、谷歌、微软等强劲对手,快速响应已成为用户黏性关键因素。同时,该发布验证了专用推理硬件的可行性,或加速行业向低延迟、专用芯片迁移的趋势,对整个AI工具生态的交互范式产生深远影响。

标签OpenAI
相关文章

您暂未设置收款码

请在主题配置——文章设置里上传

扫描二维码手机访问