OpenAI首发Cerebras芯片模型 Codex-Spark速度提升15倍标志减少对英伟达依赖关键一步

美股要聞5个月前 (02-13)122

导读目录发布概况模型核心技术特征与英伟达合作现状分析性能与速度权衡对比行业竞争与战略意义编辑总结发布概况根据黄金形态通APP报道，OpenAI本周四正式推出首个运行在Cerebras Systems晶圆级引擎芯片上的AI模型——GPT-5.3-Codex-Spark（简称Codex-Spark）。该模型专为实时编码场景优化，是OpenAI最新代码自动化工具C...

导读目录

发布概况
模型核心技术特征
与英伟达合作现状分析
性能与速度权衡对比
行业竞争与战略意义
编辑总结

发布概况

根据黄金形态通APP报道，OpenAI本周四正式推出首个运行在Cerebras Systems晶圆级引擎芯片上的AI模型——GPT-5.3-Codex-Spark（简称Codex-Spark）。该模型专为实时编码场景优化，是OpenAI最新代码自动化工具Codex的精简高速版本，旨在大幅提升响应速度。该发布标志着OpenAI在芯片供应商多元化战略上迈出实质性一步，同时也是2026年1月与Cerebras签署超100亿美元协议后的首项公开成果。目前该模型已向ChatGPT Pro订阅用户开放研究预览版，并通过Codex应用、命令行界面及Visual Studio Code扩展提供服务。OpenAI透露，Codex整体周活跃用户已突破100万，过去十天应用下载量超过100万次。

模型核心技术特征

Codex-Spark针对实时编码协作场景深度优化，OpenAI宣称生成速度较前代产品提升15倍，每秒可输出超过1000个token，带来“近乎即时”的交互体验。模型配备128000 token上下文窗口，但仅支持纯文本输入，不具备图像或多模态能力。Cerebras第三代晶圆级引擎（单芯片含4万亿晶体管）消除了传统GPU集群的通信瓶颈，使推理阶段延迟显著降低。OpenAI同时优化整个推理堆栈，包括持久WebSocket连接与Responses API改进，实现客户端-服务器往返开销减少80%，每token开销降低30%，首token时间缩短50%。Cerebras首席技术官Sean Lie表示，此次合作将探索快速推理带来的全新交互模式与用例，“这次预览仅仅是开始”。

与英伟达合作现状分析

OpenAI与英伟达的关系正处于微妙阶段。2025年9月双方宣布战略合作意向，英伟达承诺最高投资1000亿美元，OpenAI计划利用数百万块英伟达GPU建设至少10吉瓦AI数据中心。然而五个月后，多方报道称该巨额交易实质性停滞。英伟达CEO黄仁勋1月下旬公开否认“存在戏剧性”，但双方关系明显降温。OpenAI同期加速多元化布局：与Cerebras签署超百亿美元协议、与AMD达成多年6吉瓦GPU部署合作、与博通签订定制芯片及网络组件采购协议。OpenAI发言人强调，英伟达仍是训练与核心推理堆栈首选，但公司将继续评估所有场景下最具性价比的芯片方案，体现出谨慎平衡供应商依赖与成本控制的策略。

性能与速度权衡对比

维度	Codex-Spark	完整版GPT-5.3-Codex	主要差异
生成速度	提升15倍，每秒>1000 token	基准速度	显著提速，交互更流畅
SWE-Bench Pro表现	低于完整版	更高	复杂工程任务能力妥协
Terminal-Bench 2.0	低于完整版	更高	自主多步骤编程能力减弱
上下文窗口	128000 token	相同或更大	持平
输入支持	仅文本	可能多模态	功能受限
定位	实时编码协作	全面高性能编码	速度优先 vs 能力优先

上表显示，Codex-Spark以速度换取部分性能的策略清晰可见，OpenAI认为这是开发者保持创作流畅性的可接受权衡。

行业竞争与战略意义

Codex-Spark发布正值AI编码助手市场竞争白热化。谷歌、Anthropic、微软、亚马逊均在AI编程工具上持续加码，Anthropic的Claude Cowork产品近期甚至引发传统软件股波动。OpenAI内部也面临多重挑战：安全对齐团队接连解散、研究员因广告引入等争议离职、与五角大楼合作引发伦理讨论。尽管如此，Codex应用展现强劲采用势头，周活跃用户周环比增长60%，超过32.5万开发者活跃使用。未来OpenAI计划融合快速交互与长期自主任务，构建支持多代理协调的完整编码生态。Cerebras合作不仅是技术尝试，更体现OpenAI在推理成本、延迟优化与供应商多元化上的战略前瞻。

编辑总结

OpenAI通过Codex-Spark在Cerebras硬件上的首秀，展现出对推理速度与用户体验的极致追求，同时明确推进芯片供应链多元化以降低对英伟达单一依赖的风险。尽管速度提升伴随性能妥协，该模型仍为实时编码场景带来显著价值。英伟达合作虽遇瓶颈，但双方在训练前沿模型上的互补关系短期难替代。叠加内部治理争议与外部激烈竞争，OpenAI需要在商业扩张与技术创新间找到平衡。Codex-Spark的成功落地，将直接检验专用推理硬件能否重塑开发者与AI的交互范式，并为行业提供供应商多元化可行路径的实证参考。

常见问题解答

问1：Codex-Spark为什么速度能提升15倍，主要靠什么实现？
答：核心在于Cerebras晶圆级引擎单芯片架构，消除了传统GPU集群的跨芯片通信开销，使推理延迟大幅降低。同时OpenAI优化了整个推理堆栈，包括持久连接与API改进，综合实现每秒超1000 token输出，带来近乎即时的编码交互体验。
问2：Codex-Spark性能下降是否意味着它不如前代模型实用？
答：并非完全如此。OpenAI将其定位为实时协作工具，在SWE-Bench Pro和Terminal-Bench 2.0等复杂任务基准上确实逊色，但牺牲部分深度能力换取极致速度，适合保持开发者创作流畅性的日常编码场景。公司认为这是合理权衡，未来版本有望逐步融合高性能与高速特性。
问3：OpenAI与英伟达的千亿美元合作为什么停滞？
答：2025年9月宣布的战略合作涉及巨额投资与大规模GPU部署，但五个月后报道称实质停滞。原因包括OpenAI加速与AMD、博通、Cerebras等替代供应商合作，意在降低单一依赖；同时可能涉及投资条款、控制权或战略分歧。英伟达仍强调关系稳定，但双方公开表态均趋谨慎。
问4：Cerebras芯片与英伟达GPU在AI应用中定位有何不同？
答：英伟达GPU在训练大规模模型的大并行计算中仍具绝对优势，适合分布式高吞吐场景。Cerebras晶圆级引擎则专攻推理阶段，单芯片设计大幅减少通信延迟，更适合对响应速度敏感的消费者级实时应用，如编码助手。OpenAI当前策略是将英伟达用于训练核心，将Cerebras等用于特定推理优化。
问5：Codex-Spark发布对AI编码助手市场意味着什么？
答：标志OpenAI在速度与体验层面发起新一轮攻势，意在巩固市场领先地位。面对Anthropic、谷歌、微软等强劲对手，快速响应已成为用户黏性关键因素。同时，该发布验证了专用推理硬件的可行性，或加速行业向低延迟、专用芯片迁移的趋势，对整个AI工具生态的交互范式产生深远影响。

标签OpenAI

上一篇：Roku第四季度财报超预期全年营收指引55亿美元高于市场预期盘后股价暴涨超11%

下一篇：爱彼迎第四季度营收27.8亿美元超预期 2026年增速提速至低双位数盘后股价涨近7%

您暂未设置收款码

请在主题配置——文章设置里上传

扫描二维码手机访问

OpenAI首发Cerebras芯片模型 Codex-Spark速度提升15倍标志减少对英伟达依赖关键一步

导读目录

发布概况

模型核心技术特征

与英伟达合作现状分析

性能与速度权衡对比

行业竞争与战略意义

编辑总结

常见问题解答

OpenAI拟推首款无屏AI智能音箱最快今年发布挑战苹果舒适区双方竞争白热化

OpenAI Meta SpaceXAI竞推低成本高效AI模型企业支出审查推动行业定价重塑

OpenAI推出ChatGPT Work智能体连续数小时处理复杂任务 GPT-5.6驱动商务场景落地加速

OpenAI正式推出GPT-5.6系列模型 Sol/Terra/Luna面向公众开放多规格定价加速商业化

OpenAI与甲骨文达成战略合作前沿模型和Codex入驻Oracle云助力AI云生态加速

软银再发2600亿日元次级债融资AI投资孙正义重仓AI面临高额资金压力

软银集团股价创历史新高市值突破40万亿日元 OpenAI IPO临近引爆AI投资热情

OpenAI与马耳他达成全球首创合作向所有公民免费提供一年ChatGPT Plus服务

OpenAI CEO奥尔特曼利益冲突遭美国国会调查 IPO前审查加剧共和党人呼吁SEC介入

OpenAI与微软达成380亿美元营收分成上限为IPO铺路并开放亚马逊谷歌新合作

软银携手英伟达富士康打造日本国产AI服务器本土主权AI算力布局加速

OpenAI推出GPT-5.5-Cyber网络安全专版有限预览助力漏洞识别与恶意软件分析

OpenAI牵头AMD英伟达Intel微软博通巨头联手发布MRC协议解决AI大规模训练网络瓶颈

OpenAI Anthropic同日联手华尔街成立企业AI合资公司 OpenAI募40亿美金 Anthropic投15亿加速落地

OpenAI CFO Sarah Friar回应未达目标质疑：需求呈现“一堵垂直的需求墙” 公司正超额完成整体计划

OpenAI Codex重大更新上线Mac电脑自主控制功能迈向超级AI应用第一步开发者工具向通用智能体演进

OpenAI推出GPT-5.4-Cyber网络安全专用模型与Anthropic Mythos展开竞速贝森特与鲍威尔警告华尔街高管关注AI网络攻击风险

OpenAI推出100美元/月ChatGPT Pro订阅计划细分定价直指Anthropic Claude 填补20至200美元定价断层

OpenAI二级市场遇冷：6亿美元股份无人接盘投资者转投Anthropic 估值差距引发资金大挪移

OpenAI完成1220亿美元巨额融资估值达8520亿美元亚马逊投资500亿英伟达软银各投300亿为AI芯片数据中心提供强大资金支持

贊助

最近發表

熱門文章

港股7月8日强势拉升：恒生指数涨2.99%、恒生科技指数大涨4.97%，南向资金净流入142亿，AI与科网股领涨市场

熱評文章

標簽列表

您暂未设置收款码

OpenAI首发Cerebras芯片模型 Codex-Spark速度提升15倍 标志减少对英伟达依赖关键一步

导读目录

发布概况

模型核心技术特征

与英伟达合作现状分析

性能与速度权衡对比

行业竞争与战略意义

编辑总结

常见问题解答

贊助

最近發表

熱門文章

港股7月8日强势拉升：恒生指数涨2.99%、恒生科技指数大涨4.97%，南向资金净流入142亿，AI与科网股领涨市场

熱評文章

標簽列表

您暂未设置收款码

OpenAI首发Cerebras芯片模型 Codex-Spark速度提升15倍标志减少对英伟达依赖关键一步