OpenAI首发Cerebras芯片模型 Codex-Spark速度提升15倍 标志减少对英伟达依赖关键一步

导读目录
发布概况
根据黄金形态通APP报道,OpenAI本周四正式推出首个运行在Cerebras Systems晶圆级引擎芯片上的AI模型——GPT-5.3-Codex-Spark(简称Codex-Spark)。该模型专为实时编码场景优化,是OpenAI最新代码自动化工具Codex的精简高速版本,旨在大幅提升响应速度。该发布标志着OpenAI在芯片供应商多元化战略上迈出实质性一步,同时也是2026年1月与Cerebras签署超100亿美元协议后的首项公开成果。目前该模型已向ChatGPT Pro订阅用户开放研究预览版,并通过Codex应用、命令行界面及Visual Studio Code扩展提供服务。OpenAI透露,Codex整体周活跃用户已突破100万,过去十天应用下载量超过100万次。
模型核心技术特征
Codex-Spark针对实时编码协作场景深度优化,OpenAI宣称生成速度较前代产品提升15倍,每秒可输出超过1000个token,带来“近乎即时”的交互体验。模型配备128000 token上下文窗口,但仅支持纯文本输入,不具备图像或多模态能力。Cerebras第三代晶圆级引擎(单芯片含4万亿晶体管)消除了传统GPU集群的通信瓶颈,使推理阶段延迟显著降低。OpenAI同时优化整个推理堆栈,包括持久WebSocket连接与Responses API改进,实现客户端-服务器往返开销减少80%,每token开销降低30%,首token时间缩短50%。Cerebras首席技术官Sean Lie表示,此次合作将探索快速推理带来的全新交互模式与用例,“这次预览仅仅是开始”。
与英伟达合作现状分析
OpenAI与英伟达的关系正处于微妙阶段。2025年9月双方宣布战略合作意向,英伟达承诺最高投资1000亿美元,OpenAI计划利用数百万块英伟达GPU建设至少10吉瓦AI数据中心。然而五个月后,多方报道称该巨额交易实质性停滞。英伟达CEO黄仁勋1月下旬公开否认“存在戏剧性”,但双方关系明显降温。OpenAI同期加速多元化布局:与Cerebras签署超百亿美元协议、与AMD达成多年6吉瓦GPU部署合作、与博通签订定制芯片及网络组件采购协议。OpenAI发言人强调,英伟达仍是训练与核心推理堆栈首选,但公司将继续评估所有场景下最具性价比的芯片方案,体现出谨慎平衡供应商依赖与成本控制的策略。
性能与速度权衡对比
| 维度 | Codex-Spark | 完整版GPT-5.3-Codex | 主要差异 |
|---|---|---|---|
| 生成速度 | 提升15倍,每秒>1000 token | 基准速度 | 显著提速,交互更流畅 |
| SWE-Bench Pro表现 | 低于完整版 | 更高 | 复杂工程任务能力妥协 |
| Terminal-Bench 2.0 | 低于完整版 | 更高 | 自主多步骤编程能力减弱 |
| 上下文窗口 | 128000 token | 相同或更大 | 持平 |
| 输入支持 | 仅文本 | 可能多模态 | 功能受限 |
| 定位 | 实时编码协作 | 全面高性能编码 | 速度优先 vs 能力优先 |
上表显示,Codex-Spark以速度换取部分性能的策略清晰可见,OpenAI认为这是开发者保持创作流畅性的可接受权衡。
行业竞争与战略意义
Codex-Spark发布正值AI编码助手市场竞争白热化。谷歌、Anthropic、微软、亚马逊均在AI编程工具上持续加码,Anthropic的Claude Cowork产品近期甚至引发传统软件股波动。OpenAI内部也面临多重挑战:安全对齐团队接连解散、研究员因广告引入等争议离职、与五角大楼合作引发伦理讨论。尽管如此,Codex应用展现强劲采用势头,周活跃用户周环比增长60%,超过32.5万开发者活跃使用。未来OpenAI计划融合快速交互与长期自主任务,构建支持多代理协调的完整编码生态。Cerebras合作不仅是技术尝试,更体现OpenAI在推理成本、延迟优化与供应商多元化上的战略前瞻。
编辑总结
OpenAI通过Codex-Spark在Cerebras硬件上的首秀,展现出对推理速度与用户体验的极致追求,同时明确推进芯片供应链多元化以降低对英伟达单一依赖的风险。尽管速度提升伴随性能妥协,该模型仍为实时编码场景带来显著价值。英伟达合作虽遇瓶颈,但双方在训练前沿模型上的互补关系短期难替代。叠加内部治理争议与外部激烈竞争,OpenAI需要在商业扩张与技术创新间找到平衡。Codex-Spark的成功落地,将直接检验专用推理硬件能否重塑开发者与AI的交互范式,并为行业提供供应商多元化可行路径的实证参考。
常见问题解答
问1:Codex-Spark为什么速度能提升15倍,主要靠什么实现?
答:核心在于Cerebras晶圆级引擎单芯片架构,消除了传统GPU集群的跨芯片通信开销,使推理延迟大幅降低。同时OpenAI优化了整个推理堆栈,包括持久连接与API改进,综合实现每秒超1000 token输出,带来近乎即时的编码交互体验。问2:Codex-Spark性能下降是否意味着它不如前代模型实用?
答:并非完全如此。OpenAI将其定位为实时协作工具,在SWE-Bench Pro和Terminal-Bench 2.0等复杂任务基准上确实逊色,但牺牲部分深度能力换取极致速度,适合保持开发者创作流畅性的日常编码场景。公司认为这是合理权衡,未来版本有望逐步融合高性能与高速特性。问3:OpenAI与英伟达的千亿美元合作为什么停滞?
答:2025年9月宣布的战略合作涉及巨额投资与大规模GPU部署,但五个月后报道称实质停滞。原因包括OpenAI加速与AMD、博通、Cerebras等替代供应商合作,意在降低单一依赖;同时可能涉及投资条款、控制权或战略分歧。英伟达仍强调关系稳定,但双方公开表态均趋谨慎。问4:Cerebras芯片与英伟达GPU在AI应用中定位有何不同?
答:英伟达GPU在训练大规模模型的大并行计算中仍具绝对优势,适合分布式高吞吐场景。Cerebras晶圆级引擎则专攻推理阶段,单芯片设计大幅减少通信延迟,更适合对响应速度敏感的消费者级实时应用,如编码助手。OpenAI当前策略是将英伟达用于训练核心,将Cerebras等用于特定推理优化。问5:Codex-Spark发布对AI编码助手市场意味着什么?
答:标志OpenAI在速度与体验层面发起新一轮攻势,意在巩固市场领先地位。面对Anthropic、谷歌、微软等强劲对手,快速响应已成为用户黏性关键因素。同时,该发布验证了专用推理硬件的可行性,或加速行业向低延迟、专用芯片迁移的趋势,对整个AI工具生态的交互范式产生深远影响。
软银再发2600亿日元次级债融资AI投资 孙正义重仓AI面临高额资金压力
软银集团股价创历史新高 市值突破40万亿日元 OpenAI IPO临近引爆AI投资热情
OpenAI与马耳他达成全球首创合作 向所有公民免费提供一年ChatGPT Plus服务
OpenAI CEO奥尔特曼利益冲突遭美国国会调查 IPO前审查加剧 共和党人呼吁SEC介入
OpenAI与微软达成380亿美元营收分成上限 为IPO铺路并开放亚马逊谷歌新合作
软银携手英伟达富士康打造日本国产AI服务器 本土主权AI算力布局加速
OpenAI推出GPT-5.5-Cyber网络安全专版 有限预览助力漏洞识别与恶意软件分析
OpenAI牵头AMD英伟达Intel微软博通巨头联手发布MRC协议 解决AI大规模训练网络瓶颈
OpenAI Anthropic同日联手华尔街成立企业AI合资公司 OpenAI募40亿美金 Anthropic投15亿加速落地
OpenAI CFO Sarah Friar回应未达目标质疑:需求呈现“一堵垂直的需求墙” 公司正超额完成整体计划
OpenAI Codex重大更新上线Mac电脑自主控制功能 迈向超级AI应用第一步 开发者工具向通用智能体演进
OpenAI推出GPT-5.4-Cyber网络安全专用模型 与Anthropic Mythos展开竞速 贝森特与鲍威尔警告华尔街高管关注AI网络攻击风险
OpenAI推出100美元/月ChatGPT Pro订阅计划 细分定价直指Anthropic Claude 填补20至200美元定价断层
OpenAI二级市场遇冷:6亿美元股份无人接盘 投资者转投Anthropic 估值差距引发资金大挪移
OpenAI完成1220亿美元巨额融资 估值达8520亿美元 亚马逊投资500亿英伟达软银各投300亿 为AI芯片数据中心提供强大资金支持
OpenAI广告试点年化收入突破1亿美元 仅用六周时间 广告客户超600家 四月即将推出自助接入服务
OpenAI宣布关闭视频平台Sora 聚焦生产力工具与编程功能 IPO前战略调整 Sam Altman将Sora团队转向机器人技术
OpenAI将广告推向所有ChatGPT免费用户 RBC称存在显著压抑广告需求 强势催化GEO生成式引擎优化新赛道
奥尔特曼辞去Helion董事长职务 OpenAI与聚变能源公司探讨5吉瓦至50吉瓦大规模电力合作 避开利益冲突加速AI能源布局
OpenAI加速布局美国政府市场 与AWS签署协议向政府雇员提供AI服务 覆盖涉密与非涉密业务 意图复制Palantir路径并筹备年底上市





