谷歌DeepMind CTO罕见坦白：我们曾大幅落后！Gemini 3两年逆袭内幕全揭秘

美股要聞8个月前 (11-28)131

导读目录承认落后才是重新起跑第一步多模态不是功能，而是底层架构组织重构：从串行到全并行系统可用性跃迁才是真正质变基础设施重新激活成最大底气下一战：从语言智能到行动智能编辑总结承认落后才是重新起跑第一步根据 www.Todayusstock.com 报道，在最新近一小时深度专访中，谷歌首席AI架构师、DeepMind CTO Koray Kavukcuoglu...

导读目录

承认落后才是重新起跑第一步
多模态不是功能，而是底层架构
组织重构：从串行到全并行系统
可用性跃迁才是真正质变
基础设施重新激活成最大底气
下一战：从语言智能到行动智能
编辑总结

承认落后才是重新起跑第一步

根据 www.Todayusstock.com 报道，在最新近一小时深度专访中，谷歌首席AI架构师、DeepMind CTO Koray Kavukcuoglu罕见公开承认：“在很长一段时间里，这都是一场追赶。”他直言，ChatGPT爆发时，谷歌确实被甩在后面，但正是彻底承认落后，才让Gemini项目真正起跑。

Koray强调：“当我们启动Gemini时，我们知道自己落后。你必须足够诚实面对现实，然后才可能创新。”这种高层罕见的坦诚，直接推动了谷歌内部共识：仅靠传统研究节奏已无法跟上时代，必须全面转向产品驱动。

多模态不是功能，而是底层架构

Koray反复强调：多模态不是锦上添花，而是构建通用智能的必然。世界本身就是多维的，单一文本模型永远无法真正理解现实。

谷歌从Gemini 1.0起就选择最难路线——从架构层面统一文本、图像、音频、视频，在同一个模型内共同训练，重写token化、损失函数、优化器与推理路径。这直接带来Gemini 3在文档理解、图表解析、视频分析等跨模态任务上的系统性领先。

组织重构：从串行到全并行系统

Gemini最大逆袭不是技术，而是组织方式彻底重写。过去谷歌像传统流水线：研究→工程→产品→安全，链路割裂、迭代极慢。

现在已全面转向“并行系统”：

旧模式	新模式（Gemini 3起）
研究团队先训练	产品经理Day 1参与任务设计
工程最后优化部署	工程同步优化推理成本
安全上线前补丁	安全策略嵌入预训练
用户数据层层上报	真实用户信号直连训练

这种变革让20万员工的谷歌第一次实现“同日上车”：Gemini 3发布当天同步落地搜索、YouTube、地图、Android全产品矩阵。

可用性跃迁才是真正质变

用户感知到的Gemini体验质变，Koray认为核心不是“更聪明”，而是可用性成为首要目标：

指令理解大幅提升
国际化与多文化语料系统性纳入
工具调用与代码执行能力跃升（Agent基础）

这些系统工程成熟后，带来的不是单点Demo，而是整体“像产品一样好用”。

基础设施重新激活成最大底气

Koray最强调的竞争壁垒不是模型参数，而是基础设施：自研TPU、全球数据中心、跨产品分发能力、成熟安全体系、Search+Android的亿级调用入口。

一旦与统一多模态模型结合，就形成难以复制的网络效应。这也是谷歌能在两年内从落后者重回行业中心的核心原因。

下一战：从语言智能到行动智能

Koray对未来判断毫不含糊：下一阶段竞争不是谁更会聊天，而是谁能完成真实多步骤任务。

战场将集中在：

工作流自动化
开发者工具链
企业级Agent
系统级AI（Android、Chrome、Workspace）

AI正从“对话模型”转向“任务操作系统”，Gemini的目标正是成为这一代操作系统的底层能力。

编辑总结

谷歌用两年时间完成了一场教科书式的系统反转：从公开承认落后，到多模态底层重构、组织并行化、可用性优先、基础设施全面激活，最终以Gemini 3实现行业级领先。这不是某个天才灵感，而是20万人组织重新找回节奏的必然结果。下一阶段，行动智能与任务操作系统将成为决胜点，谷歌凭借全栈基础设施与产品矩阵，已悄然占据最有利位置。资本市场需重新认知：对话模型只是产品，行动模型才是平台。

常见问题解答

Q1：谷歌真的曾经大幅落后吗？
是的。Koray亲口承认，ChatGPT爆发时谷歌在产品化速度、用户体验、迭代节奏上全面落后，甚至内部都认为“被甩在后面”。但正是这种危机感促成了Gemini项目的诞生。

Q2：Gemini 3为何能在发布当天同步上车所有产品？
因为组织已彻底并行：产品经理从训练第一天参与，工程实时优化部署，安全嵌入预训练，用户数据直连训练管线。这种“全栈协同”在大厂中绝无仅有。

Q3：多模态为什么这么重要？
因为现实世界不是纯文本的。图像有空间结构、音频有时间线索、视频是多维融合。只有统一多模态训练的模型，才能真正理解世界，而非停留在语言层面。

Q4：谷歌最大的护城河是什么？
基础设施+分发能力。TPU、全球数据中心、Search+Android的亿级入口、成熟安全体系，一旦与领先模型结合，就形成难以复制的网络效应。

Q5：Gemini下一步要打什么仗？
行动智能。Koray明确：未来不是比谁更会聊天，而是谁能真正完成复杂多步骤任务。Agent、工作流自动化、系统级AI将成为下一阶段主战场。

标签谷歌 Gemini 3

上一篇：苹果起诉印度反垄断局！380亿美元全球罚款风险曝光，12月3日开庭或重塑供应链

下一篇：OpenAI合作伙伴债务狂飙近1000亿美元甲骨文Vantage再获380亿贷款风险巧妙转移自身负债近零

您暂未设置收款码

请在主题配置——文章设置里上传

扫描二维码手机访问

谷歌DeepMind CTO罕见坦白：我们曾大幅落后！Gemini 3两年逆袭内幕全揭秘

导读目录

承认落后才是重新起跑第一步

多模态不是功能，而是底层架构

组织重构：从串行到全并行系统

可用性跃迁才是真正质变

基础设施重新激活成最大底气

下一战：从语言智能到行动智能

编辑总结

常见问题解答

谷歌-A(GOOGL.US)收高1.51%成交87亿美元谷歌开发Frozen v2服务器芯片 Gemini架构固化硅片推理效率或提升6-10倍

谷歌收跌4.44%成交147.28亿美元 Gemini 3.5 Pro旗舰模型延期发布 AI竞争力担忧加剧

谷歌股价涨3.17% 欧盟反垄断上诉推进 Gemini深度集成本田多款车型

谷歌-A收涨4.82%成交117亿美元取代Verizon加入道琼斯指数

谷歌小幅下跌0.46% 成交146亿美元推出安卓谷歌财经App并重组AI攻坚团队

谷歌GOOGL跌0.24%成交155.16亿美元两名AI核心研究干将转投Anthropic Gemini 3.5 Pro发布推迟

谷歌GOOGL重挫4.99%成交181亿美元 DeepMind诺贝尔奖得主John Jumper跳槽Anthropic AI人才战升级

谷歌-A涨1.17%成交162亿六年首发新智能音箱Google Home Speaker预售99.99美元 Gemini支持自然语言交互

谷歌GOOGL收跌2.53%成交88.18亿美元 Magnificent 7集体回调搜索广告巨头承压调整

谷歌涨超1%成交92亿 Android 17正式发布 AI智能代理功能分阶段落地

谷歌GOOGL收跌2.16% 成交115亿 DiffusionGemma开源模型四倍提速消费级显卡即可运行

谷歌收高0.26%成交105亿为Anthropic数据中心提供350亿美元融资担保深化AI基础设施布局

谷歌-A股价收跌1.36%成交100.67亿美元：AI概念分化下表现相对疲软

谷歌与SpaceX签署重磅协议每月9.2亿美元采购算力 11万英伟达GPU至2029年

欧洲议会正式弃用谷歌转向法国Qwant搜索引擎推进数字主权

谷歌-A收跌0.98%成交134亿 SpaceX签署92亿美元云服务大单谷歌获11万英伟达GPU算力

谷歌收涨3.68%成交158亿美元 Gemini月活跃用户突破9亿增长速度领跑AI应用领域

谷歌跌3.86% Alphabet启动800亿美元史上最大股权融资伯克希尔斥资100亿加码AI

谷歌搜索25年来最大升级 AI模式+Gemini Spark代理助手全面嵌入搜索框彻底变革

谷歌AI模型大幅降价迎战OpenAI与Anthropic Gemini Ultra订阅从250美元降至200美元

贊助

最近發表

熱門文章

港股7月8日强势拉升：恒生指数涨2.99%、恒生科技指数大涨4.97%，南向资金净流入142亿，AI与科网股领涨市场

熱評文章

標簽列表

您暂未设置收款码