谷歌发布Gemini 3 AI模型:多模态与智能体能力实现突破

导读目录
事件概述
美东时间2025年11月18日,谷歌正式发布迄今最强大的人工智能模型 Gemini 3,并在发布当天将其整合至谷歌搜索、Gemini应用程序App及多个开发者平台中,实现产品级应用。谷歌CEO Sundar Pichai称该模型为“最智能的模型”,DeepMind CEO Demis Hassabis表示其是“世界上最好的多模态理解模型”。
模型性能与测试成绩
Gemini 3在全球AI模型排行榜 LMArena上以 1501分登顶,并在Humanity's Last Exam、GPQA Diamond、MathArena APEX及SimpleQA Verified等多项基准测试中刷新纪录:
| 测试 | Gemini 3成绩 | 备注 |
|---|---|---|
| LMArena | 1501分 | 历史最高分 |
| Humanity's Last Exam | 37.5% | 超越GPT-5 Pro的31.64% |
| GPQA Diamond | 91.9% | 学术级基准测试 |
| MathArena APEX | 23.4% | 数学能力新纪录 |
| SimpleQA Verified | 72.1% | 事实准确性测试 |
| MMMU-Pro | 81% | 多模态推理 |
| Video-MMMU | 87.6% | 视频多模态理解 |
此外,Gemini 3推出 Deep Think增强推理模式,在Humanity's Last Exam中达到41.0%,GPQA Diamond 93.8%,ARC-AGI-2 45.1%,进一步提升复杂推理能力。
开发者工具与平台升级
在代码生成领域,Gemini 3登顶WebDev Arena排行榜并刷新SWE-bench Verified成绩。谷歌推出 Google Antigravity开发平台,使智能体可跨编辑器、终端和浏览器执行任务。开发者可通过 Google AI Studio、Vertex AI、Gemini CLI以及第三方平台(GitHub、JetBrains、Replit等)访问Gemini 3。
核心产品整合与商业化
Gemini 3首日发布即整合至搜索、Gemini App、Google AI Pro/Ultra、Vertex AI及Gemini Enterprise中。搜索产品引入AI Mode,实现沉浸式视觉布局和交互式生成内容。谷歌计划逐步扩大Gemini智能体功能在更多产品中的应用。
多模态与智能体能力对比
Gemini 3具备处理文本、图像、视频、音频和代码的跨模态能力,并拥有100万token上下文窗口。在长期规划和多步骤任务执行上表现优异,智能体可自主使用工具完成复杂工作流程。
| 能力 | Gemini 3表现 | 前代Gemini 2.5对比 |
|---|---|---|
| 多模态理解 | 高精度处理文本、图像、视频、音频、代码 | 提升明显 |
| 智能体工具使用 | 自主规划执行端到端任务 | 增强操作范围和决策稳定性 |
| 代码生成 | WebDev Arena 1487分,SWE-bench 76.2% | 远超Gemini 2.5 Pro |
| 推理能力 | Humanity's Last Exam 37.5%,Deep Think 41% | 显著提升 |
编辑总结
Gemini 3的发布标志着谷歌在AI领域的前沿突破,尤其在多模态理解、智能体编码及推理能力上取得历史性进展。通过即时整合到搜索、开发者工具和企业产品,谷歌加速了AI商业化布局,同时进一步强化了模型安全性和智能体自主能力。Gemini 3不仅为开发者提供更高效工具,也为普通用户带来全新AI体验,显示谷歌AI战略正在进入Gemini时代。
常见问题解答
问1:Gemini 3有哪些亮点?
答:Gemini 3在多模态理解、智能体编码、推理能力和事实准确性等方面均刷新行业标准,并推出增强推理模式Deep Think。
问2:开发者如何访问Gemini 3?
答:可通过Google AI Studio、Vertex AI、Gemini CLI、Google Antigravity及第三方平台(GitHub、JetBrains、Replit等)访问。
问3:Gemini 3在推理能力上有何突破?
答:在Humanity's Last Exam、GPQA Diamond、ARC-AGI-2等多项基准测试中刷新记录,Deep Think模式进一步提升复杂任务推理能力。
问4:Gemini 3与前代模型相比有哪些改进?
答:在多模态处理、代码生成、智能体任务执行和推理能力上均有显著提升,Deep Think模式在复杂问题解决上表现更优。
问5:谷歌如何保障Gemini 3安全性?
答:经过最全面的内部安全评估,与顶级领域专家合作测试,提升对提示注入、网络攻击及滥用的防护能力。
谷歌与SpaceX签署重磅协议 每月9.2亿美元采购算力 11万英伟达GPU至2029年
欧洲议会正式弃用谷歌 转向法国Qwant搜索引擎 推进数字主权
谷歌-A收跌0.98%成交134亿 SpaceX签署92亿美元云服务大单 谷歌获11万英伟达GPU算力
谷歌收涨3.68%成交158亿美元 Gemini月活跃用户突破9亿 增长速度领跑AI应用领域
谷歌跌3.86% Alphabet启动800亿美元史上最大股权融资 伯克希尔斥资100亿加码AI
谷歌搜索25年来最大升级 AI模式+Gemini Spark代理助手全面嵌入 搜索框彻底变革
谷歌AI模型大幅降价迎战OpenAI与Anthropic Gemini Ultra订阅从250美元降至200美元
谷歌CEO皮查伊:Gemini月活跃用户达9亿 日请求量暴增7倍 推动Alphabet股价今年涨25%
谷歌与黑石成立AI云合资公司 黑石投资50亿美元 2027年上线500兆瓦算力
谷歌GOOGL微涨0.04%成交105亿 巴菲特卸任后伯克希尔Q1加仓谷歌清仓亚马逊Visa
2026谷歌I/O大会5月19-20日加州举办 下一代Gemini与Android XR成最大看点
谷歌跌3.03% Alphabet首发日元债券 数千亿规模布局AI基础设施
谷歌GOOGL周五收涨9.96% 单日市值暴增4210亿美元创史上第二大纪录 谷歌云营收增长63%远超预期
谷歌-A股价周一收高1.72% 成交99.2亿美元 欧盟委员会发布拟议措施 要求谷歌开放安卓核心功能予第三方AI助手 以遵守数字市场法案
谷歌推进芯片供应商多元化 与Marvell展开TPU定制及大模型推理芯片开发谈判 Marvell凭借NVIDIA 20亿美元合作在AI定制芯片市场卡位清晰
谷歌-A GOOGL收涨3.61%成交88.51亿美元 花旗上调目标价至405美元维持“买入”评级 Gemini AI平台助力搜索与云业务超预期增长
谷歌Gemini聊天机器人新增心理健康支持功能 一键直达危机热线 未来三年投入3000万美元扩大全球热线服务
谷歌推出Gemma 4开源模型 任何谷歌账号用户可免费使用Veo 3.1视频生成 英伟达优化Gemma 4适配RTX GPU
谷歌3月31日推出Veo 3.1 Lite 最具成本效益视频模型 价格不到Veo 3.1 Fast一半 4月7日再降Fast模式费用
谷歌GOOGL发布Gemini 3.1 Flash Live 实时语音交互领先 专为大规模语音优先智能体打造





