谷歌发布Gemini 3 AI模型：多模态与智能体能力实现突破

美股要聞8个月前 (11-19)125

导读目录事件概述模型性能与测试成绩开发者工具与平台升级核心产品整合与商业化多模态与智能体能力对比编辑总结常见问题解答事件概述美东时间2025年11月18日，谷歌正式发布迄今最强大的人工智能模型 Gemini 3，并在发布当天将其整合至谷歌搜索、Gemini应用程序App及多个开发者平台中，实现产品级应用。谷歌CEO Sundar Pichai称该模型为“最智...

导读目录

事件概述
模型性能与测试成绩
开发者工具与平台升级
核心产品整合与商业化
多模态与智能体能力对比
编辑总结
常见问题解答

事件概述

美东时间2025年11月18日，谷歌正式发布迄今最强大的人工智能模型 Gemini 3，并在发布当天将其整合至谷歌搜索、Gemini应用程序App及多个开发者平台中，实现产品级应用。谷歌CEO Sundar Pichai称该模型为“最智能的模型”，DeepMind CEO Demis Hassabis表示其是“世界上最好的多模态理解模型”。

模型性能与测试成绩

Gemini 3在全球AI模型排行榜 LMArena上以 1501分登顶，并在Humanity's Last Exam、GPQA Diamond、MathArena APEX及SimpleQA Verified等多项基准测试中刷新纪录：

测试	Gemini 3成绩	备注
LMArena	1501分	历史最高分
Humanity's Last Exam	37.5%	超越GPT-5 Pro的31.64%
GPQA Diamond	91.9%	学术级基准测试
MathArena APEX	23.4%	数学能力新纪录
SimpleQA Verified	72.1%	事实准确性测试
MMMU-Pro	81%	多模态推理
Video-MMMU	87.6%	视频多模态理解

此外，Gemini 3推出 Deep Think增强推理模式，在Humanity's Last Exam中达到41.0%，GPQA Diamond 93.8%，ARC-AGI-2 45.1%，进一步提升复杂推理能力。

开发者工具与平台升级

在代码生成领域，Gemini 3登顶WebDev Arena排行榜并刷新SWE-bench Verified成绩。谷歌推出 Google Antigravity开发平台，使智能体可跨编辑器、终端和浏览器执行任务。开发者可通过 Google AI Studio、Vertex AI、Gemini CLI以及第三方平台（GitHub、JetBrains、Replit等）访问Gemini 3。

核心产品整合与商业化

Gemini 3首日发布即整合至搜索、Gemini App、Google AI Pro/Ultra、Vertex AI及Gemini Enterprise中。搜索产品引入AI Mode，实现沉浸式视觉布局和交互式生成内容。谷歌计划逐步扩大Gemini智能体功能在更多产品中的应用。

多模态与智能体能力对比

Gemini 3具备处理文本、图像、视频、音频和代码的跨模态能力，并拥有100万token上下文窗口。在长期规划和多步骤任务执行上表现优异，智能体可自主使用工具完成复杂工作流程。

能力	Gemini 3表现	前代Gemini 2.5对比
多模态理解	高精度处理文本、图像、视频、音频、代码	提升明显
智能体工具使用	自主规划执行端到端任务	增强操作范围和决策稳定性
代码生成	WebDev Arena 1487分，SWE-bench 76.2%	远超Gemini 2.5 Pro
推理能力	Humanity's Last Exam 37.5%，Deep Think 41%	显著提升

编辑总结

Gemini 3的发布标志着谷歌在AI领域的前沿突破，尤其在多模态理解、智能体编码及推理能力上取得历史性进展。通过即时整合到搜索、开发者工具和企业产品，谷歌加速了AI商业化布局，同时进一步强化了模型安全性和智能体自主能力。Gemini 3不仅为开发者提供更高效工具，也为普通用户带来全新AI体验，显示谷歌AI战略正在进入Gemini时代。

常见问题解答

问1：Gemini 3有哪些亮点？
答：Gemini 3在多模态理解、智能体编码、推理能力和事实准确性等方面均刷新行业标准，并推出增强推理模式Deep Think。

问2：开发者如何访问Gemini 3？
答：可通过Google AI Studio、Vertex AI、Gemini CLI、Google Antigravity及第三方平台（GitHub、JetBrains、Replit等）访问。

问3：Gemini 3在推理能力上有何突破？
答：在Humanity's Last Exam、GPQA Diamond、ARC-AGI-2等多项基准测试中刷新记录，Deep Think模式进一步提升复杂任务推理能力。

问4：Gemini 3与前代模型相比有哪些改进？
答：在多模态处理、代码生成、智能体任务执行和推理能力上均有显著提升，Deep Think模式在复杂问题解决上表现更优。

问5：谷歌如何保障Gemini 3安全性？
答：经过最全面的内部安全评估，与顶级领域专家合作测试，提升对提示注入、网络攻击及滥用的防护能力。

标签谷歌

上一篇：Cloudflare全球宕机超210万用户受影响揭示互联网对少数基础设施依赖

下一篇：百度美股短线波动超3%，CFO透露AI投入超1000亿元，未来持续加码

您暂未设置收款码

请在主题配置——文章设置里上传

扫描二维码手机访问

谷歌发布Gemini 3 AI模型：多模态与智能体能力实现突破

导读目录

事件概述

模型性能与测试成绩

开发者工具与平台升级

核心产品整合与商业化

多模态与智能体能力对比

编辑总结

常见问题解答

谷歌-A跌1.38%成交78.36亿美元！推出Gemini 3.6 Flash等多款新模型布局代码与网络安全AI

谷歌-A(GOOGL.US)收高1.51%成交87亿美元谷歌开发Frozen v2服务器芯片 Gemini架构固化硅片推理效率或提升6-10倍

谷歌收跌4.44%成交147.28亿美元 Gemini 3.5 Pro旗舰模型延期发布 AI竞争力担忧加剧

谷歌股价涨3.17% 欧盟反垄断上诉推进 Gemini深度集成本田多款车型

谷歌-A收涨4.82%成交117亿美元取代Verizon加入道琼斯指数

谷歌小幅下跌0.46% 成交146亿美元推出安卓谷歌财经App并重组AI攻坚团队

谷歌GOOGL跌0.24%成交155.16亿美元两名AI核心研究干将转投Anthropic Gemini 3.5 Pro发布推迟

谷歌GOOGL重挫4.99%成交181亿美元 DeepMind诺贝尔奖得主John Jumper跳槽Anthropic AI人才战升级

谷歌-A涨1.17%成交162亿六年首发新智能音箱Google Home Speaker预售99.99美元 Gemini支持自然语言交互

谷歌GOOGL收跌2.53%成交88.18亿美元 Magnificent 7集体回调搜索广告巨头承压调整

谷歌涨超1%成交92亿 Android 17正式发布 AI智能代理功能分阶段落地

谷歌GOOGL收跌2.16% 成交115亿 DiffusionGemma开源模型四倍提速消费级显卡即可运行

谷歌收高0.26%成交105亿为Anthropic数据中心提供350亿美元融资担保深化AI基础设施布局

谷歌-A股价收跌1.36%成交100.67亿美元：AI概念分化下表现相对疲软

谷歌与SpaceX签署重磅协议每月9.2亿美元采购算力 11万英伟达GPU至2029年

欧洲议会正式弃用谷歌转向法国Qwant搜索引擎推进数字主权

谷歌-A收跌0.98%成交134亿 SpaceX签署92亿美元云服务大单谷歌获11万英伟达GPU算力

谷歌收涨3.68%成交158亿美元 Gemini月活跃用户突破9亿增长速度领跑AI应用领域

谷歌跌3.86% Alphabet启动800亿美元史上最大股权融资伯克希尔斥资100亿加码AI

谷歌搜索25年来最大升级 AI模式+Gemini Spark代理助手全面嵌入搜索框彻底变革

贊助

最近發表

熱門文章

港股7月8日强势拉升：恒生指数涨2.99%、恒生科技指数大涨4.97%，南向资金净流入142亿，AI与科网股领涨市场

熱評文章

標簽列表

您暂未设置收款码