黄金形态通APP下载

谷歌发布Gemini 3 AI模型:多模态与智能体能力实现突破

美股要聞7个月前 (11-19)114
导读目录事件概述模型性能与测试成绩开发者工具与平台升级核心产品整合与商业化多模态与智能体能力对比编辑总结常见问题解答事件概述美东时间2025年11月18日,谷歌正式发布迄今最强大的人工智能模型 Gemini 3,并在发布当天将其整合至谷歌搜索、Gemini应用程序App及多个开发者平台中,实现产品级应用。谷歌CEO Sundar Pichai称该模型为“最智...

谷歌发布Gemini 3 AI模型:多模态与智能体能力实现突破

导读目录

事件概述

美东时间2025年11月18日,谷歌正式发布迄今最强大的人工智能模型 Gemini 3,并在发布当天将其整合至谷歌搜索、Gemini应用程序App及多个开发者平台中,实现产品级应用。谷歌CEO Sundar Pichai称该模型为“最智能的模型”,DeepMind CEO Demis Hassabis表示其是“世界上最好的多模态理解模型”。

模型性能与测试成绩

Gemini 3在全球AI模型排行榜 LMArena上以 1501分登顶,并在Humanity's Last Exam、GPQA Diamond、MathArena APEX及SimpleQA Verified等多项基准测试中刷新纪录:

测试Gemini 3成绩备注
LMArena1501分历史最高分
Humanity's Last Exam37.5%超越GPT-5 Pro的31.64%
GPQA Diamond91.9%学术级基准测试
MathArena APEX23.4%数学能力新纪录
SimpleQA Verified72.1%事实准确性测试
MMMU-Pro81%多模态推理
Video-MMMU87.6%视频多模态理解

此外,Gemini 3推出 Deep Think增强推理模式,在Humanity's Last Exam中达到41.0%,GPQA Diamond 93.8%,ARC-AGI-2 45.1%,进一步提升复杂推理能力。

开发者工具与平台升级

在代码生成领域,Gemini 3登顶WebDev Arena排行榜并刷新SWE-bench Verified成绩。谷歌推出 Google Antigravity开发平台,使智能体可跨编辑器、终端和浏览器执行任务。开发者可通过 Google AI StudioVertex AIGemini CLI以及第三方平台(GitHub、JetBrains、Replit等)访问Gemini 3。

核心产品整合与商业化

Gemini 3首日发布即整合至搜索、Gemini App、Google AI Pro/Ultra、Vertex AI及Gemini Enterprise中。搜索产品引入AI Mode,实现沉浸式视觉布局和交互式生成内容。谷歌计划逐步扩大Gemini智能体功能在更多产品中的应用。

多模态与智能体能力对比

Gemini 3具备处理文本、图像、视频、音频和代码的跨模态能力,并拥有100万token上下文窗口。在长期规划和多步骤任务执行上表现优异,智能体可自主使用工具完成复杂工作流程。

能力Gemini 3表现前代Gemini 2.5对比
多模态理解高精度处理文本、图像、视频、音频、代码提升明显
智能体工具使用自主规划执行端到端任务增强操作范围和决策稳定性
代码生成WebDev Arena 1487分,SWE-bench 76.2%远超Gemini 2.5 Pro
推理能力Humanity's Last Exam 37.5%,Deep Think 41%显著提升

编辑总结

Gemini 3的发布标志着谷歌在AI领域的前沿突破,尤其在多模态理解、智能体编码及推理能力上取得历史性进展。通过即时整合到搜索、开发者工具和企业产品,谷歌加速了AI商业化布局,同时进一步强化了模型安全性和智能体自主能力。Gemini 3不仅为开发者提供更高效工具,也为普通用户带来全新AI体验,显示谷歌AI战略正在进入Gemini时代。

常见问题解答

问1:Gemini 3有哪些亮点?
答:Gemini 3在多模态理解、智能体编码、推理能力和事实准确性等方面均刷新行业标准,并推出增强推理模式Deep Think。
问2:开发者如何访问Gemini 3?
答:可通过Google AI Studio、Vertex AI、Gemini CLI、Google Antigravity及第三方平台(GitHub、JetBrains、Replit等)访问。
问3:Gemini 3在推理能力上有何突破?
答:在Humanity's Last Exam、GPQA Diamond、ARC-AGI-2等多项基准测试中刷新记录,Deep Think模式进一步提升复杂任务推理能力。
问4:Gemini 3与前代模型相比有哪些改进?
答:在多模态处理、代码生成、智能体任务执行和推理能力上均有显著提升,Deep Think模式在复杂问题解决上表现更优。
问5:谷歌如何保障Gemini 3安全性?
答:经过最全面的内部安全评估,与顶级领域专家合作测试,提升对提示注入、网络攻击及滥用的防护能力。
标签谷歌
相关文章

您暂未设置收款码

请在主题配置——文章设置里上传

扫描二维码手机访问