谷歌推出Gemini 3.1 Flash-Lite 响应时间提升2.5倍输出速度快45% 定价每百万输入token仅0.25美元开发者高频场景性价比首选

美股要聞5个月前 (03-04)117

导读目录性能与定价亮点多模态与基准测试可调节“思考层级”功能早期企业测试反馈市场影响与前景性能与定价亮点根据黄金形态通APP报道，美东时间3月3日，谷歌正式推出Gemini 3系列中最快、性价比最高的模型——Gemini 3.1 Flash-Lite。该模型专为开发者大规模高频工作负载设计，以更低价格实现不妥协的智能表现。根据Artificial Analy...

导读目录

性能与定价亮点
多模态与基准测试
可调节“思考层级”功能
早期企业测试反馈
市场影响与前景

性能与定价亮点

根据黄金形态通APP报道，美东时间3月3日，谷歌正式推出Gemini 3系列中最快、性价比最高的模型——Gemini 3.1 Flash-Lite。该模型专为开发者大规模高频工作负载设计，以更低价格实现不妥协的智能表现。根据Artificial Analysis基准测试，3.1 Flash-Lite首个答案响应时间较Gemini 2.5 Flash提高2.5倍，输出速度提升45%，同时维持相近或更优的质量水准。

定价极具竞争力：每百万输入token仅0.25美元，每百万输出token1.50美元。谷歌强调，该定价仅为大型模型的一小部分，适合需要大规模部署、对成本高度敏感的开发者和企业用户。

多模态与基准测试

Gemini 3.1 Flash-Lite支持文本、图像、音频与视频等多模态输入，上下文窗口最长达100万token，输出上限为6.4万token，可满足从文件摘要到复杂多模态任务的广泛需求。在Arena.ai排行榜上获得1432的Elo评分，在GPQA Diamond测试中得分86.9%，在MMMU Pro测试中得分76.8%，均超越同级别竞争模型。谷歌特别强调，该模型在部分基准中甚至超越上一代体量更大的Gemini 2.5 Flash，体现出“小模型大能力”的技术突破。

可调节“思考层级”功能

3.1 Flash-Lite的差异化亮点在于AI Studio和Vertex AI中内置的“思考层级”（thinking levels）控制。开发者可根据任务复杂程度灵活调整推理深度：对于翻译、内容审核等以成本为优先的批量任务，选择较低层级压缩成本；对于生成用户界面、创建模拟场景或遵循复杂指令等深度推理任务，调高层级提升输出质量。谷歌表示，这一功能“对于管理高频工作负载至关重要”，实现速度、成本与质量的动态平衡。

早期企业测试反馈

多家早期测试企业给予高度评价： Latitude AI负责人Kolby Nottingham：指令遵循能力与速度无与伦比，成功率高20%，推理速度快60%。 Cartwheel首席科学家Andrew Carr：智能与速度比无可匹敌，工具调用出色，处理多模态标注场景关键解锁工具。 Whering CEO Bianca Rangecroft：商品标签标注实现100%一致性，提供确定、可重复的结果。 HubX联合创始人Kaan Ortabas：10秒以内完成时间、接近实时流式输出、97%结构化输出合规率、94%意图路由准确率，在速度、精准度与成本间取得卓越平衡。

市场影响与前景

Gemini 3.1 Flash-Lite以预览版形式当天开放，通过Gemini API或Vertex AI平台接入，无需特定硬件配置，仅API调用即可使用。该模型定位高频、对延迟敏感的任务（如翻译、内容分类），是Gemini 3系列原生多模态推理家族新成员。基于Gemini 3 Pro构建，使用谷歌自研TPU及JAX/ML Pathways框架训练。谷歌此举进一步巩固其在高效AI模型领域的领先地位，价格优势有望加速开发者与企业大规模部署。市场关注其实际落地效果与对竞品（如Claude 3.5 Haiku、Grok 3 Mini）的冲击。

编辑总结

谷歌推出Gemini 3.1 Flash-Lite，响应时间提升2.5倍、输出速度快45%，定价每百万输入token仅0.25美元，专为高频场景打造性价比首选。支持多模态输入、100万token上下文、可调节“思考层级”功能，在Arena.ai获1432 Elo评分，多项基准超越同级甚至上一代旗舰。早期企业反馈效率、指令遵循与成本优势显著。该模型预览版当天开放，通过API接入，无硬件门槛。谷歌强化高效AI布局，价格与性能双杀，有望加速大规模商用落地，市场需关注实际部署反馈与竞品反应。

常见问题解答

问：Gemini 3.1 Flash-Lite与Gemini 2.5 Flash相比核心优势是什么？
答：响应时间提高2.5倍，输出速度提升45%，定价更低（输入0.25美元/百万token），在Arena.ai Elo评分1432，多项基准（如GPQA Diamond 86.9%、MMMU Pro 76.8%）超越同级甚至上一代旗舰。新增可调节“思考层级”，开发者可根据任务动态平衡速度、成本与质量。
问：该模型定价为什么这么低？适合哪些场景？
答：定价仅为大型模型一小部分，专为高频、对延迟敏感的任务优化，如翻译、内容分类、批量处理等。适合需要大规模部署、对成本高度敏感的开发者和企业用户，是高频工作负载的性价比首选。
问：“思考层级”功能具体如何使用？
答：在AI Studio与Vertex AI中内置，开发者可根据任务复杂程度调整推理深度。低层级用于成本优先的批量任务（如翻译、审核），高层级用于需要深度推理的任务（如生成UI、复杂指令遵循）。这一设计实现速度、成本与质量的动态平衡。
问：早期企业反馈的核心亮点是什么？
答：Latitude：指令遵循能力与速度无与伦比，成功率高20%、推理快60%；Cartwheel：工具调用出色，处理多模态标注关键解锁工具；Whering：商品标签标注100%一致性；HubX：10秒完成、实时流式输出、97%结构化合规率、94%意图路由准确率。整体集中于速度、指令精准度与规模化处理能力。
问：投资者当前应如何看待谷歌Gemini 3.1 Flash-Lite发布？
答：短期利好谷歌云与AI业务，价格与性能双杀有望加速开发者与企业采用，强化谷歌在高效AI模型领域的竞争力。中长期看，该模型将推动AI大规模商用落地，扩大谷歌生态粘性。关注实际API使用数据与企业反馈，及对竞品（如Claude、Grok）的冲击。谷歌AI战略持续推进，投资者可关注云业务增长与AI收入贡献。

标签谷歌

上一篇：CrowdStrike 2026财年Q4业绩亮眼营收13.1亿美元同比增长23% ARR达52.5亿美元净新增3.307亿非GAAP每股收益1.12美元

下一篇：Moderna盘后涨超10%达成全球专利诉讼和解罗斯百货Q4业绩超预期涨超6% 新闻集团与Meta多年期AI授权协议股价涨近4%

您暂未设置收款码

请在主题配置——文章设置里上传

扫描二维码手机访问

谷歌推出Gemini 3.1 Flash-Lite 响应时间提升2.5倍输出速度快45% 定价每百万输入token仅0.25美元开发者高频场景性价比首选

导读目录

性能与定价亮点

多模态与基准测试

可调节“思考层级”功能

早期企业测试反馈

市场影响与前景

编辑总结

常见问题解答

谷歌-A(GOOGL.US)收高1.51%成交87亿美元谷歌开发Frozen v2服务器芯片 Gemini架构固化硅片推理效率或提升6-10倍

谷歌收跌4.44%成交147.28亿美元 Gemini 3.5 Pro旗舰模型延期发布 AI竞争力担忧加剧

谷歌股价涨3.17% 欧盟反垄断上诉推进 Gemini深度集成本田多款车型

谷歌-A收涨4.82%成交117亿美元取代Verizon加入道琼斯指数

谷歌小幅下跌0.46% 成交146亿美元推出安卓谷歌财经App并重组AI攻坚团队

谷歌GOOGL跌0.24%成交155.16亿美元两名AI核心研究干将转投Anthropic Gemini 3.5 Pro发布推迟

谷歌GOOGL重挫4.99%成交181亿美元 DeepMind诺贝尔奖得主John Jumper跳槽Anthropic AI人才战升级

谷歌-A涨1.17%成交162亿六年首发新智能音箱Google Home Speaker预售99.99美元 Gemini支持自然语言交互

谷歌GOOGL收跌2.53%成交88.18亿美元 Magnificent 7集体回调搜索广告巨头承压调整

谷歌涨超1%成交92亿 Android 17正式发布 AI智能代理功能分阶段落地

谷歌GOOGL收跌2.16% 成交115亿 DiffusionGemma开源模型四倍提速消费级显卡即可运行

谷歌收高0.26%成交105亿为Anthropic数据中心提供350亿美元融资担保深化AI基础设施布局

谷歌-A股价收跌1.36%成交100.67亿美元：AI概念分化下表现相对疲软

谷歌与SpaceX签署重磅协议每月9.2亿美元采购算力 11万英伟达GPU至2029年

欧洲议会正式弃用谷歌转向法国Qwant搜索引擎推进数字主权

谷歌-A收跌0.98%成交134亿 SpaceX签署92亿美元云服务大单谷歌获11万英伟达GPU算力

谷歌收涨3.68%成交158亿美元 Gemini月活跃用户突破9亿增长速度领跑AI应用领域

谷歌跌3.86% Alphabet启动800亿美元史上最大股权融资伯克希尔斥资100亿加码AI

谷歌搜索25年来最大升级 AI模式+Gemini Spark代理助手全面嵌入搜索框彻底变革

谷歌AI模型大幅降价迎战OpenAI与Anthropic Gemini Ultra订阅从250美元降至200美元

贊助

最近發表

熱門文章

港股7月8日强势拉升：恒生指数涨2.99%、恒生科技指数大涨4.97%，南向资金净流入142亿，AI与科网股领涨市场

熱評文章

標簽列表

您暂未设置收款码

谷歌推出Gemini 3.1 Flash-Lite 响应时间提升2.5倍 输出速度快45% 定价每百万输入token仅0.25美元 开发者高频场景性价比首选

导读目录

性能与定价亮点

多模态与基准测试

可调节“思考层级”功能

早期企业测试反馈

市场影响与前景

编辑总结

常见问题解答

贊助

最近發表

熱門文章

港股7月8日强势拉升：恒生指数涨2.99%、恒生科技指数大涨4.97%，南向资金净流入142亿，AI与科网股领涨市场

熱評文章

標簽列表

您暂未设置收款码

谷歌推出Gemini 3.1 Flash-Lite 响应时间提升2.5倍输出速度快45% 定价每百万输入token仅0.25美元开发者高频场景性价比首选