微软谷歌同步发布新一代AI模型 微软MAI多模态系列加码自研 谷歌Gemma 4开源转向Apache 2.0

导读目录
市场概况
根据黄金形态通APP报道,微软(MSFT.US)与谷歌-A(GOOGL.US)于周四同步发布新一代AI模型,进一步加码多模态能力布局。微软推出自研MAI系列基础模型,覆盖语音转写、语音生成和图像生成,并加速融入自家产品生态;谷歌则推出Gemma 4开源模型,主打本地运行与多模态能力,并将许可协议切换至更开放的Apache 2.0。
两家公司此举凸显AI领域竞争从单一语言模型向多模态、开源与自研并重的方向加速演进,开发者生态与企业应用落地成为新焦点。
事件背景
微软MAI系列模型由Microsoft AI超级智能团队开发,该团队于2025年11月成立,由Microsoft AI首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)领导。三款模型已全部在Microsoft Foundry上线,其中语音相关模型还可在MAI Playground中使用。
谷歌Gemma 4基于与Gemini 3相同的研究技术,提供四种不同参数规模版本,针对边缘设备和消费级GPU优化,支持离线运行,并覆盖超过140种语言。
微软强调将继续与OpenAI保持合作,但同时推进自有模型体系;谷歌则通过许可协议变更,提升开发者灵活性和数据主权。
多维度分析
从技术能力维度看,微软MAI-Transcribe-1支持25种语言,批量转录速度较Azure Fast方案提升2.5倍;MAI-Voice-1可1秒生成60秒音频并支持定制语音;MAI-Image-2作为更快文生图模型已开始在Copilot上线。
谷歌Gemma 4强调“单位参数智能水平”领先,310亿和260亿参数版本在Arena AI文本排行榜分别位列第三和第六,击败规模大20倍的模型。同时支持视觉、音频输入和离线代码生成,适合移动设备与代理式工作流。
从商业策略维度分析,微软通过自研模型降低对OpenAI的依赖,同时保持合作关系,形成“双轨”布局;谷歌转向Apache 2.0许可,旨在扩大生态影响力,与Gemini专有模型形成互补。
从应用落地维度观察,微软模型快速融入Copilot、Bing、PowerPoint等产品,谷歌模型则优化本地运行,适用于数十亿安卓设备和物联网场景。
从市场竞争维度而言,两家公司此举均针对多模态与边缘计算痛点,反映AI基础设施竞争从云端向端侧延伸。
数据对比
| 模型/指标 | 微软MAI系列 | 谷歌Gemma 4 |
|---|---|---|
| 核心能力 | 语音转写、语音生成、图像生成 | 多模态(视觉、音频)、代码生成、代理工作流 |
| 语言支持 | 25种语言(转写) | 超过140种语言 |
| 参数规模/版本 | 三款专项模型 | 20亿、40亿(Effective)、260亿(MoE)、310亿(Dense) |
| 许可/部署 | 商用闭源,Microsoft Foundry上线 | Apache 2.0开源,支持本地/云端/离线 |
| 定价示例 | 转写0.36美元/小时;语音生成22美元/百万字符 | 开源免费(商用灵活) |
表格显示微软侧重专项高效模型与产品集成,谷歌强调开源灵活性与边缘部署,两者形成差异化竞争。
专家观点
穆斯塔法·苏莱曼表示:“我们正在快速部署这些顶级模型,用于支持自家的消费者和商业产品。很快你将会在Foundry以及微软各类产品和体验中看到更多模型。”他重申微软将继续与OpenAI合作,但近期合作关系重新谈判使其能够真正推进超级智能研究。
谷歌强调Gemma 4“与Gemini模型形成互补,为开发者提供业内最强大的开源与专有工具组合”,并指出Apache 2.0许可赋予开发者完整灵活性和数字主权。
市场分析认为,微软此举是构建自有AI栈以对冲依赖的重要信号,而谷歌开源策略旨在扩大生态影响力并加速创新。
投资启示
微软与谷歌同步发力多模态与开源/自研,凸显AI竞争进入新阶段。投资者需关注两家公司模型实际落地效果、生态伙伴反馈以及收入贡献。
短期内,产品集成进度与开发者采用率将成为股价催化剂;长期来看,多模态能力与边缘计算布局将影响云服务、硬件生态及企业级AI市场份额。建议结合财报细节,评估资本开支与回报平衡,同时关注开源社区活跃度对谷歌的影响。
编辑总结
微软推出MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2三款自研多模态模型,谷歌发布Gemma 4开源系列并切换至Apache 2.0许可,两家公司同步加码AI布局,反映行业从大语言模型向语音、图像、视频及本地部署全面延伸。微软在保持OpenAI合作的同时推进自有体系,谷歌则通过开源提升开发者灵活性。尽管竞争加剧,但多模态技术成熟与生态构建仍处于早期阶段,未来产品落地速度与商业化成效将成为决定胜负的关键变量。
常见问题解答
问:微软MAI系列三款模型各有哪些核心功能和定价?
答:MAI-Transcribe-1是先进语音转文本模型,支持25种语言,转录速度提升2.5倍,起步价每小时0.36美元;MAI-Voice-1是语音生成模型,1秒生成60秒音频并支持定制语音,起步价每100万个字符22美元;MAI-Image-2是更快文生图模型,已在Copilot上线,定价文本输入每100万个词元5美元,图像输出每100万个词元33美元。问:谷歌Gemma 4与前代相比有哪些重大升级?
答:Gemma 4采用Apache 2.0开源许可,提供20亿至310亿参数四种版本,支持视觉、音频输入与生成、离线代码生成及超过140种语言,针对本地运行优化,甚至可在安卓设备上运行。公司称其在单位参数智能水平上实现显著提升,并在Arena AI排行榜取得领先成绩。问:微软发布MAI模型是否意味着减少对OpenAI的依赖?
答:微软表示将继续与OpenAI保持紧密合作,但自研MAI模型显示其正构建自有AI能力作为补充。穆斯塔法·苏莱曼强调,合作关系重新谈判使其能够推进超级智能研究,整体策略类似芯片领域的自主研发与外部采购并行。问:Gemma 4切换Apache 2.0许可对开发者有何实际意义?
答:Apache 2.0是行业标准许可,提供更高灵活性,允许开发者在任何环境中自由修改、部署和商业化模型,增强数据主权与控制权。此举有助于扩大谷歌开源生态,与其Gemini专有模型形成互补,吸引更多企业和研究机构采用。问:投资者应如何看待微软与谷歌此次AI模型发布?
答:此次发布强化两家公司多模态与边缘AI布局,短期可能提振市场对AI应用落地的信心,长期取决于模型实际性能、生态采用率及商业化转化。微软侧重产品集成与企业服务,谷歌强调开源与本地部署,投资者需关注后续财报中云收入增长、毛利率变化及竞争格局演变,理性评估估值与风险。
微软CEO纳德拉重磅访谈:自研MAI大模型夺回AI控制权 拒绝卖GPU赚快钱 预言SaaS转向订阅+按量付费
微软Build大会全栈押注AI智能体时代 Web IQ+Majorana 2量子芯片+Scout本地助手三大重磅发布
微软跌4.17% 特朗普AI模型审查令引发担忧 市场解读为短期情绪反应
微软股价涨2.28%成交241亿 AI新模型+Surface Laptop Ultra携手英伟达
微软Build 2026开发者大会6月2日开幕 发布代码专用AI模型反击Cursor与Claude Code
微软MSFT收涨5.45%成交346亿 与英伟达同步预热神秘新品 曲面屏硬件或亮相Build大会
微软涨3.47%成交198亿!Build大会推自研AI代码模型 挑战Cursor与Claude
盖茨基金会清仓最后770万股微软股票 价值32亿美元 比尔·盖茨个人仍持430亿美元MSFT
微软逆势上涨3.05%成交211亿 阿克曼大举建仓称估值极具吸引力 AI担忧被严重夸大
微软MSFT收跌3.93% 成交286.62亿美元 第三财季Azure云增长40% 但资本开支大幅上调至1900亿美元引发担忧
微软股价周一微涨0.05% 成交130.3亿美元 与OpenAI结束独家使用权协议 OpenAI可向亚马逊谷歌等云平台销售AI技术 双方合作进入新阶段
微软周四收跌3.97%成交158.99亿美元 首次推出自愿退休计划 面向美国工龄加年龄满70年及以上员工 AI转型背景下优化人力成本
微软(MSFT)收高1.46%成交135.4亿美元 Xbox Game Pass大降价23% 新使命召唤不再首发加入 服务战略首调
微软MSFT收涨4.61% 成交182.12亿美元 全面上调Surface Laptop与Surface Pro价格 旗舰型号涨幅高达50% 即刻生效
微软“龙虾”来了?Copilot拟引入开源AI智能体OpenClaw技术 目标打造全天候自主运行Agent 纳德拉重组Copilot列为优先事项
微软股价收涨3.64%成交133.16亿美元 OpenAI新任营收负责人备忘录力挺亚马逊联盟 称微软限制接触企业客户能力
微软与雪佛龙及Engine No. 1排他性谈判 拟斥资70亿美元在得州建2500MW天然气发电厂 为大型数据中心园区供电
微软365 Copilot Researcher深度研究智能体重大更新 GPT先起草 Claude后批判 引入Critique功能实现多模型协作 准确性完整性显著提升
微软更新深度研究代理功能 GPT先制作初稿 Claude按学术评审审查准确性 推出Council机制多模型同步研究提炼共识
微软MSFT冻结Azure及北美销售新增招聘 员工规模或长期维持稳定 AI投入下严控成本





