苹果 Siri 重磅升级：1.2 万亿参数谷歌定制模型“掌脑”，本地运行速度成关键

北京时间 5 月 26 日，据多家媒体援引知情人士消息，苹果并非简单将 Gemini 集成到 Siri 中，而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型，作为下一代 Siri 核心 overhaul 的“大脑”。

这一规模远超当前主流移动端模型，引发业界高度关注。

据估算，Gemini 3.5 Flash 的参数量约为 3000 亿，而苹果此次采用的定制模型达到1.2 万亿参数，规模显著更大。分析指出，如此庞大的模型若能高效部署，将为 Siri 带来更强的理解、推理和复杂任务处理能力，尤其在多模态交互和上下文理解方面有望实现质的飞跃。

尽管模型参数激增，但苹果一贯注重用户隐私与实时性。报道强调，简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快，又要兼顾功耗和发热控制。

认为，模型“够大”并不必然等于“够好”。在移动场景下，延迟、能耗和准确率的平衡才是成败关键。苹果是否能在 1.2T 参数模型上实现高效本地 / 混合部署，将直接决定这次 Siri overhaul 的用户体验。

随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合，全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括：

将持续跟踪苹果 Siri 升级进展及大模型在终端侧的落地表现。这场由参数规模、推理速度、隐私保护共同定义的 AI 竞赛，正越来越接近消费者日常使用场景。谁能最终胜出，拭目以待。