北京时间 5 月 26 日,据多家媒体援引知情人士消息,苹果并非简单将 Gemini 集成到 Siri 中,而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型,作为下一代 Siri 核心 overhaul 的“大脑”。

这一规模远超当前主流移动端模型,引发业界高度关注。

模型规模碾压:1.2T vs Gemini 3.5 Flash 300B

据估算,Gemini 3.5 Flash 的参数量约为 3000 亿,而苹果此次采用的定制模型达到1.2 万亿参数,规模显著更大。分析指出,如此庞大的模型若能高效部署,将为 Siri 带来更强的理解、推理和复杂任务处理能力,尤其在多模态交互和上下文理解方面有望实现质的飞跃。

性能与速度:本地响应是最大考验

尽管模型参数激增,但苹果一贯注重用户隐私与实时性。报道强调,简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快,又要兼顾功耗和发热控制。

认为,模型“够大”并不必然等于“够好”。在移动场景下,延迟、能耗和准确率的平衡才是成败关键。苹果是否能在 1.2T 参数模型上实现高效本地 / 混合部署,将直接决定这次 Siri overhaul 的用户体验。

下半年 AI 大战一触即发

随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合,全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括:

  • WWDC:Apple Intelligence 全面亮相,Siri 与 Gemini 定制模型结合
  • GPT-5.6:OpenAI 下一代模型进展
  • Sonnet 4.8 / Opus 4.8:Anthropic 可能同步迭代
  • Gemini 3.5 Pro:谷歌已确认即将推出

将持续跟踪苹果 Siri 升级进展及大模型在终端侧的落地表现。这场由参数规模、推理速度、隐私保护共同定义的 AI 竞赛,正越来越接近消费者日常使用场景。谁能最终胜出,拭目以待。