当地时间4月6日(周一),谷歌在 iOS 平台低调上线了一款名为 “Google AI Edge Eloquent” 的实验性语音输入应用。该应用主打“离线优先”与“智能润色”,旨在利用边缘侧 AI 技术,将自然的口语实时转化为专业、精炼的文本。此举标志着谷歌正式切入由 Wispr Flow 和 SuperWhisper 领跑的高端 AI 语音转文字赛道。

核心技术与功能亮点:

Eloquent 搭载了谷歌最新发布的 Gemma4 系列(E2B/E4B 规格)自动语音识别(ASR)模型。该模型支持完全离线运行,用户在下载模型包后即可实现本地转录,有效保障隐私并降低延迟。应用具备强大的“智能去杂”功能,能自动识别并过滤“嗯”、“啊”等语气词及重复修正,输出逻辑连贯的文本。

产品深度集成与交互:

  • 多模态风格转换: 提供“要点”、“正式”、“简短”和“完整”四种文本处理模式。

  • 云端协同(可选): 开启云模式后,应用将调用云端 Gemini 模型进行深层文本清理。

  • 个性化语境: 支持从 Gmail 导入用户专属的关键词、人名及术语,并允许建立自定义词汇表。

  • 生产力统计: 实时显示听写字数、每分钟字速(WPM)及历史会话记录。

市场策略与未来布局:

目前该应用在 iOS App Store 免费提供,无订阅费或使用限制,相比每年收费85美元的 SuperWhisper 等竞品具有极强冲击力。尽管首发于 iOS,但官方描述确认了 Android 版本的开发计划,并预告将支持系统级键盘集成及类似 Wispr Flow 的悬浮按钮功能。作为 Google AI Edge 品牌下的重要成员,Eloquent 的发布不仅是工具类应用的尝试,更是谷歌展示 Gemma 模型在移动端部署能力的标杆案例。