Google 上架免费 AI 语音转写“Edge Eloquent”:采用 Gemma 手机端运作无需联网,iOS 首发

動區BlockTempo

Google 本周悄悄在 iOS 应用商店上架免费离线 AI 听写应用程序「AI Edge Eloquent」,采用端侧 Gemma ASR 模型,音频完全不离开设备,且罕见地在 Android 之前先登陆 iOS 平台。
(前情提要:Google 发布最聪明开放模型 Gemma 4!全面改采用 Apache 2.0 授权,性能直逼大型闭源 AI)
(背景补充:打破英伟达垄断?Google 地表最强 AI 模型「Gemma 3」用 1 颗 H100,击败 DeepSeek、OpenAI)

本文目录

Toggle

  • 说话即转文字,开口就能用
  • iOS 先行 Android,Google 的反常操作
  • Gemma 走进日常:端侧 AI 的真实场景验证

没有发布会、也没有任何官方公告,Google 就这样在本周稍早,悄悄把「AI Edge Eloquent」推上了 iOS 应用商店。这款完全免费的 AI 听写应用程序主打离线语音识别,背后运行的是 Google 自家的 Gemma 端侧 ASR(自动语音识别)模型,所有音频处理都在装置本机完成,不需要联网。

说话即转文字,开口就能用

「AI Edge Eloquent」的操作逻辑很直观:打开 App 后对着麦克风说话,画面会实时显示文字与声波波形;停止录音后,App 会自动过滤「嗯」「啊」等口语赘词,修正断句,把说出的内容整理成干净、可直接使用的文字,并自动复制到剪贴板。

隐私设计也是这款 App 的核心卖点之一。在纯离线模式下,音频数据不会离开用户的 iPhone,不会发送到任何服务器。Google 还提供「云端模式」选项:语音识别仍在设备端完成,只将识别后的文字(而非原始音频)发送到 Gemini 云端模型进行进一步清理,质量更高。

整套服务完全免费,无订阅费用、无使用量上限。

iOS 先行 Android,Google 的反常操作

与此同时,科技媒体注意到一个罕见现象:Google 的产品几乎都是先在 Android 上线,尤其是涉及端侧 AI 的功能,通常会搭配 Pixel 设备与 Gemini Nano 模型优先推出。这次「AI Edge Eloquent」反其道而行,应用商店描述中甚至直接写明 Android 版本即将推出。

分析人士对此有两种解读。第一种是市场测试说:Google 可能刻意选择 iOS 这个「非主场」进行实验,在不干扰 Android 生态的前提下,评估消费者对端侧 AI 听写的接受度与使用习惯。

第二种是技术就绪说:iOS 版的 Gemma ASR 模型可能在优化进度上比 Android 版更早达到可用标准,Google 选择直接上架,而不是等到两平台同步。

Gemma 走进日常:端侧 AI 的真实场景验证

从技术角度看,「AI Edge Eloquent」的意义不只是一款听写工具。Gemma 是 Google 的开源轻量级 AI 模型系列,设计初衷就是让它在行动设备等资源受限的环境中高效运行;AI Edge 则是 Google 让开发者在装置端执行机器学习模型的框架。

这款 App 相当于把 Gemma 的端侧推理能力,搬进了消费者的日常使用场景中。

对开发者而言,AI Edge Eloquent 也是一个参考样板:展示了 Gemma 模型在消费级产品中的落地方式,以及离线与云端混合架构如何在隐私与质量之间取得平衡。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论