谷歌翻译引入Gemini模型，推出实时语音翻译功能

2025-12-15 13:58

190

12月12日，谷歌宣布为Google Translate引入Gemini最先进翻译模型，实现更智能自然的文本翻译。同时推出实时语音到语音翻译beta功能，支持耳机实时翻译并保留语气节奏，应用内还扩展了语言学习工具。目前已在美国、印度等地区上线，覆盖英语与近20种语言。

与苹果 (AAPL.US) 的“实时语音翻译”限制必须使用指定AirPods以及开启“苹果智能”的iPhone 15 Pro或后续机型不同，谷歌的实时AI翻译似乎对设备基本没有要求，同时也将在明年支持iOS系统。

谷歌介绍，在翻译应用的持续监听模式下，Gemini会自动将多种语言的语音翻译为单一目标语言，使得用户可以戴上耳机，用母语聆听外语演讲、讲座或者电影；而在双向对话模式下，用户仍能从耳机中听到实时翻译，同时在说话后依靠手机播报对方的语言。

这项新功能还能保留每位说话者的语气、重音和语速，因此更容易跟上对话并分辨是谁在说话。该功能本质上是将任何一副耳机变成一个实时的单向翻译设备，如果对话者都戴上耳机，就能实现双向AI同声传译。

据悉，Gemini模型能够实现超过70种语言和2000个语言对的语音翻译，包括英语、中文（普通话）、西班牙语、德语等主要语言的互译。该功能支持自动识别语言，所以即便不知道对方是哪国人也能实时启动翻译。

谷歌介绍称，该测试版功能从周五开始向美国、墨西哥和印度的所有安卓设备推送。该功能也将在2026年进入苹果iOS生态以及更多的国家和地区。

好文章，需要你的鼓励