谷歌翻译引入Gemini模型,推出实时语音翻译功能
2025-12-15 13:58
190
12月12日,谷歌宣布为Google Translate引入Gemini最先进翻译模型,实现更智能自然的文本翻译。同时推出实时语音到语音翻译beta功能,支持耳机实时翻译并保留语气节奏,应用内还扩展了语言学习工具。目前已在美国、印度等地区上线,覆盖英语与近20种语言。
与苹果 (AAPL.US) 的“实时语音翻译”限制必须使用指定AirPods以及开启“苹果智能”的iPhone 15 Pro或后续机型不同,谷歌的实时AI翻译似乎对设备基本没有要求,同时也将在明年支持iOS系统。
谷歌介绍,在翻译应用的持续监听模式下,Gemini会自动将多种语言的语音翻译为单一目标语言,使得用户可以戴上耳机,用母语聆听外语演讲、讲座或者电影;而在双向对话模式下,用户仍能从耳机中听到实时翻译,同时在说话后依靠手机播报对方的语言。
这项新功能还能保留每位说话者的语气、重音和语速,因此更容易跟上对话并分辨是谁在说话。该功能本质上是将任何一副耳机变成一个实时的单向翻译设备,如果对话者都戴上耳机,就能实现双向AI同声传译。
据悉,Gemini模型能够实现超过70种语言和2000个语言对的语音翻译,包括英语、中文(普通话)、西班牙语、德语等主要语言的互译。该功能支持自动识别语言,所以即便不知道对方是哪国人也能实时启动翻译。
谷歌介绍称,该测试版功能从周五开始向美国、墨西哥和印度的所有安卓设备推送。该功能也将在2026年进入苹果iOS生态以及更多的国家和地区。
0
好文章,需要你的鼓励
