Google :
谷歌公司在超过20年的研发中一直致力于消除语言障碍,让人们能够以前所未有的深度进行学习、交流和连接。今天,我们迈出了下一步,发布了 Gemini 3.5 Live Translate —— 这是我们最新的音频模型,支持70多种语言的实时语音到语音翻译 。
· 能在70多种语言之间做到边听边译
· 同时保留说话人的语调、节奏和音高
· 不用等说完才翻,全程只比说话人慢几秒
· 自动滤除噪音,嘈杂环境也能用
· Google Translate App 新增「听筒模式」贴耳即听翻译
· 开发者可通过 Gemini Live API 和 Google AI Studio 直接调用
自动语言检测:
不需要提前告诉模型「我说的是中文,帮我翻成英文」。你直接说,它自己判断你在说什么语言,自动翻成目标语言。
且能够瞬间做出决策,在速度和翻译质量之间进行权衡,从而让对话真正感觉流畅、人性化和自然。Gemini 3.5 Live Translate 能够仅落后每位发言者几秒钟,甚至可以在长时间会话中保持语速、音高和语调。 http://t.cn/AXaPUF9r
发布于 江苏
