Gemini 3.1 Flash TTS发布

传统TTS工具音质平平、表达单一，难以做出生动自然的语音，制作播客、有声书或语音助手时总觉得缺少灵魂。

Google Gemini 3.1 Flash TTS 将文本转化为极致自然的AI语音，提供了全能文本转语音解决方案。

不仅拥有顶尖语音质量（Artificial Analysis排行Elo 1211世界第二），还支持多说话人对话、70+语言、音频标签精细控制语气语速，甚至能通过自然语言提示导演式生成富有情感的表演。

文档：ai.google.dev/gemini-api/docs/speech-generation

主要功能：

- 超自然语音生成，支持单/多说话人对话；
- 新增音频标签如[whispers][excited]，精确控制情感、语速、语气；
- 30种预置声音可选，风格从活泼到成熟一应俱全；
- 支持70+语言自动检测，全球多语种应用无障碍；
- 导演式提示系统，可定义场景、角色、表演指令；
- SynthID水印技术，确保AI生成内容可追踪。

支持Google AI Studio、Vertex AI、Gemini API即开即用，开发者、企业、创作者的最佳选择。

#Gemini31FlashTTS##AI语音#

发布于北京