传统TTS工具音质平平、表达单一,难以做出生动自然的语音,制作播客、有声书或语音助手时总觉得缺少灵魂。
Google Gemini 3.1 Flash TTS 将文本转化为极致自然的AI语音,提供了全能文本转语音解决方案。
不仅拥有顶尖语音质量(Artificial Analysis排行Elo 1211世界第二),还支持多说话人对话、70+语言、音频标签精细控制语气语速,甚至能通过自然语言提示导演式生成富有情感的表演。
文档:ai.google.dev/gemini-api/docs/speech-generation
主要功能:
- 超自然语音生成,支持单/多说话人对话;
- 新增音频标签如[whispers][excited],精确控制情感、语速、语气;
- 30种预置声音可选,风格从活泼到成熟一应俱全;
- 支持70+语言自动检测,全球多语种应用无障碍;
- 导演式提示系统,可定义场景、角色、表演指令;
- SynthID水印技术,确保AI生成内容可追踪。
支持Google AI Studio、Vertex AI、Gemini API即开即用,开发者、企业、创作者的最佳选择。
#Gemini31FlashTTS##AI语音#
发布于 北京
