知未科技 26-05-08 11:18
微博认证:知未科技官方微博

【#OpenAI发布三款实时语音模型#】
5月8日,OpenAI发布三款实时语音模型,分别针对语音推理、实时翻译和流式转录三类场景:
GPT-Realtime-2:构建可用于生产环境的语音智能体。它们能够进行更深入的思考、执行操作、处理中断,并让对话持续自然地进行;
GPT-Realtime-Translate:支持70多种输入语言和13种输出语言的实时翻译,打破语言障碍,帮助人们更自然地交流;
GPT-Realtime-Whisper:实时转录音频流,生成字幕和注释。
三款模型均已通过OpenAI Realtime API向开发者开放,并可在OpenAI Playground中进行测试。(APPSO)