OpenAI发布实时语音模型

【#OpenAI发布三款实时语音模型#】
5月8日，OpenAI发布三款实时语音模型，分别针对语音推理、实时翻译和流式转录三类场景：
GPT-Realtime-2：构建可用于生产环境的语音智能体。它们能够进行更深入的思考、执行操作、处理中断，并让对话持续自然地进行；
GPT-Realtime-Translate：支持70多种输入语言和13种输出语言的实时翻译，打破语言障碍，帮助人们更自然地交流；
GPT-Realtime-Whisper：实时转录音频流，生成字幕和注释。
三款模型均已通过OpenAI Realtime API向开发者开放，并可在OpenAI Playground中进行测试。（APPSO）