小互AI
26-05-08 15:08 微博认证:AI博主

GPT-Realtime-2 语音模型发布

语音首次接入 GPT-5 推理能力

OpenAI一口气发布了三个实时语音模型:

GPT-Realtime-2
GPT-Realtime-Translate
GPT-Realtime-Whisper

其中GPT-Realtime-2 是其中的主角,这是 OpenAI 第一次把“GPT-5 级推理”塞进语音模型,同时把上下文从 32K 扩到 128K...

GPT-Realtime-2:首个具备 GPT-5 级推理能力的语音模型,能在对话中推理复杂请求、并行调工具、处理打断和纠错,上下文窗口从 32K 升到 128K

GPT-Realtime-Translate:实时语音翻译模型,支持 70+ 种输入语言、13 种输出语言,跟着说话人的节奏边听边译,能处理口音和专业词

GPT-Realtime-Whisper:流式语音转文字模型,边说边出字,专门给实时字幕、会议纪要、客服转写这类不能等的

详细介绍:http://t.cn/AXJrQe73

发布于 安徽