TechWeb
26-05-21 16:58 微博认证:TechWeb官方微博

【超越GPT-Realtime-2,#阿里语音大模型获三项第一#】5月21日消息,近日,阿里巴巴语音大模型Fun-Realtime-ASR和Fun-Realtime-AudioChat在全球权威AI评测平台Artificial Analysis登顶,超越GPT-Realtime-2等国际顶尖模型,在“听准(词错误率)”、“听懂(语音推理)”和“会聊(对话流畅度)”三项指标上斩获第一。作为新的人机交互入口,阿里语音大模型家族已深度融入千问App、高德地图、钉钉等应用,提供实时语音转文字、智能导航交互及会议纪要生成等服务。

WER(Word Error Rate,词错误率)考察了模型的听写能力,数值越低,识别越精准,Fun-Realtime-ASR1.8% 的 WER 意味着 100 个词中只听错不到 2 个字。目前,该模型支持毫秒级响应,覆盖三十多种语言和七大中文方言体系,可精准识别二十多个地区的口音。同时提供企业级定制接口,支持金融、医疗等行业场景的灵活适配。http://t.cn/AX6wXRBa