爱可可-爱生活 25-09-09 08:58
微博认证:AI博主 2025微博新锐新知博主

阿里巴巴发布 Qwen3-ASR:一款集多语言、高鲁棒性与极简接入于一体的全能语音识别模型。

• 支持11种语言(含中英、阿拉伯语、德语、日语、韩语、俄语等),自动识别语言,无需手动切换。🌐
• 适应复杂环境:噪声、远场、低音质均有 <8% 的词错误率(WER),连歌曲、说唱及带背景音乐的语音也能精准识别。🎤
• 独特自定义上下文功能:可粘贴任意文本(专有名词、行业术语、甚至乱码),极大提升识别准确率和适用场景。
• 单一模型覆盖多场景,简化部署流程,极适合教育科技、媒体转录、客服智能等多领域应用。
• 提供开放API及在线Demo,方便快速体验与集成。

这背后体现了语音识别技术对多模态和上下文理解能力的持续突破,正在推动语言服务从被动转录向主动智能理解转变。未来,如何将识别结果无缝转化为实际业务行动,将是价值释放的关键。

详见🔗 bailian.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2979031
ModelScope演示🔗 modelscope.cn/studios/Qwen/Qwen3-ASR-Demo
Hugging Face演示🔗 huggingface.co/spaces/Qwen/Qwen3-ASR-Demo
技术博客🔗 qwen.ai/blog?id=41e4c0f6175f9b004a03a07e42343eaaf48329e7&from=research.latest-advancements-list

#语音识别# #多语言AI# #智能客服# #教育科技# #阿里巴巴AI#

发布于 北京