阿里巴巴发布Qwen3-ASR模型

阿里巴巴发布 Qwen3-ASR：一款集多语言、高鲁棒性与极简接入于一体的全能语音识别模型。

• 支持11种语言（含中英、阿拉伯语、德语、日语、韩语、俄语等），自动识别语言，无需手动切换。🌐
• 适应复杂环境：噪声、远场、低音质均有 <8% 的词错误率（WER），连歌曲、说唱及带背景音乐的语音也能精准识别。🎤
• 独特自定义上下文功能：可粘贴任意文本（专有名词、行业术语、甚至乱码），极大提升识别准确率和适用场景。
• 单一模型覆盖多场景，简化部署流程，极适合教育科技、媒体转录、客服智能等多领域应用。
• 提供开放API及在线Demo，方便快速体验与集成。

这背后体现了语音识别技术对多模态和上下文理解能力的持续突破，正在推动语言服务从被动转录向主动智能理解转变。未来，如何将识别结果无缝转化为实际业务行动，将是价值释放的关键。

详见🔗 bailian.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2979031
ModelScope演示🔗 modelscope.cn/studios/Qwen/Qwen3-ASR-Demo
Hugging Face演示🔗 huggingface.co/spaces/Qwen/Qwen3-ASR-Demo
技术博客🔗 qwen.ai/blog?id=41e4c0f6175f9b004a03a07e42343eaaf48329e7&from=research.latest-advancements-list

#语音识别# #多语言AI# #智能客服# #教育科技# #阿里巴巴AI#

发布于北京