爱可可-爱生活
23-03-29 08:34 微博认证:AI博主 2025微博新锐新知博主

【MuAViC:第一个针对音频-视频语音翻译的基准测试,包含约1,200小时的跨9种语言的转录数据。AV-HuBERT模型使用视觉信息来提高英语语音识别任务的性能,并使用MuAViC进行训练以在含噪和具有挑战性的环境中进行语音翻译,优于其他领先的翻译模型】《MuAViC: The first audio-video speech translation benchmark》 http://t.cn/A6C9fa1F #机器学习# http://t.cn/A6CF5d5W

发布于 北京