cohere这家公司还挺有名的,很早就在搞AI了。
没想到,最近他们开源发布了一个语音转录的模型,只有2B大小。
消费级显卡肯定是可以跑的。
该模型支持 14 种语言:英语、德语、法语、意大利语、西班牙语、葡萄牙语、希腊语、荷兰语、波兰语、阿拉伯语、越南语、中文、日语和韩语。
看评分,是ElevenLabs 和Qwen3 ASR强有力的竞争者。
甚至可以量化后用于电脑、手机,来进行语音转录。
模型地址:www.modelscope.cn/models/CohereLabs/cohere-transcribe-03-2026/summary
发布于 江苏
