M3E Models :Moka(北京希瑞亚斯科技)开源的系列文本嵌入模型。
模型下载:huggingface.co/moka-ai/m3e-base
M3E Models 是使用千万级 (2200w+) 的中文句对数据集进行训练的 Embedding 模型,在文本分类和文本检索的任务上都超越了 openai-ada-002 模型。
其数据集,模型,训练脚本,评测框架都开源。
开发者之一是 @疯狂的突然抬头
发布于 山东
