腾讯的Hy-MT2翻译模型据说不错,而且1.8B的模型只有440M,普通机器也能跑。
30B-A3B大一些,但是效果非常好。
Hy-MT2 是一系列专为复杂现实场景设计的“快思考”多语言翻译模型。该系列包含三种模型规模:1.8B、7B 和 30B-A3B(MoE),均支持 33 种语言之间的互译,并能有效遵循多种语言的翻译指令。
针对端侧部署,AngelSlim 的 1.25-bit 极致量化技术将 1.8B 模型的存储需求降至仅 440 MB,同时推理速度提升 1.5 倍。
多维度评估表明,Hy-MT2 在通用翻译、真实业务场景、领域特定任务以及指令遵循翻译任务中均表现出色。
其中,7B 和 30B-A3B 模型在“快思考”模式下优于 DeepSeek-V4-Pro、Kimi K2.6 等开源模型,而轻量级的 1.8B 模型整体表现也超越了微软、豆包等主流商业 API。
模型地址:www.modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2
发布于 江苏
