llama.cpp 的 Qwen3 PR 也合并了,同样是两个模型:
Qwen3 (Qwen3-8B?) 和 Qwen3-MoE (Qwen3-MoE-15B-A2B?)
万事俱备,只欠东风
PR地址:github.com/ggml-org/llama.cpp/pull/12828/files#diff-3fee8194c9caff1143673fd93c3edb2f9269ed27488a66a49fb6a3c186a15599
#AI生活指南# #ai创造营#
发布于 日本
