爱范儿 26-04-09 10:58
微博认证:爱范儿官方微博

【#Grok成目前幻觉最小的模型#】

据科技分析账号 X Freeze 披露的数据,xAI 旗下大语言模型 Grok 4.20 的无幻觉率指标进一步提升至 83%,在拒绝捏造事实方面超越了当前市场主流竞品。

据悉,Grok 4.20 的无幻觉率在 3 月下旬创下 78% 的记录后,现已攀升至 83%,位列全球第一。

与部分 AI 模型在面对未知问题时倾向于生成虚构信息的机制不同,Grok 4.20 主要通过直接回复「我不知道」的策略来有效规避幻觉的产生。

对比测试显示,在同等测试条件下,Grok 4.20 的无幻觉率成绩大幅领先于 Anthropic 的 Claude Opus 4.6、Google 的 Gemini 3.1 以及 OpenAI 的 GPT-5.4等业界核心头部模型。

值得关注的是,排名前 5 的模型里,包含了智谱 GLM-5.1、小米的 MiMo-V2-Pro 以及千问 Qwen3.6 Plus。