要的就是没有幻觉! 百川智能刚刚发布了 Baichuan-M3-235B!
给大家带来 Baichuan-M3-235B 模型解读~
这个模型最大的进步是优化了幻觉问题, 现在的医疗AI总是给出"建议尽快就医"这种模糊回答? 因为大模型在医疗场景下最怕的就是"幻觉", 一旦胡说八道后果不堪设想, 所以只能保守输出. Baichuan-M3-235B 通过技术手段优化了幻觉问题.
核心是两个技术创新:
第一个是 SPAR 分段管道强化学习, 把临床流程拆成病史采集、鉴别诊断、实验室检查、最终诊断四个阶段, 每个阶段都有独立奖励, 这样模型就能学会完整的临床决策逻辑, 而不是只会回答单个问题.
第二个是 Fact-Aware RL 事实感知强化学习, 在训练过程中直接集成了在线幻觉检测模块, 实时对照权威医学证据库验证模型输出. 结果就是, 即使不借助外部工具, M3 的幻觉率也比 GPT-5.2 还低.
跑分方面在 OpenAI 的权威医疗评测 HealthBench 上直接超越了 GPT-5.2, HealthBench-Hard 拿到 44.4 分, 比上一代 M2 提升了整整 28 个百分点! 更厉害的是, 在端到端临床决策评测 SCAN-bench 上, M3 是唯一一个在临床问诊、实验室检测、最终诊断三个维度都拿到第一的模型, 临床问诊能力领先第二名 12.4 分!
部署方面也很友好, W4 量化后内存只需要原来的 26%, Gated Eagle3 推测解码还能带来 96% 的推理加速, 我刚刚实测的时候感觉速度也是相当可以的. 一会给大家带来实测内容.
模型地址: huggingface.co/baichuan-inc/Baichuan-M3-235B
#ai生活指南##ai创造营#
