karminski-牙医 25-05-21 11:10
微博认证:AI博主

给大家整理下 Google I/O 2025 的开源模型列表,这个是MedGemma:

MedGemma 发布了3个开放权重模型:
medgemma-4b-pt (基座模型,8.6GB)
medgemma-4b-it (微调模型,多模态,适合医学影像诊断,8.6GB)
medgemma-27b-text-it (纯文本输入,适合问诊和病历输入 53.97GB)

当然顾名思义这是个医疗领域模型。是 Gemma3 的医学文本和医学图像理解变种。可以理解为专门看报告和看片子的模型。

文本模型输入上下文长度为 128K,输出为8K。多模态模型图像被归一化到 896 x 896 分辨率,并编码为每个 256 个 token,输出仍然是8K。

官方描述为:MedGemma 4B 采用了在多种去识别化医学数据上专门预训练的 SigLIP 图像编码器,包括胸部 X 光片、皮肤科图像、眼科图像和病理切片。其 LLM 组件在多样化的医学数据上进行训练,包括放射科图像、病理切片、眼科图像、皮肤科图像和医学文本。

跑分数据我给大家截图了。但说实话我对这个跑分毫无感知,25分比30分更能看出结节吗?不知道。想要真正使用的同学还是建议多询问专业医生。

模型地址:huggingface.co/google/medgemma-27b-text-it
repo: github.com/google-health/medgemma

#ai创造营##AI生活指南#

发布于 日本