给大家整理下 Google I/O 2025 的开源模型列表,这个是MedGemma:
MedGemma 发布了3个开放权重模型:
medgemma-4b-pt (基座模型,8.6GB)
medgemma-4b-it (微调模型,多模态,适合医学影像诊断,8.6GB)
medgemma-27b-text-it (纯文本输入,适合问诊和病历输入 53.97GB)
当然顾名思义这是个医疗领域模型。是 Gemma3 的医学文本和医学图像理解变种。可以理解为专门看报告和看片子的模型。
文本模型输入上下文长度为 128K,输出为8K。多模态模型图像被归一化到 896 x 896 分辨率,并编码为每个 256 个 token,输出仍然是8K。
官方描述为:MedGemma 4B 采用了在多种去识别化医学数据上专门预训练的 SigLIP 图像编码器,包括胸部 X 光片、皮肤科图像、眼科图像和病理切片。其 LLM 组件在多样化的医学数据上进行训练,包括放射科图像、病理切片、眼科图像、皮肤科图像和医学文本。
跑分数据我给大家截图了。但说实话我对这个跑分毫无感知,25分比30分更能看出结节吗?不知道。想要真正使用的同学还是建议多询问专业医生。
模型地址:huggingface.co/google/medgemma-27b-text-it
repo: github.com/google-health/medgemma
#ai创造营##AI生活指南#
发布于 日本
