爱可可-爱生活
25-08-18 14:07 微博认证:AI博主 2025微博新锐新知博主

MedSigLIP:面向医疗影像与文本的多模态编码模型,助力医疗 AI 应用快速落地
• 基于 SigLIP 变体,联合训练 4 亿参数视觉编码器与 4 亿参数文本编码器,实现医疗图像与文本的统一嵌入空间。
• 支持 448×448 分辨率图像及最多 64 个文本 token,专注于医疗影像解析,适合数据高效分类、零样本分类及语义图像检索。
• 不支持文本生成,需生成文本时推荐使用 MedGemma,明确区分应用场景,提升模型匹配度与性能。
• 提供 Hugging Face、Vertex AI 集成示例及容器部署方案,方便开发者快速试用与落地。
• 开源许可采用 Apache 2.0,鼓励社区贡献代码、报告问题及提交 PR,推动医疗 AI 模型生态健康发展。
• 适合医疗影像诊断辅助、智能检索等应用,显著降低跨模态学习门槛,提升医疗智能化水平。

详细资料与代码👉 github.com/Google-Health/medsiglip
#医疗人工智能# #多模态学习# #医疗影像# #开源模型# #AI赋能医疗#

发布于 北京