【DeepMind团队独家揭秘AlphaGenome内幕:两年攻坚,让AI读懂基因组98%的非编码区】
当 2003 年人类#基因组测序# 首次完成时,我们获得了一本厚达 30 亿个遗传字母的“天书”,却发现自己只能读懂其中 2% 的“文字”(编码区),剩下的 98% 被称为基因组的“暗物质”。
近日,由谷歌旗下 #DeepMind# 公司开发的人工智能模型 AlphaGenome 登上 Nature 封面。该模型主要用于理解 DNA 序列如何调控基因,帮助科学家发现为什么我们 DNA 中的细微差异会让我们面临高血压、痴呆症和肥胖症等疾病的风险。
DeepMind 于 2025 年 6 月首次在 bioRxiv 发布 AlphaGenome 的预印本,并开放 API 预览。但模型在 Nature 正式发表后,团队同时宣布了完全开源研究代码和模型权重。
AlphaGenome 是 DeepMind 继 #AlphaFold# 之后的又一力作。
该模型的核心优势在于其统一预测能力:它能一次性输入长达 100 万个碱基对的 DNA 序列,以单个碱基分辨率同时输出数千种功能基因组特征,包括基因表达水平(RNA-seq、CAGE)、RNA 剪接位点与强度、染色质开放性、组蛋白修饰、转录因子结合位点以及染色质三维接触图。通过对比突变序列与野生型序列,AlphaGenome 能在几秒内高效评分遗传变异的功能影响,这在过去往往需要数年湿实验验证。
戳链接查看详情:http://t.cn/AXqOIyAD
