#谷歌DeepMind推出全新AI工具AlphaGenome:破解基因组“暗物质” 助力遗传病研究#
据英国《卫报》1月28日报道,谷歌DeepMind宣布推出名为**AlphaGenome**的人工智能模型,这一突破性工具能够一次性分析长达100万碱基对(相当于100万个DNA字母)的DNA序列,并预测基因突变如何干扰基因调控过程,有望显著加速对遗传疾病成因的理解,并为新型治疗方法铺平道路。
人类基因组约30亿个碱基对,其中只有约2%是直接编码蛋白质的“编码区”,其余98%是非编码区,曾被戏称为基因组的“暗物质”。科学家长期以来对这些区域的功能知之甚少,但大量证据显示,许多常见疾病——包括癌症、心脏病、自身免疫疾病以及部分精神健康问题——正是由这些非编码区的调控突变所驱动。
**AlphaGenome**正是针对这一长期难题而设计。它是一个统一的深度学习DNA序列模型,能够以单碱基对分辨率预测数千种功能基因组学轨迹,包括:
- 基因何时、何地在特定细胞类型中被激活或抑制;
- 突变是否会关闭某个基因、错误时间点开启基因,或改变基因表达强度;
- 哪些基因和哪些细胞类型受到具体突变的影响。
该模型在人类和鼠标的公共遗传学大数据集上进行训练,DeepMind研究人员表示,它可以帮助科学家绘制出不同组织(如神经细胞、肝细胞)中关键的遗传调控“地图”,并精准定位驱动癌症等疾病的重要突变位点。
DeepMind研究员Natasha Latysheva表示:“我们将AlphaGenome视为理解基因组功能元件作用的重要工具,希望它能加速我们对生命代码的基本理解。”
多家媒体和专家对这一进展给予高度评价:
- 英国伦敦大学学院(UCL)儿科血液肿瘤学教授Marc Mansour称,这项技术对他寻找癌症遗传驱动因素的工作而言是“一步改变游戏规则的进步”。
- 加拿大英属哥伦比亚大学研究员Carl de Boer指出,AlphaGenome不仅能判断突变是否影响调控,还能指明受影响的基因、影响方式及细胞类型,“最终目标是模型预测如此准确,以至于无需再做大量湿实验验证”。
- 埃克塞特大学统计遗传学家Gareth Hawkes强调:“非编码区占基因组98%,我们对那29.4亿个碱基对的作用理解非常有限。AlphaGenome在这方面取得的进展非常重要。”
虽然文章未公布具体的基准测试数据,但多方报道显示,DeepMind已在2025年6月发布预印本,并在2026年1月正式于《Nature》杂志发表相关论文,同时开源了模型代码和API,以供全球研究者使用和进一步改进。
专家们也提醒,尽管AlphaGenome代表了基因调控预测领域的重大飞跃,但要真正实现“无需实验验证”的理想状态,仍需科学界长期共同努力。
随着AlphaGenome的发布,AI在基因组学领域的应用正进入全新阶段。继AlphaFold彻底改变了蛋白质结构预测之后,DeepMind再次将“Alpha”前缀赋予一项可能重塑医学研究格局的技术。未来,它或将成为设计精准基因疗法、开发针对调控异常的新型药物的重要助力。
(综合《卫报》、DeepMind官方博客、《自然》杂志及多家科学媒体报道)
