麻省理工科技评论 25-02-21 19:18
微博认证:《麻省理工科技评论》杂志官方微博

【首个能读懂所有物种DNA的模型问世,Arc、斯坦福、英伟达等联合打造,可预测基因致病性、设计人工基因组】

在生命科学研究中,#DNA# 序列承载着从最简单的细菌到最复杂的人类所有生命形式的遗传信息。然而,预测和理解这些序列的功能一直是生物学家面临的重大挑战。

比如,判断一个基因突变是否会导致疾病,或者设计一个能在特定细胞中精确表达的基因序列,往往需要耗费大量的时间和资源进行实验验证。

2 月 19 日,Arc 研究所联合美国#斯坦福大学# 、美国加州大学伯克利分校、美国加州大学旧金山分校以及英伟达,发布了一个突破性的 AI 模型 #Evo2# 。这个被称为“生物基础模型”的系统,首次实现了对生命三大领域(原核生物、古细菌和真核生物)的 DNA 序列进行统一建模。

更重要的是,它能够“读写思考”DNA 语言,不仅可以预测序列的功能,还能设计具有特定功能的新序列。Evo 2 最大的突破在于它的训练数据规模。研究团队构建了名为 OpenGenome2 的数据集,收录了 9.3 万亿个核苷酸序列,几乎囊括了地球上所有已知的生命形式。

戳链接查看详情:http://t.cn/A61X1nLF