XuanyuanTechnologyReview 26-03-23 11:04

“阿尔法折叠”首次大规模纳入蛋白结构预测数据
3月17日最新发布的“阿尔法折叠”数据集首次大规模纳入蛋白质复合物结构预测数据,这一成果由欧洲分子生物学实验室的欧洲生物信息学研究所、谷歌旗下“深度思维”公司、英伟达和韩国首尔大学四方合作完成,形成迄今规模最大的蛋白质复合物预测数据集。
自2021年开放以来,“阿尔法折叠”数据集已收录约2亿个单个蛋白质结构预测结果。新数据集首次系统性纳入蛋白质复合物结构预测数据,新增170万个高置信度的同源二聚体(由两个相同蛋白质组成的复合物)结构,为理解蛋白质如何通过相互作用发挥生命功能提供了重要基础。该数据集还优先收录了与人类健康和疾病研究密切相关的蛋白质。预测蛋白质复合物结构的难度远高于单体结构,对算力需求极高。
据介绍,“阿尔法折叠”数据集未来还将进一步扩展,计划加入由两个不同蛋白质组成的异源二聚体结构预测。

发布于 北京