在宣布“全面投入 AI 生物学”并吸纳 EvolutionaryScale 团队六个月后,Priscilla Chan(普莉希拉·陈)与 Mark Zuckerberg(马克·扎克伯格)创立的 Biohub 于 5 月 27 日发布了三款蛋白质语言模型,这些模型共同构成该机构所称的蛋白质生物学“世界模型”。
这一面向全球研究者开放的发现引擎由三项核心发布组成:ESMC、ESMFold2 和 ESM Atlas。三者共同旨在描绘生命树上的蛋白质、预测其结构,并设计可在实验室中发挥作用的新型蛋白结合物。
ESMC(Evolutionary Scale Modeling Cambrian)是一款语言模型,训练数据覆盖约 28 亿条蛋白序列,来源包括深层土壤细菌、极端环境生物,以及人体内超过 2 万种蛋白类型。模型学习到的序列表示将通过 ESMFold2 设计引擎转化为三维生物大分子复合物。http://t.cn/AX6RPSrJ
发布于 上海
