是煦煦哟 25-10-12 06:00
微博认证:科技博主 超话小主持人(科技超话)

DNA搜索引擎MetaGraph重磅问世,为生命科学研究注入新动能

瑞士苏黎世联邦理工学院的科研团队在国际顶刊《自然》最新一期发表论文,正式宣告DNA搜索引擎MetaGraph研发成功。这款工具可对公共生物学数据库中的海量信息进行高速、高效检索,为生命科学领域提供了一款极具突破性的专业利器
过去数十年间,全球各类生物学数据库规模呈指数级爆发增长,但原始测序数据始终面临“碎片化分布、噪声干扰多、数据体量庞大”的三重难题。科学家往往需耗费大量精力处理数据,却难以高效提取核心有用信息,MetaGraph的诞生正是为精准破解这一长期制约行业发展的痛点。

该引擎跳出传统数据处理框架,创新性引入数学“图结构”理念。它能智能识别并联结相互重叠的DNA片段,其原理恰似图书索引将含相同关键词的句子串联起来,最终构建出一张完整的DNA序列知识网络,让原本分散孤立的数据产生深度关联价值。

研究团队整合了7个公共资助的权威生物学数据库,搭建起覆盖生命全谱系的索引体系。这张“数据地图”不仅囊括病毒、细菌、真菌,还涵盖植物、动物及人类,共收录1880万个独特的DNA与RNA序列集,以及2100亿个氨基酸序列集,为检索提供了全面且庞大的数据源支撑。

依托庞大的索引基础,MetaGraph具备两大核心功能优势:一是支持通过文本提示直接检索原始数据档案,在实现数据高度压缩的同时,确保关键信息可随时快速调取;二是打破技术壁垒,研究人员无需复杂操作,即可直接对“序列读取档案”(SRA)等存储库提出生物学问题,大幅降低了原始数据的使用门槛。

在性能测试中,团队借助MetaGraph对24万多个人类肠道微生物组样本展开扫描,目标是搜寻其中的抗生素耐药性遗传标记。仅依靠一台高性能计算机,整个分析过程约1小时便顺利完成;而采用传统工具执行同类任务,通常需要数天甚至数周时间,MetaGraph的效率优势堪称“革命性”。

对于这一成果,法国巴斯德研究所生物计算专家拉扬·希基给予高度评价,他指出MetaGraph的研发是生命科学领域的“重大突破”,为DNA、RNA及蛋白质序列等原始生物学数据的分析,设立了全新的行业标准。 http://t.cn/AXzonM79

发布于 福建