看到一篇文章,据Science杂志2025年5月14日报道,美国国家健康与营养考察调查(NHANES)是一个公开的美国健康数据集,包含超过13万人的健康检查、血液检测和访谈数据,涵盖饮食习惯及其他健康相关信息。该数据库数据质量不高,但自2022年起,利用NHANES数据的低质量论文数量急剧增加。这些论文不仅质量低下,还可能由“论文工厂”(出售论文署名权的商业实体)推动,并通过AI生成文本辅助完成,威胁学术研究的真实性和可靠性。据说国内有几个培训团队做NHANES的挖掘。
这些论文通常遵循固定模式:选择一种健康状况、一个可能相关的环境或生理因素,以及特定人群(如研究65岁以上男性维生素D水平与抑郁症的关系,或18至45岁女性牙齿健康与糖尿病的关系)。批评者指出,这种模式像是“研究填空游戏”,通过不断替换变量生成新“发现”。
许多NHANES论文选择性分析数据(如限定特定年份或年龄段),以追求统计显著性结果。这种“数据钓鱼”行为导致大量虚假阳性结果。
批评者指出,NHANES并非唯一易受滥用的数据集。全球疾病负担研究(Global Burden of Disease)也同样可能被类似方式利用。
此外,根据“美国Healsan”的分析,利用美国NHANES数据库发表论文的国家中,中国学者发表了第二多的论文,高达7596篇(全球总计17515篇被Medline收录)。
**—***—****—*****
我赶紧查了一下我微博转发的文献解读,果然很多营养相关论文(咖啡、维生素、运动之类)都是用NHANES数据库生产的,过去一年就转发了15篇[允悲] #注册营养师[超话]#
发布于 辽宁
