看到一篇文章，据Science杂志2025年5月14日报道，美国国家健康与营养考察调查（NHANES）是一个公开的美国健康数据集，包含超过13万人的健康检查、血液检测和访谈数据，涵盖饮食习惯及其他健康相关信息。该数据库数据质量不高，但自2022年起，利用NHANES数据的低质量论文数量急剧增加。这些论文不仅质量

看到一篇文章，据Science杂志2025年5月14日报道，美国国家健康与营养考察调查（NHANES）是一个公开的美国健康数据集，包含超过13万人的健康检查、血液检测和访谈数据，涵盖饮食习惯及其他健康相关信息。该数据库数据质量不高，但自2022年起，利用NHANES数据的低质量论文数量急剧增加。这些论文不仅质量低下，还可能由“论文工厂”（出售论文署名权的商业实体）推动，并通过AI生成文本辅助完成，威胁学术研究的真实性和可靠性。据说国内有几个培训团队做NHANES的挖掘。

这些论文通常遵循固定模式：选择一种健康状况、一个可能相关的环境或生理因素，以及特定人群（如研究65岁以上男性维生素D水平与抑郁症的关系，或18至45岁女性牙齿健康与糖尿病的关系）。批评者指出，这种模式像是“研究填空游戏”，通过不断替换变量生成新“发现”。

许多NHANES论文选择性分析数据（如限定特定年份或年龄段），以追求统计显著性结果。这种“数据钓鱼”行为导致大量虚假阳性结果。

批评者指出，NHANES并非唯一易受滥用的数据集。全球疾病负担研究（Global Burden of Disease）也同样可能被类似方式利用。

此外，根据“美国Healsan”的分析，利用美国NHANES数据库发表论文的国家中，中国学者发表了第二多的论文，高达7596篇（全球总计17515篇被Medline收录）。

**—***—****—*****

我赶紧查了一下我微博转发的文献解读，果然很多营养相关论文（咖啡、维生素、运动之类）都是用NHANES数据库生产的，过去一年就转发了15篇[允悲] #注册营养师[超话]#

发布于辽宁