《易混淆概念辨析5:率-比,发病率-患病率,相对危险-比值比》
在近期有关疫苗大体观察的系统综述报道中,人们或已深刻认识到研究设计、指标计算对结果解读的重要性。现不妨以LongCovid(LC)为例,再谈谈发病率vs患病率、队列研究vs病例-对照研究&相对危险(RR)vs比值比(OR)这些概念的区别。在解读有关文献报道中,这些数值意义的理解十分重要。
此前我和众多近领域博主已阐述过发病率和患病率的区别。
当我们想知道,在sc2感染后,有多大的概率会发生lc,需要关注的是发病率;而当我们想知道,当前(某一时段内)某地区有多少人患有lc时,需要关注的是患病率。如果混淆这两个概念,就会有错误的解读。
假设某地区在一段较短时间内(例如6-12月)发生过3波covid疫情,如果规模接近,且病毒“毒力”一致,那么每个人感染后发生lc的概率(一般是10%-15%)通常是相同的,而由于每一波过后以同样“速率”产生新的lc患者,考虑lc康复的缓慢,lc在地区的患病率或会增加(“水池效应”)——除非每一波疫情得病的都是同一波人,那过于不符合实际。
错误的类型有两种。第一种是完全把患病率理解为发病率,由于患病率在不断波动,误认为感染后发生lc的概率在变化;第二种是混淆两种报道,如果冲击规模较小(较大),患病率往往低于(高于)常说的10%-15%,误认为感染后lc概率发生了变化。
对于个人来说,许多人会关注lc的发病率,因为它衡量“我个人会因为sc2感染多大概率患上lc”;对于社会来说,决策者往往会关注lc的患病率,例如关注过高的患病率对于劳动力的影响,因为它衡量“一个地区有多少人正在患有lc”。
RR和OR是另一个比较难理解的概念,尤其是后者概念的抽象。在一些科普视频里,通常会说“前瞻性研究用RR,回顾性研究用OR”,但很少详细地说明为什么要这样做。这里还涉及一个问题,即准确地说RR适用于队列研究,OR适用于病例对照研究,但队列研究也可以有回顾性的设计,这方面本文不另作讨论。
RR是一个比较容易理解的概念。举个例子,我们想知道接种sc2疫苗会否减少sc2感染后lc的发病率,以下图1(注⭐:数据为示例用,不是真实数据!下同)为例,纳入一批明确是否接种疫苗的sc2感染者,很容易计算得未接种和接种者的发病率分别是8/52=15.4%和5/43=11.6%,那么发病率的比值15.4%/11.6%=1.33即为RR。
OR的概念非常抽象,如它的名字“比值比”,它首先涉及另一个概念区别,即率和比(值)的区别。“率”衡量总体中有多少个体符合某种特征,而同样总体下,“比(值)”是总体中符合某种特征和不符合某种特征的个体数量相除——比的意义在这样的条件下很不直观,但如果换作其他主题,例如某地区人口数与医院数的比,就很容易理解,反映医疗资源的享有量。
在病例-对照研究中,研究者设计组别时,会纳入一定数量的病例数(患lc)和对照数(无lc)。如图2所示,假设研究纳入的病例和对照各为100,图中可以获得2个比值,即未接种人群中的74/54=1.37和接种人群中的26/46=0.57,而这两个比值的比(“比值比(OR)”的由来)即为1.37/0.57=2.40。或许有人会说,我们一般作比值比是算两个组的暴露比,再计算暴露比的比值,即74/26=2.85和54/46=1.17,然后2.85/1.17=2.43,这两者去掉四舍五入影响结果是一样的,计算上与除法的性质有关,可以算是两种角度的理解。
在病例-对照的设计下,虽然RR更为直观,却是不可计算的,因为发病率不可能计算,只有OR可以计算。如果把图2表格中数字硬算发病率,会发现未接种和接种的发病率分别为57.8%和36.1%,远远高出10%-15%,虽然数据是假设的,但在真实研究中会有一样的现象。这是因为病例-对照研究设计强行规定了要在病例组纳入相同的100例lc病例和100例非lc对照,这“破坏”了病例和对照存在的数量区别。
RR和OR之间有什么关联呢?虽然RR明显不适用于病例对照设计,但OR的确是队列设计中可以计算的。从公式上可以看出,如果队列中病例数相比非病例数而言很小(一般认为<5%),RR和OR的差别不大。
而上述RR和OR差别是否可以体现出统计差异,对于四格表数据自然是采用Fisher精确检验,两者的95%置信区间也一般可以被几种方式评估出来,其范围是否包含1一般能和P值是否<0.05对应。
需要注意的是,在上述结果的基础上,更进一层的讨论是接种疫苗可能会直接使感染风险下降,感染风险的下降会直接影响lc患病率(因为不感染就不会lc),因此这一前提存在的条件下去谈论“感染后lc的风险”会显得过于片面。
