《易混淆概念辨析5：率-比，发病率-患病率，相对危险-比值比》在近期有关疫苗大体观察的系统综述报道中，人们或已深刻认识到研究设计、指标计算对结果解读的重要性。现不妨以LongCovid(LC)为例，再谈谈发病率vs患病率、队列研究vs病例-对照研究&相对危险(RR)vs比值比(OR)这些概念的区别。在解读有关

《易混淆概念辨析5：率-比，发病率-患病率，相对危险-比值比》

在近期有关疫苗大体观察的系统综述报道中，人们或已深刻认识到研究设计、指标计算对结果解读的重要性。现不妨以LongCovid(LC)为例，再谈谈发病率vs患病率、队列研究vs病例-对照研究&相对危险(RR)vs比值比(OR)这些概念的区别。在解读有关文献报道中，这些数值意义的理解十分重要。

此前我和众多近领域博主已阐述过发病率和患病率的区别。
当我们想知道，在sc2感染后，有多大的概率会发生lc，需要关注的是发病率；而当我们想知道，当前(某一时段内)某地区有多少人患有lc时，需要关注的是患病率。如果混淆这两个概念，就会有错误的解读。
假设某地区在一段较短时间内(例如6-12月)发生过3波covid疫情，如果规模接近，且病毒“毒力”一致，那么每个人感染后发生lc的概率(一般是10%-15%)通常是相同的，而由于每一波过后以同样“速率”产生新的lc患者，考虑lc康复的缓慢，lc在地区的患病率或会增加(“水池效应”)——除非每一波疫情得病的都是同一波人，那过于不符合实际。
错误的类型有两种。第一种是完全把患病率理解为发病率，由于患病率在不断波动，误认为感染后发生lc的概率在变化；第二种是混淆两种报道，如果冲击规模较小(较大)，患病率往往低于(高于)常说的10%-15%，误认为感染后lc概率发生了变化。
对于个人来说，许多人会关注lc的发病率，因为它衡量“我个人会因为sc2感染多大概率患上lc”；对于社会来说，决策者往往会关注lc的患病率，例如关注过高的患病率对于劳动力的影响，因为它衡量“一个地区有多少人正在患有lc”。

RR和OR是另一个比较难理解的概念，尤其是后者概念的抽象。在一些科普视频里，通常会说“前瞻性研究用RR，回顾性研究用OR”，但很少详细地说明为什么要这样做。这里还涉及一个问题，即准确地说RR适用于队列研究，OR适用于病例对照研究，但队列研究也可以有回顾性的设计，这方面本文不另作讨论。

RR是一个比较容易理解的概念。举个例子，我们想知道接种sc2疫苗会否减少sc2感染后lc的发病率，以下图1(注⭐：数据为示例用，不是真实数据！下同)为例，纳入一批明确是否接种疫苗的sc2感染者，很容易计算得未接种和接种者的发病率分别是8/52=15.4%和5/43=11.6%，那么发病率的比值15.4%/11.6%=1.33即为RR。

OR的概念非常抽象，如它的名字“比值比”，它首先涉及另一个概念区别，即率和比(值)的区别。“率”衡量总体中有多少个体符合某种特征，而同样总体下，“比(值)”是总体中符合某种特征和不符合某种特征的个体数量相除——比的意义在这样的条件下很不直观，但如果换作其他主题，例如某地区人口数与医院数的比，就很容易理解，反映医疗资源的享有量。
在病例-对照研究中，研究者设计组别时，会纳入一定数量的病例数(患lc)和对照数(无lc)。如图2所示，假设研究纳入的病例和对照各为100，图中可以获得2个比值，即未接种人群中的74/54=1.37和接种人群中的26/46=0.57，而这两个比值的比(“比值比(OR)”的由来)即为1.37/0.57=2.40。或许有人会说，我们一般作比值比是算两个组的暴露比，再计算暴露比的比值，即74/26=2.85和54/46=1.17，然后2.85/1.17=2.43，这两者去掉四舍五入影响结果是一样的，计算上与除法的性质有关，可以算是两种角度的理解。
在病例-对照的设计下，虽然RR更为直观，却是不可计算的，因为发病率不可能计算，只有OR可以计算。如果把图2表格中数字硬算发病率，会发现未接种和接种的发病率分别为57.8%和36.1%，远远高出10%-15%，虽然数据是假设的，但在真实研究中会有一样的现象。这是因为病例-对照研究设计强行规定了要在病例组纳入相同的100例lc病例和100例非lc对照，这“破坏”了病例和对照存在的数量区别。

RR和OR之间有什么关联呢？虽然RR明显不适用于病例对照设计，但OR的确是队列设计中可以计算的。从公式上可以看出，如果队列中病例数相比非病例数而言很小(一般认为＜5%)，RR和OR的差别不大。
而上述RR和OR差别是否可以体现出统计差异，对于四格表数据自然是采用Fisher精确检验，两者的95%置信区间也一般可以被几种方式评估出来，其范围是否包含1一般能和P值是否＜0.05对应。

需要注意的是，在上述结果的基础上，更进一层的讨论是接种疫苗可能会直接使感染风险下降，感染风险的下降会直接影响lc患病率(因为不感染就不会lc)，因此这一前提存在的条件下去谈论“感染后lc的风险”会显得过于片面。

发布于上海