贝乐斯微博 25-11-13 13:15

是的,这是个很好的条件概率/贝叶斯例子。


• D:患糖尿病;Dep:患抑郁症
• 已知 P(Dep)=0.05,P(Dep\mid D)=0.25
• 令 p=P(D)(糖尿病在人群中的患病率)

1) 反向条件概率(很多人会混淆的那个)

P(D\mid Dep)=\frac{P(Dep\mid D)\,P(D)}{P(Dep)}=\frac{0.25\,p}{0.05}=5p
举例:如果糖尿病总体患病率 p=10\%,那么
P(D\mid Dep)=5\times 10\%=50\%。
如果 p=6\%,则 P(D\mid Dep)=30\%。

2) 非糖尿病者中的抑郁率

用全概率:
P(Dep)=P(Dep\mid D)P(D)+P(Dep\mid \overline D)(1-p)
\Rightarrow\ P(Dep\mid \overline D)=\frac{0.05-0.25p}{1-p}
例如 p=10\% 时,P(Dep\mid \overline D)=\frac{0.05-0.025}{0.9}\approx2.78\%。

3) 相对风险(RR)

RR=\frac{P(Dep\mid D)}{P(Dep\mid \overline D)}=\frac{0.25}{\frac{0.05-0.25p}{1-p}}
当 p=10\% 时,RR\approx 0.25/0.0278\approx 9:糖尿病患者的抑郁风险约为非糖尿病者的 9 倍(在上述基线下)。

要点
• 25% 是 P(Dep\mid D),并不是 “抑郁者中有 25% 患糖尿病”(即 P(D\mid Dep))。
• 用贝叶斯公式把“正向”条件概率翻到“反向”时,基线患病率 P(D) 是决定性因素。

发布于 新西兰