多次疾病检测是花冤枉钱吗?多重检验的必要性!
发布时间:2023-11-03 

概率是一种高效的判断工具,并在解决不确定性问题时发挥着至关重要的作用。防疫检测就像一场复杂的迷宫冒险,需要概率工具来引导我们找到正确的结果。先验概率为我们提供了一个理性的开始,可以通过已知信息合理地预测可能的结果。而后验概率,则是根据当前观察到的实际数据,动态地调整事件发生的概率估计。

使用贝叶斯的观点,假设随机变量A拥有n种互斥的结果A1,A2, …,An,如果人们无法直观探测到究竟发生了哪一种情况,便会对其进行检测,结果记为 B。通常来说,检测也是有误差的,但我们常常可以通过过往的经验得知误差的先验概率。如果根据已知检测结果B而去计算事件结果为的概率,则被称为后验概率

贝叶斯公式告诉我们,后验概率可以利用已知的先验概率计算得出:

例如,人群新冠感染率(被感染)为先验概率,对于一个感染了新冠的人核酸检测的结果为阳的条件概率为(核酸阳|被感染),已知核酸检测为阳性的受试者是否被感染(被感染|核酸阳)便是后验概率。
在防疫检测中,贝叶斯公式会计算得到一些与直觉相悖的数学事实,例如我们假想一个场景:

1)现在已知一种疾病,在人群中的自然发病率(也即从人群中随机挑选到患者的概率)为0.1%。某人担心自己患病,前去医院进行血检,发现结果为阳性。现在已知血检过程中,由机器误差导致的假阴性率与假阳性率都为 1%(患病之后血检为阴性的条件概率(血检阴|患病)称为假阴性率,不患病但血检为阳性的条件概率(血检阳|未患病)称为假阳性率),那么我们可以求出此人在血检阳性后的确患病的概率。在血检阳性后,其患病的后验概率可以通过贝叶斯公式计算得知:

这是一个与直觉非常不相符的低概率,具体原因我们将在后面讲到。

2)为了确认自己是否真的患病,此人又在医院的建议下又做了尿检,发现结果仍然为阳性。现在已知在血检阳性后,进行尿检的假阴性率与假阳性率都为 5%,这时我们可以进一步计算这个人在血检与尿检均阳性后的确患病的概率。注意到在血检阳性后,整个事件被调整为"血检阳的条件下患病与否",此时"在血检阳的条件下患病"与 "在血检阳的条件下不患病"是该事件的全部结果。进一步尿检阳性后,其患病的后验概率可以通过贝叶斯公式计算得知:

可以看到,再经过了一个精度更低的检查后,该人的实际患病概率却大幅度提高了,产生这个现象的原因是第一步的先验概率大幅度提高了。在贝叶斯理论中,先验概率是可以被后验概率修正的,人们以此得到更精准的先验知识。

3)再考虑如下场景:假如经过遗传病学排查,发现此人是家族遗传的易感者,其家族的自然发病率实为1%,我们可以重新计算这个人在血检与尿检均阳性后的确患病的概率。当此人为家族遗传易感者,自然患病率应在计算中被调整为家族自然患病率,重新计算以上两式,可以得知:

以上计算结果强调了多重检验在提高确诊的后验概率方面的关键作用。对于低疾病发病率的人群,即使使用高准确性的检测方法(如血检,假阳性率和假阴性率均为1%),误诊的风险仍然相当高,例如,在第一次检测中,血检可能会导致高达91%的误诊率。这背后的本质是:固然检测准确性较高,但相对于其假阳性率,人群中的真实患者比例更小,这会导致检测出的假阳性人数较多。然而,如3)所示,在高疾病发病率的人群中,误诊率明显降低。

在新冠疫情防控中,抗原检测呈阳性后立即进行核酸检测或进行多次抗原检测以确认结果已成为常规操作。同时,专家建议在低疾病发病率地区谨慎使用准确性较低的抗原检测方法。这些实践与贝叶斯公式相符,分别印证了:a) 多重检测可以修正不实先验估计对结果产生的不良影响;b) 先验概率尺度相较于机器误差尺度较小时,频繁检测并非合理的方法。这些指导意见提供了在有效成本下尽可能准确地检测新冠阳性的方法,即使单次检测的假阳性率/假阴性率较高,多次交叉验证仍可以显著提高准确性。因此,多重检验不是在花冤枉钱!而是在用数学的方式降低错诊率,节省医疗成本、避免医疗资源浪费。
文:Fudan IICS, Complex Biological Dynamics (CBD) Group/卞诗瑞 、史际帆