陳建仁昨天以「失真的調查:從假陽性個案談起」為題發文,談到近期彰化縣展開COVID-19的血清流行病學調查,以瞭解縣民感染COVID-19的盛行率。陳建仁說,該調查採集受檢個案的血液檢體,進行COVID-19抗體的檢驗,判定每名個案是否陽性,來估計彰化縣民的抗體陽性盛行率。但是,血清流行病學調查的正確性,決定於:1、檢驗方法的敏感度和特異度;2、檢驗抗體陽性的盛行率;3、受檢個案的代表性。
接著陳建仁一一說明3項因素可能涉及的問題, 並以2張圖表解釋。 以下為臉書全文:
檢驗方法的敏感度(Sensitivity)是指真正得到感染的人,有多少百分比呈現陽性;特異度(Specificity)是指真正沒有得到感染的人,有多少百分比呈現陰性。假陽性率是指真正沒有得到感染的人,有多少百分比呈現陽性,也就是1-specificity。假陰性率是指真正得到感染的人,有多少百分比呈現陰性,也就是1-sensitivity。血清流行病學調查所得到的檢測陽性盛行率,受到真正陽性率的高低,以及敏感度和特異度的高低的影響。一般而言,敏感度越低、特異度越低、盛行率越低,調查估計出來的檢測盛行率也越嚴重失真。
我們舉例檢測5萬人的調查來看,如表1所示,如果敏感度和特異度都是99%,在每萬人盛行率分別是「1,10,100」的3種狀況下,真正感染人數分別是「5,50,500人」;真正未感染人數分別是「49995,49950,49500人」。由於敏感度是99%,所以在3種狀況下,真正感染檢測呈陽性人數分別是「5,50,495人」。由於特異度是99%,也就是真正未感染的人會有1%呈假陽性,所以在3種狀況下,假陽性人數分別是「500,500,495人」。
因此,利用陽性人數(無法分辨真假)來估計3種狀況下每萬人檢測盛行率,分別是 「101,110,198」。也就是說,檢測盛行率高估倍數(g欄)竟高達到「101倍,11倍,2倍」。換句話說,盛行率越低,錯誤高估盛行率的失真現象越嚴重。
另外,如表2所示,如果真正盛行率是千分之1,敏感度是99%,在檢驗特異度分別是「90%,99%,99.9%」的3種狀況下,檢測真陽性人數都是50人;但是檢測假陽性人數分別是「4995,500,50人」。因此這3種狀況下的每萬人檢測盛行率,分別「1009,110,20」。換句話說,檢測盛行率高估倍數也高達到「101,11倍,2倍」。換句話說,特異度越低,錯誤高估盛行率的失真現象越嚴重。
從以上的例子可以看出,盛行率調查研究的特異度越低或真正盛行率越低,檢測盛行率也就越容易被高估,也越會失真!雖然研究者可以利用敏感度和特異度來進行調整,推算出真正盛行率[真正盛行率=(檢測盛行率+特異度-1)/(敏感度+特異度-1)]!但是,除非利用更特異的方法再做確認,否則調查者必須告訴每個陽性個案,他真正感染的機率只有50%,10%或1%。
同樣的,在入境旅客的抗原篩檢策略上,如果盛行率相當低而特異度無法提升到非常高的情況下,進行普篩而非精篩,也需要注意假陽性的問題。
(取自陳建仁 Chen Chien-Jen臉書)