2020年8月5日水曜日

ベイズの定理

統計学におけるベイズの定理は次のようなものです。

$$ P(B|A) = \frac{P(B)\cdot P(A|B)}{P(A)} $$ 
これはAが結果、Bが原因の場合に、原因が発生する確率P(B)(事前確率と呼ぶ)と原因の下で結果が発生する確率P(A|B)などから、結果が分かった場合に原因が発生していた確率P(B|A)(事後確率と呼ぶ)を計算するものです。

分かりにくいので例を挙げます。コロナウイルスの話で最近はよく目にするPCR検査についてです。

Aは検査が陽性という結果の事象、Bは実際に感染しているという原因を表す事象とすると、

P(B|A): 検査陽性だった人が実際に感染している確率
P(B): 感染している人の割合(罹患率:神のみぞ知る)
P(A|B): 感染している人が検査陽性になる確率(感度
P(A): 検査陽性の人の割合

となります。

最後のP(A)は以下のように計算できます。
\begin{eqnarray} P(A) &=& 検査陽性の割合 \\ &=& 感染かつ検査陽性の割合 + 非感染かつ検査陽性の割合 \\ &=& P(B) \cdot P(A|B) + (1 - P(B)) \cdot P(A|B^c) \\ &=& P(B) \cdot P(A|B) + (1 - P(B)) \cdot (1- P(A^c|B^c)) \end{eqnarray}

式の最後の項 \(P(A^c|B^c)\) は非感染者が検査で陰性となる確率(特異度)を表します。

ニュースなどでPCR検査の感度は0.7、特異度は0.99ほどと言われているようなので、その数字に加えて、仮に罹患率 P(B) が0.02だとしてP(B|A)、すなわち、検査陽性の人が本当に感染している確率を求めてみましょう。 \begin{eqnarray} P(B|A) &=& \frac{P(B)\cdot P(A|B)}{P(A)} \\ &=& \frac{0.02 \cdot 0.7} {0.02 \cdot 0.7 + (1 - 0.02) \cdot (1 - 0.99)} \\ &=& 0.588... \end{eqnarray}

神のみぞ知る罹患率が0.02のときには検査陽性ならば59%ほどの確率で感染していることになります。罹患率を少し変えてみると、

罹患率0.005: 26%
罹患率0.05: 79%

となります。

要するに、罹患率が低い場合には検査陽性の信頼性は低く、罹患率が高い場合には信頼性も高くなるということです。疑わしい人だけ検査した結果の陽性率が0.06程度だとすると、市中の罹患率はそれよりはかなり低いと思われるので、陽性 = 感染者とするのはかなり雑な判断だと考えられます。

同様の計算で検査陰性の人が本当に感染していない確率は上の罹患率の範囲内では98%以上なので、陰性なら検査時点での感染の疑いはあまりないことになります。

検査なんてそのようなものなので、極端に安心したり不安になったりするのは良くないでしょう。ましてや、検査陽性になった人を叩くなどもってのほかです。誰でも感染するリスクはあるのですから、次は我が身です。落ち着いて行動しましょう。

Bien cordialement,
Ermite Parfait

0 件のコメント:

コメントを投稿