臨床試験/臨床統計

臨床試験 αエラーとβエラー [★★]

投稿日:2019年10月6日 更新日:

今回はαエラーとβエラーについて説明します。
前回までの有意差の話につなげたいのですが、まずは検査の話から入ります。

例えば、10000人が感染症であるかどうかの検査を受けたとします。
結果として「陽性(+)」か「陰性(-)」のいずれかが出たとします。
この結果から、以下の4通りが考えられます。

①「陽性(+)」と判定され、実際に感染症にかかっている
②「陽性(+)」と判定されたが、実際に感染症にはかかっていない
③「陰性(-)」と判定され、実際にも感染症にはかかっていない
④「陰性(-)」と判定されたが、実際には感染症にはかかっている

①と③は検査結果と実際が一致しているので、検査結果が正しいと言えます。
一方で、②と④は検査結果が間違っています。
この間違いをエラーと言い、②の方をαエラー、④の方をβエラーと言います。

もう少しかみ砕くと、陽性(+)ではないのに陽性としてしまう間違いが「αエラー」で、「第一種の過誤」と言います。なお、検査結果としては「偽陽性」と言います。

一方、陰性(-)ではないので陰性としてしまう(実際には感染している)が「βエラー」で、「第二種の過誤」と言います。検査結果としては「偽陰性」と言います。

よく出てくる表で示しました。
10,000人の検査結果として例を示しました、勝手に数値を入れたものですので、あくまでも仮のものです。
先ほどの説明を表にして表すと、αエラー、βエラーの部分は赤色、青色の部分になります。
α、βをそれぞれの割合として算出すると、以下のようになります。
分母に注意してください。縦に考えて、合計で割っています。

α、β以外の部分についても名前がついており、左上を「感度」または「検出力」、右下の部分を「特異度」と呼びます。
感度/検出力は、感染症に感染症にかかっており、陽性と正しく判定される割合です。
特異度は、感染症にかかっていなくて、陰性と正しく判定される割合です。
ここでも縦に考えると、
感度/検出力=1-β
特異度=1-α
となります。

先ほどの10,000人の検査結果で計算すると以下のようになります。

「陽性的中率」、「陰性的中率」という言葉も出てくるので、こちらも説明しておきますと、先ほどまで表を縦に考えていましたが、こちらは横に考えます。

ここまでよいでしょうか?
検査結果についてみてきましたが、ここまでの内容をP値の有意差の話に応用していきます。
なお、表は縦にみていく方で応用しますので、「陽性的中率」、「陰性的中率」の話は一端忘れてください。

A群とB群に差があるかどうか検定をする際、P<0.05の場合に「有意な差が認められた」とする場合が多いという話をしたかと思います。
このとき、基準となる0.05を「有意水準」と呼んでおり、実は先ほどのαに相当します。

検査:陽性(+)ではないのに陽性としてしまう間違いが「αエラー」
検定:実際には差がないのに、差があると判定してしまう間違いが「αエラー」 ⇒ αは有意水準に相当する

表の方が分かりやすいでしょうか?

有意水準αを0.05に設定した場合、「実際には差がないのに、差があると誤って判定してしまう確率が5%未満である場合に、有意な差が認められたとする」ということです。

なお、有意水準はいつも0.05に設定されているわけではなく、例えば前回に多重性の問題の「ボンフェローニ法」では、P値の基準となる閾値を低くすることについて説明しました。要するに有意水準αの値を低くしたということになります。

もう1つ、検出力(1-β)の値も臨床試験では重要で、意味としては「実際に差があるものを、差があると判定する力」ということです。
たとえば、1-β=0.7の場合、70%の確立で実際に差があるデータを差があると判定できるということです。

今回はαエラーとβエラーの説明を「検査」と「有意差」の2方面から説明しました。
次回は、この知識(「有意差」の方)を基に、臨床試験での症例数の設定の話をします。

<Sponsered Link>



-臨床試験/臨床統計