今回から臨床試験の基本的なことについて書いていきます。
これまでは1回の記事が結構長かったですが、このシリーズでは1回1テーマに細かく分けて書いていきます。
このシリーズでは、臨床試験の論文をきちんと読めるように!
というのをとりあえずの目標としたいと思います。
まずは軽い題材で、論文中の数値というのをテーマとしてみます。
とりあえず(例文1)と(例文2)をみてみましょう。
(例文1)
薬剤投与開始4週後のLDLコレステロール値(平均値±標準偏差)は138.4±30.3mg/dLであった。
(例文2)
患者の年齢[中央値(最小値, 最大値)]は54.0(18, 70)歳であった。
(例文1)では「平均値±標準偏差」とありますので、平均値が138.4、標準偏差が30.3ということです。
一方(例文2)の値では「中央値(最小値, 最大値)」書いてありますので、中央値が54.0、最小値が18、最大値が70ということなのですが、これらの違いは分かりますでしょうか?
まず平均値と中央値の違いについて説明しておきます。
●平均値とは?
例えば、5人のある数値が[2, 8, 4, 6, 10]であったとします。
この場合、平均値は5人の数値を全て足して5で割ったものとなります。
要するに、(2+8+4+6+10)÷5=6となります。
なお、平均値はMeanとも記載することもあります。
●中央値とは?
上記と同じく、5人のある数値が[2, 8, 4, 6, 10]であったとします。
中央値というのは、ちょうど真ん中にくる数値のことです。
[2, 8, 4, 6, 10]を小さい順に並び替えると[2, 4, 6, 8, 10]となります。
この中で真ん中にきたのは6ですので、中央値は6となります。
それでは6人の場合ではどうでしょうか?
例えば6人の数値が[2, 8, 5, 3, 6, 10]であったとします。
まず小さい順に並べ替えると[2, 3, 5, 6, 8, 10]となります。
6人のように偶数個の場合、真ん中にくる数値は2つとなり、この場合は5と6となります。
中央値はこの平均をとって、(5+6)÷2=5.5と計算します。
表記の仕方ですが、例文2と同じ表記をすれば、中央値(最小値, 最大値)は5人の方の例では「6(2, 10)」、6人の方の例では「5.5(2, 10)」となります。
なお、(最小値, 最大値)を(範囲)と記載することもあります。
ここまではよろしいでしょうか?次に例文1にある標準偏差についてみていきます。
●標準偏差とは?(標準偏差はSDとも書きます)
ちょっと例を変えて、6人の数値が①[6, 6, 6, 6, 6, 6]である場合と②[1, 2, 3, 9, 10, 11]である場合を考えます。①は6人とも6なので、平均値も当然6です。一方で②の平均値を計算するとこちらも6になります。①と②を比較すると、①は6人とも数値に全くばらつきがないのに対し、②ではかなりのばらつきがありますね。
よって平均値を述べるときには、ばらつきがどの程度あるかを示す必要があります。
そのばらつきを示す数値の一つが標準偏差です。
標準偏差は次のように求めます
<手順1>(1人の数値-平均値)2を人数分合計します
①の例ですと、(6-6)2+(6-6)2+(6-6)2+(6-6)2+(6-6)2+(6-6)2=0となります。
②の例ですと、(1-6)2+(2-6)2+(3-6)2+(9-6)2+(10-6)2+(11-6)2=100となります。
<手順2> 手順1の合計値を人数で割ります ⇒この値を「分散」と言います
①の例ですと0÷6=0
②の例ですと100÷6=16.666…
<手順3> 手順2で求めた「分散」のルートをとったものが「標準偏差」です。
①の例ですと、√0=0
②の例ですと、√(100÷6)=4.08…
①の場合はまったくバラつきがないので当然0ですね。
よって平均値±標準偏差は、①の場合は6±0、②の場合は6±4.08となります。
計算例をお示ししましたが、計算できなくても標準偏差はバラつきを表す数値ということがわかればOKかと思います。
なお、中央値の場合は(例文2)のように、最小値と最大値を示すことが多いですので、値の範囲は分かります。
今回は簡単な内容ですが、初回なのでここまでにして、続きは次回といたします。
次回ですが、平均値のバラつきの数値として「標準偏差」ではなく「標準誤差」を記載する場合があるのでその説明と、中央値の方で「四分位範囲」というのがでてくる場合がありますので、その説明をしたいと思います。
<Sponsered Link>