臨床試験/臨床統計

臨床試験の試験デザイン②(無作為化) [★★]

投稿日:

前回の続きです。

「多施設共同、無作為化、プラセボ対照、二重盲検、並行群間比較試験」…冒頭文とします

前回①~③と番号付けたので、今回は④からですが、長くなりそうですので今回は④のみとします。

④無作為化(ランダム化)
無作為化というと分かり難いですが、ランダム化と書くとなんとなくイメージつきますね。
例えば実薬とプラセボを比較する2群の比較試験においては、患者さんを「実薬を投与する群」と「プラセボを投与する群」の2群に分ける必要があります(分けることを「割り付ける」といいます)。

このとき、公平に割り付けを行わないと、試験結果に影響がでてしまいます。
例えば医師からみて症状が悪そうな患者さんには実薬を投与して、症状が軽そうな患者さんにはプラセボを投与する、のようなひいきが生じると、公平な結果が出せません。
(前回も説明しましたが、このような偏りを「バイアス」といいます)
よって、不公平が生じないように患者さんを割り付ける必要があります。

その方法ですが、例えばコインを投げて表か裏かで決める、さいころを振って奇数か偶数かで決める、コンピュータで乱数を発生させて2分の1の確立で決める、などが考えられます。ただこの方法ですと、コインを投げた時に全て「表」となってしまうこともあり、実薬群が4例、プラセボ群が0例などとなることもあり、比較する2群の例数をそろえることができないという問題が生じます。

より一般的に行われてきた方法として「封筒法」があります。
封筒法では患者さんに1から番号を振っておきます。そして、どちらの投与群にするかを記載した紙が入っている封筒を引いていく、という方法です。
こちらにも問題点はあり、例えば重症の患者さんの群を決めるための封筒を医師が破った際に「プラセボ」が出てしまった場合、実薬群に割り付けたいという意思から、もう1枚封筒を破ってしまう、などという不正が起こり得ます。
そうなると、無作為化の意味がなくなってしまいますよね。
この問題の解決策として、各病院の医師が封筒を破るのではなく、割り付けを独立した登録センターが行うという策があります。

補足ですが、臨床試験に参加する患者の登録(組み入れ)を、独立した登録センターを介して行う仕組みのことを「中央登録方式(central registration method)」と言います。この用語も論文に出てくるので覚えておくとよいです。

<ブロックランダム化(ブロック無作為化)>
先ほどコインの裏表で割り付ける場合、各群の例数がそろわないという問題があると説明しましたが、各群の例数をそろえる無作為化の方法として「ブロックランダム化(ブロック無作為化)」という方法があります。
例えば多数の患者を4例1ブロックに分割します。

●●●●|●●●●|●●●●|●●●●|●●●●|●●●●|…
(患者さんを●で表しています)

そして、ブロックごとに割り付けを行います。
ブロックごとに各群が均等になるような組み合わせを考えればよいのです。
(1ブロック4例なので、2例が実薬群、2例がプラセボ群)
実薬群を「実」、プラセボ群を「プ」とし、ブロック4人の患者さんを(1, 2, 3, 4)とすると、各患者さんに対する割り付けとしては、
(実, 実, プ, プ)、(実, プ, 実, プ)、(実, プ, プ, 実)、
(プ, 実, プ, 実)、(プ, 実, 実, プ)、(プ, プ, 実, 実)
の6通りがあります。

この6通りの中からランダムに1通りを決めるのが、ブロックランダム化という方法です。
この方法は次に説明する「層別無作為化」においても用いられます。

<層別無作為化>
薬の効果は患者さんのさまざまな背景(因子)によって異なる場合があります。
例えば、年齢が若い患者さんよりも高齢の患者さんの方が薬が効きにくい傾向がある、男性と女性で効果の異なる傾向がある、病状が軽い患者さんの方が重症の患者さんよりも治りやすい(薬が効きやすい)傾向がある、などです(例えばです)。

80人の患者さんを仮に実薬とプラセボに無作為化した際、プラセボ群の40人は皆年齢が若く、例えば平均年齢が20歳になったとします。一方で実薬群は皆高齢で平均年齢が80歳になったとしたら、薬の効果がきちんと測れないことは何となくイメージできますよね?
実薬を投与する高齢の患者さんにおいて薬が効きにくい傾向が仮にあった場合は、年齢が若いプラセボ群の方がむしろ改善してしまった、という結果にもなりかねません。
重症度(症状の度合い)などについても同様です。

そこで、薬の効果に影響が出そうな因子(性別、年齢、重症度など)があらかじめ想定される場合には、実薬群とプラセボ群で各因子に対する偏りをなくすように割り付ける場合があります。
その方法を「層別無作為化」と言います。

イメージがわきやすいように、表にしてみました。

例えば男性が60例、女性20例の場合、男性を各群に30例ずつ分け、女性を10例ずつ分けることができれば、実薬群とプラセボ群で偏りは生じませんね。
年齢についても、60歳未満と60歳以上に分けた際、60歳未満が30例、60歳以上が50例であったとしたら、60歳未満を15例ずつ、60歳以上を25例ずつ分けることができれば偏りは生じません。
重症度についても同様です。

性別、年齢、重症度以外にも考慮する因子が複数ある場合もありますので、こんなにピッタリ分けることはできませんが、同じくらいの数に分けることができます。

また後日お話しますが、このような治療前の因子を「患者背景」と言います。治療前のことは「ベースライン」と言います。
(「患者背景」の回を設けて後に説明します)

ちょっと長くなりましたが、無作為化についてお話してきました。
最後に記載についてまとめておきます。

~整理4
冒頭文の「無作為化」の箇所には、
「無作為化(ランダム化)」「非無作為化(非ランダム化)」のいずれかが入ります。
例えば非無作為化の場合は、
「多施設共同、非無作為化、プラセボ対照、二重盲検、並行群間比較試験」
などとなります。

英語表記にすると以下のようになります。
~④の英語表記~
無作為化試験
…randomized trial(study)
非無作為化試験
…non-randomized trial(study)

なお、非無作為化試験とは、2群を無作為に分けるのではなく、例えば医師が患者さんをどちらに割り付けるかを決める、ような試験を指します。

次回は「並行群間比較試験」について説明します。

<Sponsered Link>



-臨床試験/臨床統計