臨床試験/臨床統計

臨床試験 差があるということ④ 補足(群内での経時変化、ベースラインからの変化量) [★★]

投稿日:2019年3月31日 更新日:

前回までの3回では、ある1時点(例えば投与12週後)において、実薬群とプラセボ群で差があるかどうか、ということについて説明してきました。
しかし、ある1時点だけでの比較ですと、本当に改善してるのかどうかが曖昧であるとも考えられます。
これについて、ちょっと極端な例を挙げてみます。

例えば、実薬とプラセボ投与12週時のスコアに有意な差が認められたとします。
仮に、実薬群のスコア(平均値)が5、プラセボ群のスコア(平均値)が4であったとしましょう。
(スコアは高い方が症状が良好とします)
この値を棒グラフにすると下のようになります。

グラフを見る限りではスコアに差があることがみてとれますね。
ただこのスコア、投与を開始した0週時からどのように変化したのでしょうか?
推移を実際にグラフにすると下のようになりました。(例です)

いかがでしょうか?
実薬群もプラセボ群も、0週時から全然変化していませんよね。
この例ですと、0週時のときから実薬群とプラセボ群で1の差がついておりました。

これは極端の例ですが、ある1点のみについて実薬群とプラセボ群を比較するだけでは信頼性がもてず、0週時から12週時の間に改善しているかどうかについても確認しないと、本当に改善したのかどうかが分からないのです。
そこで、実薬群の中で、0週時(ベースライン時)と12週時の値に差があるかどうかを検定し、P値により判断するということが行われます。(プラセボ群も同様です)
例えば先ほどのグラフで、0週時と12週時の値を比較した際のP値が0.05を上回っていれば、差が認められなかったということになります。

なお、前に説明しましたが、NSはNot Significant(有意差なし)を意味しており、P≧0.05の場合としています。
「vs ベースライン」はベースライン時(0週時)との比較、「vsプラセボ群」はプラセボ群との比較を示しています。

極端な例を挙げましたが、1時点だけの比較だと騙される可能性がありますので、スコアが時間とともにどのように変化したのかなど、いくつかの視点から確認していくことが必要となります。

よくみかけるグラフとして以下のような例がありますが、実薬群とプラセボ群の比較でのP値を*で示し、同じ群内での0週時(ベースライン)からの比較でのP値を#で示すなど、記号を変えて示すことがよくあります。

「vs プラセボ群」の方ですが、同じ週、例えば2週時の実薬群とプラセボ群の比較を示しています。
一方、「vs ベースライン時」は実薬群の0週時との比較を示しています(プラセボ群の0週時との比較ではありません)。

ここまでよろしいでしょうか?
次に「ベースラインからの変化量」について補足していきます。

「ベースラインからの変化量」については、
臨床試験 差があるということ① 検定とP値について [★★]
において何も説明なしで記載していましたが、その名の通り、0週時からどれくらい変化したかということです。

例えば「投与12週時におけるベースラインからの変化量」というと、0週時から12週時までにスコアなどがどれくらい変化したかを示しており、変化量が20(改善)であれば、0週時から12週時までに20改善したことを示しています。

そして、以前の記事では、実薬群は20、プラセボ群は16であり、P<0.05の場合は実薬群とプラセボ群で有意な差が認められたと説明していました。

「ベースラインからの変化量」であれば、0週時からの変化を示している値であり、時系列できちんと考えられているので「改善した」と言えるのではないか?
と思う方もいるかもしれませんが、こちらもはじめの例と同様に注意が必要であり、0週時から本当に有意な差があるのかどうかを考える必要があります。

また極端の例を挙げてみますと、実薬群のベースラインの値が10000であったとしたら、いかがでしょうか?
10000の値に対して、たった20しか改善していないということ(0週時が10000に対し、12週時が10020)ですので、0週時に対して有意な差は認められない場合もあるということです。

(グラフ右でみると、10000に対して20しか改善していないと、0週時と12週時でほとんど同じ値にみえますよね)

よって、ベースラインからの変化量を考える際も、同じ群の中でベースライン(0週)から本当に差があったのかどうかを確認しておく必要があり、有意な差かどうかだけではなく、ベースラインの値自体がどの程度であったのかどうかを確認しておく必要があります。

臨床試験の結果では、「ベースラインからの変化量」で議論されていることが多いのですので(例えば12週時の本当の値で議論されず、ベースラインからの変化量で議論されることが多い)、ベースライン値を確認することを怠らないようにしましょう。

極端な例を今回示しましたが、例えば花粉症の薬とかで、ベースラインからの変化量ではプラセボ群に対して有意差が認められているのに、実際のスコアでみると、ベースラインからこれっぽっちしか改善していないや、という例も多々みられます。

ベースラインの値の情報がグラフデータなどの傍に記載されていないこともありますので、注意が必要です。
(また別の回で説明しますが、「患者背景」と言われるデータとして、ベースライン時の値が別の頁に記載されていることがあります)

また、ベースライン時のスコアというのは、患者さんの病状の程度を表しておりますので、ベースライン時のスコアを確認し、これくらいの病状の患者さんに薬を投与すると、●週後にこれくらいスコアが改善する、という見方をできるようになるとよいかと思います。

後半少し難しかったでしょうか?
「ベースライン時のスコア」の話は「患者背景」の回でも説明すると思いますので、その時にまた復習してください。

「差があるということ」を4回にわたり説明しましたが、これで次の説明準備が整いました。
(特に「信頼区間」について理解しておく必要があります)
次回から主要評価項目がらみの話で、「非劣性」、「優越性」、「同等性」についての説明をしていきます。
それでは。

<Sponsered Link>



-臨床試験/臨床統計