臨床試験/臨床統計

臨床試験 患者背景(ベースライン特性) [★★]

投稿日:2020年2月2日 更新日:

2020年初回の記事となります。
(1月末に間に合いませんでした。 時間が経つのが早くて困ってます…)

臨床試験終盤の内容ですが、なかなか終わらず…。
患者背景(ベースライン特性)、サブグループ解析、脱落率といった説明をしていきたいと思いましたが、長くなりそうなので、今回は患者背景のみ説明します。

患者背景は、論文では結果のはじめの方に掲載されており、以下のような表で掲載されていることが多いです。


患者背景のデータとは、投与開始前(ベースライン)のデータのことです。
患者背景では次の2点に着目するとよいかと思います。

~患者背景で着目すること~
①どのような患者群が試験対象とされていたのか? 例えば、対象は若年者なのか高齢者なのか?罹病期間や重症度はどれくらいであったのか? 高血圧や糖尿病なの併存疾患がある患者なのか? などなど
②群間でバランスがとれているか?

まず①ですが、選択基準や除外基準では組み入れられる患者さんの条件が記載されていますが、実際に組み入れられた患者さんの特徴を数値化したものが、患者背景のデータと考えるとよいかと思います。

臨床試験 選択基準と除外基準、外的妥当性 [★★]

↑こちらの記事で説明しましたが、臨床試験では実際に治療を受ける全ての患者さんを網羅することはできません。組み入れられる患者さんが明確に定められ、患者さんの範囲が限定されることになります。
例えば、同じ疾患でも、ある臨床試験では軽度の患者さんが試験対象とされ、ある臨床試験では重度の患者さんが試験対象とされる、などさまざまです。
よって、試験で得られた有効性や安全性の結果を読み解く上では、どのような患者さんで得られた結果であるかをよく把握しておく必要があります。

例えば、患者背景の年齢から、組み入れられた患者さんは若年者が多いのか、高齢者が多いのか、ということが分かります。

疾患の重症度については、疾患に関連する検査値や重症度分類(数値)などで示されます。
例えば脂質異常症ではLDLコレステロールなどの値、花粉症では鼻症状のスコア(TNSS)などが数値として示されますので、これらの数値を基に、患者さんは軽度なのか?それとも重度なのか?など読み取るとよいかと思います。

併存疾患については、例えば脂質異常症の患者さんでは高血圧や糖尿病を合併していることがありますので、合併している患者さんの割合(%)が示されていたりします。
これらの疾患の合併が、薬の効果に影響している可能性もありますので、合併している患者さんが少ないのか、それとも多いのか、把握しておく必要があります。
極端な例ですが、ある臨床試験において、仮に全ての患者さんが糖尿病を合併しているとすれば、得られた有効性の結果は、糖尿病を合併する患者さんに薬を使用する際に参考となるデータ、ということになります。逆に、糖尿病を合併していない患者さんでは異なる結果が得られる可能性があります。

また、併用薬の使用状況なども考慮するとよいかと思います。
既存治療薬に上乗せして薬を使用する試験などでは、既存治療薬をどの程度の量使用しているのか?(例えば使用可能な用量上限ギリギリまで使っている患者さんなのか?)、などについて把握しておくとよいかと思います。

このように、患者背景から、どのような患者さんが試験対象となっているのかを把握したうえで、有効性、安全性についてみていくことが重要となります。
言い換えると、示された有効性、安全性の結果は、どのような患者さんに対して得られた結果なのか?を把握しておくということです。

ここまでよろしいでしょうか?

1点追加ですが(ちょっと話が変わりますが)、前に「ベースラインからの変化量」の結果を解釈するうえでは注意が必要と説明したかと思います。
変化量のみ記載され、実際の値が記載されない場合が多いので、患者背景の表などからベースライン値がどれくらいの患者さんであったのかを把握し、示された変化量を差し引いて、治療後にどれくらいの値になったのかを把握するとよいかと思います。

1例ですが、花粉症の薬であるビラノアのある臨床試験では、鼻症状のスコア(TNSS)の変化量が有効性の主要評価項目として定められましたが、ベースラインの値は以下のようになっていました。

ベースライン時のTNSSの平均値(TNSSは最大で15点となる)
プラセボ群:7.33、ビラノア群:7.48

それに対し、投与2週後のベースラインからの変化量は以下のようになっていました。

投与2週後のTNSSのベースラインからの変化量(平均値)
プラセボ群:-0.63、ビラノア群:-0.98 (群間差 -0.35、P<0.05)

変化量でみると群間差に有意差がついています(p<0.05)。
しかし、ベースラインの平均値を基に、実際の値がどれくらいの値なのかについて大雑把に計算してみると(正確な値ではないです)、プラセボ群は大体6.7(7.33-0.63より)、ビラノア群は大体6.5(7.48-0.98より)となり、実際の値は0.2程度しか差がないようです…。

このように、患者背景のベースライン値は結果を解釈するうえで重要となるかと思いますので、単に論文の「結果(Result)」に書かれている内容を鵜呑みにするのではなく、患者背景とよーくにらめっこして考えることが重要となります。

また、単にプラセボ群との有意差に着目するのではなく、治療後にどの程度の重症度まで改善したのかを考える必要がでてきます。
(プラセボ群に比べて差があっても、実際に病状がよくなっていないと意味がありません。この話は後に予定している「臨床的有用性」の回で説明します。)

それでは患者背景で着目することの2点目に移ります。

~患者背景で着目すること~
①どのような患者群が試験対象とされていたのか? 例えば、対象は若年者なのか高齢者なのか?罹病期間や重症度はどれくらいであったのか? 高血圧や糖尿病など併存疾患がある患者なのか? などなど
②群間でバランスがとれているか?

臨床試験では、実薬群とプラセボ群(2群の間)で患者背景がそろっていることが重要です。
無作為化比較試験では患者背景がそろうように無作為化されることが多いですが(層別無作為化などによる)、1つ1つよく見ていかないと、本当にそろっているかは分かりません。

※層別無作為化については、以下で説明しました。
臨床試験の試験デザイン②(無作為化) [★★]

論文の本文によく、「患者背景(ベースライン値)については、両群間でバランスがとれていた(表●)。」などと記載がありますが、定型文ですのであてになりません。
英語では、「The baseline characteristics were well balanced between study groups (Table●).)のように記載されますね。
また、有意差(P値)が示されているケースがありますが、群間に有意差が認めれない場合(P>0.05の場合)にも飛ばさずに、よく確認すべきです。
(有意差があったらバランスがとれていませんが…)

さて、どのように確認するか、ということですが、基本的に実薬群(よい結果を得たい方の群)に有利な状況になっていないかを確認していくとよいかと思います。

薬の効果に関係がありそうな要因、例えば罹病期間や重症度に違いがないのか、糖尿病などの合併率に差がないのか、などについて確認していくとよいかと思います。

例えば脂質異常症の薬(コレステロールを下げる薬など)の臨床試験では、患者さんが高血圧や糖尿病を合併していることも多くある、と先ほど説明しましたが、これらの合併が効果に影響している可能性もあります。
合併の割合が実薬群よりもプラセボ群の方が10%多いとしたら、何となく実薬群が有利のような感じがしますよね?

このように、薬の効果に影響しそうな患者背景に群間で差があるかどうかを把握し、実薬群の方が有利な条件になっていたら、有効性の結果を慎重にみていく必要があるかと思います。

~補足 患者背景の群間差を考慮するために試験で行われること~
臨床試験によっては、患者背景の群間差をより厳密に考慮して解析などが行われる場合があります。

●統計学的解析(検定など)の際、患者背景の群間のバラつきを調整する場合があります(「共変量(covariate)で調整」などと言います)。簡単にですが、年齢、性別、各指標のベースライン値などにより、評価する項目が影響を受けそうな場合、群間で差が生じないように数値を調整します。例えば、薬の効果をみるのに「Aスコア(高いほど重症とする)」を検討するとして、薬の効果とは関係なしに「Aスコア」は高齢になるほど高くなる傾向があるとしたら、高齢の患者が多く含まれる群の方が不利になりますよね。このような不利が生じないように、年齢による影響を差し引いて「Aスコア」の数値を算出する、ということが行われます。

●糖尿病の合併などによる影響について調べるために、合併の有無別に分けて比較する「サブグループ解析」が行われることがあります。「サブグループ解析」については次回説明します。
~補足 ここまで~

2020年はじめの記事ですが、いかがでしたでしょうか?
非常に重くなってしまいましたが、最後まで読んでいただいた方、ありがとうございます。お疲れ様でした。

次回は上記にも記載しましたが、「サブグループ解析」について説明します。

<Sponsered Link>



-臨床試験/臨床統計