臨床試験/臨床統計

臨床試験 サブグループ解析 [★★]

投稿日:2020年2月16日 更新日:

今回はサブグループ解析について説明します。
薬の販売促進(プロモーション)においては悪者扱いされていますが(笑)、それについては後半説明します。

臨床試験では組み入れ基準が定められ、患者さんは特定の集団に限定されるものの、それでもさまざまな患者背景を持っている患者さんが混在しています。
前回の患者背景の記事でも説明しましたが、例えば糖尿病を有している患者さんと有していない患者さんが含まれていたり、高血圧を有している患者さんと有していない患者さんが含まれていたり、これまでに治療を行っていた「治療歴あり」の患者さんと「治療歴なし」の患者さんが含まれていたりします。

そこで気になるのが、これら患者背景の異なる患者さんでは薬の効果や安全性は本当に同じになるのか?ということです。

それを確かめるために、患者背景の異なる患者さんを分けて傾向を確認するのがサブグループ解析です。
例えば「糖尿病なし」と「糖尿病あり」、「治療歴あり」と「治療歴なし」などに分けて、薬の効果や安全性が「全体」の結果と同様であるのかを確認します。

これにより、例えば「糖尿病あり」の患者さんの効果が「全体」の結果と異なる傾向であった場合(例えば効果が弱い、副作用が多い、など)、そのことを医師や薬剤師が認識していれば、実際に「糖尿病あり」の患者さんに薬を使用する際に注意することができるかと思います。

よって、サブグループ解析を行い、治療効果や安全性が患者背景によってどのように異なってくるのか、その傾向を把握しておくことは非常に意義があることです。

ここまでよろしいでしょうか?
ここから、サブグループ解析の間違った使い方について説明していきます。
冒頭に記載した、「サブグループ解析が悪者扱いされている」ことについてです。

上記のように、サブグループ解析は患者背景の違いによる傾向をみる上で非常に有用なものなのですが、あくまでも結果の主体となるのは「全体」の結果であることに注意が必要です。
サブグループに分けた解析は、この「全体」の結果と同様の効果や安全性が得られているかどうかの「傾向」を確認するためのものです。

もう少し分かりやすくすると、仮にサブグループ解析を行ったところ、「全体」の結果に比べて「効果が高い」などの結果が出た場合に、その結果をあたかも主の結果であるかのように捉えてアピールすることは間違っています。
もっと具体的に言うと、仮に「糖尿病あり」の患者さんに対する薬の効果が「患者全体」の効果に比べてたまたま高かった場合、その薬が「糖尿病あり」の患者さんに対してすごく有用である、というような認識はしてはいけないですし、そのようなことをアピールすることはよくないのです。

サブグループ解析の結果はあくまでも「全体」と同様な結果が得られるのかどうかの傾向をみるためのものであり、患者背景が異なるときに、効果や安全性などが問題にならないかどうかをみるためのものです。

それでは、なぜサブグループ解析結果は主とした結果にならないのか?について説明しますが、ちょっと長くなります。
まず、以前説明しましたが、臨床試験の合否が決まる第Ⅲ相試験(検証試験)では、主要評価項目が基本的には1つに定められ、症例数の設計がきちんとなされて、有効性を検証するための条件が定められます(症例数の設計については以下で説明しました)。

臨床試験 症例数の設定 [★★]

臨床試験の合否は主要評価項目が達成されたか否かで決まり、極端に言うと、主要評価項目の結果が全てといえます。

ただ、せっかく膨大な費用と時間をかけて行う試験ですので、様々な効果についてもみていきたいということがあり、副次評価項目などが定められて、そこで検討されます。しかし、あくまでも副次評価項目はおまけという位置づけです。
というのは、副次評価項目はいくつでも定めることができるため、たくさん定めればそれに伴い、良い結果もいくつか得られる可能性が高くなるためです。
以下の記事で以前説明しましたが、臨床試験では、色んなデータを解析して、良い結果を出そうと思えば、いくらでも出せてしまうので、臨床試験の合否となる項目は主要評価項目の1つのみとするわけです。

臨床試験の評価項目(主要評価項目、副次評価項目、事後解析) [★★]

副次評価項目など、試験前に設定されている項目であればまだ信頼性はありますが、試験後に項目を新たに定めて解析される「事後解析」となるといくらでも解析できてしまうので、「事後解析」とまでなると、「おまけ」にすぎません。(事後解析についても上記の記事で説明していました)

なお、上記は繰り返し検定を行うと「P<0.05」となる確率が高くなる、「多重性の問題」を含んでおり、このことからも解析結果を増やしてしまうことは、よくありません。

臨床試験 検定における多重性の問題 [★★]

サブグループ解析の話に戻りますが、いくらでも設定することができますよね。
よって、単に良い結果(P<0.05などのデータ)を得たいだけなら色々分けて検討しておいて、良い結果だけをアピール、ということも出来てしまうのです。
これが、サブグループ解析が悪者扱いとされる理由です。

以前は製薬会社の販売促進(プロモーション)において、サブグループ解析の良いデータをパンフレットなどでアピールしていくということが行われてきました。
(先ほど記載しましたが、例えば「糖尿病あり」でよいデータが出た場合、「糖尿病患者さんに有用な薬」などのアピールをしてしまう、ということなどです)

事後解析として、さまざまなサブグループ解析が行われることは多々あり、論文としてはたくさん発表されるのですが、あくまでもおまけです。「全体」の結果が主となる結果なのです。

このような背景から、今ではプロモーションを行ううえでのルールが定められておりまして、プロモーションに利用できるサブグループ解析結果は、試験が行われる前に定められたものだけとなっております。たとえ論文として出されていても、事後解析によるサブグループ解析結果はプロモーションには利用できない、という決まりになっています。

長くなりましたが、サブグループ解析は、患者背景の異なる患者さんを分けて傾向を確認するということが本来の目的であるのに、そのような目的ではなく、薬をアピールするための道具として使用されてしまったため、サブグループ解析が悪者扱いされてしまったということです。

補足ですが、プロモーションでは事後解析によるサブグループ結果は利用できない、と上記記載しましたが、ちょっと例外があり、本来の目的に準じて使用する場合は例外的に使用できる場合があります。

その例ですが、例えば日本人を含む国際共同試験などが行われた際、日本人と日本人以外を分けたサブグループ解析が行われていなかったとします。
ただ、薬は人種によって効果や安全性が異なることがありますので、海外の患者さんを多く含むデータをそのまま日本人に当てはめてよいかどうか、不安な場合があります。
このような懸念事項がある場合には、薬が承認されて世に出る前に、薬を承認するPMDA(独立行政法人 医薬品医療機器総合機構)が企業に対し、日本人に対するサブグループ解析を行って、結果を提示するように、などと言ってくる場合があります。
(繰り返しですが、日本人に対する効果や安全性が、「全体」と変わらないかどうかの傾向を確認するためです。もし悪かったら、承認されないことにもつながります。)

ここで初めて日本人に対するサブグループ解析が行われるのですが、これは試験後に行われるものなので、厳密には事後解析です。
しかし、こちらのサブグループ解析は、上記の「本来の目的」に沿って行われた、治療で考慮すべきデータということになりますので、承認前にPMDAとの議論に用いられ、薬の承認に利用されたデータなどについてはプロモーションにおいても使用できる場合が例外としてあります。
(例えば、「審査報告書」に記載のあるサブグループ解析結果などです。「審査報告書」についてはまだ説明していませんので、今後説明したいかと思います。)

長くなりましたので、簡単にまとめます。
●サブグループ解析は、患者背景の異なる患者さんについて、有効性や安全性が「全体」と同様かどうか、傾向をみるためのもの。
(例えば「糖尿病」の患者さんでは傾向が異なるのかどうかを確認)
●サブグループ解析結果はあくまでも傾向をみるためのもののため、「全体」の結果より良い結果が得られたからといって、それをアピールするためのものとして利用するのは間違い。
●試験前に解析を行うことが定められたサブグループ解析結果であればまだよいが、試験後に改めて解析項目が定められる「事後解析」ではいくらでもサブグループを設定して解析できてしまうので、おまけに過ぎない。
●製薬会社の販売促進(プロモーション)では、事後解析におけるサブグループ解析結果を用いることは原則できないと現在決められている。ただし、特定の背景を持つ患者さんに対する傾向をみる必要があり、薬の承認前にPMDAと議論された事後解析結果は、薬を使用していくうえで有用なデータのため、利用できる場合がある。

毎回長くなっていますが、有効性の結果を解読するための記事はあと2回になるかと思います。
次回は「脱落」(n数が減るなど)をテーマに、その次は「臨床的重要性」について解説します。

<Sponsered Link>



-臨床試験/臨床統計