臨床試験/臨床統計

臨床試験 優越性と非劣性 [★★]

投稿日:2019年4月14日 更新日:

前回までの「差があるということ」の知識を踏まえて、次の話題に入っていきます。

新しい薬(実薬とする)の臨床試験において、プラセボを対照とした試験を行う場合には、実薬がプラセボよりも効果が優れていることが証明できなければなりません。
なぜかというと、プラセボは偽物ですので、偽物と同じ効果であっては薬の意味がないからです。
「効果が優れている」とは、有効性の指標について、実薬の効果がプラセボに比べて統計学的に勝っているということで、それを「優越性」といいます。

「差があるということ」で説明した通り、P値で判定する場合はP<0.05であれば統計学的な差があると言えます。一方で95%信頼区間で判定する場合は「群間差」の信頼区間が0を跨がなければ統計学的に差がある、と言えました。

なお、群間差について忘れている方は、
臨床試験 差があるということ③ 補足(群間差、リスク比の場合) [★★]
を再度読んでいただければと思います。

有効性の指標は色々ありますが、絶対にクリアしなければいけないのが「主要評価項目」であることを以前説明しました。
優越性を検証するためのプラセボ対照試験では、有効性の「主要評価項目」について、実薬群がプラセボ群よりも統計学的に優れていれば、その臨床試験が成功したことになります。

なお、「主要評価項目」について忘れている方は、
臨床試験の評価項目(主要評価項目、副次評価項目、事後解析) [★★]
を再度読んでいただければと思います。

ここまでよろしいでしょうか?
次にプラセボを対照とするのではなく、これまでに使用されていた実薬と比較する場合について説明します。

例えば花粉症の薬は様々なものがあり、最近でも新しい薬が販売されています。
以前から使われてきた薬にも効果がありますので、新しい薬にはそれ以上に優れた点がないと世に出ても仕方がありません。そのため新しい薬には、これまでの薬を超えるような、何かしらの利点が求められます。
例えば、これまで1日2回服用する必要があったものが、1日1回の服用で治療が行えるようになれば、飲み忘れも少なくなりますので、利便性が上がることとなり、これまでにない新たな利点が生まれます。

しかし、患者さんが一番求めているのは効果であるかと思いますので、これまでの薬よりも効果が劣っていたとすると、たとえ利便性がよくても使おうとはしませんよね。
よって、新しい薬の効果について、以前から使われている薬と比較する試験が行われることになります。
ただ、以前から使われている薬は、プラセボよりも効果が高いことが既に示されていますので、優越性を検証するとなると、プラセボを対照とした場合に比べてハードルがはるかに高くなってしまいます。

主要評価項目で結果が出せないと、せっかく莫大な資金と労力をかけて行った臨床試験が失敗ということになってしまい、薬を世に出せないことにつながってしまいますので、あまりハードルの高い試験は行いたくありません。
そこで、これまでに使われてきた実薬を対照に試験を行う場合は「非劣性」を示すことができればOKということになっています。

「優越性」は対照に比べて優れているということですが、「非劣性」は対照に比べて劣っていないということを意味しています。「劣っていない」というのは、新薬が優れていてもよいし、同等でもよいということです。ただし、対照の方が優れていてはダメということになります。

では、非劣性はどのように示せばよいでしょうか?
P値は優れているかどうかの判定はできるのですが、劣っていないことを示すことができません。
一方、信頼区間であれば劣っていないことを示せますので、信頼区間により判定します。

「優越性」の場合は信頼区間の下限値(バーの左側)が0を跨がないということでしたが、非劣性の場合はそれよりも基準が低く、バーを跨いでしまってもOKです。
非劣性の場合は、「非劣性マージン」という値が設けられ、信頼区間の左側のバーが「非劣性マージン」を跨がなければ、非劣性が証明できたことになります。
具体的に図に示しましたので、①~⑥についてみていきましょう。

①の場合、信頼区間の下限値(左側のバー)が0を跨がず、非劣性マージンも跨いでいませんので、この場合は非劣性も優越性も示せたことになります。

②の場合、信頼区間の下限値(左側のバー)が0を跨いでいるので優越性は示せていませんが、非劣性マージンは跨いでいませんので、この場合は非劣性が示せたことになります。

③の場合、信頼区間の下限値(左側のバー)が0を跨いでおり、非劣性マージンも跨いでいますので、優越性も非劣性も示さなかったことになります。

④~⑥は群間差の平均値が0よりも小さくなり、平均値だけでみると対照群の方が優れている場合です。
この場合、信頼区間の下限値は必ず0より小さくなりますので優越性は示せませんが、非劣性は示せる場合があります。

④の場合、信頼区間の下限値が非劣性マージンを跨いでいませんので、非劣性は示せています。

⑤⑥の場合はどちらも非劣性マージンを跨いでいるため、非劣性は示せなかったことになります。
なお、⑥の場合は信頼区間の上限値(右側のバー)が0を下回っており、対照群が新薬群に比べて優越となっています。

分かりましたでしょうか?
今回のことを簡単にまとめておきます。

~まとめ~
●プラセボ対照試験では、主要評価項目について「優越性」を示す必要がある
●実薬対照試験では、主要評価項目について「非劣性」が示されればよい
●非劣性を検討する場合には「非劣性マージン」が設定され、信頼区間の下限値が「非劣性マージン」よりも大きければ(跨いでいなければ)、非劣性を示せたことになる

なお、有効性について、対照薬に対する「優越性」や「非劣性」を検証する試験のことを「検証試験」といい、第Ⅲ相試験で行われます。
その中で、「優越性」を示す試験を「優越性試験」、「非劣性」を示す試験を「非劣性試験」と言います。

いかがでしたでしょうか?
次回は今回の内容をもう少し補足していこうと思います。

<Sponsered Link>



-臨床試験/臨床統計