臨床試験/臨床統計

臨床試験 解析対象集団、感度分析、欠損値の補完 [★★]

投稿日:2019年12月8日 更新日:

今回はまず、ITT、FASなど解析対象集団について、用語解説していきます。
後半は欠損値の補完(LOCF法など)について、簡単に説明します。

例えば、臨床試験に組み入れられる(登録される)患者さんが200例であったとします。
薬の効果(有効性)について解析する際、200例全ての患者さんを対象に解析されるのが本来はベストなのですが、そのようなことは稀であります。
なぜかというと、色んな事情により、薬を一回も服用されなかった患者さんもいれば、試験途中で薬の服用を止めざるを得なかった患者さんもいます。中には1日3回服用するように定められたにもかかわらず、1日1回しか服用しなかったなど、ルールを違反した患者さんもいます。よって、このような患者さんを解析対象から外さざるを得ないことがあるためです。

どのような患者さんを解析対象にするのかについては、試験開始前に決めておく必要があります。
例えば、薬を1回でも服用した患者さんを対象に解析するのか、ルールを順守して服用した患者さんを対象に解析するのか、といったことです。

解析対象の決め方によって試験結果が異なってきますので、主要評価項目については解析対象を1つに定めておかなければなりません。そうしないと、ある解析対象ではプラセボ群に比べて有意差が認められなかったけど、解析対象を変えたら有意差が認められたということがあった場合、有意差が認められたよい方の結果を選択するということが起きてしまうためです。

ここまでよろしいでしょうか?
それでは解析対象集団について説明していきます。

図にITT、FAS、PPSという3つの解析対象集団を示しました。
まず、無作為化された時点での集団をITT(Intent To Treat)と呼びます。
ITTは無作為化された全ての患者さんが含まれることになります。

次にFASですが、ITTから薬を一度も服用されなかった患者さんや、服用後の測定データが全くない患者さんなど、除くべき理由のある最低限の患者さんを除いた集団をFAS(Full Analysis Set=最大の解析対象集団)と呼びます。

そしてPPSですが、服薬などのルール(プロトコールと呼びます)をきちんと遵守した集団をPPS(Per Protocol Set=治験実施計画に適合した対象集団)と呼びます。

なお、ITT集団については、少し修正して定義されることがあり、modified ITT(mITT)という用語が出てくる場合があります。(mITTは一度も薬を服用されなかった患者さんをITTから除く、などで定義されることがあり、FASと同じような集団になることが多いかと思います)。

また、ITT、FAS、PPSは有効性の解析対象集団として定義されることが多いように思われます。
安全性の解析対象については薬を1回以上服用された患者さんを対象とされることが多く、別途「Safety Analysis Set(SAS)」として定義されることがあります。

先に主要評価項目(主に有効性)については解析対象集団が1つに定められると説明しましたが、FASを対象に解析するのか、PPSを対象に解析にするのか、といったことです。
ただ、例えば主要評価項目の解析をFASを対象に行った場合、PPSにおいても同様の結果が得られるかどうかを検討する、ということは行われます。このような検討を「感度分析」といいます。

<感度度分析の例> ビラノア(花粉症の薬)の臨床試験の例(申請資料概要を参考に一部変更)
主要評価項目はTNSS(鼻症状のスコア)の平均変化量とした。
主解析として、FASを対象に、プラセボ群に対するビラノア群の優越性を検証した。

TNSSの平均変化量はビラノア群で-0.98(95%信頼区間:-1.19~-0.77)、プラセボ群で-0.63(95%信頼区間:-0.84~-0.42)であった。
ビラノア群のプラセボ群に対する平均値の差は-0.35(95%信頼区間:-0.65~-0.05、p=0.023)、であり、p値が事前に規定した有意水準5%を下回ったことから(p<0.05)、ビラノア群のプラセボ群に対する優越性が検証された。

~主解析の感度分析~
PPS を対象にTNSSの平均変化量をビラノア群とプラセボ群で比較検討した。
TNSS の平均変化量はビラスチン群で-0.98(95%信頼区間:-1.19~-0.77)、プラセボ群で-0.63(-0.84~-0.41)であり、プラセボ群に対するビラノア群の平均値の差は-0.35(-0.65~-0.05、p=0.021)であった。
PPS でもFASと同様の結果であった.

※上記分かりやすいように少し修正しています。実際は、上記平均変化量は調整値、平均値の差は推定値です。これについては難しい表現ですので、とりあえず読みとばしてください。ビラノア群は実際には20mg群です。
———-感度分析の例 ここまで———-

ここまでよろしいでしょうか?
少し話が変わり、「欠損値の補完」について軽く説明します。

臨床試験をスタートしてから終了するまで、患者さんが何らかの理由で少しずつ減っていくことがあります。(例えば途中で服薬を止めてしまったなどです)
患者さんの数はnと表現されますが、以下のグラフでは、nが週とともに減っていっています。
0週が50例として、その後12週では36例まで減っています。

例えば12週時で評価したい場合、0週の例数を変えずに、50例として解析したい場合があります。
その場合は、欠損した14例(50例-36例)を補完して50例とした場合のスコアを推定する、ということが行われます。
これが欠損値の補完です。

欠損値を補完する方法は色々ありますが、よくみかけるものとしてLOCF(Last Observation Carried Forward)法があります。

LOCF法は、例えばある患者さんでは8週時のデータまでしかないとき、8週時のデータを12週時のデータとする、という方法です。(最後の値で補完する方法)

このように保管して12週の平均値を求めたら、以下のようになりました(あくまでも仮です)。
一番右にLOCF法で算出した12週の値を置いてみました。
(nが0週と同じく50となっています)

論文中でLOCF法はよくみかけますので、LOCFって何だろう?とならないよう、簡単に説明しました。

今回は色々説明してたら、ちょっと盛り沢山になりました。
次回ですが、患者背景、脱落率、サブグループ解析といったところについて説明します。

<Sponsered Link>



-臨床試験/臨床統計