今回は、試験概要の残り「症例数の設定」と「解析方法」についてと、結果のはじめの部分の「患者背景」まで説明していきます。
(「解析方法」は結果と一緒に説明しますので、簡単に触れるだけになります)
第1回:論文取得、試験概要1(目的、試験デザイン、組み入れ基準(選択基準・除外基準)、投与方法)
第2回:試験概要2(評価項目、サブグループ解析)
第3回:試験概要3(症例数の設定、解析方法)、結果1(組み入れ患者、患者背景)
第4回:結果2(有効性:主要評価項目)
第5回:結果3(有効性:副次評価項目、安全性)
(第4回~第5回は予定です)
<METHODS>(前回までの続き)
■症例数の設定
症例数は、想定される臨床効果(プラセボ群との差)、有意水準α(通常は0.05に設定)、検出力1-β(0.8以上が望ましい)を基に決定されます。
~こちらで復習~
臨床試験 症例数の設定 [★★]
~こちらで復習 ここまで~
それでは、今回の臨床試験において、どのように定められたかをみていきます。
本文に記載がありませんが、Supplementary Appendix P18に記載されています。
Additional Statistical Analysis Detailsの2段落目です。
The study was designed to achieve 85% power for detecting a recovery rate ratio of 1.35 with a two-sided type-I error rate of 5%.
●想定される臨床効果(プラセボ群との差)
recovery rate ratio of 1.35
→プラセボ群に対する回復率の比を1.35と定めているということです(回復率というのが分かり難いかもしれませんが、回復した患者さんの数がプラセボ群よりも1.35倍であると見込んだということです)。
なお、「プラセボ群との差」と表現していましたが、臨床効果の違いという意味では「比」も同様です。
●有意水準α
two-sided type-I error rate of 5%
→両側5%(α=0.05)
(「両側」については本ブログではまだ説明していませんでした。統計の回で触れようとは思っています)
●検出力1-β
85% power
→85%(1-β=0.85)
これらの条件から症例数を以下のように定めています。
●症例数
at least 400 recoveries(同段落の3行目)
→回復症例が少なくとも400例
Enrollment continued through April 19, 2020 to ensure at least 400 recoveries
ということですので、回復症例が400例となるまで組み入れ続ける、ということです。
さて、ここで1つ疑問があります。
プラセボ群に対する臨床効果の比をなぜ1.35倍と定めたのかについてです。
Supplementary Appendixでは触れられていませんので、Protocolをみてみます。
見つけるのが大変ですが、PDFの頁数で97頁/367頁目をみてみます。
頁下の頁番号だと、しおりで「ACTT v3.0, 02Apr2020」に飛び、Page 43 of 65です。
「9.2 Sample Size Determination」の項目です。
α=0.05、1-β=0.85(検出力85%)と定めた場合の、臨床効果の比と回復症例数の関係を次の頁のTable4で示しています。
比1.25の場合、回復症例723例必要(プラセボ群との統計学的な差を出すのに)
比1.30の場合、回復症例523例必要
比1.35の場合、回復症例400例必要
比1.40の場合、回復症例318例必要
比(プラセボ群との差)が大きいほど、プラセボ群との統計学的な差を出すために必要な症例数は少なくなっています。
(逆に言うと、差が小さい場合に統計学的な差を出すには、膨大な症例数が必要)
この中から比を1.35と想定したので回復症例が400例となったわけですが、その根拠として以下が記載されています。
(Table 4の前の頁、下から5行目~)
A recovery rate ratio of 1.40 is similar to, but slightly higher than the figure of 1.31 reported in Cao, Wang, Wen et al. (2020) for a lopinavir/ritonavir trial that used time to improvement by 2 categories as primary endpoint. A total of 400 recoveries is needed for a recovery ratio of 1.35 with 85% power. Table 4 provides power for various recovery rate ratios.
赤字部分、ロピナビル・リトナビルのCocid-19に対する臨床試験において、比が1.31と報告されていることを参考にされてるようです。
(ロピナビル・リトナビルは抗HIV薬であり、コロナウイルスの治療薬候補とされていたものです)
面倒ですが、こちらの論文も確認してみます。
該当文献の情報ですが、PDFの289頁/367頁の文献リストの「2」です。
2. Cao, Wang, Wen et al. 2020. A trial of lopinavir–ritonavir in adults hospitalized with severe covid-19. New DOI: 10.1056/NEJMoa2001282.
こちらの論文の結果をみると、改善率の比(ロピナビル・リトナビル投与群の未投与群(標準治療のみの群)に対する比)が1.31となっています(こちらの試験の主要評価項目結果です。ABSTRACTのRESULTにも記載されています)。
なお、この試験では有意差が得られておらず、ロピナビル・リトナビル投与群によるベネフィットはないとされてしまっています。
改善率の比(ハザード比):1.31、95%信頼区間:0.95~1.80(P=0.09)
95%信頼区間が0.95~1.80で1を跨いでおり、P値が0.09なので有意差がありません。
(比の場合の基準は1を跨ぐかどうかでしたね。「臨床試験 差があるということ③ 補足(群間差、リスク比の場合) [★★] 」を参考)
おしいといえばおしいので、症例数をもっと増やせば有意差が出た可能性はありますね。この試験では統計学的な差を出すのに160例必要と想定され、実際に無作為化された症例が199例でした。
レムデシビルの試験に戻ると、この1.31を参考に、レムデシビルの効果をプラセボの1.35倍として、プラセボ群との統計学的な差を出すためには400例必要、ということになったわけです。
補足:
記載されていませんが、おそらくロピナビル・リトナビルとレムデシビルで同程度の効果であると想定したのかと思います。
■解析方法(検定方法)
METHODSのSTATISTICAL ANALYSISのはじめに主要評価項目についてのみ記載があります。
(The primary analysis was a stratified log-rank test…)
各結果の解析方法は、有効性の結果(RESULTS)の図表の注釈などにも記載がありますので、検定方法は結果と一緒に説明したいと思います。
ここまでが<METHODS>になります。
それでは、結果(RESULTS)に入っていきます。
今回は患者背景まで説明します。
<RESULTS>
今回は、「組み入れ患者」と「患者背景」について説明します。
なお、論文の著作権の関係上、論文の図表を本ブログに掲載することができませんので、ご了承ください。
(論文の図表をあわせてみてくださいね)
■組み入れ患者(フロー)
Figure 1をみてください。
1107例が組み入れられ、適格とされた1063例が無作為化されています。
541例がレムデシビル群、522例がプラセボ群に無作為化されました。
(その1つ下の部分は詳細なので飛ばし、さらにその下にいきます)
本試験は継続中なので、全ての患者が試験終了に至っていません。
レムデシビル群では391例が試験完了、132例は試験継続中です。
プラセボ群では340例が試験完了、169例は試験継続中です。
最終的に、レムデシビル群は538例、プラセボ群は521例について解析されたということです。
さて、組み入れ患者のフローでは脱落率について気を付けてみましょう。
以下の記事で以前記載しましたが、通常10~15%の脱落を見込んでいるので、その範囲内に入っていれば問題ないかと思います。
レムデシビル群は541例のうち538例が解析対象、プラセボ群は522例のうち521例が解析対象とされましたので問題なさそうですね。
~こちらで復習~
臨床試験 脱落について [★★]
~こちらで復習 ここまで~
■患者背景
Table 1が患者背景です。
患者背景で気にすべきことは、①組み入れられたのはどのような患者か?(重症度など)、②群間でバランスがとれているか、の2点です。
~こちらで復習~
臨床試験 患者背景(ベースライン特性) [★★]
~こちらで復習 ここまで~
②群間でバランスがとれているか
先に②の方ですが、本試験では層別無作為化をしているので、層別因子である「施設」と「重症度」についてはバランスよく割り振られているかと思います。
(「層別無作為化」については、第1回を参照ください)
層別因子の重症度ですが、8カテゴリーの方ではなく、「軽度/中等度」「重度」で分ける方の重症度です。
ただ、Table1には8カテゴリーの重症度しか掲載されていません。
Supplementary AppendixのTable S1に掲載されているので、あわせてみてみましょう。
「Disease severity」のとこです。
「Mild/moderate disease」、「Severe disease」ともに群間の差は1%未満に収まっていますね。
(表内に重症度の定義も丁寧に記載されていますね)
患者背景全体的にも、8カテゴリー別重症度のカテゴリー7で差異が少しあるくらいで、特にバランスは問題なさそうです。
(カテゴリー7は、レムデシビル群が23.1%、プラセボ群が28.2%)
①組み入れられたのはどのような患者か?(重症度など)
それでは、①の組み入れ患者の特徴についてみていきます。
今回はやはり重症度が重要かと思います。
先のTable S1の重症度をみてお分かりのように、圧倒的に「Severe disease」の患者さんが多く占めています。
「Severe disease」が9割弱、「Mild/moderate disease」は1割程度しかいません。
Table 1の8カテゴリーの方もみてみましょう。
(1~3は「回復」と定義されているので4以上の患者さんしかいません。また、8は死亡ですので、組み入れ時では4~7のいずれかとなります)
有効性の結果は主に8カテゴリーの重症度でみていきますので、よくみておきましょう。
一般の方も対象とした記事でも記載しましたが、
「4」が1割程度、「5」が4割程度、「6」が2割弱、「7」が2~3割ということです。
酸素吸入を要しない「4」の患者さんがいる一方で、重症の「7」の患者さんもおり、患者さんの幅が広いです。
だから、重症度別の有効性についても、分けてみていく必要があるのです(サブグループ解析の扱いです)。
↓一般の方も対象としたこちらの記事で既に説明しています。
新型コロナウイルス感染症(COVID-19)治療薬 レムデシビル②(治療効果) [★~★★]
他の患者背景についてはどうでしょうか?
年齢は平均58~59歳です。
年齢区分についてはTable S1にあり、18-39歳、40-64歳、65歳以上の区分に分けられて算出されています。
65歳以上が3~4割、40-64歳が約半数、残りが18-39歳です。
症状がみられてからの期間(Median time from symptom onset…)ですが、無作為化の時点において、中央値9日、四分位範囲で6~12日となっていますので、この程度の日数で投与を開始した患者さんに対するデータとして捉えましょう。
また、高血圧が50%弱、肥満が4割弱、糖尿病が3割程度となっています。
~中央値・四分位(IQR)についてはこちらで復習~
臨床試験の論文中の数値について①(平均値と中央値、標準偏差) [★★]
臨床試験の論文中の数値について②(四分位) [★★]
~こちらで復習 ここまで~
今回はここまでとなります。
次回から有効性の結果を説明していきます。
第4回では主要評価項目について、全体の結果とサブグループ解析の結果を説明しますが、あわせて解析方法(カプランマイヤー曲線、ログランク検定)や調整因子についても触れたいと思います。
<Sponsered Link>