臨床試験/臨床統計

新型コロナウイルス感染症(COVID-19)治療薬 レムデシビル 論文読解(第2回) [★★]

投稿日:

今回は試験概要の続きで、評価項目とサブグループ解析について解説していきます。

第1回:論文取得、試験概要1(目的、試験デザイン、組み入れ基準(選択基準・除外基準)、投与方法)
第2回:試験概要2(評価項目、サブグループ解析)
第3回:試験概要3(症例数の設定、解析方法)、結果1(患者背景)
第4回:結果2(有効性:主要評価項目)
第5回:結果3(有効性:副次評価項目、安全性)
(第3回~第5回は予定です)

<METHODS>(前回の続き)
■評価項目
主要評価項目、副次評価項目、他の評価項目について抽出しましょう。
「STATISTICAL ANALYSIS」(解析方法)の項目内に記載があります。
(「評価項目」(AssessmentやOutcomeなどの項目)が設けられることもあるのですが、この論文では評価項目が解析方法とあわせてまとめて記載されています。さらに主要評価項目以外が明確に記載されていないので分かり難いです)

-評価項目-(先に答えです)
主要評価項目:回復までの期間(28日時点)
重要な副次評価項目:8カテゴリーで定義された臨床状態(15日時点)
他の評価項目:死亡(14日時点、28日時点)、グレード3または4の有害事象、重篤な有害事象 など

主要評価項目について
主要評価項目については、STATISTICAL ANALYSISの2段落目、
「The primary outcome measure was the time to recovery, defined as the first day, during the 28 days after enrollment」
の箇所です。
それでは「回復」について考えてみましょう。どのように定義されていますでしょうか?
先ほどの文書の後に、
「patient satisfied categories 1, 2, or 3 on the eight-category ordinal scale」とあります。

8カテゴリーで定義された臨床状態が「1~3」になった場合に「回復」とされるということです。
それでは「8カテゴリーで定義された臨床状態」とはどのようなものでしょうか?
こちら、副次評価項目としても設定されているものです。

「8カテゴリーで定義された臨床状態」について
STATISTICAL ANALYSIS 2段落目の5行目~次の頁(3頁目)の左段14行目にかけて記載されています。
(「The categories are as follows…」~「8, death.」まで)

こちら、一般の方も対象とした以下の記事でも記載しました。
新型コロナウイルス感染症(COVID-19)治療薬 レムデシビル②(治療効果) [★~★★]

上記記事では分かりやすいように「<重症度の分類>」という用語を用いていましたが、実は本試験ではこれとは別にもう1つ重症度が定義されているため、こちらは「8カテゴリーで定義された臨床状態」と呼ぶことにします。
(本試験では、重症度の分類方法が2通りあるということです)

<8カテゴリーで定義された臨床状態>
1. 退院、活動に制限なし
2. 退院、活動が制限される(在宅酸素吸入が必要な場合も含む)
3. 入院、酸素吸入を要しない、治療の継続は不要
4. 入院、酸素吸入を要しない、治療の継続は必要
5. 入院、酸素吸入を要する
6. 入院、非侵襲的人工呼吸器または高流量酸素による管理
7. 入院、侵襲的人工呼吸器またはECMOによる管理
8. 死亡
(青字の「1」~「3」を「回復」と定義しています)

(補足)
1→8にいくにつれて重症
1と2は「退院」、3~7は「入院」で7が一番重症、8は死亡
「非侵襲的人工呼吸器」と「侵襲的人工呼吸器」の違いですが、「非侵襲的」はマスクなどで人口呼吸を行う方法、「侵襲的」は管を口や鼻から入れて行う方法です。
ECMOとは、体から血液を取り出し、その血液から二酸化炭素を除去して酸素を入れ、再度血液を体に戻す方法です。人工呼吸器では生命を維持できないような重症の患者さんに用いられます。
~(補足)ここまで~

主要評価項目について(続き)
主要評価項目の話に戻ります。
こちらの8カテゴリーにおいて、1~3に回復するまでの期間(日数)を主要評価項目としています。

なお、患者背景でも説明しますが、試験開始時には1~3の患者は含まれていません。
(含まれていたら、はじめから「回復」になってしまいますので)
8も死亡なので含まれていません。
試験開始時は4~7のいずれかになります。

重要な副次評価項目「8カテゴリーで定義された臨床状態」について
先ほどの8カテゴリーの説明の後に「Other outcomes…」とありますが、こちらは一端後に回して、先に副次評価項目から説明します。
STATISTICAL ANALYSIS 3段落目(3頁目左段の真ん中くらい、段落が変わるところ)
「The primary outcome was initially defined as the difference in clinical status,…」からです。
この段落の6行目に「key secondary outcome」という用語が出ています。

こちら非常に分かり難いのですが、こちらの項目が当初は主要評価項目にする予定であり、途中で副次評価項目に変更されたという経緯が説明されています。
(試験のプロトコールが途中で変更されたということです)
変更理由については、「Covid-19の症状が想定以上に長い経過を辿る可能性があったため」と記載されています。
(この段落の最後の5行「This change in primary outcome was made in response to…」の部分です)

それではこの副次評価項目がどのようなものかについてですが、先程の「8カテゴリーで定義された臨床状態」の患者数(割合)の分布のことです。
具体的には、レムデシビル群とプラセボ群の群別に、
カテゴリー1の割合、カテゴリー2の割合、カテゴリー3の割合、…、カテゴリー7の割合
を算出し、レムデシビル群とプラセボ群で差があるかどうかを検討します。

実はこちらのデータを、一般の方も対象とした
新型コロナウイルス感染症(COVID-19)治療薬 レムデシビル②(治療効果) [★~★★]
で紹介しました。
(治療効果をみるうえでは、こちらのデータが一番分かりやすいかと思いますので)

それでは最後に他の項目についてみていきます。

「他の評価項目」について
論文を少し戻り、3頁目左段14行目~の「Other outcomes…」に記載されています。
・mortality at 14 and 28 days after enrollment
⇒死亡(14日時点、28日時点)
・grade 3 and 4 adverse events and serious adverse events that occurred during the trial.
⇒グレード3または4の有害事象、重篤な有害事象
(Protocolには記載されているのですが、これらの「他の評価項目」は、「安全性評価項目」の扱いとなっています)

~こちらで復習~
臨床試験の評価項目(主要評価項目、副次評価項目、事後解析) [★★]
~こちらで復習 ここまで~

■サブグループ解析
サブグループ解析について、3頁目左17行目~記載されています。
(Prespecified sub-groups…)

“Prespecified sub-groups”は「事前規定されたサブグループ」の意味です。
「事前規定された」とは、試験開始前に定められたという意味です。

以前、「臨床試験 サブグループ解析 [★★]」の記事に記載しましたが、サブグループ解析を試験後に行おうと思えばいくらでも行うことができてしまうため、色んなサブグループを作って解析して、都合のよい結果のみを報告するということもできてしまいます。
そのため、試験後に新たにサブグループを定めて解析した結果は信頼性があまり持てず、悪者扱いされることもあります。
(なお、試験後に定めて行われる解析を「事後解析」といいます)

ただ、サブグループ解析自体が悪いということではなく、例えば今回の試験では、重症度の違いにより効果がどう異なるのか?、などについて確認ことは非常に重要かと思いますので、「傾向をみる」という意味では非常に意義のあるものです。
よって、サブグループ解析結果をみる際には、信頼性の面から、サブグループを試験前に定めていること(事前規定されていること)が明記されているかどうかを確認するとよいかと思います。

この論文では、上記の通り、“Prespecified sub-groups” 「事前規定されたサブグループ」と記載がありますので、試験開始前にきちんと定めたものということです。

ただし、サブグループ解析はあくまでも傾向をみるためのものであることに注意が必要です。
第Ⅲ相試験(検証試験)では主要評価項目について、プラセボ群に対して有意差が認められるように症例数が定められますが、サブグループに分けた時点で例数が担保されませんので、検定のp値もおまけ程度に見る必要があるかと思います。

~サブグループ解析についてはこちらで復習~
臨床試験 サブグループ解析 [★★]
~こちらで復習 ここまで~

話が脱線しましたが、本試験の話に戻ります。
今回の試験では、以下①~④のサブグループが定められています。
①性別…男性、女性
②重症度(disease severity)
③年齢…18~39歳、40~64歳、65歳以上
④症状が現れている期間(無作為化前の時点で)…10日以下、10日超

①③④は特に説明することはありませんので、②の重症度についてだけ説明します。

本試験で定義されている「重症度」は2つあります。
論文では、
disease severity (as defined for stratification and by ordinal scale at enrollment)
と記載されています。

1つは先に説明した「8カテゴリーで定義された臨床状態」ですが、こちらは”ordinal scale”の方です。
もう1つの重症度は”defined for stratification”ですが、この重症度は層別無作為化に用いた重症度です。
(前回、無作為化の説明で、層別因子として「施設」と「重症度」を用いている、と説明しましたが、そちらの重症度は8カテゴリーとは別に定められています)

定義については本文中ではなくSupplementary Appendixに記載があるため、そちらを見てみます。
(論文2頁目の左 DESIGNの10行目に”see the Supplementary Appendix”とあります)

Supplementary Appendix 17頁 2行目~に「重度(severe)」、5行目~に「軽度/中等度(mile/moderate)」の定義が記載されています。

<重症度(「重度」「軽度/中等度」)の定義>
重度(Severe disease
・人工呼吸器管理を要する(侵襲的または非侵襲的)
・酸素吸入を要する
・SpO2 ≤ 94% または 呼吸速度≥ 24回/分

軽度/中等度(Mild/moderate disease
・SpO2 > 94% かつ 呼吸速度< 24回/分
・酸素吸入を要しない

有効性の結果は、8カテゴリーの重症度と、こちらの「重度」「軽度/中等度」の重症度、どちらも出てきますので、混同しないようにしましょう。
(8カテゴリーの方が重点的に記載されています)

以上、今回は「評価項目」と「サブグループ解析」について解説しました。
次回は試験概要の残り「症例数の設定」と「解析方法」について説明していきますが、「解析方法」は結果と一緒に説明しようと思いますので、簡単に触れるだけになるかと思います。
それと、結果のはじめの部分の「患者背景」のとこまで進もうかと思います。
それではまた!

<Sponsered Link>



-臨床試験/臨床統計