第22回: ebm実践のための統計学(その9) · 3.5.3...

13
| サイトマップ | サイトトップへ 医学統計学 ログアウト TOP > 医学統計学講座 > 22株式会社サンテック 統計解析室室長 足立 堅一 先生 第22回: EBM実践のための統計学(その9) 医学論文を統計学的側面から読解するために ~~~~~~ CONTENTS ~~~~~~ 印刷される場合には、こちら PDF版)をご利用下さい。 PDFファイルをご覧になるには「推奨動作環境」をご覧ください。 3 各論 医学臨床論文読解や作成へのstep 3.5 ITTとrandomization 3.5.1 ITTとは何か? (1) 略号ITTの英語は? それを日本語に訳すとどうなる? (2) ITTが出現する局面は? -治験だけではない! 一般の臨床試験でも出現! 3.5.2 ITT vs. ITT解析 -ITT解析の目指すものは何か? (1) randomizationをした被験者を除くとbiasが掛かる! (2) 「無作為化」の2大別化 randomization random allocation vs. random sampling (3) 2大別化「無作為化」と内的/外的妥当性 3.5.3 ITT原則と実際適用上の諸問題 -ITT原則とbelling the cat (1) ITT解析によって招来する別の利点 randomization random allocation vs. random sampling (2) Fisherの実験計画法での3原則とrandomizationの位置付け -局所管理・反復・無作為化 (3) 求めるべき最終goalとは何か? -求めるべきはbias free/bias混入の回避 掲載内容のご使用は診断薬.NET「利用規約/著作権」に準じ 私的使用の範囲外でのご使用は事前に承諾が必要です。 | ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権| Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

Upload: others

Post on 21-May-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

株式会社サンテック 統計解析室室長

足立 堅一 先生

第22回: EBM実践のための統計学(その9)

― 医学論文を統計学的側面から読解するために ―

~~~~~~ CONTENTS ~~~~~~

印刷される場合には、こちら (PDF版)をご利用下さい。 PDFファイルをご覧になるには「推奨動作環境」をご覧ください。

3各論 ― 医学臨床論文読解や作成へのstep

3.5 ITTとrandomization 3.5.1 ITTとは何か?

(1) 略号ITTの英語は? それを日本語に訳すとどうなる?

(2) ITTが出現する局面は? -治験だけではない! 一般の臨床試験でも出現!

3.5.2 ITT vs. ITT解析 -ITT解析の目指すものは何か?

(1) randomizationをした被験者を除くとbiasが掛かる!

(2) 「無作為化」の2大別化 -randomization ⇒ random allocation vs. random sampling

(3) 2大別化「無作為化」と内的/外的妥当性

3.5.3 ITT原則と実際適用上の諸問題 -ITT原則とbelling the cat

(1) ITT解析によって招来する別の利点 -randomization ⇒ random allocation vs. random sampling

(2) Fisherの実験計画法での3原則とrandomizationの位置付け -局所管理・反復・無作為化

(3) 求めるべき最終goalとは何か? -求めるべきはbias free/bias混入の回避

※掲載内容のご使用は診断薬.NET「利用規約/著作権」に準じ 私的使用の範囲外でのご使用は事前に承諾が必要です。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

NEXT

今回は、dataの統計解析のときに遭遇するITTという概念について解説する。ITTを何故採り上げることにしたのか? その理由は、

その概念を理解するためには、ITTという英語を日本語に訳しただけではその背後に潜むものの本質的理解には至らないであろうこと、ITTなる解析は、治験だけでなくて、一般的臨床試験においても用いられること、

ITTなる概念/主義は1つであっても、実際にそれを具体化・実践化するときには、1つの

決定的でstereotypeな手順でかつ科学的に妥当な手順は現実的に存在しそうもないこ

と、そのためにより妥当なものは何かを常に考える目・senseを養うことが必要と判断したためである。

3. 各論 ― 医学臨床論文読解や作成へのstep

3.5 ITTとrandomization 3.5.1 ITTとは何か?

(1) 略号ITTの英語は? それを日本語に訳すとどうなる?

ITTの英語は、 Intention To Treat または、 Intent To Treat である。 日本語に訳すと、 治療/処置をする意図・目的ということになろう(表1)。

表1 ITT略号の英語とそれに対応する日本語の意味

Intention To Treat または、Intent to Treat ↓

治療/処置をする意図・目的*

*注 :一般には、日本語訳されず、そのまま使われる。その点では、略号QOLと状況は類似している。

訳しても、分ったような、分からんような気分であるのは、筆者だけではなかろう。 少なくとも、「治療/処置をする意図・目的」 がなんで 「統計解析」 と関係していくのかをこれだけで理解できるであろうか?

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT 3.5.1 ITTとは何か?

(2) ITTが出現する局面は? -治験だけではない! 一般の臨床試験でも出現!

「治験」だけなら、この連載の読者の半分が「俺には関係ないね!」とどこ吹く風の態度でおれようが、残念ながらそうは問屋が卸さない。 先ずは、治験での代表的文書/guideline の例として、ICH-E9「臨床試験のための統計

的原則」の一部を紹介しよう(表2)。そこには、「Intention-To-Treat の原則 / Intention-To-Treat Principle」として記述がある。

表2 「 Intention-To-Treatの原則/Intention-To-Treat Principle」

用語集:

治療に用いる治療方針により得られる効果は、実際に受けた試験治療ではなく、被験者を治療しようとする意図(予定した試験治療規定)に基づくことにより最もよく評価できる、ということを主張する原則。 この原則から、一つの試験治療グループに割付けられた被験者は、予定した試験治療のコースを遵守したかどうかにかかわらず、割付けられたグループのまま追跡され、評価され、解析されるべきであることが導かれる。 5.2.1 最大の解析対象集団:

Intention-to-treat の原則(用語集参照)は、ランダム化が行われた全被験者を主要な解析に含めるべきであると主張するものである。

出典:「臨床試験のための統計的原則」 医薬審第1047号、1998年11月30日

やはり、難解であろうが、ITTの輪郭や本質はぼんやりと把握できるであろう。それは、妥当にも

原則(principle)と表現されていることで、筆者流に言えば、「主義」という用語で呼びたいことと繋がること、無作為化と深い繋がりを有すること、

統計解析的にどんな扱いをするかの概念の漠然としたimage化に繋がること、であろう。

次に、一般の臨床試験論文でその使用例・適用例を包括的に議論している論文1)を紹介する。 先ず、ここでは、この 「原理」 に基づくものとして、 「Intention-to-treat analysis / Intention-to-treat 解析」 という用語が見られることに注目したい。この論文については以後も逐次その内容を紹介する。 それによると、MEDLINE database を用いた検索の結果、RCT(Randomized Control Trial)として報告された1999年の英文論文の半数弱に ITT の記載が見られたという。

1)R.L.Kruse, B.S.Alper, C.Reust, J.J.Stevermer, S.Shannon, and

R.H.Williams, "Intention-to-treat analysis: Who is in? Who is out?", Journal of Family Practice, No.11, Vol.51, 2002

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT

3.5.2 ITT vs. ITT解析 ―ITT解析の目指すものは何か?

その目指すところは、既にその概要は紹介したので、ぼんやりながらその一端は想像できるであろう。 ITT原則 / 解析とは、「無作為化した被験者は、解析には全て取り込むべきである」 つま

り、”once randomized, always analyed” , ”including all randomized subjects when analyzed randomized controlled trials” 1)との主義であることである。 では何故そうすべきなのだろうか?それを理解できるかできないかそれが問題である。また、「無作為化した被験者」と謳われているが、「無作為化しない被験者/試験」は、それではどうなるのかについては、言及されたものを筆者は、不勉強ながら、未だ見たことがないが、ITT原則主義者には論外になるように思われる(一方で、現実に実施される研究において、無作為化がなされない研究も少なくないし、「何でも是が非でも無作為化だ!無作為化すれば全てが解決するのだ!そうでないと無価値だ!」というその問題の本質的な洞察を伴わない、頭ごなし

の教条主義的な態度に連結することは、逆の意味での bias/偏見に繋がる危険性があることをここで喚起したい)。

(1) randomizationをした被験者を除くとbiasが掛かる!

”ITT is an important factor in minimizing bias” 1)と記載されている。これを次の例題として理解を深めることにする

例題1 既に紹介した「臨床試験のための統計的原則」に、

とある。「解析時にも最初のランダム化を維持することは、偏りを防ぎ、統計的検定の強固な基盤を与える点で重要である。」との記載の意味を説明すること。

5.2.1 最大の解析対象集団 (中略)。本ガイドラインでは「最大の解析対象集団」という用語を用い

て、ランダム化が行れた全被験者を含める intention-to-treat という理想に可能な限り完全に近づけた解析対象集団を表すことにする。解析時にも最初のランダム化を維持することは、偏りを防ぎ、統計的検定の強固な基盤を与える点で重要である。 多くの臨床試験において、最大の解析対象集団を用いることは保守的な戦略となる。また多くの状況で、最大の解析対象集団により得られる試験治療の効果の推定値は、後の日常診療での効果を反映する可能性がより高いといってよい。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT 3.5.2 ITT vs. ITT解析 -ITT解析の目指すものは何か?

例題1:

既に紹介した「臨床試験のための統計的原則」に、

とある。「解析時にも最初のランダム化を維持することは、偏りを防ぎ、統計的検定の強固な基盤を与える点で重要である。」との記載の意味を説明すること。

5.2.1 最大の解析対象集団 (中略)。本ガイドラインでは「最大の解析対象集団」という用語を用いて、ランダム

化が行れた全被験者を含める intention-to-treat という理想に可能な限り完全に近づけた解析対象集団を表すことにする。解析時にも最初のランダム化を維持することは、偏りを防ぎ、統計的検定の強固な基盤を与える点で重要である。多くの臨床試験において、最大の解析対象集団を用いることは保守的な戦略となる。また多くの状況で、最大の解析対象集団により得られる試験治療の効果の推定値は、後の日常診療での効果を反映する可能性がより高いといってよい。

特に「統計的検定の強固な基盤を与える」ということの理解は、一般教養としての一般的な統計解析の教科書にも記載がないであろうために、大いに難解であろう。 その意味は、簡単に言ってしまえば、検定、一番popular な t 検定(それ以外のものも理屈は同じ)を例に採れば、その検定の基盤となっている理論的な(対応のな

い) t 分布(標本分布)は、正規分布する同一母集団(population)から2つの群(2

標本)を抽出(sampling)することを前提として理論構築され、t 分布(頻度分布)が誘導されていることを理解することが必要になる。 確かに、A群は大き目なものを、B群は逆に小さ目なものを恣意的に標本抽出する

のは駄目なこと/biasが掛かる、それを回避するのには、random sampling が1つの有力な手段であることも、誰でも分るであろう。

例題1の解答を、換言して、例題2としてもう一歩理解を深めることにしよう。

例題2 例題1の解答で、「randomize samplingしないと biasが掛かる」と解説し

た。それを別の用語で換言するとどうなるか?

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT 3.5.2 ITT vs. ITT解析 -ITT解析の目指すものは何か?

例題2:

例題1の解答で、「randomize samplingしないとbiasが掛かる」と解説した。それを別の用語で換言するとどうなるか?

こうして得てしまったdataである限り、t 検定をするとして、t 分布表を用いて、たと

えp 値を計算しても、その p 値が信用できない/妥当性がないということである。 つまり、例えば、p 値が0.05 を切ったので、統計的に有意だとする妥当性、その逆の場合の妥当性がないのである。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT 3.5.2 ITT vs. ITT解析 -ITT解析の目指すものは何か?

以上から結論されることは、

表3 理想的ITT原則の基本

試験実施においては、「無作為化」をすること解析においても、その「無作為化」を遵守すること

そうする目的は、biasを防ぐこと / biasを最小化すること、統計的検定の基盤を与えること

ということになる。 なお、biasの発生回避と統計的基盤の確保とを同一視しての解説(一般に統計学者に代

表される)と統計的基盤の確保には言及せず、除外例を設けることがbiasの発生の元凶で

あり、それを回避するのがITTと受け取れる解説1)とが見られる。

(2) 「無作為化」の2大別化 -randomization ⇒ random allocation vs. random sampling

今まで、「無作為化 / randomization」なる用語を世間的にもそうであるように用いて来た。 しかし、このままだと、実は曖昧さを内在させており、かつそれが誤誘導になり兼ねないと筆

者には思われる。そこで、第19回で既に解説したように、random allocation vs. random sampling との2大別したい。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT 3.5.2 ITT vs. ITT解析 -ITT解析の目指すものは何か?

(3) 2大別化「無作為化」と内的/外的妥当性

例題とはしないが、一般のほとんどの研究において、なされている「無作為化 / randomization」は2大別したときのどちらになるか?と言えば、random allocation であり random sampling ではない。 そして、前者で保証されるのは、内的妥当性だけであり、後者でなければ外的妥当性 / 一般化可能性は保証されない。このことは、既に第19回で既に解説した(表4)。

表4 「無作為化/randomization」の2大別化と内的/外的妥当性

randomization ⇒ random allocation vs. random samplingrandom allocation: 内的妥当性(内部妥当性internal validity)の保証

random sampling: 外的妥当性(外部妥当性external validity)・一般化

可能性(generaliability)の保証

一般の試験 / 研究でなされているもの&達成されているもの: -random allocation:内的妥当性

最近、こうして明確な区別の下に同様な解説がしてある論文2)を見つけたので紹介してお

く。また、計算された p 値の妥当性は random allocation vs. random sampling でどうなるのかとの疑問が生じるかも知れない。 そうした観点から明確に論じたものにお目に掛かったことがないのであるが、 random allocation した試験から内的妥当性を求めるのには問題ないと思われる。しかし、それにより外的妥当性を求めるのは当然ながら一般的には妥当ではない。

2)丹後敏郎,「良質の根拠を有無randomizationの本質―科学研究者としてのセンス―」, J. Natl. Inst. Public Health, No.4, Vol.49, p308-312, 2000

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT

3.5.3 ITT原則と実際適用上の諸問題 ―ITT原則とbelling the cat

ITTは原理原則・主義であると述べたのには理由がある。 それは、総論的には、ITT主義の理想に反対者はいない。しかし、現実にどうするか/どうすればそれが実現できるかについては百家争鳴とはいかないまでもかなり見解や実践方法が分か

れるのが現実であり、事実、論文1)においてもそうした報告がある。 いわば、「ネコに鈴を付ける」のは妙案至極である。しかし、各論的に、では「誰がどのようにして鈴を付けるのか」となれば、理想実現への困難さという現実がそこには見えて来る。私見になるが、固定的手順で万人が認める唯一のものに決めることは不可能なものと思われる。 すなわち、無作為化およびITTを標榜している論文から、1)の論文の著者が review・

investigate 対象として無作為抽出した論文100報の内、無作為化した被験者全部を解析に

組み込んだ研究報告は42/100と半数弱であり、残り58/100は何らかの理由で被験者の一部を解析から除外していたのである。除外症例は、無作為化後追跡ができなかったのが16

case、ついで割り当てた処置を受けなかったのが14case、選択基準を満たしていなかったの

が14caseなどとなっている。 論文の著者は、ITTを標榜しながら、こうした除外した解析をしたcaseには批判的であるが、筆者は必ずしもそれに賛成ではない。これらを解析に除外しないで組み入れた場合には、これらは無効なものが多数であることが予想されるために、今度は適正な評価へ繋がることより

は、有効性の過小評価(bias)が懸念されるからである。勿論、除外例が殆ど発生しない、換言

すれば除外する/しないが大勢の結論に影響しないような品質の高い研究をすべきであることには全く異論はない。 つまり、除外例が多い/少ない=品質が悪い/良いを批判されるべきであり、除外した/しないを批判されるべきではないと筆者は考える。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT 3.5.3 ITT原則と実際適用上の諸問題 -TT原則とbelling the cat

(1) ITT解析によって招来する別の利点 -randomization ⇒ random allocation vs. random sampling

また、副産物というのは適当ではないかも知れないが、ITT解析によってもたらされるもう1つの別の利点がある。筆者はむしろこちらの方に対しての関心の方が高い。それは、例題1での以下の記述である(表5)。

表5 ITT解析の好ましい副産物

また多くの状況で、最大の解析対象集団により得られる試験治療の効果の推定値は、後の日常診療での効果を反映する可能性がより高いといってよい。

どうしてそうなるのかも例題としてよいかも知れないが、結論を言うと、途中でfollow-upできなくなった症例を採り入れて「有効性」を求めると、無効例となるのが普通であるためであ

る。日常診療での効果へ反映させるためとの観点から、1)の論文の著者が除外例を設けず、全例を解析の分母に入れるべしとの見解であるとすれば、筆者も異論はない。 筆者は、これを「温室栽培」と「露地栽培」とか、競馬用の馬の「馬場上競走」と「街路上競走」とに喩えている。前者では理想的で実力が全開可能な環境であるものの、現実の場つまり後者で発揮できるのはそれよりは低いのが普通である。 これと関連して、現実的用語とそれが使われるcaseを次の例題としておく。

例題3 「温室栽培」と「露地栽培」との比喩の該当するものを、表2や例題1から見

つけ出すこと。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT 3.5.3 ITT原則と実際適用上の諸問題 -ITT原則とbelling the cat

例題3:

「温室栽培」と「露地栽培」との比喩の該当するものを、表2や例題1から見つけ出すこと。

表2の「実際に受けた試験治療」が前者に該当する。これを当該guidelineでは、

PPS(Per Protocol Set)の用語で定義している。 一方で、例題1での「 intention-to-treat という理想に可能な限り完全に近づけた

解析対象集団」が後者に該当する。これを当該guidelineでは、FAS(Full Analysis Set)の用語で定義している。つまり、FASとはITT主義を実践して、現実

的に適応したときの1つの具体物である。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT 3.5.3 ITT原則と実際適用上の諸問題 -TT原則とbelling the cat

(2) Fisherの実験計画法での3原則とrandomizationの位置付け -局所管理・反復・無作為化

これについても第13回で既に解説した。ここで新たに問題にしたいのは、 ―3原則での「局所管理」と「無作為化」とは矛盾しないか? という点である。 私的見解としては、局所管理と無作為化とは一部で矛盾する側面を有していると思うのである。無作為化至上主義では、「局所管理」は無用の長物ではあるまいか? 矛盾する局面に直面したときに、Fisher はどうであったか知らないが、どちらを重視するかが人により分かれるのが現実である。例えば、「局所管理 << 無作為化」 主義者であって

も、ほとんどが block randomization(第13回)は肯定的であるだろうと思われるがそこには矛盾はないだろうか?

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第22回

第22回:EBM実践のための統計学(その9)株式会社サンテック 統計解析室室長

足立 堅一先生

BACK 3.5.3 ITT原則と実際適用上の諸問題 -ITT原則とbelling the cat

(3) 求めるべき最終goalとは何か? -求めるべきはbias free/bias混入の回避

結局のところ ITT だろうと、その他のものであろうと、「求めるべきは bias free / bias混入の回避」である。そのためには、ITT あり、randomization ありである。 しかし、randomization だけで全てが解決するというのは短絡的であろう。それは、

blinding / masking などがそれを補強する形で用いられていることだけを見ても明瞭である。 また、bias free が理想ではあるが、それがどうしても達成できない状況では、更に智慧を

絞れば、「求めるべきは、bias freeではあるが、どうしても駄目なときの次善の策は、bias の方向を知れ!」ということになるであろう。 biasがどちらの方向(over-estimation or under-estimation)か分らないものは、一般

に煮ても焼いても食えないが、方向が判明し、自分に不利な方向のbias下でも勝った / 自分に有利な方向のbias下でも負けたという結論が出た場合には、そうした結論は妥当だからである。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.