(3) pattern-mixture modelの解説...【日本製薬工業協会シンポジウム】...

54
日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について -統計手法・estimandと架空の事例に対する流れの整理- (3) PATTERN-MIXTURE MODELの解説 医薬品評価委員会 データサイエンス部会 タスクフォース4 欠測のあるデータに対する解析方法論・ SASプログラム検討チーム 田辺三菱製薬株式会社 高橋 文博 1

Upload: others

Post on 05-Feb-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

【日本製薬工業協会シンポジウム】

臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

-統計手法・estimandと架空の事例に対する流れの整理-

(3) PATTERN-MIXTURE MODELの解説

医薬品評価委員会 データサイエンス部会 タスクフォース4

欠測のあるデータに対する解析方法論・SASプログラム検討チーム

田辺三菱製薬株式会社 高橋 文博

1

Page 2: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

発表構成

1. Multiple Imputation

2. Pattern Mixture Model

1. Pattern Mixture Modelとは

2. 制約条件を仮定したPattern Mixture Model

1. CCMV, NCMV, NFMV

2. マクロプログラム,実行結果

2

Page 3: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

Section 1

Multiple Imputation (MI)

3

Page 4: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

MARを仮定した単調回帰のMI (主解析)

PMMの推定のためのMI

Multiple Imputation(MI)

4

Page 5: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

5

• Rubin(1978,1987)によって提案された方法 • 欠測メカニズムがMARであれば,MARに基づくMIの 解析(主解析)は妥当 • 複数回の補完を行うことで,欠測値の補完に対して 不確実性を考慮 • MIにおける解析モデルと補完モデルが尤度ベースのモデルと同じならば,MIの結果は尤度ベースの結果と

類似.(Mallinckrodt,2013) 補完モデル:欠測値を補完するための統計モデル

解析モデル:多重補完された完全データを用いて解析するための統計モデル

• MIが有用な状況(Dmitrienko et al, 2005): 共変量の欠測を補完 PMM(MNAR)の枠組みでも適用可能 非単調な欠測を補完

Multiple Imputation(MI)

Page 6: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

6

• 単調又は非単調 欠測パターン仮定 • 表1 Proc MIにおける補完方法 (Yuan, 2011)

Multiple Imputation(MI)のSASの実行種類

Page 7: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

7

• ある時点 欠測値 を補完するため,観測されたデータ を用いて予測分布を構築

• 予測分布を構築する為の回帰モデル

• 回帰パラメータの推定値 • 共分散行列 ただし, は は, で構成されるデザイン行列

MIにおける単調回帰の概略

Page 8: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

8

• パラメータの事後分布から下記をサンプル : が観測されているデータ数 : 個の変数で互いに独立の正規変数ベクトル 分散: 回帰係数: ただし, はコレスキー分解 により得られる上三角行列

• 欠測値 を下記の式で生成される値で補完

• 上記の過程をM回繰り返す

jnjY

MIにおける単調回帰の概略

Page 9: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

9

• k x 1の長さのパラメータベクトル: • 補完回数:M回 • M個の完全データセットより推定されるパラメータ ベクトル: • このとき,上記のベクトルの推測は下記にもとづく

Multiple Imputationの概略(Rubin 1987)

例)群間差や

群間差の分散

平均補完内分散

補完間分散

Page 10: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

10

• 漸近正規性により下記の検定統計量を構成

• (Li et al, 1991)によるF分布に基づく推測を利用 におけるF統計量とP値

• 漸近論の推測は標本数Nや補完数のMに依存.

Multiple Imputationの概略(Rubin 1987)

Page 11: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

11

• 最初は,十分な結果(推定値の精度があまり変化しない)を得るのに必要な補完数Mは3~5(Molenberghs et al. 2007)

• しかし,最近の文献では,少なくても欠測確率(%)以上 例えば, 20%の欠測データ → 20回以上の補完が必要 (White et al, 2011), 手法を比較する際は,モンテカルロエラーを考慮し 100~1000回の間は必要 (Royston and White, 2011)

• Mを大きくとるほど,信頼区間・p値の近似精度は高くなる, 小さすぎると,近似精度が不十分である可能性も

Multiple Imputationの概略(Rubin 1987)

Page 12: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

12

①MIの実行 proc mi data = XXXX seed = シード番号 nimpute = 補完回数(補完されたデータセットの作成個数) out = 多重補完後の出力データセット名; by 薬剤群変数; monotone method = reg(単調回帰の場合); var v0 val1 val2 val3 val4(解析対象変数); run;

②多重補完後,多重補完によって得られたM個のデータセットのそれぞれに対して解析モデルを適用.

例)Mixed プロシジャーによるANCOVAモデル 最終時点の値=治療効果+ベースライン値

>結果が安定しないケースもあるので,補完回数を複数試行し,P値や推定値の安定性を確認する

単調回帰のMIによるSAS プログラム(例)

Page 13: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

13

③解析モデルで得られたM個の解析結果より MIANALYZEを用いて解析結果の一つに統合

proc mianalyze data=XXX alpha=0.05; modeleffects estimate(対象推定値の変数); stderr stderr(標準誤差の変数); ods output ParameterEstimates=統合結果; run;

(参考) 石田和也,斎藤和宏,Proc Mianalyzeを用いた多重代入法の結果の統合,

2014,SASユーザー総会論文集

単調回帰のMIによるSAS プログラム(例)

Page 14: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

①及び③で得られるSASデータセット

14

Proc MI補完前 SASデータセット

Proc MI 補完後 SASデータセット

M個生成

Proc mianalyze 統合前データセット(群間差)

各群の推定値に関するデータセットに対しても同様 Proc mianalyze

統合後データセット(群間差)

単調回帰のMIによるSAS 解析結果(例)

Page 15: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

解析対象データ

◎うつ病の第III相試験を想定したシミュレーションデータ

0

10

20

30

(平均±SD)

実薬群 プラセボ群

●主要評価項目:HAM-D

→ スコア低下:改善

(解析には変化量使用)

●実薬群 vs プラセボ群

・1群100例(ベースライン時)

ベースライン 時点1 時点2 時点3 時点4

例数 平均

(SD) 例数

平均

(SD) 例数

平均

(SD) 例数

平均

(SD) 例数

平均

(SD)

実薬群 100 20.0

(4.1) 93

18.1

(4.2) 89

14.9

(5.4) 84

11.0

(6.3) 83

8.5

(6.8)

プラセボ群 100 20.1

(4.2) 90

17.5

(4.2) 87

15.4

(4.6) 85

13.3

(6.3) 80

11.0

(6.1)

ベースライン 時点1 時点2 時点4 時点3 ◎単調な欠測のみ

15

Page 16: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

16

解析モデル

欠測メカニズム/欠測確率

時点4における各群の 点推定値(SE) 群間差 群間差のSE P値

実薬群 プラセボ群

MI MNAR/Low

-11.26(0.68) -8.75(0.67) -2.51 0.96 0.009

- 多重補完後の解析モデル: ANCOVA proc mixed data=/*補完後データセット*/; by _Imputation_; class trt; model val4=x0 trt; lsmeans trt/pdiff=control("2") cl alpha=0.05; ods output diffs=/*群間差のデータセット*/; ods output lsmeans=/*各群の推定値のデータセット*/; run;

(MARを仮定した解析)MI(単調回帰)+ANCOVA: 解析対象データの解析結果

Page 17: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

17

PATTERN MIXTURE MODEL (PMM)

Section 2

Page 18: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

SM(Selection Model 再褐)

• SM(Selection Model)とは

– 完全データの尤度が,以下のように分解されることを想定.

応答変数の分布の

パラメータ Type (i) の仮定 Type (i) の仮定

18

PMMは上記の同時密度関数は どのように分解される?

Page 19: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

19

*Little (1993,1994,1995)

Ratitch et al. (2013)

推定不可能な欠測データの確率分布に何らかの制約条件が必要

NRC (2010)

Type(i):欠測データの分布に対する

検証不可能な仮定

Type(ii):観測データの分布に対する

検証可能な仮定

Selection Modelとの違い 観測データ,欠測データ,欠測識別

変数の同時分布の分解方法が異なる

:被験者 観測された応答変数

:被験者 の観測されなかった(欠測)応答変数

:被験者 の欠測識別変数

:被験者 の観測されている共変量

PMM

:欠測識別変数の分布のパラメータ

Type (ii) Type (i)

:応答変数の分布のパラメータ

Page 20: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

20

①脱落時点に基づく脱落パターン

例) 観測○ 未観測×

時点1 ○ 時点2 ○ 時点3 ○ 時点4 ○ パターン1

時点1 ○ 時点2 ○ 時点3 ○ 時点4 × パターン2

時点1 ○ 時点2 ○ 時点3 × 時点4 × パターン3

時点1 ○ 時点2 × 時点3 × 時点4 × パターン4

②中止理由に基づく脱落パターン

中止理由1:有害事象により中止

中止理由2:効果不足

中止理由3:被験者の同意撤回 など

他にもパターンの定義は可能

(ア)パターン1のデータのみで 解析した場合,バイアスが入る

(イ)×のデータを補完してバイアスを減らしたい

(ウ)×の分布に「○の分布と結びつける仮定(制約条件)」を追加し、×の特定された分布を解析に活用する

欠測メカニズムがMARやMNARの状況を想定

欠測パターンの例

Page 21: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

21

Missing data in clinical trials page 37, Molenberghs et al. (2007)より

制約条件と欠測メカニズムの関係図

MARがMNARに包含される形で定義

Page 22: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

制約条件を仮定したPMMにおける分布の記号整理

確率密度関数1 最終観測時点 が 時点を条件づけた上での 応答変数 の分布

最終観測時点をパターンと同一視,脱落パターンと考える

確率密度関数2

最終観測時点 が 時点以上を条件づけた上 での応答変数 の分布

22

Page 23: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

確率密度関数3 最終観測時点 が 時点,かつ応答変数 を条件づけた上での応答変数 の分布 制約条件NFMVを考えるうえで,観測値が現在,過去,未来のどれにあたるかを考える必要がある

例1 最終観測時点 が3以上の為, は過去に 観測されているデータ=>特定可能 例2

最終観測時点 が1の為, は過去に観測, は現在 の未観測, は未来の未観測データ=>特定不能

制約条件を仮定したPMMにおける分布の記号整理

23

Page 24: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

Thijs et al. (2002)は上記の制約条件を統一的に示す形でPMMを提案

24

t時点まで観測

未観測データの分布

制約条件(CCMV,NCMV,ACMV)を 仮定したPMM

簡単な記載とする為, 以降の章において共変量 ,応答変数に関するパラメータ 及び欠測パターンに関するパラメータ は除いて記載する.

Page 25: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

①脱落時点に基づく脱落パターン

例) 観測○ 未観測×

時点1 ○ 時点2 ○ 時点3 ○ 時点4 ○ パターン1

時点1 ○ 時点2 ○ 時点3 ○ 時点4 × パターン2

時点1 ○ 時点2 ○ 時点3 × 時点4 × パターン3

時点1 ○ 時点2 × 時点3 × 時点4 × パターン4

②中止理由に基づく脱落パターン

中止理由1:有害事象により中止

中止理由2:効果不足

中止理由3:被験者の同意撤回 など

他にもパターンの定義は可能

25

(ア)パターン1のデータのみで 解析した場合,バイアスが入る

(イ)×のデータを補完してバイアスを減らしたい

(ウ)×の分布に「○の分布と結びつける仮定(制約条件)」を追加し、×の特定された分布を解析に活用する

欠測メカニズムがMARやMNARの状況を想定

欠測パターンの例(再掲)

Page 26: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

この重みωsj (s:補完対象時点,j:どのパターンの分布)の設定により,制約条件CCMV,NCMV,ACMVを表現 以上,3つの制約条件を完全データの分布関数に代入

26

• 制約条件(CCMV,NCMV,ACMV)

制約条件(CCMV,NCMV,ACMV)を 仮定したPMM

左辺:×の分布

右辺:○の分布

Page 27: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

27

制約条件1 (CCMV:Complete Case Missing Value)

最後まで観測されたCompleter (例,パターン1)の情

報から欠測の情報を補完するもの.完全パターンのデータを利用し,多くの被験者がCompleterのパターンの場合を満たしている場合に有用.また,Non-monotoneのときにも利用が容易. 例) 観測○ 未観測×

パターン1 時点1 ○ 時点2 ○ 時点3 ○ 時点4 ○

パターン2 時点1 ○ 時点2 ○ 時点3 ○ 時点4 ×

パターン3 時点1 ○ 時点2 ○ 時点3 × 時点4 ×

かつその他 のとき 左辺:×の分布

右辺:○の分布

Page 28: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

欠測時点で測定された一番近いパターンの情報から欠測の情報を補完するもの.たとえば,下記の例でパターン3の 時点3を補完したい場合,一番欠測パターンが近いパターン2のデータの分布から補完 例) 観測○ 未観測× パターン1 時点1 ○ 時点2 ○ 時点3 ○ 時点4 ○ パターン2 時点1 ○ 時点2 ○ 時点3 ○ 時点4 × パターン3 時点1 ○ 時点2 ○ 時点3 × 時点4 ×

28

制約条件2 (NCMV:Neighboring Case Missing Value)

かつその他 のとき 左辺:×の分布

右辺:○の分布

Page 29: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

29

制約条件3

(ACMV: Available Case Missing Value)

:脱落パターン

における観測

された割合

• 単調な欠測の場合に,ACMVはMARと同等

Page 30: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

30

制約条件3

(ACMV: Available Case Missing Value)

欠測時点以降に観測されている全てのパターンの情報から欠測の情報を補完するもの.先ほどの例で,パターン3の時点3の値を補完したい場合,欠測のパターンが一番近い パターン2とCompleteパターン1のデータの分布から補完 例) 観測○ 未観測× パターン1 時点1 ○ 時点2 ○ 時点3 ○ 時点4 ○ パターン2 時点1 ○ 時点2 ○ 時点3 ○ 時点4 × パターン3 時点1 ○ 時点2 ○ 時点3 × 時点4 ×

Page 31: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

31

CCMV NCMV ACMVの制約条件と その他の制約条件

• CCMV, ACMV, NCMVは、どれが正しいか?

• 欠測しているデータの真の状況次第.真の状況は、欠測しているので,誰にも分からない…でも,制約条件を決めないと解析できない

• CCMV NCMV ACMVの制約条件をどう使い分ける?

Page 32: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

32

CCMV NCMV ACMVの制約条件と その他の制約条件

• CCMV NCMV ACMVの制約条件をどう使い分ける? 欠測メカニズムをもとに制約条件を選択する? O’Kelly et al (2014)を参考 ①CCMVを選択

完了例だけの分布を欠測値の補完に利用している ことから,バイアスが入る

②NCMVを選択 Neighbourhoodの例数が十分取れない場合があり, 実行がしにくい場合がある

③単調な欠測の場合でMARに近いならば ACMVを選択,3つの条件の中では一番望ましいのでは?

• PMMの枠組みでMARに対応するACMVがあるが,もう少し広い欠測メカニズム(MNAR)を考えたい場合,SMのNFD(後に説明)に対応する制約条件として

NFMVを選択=>後に説明

Page 33: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

33

1. 各脱落パターンtにおける観測されたデータの 分布 のパラメータ推定 2. 制約条件としてACMVを選択 3. 2.の選択にもとづき,未観測データの条件付き分布 を特定. 条件付き分布は は重み と

その重みにくっついている分布で構成されている為,一様 乱数を用いて,構成されている分布から一つ分布を選択 する.選択された分布から乱数を取得し,欠測値の 補完値として利用 4. 欠測値に対して多重補完(MI)のデータセットを作成 5. 多重補完したデータを適切な解析モデル (MMRMなど)で解析 6. Rubin(1987)の考えにもとづき,複数の解析結果を統合

Thijs et al. (2002)の実装方法(MAR)

Page 34: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

• Diggle and Kenward (1994)がNon Future Dependent(NFD)という仮定したSMを提案

• NFDを定式化,NFDは自然な仮定

• Kenward et al. (2003) により,NFD⇔NFMVが証明

制約条件(NFMV)を仮定したPMM

34

t時点までは観測,t+1時点以降は未観測の脱落パターン

t時点までは観測されている応答変数,t+1時点以降は未観測の応答変数

Page 35: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

• Kenward et al. (2003)はMNARを仮定したPMMを提案 • ACMVの結果とNFMV+CCMV又はNFMV+NCMVの結果比較することは,

MARの欠測メカニズムからの乖離を評価

制約条件(NFMV)を仮定したPMM

35

未観測

現在

(t+1時点) 過去

(t時点まで)

未来

(t+2時点以降)

制約条件が必要

Page 36: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

• Kenward et al. (2003)はMNARを仮定したPMMを提案 • ACMVの結果とNFMV+CCMV又はNFMV+NCMVの結果比較することは,

MARの欠測メカニズムからの乖離を評価

制約条件(NFMV)を仮定したPMM

36

制約条件

NFMVと異なる制約条件(CCMV,NCMV)を仮定

Page 37: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

• 脱落が今現在観測されていないデータに依存し,未来に観測されていないデータには依存しない

• 欠測メカニズム(Selection ModelのMissing Non-Future Dependent:MNFD)と同等

• 完全にデータの分布が特定できない,すなわち下記の 条件付き分布(現在)のみも特定されていない 制約条件(CCMV, NCMV,ACMV)の追加が必要

37

NFMV+CCMV,NFMV+NCMV => MNARを仮定

現在(t+1)の未観測のデータ

に対して

制約条件(NFMV: Non-Future Missing Value)

ACMVを含む

Page 38: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

38

制約条件(NFMV: Non-Future Missing Value)

例) 観測○ 未観測× パターン1 時点1 ○ 時点2 ○ 時点3 ○ 時点4 ○ パターン2 時点1 ○ 時点2 ○ 時点3 ○ 時点4 × パターン3 時点1 ○ 時点2 ○ 時点3 × 時点4 × パターン4 時点1 ○ 時点2 × 時点3 × 時点4 ×

2時点以上先の×に対して制約条件NFMVを仮定

1時点先の×及び制約条件NFMVの一部(下記の式)の両方に対して制約条件CCMV,NCMV,ACMVを仮定

に対して

上記の制約条件にACMVを選択した場合(製薬協レポート参照)

全体の制約条件はACMV,NFMV+ACMV=>ACMV

Page 39: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

39

1.パターンごとに特定可能な分布 の パラメータを推定 2.制約条件のCCMVやNCMVを用いて,現在観測されていない の のデータの分布のモデル化

3.制約条件のNFMVを用いて,未来の未観測データ の条件付き分布を特定.この分布をもとに未観測 データの補完 4.手順1から手順3により各パターンの全データの分布 を特定し,欠測値に対して多重補完(MI)

5.多重補完されたデータに対して,解析モデルを適用 6.Rubin(1987)の考えにもとづき,解析結果を統合

Kenward et al. (2003)の実装方法(MNAR)

Page 40: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

40

%macro %patternmixture(analyset=XXX, /*データセット名*/ Iconstraint=XXX, /*補完モデルに使用, CCMV or NCMV*/ Itype=XXX, /*時点制約としてNFMV or ALL*/ seedgen=XXX, numberimputations=X, /*シード数と補完数*/ YVAR=%STR(XXX), /*目的変数*/ MODEL=%STR(XXXX), /*補完モデル*/ modvars=%STR(xxx), classvars=%STR(XXX), id=, /*補完モデルの質的変数*/ MODEL2=%STR(XX), /*解析モデル,補完モデルと同一でなくてよい*/ classvars2=%STR(XX), /*解析モデルの質的変数*/ othervars=%STR(XXX), /*Lsmean算出に必要な連続変数*/ TITLE=%STR(), FOOTNOTE=%STR( ));

PMMマクロ(参考:Missingdata.org.uk)

Page 41: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

41

PMMマクロの例 NFMV+CCMV

補完モデル:

治療効果,時点効果,ベースライン値,ベースラインと治療の交互作用,ベースラインと時点の交互作用,治療と時点の交互作用,ベースラインと治療と時点の交互作用 解析モデル: ベースライン値,脱落パターン,治療,時点,脱落パターンと治療の 交互作用,治療と時点の交互作用,脱落パターンと治療と時点の 交互作用 制約条件:NFMV+CCMV データセット:MNARかつ欠測確率がLow

Page 42: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

PMMマクロ(データ:MNAR,欠測確率Low)の SAS output NFMV+CCMV

42

Page 43: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

43

PMMマクロの例 NFMV+NCMV

補完モデル:

治療効果,時点効果,ベースライン値,ベースラインと治療の交互作用,ベースラインと時点の交互作用,治療と時点の交互作用,ベースラインと治療と時点の交互作用 解析モデル: ベースライン値,脱落パターン,治療,時点,脱落パターンと治療の 交互作用,治療と時点の交互作用,脱落パターンと治療と時点の 交互作用 制約条件:NNFMV+CMV データセット:MNARかつ欠測確率がLow

Page 44: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

PMMマクロ(データ:MNAR,欠測確率Low)の SAS output NFMV+NCMV

44

Page 45: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

まとめ

• Multiple Imputationの概要及び実行について

MAR,MIの概要

単調回帰

併合ルール

PMMにも利用

• Pattern Mixture Model,制約条件,実行について

モデル説明

CCMV,NCMV,ACMV,NFMV

45

Page 46: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

参考文献

• Dmitrienko, A., Molenberghs, G., Chuang-Stein, C., & Offen, W. W. (2005). Analysis of clinical trials using SAS: A practical guide. SAS Institute.

• Kenward, M. G., Molenberghs, G., & Thijs, H. (2003). Pattern‐mixture models with proper time dependence. Biometrika, 90(1), 53-71.

• Little, R. J. (1993). Pattern-mixture models for multivariate incomplete data. Journal of the American Statistical Association, 88(421), 125-134.

• Little, R. J. (1994). A class of pattern-mixture models for normal incomplete data. Biometrika, 81(3), 471-483.

• Little, R. J. (1995). Modeling the drop-out mechanism in repeated-measures studies. Journal of the American Statistical Association, 90(431), 1112-1121.

• Mallinckrodt, C. H. (2013). Preventing and treating missing data in longitudinal clinical trials: a practical guide. Cambridge University Press.

• Molenberghs, G., & Kenward, M. (2007). Missing data in clinical studies (Vol. 61). John Wiley & Sons.

46

Page 47: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

参考文献

• National Research Council (2010). The Prevention and Treatment of Missing Data in Clinical Trials. Washington, DC: The National Academies Press.

• O'Kelly, M., & Ratitch, B. (2014). Clinical Trials with Missing Data: A Guide for Practitioners. John Wiley & Sons.

• Royston, P., & White, I. R. (2011). Multiple imputation by chained equations (MICE): implementation in Stata. J Stat Softw, 45(4), 1-20.

• Ratitch, B., O'Kelly, M., & Tosiello, R. (2013). Missing data in clinical trials: from clinical assumptions to statistical analysis using pattern mixture models. Pharmaceutical statistics, 12(6), 337-347.

• Rubin, D. B.(1978). Multiple Imputation in sample surveys- Aphenomenological Bayesian approach to nonresponse. Imputation and Editing of Faulty or Missing Survey Data. Washington, DC:U.S. Department of Commerce

47

Page 48: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

参考文献

• Rubin, D. B. (1987). Multiple imputation for nonresponse in surveys (Vol. 81). John Wiley & Sons.

• Thijs, H., Molenberghs, G., Michiels, B., Verbeke, G., & Curran, D. (2002). Strategies to fit pattern‐mixture models. Biostatistics, 3(2), 245-265.

• Yuan, Y. (2011). Multiple imputation using SAS software. Journal of Statistical Software, 45(6), 1-25.

• White, I. R., Royston, P., & Wood, A. M. (2011). Multiple imputation using chained equations: issues and guidance for practice. Statistics in medicine, 30(4), 377-399.

48

Page 49: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

ご清聴ありがとうございました

49

Page 50: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

50

Back up slide

Page 51: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

51

単調欠測データ を仮定

- 欠測値 を補完するための予測分布

- (1)事後分布 より をサンプル - (2) より欠測値 をサンプル

- の同時事後分布から(1)(2)の作業をm回反復

pYY ,...,1

jY

dYYPYYYPYYYP

YYYPYYP

jjjjj

jjjjobsj

111111

1011

,...,\,,...,\,...,\

,,...,,,...,\\

11,...,\ jYYP *

*

11 ,,...,\ jj YYYP jY

*,jY

Multiple Imputation(MI)の 概略(Rubin 1987)

Page 52: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

52

%macro FIRSTANL(constraint = , type =, yvar=, model= , classvars=); - 欠測値を補完する為に使用する各パターンの分布の パラメータ(平均や分散共分散行列)を推定 - Constraint: CCMV or NCMV 欠測データを補完するために,どのパターンの分布からの パラメータを利用するか - Type: NFMV or ALL, 時点制約 欠測データの分布に対する制約条件の設定 - yvar:目的変数の設定 - Model:補完モデルの指定 - Class vars:補完モデルでの質的変数の指定

構成マクロの説明

Page 53: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

53

構成マクロの説明

%macro GENCOV(incovmean= , incovvar=, outcovset=, visitval=);

- Mixed Modelで解析して得られた共分散パラメータの推定値と,この推定値の分散共分散行列を用いて,共分散

パラメータの乱数を生成 %macro GENPARMS(inparm= ,incov= , outparm= ); - Mixed Modelで解析して得られた固定効果の推定値 と,固定効果の推定値の分散共分散行列を用いて, 固定効果の値の乱数を生成

Page 54: (3) PATTERN-MIXTURE MODELの解説...【日本製薬工業協会シンポジウム】 臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

54

構成マクロの説明

%macro GENVALS(dataset= , firstvis= , basevis= ,yvar= ); - 各時点の欠測値を補完する値を生成する. %macro MEGACALL(numimp=, Itype= , Iconstraint= ,yvar= , firstv= , lastvis= ); - MACRO GENCOV,GENPARM,GENVALSを用いて 完全データセットを作成 - Itype: NFMV or ALL - Iconstraint: CCMV or NCMV,ただし,ACMVは未サポート %macro ANALYZE(numimp= , yvar= , model2= ,classvars2= , othervars= ) - numimp:補完回数の指定 - model2:解析モデルの指定