sas生存時間解析プロシジャの 最新の機能拡張 ·...
TRANSCRIPT
SAS生存時間解析プロシジャの
最新の機能拡張
浜田知久馬 東京理科大学
What’s new in SAS survival procedures.
Chikuma Hamada Tokyo University of Science
1
3
Kyoto Heart Study
バルサルタン
Non-ARB
要旨 LIFETESTプロシジャは生存関数の信頼バンド,kernel法を用いた平滑化ハザード関数の推定が可
能になった.更に3群以上の多群について多重性を考量した多重比較も可能になった.
PHREGプロシジャはCONTRAST,ESTIMATE,LSMEANS,LSMESTIMATE,HAZARDRATIO文で
柔軟な推測,共変量と多重性の双方を同時に調整した多重比較も可能になった.またRANDOM文による変量効果を用いた解析も可能になった.
キーワード: LIFETESTプロシジャ, PHREGプロシジャ,
多重比較, LSMESTIMATE,変量効果 4
LIFETEST
生存関数の信頼区間と信頼バンド
kernel法を用いた平滑化ハザード関数の推定
PHREG
ESTIMATE文とLSMESTIMATE文
LSMEANS文による多重比較
(LIFETESTによる多重比較)
事例 最大対比法による用量反応解析
HAZARDRATIO文
共変量と多重性の同時調整
事例 サブグループ解析の多重比較
RANDOM文による変量効果モデル
ASSESS文によるモデルの妥当性の評価
5
内容
6
可視化 kernel
平滑化ハザード
変量効果
RANDOM文
ハザード比の推定多重比較
ESTIMATE文LSMESTIMATE文
LSMEANS文
HAZARDRATIO文
比例ハザード性 線形性の仮定の評価 ASSESS文
22110 exp)()( zzuthth i
比例ハザードモデル
内容
生存関数の信頼区間と信頼バンド 点と線
生存関数の信頼区間(pointwise):
特定の時点について,真の生存割合を被覆
する確率を確保 :CL:Confidence Limit
生存関数の信頼バンド(simultaneous) :
時点全体について,真の生存割合を被覆
する確率を確保 :CB:Confidence Band
副作用の好発時期等の生存時間曲線全体の
プロファイルを比較するとき等に有効 7
の公式GreenwoodtSVtSVtS :ˆˆ96.1ˆ
生存時間曲線の信頼区間のプログラム plots=s(cl)オプション
proc lifetest data=gehan
plots=s(cl strata=panel test
atrisk=0 to 40 by 5)
method=km;
time week*remiss(0);
strata drug;
run;
9
信頼区間 時点毎に真値が含まれる確率を保証
生存割合を2重対数変換後,正規近似で信頼区間を構成 10
生存関数(0~1)の変換と信頼区間の算出
得られた生存割合 を関数 で変換
変換後に区間を計算し,逆変換
tSgtS xg ˆˆ
tSgtSg ˆvar96.1ˆ
tSgtSgg ˆvar96.1ˆ1
g-1(x)
tS xg
11
LIFETEST procedure で計算可能な5種類の変換
CONFTYPE=オプション
変換 変換関数
変換無し(LINEAR:NOTRANS)
対数変換(LOG)
二重対数変換(LOGLOG)
逆正弦変換(ASINSQRT)
ロジット変換(LOGIT)
xxg 1sin
xxg loglog
xxg
xxg log
xxxg 1log
12
各変換での95%信頼区間 変換後正規近似でCL構成→逆変換
変換 95%信頼区間
LINEAR
LOG
LOGLOG
ASINSQRT
LOGIT
SSSS var1496.1arcsinsin
12
SSSS varlog96.1loglogexpexp
2
SS var96.1
SSS var96.1logexp 2
Sh
Sh
1
SSS
S
SSh var196.1
1logexp
2ただし,
13
GEHANのデータ(対照群)での5種類の信頼区間
LINEAR LOG LOGLOG
ASINSQRT LOGIT
14
上下対称
上下非対称 上下非対称
上下非対称 上下非対称
デフォルトは
LOGLOG変換
95%信頼区間の正確な被覆確率 区間[0.05, 0.95]における平均値
90%
95%
100%
50 100 200 400
被覆確率
NONTRANS LOG LOGLOG ASINSQRT LOGIT
症例数 [n]
15 デフォルトはLOGLOG変換
95%信頼区間の正確な被覆確率 [n=50, LOGLOG]
平均:
95.22%
16
佐藤聖士,浜田知久馬(2011)
生存関数における信頼区間算出法の性能比較 SAS Forum ユーザー会 学術総会
LIFETESTプロシジャの信頼バンドの出力
デフォルトはLOGLOG変換
デフォルトはHW
17
信頼バンドの種類
• EP(Equal Precision)型信頼バンド
• HW(Hall-Wellner)型信頼バンド
tS
n
tnaahtStStS
n
tnaahtS SULSUL ˆ1,ˆˆ1,ˆ
2/1
2
2/1
2
tStaaetStStStaaetS SULSULˆ,ˆˆ,ˆ
生存割合の分散生存割合の推定量 ::ˆ 2 ttS S
W. J. Hall and Jon A (1980)
Nair,V. N. (1984)
18
上下対称
生存時間曲線の信頼バンドのプログラム plots=s(cb)オプション
proc lifetest data=gehan
plots=s(cb strata=panel test atrisk=0 to 40 by 5)
method=km;
time week*remiss(0);
strata drug;
run;
19
信頼バンド (信頼区間より広い) 区間で真値が含まれる確率を保証
20
デフォルトは
HW型でLOGLOG変換
佐藤聖士 浜田知久馬(2012)
生存関数における信頼バンド構成法の比較 SAS Forum ユーザー会 学術総会
信頼区間と信頼バンドの同時出力
plots=s(cb cl)
21
ハザード関数の推定と平滑化
proc lifetest data=gehan method=pl nelson
plots(only)=hazard(kernel=b bw=5);
time week*remiss(0);
strata drug;
run;
22
kernel(カーネル:核)関数による平滑化 バンド幅bw(band width)=5週
Nelson-Aalen推定量
累積ハザード関数 の推定量
di : 時点 i における死亡総数
ni : 時点 i における群を併合したリスク集合の大きさ
ハザード関数:離散的な値をとる
関数の形状の比較が難しい
kernel(カーネル):核関数法でハザードの平滑化を行う
ハザード関数の推定と平滑化
)(tH
ii
tt
ii ndthndtHi
,
23
Nelson型の累積ハザード関数(離散的) 積極限法による生存推定
WEEK 積極限法 Nelson-Aalen 死亡数 生存数
生存率 死亡率 生存率の標準誤差
累積ハザード
累積ハザード 標準誤差
0.0000 1.0000 0 0 0 . 0 21
1.0000 . . . . . 1 20
1.0000 0.9048 0.0952 0.0641 0.0952 0.0673 2 19
2.0000 . . . . . 3 18
2.0000 0.8095 0.1905 0.0857 0.2005 0.1004 4 17
3.0000 0.7619 0.2381 0.0929 0.2593 0.1163 5 16
4.0000 . . . . . 6 15
4.0000 0.6667 0.3333 0.1029 0.3843 0.1461 7 14
5.0000 . . . . . 8 13
5.0000 0.5714 0.4286 0.1080 0.5272 0.1776 9 12
8.0000 . . . . . 10 11
8.0000 . . . . . 11 10
8.0000 . . . . . 12 9
8.0000 0.3810 0.6190 0.1060 0.8605 0.2436 13 8
層 2: drug = CONTROL
24
tt
ii
i
nd
21
2
19
2
21
2
Nelson型のハザード関数(離散的) Control
14
2
16
2
17
1
19
2
21
2
12
4
8
2 6
2
1
1
3
12
1
4
1
ii ndth
時間(週)
ハザード関数
25
kernel-smoothed hazard 関数の出力
Gehanのデータ
バンド幅5週
28
CONTROL
6-MP
カーネル関数 (biweight カーネル)
カーネル(kernel:核)推定
i
n
i
i tHb
ttK
bth
~1ˆ
1
22116
15xxK
(-1 ≤ x ≤ 1)
:平滑化したハザード推定量
:カーネル関数
:バンド幅
K(x)
th
b
バンド幅2b 29
死亡時点(核)を中心とした確率
密度関数を複数可算した混合分布.
時点ごとのカーネル密度
22116
15xxK
時間(週)
バンド幅5週
ハザード関数
2b=10 30
カーネル密度の加算 Control
時間(週)
ハザード関数
バンド幅5週
31
34
経口FU剤の結腸癌の補助化学療法の投与期間の比較(6 vs. 12月)
X-ACT試験と財団法人がん集学的治療研究財団による3試験(JFMC7-1,JFMC7-2,JFMC15)
ステージⅢの治療群患者のみ使用(投与期間の比較)
全生存期間:overall survival, OS
無病生存期間:disease-free survival, DFS
対象データ
試験 X-ACT
JFMC7-1
JFMC7-2
JFMC15
化学療法 5-FU/LV カペシタビン 5-FU,HCFU
投与期間 6ヶ月 12ヶ月
患者数(人) 983 1004 405
男性(人) 532 543 190
女性(人) 451 461 215
35
6 vs. 12月投与(DFS:無病生存期間)
0~0.5年はあまり差がない
0.5年以降ハザードに差が現れる
ハザード比: 0.679
⇒12ヶ月投与の方が再発・死亡リスクを約32%抑える
0.25
0.20
0.15
0.10
0.05
0 1 2 3 4 5
ハザード
ハザード比0.679
時間(年)
生存率
1.0
0.8
0.6
0.4
0.2
0.0 0 1 2 3 4 5
Logrank p<.0001
時間(年)
Logrank p<0.0001
6ヶ月
12ヶ月
6ヶ月
12ヶ月
バンド幅b = 1(年間)
36
KM法による生存関数 カーネル法によるハザード関数
6 vs. 12月投与(OS:全生存期間)
0~1年はあまり差がない
1年以降ハザードに差が現れる
ハザード比: 0.855
⇒12ヶ月投与の方が死亡リスクを約14%抑える
1.0
0.8
0.6
0.4
0.2
0.00 1 2 3 4 5
Logrank p=0.159
時間(年)
生存率
0.10
0.08
0.06
0.04
0.02
0.00
0 1 2 3 4 5
ハザード比0.855
時間(年)
ハザード
6ヶ月 6ヶ月
12ヶ月
12ヶ月
バンド幅b = 1(年間)
37
KM法による生存関数 カーネル法によるハザード関数
38
可視化 kernel
平滑化ハザード
変量効果
RANDOM文
ハザード比の推定多重比較
ESTIMATE文LSMESTIMATE文
LSMEANS文
HAZARDRATIO文
比例ハザード性 線形性の仮定の評価 ASSESS文
22110 exp)()( zzuthth i
比例ハザードモデル
内容
VA Lung Cancer data(PHREGのマニュアルより) ESTIMATE文,LSMESTIMATE文, LSMEANS文
Veterans Administration lung cancer trial presented in
Kalbfleisch and Prentice(1980)
男性を対象とした進行肺がんのランダム化臨床試験
エンドポイント:Time(死亡までの時間(日))
共変量
Therapy(2) (治療法: standard or test) (i)
Cell(4) (腫瘍セル型: adeno, large, small, squamous) (j)
Prior(2) (既往歴: 0=no, 10=yes) Age(連続量) (年齢)
Duration (連続量) (診断からランダム化までの期間(月)
Kps (連続量) (Karnofskyのperformance scale)0~100 39
生存時間KM曲線(VA Lung Cancer data) Cell型で層別 (adeno-largeの比較)
adeno
腺癌
small large
squamous
扁平上皮癌
40
310 : H
生存時間KM曲線(VA Lung Cancer data) Therapyで層別 (standard-testの比較)
standard
test
41
210 : H
cell type =adeno
large
small squamous
test
standard
42
生存時間KM曲線
Cell型とTherapy層別
32310 : H
4×2 2元配置 セル平均のモデル
Cell Therapy
Standard Test
Adeno 11 12 1.
Large 21 22 2.
Small 31 32 3.
Squamous 41 42 4.
.1 .2 ..
1
2
3
4
1 2
model Time*Status(0) = Cell Therapy Cell*Therapy;
321
120
210220
311
110
410 420
43
ESTIMATE文,LSMESTIMATE文 セル平均を用いた仮説の表現
Cell(i) smallにおいて, 対数ハザードが処置(j)
StandardとTestに差があるか
帰無仮説:H0
:治療効果セル効果, ji
ijjiijij
ijjiij
th
th
thth
:),(log
)(log
)exp()()(
0
0
3231
44
PHREGのESTIMATE文とLSMESTIMATE文
proc phreg data=VALung;
class Prior Cell Therapy/param=glm;
model Time*Status(0) = Cell Therapy
Cell*Therapy;
estimate "3small 1standard vs 2test"
Cell*Therapy 0 0 0 0 1 -1 0 0/e exp;
lsmestimate Cell*Therapy
"3small 1standard vs 2test"
0 0 0 0 1 -1 0 0/e exp;run;
45 3231
パラメータ推定値 最尤推定値の分析 パラメータ 自由
度 パラメータ 推定値
標準誤差 カイ 2 乗 Pr > ChiSq
Cell adeno 1 1.56539 0.38499 16.5326 <.0001 Cell large 1 0.82278 0.40021 4.2267 0.0398 Cell small 1 1.81806 0.39165 21.5481 <.0001 Cell squamous 0 0 . . . Therapy standard 1 0.74962 0.38938 3.7064 0.0542 Therapy test 0 0 . . . Cell*Therapy adeno standard 1 -0.89508 0.56925 2.4724 0.1159
Cell*Therapy adeno test 0 0 . . .
Cell*Therapy large standard 1 -1.22577 0.56045 4.7835 0.0287
Cell*Therapy large test 0 0 . . .
Cell*Therapy small standard 1 -1.43016 0.51127 7.8246 0.0052
Cell*Therapy small test 0 0 . . .
Cell*Therapy squamous standard 0 0 . . .
Cell*Therapy squamous test 0 0 . . .
31
32
21
46
43016.13231
ESTIMATE文とLSMESTIMATE文の結果
推定
ラベル 推定値 標準誤差 z 値 Pr > |z|
3small 1standard vs 2test Non-est . . .
Least Squares Means Estimate
ラベル 推定値 標準誤差 z 値 Pr > |z|
3small 1standard vs 2test -0.6805 0.3199 -2.13 0.0334
ESTIMATE文
LSMESTIMATE文
43016.13231 とは異なる
推定不能
47
LSMESTIMATE文のEオプション 係数の出力 Coefficients for Cell*Therapy Least Squares Means Estimate
パラメータ cell type type of treatment Row1
Celladeno adeno
Celllarge large
Cellsmall small
Cellsquamous squamous
Therapystandard standard 1
Therapytest test -1
CelladenoTherapystandard adeno standard
CelladenoTherapytest adeno test
CelllargeTherapystandard large standard
CelllargeTherapytest large test
CellsmallTherapystandard small standard 1
CellsmallTherapytest small test -1
CellsquamousTherapystandard squamous standard
CellsquamousTherapytest squamous test
1
2
31
32
48
3231213231
モデルパラメータによる仮説の表現 Cell CのStandard(μ31)とTest (μ32)の差
323121
3231
322332
311331
ijjiij
49
μ31 μ32 α3
β1 β2
ESTIMATE文の指定(主効果も指定する必要)
Therapy 1 -1 Cell*Therapy 0 0 0 0 1 -1 0 0
3231213231
322332
311331
42413231
22211211
214321
,,,
,,,
,,,,
21 3231
50
ESTIMATE文とLSMESTIMATE文
estimate "3small 1standard vs 2test"
Therapy 1 -1 Cell*Therapy 0 0 0 0 1 -1 0 0;
or
estimate "3small 1standard vs 2test"
Therapy 1 -1 Cell*Therapy 0 0 0 0 1 -1;
(省略した場合は0として扱われる)
lsmestimate Cell*Therapy "3small 1standard vs 2test" 0 0 0 0 1 -1 0 0;
(Cell*Therapyのみ指定)
51
セル平均を用いた仮説の表現
平均効果 AdenoとLargeにおいて差があるか
帰無仮説:H0
22
22211211
21
52
:治療効果セル効果, ji
ijjiijij
ijjiij
th
th
thth
:),(
)(log
)exp()()(
0
0
モデルパラメータによる仮説の表現 平均効果Cell AとB の差
2
22
2221121121
2221121121
222222
211221
122112
111111
53
μ11 μ12
μ21 μ22
1
2
ESTIMATE文の指定 Cell 1 -1 0 0 Cell*Therapy .5 .5 -.5 -.5 0 0 0 0
2
22
,,
,,
,,,,
2221121121
2221121121
42413231
22211211
214321
22211211
54
ESTIMATE文とLSMESTIMATE文 estimate "1adeno-2large"
Cell 1 -1 0 0 Cell*Therapy .5 .5 -.5 -.5 0 0 0 0;
or
estimate "1adeno-2large"
Cell 1 -1 Cell*Therapy .5 .5 -.5 -.5;
(省略した場合は0として扱われる)
lsmestimate Cell “1adeno-2large”1 -1 0 0; (Cellのみ指定)
55
セル平均を用いた仮説の表現
平均効果Therapy StandardとTestにおいて差があるか
帰無仮説:H0:
44
4232221241312111
21
56
:治療効果セル効果, ji
ijjiijij
ijjiij
th
th
thth
:),(
)(log
)exp()()(
0
0
モデルパラメータによる仮説の表現 平均効果Cell AとB の差
42413231
22211211
21
4232221241312111
21
25.25.25.25.
25.25.25.25.
44
57
μ11 μ12
μ21 μ22
μ31 μ32
μ41 μ42
21
ESTIMATE文とLSMESTIMATE文
estimate "1standard-2test"
Therapy 1 -1
Cell*Therapy .25 -.25 .25 -.25 .25 -.25 .25 -.25;
lsmestimate
Therapy “1standard-2test” 1 -1;
(Therapyのみ指定)
4241323122211211
21
58
ESTIMATE文とLSMESTIMATE文
交互作用を含むモデルのESTIMATE文
1)主効果を含めて複雑な係数を指定する必要がある.
2)多くの要素をプログラムで指定.
3)0の省略等簡略も可能だが,非明示的なルールがある(Eオプションで確認).
面倒かつプログラムミスをしやすい.
LSMEANS文は出力が冗長で柔軟性なし
→LSMESTIMATE文
59
ESTIMATE LSMESTIMATE LSMEANS マニュアル
複数の効果を指定.柔軟な指定が可能だが,慣れないと面倒でミスしやすい.
オートマ
一つの効果のみ指定.簡単便利.慣れてしまうとマニュアルは
使えなくなる.
60
路線バス
対比較または,基準群との比較を不必要なものを含めて網羅的に出力.
〇推奨 × △
ESTIMATE,LSMESTIMATE,LSMEANS
ESTIMATE文(マニュアル)
推定可能にするため原則的にすべてのパラメータを指定(0のものは省略可)
LSMESTIMATE文(オートマ) 比較の対象の効果のパラメータのみを指定
任意の対比についての多重比較が可能
現在では多くのプロシジャで利用可
LSMEANS文(路線バス) 比較の対象の効果のみを指定
群間の対比較のみ可能
交互作用の比較の場合,出力が冗長
61
皮膚癌データ: SCANCER ラットを用いた発癌実験データ
10nmol:HR=1
90nmol:HR=5.680
30nmol:HR=4.167
66
生存時間の多重比較の方法
LIFETEST STRATA文 ADJ=オプション
ADJUST=BONFERRONI
ADJUST=DUNNETT
ADJUST=SCHEFFE
ADJUST=SIDAK
ADJUST=SIMULATE
ADJUST=SMM | GT2
ADJUST=TUKEY
67
TEST=WILCOXONで一般化ウイルコクソン
検定の多重比較も可能
打ち切りと非打ち切り値の数の要約
層 DOSE 全体 死亡 打ち切り
1 10 30 11 19
2 30 30 19 11
3 90 30 20 10
Total 90 50 40
基本的な多重比較法 A,B,Cの比較
A
B
C
AB
AC
BC
Tukey:AB,AC,BC
Dunnett:AB,AC
Scheffe:AB,AC,BC,A-BC
A-BC
m:比較の数
Bonferroni:p値をm倍
Sidak:独立性を前提
に多重性調整
SIMULATED:シミュレーションにより多重性調整 68
検定の多重性
有意水準αで独立な検定をm回行った場合
1)1回も有意にならない確率
α =0.05,m=10のときの確率
(1-α)m (1-0.05)10 =0.59874
2)1回以上有意になる確率
また α =0.05,m=10のときの確率
1-(1-α)m ≒m・α
1-(1-0.05)10 = 0.40126
69
独立な最小p値の分布
1
m
m
)1()'()(
)1(1)(
p
)(1
)1(1
1
mxmxFxf
xxF
m
m
確率密度関数:
分布関数:
値の分布個の最小
α未満最小p値が有意つ以上が有意
αα水準で有意:
つ以上が個の独立な検定のうち
70
m個の最小p値の確率密度関数
1
2
3
4
5
m=10 )( pf 1)1()( mpmpf
71
p
m個の最小p値の累積分布関数
1
2
3 4
5 m=10 )( pF
法
≒
に近いときが
法
Bonferroni
pm)(
0
)1(1)( m
pF
p
Sidak
ppF
72
p
0.40126
多群の場合のノンパラ検定
包括検定:分散分析型統計量
自由度:群の数(r)ー1
群間で差があるか
分散共分散行列
数の差のベクトル観測死亡数と期待死亡
r
VVV
VVV
VVV
u
u
u
T
rrrr
r
r
r
:
,
:
:
2
21
22221
11211
2
1
uVu
Vu
V
u
73
uVu T2
Dunnett型 多重比較
(基準群(用量10nmol群)との比較)
ods graphics on;
proc lifetest data=scancer
plots=survival(atrisk=0 to 80 by 10);
time time*censor(0);
strata dose /
test=logrank adjust=dunnett;
run;
ods graphics off;
74
ログランク検定の出力(包括検定)
uVu T2
75
3×1
3×3
順位統計量
DOSE ログランク
10 -13.863
30 4.814
90 9.048
数の差観測死亡数と期待死亡
1u
2u
3u
ログランク検定の共分散行列
DOSE 10 30 90
10 10.2810 -5.7934 -4.4875
30 -5.7934 9.0072 -3.2138
90 -4.4875 -3.2138 7.7013
11V
21V
31V
12V 13V
22V 23V
32V 33V
層に対しての同等性の検定
検定 カイ 2 乗 自由度 Pr > Chi-Square
ログランク 20.2565 2 <.0001
u
V
121122
2
122
122
)(
VVV
uuX
群iと群jの 対比較のカイ 2 乗統計量Xij
2
2982.11
)7890.5(22810.100072.9
))863.13(814.4(
2
)(
2
)(
][
)(
2
121122
2
122
12
22
2
VVV
uuX
VVV
uu
uuV
uuX
ijiijj
ij
ij
ij
ij
76 0008.0)2982.11Pr(
2
1 p
多重比較の調整p値の計算
関数
関数
未加工
r:群数検定の回数,
)(PROBMC:
)(PROBMC:
)Pr(:
)1(1:
),1min(:
)Pr(:)(
:
22
1
22
1
HsuDunnettDunnett
KramerTukeyTukey
XadjpScheffe
padjpSidak
pmadjpBonferroni
Xpadjustednon
m
ijr
m
ij
77
Dunnett型 多重比較(adjust=dunnett);
78
層に対しての同等性の検定
検定 カイ 2 乗 自由度 Pr > Chi-Square
ログランク 20.2565 2 <.0001
多重比較の調整 : Logrank 検定
層比較 カイ 2 乗 p 値
DOSE DOSE 未加工 (調整無)
Dunnett-Hsu
30 10 11.2982 0.0008 0.0015**
90 10 19.4717 <.0001 <.0001**
Xij2
uVu T2
Simulated法の多重比較(Tukey型)
proc lifetest data=scancer
plots=survival(atrisk=0 to 80 by 10);
time time*censor(0);
strata dose /
test=logrank
adjust=simurate(report seed=4989);
ods output survdiff=diff;
run;
83
Simulated法の多重比較(Tukey型)
確率点シミュレーションの詳細
乱数シード 4989
比較型 All
標本サイズ(シミュレーション回数) 12605
ターゲット アルファ(目標水準) 0.05
精密の半径Accuracy radius 0.005
精度の信頼度Accuracy confidence 99%
α
1
84 2γ
信頼区間の幅
3回の最小p値の分布 理論分布とシミュレーションによる近似
理論分布(確率密度関数) 12605回のシミュレーション 2)1(3)( ppf
85
Simulated法の多重比較(Tukey型)
シミュレーション結果
手法 95% 分位点 推定アルファ
99% 信頼限界
Simulated 2.349061 0.0500 0.0450 0.0550
Tukey-Kramer
2.343701 0.0511 0.0460 0.0561
Bonferroni 2.393980 0.0447 0.0399 0.0494
Sidak 2.387738 0.0454 0.0406 0.0502
GT-2 2.387738 0.0454 0.0406 0.0502
Scheffe 2.447747 0.0385 0.0341 0.0429
Z 1.959964 0.1192 0.1118 0.1267
q
)(1
qF棄却限界値 :
q
5/3%点
5%点 86
0.05±0.005(γ)
Simulated法の多重比較(Tukey型)
シミュレーションで最小p値が0.0008
以下 26/12605=0.0022
87
多重比較の調整 : Logrank 検定
層比較 カイ 2 乗 p 値
DOSE DOSE 未加工 Simulated
10 30 11.2982 0.0008 0.0022**
10 90 19.4717 <.0001 <.0001**
30 90 0.7748 0.3787 0.6514
シミュレーション回数の設定
シミュレーション回数
精度の信頼水準
:抑えたい精度の幅
α:目標有意水準
推定有意水準
累積分布関数
推定棄却限界値
)12605(:
(0.99):1
0.05)(
))((1:
:)(
:
1))Pr((
N
qF
qF
q
88
2γ
1%
シミュレーション回数の設定
12605)05.01(05.0005.0
60.2
)1(
60.2,)1(
1))(Pr(
)1(][,1)(
2
2
2
2
2/
2/01.02/
ZN
ZN
Z
NVqF
89
生存時間データへの最大対比法の適用 (-1 0 1) (-1 -1 2) (-2 1 1) (-5 -2 7)
Linear
(-1 0 1)
h-start
(-1 -1 2)
m-end
(-2 1 1)
94
dose(10,30,90)
(-5 -2 7)
最大対比法(対数ハザード)の適用
proc phreg data=scancer;
class dose/param=glm ref=first;
hazardratio dose/diff=ref;
model time*censor(0)=dose;
lsmestimate dose
‘linear’ -1 0 1, ‘dose’ -5 -2 7,
‘h-start’ -1 -1 2, 'm-saturate' -2 1 1 /adj=simulate(report) seed=4989;
run; 95
Simulated法の利点
Sidak法は複数の対比の統計量が独立を前提
Bonferroni法はSidak法のよい近似法
Scheffe法は任意の対比の最大のものを統計量とすることを想定するので過度に保守的
用量反応モデルに対する対比統計量は正の相関が高く,相関構造を反映できるSimulated法の検出力が高くなる(名義水準に保たれる).
Simulated法では任意の複数の対比について,相関を考慮した多重性の調整が可能
12605回のシミュレーションでは最大1%程度の誤差
96
Bonferroni法との性能比較 REPORTオプション
シミュレーション結果
手法 95% 分位点 推定アルファ 99% 信頼限界
Simulated 2.214661 0.0500 0.0450 0.0550
Bonferroni 2.497705 0.0242 0.0207 0.0277
Sidak 2.490915 0.0248 0.0212 0.0283
Scheffe 2.447747 0.0282 0.0244 0.0320
Z 1.959964 0.0866 0.0801 0.0930
5/4%点
5%点 97 対比統計量は正の相関が高いのでBonferroni法は保守的
最大対比法の適用
98
Least Squares Means Estimates Adjustment for Multiplicity: Simulated
効果 ラベル 推定値 標準誤差
z 値 Pr > |z|
調整済 P
指数
DOSE linear 1.7370 0.4429 3.92 <.0001 0.0002 5.6803
DOSE dose 9.3045 2.5135 3.70 0.0002 0.0004 10987
DOSE h-start 2.0467 0.6322 3.24 0.0012 0.0029 7.7425
DOSE m-saturate
3.1643 0.8293 3.82 0.0001 0.0002 23.6720
最大対比:2.215を越えているので有意
対数ハザードが等差的に変化
対比(-1 0 1)の適用結果
99
生存時間KM曲線 対比による予測生存時間曲線
10:HR=1
30:HR=4.167
90:HR=5.680
HAZAEDRATIO文(対応のESTIMATE文) proc phreg data=VALung;
class Prior Cell Therapy/param=glm ;
model Time*Status(0) = Kps Cell Prior Therapy Prior*Therapy;
hazardratio 'H1' Kps / units=10 cl=both;
hazardratio 'H2' Cell /cl=both;
hazardratio 'H3' Therapy /diff=ref cl=both;
estimate 'E1' Kps 10 / exp;
estimate 'E2 12' cell 1 -1 0 0, /* adeno vs large */
'E2 13' cell 1 0 -1 0, /* adeno vs small */
'E2 14' cell 1 0 0 -1, /* adeno vs squamous */
'E2 23' cell 0 1 -1 0, /* large vs small */
'E2 24' cell 0 1 0 -1, /* large vs Squamous */
‘E2 34’ cell 0 0 1 -1 /* small vs squamous */ / exp;
estimate 'E3 no' Therapy 1 -1 Prior*Therapy 1 -1 0 0,
'E3 yes' Therapy 1 -1 Prior*Therapy 0 0 1 -1/ exp;run; 100
検定結果 Type 3 検定
効果 自由度 Wald カイ 2 乗
Pr > ChiSq
Kps 1 35.9218 <.0001
Cell 3 17.4134 0.0006
Prior 1 0.1150 0.7345
Therapy 1 0.2510 0.6164
Prior*Therapy 1 2.9269 0.0871
101
パラメータ推定値
パラメータ 自由度
パラメータ 推定値
標準誤差 カイ 2 乗 Pr > ChiSq
ハザード比
Kps 1 -0.03111 0.00519 35.9218 <.0001 0.969
Cell adeno 1 1.16052 0.30002 14.9629 0.0001 3.192
Cell large 1 0.41145 0.28309 2.1125 0.1461 1.509
Cell small 1 0.85410 0.26894 10.0858 0.0015 2.349
Cell squamous 0 0 . . . .
Prior no 1 0.27688 0.30490 0.8247 0.3638 .
Prior yes 0 0 . . . .
:
102
KPSが1単位変化 HR:exp(-0.03111)=0.969
adeno-squamous HR:exp(1.16052)=3.192 adeno-large HR:exp(1.16052-0.41145)= 2.115
:
Wald検定と尤度比検定ベースの信頼区間 信頼区間:検定で棄却されない母数の集合
103
対数尤度
β MLE
最尤推定量
尤度比検定ベース
の信頼区間CL= PL
Wald検定ベース
の信頼区間CL=WALD
MLE+1.96SE
3.84/2=1.92
MLEー1.96SE
CL=BOTH
hazardratio ‘H1’ Kps / units=10 cl=both; 連続量はUNITSオプションで増分単位を指定 cl=bothでWald検定と尤度比検定ベースCLを出力
H1: ハザード比 Kps
説明 点推定値 95% Wald 信頼限界 95% プロファイル尤度 による信頼限界
Kps Unit=10 0.733 0.662 0.811 0.662 0.811
推定(ESTIMATE文)
ラベル 推定値 標準誤差
z 値 Pr > |z| 指数
E1 -0.3111 0.05191 -5.99 <.0001 0.7326
exp(10・(-0.03111))=0.96910
=0.733
104
CL=WALD CL= PL
Karnofsky Performance Scale: 0:死亡 100:正常
hazardratio ‘H2’ Cell /cl=both; デフォルト(diff=all)は全ての対比較 H2: ハザード比 Cell
説明 点推定値
95% Wald 信頼限界 95% プロファイル尤度 による信頼限界
Cell adeno vs large 2.115 1.164 3.843 1.162 3.855
Cell adeno vs small
1.359 0.798 2.312 0.791 2.301
Cell adeno vs squamous
3.192 1.773 5.746 1.770 5.768
Cell large vs small 0.642 0.385 1.073 0.380 1.065
Cell large vs squamous
1.509 0.866 2.628 0.863 2.634
Cell small vs squamous
2.349 1.387 3.980 1.399 4.030
105
CL=WALD CL= PL
hazardratio ‘H2’ Cell /cl=both diff=ref; Cell(ref=‘ ’)により基準群を指定
H2: ハザード比 Cell
説明 点推定値
95% Wald 信頼限界 95% プロファイル尤度 による信頼限界
Cell adeno vs squamous 3.192 1.773 5.746 1.770 5.768
Cell large vs squamous 1.509 0.866 2.628 0.863 2.634
Cell small vs squamous 2.349 1.387 3.980 1.399 4.030
adeno small
107
Cell(ref=‘squamous’)
hazardratio ‘H3’Therapy/diff=ref cl=both;
Prior*Therapyを指定した場合, Prior(yes or no)ごとのHRを出力
H3: ハザード比 Therapy
説明 点推定値
95% Wald 信頼限界
95% プロファイル尤度 による信頼限界
Therapy standard vs test At Prior=no
0.633 0.400 1.002 0.399 1.002
Therapy standard vs test At Prior=yes
1.268 0.638 2.522 0.641 2.565
推定(ESTIMATE文)
ラベル 推定値 標準誤差 z 値 Pr > |z| 指数
E3 no -0.4567 0.2342 -1.95 0.0512 0.6334
E3 yes 0.2377 0.3508 0.68 0.4980 1.2684
108
共変量(Kps Prior Therapy) を調整した多重比較
proc phreg data=VALung ;
class Prior Cell(ref='adeno')
Therapy/param=glm ;
model Time*Status(0) =
Kps Prior Therapy Cell;
lsmeans Cell/
diff=all adj=tukey cl exp;run;
109
共変量を調整した多重比較 信頼区間 Cell の最小 2 乗平均の差 多重比較の調整 : Tukey-Kramer
cell type
cell type 指数 Exponentiated Lower
Exponentiated Upper
調整済 下限 Exp
調整済 上限 Exp
adeno large 2.1712 1.1985 3.9335 0.9964 4.7313
adeno small 1.4045 0.8266 2.3866 0.7010 2.8140
adeno squamous 3.2137 1.7868 5.7803 1.4888 6.9370
large small 0.6469 0.3857 1.0851 0.3284 1.2743
large squamous 1.4801 0.8513 2.5736 0.7168 3.0562
small squamous 2.2881 1.3490 3.8809 1.1448 4.5733 111
LSMEANSによる共変量を調整した多重比較
adeno-squamous
small-squamous
112 対角線を含んでいれば有意差なし
βの調整
推定値
βの調整
推定値
adeno-large
共変量(点推定値が変化)と 多重性(区間幅が増加)の同時調整
113
cell type cell type 調整無 ハザード比
調整無 ハザード比下限
調整無 ハザード比下限
調整 ハザード比
調整 ハザード比下限
調整 ハザード比下限
adeno large 2.4873 1.4146 4.3733 2.1712 0.9964 4.7313
adeno small 1.1560 0.7092 1.8842 1.4045 0.701 2.814
adeno squamous 3.1311 1.7637 5.5586 3.2137 1.4888 6.937
large small 0.4648 0.2832 0.7626 0.6469 0.3284 1.2743
large squamous 1.2588 0.7310 2.1678 0.7168 3.0562
small squamous 2.7086 1.6479 4.4521 2.2881 1.1448 4.5733
無調整 2.4873 (1.4146-4.3733)
調整 2.1712 (0.9964-4.7313) adeno-large
114
PHREG BASELINE文による生存時間曲線
共変量調整無 共変量調整有
squamous HR=1.0000
large 1.2588 small 2.7086
adeno 3.1311
squamous HR=1.0000
large 1.4801
small 2.2881 adeno 3.2137
adeno-large
p=0.0084
adeno-large
p= 0.0516
Cell*Therapyの交互作用の解析
proc phreg data=VALung;
class Prior Cell Therapy/param=glm;
model Time*Status(0) =
Kps Prior Cell Therapy
Cell*Therapy;
hazardratio 'Therapy' Therapy;
lsmeans Cell*Therapy/adj=tukey exp;
115
交互作用の検定結果
Type 3 検定
効果 自由度 Wald カイ 2 乗
Pr > ChiSq
Kps 1 34.1819 <.0001
Prior 1 0.0973 0.7551
Cell 3 20.3860 0.0001
Therapy 1 0.9487 0.3300
Cell*Therapy 3 6.6284 0.0847
Cell*Therapyの交互作用はp<0.10 adenoとsquamousはpositive,largeとsmallはnegative
116
Cell型ごとのTherapyの効果 hazardratio 'Therapy' Therapy; Therapy: ハザード比 Therapy
説明 点推定値 95% Wald 信頼限界
Therapy standard vs test At Cell=adeno
1.243 0.540 2.859
Therapy standard vs test At Cell=large
0.605 0.276 1.324
Therapy standard vs test At Cell=small
0.448 0.236 0.852
Therapy standard vs test At Cell=squamous
1.397 0.644 3.028
Cell=smallでTherapyの効果は有意 サブグループ解析の多重性の考慮
117
cell type =adeno
large
small squamous
test
standard
118
生存時間KM曲線
HR=1.243 p=0.6092
HR=0.605 p=0.2085
HR=0.448
p=0.0144
HR=1.397 p=0.3975
lsmeans Cell*Therapy/adj=tukey exp; 8(4×2)水準間(8C2=28通り)の比較 Cell*Therapy の最小 2 乗平均の差 多重比較の調整 : Tukey-Kramer
cell type type of treatment
cell type type of treatment
Pr > |z| 調整済 P 指数
large standard large test 0.2085 0.9142 0.6046
large standard small standard 0.2586 0.9504 0.6798
large standard small test 0.0024 0.0497 0.3049
large standard squamous standard 0.9060 1.0000 0.9545
large standard squamous test 0.4473 0.9950 1.3331
large test small standard 0.7449 1.0000 1.1245
large test small test 0.0850 0.6727 0.5043
large test squamous standard 0.2643 0.9535 1.5788
large test squamous test 0.0487 0.5017 2.2050
small standard small test 0.0144 0.2186 0.4485
: 120 8群比較の多重性を考慮すると,standard vs test at Cell=smallは有意差なし
LSMEANSによる多重比較 不必要な比較を含むため過度に保守的
121
p=0.0144
多重性p=0.2186 0.448(0.236-0.852)
サブグループ解析の多重性の調整 Bonferroni adj=bonferroni
proc phreg data=VALung;
class Prior Cell Therapy/param=glm;
model Time*Status(0) = Kps Prior Cell
Therapy Cell*Therapy;
lsmestimate Cell*Therapy
" 1adeno 1standard vs 2test" 1 -1 0 0 0 0 0 0,
" 2large 1standard vs 2test" 0 0 1 -1 0 0 0 0,
" 3small 1standard vs 2test" 0 0 0 0 1 -1 0 0,
" 4squam 1standard vs 2test" 0 0 0 0 0 0 1 -1
/adj=bonferroni;run; 122
μ11 μ12
μ21 μ22
μ31 μ32
μ41 μ42
サブグループ解析の多重性の調整 Bonferroni p値を4倍
Least Squares Means Estimates Adjustment for Multiplicity: Bonferroni
ラベル 推定値 標準誤差 z 値 Pr > |z| 調整済 P
1adeno 1standard vs 2test
0.2173 0.4250 0.51 0.6092 1.0000
2large 1standard vs 2test
-0.5032 0.4001 -1.26 0.2085 0.8339 0.2085×4
3small 1standard vs 2test
-0.8019 0.3277 -2.45 0.0144 0.0576 0.0144×4
4squam 1standard vs 2test
0.3341 0.3948 0.85 0.3975 1.0000
123 ),1min(: pmadjpBonferroni
サブグループ解析の多重性の調整 Holm(逐次Bonferrroni)
proc phreg data=VALung;
class Prior Cell Therapy/param=glm;
model Time*Status(0) = Kps Prior Cell
Therapy Cell*Therapy;
lsmestimate Cell*Therapy
" 1adeno 1standard vs 2test" 1 -1 0 0 0 0 0 0,
" 2large 1standard vs 2test" 0 0 1 -1 0 0 0 0,
" 3small 1standard vs 2test" 0 0 0 0 1 -1 0 0,
" 4squam 1standard vs 2test" 0 0 0 0 0 0 1 -1
/adj=bonferroni stepdown;run; 124
サブグループ解析の多重性の調整 Holm(逐次Bonferrroni) Least Squares Means Estimates Adjustment for Multiplicity: Holm
ラベル Pr > |z| 調整済 P
1adeno 1standard vs 2test 0.6092 0.7949
2large 1standard vs 2test 0.2085 0.6254 0.2085×3
3small 1standard vs 2test 0.0144 0.0576 0.0144×4
4squam 1standard vs 2test 0.3975 0.7949 0.3975×2 125
サブグループ解析の多重性の調整 adj=simulate
proc phreg data=VALung;
class Prior Cell Therapy/param=glm;
model Time*Status(0) = Kps Prior Cell
Therapy Cell*Therapy;
lsmestimate Cell*Therapy
" 1adeno 1standard vs 2test" 1 -1 0 0 0 0 0 0,
" 2large 1standard vs 2test" 0 0 1 -1 0 0 0 0,
" 3small 1standard vs 2test" 0 0 0 0 1 -1 0 0,
" 4squam 1standard vs 2test" 0 0 0 0 0 0 1 -1
/adj=simulate(report) seed=4989 ;run; 126
サブグループ解析の多重性の調整 adj=simulate
シミュレーション結果
手法 95% 分位点
推定アルファ
99% 信頼限界
Simulated 2.485167 0.0500 0.0450 0.0550
Bonferroni 2.497705 0.0482 0.0433 0.0532
Sidak 2.490915 0.0489 0.0440 0.0539
Scheffe 3.080216 0.0082 0.0061 0.0102
Z 1.959964 0.1810 0.1722 0.1899
127
独立に近いのでSimulated法とBonferroni
の棄却限界値が近くなっている
主効果とサブグループ解析の多重性の調整 proc phreg data=VALung;
class Prior Cell Therapy/param=glm;
model Time*Status(0) = Kps Prior Cell Therapy
Cell*Therapy;estimate
" 0main 1standard vs 2test" Therapy 1 -1,
Cell*Therapy .25 -.25 .25 -.25 .25 -.25 .25 -.25,
" 1adeno 1standard vs 2test" Therapy 1 -1
Cell*Therapy 1 -1 0 0 0 0 0 0,
" 2large 1standard vs 2test" Therapy 1 -1
Cell*Therapy 0 0 1 -1 0 0 0 0,
" 3small 1standard vs 2test" Therapy 1 -1
Cell*Therapy 0 0 0 0 1 -1 0 0,
" 4squam 1standard vs 2test" Therapy 1 -1
Cell*Therapy 0 0 0 0 0 0 1 -1
/adj=simulate(report); seed=4989 run;
129
μ11 μ12
μ21 μ22
μ31 μ32
μ41 μ42
μ・1 μ・2
スライド54参照
主効果とサブグループ解析の多重性の調整
シミュレーション結果
手法 95% 分位点
推定アルファ
99% 信頼限界
Simulated 2.546559 0.0500 0.0450 0.0550
Bonferroni 2.575829 0.0475 0.0426 0.0524
Sidak 2.568763 0.0479 0.0430 0.0528
Scheffe 3.080216 0.0103 0.0080 0.0126
Z 1.959964 0.1990 0.1899 0.2082
130 主効果はサブグループを含んでいるので相関あり
主効果とサブグループ解析の多重性の調整
推定 多重度の調整 : Simulated
ラベル 推定値 標準誤差
z 値 Pr > |z| 調整済 P
0main 1standard vs 2test
-0.1884 0.1935 -0.97 0.3300 0.8099
1adeno 1standard vs 2test
0.2173 0.4250 0.51 0.6092 0.9775
2large 1standard vs 2test
-0.5032 0.4001 -1.26 0.2085 0.6237
3small 1standard vs 2test
-0.8019 0.3277 -2.45 0.0144 0.0649
4squam 1standard vs 2test
0.3341 0.3948 0.85 0.3975 0.8757 131
主効果
132
可視化 kernel
平滑化ハザード
変量効果
RANDOM文
ハザード比の推定多重比較
ESTIMATE文LSMESTIMATE文
LSMEANS文
HAZARDRATIO文
比例ハザード性 線形性の仮定の評価 ASSESS文
22110 exp)()( zzuthth i
比例ハザードモデル
内容
RANDOM文による変量効果モデル BLINDデータ(PHREGのマニュアルより)
197人 394眼 データ
個体識別番号:ID
エンドポイント:TIME (失明までの時間)
打ち切り変数: STATUS
(0:打ち切り 1:イベント)
処置変数:TREAT(1:Laser 0:Others)
片眼にLaser 他眼にOthers
発症時期:TYPE
0:幼少(20歳未満)1:成人(20歳以上)
133
イベントと打切りの集計
打ち切りと非打ち切り値の数の要約
層 Treat Type 全体 死亡 打ち切り パーセント 打ち切り
1 0(他) 0(幼) 114 51 63 55.26
2 0(他) 1(成) 83 50 33 39.76
3 1(L) 0(幼) 114 36 78 68.42
4 1(L) 1(成) 83 18 65 78.31
Total 394 155 239 60.66
1:Laser 0:Others
134
カプランマイヤー曲線
成人 レーザーなし
成人 レーザーあり
幼少 レーザーあり
幼少 レーザーなし
135
HR=3.562
HR=1.529
両眼を独立だとして解析
proc phreg data=Blind ;
class id type treat;
model Time*Status(0)=
Treat Type Treat*Type;
hazardratio Treat;
id ID;run;
N= 394 197人×2眼
136
両眼を独立だとして解析
最尤推定値の分析
パラメータ 自由度 パラメータ 推定値
標準誤差 カイ 2 乗 Pr > ChiSq
Treat 1 1.27033 0.27531 21.2909 <.0001
Type 1 0.50482 0.28878 3.0557 0.0805
Type*Treat 1 -0.84566 0.35088 5.8084 0.0159*
ハザード比 Treat
説明 点推定値 95% Wald 信頼限界
Treat 0 vs 1 At Type=0 1.529 0.998 2.343
Treat 0 vs 1 At Type=1 3.562 2.077 6.110
量的交互作成人で強い治療効果 137
成人で 強いレーザー治療の効果
成人
幼少
両眼の解析
・左右眼の相関
ある個人の左右眼は遺伝的,環境的要因が類似しているので独立ではない(正の相関)
独立だとして解析すると情報量(N)を過大評価
・ロバスト分散(サンドイッチ型分散)
左右眼の相関を考慮した分散
相関を考慮することで分散が大きくなる.
(相関が0のときは通常のWald検定に一致)
・frailty(脆弱さ)モデル
個体差を変量効果としてモデル化
138
左右眼の失明までの時間の相関
139
-20 0 20 40 60 80
COL2
0
20
40
60
80
C
O
L
1
右眼
左眼
r=0.463
正の相関
打ち切り
除くと
r=0.264
frailty(脆弱さ)モデル 個体差による変動によって,弱い個体が生じ,
早期に死亡が起きることを想定したモデル
生存時間の変量効果モデル.
(比例ハザードfrailtyモデル)
ui:個人iのfrailty (0~∞)
先天的な弱さloguiの分布
iii uthth zβTexp)()( 0
),0( 2N
140
強い 弱い
サンドイッチ分散による解析
proc phreg data=Blind
covs(aggregate) namelen=22;
class id type treat;
model Time*Status(0)=
Treat Type Treat*Type;
hazardratio Treat;
id ID;run;
141
個体単位で
分散を評価する
ことを指定
サンドイッチ分散による解析
最尤推定値の分析
パラメータ 自由度
パラメータ 推定値
標準誤差
標準誤差比
カイ 2 乗
Pr > ChiSq
Treat 1 1.27033 0.24151 0.877 27.6672 <.0001
Type 1 0.50482 0.28961 1.003 3.0383 0.0813
Type*Treat 1 -0.84566 0.30353 0.865 7.7622 0.0053**
ハザード比 Treat
説明 点推定値 95% Wald ロバスト信頼限界
Treat 0 vs 1 At Type=0 1.529 1.064 2.197
Treat 0 vs 1 At Type=1 3.562 2.219 5.718
142
frailtyモデルによる解析
proc phreg data=Blind;
class id type treat;
model Time*Status(0)=
Treat Type Treat*Type;
random ID;
hazardratio Treat;
run;
143
個体IDを変量効果
としてRANDOM文
で指定
frailtyモデルによる解析
最尤推定値の分析
パラメータ 自由度
パラメータ推定値
標準誤差 カイ 2 乗 Pr > ChiSq
Treat 1 1.46388 0.28320 26.7193 <.0001
Type 1 0.56749 0.32248 3.0969 0.0784
Type*Treat 1 -0.96538 0.36142 7.1347 0.0076**
Frailty Model Analysis: ハザード比 Treat
説明 点推定値 95% Wald 信頼限界
Treat 0 vs 1 At Type=0 1.646 1.059 2.560
Treat 0 vs 1 At Type=1 4.323 2.481 7.530
共分散パラメータの推定
共分散パラメータ REML 推定 標準誤差
ID 0.8308 0.2145
144
%91
911.0 22
ハザードの変動係数
考察
独立として解析するより,サンドイッチ分散,frailtyモデルによる解析の方が交互作用の有意性が強い.(一般には,独立とした解析の方が革新的.)
同一個体内で異なった処置を両眼に割り付けているので,個体間差を除いて,処置効果を評価できる.個体単位のtypeについてはで結果はほとんど変わら
ない.
145
p値 独立 サンドイッチ frailty
Treat <.0001** <.0001** <.0001**
Type 0.0805 0.0813 0.0784
Type*Treat 0.0159* 0.0053** 0.0076**
146
可視化 kernel
平滑化ハザード
変量効果
RANDOM文
ハザード比の推定多重比較
ESTIMATE文LSMESTIMATE文
LSMEANS文
HAZARDRATIO文
比例ハザード性 線形性の仮定の評価 ASSESS文
22110 exp)()( zzuthth i
比例ハザードモデル
内容
ASSESS文による
比例ハザードモデルの検証
1)比例ハザード性(HRが時間に対して一定)
累積Schoenfeld残差プロット
2)対数ハザードに対して,線形モデルは適切か
2次以上の項,カテゴリカルデータ化
累積マルチンゲール残差プロット
3322110
22110
0
expexpexp)(
exp)(
exp)()(
zzzth
zzth
thth
zβT
2013/7/18 147
Cox-Snell残差(累積ハザード):rcs
の値をとる.~
布にしたがう.とき期待値1の指数分
モデルが正しいの累積ハザード関数.の時点個体
)0()1(0
i
)exp()()(
)()(log
0
0
SS
t
tHtH
duuhtSr
i
i
T
iii
t
iiics
i
zβ
個体iの死亡時点tiまでの累積ハザード,tiが長く, リスクの高い個体ほど値が大きくなる. 打ち切りの場合でも定義できるが,最大の生存時間については累積ハザード関数が定義できないので計算できない.
2013/7/18 148
マルチンゲール残差:rMart
観測死亡数と累積ハザードとの差
csMartiics rrtSr
)(log
打切りがない場合:E[rcs ]=1 δ:イベントを起こせば1,打ち切りであれば0 rMart : -∞(S=0)~1(S=1) E[rMart ]=0,rMartの累積和は0
個体iのtiまでの観測死亡数と期待累積ハザードとの差,マルチンゲール残差は正であれば,モデルより死亡が起きやすく(累積ハザードが低いに死亡),負であれば起きにくい.打ち切りを受けた個体は,常に負の値
2013/7/18 149
Schoenfeld残差 Schoenfeld残差: 共変量ごとに定義 個体iの共変量と,リスク集合の共変量の平均の差 Schoenfeld残差のベクトルは個体が打ち切りを受けた場合には定義されず,また全個体について残差の和を計算すると0になる.
比例ハザード性の下でSchoenfeld残差はランダムウォークする.説明変数と同じ単位を持つ.
1kt:)(
)exp()(
)exp()()(
log
がリスク集合に含めばで個体時点tY
tY
tZtYZ
ZZd
LdU
k
k
kk
i
iii
i
(t)Zβ
(t)Zβ
k
k
2013/7/18 150
累積マルチンゲール残差プロット 関数形の検証
横軸:共変量 縦軸:マルチンゲール残差の累積和 マルチンゲール残差の平均は0なので累積和は0から始まり0に収束する.累積するので独立で
はなく,また下にスソを引いた分布なので評価は難しいが,モデルより死亡が起きやすい場合は累積和は上昇,死亡が起きにくい場合は累積和は下降する.
比例ハザードモデルの下のシミュレーションでKolmogorov-Smirnov 型の統計量(最大絶対値)のp値を計算,20パターンを図示.
2013/7/18 151
累積Schoenfeld残差プロット 比例ハザード性の検証
横軸:時間 縦軸:Schoenfeld残差の累積和 Schoenfeld残差の平均は0なので,累積和は0から始まり0に収束する.累積するので独立ではな
く,評価は難しいが,比例ハザード性の仮定の下でSchoenfeld残差はランダムウォークする.
累積和が上昇する場合,共変量の値が大きいとモデルより死亡が起きやすい.比例ハザードモデルの下のシミュレーションでKolmogorov-Smirnov 型の統計量(最大絶対値)のp値を計算,20パターンを図示.
2013/7/18 152
比例ハザードモデル とモデルの関数形の誤特定
exp)(:
)(:
)(exp)()(4
exp)()(3
)log(exp)()(2
exp)()(1
01
01
10
2
12110
110
110
thcz
thcz
czIthth
zzthth
zthth
zthth
閾値:
高次:
:低次
:線形
2013/7/18 153
2013/7/18 154
)log(exp)()(
exp)()(
110
110
zthth
zthth
真
モデル
11z
)log( 11 z
関数形zとlog(Z)残差プロット
2013/7/18 155
モデルより死亡が起きにくい
モデルより死亡が起きやすい
累積マルチンゲール残差プロット
2013/7/18 156
上昇:モデルより 死亡が起きやすい
下降:モデルより 死亡が起きにくい
モデルの誤特定と残差
2013/7/18 157
型
モデルより低次
モデル
真
sin-
exp)(
)log(exp)(
110
110
zth
zth
モデルの誤特定と残差
2013/7/18 158
型
モデルより高次
モデル
真
sin
exp)(
exp)(
110
2
12110
zth
zzth
モデルの誤特定と残差
2013/7/18 159
字型
が存在閾値
モデル
真
m
)5(
exp)(
)(exp)(
110
10
zth
czIth
比例ハザードモデル HR=0.5
層に対しての同等性の検定
検定 カイ 2 乗 自由度 Pr > Chi-Square
ログランク 158.4857 1 <.0001
Wilcoxon 127.2079 1 <.0001
-2Log(LR) 163.9882 1 <.0001
2013/7/18 160
層に対しての同等性の検定
検定 カイ 2 乗 自由度 Pr > Chi-Square
ログランク 158.4857 1 <.0001
Wilcoxon 127.2079 1 <.0001
HR=0.544
KM曲線
2重対数プロット
2013/7/18 161
比例ハザードモデルのあてはめ
2013/7/18 162
HR=0.544
累積Schoenfeld残差プロット
2013/7/18 163
例ハザード前提条件のもとでの上限値の検定
変数 最大絶対値 反復 シード Pr > MaxAbsVal
g 0.9026 1000 4989 0.3830
細線:比例ハザードモデルの下でシミュレーションの20パターン
最大絶対値
比例ハザードモデルと残差
2013/7/18 164
区分指数モデル <5:HR=1 >5:HR=0.5 N=1000
後半でのみ差がある 層に対しての同等性の検定
検定 カイ 2 乗 自由度 Pr > Chi-Square
ログランク 10.4492 1 0.0012
Wilcoxon 0.1770 1 0.6740
2013/7/18 165
<5 HR=1.059
>5 HR=0.509
2重対数プロット log(5)=1.609
2013/7/18 166
log(5)
比例ハザードモデルのあてはめ
2013/7/18 167
HR=0.858
累積Schoenfeld残差プロット
比例ハザード前提条件のもとでの上限値の検定
変数 最大絶対値 反復 シード Pr > MaxAbsVal
g 3.1984 1000 4989 <.0001
上昇 群2(赤)でモデルより死亡が起きやすい 下降 群2 (赤)でモデル
より死亡が起きにくい
2013/7/18 168
最大絶対値:3.1984
区分指数モデル <5:HR=0.5 >5:HR=1と残差
2013/7/18 169
区分指数モデル <5:HR=1 >5:HR=0.5と残差
2013/7/18 170
累積Schoenfeld残差プロットの見方
0)0からスタートして0に収束
1)上昇:群2でモデルより死亡が起きやすい.
2)下降:群2でモデルより死亡が起きにくい.
3)ランダムウォーク:モデルが適合
4)視覚的な評価:シミュレーションの20パターンの中に累積Schoenfeld残差プロットが埋もれていればモデルが適合
5)検定:最大絶対値の分布を1000回のシミュレーションで計算.有意であれば,モデルが不適合 2013/7/18 171
累積マルチンゲール残差プロットの見方
0)0からスタートして0に収束
1)上昇:モデルより死亡が起きやすい.
2)下降:モデルより死亡が起きにくい.
3)ランダムウォーク:モデルが適合
4)視覚的な評価:シミュレーションの20パターンの中に累
積マルチンゲール残差プロットが埋もれていればモデルが適合
5)検定:最大絶対値の分布を1000回のシミュレーションで計算.有意であれば,モデルが不適合
6)-sin型:次数を下げる sin型:次数を上げる
m型:閾値が存在 2013/7/18 172
膵癌データの解析
モデルの妥当性評価 ASSESS文
proc phreg data=pcancer;
model time*censor(1)=stage treat age;
assess var=(age) ph /seed=4989 resample;
output out=out survival=s resmart=r ressch=rsstage rstreat rsage;run;
2013/7/18 173
大橋・浜田(1995) 生存時間解析 N=83
STAGE ステージ:3(53.0%) 4(47.0%)
TREAT 術中照射なし:0(26.5%),あり1(73.5%)
AGE 研究登録時の年齢
Cox回帰の結果
最尤推定値の分析
パラメータ
自由度 パラメータ 推定値
標準誤差
カイ 2 乗
Pr > ChiSq
ハザード比
STAGE 1 0.22104 0.11465 3.7172 0.0539 1.247
TREAT 1 -0.34166 0.13480 6.4239 0.0113 0.711
AGE 1 0.01308 0.01250 1.0954 0.2953 1.013
AGEは有意でない
2013/7/18 174
ステージ別の生存時間曲線
HR:3.151 1.425 1.909 0.770
0-2でステージ4の
リスク大
2013/7/18 175 時点全体のHR:1.247
比例ハザード性の検討 ステージ
0-2で上昇
ステージ4で
モデルより死亡が起きやすい
2013/7/18 176
最大絶対値:0.9428
処置別の生存時間曲線
HR:0.365 1.053 0.387 0.401
2-4で 処置群の効果がない
2013/7/18 177 時点全体のHR:0.711
比例ハザード性の検討 処置
2-4で上昇 処置群でモデルより 死亡が起きやすい 2013/7/18 178
線形性の仮定の評価
上昇 モデルより 死亡が起きやすい
下降 モデルより 死亡が起きにくい
2013/7/18 180 最大絶対値:9.1796
年齢のカテゴリー変数によるモデル化 data pcancer;set pcancer;
select;
when( age <50) do;cat=1;a1=0;a2=0;a3=0;end;
when(50<=age <60) do;cat=2;a1=1;a2=0;a3=0;end;
when(60<=age <70) do;cat=3;a1=0;a2=1;a3=0;end;
when(70<=age ) do;cat=4;a1=0;a2=0;a3=1;end;
otherwise;end;
proc phreg;class cat/param=ref ref=first;
model time*censor(1)=stage treat cat;run;
2013/7/18 181
年齢のカテゴリー変数によるモデル化
最尤推定値の分析
パラメータ
自由度 パラメータ 推定値
標準誤差
カイ 2 乗 Pr > ChiSq
ハザード比
STAGE 1 0.20517 0.11564 3.1478 0.0760 1.228
TREAT 1 -0.33751 0.13889 5.9056 0.0151 0.714
a1 50-59 1 -0.56219 0.37011 2.3073 0.1288 0.570
a2 60-69 1 -0.34124 0.35567 0.9205 0.3373 0.711
a3 70- 1 0.34543 0.39596 0.7610 0.3830 1.413
線形仮説検定の結果
ラベル Wald カイ 2 乗
自由度 Pr > ChiSq
age 8.3049 3 0.0401
2013/7/18 182
-50:1.000 50-59:0.570 60-69:0.711 70-:1.413
183
可視化 kernel
平滑化ハザード
変量効果
RANDOM文
ハザード比の推定多重比較
ESTIMATE文LSMESTIMATE文
LSMEANS文
HAZARDRATIO文
比例ハザード性 線形性の仮定の評価 ASSESS文
22110 exp)()( zzuthth i
比例ハザードモデル
まとめ
ご清聴どうもありがとうございました.
PHREGは
LSMESTIMATE文に限る
184
薬剤疫学会 第19回学術総会 薬剤疫学における生物統計の役割
-科学的な医薬品リスク管理計画(RMP)実践を目指して- 期日:2013年11月16(土),17(日) 会場:東京大学 伊藤国際学術研究センター 事務局:東京理科大学浜田研究室
185
薬剤疫学会 第19回学術総会
1 会 期: 平成25年11月16日(土)~17日(日) 2 会 場: 東京大学伊藤国際学術研究センター 〒113-0033 東京都文京区本郷7-3-1 3 会 長: 浜田 知久馬(東京理科大学工学部経営工学科教授) 4 参加費: [事前登録] 会員6,000円 非会員8,000円 学生3,000円 [当日参加] 会員8,000円 非会員10,000円 学生4,000円 5 懇親会費: 5,000円 6 連絡先: 東京理科大学 工学部経営工学科 浜田研究室 担当:栗原順子、松下泰之 〒162-8601東京都新宿区神楽坂1-3 E-mail:jspe2013@ms.kagu.tus.ac.jp http://www.rs.kagu.tus.ac.jp/hamada/jspe2013/
プログラム概要(予定)
会長講演 「薬剤疫学研究のトレンドの分析」 演者:第19回学術総会会長 浜田知久馬 特別講演 「薬効評価における統計学」 演者:大橋靖雄 シンポジウム1 科学的な医薬品リスク管理計画(RMP)実践を目指して シンポジウム2 PMDAの自発報告データベースの新たな活用と今後の課題 教育講演 安全性メタアナリシス~その解釈と留意点~ 演者:浜田知久馬 日本臨床試験研究会との共同企画 活性化する日本の医療データベース研究-更なる発展に向けて-