sas生存時間解析プロシジャの最新の機能拡張 ·...

SAS生存時間解析プロシジャの

最新の機能拡張

浜田知久馬東京理科大学

What’s new in SAS survival procedures.

Chikuma Hamada Tokyo University of Science

1

2

統計学をめぐるホットな話題

バルサルタン

http://www.amazon.co.jp/gp/reader/4478022216/ref=sib_dp_pt

3

Kyoto Heart Study

バルサルタン

Non-ARB

要旨 LIFETESTプロシジャは生存関数の信頼バンド，kernel法を用いた平滑化ハザード関数の推定が可

能になった．更に３群以上の多群について多重性を考量した多重比較も可能になった．

PHREGプロシジャはCONTRAST，ESTIMATE，LSMEANS，LSMESTIMATE，HAZARDRATIO文で

柔軟な推測，共変量と多重性の双方を同時に調整した多重比較も可能になった．またRANDOM文による変量効果を用いた解析も可能になった．

キーワード： LIFETESTプロシジャ， PHREGプロシジャ，

多重比較， LSMESTIMATE，変量効果 4

LIFETEST

生存関数の信頼区間と信頼バンド

kernel法を用いた平滑化ハザード関数の推定

PHREG

ESTIMATE文とLSMESTIMATE文

LSMEANS文による多重比較

(LIFETESTによる多重比較）

事例最大対比法による用量反応解析

HAZARDRATIO文

共変量と多重性の同時調整

事例サブグループ解析の多重比較

RANDOM文による変量効果モデル

ASSESS文によるモデルの妥当性の評価

5

内容

6

可視化 kernel

平滑化ハザード

変量効果

RANDOM文

ハザード比の推定多重比較

ESTIMATE文LSMESTIMATE文

LSMEANS文

HAZARDRATIO文

比例ハザード性線形性の仮定の評価 ASSESS文

22110 exp)()( zzuthth i

比例ハザードモデル

内容

生存関数の信頼区間と信頼バンド点と線

生存関数の信頼区間(pointwise)：

特定の時点について，真の生存割合を被覆

する確率を確保：CL:Confidence Limit

生存関数の信頼バンド(simultaneous) :

時点全体について，真の生存割合を被覆

する確率を確保：CB:Confidence Band

副作用の好発時期等の生存時間曲線全体の

プロファイルを比較するとき等に有効 7

の公式GreenwoodtSVtSVtS :ˆˆ96.1ˆ

生存時間曲線の信頼区間のプログラム plots=s(cl)オプション

proc lifetest data=gehan

plots=s(cl strata=panel test

atrisk=0 to 40 by 5)

method=km;

time week*remiss(0);

strata drug;

run;

9

信頼区間時点毎に真値が含まれる確率を保証

生存割合を２重対数変換後，正規近似で信頼区間を構成 10

生存関数(0~1)の変換と信頼区間の算出

得られた生存割合を関数で変換

変換後に区間を計算し，逆変換

tSgtS xg ˆˆ

tSgtSg ˆvar96.1ˆ

tSgtSgg ˆvar96.1ˆ1

g-1(x)

tS xg

11

LIFETEST procedure で計算可能な5種類の変換

CONFTYPE=オプション

変換変換関数

変換無し（LINEAR:NOTRANS）

対数変換（LOG）

二重対数変換（LOGLOG）

逆正弦変換（ASINSQRT）

ロジット変換（LOGIT）

xxg 1sin

xxg loglog

xxg

xxg log

xxxg 1log

12

各変換での95%信頼区間変換後正規近似でCL構成→逆変換

変換 95%信頼区間

LINEAR

LOG

LOGLOG

ASINSQRT

LOGIT

SSSS var1496.1arcsinsin

12

SSSS varlog96.1loglogexpexp

2

SS var96.1

SSS var96.1logexp 2

Sh

Sh

1

SSS

S

SSh var196.1

1logexp

2ただし，

13

GEHANのデータ（対照群）での5種類の信頼区間

LINEAR LOG LOGLOG

ASINSQRT LOGIT

14

上下対称

上下非対称上下非対称

上下非対称上下非対称

デフォルトは

LOGLOG変換

95%信頼区間の正確な被覆確率区間[0.05, 0.95]における平均値

90%

95%

100%

50 100 200 400

被覆確率

NONTRANS LOG LOGLOG ASINSQRT LOGIT

症例数 [n]

15 デフォルトはLOGLOG変換

95%信頼区間の正確な被覆確率 [n=50, LOGLOG]

平均：

95.22%

16

佐藤聖士，浜田知久馬(2011)

生存関数における信頼区間算出法の性能比較 SAS Forum ユーザー会学術総会

LIFETESTプロシジャの信頼バンドの出力

デフォルトはLOGLOG変換

デフォルトはHW

17

信頼バンドの種類

• EP(Equal Precision)型信頼バンド

• HW(Hall-Wellner)型信頼バンド

tS

n

tnaahtStStS

n

tnaahtS SULSUL ˆ1,ˆˆ1,ˆ

2/1

2

2/1

2

tStaaetStStStaaetS SULSULˆ,ˆˆ,ˆ

生存割合の分散生存割合の推定量 ::ˆ 2 ttS S

W. J. Hall and Jon A (1980)

Nair，V. N. (1984)

18

上下対称

生存時間曲線の信頼バンドのプログラム plots=s(cb)オプション

proc lifetest data=gehan

plots=s(cb strata=panel test atrisk=0 to 40 by 5)

method=km;


strata drug;

run;

19

信頼バンド（信頼区間より広い）区間で真値が含まれる確率を保証

20

デフォルトは

HW型でLOGLOG変換

佐藤聖士浜田知久馬(2012)

生存関数における信頼バンド構成法の比較 SAS Forum ユーザー会学術総会

信頼区間と信頼バンドの同時出力

plots=s(cb cl)

21

ハザード関数の推定と平滑化

proc lifetest data=gehan method=pl nelson

plots(only)=hazard(kernel=b bw=5);


strata drug;

run;

22

kernel(カーネル:核)関数による平滑化バンド幅bw(band width)=5週

Nelson-Aalen推定量

累積ハザード関数の推定量

di : 時点 i における死亡総数

ni : 時点 i における群を併合したリスク集合の大きさ

ハザード関数：離散的な値をとる

関数の形状の比較が難しい

kernel(カーネル)：核関数法でハザードの平滑化を行う

ハザード関数の推定と平滑化

)(tH

ii

tt

ii ndthndtHi

,

23

Nelson型の累積ハザード関数(離散的) 積極限法による生存推定

WEEK 積極限法 Nelson-Aalen 死亡数生存数

生存率死亡率生存率の標準誤差

累積ハザード

累積ハザード標準誤差

0.0000 1.0000 0 0 0 . 0 21

1.0000 . . . . . 1 20

1.0000 0.9048 0.0952 0.0641 0.0952 0.0673 2 19

2.0000 . . . . . 3 18

2.0000 0.8095 0.1905 0.0857 0.2005 0.1004 4 17

3.0000 0.7619 0.2381 0.0929 0.2593 0.1163 5 16

4.0000 . . . . . 6 15

4.0000 0.6667 0.3333 0.1029 0.3843 0.1461 7 14

5.0000 . . . . . 8 13

5.0000 0.5714 0.4286 0.1080 0.5272 0.1776 9 12

8.0000 . . . . . 10 11

8.0000 . . . . . 11 10

8.0000 . . . . . 12 9

8.0000 0.3810 0.6190 0.1060 0.8605 0.2436 13 8

層 2: drug = CONTROL

24

tt

ii

i

nd

21

2

19

2

21

2

Nelson型のハザード関数(離散的) Control

14

2

16

2

17

1

19

2

21

2　

12

4

8

2 6

2

1

1

3

12

1

4

1

ii ndth

時間（週）

ハザード関数

25

kernel-smoothed hazard 関数の出力

Gehanのデータ

バンド幅5週

28

CONTROL

6-MP

カーネル関数（biweight カーネル）

カーネル(kernel：核)推定

i

n

i

i tHb

ttK

bth

~1ˆ

1

22116

15xxK

(-1 ≤ x ≤ 1)

：平滑化したハザード推定量

：カーネル関数

：バンド幅

K(x)

th

b

バンド幅２ｂ 29

死亡時点（核）を中心とした確率

密度関数を複数可算した混合分布．

時点ごとのカーネル密度

22116

15xxK

時間（週）

バンド幅5週

ハザード関数

２ｂ=10 30

カーネル密度の加算 Control

時間（週）

ハザード関数

バンド幅5週

31

34

経口FU剤の結腸癌の補助化学療法の投与期間の比較(6 vs. 12月）

X-ACT試験と財団法人がん集学的治療研究財団による3試験（JFMC7-1,JFMC7-2,JFMC15）

ステージⅢの治療群患者のみ使用（投与期間の比較）

全生存期間：overall survival, OS

無病生存期間：disease-free survival, DFS

対象データ

試験 X-ACT

JFMC7-1

JFMC7-2

JFMC15

化学療法 5-FU/LV カペシタビン 5-FU,HCFU

投与期間 6ヶ月 12ヶ月

患者数（人） 983 1004 405

男性（人） 532 543 190

女性（人） 451 461 215

35

6 vs. 12月投与(DFS：無病生存期間)

0~0.5年はあまり差がない

0.5年以降ハザードに差が現れる

ハザード比: 0.679

⇒12ヶ月投与の方が再発・死亡リスクを約32%抑える

0.25

0.20

0.15

0.10

0.05

0 1 2 3 4 5

ハザード

ハザード比0.679

時間（年）

生存率

1.0

0.8

0.6

0.4

0.2

0.0 0 1 2 3 4 5

Logrank p<.0001

時間（年）

Logrank p<0.0001

6ヶ月

12ヶ月

6ヶ月

12ヶ月

バンド幅b ＝ 1（年間）

36

KM法による生存関数カーネル法によるハザード関数

6 vs. 12月投与(OS：全生存期間)

0~1年はあまり差がない

1年以降ハザードに差が現れる

ハザード比: 0.855

⇒12ヶ月投与の方が死亡リスクを約14%抑える

1.0

0.8

0.6

0.4

0.2

0.00 1 2 3 4 5

Logrank p=0.159

時間（年）

生存率

0.10

0.08

0.06

0.04

0.02

0.00

0 1 2 3 4 5

ハザード比0.855

時間（年）

ハザード

6ヶ月 6ヶ月

12ヶ月

12ヶ月

バンド幅b ＝ 1（年間）

37

KM法による生存関数カーネル法によるハザード関数

38

可視化 kernel


変量効果

RANDOM文



LSMEANS文

HAZARDRATIO文




内容

VA Lung Cancer data(PHREGのﾏﾆｭｱﾙより) ESTIMATE文，LSMESTIMATE文， LSMEANS文

Veterans Administration lung cancer trial presented in

Kalbfleisch and Prentice(1980)

男性を対象とした進行肺がんのランダム化臨床試験

エンドポイント：Time(死亡までの時間（日）)

共変量

Therapy(2) (治療法: standard or test) (i)

Cell(4) (腫瘍セル型: adeno, large, small, squamous) (j)

Prior(2) (既往歴: 0=no, 10=yes) Age(連続量) (年齢)

Duration (連続量) (診断からランダム化までの期間(月)

Kps (連続量) (Karnofskyのperformance scale)0~100 39

生存時間KM曲線(VA Lung Cancer data) Cell型で層別 (adeno-largeの比較)

adeno

腺癌

small large

squamous

扁平上皮癌

40

310 : H

生存時間KM曲線(VA Lung Cancer data) Therapyで層別 (standard-testの比較)

standard

test

41

210 : H

cell type =adeno

large

small squamous

test

standard

42

生存時間KM曲線

Cell型とTherapy層別

32310 : H

４×２２元配置セル平均のモデル

Cell Therapy

Standard Test

Adeno 11 12 1.

Large 21 22 2.

Small 31 32 3.

Squamous 41 42 4.

.1 .2 ..

1

2

3

4

1 2

model Time*Status(0) = Cell Therapy Cell*Therapy;

321

120

210220

311

110

410 420

43

ESTIMATE文，LSMESTIMATE文セル平均を用いた仮説の表現

Cell(i) smallにおいて, 対数ハザードが処置(j)

StandardとTestに差があるか

帰無仮説：H0

：治療効果セル効果， ji

ijjiijij

ijjiij

th

th

thth

:),(log

)(log

)exp()()(

0

0

3231

44

PHREGのESTIMATE文とLSMESTIMATE文

proc phreg data=VALung;

class Prior Cell Therapy/param=glm;

model Time*Status(0) = Cell Therapy

Cell*Therapy;

estimate "3small 1standard vs 2test"

Cell*Therapy 0 0 0 0 1 -1 0 0/e exp;

lsmestimate Cell*Therapy

"3small 1standard vs 2test"

0 0 0 0 1 -1 0 0/e exp;run;

45 3231

パラメータ推定値最尤推定値の分析パラメータ自由

度パラメータ推定値

標準誤差カイ 2 乗 Pr > ChiSq

Cell adeno 1 1.56539 0.38499 16.5326 <.0001 Cell large 1 0.82278 0.40021 4.2267 0.0398 Cell small 1 1.81806 0.39165 21.5481 <.0001 Cell squamous 0 0 . . . Therapy standard 1 0.74962 0.38938 3.7064 0.0542 Therapy test 0 0 . . . Cell*Therapy adeno standard 1 -0.89508 0.56925 2.4724 0.1159

Cell*Therapy adeno test 0 0 . . .

Cell*Therapy large standard 1 -1.22577 0.56045 4.7835 0.0287

Cell*Therapy large test 0 0 . . .

Cell*Therapy small standard 1 -1.43016 0.51127 7.8246 0.0052

Cell*Therapy small test 0 0 . . .

Cell*Therapy squamous standard 0 0 . . .

Cell*Therapy squamous test 0 0 . . .

31

32

21

46

43016.13231

ESTIMATE文とLSMESTIMATE文の結果

推定

ラベル推定値標準誤差 z 値 Pr > |z|

3small 1standard vs 2test Non-est . . .

Least Squares Means Estimate

ラベル推定値標準誤差 z 値 Pr > |z|

3small 1standard vs 2test -0.6805 0.3199 -2.13 0.0334

ESTIMATE文

LSMESTIMATE文

43016.13231 とは異なる

推定不能

47

LSMESTIMATE文のEオプション係数の出力 Coefficients for Cell*Therapy Least Squares Means Estimate

パラメータ cell type type of treatment Row1

Celladeno adeno

Celllarge large

Cellsmall small

Cellsquamous squamous

Therapystandard standard 1

Therapytest test -1

CelladenoTherapystandard adeno standard

CelladenoTherapytest adeno test

CelllargeTherapystandard large standard

CelllargeTherapytest large test

CellsmallTherapystandard small standard 1

CellsmallTherapytest small test -1

CellsquamousTherapystandard squamous standard

CellsquamousTherapytest squamous test

1

2

31

32

48

3231213231

モデルパラメータによる仮説の表現 Cell CのStandard(μ31)とTest (μ32)の差

323121

3231

322332

311331

ijjiij

49

μ31 μ32 α3

β1 β2

ESTIMATE文の指定(主効果も指定する必要）

Therapy 1 -1 Cell*Therapy 0 0 0 0 1 -1 0 0

3231213231

322332

311331

42413231

22211211

214321

,,,

,,,

,,,,

21 3231

50



Therapy 1 -1 Cell*Therapy 0 0 0 0 1 -1 0 0;

or


Therapy 1 -1 Cell*Therapy 0 0 0 0 1 -1;

(省略した場合は0として扱われる）

lsmestimate Cell*Therapy "3small 1standard vs 2test" 0 0 0 0 1 -1 0 0;

(Cell*Therapyのみ指定）

51

セル平均を用いた仮説の表現

平均効果 AdenoとLargeにおいて差があるか

帰無仮説：H0

22

22211211

21

52


ijjiijij

ijjiij

th

th

thth

:),(

)(log

)exp()()(

0

0

モデルパラメータによる仮説の表現平均効果Cell AとB の差

2

22

2221121121

2221121121

222222

211221

122112

111111

53

μ11 μ12

μ21 μ22

1

2

ESTIMATE文の指定 Cell 1 -1 0 0 Cell*Therapy .5 .5 -.5 -.5 0 0 0 0

2

22

,,

,,

,,,,

2221121121

2221121121

42413231

22211211

214321

22211211

54

ESTIMATE文とLSMESTIMATE文 estimate "1adeno-2large"

Cell 1 -1 0 0 Cell*Therapy .5 .5 -.5 -.5 0 0 0 0;

or

estimate "1adeno-2large"

Cell 1 -1 Cell*Therapy .5 .5 -.5 -.5;

(省略した場合は0として扱われる）

lsmestimate Cell “1adeno-2large”1 -1 0 0; (Cellのみ指定）

55

セル平均を用いた仮説の表現

平均効果Therapy StandardとTestにおいて差があるか

帰無仮説：H0：

44

4232221241312111

21

56


ijjiijij

ijjiij

th

th

thth

:),(

)(log

)exp()()(

0

0

モデルパラメータによる仮説の表現平均効果Cell AとB の差

42413231

22211211

21

4232221241312111

21

25.25.25.25.

25.25.25.25.

44

57

μ11 μ12

μ21 μ22

μ31 μ32

μ41 μ42

21


estimate "1standard-2test"

Therapy 1 -1

Cell*Therapy .25 -.25 .25 -.25 .25 -.25 .25 -.25;

lsmestimate

Therapy “1standard-2test” 1 -1;

(Therapyのみ指定）

4241323122211211

21

58


交互作用を含むモデルのESTIMATE文

１）主効果を含めて複雑な係数を指定する必要がある．

２）多くの要素をプログラムで指定．

３）0の省略等簡略も可能だが，非明示的なルールがある（Eオプションで確認）．

面倒かつプログラムミスをしやすい．

LSMEANS文は出力が冗長で柔軟性なし

→LSMESTIMATE文

59

ESTIMATE LSMESTIMATE LSMEANS マニュアル

複数の効果を指定．柔軟な指定が可能だが，慣れないと面倒でミスしやすい．

オートマ

一つの効果のみ指定．簡単便利．慣れてしまうとマニュアルは

使えなくなる．

60

路線バス

対比較または，基準群との比較を不必要なものを含めて網羅的に出力．

〇推奨 × △

http://www.google.co.jp/url?sa=i&rct=j&q=&esrc=s&frm=1&source=images&cd=&cad=rja&docid=23e1illYqaGfBM&tbnid=5f7JA7Qs_Q5k3M:&ved=0CAUQjRw&url=http://www.tt-w.net/2009/07/19235634.html&ei=r4uJUcPSOMLikAWS2IHoBQ&bvm=bv.46226182,d.dGI&psig=AFQjCNGQHInxh0xfSudz-4tCCil_nMVr9Q&ust=1368055084001104

ESTIMATE，LSMESTIMATE，LSMEANS

ESTIMATE文(マニュアル)

推定可能にするため原則的にすべてのパラメータを指定(0のものは省略可）

LSMESTIMATE文(オートマ) 比較の対象の効果のパラメータのみを指定

任意の対比についての多重比較が可能

現在では多くのプロシジャで利用可

LSMEANS文(路線バス) 比較の対象の効果のみを指定

群間の対比較のみ可能

交互作用の比較の場合，出力が冗長

61

皮膚癌データ: SCANCER ラットを用いた発癌実験データ

10nmol：HR=1

90nmol:HR=5.680

30nmol:HR=4.167

66

生存時間の多重比較の方法

LIFETEST STRATA文 ADJ=オプション

ADJUST=BONFERRONI

ADJUST=DUNNETT

ADJUST=SCHEFFE

ADJUST=SIDAK

ADJUST=SIMULATE

ADJUST=SMM | GT2

ADJUST=TUKEY

67

TEST=WILCOXONで一般化ウイルコクソン

検定の多重比較も可能

打ち切りと非打ち切り値の数の要約

層 DOSE 全体死亡打ち切り

1 10 30 11 19

2 30 30 19 11

3 90 30 20 10

Total 90 50 40

基本的な多重比較法 A,B,Cの比較

A

B

C

AB

AC

BC

Tukey：AB,AC,BC

Dunnett：AB,AC

Scheffe：AB,AC,BC,A-BC

A-BC

m：比較の数

Bonferroni：p値をm倍

Sidak：独立性を前提

に多重性調整

SIMULATED：シミュレーションにより多重性調整 68

検定の多重性

有意水準αで独立な検定をm回行った場合

１）１回も有意にならない確率

α =0.05，m=10のときの確率

（１-α)m （１-0.05)10 =0.59874

２）１回以上有意になる確率

また α =0.05，m=10のときの確率

1-（１-α)m ≒m･α

1-（１-0.05)10 = 0.40126

69

独立な最小p値の分布

1

m

m

)1()'()(

)1(1)(

p

)(1

)1(1

1

mxmxFxf

xxF

m

m

確率密度関数：

分布関数：

値の分布個の最小

α未満最小ｐ値が有意つ以上が有意

αα水準で有意：　

つ以上が個の独立な検定のうち

70

m個の最小p値の確率密度関数

1

2

3

4

5

ｍ＝10 )( pf 1)1()( mpmpf

71

p

m個の最小p値の累積分布関数

1

2

3 4

5 m=10 )( pF

法

≒

に近いときが

法

Bonferroni

pm)(

0

)1(1)( m

pF

p

Sidak

ppF

72

ｐ

0.40126

多群の場合のノンパラ検定

包括検定：分散分析型統計量

自由度：群の数（ｒ）ー1

群間で差があるか

分散共分散行列

数の差のベクトル観測死亡数と期待死亡

r

VVV

VVV

VVV

u

u

u

T

rrrr

r

r

r

:

,

:

:

2

21

22221

11211

2

1

uVu

Vu

V

u

73

uVu T2

Dunnett型多重比較

(基準群（用量10nmol群）との比較）

ods graphics on;

proc lifetest data=scancer

plots=survival(atrisk=0 to 80 by 10);

time time*censor(0);

strata dose /

test=logrank adjust=dunnett;

run;

ods graphics off;

74

ログランク検定の出力（包括検定）

uVu T2

75

３×１

３×３

順位統計量

DOSE ログランク

10 -13.863

30 4.814

90 9.048

数の差観測死亡数と期待死亡

1u

2u

3u

ログランク検定の共分散行列

DOSE 10 30 90

10 10.2810 -5.7934 -4.4875

30 -5.7934 9.0072 -3.2138

90 -4.4875 -3.2138 7.7013

11V

21V

31V

12V 13V

22V 23V

32V 33V

層に対しての同等性の検定

検定カイ 2 乗自由度 Pr > Chi-Square

ログランク 20.2565 2 <.0001

u

V

121122

2

122

122

)(

VVV

uuX

群ｉと群ｊの対比較のカイ 2 乗統計量Xｉｊ

2

　　

2982.11

)7890.5(22810.100072.9

))863.13(814.4(

2

)(

2

)(

][

)(

2

121122

2

122

12

22

2

VVV

uuX

VVV

uu

uuV

uuX

ijiijj

ij

ij

ij

ij

76 0008.0)2982.11Pr(

2

1 p

多重比較の調整p値の計算

　　

関数

関数

未加工

ｒ：群数検定の回数，

)(PROBMC:

)(PROBMC:

)Pr(:

)1(1:

),1min(:

)Pr(:)(

:

22

1

22

1

HsuDunnettDunnett

KramerTukeyTukey

XadjpScheffe

padjpSidak

pmadjpBonferroni

Xpadjustednon

m

ijr

m

ij

77

Dunnett型多重比較(adjust=dunnett);

78



ログランク 20.2565 2 <.0001

多重比較の調整 : Logrank 検定

層比較カイ 2 乗 p 値

DOSE DOSE 未加工 (調整無)

Dunnett-Hsu

30 10 11.2982 0.0008 0.0015**

90 10 19.4717 <.0001 <.0001**

Xｉｊ2

uVu T2

Simulated法の多重比較(Tukey型）

proc lifetest data=scancer

plots=survival(atrisk=0 to 80 by 10);

time time*censor(0);

strata dose /

test=logrank

adjust=simurate(report seed=4989);

ods output survdiff=diff;

run;

83


確率点シミュレーションの詳細

乱数シード 4989

比較型 All

標本サイズ（シミュレーション回数） 12605

ターゲットアルファ（目標水準） 0.05

精密の半径Accuracy radius 0.005

精度の信頼度Accuracy confidence 99%

　　

α

1

84 ２γ

信頼区間の幅

３回の最小p値の分布理論分布とシミュレーションによる近似

理論分布(確率密度関数） 12605回のシミュレーション 2)1(3)( ppf

85


シミュレーション結果

手法 95% 分位点推定アルファ

99% 信頼限界

Simulated 2.349061 0.0500 0.0450 0.0550

Tukey-Kramer

2.343701 0.0511 0.0460 0.0561

Bonferroni 2.393980 0.0447 0.0399 0.0494

Sidak 2.387738 0.0454 0.0406 0.0502

GT-2 2.387738 0.0454 0.0406 0.0502

Scheffe 2.447747 0.0385 0.0341 0.0429

Z 1.959964 0.1192 0.1118 0.1267

q

　)(1

qF棄却限界値　:

q

5/3%点

5%点 86

0.05±0.005(γ)


シミュレーションで最小p値が0.0008

以下 26/12605=0.0022

87

多重比較の調整 : Logrank 検定

層比較カイ 2 乗 p 値

DOSE DOSE 未加工 Simulated

10 30 11.2982 0.0008 0.0022**

10 90 19.4717 <.0001 <.0001**

30 90 0.7748 0.3787 0.6514

シミュレーション回数の設定

　　

シミュレーション回数

精度の信頼水準

：抑えたい精度の幅

α：目標有意水準

推定有意水準

累積分布関数

推定棄却限界値

)12605(:

(0.99):1

0.05)(

))((1:

:)(

:

1))Pr((

N

qF

qF

q

88

２γ

１％

シミュレーション回数の設定

12605)05.01(05.0005.0

60.2

)1(

60.2,)1(

1))(Pr(

)1(][,1)(

2

2

2

2

2/

2/01.02/

ZN

ZN

Z

NVqF

89

生存時間データへの最大対比法の適用 (-1 0 1) (-1 -1 2) (-2 1 1) (-5 -2 7)

Linear

(-1 0 1)

h-start

(-1 -1 2)

m-end

(-2 1 1)

94

dose(10,30,90)

(-5 -2 7)

最大対比法(対数ハザード）の適用

proc phreg data=scancer;

class dose/param=glm ref=first;

hazardratio dose/diff=ref;

model time*censor(0)=dose;

lsmestimate dose

‘linear’ -1 0 1, ‘dose’ -5 -2 7,

‘h-start’ -1 -1 2, 'm-saturate' -2 1 1 /adj=simulate(report) seed=4989;

run; 95

Simulated法の利点

Sidak法は複数の対比の統計量が独立を前提

Bonferroni法はSidak法のよい近似法

Scheffe法は任意の対比の最大のものを統計量とすることを想定するので過度に保守的

用量反応モデルに対する対比統計量は正の相関が高く，相関構造を反映できるSimulated法の検出力が高くなる（名義水準に保たれる）．

Simulated法では任意の複数の対比について，相関を考慮した多重性の調整が可能

12605回のシミュレーションでは最大1%程度の誤差

96

Bonferroni法との性能比較 REPORTオプション


手法 95% 分位点推定アルファ 99% 信頼限界

Simulated 2.214661 0.0500 0.0450 0.0550

Bonferroni 2.497705 0.0242 0.0207 0.0277

Sidak 2.490915 0.0248 0.0212 0.0283

Scheffe 2.447747 0.0282 0.0244 0.0320

Z 1.959964 0.0866 0.0801 0.0930

5/4％点

5％点 97 対比統計量は正の相関が高いのでBonferroni法は保守的

最大対比法の適用

98

Least Squares Means Estimates Adjustment for Multiplicity: Simulated

効果ラベル推定値標準誤差

z 値 Pr > |z|

調整済 P

指数

DOSE linear 1.7370 0.4429 3.92 <.0001 0.0002 5.6803

DOSE dose 9.3045 2.5135 3.70 0.0002 0.0004 10987

DOSE h-start 2.0467 0.6322 3.24 0.0012 0.0029 7.7425

DOSE m-saturate

3.1643 0.8293 3.82 0.0001 0.0002 23.6720

最大対比：2.215を越えているので有意

対数ハザードが等差的に変化

対比(-1 0 1)の適用結果

99

生存時間KM曲線対比による予測生存時間曲線

10：HR=1

30:HR=4.167

90:HR=5.680

HAZAEDRATIO文(対応のESTIMATE文) proc phreg data=VALung;

class Prior Cell Therapy/param=glm ;

model Time*Status(0) = Kps Cell Prior Therapy Prior*Therapy;

hazardratio 'H1' Kps / units=10 cl=both;

hazardratio 'H2' Cell /cl=both;

hazardratio 'H3' Therapy /diff=ref cl=both;

estimate 'E1' Kps 10 / exp;

estimate 'E2 12' cell 1 -1 0 0, /* adeno vs large */

'E2 13' cell 1 0 -1 0, /* adeno vs small */

'E2 14' cell 1 0 0 -1, /* adeno vs squamous */

'E2 23' cell 0 1 -1 0, /* large vs small */

'E2 24' cell 0 1 0 -1, /* large vs Squamous */

‘E2 34’ cell 0 0 1 -1 /* small vs squamous */ / exp;

estimate 'E3 no' Therapy 1 -1 Prior*Therapy 1 -1 0 0,

'E3 yes' Therapy 1 -1 Prior*Therapy 0 0 1 -1/ exp;run; 100

検定結果 Type 3 検定

効果自由度 Wald カイ 2 乗

Pr > ChiSq

Kps 1 35.9218 <.0001

Cell 3 17.4134 0.0006

Prior 1 0.1150 0.7345

Therapy 1 0.2510 0.6164

Prior*Therapy 1 2.9269 0.0871

101

パラメータ推定値

パラメータ自由度



ハザード比

Kps 1 -0.03111 0.00519 35.9218 <.0001 0.969

Cell adeno 1 1.16052 0.30002 14.9629 0.0001 3.192

Cell large 1 0.41145 0.28309 2.1125 0.1461 1.509

Cell small 1 0.85410 0.26894 10.0858 0.0015 2.349

Cell squamous 0 0 . . . .

Prior no 1 0.27688 0.30490 0.8247 0.3638 .

Prior yes 0 0 . . . .

:

102

KPSが1単位変化 HR:ｅxp(-0.03111）=0.969

adeno-squamous HR：ｅxp(1.16052）=3.192 adeno-large HR：ｅxp(1.16052-0.41145）= 2.115

：

Wald検定と尤度比検定ベースの信頼区間信頼区間：検定で棄却されない母数の集合

103

対数尤度

β MLE

最尤推定量

尤度比検定ベース

の信頼区間CL＝ PL

Wald検定ベース

の信頼区間CL=WALD

MLE+1.96SE

3.84/2=1.92

MLEｰ1.96SE

CL=BOTH

hazardratio ‘H1’ Kps / units=10 cl=both; 連続量はUNITSオプションで増分単位を指定 cl=bothでWald検定と尤度比検定ベースCLを出力

H1: ハザード比 Kps

説明点推定値 95% Wald 信頼限界 95% プロファイル尤度による信頼限界

Kps Unit=10 0.733 0.662 0.811 0.662 0.811

推定（ESTIMATE文）

ラベル推定値標準誤差

z 値 Pr > |z| 指数

E1 -0.3111 0.05191 -5.99 <.0001 0.7326

ｅxp(10･（-0.03111)）=0.96910

=0.733

104

CL=WALD CL＝ PL

Karnofsky Performance Scale: 0:死亡 100:正常

hazardratio ‘H2’ Cell /cl=both; デフォルト(diff=all)は全ての対比較 H2: ハザード比 Cell

説明点推定値

95% Wald 信頼限界 95% プロファイル尤度による信頼限界

Cell adeno vs large 2.115 1.164 3.843 1.162 3.855

Cell adeno vs small

1.359 0.798 2.312 0.791 2.301

Cell adeno vs squamous

3.192 1.773 5.746 1.770 5.768

Cell large vs small 0.642 0.385 1.073 0.380 1.065

Cell large vs squamous

1.509 0.866 2.628 0.863 2.634

Cell small vs squamous

2.349 1.387 3.980 1.399 4.030

105

CL=WALD CL＝ PL

hazardratio ‘H2’ Cell /cl=both diff=ref; Cell(ref=‘ ’)により基準群を指定

H2: ハザード比 Cell

説明点推定値

95% Wald 信頼限界 95% プロファイル尤度による信頼限界

Cell adeno vs squamous 3.192 1.773 5.746 1.770 5.768

Cell large vs squamous 1.509 0.866 2.628 0.863 2.634

Cell small vs squamous 2.349 1.387 3.980 1.399 4.030

adeno small

107

Cell(ref=‘squamous’)

hazardratio ‘H3’Therapy/diff=ref cl=both;

Prior＊Therapyを指定した場合， Pｒｉｏｒ（yes or no)ごとのＨＲを出力

H3: ハザード比 Therapy

説明点推定値

95% Wald 信頼限界

95% プロファイル尤度による信頼限界

Therapy standard vs test At Prior=no

0.633 0.400 1.002 0.399 1.002

Therapy standard vs test At Prior=yes

1.268 0.638 2.522 0.641 2.565

推定（ESTIMATE文）

ラベル推定値標準誤差 z 値 Pr > |z| 指数

E3 no -0.4567 0.2342 -1.95 0.0512 0.6334

E3 yes 0.2377 0.3508 0.68 0.4980 1.2684

108

共変量(Kps Prior Therapy) を調整した多重比較

proc phreg data=VALung ;

class Prior Cell(ref='adeno')

Therapy/param=glm ;

model Time*Status(0) =

Kps Prior Therapy Cell;

lsmeans Cell/

diff=all adj=tukey cl exp;run;

109

共変量を調整した多重比較信頼区間 Cell の最小 2 乗平均の差多重比較の調整 : Tukey-Kramer

cell type

cell type 指数 Exponentiated Lower

Exponentiated Upper

調整済下限 Exp

調整済上限 Exp

adeno large 2.1712 1.1985 3.9335 0.9964 4.7313

adeno small 1.4045 0.8266 2.3866 0.7010 2.8140

adeno squamous 3.2137 1.7868 5.7803 1.4888 6.9370

large small 0.6469 0.3857 1.0851 0.3284 1.2743

large squamous 1.4801 0.8513 2.5736 0.7168 3.0562

small squamous 2.2881 1.3490 3.8809 1.1448 4.5733 111

LSMEANSによる共変量を調整した多重比較

adeno-squamous

small-squamous

112 対角線を含んでいれば有意差なし

βの調整

推定値

βの調整

推定値

adeno-large

共変量(点推定値が変化)と多重性(区間幅が増加)の同時調整

113

cell type cell type 調整無ハザード比

調整無ハザード比下限

調整無ハザード比下限

調整ハザード比

調整ハザード比下限

調整ハザード比下限

adeno large 2.4873 1.4146 4.3733 2.1712 0.9964 4.7313

adeno small 1.1560 0.7092 1.8842 1.4045 0.701 2.814

adeno squamous 3.1311 1.7637 5.5586 3.2137 1.4888 6.937

large small 0.4648 0.2832 0.7626 0.6469 0.3284 1.2743

large squamous 1.2588 0.7310 2.1678 0.7168 3.0562

small squamous 2.7086 1.6479 4.4521 2.2881 1.1448 4.5733

無調整 2.4873 (1.4146-4.3733)

調整 2.1712 (0.9964-4.7313) adeno-large

114

PHREG BASELINE文による生存時間曲線

共変量調整無共変量調整有

squamous HR=1.0000

large 1.2588 small 2.7086

adeno 3.1311

squamous HR=1.0000

large 1.4801

small 2.2881 adeno 3.2137

adeno-large

p=0.0084

adeno-large

p= 0.0516

Cell*Therapyの交互作用の解析



model Time*Status(0) =

Kps Prior Cell Therapy

Cell*Therapy;

hazardratio 'Therapy' Therapy;

lsmeans Cell*Therapy/adj=tukey exp;

115

交互作用の検定結果

Type 3 検定

効果自由度 Wald カイ 2 乗

Pr > ChiSq

Kps 1 34.1819 <.0001

Prior 1 0.0973 0.7551

Cell 3 20.3860 0.0001

Therapy 1 0.9487 0.3300

Cell*Therapy 3 6.6284 0.0847

Cell*Therapyの交互作用はp<0.10 adenoとsquamousはpositive,largeとsmallはnegative

116

Cell型ごとのTherapyの効果 hazardratio 'Therapy' Therapy; Therapy: ハザード比 Therapy

説明点推定値 95% Wald 信頼限界

Therapy standard vs test At Cell=adeno

1.243 0.540 2.859

Therapy standard vs test At Cell=large

0.605 0.276 1.324

Therapy standard vs test At Cell=small

0.448 0.236 0.852

Therapy standard vs test At Cell=squamous

1.397 0.644 3.028

Cell=smallでTherapyの効果は有意サブグループ解析の多重性の考慮

117

cell type =adeno

large

small squamous

test

standard

118

生存時間KM曲線

HR=1.243 p=0.6092

HR=0.605 p=0.2085

HR=0.448

p=0.0144

HR=1.397 p=0.3975

lsmeans Cell*Therapy/adj=tukey exp; 8(4×2)水準間(8Ｃ2=28通り)の比較 Cell*Therapy の最小 2 乗平均の差多重比較の調整 : Tukey-Kramer

cell type type of treatment

cell type type of treatment

Pr > |z| 調整済 P 指数

large standard large test 0.2085 0.9142 0.6046

large standard small standard 0.2586 0.9504 0.6798

large standard small test 0.0024 0.0497 0.3049

large standard squamous standard 0.9060 1.0000 0.9545

large standard squamous test 0.4473 0.9950 1.3331

large test small standard 0.7449 1.0000 1.1245

large test small test 0.0850 0.6727 0.5043

large test squamous standard 0.2643 0.9535 1.5788

large test squamous test 0.0487 0.5017 2.2050

small standard small test 0.0144 0.2186 0.4485

： 120 ８群比較の多重性を考慮すると，standard vs test ａt Cell=smallは有意差なし

LSMEANSによる多重比較不必要な比較を含むため過度に保守的

121

p=0.0144

多重性p=0.2186 0.448(0.236-0.852)

サブグループ解析の多重性の調整 Bonferroni adj=bonferroni



model Time*Status(0) = Kps Prior Cell

Therapy Cell*Therapy;


" 1adeno 1standard vs 2test" 1 -1 0 0 0 0 0 0,

" 2large 1standard vs 2test" 0 0 1 -1 0 0 0 0,

" 3small 1standard vs 2test" 0 0 0 0 1 -1 0 0,

" 4squam 1standard vs 2test" 0 0 0 0 0 0 1 -1

/adj=bonferroni;run; 122

μ11 μ12

μ21 μ22

μ31 μ32

μ41 μ42

サブグループ解析の多重性の調整 Bonferroni p値を4倍

Least Squares Means Estimates Adjustment for Multiplicity: Bonferroni

ラベル推定値標準誤差 z 値 Pr > |z| 調整済 P

1adeno 1standard vs 2test

0.2173 0.4250 0.51 0.6092 1.0000

2large 1standard vs 2test

-0.5032 0.4001 -1.26 0.2085 0.8339 0.2085×4

3small 1standard vs 2test

-0.8019 0.3277 -2.45 0.0144 0.0576 0.0144×4

4squam 1standard vs 2test

0.3341 0.3948 0.85 0.3975 1.0000

123 　　),1min(: pmadjpBonferroni

サブグループ解析の多重性の調整 Holm(逐次Bonferrroni)










/adj=bonferroni stepdown;run; 124

サブグループ解析の多重性の調整 Holm(逐次Bonferrroni) Least Squares Means Estimates Adjustment for Multiplicity: Holm

ラベル Pr > |z| 調整済 P

1adeno 1standard vs 2test 0.6092 0.7949

2large 1standard vs 2test 0.2085 0.6254 0.2085×3

3small 1standard vs 2test 0.0144 0.0576 0.0144×4

4squam 1standard vs 2test 0.3975 0.7949 0.3975×2 125

サブグループ解析の多重性の調整 adj=simulate










/adj=simulate(report) seed=4989 ;run; 126

サブグループ解析の多重性の調整 adj=simulate


手法 95% 分位点

推定アルファ

99% 信頼限界

Simulated 2.485167 0.0500 0.0450 0.0550

Bonferroni 2.497705 0.0482 0.0433 0.0532

Sidak 2.490915 0.0489 0.0440 0.0539

Scheffe 3.080216 0.0082 0.0061 0.0102

Z 1.959964 0.1810 0.1722 0.1899

127

独立に近いのでSimulated法とBonferroni

の棄却限界値が近くなっている

主効果とサブグループ解析の多重性の調整 proc phreg data=VALung;


model Time*Status(0) = Kps Prior Cell Therapy

Cell*Therapy;estimate

" 0main 1standard vs 2test" Therapy 1 -1,

Cell*Therapy .25 -.25 .25 -.25 .25 -.25 .25 -.25,

" 1adeno 1standard vs 2test" Therapy 1 -1

Cell*Therapy 1 -1 0 0 0 0 0 0,

" 2large 1standard vs 2test" Therapy 1 -1

Cell*Therapy 0 0 1 -1 0 0 0 0,

" 3small 1standard vs 2test" Therapy 1 -1

Cell*Therapy 0 0 0 0 1 -1 0 0,

" 4squam 1standard vs 2test" Therapy 1 -1

Cell*Therapy 0 0 0 0 0 0 1 -1

/adj=simulate(report); seed=4989 run;

129

μ11 μ12

μ21 μ22

μ31 μ32

μ41 μ42

μ･1 μ･2

スライド54参照

主効果とサブグループ解析の多重性の調整


手法 95% 分位点

推定アルファ

99% 信頼限界

Simulated 2.546559 0.0500 0.0450 0.0550

Bonferroni 2.575829 0.0475 0.0426 0.0524

Sidak 2.568763 0.0479 0.0430 0.0528

Scheffe 3.080216 0.0103 0.0080 0.0126

Z 1.959964 0.1990 0.1899 0.2082

130 主効果はサブグループを含んでいるので相関あり

主効果とサブグループ解析の多重性の調整

推定多重度の調整 : Simulated

ラベル推定値標準誤差

z 値 Pr > |z| 調整済 P

0main 1standard vs 2test

-0.1884 0.1935 -0.97 0.3300 0.8099

1adeno 1standard vs 2test

0.2173 0.4250 0.51 0.6092 0.9775

2large 1standard vs 2test

-0.5032 0.4001 -1.26 0.2085 0.6237

3small 1standard vs 2test

-0.8019 0.3277 -2.45 0.0144 0.0649

4squam 1standard vs 2test

0.3341 0.3948 0.85 0.3975 0.8757 131

主効果

132

可視化 kernel


変量効果

RANDOM文



LSMEANS文

HAZARDRATIO文




内容

RANDOM文による変量効果モデル BLINDデータ(PHREGのマニュアルより）

197人 394眼データ

個体識別番号：ID

エンドポイント：TIME (失明までの時間)

打ち切り変数： STATUS

（0:打ち切り 1:イベント)

処置変数：TREAT(1:Laser 0:Others)

片眼にLaser 他眼にOthers

発症時期：TYPE

0:幼少（20歳未満）1：成人（20歳以上）

133

イベントと打切りの集計

打ち切りと非打ち切り値の数の要約

層 Treat Type 全体死亡打ち切りパーセント打ち切り

1 0(他） 0（幼） 114 51 63 55.26

2 0(他） 1（成） 83 50 33 39.76

3 1（L) 0（幼） 114 36 78 68.42

4 1（L) 1（成） 83 18 65 78.31

Total 394 155 239 60.66

1:Laser ０:Others

134

カプランマイヤー曲線

成人レーザーなし

成人レーザーあり

幼少レーザーあり

幼少レーザーなし

135

HR=3.562

HR=1.529

両眼を独立だとして解析

proc phreg data=Blind ;

class id type treat;

model Time*Status(0)=

Treat Type Treat*Type;

hazardratio Treat;

id ID;run;

N= 394 197人×２眼

136

両眼を独立だとして解析

最尤推定値の分析

パラメータ自由度パラメータ推定値


Treat 1 1.27033 0.27531 21.2909 <.0001

Type 1 0.50482 0.28878 3.0557 0.0805

Type*Treat 1 -0.84566 0.35088 5.8084 0.0159*

ハザード比 Treat


Treat 0 vs 1 At Type=0 1.529 0.998 2.343

Treat 0 vs 1 At Type=1 3.562 2.077 6.110

量的交互作成人で強い治療効果 137

成人で強いレーザー治療の効果

成人

幼少

両眼の解析

・左右眼の相関

ある個人の左右眼は遺伝的，環境的要因が類似しているので独立ではない（正の相関）

独立だとして解析すると情報量(N)を過大評価

・ロバスト分散（サンドイッチ型分散）

左右眼の相関を考慮した分散

相関を考慮することで分散が大きくなる．

（相関が０のときは通常のWald検定に一致）

・frailty（脆弱さ）モデル

個体差を変量効果としてモデル化

138

左右眼の失明までの時間の相関

139

-20 0 20 40 60 80

COL2

0

20

40

60

80

C

O

L

1

右眼

左眼

r=0.463

正の相関

打ち切り

除くと

r=0.264

frailty（脆弱さ）モデル個体差による変動によって，弱い個体が生じ，

早期に死亡が起きることを想定したモデル

生存時間の変量効果モデル．

（比例ハザードfrailtyモデル）

ｕｉ：個人iのfrailty (0~∞）

先天的な弱さlogｕｉの分布

iii uthth zβTexp)()( 0

),0( 2N

140

強い弱い

サンドイッチ分散による解析

proc phreg data=Blind

covs(aggregate) namelen=22;




hazardratio Treat;

id ID;run;

141

個体単位で

分散を評価する

ことを指定

サンドイッチ分散による解析




標準誤差

標準誤差比

カイ 2 乗

Pr > ChiSq

Treat 1 1.27033 0.24151 0.877 27.6672 <.0001

Type 1 0.50482 0.28961 1.003 3.0383 0.0813

Type*Treat 1 -0.84566 0.30353 0.865 7.7622 0.0053**

ハザード比 Treat

説明点推定値 95% Wald ロバスト信頼限界

Treat 0 vs 1 At Type=0 1.529 1.064 2.197

Treat 0 vs 1 At Type=1 3.562 2.219 5.718

142

frailtyモデルによる解析

proc phreg data=Blind;




random ID;

hazardratio Treat;

run;

143

個体IDを変量効果

としてRANDOM文

で指定

frailtyモデルによる解析





Treat 1 1.46388 0.28320 26.7193 <.0001

Type 1 0.56749 0.32248 3.0969 0.0784

Type*Treat 1 -0.96538 0.36142 7.1347 0.0076**

Frailty Model Analysis: ハザード比 Treat


Treat 0 vs 1 At Type=0 1.646 1.059 2.560

Treat 0 vs 1 At Type=1 4.323 2.481 7.530

共分散パラメータの推定

共分散パラメータ REML 推定標準誤差

ID 0.8308 0.2145

144

%91

911.0 22

ハザードの変動係数

考察

独立として解析するより，サンドイッチ分散，frailtyモデルによる解析の方が交互作用の有意性が強い．(一般には，独立とした解析の方が革新的．)

同一個体内で異なった処置を両眼に割り付けているので，個体間差を除いて，処置効果を評価できる．個体単位のtypeについてはで結果はほとんど変わら

ない．

145

p値独立サンドイッチ frailty

Treat <.0001** <.0001** <.0001**

Type 0.0805 0.0813 0.0784

Type*Treat 0.0159* 0.0053** 0.0076**

146

可視化 kernel


変量効果

RANDOM文



LSMEANS文

HAZARDRATIO文




内容

ASSESS文による

比例ハザードモデルの検証

1)比例ハザード性(HRが時間に対して一定)

累積Schoenfeld残差プロット

2)対数ハザードに対して，線形モデルは適切か

２次以上の項，カテゴリカルデータ化

累積マルチンゲール残差プロット

3322110

22110

0

expexpexp)(

exp)(

exp)()(

zzzth

zzth

thth

zβT

2013/7/18 147

Cox-Snell残差(累積ハザード）：rcs

の値をとる．～

布にしたがう．とき期待値１の指数分

モデルが正しいの累積ハザード関数．の時点個体

)0()1(0

i

)exp()()(

)()(log

0

0

SS

t

tHtH

duuhtSr

i

i

T

iii

t

iiics

i

zβ

個体ｉの死亡時点ｔｉまでの累積ハザード，ｔｉが長く，リスクの高い個体ほど値が大きくなる．打ち切りの場合でも定義できるが，最大の生存時間については累積ハザード関数が定義できないので計算できない．

2013/7/18 148

マルチンゲール残差：rMart

観測死亡数と累積ハザードとの差

csMartiics rrtSr

)(log

打切りがない場合：E[rcs ]=1 δ：イベントを起こせば1，打ち切りであれば0 rMart ： -∞(S=0)～1(S=1) E[rMart ]=0，rMartの累積和は0

個体iのｔｉまでの観測死亡数と期待累積ハザードとの差，マルチンゲール残差は正であれば，モデルより死亡が起きやすく（累積ハザードが低いに死亡），負であれば起きにくい．打ち切りを受けた個体は，常に負の値

2013/7/18 149

Schoenfeld残差 Schoenfeld残差：共変量ごとに定義個体ｉの共変量と，リスク集合の共変量の平均の差 Schoenfeld残差のベクトルは個体が打ち切りを受けた場合には定義されず，また全個体について残差の和を計算すると０になる．

比例ハザード性の下でSchoenfeld残差はランダムウォークする．説明変数と同じ単位を持つ．

1kt:)(

)exp()(

)exp()()(

log

がリスク集合に含めばで個体時点tY

tY

tZtYZ

ZZd

LdU

k

k

kk

i

iii

i

(t)Zβ

(t)Zβ

k

k

2013/7/18 150

累積マルチンゲール残差プロット関数形の検証

横軸：共変量縦軸：マルチンゲール残差の累積和マルチンゲール残差の平均は0なので累積和は0から始まり0に収束する．累積するので独立で

はなく，また下にスソを引いた分布なので評価は難しいが，モデルより死亡が起きやすい場合は累積和は上昇，死亡が起きにくい場合は累積和は下降する．

比例ハザードモデルの下のシミュレーションでKolmogorov-Smirnov 型の統計量(最大絶対値）のp値を計算，20パターンを図示．

2013/7/18 151

累積Schoenfeld残差プロット比例ハザード性の検証

横軸：時間縦軸：Schoenfeld残差の累積和 Schoenfeld残差の平均は0なので，累積和は0から始まり0に収束する．累積するので独立ではな

く，評価は難しいが，比例ハザード性の仮定の下でSchoenfeld残差はランダムウォークする．

累積和が上昇する場合，共変量の値が大きいとモデルより死亡が起きやすい．比例ハザードモデルの下のシミュレーションでKolmogorov-Smirnov 型の統計量(最大絶対値）のp値を計算，20パターンを図示．

2013/7/18 152

比例ハザードモデルとモデルの関数形の誤特定

exp)(:

)(:

)(exp)()(4

exp)()(3

)log(exp)()(2

exp)()(1

01

01

10

2

12110

110

110

thcz

thcz

czIthth

zzthth

zthth

zthth

閾値：

高次：

：低次

：線形

2013/7/18 153

2013/7/18 154

)log(exp)()(

exp)()(

110

110

zthth

zthth

真　　　

モデル

11z

)log( 11 z

関数形ｚとlog（Z）残差プロット

2013/7/18 155

モデルより死亡が起きにくい

モデルより死亡が起きやすい

累積マルチンゲール残差プロット

2013/7/18 156

上昇：モデルより死亡が起きやすい

下降：モデルより死亡が起きにくい

モデルの誤特定と残差

2013/7/18 157

型

モデルより低次

モデル　

真

sin-

exp)(

)log(exp)(

110

110

zth

zth


2013/7/18 158

型

モデルより高次

モデル　

真

sin

exp)(

exp)(

110

2

12110

zth

zzth


2013/7/18 159

字型

が存在閾値

モデル　

真

m

)5(

exp)(

)(exp)(

110

10

zth

czIth

比例ハザードモデル HR=0.5



ログランク 158.4857 1 <.0001

Wilcoxon 127.2079 1 <.0001

-2Log(LR) 163.9882 1 <.0001

2013/7/18 160



ログランク 158.4857 1 <.0001

Wilcoxon 127.2079 1 <.0001

HR=0.544

KM曲線

2重対数プロット

2013/7/18 161

比例ハザードモデルのあてはめ

2013/7/18 162

HR=0.544


2013/7/18 163

例ハザード前提条件のもとでの上限値の検定

変数最大絶対値反復シード Pr > MaxAbsVal

g 0.9026 1000 4989 0.3830

細線：比例ハザードモデルの下でシミュレーションの20パターン

最大絶対値

比例ハザードモデルと残差

2013/7/18 164

区分指数モデル <5：HR=1 >5：HR=0.5 N=1000

後半でのみ差がある層に対しての同等性の検定


ログランク 10.4492 1 0.0012

Wilcoxon 0.1770 1 0.6740

2013/7/18 165

<5 HR=1.059

>5 HR=0.509

2重対数プロット log(5)=1.609

2013/7/18 166

log(5)

比例ハザードモデルのあてはめ

2013/7/18 167

HR=0.858


比例ハザード前提条件のもとでの上限値の検定

変数最大絶対値反復シード Pr > MaxAbsVal

g 3.1984 1000 4989 <.0001

上昇群２(赤)でモデルより死亡が起きやすい下降群２ (赤)でモデル

より死亡が起きにくい

2013/7/18 168

最大絶対値:3.1984

区分指数モデル <5：HR=0.5 >5：HR=1と残差

2013/7/18 169

区分指数モデル <5：HR=1 >5：HR=0.5と残差

2013/7/18 170

累積Schoenfeld残差プロットの見方

0)0からスタートして0に収束

1)上昇：群２でモデルより死亡が起きやすい．

2)下降：群２でモデルより死亡が起きにくい．

3)ランダムウォーク：モデルが適合

4)視覚的な評価：シミュレーションの20パターンの中に累積Schoenfeld残差プロットが埋もれていればモデルが適合

5)検定：最大絶対値の分布を1000回のシミュレーションで計算．有意であれば，モデルが不適合 2013/7/18 171

累積マルチンゲール残差プロットの見方

0)0からスタートして0に収束

1)上昇：モデルより死亡が起きやすい．

2)下降：モデルより死亡が起きにくい．

3)ランダムウォーク：モデルが適合

4)視覚的な評価：シミュレーションの20パターンの中に累

積マルチンゲール残差プロットが埋もれていればモデルが適合

5)検定：最大絶対値の分布を1000回のシミュレーションで計算．有意であれば，モデルが不適合

6)-sin型：次数を下げる sin型：次数を上げる

m型：閾値が存在 2013/7/18 172

膵癌データの解析

モデルの妥当性評価 ASSESS文

proc phreg data=pcancer;

model time*censor(1)=stage treat age;

assess var=(age) ph /seed=4989 resample;

output out=out survival=s resmart=r ressch=rsstage rstreat rsage;run;

2013/7/18 173

大橋・浜田(1995) 生存時間解析 N=83

STAGE ステージ：3(53.0%) 4(47.0%)

TREAT 術中照射なし:0(26.5%)，あり1(73.5%)

AGE 研究登録時の年齢

Cox回帰の結果


パラメータ

自由度パラメータ推定値

標準誤差

カイ 2 乗

Pr > ChiSq

ハザード比

STAGE 1 0.22104 0.11465 3.7172 0.0539 1.247

TREAT 1 -0.34166 0.13480 6.4239 0.0113 0.711

AGE 1 0.01308 0.01250 1.0954 0.2953 1.013

AGEは有意でない

2013/7/18 174

ステージ別の生存時間曲線

HR:3.151 1.425 1.909 0.770

0-2でステージ4の

リスク大

2013/7/18 175 時点全体のHR:1.247

比例ハザード性の検討ステージ

0-2で上昇

ステージ4で

モデルより死亡が起きやすい

2013/7/18 176

最大絶対値:0.9428

処置別の生存時間曲線

HR:0.365 1.053 0.387 0.401

2-4で処置群の効果がない

2013/7/18 177 時点全体のHR:0.711

比例ハザード性の検討処置

2-4で上昇処置群でモデルより死亡が起きやすい 2013/7/18 178

線形性の仮定の評価

上昇モデルより死亡が起きやすい

下降モデルより死亡が起きにくい

2013/7/18 180 最大絶対値:9.1796

年齢のｶﾃｺﾞﾘｰ変数によるモデル化 data pcancer;set pcancer;

select;

when( age <50) do;cat=1;a1=0;a2=0;a3=0;end;

when(50<=age <60) do;cat=2;a1=1;a2=0;a3=0;end;

when(60<=age <70) do;cat=3;a1=0;a2=1;a3=0;end;

when(70<=age ) do;cat=4;a1=0;a2=0;a3=1;end;

otherwise;end;

proc phreg;class cat/param=ref ref=first;

model time*censor(1)=stage treat cat;run;

2013/7/18 181

年齢のｶﾃｺﾞﾘｰ変数によるモデル化


パラメータ

自由度パラメータ推定値

標準誤差

カイ 2 乗 Pr > ChiSq

ハザード比

STAGE 1 0.20517 0.11564 3.1478 0.0760 1.228

TREAT 1 -0.33751 0.13889 5.9056 0.0151 0.714

a1 50-59 1 -0.56219 0.37011 2.3073 0.1288 0.570

a2 60-69 1 -0.34124 0.35567 0.9205 0.3373 0.711

a3 70- 1 0.34543 0.39596 0.7610 0.3830 1.413

線形仮説検定の結果

ラベル Wald カイ 2 乗

自由度 Pr > ChiSq

age 8.3049 3 0.0401

2013/7/18 182

-50:1.000 50-59:0.570 60-69:0.711 70-:1.413

183

可視化 kernel


変量効果

RANDOM文



LSMEANS文

HAZARDRATIO文




まとめ

ご清聴どうもありがとうございました．

PHREGは

LSMESTIMATE文に限る

184

http://www.google.co.jp/url?sa=i&rct=j&q=&esrc=s&frm=1&source=images&cd=&cad=rja&docid=-QhzeYHNCycBmM&tbnid=DCPt0CXzKETtRM:&ved=0CAUQjRw&url=http://pixta.jp/illust/4901172&ei=NXqIUb-vJcGfkAWWj4HADw&bvm=bv.45960087,d.dGI&psig=AFQjCNGsdAsmF8j4P6SMXQd1EIXG2CFZ1A&ust=1367985065125962

薬剤疫学会第19回学術総会薬剤疫学における生物統計の役割

－科学的な医薬品リスク管理計画（RMP）実践を目指して－期日：2013年11月16(土)，17(日) 会場：東京大学伊藤国際学術研究センター事務局：東京理科大学浜田研究室

185

薬剤疫学会第19回学術総会

１会期：平成25年11月16日（土）～17日（日）２会場：東京大学伊藤国際学術研究センター〒113-0033 東京都文京区本郷7-3-1 ３会長：浜田知久馬（東京理科大学工学部経営工学科教授）４参加費： [事前登録] 会員6,000円非会員8,000円学生3,000円 [当日参加] 会員8,000円非会員10,000円学生4,000円５懇親会費： 5,000円６連絡先：東京理科大学工学部経営工学科浜田研究室担当：栗原順子、松下泰之〒162-8601東京都新宿区神楽坂1-3 E-mail：jspe2013＠ms.kagu.tus.ac.jp http://www.rs.kagu.tus.ac.jp/hamada/jspe2013/

プログラム概要（予定）

会長講演「薬剤疫学研究のトレンドの分析」演者：第19回学術総会会長浜田知久馬特別講演「薬効評価における統計学」演者：大橋靖雄シンポジウム１科学的な医薬品リスク管理計画（RMP）実践を目指してシンポジウム2 PMDAの自発報告データベースの新たな活用と今後の課題教育講演安全性メタアナリシス～その解釈と留意点～演者：浜田知久馬日本臨床試験研究会との共同企画活性化する日本の医療データベース研究－更なる発展に向けて－

sas生存時間解析プロシジャの 最新の機能拡張 ·...

Documents

sas生存時間解析プロシジャの最新の機能拡張 ·...