auswertung multivariate analyse: einführung in das cox-modell · alle mit ** gekennzeichneten...
TRANSCRIPT
Auswertung
• Deskriptive Statistik • Häufigkeiten, • Univariate Statistiken, • Explorative Datenanalyse, • Kreuztabellen)• Induktive Statistik, • Vergleich von Mittelwerten • Errechnen von Mittelwerten • t-Tests• Varianzanalyse, • Korrelationseffizienten,• Lineare Regression, Entscheidungsbäume (decision trees)• Nichtparametrische Tests Log-lineare Modelle• Chi-Quadrat-Test, Clusteranalyse• Binomialtest, Gepoolte Zeitreihenanalyse• Sequenzanalyse, Logistische Regression• Stichprobentests, Skalenanalyse• Analyse von Mehrfachantworten Conjoint-Analyse• Multivariate Verfahren Faktorenanalyse, • Multidimensionale Skalierung Kundenzufriedenheit• Zeitreihenanalyse Diskriminanzanalyse
Strukturgleichungsmodell
Multivariate Analyse: Einführung in das COX-Modell
philender.com/.../multivariate/mathcartoon.gif
Der auslösende Dialog
Mir scheint, unsereErgebnisse sindbesser geworden (?)
Klar, seit ichhier Chef bin!
Rechnen Sie‘s nach!
Der Rat des Statistikers IFormulieren Sie eine Hypothese, die sich prüfen läß t
Das beobachtete Überleben der R0-reseziertenPatienten mit Franken-Tumor hat sich
seit dem 1.1.2000 signifikant verbessert.
Das Ergebnis des Nachdenkens:Hypothese:
Bitte kurz einmal rechnen
Der Rat des Statistikers II
Sammeln Sie die notwendigen Daten• Eine homogene Gruppe• Vollzählig (alle fraglichen Patienten)• Vollständig (alle Merkmale)
Das Ergebnis der DokumentationNummer R-Klass Geb-Datum Geschlecht Op-Datum Merkmal Status Todesdatum52-0215 R0 04.03.1930 männlich 15.03.1995 >2000 tot 26.11.199752-0243 R0 18.01.1939 männlich 17.02.1995 >2000 tot 04.05.199552-0316 R0 02.04.1935 männlich 19.06.1995 >2000 tot 02.04.199952-0360 R0 24.05.1930 männlich 22.09.1993 bis 2000 lebt52-0381 R0 15.11.1944 männlich 11.01.1995 bis 2000 tot 11.09.199852-0384 R0 31.03.1943 männlich 07.09.1995 >2000 lebt52-0411 R0 31.07.1926 weiblich 14.10.1994 bis 2000 tot 26.07.199652-0419 R0 13.05.1918 weiblich 05.12.1995 bis 2000 lebt52-0426 R0 19.05.1926 männlich 05.04.1995 bis 2000 tot 05.11.200552-0440 R0 03.09.1930 männlich 04.11.1996 >2000 tot 29.12.199952-0449 R0 08.08.1932 weiblich 22.06.1994 bis 2000 tot 14.02.199752-0492 R0 02.06.1919 männlich 29.01.1996 bis 2000 tot 15.04.200052-0493 R0 10.07.1923 männlich 26.06.1995 bis 2000 tot 13.03.199852-0497 R0 29.11.1947 männlich 12.09.1995 >2000 lebt52-0510 R0 10.09.1928 weiblich 14.02.1995 bis 2000 tot 16.05.199652-0622 R0 01.03.1939 weiblich 31.07.2002 >2000 lebt52-0645 R0 06.12.1934 männlich 16.08.1999 >2000 lebt
Bitte kurz einmal rechnen
Insgesamt 382 Patienten mit R0-reseziertem Franken- Tumor von 1995 - 2008
Der Rat des Statistikers IIISammeln Sie die notwendigen Daten
• Leben die Patienten wirklich, von denen Sie kein Todesdatum haben?
• Sammeln Sie Informationen beim Hausarzt, • Beim Patienten• Beim Einwohnermeldeamt
Das Ergebnis der Dokumentation
Nummer R-Klass Geb-Datum Geschlecht Op-Datum Merkmal Status Todesdatum Letzter Kontakt52-0215 R0 04.03.1930 männlich 15.03.1995 >2000 tot 26.11.1997 26.11.199752-0243 R0 18.01.1939 männlich 17.02.1995 >2000 tot 04.05.1995 04.05.199552-0316 R0 02.04.1935 männlich 19.06.1995 >2000 tot 02.04.1999 02.04.199952-0360 R0 24.05.1930 männlich 22.09.1993 bis 2000 lebt 15.06.200952-0381 R0 15.11.1944 männlich 11.01.1995 bis 2000 tot 11.09.1998 11.09.199852-0384 R0 31.03.1943 männlich 07.09.1995 >2000 lebt 15.06.200952-0411 R0 31.07.1926 weiblich 14.10.1994 bis 2000 tot 26.07.1996 26.07.199652-0419 R0 13.05.1918 weiblich 05.12.1995 bis 2000 lebt 10.12.200952-0426 R0 19.05.1926 männlich 05.04.1995 bis 2000 tot 05.11.2005 05.11.200552-0440 R0 03.09.1930 männlich 04.11.1996 >2000 tot 29.12.1999 29.12.199952-0449 R0 08.08.1932 weiblich 22.06.1994 bis 2000 tot 14.02.1997 14.02.199752-0492 R0 02.06.1919 männlich 29.01.1996 bis 2000 tot 15.04.2000 15.04.200052-0493 R0 10.07.1923 männlich 26.06.1995 bis 2000 tot 13.03.1998 13.03.199852-0497 R0 29.11.1947 männlich 12.09.1995 >2000 lebt 15.06.200952-0510 R0 10.09.1928 weiblich 14.02.1995 bis 2000 tot 16.05.1996 16.05.199652-0622 R0 01.03.1939 weiblich 31.07.2002 >2000 lebt 22.03.201052-0645 R0 06.12.1934 männlich 16.08.1999 >2000 lebt 28.04.2010
Bitte kurz einmal rechnen
Log Rank (Mantel-Cox)
Chi-Quadrat
Freiheitsgrade Sig.
OP_Jahr 5,737 1 0,017 **
Das 1. ErgebnisDanke!!
Unser Chef ist der größte!!!
Die Tat des Statistikers I
OP_Jahr Gesamtzahl
bis 2000 246
≥ 2000 136
Gesamt 382
Warten wir‘s ab
Der Rat des Statistikers IV
Prüfen Sie, von welchen Faktoren bereits bekannt is t,dass Sie das Zielereignis „Tod des Patienten“ beein flussen.
Machen Sie eine Literatursuche und dokumentieren Sie mögliche konkurrierende Merkmale.
Sammeln Sie die notwendigen Daten
Wert0101
01
0101
01
01
0101
Das Ergebnis der Literatursuche
„ Bekannte“ Faktoren
Seite
Anzahl
N_Kat
M_Kat
Durchmesser
Zweit_Tumor
Alter
Abstand
CEA
Ausprägungenunten jeweils das höhere Risikorechtslinks1 oder 2> 2
N0N1M0M1bis 5 cm> 5 cm
neinja
bis 60 Jahre60 Jahre u. älter
> 5mm≤ 5mm
bis 2930 und höher
Empfohlene Codierung
Das Ergebnis der Dokumentation
Nummer …. SeiteAnzahl der Tumoren
N-Kategorie
M-Kategorie
Tumor-größe
Zweit-tumor Alter
Sicherheits-Abstand
CEA präoperativ
52-0215 …. rechts >2 N0 M0 > 5 cm nein 60 Jahre u. älter > 5mm bis 2952-0243 …. <3 N0 M0 > 5 cm ja bis 60 Jahre bis 2952-0316 …. rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter > 5mm52-0360 …. <3 N0 M0 nein 60 Jahre u. älter > 5mm bis 2952-0381 …. rechts <3 N0 M0 bis 5 cm bis 60 Jahre <= 5mm52-0384 …. rechts M0 bis 5 cm nein bis 60 Jahre52-0411 …. rechts <3 N0 M0 bis 5 cm ja 60 Jahre u. älter > 5mm 30 und höher52-0419 …. Links <3 N0 M0 > 5 cm nein 60 Jahre u. älter > 5mm52-0426 …. rechts <3 N0 M0 > 5 cm nein 60 Jahre u. älter > 5mm52-0440 …. rechts <3 N0 M0 nein 60 Jahre u. älter > 5mm 30 und höher52-0449 …. rechts M0 bis 5 cm nein 60 Jahre u. älter bis 2952-0492 …. rechts <3 N0 M0 bis 5 cm 60 Jahre u. älter > 5mm 30 und höher52-0493 …. <3 N0 M0 > 5 cm nein 60 Jahre u. älter <= 5mm 30 und höher52-0497 …. rechts <3 N1 M0 bis 5 cm nein bis 60 Jahre > 5mm52-0510 …. rechts <3 N0 bis 5 cm nein 60 Jahre u. älter <= 5mm bis 2952-0622 …. rechts N0 M0 nein 60 Jahre u. älter > 5mm bis 2952-0645 …. rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter 30 und höher
Bitte kurz einmal rechnen
Der Rat des Statistikers VKomplettieren Sie ihre Datensammlung!
Nur Fälle, bei denen a l l e Merkmale vorhand en sind,sind später für die multivariate Analyse verwendbar .
Im gezeigten Ausschnitt wären 2/17 = 12% der Fälle brauchbarbei allen anderen fehlt mindestens ein Merkmal.
Kennzeichnen Sie missings eindeutig, z.B. mit „9“ o der „99..9“.
Nummer …. SeiteAnzahl der Tumoren
N-Kategorie
M-Kategorie
Tumor-größe
Zweit-tumor Alter
Sicherheits-Abstand
CEA präoperativ
52-0215 …. rechts >2 N0 M0 > 5 cm nein 60 Jahre u. älter > 5mm bis 2952-0243 …. <3 N0 M0 > 5 cm ja bis 60 Jahre bis 2952-0316 …. rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter > 5mm52-0360 …. <3 N0 M0 nein 60 Jahre u. älter > 5mm bis 2952-0381 …. rechts <3 N0 M0 bis 5 cm bis 60 Jahre <= 5mm52-0384 …. rechts M0 bis 5 cm nein bis 60 Jahre52-0411 …. rechts <3 N0 M0 bis 5 cm ja 60 Jahre u. älter > 5mm 30 und höher52-0419 …. Links <3 N0 M0 > 5 cm nein 60 Jahre u. älter > 5mm52-0426 …. rechts <3 N0 M0 > 5 cm nein 60 Jahre u. älter > 5mm52-0440 …. rechts <3 N0 M0 nein 60 Jahre u. älter > 5mm 30 und höher52-0449 …. rechts M0 bis 5 cm nein 60 Jahre u. älter bis 2952-0492 …. rechts <3 N0 M0 bis 5 cm 60 Jahre u. älter > 5mm 30 und höher52-0493 …. <3 N0 M0 > 5 cm nein 60 Jahre u. älter <= 5mm 30 und höher52-0497 …. rechts <3 N1 M0 bis 5 cm nein bis 60 Jahre > 5mm52-0510 …. rechts <3 N0 bis 5 cm nein 60 Jahre u. älter <= 5mm bis 2952-0622 …. rechts N0 M0 nein 60 Jahre u. älter > 5mm bis 2952-0645 …. rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter 30 und höher
Nummer …. SeiteAnzahl der Tumoren
N-Kategorie
M-Kategorie
Tumor-größe
Zweit-tumor Alter
Sicherheits-Abstand
CEA präoperativ
52-0215 rechts >2 N0 M0 > 5 cm nein 60 Jahre u. älter > 5mm bis 2952-0243 rechts <3 N0 M0 > 5 cm ja bis 60 Jahre > 5mm bis 2952-0316 rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter > 5mm bis 2952-0360 rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter > 5mm bis 2952-0381 rechts <3 N0 M0 bis 5 cm nein bis 60 Jahre <= 5mm unbekannt52-0384 rechts <3 N0 M0 bis 5 cm nein bis 60 Jahre > 5mm unbekannt52-0411 rechts <3 N0 M0 bis 5 cm ja 60 Jahre u. älter > 5mm 30 und höher52-0419 Links <3 N0 M0 > 5 cm nein 60 Jahre u. älter > 5mm bis 2952-0426 rechts <3 N0 M0 > 5 cm nein 60 Jahre u. älter > 5mm unbekannt52-0440 rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter > 5mm 30 und höher52-0449 rechts <3 N1 M0 bis 5 cm nein 60 Jahre u. älter > 5mm bis 2952-0492 rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter > 5mm 30 und höher52-0493 rechts <3 N0 M0 > 5 cm nein 60 Jahre u. älter <= 5mm 30 und höher52-0497 rechts <3 N1 M0 bis 5 cm nein bis 60 Jahre > 5mm bis 2952-0510 rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter <= 5mm bis 2952-0622 rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter > 5mm bis 2952-0645 rechts <3 N0 M0 bis 5 cm nein 60 Jahre u. älter > 5mm 30 und höher
Bitte kurz einmal rechnen
Das verbesserte Ergebnis der Dokumentation
Log Rank (Mantel-Cox) Chi-Quadrat Freiheitsgrade Sig.
Seite 3,184 1 0,074 *Anzahl 10,912 1 0,001 **
OP_Jahr 5,737 1 0,017 **N_Kat 7,745 1 0,005 **M_Kat 5,707 1 0,017 **Durchmesser 1,961 1 0,161
Zweit_Tumor 18,879 1 0,00001 **Alter 2,692 1 0,101
Abstand ,808 1 0,369
CEA 3,371 1 0,066 *
Die Tat des Statistikers IIb
Alle mit ** gekennzeichneten Merkmale üben univaria t einen statistischsignifikanten Einfluß auf die Überlebensraten aus, die mit * gekennzeichetenzeigen eine Trend.
Folglich brauchen wir eine multivariate Analyse, wi r nehmen das COX-Modell.
??????????
Zusammenfassung der Fallverarbeitung
GesamtzahlAnzahl der Ereignisse
Zensiert
N Prozent
382 214 168 0,4
Zunächst müssen wir die Anzahl der Ereignisse fests tellen, denn von der Anzahl der Ereignisse hängt die Anzahl der Faktoren ab, die wir berücksic htigen können. Am einfachsten ist es, wir rechnen eine Überlebenskurve für alle Patienten
Faustregel: 1 Faktor pro 20 Ereignisse, also für un s: 20 Todesfälle
Bitte weiterrechnen !
Die Tat des Statistikers III
Schritt 4: a) Art der Berechnung festlegenb) Konfidenzintervall anfordernc) Signifikanzniveaux festlegen
Bitte weiter
b) Konfidenzintervall anfordernc) Signifikanzniveau für Aufnahme
ins Modell festlegen
Bitte weiter
Schritt 4:
Auswertung der Fallverarbeitung
N Prozent
Für Analyse verfügbare Fälle
Ereignis 174 ,5
Zensiert 185 ,5
Insgesamt 359 ,9
Nicht verwendete Fälle
Fälle mit fehlenden Werten 23 ,1
Fälle mit negativer Zeit 0 ,0
Zensierte Fälle vor dem frühesten Ereignis in einer Schicht
0 ,0
Insgesamt 23 ,1
Insgesamt 382 1,0
Ergebnis 1: Fallzahl
Nur Fälle, bei denen a l l e Merkmale vorhanden sind,sind später für die multivariate Analyse verwendbar.
Codierungen für kategoriale Variablen
Häufigkeit (1)
OP_Jahr 0=>2000 129 0
1=bis 2000 230 1
Seite 0=rechts 263 0
1=Links 96 1
Anzahl 0= 1 oder 2 270 0
1= >2 89 1
N_Kat 0=N0 256 0
1=N1 103 1
M_Kat 0=M0 342 0
1=M1 17 1
………. ……….. …….. 0
……….. …….. 1
CEA 0=bis 29 250 0
1=30 und höher 109 1
Risiko = e Risikobeitrag vonFaktor1 + eRisikobeitrag von Faktor
2 + …… + eRisikobeitrag von Faktorn
Sinn der Umcodierung:
Wir wollen das individuelle Risiko des Patienten als Summe der Beiträge der Risikofaktorendarstellen, wobei der Summand immer 0 sein soll, wenn der Risikofaktor fehlt.
Wir benutzen dazu die Eulersche Zahl e
Das ist für den Hausgebrauch
2,72
und berechnen das Risiko des einzelnen Patienten nach der Formel
Ergebnis 2: Interne Codierung
Variablen nicht in der Gleichung
Score df Signifikanz
N_Kat 7,971 1 ,005
Anzahl 11,107 1 ,001
Seite 4,020 1 ,045
Abstand 1,851 1 ,174
OP_Jahr 7,428 1 ,006
Durchmesser 2,702 1 ,100
Alter ,335 1 ,563
Zweit_Tumor 18,834 1 ,000
M_Kat 9,311 1 ,002
CEA 3,166 1 ,075
Die Prozedur versucht nun, das Endergebnis zunächst mit dem Faktor mit dem kleinsten „Signifikanz“ Wert zu erzeugen [wenn sein Wert kleiner ist als der von uns eingegebene Wert für „Aufnahme“ (.05) ], berech net dann die „Signifikanz“ für die übrigen Faktoren neu und nimmt wiederum den kleinsten hinzu, [wenn sein Wert kleiner ist als der von uns eingegebene W ert für „Aufnahme“ (.05)] u.s.w, so lange bis entweder alle Faktoren verbrauc ht oder alle „Signifikanz“-Werte > 0.05 sind.
Ergebnis 3: Einfluss der einzelnen MerkmaleZunächst betrachten wir die Ausgangssituation:
Wir merken uns:je kleiner der Wert „Signifikanz“ ist, desto größer der Beitrag des entsprechenden Faktors zum Endergebnis.
Schritt 4:Signifikanz-niveau für Aufnahme ins Modell festlegen
Omnibus-Tests der Modellkoeffizienten
Schritt-2 Log-
Likelihood
Gesamt (Wert)
Änderung aus
vorangegan-genem Schritt
Änderung aus
vorangegan-genem Block
Chi-Quadrat df
Signi-fikanz Chi-Quadrat df
Signi-fikanz Chi-Quadrat df
Signifi-kanz
1a
1816,363 18,834 1 ,000 15,080 1 ,000 15,080 1 ,000
2b
1803,220 32,813 2 ,000 13,143 1 ,000 28,223 2 ,000
3c
1797,749 38,557 3 ,000 5,471 1 ,019 33,694 3 ,000
a. Variable(n) eingegeben in Schritt Nr. 1: Zweit_T umor
b. Variable(n) eingegeben in Schritt Nr. 2: Anzahl
c. Variable(n) eingegeben in Schritt Nr. 3: N_Kat
d. Beginnen mit Block-Nr. 1. Methode = Vorwärts sch rittweise (Conditional LR)
Ergebnis 4: Auswahl der Merkmale mit unabhängigem statistisch signifikantem Einfluß
B SE Wald dfSignifi-
kanzExp(B)
95,0% Konfidenzinterv. für
Exp(B)
Untere Obere
Schritt 1 Zweit_Tumor ,812 ,192 17,841 1 ,000 2,253 1,546 3, 285
Schritt 2 Anzahl ,634 ,168 14,322 1 ,000 1,886 1,358 2,620
Zweit_Tumor ,910 ,195 21,754 1 ,000 2,485 1,695 3,642
Schritt 3 N_Kat ,386 ,162 5,711 1 ,017 1,471 1,072 2,019
Anzahl ,580 ,170 11,696 1 ,001 1,787 1,281 2,492
Zweit_Tumor ,917 ,195 22,023 1 ,000 2,502 1,706 3,669
andere gebräuchliche Bezeichnungen sind: Hazard oder
relatives Risiko oder relative risk
1,471 * N_Kat + 1,787 * Anzahl + 2,502 * Zweittumor
wobei das Risiko „0“ ist, wenn alle Summanden „0“ s ind, also der Patient keinen Risikofaktor hat.
e 0,386 * N_Kat + e 0,580 * Anzahl + e 0,917* Zweittumor
Das individuelle Risiko des Patienten ist also
Ergebnis 5: Die gesuchten Prognosefaktoren
Variablen nicht in der Gleichung
Score dfSignifikanz
… … … … …
Schritt 3 Seite ,707 1 ,400
Abstand 1,037 1 ,308
OP_Jahr 3,073 1 ,080
Durchmesser 3,027 1 ,082
Alter 2,048 1 ,152
M_Kat ,141 1 ,708
CEA 2,332 1 ,127
Warum istjetzt unserChef kein
Faktor mehr ????
Der Rat des Statistikers VIIch sehe einen Trend (Signifikanz < 0.1), lassen Sie mich etwas versuchen.
Ergebnis 5: Die gesuchten Prognosefaktoren
…Signifi-
kanzExp(B)
95,0% Konfidenzinterv. für
Exp(B)
Untere Obere
… … … … … … …
Schritt 3 N_Kat … ,058 1,365 ,989 1,884
Anzahl … ,002 1,695 1,209 2,376
OP_Jahr … ,043 1,419 1,012 1,990
Durchmesser ,041 1,398 1,014 1,928
Zweit_Tumor ,000 2,513 1,712 3,689
Ergebnis
…Signifi-
kanzExp(B)
95,0% Konfidenzinterv. für
Exp(B)
Untere Obere
… … … … … … …
Schritt 3 N_Kat … ,058 1,365 ,989 1,884
Anzahl … ,002 1,695 1,209 2,376
OP_Jahr … ,043 1,419 1,012 1,990
Durchmesser ,041 1,398 1,014 1,928
Zweit_Tumor ,000 2,513 1,712 3,689
Warum istjetzt unser
Chef jetzt d o c h ein signifikannter
Faktor ?
Ergebnis
� Das Ergebnis dieser Schätzung hängt von sehr vielen Faktoren ab, deren Einfluß im Detail nicht vorhergesagt werden kann.
� Hier hilft nur Fachkenntnis und Erfahrung.
� Also: zu Risiken und Nebenwirkungen fragen Sie einen Fachmann
… oder …
� wählen Sie beispielsweise +44 (0) 1865 272860 (Sta tistics)
Da werden Sie geholfen.
� Die Cox-Regression ist ein Verfahren, das bedingte Wahrscheinlichkeiten schätzt.
� Genauso wenig, wie man durch Lesen der Operationsle hre zum Chirurgen werden kann … ,wird man durch Lesen des SPSS-Handbuchs zum Statist iker.
Der abschließende Rat des Statistikers
1990 gewann er den Charles F. Kettering Prize der General Motors Cancer Research Foundation und die Goldmedaille der Cancer Research Gesellschaft für die Entwicklung der nach ihm benannten Cox-Regression, die sich mit der Modellierung von Überlebenszeiten beschäftigt.
david.cox at nuffield.ox.ac.ukMain contact information:+44 (0) 1865 278690 (Nuffield College Direct)+44 (0) 1865 278621 (Fax)Nuffield College, New Road,Oxford,OX1 1NF
Alternative contact information:+44 (0) 1865 272860 (Statistics)
*15. Juli 1924 in Birmingham, EnglandUnited Kingdom
Professor Sir David Cox http://www.stats.ox.ac.uk/people/associate_staff/da vid_cox
D. R. Cox, Regression Models and Life-TablesJournal of the Royal Statistical Society. Series B (Methodological), Vol. 34, No. 2. (1972), pp.187-22 0.
D. R. Cox, Regression Models and Life-TablesJournal of the Royal Statistical Society. Series B (Methodological), Vol. 34, No. 2. (1972), pp.187-22 0.