projekt i deskription eines klinischen datensatzesduerre/berichtalexander.pdf · 3.1 auf momente...
Post on 10-Sep-2019
4 Views
Preview:
TRANSCRIPT
Dozenten:
Prof. Dr. Christine Muller
Dipl.-Math. Liesa Denecke
Fallstudien I (SoSe 2010)
Projekt I
Deskription eines klinischen Datensatzes
Autor: Alexander Durre
24. April 2010
in Zusammenarbeit mit: Johanna Buncke, Nils Goeken und Thomas
Lehmann
Inhaltsverzeichnis
1 Einleitung 1
2 Problemstellung 1
2.1 Datenmaterial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.2 Untersuchungsziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
3 Statistische Methoden 2
3.1 Auf Momente basierende statistische Kennzahlen . . . . . . . . . . . 3
3.2 Robuste Kennzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.3 Zusammenhangsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.4 Grafische Darstellungen . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.5 Schiefetransformationen . . . . . . . . . . . . . . . . . . . . . . . . . 7
4 Statistische Auswertung 7
4.1 Gute der Randomisation . . . . . . . . . . . . . . . . . . . . . . . . . 7
4.2 Korrelation zwischen Bilirubin- und Alkaline Phosphate-Werten vor
der OP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4.3 Zusammenhang zwischen Leberwerten vor der Operation und Alter . 9
4.4 Transformationen zu normalverteilten Leberwerten . . . . . . . . . . 10
4.5 Wirkung des Medikaments . . . . . . . . . . . . . . . . . . . . . . . . 11
4.6 Abhangigkeit zwischen Medikamentenwirkung und Alter . . . . . . . 12
5 Zusammenfassung 12
A Anhang i
A.1 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
A.2 R-Code . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
1 Einleitung
Ungewohnliche hohe Konzentrationen des Pigments Bilirubin und des Proteins Alka-
line Phosphatase im Blut konnen auf das Vorliegen eines Verschlusses des Gallengan-
ges hindeuten (Pelligrini et al., 1982). Im Folgenden wird die Konzentration dieser
chemischen Elemente vor und nach einer Gallenoperation sowie der Einfluss eines
Medikaments untersucht. Neben verschiedenen grafischen Darstellungen wie Box-
plots und Histogrammen werden Lage- und Streuungsmaße auf die Werte vor und
nach der Operation sowie auf verschiedene Teilgruppen, die durch Geschlecht, Alter
und Art des Medikaments charakterisiert werden, angewendet. Außerdem werden
mogliche Abhangigkeiten zwischen Alter, Leberwerten und Medikamentenwirkung
mit Hilfe von Zusammenhangsmaßen betrachtet.
Im ersten Kapitel werden die zu untersuchenden Fragestellungen umrissen sowie
das Datenmaterial der Studie vorgestellt. Verwendete statistische Kennzahlen und
grafische Darstellungen werden im zweiten Abschnitt vorgestellt, bevor im dritten
Teil die Daten schließlich analysiert werden. Im vierten Kapitel werden neben einer
Zusammenfassung weitere mogliche zu untersuchende Fragen aufgeworfen.
2 Problemstellung
2.1 Datenmaterial
Die in dem Bericht genutzten Daten entstammen einer klinischen Studie aus dem
Jahre 1980, die die Wirksamkeit eines medizinischen Praperates untersuchen sollte.
Dazu wurden 20 Patienten mit einem Gallengangsverschluss ausgewahlt. Ihnen wur-
de einmalig nach der notwendigen Operation zufallig entweder das Medikament oder
ein Placebo verabreicht. Durch diese Randomisiation wurde versucht, den Einfluss
der Storeffekte wie Alter und Geschlecht zu minimieren. Die protokollierten Leber-
werte vor und zehn Tage nach der Operation bilden eine verbundene Stichprobe.
Dieser Bericht konzentriert sich nur auf die damals gemessenen Alkaline Phosphatase-
und Bilirubinwerte, die sehr aufschlussreiche Indikatoren fur einen Gallengangsver-
schluss sind (Pelligrini et al., 1982). In Tabelle 1 sind alle erfassten univariaten
Merkmale dargestellt.
Die Messung der Leberwerte erfolgt in klinischen Laboren. Eine Messungenaugikeit
1
Merkmal Merkmalstyp Skalentyp Einheit Auspragungen
Patientennummer nominal Nominal - N
Geburtsjahr diskret Intervall Jahr N
Geschlecht nominal Nominal - m / w
Behandlungsgruppe nominal Nominal - Medikament
/ Placebo
Messzeitpunkt ordinal Ordinal - vor / nach OP
Bilirubin-Wert stetig Verhaltnis mg/dL R+
Alkaline-
Phosphatase-Wert
stetig Verhaltnis IU/L R+
Tabelle 1: Die beobachteten Merkmale und ihre Eigenschaften
muss bei Bilirubin (Rosenthal et al., 1990) wie auch bei Alkaline Phosphatase (Lott
et al., 1978) berucksichtigt werden.
2.2 Untersuchungsziele
Der Datensatz soll unter folgenden Gesichtspunkten deskriptiv untersucht werden:
• Gute der Randomisation der Studie
• Korrelation zwischen Bilirubin- und Alkaline Phosphate-Werten vor der OP
• Zusammenhang zwischen Leberwerten vor der Operation und Alter
• Transformationen zu normalverteilten Leberwerten
• Wirkung des Medikaments
• Abhangigkeit zwischen Medikamentenwirkung und Alter der Probanden
3 Statistische Methoden
Im ersten Teil werden die verschieden robusten statistischen Kennzahlen, mit denen
der Datensatz deskriptiv ausgewertet wird, vorgestellt, im zweiten Abschnitt die
2
angewendeten grafischen Darstellungen und zum Ende eine Transformation, um die
Schiefe einer Stichprobe zu korrigieren. Im Folgenden bezeichne x = x1, . . . , xn eine
Stichprobe, n die Stichprobengroße und x(1) . . . x(n) die geordnete Statistik.
3.1 Auf Momente basierende statistische Kennzahlen
Lage, Streuung, Schiefe und Wolbung einer empirischen Verteilung konnen mit Hilfe
von Momenten berechnet werden. Sie sind damit gut mit den theoretischen Para-
metern Erwartungswert und Varianz der Wahrscheinlichkeitstheorie vegleichbar. Ein
Nachteil besteht jedoch in der Anfalligkeit der Kennzahlen fur Ausreißer, die mit
steigendem verwendeten Moment zunimmt.
Das Lagemaß arithmetisches Mittel (R-Befehl: mean(x))
x =1
n
n∑i=1
xi (1)
stellt das erste unzentrierte Moment dar. Zur Bestimmung der Streuung einer Stich-
probe, kann die empirische Varianz (R-Befehl: var(x))
s2(x) =1
n− 1
n∑i=1
(xi − x)2 (2)
(bis auf einen Vorfaktor das zweite zentrierte Moment) verwendet werden. Zur bes-
seren Interpretierbarkeit wird haufig die Standardabweichung (R-Befehl: sd(x))
s =√s2 betrachtet. Die Symmetrie einer Verteilung kann uber den Momentenko-
effizienten der Schiefe (R-Befehl: Schiefe(x); eigene Funktion, siehe Anhang)
skm(x) =
(1
n
n∑i=1
(xi − x)3
)/s3 (3)
charakterisiert werden. Dabei gilt, dass bei Symmetrie der Wert 0 angenommen
wird. Ist skm > 0, so spricht man von einer linkssteilen, bei skm < 0 von einer
rechtssteilen Verteilung (Fahrmeir et al., 2007, S. 75). Ein betragsmaßig großer Wert
spricht gegen das Vorliegen einer bekanntermaßen symmetrischen Normalverteilung
(Hartung, 2005, S. 49). Die Wolbung beschreibt, wie viele Beobachtungen an den
Randern (also im weitesten Sinne Ausreißer) vorliegen. Das Wolbungsmaß von
Fisher (R-Befehl: Wolbung(x); eigene Funktion, siehe Anhang)
km(x) =
(1
n
n∑i=1
(xi − x)4
)/s4 − 3 (4)
3
basiert auf dem vierten zentrierten Moment. Es ist durch die Normalverteilung nor-
miert, fur spitzere Verteilungen ist km positiv, fur flachere nimmt km negative Werte
an (Fahrmeir et al., 2007, S. 76). Wieder spricht eine betragsmaßig große Wolbung
gegen eine Normalverteilung (Hartung, 2005, S. 49).
3.2 Robuste Kennzahlen
Auf Momenten beruhende Maßzahlen konnen schon durch die Veranderung eines
einzigen Wertes beliebig manipuliert werden. Wie viele Manipulationen im Vegleich
zur Stichprobengroße eine Kennzahl vertragt, beschreibt der Bruchpunkt ε. Ein Wert
von 0 bedeutet deshalb keine Resistenz gegen Ausreißer (Hartung, 2005, S.864). Im
Folgenden sollen deshalb robustere Kennzahlen betrachtet werden.
Das p-Quantil (R-Befehl: quantile(x,p,type=2)
xp =
x[np]+1 , falls np ∈ N0
12(x(n/2) + x((n+2)/2)) , falls np /∈ N0
0 < p < 1 (5)
beschreibt den Wert, bei dem p · 100% der Beobachtungen kleiner und (1 − p) ·
100% der Beobachtungen großer sind. Der Bruchpunkt ε hangt von p ab: ε =p p ≤ 0.5
1− p p > 0.5
. Alle folgenden uber Quantile konstruierte Parameter ubernehmen
den Bruchpunkt, von ihrem”anfalligsten“ Quantil. Der Median (R-Befehl: medi-
an(x)) ist das 0.5-Quantil und eine robuste Alternative zu x (1). Eine Moglichkeit
die Streuung einer Stichprobe anzugeben, ist der Quartilsabstand
dQ = x0.75 − x0.25 (6)
mit ε = 0.25. Der MAD (R-Befehl: mad(x,constant=1))
MAD = Median(|xi − x0.5|) · 1.2826 (7)
ist mit ε = 0.5 noch resistenter (Hartung, 2005, S. 865) und stellt den medianen
betragsmaßigen Abstand der Beobachtungen zum Median dar. Der Quantilsko-
effizient der Schiefe (R-Funktion: Schiefe(x,p,robust=TRUE); eigene Funktion,
siehe Anhang)
skp(x) =x1−p + xp − 2x0.5
x1−p − xp, p ∈
(0,
1
2
)(8)
4
uberpruft die symmetrische Lage von xp und x1−p zu x0.5. Die Interpretation ent-
spricht der des Momentenkoeffizienten (3). Auch die Kurtosis kann robust beschrie-
ben werden. Das Wolbungsmaß nach Moors (R-Befehl: Wolbung(x,robust=TRUE);
eigene Funktion, siehe Anhang)
kp(x) =x0.875 − x0.625 + x0.375 − x0.125
x0.75 − x0.25
− 1.23 (9)
ist ebenfalls zur Normalverteilung normiert und besitzt deshalb die gleiche Interpre-
tation wie das Wolbungsmaß nach Fisher (4) (Kim und White, 2003).
3.3 Zusammenhangsmaße
Fur mehrdimensionale qualitative oder diskrete Daten stellt der Kontingenzkoef-
fizient
K =
√χ2
χ2 + n(10)
ein Maß fur die Abhangigkeit zwischen den Variablen dar. Er berechnet sich uber
den unnormierten und deshalb schwer interpretierbaren χ2-Koeffizient (R-Befehl:
chisq.test(x,correct=FALSE)$statistic)
χ2 =k∑i=1
m∑j=1
(hij −
hi.h.jn
)2
/
(hi.h.jn
)(11)
. Dabei bezeichnet hij die relativen Haufigkeiten, hi. die relativen Zeilen- und h.j
die relativen Spaltenhaufigkeiten. Der Kontingenzkoeffizient liegt zwischen 0 und√M−1M
, wobei M das Minimum aus Spalten- und Zeilenanzahl der zugehorigen Kon-
tingenztafel ist. Je großer der Koeffizient ausfallt, umso großer ist die Abhangigkeit
zwischen den einzelnen Variablen. Die Maßzahl gibt keine Aussage uber die Art des
Zusammenhangs an (Fahrmeir et al., 2007, S. 125).
Fur zweidimensionale mindestens ordinale Merkmale uberpruft der Korrelations-
koeffizent von Spearman (R-Befehl: cov(x,method=“spearman“))
rsp(x, y) =
n∑i=1
(rg(xi)− rg(x)(rg(yi)− rg(y)√n∑i=1
(rg(xi)− rg(x))2n∑j=1
(rg(yj)− rg(y))2
, rg(x(i)) = i (12)
die Daten auf einen monotonen Zusammenhang. Dabei liegt rsp zwischen −1 (ne-
gativer monotoner Zusammenhang) und 1 (positiver monotoner Zusammenhang)
5
(Fahrmeir et al., 2007, S. 143). Im Gegensatz zum Korrelationskoeffizienten von
Bravais-Pearson ist der von Spearman resistent gegenuber Ausreißern.
3.4 Grafische Darstellungen
Der Boxplot (R-Befehl: boxplot(x)) stellt uber die Quartile (inklusive Minimum
und Maximum) Lage, Streuung und Schiefe der Daten auf einen Blick dar. Außer-
dem werden Beobachtungen, deren Lage sich stark von der der ubrigen unterscheidet
(xi /∈ [x0.25− 1.5dQ, x0.75 + 1.5dQ]) als Ausreißer identifiziert (Chambers et al., 1983,
S. 21-22).
Im Histogramm (R Befehl: hist(x,freq=FALSE)) werden die Beobachtungen in
mehrere Klassen (als Orientierung gilt: [√n]) eingeteilt. Fur jede Klasse wird die
Haufigkeitsdichte (relative Haufigkeit/Klassenbreite) auf der y-Achse abgetragen.
Im Allgemeinen besitzt das Histogramm mehr Informationsgehalt als ein Boxplot.
Allerdings sind Lage, Schiefe und Streuung der Beobachtungen schwerer herauszu-
lesen und das Erscheinungsbild hangt stark von den individuell gewahlten Klassen
ab (Chambers et al., 1983, S. 24).
Um einen ersten Eindruck uber Zusammenhange zwischen zwei metrischen Varia-
blen zu gewinnen, verwendet man ein Streudiagramm (R-Befehl: plot(x,y)). In
ihm werden die Beobachtungen wie in ein Koordinatensystem eingezeichnet. Damit
konnen strukturelle Zusammenhange unterschiedlichster Art (nicht nur monoton)
erkannt werden (Chambers et al., 1983, S. 76-86).
Der theoretische Q-Q-Plot (R-Befehl:qqnorm(x) fur Vergleich mit Normalvertei-
lung) dient der Uberprufung von Verteilungsannahmen an die Stichprobe. Die empi-
rischen Quantile werden gegen die theoretischen Quantile der vermuteten Verteilung
abgetragen. Bei Zutreffen der Vermutung mussten die sich so ergebenen Punkte auf
einer Linie befinden. Liegt ein kleiner Teil der ersten Punkte unter der Geraden be-
ziehungsweise ein kleiner Teil der letzten Punkte oberhalb der Geraden, so spricht
dies fur Ausreißer. Zeigen mehrere Randpunkte dieses Verhalten, so deutet das auf
eine Verteilung mit schwereren Randern hin. Eine Kurve im Diagramm spricht fur
Asymmetrie, eine Welle fur zwei sich uberlagernde Verteilungen mit unterschiedli-
cher Lage (Chambers et al., 1983, S. 197-212).
6
3.5 Schiefetransformationen
Asymmetrische Verteilungen konnen meist mit Hilfe einer Potenzfunktion der Form
y(x)θ =
xθ θ > 0
log(x) θ = 0
(13)
symmetrisch transformiert werden, wobei θ ∈ [0, 1) fur linkssteile und θ > 1 fur
die selteneren rechtssteile Verteilungen benutzt wird. Zur Bestimmung von θ gibt
es verschiedene Ansatze. Unter der Voraussetzung, dass ein θ existiert, so dass die
transformierte Stichprobe einer Normalverteilung entstammt, liefert nach Box und
Cox
θBC = argmaxθ
(−n2
log(2πσ2(y(x)θ))−n
2+ n log |θ|+ (θ − 1)
n∑j=1
log |yj|
)(14)
den gewunschten Parameter (Chambers et al., 1983, S.214f). Robuster (und ohne
Normalverteilungsannahme praktikabel) ist der Ansatz von Hinkley uber die Quan-
tile. Die Losung der Gleichung(xpx0.5
)θ+
(x1−p
x0.5
)θ= 2 (15)
entspricht dem gesuchten θ := θH (Hinkley, 1975). Beide Gleichungen lassen sich
nur numerisch losen. Im Anhang findet sich eine geeignete R-Funktion.
4 Statistische Auswertung
Die im zweiten Kapital aufgeworfenen Fragen sollen nun mit Hilfe der im dritten Ab-
schnitt eingefuhrten Methoden und der Statistik-Software R 2.6.0 (R Development
Core Team, 2007) beantwortet werden.
4.1 Gute der Randomisation
Notwendig fur die Einschatzung der Wirkung des Praperates ist eine gute Rando-
misierung und damit eine Minimierung des Einflusses der Storvariablen. Auf den
ersten Blick erscheint der Frauenanteil (15 von 20) in der Stichprobe ungewohnlich
7
hoch zu sein. Er lasst sich jedoch durch eine hohere weibliche Pravelenz fur Gallen-
steinleiden erklaren (Stechemesser, 2007). Dass Frauen und Manner den Gruppen
zufallig zugeteilt wurde, zeigt der (bei dieser Anzahl an weiblichen und mannlichen
Probanden) kleinstmogliche Kontingenzkoeffizient von 0.11. Auch bezuglich des Al-
ters scheint die Randomisierung gut gelungen zu sein. Das arithmetische Mittel der
Medikamentengruppe ist mit 1912.1 Jahren zu dem der Kontrollgruppe mit 1912.7
Jahren nahezu identisch. Die Streuung der Placebogruppe mittels der Standardab-
weichung ist mit 14.0 zu 10.7 Jahren jedoch etwas großer.
Wichtig fur die Bewertung des Arzneimittels sind ahnliche vor-OP-Leberwerte der
Medikamenten- und Kontrollgruppe. Der Tabelle 2 ist zu entnehmen, dass sowohl
der Mittelwerte als auch die Streuung der Alkaline Phosphatase und der Bilirubin-
Werte in der Medikamentengruppe deutlich hoher als in der Kontrollgruppe sind.
Die Unterschiede der Leberwerte vor allem in der Lage sollten dazu veranlassen den
Medikamenteneffekt nicht nur uber die Leberwerte nach der Operation zu bewerten,
sondern die aussagefahigere Differenz der Werte vorher und nachher zu betrachten.
Leberwerte Allaline Phosphatase Bilirubin
Gruppen x0.5 mad x s
Placebo 160 110.5 2.4 2.5
Medikament 244.5 171.2 3.5 3.8
Tabelle 2: Lage- und Streuparameter fur AP- und Bilirubin-Werte vor der Operation
4.2 Korrelation zwischen Bilirubin- und Alkaline Phosphate-
Werten vor der OP
Alkaline Phosphatase und Bilirubin-Werte werden genutzt um Gallengangsverschlusse
zu diagnostizieren (Pelligrini et al., 1982). Dabei gelten Werte zwischen 0,1 - 1,2
mg/dl (Internisten im Netz, 2010) fur Bilirubin und 47-144 mg/dl fur Alkaline-
Phosphatase als normal (nlm, 2010). Stark uberhohte Werte sind Indikatoren fur
Krankheiten. Die hohe Korrelation von Spearman zwischen den beiden Leberwerten
vor der Operation von 0.71 lasst vermuten, dass moglicherweise die Messung von nur
einem Parameter notig sind. Die Abbildung 1 macht jedoch deutlich, dass uberhohte
8
Bilirubin-Konzentrationen nicht immer uberhohte Alkaline-Phosphatase-Werte nach
sich ziehen.
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
200 400 600 800
02
46
8
Alkaline Phosphatase in IU/L
Bili
rubi
n in
mg/
dL
Abbildung 1: Zusammenhang zwischen Bilirubin und Alkaline Phosphatase-Werten
vor der Operation
4.3 Zusammenhang zwischen Leberwerten vor der Operati-
on und Alter
Es wurden schon wissenschaftliche Arbeiten uber den Zusammenhang von Alter
und Bilirubin (Rosenthal et al., 1984) sowie Alter und Alkaline Phosphatase-Werten
(Eastman und Bixler 1977) verfasst. Eine Korrelation bei den”krankhaften“ Werten
vor der Operation ist mit rsp = −0.04 bei Bilirubin und rsp = −0.29 bei Alkaline
Phosphatase jedoch nicht so stark ausgepragt. Der Abblidung 2 ist jedoch zu ent-
nehmen, dass bei Bilirubin ein nicht monotoner Zusammenhang vorliegen konnte.
Die Bilirubin-Werte um das Geburtsjahr 1915 sind deutlich hoher und streuen viel
mehr als bei den alteren und jungeren Jahrgangen. Aufgrund der wenigen Daten
sollte man diese Beobachtung jedoch nicht uberinterpretieren. Den leicht negativen
Zusammenhang zwischen Alter und Alkaline Phosphatase-Konzentrationen im Blut
kann man auch der Abbildung 6 im Anhangs entnehmen.
9
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
1900 1910 1920 1930 1940
02
46
8
Geburtsjahr
Bili
rubi
n in
mg/
dl
Abbildung 2: Zusammenhang zwischen Alter und Bilirubin-Wert vor der Operation
4.4 Transformationen zu normalverteilten Leberwerten
Um in einer spateren Studie den Gauß-Test oder andere die Normalverteilung-
voraussetzende Verfahren auf die Daten nach der Operation anwenden zu konnen,
ist es wichtig die Verteilung zu uberprufen. Wie man der Tabelle 3 entnehmen kann,
besitzen alle Messreihen eine recht starke Schiefe. Nach einer geeigneten Potenztrans-
formation mit dem Exponenten θ (zur Erinnerung, fur θ = 0 wird der Logarithmus
angewendet) sind die Verteilungen wie erwartet symmetrisch. Die Bilirubin-Werte
besitzen jedoch eine zu kleine Wolbung fur eine Normalverteilung. Die zu Alkali-
ne Phosphatase gehorigen Q-Q-Plots (Abbildungen 5 und 7 im Anhang) vermitteln
tatsachlich den Eindruck, dass eine Normalverteilung vorliegen konnte.
AP BIL
sk0.25 θH skp(y(x)θH) kp(y(x)θH
) skm θBC skm(y(x)θBC) km(y(x)θBC
)
Pla 0 1 0 −0.27 0.71 0 0.31 −1.60
Med 0.28 0 0.11 −0.79 0.32 0.38 −0.13 −1.51
Tabelle 3: Schiefe- und Wolbungsmaße vor und nach der Transformation
10
4.5 Wirkung des Medikaments
Da die Ausgangswerte fur Bilirubin- und Alkaline Phosphatase zwischen der Medi-
kamenten und der Kontrollgruppe recht unterschiedlich waren, konzentriert sich die
Auswertung vor allem auf die Differenz der Werte vor und nach der Operation. Bei
Bilirubin zeigt das Praperat die großere Wirkung, was eine durchschnittliche Sen-
kung von 2.61 mg/dl zu 1.67 mg/dl bei dem Placebo zeigt. Der Abbildung 3 ist auch
zu entnehmen, dass die Streuung der Wirkung unter dem Medikament großer ist,
der Bilirubinwert eines Patienten stieg sogar leicht an. In Abbildung 9 im Anhang
erkennt man, dass nach der Operation die großeren Bilirubin-Werte in der Medika-
mentengruppe auftreten, jedoch ohne besorgniserregend groß zu sein.
Ahnliche Ergebnisse erhalt man auch fur Alkaline Phosphatase. Wie in Abbildung 9
Med
ikam
ent
Pla
cebo
0 2 4 6 8
Veränderung der Bilirubin−Werte in mg/dl
Abbildung 3: Differenzen zwischen den Alkaline Phosphatase- und Bilirubin-Werten
vor und nach der Operation
im Anhang zu sehen, ist der Median der Differenzen zwischen der Messung vor und
nach der Operation bei dem Medikament mit 65 IU/l großer als unter dem Placebo
mit 24 IU/l. Der Unterschied in der Streuung ist hier noch starker mit MAD-Werten
von 104 IU/l (Medikament) zu 54 IU/l (Placebo). Besonders besorgniserregende ist
die Anzahl von 4 von 10 Patienten, deren Wert sich vergroßerte. Nach der Operati-
on hatten fast ausschließlich die Patienten der Medikamentengruppe die uberhohten
Werte (siehe Abbildung 8 im Anhang).
11
4.6 Abhangigkeit zwischen Medikamentenwirkung und Al-
ter
Im vorhergehenden Teil konnte man eine großere Streuung bei der Wirkung des
Medikamentes beobachten, jetzt soll versucht werden, ob diese wenigstens zum Teil
durch Kenntnis des Alters erklart werden kann, um das Medikament gezielt anwen-
den zu konnen. Untersucht man einen Zusammenhang zwischen Alter und Differenz
der Alkaline Phosphatase Werte getrennt nach Medikamenten und Placebogruppe,
so macht man eine uberraschende Beobachtung. Wahrend der rsp unter der Kontroll-
gruppe den Wert 0.18 annimmt, misst er unter den Empfangern des Medikamentes
-0.54. Das deutet daraufhin, dass die Wirkung des Praperates mit steigendem Alter
zunimmt. Bei Bilirubin sieht es ahnlich aus, dort betragt rsp in der Medikamenten-
gruppe -0.27 und in der Placebogruppe 0.32. Es scheint also, als ob das Medikament
vor allem fur altere Menschen geeignet sei. Allerdings liegen jeweils nur zehn Beob-
achtungen vor, weshalb man das Ergebnis nicht uberbewerten sollte.
5 Zusammenfassung
Auf der Grundlage einer Untersuchung uber die Wirksamkeit eines neuen Medika-
mentes bei Gallengangsverschlussen wollte man neben dieser Fragestellung die Ran-
domisierung der Studie beurteilen und zwei wichtige Indikatoren fur Gallengangsver-
schlusse, die Leberwerte Alkaline Phosphatase sowie Bilirubin, auf Normalverteilung
uberprufen. Die Randomisierung konnte bis auf die unterschiedlichen Leberwerte vor
der Operation als sehr zufriedenstellend bewertet werden. Ersterem behalf man sich
durch Differenzbetrachtung der Werte vor und nach der Operation. Als normalver-
teilt konnten lediglich die Alkaline Phosphatase-Werte angesehen werden. Es konnte
tatsachlich eine allgemein leberwertsenkende Wirkung des Medikamentes beobach-
tet werden, jedoch war sie inhomogene Wirkung durch das unterschiedliche Alter zu
erklaren, was teilweise auch gelang. Jedoch ist die Stichprobe fur eine solche diffe-
renzierte Betrachtung viel zu klein um solide Schlussfolgerungen zu ziehen. Bei einer
zukunftigen Untersuchung sollte jedoch ein starkes Augenmerk auf die unterschied-
liche Wirkung aufgrund des Alters und auch des Geschlechts mit einem großeren
Stichprobenumfang Rucksicht genommen werden.
12
Literaturverzeichnis
Chambers, J., Cleveland, S., Kleiner, B., Tukey, P. (1983) Graphical methods for
data analysis, 1. Auflage, Duxbury Press, Boston
Eastman, R, Bixler, D (1977). Serum Alkaline Phosphatase: Normal Values by Sex
and Age. clinical chemestrie 23(9), 1769-1770
Fahrmeir, L., Kunstler, R., Pigeot, I., Tutz, G. (2007). Statistik, 6. Auflage, Sprin-
ger, Berlin
Hartung, J. (2005). Statistik, 14 Auflage, Oldenbourg, Munchen
Hinkley, D. (1975). On power transformations to symmetry. Biometrika 62(1), 101-
111
Internisten im Netz (2010).
http://www.internisten-im-netz.de/de bilirubin 1327.html (21.04.2010). Kim, T., Whi-
te, H. (2003). http://www.escholarship.org/uc/item/7b52v07p, 24.4.2010
Lott, J., Turner, K., Scott, J. (1978). Factors Affecting Measurement of Total Alkali-
ne Phosphatase Activity in Human Serum, Especially Wavelength Accuracy. clinical
chemestrie 246, 938-941
nlm, http://www.nlm.nih.gov/medlineplus/ency/article/003470.htm, 24.4.2010
Pellegrini, C., Thomas, J., Way, L. (1982). Bilirubin and alkaline phosphatase values
before and after surgery for biliary obstruction. The American Journal of Surgery
143(1), 67-73.
R Development Core Team (2007). A language and environment for statistical com-
puting, R Foundation for Statistical Computing, Vienna, Austria, URL: http://www.R-
project.org.
Rosenthal, P., Pincus, M., Fink, D. (1984). Sex- and age-related differences in biliru-
bin concentrations in serum. Clinical chemestrie clinical chemestrie 30, 1380-1382
Rosenthal, P., Keefe, M., Henten, D., Cheng, M.m Lee, C., Hall, R., Newton, M.
13
(1990). Total and Direct-Reacting Bilirubin Values by Automated Methods Compa-
red with Liquid Chromatography and with Manual Methods for Determining Delta
Bilirubin clinical chemestrie 36, 788-791
Stechermesser, http://www.diss.fu-berlin.de/diss/servlets/MCRFileNodeServlet
/FUDISS derivate 000000003356,24.4.2010
A Anhang
A.1 Abbildungen
●
200
400
600
800
AP−Werte vor OP
Alk
alin
e P
hosp
hata
se in
IU/l
5015
025
035
0AP−Werte nach OP
Alk
alin
e P
hosp
hata
se in
IU/l
02
46
8
BIL−Werte vor OP
Bili
rubi
n in
mg/
dl
0.5
1.0
1.5
BIL−Werte nach OP
Bili
rubi
n in
mg/
dl
Abbildung 4: Alkaline-Phosphate- und Bilirubin-Werte vor und nach der Operation
i
●●
●
●
●
●
●
●
●
●
−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5
5010
015
020
025
030
0
Normal Q−Q Plot
theoretische Quantile
empi
risch
e Q
uant
ile
Abbildung 5: QQ-Plot der logarithmierten Alkaline Phosphatase-Werte nach der
Operation der Medikamentengruppe
A.2 R-Code
### Einlesen der Daten
daten <- read.table("http://www.statistik.tu-dortmund.de/fileadmin/
user_upload/Lehrstuehle/Ingenieur/Mueller/Lehre/Fallstudien_I/Projekt_1/
GALLEN.DAT", header=F,skip=1)
daten <- read.table("GALLEN.DAT", header=F,skip=1)
daten <- daten[,-c(7,8,10)]
names(daten) <- c("PAT_NR","GEB","SEX","TREAT","ZEIT","BIL","AP")
## Aufspalten des Datensatzes in Gruppen
daten_vor <- daten[daten$ZEIT=="vor",] #vor OP
daten_nach <- daten[daten$ZEIT=="nach",] #nach OP
## Patienten mit medikamentoser Behandlung vor OP
daten_vor_med <- daten_vor[daten_vor$TREAT=="v",]
## Patienten unter Placebo vor OP
daten_vor_p <- daten_vor[daten_vor$TREAT=="p",]
## Patienten mit medikamentoser Behandlung nach OP
daten_nach_med <- daten_nach[daten_vor$TREAT=="v",]
## Patienten unter Placebo nach OP
daten_nach_p <- daten_nach[daten_nach$TREAT=="p",]
## nach Geschlecht
daten_vor_w <- daten_vor[daten_vor$SEX=="w",]
daten_nach_w <- daten_nach[daten$SEX=="w",]
ii
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
1900 1910 1920 1930 1940
200
400
600
800
Geburtsjahr
Alk
alin
e P
hosp
hata
se in
UI/l
Abbildung 6: Zusammenhang zwischen Alter und Alkaline Phospatase-Werten
daten_vor_m <- daten_vor[daten_vor$SEX=="m",]
daten_nach_m <- daten_nach[daten$SEX=="m",]
## Patientinnen mit Medikament vor OP
daten_vor_med_w <- daten_vor_med[daten_vor_med$SEX=="w",]
## Patienten mit Medikament vor OP
daten_vor_med_m <- daten_vor_med[daten_vor_med$SEX=="m",]
## Patientinnen mit Placebo vor OP
daten_vor_p_w <- daten_vor_p[daten_vor_p$SEX=="w",]
## Patienten mit Placebo vor OP
daten_vor_p_m <- daten_vor_p[daten_vor_p$SEX=="m",]
## Patientinnen mit Medikament nach OP
daten_nach_med_w <- daten_nach_med[daten_nach_med$SEX=="w",]
## Patienten mit Medikament nach OP
daten_nach_med_m <- daten_nach_med[daten_nach_med$SEX=="m",]
## Patientinnen mit Placebo nach OP
daten_nach_p_w <- daten_nach_p[daten_nach_p$SEX=="w",]
## Patienten mit Placebo nach OP
daten_nach_p_m <- daten_nach_p[daten_nach_p$SEX=="m",]
### Gute der Randomisation
# generalle Ausreißeranalyse
pdf("Diagramme\\Ausreisseranalyse.pdf",family="Times")
par(mfrow=c(2,2))
iii
●
●
●
●
●
●
●
●
●
●
−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5
4.5
5.0
5.5
Normal Q−Q Plot
theoretische Quantile
empi
risch
e Q
uant
ile
Abbildung 7: QQ-Plot der Alkaline Phosphatase-Werte nach der Operation der Kon-
trollgruppe
boxplot(daten_vor$AP,main="AP-Werte vor OP",
ylab="Alkaline Phosphatase in IU/l")
boxplot(daten_nach$AP,main="AP-Werte nach OP",
ylab="Alkaline Phosphatase in IU/l")
boxplot(daten_vor$BIL,main="BIL-Werte vor OP",
ylab="Bilirubin in mg/dl")
boxplot(daten_nach$BIL,main="BIL-Werte nach OP",
ylab="Bilirubin in mg/dl")
dev.off()
# Kontingenzkoeffizient
table(daten[1:20,]$SEX) # Anteil Frauen Manner
Kontingenztafel <- rbind(table(daten_vor_med$SEX),table(daten_vor_p$SEX))
rownames(Kontingenztafel) <- c("Medikament","Placebo")
colnames(Kontingenztafel) <- c("m", "w")
n <- sum(Kontingenztafel)
Chiquadrat <- chisq.test(Kontingenztafel,correct=FALSE)$statistic
(Chiquadrat/(n + Chiquadrat))^0.5
# Randomisierung bezgl. Alter
mean(daten_vor_med$GEB)
mean(daten_vor_p$GEB)
sd(daten_vor_med$GEB)
sd(daten_vor_p$GEB)
# Randomisation bzgl. Bilirubinund AP
median(daten_vor_med$AP)
iv
Placebo
Alkaline Phosphate in IU/L
rel.
Häu
f. / K
lass
enbr
eite
0 100 200 300 4000.00
00.
006
Medikament
Alkaline Phosphate in IU/L
rel.
Häu
f. / K
lass
enbr
eite
0 100 200 300 4000.00
00.
006
Abbildung 8: Alkaline Phosphatase-Werte nach der Operation
median(daten_vor_p$AP)
mad(daten_vor_med$AP)
mad(daten_vor_p$AP)
mean(daten_vor_med$BIL)
mean(daten_vor_p$BIL)
sd(daten_vor_med$BIL)
sd(daten_vor_p$BIL)
### Korrelation zwischen Bilirubin- und AP-Werten vor der OP
pdf("Diagramme\\KorrelationAPBIL.pdf",family="Times")
par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))
plot(daten_vor$AP,daten_vor$BIL,xlab="Alkaline Phosphatase in IU/L",
ylab="Bilirubin in mg/dL")
dev.off()
cor(daten_vor$AP, daten_vor$BIL, method="spearman")
### Zusammenhang zwischen Leberwerten vor der Operation und Alter
pdf("Diagramme\\AlterBIL.pdf",family="Times")
par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))
plot(daten_vor$GEB, daten_vor$BIL, xlab="Geburtsjahr",
ylab="Bilirubin in mg/dl")
dev.off()
cor(daten_vor$AP, daten_vor$GEB,method="spearman")
cor(daten_vor$BIL, daten_vor$GEB,method="spearman")
pdf("Diagramme\\AlterAP.pdf",family="Times")
par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))
v
Placebo
Bilirubin in mg/dl
rel.
Häu
f. / K
lass
enbr
eite
0.0 0.5 1.0 1.5 2.0
0.0
0.4
0.8
Medikament
Bilirubin in mg/dl
rel.
Häu
f. / K
lass
enbr
eite
0.0 0.5 1.0 1.5 2.0
0.0
0.4
0.8
Abbildung 9: B
ilirubin-Werte nach der Operation
plot(daten_vor$GEB, daten_vor$AP, xlab="Geburtsjahr",
ylab="Alkaline Phosphatase in UI/l")
dev.off()
### Transformationen zu normalverteilten Leberwerten
#### notige Programme
# Schiefe-Berechnung
# x: Datenvektor
# robust: falls F -> uber Momente
# falls T -> uber Quantile
# p: welches Quantil
Schiefe <- function(x,robust=FALSE,p=0.25) {
if (robust==FALSE)
{return(mean((x-mean(x))^3)/var(x)^1.5) }
else
{return((quantile(x,1-p, type=2)+quantile(x,p, type=2)-2*quantile
(x,0.5, type=2))/(quantile(x,1-p, type=2)-quantile(x,p, type=2)))}
}
# Berechnung der Wolbung
# x: Datenvektor
# robust: falls F -> uber Momente
# falls T -> uber Quantile
Wolbung <- function(x,robust=FALSE) {
if (robust==FALSE) {
return(mean((x-mean(x))^4)/var(x)^2-3)}
else {return((quantile(x,0.875, type=2)-quantile(x,0.625, type=2)
vi
●
Med
ikam
ent
Pla
cebo
−200 0 200 400 600
Veränderung der AP−Werte in IU/l
Abbildung 10: Differenzen zwischen den Alkaline Phosphatase-Werten vor und nach
der Operation
+quantile(x,0.375, type=2)-quantile(x,0.125, type=2))/
(quantile(x,0.75, type=2)-quantile(x,0.25, type=2))-1.23)}
}
# diese Funktion berechnet ein a, so dass x^a symmetrisch ist
# ist a in der Nahe von 0, so ist log(x) symmetrisch
# x: Datenvektor
# robust: soll Schiefe uber Momente oder uber Quantile
# zu 0 transformiert werden
# Quantil: welches Quantil soll symmetrisch sein
# Schrittgroße: wie genau soll a berechnet werden
##### Schiefe-Trafo ######
Schiefe_Trafo <- function(x,Schrittgroße=0.001,robust=FALSE,Quantil=0.25) {
if (robust==FALSE) {
Definitionsbereich <- seq(Schrittgroße,4,by=Schrittgroße)
n <- length(x)
y <- matrix(x,nrow=length(x),ncol=(length(Definitionsbereich)))
y <- rbind(y,Definitionsbereich)
Potenzfunktion <- function(x) {
n <- length(x)
return(x[-n]^x[n])}
Varianz <- apply(y,2,Potenzfunktion)
Varianz <- apply(Varianz,2,var)
zuMaximierendes <- -n/2*log(2*pi*Varianz)-n/2+n*
log(Definitionsbereich)+(Definitionsbereich-1)*sum(log(x))
return(Definitionsbereich[which.max(zuMaximierendes)]) }
else {
q1 <- median(x)
q2 <- quantile(x,Quantil,type=2)
q3 <- quantile(x,1-Quantil,type=2)
vii
Definitionsbereich <- seq(Schrittgroße,4,by=Schrittgroße)
b <- (q2/q1)^Definitionsbereich+(q3/q1)^Definitionsbereich-2
return(Definitionsbereich[which.min(abs(b))])
}
}
Schiefe(daten_nach_med$AP,robust=TRUE)
Wolbung(daten_nach_med$AP,robust=TRUE)
Schiefe_Trafo(daten_nach_med$AP,robust=TRUE)
Schiefe(log(daten_nach_med$AP),robust=TRUE)
Wolbung(log(daten_nach_med$AP),robust=TRUE)
Schiefe(daten_nach_p$AP,robust=TRUE)
Wolbung(daten_nach_p$AP,robust=TRUE)
Schiefe_Trafo(daten_nach_p$AP,robust=TRUE)
Schiefe(daten_nach_p$AP,robust=TRUE)
Wolbung(daten_nach_p$AP,robust=TRUE)
Schiefe(daten_nach_med$BIL)
Wolbung(daten_nach_med$BIL)
Schiefe_Trafo(daten_nach_med$BIL)
Schiefe(daten_nach_med$BIL^0.38)
Wolbung(daten_nach_med$BIL^0.38)
Schiefe(daten_nach_p$BIL)
Wolbung(daten_nach_p$BIL)
Schiefe_Trafo(daten_nach_p$BIL)
Schiefe(log(daten_nach_p$BIL))
Wolbung(log(daten_nach_p$BIL))
pdf("Diagramme\\qqMed.pdf",family="Times")
par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))
qqnorm(daten_nach_p$AP,xlab="theoretische Quantile",
ylab="empirische Quantile")
dev.off()
pdf("Diagramme\\qqp.pdf",family="Times")
par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))
qqnorm(log(daten_nach_med$AP),xlab="theoretische Quantile"
,ylab="empirische Quantile")
dev.off()
### Wirkung des Medikaments
AP_diff2 <- daten_vor_med$AP - daten_nach_med$AP
AP_diff3 <- daten_vor_p$AP - daten_nach_p$AP
BIL_diff2 <- daten_vor_med$BIL - daten_nach_med$BIL
BIL_diff3 <- daten_vor_p$BIL - daten_nach_p$BIL
viii
median(AP_diff2)
median(AP_diff3)
mad(AP_diff2)
mad(AP_diff3)
mean(BIL_diff2)
mean(BIL_diff3)
pdf("Diagramme\\DiffBIL.pdf",family="Times")
par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))
boxplot(BIL_diff2, BIL_diff3, horizontal=T, names=c("Medikament",
"Placebo"),xlab="Veranderung der Bilirubin-Werte in mg/dl")
dev.off()
pdf("Diagramme\\DiffAP.pdf",family="Times")
par(cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))
boxplot(AP_diff2, AP_diff3, horizontal=T, names=c("Medikament",
"Placebo"),xlab="Veranderung der AP-Werte in IU/l")
dev.off()
pdf("Diagramme\\EndwerteAP.pdf",family="Times")
par(mfrow=c(2,1),cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))
hist(daten_nach_p$AP, xlab="Alkaline Phosphate in IU/L",
ylab="rel. Hauf. / Klassenbreite",freq=F, main="Placebo",xlim=c(0,400))
hist(daten_nach_med$AP, xlab="Alkaline Phosphate in IU/L",
ylab="rel. Hauf. / Klassenbreite",freq=F, main="Medikament",xlim=c(0,400))
dev.off()
pdf("Diagramme\\EndwerteBIL.pdf",family="Times")
par(mfrow=c(2,1),cex.axis=1.6,cex.lab=1.6,cex.main=1.6,mar=c(5,5,2,2))
hist(daten_nach_p$BIL, xlab="Bilirubin in mg/dl",
ylab="rel. Hauf. / Klassenbreite",freq=F, main="Placebo",xlim=c(0,2),breaks=seq(from=0,to=2,by=0.4))
hist(daten_nach_med$BIL, xlab="Bilirubin in mg/dl",
ylab="rel. Hauf. / Klassenbreite",freq=F, main="Medikament",xlim=c(0,2),breaks=seq(from=0,to=2,by=0.4))
dev.off()
# Abhangigkeit zwischen Medikamentenwirkung und Alter bzw. Geschlecht
cor(daten_nach_med$GEB, AP_diff2, method="spearman")
cor(daten_nach_p$GEB, AP_diff2, method="spearman")
cor(daten_nach_med$GEB, BIL_diff2, method="spearman")
cor(daten_nach_p$GEB, BIL_diff2, method="spearman")
ix
top related