analysis of variance (anova) 1/2 - stat.ethz.ch · anova = spezialfall einer linearen regression g...
Post on 30-Oct-2019
10 Views
Preview:
TRANSCRIPT
||Seminar fÃŒr Statistik 16.10.2014Markus Kalisch 1
ANalysis Of VAriance (ANOVA) 1/2
||Seminar fÃŒr Statistik
ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und
Placebo (Faktor). Gibt es einen sign. Unterschied in der
Wirkung (kontinuierlich)?
ð ~ ð + ð
ANOVA 2: Zwei Medikamente zur Blutdrucksenkung,
Placebo (Faktor) und Geschlecht (Faktor). Gibt es einen
sign. Unterschied in der Wirkung (kontinuierlich) (evtl.
geschlechterspezifisch)?
ð ~ ð1 + ð2 + ð
16.10.2014((Vorname Nachname)) 2
ANOVA - Idee
1-weg ANOVA
2-weg ANOVA
||Seminar fÃŒr Statistik
ANOVA = «Varianzanalyse»
Macht Aussagen ÃŒber Mittelwerte (analysiert dazu
Varianzen)
ANOVA = Spezialfall einer Linearen Regression
ðððð¡. ðððððððð ~ ðððððððð + ð¹ðâððð
Verallgemeinerung des t-Test (2 Gruppen â viele
Gruppen)
Historisch: Sehr verbreitet; heute: Immer noch extrem
verbreitet
16.10.2014Markus Kalisch 3
ANOVA: Mögliche MissverstÀndnisse
||Seminar fÃŒr Statistik 16.10.2014Markus Kalisch 4
Wdh: Ungepaarter t-Test
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
05
10
M P
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
-50
5
M P
D
ð
ðD
ð¡ âð·
ð; ððððð ð»0 ð ð¡ðððð¡: ð¡ ⌠ð¡ðâ1 â ð(0,1)
D: âStreuungâ zwischen MW (âSignalâ)
ð: âStreuungâ um MW (âFehlerâ)
||Seminar fÃŒr Statistik 16.10.2014Markus Kalisch 5
ANOVA: Idee
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0
M1 M2 P
Streuung zwischen Gruppen:
âBetween-Sum-of-Squaresâ (ðððµ)RSS der Gruppenmittelwerte (rote Kreuze)
um den totalen Mittelwert (blaue Linie)
ðððµ = ð â
ð=1
ð
ðð. â ð..2
Streuung innerhalb Gruppen:
âWithin-Sum-of-Squaresâ (ððð)
RSS der Einzelbeobachtungen
(schwarze Kreise) um die einzelnen
Mittelwerte (rote Kreuze)
ððð =
ð=1
ð
ð=1
ð
ððð â ðð.2
ð: ðŽðð§ðâð ðºðð¢ðððð 3ð: ðŽðð§ðâð ðµððð. ððð ðºðð¢ððð 10Ann: ð in jeder Gruppe gleich
ð3.
ð2.ð1. ð..
Teststatistik âðððµ
ððð
||Seminar fÃŒr Statistik
In welchem Bild ist die Teststatistik der ANOVA grösser ?
16.10.2014Markus Kalisch 6
ANOVA: Teststatistik
A
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
05
15
M1 P
B
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
05
15
M1 P
||Seminar fÃŒr Statistik
ððð = ð + ðŒð + ððð , ððð ~ ð 0, ð2 ððð
Technische Nebenbedingung: ð=1ððŒð = 0
ð»0: ðŒ1 = ðŒ2 = ⯠= ðŒð = 0
Teststatistik: ð =ðððµ/(ðâ1)
ððð/(ðâ ðâ1 )=ðððµ
ððð
Theorie: Falls ð»0 stimmt
ð ~ ð¹ðâ1,ðâ ðâ1
Damit kann ein Hypothesentest mit den ÃŒblichen 6
Schritten durchgefÃŒhrt werden
16.10.2014Markus Kalisch 7
ANOVA: Modell
âMean Squaresâ
âDegrees of freedom (Df)â
âAnalyse der
Varianzenâ
||Seminar fÃŒr Statistik
Angenommen: ðð ~ ð 0,1 , ð = 1,âŠð alle unabhÀngig
ðŽ =
ð=1
ð
ðð2
Chi-Quadrat-Verteilung mit ð Freiheitsgraden: A ~ ðð Angenommen: ðŽ ~ Χð, ðµ ~ Χð unabhÀngig
ð =ðŽ/ð
ðµ/ð
F-Verteilung mit ð und ð Freiheitsgraden ð ~ ð¹ð;ð
16.10.2014Markus Kalisch 8
Exkurs: Verteilungen
||Seminar fÃŒr Statistik 16.10.2014Markus Kalisch 9
Beispiel in R: ANOVA-Tabelle
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0
M1 M2 P
ð = 3, ð = 10
ð â 1 = 2g*(p-1)=27
ðððµ = 872.3ððð = 642.1
ðððµ =872.3
2= 436.1
ððð =642.1
27= 23.8
ð¹ =436.1
23.8= 18.34
||Seminar fÃŒr Statistik
Falls ANOVA signifikant: Zwischen welchen Gruppen sind
signifikante Unterschiede ?
â t-Tests fÃŒr alle Gruppenpaare
Problem: Multiples Testen
Bei ð Gruppen gibt es ð2=ð(ðâ1)
2t-Tests
Bsp: ð = 20 â 190 Tests auf 5%-Niveau
Könnten etwa 0.05 â 190 â 10 falsch positive Tests haben
Lösung: t-Test korrigieren (z.B. Bonferroni, âŠ)
16.10.2014Markus Kalisch 10
Wo ist der Unterschied ?
Teil 1: Paarweise Tests
||Seminar fÃŒr Statistik
Vorteil:
- Vertrauensintervalle fÃŒr Differenzen der
Gruppenmittelwerte
- Wa., dass alle wahren Differenzen in den
Vertrauensintervallen liegen: 95%
Alternative zum paarweisen t-Test
Empfehlung: Tukey HSD verwenden
16.10.2014Markus Kalisch 11
Beliebte Alternative bei ANOVA:Tukeyâs Honestly Significant Difference (HSD) Test
||Seminar fÃŒr Statistik 16.10.2014Markus Kalisch 12
Beispiel in R: TukeyHSD
-15 -10 -5 0 5 10
P-M
2P
-M1
M2
-M1
95% family-wise confidence level
Differences in mean levels of g Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0M1 M2 P
M2 ist deutlich wirksamer als M1
M1 und M2 sind deutlich
wirksamer als Placebo
||Seminar fÃŒr Statistik
Bisher: Differenz von zwei Gruppen
Jetzt: Linearkombination von beliebigen Gruppen
Bsp: Sind die beiden Medikamente im Mittel besser als
das Placebo ?
16.10.2014Markus Kalisch 13
Wo ist der Unterschied ?
Teil 2: Allgemeine Kontraste
||Seminar fÃŒr Statistik
Vektor mit wahren
Gruppenmittelwerten:
ð = ðð1, ðð2, ððð
Kontraste-Matrix ðŸ
Parameter-Vektor ð
ð»0: ðŸ â ð = ð
Praxis: Benutzer definiert ðŸ und ð; Computer berechnet
p-Werte fÃŒr Hypothesen und korrigiert fÃŒr mult. Testen
16.10.2014Markus Kalisch 14
Kontraste: Notation
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0
M1 M2 P
||Seminar fÃŒr Statistik
(Alternative zu TukeyHSD)
16.10.2014Markus Kalisch 15
Konstraste â Bsp 1: Paarweise Vergleiche
K ð m
ðð2 â ðð1 = 0ðð â ðð1 = 0ðð â ðð2 = 0
||Seminar fÃŒr Statistik
Funktion âglhtâ (General Linear Hypotheses Test) im
package âmultcompâ
16.10.2014Markus Kalisch 16
Kontraste â Bsp 1: R
Approx. 95%-VI fÃŒr Unterschied M1 vs. M2:
5.67 ± 2 â 2.181
||Seminar fÃŒr Statistik 16.10.2014Markus Kalisch 17
Kontraste â Bsp 2:
Gruppe der Medikamente vs. Placebo
0.5 â ðð1 + 0.5 â ðð2 â ðð = 0ðð2 â ðð1 = 0
Medikamente vs. Placebo
Medikamente untereinander
||Seminar fÃŒr Statistik 16.10.2014Markus Kalisch 18
Kontraste â Bsp 2: R
Die Medikamente sind deutlich
wirksamer als Placebo
M2 ist deutlich wirksamer als M1
||Seminar fÃŒr Statistik
Angenommen, es gibt zwei Medikamente (M1, M2) und
auch zwei mögliche Formen von Placebo (P1, P2). Folgende
Matrix ist dann eine mögliche Kontrastmatrix fÌr die
Vergleiche:
(M1, M2) vs. (P1, P2)
M1 vs. M2
P1 vs. P2
16.10.2014Markus Kalisch 19
Kontraste
⢠Ja
⢠Nein
||Seminar fÃŒr Statistik
Wenige Kontraste â viel Macht
Software: Korrektur fÃŒr multiples Testen innerhalb von
einem Funktionsaufruf (aber nicht bei mehreren
Funktionsaufrufen mit verschiedenen Kontrasten)
Deshalb: Einen Satz von Kontrasten definieren, dann
auswerten; anschliessend keinen neuen Satz von
Kontrasten mehr untersuchen
16.10.2014Markus Kalisch 20
Grundregeln fÃŒr Kontraste
||Seminar fÃŒr Statistik
ððð = ð + ðŒð + ððð , ððð ~ ð 0, ð2 ððð
1. Daten in jeder Gruppe normalverteilt
2. Gleiche Varianz in Gruppen
3. UnabhÀngige Fehler ððð
In R: Funktion âplotâ wie bei Linearer Regression
Vorteil: âBalanciertes Experimentâ (gleiche Anzahl pro Gruppe):
ANOVA ist robuster gegen Abweichungen obiger Annahmen
16.10.2014Markus Kalisch 21
Residuenanalyse bei ANOVA
top related