tutorat statistik ii im ss 09 zufallseffekte & messwiederholung ch-langrock@t-online.de
Post on 05-Apr-2015
111 Views
Preview:
TRANSCRIPT
Tutorat Statistik II im SS 09Zufallseffekte & Messwiederholung
ch-langrock@t-online.de
Memo: zweifaktorielle ANOVA
Was fällt euch noch ein?
Memo
o Verfahren zur Prüfung von Gruppen-unterschieden in Bezug auf mehrere UVs
o Erweiterung der einfak. ANOVA um den Interaktionseffekt bzw. die -quadratsumme
o Zwei Typen von Effekten/Quadratsummen: Haupt- und Interaktionseffekte
o Auswertung von Wechselwirkungen (Interaktionen) zwischen den UVs
o Interaktionstypen: ordinal, disordinal, hybrido Interpretation: Über Trends in beiden Diagrammen
Thema: Zufallseffekte & Messwiederholung
Gliederung
I. Feste vs. ZufallseffekteII. Messwiederholung einfaktoriellIII. Messwiederholung mehrfaktoriell
I. Feste vs. Zufallseffekte
Übersicht ANOVA
Feste Effekt vs. Zufallseffekte
Definition:
Man spricht von festen Effekten, wenn alle möglichen bzw. alle interessierenden Stufen eines Faktors im Versuchsplan realisiert werden.
Beispiele: Geschlecht, Therapieform, Hautfarbe
Definition:
Man spricht von Zufallseffekten, wenn einen Faktor sehr viele Abstufungen hat und für eine Untersuchung “zufällig” einige davon ausgesucht werden.
Beispiele: Persönlichkeitseigenschaften, Alter, Universität
Feste Effekt vs. Zufallseffekte
Zentraler Unterschied: Generalisierbarkeit (externe Validität)
Bei festen Effekten ist keine Verallgemeinerung der inferenzstatistischen Prüfung auf nicht realisierte Stufen der UV möglich:
Wenn ich Verhaltenstherapie und Gesprächstherapie als Faktor in meinem Versuchsplan habe, kann ich bei der Interpretation der Ergebnisse keine Aussagen über Psychotherapie im Allgemeinen tätigen.
Um Psychotherapie im Allgemeinen in Bezug auf meine AV bewerten zu könne, gibt es zwei Möglichkeiten:
1. Ich realisiere alle Stufen des Faktors Psychotherapie -> ANOVA mit festen Effekten
2. Ich wähle aus allen Therapieformen eine ausreichend große Zahl zufällig aus -> ANOVA mit zufälligen Effekten
Nur eine Varianzanalyse mit zufälligen Effekten erlaubt intervallskalierte Variablen – mit theoretisch unendlich vielen Abstufungen – einzubeziehen. Dennoch kann eine „Zufallsfaktor“ grundsätzlich auch Nominal- bzw. Ordinalskalenniveau haben.
Feste Effekt vs. Zufallseffekte
Unterschiede
Feste Effekte Zufallseffekte
oAlle möglichen / interessierenden Stufen eines Faktors werden realisiert.
oEinige Stufen werden aus vielen möglichen Stufen ausgesucht.
oKeine Generalisierbarkeit auf nicht realisierte Stufen.
oGeneralisierbarkeit ist gegeben.
oDie Summe der Effekte ist Null.
oDie Summe der Effekte muss nicht Null sein.
oH0: Alle Effekte sind Null bzw. Die Varianz der Effekte ist Null. αj = 0 (für alle j) od. σ²(α) = 0
oH0: Die Varianz der Effekte ist Null. σ²(α) = 0
Der F-Test bei der 2-faktoriellenANOVA mit Zufallseffekten
within
FaktorAxBAxB
FaktorAxB
FaktorBB
FaktorAxB
FaktorAA
MS
MSF
MS
MSF
MS
MSF
qpNdf
qpdf
qpdf
qdf
qpdf
Nenner
Zähler
Nenner
Zähler
Nenner
Zähler
)1()1(
)1()1(
1
)1()1(
1
Liegt ein Faktor mit festem Effekt und ein Faktor mit Zufallseffekt vor, spricht man von einer ANOVA mit gemischten Effekten.
Wichtig: Es muss bei der Berechnung der F-Tests beachtet werden, welcher Faktor als Zufallsfaktor eingegeben wird.
Die folgende Berechnung geht davon aus, dassFaktor B der Zufallsfaktor ist.
Der F-Test bei der 2-faktorielleANOVA mit „gemischten Effekten“
Der F-Test bei der 2-faktorielleANOVA mit „gemischten Effekten“
within
FaktorAxBAxB
within
FaktorBB
FaktorAxB
FaktorAA
MS
MSF
MS
MSF
MS
MSF
qpNdf
qpdf
qpNdf
qdf
qpdf
Nenner
Zähler
Nenner
Zähler
Nenner
Zähler
)1()1(
1
)1()1(
1
zufällig
fest
Faktor A Faktor B AxB
A fest,
B fest
A zufällig,
B zufällig
A fest,
B zufällig
Prüfvarianzen derzweifaktoriellen ANOVA
within
FaktorA
MS
MSF
FaktorAxB
FaktorB
MS
MSF
within
FaktorAxB
MS
MSF
within
FaktorAxB
MS
MSF
within
FaktorAxB
MS
MSF
FaktorAxB
FaktorA
MS
MSF
within
FaktorB
MS
MSF
within
FaktorB
MS
MSF
FaktorAxB
FaktorA
MS
MSF
Zusammenfassung
o Definierte Anzahl von Stufen „fester Faktor“o Beliebige Anzahl von Stufen „Zufallsfaktor“o Die Art des Modells (feste Effekte, zufällige
Effekte, gemischte Effekte) beeinflusst die Prüfvarianz im Nenner des F-Bruchs:
Feste Effekte: MSwith
Zufällige Effekte: MSAxB
Gemischte Effekte: Für den festen Faktor MSAxB, für den zufälligen MSwith
Herleitung: Leonhart, Kapitel 16
II. Messwiederholung einfaktoriell
ANOVA mit Messwiederholung
Wichtige Anwendungsmöglichkeiten für Messwiederholung:
- Messwiederholung im engeren Sinn: Die selbe AV wird mehrfach erhoben ( Veränderungsmessung)
- Eine AV wird durch unterschiedliche Verfahren (z.B. Selbstbeobachtung und Fremdbeobachtung) erhoben ( Vergleich der Verfahren)
- Personen aus zwei (oder mehreren) Stichproben werden einander zugeordnet (“matching“)
Welches Verfahren für Messwiederholung kennt ihr bereits? Den t-Test für abhängige Stichproben.
Einfaktorielle ANOVA mit Messwdh.
Eine einfaktorielle ANOVA mit Messwiederholung kann als2-faktorielle ANOVA mit gemischten Effekten betrachtet werden:
Faktor A: Messzeitpunkt (fester Effekt) Faktor B: Versuchsperson (Zufallseffekt)
Der Personenfaktor (B) erfasst Unterschiede zwischen den Versuchspersonen, der Messwiederholungsfaktor (A) Unterschiede zwischen den Messzeitpunkten.
Unterschiede zwischen den Versuchspersonen sind irrelevant; es interessiert der Unterschied zwischen den einzelnen Messzeitpunkten.
Vorteile & Nachteile1. Teststärker als nicht-
messwiederholte ANOVA, da Fehlervarianz reduziert wird
2. weniger Personen nötig durch wiederholte Messung bei denselben Personen
1. Sphärizitätsannahme (Zirkularitätsannahme):o Varianzen und
Kovarianzen unter den einzelnen Faktorstufen homogen
o Bei einer Verletzung: Greenhouse-Geisser-Korrektur.
2. Sequenzeffekte: Reihenfolge der Testung hat Einfluss
3. Bei fehlenden Daten zu einem Messzeitpunkt muss die Person komplett ausgeschlossen werden. N sinkt
Quadratsummenzerlegung
SStotal = SSbetween + SSwithin
SStotal = SSbetween + SStreatment + SSerror
o Varianzanteileo SSbetween: zwischen Personen zum selben
Messzeitpunkto interessiert nicht wird nicht für den F-Test verwendet
o SSwithin: innerhalb derselben Personen zu unterschiedlichen MZPs
o auf Treatment zurückzuführen SStreatment
o Fehlervarianz SSerror
Formeln
)1()1( Npdferror
p
jjtreatment yynSS
1
2..).(
1pdftreatment
n
i
p
jijijerror yyyySS
1 1
2..)..(
treatment
treatmenttreatment df
SSMS
error
errorerror df
SSMS
error
treatment
MS
MSF
Rechenbeispiel
Messzeitpunkt
Pat-Nr. vor Th. nach Th. 6 Monate
1 23 10 13
2 27 13 16
3 25 9 12
4 24 8 12
..yjy.
.iy
Mittelwerte
Messzeitpunkt
Pat-Nr. vor Th. nach Th. 6 Monate
1 23 10 13 15,33
2 27 13 16 18,67
3 25 9 12 15,33
4 24 8 12 14,67
24,75 10 13,25 16,00jy.
.iy
Meßwiederholte einfaktorielle ANOVA: Vorgehen
1. Hypothesen
2. Varianzzerlegung:a) Rand- und Gesamtmittelwerte bilden
b) Quadratsummen berechnen
c) Freiheitsgrade berechnen
d) Mittlere Quadratsummen berechnen
3. F-Bruch bilden
4. Vergleich des emp. F-Werts mit krit. F-Wert
Mauchly-Test auf Sphärizitätb
Maß: MASS_1
,269 2,628 2 ,269 ,578 ,710 ,500InnersubjekteffektTHERAPIE
Mauchly-WApproximiertes Chi-Quadrat df Signifikanz
Greenhouse-Geisser Huynh-Feldt Untergrenze
Epsilona
Prüft die Nullhypothese, daß sich die Fehlerkovarianz-Matrix der orthonormalisierten transformierten abhängigen Variablenproportional zur Einheitsmatrix verhält.
Kann zum Korrigieren der Freiheitsgrade für die gemittelten Signifikanztests verwendet werden. In der Tabelle mitden Tests der Effekte innerhalb der Subjekte werden korrigierte Tests angezeigt.
a.
Design: Intercept Innersubjekt-Design: THERAPIE
b.
p > .05, der Mauchly-Test ist also nicht signifikant
Demnach ist die Sphärizität (Zirkularität) ist also gegeben.
Tests der Innersubjekteffekte
Maß: MASS_1
480,500 2 240,250 345,960 ,000
480,500 1,155 415,921 345,960 ,000
480,500 1,421 338,180 345,960 ,000
480,500 1,000 480,500 345,960 ,000
4,167 6 ,694
4,167 3,466 1,202
4,167 4,263 ,978
4,167 3,000 1,389
Sphärizität angenommen
Greenhouse-Geisser
Huynh-Feldt
Untergrenze
Sphärizität angenommen
Greenhouse-Geisser
Huynh-Feldt
Untergrenze
QuelleTHERAPIE
Fehler(THERAPIE)
Quadratsumme vom Typ III df
Mittel derQuadrate F Signifikanz
Da die Sphärizitätsannahme nicht verletzt ist, kann die erste Zeile verwendet werden.
p < 0.05, d.h. Der Messzeitpunkt beeinflusst das Testergebnis.
III. Messwiederholung mehrfaktoriell
Messwiederholung 2-faktoriell
o Unvollständige Messwiederholung: Nur ein Faktor der ANOVA ist ein Messwiederholungsfaktor.
Beispiel: Effekte von Verhaltenstherapie, Gesprächstherapie und Psychoanalyse nach einer Woche, einem Monat und einem Jahr.
o Vollständige Messwiederholung: Beide Faktoren sind Messwiederholungsfaktoren.
Beispiel: Die Befindlichkeit von Schmerzpatienten wird im Verlauf einer Woche dreimal am Tag erhoben. Faktor 1 erfasst hier die Veränderung über den Tag hinweg, Faktor 2 den Einfluss des Wochentags.
Unvollständige Messwiederholung
Woche Monat Jahr
VT n 1 n 1 n 1
GT n 2 n 2 n 2
PA n 3 n 3 n 3
Vollständige Messwiederholung
Morgen Mittag Abend
Montag
Ngesamt
Dienstag
Mittwoch
Donnerstag
Freitag
Samstag
Sonntag
Vielen Dank für eure Aufmerksamkeit!
Arbeitsblatt 4
1. Erläutern Sie kurz den Begriff „Zufallseffekt“.
2. Welchen Vorteil kann es haben, einen Faktor als Zufallseffekt zu kodieren? Nennen sie ein Beispiel für eine entsprechende Fragestellung.
3. Mit welchen mittleren Quadratsummen (MS) werden die drei F-Brüche in einer 2-faktoriellen ANOVA mit Zufallseffekten auf Faktor B und festen Effekten auf Faktor A gebildet?
Ergebnis
1. Wenn ein Faktor (theoretisch) unendlich viele Abstufungen hat und für eine Untersuchung „zufällig“ einige davon ausgesucht werden, spricht man von Zufallseffekten.
2. Wenn ein Faktor als Zufallsfaktor betrachtet wird, so ist eine Generalisierung der Ergebnisse auf andere (nicht untersuchte) Stufen möglich.
3. ->
within
FaktorAxB
MS
MSF
FaktorAxB
FaktorA
MS
MSF
within
FaktorB
MS
MSF
Arbeitsblatt 4
4. Welche Vor- und Nachteile hat eine ANOVA mit Messwiederholung?
5. Sie berechnen eine ANOVA und stellen dabei fest, dass die Sphärizitätsannahme verletzt ist. Wie können Sie nun weiter vorgehen?
Ergebnisse 4.Vorteile:
Es werden weniger Versuchspersonen benötigt, da dieselben Vpn mehrmals getestet werden.Höhere Teststärke (Power), da die Fehlervarianz verringert wird. Die Varianz „zwischen“ Vpn ist eliminiert, da man die Vpn nur mit sich selbst vergleicht.
Nachteile:Sphärizitätsannahme (Zirkularitätsannahme) Sequenzeffekte (Reihenfolge der Testung kann Einfluss haben)Fehlende Daten zu einem Messzeitpunkt führen dazu, dass eine Person komplett (zu allen Messzeitpunkten) ausgeschlossen werden muss.
5. Wenn eine Korrektur der Freiheitsgrade (nach Greenhouse-Geisser) erfolgt, darf der F-Test dennoch interpretiert werden.
top related