hierarchische lineare modelle: mehrebenenmodelle€¦ · dr. matthias rudolf: m3 – multivariate...
TRANSCRIPT
Hierarchische lineare Modelle:
MehrebenenmodelleEine erste Einführung
in grundsätzliche Überlegungen und Vorgehensweisen
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 1
Inhaltsübersicht 1 Problemlage 2 Beispieldatensatz 3 Auswertungsalternativen
Auswertung der Einzeldaten Auswertung gemittelter Daten Auswertung mittels HLM
• Mehrebenen-Modell
4 Fazit und Ausblick
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 2
1 Problemlage
Voraussetzung der meisten statistischen Verfahren: Unabhängigkeit der Probanden
Statistische Verfahren sind i. d. R. nicht robust gegen Verletzungen der Unabhängigkeitsvoraussetzung
Grundannahme der Unabhängigkeit ist in typischen Anwendungssituationen verletzt, zum Beispiel ......
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 3
1 Problemlage Beispiel 1: Beschäftigte in Abteilungen Level 2: Abteilungen Bauabteilung – Mechanik – Außendienst
Level 1: Beschäftigte
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 4
1 Problemlage Beispiel 2: Schüler in Klassen Level 2: Klassen (jeweils 5. Klasse) Klasse A (n=18) – Klasse B (n=30) – Klasse C (n=25) Level 1: Schüler
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 5
1 Problemlage
Beispiel 3: Längsschnittdaten
Level 2: Proband Level 2-Prädiktoren z.B. Alter, Intelligenz
Level 1: Messzeitpunkt Level 1-Prädiktor z.B. Aufgabenkomplexität Kriterium z.B. Lösungsqualität
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 6
1 Problemlage hierarchische Datenstrukturen
Daten auf mehreren hierarchisch geordneten Ebenen
Einheiten innerhalb aller Ebenen klar definiert und beobachtbar
Jede Einheit einer niedrigeren Ebene ist eindeutig einer Einheit der übergeordneten Ebene zuzuordnen
Gruppen der unterschiedlichen Level können unterschiedlich groß sein
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 7
1 Problemlage
hierarchische Datenstrukturen Kriterium wird auf der untersten Ebene (Level 1)
gemessen (d.h. i.d.R. bei jedem einzelnen Probanden)
Prädiktoren werden auf allen Ebenen / in allen Levels erhoben
Problem: Beobachtungen innerhalb einzelner Gruppen der übergeordneten Levels sind eventuell nicht unabhängig voneinander, ähneln sich stärker als zwischen den Gruppen (gemeinsame Bedingungen, Gruppeneffekte, ...)
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 8
2 Denkbare LösungsansätzeAuswertung gemittelter Daten Problem: Informationsverluste, Teststärkeverluste
Auswertung der Einzeldaten Problem: verletzte Voraussetzung
Mehrebenen-Modellierung Problemangepasstes Vorgehen
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 9
2.1 Auswertung gemittelter Daten
Auswertung gemittelter Daten ohne explizite Berücksichtigung der hierarchischen Datenstruktur ungünstig wegen.... .... Reduzierung der Stichprobengröße auf die
Anzahl der Tätigkeiten (Anzahl der Level 2-Einheiten)
.... undifferenzierter Einbeziehung unterschiedlicher (in Größe, Varianz usw.) Tätigkeiten (Level 2-Einheiten)
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 10
2.2 Auswertung der Einzeldaten
Auswertung der Einzeldaten ohne explizite Berücksichtigung der hierarchischen Datenstruktur ungünstig wegen.... .... Verletzung der Voraussetzung der
Unabhängigkeit .... künstlicher Vervielfältigung der Level 2-
Prädiktoren, indem jedem Probanden (Level 1) der jeweilige Wert der Tätigkeit (Level 2) zugewiesen wird (besonders problematisch bei ungleich großen Level 2-Einheiten)
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 11
2.2 Auswertung der Einzeldaten
Beispiel aus Eid, Gollwitzer & Schmitt (2010). Statistik und Forschungsmethoden, Kapitel 19. Weinheim: Beltz
Beispiel zur Illustration möglicher Auswirkungen bei Verletzung der Unabhängigkeitsvoraussetzung.
Untersuchung des Zusammenhanges von UV: Verantwortung und AV: Arbeitszufriedenheit an Daten aus 3 Firmen
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 12
2.2 Auswertung der Einzeldaten Ökologischer Fehlschluss: Fälschliche Interpretation
eines Zusammenhanges bzw. eines Effekts, der auf der Ebene von Gruppen (Level-2-Einheiten) gefunden wurde, auf der Ebene von Individuen!
Vgl. Eid, Gollwitzer & Schmitt (2010). Statistik und Forschungsmethoden, Kapitel 19. Weinheim: Beltz
Ergebnis bei Annahme der Unabhängigkeit: negativer Zusammenhang!
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 13
2.2 Auswertung der Einzeldaten
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 14
2.3 ICC und Fehlerkomponenten
Beurteilung des Ausmaßes der „Nicht-Unabhängigkeit durch systematische Level-2-Unterschiede: Intraklassen-Korrelation (intraclass correlation ICC):
2 22 2
2 2 22 1
Level Level
gesamt Level Level
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 15
2.3 ICC und Fehlerkomponenten
Heuristische Illustration des ICC am Mini-Beispiel (keine korrekte Schätzung!):
2 0.56Firma As
8.2Firma Ay 6.2FirmaBy 2.2FirmaCy 2 6.22Ys
2 2 27.18 6.22 0.96Y innerhalb FirmenYs s s
2 1.76FirmaBs 2 0.56FirmaCs 2 0.96innerhalb Firmens
2 7.18Ys
2 22 2
2 2 22 1
6.22 0.877.18
Level Level
gesamt Level Level
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 16
2.3 ICC und Fehlerkomponenten
Weitergehende (heuristische) Fehlerkomponentenalalyse: Berechnung von 3 firmenspezifische Regressionsgleichungen
(Y: Arbeitszufriedenheit; X: Verantwortung):
Firma A: ymA = 7.24 + 0.37 · xmA + rmA (m=1,…,5) Firma B: ymB = -0.05 + 1.25 · xmB + rmB (m=1,…,5) Firma C: ymC = 1.04 + 0.15 · xmC + rmC (m=1,…,5)
Level-1-Residuen: rmA, rmB, rmC (m=1,…,5) mit
Varianz der Level-1-Residuen: Level-1-Varianz s2r
mi mi mir y y
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 17
2.3 ICC und Fehlerkomponenten
Weitergehende (heuristische) Fehlerkomponentenanalyse:
Variabilität der Regressionskonstanten b0 auf Ebene 2 b0A= 7.24, b0B= -0.05 , b0C= 1.04 Variabilität der Regressionskoeffizienten b1 auf Ebene 2 b1A= 0.37, b1B= 1.25, b1C= 0.15
Level-2-Residuen: u0A, u0B, u0C mit Level-2-Residuen: u1A, u1B, u1C mit
Varianz der Level-2-Residuen : Level-2-Varianz s2u0
Varianz der Level-2-Residuen : Level-2-Varianz s2u1
Kovarianz der Level-2-Residuen: Level-2-Kovarianz su0u1
0 2.74b
1 0.59b
0 0 0i iu b b 1 1 1i iu b b
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 18
2.4 2-Ebenen-Beispieldatensatz
Level 1: 100 Beschäftigte Kriterium: Leistung Prädiktor: Motivation
Level 2: 10 unterschiedliche Tätigkeiten Prädiktor: Profil der Tätigkeit
(Freiheitsgrade)
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 19
2.4 2-Ebenen-Beispieldatensatz Level 1-Daten: Level 2-Daten:
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 20
2.4 2-Ebenen-Beispieldatensatz
Folie Nr. 21Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM
2.4 2-Ebenen-Beispieldatensatz
Folie Nr. 22Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 23
Anforderungen an ein Mehrebenenmodell im Beispiel:
Modellierung der individuellen Leistungswerte in Abhängigkeit von der individuellen Motivation (Regressionskoeffizienten tätigkeitsabhängig).
Modellierung der unterschiedlichen Regressionskonstanten unter den Level-2-Stufen (Tätigkeiten) durch die unterschiedlichen Tätigkeitsprofile (Level 2-Prädiktor).
Modellierung der unterschiedlichen Regressionsanstiege (d.h. der unterschiedlichen Abhängigkeiten von Motivation und Leistung) unter den Level-2-Stufen (Tätigkeiten) durch die unterschiedlichen Tätigkeitsprofile (Level 2-Prädiktor).
2.5. Mehrebenenmodell
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 24
Tätigkeits-Profil Fehlerkomponenten
Level 2
Fehler Level 1Motivation Leistung
Level 2:
Level 1:
2.5. Mehrebenenmodell
2.5. Mehrebenenmodell
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 25
Level 1-Regressionsgleichung
yij = b0j + b1j · xij + rij (i=1,...,nj, j=1,...,p))
bzw. Leistungij = b0j + b1j · Motivationij + rij
yij: Kriteriumswert des i-ten Pb unter j-ter L. 2-Stufe b0j: Regressionskonstante unter j-ter Level 2-Stufe b1j: Regressionskoeffizient unter j-ter Level 2-Stufe xij: Prädiktorwert des i-ten Pb unter j-ter Level 2-Stufe rij: Fehlerterm des i-ten Pb unter j-ter Level 2-Stufe p: Anzahl der Level 2-Stufen nj: Anzahl der Pb unter j-ter Level 2-Stufe
2.5. Mehrebenenmodell
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 26
Level 2-Regressionsgleichung
Level 1-Gleichung (1 Level 1-Prädiktor): yij = b0j + b1j · xij + rij bzw. Leistungij = b0j + b1j · Motivationij + rij
Level 2-Gleichungen (1 Level 2-Prädiktor): b0j = g00 + g01 · zj + u0j bzw. b0j = g00 + g01 · Profilj + u0j
b1j = g10 + g11 · zj + u1j bzw. b1j = g10 + g11 · Profilj + u1j
zj: Level 2-Prädiktor unter j-ter Stufe b0j,b1j: gruppenspezifische Level 1-Regr.-koeff. g00, g01, g10, g11: Level 2-Regressionskoeffizienten u0j: gruppenspezifische Fehlerkomponente von b0j u1J: gruppenspezifische Fehlerkomponente von b1j
2.5. Mehrebenenmodell
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 27
yij: Leistung
rij: Fehler Level 1xij: Motivation
1: Konstante
b1j
b0j
zj: Profil u0j: Fehler Level 2u1j: Fehler Level 2
g01 g11
2.5. Mehrebenenmodell
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 28
Ergebnisse im Beispiel Level 1-Gleichung: Leistungij = b0j + b1j · Motivationij+ rij
Level 2-Gleichungen: b0j = 2461 + 15 · Profilj + u0j b1j = 43 + 0.2 · Profilj + u1j
Varianz(u0) nicht signifikantVarianz(u1) nicht signifikant
Literatur und Software Ausgewählte Literatur:
Petrenz, M. (2016): Möglichkeiten der Umsetzung von Hierarchischen Linearen Modellen in SPSS im Kontext der Blickbewegungsforschung. Masterarbeit, TU Dresden, Studiengang Psychologie: HPSTS
Raudenbush, S.W. & Bryk, A.S. (2002). Hierarchical Linear Models. Applicationsand Data Analysis Methods (Second Edition). Thousand Oakes: Sage.
Heck, R.H. & Scott, T.L. (2009). An Introduction to Multilevel Modeling Techniques. New York: Routledge.
Eid, M., Gollwitzer, M. & Schmitt, M. (2010). Statistik und Forschungsmethoden, Kapitel 19. Weinheim: Beltz.
Hox, J.J. (2010). Multilevel Analysis: Techniques and Applications. Taylor & Francis.
Luke, Douglas,A. (2004). Multilevel Modeling. Thousand Oakes: Sage.
Software: HLM, SPSS, Mplus, Stata, R u.a.
Dr. Matthias Rudolf: M3 – Multivariate Statistik – Vorlesung Einführung HLM Folie Nr. 29