lineare nichtlineare zusammenhänge - tu-chemnitz.de · • hier: f = 0.5 Æ0.5 x 20 = 10 Æ10...
TRANSCRIPT
02.06.2009
1
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
• Nicht‐lineareZusammenhänge
• Lowess und Potenzleiter• Partialkorrelation
Thomas Schäfer | SS 2009 1
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Was Sie schon wissen:
• Zusammenhänge sind die Grundlage der Methodenlehre
Lineare vs. nichtlineare Zusammenhänge
• alle Unterschiedsfragestellungen lassen sich als Zusammenhangsfragestellungen ausdrücken
• es geht immer um Varianzaufklärung
• das ALM bildet die mathematische Grundlage für die Untersuchung von Zusammenhängen
• aus dem ALM folgt direkt die (Multiple) Regression
Thomas Schäfer | SS 2009
aus dem ALM folgt direkt die (Multiple) Regression
• Voraussetzung: die Zusammenhänge müssen linear sein
Problem: Was macht man bei nicht‐linearen Zusammenhängen?
2
02.06.2009
2
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
• lineare Zusammenhänge
Lineare vs. nichtlineare Zusammenhänge
YY
Thomas Schäfer | SS 2009 3
X
Abweichungsquadrat
X
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Zunächst: • nicht‐lineare Zusammenhänge
sind anhand des Korrelations
Lineare vs. nichtlineare Zusammenhänge
sind anhand des Korrelations‐koeffizienten nicht zu entdecken!
• dieser lässt sich immer berechnen und setzt eine lineare Korrelation voraus
• Verletzungen der Linearität sind immer visuell zu prüfen
• daher immer die Streudiagramme
Thomas Schäfer | SS 2009
• daher immer die Streudiagramme ansehen
4
02.06.2009
3
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Beispiele Explizite ReligiositätSpiritualitätGenerativitätNaturverbundenheitSoziales EngagementGesundheitSelbsterkenntnisIndividualismusHerausforderungEntwicklungMachtF ih itFreiheitKreativitätWissenLeistungVernunftTraditionMoralBodenständigkeitGemeinschaftSpaßLiebeHarmonieWellnessFürsorgeBewusstes Erleben
Funktion des Zusammenhangs von Sinnerfüllung mit der Breite der Lebensbedeutungen
Thomas Schäfer | SS 2009 5
der Breite der Lebensbedeutungen
Solche Zusammenhänge kann man noch mit Hilfe einer Rangkorrelation beschreiben, da die Kurven monoton steigen
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Wie findet man heraus, ob Zusammenhänge linear sind?
• Streudiagramm(matrix)
Lineare vs. nichtlineare Zusammenhänge
• Lowess‐KurveStreudiagramme
Thomas Schäfer | SS 2009 6
02.06.2009
4
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Lineare vs. nichtlineare Zusammenhänge
Streudiagramm‐Matrix
Thomas Schäfer | SS 2009 7
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Wie sieht ein bivariaterZusammenhang tatsächlich aus?
LOWESS ‐ LOcally WEighted Scatterplot Smoother
Prinzip: Jedem Punkt wird eineneue Position zugewiesen, und zwar so, dass der Punkt sichbesser in das Muster seiner Nachbarpunkte einfügt. Das Ergebnis ist eine geglättete(smoothed) Linie, die den
Thomas Schäfer | SS 2009
Zusammenhang der Variablenwiderspiegelt.
8
02.06.2009
5
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Schritt 1
• ein Wert f wird festgelegt, der darüber entscheidet, wie viele Nachbarpunkte in die
LOWESS
entscheidet, wie viele Nachbarpunkte in die Glättung einbezogen werden sollen
• ein großer f‐Wert führt zu einer starken Glättung der Kurve
• f wird mit der Anzahl aller Punkte multipliziert, um die Anzahl relevanter Nachbarpunkte zu erhalten
• hier: f = 0.5 0.5 x 20 = 10 10 Nachbarpunkte werden berücksichtigt (incl dem Ausgangspunkt)
Thomas Schäfer | SS 2009
werden berücksichtigt (incl. dem Ausgangspunkt)
9
das Beispiel zeigt die Glättung dieses Punktes
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Schritt 2
• eine Gewichtungsfunktion weist jedem Nachbarpunkt ein Gewicht zu, mit dem er auf die
LOWESS
Nachbarpunkt ein Gewicht zu, mit dem er auf die neue Position des Punktes Einfluss nimmt
• nahe Punkte haben einen großen, ferne Punkte einen schwachen Einfluss
Thomas Schäfer | SS 2009 10
Gewichtungsfunktion um den Ausgangspunkt herum
02.06.2009
6
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Schritte 3 und 4
• durch alle beteiligten Punkte wird eine Regressionsgerade gelegt, und zwar nicht nach
LOWESS
Regressionsgerade gelegt, und zwar nicht nach dem Prinzip der kleinsten Quadrate, sondern nach dem Prinzip der der gewichteten kleinsten Quadrate (weighted least squares ‐WLS)
• der Ausgangspunkt wird nun auf die Gerade geschoben und erhält so seine neue Position
Thomas Schäfer | SS 2009 11
der Ausgangspunkt erhält eine neue Position und liegt nun weiter oben
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Ergebnis
• der Punkt hat eine neue Lage in der ursprünglichen Punktewolke
LOWESS
ursprünglichen Punktewolke
• diese Prozedur wird für alle Ausgangspunkte wiederholt
• im Ergebnis liegen alle Punkte auf eine ungefähren Linie
Thomas Schäfer | SS 2009 12
neue Position des Punktes
02.06.2009
7
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Behandlung der „äußeren“ Werte:
LOWESS
Kann die Gewichtungs‐funktion nicht symmetrisch zu beiden Seiten des Punktes aufgespannt werden, nimmt man auf der einen Seite entsprechend mehr Punkte hinzu (hier: die 9 Punkte links
Thomas Schäfer | SS 2009
vom betreffenden Punkt)
13
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
LOWESS – das Ergebnislinear
f = 0.3 f = 0.9
Thomas Schäfer | SS 2009 14
02.06.2009
8
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
• Streudiagramm doppelklicken
• Anpassungslinie einfügen
LOWESS in SPSS
• Lowess wählen
• f‐Wert einstellen
f ‐Wert
Thomas Schäfer | SS 2009 15
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
• nach dem Anschauen der Lowess‐Kurve muss man entscheiden, ob man den Zusammenhang noch als
LOWESS – das Ergebnis
man den Zusammenhang noch als hinreichend linear „durchgehen lassen“ kann
• wenn nicht, muss der Zusammenhang „gerade gebogen“ werden, bevor man eine Korrelation berechnen kann
Thomas Schäfer | SS 2009
berechnen kann
Potenzleiter
16
02.06.2009
9
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Potenzleiter: Wie biege ich eine Kurve gerade?
xpotenzhinauf: potenz > 1, z. B. x2, x3 ...
hinunter: potenz < 1, z.B. x 0,5, log x, x‐0,5, x‐1, x‐2 ...
Thomas Schäfer | SS 2009 17
Graphische Darstellung der Potenzleiter. Für jedes der vier Kreissegmente zeigen die zwei dazugehörigen Pfeile an, in welche Richtung der Potenzleiter die X‐ und die Y‐Variablen verändert werden müssen, um eine lineare Beziehung zwischen beiden Variablen zu erreichen. So müsste beispielsweise für die Art der unter a) gezeigten Krümmung entweder die Potenz der Y‐Variable erhöht oder/und die der X‐Variable erniedrigt werden.
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Potenzleiter
riabl
e
1,0,9,8,7,65 X hinunter
1,0,9,8
1,0,9,8
X-Variable
10987654321
Y-Va
r ,5,4,3,2,1
0,0
Thomas Schäfer | SS 2009 18
X^0,5 (Wurzel aus X)
3,53,02,52,01,51,0
Y-Va
riabl
e ,7,6,5,4,3,2,1
0,0
Logarithmus von X (ln)
2,52,01,51,0,50,0
Y-Va
riabl
e ,7,6,5,4,3,2,1
0,0
02.06.2009
10
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Potenzleiteria
ble
1000900800700600500
X-Variable
10987654321
Y-Va
r 500400300200100
0
1000900800
1000900800
X hinauf
Thomas Schäfer | SS 2009 19
X hoch 3
10008006004002000
Y-Va
riabl
e 700600500400300200100
0
X zum Quadrat
100806040200
Y-Va
riabl
e 700600500400300200100
0
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Alternative zur Potenzleiter per Hand: Kurvenanpassung in SPSS
• allerdings nur für vordefinierte Kurven möglich
Potenzleiter
• nur für Regression, nicht für Korrelation
Thomas Schäfer | SS 2009 20
02.06.2009
11
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Beispiel zu LOWESS & Potenzleiter
500
600
700
)
Rat
ing"
0 200 400 600 800 10000
100
200
300
400
Nennungen in NY-Times
"Kno
wle
dge
R
Thomas Schäfer | SS 2009 21
Zusammenhang zwischen Häufigkeit der Nennung eines Landes in der New York Times und der Einschätzung des eigenen Wissens über dieses Land („Knowledge rating“) – ursprünglicher Zusammenhang mit Regressionsgerade (r2 = 0,49)
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Beispiel zu LOWESS & Potenzleiter
400
500
600
700
400
500
600
700
Rat
ing"
e R
atin
g"
Demonstration des Prinzips der Potenzleiter mit Hilfe der LOWESS‐Prozedur
0 200 400 600 800 10000
100
200
300
0 10 20 300
100
200
300
500
600
700
500
600
700
a) Originalwerte b) Exponent: 0,5
ng"
ng"
"Kno
wle
dge
"Kno
wle
dge Prozedur
Thomas Schäfer | SS 2009 22
0 1 2 3 4 5 60
100
200
300
400
500
-2 0 2 4 6 80
100
200
300
400
500
c) Exponent: 0,25 d) Exponent: 0 (ln)
"Kno
wle
dge
Rat
in
"Kno
wle
dge
Rat
in
02.06.2009
12
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Beispiel zu LOWESS & Potenzleiter
500
600
700
ting"
0 1 2 3 4 5 60
100
200
300
400
500
"Kno
wle
dge
Rat
Thomas Schäfer | SS 2009 23
Konstruktion der Regressionsgeraden nach Begradigung des Zusammenhangs mit Hilfe der Potenzleiter (r2 = .66).
Nennungen (Exponent: 0,25)
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Bei Nichtlinearität von Variablen, die in linearen Verfahren benutzt werden sollen, wie z.B.R i lti l R i
LOWESS & Potenzleiter – Anwendungsmöglichkeiten
• Regression, multiple Regression• Faktorenanalyse• Strukturgleichungsmodelle
Anwendungsvoraussetzung:
M K ü d h iß fü K d S i
Thomas Schäfer | SS 2009
• Monotone Krümmungen, das heißt, für Kurven deren Steigung kontinuierlich zu‐ oder abnimmt und dabei nicht das Vorzeichen (den Trend) wechselt
24
02.06.2009
13
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
• Korrelationen zwischen zwei Variablen sind selten wirklich „rein“, meist gibt es weitere Variablen, die diesen Zusammenhang beeinflussen
Partialkorrelation
Zusammenhang beeinflussen
• deren Einfluss kann mit Hilfe der Partialkorrelation eliminiert werden
• die störenden Variablenwerden „auspartialisiert“(bzw. der Zusammenhang
Thomas Schäfer | SS 2009
wird um den Einfluss derstörenden Variable(n)bereinigt)
25
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
• Korrelationen, die alle Alternativerklärungen ausschließen, finden wir nur bei Experimenten
b h ll ll k l
Partialkorrelation
• bei nicht‐experimentellen Designs mit intervallskalierter UV können Stör‐ bzw. Drittvariablen im nachhinein mit Hilfe der Partialkorrelation statistisch kontrolliert werden (als Alternative zur Kovarianzanalyse bei nominal skalierter UV)
• wenn nach Auspartialisieren der Drittvariable der Zusammenhang zwischen X und Y kleiner wird, dann kann er d h di D i i bl h i
Thomas Schäfer | SS 2009
durch die Drittvariable verursacht gewesen sein
• wenn nach Auspartialisieren der Zusammenhang nicht kleiner wird, ist die Drittvariable als Ursache ausgeschlossen
26
02.06.2009
14
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Partialkorrelation
rXY.ZKorrelation zwischen den Variablen X und Y nachdem derKorrelation zwischen den Variablen X und Y, nachdem der lineare Einfluss der Variablen Z entfernt wurde
oder (äquivalent):
rrrrr
ryzxz
yzxzxyzxy 22.
11 −−
−=
Thomas Schäfer | SS 2009 27
Korrelation zwischen den Residualwerten von X und Y, nachdem X und Y aus Z vorhergesagt wurden
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
• Darstellung als Venn‐Diagramm (die Flächen repräsentieren die Varianz einer Variable)
fl f
Partialkorrelation
TV (x)• Einfluss von z entfernen TV (x)
Schicht (z)Schule (y)
Blau schraffiert: Korrelation zwischen TV und Schule
Rot schraffiert: Anteil dieser Korrelation, der durch Schicht
ht i d
Thomas Schäfer | SS 2009 28
verursacht wird
rrrrr
ryzxz
yzxzxyzxy 22.
11 −−
−=
02.06.2009
15
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Wiederholung Residualwerte
• nach einer Regression von Y auf X bleiben die Residualwerte übrig
• sie enthalten Messfehler und den Einfluss anderer Variablen außer XEinfluss anderer Variablen außer X
• sie werden als neue Variable gespeichert
• ihre Varianz kann nicht mehr von X beeinflusst sein
Thomas Schäfer | SS 2009 29
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
• alternativ: Korrelation zwischen den Residualwerten von Xund Y, nachdem X und Y aus Z vorhergesagt wurden
Partialkorrelation
TV (x)
S hi ht ( )Schule (y)
TV (x)
S h l ( )
Regression
Residuen
Thomas Schäfer | SS 2009 30
Schicht (z) Schule (y)
Regression
die verbleibende Korrelation kann mit z nichts mehr zu tun haben
02.06.2009
16
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Partialkorrelation ‐ Beispiel
Korrelation
Partialkorrelation
Thomas Schäfer | SS 2009 31
Partialkorrelation
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Partialkorrelation ‐ Beispiel
Regression von FE auf IQ Residuum FERegression von SK auf IQ Residuum SK
Korrelation der Residuen
Thomas Schäfer | SS 2009 32
Korrelation der Residuen
02.06.2009
17
methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.
Semipartialkorrelation
TV (x)Residuum
Schule (y)
Bei der Semipartialkorrelation wird x (der Prädiktor) bezüglich einer Drittvariablen z residualisiert und dieses Residuum mit y (dem Kriterium) korreliert
die Drittvariable wird also nur
Thomas Schäfer | SS 2009 33
die verbleibende Korrelation spiegelt den Varianzanteil in y wider, der von x zusätzlich zu z
erklärt wird
aus einer Variable auspartialisiert