lineare nichtlineare zusammenhänge - tu-chemnitz.de · • hier: f = 0.5 Æ0.5 x 20 = 10 Æ10...

02.06.2009

1

methodenlehre ll – Nichtlineare Zusammenh. & Partialkorr.

• Nicht‐lineareZusammenhänge

• Lowess und Potenzleiter• Partialkorrelation

Thomas Schäfer | SS 2009 1


Was Sie schon wissen:

• Zusammenhänge sind die Grundlage der Methodenlehre

Lineare vs. nichtlineare Zusammenhänge

• alle Unterschiedsfragestellungen lassen sich als Zusammenhangsfragestellungen ausdrücken

• es geht immer um Varianzaufklärung

• das ALM bildet die mathematische Grundlage für die Untersuchung von Zusammenhängen

• aus dem ALM folgt direkt die (Multiple) Regression

Thomas Schäfer | SS 2009

aus dem ALM folgt direkt die (Multiple) Regression

• Voraussetzung: die Zusammenhänge müssen linear sein

Problem: Was macht man bei nicht‐linearen Zusammenhängen?

2

02.06.2009

2


• lineare Zusammenhänge


YY


X

Abweichungsquadrat

X


Zunächst: • nicht‐lineare Zusammenhänge

sind anhand des Korrelations


sind anhand des Korrelations‐koeffizienten nicht zu entdecken!

• dieser lässt sich immer berechnen und setzt eine lineare Korrelation voraus

• Verletzungen der Linearität sind immer visuell zu prüfen

• daher immer die Streudiagramme


• daher immer die Streudiagramme ansehen

4

02.06.2009

3


Beispiele Explizite ReligiositätSpiritualitätGenerativitätNaturverbundenheitSoziales EngagementGesundheitSelbsterkenntnisIndividualismusHerausforderungEntwicklungMachtF ih itFreiheitKreativitätWissenLeistungVernunftTraditionMoralBodenständigkeitGemeinschaftSpaßLiebeHarmonieWellnessFürsorgeBewusstes Erleben

Funktion des Zusammenhangs von Sinnerfüllung mit der Breite der Lebensbedeutungen


der Breite der Lebensbedeutungen

Solche Zusammenhänge kann man noch mit Hilfe einer Rangkorrelation beschreiben, da die Kurven monoton steigen


Wie findet man heraus, ob Zusammenhänge linear sind?

• Streudiagramm(matrix)


• Lowess‐KurveStreudiagramme


02.06.2009

4



Streudiagramm‐Matrix



Wie sieht ein bivariaterZusammenhang tatsächlich aus?

LOWESS ‐ LOcally WEighted Scatterplot Smoother

Prinzip: Jedem Punkt wird eineneue Position zugewiesen, und zwar so, dass der Punkt sichbesser in das Muster seiner Nachbarpunkte einfügt. Das Ergebnis ist eine geglättete(smoothed) Linie, die den


Zusammenhang der Variablenwiderspiegelt.

8

02.06.2009

5


Schritt 1

• ein Wert f wird festgelegt, der darüber entscheidet, wie viele Nachbarpunkte in die

LOWESS

entscheidet, wie viele Nachbarpunkte in die Glättung einbezogen werden sollen

• ein großer f‐Wert führt zu einer starken Glättung der Kurve

• f wird mit der Anzahl aller Punkte multipliziert, um die Anzahl relevanter Nachbarpunkte zu erhalten

• hier: f = 0.5 0.5 x 20 = 10 10 Nachbarpunkte werden berücksichtigt (incl dem Ausgangspunkt)


werden berücksichtigt (incl. dem Ausgangspunkt)

9

das Beispiel zeigt die Glättung dieses Punktes


Schritt 2

• eine Gewichtungsfunktion weist jedem Nachbarpunkt ein Gewicht zu, mit dem er auf die

LOWESS

Nachbarpunkt ein Gewicht zu, mit dem er auf die neue Position des Punktes Einfluss nimmt

• nahe Punkte haben einen großen, ferne Punkte einen schwachen Einfluss


Gewichtungsfunktion um den Ausgangspunkt herum

02.06.2009

6


Schritte 3 und 4

• durch alle beteiligten Punkte wird eine Regressionsgerade gelegt, und zwar nicht nach

LOWESS

Regressionsgerade gelegt, und zwar nicht nach dem Prinzip der kleinsten Quadrate, sondern nach dem Prinzip der der gewichteten kleinsten Quadrate (weighted least squares ‐WLS)

• der Ausgangspunkt wird nun auf die Gerade geschoben und erhält so seine neue Position


der Ausgangspunkt erhält eine neue Position und liegt nun weiter oben


Ergebnis

• der Punkt hat eine neue Lage in der ursprünglichen Punktewolke

LOWESS

ursprünglichen Punktewolke

• diese Prozedur wird für alle Ausgangspunkte wiederholt

• im Ergebnis liegen alle Punkte auf eine ungefähren Linie


neue Position des Punktes

02.06.2009

7


Behandlung der „äußeren“ Werte:

LOWESS

Kann die Gewichtungs‐funktion nicht symmetrisch zu beiden Seiten des Punktes aufgespannt werden, nimmt man auf der einen Seite entsprechend mehr Punkte hinzu (hier: die 9 Punkte links


vom betreffenden Punkt)

13


LOWESS – das Ergebnislinear

f = 0.3 f = 0.9


02.06.2009

8


• Streudiagramm doppelklicken

• Anpassungslinie einfügen

LOWESS in SPSS

• Lowess wählen

• f‐Wert einstellen

f ‐Wert



• nach dem Anschauen der Lowess‐Kurve muss man entscheiden, ob man den Zusammenhang noch als

LOWESS – das Ergebnis

man den Zusammenhang noch als hinreichend linear „durchgehen lassen“ kann

• wenn nicht, muss der Zusammenhang „gerade gebogen“ werden, bevor man eine Korrelation berechnen kann


berechnen kann

Potenzleiter

16

02.06.2009

9


Potenzleiter: Wie biege ich eine Kurve gerade?

xpotenzhinauf: potenz > 1, z. B. x2, x3 ...

hinunter: potenz < 1, z.B. x 0,5, log x, x‐0,5, x‐1, x‐2 ...


Graphische Darstellung der Potenzleiter. Für jedes der vier Kreissegmente zeigen die zwei dazugehörigen Pfeile an, in welche Richtung der Potenzleiter die X‐ und die Y‐Variablen verändert werden müssen, um eine lineare Beziehung zwischen beiden Variablen zu erreichen. So müsste beispielsweise für die Art der unter a) gezeigten Krümmung entweder die Potenz der Y‐Variable erhöht oder/und die der X‐Variable erniedrigt werden.


Potenzleiter

riabl

e

1,0,9,8,7,65 X hinunter

1,0,9,8

1,0,9,8

X-Variable

10987654321

Y-Va

r ,5,4,3,2,1

0,0


X^0,5 (Wurzel aus X)

3,53,02,52,01,51,0

Y-Va

riabl

e ,7,6,5,4,3,2,1

0,0

Logarithmus von X (ln)

2,52,01,51,0,50,0

Y-Va

riabl

e ,7,6,5,4,3,2,1

0,0

02.06.2009

10


Potenzleiteria

ble

1000900800700600500

X-Variable

10987654321

Y-Va

r 500400300200100

0

1000900800

1000900800

X hinauf


X hoch 3

10008006004002000

Y-Va

riabl

e 700600500400300200100

0

X zum Quadrat

100806040200

Y-Va

riabl

e 700600500400300200100

0


Alternative zur Potenzleiter per Hand: Kurvenanpassung in SPSS

• allerdings nur für vordefinierte Kurven möglich

Potenzleiter

• nur für Regression, nicht für Korrelation


02.06.2009

11


Beispiel zu LOWESS & Potenzleiter

500

600

700

)

Rat

ing"

0 200 400 600 800 10000

100

200

300

400

Nennungen in NY-Times

"Kno

wle

dge

R


Zusammenhang zwischen Häufigkeit der Nennung eines Landes in der New York Times und der Einschätzung des eigenen Wissens über dieses Land („Knowledge rating“) – ursprünglicher Zusammenhang mit Regressionsgerade (r2 = 0,49)



400

500

600

700

400

500

600

700

Rat

ing"

e R

atin

g"

Demonstration des Prinzips der Potenzleiter mit Hilfe der LOWESS‐Prozedur

0 200 400 600 800 10000

100

200

300

0 10 20 300

100

200

300

500

600

700

500

600

700

a) Originalwerte b) Exponent: 0,5

ng"

ng"

"Kno

wle

dge

"Kno

wle

dge Prozedur


0 1 2 3 4 5 60

100

200

300

400

500

-2 0 2 4 6 80

100

200

300

400

500

c) Exponent: 0,25 d) Exponent: 0 (ln)

"Kno

wle

dge

Rat

in

"Kno

wle

dge

Rat

in

02.06.2009

12



500

600

700

ting"

0 1 2 3 4 5 60

100

200

300

400

500

"Kno

wle

dge

Rat


Konstruktion der Regressionsgeraden nach Begradigung des Zusammenhangs mit Hilfe der Potenzleiter (r2 = .66).

Nennungen (Exponent: 0,25)


Bei Nichtlinearität von Variablen, die in linearen Verfahren benutzt werden sollen, wie z.B.R i lti l R i

LOWESS & Potenzleiter – Anwendungsmöglichkeiten

• Regression, multiple Regression• Faktorenanalyse• Strukturgleichungsmodelle

Anwendungsvoraussetzung:

M K ü d h iß fü K d S i


• Monotone Krümmungen, das heißt, für Kurven deren Steigung kontinuierlich zu‐ oder abnimmt und dabei nicht das Vorzeichen (den Trend) wechselt

24

02.06.2009

13


• Korrelationen zwischen zwei Variablen sind selten wirklich „rein“, meist gibt es weitere Variablen, die diesen Zusammenhang beeinflussen

Partialkorrelation

Zusammenhang beeinflussen

• deren Einfluss kann mit Hilfe der Partialkorrelation eliminiert werden

• die störenden Variablenwerden „auspartialisiert“(bzw. der Zusammenhang


wird um den Einfluss derstörenden Variable(n)bereinigt)

25


• Korrelationen, die alle Alternativerklärungen ausschließen, finden wir nur bei Experimenten

b h ll ll k l

Partialkorrelation

• bei nicht‐experimentellen Designs mit intervallskalierter UV können Stör‐ bzw. Drittvariablen im nachhinein mit Hilfe der Partialkorrelation statistisch kontrolliert werden (als Alternative zur Kovarianzanalyse bei nominal skalierter UV)

• wenn nach Auspartialisieren der Drittvariable der Zusammenhang zwischen X und Y kleiner wird, dann kann er d h di D i i bl h i


durch die Drittvariable verursacht gewesen sein

• wenn nach Auspartialisieren der Zusammenhang nicht kleiner wird, ist die Drittvariable als Ursache ausgeschlossen

26

02.06.2009

14


Partialkorrelation

rXY.ZKorrelation zwischen den Variablen X und Y nachdem derKorrelation zwischen den Variablen X und Y, nachdem der lineare Einfluss der Variablen Z entfernt wurde

oder (äquivalent):

rrrrr

ryzxz

yzxzxyzxy 22.

11 −−

−=


Korrelation zwischen den Residualwerten von X und Y, nachdem X und Y aus Z vorhergesagt wurden


• Darstellung als Venn‐Diagramm (die Flächen repräsentieren die Varianz einer Variable)

fl f

Partialkorrelation

TV (x)• Einfluss von z entfernen TV (x)

Schicht (z)Schule (y)

Blau schraffiert: Korrelation zwischen TV und Schule

Rot schraffiert: Anteil dieser Korrelation, der durch Schicht

ht i d


verursacht wird

rrrrr

ryzxz

yzxzxyzxy 22.

11 −−

−=

02.06.2009

15


Wiederholung Residualwerte

• nach einer Regression von Y auf X bleiben die Residualwerte übrig

• sie enthalten Messfehler und den Einfluss anderer Variablen außer XEinfluss anderer Variablen außer X

• sie werden als neue Variable gespeichert

• ihre Varianz kann nicht mehr von X beeinflusst sein



• alternativ: Korrelation zwischen den Residualwerten von Xund Y, nachdem X und Y aus Z vorhergesagt wurden

Partialkorrelation

TV (x)

S hi ht ( )Schule (y)

TV (x)

S h l ( )

Regression

Residuen


Schicht (z) Schule (y)

Regression

die verbleibende Korrelation kann mit z nichts mehr zu tun haben

02.06.2009

16


Partialkorrelation ‐ Beispiel

Korrelation

Partialkorrelation


Partialkorrelation


Partialkorrelation ‐ Beispiel

Regression von FE auf IQ Residuum FERegression von SK auf IQ Residuum SK

Korrelation der Residuen


Korrelation der Residuen

02.06.2009

17


Semipartialkorrelation

TV (x)Residuum

Schule (y)

Bei der Semipartialkorrelation wird x (der Prädiktor) bezüglich einer Drittvariablen z residualisiert und dieses Residuum mit y (dem Kriterium) korreliert

die Drittvariable wird also nur


die verbleibende Korrelation spiegelt den Varianzanteil in y wider, der von x zusätzlich zu z

erklärt wird

aus einer Variable auspartialisiert

lineare nichtlineare zusammenhänge - tu-chemnitz.de · • hier: f = 0.5 Æ0.5 x 20 = 10 Æ10...

Documents