statistik i Übung - uni-goettingen.de · statistik i Übung – statistik und tabellenkalkulation?...
TRANSCRIPT
Statistik I Übung – Statistik und Tabellenkalkulation?
1Göttingen27. Juni 2007
Statistik I Übung
1Göttingen27. Juni 2007
11. Zusammenhangsmaßefür nominale Variablen
Dozent: Jürgen Leibold
Statistik I Übung – Statistik und Tabellenkalkulation?
2Göttingen27. Juni 2007
Übersicht
Evaluation
Nominale Zusammenhangsmaße
Chi-Quadrat Phi Cramers V
Statistik I Übung – Statistik und Tabellenkalkulation?
3Göttingen27. Juni 2007
Nominale Zusammenhangsmaße
Statistik I Übung – Statistik und Tabellenkalkulation?
4Göttingen27. Juni 2007
EWL (X)AWL (Y) gesamt
e11 e12 464e21 e22 3025
gesamt 1703 1786 3489
gut (x1) nicht gut (x2)gut (y1)nicht gut (y2)
Randverteilung Erwartete Häufigkeiten
e11=n1 °∗n° 1n
EWL (X)AWL (Y) gesamt
226,5 237,5 4641467,5 1548,5 3025
gesamt 1703 1786 3489
gut (x1) nicht gut (x2)gut (y1)nicht gut (y2)
Erwartete Häufigkeiten e11=464∗17033489
=226.5
EWL (X)AWL (Y) gesamt
338 126 4641365 1660 3025
gesamt 1703 1786 3489
gut (x1) nicht gut (x2)gut (y1)nicht gut (y2)
Empirische Häufigkeiten
Statistik I Übung – Statistik und Tabellenkalkulation?
5Göttingen27. Juni 2007
Chi-Quadrat
F19 Geschlecht
männlich weiblich Gesamt ErgebnisJa 30 (29,05) 41 (41,95) 71nein 15 (15,95) 24 (23,05) 39Gesamt Ergebnis 45 65 110
F12 Können Sie mit einem Summen-zeichen umgehen?'
( ) ( ) ( ) ( ) ( )2 2 2 2 2jI
ij ij 11 12 21 222
i 1 j 1 ij 11 12 21 22
n e a e b e c e d ee e e e e= =
− − − − −χ = = + + +∑∑
( ) ( ) ( ) ( )2 2 2 22 30 29,05 41 41.95 15 15.95 24 23,05
0,1483229.05 41.95 15,95 23.05− − − −
χ = + + + =
e11=n1 °∗n° 1n
Statistik I Übung – Statistik und Tabellenkalkulation?
6Göttingen27. Juni 2007
( ) ( ) ( ) ( ) ( )2 2 2 2 2jI
ij ij 11 12 21 222
i 1 j 1 ij 11 12 21 22
n e a e b e c e d ee e e e e= =
− − − − −χ = = + + +∑∑
( ) ( )( ) ( ) ( ) ( )
2 211 22 12 212
1 2 1 2
n n n n a d b cn n
n n n n a b c d a c b d⋅ − ⋅ ⋅ − ⋅
χ = ⋅ = ⋅⋅ ⋅ ⋅ + ⋅ + ⋅ + ⋅ +g g g g
alternative Formel:
Wenn der Chiquadratwert hohe Werte annimmt, ist die Nullhypothese eher abzulehnen. Dies ist auch daher nahe liegend, weil bei gültiger Nullhypothese keine oder nur geringe Differenzen zwischen beobachteten und erwarteten Häufigkeiten auftreten sollten und entsprechend die Chiquadratstatistik klein sein sollte.
Anmeldung.ods Tabelle 7
Statistik I Übung – Statistik und Tabellenkalkulation?
7Göttingen27. Juni 2007
Die Interpretation Ф erfolgt analog zur Prozentsatzdifferenz:-.05 < Φ < +.05 praktisch kein Zusammenhang;.05 ≤ |Φ| < .10 geringer Zusammenhang.10 ≤ |Φ| < .25 mittlerer Zusammenhang, |Φ| ≥ .25 darüber: starker Zusammenhang
Anmeldung.ods Tabelle 8
Phi-Quadrat und PhiIn einer Vierfeldertafel ist der maximale Wert von χ² gleich dem Stichprobenumfang n.Bei der Berechnung von Φ² wird die Fallzahlabhängigkeit von χ² dadurch berücksichtigt, dass χ² durch n geteilt wird.
²= x²n
= x²n = ad−bc abcd acbd
Statistik I Übung – Statistik und Tabellenkalkulation?
8Göttingen27. Juni 2007
••
χ χ= = = =⋅ − − ⋅χ
max
2 2
2252.4V 0.24
n min(I 1, J 1) 2168 2
Mehrere Felder → Cramers V
χ2max = n••⋅Minimum von I−1 oder J−1
In einer IJ-Kreuztabelle ist der Maximalwert von χ² gleich dem Produkt aus der Fallzahl und dem Minimum der Spalten- oder Zeilenzahl minus eins:
Die Interpretation ist wie bei Φ : Es besteht eine mittelstarke Beziehung. Im Unterschied zu Φ hat V kein Vorzeichen, da das Maß für nominalskalierte Variablen mit mehr als zwei Ausprägungen konstruiert ist.
Statistik I Übung – Statistik und Tabellenkalkulation?
9Göttingen27. Juni 2007
Ausgangswerte ( empirische Häufigkeiten)Wahlabsicht katholisch evangelisch keine gesamt
CDU 48.4% (327) 35.6% (306) 22.3% (141) 35.7% (774)SPD 29.3% (198) 34.9% (300) 34.2% (216) 32.9% (714)FDP 7.2% (49) 12.7% (109) 6.5% (41) 9.2% (199)Grüne 13.6% (92) 15.0% (129) 21.2% (134) 16.4% (355)PDS 1.5% (10) 1.9% (16) 15.8% (100) 5.8% (126)gesamt 100.0% (676) 100.0% (860) 100.0% (632) 100.0% (2168)
• ••• • •
••
⋅= ⋅ ⋅ = i j
ij i j
n ne n p p
n
Erwartete HäufigkeitenWahlabsicht katholisch evangelisch keine gesamt
CDU 241,34 307,03 225,63SPD 222,63 283,23 208,14FDP 62,05 78,94 58,01Grüne 110,69 140,82 103,49PDS 39,29 49,98 36,73gesamt
Statistik I Übung – Statistik und Tabellenkalkulation?
10Göttingen27. Juni 2007
Erwartete HäufigkeitenWahlabsicht katholisch evangelisch keine
CDU 241,34 307,03 225,63SPD 222,63 283,23 208,14FDP 62,05 78,94 58,01Grüne 110,69 140,82 103,49PDS 39,29 49,98 36,73
Ausgangswerte ( empirische Häufigkeiten)Wahlabsicht katholisch evangelisch keine
CDU 327 306 141SPD 198 300 216FDP 49 109 41Grüne 92 129 134PDS 10 16 100
••
χ χ= = = =⋅ − − ⋅χ
max
2 2
2252.4V 0.24
n min(I 1, J 1) 2168 2
( )= =
−χ = ∑∑
2JI
ij ij2
i 1 j 1 ij
n e
e
Chi²-AnteileWahlabsicht katholisch evangelisch keine
CDU 30,404 0,003 31,744SPD 2,725 0,993 0,297FDP 2,745 11,448 4,988Grüne 3,156 0,992 8,997PDS 21,833 23,103 108,983gesamt 60,86 36,54 155,01 252,4
Anmeldung.ods Tabelle 9
Statistik I Übung – Statistik und Tabellenkalkulation?
11Göttingen27. Juni 2007
Aufgabe Folien bzw. Kapitel im Statistikbuch zu den ordinalen
Zusammenhangsmaßen gründlichst durchlesen: Gamma Tau-a Tau-b SomersD
Fragen zu Unklarheiten notieren!
Statistik I Übung – Statistik und Tabellenkalkulation?
12Göttingen27. Juni 2007
2. Probeklausur Probeklausur im jeweiligen Cip-Pool Ergebnisse bzw. Lösungsweg auf Klausurbogen
vermerken während des Tutoriums maximale Punktzahl = 60 31 Punkte = bestanden nur eine Variante
Abschlussklausur hat mehrere Varianten!
Statistik I Übung – Statistik und Tabellenkalkulation?
13Göttingen27. Juni 2007
Dann bis nächste Woche.