19.05.2009präsentation seminararbeit - tobias byland mosaikplots einführung kategoriale daten...

21
19.05.2009 Präsentation Seminararbeit - Tobias Byland Mosaikplots • Einführung • Kategoriale Daten • Schrittweiser Aufbau eines Mosaikplotes • Erweiterte Mosaikplots • Probleme bei Mosaikplots 1

Upload: fritz-naiser

Post on 05-Apr-2015

105 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

Mosaikplots

• Einführung

• Kategoriale Daten

• Schrittweiser Aufbau eines Mosaikplotes

• Erweiterte Mosaikplots

• Probleme bei Mosaikplots

1

Page 2: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

1. Einführung

Anwendungsbereich von Mosaikplots:

• Analyse von kategorialen Daten

• Grafische Darstellung von (komplexen) Kontingenztafeln

• Qualitative Zusammenhänge zwischen mehreren Variablen aufzeigen

2

Page 3: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

2. Kategoriale Daten

Unterscheide Daten nach Informationsgehalt:

• Nominal Unterscheidung(Geschlecht, Farben)

• Ordinal Unterscheidung und Ordnung(Schulnoten, Präferenzen)

• Metrisch Unterscheidung, Ordnung und Abstand(Temperatur, BIP)

Informationsgehalt bestimmt mögliche Rechenoperationen.

Kategoriale Daten

3

Page 4: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

3. Schrittweiser Aufbau eines Mosaikplotes

53‘182 Beobachtungen

Datensatz Suicide

method2 poison gas hang drown gun knife jump other

sex age.group male 10-20 1160 335 1524 67 512 47 189 464 25-35 2823 883 2751 213 852 139 366 775 40-50 2465 625 3936 247 875 183 244 534 55-65 1531 201 3581 207 477 154 273 294 70-90 938 45 2948 212 229 105 268 147female 10-20 921 40 212 30 25 11 131 100 25-35 1672 113 575 139 64 41 276 263 40-50 2224 91 1481 354 52 80 327 305 55-65 2283 45 2014 679 29 103 388 296 70-90 1548 29 1355 501 3 74 383 106

4

Page 5: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

3. Schrittweiser Aufbau eines Mosaikplotes

1

1

5

Page 6: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

3. Schrittweiser Aufbau eines Mosaikplotes

method2 poison gas hang drown gun knife jump othersex male 8917 2089 14740 946 2945 628 1340 2214female 8648 318 5637 1703 173 309 1505 1070

6

Page 7: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

3. Schrittweiser Aufbau eines Mosaikplotes

7

Page 8: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

4. Erweiterte Mosaikplots

Mosaikplots zeigen also Zusammenhänge auf, aber sind diese auch statistischrelevant?Mass für Abhängigkeit zwischen kategorialen Daten: Chi-Quadrat-Statistik

Unter Unabhängigkeit würde man erwarten

Daraus folgt Teststatistik

Idee: Mosaikplot unter Unabhängigkeit als Benchmark oder die Pearson-Residuen direkt im Mosaikplot zeigen

8

Page 9: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

4. Erweiterte Mosaikplots

Daten unter UnabhängigkeitVorhandene Daten

9

Page 10: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

4. Erweiterte Mosaikplots

Nur einzelne Residuen sichtbar => kein Testauf Unabhängigkeit!

10

Page 11: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

• Mehrere Mosaikplots für den selben Datensatz

• Viele Variablen / Ausprägungen

• Kleine oder fehlende Werte

11

Page 12: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Mehrere Mosaikplots für den selben Datensatz

Kein eindeutiges Verfahren zur Erstellung von Mosaikplots !

12

Page 13: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Ziel: Erkläre die Art der Selbstmorde (method2)

Vorgehen:

• Mit einer Variablen mit möglichst wenig Ausprägungen beginnen, im Idealfall dichotom.

• Den Mosaikplot für neue Variablen immer abwechslungsweise splitten.

• Die zu erklärende Variable als Letztes einfügen, und durch Einfärben hervorheben.

13

Page 14: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

14

Page 15: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Viele Variablen / Ausprägungen

(A Mosaic of Television Ratings, J. A. Hartigan and Beat Kleiner, 1984)

15

Page 16: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Lösung: Subplots

16

Page 17: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Kleine oder fehlende Werte

17

Page 18: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Kleine oder fehlende Werte

• Mosaikplots eignen sich weniger für Kontingenztabellen mit kleinen Zelleinträgen

• Beliebig grosse Zelleinträge sind hingegen kein Problem.

18

Page 19: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

6. Fairs Affairs

affairs gender age age2 yearsmarried 0: 451 female: 315 1: 6 1: 276 1: 52 1: 150 male : 286 2: 270 2: 259 2: 193 3: 203 3: 66 3: 356 4: 79 5: 43 children religion education rating no : 171 1: 212 1: 205 1: 82 yes: 430 2: 319 2: 316 2: 93 3: 70 3: 80 3: 426

> summary(Affairs_mp)

19

Page 20: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

6. Anwendungsbeispiel: Fairs Affairs

Page 21: 19.05.2009Präsentation Seminararbeit - Tobias Byland Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots

19.05.2009 Präsentation Seminararbeit - Tobias Byland

6. Anwendungsbeispiel: Fairs Affairs