21
19.05.2009 Präsentation Seminararbeit - Tobias Byland Mosaikplots • Einführung • Kategoriale Daten • Schrittweiser Aufbau eines Mosaikplotes • Erweiterte Mosaikplots • Probleme bei Mosaikplots 1

Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes

Embed Size (px)

DESCRIPTION

Mosaikplots Einführung Kategoriale Daten Schrittweiser Aufbau eines Mosaikplotes Erweiterte Mosaikplots Probleme bei Mosaikplots. 1. 1. Einführung. Anwendungsbereich von Mosaikplots: Analyse von kategorialen Daten Grafische Darstellung von (komplexen) Kontingenztafeln - PowerPoint PPT Presentation

Citation preview

Page 1: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

Mosaikplots

• Einführung

• Kategoriale Daten

• Schrittweiser Aufbau eines Mosaikplotes

• Erweiterte Mosaikplots

• Probleme bei Mosaikplots

1

Page 2: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

1. Einführung

Anwendungsbereich von Mosaikplots:

• Analyse von kategorialen Daten

• Grafische Darstellung von (komplexen) Kontingenztafeln

• Qualitative Zusammenhänge zwischen mehreren Variablen aufzeigen

2

Page 3: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

2. Kategoriale Daten

Unterscheide Daten nach Informationsgehalt:

• Nominal Unterscheidung(Geschlecht, Farben)

• Ordinal Unterscheidung und Ordnung(Schulnoten, Präferenzen)

• Metrisch Unterscheidung, Ordnung und Abstand(Temperatur, BIP)

Informationsgehalt bestimmt mögliche Rechenoperationen.

Kategoriale Daten

3

Page 4: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

3. Schrittweiser Aufbau eines Mosaikplotes

53‘182 Beobachtungen

Datensatz Suicide

method2 poison gas hang drown gun knife jump other

sex age.group male 10-20 1160 335 1524 67 512 47 189 464 25-35 2823 883 2751 213 852 139 366 775 40-50 2465 625 3936 247 875 183 244 534 55-65 1531 201 3581 207 477 154 273 294 70-90 938 45 2948 212 229 105 268 147female 10-20 921 40 212 30 25 11 131 100 25-35 1672 113 575 139 64 41 276 263 40-50 2224 91 1481 354 52 80 327 305 55-65 2283 45 2014 679 29 103 388 296 70-90 1548 29 1355 501 3 74 383 106

4

Page 5: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

3. Schrittweiser Aufbau eines Mosaikplotes

1

1

5

Page 6: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

3. Schrittweiser Aufbau eines Mosaikplotes

method2 poison gas hang drown gun knife jump othersex male 8917 2089 14740 946 2945 628 1340 2214female 8648 318 5637 1703 173 309 1505 1070

6

Page 7: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

3. Schrittweiser Aufbau eines Mosaikplotes

7

Page 8: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

4. Erweiterte Mosaikplots

Mosaikplots zeigen also Zusammenhänge auf, aber sind diese auch statistischrelevant?Mass für Abhängigkeit zwischen kategorialen Daten: Chi-Quadrat-Statistik

Unter Unabhängigkeit würde man erwarten

Daraus folgt Teststatistik

Idee: Mosaikplot unter Unabhängigkeit als Benchmark oder die Pearson-Residuen direkt im Mosaikplot zeigen

8

Page 9: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

4. Erweiterte Mosaikplots

Daten unter UnabhängigkeitVorhandene Daten

9

Page 10: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

4. Erweiterte Mosaikplots

Nur einzelne Residuen sichtbar => kein Testauf Unabhängigkeit!

10

Page 11: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

• Mehrere Mosaikplots für den selben Datensatz

• Viele Variablen / Ausprägungen

• Kleine oder fehlende Werte

11

Page 12: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Mehrere Mosaikplots für den selben Datensatz

Kein eindeutiges Verfahren zur Erstellung von Mosaikplots !

12

Page 13: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Ziel: Erkläre die Art der Selbstmorde (method2)

Vorgehen:

• Mit einer Variablen mit möglichst wenig Ausprägungen beginnen, im Idealfall dichotom.

• Den Mosaikplot für neue Variablen immer abwechslungsweise splitten.

• Die zu erklärende Variable als Letztes einfügen, und durch Einfärben hervorheben.

13

Page 14: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

14

Page 15: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Viele Variablen / Ausprägungen

(A Mosaic of Television Ratings, J. A. Hartigan and Beat Kleiner, 1984)

15

Page 16: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Lösung: Subplots

16

Page 17: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Kleine oder fehlende Werte

17

Page 18: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

5. Probleme eines Mosaikplots

Kleine oder fehlende Werte

• Mosaikplots eignen sich weniger für Kontingenztabellen mit kleinen Zelleinträgen

• Beliebig grosse Zelleinträge sind hingegen kein Problem.

18

Page 19: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

6. Fairs Affairs

affairs gender age age2 yearsmarried 0: 451 female: 315 1: 6 1: 276 1: 52 1: 150 male : 286 2: 270 2: 259 2: 193 3: 203 3: 66 3: 356 4: 79 5: 43 children religion education rating no : 171 1: 212 1: 205 1: 82 yes: 430 2: 319 2: 316 2: 93 3: 70 3: 80 3: 426

> summary(Affairs_mp)

19

Page 20: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

6. Anwendungsbeispiel: Fairs Affairs

Page 21: Mosaikplots  Einführung  Kategoriale Daten  Schrittweiser Aufbau eines Mosaikplotes

19.05.2009 Präsentation Seminararbeit - Tobias Byland

6. Anwendungsbeispiel: Fairs Affairs