Upload
nerice
View
31
Download
1
Embed Size (px)
DESCRIPTION
Betrachtung der Realität aus der Sicht der Statistik TABELLEN UND HÄUFIGKEITSVERTEILUNGEN. Übersetzung: / Tradotto da:. Scuola Secondaria 1°grado; Argomento: Leggiamo - Tabelle (30.09.13); Pacchetto: S1.A.3. INHALT. Häufigkeitstabellen mit Prozentwerten - PowerPoint PPT Presentation
Citation preview
Betrachtung der Realität aus Betrachtung der Realität aus der Sicht der Statistik der Sicht der Statistik
TABELLEN UND TABELLEN UND HÄUFIGKEITSVERTEILUNGENHÄUFIGKEITSVERTEILUNGEN
Scuola Secondaria 1°grado; Argomento: Leggiamo - Tabelle (30.09.13); Pacchetto: S1.A.3
Übersetzung: / Tradotto da:
INHALT
1) Häufigkeitstabellen mit Prozentwerten
2) Absolute Häufigkeitstabelle: Erstellung
3) Vergleichbarkeit von Verteilungen
4) Konzeptualisierung einfache Verteilung
5) Kreuztabellen
6) Konzeptualisierung doppelte Verteilung
Tab. 1 – Personen im Alter von 6 Jahren und mehr nach Häufigkeit der Internetnutzung Jahr 2012 (je 100 Personen mit 6 Jahren und mehr)
Häufigkeit der InternetnutzungPersonen mit 6
Jahren und mehrJeden Tag 29,5Einmal oder mehrmals in der Woche 18,7Ein paar Mal im Monat 3,3Ein paar Mal im Jahr 1,0nie 45,6Keine Angabe 1,9Insgesamt 100,0
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Häufigkeitstabellen mit Prozentwerten
Die Tabelle mit prozentuellen Häufigkeiten ist am weitesten verbreitet, da sie leicht verständlich ist: Die Werte werden mit dem Gesamten in Beziehung gesetzt (das gleich 100 ist).
Wie liest man die Tabelle?
Tab. 1 – Personen im Alter von 6 Jahren und mehr nach Häufigkeit der Internetnutzung Jahr 2012 (je 100 Personen mit 6 Jahren und mehr)
Häufigkeit der InternetnutzungPersonen mit 6
Jahren und mehrJeden Tag 29,5Einmal oder mehrmals in der Woche 18,7Ein paar Mal im Monat 3,3Ein paar Mal im Jahr 1,0nie 45,6Keine Angabe 1,9Insgesamt 100,0
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Häufigkeitstabellen mit Prozentwerten: lesen
Berücksichtigt man die gesamte italienische Bevölkerung im Alter von 6 Jahren und mehr, sagt uns die Tabelle zum Beispiel das…
… 45,6% das Internet nicht
nutzen
… fast 30% der Bevöl-kerung das Internet jeden Tag verwenden
Wie erstellt man die Tabelle?
Häufigkeitstabellen mit Prozentwerten: erstellen
Personen mit 6 Jahren und mehr
(je 1 Person mit 6 Jahren und mehr)
16.819 / 57.019
10.640 / 57.019
1.871 / 57.019
597 / 57.019
26.008 / 57.019
1.084 / 57.019
57.019 / 57.019
Personen mit 6 Jahren und mehr
(je 100 Personen mit 6 Jahren und mehr)
16.819 / 57.019 x 100
10.640 / 57.019 x 100
1.871 / 57.019 x 100
597 / 57.019 x 100
26.008 / 57.019 x 100
1.084 / 57.019 x 100
57.019 / 57.019 x 100
Häufigkeit der Internetnutzung
Personen mit 6 Jahren und mehr
(Werte in 1.000)
Jeden Tag 16.819 Einmal oder mehrmals in der Woche 10.640 Ein paar Mal im Monat 1.871 Ein paar Mal im Jahr 597 nie 26.008 Keine Angabe 1.084 Insgesamt 57.019
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Tab. 2 - Personen im Alter von 6 Jahren und mehr nach Häufigkeit der Internetnutzung - Jahr 2012
a) Man berücksichtigt absolute Häufigkeitstabelle
c) Man berechnet die prozentuellen Häufigkeiten
b) Man berechnet die relativen HäufigkeitenDie absolute Häufigkeit gibt
an, wie oft sich die Ausprägung eines Merkmals
in der Grundgesamtheit wiederholt
Die relative Häufigkeit ist das Verhältnis
zwischen absoluter Häufigkeit und
SummeDie prozentuelle Häufigkeit ist die
relative Häufigkeit multipliziert mit
100
Die Tabelle mit den relativen und prozentuellen Häufigkeiten erhält man ausgehend von der absoluten Häufigkeitstabelle.Wie erhält man aber die absolute Häufigkeitstabelle?
Absolute Häufigkeitstabelle: erstellen (1/4)
Die absolute Häufigkeitstabelle erhält man ausgehend von der Verteilung nach Einheit: für jede Einheit wird die Ausprägung des Merkmals angegeben.
Absolute Häufigkeitstabelle: erstellen (2/4)
In Excel mit der Schaltfläche fx (Funktion einfügen) die Funktion „Zählenwenn“ auswählen und mit Ok bestätigen.
Absolute Häufigkeitstabelle: erstellen (3/4)
Den Zellbereich eingeben, der gezählt werden soll, und die Suchkriterien, also die Bedingung, mit der die Zellen definiert werden, die gezählt werden sollen. Dann mit Ok bestätigen.
Absolute Häufigkeitstabelle: erstellen (4/4)
So erhält man die absoluten Häufigkeiten (dieselben wie in Tabelle 2).
In Excel lassen sich die relativen Häufigkeiten
berechnen:
und die prozentuellen Häufigkeiten:
So erhält man alle Berechnungen, die in
Tabelle 2 gemacht wurden:
Vergleichbarkeit von Verteilungen (1/2)
Frage: wie stark ist die tägliche Internetnutzungzwischen 2009 und 2012 gestiegen?Tab. 3 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung (Werte in 1.000)
Häufigkeit der Internetnutzung
Personen mit 6 Jahren und mehr
Jahr 2009 Jahr 2012
Jeden Tag 12.251 16.819 Einmal oder mehrmals in der Woche 9.632 10.640 Ein paar Mal im Monat 2.233 1.871 Ein paar Mal im Jahr 864 597 Nie 29.540 26.008 Keine Angabe 1.712 1.084 Insgesamt 56.232 57.019
Quelle: Istat, I.Stat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
… aber der Vergleich ist ungültig, da die beiden Grundgesamtheiten unterschiedlich groß sind.
Der Vergleich der Verteilungen der absoluten Häufigkeiten ergibt, dass die Zahl der Personen im Alter von 6 Jahren und mehr von 12.251 Tausend im Jahr 2009 auf 16.819 Tausend im Jahr 2012 gestiegen ist…
Vergleichbarkeit von Verteilungen (2/2)
Um Vergleiche zu ziehen, müssen die Verteilungen der relativen oder prozentuellen Häufigkeiten verwendet werden, wo jede Grundgesamtheit gleich groß ist.
Der Vergleich der Verteilungen der prozentuellen Häufigkeiten erlaubt die Aussage, dass im Jahr 2009 21,8 von 100 Personen im Alter von 6 Jahren und mehr täglich das Internet genutzt haben (also 21,8 Prozent). 2012 haben 29,5 von 100 Personen im Alter von 6 Jahren und mehr täglich das Internet genutzt (also 29,5 Prozent).
Tab. 4 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung (je 100 Personen mit 6 Jahren und mehr)
Häufigkeit der Internetnutzung Personen mit 6 Jahren und mehr
Jahr 2009 Jahr 2012
Jeden Tag 21,8 29,5 Einmal oder mehrmals in der Woche 17,1 18,7 Ein paar Mal im Monat 4,0 3,3 Ein paar Mal im Jahr 1,5 1,0 Nie 52,5 45,6 Keine Angabe 3,0 1,9 Insgesamt 100,0 100,0
Quelle: Istat, I.Stat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Konzeptualisierung der einfachen Verteilung in der Sprache der Statistiker…
Die Summe der absoluten Häu-figkeiten ent-
spricht der Grund-
gesamtheit
Die Summe der prozentuellen
Häufigkeiten ist 100
Die Summe der relativen Häufigkeiten
ist 1
Carattere XFrequenze
assoluteFrequenze
relativeFrequenze
percentuali
Modalità x1
Modalità x2
. . . .
Modalità xi
. . . .
Modalità xk
Totale 1 100
f1ൌ�� ଵn1 p1ൌ��
ଵ כ ͳͲͲ
f2ൌ�� ଶ
fiൌ��
fkൌ��
p2ൌ�� ଶ כ ͳͲͲ
piൌ�� כ ͳͲͲ
pkൌ�� כ ͳͲͲ
n2
ni
nk
n
Tab. 5 – Einfache Häufigkeitsverteilung
Schauen wir uns die Summen
an…
Tabellen-kopf
Spalte mit Ausprägungen
Die Sprache der Statistiker verwendet bestimmte Symbole…
Kreuztabelle
Es gibt 2 Merk-male
Tab. 6 – Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung und Region Jahr 2012 (je 100 Personen mit 6 Jahren und mehr in derselben Region)
REGIONEN
Häufigkeit der Internetnutzung
InsgesamtJeden Tag
Einmal oder
mehrmals in der
Woche
Ein paar Mal im Monat
Ein paar Mal im Jahr
Keine Angabe
Nie
Piemont 30,6 17,9 3,9 1,3 1,6 44,7 100,0Aosta 30,8 23,3 3,3 0,8 2,5 39,2 100,0Ligurien 31,2 19,3 2,9 1,4 2,0 43,1 100,0Lombardei 33,2 21,0 3,5 1,2 0,9 40,2 100,0Trentino-Südtirol 30,3 23,2 4,9 1,6 3,1 36,8 100,0Südtirol 29,7 24,9 5,3 2,1 2,3 35,7 100,0Trentino 31,1 21,6 4,6 1,2 3,4 38,0 100,0Venetien 32,8 20,3 4,3 0,9 1,4 40,3 100,0Friaul-Julisch Venetien 31,1 17,9 3,6 1,6 2,0 43,7 100,0Emilia-Romagna 34,0 18,4 3,3 1,5 2,4 40,4 100,0Toskana 30,8 19,4 3,6 0,9 2,5 42,7 100,0Umbrien 28,8 19,9 2,3 1,3 0,8 46,8 100,0Marken 31,8 18,6 2,4 1,4 2,4 43,4 100,0Latium 33,0 18,5 3,4 0,8 3,2 41,0 100,0Abruzzen 28,1 16,0 4,2 0,6 3,5 47,6 100,0Molise 27,1 14,2 3,0 1,3 1,3 53,1 100,0Kampanien 23,0 15,9 2,5 0,4 1,3 56,8 100,0Apulien 22,0 17,4 2,4 1,1 1,6 55,5 100,0Basilikata 22,5 16,7 2,3 1,1 4,0 53,4 100,0Kalabrien 23,9 17,3 2,2 0,7 2,1 53,9 100,0Sizilien 24,5 17,6 3,0 0,9 2,6 51,5 100,0Sardinien 29,5 18,4 2,8 1,6 1,6 46,2 100,0Italien 29,5 18,7 3,3 1,0 1,9 45,6 100,0
Schauen wir uns an einem Beispiel an, wie man die Tabelle liest
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Kreuztabelle: lesen
45,6% der Bevölkerung Italiens mit 6 Jahren und mehr nutzt nicht das Internet…… aber es gibt große räumliche Unterschiede
Tab. 6 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung und Region Jahr 2012 (je 100 Personen mit 6 Jahren und mehr in derselben Region)
REGIONEN
Häufigkeit der Internetnutzung
InsgesamtJeden Tag
Einmal oder
mehrmals in der
Woche
Ein paar Mal im Monat
Ein paar Mal im Jahr
Keine Angabe
Nie
Piemont 30,6 17,9 3,9 1,3 1,6 44,7 100,0Aosta 30,8 23,3 3,3 0,8 2,5 39,2 100,0Ligurien 31,2 19,3 2,9 1,4 2,0 43,1 100,0Lombardei 33,2 21,0 3,5 1,2 0,9 40,2 100,0Trentino-Südtirol 30,3 23,2 4,9 1,6 3,1 36,8 100,0Südtirol 29,7 24,9 5,3 2,1 2,3 35,7 100,0Trentino 31,1 21,6 4,6 1,2 3,4 38,0 100,0Venetien 32,8 20,3 4,3 0,9 1,4 40,3 100,0Friaul-Julisch Venetien 31,1 17,9 3,6 1,6 2,0 43,7 100,0Emilia-Romagna 34,0 18,4 3,3 1,5 2,4 40,4 100,0Toskana 30,8 19,4 3,6 0,9 2,5 42,7 100,0Umbrien 28,8 19,9 2,3 1,3 0,8 46,8 100,0Marken 31,8 18,6 2,4 1,4 2,4 43,4 100,0Latium 33,0 18,5 3,4 0,8 3,2 41,0 100,0Abruzzen 28,1 16,0 4,2 0,6 3,5 47,6 100,0Molise 27,1 14,2 3,0 1,3 1,3 53,1 100,0Kampanien 23,0 15,9 2,5 0,4 1,3 56,8 100,0Apulien 22,0 17,4 2,4 1,1 1,6 55,5 100,0Basilikata 22,5 16,7 2,3 1,1 4,0 53,4 100,0Kalabrien 23,9 17,3 2,2 0,7 2,1 53,9 100,0Sizilien 24,5 17,6 3,0 0,9 2,6 51,5 100,0Sardinien 29,5 18,4 2,8 1,6 1,6 46,2 100,0Italien 29,5 18,7 3,3 1,0 1,9 45,6 100,0
Fast 30% der Bevölkerung Italiens nutzen jeden Tag das Internet……aber es gibt große räumliche Unterschiede
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Kreuztabelle: erstellen (1/5)
Wie bei der einfachen Tabelle wird die Tabelle mit den absolu-ten Häufig-keiten, also die Tabelle nach Einheiten, verwendet
Wie erstellt man in Excel eine Kreuz-tabelle?
Tab. 7 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung und Region Jahr 2012 (Werte in 1.000)
REGIONEN
Häufigkeit der Internetnutzung
InsgesamtJeden Tag
Einmal oder
mehrmals in der
Woche
Ein paar Mal im Monat
Ein paar Mal im Jahr
Keine Angabe
Nie
Piemont 1.281 749 165 54 67 1.873 4.189Aosta 37 28 4 1 3 47 120Ligurien 477 295 44 22 31 659 1.528Lombardei 3.101 1.965 330 109 80 3.751 9.336Trentino-Südtirol 294 225 48 16 30 357 970Südtirol 141 118 25 10 11 169 474Trentino 154 107 23 6 17 188 495Venetien 1.517 940 200 41 63 1.865 4.626Friaul-Julisch Venetien 361 207 42 19 23 507 1.159Emilia-Romagna 1.418 769 138 62 101 1.688 4.176Toskana 1.091 687 127 32 90 1.512 3.539Umbrien 246 170 20 11 7 400 854Marken 469 275 36 20 35 640 1.475Latium 1.780 1.001 185 45 174 2.215 5.400Abruzzen 357 203 53 7 45 604 1.269Molise 82 43 9 4 4 161 303Kampanien 1.256 870 138 24 69 3.102 5.459Apulien 846 668 92 43 63 2.138 3.850Basilikata 125 93 13 6 22 297 556Kalabrien 452 327 41 13 39 1.021 1.893Sizilien 1.158 832 141 43 121 2.439 4.734Sardinien 468 292 44 25 25 732 1.586Italien 16.819 10.640 1.871 597 1.084 26.008 57.019
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Kreuztabelle: erstellen (2/5)
In Excel: im Menü Einfügen Pivottabelle auswählen. Es öffnet sich das Fenster «Pivottabelle erstellen», in dem Folgendes spezifiziert werden muss: a) die Daten, die analysiert werden (gesamte Datenmatrix auswählen), b) wo der PivotChart-Bericht positioniert wird. Dann auf ok klicken.
Doppelte Verteilung je Einheit: für jede Einheit die Ausprägungen von zwei Merkmalen:
Kreuztabelle: erstellen (3/5)
Aus PivotTable-Feldliste die Felder in die untenstehenden Bereiche ziehen: Spaltenbeschriftung – Zeilenbeschriftung - Werte.
Kreuztabelle: erstellen (4/5)
Um die Tabelle 7 zu nachzubauen: ‘Internetnutzung’ in die Spaltenbeschriftungen ziehen, ‘Region’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung)
Kreuztabelle: erstellen (5/5)
Um die Tabelle 6 nachzubauen: ‘Internetnutzung’ in die Spaltenbeschriftungen ziehen, ‘Region’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung; zeige Werte als % der Zeilensumme)
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker… (1/4)
nij ist die Häufigkeit der Einheiten, bei denen das
Merkmal X in der Ausprägung xi und das Merkmal Y in der
Ausprägung yj vorhanden ist.
Tabellen-kopf
Spalte mit
Ausprä-gungen
z Ausprägung des Merkmals y
Modalità y1 Modalità y2 . Modalità yj . Modalità yz
Modalità x1 . .
Modalità x2 . .
. . . . .
Modalità xi . .
. . . . .
Modalità xk . .
Totale . .
Carattere XCarattere y
Totale
n11
n21
ni1
nk1
n01
n12
n22
ni2
nk2
n02
n1j
n2j
nij
nkj
n0j
n1z
n2z
niz
nkz
n0z
n10
n20
ni0
n
nk0
n0j ist die Häufigkeit der Einhei-ten, bei denen das Merkmal Y in der Ausprägung yj vorhanden ist
ni0 ist die Häufigkeit der Einheiten, bei
denen das Merkmal X in der Ausprä-
gung xi
vorhanden ist
n ist die Anzahl der
Grund-gesamtheit
Tab. 8 – Doppelte Verteilung der absoluten Häufigkeiten
Modalità y1 Modalità y2 . Modalità yj . Modalità yz
Modalità x1 . .
Modalità x2 . .
. . . . .
Modalità xi . .
. . . . .
Modalità xk . .
Totale . .
Carattere XCarattere y
Totale
p11
p21
pi1
pk1
p01
p12
p22
pi2
pk2
p02
p1j
p2j
pij
pkj
p0j
p1z
p2z
piz
pkz
p0z
p10
p20
pi0
100
pk0
Tab. 9 – Doppelte Verteilung der gesamten prozentuellen Häufigkeiten
In einer Kreuztabelle können drei verschiedene Arten von relativen (oder prozentuellen) Häufigkeiten berechnet werden:
1. Doppelte Verteilung von gesamten relativen Häufigkeiten. Diese erhält man, indem man jede absolute Häufigkeit durch die Gesamtanzahl n dividiert (multipliziert mit 100 ergibt das die gesamten prozentuellen Häufigkeiten).
wobei:
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker … (2/4)
2. Verteilung der relativen Häufigkeiten der Spalte.Diese erhält man, indem man jede absolute Häufigkeit durch die Summe der jeweiligen Spalte dividiert (multipliziert mit 100 ergeben sich die prozentuellen Häufigkeiten der Spalte).So kann, bei gleicher Anzahl der einzelnen Ausprägungen des Merkmals X, die unterschiedliche Zusammensetzung der Einheiten nach den Ausprägungen des Merkmals Y verglichen werden.
wobei:
Tab. 10 – Doppelte Verteilung der prozentuellen Häufigkeiten der Spalte
Modalità y1 Modalità y2 . Modalità yj . Modalità yz
Modalità x1 . .
Modalità x2 . .
. . . . . . . .
Modalità xi . .
. . . . . . . .
Modalità xk . .
Totale . .
Carattere XCarattere y
Totale
p11
p21
pi1
pk1
p01
p12
p22
pi2
pk2
p02
p1j
p2j
pij
pkj
p0j
p1z
p2z
piz
pkz
p0z 100
p11
p21
pi1
pk1
p01
p12
p22
pi2
pk2
p02
p1j
p2j
pij
pkj
p0j
p1z
p2z
piz
pkz
p0z 100
100
100
100
100
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker … (3/4)
3. Verteilung von relativen Häufigkeiten der Zeile. Diese erhält man, indem man jede absolute Häufigkeit durch die Summe der jeweiligen Zeile dividiert (multipliziert mit 100 ergeben sich die prozentuellen Häufigkeiten der Zeile). So kann, bei gleicher Anzahl der einzelnen Ausprägungen des Merkmals Y, die unterschiedliche Zusammensetzung der Einheiten nach den Ausprägungen des Merkmals X verglichen werden.
wobei:
Modalità y1 Modalità y2 . Modalità yj . Modalità yz
Modalità x1 . .
Modalità x2 . .
. . . . . . . .
Modalità xi . .
. . . . . . . .
Modalità xk . .
Totale . .
TotaleCarattere y
Carattere X
p11
p21
pi1
pk1
p12
p22
pi2
pk2
p1j
p2j
pij
pkj
p1z
p2z
piz
pkz
p10
p20
pi0
100
pk0
100 100 100 100
Tab. 11 – Doppelte Verteilung der prozentuellen Häufigkeiten der Zeile
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker … (4/4)
Einfache Tabelle: Erstellung mit Pivot-Tabelle
Um die absoluten Häufigkeiten der Tabelle 2 zu erstellen: ‘Internetnutzung’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte ziehen (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung)
Da wir jetzt das Instrument Pivot-Tabelle kennen, können wir es auch verwenden, um einfache Tabellen (mit nur einem Merkmal) zu erstellen.
Um die prozentuellen Häufigkeiten der Tabelle 2 zu erstellen: ‘Internetnutzung’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte ziehen (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung; zeige Werte als % der Spaltensumme)
……und jetzt…und jetzt…Gute Arbeit!Gute Arbeit!
Rete per la promozione della cultura statistica
Übersetzung: / Tradotto da: