View
1
Download
0
Category
Preview:
Citation preview
Wozu brauche ich Statistik?
Markus Lehmann, DAAD
iDA Seminar – 14.12.2016
Formulierung und Präzisierung der Fragestellung
Planung und Vorbereitung der Erhebung
Konstruktion des Erhebungsinstruments
Festlegung der Untersuchungsform
Stichprobenverfahren
Pretest
Datenerhebung
Datenauswertung
Berichterstattung
Rückblick – Der Forschungsablauf
2
3
Grundgesamtheit Stichprobe (sample)
Verteilung von Merkmalen, z.B. 50%
Männer, 50% Frauen
Abbildung der Grundgesamtheit in
Bezug auf die Verteilung der
Merkmale
Stichprobenverfahren
Grundbegriffe I
Grundgesamtheit (GG) / Zielpopulation
Menge von Objekten, auf die sich die Aussagen der Untersuchung beziehen
sollen (angestrebte GG)
Festlegung der Erhebungseinheit (Personen, Organis., Länder, ...) & Raum-
zeitliche Eingrenzung.
Bsp.: „Alle Personen mit deutscher Staatsangehörigkeit, die zum Zeitpunkt
der Befragung in der BRD in Privathaushalten leben und die spätestens am
1.1.1982 geboren sind“
Auswahlgesamtheit
Alle Objekte, die eine prinzipielle Chance haben in die Stichprobe zu
gelangen (faktische GG)
4
Survey-Population
Entspricht der Auswahlgesamtheit abzüglich der Menge der Elemente, die nicht
zur Zielpopulation gehören (Overcoverage)
Ziel einer Stichprobenziehung
Survey-Population und Grundgesamtheit möglichst deckungsgleich
5
Grundbegriffe II
Zielpopulation
6
Auswahlgesamtheit
Survey-Population
Ausfälle
Overcoverage
Undercoverage
Under- und Overcoverage
Auf welche Weise sollen Elemente der Grundgesamtheit ausgewählt werden?
Wahrscheinlichkeitsauswahl
Zufallsstichproben, z.B. Klumpung/Cluster, Schichtung
Bewusste Auswahl
Nach Kriterien, z.B.
Quotenverfahren
Willkürliche Auswahl
Stichprobenziehung nicht kontrolliert, häufig psychologische Experimente
7
Stichprobenverfahren
Vollerhebung vs. Stichprobe
8
Vorteile einer Stichprobe Nachteile einer Stichprobe
Geringere Kosten
Daten schneller verfügbar
Vollerhebung oft nicht möglich
Zufallsfehler der Stichprobe
Selektives Sample (Gegenteil:
repräsentatives Sample)
Systematische Fehler bei
Stichprobenziehung und
Umsetzung
Verzerrung durch Non-Response
Aber: auch „Voll“erhebungen
produzieren Fehler
Auswahlverfahren
Gewichtung
Designgewichtung: bei disproportionaler Schichtung
Anpassungsgewichtung: zur Korrektur der Ausfälle
Aber: Unklar, ob nicht angepasste Merkmale evtl. sogar stärker verzerrt
Nicht-Repräsentativität kein Problem bei Kausalanalysen
Bei Aussagen über Grundgesamtheit (Populationsparameter) wird kontrolliertes
Stichprobenverfahren benötigt
9
Repräsentativität
10
Online-Befragung zu vers. Aspekten studienbezogener Auslandsaufenthalte
Brutto-Stichprobe: Anzahl kontaktierter Studierender
Stichprobe bereinigt: Brutto-Stichprobe abzüglich Studierende, die Studium
bereits abgeschlossen hatten und unzustellbare E-Mails
Rücklauf (brutto): Studierende, die Teilnahmelink aktiviert und an Befragung
beteiligt waren
Rücklauf (bereinigt): Nach Plausibilisierung und Bereinigung der Daten (z. B.
Ausschluss von unzureichend ausgefüllten Fragebögen)
Repräsentativität: DAAD/DZHW-Mobilitätsstudie I
11
Prüfung Rücklauf auf Repräsentativität: zentrale soziodemografische und
studienspezifische Strukturmerkmale mit entsprechenden Verteilungen in der
Grundgesamtheit gegenübergestellt
Grundgesamtheit: Studierende (deutsche und Bildungsinländer(innen) im
Wintersemester 2013/14 an staatlichen Hochschulen (ohne
Verwaltungsfachhochschulen)
Prüfungsergebnis: Hinsichtlich einzelner Merkmale geringfügige Unterschiede
zw. Verteilungen der Stichprobe zu Grundgesamtheit
z.B. Studentinnen überproportional an Befragung beteiligt
Lösung: Nutzung von Anpassungsgewichten, um Abweichungen auszugleichen,
demnach sind Ergebnisse der Mobilitätsstudie 2015 nach berücksichtigten
Strukturmerkmalen auf Bundesebene repräsentativ
Repräsentativität: DAAD/DZHW-Mobilitätsstudie II
12
Studie zur Motivation, Integration und Förderung internationaler
Nachwuchswissenschaftler in Deutschland, u.a. standardisierte
Onlinebefragung
Brutto-Stichprobe: 4.200 Personen, Analyse-Sample: 1.532
Prüfung Repräsentativität: Vergleich Stichprobe mit Grundgesamtheit
hinsichtlich regionaler Herkunft und Fächerzugehörigkeit der Befragten (hier:
Wissenschaftler)
Prüfungsergebnis: Hinsichtlich regionaler Herkunft spiegelt MIND-Stichprobe
Zusammensetzung in GG wider, kleinere Abweichung hinsichtlich
Fachzugehörigkeit
Repräsentativität: MIND-Studie von GATE I
13
Repräsentativität: MIND-Studie von GATE I
Rückblick: Der Forschungsablauf
Formulierung und Präzisierung des Forschungsproblems
Planung und Vorbereitung der Erhebung
Konstruktion des Erhebungsinstruments
Festlegung der Untersuchungsform
Stichprobenverfahren
Pretest
Datenerhebung
Datenauswertung
Berichterstattung
14
Phasen der Datenauswertung
15
Kodierung und Datenübertragung
Fehlerkontrolle, eventuelle Fehlerbereinigung, Ausschluss fehlerhafter und fehlender Angaben
Umformung/Neubildung von Variablen, Indizes und Skalen
Statistische Analyse von Verteilungen und Zusammenhängen
univariat / bivariat / mulitvariat
Fokus auf Deskriptivstatistik, d.h.
Berechnung von Kennziffern zur
Beschreibung einer Stichprobe
Univariate Analyse: Verteilungen
Randauszählung: Auszählung und Berechnung der absoluten, relativen und
prozentualen Häufigkeiten nach den Kategorien von Variablen
Tabellarische und graphische Darstellungsmöglichkeiten der
Häufigkeitsverteilung
16
Kategorien
Prozentuale
Häufigkeiten
Univariate Analyse: Graphische Darstellung von
Verteilungen (1)
Histogramm: Standardform zur graphischen Darstellung empirischer
Häufigkeitsverteilung, Darstellung relativer Häufigkeiten/Prozentanteile je
Kategorie
17
Quelle: Wissenschaft weltoffen 2016, S.127
Univariate Analyse: Graphische Darstellung von
Verteilungen (2)
Kreis- oder Tortendiagramm: bei nichtmetrischen Daten mit wenig
Variablenausprägungen, meist Verwendung von Prozentwerten
18
Quelle: Wissenschaft weltoffen 2016, S.59
Univariate Analyse: Mittelwert & Streuung
Maßzahlen der zentralen Tendenz
Arithmetischer Mittelwert / Median / Modus
Maßzahlen der Dispersion (Streuung)
Minimum & Maximum / Range / Standardabweichung / etc.
Boxplot: Diagramm zur graphischen Darstellung, fasst verschiedene Streuungs-
und Lagemaße zusammen
19
Univariate Analyse: Graphische Darstellung von Mittelwert
& Streuung
20
Quelle: Sechste Erhebung von Profildaten 2015, S. 14
Bivariate Zusammenhänge: Tabellenanalyse
Prüfung von Zusammenhangshypothesen zwischen zwei dichotomen Variablen,
Mögliche verzerrende Einflüsse durch Drittvariablen nicht berücksichtigt
21
Bivariate Zusammenhänge: Tabellenanalyse (2)
22
Praktische Übung
Interpretation von Statistiken
Ableitung von Handlungsempfehlungen
23
Interpretation und Weiterverwertung von Statistiken
24
Aussage der Tabellen – was steht hier überhaupt?
Aufbereitung von Tabellen – wie kann ich die enthaltene
Info meiner Leitungsebene näher bringen?
Welchen weiterführenden Infos bräuchte ich? Was könnten
Empfehlungen sein?
Bitte bereiten Sie bis 10:30 Uhr ein Plakat vor.
Recommended