46
Einführung in die statistischen Methoden von Stichprobenerhebungen Beat Hulliger Hochschule für Wirtschaft FHNW Riggenbachstrasse 16 4600 Olten c Beat Hulliger 2016 Alle Rechte vorbehalten

Einführung in die statistischen Methoden von ... · Eine Charakteristik lässt sich aus den Variablenwerten der Populationselemente berechnen (z.B. die Anzahl der Erwerbslosen aus

Embed Size (px)

Citation preview

Einführung in die statistischen Methodenvon Stichprobenerhebungen

Beat Hulliger

Hochschule für Wirtschaft FHNWRiggenbachstrasse 16

4600 Olten

c©Beat Hulliger 2016

Alle Rechte vorbehalten

Teile des Skripts basieren auf einer Vorlesung von Philippe Eichenberger. Philippe Ei-chenberger, Paul-André Salamin, Werner Stahel, Markus Hürzeler, Rudi Peters, AnneRenaud, Christian Keller und Ruth Meili haben Entwürfe kommentiert und verbessert.Das Skript wurde im Nachdiplomkurs über angewandte Statistik an der ETH Zürich undan der Universität Bern, im Kurs über Stichprobenerhebungen des Bundesamts für Statis-tik und im Kurs Erhebungsstatistik der Fachhochschule Nordwestschweiz getestet. Mei-nen Kolleginnen und Kollegen und den Kursteilnehmern danke ich herzlich für ihre Anre-gungen.

II

Inhaltsverzeichnis

1 Einführung 11.1 Warum eine Zufalls-Stichprobe? . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Einige wichtige Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.1 Repräsentativität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.3 Die fünf Schritte einer Erhebung . . . . . . . . . . . . . . . . . . . . . . . . 51.4 Zur Realisation einer Erhebung . . . . . . . . . . . . . . . . . . . . . . . . . 61.5 Grundlage der klassischen Stichprobentheorie . . . . . . . . . . . . . . . . 7

2 Einfache Zufalls-Stichprobe 92.1 Stichprobenplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.2 Schätzer für den Mittelwert . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.3 Varianz des Stichprobenmittels . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.1 Herleitung der Varianz des Stichprobenmittels * . . . . . . . . . . . . 112.4 Schätzung der Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.5 Stichprobengrösse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.6 Schätzung eines Anteils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.7 Untersuchungsbereiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.7.1 Auflösung einer Stichprobe . . . . . . . . . . . . . . . . . . . . . . . 132.8 Ziehung einer einfachen Zufallsstichprobe: . . . . . . . . . . . . . . . . . . 14

2.8.1 Einfacher Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . 142.8.2 Systematische Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . 14

3 Einfache geschichtete Zufallsstichprobe 153.1 Schätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2 Aufteilung der Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.3 Stichprobengrösse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.4 Anzahl und Wahl der Schichten . . . . . . . . . . . . . . . . . . . . . . . . . 173.5 Genauigkeitsvergleich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

4 Verwendung von Hilfsinformationen 184.1 Nachschichtung bei einfacher Zufallsstichprobe . . . . . . . . . . . . . . . . 184.2 Quotientenschätzer bei einfacher Zufallsstichprobe . . . . . . . . . . . . . . 184.3 Die Horvitz-Thompson Strategie * . . . . . . . . . . . . . . . . . . . . . . . 19

4.3.1 Ziehungsalgorithmus für n=2 * . . . . . . . . . . . . . . . . . . . . . 204.3.2 Ziehung für n beliebig . . . . . . . . . . . . . . . . . . . . . . . . . . 214.3.3 Varianzschätzung ohne doppelte Einschlussawahrscheinlichkeiten . 21

4.4 Regressions-Schätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.5 Kalibrierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

5 Klumpenstichproben 235.1 Einfache Klumpenstichprobe . . . . . . . . . . . . . . . . . . . . . . . . . . 235.2 Vergleich mit der einfachen Zufallsstichprobe . . . . . . . . . . . . . . . . . 245.3 Mehrstufige Stichprobenpläne . . . . . . . . . . . . . . . . . . . . . . . . . . 245.4 Unterstichproben in den Klumpen . . . . . . . . . . . . . . . . . . . . . . . . 25

III

5.5 Effekt des Stichprobenplans . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

6 Datenaufbereitung 266.1 Kontrollen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266.2 Einsetzungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

7 Robuste Schätzverfahren 287.1 Median, Quartile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287.2 Gestutztes und winsorisiertes Mittel, gewichteter Median* . . . . . . . . . . 287.3 Robuster Quotientenschätzer * . . . . . . . . . . . . . . . . . . . . . . . . . 29

7.3.1 Robustifizierter Horvitz-Thompson Schätzer . . . . . . . . . . . . . . 30

8 Antwortausfälle und Kalibrierung 318.1 Korrektur mit Nachschichtung und Kalibrierung . . . . . . . . . . . . . . . . 328.2 Beispiel einer Kalibrierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338.3 Schätzung der Antwortneigung * . . . . . . . . . . . . . . . . . . . . . . . . 34

9 Inferenz 359.1 Varianzschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359.2 Vertrauensintervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359.3 Tests und Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

10 Lösungen zu den Beispielen 38

Literaturverzeichnis 41

Index 41

IV

Kapitel 1

Einführung

Die Statistik liefert der Wissenschaft Methoden, um aus einer Masse von Beobachtungenallgemeine Schlüsse zu ziehen. Dabei wird dem Problem der Gewinnung von Beobach-tungen ebenso Gewicht gegeben wie der Analyse und Synthese allgemeiner Aussagen.Viele Methoden der Statistik fassen die Beobachtungen einer Stichprobe als Realisa-tionen von Zufallsvariablen auf. Potentiell könnten unendlich viele solche Realisationenbeobachtet werden. Man spricht darum auch von unendlichen Populationen. Im Gegen-satz dazu beschäftigt sich dieses Skript mit realen Populationen, die eine endliche AnzahlEinheiten enthalten.

Die Stichprobentheorie gibt ein mathematisches Fundament, um Elemente aus einerendlichen aber oft grossen Population zufällig auszuwählen und aufgrund dieser Stich-probe Schlüsse über die gesamte vorliegende Population zu ziehen. Es braucht grosseSorgfalt, um qualitativ hochstehende Daten zu erheben. Trotzdem gibt es in der Praxisimmer Abweichungen vom idealen theoretischen Modell. Zum Beispiel antworten in ei-ner Unternehmens-Erhebung oft nicht alle Unternehmen. Die Methoden der Stichprobe-nerhebungen beschäftigen sich also einerseits mit der theoretischen Grundlegung, aberauch mit den in der Praxis immer auftretenden Abweichungen.

Stichprobenerhebungen werden in der Soziologie, Ökonomie, Marktforschung, Medi-zin, Biologie, Qualitätssicherung, Buchhaltung usw. als wichtiges Instrument zur Informa-tionsbeschaffung angewandt.

Wenn wir hier von Methoden der Stichprobenerhebungen sprechen, meinen wir einer-seits die theoretischen Grundlagen der Stichprobentheorie, andererseits aber auch dieMethoden zur Bewältigung der praktischen Probleme bei Stichprobenerhebungen. Dabeikann diese kurze Einführung nur die Grundlagen geben und die wichtigsten Problemeandeuten. Das Ziel dieser Einführung ist, einen Fachwissenschaftler/eine Fachwissen-schaftlerin in die Methoden der Stichprobenerhebung einzuführen, damit er/sie in der La-ge ist, zu beurteilen, ob eine Stichprobenerhebung das anliegende Problem lösen kann,und was die wichtigsten Methoden sind. Die Einführung soll ausserdem die Begriffe so-weit klären, dass er/sie bei der Planung und Auswertung einer Stichprobenerhebung infruchtbarer Weise einen Statistiker beiziehen kann.

Diese kurze Einführung konzentriert sich auf die statistischen Methoden, die in Stich-probenerhebungen zur Anwendung kommen. Fragen wie Informatik-Unterstützung, Er-stellen von Fragebogen, Auswertungsplanung usw. werden nur am Rande gestreift. Einegute Übersicht über viele Fragen rund um Stichproben-erhebungen ist die Broschüreder American Statistical Association“What is a Survey” auf http://www.whatisasurvey.info/. Eine Einführung in die Erstellung von Fragebogen findet sich zum Beispiel in(Floyd J. Fowler, 2009).

Das Fundament der Stichprobentheorie ist wie bei anderen statistischen Methodendie mathematische Statistik. Es werden also mathematische Formeln eingeführt und be-nützt werden. Es werden aber nur wenige Beweise ausgeführt. Soweit möglich wird je-weils auf weiterführende Literatur hingewiesen, welche auch die notwendigen Beweiseenthält.

1

2 c© Beat Hulliger 2016

Einzelne Abschnitte sind mit einem Stern (*) bezeichnet. Diese Abschnitte sind et-was anspruchsvoller und werden in der Regel für das Verständnis der nachfolgendenAbschnitte nicht benötigt.

1.1 Warum eine Zufalls-Stichprobe?

Will man etwas über die Charakteristiken einer endlichen Population erfahren (z.B. Anteilder Raucher unter den Beschäftigten eines Betriebs), bieten sich verschiedene Methodenan:

1. Von jedem Element der Population wird die gewünschte Information gesammelt.Man spricht von einer Vollerhebung oder einem Zensus. Vollerhebungen sind oftteuer und zeitaufwendig. Ihr Vorteil ist, dass auch kleine Teilpopulationen analysiertwerden können.

2. Manchmal fällt die gewünscht statistisch Information als Nebenprodukt adminis-trativer Tätigkeiten an, insbesondere in der öffentlichen (oder amtlichen) Statistik.Meistens wird dann die Information in einem oder mehreren Registern gespeichertund muss für die Statistik aufbereitet werden. Die Kosten für die Registerführungwerden dabei oft nicht der Statistik angelastet. Hingegen entspricht die in den Re-gistern enthaltene Information sowohl was den Inhalt als auch was die Abdeckungder Population betrifft meistens nicht ganz der gewünschten Information.

3. Oft führt eine Erhebung, die nur bei einem zufällig ausgewählten Teil der Populati-on durchgeführt wird, am schnellsten und kostengünstigsten zu den gewünschtenResultaten. Die zufällige Auswahl der Stichprobe liefert ein mathematisches Funda-ment für den Schluss vom Teil der Population auf die ganze. Gleichzeitig ermöglichtdie Zufalls-Stichprobe die Schätzung der Ungenauigkeit dieses Schlusses. Darumist die Zufalls-Stichprobe die Basis für eine sogenannte repräsentative Stichprobe-nerhebung.

4. Eine Erhebung bei einem nicht zufällig ausgewählten Teil der Population heisst Tei-lerhebung. Beispielsweise kann eine Teilerhebung bei den grössten 100 Unter-nehmen der Schweiz durchgeführt werden (sogenannte Konzentrationsstichpro-be). Offensichtlich kann dann über die kleinen Unternehmen nur unter starken An-nahmen eine Aussage gemacht werden. Bei sogenannten Quoten- Stichprobenwerden Interviewern die Anzahl Interviews (Quoten) für bestimmte Personen (z.B.“Angestellter unter 40") vorgegeben, aber die eigentliche Auswahl ist dem Inter-viewer überlassen. Ein Quotenstichprobe hat den Nachteil, dass sie zu einem sys-tematischen Schätzfehler führen kann und dass keine verlässliche Fehlerschätzungmöglich ist. Heute werden auch oft Erhebungen bei einer Gelegenheitsstichprobe(engl. convenience sample) durchgeführt, zu der ein einfacher und günstiger Zu-gang besteht, aber keine Kontrolle über den Zusammenhang mit einer gewünsch-ten Population. Beispielsweise befragt ein Studierender seine Facebook-Freundeüber die Einstellung zu e-books. Teilerhebungen und insbesondere Gelegenheitss-tichproben sind nicht repräsentativ.

In Tabelle 1.1 werden Zufalls-Stichprobe, Vollerhebung und Register miteinander ver-glichen.

Stichprobenerhebungen, die auf einer Zufallsstichprobe basieren, liefern also qualita-tiv hochstehende, umfangreiche Informationen, die sich auf die Population verallgemei-nern lassen. Dank der Zufallsstichprobe kann der Fehler dieser Aussagen abgeschätztwerden. Stichprobenerhebungen sind relativ teuer, können aber die Ergebnisse schnellzur Verfügung stellen. Sie sind nicht für die Untersuchung kleiner Teilpopulationen geeig-net.

c© Beat Hulliger 2016 3

Kriterium Zufalls-S. Vollerhebung Register Gelegenheits-S.

Umfang der Information + . – .Qualität der Daten + . – –Kosten . – + +Schnelligkeit + – . +Untergrupppen-Auswertung – + . +Vollständigkeit – + . –Bias + + . –Varianz – + + .Repräsentativität + + + –

Tabelle 1.1: Verschiedene Wege zur Information.

1.2 Einige wichtige Begriffe

Eine endliche Population oder Grundgesamtheit ist eine endliche Menge von Elemen-ten. Die Zugehörigkeit zur Grundgesamtheit, bzw. die genaue Abgrenzung der Elementeund der Population ist eines der schwierigsten Probleme bei Stichprobenerhebungen.Der Stichprobenplan beschreibt für jede Teilmenge einer endlichen Population mit wel-cher Wahrscheinlichkeit sie gezogen zu werden soll. Aus dem Stichprobenplan leitensich die Einschlusswahrscheinlichkeiten der einzelnen Element ab. Bei der Ziehungder Stichprobe wird ein Stichprobenplan ausgeführt. Es wird also zufällig eine Teilmengeder Population, die Stichprobe, ausgewählt. Bei jedem Element der Population könnendie Werte einer oder mehrerer Variablen gemessen werden. Die Menge der Variablen-Werte eines Elements sind die Daten eines Elements.

Das Ziel ist die Schätzung einer Charakteristik der Population (Populations - Para-meter). Eine Charakteristik lässt sich aus den Variablenwerten der Populationselementeberechnen (z.B. die Anzahl der Erwerbslosen aus der Summe der Werte 1 für erwerbslosbzw. 0 für erwerbstätig). Der Zugang zur Population erfolgt oft über eine Liste, den soge-nannten Stichprobenrahmen. Beispielsweise können die Haushalte der Schweiz überdas elektronische Telefonverzeichnis erschlossen werden. Oft ist ein Stichprobenrahmenunvollständig oder hat Fehler. Manchmal ist die Einheit des Stichprobenrahmens nichtdieselbe, die man analysieren möchte. Zum Beispiel werden im Telefonverzeichnis Tele-fonnummern gezogen, aber die Auswertung bezieht sich dann auf die Motorfahrzeuge imentsprechenden Haushalt. Man unterscheidet dann Stichprobeneinheit und Analyseein-heit.

Währende der Datengewinnung wird versucht, die Daten von jedem Element derStichprobe zu ermitteln. Dabei muss meistens mit Antwortausfällen gerechnet werden.Die Anzahl der Elemente, über die man Daten ermitteln konnte, ist die Netto-Stichproben-grösse.

Werden bei der selben Stichprobe zwei oder mehr Male Daten erhoben, spricht manvon einem Panel. Panel sind sehr geeignet, um Entwicklungen über die Zeit zu erfassen.

Ein Schätzverfahren bzw. ein Schätzer oder Punkt-Schätzer beschreibt, wie ausden Daten der Stichprobe eine Schätzung für die Populations-Charakteristik berechnetwird. Ein guter Schätzer berücksichtigt den Stichprobenplan und eventuell Antwortaus-fälle. Wenn ein Schätzer im Mittel über viele (hypothetische) Stichprobenziehungen diePopulationscharakteristik trifft, dann wird er erwartungstreu genannt, oder man sagt,der Schätzer hat keinen Bias. Die Varianz eines Punktschätzers kann selbst geschätztwerden. Diese Varianzschätzung erlaubt die Bildung von Vertrauensintervallen. Die Va-rianz von Schätzern nimmt meistens umgekehrt proportional zur Stichprobengrösse ab.Die Grösse der Population hat oft einen vernachlässigbaren Einfluss auf die Varianz.

Die erhobenen Daten, müssen auf ihre Vollständigkeit und auf ihre Konsistenz kon-

4 c© Beat Hulliger 2016

POPULATION CHARAKTERISTIK

⇓ Stichprobenplan und Ziehung Schätzung ⇑

STICHPROBE ⇒ Datengewinnung⇒ DATEN

Tabelle 1.2: Der Weg von der Population zur Charakteristik.

trolliert werden. Oft fehlen gewisse Antworten und oft widersprechen sich die Daten (z.B.jugendliche Witwen) oder es hat extreme Werte, sogenannte Ausreisser in den Daten.Fehlende und fehlerhafte Daten können z.T. nach erhoben werden, oder man versucht,sie zu korrigieren oder mit Hilfe von statistischen Modellen mit gültigen Werten zu er-setzen. Die Phase der Kontrollen und Einsetzungen (engl. “Edit and Imputation”) oderDatenaufbereitung ist kostspielig und langwierig, aber sie ist oft entscheidend für dieQualität der Resultate.

Unter Gewichtung versteht man die Entwicklung von Schätzern, die sich als gewich-tete Summen ausdrücken lassen. Es wird dabei jeder Beobachtung ein Gewicht zuge-ordnet. Die Gewichte sollen sowohl den Stichprobenplan berücksichtigen, als auch Ant-wortausfälle möglichst gut kompensieren. Da mit Hilfe der Gewichte von der Stichprobeauf die Population geschlossen werden kann, spricht man auch von Hochrechnung.

Oft möchte man nicht nur für die ganze Population, sondern auch für einzelne Tei-le der Population, sogenannte Untersuchungsbereiche, Aussagen machen. Meistenshat man bereits vor der Erhebung Informationen über die Struktur der Population, z.B.über interessierende Untersuchungsbereiche oder die geographische Verteilung. DieseInformationen werden ausgenützt, um die Erhebung effizienter zu machen und führen zukomplexen Stichprobenplänen. Man unterscheidet zwei Methoden der Strukturierung vonStichproben: Schichtung und Klumpung.

Bei der Schichtung kann die Population in einige homogene Teile, die Schichten, auf-geteilt werden, und man zieht in jeder Schicht eine unabhängige Stichprobe. Bei derKlumpung kann die Population in viele, oft geographisch zusammenhängende Teile, dieKlumpen, zerlegt werden, und man zieht eine Stichprobe von solchen Klumpen. DieKlumpen können natürlich in Schichten aufgeteilt werden, und innerhalb der Klumpenkönnen wiederum Stichproben gezogen werden. Solche Stichprobenpläne nennt manmehrstufig.

Der Weg von der Population zur Stichprobe und zurück wird in Tabelle 1.2 dargestellt.

1.2.1 Repräsentativität

Der Begriff der Repräsentativität ist schwierig zu fassen und es bestehen verschiedeneMeinungen darüber. Einige Elemente dazu sind die folgenden:

1. Aus moderner Sicht spricht man von repräsentativen Erhebungen und nicht vonrepräsentativen Stichproben. Dies weil bei der Stichprobe der wesentliche Schlussvon der Stichprobe auf die Population gar noch nicht geklärt ist.

2. Grundsätzlich ist eine Erhebung repräsentativ, wenn sie

i) einen gültigen Schluss auf die zu schätzenden Charakteristiken einer Popula-tion ermöglicht. Mit gültig ist hier gemeint, dass die Schätzung tatsächlich dieCharakteristik schätzt, insbesondere keinen systematischen Fehler hat.

ii) und wenn dieser Schluss genügend genau ist, also auch bei Wiederholungennicht so grosse Unterschiede bestehen, dass für die praktische Anwendung zuviel Unsicherheit besteht.

c© Beat Hulliger 2016 5

Diese beide Kriterien sind sehr einschränkend und anspruchsvoll. Sie sind denbekannten Begriffen Validität und Reliabilität aus den Sozialwissenschaften naheverwandt. Das Problem liegt darin, wie die Begriffe Validität und Reliabilität opera-tionalisiert werden können.

3. Eine operationelle Definition liefert die Theorie der Zufallsstichproben: Eine Erhe-bung ist repräsentativ, wenn

i) die Stichprobe nach einem vordefinierten Stichprobenplan zufällig gezogen wur-de.

ii) von allen Elementen in der Stichprobe die benötigten Informationen vorliegen.

iii) das Schätzverfahren den Stichprobenplan berücksichtigt und damit keinen odereinen vernachlässigbaren Bias hat.

iv) die Genauigkeit der Schätzer für die praktische Anwendung genügend ist.

Dies Definition zeigt einen klaren Weg für die Repräsentativität auf. Leider kann siein der Praxis nicht voll eingehalten werden, u.a. weil Antwortausfälle und weitereAbweichungen nicht zu vermeiden sind.

4. Eine Modell-basierte Definition muss folgende Bedingungen zu erfüllen:

i) Die interessierenden Charakteristiken können aus den Hilfsinformationen mitHilfe eine Modells genügend genau vorhergesagt werden.

ii) Die für die Vorhersage benötigten Hilfsinformationen sind für die Populationbekannt.

iii) Das Modell kann aus der Stichprobe ohne systematische Fehler und mit genü-gender Genauigkeit geschätzt werden.

Aufgrund dieser Definitionen wird klar, dass in realistischen Fällen keine endgültigeAussage über die Repräsentativität gemacht werden kann, weil jeweils wesentliche Ele-mente nicht bekannt sind, sondern nur postuliert werden können. Bei der realistischenZufallsstichprobe mit Antwortausfällen muss eine Aussage über den Effekt der Antwort-ausfälle und über die angestrebte Kompensation bei den Schätzverfahren gemacht wer-den. Bei Modell-basierten Verfahren muss eine Aussage über die Güte des Modells fürden nicht erhobenen Teil der Population gemacht werden, welche nicht auf den Datender Stichprobe basiert. Eine gewisse Bescheidenheit ist also angebracht, wenn der Be-griff Repräsentativität verwendet wird.

1.3 Die fünf Schritte einer Erhebung

1. Planung: Die Planung einer Erhebung ist der Schlüssel zum Erfolg. Bei der Pla-nung muss die Zielsetzung, die Projektorganisation (Personal, Organisation, Fi-nanzen, Projektplan) festgelegt werden wie bei jedem Projekt. Ausserdem müssenGrundparameter festgelegt werden, wie Grundgesamtheit und Einheit, Stichpro-benrahmen, Zeitpunkt der Erhebung und Referenzzeit, Erhebungsmethode (CATI,CAWI, PAPI etc., siehe Tabelle 1.3) angestrebte Genauigkeit und Stichprobenplan.Bei der Festlegung der Referenzperiode und der Erhebungsperiode müssen Sai-soneffekte oder spezielle Ereignisse berücksichtigt bzw. vermieden werden. Oft be-zieht sich die Erhebung auf einen Stichtag, aber auch Zeitperioden (letzte Wocheetc.) kommen in Frage. Bei der Informatik-Infrastruktur muss eine der Erhebung ent-sprechende Hard- und Software für die Erhebung selbst, für die Daten-Erfassung,die Datenaufbereitung, sowie die Dokumentation, Auswertung, Diffusion und Archi-vierung bereitgestellt werden.

6 c© Beat Hulliger 2016

2. Instrument: Das eigentlich Messinstrument einer Erhebung ist oft ein Fragebogen,es kann aber auch eine medizinische Messung oder ein Gutachter-Protokoll etc.sein. Das Messinstrument kann erst entwickelt werden, wenn die wichtigen Fragender Planung geklärt sind. Obwohl es natürlich Teil der Vorbereitung ist, wird es alseinzelner Schritt behandelt damit klar ist, dass es erst der zweite Schritt einer Er-hebung ist und damit die Bedeutung offensichtlich wird. Zum Fragebogen gehörenalle Informationsmittel, mit denen die Befragten angesprochen werden sollen, z.B.auch Ankündigungsbriefe, einleitende Aussagen und Erläuterungen. Diese Einweg-Kommunikation kann meistens nicht in einer ersten Version erstellt werden, sondernmuss in mehreren Iterationen und dank Tests mit Mitarbeitern, Auftraggebern, po-tentiellen Befragten verbessert werden.

3. Datengewinnung: Die Feldarbeit beginnt oft mit der Ziehung der eigentlichen Stich-probe und mit dem Kontaktieren der Stichprobeneinheiten. Wichtig ist eine rigoroseund detaillierte Überwachung der Feldarbeit (Interviewer und Interviewerinnen), desRücklaufs und der Qualität der ausgefüllten Fragebogen, um bei allfälligen Proble-men schnell eingreifen zu können. Die Datengewinnung ist abgeschlossen, wenndie Daten auf elektronischem Datenträger in Rohform vorhanden sind. Mahnungak-tionen müssen durchgeführt werden, allenfalls muss einem Befragten/einer Befrag-ten ein Wechsel zu einer anderen Erhebungsmethode (Papier anstatt Internet, Te-lefon anstatt Papier etc.) offeriert werden. Anreize (Geld, Wettbewerb) müssen ver-waltet und glaubhaft kommuniziert werden.

4. Auswertung: Die Rohdaten müssen kodiert, kontrolliert und soweit aufbereitet wer-den, dass statistische Analysen durchgeführt werden können. Weitere Arbeitensind Entdeckung von Ausreisser, Imputation von fehlenden und fehlerhaften Da-ten, Zusammenführen von Datensätzen, Etikettierung. Die Analysen sind deskrip-tiv, wobei die Genauigkeit eine wichtige Rolle spielt, und analytisch mit Hypothe-sentests und Modellbildung. Um den Stichprobenplan zu berücksichtigen und umAntwortausfälle zu kompensieren, müssen oft Schätzverfahren, vorzugsweise alsGewichtung entwickelt werden. Vertrauensintervalle, welche diesen Verfahren unddem Stichprobenplan müssen entwickelt und berechnet werden. Visualisierung soll-ten die Gewichtung berücksichtigen.

5. Kommunikation: Je nach Auftraggeber muss die Berichterstattung anders, aberauf alle Fälle Zielgruppen gerecht erfolgen. Berichterstattung (Diffusion) kann inForm von Pressemitteilungen, Methodenberichten, Artikeln in wissenschaftlichenZeitschrift- en erfolgen. Daten müssen unter Berücksichtigung des Datenschutzes(z.B. anonym oder noch besser geschützt) archiviert werden und allenfalls für dieWeitergabe an Forscher und Dokumentationsstellen aufbereitet werden. Dazu kom-men die üblichen Abschlussarbeiten für ein Projekt (Abrechnung etc.).

1.4 Zur Realisation einer Erhebung

Um die oben beschriebenen Schritte ausführen zu können, braucht es mindestens einedem Problem angepasste Projektorganisation, eine gesicherte Finanzierung und einenrealistischen Zeitplan.

Projektorganisation: Stichprobenerhebungen sind meistens mittlere bis grössere Pro-jekte und benötigen eine entsprechende Projektorganisation mit Projektleiter, Mitar-beitern, Auftraggeber, beratende Gremien, evtl. Vergabe der Erhebung an Umfrage-Institut, Unterstützung durch Statistiker und evtl. Informatiker.

Finanzierung: Bei der Finanzierung Pilot-Studie und Auswertung nicht vergessen! Einspezielles Problem ist die unbekannte Ausschöpfung: Unter Umständen müssenReservestichproben vorgesehen werden (siehe Abschnitt Antwortausfälle).

c© Beat Hulliger 2016 7

Tabelle 1.3: Erhebungsmethoden bei PersonenbefragungenMethode Vorteile NachteilePersönliches In-terview (F2F, PA-PI, CAPI)

Hohe Antwortquote; Mankann Texte, Bilder, ... zeigen

Kosten; Befragungsdauer;Oft Klumpenstichprobe;Schwierig zu kontrollieren

Computer- unter-stützte Telefon-Interviews (CATI)

Schnelligkeit; Computer- Un-terstützung; Kontrolle der Be-frager; Daten- Erfassung; AlleStichprobenpläne

Personen ohne Telefonan-schluss; Unmöglich Texteoder Bilder zu zeigen; Einfa-che Fragen

Per Post Kosten; Erlaubt Nachdenken;Alle Stichprobenpläne

Lange Erhebungsdauer; Ant-wortquote; Wer antwortet ?

Web-Interview(CAWI, CASI)

Kosten, Schnelligkeit, Multi-media, Sprungbefehle, Da-tenerfassung, Kontrollen

Web-Population, E-Post, Werantwortet?, Antwortquote.

Zeitplan: Die Entwicklung des Fragebogens braucht viel Zeit. Für die Phase der Daten-aufbereitung muss man mindestens gleich viel Zeit einplanen wie für die Feldarbeit(effektive Datenerhebung) selbst. Die Auswertung und die Diffusion braucht, je nachKomplexität, ein Mehrfaches der Zeit für die Feldarbeit!

1.5 Grundlage der klassischen Stichprobentheorie

Wir betrachten eine endliche Population U = {1, . . . , N} mit 0 < N < ∞ verschiedenenElementen. Für jedes Element i ∈ U kann der Wert einer Variablen y bestimmt werden.Der Vektor dieser Werte yi (i ∈ U) wird mit yU bezeichnet. Das Ziel der Stichprobener-hebung ist die Schätzung einer Charakteristik

θ(yU ) der Population, d.h. man will eine Funktion des Vektors yU oder von verschiede-nen Variablen y1U , . . . , ypU schätzen. Die zu schätzende Charakteristik ist oft das Populations-Mittel yU :=

∑i∈U yi/N einer Variable oder das Total yU+ =

∑i∈U yi.

Aus der Population wird eine Teilmenge S ⊆ U ausgewählt, die Stichprobe. DerStichprobenplan p(S) auf dem RaumS der möglichen Stichproben S ⊆ U ordnet jeder Stichprobe eine Ziehungs-Wahr-

scheinlichkeit zu:p : S → [0, 1].

Es gilt also 0 ≤ p(S) ≤ 1,∀S ∈ S und∑

S∈S p(S) = 1. Mit anderen Worten ist p dieWahrscheinlichkeitsverteilung der Mengenvariable S.

Oft wird der Stichprobenplan auch als die multivariate Verteilung eines Einschluss-vektors I mit binären Elementen Ii = 1{i ∈ S} (i ∈ U), d.h. auf den Ecken eines N -dimensionalen Einheitswürfels aufgefasst.

Der RaumS wird oft eingeschränkt auf Stichproben einer festen Grösse n, d.h. die Stichproben,

die nicht n Elemente enthalten, haben p(S) = 0 und werden gar nicht mehr aufgeführt.Es gibt aber auch Stichprobenpläne, welche erlauben, ein Element mehr als einmal zuziehen (sogenannte Stichprobenpläne mit Zurücklegen). In diesem Skript betrachten wirnur Stichprobenpläne ohne Zurücklegen.

Die Begriffe “mit und ohne Zurücklegen” stammen vom sogenannten Urnenmodell:In einer Urne befinden sich N gleichförmige und gleich schwere Kugeln. Es seien a roteund N − a schwarze Kugeln darunter. Die Kugeln werden gemischt und man zieht blindZug um Zug n Kugeln aus der Urne. Dabei kann man jeweils die Farbe einer gezogenenKugel notieren, die Kugel gleich wieder in die Urne legen und die Urne vor dem nächstenZug mischen. Dieses Vorgehen heisst “mit Zurücklegen". Offensichtlich kann eine Kugeldann mehrmals gezogen werden. Oder man nimmt eine Kugel nach der anderen aus der

8 c© Beat Hulliger 2016

Urne, ohne die Kugeln zurückzulegen. Jedes Element kann dann nur einmal gezogenwerden. Das Urnenmodell beschreibt eine einfache Zufallsstichprobe (siehe Abschnitt2).

Beispiel 1 (Population mit 3 Elementen) Sei U = {1, 2, 3}. Notiere alle 23 möglichenTeilmengen und bezeichne den Stichprobenraum der Stichproben der Grösse n = 2.

Beispiel 2 (Population 5) Sei U = {1, 2, 3, 4, 5}. Zähle die Stichproben der Grösse n = 2auf. Die Variable y habe folgende Werte: yU = (1, 5, 9, 8, 12)>. Berechne die folgendenCharakteristiken der Population: Populationsmittel, Populationsvarianz, Populationsmedi-an von y.

Die Einschlusswahrscheinlichkeit für das Element i ergibt sich als

πi = P[i ∈ S] =∑S3i

p(S).

Mit anderen Worten beschreibt πi die eindimensionale Randverteilung von p(S) für dasElement Ii des Einschlussvektors, also eine Bernoulli-Verteilung (P [Ii = 1] = πi undP [Ii = 0] = 1 − πi). Für den Einschluss des Elements i kommt es nicht darauf an,mit welcher Stichprobe das Element gezogen wird. Zur Berechnung der Einschlusswahr-scheinlichkeit müssen wir also alle Stichproben S, die das Element i enthalten eruieren,deren Wahrscheinlichkeit p(S) ermitteln und diese Wahrscheinlichkeiten summieren.

Die gemeinsame Einschlusswahrscheinlichkeit für zwei verschiedene Elemente i und jist

πij = P[i ∈ S ∧ j ∈ S] = P [Ii = 1, Ij = 1].

Dabei ist ∧ ein logisches “und”. Man setzt oft πii = πi. Ein wesentliches Merkmal dermeisten Stichprobenpläne ist, dass πij 6= πiπj , d.h. der Einschluss zweier Element ist imNormalfall nicht unabhängig.

Die in der Stichprobe beobachteten Werte (yi1 , . . . , yin) werden mit yS bezeichnet. EinSchätzer ist eine Funktion der Stichprobenwerte, also T = T (yS). Der Erwartungswertdes Schätzers unter dem Stichprobenplan p ist

E[T (yS)] =∑Sp(S)T (yS).

Der Bias eines Schätzers ist die mittlere Abweichung von der zu schätzenden Charakte-ristik:

E[T (yS)]− θ.

Ein Schätzer mit Bias 0 heisst erwartungstreu.Die Varianz eines Schätzers ist

V [T (yS)] = E[(T (yS)− E[T (yS)])2

]=∑Sp(S) (T (yS)− E[T (yS)])2 .

Ein Paar (Stichprobenplan, Schätzverfahren), also (p, T ), wird als Strategie bezeich-net. Um einen guten Schätzer zu definieren, verlangt man oft, dass der Schätzer untereinem Stichprobenplan erwartungstreu ist und eine kleine Varianz hat. Oder man ver-langt, dass der mittlere quadratische Fehler E[(T − θ)2] möglichst klein sein soll.

Im Unterschied zur klassischen Statistik, wo die Werte yi1 , . . . , yin Realisationen vonZufallsvariablen sind, ist in der konventionellen Stichprobentheorie S, die Stichprobe, daseinzige zufällige Element.

Manchmal wirdauch ein stochastisches Modell für Y angenommen. Man spricht dann vonSuperpopulationsmodellen. Die Inferenz auf die Populationscharakteristik kann dann

auf diesem stochastischen Modell gründen oder zumindest kann das Modell die Schätz-verfahren unterstützen.

Kapitel 2

Einfache Zufalls-Stichprobe

Die einfache Zufallsstichprobe ist der Grundbaustein in vielen komplexen Stichprobenplä-nen mit Schichtungen, Klumpungen und mehreren Stufen (siehe Kapitel 3, 5). In der Pra-xis werden vor allem komplexe Stichprobenpläne angewandt. Die Formeln der einfachenZufallsstichprobe sind noch sehr nahe den Formeln, die aus der klassischen Statistik fürunendliche Populationen bekannt sind.

In diesem und den nächsten Kapiteln findet sich eine Einführung in die klassischeStichprobentheorie. Dabei wird jeweils angenommen, dass keine Antwortausfälle auftre-ten. Antwortausfälle werden im Kapitel 8 behandelt.

2.1 Stichprobenplan

Sei N die Grösse der Population. Sei y1, . . . , yN das interessierende Merkmal (Variable).Die möglichen Stichproben seien alle Teilmengen der Population mit genau n Elementen.Bei der einfachen Zufalls-Stichprobe (ohne Zurücklegen), ES, hat jede Teilmenge derGrösse n dieselbe Wahrscheinlichkeit, Stichprobe zu werden. Diese Wahrscheinlichkeitist

p(S) =1(Nn

) =n!(N − n)!

N !.

Jedes Element hat folglich die Einschlusswahrscheinlichkeit

P[i ∈ S] = πi = n/N.

Die gemeinsame Einschlusswahrscheinlichkeit zweier Elemente i und j ist πij =n(n−1)N(N−1) .

Achtung, gleiche Einschlusswahrscheinlichkeiten für alle Elemente garantieren nicht,dass eine einfache Zufallsstichprobe vorliegt! Die Einschlusswahrscheinlichkeiten definie-ren nämlich nur die Randverteilungen pro Element, aber nicht die gemeinsame Verteilungaller Elemente. Gleiche Einschlusswahrscheinlichkeit entsteht beispielsweise auch dann,wenn zuerst ein Element aus U mit Wahrscheinlichkeit 1/N ausgewählt wird und danndie n− 1 nächsten Nachbarn des gezogenen Elements zu der Stichprobe hinzugeschla-gen werden. Das ist aber keine einfache Zufallsstichprobe, weil z.B. Elemente, die weitauseinander liegen nie gleichzeitig in die Stichprobe gelangen können, also πij = 0 ha-ben.

2.2 Schätzer für den Mittelwert

Das arithmetische Mittel der Stichprobenmerkmale, das Stichprobenmittel

yS =1

n

∑i∈S

yi,

9

10 c© Beat Hulliger 2016

schätzt das arithmetische Mittel der Population yU erwartungstreu. Der Beweis benütztdie Indikator-Funktion 1{i ∈ S}, welche den Werte 1 annimmt, wenn i in der Stichprobe Sist, und sonst 0. Der Erwartungswert der Indikator-Funktion ist E[1{i ∈ S}] = P[i ∈ S] =πi. Mit Hilfe der Indikator-Funktion kann anstatt der Summe über eine zufällige Menge Seine Summe über die Population betrachtet werden:

E

[∑i∈S

yi/n

]= E

[∑i∈U

yi1{i ∈ S}/n

]=∑i∈U

yiπi/n = yU .

Das Total der Variablen y, d.h. yU+, wird geschätzt durch NyS . Dieser Schätzer kannauch als gewichtete Summe geschrieben werden:

NyS =∑i∈S

N

nyi =

∑i∈S

1

πiyi.

2.3 Varianz des Stichprobenmittels

Die Varianz des arithmetischen Mittels ist

V [yS ] = (1− n/N)1

nD2, (2.1)

wobei hier

D2 =1

N − 1

∑i∈U

(yi − yU )2 (2.2)

die Varianz von y in der Population bezeichnet. (In der Literatur wird D oft mit S be-zeichnet für Standardabweichung. Hier wird D verwendet, um die Verwechslung mit derStichprobe zu vermeiden.)

Der Faktor 1 − n/N wird Endlichkeitskorrektur genannt. Die Endlichkeitskorrekturstrebt gegen 0, wenn die Stichprobengrösse n gegen die Populationsgrösse N strebt.Dies ist auch richtig so: Bei einer Vollerhebung hat der Mittelwert der “Stichprobe” keineVarianz mehr, da er zumindest theoretisch dem wahren Wert in der Population entspricht.Die Wurzel

√V [yS ] aus der Varianz wird Standardfehler oder Stichprobenfehler ge-

nannt.

Bei kleiner Stichprobenrate f = n/N verhält sich V [yS ] wie 1/n: Die Populations-grösse ist oft unwesentlich für die Genauigkeit! Um den Stichprobenfehler zu halbieren,braucht es vier mal so viele Beobachtungen!

Beispiel 3 (Einfache Zufallsstichprobe) Berechne mit Population 5 für alle einfachenZufallsstichproben der Grösse n = 2 das Stichprobenmittel yS . Bestimme den Erwar-tungswert des Stichprobenmittels und die Varianz.

Die Varianz des Schätzers NyS für das Total ist N2V [yS ].

c© Beat Hulliger 2016 11

2.3.1 Herleitung der Varianz des Stichprobenmittels *

Zur Erinnerung: In der folgenden Herleitung ist S das zufällige Element, nicht yi. C(X,Y )bezeichnet die Kovarianz zweier Zufallsvariablen X und Y .

V

[1

n

∑S

yi

]=

1

n2V

[∑U

yi1{i ∈ S}

]

=1

n2

∑U

y2i V [1{i ∈ S}]

+1

n2

∑i 6=j,∈U

yiyjC(1{i ∈ S},1{j ∈ S})

=1

n2

∑U

n

N(1− n/N)y2i

+1

n2

∑i 6=j,∈U

yiyj

(n(n− 1)

N(N − 1)− n2

N2

)

=1

n(1− n/N)

1

N − 1

∑U

N − 1

Ny2i −

1

N

∑i 6=j,∈U

yiyj

=

1

n(1− n/N)

1

N − 1

∑U

(yi − yU )2

Dabei ist C(., .) die Kovarianz.

2.4 Schätzung der Varianz

Um eine Schätzung der Varianz des arithmetischen Mittels zu erhalten, wird das unbe-kannte D2 in V [yS ] aus der Stichprobe geschätzt:

d2 =1

n− 1

∑i∈S

(yi − yS)2.

Dann wird d2 in die Formel (2.1) eingesetzt:

v(yS) = (1− n/N)d2/n = (1− n/N)1

n

(1

n− 1

∑i∈S

(yi − yS)2

).

Dabei wird d die Standardabweichung der Stichprobe genannt (in der Literatur oft mit sabgekürzt). Der Schätzer v(yS) ist erwartungstreu. Die Wurzel von v(yS), nämlich

√(1− n/N)·

d/√n, ist der geschätzte Standardfehler des Stichprobenmittels.

In der Praxis wird die Endlichkeitskorrektur vernachlässigt, wenn die Stichprobenratef = n/N klein (< 0.1) ist.

2.5 Stichprobengrösse

Eine einfache Abschätzung der benötigten Stichprobengrösse n0, um für das Stichpro-benmittel eine Varianz V , beziehungsweise eine Standardabweichung von maximal a zuerreichen, liefert

n0 = D2/V = (D/a)2

Dabei ist D2 die Varianz in der Population. Da im Normalfall D2 unbekannt ist, benötigtman eine Abschätzung von D2 mit Hilfe von Daten aus früheren Erhebungen oder austheoretischen Überlegungen.

12 c© Beat Hulliger 2016

Wird die gewünschte Variabilität des Stichprobenmittels als Variationskoeffizient c =√V [yS ]/E[yS ] ausgedrückt, dann ist

n0 =(D/yU )2

c2.

Oft wird auch eine maximale halbe Länge eines (approximativen) 95%-Vertrauensintervalls,e, angestrebt. Dann ergibt sich die benötigte Stichprobengrösse mit

n0 =e2

z2D2.

Wenn die Endlichkeitskorrektur berücksichtigt werden soll, wird n0 ersetzt durch n =n0/(1 + n0/N).

2.6 Schätzung eines Anteils

Sei yi = 1{i ∈ A} eine Variable mit dem Wert 1, falls Element i in der Teilmenge A ⊂ Uist, und mit dem Wert 0 sonst (Indikatorvariable). Der Anteil von Elementen von U , wel-che zu A gehören, ist pU =

∑U 1{i ∈ A}/N . (Hier bezeichnet p einen Anteil und nicht

den Stichprobenplan.) Dieser Anteil wird erwartungstreu geschätzt durch das Stichpro-benmittel pS =

∑S 1{i ∈ A}/n, d.h. durch den Anteil in der Stichprobe. Die Varianz von

pS lässt sich aus (2.1) herleiten und ist

V [pS ] =pU (1− pU )

n

N − nN − 1

.

Diese Varianz kann geschätzt werden mit

v(pS) = (1− n/N)pS(1− pS)

n− 1.

Die Stichprobengrösse für die Schätzung eines Anteils mit vorgegebener Genau-igkeit kann durch n0 = pU (1 − pU )/V oder bei Berücksichtigung der Endlichkeitskorrek-tur durch n = n0/(1 + (n0 − 1)/N) bestimmt werden. Die Funktion pU (1 − pU ) hat beipU = 0.5 ihr Maximum. Weil oft viele verschiedene Variablen erhoben werden sollen, istdie pU = 0.5 entsprechende obere Grenze n0 = 0.25/V sehr bequem und wird häufigverwendet.

Als konkretes Beispiel sei V = 0.0252 angenommen. Dieser Wert ergibt gerade ein95%-Vertrauensintervall mit halber Länge 0.05 (siehe Abschnitt 9.2). Die benötigte Stich-probengrösse ist n = 0.25/0.0252 = 400.

In Abschnitt 2.7 wird die Grösse der Stichprobe für die Schätzung von Gruppen an-hand der Auflösung einer Stichprobe (Eichenberger et al., 2011) diskutiert.

2.7 Untersuchungsbereiche

Sei UB ⊂ U ein Teil der Population für den wir eine besondere Auswertung machen möch-ten (Untersuchungsbereich). Beispielsweise sollen bei einer Bevölkerungsstichprobe dieFrauen speziell analysiert werden. Bei einer einfachen Zufallsstichprobe S aus U könnenwir die Stichprobe SB = S ∩ UB als einfache Zufallsstichprobe aus UB betrachten, wennwir die Grösse nB der Teilstichprobe SB als fest annehmen (Tatsächlich ist natürlich nBhypergeometrisch verteilt). Das Mittel yUB

wird also erwartungstreu geschätzt durch

ySB=

1

nB

∑SB

yi.

c© Beat Hulliger 2016 13

Dieser Schätzer ist ein Quotient von zwei Zufallsvariablen. Um seine Varianz zu berech-nen muss auch die Variabilität von nB berücksichtigt werden. Im allgemeinen Fall lässtsich nur eine Varianz-Approximation angeben.

Wir nehmen nun an, dass wir mit Sicherheit mindestens zwei Beobachtungen imUntersuchungsbereich haben. Dann ist der Varianzschätzer

v(ySB) = (1− nB/NB)

1

nB

1

nB − 1

∑SB

(yi − ySB)2,

erwartungstreu. Falls NB unbekannt ist, kann die Endlichkeitskorrektur mit 1 − n/N an-genähert werden.

Wenn die Grösse NB des Untersuchungsbereichs bekannt ist, ist ein guter erwar-tungstreuer Schätzer für das Total yUB+ über den Untersuchungsbereich: NB ySB

. Diesist ein sogenannter Quotientenschätzer (siehe Abschnitt 4.2).

Der Schätzer TB = N∑

SByi/n benötigt keine Information über die Grösse des Un-

tersuchungsbereichs. Man kann diesen Schätzer als einen Mittelwert über die ganzeStichprobe schreiben, wenn man eine neue Variable y′i = yi1{yi ∈ UB} einführt. Die Va-rianz von TB = y′S kann dann wie für jedes Stichprobenmittel geschätzt werden mit Hilfeder Variable y′i. Der Schätzer TB ist meistens weniger effizient als ySB

, obwohl auch ererwartungstreu ist.

Betrachtet man die Differenz ySB− ySC

zwischen den Stichprobenmitteln über zweiverschiedene Untersuchungsbereiche UB und UC , UB∩UC = ∅, dann sind die zwei Stich-probenmittel bedingt auf die Stichprobengrössen nB und nC unabhängig. Die Summe derVarianzschätzer für die Stichprobenmittel über die Untersuchungsbereiche

v(ySB) + v(ySC

)

schätzt die Varianz von ySB− ySC

nahezu erwartungstreu. Dabei wird die Endlichkeits-korrektur weggelassen, weil ohnehin yUB

− yUCnicht 0 ist im Normalfall. Der Test bezieht

sich streng genommen auf ein unterliegendes stochastisches Modell für die VariablenyUB

und yUC. Die Werte, welche diese Variablen für die vorliegende endliche Population

annehmen, werden als Realisationen von Zufallsvariablen betrachtet (eine sogenannteSuperpopulation) und die eigentliche Hypothese ist, dass diese Zufallsvariablen den glei-chen Erwartungswert haben.

2.7.1 Auflösung einer Stichprobe

Die Auflösung einer Stichprobe wurde in Eichenberger et al. (2011) eingeführt. Dabeiwird die Frage nach der Genauigkeit so gestellt, dass in einem Untersuchungsbereichder Grösse ND der Anteil einer Gruppe der Grösse Rs, also mit Anteil p = Rs/ND nochgut geschätzt werden soll. Dabei geht es um kleine Gruppen, also um Anteile p < 0.1. Rswird die Grössen-Auflösung der Stichprobe genannt. Eine grobe Abschätzung ergibt

nD = 4ND/Rs = 4/p.

Um beispielsweise die Grösse eine Gruppe mit einem vermuteten Anteil von p = 0.01(also 1%) gut zu schätzen, benötigt man eine Stichprobe der Grösse nD = 400. Umeine Gruppe der Grösse p = 0.05 zu schätzen braucht man eine Stichprobe der GrössenD = 80.

Vergleiche zwischen der Grösse von Gruppen in zwei verschiedenen Untersuchungs-bereichen sind schwieriger zu fassen. Angenommen, der Anteil einer Gruppe in zwei un-gefähr gleichen Untersuchungsbereichen B und C unterscheidet sich um rd = pB − pC(pB > pC vorausgesetzt). Das Ziel sei, die Differenz der Anteile gut zu schätzen. Dannergibt eine grobe Abschätzung der benötigten Stichprobengrösse je in den beiden Unter-suchungsbereichen

nB = nC =2

r2d.

14 c© Beat Hulliger 2016

Um eine Differenz von rd = 0.05 gut zu schätzen, benötigt man also eine Stichprobe vonje nB = nC = 800. Damit wird deutlich, dass für die Schätzung von Differenzen zwischenUntersuchungsbereichen wesentlich grössere Stichproben benötigt werden, als für dieSchätzung einer einzelnen Populationscharakteristik. Dies ist vergleichbar mit der Machteines Zweistichproben-Anteil-Tests: Um bei pB = 0.525 und pC = 0.475 und α = 0.05 eineMacht von 0.5 zu erreichen werden je n = 768 Beobachtungen benötigt. Für eine Diffe-renz von rd = 0.1 benötigt man je nB = nC = 200 Elemente in den Untersuchungsbe-reichen. Genauere Abschätzungen und der Zusammenhang mit der Macht von χ2-Testsfinden sich in Eichenberger et al. (2011).

2.8 Ziehung einer einfachen Zufallsstichprobe:

2.8.1 Einfacher Algorithmus

Erzeuge zu jedem Element von U eine unabhängige Realisierung einer auf dem Intervall[0, 1] uniform verteilten Zufallsvariablen. Sortiere die Population nach dieser Zufallsvaria-ble. Die ersten n Elemente in der sortierten Population bilden die Stichprobe.

2.8.2 Systematische Stichprobe

In der Praxis wird oft folgende Methode angewendet, obwohl sie theoretisch nicht ei-ner einfachen Zufallsstichprobe entspricht: Man hat die Elemente der Population in einersequentiellen Liste angeordnet. Sei N/n = k eine ganze Zahl. Ziehe einen zufälligenStartpunkt i0 ∈ {1, . . . , k}. Dann wird ab i0 jeweils ein Schritt von k Elementen gemachtund das getroffenen Element gezogen. Die Stichprobengrösse ist N/k = n. Da die Wahr-scheinlichkeit, zwei benachbarte Elemente zu ziehen, 0 beträgt, handelt es sich nicht umeine einfache Zufallsstichprobe, obwohl die Einschlusswahrscheinlichkeit jedes Elementsn/N beträgt. Indem die Elemente der Liste vorgängig zufällig angeordnet werden, kannman die systematische Stichprobe zu einer tatsächlichen ES machen. Auch wenn dieOrdnung nicht zufällig ist, ist die systematische Stichprobe oft eine sehr gute Annäherungan eine einfache Zufallsstichprobe. Das grösste Problem stellen Gesetzmässigkeiten imStichprobenrahmen dar, welche mit der Schrittweite in Phase sind! Falls N/n keine gan-ze Zahl ist, muss als Schrittweite die grösste ganze Zahl, die kleiner als N/n ist, gewähltwerden. Die Stichprobe kann dabei je nach Startwert auch die Grösse n+ 1 haben.

Kapitel 3

Einfache geschichteteZufallsstichprobe

Bei einer geschichteten Zufallsstichprobe wird die Population in Teil-Populationen auf-geteilt und innerhalb dieser Teilpopulationen wird je separat eine Stichprobe gezogen.Um eine Schätzung für die gesamte Population zu erhalten, werden die Resultate fürdie Teil-Populationen am Ende wieder zu einem Gesamtresultat zusammengefügt. DiePopulation U sei in L Unter-Populationen Uh, (h = 1, . . . , L) aufgeteilt. Diese Unterpo-pulationen, die man Schichten nennt, sind in sich möglichst homogen und untereinandermöglichst heterogen zu definieren (bezüglich der hauptsächlich interessierenden Varia-blen). Die Einheiten der Population werden mit dem Doppelindex hi indexiert, wobei hdie Schicht bezeichnet und i ein Element innerhalb einer Schicht. Das erste Element inSchicht h hat dabei nichts zu tun mit dem ersten Element der Schicht h′. Sei Nh dieGrösse der Schicht Uh und Wh = Nh/N ihr Gewicht.

Für die einfache geschichtete Zufallsstichprobe zieht man in jeder Schicht Uh eineeinfache Zufallsstichprobe Sh.

Bemerkungen:

+ Sogar eine sehr einfache Schichtung kann die Varianz massiv verkleinern.

+ Die Stichprobengrösse innerhalb der Schichten kann rein aufgrund von Effizienz-überlegungen für die gesamte Stichprobe festgelegt werden (cf. Abschnitt 3.2). Mankann aber auch die Stichprobengrösse für interessante oder kleine Schichten erhö-hen (oversampling).

+ Man kann verschiedene beliebig komplizierte Stichprobenverfahren in den verschie-denen Schichten anwenden, wenn die verschiedenen Stichproben in den Schichtenunabhängig sind. Dies führt zu komplexen Stichprobenplänen.

− Ohne genügende Informationen über die Grundgesamtheit kann man sie nicht schich-ten. Eine grössere Population ohne Struktur ist in der Praxis selten. Wenn die imvoraus bekannte Information etwas über die zu untersuchenden Variablen aussagt,ist Schichtung sinnvoll.

3.1 Schätzer

Innerhalb der Schichten können wir die Techniken für eine einfache Zufallsstichprobeanwenden. Es ist also ySh

ein Schätzer für das Schichtmittel yUhund NhySh

ein Schätzerfür das Schichttotal. Ein Schätzer für das Populationsmittel yU ist

TSS =

(L∑h=1

NhySh

)/N =

L∑h=1

WhySh=

L∑h=1

∑i∈Sh

Nh

Nnhyhi.

15

16 c© Beat Hulliger 2016

Dieser Schätzer wird geschichtetes Mittel genannt und manchmal auch mit ySS bezeich-net. Die geschichtete Stichprobe mit dem geschichteten Mittel ist eine Horvitz-ThompsonStrategie (siehe Abschnitt 4.3). Die Varianz von TSS ist

V [TSS ] =L∑h=1

W 2hV [ySh

] =L∑h=1

W 2h (1− nh/Nh)D2

h/nh,

wobei D2h = 1

Nh−1∑

i∈Uh(yhi − yUh

)2 ist. Eine Schätzung erhält man, indem D2h durch

d2h = 1nh−1

∑i∈Sh

(yhi − ySh)2 ersetzt wird.

Anstatt NhyShkann auch ein anderer Schätzer für das Schichttotal benützt werden,

z.B. ein Quotientenschätzer (siehe Abschnitt 4.2) Der Varianzschätzer pro Schicht müss-te dann angepasst werden. Die Kombination der Varianzschätzer geschieht aber gleichwie beim Stichprobenmittel.

Ein TSS entsprechender Schätzer für das Populationstotal ist

NTSS =L∑h=1

NhySh=

L∑h=1

∑i∈Sh

Nh

nhyhi.

Die Faktoren Nh/nh werden oft Hochrechnungs-Gewichte genannt.

Beispiel 4 (Geschichtete Stichprobe) Sei die Population 5 in zwei Schichten unterteilt:U1 = {1, 2, 3} und U2 = {4, 5}. Berechne für die Variable y je das Schichtmittel und dieSchichtvarianz. Wir ziehen in jeder Schicht eine einfache Zufallsstichprobe der Grössen = 1. Zähle die möglichen Stichproben auf. Berechne je das geschichtete Mittel ySSsowie Mittelwert und Varianz dieser Schätzungen.

3.2 Aufteilung der Stichprobe

Sei die Grösse n der gesamten Stichprobe vorgegeben. Bei der proportionalen Auftei-lung wird die Stichprobe proportional zu den Schichtgrössen aufgeteilt:

nh = nNh/N = nWh.

Die optimale Aufteilung (Neyman-Tschuprow) berücksichtigt nicht nur die Schicht-grössen, sondern auch die Variabilität Dh einer interessierenden Variablen innerhalb derSchichten. Die Varianz von TSS wird minimiert durch die Aufteilung

nh = nNhDh∑L

h′=1Nh′Dh′.

Zusätzlich zu der Variabilität der Schichten können auch ungleiche Kosten je Schichtbei der Optimierung berücksichtigt werden (Cochran, 1977, p. 96).

3.3 Stichprobengrösse

Für die Bestimmung der gesamten Stichprobengrösse n wird wie folgt vorgegangen:Bei proportionaler Aufteilung gilt (ohne Berücksichtigung der Endlichkeitskorrektur)

n0 =L∑h=1

WhD2h/V,

wobei V die gewünschte Varianz des Schätzers für das Populationsmittel ist. Die End-lichkeitskorrektur kann berücksichtigt werden durch n = n0/(1 + n0/N).

c© Beat Hulliger 2016 17

Bei optimaler Aufteilung ergibt sich

n =(∑L

h=1WhDh)2

V +∑L

h=1WhD2h/N

.

Dabei ist die Endlichkeitskorrektur innerhalb der Schichten bereits berücksichtigt(Cochran, 1977, p.98).

3.4 Anzahl und Wahl der Schichten

Um die Genauigkeit der Resultate zu verbessern, könnte man versuchen, immer mehrSchichten zu definieren. Das ist nicht sinnvoll, denn:

• Die Stichprobengrösse innerhalb der Schichten muss mindestens 2 sein, wenn maneine erwartungstreue Schätzung der Varianz berechnen will. Mit einer Gesamtstich-probe der Grösse n kann man dann höchstens n/2 Schichten definieren. Wennman innerhalb einer Schicht Ausreisser entdecken möchte, sollte man mindestens3 Beobachtungen haben.

• Oft muss man mit einer Ausfallrate bis zu 50% rechnen, sodass pro Schicht ge-nügend Reserve vorhanden sein sollte. Der Wunsch nach Auswertung von Unter-suchungsbereichen pro Schicht verlangt oft auch relativ grosse Stichproben proSchicht, um mit genügender Sicherheit Beobachtungen aus dem Untersuchungs-bereich in der Stichprobe jeder Schicht zu haben.

• Die Genauigkeit wächst nicht linear mit der Anzahl Schichten. Mehr Schichten zubilden, ist bald nicht mehr interessant, vor allem wenn die Schichtung aufgrund vonMerkmalen definiert wird, welche nicht sehr stark mit der interessierenden Varia-ble korrelieren. Theoretisch ist es sogar möglich, dass ein geschichtetes Mittel mitvielen Schichten höhere Varianz als das Stichprobenmittel bei einfacher Zufalls-stichprobe hat (siehe Cochran 1977, Kapitel 5.6).

Die Festlegung der Schichtgrenzen folgt oft praktischen Überlegungen und wird z.T. vonden anvisierten Auswertungen mitbestimmt. Die Schichten sollten möglichst homogensein bezüglich wichtiger Variablen. Wenn genügend Informationen über die Populati-on bei der Stichprobenplanung vorliegen, können die Schichtgrenzen optimiert werden(Cochran, 1977, Section 5A.7).

3.5 Genauigkeitsvergleich

Wenn in allen Schichten für alle betrachteten Aufteilungen der Auswahlsatz nh/Nh ver-nachlässigbar ist, d.h. kleiner als 0.1 ist, dann gilt im Allgemeinen folgende Beziehung:

VSSopt[T (yS)] ≤ VSSprop[T (yS)] ≤ VES [T (yS)],

wobei T (yS) das Populationsmittel der Variable y ist, für welche die Zuteilung der ge-schichteten Stichprobe optimiert wurde. Dabei kann man zeigen, dass die proportionalegeschichtete Stichprobe gegenüber der ES gewinnt, weil die Variabilität der Schichtmit-tel wegfällt, und dass die optimale geschichtete Stichprobe noch effizienter ist, weil sieunterschiedliche Varianzen in den Schichten berücksichtigt (Cochran, 1977, Section 5.6and 5.7).

Es ist aber auch möglich, dass eine geschichtete Stichprobe grössere Varianz hat alseine einfache Zufallsstichprobe, nämlich dann, wenn in Schichten mit hoher Variabilitätvergleichsweise kleine Stichproben gezogen werden. Da oft eine Stichprobe für verschie-dene Variablen erhoben wird, aber nur für eine einzige (unbekannte!) Variable optimiertwerden kann, ist in der Praxis die proportionale Aufteilung ein häufiger Kompromiss.

Kapitel 4

Verwendung von Hilfsinformationen

4.1 Nachschichtung bei einfacher Zufallsstichprobe

Nehmen wir an, dass es Schichtungsmerkmale gibt, die wir gern benutzen würden, dieaber nicht bereits vor der Stichprobenziehung bekannt sind. Hingegen kennen wir dieGrösse der Schichten in der Population. Für die Stichprobenelemente können die Merk-male erhoben werden. Nachdem eine einfache Zufallsstichprobe gezogen worden ist unddie Erhebung durchgeführt worden ist, kann jedes Element der Stichprobe seiner Schichtzugeordnet werden. Man kann dann das folgende Schätzverfahren anwenden:

TP =

(L∑h=1

NhySh

)/N =

L∑h=1

Wh

∑i∈Sh

yi /nh ,

wobei Nh die als bekannt vorausgesetzte Populationsgrösse der Schicht h ist und Wh =Nh/N deren Gewicht. Dieses Vorgehen nennt man Nachschichtung (poststratification).

Der Schätzer TP hat dieselbe Form wie das geschichtete Mittel. Die Stichprobengrös-sen nh in den Schichten sind aber Zufallsvariablen, im Gegensatz zur echten Schichtungvor der Stichprobenziehung. Ihr Erwartungswert ist nNh/N = nWh.

Das nachgeschichtete Mittel ist erwartungstreu, wenn dieNh korrekt sind. Die Varianzvon TP muss die Zufälligkeit der nh berücksichtigen:

V [TP ] ≈L∑h=1

W 2h (1− nWh/Nh)

1

nWhD2h +

L∑h=1

(1− nWh/Nh)(1−Wh)1

(nWh)2D2h.

Da der zweite Term wie 1/n2 fällt, kann er bei genügend grossen nWh vernachlässigtwerden. Der erste Term ist gleich der Varianz des geschichteten Mittels bei proportionalerAufteilung der Stichprobe (cf. Abschnitt 3.2). Die Varianz kann durch

v(TP ) =L∑h=1

W 2h (1− nh/Nh)

1

nhd2h

geschätzt werden. Der Varianzschätzer v(TP ) schätzt die Varianz von TP erwartungs-treu, berücksichtigt also auch die Variabilität der nh. Allerdings wird die Varianz diesesVarianzschätzers bei kleinen nWh sehr gross.

Die Nachschichtung wird oft benützt, um die Schätzungen aus Erhebungen an be-kannten demographischen Randwerten zu kalibrieren (Geschlecht, Alter, Zivilstand etc.,siehe Abschnitt 8.1).

4.2 Quotientenschätzer bei einfacher Zufallsstichprobe

Bei jeder Einheit der Stichprobe werde nun ausser der interessierenden Variablen yi ei-ne weitere Variable xi beobachtet. Wenn das Populationsmittel xU dieser Hilfsvariablen

18

c© Beat Hulliger 2016 19

bekannt ist, dann kann eine eventuelle Korrelation zwischen yi und xi ausgenützt wer-den, um die Genauigkeit der Schätzung zu erhöhen. Der Quotientenschätzer geht implizitdavon aus, dass eine Regression durch den Nullpunkt mit Varianz proportional zur unab-hängigen Variablen ein gutes Modell für die Daten ist. Sei R = yU/xU = yU+/xU+ derQuotient in der Population und R = yS/xS der Quotient in der Stichprobe.

Zu schätzen sei das Populationsmittel yU . Man zieht eine einfache Zufallsstichprobe.Der Quotientenschätzer oder Verhältnisschätzer von yU ist

TR = xUySxS

= xU R = ySxUxS.

Der Quotientenschätzer hat einen Bias:

E[TR − yU ] ≈ yU[V [xS ]/x2U − C(yS , xS)/(xU yU )

].

Der Bias nimmt also wie 1/n ab mit der Stichprobengrösse n. Er ist aber gross, falls dieKorrelation zwischen x und y klein ist oder sogar negativ.

Eine Schätzung der Varianz von TR erhält man durch Linearisierung:

v(TR) = (1− n/N)1

n

(1

n− 1

∑i∈S

(yi − Rxi)2).

Beispiel 5 (Population 5 mit Quotientenschätzer) Sei das Populationsmittel derVariable xU = (3, 2, 5, 6, 4)> bekannt. Berechne für jede Stichprobe der Grösse n = 2 denQuotientenschätzer. Berechne Mittelwert und Varianz dieser Schätzungen.

4.3 Die Horvitz-Thompson Strategie *

Die Horvitz-Thompson Strategie liefert eine theoretische Grundlage für komplexe Stich-probenpläne mit Schichtung und Klumpung (siehe Abschnitt 3 und 5). Wir nehmen an,eine Hilfsvariable xi > 0, (i ∈ U), z.B. eine Grösse, sei bereits vor der Erhebung be-kannt. Man kann einen Stichprobenplan entwerfen, der Einschlusswahrscheinlichkeitenπi = P[i ∈ S] = nxi/

∑U xi liefert. Dabei ist eine Bedingung, dass nxi/

∑U xi < 1, (i ∈

U). Der SchätzerTHT =

∑i∈S

yi /(Nπi)

heisst Horvitz-Thompson Schätzer. Der HT-Schätzer ist erwartungstreu für das Popula-tionsmittel. Er ist der einzige lineare erwartungstreue Schätzer mit Gewichten, die nichtvon der Stichprobe S abhängen. Der HT-Schätzer für ein Populationstotal ist

NTHT =∑i∈S

1

πiyi.

Die Faktoren wi = 1πi

werden oft Hochrechnungs-Gewichte genannt.Wenn eine positive Korrelation zwischen den Variablen yi und xi besteht, dann ist die

HT-Strategie sehr effizient. Im Extremfall, wenn yi = const · xi, dann hat er Varianz 0.Die Horvitz-Thompson Strategie gewinnt also Effizienz durch ein implizites Modell, bautaber das Modell so in den Stichprobenplan ein, dass der HT-Schätzer erwartungstreu ist,und das sogar, wenn das Modell überhaupt nicht stimmen würde! Die Horvitz-ThompsonStrategie kann also auch angewandt werden, wenn die Einschlusswahrscheinlichkeitenπ irgendwoher stammen, also nicht mit einer Korrelation zwischen einer Hilfsvariable undeiner interessierenden Variable begründet ist. Die Erwartungstreue bleibt erhalten. DieVarianz kann allerdings sehr gross sein.

20 c© Beat Hulliger 2016

Die Varianz des HT-Schätzers ist

V [THT ] =1

N2

∑U

1− πiπi

y2i +∑

i 6=j,∈U

πij − πiπjπiπj

yiyj

.

Diese Varianz kann z.B. geschätzt werden durch

v(THT ) =1

2N2

∑i 6=j,∈S

πiπj − πijπij

(yiπi− yjπj

)2

.

Die Berechnung der gemeinsamen Einschlusswahrscheinlichkeiten πij für zwei Ele-mente in der Stichprobe ist unter Umständen sehr aufwendig.

Bemerkung: Die einfache Zufallsstichprobe ohne Zurücklegen mit dem arithmeti-schen Mittel ist eine Horvitz-Thompson Strategie mit πi = n/N und πij = [n(n−1)]/[N(N−1)].

Bemerkung: Der reine Horvitz-Thompson Schätzer wird selten angewandt. Meistenswird mit dem sogenannten Hajek-Schätzer gearbeitet. Er hat die Form

THajek =

∑i∈S yi/πi∑i∈S 1/πi

.

Mit anderen Worten wird anstelle der Populationsgrösse N , ein Schätzer von ihr, nämlich∑i∈S 1/πi eingesetzt. Damit ist der Hajek-Schätzer ein Quotienten-Schätzer. Sein Vorteil

ist, dass er bei einer Stichprobe mit extremen Einschlusswahrscheinlichkeiten stabilerist. Ausserdem lässt sich das Problem der Untersuchungsbereiche einfach lösen: EinSchätzer für ein Mittel über die Teilstichprobe S0 ist dann einfach

THajek =

∑i∈S0

yi/πi∑i∈S0

1/πi.

Mit anderen Worten ist die Standardisierung für die Grösse des Untersuchungsbereichsgleich eingebaut.

4.3.1 Ziehungsalgorithmus für n=2 *

Das Problem der HT-Strategie mit ungleichen Einschlusswahrscheinlichkeiten ist, einenStichprobenplan zu definieren (algorithmisch), welcher die richtigen πi verwirklicht undwelcher eine einfache Berechnung der doppelten Einschlusswahrscheinlichkeiten zu-lässt. Für n = 2 ist dies noch relativ einfach:

Algorithmus von Durbin für n=2:

1. Ziehe eine erste Einheit i1 mit Ziehungs-Wahrscheinlichkeiten z1,i = πi/2.

2. Berechne neue Ziehungs-Wahrscheinlichkeiten

z2,j =πj2A

(1

1− πi1+

1

1− πj

), (j 6= i1)

wobei A = 1 +∑

Uπi

2−2πi ist.

3. Ziehe eine zweite Einheit i2 in U\i1 gemäss den revidierten Ziehungswahrschein-lichkeiten z2,j .

Die Einschlusswahrscheinlichkeiten πij sind

πiπj2A

[1

1− πi+

1

1− πj

].

Bei geschichteten Stichproben wird manchmal innerhalb der Schichten eine Horvitz-Thompson Strategie mit n = 2 angewandt. Für grössere Stichproben werden die Algo-rithmen sehr aufwendig, ausser man lässt eine variable Stichprobengrösse zu.

c© Beat Hulliger 2016 21

Beispiel 6 (Population 5 mit Horvitz-Thompson Schätzer) Die Einschlusswahrschein-lichkeiten bei Population 5 seien proportional zu xU = (3, 2, 5, 6, 4)>. Mit Durbins Zie-hungsalgorithmus ergeben sich die die doppelten Einschlusswahrscheinlichkeiten π1,2 =0.0275, π1,3 = 0.0880, π1,4 = 0.1210, π1,5 = 0.0635, π2,3 = 0.0556, π2,4 = 0.0770, π2,5 =0.0400, π3,4 = 0.2310, π3,5 = 0.1255, π4,5 = 0.1711, die gleichzeitig die Wahrscheinlich-keiten der entsprechenden Stichproben sind. Berechne für jede Stichprobe den Horvitz-Thompson Schätzer für das Mittel und ermittle die Varianz aus allen Stichproben.

4.3.2 Ziehung für n beliebig

Falls man auf die Berechnung der doppelten Einschlusswahrscheinlichkeiten verzichtenkann, z.B. weil man Varianzen mit Hilfe einer resampling Methode schätzen will, dannkönnen grössere Stichproben in Betracht gezogen werden. Eine relativ einfache Metho-de, welche eine fest vordefinierte Stichprobengrösse garantiert, liefert Grundy (1954).

Eine weitere einfache Methode, welche aber keine feste Stichprobengrösse liefert,ist die sogenannte Bernoulli- oder Poisson-Stichprobe: Bernoulli-Stichprobe: Für je-des Element der Population U wird unabhängig eine im Intervall [0, 1] uniform verteilteZufallsvariable realisiert. Das Ergebnis sei ui. Falls ui < πi wird das Element in dieStichprobe aufgenommen, sonst nicht. Offensichtlich ist die Einschlusswahrscheinlich-keit πi. Die doppelte Einschlusswahrscheinlichkeit P[i, j ∈ S] = πij = πiπj ist einfachzu berechnen. Der Nachteil der Bernoulli-Stichprobe ist, dass die Stichprobengrösse ei-ne Zufalls-Variable ist. Im Fall, wo alle πi gleich sind, ist die Stichprobengrösse binomialverteilt.

Es existieren viele Ziehungsalgorithmen für ungleiche Einschlusswahrscheinlichkei-ten. Alle haben mehr oder weniger gravierende Einschränkungen, die meisten erlau-ben keine einfache Berechnung der doppelten Einschlusswahrscheinlichkeiten, einigewenigstens gute Abschätzungen.

4.3.3 Varianzschätzung ohne doppelte Einschlussawahrscheinlichkeiten

Auch approximative Varianz-Schätzungen, die auf den einfachen Einschlusswahrschein-lichkeiten beruhen, sind möglich. Zum Beispiel die Näherung von Hartley-Rao

vHR(THT ) =1

N2

1

2(n− 1)

∑i 6=j,∈S

(1− πi − πj +

∑i∈S πi

n

)(yiπi− yjπj

)2

.

Häufig behilft man sich auch mit der Annahme, dass die Stichprobe mit Zurücklegengezogen worden war, und verwendet die Varianzschätzung für einen Hansen-Hurwitz-Schätzer mit Ziehungswahrscheinlichkeiten pi = πi/n:

vWR(THT ) =1

N2

1

n(n− 1)

∑i∈S

(yiπi/n

− T ′HT)2

,

wobei T ′HT der Schätzer für das Total ist. Für grosse Stichproben mit tiefen Stichprobenra-ten ist der Näherungsfehler bei diesen beiden Methoden oft klein. Für kleine Stichprobenoder hohe Stichprobenraten kann er aber beträchtlich sein.

4.4 Regressions-Schätzer

Der Quotienten-Schätzer wird durch das Modell einer Regression durch den Nullpunktgestützt. Offensichtlich können weitere erklärende Variablen herangezogen werden, wenndie entsprechenden Populationstotale bekannt sind. Das unterstützende Modell ist: Yi =x>i β + Ei, V [Ei] = λiσ

2E . Dabei seien die Heteroskedastizitäts-Konstanten λi bekannt,

22 c© Beat Hulliger 2016

während β und σ wie üblich zu schätzen sind. Bei der Schätzung von β werden die λiund die Stichprobengewichte 1/πi berücksichtigt.

β = (X>S V−1S Π−1S XS)−1X>S V

−1S Π−1S yS ,

wobei VS = diag(λS) und ΠS = diag(πS). Hier ist xi ein Vektor von Hilfsvariablen. DerVektor der entsprechenden Populationsmittelwerte sei xU .

Der sogenannte synthetische Schätzer oder Regressions-Schätzer ist die Summe dervorhergesagten Werte für die Population: Tsynth = x>U β. Der Quotienten-Schätzer ist alsoauch ein synthetischer Schätzer.

Der verallgemeinerte Regressionsschätzer (GREG: generalized regression estimator)ergänzt den synthetischen Schätzer mit einem Schätzer für den Fehler:

TGREG = x>U β + (THT (yS)− THT (xS)>β)

= THT (yS) + (xU − THT (xS))>β.

Der Korrektur-Term (THT (yS)−THT (xS)>β kann explizit geschrieben werden als∑

i∈S(yi−x>i β)/(Nπi), womit klar wird, dass der Korrektur-Term ein Horvitz-Thompson-Schätzerdes Mittels der Residuen ist. Dank diesem Term ist der GREG asymptotisch erwar-tungstreu. Wenn man den Fehlerterm genauer untersucht, wird klar, dass er verschwin-det, wenn λi eine lineare Funktion der Hilfsvariablen ist. In dem Fall ist der GREG al-so identisch mit einem synthetischen Schätzer. Ein Vorzug des synthetischen und desGREG-Schätzers ist, dass er für jede Variable yi als lineare Funktion mit sogenannteng-Gewichten geschrieben werden kann: TGREG(yS) =

∑i∈S giyi/πi mit

gi = 1 + (xU − THT (xS))>(X>S V−1S Π−1S XS)−1X>S V

−1S Π−1S .

Die Varianz des GREG wird mit Hilfe der Residualvarianz geschätzt, entspricht also derVarianz des Horvitz-Thompson Schätzers für die Variable zi = (yi−x>i β). Als Alternativekann die Form des GREG mit g-Gewichten benutzt werden.

4.5 Kalibrierung

Der GREG ist ein wichtiger Spezialfall eines noch generelleren Algorithmus für die Aus-nützung von Hilfsinformationen, die Kalibrierung . Bei der Kalibrierung geht man vonInitialgewichten, z.B. den Designgewichten di = 1/πi aus und sucht einen neuen Ge-wichtungssatz wi so, dass einerseits bekannte Totale exakt geschätzt werden, d.h. manverlangt für einen Vektor von bekannten Totalen xU+, dass

∑i∈S wixi = xU+ gilt, und

andererseits sollen die Gewichte wi möglichst nahe bei di liegen. Man muss also eine Di-stanzfunktionG(d,w) unter Nebenbedingungen minimieren. Verwendet man als Distanz-funktion die Kleinste-Quadrate Funktion

∑S(wi−di)2/di gewinnt man den GREG zurück

(Deville and Särndal, 1992). Verwendet man andere Distanzfunktionen erhält man z.B.den raking ratio estimator oder ähnliche Schätzer. Kalibrierung (und GREG-Schätzer)werden auch für die Reduktion von systematischen Fehlern wegen Antwortausfällen ver-wendet (vgl. Abschnitt 8.1).

Kapitel 5

Klumpenstichproben

Die Grundgesamtheit ist in N disjunkte Teile aufgeteilt, die Klumpen (clusters) genanntwerden. Es wird eine Zufallsstichprobe von Klumpen (primary units, Einheiten erster Stu-fe) ausgewählt und innerhalb der Klumpen wird eine Vollerhebung von Einheiten zweiterStufe gemacht oder es wird eine Unterstichprobe gezogen. Die Zufallsstichprobe derKlumpen ist oft geschichtet und oft sind die Einschlusswahrscheinlichkeiten der Klumpenproportional zu deren Grösse (Horvitz-Thompson Strategie).

+ Oft ist keine Liste der Einheiten zweiter Stufe vorhanden. Die Klumpenstichprobeerleichtert die Stichprobenziehung, weil man dann nur eine Liste der Einheiten inden ausgewählten Klumpen braucht.

+ Man kann die Erhebungskosten reduzieren und auch die Organisation vereinfa-chen, weil die Erhebung in wenigen Klumpen konzentriert ist.

− Eine Klumpenstichprobe ist meistens weniger genau als eine einfache Zufallsstich-probe mit gleicher Anzahl von Einheiten zweiter Stufe. Ausserdem werden die Schät-zer komplizierter.

5.1 Einfache Klumpenstichprobe

Es werde eine einfache Zufallsstichprobe S von Klumpen gezogen, die jeweils voll er-hoben werden. Die Population der Klumpen wird mit U1 bezeichnet und hat Grösse N .Der Klumpen Ki enthält Mi Einheiten zweiter Stufe. Die Population der Einheiten zweiterStufe wird mit U2 bezeichnet und hat Grösse M0 =

∑U1Mi. Man kann dann die Formeln

der einfachen Zufallsstichprobe auf Klumpenebene anwenden.Sei yij der Wert der interessierenden Variablen für das Element j im KlumpenKi, (i =

1, . . . , N), (j = 1, . . . ,Mi). Ein erwartungstreuer Schätzer für das Total

yU2+ =∑i∈U1

∑j∈Ki

yij

istTK =

N

n

∑i∈S

∑j∈Ki

yij .

Die Varianz von TK ist V [TK ] = N2(1− n/N)D2/n, wobei

D2 =1

N − 1

∑i∈U1

(yKi+ −∑l∈U1

yKl+/N)2

Ein Schätzer dieser Varianz erhält man, indem D2 durch

d2 =1

n− 1

∑i∈S

(yKi+ −∑l∈S

yKl+/n)2

23

24 c© Beat Hulliger 2016

geschätzt wird.Der Schätzer TK ist sehr variabel, wenn die Klumpenmittel ungefähr gleich sind, wäh-

rend die Klumpengrössen stark variieren. Dann ist ein Quotientenschätzer der Form

TKR = M0

∑i∈S

∑j∈Ki

yij

/∑i∈S

Mi (5.1)

oft der bessere Schätzer.

Beispiel 7 (Klumpenstichprobe mit einfachem Schätzer) Die Population 5 sei wie folgtin Klumpen eingeteilt: K1 = {1, 2},K2 = {3},K3 = {4, 5}. Wir ziehen eine einfache Zu-fallsstichprobe der Grösse n = 1 aus den Klumpen und beziehen alle Elemente desgezogenen Klumpens in die Stichprobe ein (Welche Stichproben sind möglich?). Wir be-rechnen den Schätzer TK/M0 für jeden Fall. Berechne auch das Mittel und die Varianzdieser Schätzungen.

Beispiel 8 (Klumpenstichprobe mit Quotientenschätzer) Berechne den SchätzerTKR

/M0 im Fall der Klumpenstichprobe aus Beispiel 7.

Beispiel 9 (Klumpenstichprobe mit Horvitz-Thompson Schätzer) Wir ziehen in Po-pulation 5 n = 1 Klumpen mit ungleicher Wahrscheinlichkeit: Klumpen Ki wird mit Wahr-scheinlichkeit πi = Mi/M0 gezogen (i = 1, 2, 3). Dann berechnen wir den Horvitz-Thompson Schätzer THT = (Miyi/πi)/M0. Kontrolliere den Mittelwert und die Varianzdieser Schätzungen.

5.2 Vergleich mit der einfachen Zufallsstichprobe

Alle Klumpen seien von der GrösseM . Eine einfache Zufallsstichprobe der Grösse n wirdaus den N Klumpen gezogen und jeder gezogene Klumpen wird vollständig erhoben. DiePopulation von Elementen zweiter Stufe hat Grösse M0 = NM .

Die Varianz unter den Einheiten zweiter Stufe ist D2 =∑

i,j(yij− yU2)2/(M0−1). Man

kann eine Korrelation innerhalb der Klumpen definieren:

ρ =

∑i

∑j 6=k(yij − yU2)(yik − yU2)

(M − 1)(M0 − 1)D2.

Diese Intra-Klumpen-Korrelation ist ein Mass für die Homogenität der Klumpen. DasStichprobenmittel der Einheiten zweiter Stufe yS2 =

∑i∈S1

∑j∈Ki

yij/(nM) schätzt yU2

erwartungstreu und hat Varianz

V [yS2 ] = (1− n/N)1

nM

M0 − 1

M0 −MD2[1 + (M − 1)ρ].

Je grösser also ρ ist, d.h. je homogener die Klumpen sind, desto grösser ist die Varianz.

5.3 Mehrstufige Stichprobenpläne

Die Grundgesamtheit wird in ein hierarchisches System von Untereinheiten gegliedert(Zum Beispiel: Gemeinden, Haushalte, Haushaltmitglieder).

Auf jedem Niveau, wählt man eine Stichprobe von Untereinheiten zufällig aus. ZumBeispiel:

1. Eine Zufallsstichprobe von Gemeinden mit Einschlusswahrscheinlichkeiten propor-tional zur Anzahl der Einwohner.

c© Beat Hulliger 2016 25

2. In jeder der ausgewählten Gemeinden wählt man eine einfache Zufallsstichprobevon Haushalten.

3. In den ausgewählten Haushalten wird eine einfache Zufallsstichprobe von Haus-haltmitgliedern gezogen.

Es ist natürlich immer möglich und oft notwendig, einen solchen Plan mit einer Schich-tung der Untereinheiten zu kombinieren.

5.4 Unterstichproben in den Klumpen

Das einfachste Beispiel eines mehrstufigen Stichprobenplans ist eine einfache Klumpen-stichprobe mit Unterstichprobe in den Klumpen. Man wählt dabei eine einfache Zufalls-stichprobe S1 der Grösse n von Klumpen. Innerhalb der gewählten Klumpen wird eineeinfache Zufallsstichprobe S2i der Grösse mi gezogen.

Sei yi = 1mi

∑j∈S2i

yij das Stichprobenmittel in Klumpen i. Ein erwartungstreuerSchätzer für das Total yU2+ =

∑i∈U1

∑j∈Ki

yij ist

TK =N

n

n∑i=1

Miyi

Die Varianz von TK wird geschätzt durch

v(TK) = (1− n/N)N2

n

1

n− 1

n∑i=1

(Miyi − TK)2 +N

n

n∑i=1

(1−mi/Mi)M2i

mid2i ,

wobei d2i = 1mi−1

∑mij=1(yij − yi)2 die Stichprobenvarianz im Klumpen Ki ist.

Analog (5.1) ist oft ein Quotientenschätzer der Form

TKR= M0

∑i∈S

Miyi/∑i∈S

Mi

besser.

5.5 Effekt des Stichprobenplans

Kish definierte den “design-effect” für einen (erwartungstreuen) Schätzer T bzw. für eineStrategie (p,T) als das Verhältnis der Varianz unter dem betrachteten Stichprobenplanp zu der Varianz des Stichprobenmittels bei einfacher Zufallsstichprobe (ES) der selbenGrösse (Kish, 1965):

deff (T ) =Vp[T ]

VES[yS ].

Der Kehrwert 1/deff beschreibt, wie viel grösser oder kleiner eine einfache Zufallsstich-probe wäre, die dieselbe Genauigkeit wie die betrachtete liefert.

Der Effekt des Stichprobenplans auf das Stichprobenmittel bei einer einstufigen Klum-penstichprobe mit Klumpen gleicher Grösse ist zum Beispiel

deff (T ) ≈ 1 + (M − 1)ρ.

Wenn also die Intra-Klumpen-Korrelation sehr hoch ist, im Extremfall ρ = 1, dann müssenwir M Mal so viele Einheiten zweiter Stufe erheben, wie bei einer einfachen Zufallsstich-probe. Dies ist einleuchtend. Wenn ρ = 1 ist, können wir gerade so gut nur 1 Element proKlumpen erheben anstatt alle M und erhalten dieselbe Information.

Kapitel 6

Datenaufbereitung

Die Daten, die aus der Erhebung entstehen, müssen auf elektronischem Datenträger er-fasst werden und offene Fragen müssen kodiert werden. Dann müssen Kontrollen (engl.edit) durchgeführt werden, ob die Antworten vollständig und konsistent sind. Bei fehlen-den oder unplausiblen Werten kann manchmal ein Wert deterministisch eingesetzt wer-den, manchmal müssen Werte aufgrund von Modellen erzeugt und eingesetzt werden(engl. imputation). Manchmal ist es aber besser, inkonsistente Daten oder auch solchemit fehlenden Werten aus der Analyse wegzulassen. Das Endprodukt der Datenaufbe-reitung sind bereinigte Daten, die zur Analyse bereit sind. Die Phase der Kontrollen undKorrekturen wird auch Plausibilisierung genannt.

Der Prozess der Datenaufbereitung ist entscheidend für die Qualität der Resultateeiner statistischen Erhebung. Er kann sehr kosten- und zeitintensiv sein. Als generelleRegel sollte gelten, dass nie die Originaldaten überschrieben werden und dass alle Än-derungen an den Daten dokumentiert werden müssen. Das EDIMBUS-Manual ist eineder wenigen Handbücher über die Datenaufbereitung (Luzi et al. (2007)).

6.1 Kontrollen

• Eingangskontrolle

• Vollständigkeitskontrolle (fehlende Antworten)

• Eindimensionale Kontrolle einzelner Fragebogen (Format, zulässiger Wertebereich,Ausreisser)

• Mehrdimensionale Kontrolle einzelner Fragebogen (Konsistenz-Prüfung: ”teenagewidows´´)

• Kontrolle mit Hilfe externer Information

• Eindimensionale Kontrolle der Stichprobe (micro-editing)

• Mehrdimensionale Kontrolle der Stichprobe (macro-editing)

Kontrollen bilden ein logisches System: Das System muss in sich konsistent seinund möglichst klein. Das ist bei grossen Kontrollbatterien schwierig und benötigt eige-ne Methoden. Generelle Regel: Kontrollen ändern nichts an den Daten. Das Ergebnisvon Kontrollen sind Indikator-Variablen (sogenannte Flaggen) pro kontrollierte Variableoder Variablenkombination. Diese Flaggen sollten ausgewertet werden. Das wertvollsteErgebnis der Kontrollen sind nämlich Informationen über die Qualität der Daten, insbe-sondere über u.U. unzuverlässige Variablen. Kontrollen müssen darum in erster Linie alsein Werkzeug für die Qualitätsverbesserung von Erhebungen betrachtet werden und erstin zweiter Linie als Ausgangswert für Einsetzungen.

26

c© Beat Hulliger 2016 27

6.2 Einsetzungen

Vollständige fehlende Einheiten (unit-nonresponse) werden üblicherweise mit Gewichtun-gen kompensiert, so weit dies möglich ist (siehe Abschnitt 8). Wenn nur einzelne Werteeiner antwortenden Einheit fehlen (item-nonresponse), dann wird oft mit Hilfe von Mo-dellen ein Wert eingesetzt (Imputation). Fehlerhafte oder fehlende Daten können odermüssen unter Umständen ersetzt werden. Dabei kann nicht von Korrekturen gespro-chen werden, weil der Anspruch, die wahren Werte herstellen zu können, nicht einlösbarist. Einsetzungen sollten darum sorgfältig entwickelt und ihre Auswirkungen auf allfälligeEndresultate überprüft werden.

• Nachfragen (telefonisch, persönlich, schriftlich).

• Prioritäten festlegen und deterministische Korrekturen durchführen.

• Ausreisser zensurieren und/oder kennzeichnen.

Immer wenn eine Änderung im Datensatz vorgenommen wird, muss sie dokumentiertwerden. Die Rohdaten sollten separat archiviert werden.

Die gängigsten Einsetzungesmethoden sind:

1. Nichtst tun: fehlende Werte bleiben fehlend und werden in der Analyse weggelas-sen. Achtung: auch hier kann ein Bias entstehen.

2. Einsetzung des Mittelwerts der vorhandenen Werte: Möglicher Bias und sicher Ein-fluss auf die Varianz.

3. Einsetzung von Vorhersagen aufgrund eines (linearen) Modells: Allenfalls Bias undVarianz-Beeinflussung. Varianz kann u.U. wieder kompensiert werden, wenn Resi-duen zur Vorhersage geschlagen werden.

4. “Hot Deck”: Der Wert der nächsten ähnlichen Einheit wird eingesetzt. Oft kombiniertmit Modellen (Regression, Schichtung).

Um einen Bias der Varianzschätzung nach Imputation zu vermeiden, kann multipleImputation verwendet werden. Allenfalls sind auch Jackknife- oder Bootstrap-Schätzernützlich.

Kapitel 7

Robuste Schätzverfahren

Die Schätzer, die in den ersten Kapiteln beschrieben worden sind, können meistens nichtdirekt angewandt werden, sondern müssen ergänzt werden, um Ausreisser und Antwort-ausfälle zu erlauben.

Ausreisser in quantitativen Variablen kommen normalerweise selten (1% bis 10%)vor, manchmal aber auch häufig. In der Praxis ist es üblich, dass geprüft wird, ob dieWerte einer Variablen in einem erlaubten Bereich sind. Oft wird auch gleich der zweiteSchritt gemacht und Werte, die ausserhalb des Bereichs sind, werden an die Grenze desBereichs gesetzt. Diese imputierten Werte werden mit einem “flag"gekennzeichnet.

Da Ausreisser oft nur im Vergleich zu den anderen Beobachtungen erkennbar sind,werden auch robuste Schätzer angewendet. Dabei stellt sich das spezielle Problem, dassauch die robusten Schätzer den Stichprobenplan und eventuelle Gewichtungen für Ant-wortausfälle und Kalibrierungen berücksichtigen sollten.

7.1 Median, Quartile

In einer einfachen Zufallsstichprobe wird der Populations-Median der Variablen y, d.h.der Wert med(yU ) durch den Stichproben-Median med(yS) geschätzt. Die Populations-Quartile werden durch die Stichprobenquartile Q1 und Q3 geschätzt. Ein grobe Abschät-zung der Standardabweichung des Stichproben-Medians unter Annahme einer Normal-verteilung liefert

0.93 · (Q3 −Q1)/√n.

Die Differenz Q3−Q1 wird Quartilsabstand genannt1. Mit dieser Abschätzung kann auchein approximatives Vertrauensintervall berechnet werden. Genauere Schätzungen derVarianz des Medians sind mit Hilfe der empirischen Verteilungsfunktion möglich. DerStichproben-Median ist sehr robust gegen Ausreisser und z.B. für Einkommensdaten in-teressant.

7.2 Gestutztes und winsorisiertes Mittel, gewichteter Median*

Sei 0 ≤ y1 ≤ y2 · · · ≤ yn eine einfache Zufalls-Stichprobe mit geordneten Werten. Seiein gewichtetes Mittel T =

∑ni=1wiyi der Ausgangsschätzer für eine Robustifizierung.

Bilde die kumulierten Summen der Gewichte ki =∑i

j=1wj und bestimme zu einemvorgegebenen α ∈ [0, 1] den Index i0 = max{i : ki/kn ≤ 1 − α}. Dann ist das obengestutzte Mittel

T ′α =

i0∑i=1

wiyi

/i0∑j=1

wj .

1Der Faktor .0.93 entsteht durch die Division der Wurzel aus der asymptotischen Varianz des Mediansmit dem Quartilsabstand unter Normalverteilung, also (π/2)0.5/(2Φ−1(0.75)) ≈ 0.93. Der notched boxplotverwendet stattdessen optimistischere 1.58/2=0.79

28

c© Beat Hulliger 2016 29

und das oben winsorisierte Mittel

T ′′α =

(i0∑i=1

wiyi + yi0

n∑i=i0+1

wi

)/∑i∈S

wi .

Beide Schätzer T ′α und T ′′α haben im Normalfall einen Bias! Man wird also α nicht sehrgross wählen, z.B. α = 0.02. Hingegen haben die beiden Schätzer oft eine wesentlichkleinere Varianz als T , falls Ausreisser in der Stichprobe auftreten.

Bei einer einfachen geschichteten Stichprobe wird man T ′α und T ′′α innerhalb derSchichten anwenden. Dabei kumuliert sich aber der Bias über die Schichten. Die αhin den Schichten müssen entsprechend kleiner gewählt werden.

Ein wichtiger Spezialfall des beidseitig gestutzten Mittels ist der gewichtete Median:Man sucht die Indices iu = max{i : ki/kn ≤ 0.5} und io = min{i : ki/kn ≥ 0.5} undberechnet den gewichteten Median als

M =wiuyiu + wioyiowiu + wio

oder man arbeitet mit dem sogenannten unteren Median Mu = yiu .Varianzschätzer für diese robusten Schätzverfahren sind im Normalfall wesentlich

komplexer als für lineare Schätzer und müssen oft mit "resampling" - Methoden berechnetwerden (cf. Abschnitt 9.1).

7.3 Robuster Quotientenschätzer *

Falls ein Quotientenschätzer angewandt werden soll, aber im unterliegenden Modell derRegression durch den Nullpunkt Ausreisser auftreten, sollte eine robuste Version derSchätzung der Steigung die Kleinste-Quadrate Schätzung

∑S yi/

∑S xi ersetzen. Im

folgenden wird eine relativ einfache Methode vorgestellt, ein sogenannter Einschritt-M-Schätzer (Hulliger, 1999).

Zuerst wird der Median der Quotienten yi/xi, wobei hier xi für die unabhängige undyi für die abhängige Variable steht, berechnet: β0 = med(yi/xi). Das Mittel dieser Quoti-enten wäre ja der Kleinste-Quadrate Schätzer im Modell yi = βxi + Ei mit V [Ei] = σ2x2i .In diesem Modell erhalten also die Beobachtungen mit grossem xi ein relativ kleinesGewicht. Ausserdem wird der Median anstatt das Mittel herangezogen, um auch Robust-heit gegen extreme Steigungen zu erhalten. Von dieser Initialschätzung der Steigungwerden standardisierte Residuen gerechnet: ri = (yi − β0xi)/

√xi. Die Standardisierung

entspricht einer Fehlervarianz V [Ei] = σ2xi, welche zum Kleinste-Quadrate Schätzerβ =

∑S yi/

∑S xi führt. Der Median des Absolutbetrags dieser Residuen wird nun als

Skala für die Robustifizierung benützt: σ = med(|ri|)/0.67. Der Korrekturfaktor 0.67 machtσ zu einem konsistenten Schätzer der Fehlervarianz bei Normalverteilung der Fehler. DieResiduen ri, die im Absolutbetrag grösser als c · σ sind, werden heruntergewichtet. Sieerhalten ein Robustheitsgewicht

ui = min(1, cσ/|ri|).

Dabei ist c eine Konstante, mit der die Stärke der Robustifizierung gesteuert werdenkann. Ein übliche Wahl der Konstanten ist z.B. c = 2.

Erst jetzt wird ein gewichteter Kleinste-Quadrate-Schätzer berechnet, der sowohl die-se Robustheitsgewichte, als auch eine Fehlervarianz V [Ei] = σ2xi proportional zu xiberücksichtigt.

βr =

∑S uiyi∑S uixi

.

Zusätzlich kann eine Gewichtung entsprechend dem Stichprobenplan berücksichtigt wer-den.

30 c© Beat Hulliger 2016

7.3.1 Robustifizierter Horvitz-Thompson Schätzer

Der Horvitz-Thompson Schätzer kann als Lösung einer Schätzgleichung dargestellt wer-den. Als unterliegendes Modell wird postuliert: yi = βxi + Ei with V [Ei] = xiσ

2. Unterdiesem Modell ist der Horvitz-Thompson Schätzer

THT =∑i∈S

yiNπi

= xUβLS ,

wobei βLS die folgende Schätzgleichung löst:∑S

1

πi

yi − βxi√xi

xi√xi

= 0.

Anstatt dem standardisierten Residuum (yi − βxi)/√xi kann eine beschränkte symme-

trische Funktion davon verwendet werden. Die einfachste Version ist dabei die Huber-Funktion ψc = min(c,max(x,−c)). Die Lösung βR von∑

S

1

πiψc

(yi − βxi√

xi

)xi√xi

= 0.

führt zum robustifizierten Horvitz-Thompson Schätzer TRHT = xUβR (Hulliger, 1995).Es handelt sich also um einen M-Schätzer. Die Varianz kann mit Linearisierung oderResampling geschätzt werden (siehe Kapitel 9.1). Die Festlegung der Konstante c ist wiebei allen robusten Schätzern nicht einfach. Simulationen haben gezeigt, dass insbeson-dere bei grossen Stichproben Abstimmungskonstanten in der Grössenordnung von 5 bis10 Medianabweichungen ein gutes Verhältnis von Bias und Varianz erreichen.

Kapitel 8

Antwortausfälle und Kalibrierung

Bei schriftlichen Erhebungen von Haushalten erhält man von 20 bis 50 Prozent der Haus-halte keine Angaben. Dies hat verschiedene Gründe: Mangelhafter Stichprobenrahmen,Erreichbarkeit, Invalidität und Verweigerung. Bei Erhebungen von Unternehmen mussman unter Umständen mit 40 bis 80 % Antwortausfällen (Nonresponse) rechnen.

Die Antwortausfälle sind fast immer mehr oder weniger mit dem Untersuchungsge-genstand korreliert. Beispielsweise sind bei einer Umfrage über Weiterbildung die Leute,die sich weitergebildet haben, eher motiviert zu antworten. Andrerseits sind diese Leuteeventuell mobiler, also schwieriger zu erreichen. Antwortausfälle, welche mit zu untersu-chenden Charakteristiken korreliert sind, führen zu einem Bias.

Nimmt man an, es gebe eine Schicht von Leuten, die potentiell antworten, Ur und eineSchicht von potentiellen Antwortausfällen Un, dann kann man streng genommen mit derErhebung nur etwas über die potentiell antwortende Population aussagen Ur. Bei dicho-tomen (zweiwertigen) Variablen kann man den Einfluss der Antwortausfälle abschätzen,indem man annimmt, dass sie entweder alle die eine oder alle die andere Ausprägunghaben.

Sei Nr die Grösse der antwortenden Schicht Ur. Wir nehmen an, wir hätten eine ein-fache Zufallsstichprobe in U gezogen. Die Schicht der Antwortenden ist dann ein Unter-suchungsbereich (cf. Abschnitt 2.7). Sei ySr =

∑Sryi/nr das Stichprobenmittel der Ant-

wortenden. Der Bias ist dann

E[ySr − yU ] = (1−Nr/N)(yUr − yUn).

Es ist klar, dass wir nur einen kleinen Bias haben, wenn das Populationsmittel in denbeiden Untersuchungsbereichen Ur und Un annähernd gleich ist. Der Bias ist auch klein,wenn Nr/N , der Anteil der Antwortenden in der Population, gross ist. Wir können alsosowohl bei sehr schlechter Antwortrate gute Schätzer haben, als auch bei sehr guterAntwortrate schlechte Schätzer! Der Varianzschätzer

v(ySr) = (1− n/N)1

nr

1

nr − 1

∑Sr

(yi − ySr)2,

ist nahezu erwartungstreu unter dem einfachen Modell eines festen Untersuchungsbe-reichs von Antwortenden.

Natürlich haben die Antwortausfälle wegen der Reduktion der Stichprobengrösseauch einen Einfluss auf die Genauigkeit der Schätzungen. Meistens wird dem entgegen-gewirkt, indem aus einer Pilot-Erhebung eine Antwortrate r geschätzt wird und die für dieangestrebte Genauigkeit geplante Netto-Stichprobengrösse n durch r dividiert wird. Die-se Bruttostichprobengrösse nb = n/r wird dann durch die Antwortausfälle zur realisiertenNetto-Stichprobengrösse nr. In der Praxis ist die Situation wesentlich komplizierter undman muss sehr genau definieren, was man unter Nettostichprobengrösse versteht.

Neben einem totalen Antwortausfall sind auch partielle Antwortausfälle (item-nonresponse)ein Problem (Verweigerung einzelner Fragen, "Weiss nicht", Frage nicht geeignet, Inter-viewabbruch). Da mindestens Teilinformationen vorhanden sind, kann oft eine vernünf-tige Schätzung anstatt der fehlenden Information eingesetzt werden (Imputation). Bias

31

32 c© Beat Hulliger 2016

und Varianz, die dadurch bei den Schätzern entstehen, hängen von der Güte der ver-wendeten Modelle und den Imputations-Methoden ab.

8.1 Korrektur mit Nachschichtung und Kalibrierung

Bei einer geschichteten Stichprobe bewirkt die Verwendung der Netto-Stichprobengrössein der Schicht h, nr,h, anstatt der entsprechenden Brutto-Stichprobengrösse nb,h, dassUnterschiede in der Ausfallrate zwischen den Schichten berücksichtigt werden. Dassel-be kann durch Nachschichtung (siehe Abschnitt 4.1) bzw. Kalibrierung erreicht werden(Deville and Särndal, 1992). Die Idee hinter diesen Kompensationen ist, dass für die Ein-heiten einer Zelle h das Modell yhi = µh + Ehi angenommen wird, wobei der Fehler Ehiunabhängig vom Antwortausfall ist und Erwartungswert 0 hat. Man schätzt dann µh in derZelle und kombiniert die Zellen mit dem Gewicht, das aus externen Quellen bekannt ist.

Die generelle Idee ist, dass man eine externe Variable sucht, die sowohl mit der Ant-wortneigung, als auch mit den Untersuchungsvariablen korreliert. Wenn man dann einlineares Modell mit der externen Variablen als erklärende Variable zur Verbesserung derSchätzung verwendet, kann man im Normalfall einen Nonresponse-Bias reduzieren. DasProblem ist dabei oft, dass ein eventueller Bias zwar reduziert wird durch Nachschich-tungen, dass aber die Variabilität der entsprechenden Gewichte sich auf die Schätzerüberträgt. Der Variationskoeffizient c der (Nachschichtungs-) Gewichte ist ein Indikatorfür diesen Effekt.

Als Faustregel kann man eine Erhöhung der Varianz um den Faktor (1 + c2) anneh-men, wenn die Nachschichtungs-Variablen die Antwortausfälle und die interessierendeVariable nicht differenzieren. Wenn man den Effekt der Kalibrierung genauer untersu-chen will, muss sie bei der Varianzschätzung berücksichtigt werden.

Beispiel 10 (Nachschichtung) Um den Anteil der Raucher in einer Population zu schät-zen, haben wir unter 2000 Personen eine einfache Zufallsstichprobe der Grösse 200 ge-zogen und von 130 Personen Antworten erhalten. Von den 130 Antwortenden waren 23Raucher. Wir wissen, dass die Grundgesamtheit je 1000 Männer und Frauen enthält,haben aber in unserer Stichprobe 80 Frauen, wovon 8 Raucherinnen sind. Führe eineNachschichtung nach Geschlecht durch und vergleiche TP mit dem Stichprobenmittel.

Ein Modell, unter welchem die im Beispiel 10 erwähnte Nachschichtung vernünftigist, sieht wie folgt aus: Die (unbekannte) Verteilung in der Population sei in Tabelle 8.1dargestellt.

Geschlecht Raucher NichtraucherM 300 700F 100 900Total 400 1’600

Tabelle 8.1: Modell 1 für Population

Das Populationsmittel ist pU = 0.2. Wir nehmen an, dass die Antwortwahrschein-lichkeit unabhängig vom Rauchen bei den Männern 0.5 und bei den Frauen 0.8 beträgt(Modell 1). Die Stichprobe wird also im Erwartungswert genau derjenigen im Beispiel 10entsprechen. Das nachgeschichtete Mittel ergibt genau das Populationsmittel!

Ein Situation, in der die Nachschichtung schlechte Resultate erbringt, ist die folgende.Die Population sei in Tabelle 8.2 dargestellt.

Das Populationsmittel bei den Männern betrage also pU1 = 0.15 ist und bei den Frau-en pU2 = 0.08 und damit pU = 0.115. Wir nehmen an, dass die Raucher mit Sicherheitantworten, während die männlichen Nichtraucher mit Wahrscheinlichkeit 0.412 und die

c© Beat Hulliger 2016 33

Geschlecht Raucher NichtraucherM 150 850F 80 920Total 230 1’770

Tabelle 8.2: Modell 2 für Population

weiblichen Nichtraucher mit Wahrscheinlichkeit 0.783 antworten (Modell 2). Wieder ent-spricht die Stichprobe im Erwartungswert genau derjenigen im Beispiel 10. Das nachge-schichtete Mittel (0.20) hat aber die grössere Abweichung vom Populationsmittel (0.115)als das ungewichtet Stichprobenmittel (0.177)!

Eine Verallgemeinerung der Nachschichtung ergibt sich, wenn zwar für verschiedeneVariablen die Randverteilungen aus anderer Quelle bekannt sind, aber nicht die Wertefür die Zellen bei Kreuzung der Variablen. Beispielsweise kann zwar die Populations-grösse für alle Altersklassen getrennt nach Geschlecht bekannt sein, aber es fehlt diedreifache Kreuzung nach Nationalität × Alter × Geschlecht. Dann gibt es verschiedeneGewichtungs-Verfahren, um gleichzeitig alle Randverteilungen zu einzuhalten (z.B. Itera-tive Proportional Fitting). Diese Verfahren werden oft unter dem Begriff Kalibrierung zu-sammengefasst. Diese und andere Kalibrierungs-Verfahren werden in Deville and Särn-dal (1992) besprochen.

8.2 Beispiel einer Kalibrierung

Im folgenden wird beispielhaft eine einfache Kalibrierung durchgeführt. Ausgehend vonBeispiel 10 nehmen wir an, dass wir zusätzlich wissen, dass die Grundgesamtheit 300Ausländerinnen oder Ausländer enthält. Wir stellen fest, dass nur 7 Ausländerinnen und5 Ausländer geantwortet haben. Dabei haben wir 5 Ausländerinnen und 4 Ausländergefunden, die rauchen. Wir kalibrieren auf Geschlecht und Ausländerstatus (je einmal)und schätzen den Anteil der Raucher.

Die Stichprobe kann wie in Tabelle 8.3 dargestellt werden.

N CH A nrN 2’000 1’700 300M 1’000 45 5 50F 1’000 73 7 80nr 118 12 130

Tabelle 8.3: Stichprobe mit Rändern entsprechend Population (N) und Stichprobe (n).

Wir gehen aus von einem Initialgewicht w0 = 2000/130 = 15.4. Im ersten Schritterhalten die Männer ein Gewichtsfaktor w1 = 1000/(50 · 15.4) = 1.3 und die Fraueneinen Gewichtsfaktor von w1 = 1000/(80 · 15.4) = 0.81. Im zweiten Schritt erhalten dieAusländer (Männer und Frauen) einen Faktor w2 = 300/(5 · 15.4 · 1.3 + 7 · 15.4 · 0.81) = 1.6und die Schweizer erhalten einen Faktor w2 = 1700/(45 ·15.4 ·1.3+73 ·15.4 ·0.81) = 0.94.Die Gewichte, die sich aus der Multiplikation der Faktoren w = w0w1w2 ergeben, sind inTabelle 8.4 dargestellt.

Offensichtlich stimmen die Summen der Gewichte der Männer und Frauen nicht mehrmit der Population überein. Es ergibt sich z.B. für Männer eine Gewichtssumme von45 · 18.82 + 5 · 32.03 = 1′007.05. Die zweite Nachschichtung beeinträchtigt die erste.Auch die gesamte Gewichtssumme ist leicht zu gross: 2’003.06. Das ist auf Rundungs-fehler zurückzuführen. Man könnte jetzt in einem weiteren Schritt wieder auf das Ge-schlecht kalibrieren usw. bis alle Gewichtssummen stimmen. Die Gewichtsveränderung

34 c© Beat Hulliger 2016

CH AM 18.82 32.03F 11.73 19.96

Tabelle 8.4: Gewicht der Zellen nach einfacher Kalibrierung.

durch diese zusätzlichen Iterationen ist aber oft klein. Wendet man die Gewichte in Ta-belle 8.4 nun auf die Schätzung der Anzahl Raucher an, ergibt sich T =

∑S wiyi =

11 · 18.82 + 4 · 32.03 + 3 · 11.73 + 5 · 19.96 = 470.13. Als Schätzung für den Anteil derRaucher ergibt sich T =

∑S wiyi/

∑S wi = 470.13/2′003.06 = 0.235. Tabelle 8.5 ist die

Vierfeldertafel Raucher × Geschlecht der geschätzten Anzahlen in der Population.

Geschlecht Raucher NichtraucherM 335.14 671.91F 134.99 861.02Total 470.13 1532.93

Tabelle 8.5: Geschätzte Anzahlen in der Population

8.3 Schätzung der Antwortneigung *

Oft wird versucht, mit einer Nonresponse-Studie die Antwortausfälle genauer zu charak-terisieren. Dabei wird z.B. aus den Antwortausfällen eine kleine Stichprobe gezogen undmöglichst vollständig erhoben. Damit können dann Modelle geschätzt werden, die dasAntwortverhalten beschreiben und die erlauben, die Schätzungen zu korrigieren.

Beispielsweise kann mit logistischer Regression die Wahrscheinlichkeit geschätzt wer-den, dass eine Antwort in der Haupterhebung erhalten wird. Diese Antwortneigung pr,i(engl. propensity score) kann von verschiedenen Variablen in der Erhebung abhängen.Man betrachtet dann die Auswahl der Antwortenden als eine Stichprobe mit Einschluss-wahrscheinlichkeiten pr,iπi und wendet den Horvitz-Thompson Schätzer an. Wenn einSchätzer ohne Nonresponse-Korrektur die Form T =

∑S wiyi hat (z.B. mit wi = 1/πi),

dann wird er ersetzt durch

T ′ =∑S

wiyi/pr,i

∑S wi∑

S wi/pr,i.

Im Fall wi = 1/n ist T ′ =∑

S(yi/pr,i)/∑

S(1/pr,i).Da meistens in der Nonresponse-Erhebung ebenfalls Antwortausfälle vorkommen

wird die Nonresponse-Korrektur mit 1/pr,i auch auf die Antworten aus der Nonresponse-Erhebung angewendet.

Kapitel 9

Inferenz

Für komplexere Schätzverfahren müssen auch die entsprechenden Varianzschätzer, diesowohl den Stichprobenplan, als auch die Form der Schätzer berücksichtigen, entwickeltwerden. Für Vertrauensintervall, Hypothesentests und Modellierung muss oft auf Super-populationsmodelle, also ein stochastisches Modell für die beobachteten Variablen, hin-zugezogen werden. Bei der Inferenz muss dann berücksichtigt werden, dass der Stich-probenplan die Unabhängigkeit der Beobachtungen, welche den meisten Verfahren derschliessenden Statistik zugrunde liegt, beeinträchtigt. Es müssen also für Stichproben-daten spezielle schliessende Verfahren angewendet werden.

9.1 Varianzschätzung

Wegen Nachschichtung, Kalibrierung und Kompensation für Antwortausfälle kann selbstbei einfachen Zufallsstichproben und einfachen linearen Schätzern die Varianzschät-zung zum Problem werden. Noch schwieriger wird die Varianzschätzung bei nichtlinearenSchätzern z.B. von Quotienten oder Korrelationen oder bei robusten Schätzern. Verschie-dene Methoden helfen, trotzdem zu Varianzschätzungen zu kommen.

Ausgiebig verwendet wird die Linearisierung, d.h. Varianzapproximation mit Hilfevon Taylor-Entwicklungen und deren Schätzung. Falls dies zu komplex wird, werden oft“resampling Verfahren angewendet, z.B. “balanced half samples" oder das Jackknife.

Einfaches Jackknife: Betrachte eine einfache Zufallsstichprobe der Grösse n undeinen Schätzer T (yS), welcher sich auch für die Stichprobe mit Grösse n − 1 berech-nen lässt. Bezeichne mit T(i) den Schätzer, der sich ergibt, wenn die Einheit i aus derBerechnung weggelassen wird. Sei T(.) =

∑S T(i)/n. Dann ist

vJK(T ) =n− 1

n

∑i∈S

(T(i) − T(.))2

ein Schätzer für die Varianz von T (ohne Endlichkeitskorrektur).In der Praxis ist das Verfahren etwas komplizierter, weil man im Prinzip für jeden

Schätzer T(i) die von der Stichprobe abhängenden Gewichte neu berechnen muss. Da-zu kommt, dass der Stichprobenplan beim Jackknife berücksichtigt werden muss. Beieiner einfachen geschichteten Zufallsstichprobe kann z.B. je ein Jackknife- Schätzer in-nerhalb der Schichten berechnet werden und dann wie in Abschnitt 3 mit dem Quadratder Schichtgewichte aufsummiert werden.

9.2 Vertrauensintervalle

In der Stichprobentheorie gilt eine Variante des zentralen Grenzwertsatzes. Da meis-tens die Stichprobenumfänge sehr gross sind, wird im allgemeinen angenommen, dassSchätzer, die sich als gewichtetes Mittel schreiben lassen, ungefähr normalverteilt sind.

35

36 c© Beat Hulliger 2016

Dann bildet der Bereich T ± 1.96

√V (T ) ein genähertes 95% Vertrauensintervall für den

Schätzer T . Oft wird der Einfachheit halber anstatt dem Faktor 1.96 der Faktor 2 ge-setzt (der Faktor 2 entspricht dem Quantil einer t-Verteilung mit 60 Freiheitsgraden). BeiEinkommen oder Investitionen ist die Annahme der Normalverteilung u.U. auch bei rela-tiv grossen Stichprobenumfängen nicht gerechtfertigt, weil die Ausgangs-Variablen sehrschief verteilt sind.

Vertrauensintervalle sind die einfachste Methode, um dem Publikum die Bedeutungder Stichprobenvariabilität zu erklären. Sie helfen auch, signifikante Unterschiede zu fin-den: überlappen sich die Vertrauensintervalle für eine Charakteristik zweier disjunkterUntersuchungsbereiche nicht, dann ist die Differenz der geschätzten Charakteristiken si-gnifikant. Ein genauerer Test müsste die Varianz der Differenz unter Berücksichtigung desStichprobenplans schätzen und einen t-Test durchführen. Bei disjunkten Untersuchungs-bereichen kann man meistens die beiden entsprechenden Teilstichproben als unabhän-gig annehmen und die Varianz der Differenz mit der Summe der Varianzschätzer für diebeiden Untersuchungsbereiche schätzen. Bei nicht disjunkten Untersuchungsbereichen,insbesondere wenn für den selben Untersuchungsbereich zwei verschiedene Charakte-ristika verglichen werden sollen, muss neben dem Stichprobenplan auch die Korrelationder Schätzer berücksichtigt werden.

9.3 Tests und Modelle

Da die Varianzen bei komplexen Stichproben verändert werden, ergeben die üblichenχ2-Tests falsche Signifikanzen. Sei Ajk, mit j = 1, . . . , J und k = 1, . . . ,K eine Aufteilungder Population nach zwei Merkmalen mit J bzw. K Kategorien. Die Anzahlen Njk vonBeobachtungen der Population in den Zellen Ajk bilden also eine Kontingenztafel. Sei njkdie Anzahl Beobachtungen der Stichprobe in der Zelle jk, pjk =

∑S wi1{i ∈ Ajk}/

∑S wi

die Schätzung des Populationsanteils in Zelle jk, Njk = N · pjk die geschätzte Grösseder Population in Zelle jk und p.k die Schätzung des Anteils der Kategorie k aus demRand der Kontingenztafel.

Die übliche χ2-Statistik für die Population ist

χ2U =

J∑j=1

K∑k=1

(Npjk −Npj.p.k)2

Npj.p.k(9.1)

= N ·J∑j=1

K∑k=1

(pjk − pj.p.k)2

pj.p.k. (9.2)

Bei Daten aus Stichprobenerhebungen muss die χ2-Statistik mit den geschätztenPopulationsanteilen pjk, Formel (9.2), berechnet werden, weil die ungewichtete Stich-probe im Normalfall keine konsistente Schätzung der Anteile liefert. Dann muss aller-dings die χ2

U von der Populationsgrösse auf die Stichprobengrösse skaliert werden, d.h.χ2S = χ2

Un/N , um die richtige Anzahl Freiheitsgrade zu erreichen. Im obigen Beispiel10 ergibt sich für die mit der Stichprobe berechnete χ2-Statistik für den Zusammenhangzwischen Raucher und Geschlecht ein Wert von 8.45 ( χ2 ohne Kontinuitätskorrektur),während mit den hochgerechneten Werten (siehe Tabelle 8.5) 108.48 ∗ 130/2000 = 7.05resultiert. Der Unterschied zur “ungewichteten"χ2-Statistik ist in diesem Beispiel eherklein.

Die Berücksichtigung der Gewichte bei der Berechnung χ2-Statistik ist aber noch nichtgenügend, weil bei komplexen Stichprobenplänen auch der Effekt des Stichprobenplansauf die Varianzen berücksichtigt werden muss (vgl. Abschnitt 5.5). Für die Berechnungder entsprechenden Korrekturen werden in der Regel die Effekte des Stichprobenplansauf die Varianz der Zellen und Ränder der Kontingenztafel benötigt.

Auch die üblichen Tests von Koeffizienten in Regressionsmodellen können bei kom-plexen Stichproben falsche Resultate ergeben, wenn die Tests nicht korrigiert werden.

c© Beat Hulliger 2016 37

Wenn bei Regressionsmodellen die Untersuchungsvariablen mit dem Stichproben-plan, bzw. mit den für den Stichprobenplan verwendeten Variablen korrelieren, könnenauch die Schätzungen für Koeffizienten verfälscht werden. Dieser Effekt wird Selektions-Verzerrung (Selection-Bias) genannt. Bei Antwortausfällen kann ein ähnlicher Effekt auf-treten.

Eine gute Übersicht über die Probleme, die bei der Analyse von komplexen Stichpro-ben entstehen gibt (Chambers and Skinner, 2003).

Kapitel 10

Lösungen zu den Beispielen

Beispiel 1 (Population mit 3 Elementen): Sei U = {1, 2, 3}. Notiere alle 23 möglicheTeilmengen und bezeichne den Stichprobenraum der Stichproben der Grösse n = 2.

Lösung: {}, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}Beispiel 2 (Population 5): Sei U = {1, 2, 3, 4, 5}. Zähle die Stichproben der Grös-

se n = 2 auf. Die Variable y habe folgende Werte: yU = (1, 5, 9, 8, 12)>. Berechne diefolgenden Charakteristiken der Population: Populationsmittel, Populationsvarianz, Popu-lationsmedian von y.

Lösung: Die Stichproben der Grösse n = 2 sind in Tabelle 10.1 aufgeführt.

S {1, 2} {1, 3} {1, 4} {1, 5} {2, 3} {2, 4} {2, 5} {3, 4} {3, 5} {4, 5}yS 1,5 1, 9 1, 8 1, 12 5, 9 5, 8 5, 12 9, 8 9, 12 8, 12yS 3.0 5.0 4.5 6.5 7.0 6.5 8.5 8.5 10.5 10.0

Tabelle 10.1: Stichproben der Grösse n = 2 aus der Population 5.

Populationsmittel: yU = 7, Populationsvarianz: D2 = 17.5,Median: med(yU ) = 8

Beispiel 3 (Einfache Zufallsstichprobe): Berechne mit Population 5 für alle ein-fachen Zufallsstichproben der Grösse n = 2 das Stichprobenmittel yS . Bestimme denErwartungswert des Stichprobenmittels und die Varianz.

Die Stichprobenmittel sind in Tabelle 10.1 aufgeführt. Jede Stichprobe hat die Wahr-scheinlichkeit 1/10, gezogen zu werden. Der Mittelwert der Stichprobenmittel über diemöglichen Stichproben ist 7, d.h. der Erwartungswert ist E[yS ] = (3.0 + 5.0 + 4.5 + 6.5 +7.0+6.5+8.5+8.5+10.5+10.0)/10 = 7. Die Varianz beträgt

∑10i=1(ySi−7)2/10 = 5.25 (In

der Varianz-Formel wird durch die Anzahl der möglichen Stichproben dividiert, d.h. durch( (N

), n) = 10.Beispiel 4 (Geschichtete Stichprobe): Sei die Population 5 in zwei Schichten un-

terteilt: U1 = {1, 2, 3} und U2 = {4, 5}. Berechne für die Variable y je das Schichtmittelund die Schichtvarianz. Wir ziehen in jeder Schicht eine einfache Zufallsstichprobe derGrösse n = 1. Zähle die möglichen Stichproben auf. Berechne je das geschichtete MittelySS sowie Mittelwert und Varianz dieser Schätzungen.

Lösung: Schicht 1: yU1 = 5, D2U1

= 16. Schicht 2: yU2 = 10, D2U2

= 8.Die möglichen Stichproben sind: {1, 4}, {1, 5}, {2, 4}, {2, 5}, {3, 4}, {3, 5}Geschichtetes Mittel ySS : 3.8, 5.4, 6.2, 7.8, 8.6, 10.2.Deren Mittel, d.h. der Erwartungswert, ist 7 und die Varianz beträgt 4.48. Das geschichteteMittel ist tatsächliche effizienter als das Stichprobenmittel bei einfacher Zufallsstichprobe.

Beispiel 5 (Population 5 mit Quotientenschätzer): Sei das Populationsmittel derVariable xU = (3, 2, 5, 6, 4)> bekannt. Berechne für jede Stichprobe der Grösse n = 2den Quotientenschätzer. Berechne Mittelwert und Varianz dieser Schätzungen.

Lösung: Der Quotientenschätzer TR = yS xU/xS ergibt 4.8, 5, 4, 7.43, 8, 6.5, 11.33,6.18, 9.33, 8. Das Mittel dieser Werte ist 7.057. Der Quotientenschätzer hat also einen

38

c© Beat Hulliger 2016 39

kleinen Bias als Schätzer von yU = 7. Die Varianz des Quotientenschätzers ist 4.51, alsonur leicht grösser als beim geschichteten Mittel.

Beispiel 6 (Population 5 mit Horvitz-Thompson Schätzer): Die Einschlusswahr-scheinlichkeiten bei Population 5 seien proportional zu xU = (3, 2, 5, 6, 4)>. Mit Dur-bins Ziehungsalgorithmus ergeben sich die die doppelten Einschlusswahrscheinlichkei-ten π1,2 = 0.0275, π1,3 = 0.0880, π1,4 = 0.1210, π1,5 = 0.0635, π2,3 = 0.0556, π2,4 =0.0770, π2,5 = 0.0400, π3,4 = 0.2310, π3,5 = 0.1255, π4,5 = 0.1711, die gleichzeitig die Wahr-scheinlichkeiten der entsprechenden Stichproben sind. Berechne für jede Stichprobe denHorvitz-Thompson Schätzer für das Mittel und ermittle die Varianz aus allen Stichproben.

Lösung: Der Erwartungswert ist 7. Der Horvitz-Thompson Schätzer ist tatsächlich er-wartungstreu. Die mit den Stichprobenwahrscheinlichkeiten gewichtete Varianz ist 4.60,also knapp über derjenigen des Quotientenschätzers.

Beispiel 7 (Klumpenstichprobe mit einfachem Schätzer): Die Population 5 sei wiefolgt in Klumpen eingeteilt: K1 = {1, 2},K2 = {3},K3 = {4, 5}. Wir ziehen eine einfacheZufallsstichprobe der Grösse n = 1 aus den Klumpen und beziehen alle Elemente desgezogenen Klumpens in die Stichprobe ein (Welche Stichproben sind möglich?). Wir be-rechnen den Schätzer TK/M0 für jeden Fall. Berechne auch das Mittel und die Varianzdieser Schätzungen.

Lösung: Das Ergebnis für den ersten Klumpen ist TK/M0 = ((1 + 5) · 3/1)/5 = 3.6und für Klumpen zwei und drei ergibt sich 5.4 und 12. Das Mittel von 3.6, 5.4 und 12 istwiederum 7, aber die Varianz ist 13.04. Der Schätzer TK/M0 mit Klumpenstichprobe istalso nicht effizient.

Beispiel 8 (Klumpenstichprobe mit Quotientenschätzer): Berechne den SchätzerTKR

/M0 im Fall der Klumpenstichprobe aus Beispiel 7.Lösung: TKR

/M0: 3, 9, 10. Das Mittel dieser Schätzungen ist 7.333 und die Varianzbeträgt 9.555. Der Schätzer hat also einen kleinen Bias, dafür aber kleinere Varianzals TK/M0. Auch im mittleren quadratischen Fehler, welcher den Bias berücksichtigt,ist TKR

/M0 immer noch einiges besser als TK/M0.Beispiel 9 (Klumpenstichprobe mit Horvitz-Thompson Schätzer): Wir ziehen einen

Klumpen mit ungleicher Wahrscheinlichkeit, nämlich Klumpen Ki wird mit Wahrschein-lichkeit πi = Mi/M0 gezogen (i = 1, 2, 3). Dann berechnen wir den Horvitz-ThompsonSchätzer THT = (Miyi/πi)/M0. Kontrolliere den Mittelwert und die Varianz dieser Schät-zungen.

Lösung: Der Horvitz-Thompson Schätzer mit Einschlusswahrscheinlichkeiten πi =Mi/M0 ergibt 3, 9, 10. Das mit den Stichprobenwahrscheinlichkeiten gewichtete Mittel die-ser Schätzungen ist 0.4 · 3 + 0.2 · 9 + 0.4 · 10 = 7, was zu erwarten war, weil der Horvitz-Thompson Schätzer erwartungstreu ist. Die gewichtete Varianz beträgt 0.4 · 42 + 0.2 · 22 +0.4 · 32 = 10.8, liegt also zwischen den Schätzern TKR

/M0 und TK/M0.Beispiel 10 (Nachschichtung): Um den Anteil der Raucher zu schätzen, haben wir

unter 2000 Personen eine einfache Zufallsstichprobe der Grösse 200 gezogen und von130 Personen Antworten erhalten. Von den 130 Antwortenden waren 23 Raucher. Wirwissen, dass die Grundgesamtheit je 1000 Männer und Frauen enthält, haben aber inunserer Stichprobe 80 Frauen, wovon 8 Raucherinnen sind. Führe eine Nachschichtungnach Geschlecht durch und vergleiche TP mit dem Stichprobenmittel.

Lösung: Das Stichprobenmittel ist ps = 0.177. Das nachgeschichtete Mittel ist TP =(1000 · 0.3 + 1000 · 0.1)/2000 = 0.2.

Literaturverzeichnis

Ardilly, P. and Y. Tillé (2005). Sampling Methods: Exercises and Solutions. Springer.

Chambers, R. and C. Skinner (2003). Analysis of Survey Data. Wiley Series in SurveyMethodology. Wiley.

Cochran, W. G. (1977). Sampling Techniques (3ed.). Wiley.

Dalenius, T. (1985). Elements of Survey Sampling. Sarec.

Deville, J.-C. and Särndal (1992). Calibration estimators in survey sampling. JA-SA 87/418, 376–382.

Eichenberger, P., B. Hulliger, and J. Potterat (2011). Two measures for sample size de-termination. Survey Research Methods 5/1, 27–37.

Floyd J. Fowler, J. (2009). Survey Research Methods (4ed). Applied Social ResearchMethods Series. SAGE Publications.

Groves, R., J. Floyd J. Fowler, M. Couper, J. Lepkowski, E. Singer, and R. Tourangeau(2011). Survey Methodology. Wiley Series in Survey Methodology. Wiley.

Grundy, P. (1954). A method of sampling with probability exactly proportional to size.Journal of the Royal Statistical Society, Series B 16, 236–238.

Hulliger, B. (1995). Outlier robust Horvitz-Thompson estimators. Survey Methodology 21,79–87.

Hulliger, B. (1999). Simple and robust estimators for sampling. In ASA Proceedings ofthe Section on Survey Research Methods, pp. 54–63. American Statistical Association.

Kauermann, G. and H. Küchenhoff (2011). Stichproben: Methoden und praktische Um-setzung mit R. Springer-Lehrbuch. Springer.

Kish, L. (1965). Survey sampling. Wiley classics library. J. Wiley.

Lohr, S. (2009). Sampling: Design And Analysis. Advanced Series. Brooks/Cole.

Luzi, O., T. De Waal, B. Hulliger, M. Di Zio, J. Pannekoek, D. Kilchmann, U. Guarne-ra, J. Hoogland, A. Manzari, and C. Tempelman (2007). Recommended Practices forEditing and Imputation in Cross-Sectional Business Surveys. Italian Statistical InstituteISTAT,.

Särndal, C., B. Swensson, and J. Wretman (2003). Model Assisted Survey Sampling.Springer Series in Statistics. Springer.

Tillé, Y. (2001). Théorie des sondages, échantillonnage et estimation en populationsfinies, Cours et exercices avec solutions. Dunod, Paris.

40

Index

χ2-Test, 36

Algorithmus von Durbin, 20Analyseeinheit, 3Anteil, 12Antwortausfälle, 3, 31Antwortneigung, 34Antwortquote, 7Antwortrate, 31Ausfallrate, 32Ausreisser, 4, 28

balanced half samples, 35Bernoulli-Stichprobe, 21Bias, 3, 8, 19Bruttostichprobengrösse, 31

CATI, 7Charakteristik, 3, 7

Daten, 3Daten-Erfassung, 5Datenaufbereitung, 4, 5, 26Datengewinnung, 3Diffusion, 5

einfache geschichtete Zufallsstichprobe, 15Einfache Klumpenstichprobe, 23einfachen Zufalls-Stichprobe, 9Einschlusswahrscheinlichkeit, 3, 8, 9Einsetzung, 4Element, 3, 7Endlichkeitskorrektur, 10, 16Erhebungskosten, 23Erhebungsmethode, 5Erhebungsperiode, 5erwartungstreu, 3, 8Erwartungswert, 8

Feldarbeit, 7Festlegung der Schichtgrenzen, 17

geschichtetes Mittel, 16gestutztes Mittel, 28Gewichtung, 4Grösse der Population, 9GREG, 22Grundgesamtheit, 3, 5

Hajek-Schätzer, 20Hochrechnung, 4Hochrechnungs-Gewichte, 16, 19Horvitz-Thompson, 19Hot Deck, 27

Imputation, 26Indikatorvariable, 12Informatik, 5Initialgewicht, 33Intra-Klumpen-Korrelation, 24Iterative Proportional Fitting, 33

Jackknife, 35

Kalibrierung, 22, 32, 33Klumpen, 23Klumpung, 4Kodierung, 26komplexe Stichprobenpläne, 19komplexen Stichproben, 36komplexen Stichprobenpläne, 4Konsistenz, 3Kontingenztafel, 36Kontrollen, 4, 26

Linearisierung, 19, 35

Median, 28Messinstrument, 6mittlerer quadratischer Fehler, 8

Nachschichtung, 18, 32Netto-Stichprobengrösse, 3, 31Neyman-Tschuprow, 16Nonresponse, 31Nonresponse-Bias, 32

optimale Aufteilung, 16

Panel, 3Parameter, 3partielle Antwortausfälle, 31persönliches Interview, 7Plausibilisierung, 26Population, 2, 3, 7Populations-Mittel, 7Post, 7proportionale Aufteilung, 16

41

42 c© Beat Hulliger 2016

Punkt-Schätzer, 3

Quartile, 28Quartilsabstand, 28Quoten-Stichprobe, 2Quotientenschätzer, 19Quotientenschätzer, robuster, 29

Referenzperiode, 5Register, 2Regressionsmodelle, 36repräsentativ, 2robuste Schätzer, 28

Schätzer, 3, 8Schätzung, 3Schätzung der Varianz, 11Schätzverfahren, 3Schichten, 15Schichtung, 4Selektions-Verzerrung, 37signifikante Unterschiede, 36Standardabweichung, 10Standardfehler, 10Stichprobe, 3, 7Stichproben-Median, 28Stichprobeneinheit, 3Stichprobenerhebung, 1, 2Stichprobenfehler, 10Stichprobengrösse, 3, 11, 12, 16, 21Stichprobenmittel, 9Stichprobenplan, 3, 5, 7Stichprobenrahmen, 3, 5Stichprobenrate, 10Stichtag, 5Strategie, 8Superpopulationsmodelle, 8systematische Stichprobe, 14

Teilerhebung, 2Total, 7

uniform verteilte Zufallsvariablen, 14Untersuchungsbereich, 4, 12Urnenmodell, 7

Variable, 3, 7Varianz, 3, 8, 10Varianz Horvitz-Thompson-Schätzer, 20Varianzschätzung, 3, 35Variationskoeffizient, 12Verhältnisschätzer, 19Vertrauensintervall, 3, 36Verweigerung, 31Vollständigkeit, 3

winsorisierte Mittel, 29

Zensus, 2zentraler Grenzwertsatz, 35Ziehung, 14Ziehung der Stichprobe, 3Ziehungs-Wahrscheinlichkeit, 7Zufallsstichprobe, 2Zufallsvariablen, 8Zurücklegen, 7