20
Dozent: Dawid Bekalarczyk Universität Duisburg-Essen Fachbereich Gesellschaftswissenschaften Institut für Soziologie Lehrstuhl für empirische Sozialforschung Raum: LF 161 T T E E I I L L 3 3 : : M M E E S S S S E E N N U U N N D D S S K K A A L L I I E E R R E E N N

TEIL 3: MESSEN UND SKALIEREN - Willkommen … ist schwierig, geeignete Items für eine solche Skala zu finden, welche eindimensional sind und gleichzeitig an Intensität monoton zunehmen

Embed Size (px)

Citation preview

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

TTEEIILL 33:: MMEESSSSEENN UUNNDD SSKKAALLIIEERREENN

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

GLIEDERUNG

Das Messen – eine Umschreibung

Skalenniveaus von Variablen

Drei Gütekriterien von Messungen

Objektivität

Reliabilität

Validität

Konstruierte Skalen in den Sozialwissenschaften

Likert-Skala

Guttman-Skala

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Das Messen – eine Umschreibung

� Der Prozess der Datenerhebung kann auch als Messen bezeichnet werden � Feststellung

der Merkmalsausprägungen von Untersuchungseinheiten (z.B. „Feststellung, wie viel eine

Person wiegt“ oder „Feststellung, wie aggressiv ein Schulkind auf einen Reiz reagiert“)

� Messen ist die Zuordnung von Zahlen zu Objekten oder Ereignissen nach festgelegten Re-geln und zwar so, dass numerische Relative den empirischen Relativen entsprechen

Begriff Empirisches Relativ Numerisches Relativ

Definition Eine Menge von Objekten, über die

eine Relation definiert wurde bzw.

die entsprechend der Relation

geordnet wurden

Eine Menge von Zahlen, über

die eine Relation definiert wur-

de und die entsprechend sor-

tiert wurden

Beispiel (Messung der Kör-

pergröße an drei Personen

in cm)

Otto > Fritz > Hugo 186 > 179 > 168

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

� Eine Messung im o.g. Sinne ist eine strukturtreue Abbildung � Die Beziehungen der Objek-

te werden durch die Beziehungen der zugeordneten Zahlen korrekt wiedergegeben

� Strukturtreue Abbildungen werden als Morphismen bezeichnet

Beispiel: Vier Schülern A, B, C, D werden ihre Schulnoten in Mathe zugeordnet:

Isomorphismus: umkehr-bar eindeutige Abbildung A <-----------> 1 B <-----------> 2 C <-----------> 3 D <-----------> 4

Homomorphismus: nicht umkehrbar eindeutige Ab-bildung

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Skalenniveaus von Variablen

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Drei Gütekriterien von Messungen

1. Objektivität (Intersubjektivität):

� Durchführungsobjektivität – Unabhängigkeit zwischen der durchführenden Person und der

Durchführung (z.B. standardisierte Fragen; kein Spielraum für verschiedene Interviewer)

� Auswertungsobjektivität – Unabhängigkeit zwischen einer Auswertung und der auswerten-

den Personen (deshalb gibt es etablierte statistische Analyseverfahren)

� Interpretationsobjektivität – Unabhängigkeit zwischen der interpretierenden Person und

der Interpretation (offene, publizierte Argumentation)

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

2. Reliabilität (Zuverlässigkeit von Messungen):

� Ausmaß, bei wiederholten Messungen mit einem Messinstrument unter den gleichen Be-dingungen zu dem gleichen Ergebnis zu gelangen

Verfahren zur Überprüfung der Reliabilität:

� Test-Re-Test – ein Test wird an den selben Objekten zwei Mal durchgeführt und es werden

die Ergebnisse auf ihre Übereinstimmung geprüft

� Parallel-Test – die Messungen werden mit zwei unterschiedlichen (leicht abweichenden) In-

strumenten durchgeführt (z.B. mit zwei ähnlichen Fragebögen)

� Konsistenz (split-half-Methode) – Spaltung eines Messinstruments in zwei Hälften und Ver-

gleich der Ergebnisse

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

3. Validität (Gültigkeit von Messungen)

� Ausmaß, in dem das Messinstrument tatsächlich das misst, was es messen soll

Validitätskonzepte:

� Inhaltsvalidität – bezieht sich darauf, dass möglichst alle Aspekte / Dimensionen des Sach-verhalts, die gemessen werden sollten, berücksichtigt werden (z.B. bei der Messung des

Musikwissens sollten alle gängigen Musikrichtungen abgefragt werden und nicht nur Rock

und Jazz)

� Kriteriumsvalidität – bezieht sich auf den Zusammenhang zwischen den empirisch gemes-

senen Ergebnissen des Messinstrumentes und einem anders gemessenen externen Krite-rium

� Vorhersagevalidität (Prädiktive Validität) – das externe Kriterium liegt in der Zukunft (z.B. mit einem Einstellungstest soll vorausgesagt werden, wie gut jmd. seine Arbeit

später machen wird)

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

� known-groups – sind zwei Gruppen bekannt, die auf der interessierenden Dimension

Unterschiede aufweisen, so muss ein Messinstrument diese beiden Gruppen unter-scheiden können (die Gruppenzugehörigkeit ist hier also das externe Kriterium

� Expertenvalidierung – Experten überprüfen gefühlsmäßig die Gültigkeit des Messinstru-mentes

� Konstruktvalidität

� liegt dann vor, wenn aus dem Konstrukt empirisch überprüfbare Zusammenhänge die-

ses Konstruktes mit anderen Konstrukten theoretisch hergeleitet und empirisch über-prüft werden können

� ist in dem Sinne die Überprüfung von statistischen Modellen (die auf Hypothesen ba-

sieren)

� dafür stehen komplexe statistische Methoden zur Verfügung

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Konstruierte Skalen in den Sozialwissenschaften

� Skalen allgemein sind Homomorphismen, welche für Messungen genutzt werden, und somit

die Ergebnisse der Konstruktion von Messinstrumenten darstellen

� Methoden zur Konstruktion solcher Instrumente bezeichnet man daher als Skalierungsver-fahren

� Konstruierte Skalen: Spezielle Skalen, bei denen die Kombination eine Reihe von „Items“,

die entlang einer inhaltlichen Dimension messen, die Skalenwerte liefern

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Items:

� Die kleinsten Bestandteile eines Erhebungsinstrumentes (z.B. einzelne Fragen, Aufgaben

oder Aussagen, die verbunden sind mit der Aufforderung, den Grad der Zustimmung bzw.

Ablehnung oder einer anderen Bewertung anzugeben)

� Man erschließt soziale Einstellungen aus Reaktionen auf sorgfältig ausgewählten State-ments (Items), die als Indikatoren für eine direkt nicht beobachtbare Einstellung betrachtet

werden

BEISPIEL:

Einstellung: Ausländerfeindlichkeit

Item 1: „In wirtschaftlich schlechten Zeiten wie

diesen sollten Ausländer lieber wieder gehen“.

Item 2: „Ausländer können sich nicht an-

passen.“

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Weitere Anmerkungen:

� Skalierungsverfahren werden in der empirischen Sozialforschung überwiegend zur Messung von Einstellungen verwendet

� Einstellungen werden dabei als latente Variablen aufgefasst – Ziel der Einstellungsmessung

ist die Feststellung der Ausprägung der latenten Variablen bei den Befragten

� Zur Messung werden den Befragten Aussagen vorgelegt, auf welche die Befragten mit Zu-

stimmung oder Ablehnung reagieren sollen (Items)

� Bei diesen Items geht man davon aus, dass sie die interessierenden Auffassungen / Einstel-

lungen über die Beantwortung zum Ausdruck bringen

� Über verschiedene Regeln, welche von der verwendeten Skalenkonstruktion abhängen,

werden nun die Ergebnisse der Statements einzelner Personen zu einem Skalenwert pro Person verarbeitet

Beispiele für Items zu verschiedenen Themen wie z.B. Politik, mit jeweils fünf Antwortmölichkeiten:

Beispiele für Items zu verschiedenen Themen wie z.B. Politik, mit jeweils fünf Antwortmö

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Beispiele für Items zu verschiedenen Themen wie z.B. Politik, mit jeweils fünf Antwortmög-

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Likert-Skala:

1. Schritt:

� Die Konstruktion einer Likert-Skala beginnt mit der Sammlung einer großen Zahl von Items (diese Items stellen hierbei Aussagen dar, von denen angenommen wird, dass sie die inter-

essierende Einstellung wiedergeben)

� Diese Items werden einer Stichprobe von Personen vorgelegt, die Befragten werden nun

aufgefordert, zu jedem Statement Stellung zu beziehen; jedes Item hat die gleichen Ant-

wortvorgaben, z.B.:

� stimme voll und ganz zu

� stimme eher zu

� teils / teils

� stimme eher nicht zu

� stimme gar nicht zu

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

2. Schritt:

� Kodierung der Antwortmöglichkeiten mit Zahlenwerten und ggf. Umkehrung der Zahlen-werte bei negativ formulierten Items, damit die Zahlenwerte immer der gleichen Einstel-

lungsrichtung entsprechen

Beispiel – Einstellung gegenüber der Familie:

ITEM A: “Meine Familie bedeutet mir

sehr viel”

ITEM B: “Meine Familie spielt in meinem

Leben keine große Rolle”

Ausprägungen: Werte: Ausprägungen: Werte:

stimme voll und ganz zu 1 stimme voll und ganz zu 5

stimme eher zu 2 stimme eher zu 4

teils / teils 3 teils / teils 3

stimme eher nicht zu 4 stimme eher nicht zu 2

stimme gar nicht zu 5 stimme gar nicht zu 1

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

3. Schritt – Item-Analyse:

� Das statistische Verfahren „Item-Analyse“ (Überprüfung der Eindimensionalität) soll ungee-ignete Items aus der Skala aussondern

� Ungeeignete Items: Personen mit sehr unterschiedlicher Einstellung beantworten ein Item

ähnlich oder alle Personen stimmen dem Item zu bzw. alle Personen lehnen es ab

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Guttman-Skala:

� Die Guttman-Skala basiert auf der Vorgabe einer Reihe von Aussagen, die in bezug auf die interessierende Einstellung immer extremer werden

� Die Fragen / Aussagen lassen sich nur mit ja / nein beantworten

� Es wird angenommen, dass ein Befragter mit einer bestimmten Einstellung alle Aussagen, die weniger extreme Anschauungen ausdrücken als er selbst besitzt, zustimmt und alle

Aussagen, die extremere Anschauungen ausdrücken, ablehnt

BEISPIEL (Verdrossenheit gegenüber Managern großer Wirtschaftskonzerne):

1. Manager können sich oftmals in die Probleme einfacher Arbeiter nicht hineinversetzen

2. Managern sind Geld und andere Vorteile oft wichtiger, als sich um die Probleme der Arbei-

ter zu kümmern

3. Manager würden über Leichen gehen, um an Geld und Macht zu gelangen – wer und was

dabei auf der Strecke bleibt, interessiert sie nicht

Aufgaben: 1 2 3 4 5 6 7 8 9 10

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

10

Dozent: Dawid Bekalarczyk

Universität Duisburg-Essen

Fachbereich Gesellschaftswissenschaften

Institut für Soziologie

Lehrstuhl für empirische Sozialforschung

Raum: LF 161

Probleme bei der Guttman-Skala:

� Es ist schwierig, geeignete Items für eine solche Skala zu finden, welche eindimensional sind

und gleichzeitig an Intensität monoton zunehmen

� Es können inkonsistente Antwortmuster auftreten