28
Chi-Quadrat-Verfahren (ohne Messwiederholung)

Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren

(ohne Messwiederholung)

Page 2: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010
Page 3: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis

Chi-Quadrat-Verfahren (ohne Messwiederholung) ..................................................................................... 2Lernhinweise ............................................................................................................................................ 2Einführung ................................................................................................................................................ 2Theorie (1-4) ............................................................................................................................................ 51. Grundkonzept aller Verfahren ............................................................................................................. 5

Teil 1 - Grundkonzept aller Verfahren ....................................................................................... Teil 2 - Grundkonzept aller Verfahren ....................................................................................... Teil 3 - Grundkonzept aller Verfahren .......................................................................................

2. Vergleich einer empirischen mit einer theoretischen Verteilung ........................................................ 93. Vergleich einer empirischen mit einer Normalverteilung ................................................................. 124. Vergleich von zwei empirischen Verteilungen ................................................................................. 16Fallbeispiel (1-3) .................................................................................................................................... 171. Vergleich einer empirischen Verteilung mit einer Gleichverteilung ................................................. 182. Vergleich einer empirischen Verteilung mit einer Normalverteilung ............................................... 213. Vergleich von zwei empirischen Verteilungen ................................................................................. 24

Page 4: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 2

Chi-Quadrat-Verfahren (ohne Messwiederholung)LernhinweiseDieser Lernschritt umfasst die folgenden Unterabschnitte:

• Grundkonzept aller Verfahren

• Der Vergleich einer empirischen mit einer theoretischen Verteilung

• Vergleich einer empirischen Verteilung mit einer Normalverteilung

• Der Vergleich von zwei empirischen Verteilungen

Benötigte Vorkenntnisse

• Eigenschaften der Skalenniveaus

• Grundprinzip entscheidungsstatistischer Verfahren

Geschätzte BearbeitungszeitNach Konsultation der in Ihrem Curriculum vorgesehenen Vorbereitungslektüre können Sie diesen Lernschrittin ca. 60 Minuten bearbeiten.

Einführung

Ist Precilla Cornflakes eine Falschspielerin

Unsere Geschichte spielt in Tumbstone (Arizona), d.h. im wildesten Teil des Westens.Es ist 03.05 Uhr morgens, im düsteren Hinterzimmer von Lucys Saloon rollen wieder mal die Würfel. Es istimmer dieselbe illustre Runde, die sich zum nächtlichen Glücksspiel trifft: Lucys Mitarbeiterinnen Tilly Knall,Linda Jones, Precilla Cornflakes und Virginia McBurger spielen um die wenigen Dollars, die sie am Abendim Saloon verdienten.

Page 5: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 3

Die Runde begann ja ganz gemütlich, doch jetzt herrscht Hochspannung: Die Damen sind aufs äusserste gereizt,denn wiederum scheint das Glück parteiisch zu sein: Auch heute hat Precilla die meisten der schwer verdientenDollars eingesteckt.Um 03:18 ist es soweit: Tilly hat ihren letzten Dollar verspielt, es kommt zum Eklat!Tilly zieht ihren Damen-Colt und schreit:"Verdammte Schiebung!! Hier wird falsch gespielt!! Precilla, gib mir mein Geld zurück, oder es knallt!!"Virginia McBurger versucht zu schlichten:"OK Tilly, steck erst mal dein Schiesseisen weg! Ich hab eine bessere Idee: Wir bringen Precillas Würfelunserem Sheriff O'Neel. Der kann entscheiden, ob Precillas Würfel präpariert ist. Wenn er wirklich präpariertist, kriegst Du dein Geld zurück, und Precilla geht mal für ein paar Tage ins Kittchen."Nach einigem Hin und Her akzeptiert Tilly den Vorschlag. Nach einem letzten Schluck gehen die Damenschlafen.

Am nächsten Tag herrscht Katerstimmung in der Küche von O'Neel, dem berühmten Sheriff von Tumbstone.O'Neel ist ausser sich: "Wie soll ich diesen vier tollen Weibern sagen können, ob Precillas Würfel präpariertist oder nicht? Ich bin doch kein Hellseher!"

Page 6: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 4

Emme, seine Frau bleibt ganz cool: "Schäm dich, O'Neel! Erstens sind das nicht vier tolle Weiber,sondern ehrenwerte Mitglieder unseres Bingo-Clubs. Zweitens hat uns doch Pastor Detlev an der letztenJahresversammlung die Sache mit dem Zufall gerade am Beispiel eines Würfels erklärt."O'Neel wird neugierig: "Soso. Dann erklär' mir doch mal diese Sache mit dem Zufall."Emme trocknet sich die Hände ab und freut sich, dem sonst so selbstsicheren Sheriff O'Neel mal etwas erklärenzu können: "Die Sache ist ganz einfach. Bei einem normalen Würfel müssen alle Würfelbilder gleich häufigauftreten. Du würfelst also mit Precillas Würfel z.B. 120mal und notierst Dir die Ergebnisse. Dann zeichnenwir die Verteilung der Ergebnisse auf und vergleichen diese Verteilung mit einer Verteilung, bei der alleWürfelbilder gleich häufig vorkommen. Unterscheiden sich die beiden Verteilungen, so ist Precillas Würfelpräpariert."O'Neel holt sich brummend Bleistift und Papier, setzt sich an den Küchentisch und beginnt zu würfeln.Nach einer Stunde ist es soweit: O'Neel hat mit Emmes Hilfe die Häufigkeiten bestimmt, mit denendie Würfelbilder in 120 Würfen (Experimenten) mit Precillas Würfel aufgetreten sind. Emme hat auchaufgezeichnet, welche Häufigkeiten für einen idealen, nicht präparierten Würfel zu erwarten sind. Pastor Detlevnannte diese Verteilung eine Gleichverteilung.Wir sehen uns die beiden Verteilungen mal an:

Page 7: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 5

Die beiden Verteilungen zeigen deutliche Unterschiede. Sind diese aber so gravierend, dass darausgeschlossen werden darf, dass Precillas Würfel präpariert ist? Oder ist es möglich, dass die Unterschiede nurzufällig entstanden sind und bei einer Weiterführung der Experimente mit Precillas Würfel, bei z.B. 1200Wurfexperimenten, verschwinden würden?Die Frage ist ernst, denn einerseits will Sheriff O'Neel nicht tagelang würfeln, andererseits möchte er Precillaauch nicht unnötigerweise einsperren, kennt er sie doch als wehrhaftes Frauenzimmer. Emme schlägt vor, denPastor Detlev nochmals um Rat zu bitten.Da uns dieser Weg verschlossen ist, behelfen wir uns mit einem Blick ins Theorie-Kapitel.

Theorie (1-4)

Inhaltsübersicht

• 1. Grundkonzept aller Verfahren

• 2. Vergelich einer empirischen mit einer theoretischen Verteilung

• 3. Vergleich einer empirischen mit einer Normalverteilung

• 4. Vergleich von zwei empirischen Verteilungen

1. Grundkonzept aller VerfahrenDie im Zusammenhang mit

-Verfahren zentrale Fragestellung lautet:Wie kann eine empirisch erhobene Verteilung eines nominal skalierten Merkmals mit einer theoretischerwarteten Verteilung verglichen werden?Wir wählen für unsere Überlegungen den einfachsten Fall und vergleichen die Verteilung eines nominalskalierten Merkmals mit k = 5 Ausprägungskategorien mit einer theoretisch erwarteten Gleichverteilung.

Page 8: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 6

Anhand dieser Abweichungen sollten wir entscheiden können, ob sich die beobachtete und die erwarteteVerteilung so stark unterscheiden, dass bei der Interpretation der Unterschiede zwischen den beidenVerteilungen der Zufall ausgeschlossen werden darf.Wir suchen also ein Prüfverfahren, das uns erlaubt, ganze Verteilungen auf signifikante Unterschiede zu prüfen.Rufen wir uns als erstes in Erinnerung, was ganz generell zu jedem entscheidungsstatistischen Verfahrengehört.

Quiz zu entscheidungsstatischen VerfahrenWas gehört aus formaler Sicht, d.h. ohne Berücksichtigung der Interpretation des Resultates, im einfachstenFall zu jedem entscheidungsstatistischen Verfahren?Ganz generell gehört zu jedem entscheidungsstatistischen Prüfverfahren:

❏ Eine Arbeitshypothese H0 und eine Alternativhypothese H1

❏ Eine Prüfgrösse

❏ Eine alternative Prüfgrösse

❏ Information, wie die Prüfgrösse verteilt ist, wenn die Arbeitshypothese H0 nicht gültig is

❏ Information, wie die Prüfgrösse verteilt ist, wenn die Arbeitshypothese H0 gültig ist

❏ Ein a-Fehler-Risiko

❏ Ein b-Fehler-Risiko

Page 9: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 7

Den Ausgangspunkt für die Entwicklung einer adäquaten Prüfgrösse haben wir schon gefunden, es sind die inden einzelnen Ausprägungskategorien beobachteten Häufigkeitsunterschiede (fbj - fej).

Da mit der gesuchten Prüfgrösse die beiden Verteilungen gesamthaft verglichen werden sollen, muss sie dieHäufigkeitsunterschiede in allen k Ausprägungskategorien umfassen.Als erstes denken wir natürlich an die Summe der k Häufigkeitsunterschiede, verwerfen die Idee aber schonnach einer kurzen Überlegung:Da sowohl positive wie auch negative Häufigkeitsunterschiede vorliegen, kann ihre Summe auch bei grossenUnterschieden klein werden (beim Vergleich einer empirischen Verteilung mit einer Gleichverteilung wirddie Summe sogar per Definition gleich Null). Positive und negative Unterschiede gleichen sich aus. Wieimmer in solchen Fällen, müssen wir die Vorzeichen 'loswerden'. Dies gelingt mathematisch am einfachsten,indem wir die Häufigkeitsunterschiede (fbj - fej) quadrieren. Damit haben wir Beschreibungen der k

Häufigkeitsunterschiede, die sicher immer positiv sind.Nun normieren wir (fbj - fej)2 noch bezüglich fej. Dies bedeutet, dass gleich grosse Differenzen zwischen

beobachteten und erwarteten Häufigkeiten je nach erwarteter Häufigkeit verschieden gewichtet werden. Beikleiner erwarteter Häufigkeit wird der Differenz ein grösseres Gewicht gegeben als bei grosser erwarteterHäufigkeit.Damit haben wir die gesuchte Prüfgrösse gefunden, es ist das klassische

Chi-Quadrat:

Dabei bedeutet:

• fbj: beobachtete absolute Häufigkeit der Ausprägungskategorie j

• fej: theoretisch erwartete absolute Häufigkeit der Kategorie j

• k: Anzahl Ausprägungskategorien

Nachdem wir eine Prüfgrösse für den Vergleich ganzer Verteilungen gefunden haben, müssen einediesbezügliche Arbeitshypothese H0 und eine Alternativhypothese H1 formuliert werden.

Arbeitshypothese H0 : Die beiden Verteilungen unterscheiden sich nur zufällig.

Alternativhypothese H1 : Die beiden Verteilungen unterscheiden sich nicht zufällig.

Quiz zu den HypothesenEine mathematische Formulierung der Arbeits- und Alternativhypothese - wie z.B. H0: m1 = m2 [siehe aktuelle

Formel!] beim t-Test für unabhängige Stichproben - ist im Zusammenhang mit nichtparametrischen Verfahrennicht möglich. Überlegen wir kurz,warum dies so ist.Wählen Sie die korrekte Antwort.Im Zusammenhang mit nichtparametrischen / verteilungsfreien Verfahren können Arbeits- undAlternativhypothese nur verbal formuliert werden,

❍ weil wir die Verteilungsparameter in der Population nicht kennen

❍ weil wir die Verteilungskennwerte in den Stichproben noch nicht berechnet haben

Page 10: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 8

❍ weil für Verteilungen nominal und ordinal skalierter Daten keine Verteilungsparameter und -kennwerteangegeben werden können

❍ weil wir die Hypothesen in verbaler Form besser verstehen

Wie ist nun aber die Prüfgrösse

verteilt, wenn die Arbeitshypothese H0 gültig ist, d.h. wenn sich die beiden Verteilungen nur zufällig

unterscheiden?Die Statistiker verraten uns das Geheimnis.

Für den Vergleich einer beobachteten (empirischen) Verteilung mit einer Gleichverteilung giltfolgendes:Ist die theoretisch erwartete absolute Häufigkeit fej für keine Ausprägungskategorie kleiner als 5, so ist

die Prüfgrösse

mit dem Freiheitsgrad df (df = k -1)

-verteilt.

In unserem Einführungsbeispiel umfassen die beobachtete und die theoretisch erwartete Verteilung k =5 Ausprägungskategorien. Ist keine der erwarteten absoluten Häufigkeiten fej kleiner als 5, so ist die

Prüfverteilung eine

-Verteilung mit dem Freiheitsgrad df = 4.

Page 11: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 9

Damit haben wir das Grundkonzept aller univariaten (oder linearen)

-Verfahren kennengelernt und alles zusammengetragen, was wir für den Vergleich von zwei ganzenVerteilungen brauchen:

• Die Prüfgrösse

, die den konkreten Unterschied zwischen den zu vergleichenden Verteilungen beschreibt.

• Eine Arbeitshypothese H0 (Die beiden Verteilungen unterscheiden sich nur zufällig) und eine

Alternativhypothese H1 (Die beiden Verteilungen unterscheiden sich nicht zufällig).

• Die Prüfverteilung: Unter der Voraussetzung, dass kein fej kleiner ist als 5, wissen wir, wie die Prüfgrösse

bei Gültigkeit der Arbeitshypothese H0 verteilt ist.

• Als a-Fehler-Risiko, d.h. als Signifikanzniveau p, akzeptieren wir wie üblich 5%, 1% oder 0,1%.

2. Vergleich einer empirischen mit einer theoretischenVerteilungEine empirische (beobachtete) Verteilung kann anhand der Prüfgrösse

mit jeder beliebigen theoretischen Verteilung verglichen und auf signifikante Unterschiede geprüft werden.Dabei steht k für die Zahl der Ausprägungskategorien der zu vergleichenden Verteilungen, fbj für die

beobachtete und fej für die erwartete absolute Häufigkeit in der j'ten Ausprägungskategorie.

Unter der Voraussetzung, dass kein fej (j=1...k), d.h. keine der erwarteten absoluten Häufigkeiten, kleiner ist

als 5, ist die Prüfverteilung bekannt: Es ist eine

-Verteilung.Nun gibt es aber eine ganze Familie von

-Verteilungen; wir unterscheiden sie anhand des Freiheitsgrades df.Welche

-Verteilung im konkreten Fall als Prüfverteilung dient, ist abhängig von k, der Anzahl Ausprägungskategorien,und von der Art der theoretischen Verteilung, mit der verglichen werden soll.Auf die formale Herleitung des für jede theoretische Verteilung optimalen Freiheitsgrades df können wir hiernicht eingehen; eine Faustregel deckt uns aber die wichtigsten drei Fälle ab.

Page 12: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 10

Damit wir diese verstehen können, müssen wir kurz überlegen, was als erstes zu tun ist, wenn wir einebeobachtete (empirische) Verteilung mit einer theoretischen Verteilung vergleichen wollen.Die univariaten (linearen)

-Verfahren basieren auf dem Vergleich der beobachteten und der theoretisch erwarteten absoluten Häufigkeitender Ausprägungskategorien. Dies bedeutet, dass wir die theoretisch erwartete Verteilung für die Kategoriender empirischen Verteilung und die Anzahl der beobachteten Fälle definieren müssen. Auf der AnzahlAusprägungskategorien (k) und der Zahl der für die theoretische Verteilung notwendigen "Vorgaben" basiertdie Einschätzung des Freiheitsgrades der Prüfverteilung.Unter Anzahl "Vorgaben" soll die Zahl der Stichproben-Kenngrössen (z.B. Stichprobengrösse, Mittelwert etc.)verstanden werden, die zur Bestimmung der theoretischen Verteilung benötigt werden.

Schätzformel für df:df = k - (Anzahl "Vorgaben" für die theoretische Verteilung)

Einfaches Beispiel erwünscht?

Für die Verteilung eines nominal skalierten Merkmals mit 5 Ausprägungskategorien soll geprüftwerden, ob die Abweichungen von einer Gleichverteilung so gross sind, dass bei der Interpretation derUnterschiede der Zufall ausgeschlossen werden darf.Da die

-Verfahren auf dem Vergleich der beobachteten absoluten Häufigkeiten mit den theoretisch erwartetenabsoluten Häufigkeiten beruhen, muss in einem ersten Arbeitsschritt die theoretisch erwartete Verteilungermittelt werden.

Page 13: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 11

Das interessierende Merkmal umfasst 5 Ausprägungskategorien und wurde an 125 Probandinnen undProbanden erfasst. Damit hat auch die theoretische Gleichverteilung 5 Ausprägungskategorien und total125 Beobachtungen zu umfassen.Die Definition dieser theoretischen Verteilung fällt uns leicht. Da in einer Gleichverteilung alleAusprägungskategorien mit derselben absoluten Häufigkeit auftreten, müssen die 125 Beobachtungenauf 5 Ausprägungskategorien verteilt werden: In jeder Kategorie sind 25 Fälle zu erwarten.Zur Bestimmung einer Gleichverteilung gibt es also nur eine "Vorgabe": Die Anzahl der Beobachtungen.Der Freiheitsgrad der Prüfverteilung kann damit bestimmt werden:df = k - (Anzahl "Vorgaben" für die theoretische Verteilung) = 5 - 1 = 4

Betrachten wir die drei wichtigsten Fälle:

Page 14: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 12

Für diese drei Fälle ist der Freiheitsgrad der Prüfverteilung eindeutig festgelegt. In der Praxis kommen aber auchtheoretisch erwartete Verteilungen vor, bei denen bezüglich der Vorgaben ein Interpretationsspielraum besteht.In solchen Fällen wählen wir den höheren Freiheitsgrad und entscheiden bezüglich der Ablehnung unsererArbeitshypothese H0 konservativ. In anderen Worten: Bei Unsicherheit fordern wir zwischen der empirischen

und der theoretischen Verteilung einen etwas grösseren Unterschied, um die Arbeitshypothese zu verwerfen.Hinweis: Unter der Rubrik "Fallbeispiele" findet sich ein Beispiel zum Vergleich einer empirischen Verteilungmit einer Gleichverteilung.

3. Vergleich einer empirischen mit einer NormalverteilungSoll die beobachtete Verteilung eines intervall- oder proportinal skalierten Merkmals mit einerNormalverteilung verglichen werden, so ist auch dies anhand eines univariaten oder linearen

-Verfahrens möglich.Voraussetzung ist einzig, dass wir angeben können, welche absoluten Häufigkeiten in den einzelnenAusprägungskategorien theoretisch zu erwarten sind, wenn das Merkmal normalverteilt ist und seineAusprägungsgrade so kategorisiert werden, wie dies für die beobachteten Ausprägungsgrade gemacht wurde.

Page 15: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 13

Das Verfahren zur Ermittlung dieser theoretischen Verteilung ist formal sehr einfach, die numerischeRealisierung aber so aufwendig, dass derartige Vergleiche in der Regel mit einem Statistikprogramm (z.B.SPSS) durchgeführt werden.So wollen wir uns als erstes auf rein formaler Ebene das Grundprinzip derartiger Vergleiche ansehen und einkonkretes Beispiel dann gleich mit SPSS lösen.Zur Erläuterung des grundsätzlichen Vorgehens diene uns folgendes Beispiel:Ein intervall-skaliertes Merkmal wurde in 7 Ausprägungskategorien kategorisiert, als Daten liegen uns dieabsoluten Häufigkeiten vor, mit denen die 7 Ausprägungskategorien beobachtet wurden. Wir möchten nunprüfen, ob sich diese empirische Verteilung als Ganzes so stark von einer Normalverteilung unterscheidet, dassausgeschlossen werden kann, dass die Unterschiede zwischen den beiden Verteilungen nur zufällig zustandegekommen sind.Wollen wir die empirische Verteilung und die theoretisch erwartete Normalverteilung mit einem univariaten

-Verfahren vergleichen resp. auf einen signifikanten Unterschied prüfen, so brauchen wir Angaben über dietheoretisch erwartete Normalverteilung unseres Merkmals in den gegebenen Ausprägungskategorien.

Die theoretischen Häufigkeiten finden wir über das Modell aller Normalverteilungen, über die z-Verteilung,wie folgt:Als erstes transformieren wir die Kategoriengrenzen der beobachteten Verteilung in die z-Verteilung. Anhandeiner z-Tabelle können wir dann die Wahrscheinlichkeiten bestimmen, mit denen der Ausprägungsgradeines normalverteilten Merkmals in den einzelnen Ausprägungskategorien zu erwarten ist. DieseWahrscheinlichkeiten entsprechen - Sie erinnern sich - der Fläche unter der z-Funktion zwischen denKategoriengrenzen.

Page 16: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 14

Nun kennen wir die relativen Häufigkeiten, mit denen die einzelnen Ausprägungskategorien zu erwarten sind,wenn das Merkmal normalverteilt ist. Für ein lineares

-Verfahren brauchen wir aber die absoluten Häufigkeiten der theoretischen Verteilung. Diese bestimmen wireinfach als Produkt der relativen Häufigkeiten der einzelnen Ausprägungskategorien und der Gesamtzahl derbeobachteten Fälle n.

Page 17: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 15

Nun liegt eine empirische und eine theoretisch erwartete Verteilung vor, wir können sie anhand eines linearenChi-Quadrat-Verfahrens vergleichen. Dazu erinnern wir uns an folgendes:

• Keine der theoretisch erwarteten absoluten Häufigkeiten darf kleiner sein als 5. Ist dies derFall, so müssen, falls dies aus inhaltlicher Sicht vertretbar ist, benachbarte Ausprägungskategorienzusammengelegt werden. Ein numerisches Beispiel dazu kennen Sie aus der Vorbereitungslektüre.

• Der Freiheitsgrad df der Prüfverteilung ist df = k - 3. Für die theoretische Verteilung gibt es nämlich3 Vorgaben: Die Zahl der Fälle, den Mittelwert und die Standardabweichung. In unserem konkretenBeispiel umfasst das Merkmal k = 7 Ausprägungskategorien. Prüfverteilung ist also eine

-Verteilung mit dem Freiheitsgrad df = 7 - 3 = 4.

Ein 'manueller' Vergleich der beiden Verteilungen mit einem linearen

-Verfahren ist nun möglich, rechentechnisch aber so aufwendig, dass wir in der Praxis ein Statistikprogramm(z.B. SPSS) einsetzen. Diese Programme realisieren den gewünschten Vergleich aber meist nicht über ein

Page 18: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 16

-Verfahren, sondern anhand verwandter Tests, die andere Prüfgrössen und andere Prüfverteilungen benutzen.Eines der wichtigsten dieser Verfahren ist der Test nach Kolmogorov-Smirnov. Unter der Rubrik"Fallbeispiele" finden Sie ein konkretes, mit SPSS gelöstes Beispiel.

4. Vergleich von zwei empirischen VerteilungenEin lineares

-Verfahren kann uns auch dienlich sein, um zwei empirische Verteilungen als Ganzes zu vergleichen. Da dabeinur die Unterschiede in den Häufigkeiten der Ausprägungskategorien ausgewertet werden, ist dies auf allenSkalenniveaus möglich.Zwei spezielle Sachverhalte, die sich aus der Definition der Prüfgrösse ergeben, müssen beim Vergleich zweierempirischer Verteilungen aber berücksichtigt werden. Wir wollen sie uns im Detail ansehen.Sie erinnern sich, die Prüfgrösse

ist wie folgt definiert:

Im Zähler der Summanden stehen die quadrierten Abweichungen zwischen den beobachteten und den

erwarteten absoluten Häufigkeiten (fbj - fej)2, im Nenner die erwartete absolute Häufigkeit fej. Diese Division

durch fej normiert die im Zähler stehenden quadrierten Abweichungen so, dass grosse Abweichungen von der

theoretisch erwarteten Verteilung stärker gewichtet werden als kleine Abweichungen.Inhaltlich bedeutet dies, dass die beobachtete Verteilung bezüglich der theoretisch erwarteten Verteilungbeurteilt wird. Dies ergibt keine Probleme, solange tatsächlich eine empirische mit einer theoretisch erwartetenVerteilung verglichen wird.Liegen nun aber zwei empirische, d.h. beobachtete Verteilungen vor, so muss entschieden werden, welche derVerteilungen zur Normierung herangezogen werden soll. In anderen Worten:

Es muss entschieden werden, welche der Verteilungen als die 'theoretisch erwartete Verteilung' geltensoll.

Diese Entscheidung, die nur nach inhaltlichen Gesichtspunkten getroffen werden kann, ist bedeutungsvoll.Von ihr hängt der Ausprägungsgrad der Prüfgrösse und damit auch das Ergebnis des Vergleichs der beidenVerteilungen ab.Der zweite Punkt, der zu beachten ist, betrifft die Tatsache, dass sich die Prüfgrösse

Page 19: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 17

auf die absoluten Häufigkeiten abstützt. Dies erfordert, dass die beiden zu vergleichenden Verteilungen einegleiche Anzahl von Beobachtungen umfassen müssen.Nun kommt es aber häufig vor, dass die beiden Stichproben, in denen das interessierende Merkmal erhobenwurde, nicht gleich gross sind, womit die beiden zu vergleichenden Verteilungen eine unterschiedliche Anzahlvon Beobachtungen beinhalten.

Wir lösen dieses Problem über die folgenden Arbeitsschritte

Wir bestimmen für die gewählte 'theoretisch erwartete Verteilung' die relativen Häufigkeiten.Multiplizieren wir diese relativen Häufigkeiten mit der Stichprobengrösse der anderen Stichprobe, soerhalten wir die 'theoretisch erwarteten absoluten Häufigkeiten' für den Fall, dass die beiden Stichprobengleich gross sind. Jetzt ist ein Vergleich mit einem linearen

möglich.

Ein einfaches, mit SPSS gelöstes Beispiel findet sich unter der Rubrik "Fallbeispiele".

Fallbeispiel (1-3)

• 1. Vergleich einer empirischen Verteilung mit einer Gleichverteilung

Page 20: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 18

• 2. Vergleich einer empirischen Verteilung mit einer Normalverteilung

• 3. Vergleich von zwei empirischen Verteilungen

1. Vergleich einer empirischen Verteilung mit einerGleichverteilung

Fallbeispiel 1: Ist Precilla Cornflakes wirklich eine Falschspielerin?Wir erinnern uns an unsere Einführungsgeschichte. Auf dem Küchentisch von O'Neel liegen zweiHäufigkeitsverteilungen. Die eine zeigt die Häufigkeiten, mit denen die Würfelbilder von Precillas Würfel in120 Würfen aufgetreten sind. Die andere zeigt die von Pastor Detlev theoretisch erwartete Verteilung dieserHäufigkeiten für einen idealen, nicht präparierten Würfel.

Page 21: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 19

O'Neel und seine Frau Emme stehen vor der Frage, ob sich diese recht unterschiedlichen Verteilungen so starkunterscheiden, dass bei der Erklärung dieses Unterschiedes der Zufall ausgeschlossen werden kann. Wäre diesder Fall, so wäre Precillas Würfel präpariert und Precilla müsste als Falschspielerin ins Kittchen.Mit unserem Wissen um die

-Verfahren können wir O'Neel und Emme bei der Beantwortung dieser Frage behilflich sein. Es geht um denVergleich einer empirischen Verteilung mit einer Gleichverteilung.Wir lösen das Problem über die üblichen Arbeitsschritte:

• Prüfung der Voraussetzungen und Wahl des Prüfverfahrens:Es gibt nur ein interessierendes Merkmal: Die Würfelbilder. Dieses Merkmal hat 6Ausprägungskategorien und ist nominal skaliert. Zudem sollen zwei Verteilungen gesamthaft verglichenund auf einen signifikanten Unterschied geprüft werden: Wir wählen ein univariates

-Verfahren.

• Formulierung der Arbeitshypothese H0 und der Alternativhypothese H1:

H0: Die beiden Verteilungen unterscheiden sich nur zufällig.

H1: Die beiden Verteilungen unterscheiden sich nicht nur zufällig.

Ermittlung des Ausprägungsgrades der Prüfgrösse (mittels einer Tabelle)

AusprägungdesMerkmals

fbj fej (fbj-fej)

König 19 20 1 1/20

Dame 11 20 9 81/20

Bube 18 20 2 4/20

10 31 20 11 121/20

9 19 20 1 1/20

As 22 20 2 4/20

• Ermittlung der Prüfverteilung:Da wir unsere empirische Verteilung mit einer Gleichverteilung vergleichen, bestimmt sich der Typ der

Page 22: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 20

-Verteilung, d.h. der Freiheitsgrad df wie folgt: df = k - 1 = 6 - 1 = 5

• Ermittlung der Überschreitungswahrscheinlichkeit:Die Prüfgrösse

hat im gegebenen Fall einen Ausprägungsgrad von 10,6. Bestimmen Sie dieÜberschreitungswahrscheinlichkeit dieses Ausprägungsgrades anhand der passenden Tabelle.

1. Die Übertretungswahrscheinlichkeit ist

❍ >5%

❍ <5%

❍ <1%

❍ <0.1%

2. Die Arbeitshypothese kann damit

❍ angenommen werden

❍ verworfen werden

Lösung

Bei einer Überschreitungswahrscheinlichkeit >5% kann bei der Interpretation der Unterschiedezwischen den beiden Verteilungen der Zufall nicht ausgeschlossen werden.Sheriff O'Neel und Emme sind erleichtert. Für Emme ist klar, dass Precilla Cornflakes, die ehrenwerteKollegin aus dem Bingo-Club, keine Falschspielerin ist. O'Neel ist sich da immer noch nicht so sicher,aber er ist glücklich, dass er die wehrhafte Precilla nicht einsperren muss.

Datenauswertung mit SPSSAbschliessend wollen wir uns ansehen, wie ein mit SPSS realisierter Vergleich der beiden Verteilungenaussieht. Zu diesem Zweck speichern wir die Resultate der 120 Würfelexperimente von O'Neel alsAusprägungen der Variablen beobacht in einem Datenfile mit dem Namen 'precilla.sav' und geben diefolgenden SPSS-Befehle ein:GET FILE 'X:\\SPSS-DAT\\precilla.sav'.VALUE LABELS beobacht 1 'König' 2 'Dame' 3 'Bube' 4 '10' 5 '9' 6 'As'.NPAR TESTS /CHISQUARE = beobacht /EXPECTED = 20 20 20 20 20 20.Wir lesen das Datenfile 'precilla.sav' und verlangen einen univariaten (linearen)

-Test, wobei wir als Vergleichs-Verteilung eine Gleichverteilung definieren (EXPECTED = 20 20 20 20 20 20).

Page 23: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 21

SPSS Output zeigen

Der SPSS-Ausgabe entnehmen wir für die Prüfgrösse denselben Ausprägungsgrad, wie wir ihn in dermanuellen Auswertung bestimmt haben. Seine Überschreitungswahrscheinlichkeit liegt bei 6%. DieArbeitshypothese H0 kann nicht verworfen werden, Precilla muss also nicht ins Kittchen.

2. Vergleich einer empirischen Verteilung mit einerNormalverteilung

Sind die in einer Stichprobe erzielten Testresultate näherungsweise normalverteilt?Im Rahmen einer Testentwicklung wurde eine Aufgabenserie entworfen, mit der die Fähigkeit zur adäquatenBeurteilung sozialer Situationen eingeschätzt werden soll. In einem ersten Versuch wurde die Aufgabenserieeiner Stichprobe von Probandinnen und Probanden vorgelegt, von der angenommen werden darf, dasssie für die Population der 20- bis 21-jährigen deutschsprachigen Mitteleuropäerinnen und Mitteleuropäer

Page 24: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 22

einigermassen repräsentativ ist. Die Testresultate der Versuchspersonen, d.h. die Anzahl der als korrektbeurteilten Antworten, wurden als Ausprägungsgrade der Variablen atest1 in einem Datenfile mit dem Namensoz-kom.sav für eine Auswertung mit SPSS gespeichert.Die Testentwicker möchten die Daten dieses ersten Versuches bezüglich ihrer Verteilung analysieren. Konkretmöchten sie wissen, ob angenommen werden darf, dass die von den Versuchspersonen erzielten Resultatenäherungsweise normalverteilt sind. Sie bearbeiten diese Fragestellung über die üblichen Arbeitsschritte.

• Prüfung der Voraussetzungen und Wahl des Prüfverfahrens:Das interessierende Merkmal ist die Zahl der richtig gelösten Aufgaben; dieses Merkmal ist proportionalskaliert. Es soll eine empirische Verteilung mit einer Normalverteilung verglichen werden, wobei diekonkrete Fragestellung lautet: Darf angenommen werden, dass die empirische Verteilung der Daten nurzufällig von einer Normalverteilung abweicht?Wir wissen, dass diese Frage manuell mit einem linearen

-Verfahren, etwas schneller aber mit Hilfe von SPSS und dem Kolmogorov-Smirnov-Test angegangenwerden kann

• Arbeitshypothese H0 : Die empirische Verteilung unterscheidet sich von einer Normalverteilung nur

zufällig.Alternativhypothese H1 : Die empirische Verteilung unterscheidet sich nicht nur zufällig von einer

Normalverteilung.

• Datenanalyse mit Hilfe von SPSS und dem Kolmogorov-Smirnov-Test:Wir lesen unser Datenfile 'soz-kom.sav' ein, verlangen eine graphische Darstellung der empirischenHäufigkeitsverteilung und vergleichen diese anhand des Kolmogorov-Smirnov-Tests mit einerNormalverteilung. Hierfür wählen wir die folgenden SPSS-Befehle:GET FILE 'X:\\SPSS-DAT\\soz.kom.sav'.FREQUENCIES VARIABLES = atest1 /FORMAT NOTABLE /HISTOGRAMM NORMAL.NPAR TEST /K-S (NORMAL) atest1.

Page 25: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 23

SPSS output

• Interpretation der Ergebnisse:Die SPSS-Ausgabe zeigt uns als erstes die Häufigkeitsverteilung des Merkmals 'Anzahl korrekterAntworten' für die untersuchte Stichprobe von 35 Versuchspersonen. Für den optischen Vergleich derempirischen Verteilung mit einer Normalverteilung haben wir die Normalverteilung ins Histogrammeintragen lassen.Als zweites nennt uns SPSS die Kennwerte des Tests nach Kolmogorov-Smirnov, wobei für unsdie zweiseitige Überschreitungswahrscheinlichkeit [Asymp. Sig. (2-tailed)] der Prüfgrösse nachKolmogorov-Smirnov von Bedeutung ist. Diese beträgt 30,4%. Unter Annahme der Gültigkeit derArbeitshypothese H0 wird der Ausprägungsgrad der Prüfgrösse also in 30,4% der Fälle zufällig erreicht

oder überschritten.

Page 26: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 24

Da unsere Frage die Annahme der Arbeitshypothese betrifft, beurteilen wir dieseÜberschreitungswahrscheinlichkeit am 25% -Signifikanzniveau. Da wir mit 30,4% über dem 25%-Niveau liegen, nehmen wir die Arbeitshypothese an und kommen zum Schluss, dass es nichtauszuschliessen ist, dass unsere empirische Verteilung nur zufällig von einer Normalverteilung abweicht.Eine Irrtumswahrscheinlichkeit kann in diesem Fall nicht angegeben werden.In der Praxis geht man in dieser Situation davon aus, dass die Stichprobe aus einer Population stammt,in der das interessierende Merkmal normalverteilt ist.

3. Vergleich von zwei empirischen Verteilungen

Unterscheiden sich Gymnasiastinnen und Gymnasiasten bezüglich ihrer Studieninteressen?In den Abschlussklassen eines Gymnasiums wurden die generellen Studieninteresse erhoben. DieMaturandinnen und Maturanden hatten dabei anzugeben, an welcher Fakultät sie planten, ihr Studiumaufzunehmen.Da sich das Rektorat des Gymnasiums für geschlechtsspezifische Studien-Präferenzen interessiert, liess derzuständige Prorektor die Studienwünsche der Frauen und der Männer separat auszählen. Dabei ergaben sichdie folgenden Verteilungen:

Zahl der Männer Zahl der Frauen

Philosophische Fakultät 22 28

Sozialwissenschaftliche Fakultät 36 25

Naturwissenschaftliche Fakultät 31 20

Medizinische Fakultät 20 21

WirtschaftswissenschaftlicheFakultät

42 28

Rechtswissenschaftliche Fakultät 17 9

Total Wahlen 168 131

Die Verteilungen der Studienwünsche der Frauen und der Männer sollen bezüglich eines signifikantenUnterschieds verglichen werden. Dabei gehen wir wie üblich vor:

• Prüfung der Voraussetzungen und Wahl des Prüfverfahrens:Das bei den Gymnasiastinnen und Gymnasiasten erhobene Merkmal ist der 'Studienwunsch'; diesesMerkmal ist nominal skaliert. Für den Vergleich der Verteilungen dieses Merkmals in der Stichprobe derMänner und der Stichprobe der Frauen kommt nur ein nichtparametrisches Verfahren in Frage, konkretein lineares Chi-Quadrat-Verfahren für unabhängige Stichproben. Die einzige formelle Voraussetzung,dass keine der absoluten Häufigkeiten kleiner sei als 5, ist im Rahmen dieses Beispiels erfüllt.

• Arbeitshypothese H0 :

Die beiden Verteilungen unterscheiden sich als Ganzes nur zufällig.Alternativhypothese H1 :

Die beiden Verteilungen unterscheiden sich nicht zufällig.

Page 27: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 25

• Als erstes muss entschieden werden, welche der beiden Verteilungen als die 'theoretisch erwarteteVerteilung' gelten soll. Da im Rahmen unseres Beispiels nichts für die eine oder andere Lösung spricht,wählen wir die Verteilung in der Stichprobe der Maturandinnen als 'theoretisch erwartete Verteilung'.Dies zeigt sich im SPSS-Befehlssatz dadurch, dass wir die Verteilung der Studienwünsche derMaturandinnen unter EXPCTED eingeben. Die Umrechnung in die 'theoretisch erwartete Verteilung'bei gleichen Stichprobengrössen übernimmt SPSS.DATA LIST /fak 1 freq 3-4.WEIGHT BY freq.VALUE LABELS fak 1 'Philosophische Fak'2 'Sozialwissenschaftliche Fak'3 'Naturwissenschaftliche Fak'4 'Medizinische Fak'5 'Wirtschaftswissenschaftliche Fak'6 'Rechtswissenschaftliche Fak' .BEGIN DATA1 222 363 314 205 426 17END DATA.NPAR TESTS /CHISQUARE = fak /EXPECTED = 28 25 20 21 28 9.

Page 28: Chi-Quadrat-Verfahren (ohne Messwiederholung)mesosworld.ch/lerninhalte/NParamN_Chi/de/text/NParamN_Chi.pdf · Chi-Quadrat-Verfahren (ohne Messwiederholung) - Stand vom: 20.1.2010

Chi-Quadrat-Verfahren (ohne Messwiederholung)

http://mesosworld.ch - Stand vom: 20.1.2010 26

SPSS output

• Interpretation der Ergebnisse:Die SPSS-Ausgabe zeigt uns als erstes die Häufigkeitsverteilung des Merkmals 'Studienwünsche' fürdie Stichprobe der Maturanden (observed) und die auf die gleiche Stichprobengrösse transformierte'theoretisch erwartete Verteilung' der Maturandinnen (expected).Anschliessend wird der Ausprägungsgrad der Prüfgrösse (Chi-Square) und dessen zweiseitigeÜberschreitungswahrscheinlichkeit ausgegeben. Da dieser kleiner ist als 5%, lehnen wir unsereArbeitshypothese H0 zu Gunsten von H1 ab.

Inhaltlich bedeutet dies, dass bezüglich der Studienwünsche in den Abschlussklassen diesesGymnasiums ein geschlechtsspezifischer Unterschied nachgewiesen werden kann.