72
Statistik mit Excel

Statistik mit Excel - uni-goettingen.de · Überblick 1.Zusammenhänge in Vierfelder-tabellen mit Excel, Phi 2.Zusammenhänge in Mehrfelder-tabellen mit Excel, Cramers‘ V 3.Chiquadrat-

  • Upload
    vandan

  • View
    233

  • Download
    0

Embed Size (px)

Citation preview

Statistik mit Excel

Überblick

1. Zusammenhänge in Vierfelder-tabellen mit Excel, Phi

2. Zusammenhänge in Mehrfelder-tabellen mit Excel, Cramers‘ V

3. Chiquadrat- Test auf statistische Unabhängigkeit

2. Zusammenhänge in Vierfeldertabellen mit

Excel, Phi

Phi ist ein symmetrisches Zusammenhangsmaß für eine Vier-Feldertablle.

Für die Berechnung von Phi gibt es in Excel zwei Möglichkeiten:

1. Berechnungsformel2. Funktion: Korrel

1. Berechnungsformel für Phi

Zuerst mit dem Pivot-Assistenten die Tabelle umwandeln (Anzahl/Standard statt Spaltenprozente).

2. Funktion Korrel

2. Zusammenhänge in Mehrfeldertabellen:

Cramers‘V

Cramers‘V ist ein symmetrisches Zusammenhangsmaß für nominale Daten.

Berechnungsformel für Cramer‘s V

1. Chiquadrat- Test auf statistische

Unabhängigkeit

Der Chi²- Test testet die Nullhypothese bei nominalskalierten Daten. Die Teststatistik Pearson Chiquadrat: Summe der quadrierten Abweichungen zwischen den beobachteten und erwarteten Häufigkeiten dividiert durch die erwarteten Häufigkeiten

1. Schritt: Erstellen der bivariaten Häufigkeitstabelle mit den beob-achteten Werten (Kontingenztab-elle) und einer Häufigkeitstabelle mit den theoretisch erwarteten Werten (Assoziationstabelle).

Wenn die bei Unabhängigkeit zu erwartenden Werte mit den beobachteten Werten übereinstimmen, dann kann die Hypothese der Unabhängigkeit als bestätigt angesehen werden.

2. Schritt: Nun müssen die Abweichungen zwischen den beobachteten und erwarteten Werten quadriert, durch die erwarteten Werte geteilt und anschliessend aufsummiert werden.

Dann mit dem schwarzem Kreuz in der rechten unteren Ecke die Berechnung für die anderen Zellen kopieren.

Bei einer Irrtumswahrscheinlichkeit von 5% ist die Nullhypothese abzulehnen, wenn die Teststatistik größer ist als das (1-alpha)- Quantil der Chiquadratverteilung mit df=4(5 Zeilen-1) * (2 Spalten –1)= 4Da 13,98 > 9,488 (s. Tabelle: Quantile der Chiquadratverteil-ung) ist die Nullhypothese zu verwerfen, d.h. es gibt einen signifikanten Zusammenhang zwischen Wahlabsicht und Geschlecht.

CHITEST liefert die Wahrscheinlichkeit für eine Chi-Quadrat-Verteilung mit df = (r - 1)(c - 1) Freiheitsgraden. Der Wert von 0,007. Dieser Wert ist kleiner als das vorgegebene Signifikanzniveau (5% Irrtumswahrscheinlich-keit= 0,05). D.h. die Nullhypothese, dass kein Zusammenhang zwischen Wahlabsicht und Geschlecht besteht, kann verworfen werden.

Die Datenbereiche markieren, inklusive Spaltenüberschriften (Variablennamen), danach auf „Weiter“.

Interpretation: 52, 23% der Männer, aber nur 47,2% der Frauen geben an, schon mal eine Sünde begangen zu haben.

Interpretation: Zwischen Geschlecht und dem „Begehen einerSünde“ besteht ein schwacher Zusammenhang (dyx%=5.03)

3. Konfidenzintervalle für Prozentsatzdifferenzen

Schätzung des 95%-Konfidenzintervalls

Zunächst müssen wir die Kreuztabelle umwandeln.Statt der Prozentwerte brauchen wir für die Berechnung des KI die gemeinsame Häufigkeitsverteilung der beiden Variablen.

Konfidenzintervallberechnung:

+

Interpretation: das Intervall von 1,3 bis 8,76 enthält mit einer Wahrscheinlichkeit von 95% den Wert der Prozentsatzdifferenz.

Beispiel 2:

Kreuztabelle mit den Variablen „Erhebungsgebiet“ (ost/west) und „Glaube an die Hölle“