Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Formelsammlung
Seite 1
Formelsammlung
Grundbegriffe der Wahrscheinlichkeitsrechnung
Theoretische Wahrscheinlichkeit
Empirische Wahrscheinlichkeit
(Relative Häufigkeit)
Ereignissemöglicher Anzahl
Ereignissegünstiger Anzahl=p(A)
n
f(A)=p(A)
f(A) = Häufigkeit des Ereignisses A
n = Anzahl aller Ereignisse
Deskriptive Statistik
Skalenniveaus
Nominalskala
Rangskala (Ordinal-)
Intervallskala
Verhältnisskala
= ;
= ; ; > ; <
= ; ; > ; < ; + ;
= ; ; > ; < ; + ; ; · ; /
Zulässige Transformationen:
- jede, die Gleichheit und
Unterschiedlichkeit erhält
- positive streng monotone
Transformationen
- positive lineare Transformationen der
Form y = a · x + b mit m > 0
- positive Ähnlichkeitstransformationen
der Form y = m · x mit m > 0
Prozentwert und Prozentrang
Prozentwert
Prozentrang
100%n
f=% k
k
100%n
(k)f=PR kum
fk = Häufigkeit in der Kategorie k
%k = Prozentwert in der Kategorie k
n = Anzahl Beobachtungen
fkum(k) = Kumulierte Häufigkeit
%kum(k) = Kumulierter Prozentwert
Maße der zentralen Tendenz
Modalwert (Modus)
Median
Wert, der am häufigsten besetzt ist
Wert, der eine Verteilung halbiert
Varianzanalyse
Seite 2
Arithmetisches Mittel
Gewogenes AM
Mittelwert nach einer linearen
Transformation y = a · x + b
n
x
x
n
1i
i
p
1k
k
p
1k
kk
n
xn
x
bxay
n = Anzahl der Vpn
xi = Messwert
i = Index der Versuchspersonen
x = Mittelwert der Mittelwerte
p = Anzahl der Mittelwerte
nk = Anzahl der Vpn in Gruppe k
y = transformierter Mittelwert
Dispersionsmaße
Varianz
(als Populationsschätzer)
1n
)xx(
ˆ
n
1i
2i
2x
n = Anzahl der Vpn
xi = Messwert
i = Messwertindex
Standardabweichung
(als Populationsschätzer)
Varianz nach einer linearen
Transformation y = a · x + b
2xx
ˆ = ˆ
2x
22y
ˆaˆ
2x = zu transformierende Varianz
z-Standardisierung (z-Wert)
i
x
xz
μ = Populationsmittelwert
σ = Streuung
Inferenzstatistik
Standardfehler des Mittelwertes
)1n(n
)xx(
n
ˆˆ
n
1i
2i2
xx
2x = Varianz der Variable x
xi = Wert der Person i auf Variable x
x = Mittelwert der Variable x
n = Stichprobenumfang
Formelsammlung
Seite 3
Regression und Korrelation
Kovarianz
empirische Kovarianz
maximale Kovarianz
1n
yyxx
)y,xcov(
n
1i
ii
yxmax
ˆˆcov
xi = Wert der Person i auf Variable x
zi = Wert der Person i auf Variable y
x = Mittelwert der Variable x
y = Mittelwert der Variable y
n = Stichprobenumfang
Produkt-Moment-Korrelation
ˆˆ
y)cov(x,=r
yx
xy
rxy = Korrelation nullter Ordnung der
beiden interessierenden Merkmale
Partialkorrelation
)r1()r1(
rrrr
2xz
2yz
xzyzxy
zxy
rxy|z = Partialkorrelation der beiden
interessierenden Merkmale
rxz; ryz = Korrelation von x und y mit der
Drittvariable z
Fisher Z -Transformation
r1
r1ln
2
1Z
1e
1er
Z2
Z2
Z = Z-transformierte Korrelation
ln = natürlicher Logarithmus
r = Korrelationskoeffizient
e ≈ 2,7183 (Eulersche Zahl)
Punktbiseriale Korrelation
2
10
y
01pb
N
nn
ˆ
yyr
y = intervallskalierte Variable
x = dichotome Variable (x = 0; x =1)
0y = Mittelwert von y bei x = 0
y1 = Mittelwert von y bei x = 1
yσ = Streuung der y-Variable
n0 = Anzahl Beobachtungen bei x = 0
n1 = Anzahl Beobachtungen bei x = 1
N = n0 + n1
Rangkorrelation
)1n(n
d6
1r2
n
1i
2i
s
di = Differenz der laufenden Nr. der
Untersuchungseinheit i auf einem
Rangplatz
n = Anzahl der Rangplätze
Varianzanalyse
Seite 4
Lineare Regression
Vorhersage von y durch x
Vorhersage von x durch y
yxiyxi a+xb=y
xyixyi a+yb=x
iy = vorhergesagte Werte
b = Regressionsgewicht
a = additive Konstante
Regressionsgewicht
(Steigung der Gerade)
2x
yxˆ
y)cov(x,=b
bzw. 2y
xyˆ
y)cov(x,=b
cov(x,y) = Kovarianz von x und y
x = Streuung der Variable x
y = Streuung der Variable y
Höhenlage:
(Schnittpunkt mit y bei x = 0)
a y b xyx yx
bzw. a x b yxy xy
t-Test für Korrelationen
t-Wert
2
df
r1
2Nrt
r = Korrelationskoeffizient
n = Anzahl der Versuchspersonen
df = N - 2
Effektstärken
yxmax
emp
xyˆˆ
)y,xcov(
cov
covr
Konventionen nach Cohen (1988):
kleiner Effekt: r = 0,1
mittlerer Effekt: r = 0,3
großer Effekt: r = 0,5
t-Test für unabhängige Stichproben
t-Wert
Empirischer t-Wert unter H0
Standardfehler der
Mittelwertsdifferenz
tx x
df
x x
1 2
1 2
2
22
1
21
xxn
ˆ
n
ˆˆ
21
1x = Mittelwert der 1. Gruppe
2x = Mittelwert der 2. Gruppe
df = n1 + n2 2
21 = geschätzte Populationsvarianz
der 1. Gruppe 22 = geschätzte Populationsvarianz
der 2. Gruppe
Formelsammlung
Seite 5
Theoretische Effektstärkenmaße
x
21d
2x
2sys2
2x
2sys
2sys
2Gesamt
2sys2
μ1, μ2 = Mittelwerte der Populationen,
aus denen die Mittelwerte
gezogen werden
x = Streuung der Population
innerhalb einer Bedingung
Konventionen nach Cohen (1988):
kleiner Effekt: d = 0,2
mittlerer Effekt: d = 0,5
großer Effekt: d = 0,8
22
21
22
21
²1
²22
Konventionen nach Cohen (1988):
kleiner Effekt: Ω2 = 0,01
mittlerer Effekt: Ω2 = 0,06
großer Effekt: Ω2 = 0,14
Empirische Effektstärkenmaße (Schätzungen für die Population)
2
ˆˆ
xx
ˆ
xxd
2x
2x
21
x
21
21
21 x,x = Mittelwerte der Gruppen
x = geschätzte Populationsstreuung
2x1
= geschätzte Varianz der Gruppe 1
2x2
= geschätzte Varianz der Gruppe 2
N
1tf
22
2
22
f + 1
fˆ
2
22
- 1ˆf
²1
²2f2d
t = empirischer t-Wert
N = n1 + n2
Empirische Effektstärkenmaße (auf Stichprobenebene)
df
t
QS
QSf
2
x
sys2S
2S
2S
Gesamt
sys2
f1
f
QS
QS
fS2 = Effekt auf Stichprobenebene
η2 = Eta-Quadrat, Effekt auf Stich-
probenebene
Varianzanalyse
Seite 6
Teststärkebestimmung
(a posteriori)
N
1
N
2
2
2
= Nonzentralitätsparameter
² = theoretischer Effekt
Stichprobenumfangsplanung
(a priori)
2
2
1;
2
1;
1
N
= Nonzentralitätsparameter
(ermittelt bei gegebenem und
aus den TPF-Tabellen)
N = Anzahl Versuchspersonen
t-Test für abhängige Stichproben
t-Wert
Empirischer t-Wert unter H0
Standardfehler des Mittelwerts
der Differenzen
dx
ddf
ˆ
xt
N
ˆˆ d
xd
N
d
x
N
1i
i
d
1N
)xd(
ˆ
N
1i
2di
d
df = N 1
N = Anzahl Versuchspersonen
xi1 = Wert der Person i in Bed. 1
xi2 = Wert der Person i in Bed. 2
di = xi1 xi2 (Differenzwert)
Empirische Effektstärkenmaße
d
d
Zˆ
xd
df
t
QS
QSf
2
x
sys2)abhängig(S
2S
2S
xsys
sys2p
f1
f
QSQS
QS
dx = Mittelwert der Differenzen
d = Streuung der Differenzen
fS2 = Effekt auf Stichprobenebene
ηp2 = partielles Eta-Quadrat, Effekt auf
Stichprobenebene
Teststärkebestimmung (auf Basis der Konventionen für
unabhängige Stichproben)
N1r1
2N
r1
22
22unabhängig
r = Korrelation zwischen den
Messwertreihen
Formelsammlung
Seite 7
Teststärkebestimmung
(für empirische Effekte)
Nf 2)abhängig(S
= Nonzentralitätsparameter
Stichprobenumfangsplanung (anhand der Konventionen für
unabhängige Stichproben)
2
)r1(N
2unabhängig
1;
r = Korrelation zwischen den
Messwertreihen
Stichprobenumfangsplanung (bei vorhandener Effektgröße aus
Literatur oder anderen Studien)
2abhängig
1;
fN
f2
abhängig = aus der Literatur oder
eigenen Studien abgeleitete
anzunehmende Effektstärke
Varianzanalyse ohne Messwiederholung
Einfaktorielle Varianzanalyse
(ohne Messwiederholung)
Quadratsummen
Freiheitsgrade
p
1i
2
izwischen GAnQS
p
1i
n
1m
2
imiinnerhalb AxQS
1pdfzwischen
)1n(pdfinnerhalb
p = Anzahl Faktorstufen
n = Anzahl Vpn pro Faktorstufe
iA = Mittelwert aus Faktorstufe i
G = Gesamtmittelwert
Stichprobenkennwerte
innerhalb
innerhalb2
innerhalb
zwischen
zwischen2
zwischen
df
QSˆ
df
QSˆ
Empirischer F-Wert
2innerhalb
2zwischen
df,dfˆ
ˆF
NennerZähler
dfZähler = dfzwischen
dfNenner = dfinnerhalb
Varianzanalyse
Seite 8
Zweifaktorielle Varianzanalyse (ohne Messwiederholung)
Quadratsummen
Freiheitsgrade
p
1i
q
1j
n
1m
2
ijmijsRe
p
1i
q
1j
2
jiijAxB
q
1j
2
jB
p
1i
2
iA
ABxQS
GBAABnQS
GBpnQS
GAqnQS
dfA = p 1
dfB = q 1
dfAB = (p 1) · (q 1)
dfRes = p · q · (n 1)
p = Anzahl Faktorstufen Faktor A
q = Anzahl Faktorstufen Faktor B
n = Anzahl Vpn in der Zelle ABij
iA = Mittelwert der Faktorstufe Ai
iB = Mittelwert der Faktorstufe Bj
ijAB = Zellmittelwert
G = Gesamtmittelwert
Stichprobenkennwerte
sRe
sRe2
sRe
AxB
AxB2
AxB
B
B2
B
A
A2
A
df
QSˆ
df
QSˆ
df
QSˆ
df
QSˆ
Empirische F-Werte
Haupteffekt A
Haupteffekt B
Wechselwirkung AB
2sRe
2A
df,dfˆ
ˆF
sReA
2sRe
2B
df,dfˆ
ˆF
sReB
2sRe
2AxB
df,dfˆ
ˆF
sReAxB
Formelsammlung
Seite 9
Empirische Effektstärkenmaße
Umrechnung f 2 2
Umrechnung 2 2 f
N
1Fdff
empZähler2
22
21
f
f
f 22
21
dfZähler = Freiheitsgrade des Zählers
des F-Bruchs
dfNenner = Freiheitsgrade des Nenners
des F-Bruchs
N = p ·q · n = Stichprobengröße
Teststärkebestimmung
(a posteriori)
Definition und Umrechnung der
Effektstärkenmaße
N2
2
2
2x
2sys
2sys2
p1
2
2
2x
2sys2
1
= Nonzentralitätsparameter
Konventionen nach Cohen (1988):
kleiner Effekt: Ω2 = 0,01
mittlerer Effekt Ω2 = 0,06
großer Effekt Ω2 = 0,14
Stichprobenumfangsplanung
(a priori)
2
α)β;;1(df
Φ
λN Zähler
= Nonzentralitätsparameter
(ermittelt bei gegebenem , ,
und dfZähler aus TPF-Tabellen)
Bei gleicher Vpn-Anzahl in Zellen
(unabhängige Stichproben):
N = p · n
Tukey HSD-Test
einfaktorielle ANOVA
zweifaktorielle ANOVA
Haupteffekt A
Haupteffekt B
Wechselwirkung
HSD
2sRe
)df,r,(kritn
ˆqHSD
sRe
nHSD = n
nHSD = q · n
nHSD = p · n
nHSD = n
HSD = kritische Differenz eines
Paarvergleichs
qkrit = krit. Wert aus der q-Tabelle
= kumuliertes Signifikanzniveau
für alle Paarvergleiche
r = Anzahl der Mittelwerte
nHSD = Anzahl der Vpn, aus denen die
verglichenen Mittelwerte
gebildet werden
n = Anzahl der Vpn pro Zelle
p = Stufenanzahl Faktor A
q = Stufenanzahl Faktor B
Varianzanalyse
Seite 10
Varianzanalyse mit Messwiederholung
Einfaktorielle Varianzanalyse (mit Messwiederholung)
- systematische Varianz
- Residualvarianz
1p
)GA(n
df
QSˆ
p
1i
2i
A
A2A
)1n()1p(
)]GPA(x[
df
QSˆ
2mi
p
1i
N
1m
im
VpnA
VpnA2VpnA
iA = Mittelwert der Faktorstufe Ai
mP = Mittelwert der Person m
G = Gesamtmittelwert
p = Anzahl Faktorstufen Faktor A
n = Anzahl Vpn in einer
Faktorstufe
F-Bruch 2
VpnA
2A
2sRe
2A
)df,df(Aˆ
ˆ
ˆ
ˆF
sReA
dfA = p – 1
dfRes = (n – 1) · (p – 1)
Empirische Effektstärkenmaße
(auf Stichprobenebene)
VpnAA
A2p
QSQS
QS
VpnA
A2)abhängig(S
QS
QSf
VpnA
A2)abhängig(S
df
dfFf
2S
2S2
pf1
f
ηp²: partielles Eta-Quadrat, Effekt auf der
Stichprobenebene
Teststärkeanalyse
- a priori auf Basis der
Konventionen für unabhängige
Stichproben
NΦr1
pλ 2
unabhängigαdf;
mit 2unabhängig
2unabhängig2
unabhängigΩ1
ΩΦ
p = Anzahl Stufen des Faktors A
r = mittlere Korrelation zwischen
den Messzeitpunkten
Konventionen für Effekt bei
unabhängigen Stichproben:
kleiner Effekt: Ω² = 0,01
mittlerer Effekt: Ω² = 0,06
großer Effekt: Ω² = 0,14
Stichprobenumfangsplanung
auf Basis der Konventionen für
unabhängige Stichproben
p
)r1(N
2unabhängig
1;;df
mit 2unabhängig
2unabhängig2
unabhängig1
p = Anzahl Stufen des Faktors A
r = mittlere Korrelation zwischen
den Messzeitpunkten
Formelsammlung
Seite 11
Post Hoc Tests
n
ˆqHSD
2sRe
)df;p;(krit Nenner
HSD = kritische Differenz eines
Paarvergleichs
qkrit = krit. Wert aus der q-Tabelle
= kumuliertes Signifikanzniveau
für alle Paarvergleiche
p = Anzahl der Mittelwerte
n = Anzahl der Vpn pro Zelle
Zweifaktorielle Varianzanalyse (mit MW auf einem Faktor)
- Faktor A ohne MW
- Faktor B mit MW
- Wechselwirkung A x B
- Prüfvarianz des Faktors A
- Prüfvarianz des Faktors B und
der Wechselwirkung A×B
1p
)GA(qn
df
QSˆ
p
1i
2i
)mwnicht(A
)mwnicht(A2
)mwnicht(A
1q
)GB(pn
df
QSˆ
q
1j
2j
)mw(B
)mw(B2)mw(B
)1q()1p(
)]GBA(BA[n
df
QSˆ
q
1j
p
1i
2jiij
)mw(BA
)mw(BA2)mw(BA
)1n(p
)APA(q
df
QSˆˆ
p
1i
n
1m
2iim
SinVpn
SinVpn2
SinVpn
2)A(üfPr
)1n()1q(p
)]APABA(x[
df
QSˆ
p
1i
2iimij
q
1j
n
1m
ijm
VpnB
VpnB2VpnB
F-Brüche
- Faktor A ohne MW
- Faktor B mit MW
- Wechselwirkung A×B
2
SinVpn
2A
2)A(üfPr
2
)mwnicht(A
)df;df(Aˆ
ˆ
ˆ
ˆF
SinVpnA
2VpnB
2B
2)B(üfPr
2)mw(B
)df;df(Bˆ
ˆ
ˆ
ˆF
VpnBB
2VpnB
2)mw(BA
2)B(üfPr
2)mw(BA
)df;df(BAˆ
ˆ
ˆ
ˆF
VpnBBA
dfA = p – 1
dfVpn in S = p · (n – 1)
dfB = q – 1
dfB×Vpn = p · (q – 1) · (n – 1)
dfA×B(mw) = (p – 1) · (q – 1)
dfB×Vpn = p · (q – 1) · (n – 1)
Varianzanalyse
Seite 12
Empirische Effektstärkenmaße
(auf Stichprobenebene)
- Faktor A ohne MW
- Faktor B mit MW
- Wechselwirkung A×B
Berechnung aus F-Werten
SinVpnA
A2)A(p
QSQS
QS
VpnBB
B2)B(p
QSQS
QS
VpnBBA
BA2)BA(p
QSQS
QS
üfPr
Effekt2)abhängig(S
df
dfFf
2S
2S2
pf1
f
Teststärkeanalyse
- Für Faktor A ohne MW
- Für Faktor B mit MW und die
Wechselwirkung A×B
Nr)1q(1
q 2unabhängig;df);mwnicht(A
Nr1
q 2unabhängig;df);mw(BA;df);mw(B
Stichprobenumfangsplanung
- für Faktor A ohne MW
- für Faktor B und WW siehe
einfaktorielle VA mit MW
q
r)1q(1npN
2unabhängig
1;;df
)mwnicht(A
Zweifaktorielle Varianzanalyse (mit MW auf beiden Faktoren)
F-Brüche
- HE Faktor A mit p Stufen
- HE Faktor B mit q Stufen
- WW A×B
2VpnA
2A
2)A(üfPr
2A
)df,df(Aˆ
ˆ
ˆ
ˆF
)A(üfPrA
2VpnB
2B
2)B(üfPr
2B
)df,df(Bˆ
ˆ
ˆ
ˆF
)B(üfPrB
2VpnBA
2BA
2)BA(üfPr
2BA
)df,df(AxBˆ
ˆ
ˆ
ˆF
)BA(üfPrBA
dfA = p – 1
dfA×Vpn = (p – 1) · (n – 1)
dfB = q – 1
dfB×Vpn = (q – 1) · (n – 1)
dfA×B = (p – 1) · (q – 1)
dfA×B×Vpn = (p – 1) · (q – 1) · (n – 1)
Formelsammlung
Seite 13
Empirische Effektstärkenmaße
(auf Stichprobenebene)
- Faktor A ohne MW
- Faktor B mit MW
- Wechselwirkung A×B
- Berechnung aus F-Werten
)A(üfPrA
A2)A(p
QSQS
QS
)B(üfPrB
B2)B(p
QSQS
QS
)BA(üfPrBA
BA2)BA(p
QSQS
QS
üfPr
Effekt2)abhängig(S
df
dfFf
2S
2S2
pf1
f
Teststärkeanalyse
- auf Basis der Konventionen für
unabhängige Stichproben
nr1
qp 2unabhängig;df
mit 2unabhängig
2unabhängig2
unabhängig1
Stichprobenumfangsplanung
- analog zur einfaktoriellen
VA mit MW auf einem Faktor
- getrennt vorzunehmen für
Faktor A, Faktor B und WW
p
)r1(N
2unabhängig
1;;df
mit 2unabhängig
2unabhängig2
unabhängig1
Nichtparametrische Verfahren: U-Test
U-Test
Prüfung der Korrektheit der
Rangzuweisung
2
1)+(NN=T+T 21
N = n1 + n2
T1 = Rangplatzsumme Gruppe 1
T2 = Rangplatzsumme Gruppe 2
Rangplatzüberschreitungen von
Gruppe 1 gegenüber Gruppe 2
111
21 T2
)1n(nnnU
Rangplatzunterschreitungen von
Gruppe 1 gegenüber Gruppe 2
222
21 T2
)1n(nnnU
Kontrolle UnnU 21
Varianzanalyse
Seite 14
Bei n1 oder n2 > 20
U
UUz
2
nn 21U
μU = erwarteter mittlerer U-Wert
σU = Streuung der U-Werte
n1 = Anzahl Vpn in Gruppe 1
n2 = Anzahl Vpn in Gruppe 2
Streuung bei unverbundenen
Rängen
korrigierte Streuung bei
verbundenen Rängen
12
)1nn(nn 2121U
k
1i
i3i
321
U12
tt
12
NN
)1N(N
nncorr
N = n1 + n2
ti = Anzahl der Personen, die sich
Rangplatz i teilen
k = Anzahl der verbundenen Ränge
Stichprobenumfangsplanung
Berechnung über t-Test
2)Testt(N
Nichtparametrische Verfahren: Chi²-Test
Eindimensionaler chi²-Test
k
1i ei
2
eibi2 f
)f - (f
k = Anzahl Kategorien
fbi = beobachtete Häufigkeit in Kat. i
fei = erwartete Häufigkeit in Kat. i
df = k 1
Zweidimensionaler chi²-Test
allgemein
erwartete Häufigkeit
k
1i
l
1j eij
2
eijbij2
f
)ff(
N
meSpaltensum eZeilensummf
ji
eij
k = Anzahl Kategorien i
l = Anzahl Kategorien j
fbij = beobachtete Zellhäufigkeit
feij = erwartete Zellhäufigkeit
df = (k 1) · (l 1)
Vierfelder-chi²-Test
(zwei dichotome Merkmale)
)dc()ba()db()ca(
)cbda(N 22
a b
c d
Formelsammlung
Seite 15
Empirische Effektstärkenmaße
- Vierfelder Test auch
N
w2
2
N
w2
22
N = Anzahl Beobachtungen
= Phi - Koeffizient
(gleichbedeutend mit Korrelation
zweier dichotomer Variablen)
Annahme einer Effektstärke
a priori
- eindimensional
- zweidimensional
k
1i ei
2
eibi2 p
)p - (p w
k
1i
i
1j eij
2
eijbij2 p
)p - (p w
k = Anzahl der Kategorien
pbi = rel. Häufigkeit unter der H1
pei = rel. Häufigkeit unter der H0
k = Anzahl der Kategorien i
l = Anzahl der Kategorien j
pbij = rel. Häufigkeit unter der H1
peij = rel. Häufigkeit unter der H0
Konventionen
kleiner Effekt: w² = 0,01
mittlerer Effekt w² = 0,09
großer Effekt: w² = 0,25
Teststärkebestimmung
Nw 2
= Nonzentralitätsparameter
Stichprobenumfangsplanung
2w
N