33
Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

Embed Size (px)

Citation preview

Page 1: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

Marktforschung

Sommersemester 2011

Thema 6:

Korrelationsanalyse

Page 2: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

Gliederung

1. Situation

2. Fragestellung

3. Datenlage

4. Funktionstypen

5. Korrelationen

5.1 Korrelationskoeffizient nach Bravais-Pearson

5.2 Rangkorrelationskoeffizient nach Spearman

5.3 Rangkorrelationskoeffizient nach Kendall

6. Zusammenfassung

7. Probleme

2

Marktforschung | SoSe 2011| Universität Siegen

Page 3: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

1. Situation

Den Marketingleiter des Pizzaherstellers interessiert die Frage nach dem Zusammenhang zwischen Verkaufspreis und Absatzmenge von Tiefkühlpizzen im Monat.

Zu diesem Zweck wurde die Absatzmenge bei unterschiedlichen Preisen der Tiefkühlpizza im Monat ermittelt.

3

Marktforschung | SoSe 2011| Universität Siegen

Page 4: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

2. Fragestellung

Stellen Sie die erfassten Daten zunächst mit Hilfe eines Streudiagramms dar. Liefert Ihnen das Streudiagramm bereits erste Hinweise auf einen möglichen Zusammenhang.

Beschreiben Sie den Zusammenhang mithilfe sog. Korrelationskoeffizienten, wobei Sie einen linearen Zusammenhang zwischen den Werten unterstellen sollten.

Gehen Sie bei Ihren Berechnungen davon aus, dass die beiden Merkmale der Stichprobe normalverteilt sind.

4

Marktforschung | SoSe 2011| Universität Siegen

Page 5: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

3. Datenlage

5

Marktforschung | SoSe 2011| Universität Siegen

Tiefkühlpizza A B C D E F G H I J

Preis in Euro 5,10 1,80 2,10 2,05 1,99 1,90 2,20 1,95 2,50 2,25

Absatzmenge

im Monat

110 1200 100 43 910 1000 760 970 685 860

Folgende Daten wurden erfasst:

Page 6: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

Ausgewählte Grundformen linearer Funktionen ( )

Beispiel:

Zusammenhang zwischen Zahl der Vertreterbesuche und Höhe des Verkäuferumsatzes

Beispiel:

Zusammenhang zwischen Preis und Absatzmenge

Beispiel:

Zusammenhang zwischen Preis A und Preis B verschiedener Güter

4. Funktionstypen

baxxf )(

6

Marktforschung | SoSe 2011| Universität Siegen

Page 7: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

Ausgewählte Grundformen nicht-linearer Funktionen (z. B.: , , )

Beispiel:

Zusammenhang zwischen Artikel-anzahl und Zahlungs-bereitschaft

Beispiel:

Zusammenhang zwischen Preis und Absatz bei bestimmten Gütern

Beispiel:

Zusammenhang zwischen Mund-zu-Mund Propaganda und Ausbreitung einer Werbe-botschaft

Beispiel:

Zusammenhang zwischen Vertraut-heit und Attraktivität eines Produktes

Beispiel:

Werbewirkungs-funktion

Beispiel:

Trendprognose zum Absatz eines Automobils

xxf alog)( xaxf )( cbxaxxf 2)(

4. Funktionstypen

7

Marktforschung | SoSe 2011| Universität Siegen

Page 8: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5. Korrelationen

Streu(ungs)diagramme sind grafische Hilfsmittel, die die Anordnung der Beobachtungspunkte veranschaulichen

jedes xi/yi - Beobachtungspaar wird in ein x/y-Koordinatensystem eingetragen

es lässt sich ein erster Eindruck gewinnen, ob und wie stark zwei Merkmale zusammenhängen

Funktionstypen können abgeleitet werden

8

Marktforschung | SoSe 2011| Universität Siegen

Page 9: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5. Korrelationen

• als Korrelation bezeichnet man den wechselseitigen Zusammenhang zwischen Größen

• Korrelation bedeutet nicht das Vorhandensein von Kausalität. Besteht eine Korrelation zwischen X und Y, so gibt es mindestens drei alternative Möglichkeiten einer Kausalitätsbeziehung:- X bewirkt Y- Y bewirkt X und- X und Y werden durch Z bewirkt (Scheinkorrelation bzw. partielle Korrelation).

• die Korrelationsanalyse liefert ein Maß für die Stärke des Zusammenhangs; erfasst jedoch nur monotone bzw. lineare Zusammenhänge

9

Marktforschung | SoSe 2011| Universität Siegen

Page 10: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5. Korrelationen

• die Stärke des Zusammenhangs wird durch den Korrelationskoeffizienten r gemessen

• r liegt stets in den Grenzen von -1 bis +1 • für die Stärke des Zusammenhangs ist allein der Betrag des

Korrelationskoeffizienten maßgebend• das Vorzeichen gibt an, ob der Zusammenhang gleichläufig (+)

oder gegenläufig (–) ist

Korrelationskoeffizient Einstufung

│r│≤ 0.25 0.25 <│r│≤ 0.66

0.66 <│r│< 1 │r│= 1

schwache Korrelationmittlere Korrelationstarke Korrelation

perfekte Korrelation

10

Marktforschung | SoSe 2011| Universität Siegen

Page 11: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.1 Korrelationskoeffizient nach Bravais-Pearson

Vermutung:

Zwischen den Variablen Preis und Verkaufsmenge besteht ein linearer und gegenläufiger Zusammenhang; je höher der Verkaufspreis umso geringer die Absatzmenge.

11

Marktforschung | SoSe 2011| Universität Siegen

Page 12: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.1 Korrelationskoeffizient nach Bravais-Pearson

12

Marktforschung | SoSe 2011| Universität Siegen

•zur Beschreibung des Zusammenhangs zwischen metrisch skalierten und normalverteilten Variablen

•misst die Stärke des linearen Zusammenhangs

es gilt:

Erläuterung

sx bzw. sy stehen für die Standardabweichungen der Merkmale X bzw. Y

sxy bezeichnet die empirische Kovarianz

yx

xy

n

i

n

i

ii

n

ixy

sss

yyxx

yyixxir

1 1

1

²²

yyxxn/1s i

n

1iixy

Page 13: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.1 Korrelationskoeffizient nach Bravais-Pearson

zur Kovarianz:

•um einen Zusammenhang zwischen zwei Merkmalen zu erfassen, beschreibt man die Lage eines Beobachtungspunktes mit Bezug zu dem Schwerpunkt des Streudiagramms

•Punkte im ersten und dritten Quadranten deuten auf einen positiven Zusammenhang hin; Punkte im zweiten und vierten Quadranten auf einen negativen Zusammenhang

•formal wird dies für jeden Punkt durch das Produkt (xi- )(yi- ) erfasst

),( yx

x

IV I

III II

x y/x

x x xx x x x x x x

x x x x x x x x x

y

xx

y

y

13

Marktforschung | SoSe 2011| Universität Siegen

Page 14: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.1 Korrelationskoeffizient nach Bravais-Pearson

• Es gilt:

Quadrant 1:

Quadrant 2:

Quadrant 3:

Quadrant 4:

• Liegen die Punkte hauptsächlich in den Quadranten 1 und 3, so ist die Summe der Produkte stark positiv.

• Liegen die Punkte hauptsächlich in den Quadranten 2 und 4, so ist die Summe der Produkte stark negativ.

• Sind die Punkte gleichmäßig verteilt, so heben sich positive und negative Summanden weitgehend auf und die Summe der Produkte wird weitgehend Null.

0))((; yyxxyyxx iiii

0))((; yyxxyyxx iiii

0))((; yyxxyyxx iiii

0))((; yyxxyyxx iiii

14

Marktforschung | SoSe 2011| Universität Siegen

Page 15: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.1 Korrelationskoeffizient nach Bravais-Pearson

• Kovarianz: durchschnittliche Summe von Abweichungsprodukten

• die Kovarianz gibt die Tendenz an, in welche Richtung dieMerkmale variieren

• sxy > 0 mit x steigt (tendenziell) auch y (und umgekehrt)

• sxy < 0 hohe Werte der einen Zufallsvariablen gehen mit niedrigen Werten der anderen Zufallsvariablen einher

• sxy = 0 x und y sind unabhängig

• Kovarianzen deuten (ggf.) auf lineare Abhängigkeiten hin. Sie sind von den Maßeinheiten der Merkmale abhängig!

• Wertebereich : bis

15

Marktforschung | SoSe 2011| Universität Siegen

Page 16: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.1 Korrelationskoeffizient nach Bravais-Pearson

•Normierung der Kovarianz:

Korrelationskoeffizienten nach Bravais-Pearson (Produkt-Moment-Korrelation) rxy

Division der Kovarianz durch die Standardabweichungen beider

Merkmale (=Eliminierung der Streuung der einzelnen Verteilungen)

Wertebereich von rxy : -1 bis +1

positive rxy die Merkmale variieren tendenziell in der gleichen Richtung

negative rxy die Merkmale variieren tendenziell in entgegen-

gesetzter Richtung

rxy = 0 kein (linearer) Zusammenhang!

16

Marktforschung | SoSe 2011| Universität Siegen

Page 17: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.1 Korrelationskoeffizient nach Bravais-Pearson

Die statistische Absicherung des Korrelationskoeffizienten nach Bravais-Pearson gegen Null erfolgt über die t-verteilte Prüfgröße.

Der Korrelationskoeffizient ist dann signifikant, wenn die Prüfgröße größer ist als der kritische Wert der t-Verteilung.

²1

2

xy

xy

r

nrt

bei df = n-2 Freiheitsgraden

17

Marktforschung | SoSe 2011| Universität Siegen

Page 18: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

• rxy = -0,631

• im vorliegenden Fall liegt mit p=0,05 ein nicht signifikanter Wert vor

Folgende Ergebnisse liefert die Berechnung desKorrelationskoeffizient nach Bravais-Pearson

5.1 Korrelationskoeffizient nach Bravais-Pearson

Korrelation

1 -,631

,050

10 10

-,631 1

,050

10 10

Korrelation nachPearson

Sig. (2-seitig)

N

Korrelation nachPearson

Sig. (2-seitig)

N

Preis

Absatzmenge

Preis Absatzmenge

18

Marktforschung | SoSe 2011| Universität Siegen

Page 19: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.1 Korrelationskoeffizient nach Bravais-Pearson

19

Marktforschung | SoSe 2011| Universität Siegen

Page 20: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.1 Korrelationskoeffizient nach Bravais-Pearson

•r

xy misst den linearen Zusammenhang zweier Variablen

Konsequenz: einzelne Ausreißer, d.h. einzelne extreme Datenpunkte, können einen starken, unerwünschten Effekt auf den numerischen Wert von rxy haben; hohe Korrelationen können als gering erscheinen und umgekehrt.

Lösung: Ermittlung von Rangkorrelationskoeffizienten, die von Ausreißern wesentlich weniger beeinflusst werden, da ihre Ermittlung auf den Rängen der Beobachtungen basiert.

20

Marktforschung | SoSe 2011| Universität Siegen

Page 21: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.2 Rangkorrelationskoeffizient nach Spearman (rs)

Ausreißer!

21

Marktforschung | SoSe 2011| Universität Siegen

Page 22: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.2 Rangkorrelationskoeffizient nach Spearman (rs)

•wird zwischen zwei Variablen berechnet, die mindestens ordinalskaliert sind; für metrisch skalierte Variablen, bei Unsicherheit hinsichtlich der Normalverteilungsanahme

•misst die Stärke des monotonen Zusammenhangs

•basiert auf Rangzahlen, die den Messwerten zugeordnet sind

•für beide Variablen wird eine Rangreihe der Werte erstellt, dem höchsten Wert wird der Rangplatz 1 verliehen; bei gleichen Werten werden gemittelte Rangplätze vergeben

•die Differenz di der zugehörigen Rangplatzpaare wird bestimmt

es gilt:

•die Absicherung erfolgt über die t-verteilte Prüfgröße

bei df = n – 2 Freiheitsgraden

22

Marktforschung | SoSe 2011| Universität Siegen

)1²(

²61 1

nn

dr

n

i

i

s

²1

2

s

s

r

nrt

Page 23: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.2 Rangkorrelationskoeffizient nach Spearman (rs)

•Wertebereich von rs: -1 bis +1

•gehen mit steigenden x-Werten auch steigende y-Werte einher, so nimmt rs

tendenziell einen großen Wert an

•sind die Rangzahlen bei den Merkmalen beider Variablen völlig gleich, so nimmt rs den Wert 1 an (die Rangpaare liegen auf einer Geraden mit positiver Steigung liegen)

•bei entgegengesetzt laufenden Rangzahlen wird rs = -1 (die Rangpaare liegen auf einer Geraden mit negativer Steigung)

23

Marktforschung | SoSe 2011| Universität Siegen

Page 24: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.2 Rangkorrelationskoeffizient nach Spearman (rs)

Tiefkühlpizza A B C D E F G H I J

Preis in Euro 5,10 1,80 2,10 2,05 1,99 1,90 2,20 1,95 2,50 2,25

Absatzmenge im Monat

110 1200 100 43 910 1000 760 970 685 860

Rang Preis 1 10 5 6 7 9 4 8 2 3

Rang Absatzmenge 8 1 9 10 4 2 6 3 7 5

di -7 9 -4 -4 3 7 -2 5 -5 -2

d²i 49 81 16 16 9 49 4 25 25 4

Rechenschritte zur Rangkorrelation nach Spearman rs :

Page 25: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.2 Rangkorrelationskoeffizient nach Spearman (rs)

Es ergibt sich

Die Absicherung erfolgt über die t-verteilte Prüfgröße mit

Nach der t-Tabelle ist dies bei df = 8 Freiheitsgraden und α = 0.05 ein signifikanter Wert.

25

Marktforschung | SoSe 2011| Universität Siegen

685,01100*10

278*61

sr

65,2²685,01

8*685,0

t

t-Tabelle

df α =0,05 α =0,01

8 1,860 2,896

9 1,833 2,821

Page 26: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.2 Rangkorrelationskoeffizient nach Spearman (rs)

Interpretation des Ergebnisses

rs= -0,685

=> starker Zusammenhang

rs< 0 => gegenläufiger monotoner Zusammenhang

Es zeigt sich ein mittlerer gegenläufiger Zusammenhang zwischen Preis und Absatzmenge: Je höher der Preis einer Tiefkühlpizza, umso niedriger ist die verkaufte Menge an Tiefkühlpizzen.

26

Marktforschung | SoSe 2011| Universität Siegen

Page 27: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

• wird zwischen zwei Variablen berechnet, die mindestens ordinalskaliert sind

• misst die Stärke des monotonen Zusammenhangs• stellt darauf ab, ob Rangzahlen in gleicher Richtung oder

entgegengesetzter Richtung verlaufen• Rangreihe der ersten Variablen wird in aufsteigender Folge notiert• Rangreihe der zweiten Variablen wird entsprechend zugeordnet; für

jeder dieser Rangzahlen wird die Anzahl der Ränge festgestellt, die kleiner oder gleich der Zahl sind und in der Reihe rechts davon stehen (Qi)

• es gilt: )1(

41 1

nn

Qr

n

i

i

k

5.3 Rangkorrelationskoeffizient nach Kendall (rk)

27

Marktforschung | SoSe 2011| Universität Siegen

Page 28: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

5.3 Rangkorrelationskoeffizient nach Kendall (rk)

•nicht die Absolutbeträge der Stichprobenwerte sind entscheidend, sondern nur die relative Anordnung der Ränge

•Anwendung insbesondere dann, wenn Daten nicht normalverteilt sind

•für kleinere Stichprobenumfänge weniger empfindlich gegen Ausreißer-Rangpaare

28

Marktforschung | SoSe 2011| Universität Siegen

Page 29: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

6. Zusammenfassung

Y

nominal ordinal metrisch

X

nominal Kontingenz Kontingenz Kontingenz

ordinal Kontingenz Rang-Korrel. Rang-Korrel.

metrisch Kontingenz Rang-Korrel. Korrelation i.e.S.

29

Marktforschung | SoSe 2011| Universität Siegen

Die Rangkorrelation kann nur dann berechnet werden, wenn die beteiligten Variablen mindestens ordinalskaliert sind; die Korrelation i.e.S (Korrelation nach Bravais-Pearson) allerdings nur für metrische Variablen.

Page 30: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

6. Zusammenfassung

Übersicht bivariater Korrelationsarten in Abhängigkeit

vom Skalenniveau

30

Marktforschung | SoSe 2011| Universität Siegen

Y

ordinal metrisch

X

ordinal Rangkorrelation (Spearman (5.2), Kendall (5.3))

Rangkorrelation (Spearman (5.2), Kendall (5.3))

metrisch Rangkorrelation (Spearman (5.2), Kendall (5.3))

Produkt-Moment-Korrelation (Pearson (5.1))

Korrelation i.e.S

Page 31: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

7. Probleme

•für die Korrelation i.e.S gilt: Einzelne Fälle können einen starken Einfluss auf den Korrelationskoeffizienten ausüben.

•Korrelationen lassen sich für alle Funktionstypen berechnen; allerdings werden nur monotone bzw. lineare Zusammenhänge erfasst.

Page 32: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

7. Probleme

•Kausalzusammenhänge können nicht erfast werden

•Scheinkorrelationen (Korrelation zwischen Merkmalen, die inhaltlich nicht gerechtfertigt ist) können auftreten; Zusammenhänge ergeben sich dann, wenn ein mit beiden beobachtbaren Merkmalen hochkorreliertes drittes Merkmal übersehen wird und unberücksichtigt bleibt.

•bleibt ein entscheidendes Merkmal unberücksichtigt, kann dies zudem vorhandene Korrelationen verschleiern oder hinsichtlich des Vorzeichens umkehren

32

Marktforschung | SoSe 2011| Universität Siegen

Page 33: Marktforschung Sommersemester 2011 Thema 6: Korrelationsanalyse

Literatur

Berekoven, Ludwig, Eckert, Werner & Ellenrieder, Peter (2004). Marktforschung. Methodische Grundlagen und praktische Anwendung, 10. Auflage, Wiesbaden: Gabler, S.204-206.

Bortz, Jürgen (2005). Statistik für Human- und Sozialwissenschaftler, 6. Aufl., Heidelberg: Springer, S.203-207 und S.232-234.

Fahrmeir, Ludwig, Künstler, Rita, Pigeot, Iris & Tutz, Gerhard (2004). Statistik, 5. Aufl., Berlin-Heidelberg-New York etc.: Springer, S.134-145 und S.147-152.

Zöfel, Peter (2003). Statistik für Wirtschaftswissenschaftler, München-Boston-San Francisco etc: Pearson, S.150-161.

33

Marktforschung | SoSe 2011| Universität Siegen