Streuung

Preview:

DESCRIPTION

Streuung. Bezeichnung Streuung=Dispersion=Variabilität Fragestellung : Wie heterogen sind die Daten? Wie weit weichen Merkmale von den Mittelwerten ab? Zweck der Berechnung - PowerPoint PPT Presentation

Citation preview

1

Streuung

• Bezeichnung

Streuung=Dispersion=Variabilität

• Fragestellung:

• Wie heterogen sind die Daten?• Wie weit weichen Merkmale von den Mittelwerten ab?

• Zweck der Berechnung

• Der Mittelwert/ Zentralwert ist zur Charakterisierung der Daten nicht ausreichend. Man will auch wissen, wie stark die Daten von der Mitte abweichen.

• Die Streuung ist ein Maß für die Abweichung.

• Beispiel: Altersangabe für 2 Arbeitsgruppen

Gruppe2: 27, 28, 28, 29, 29, 30, 30, 31, 31, 32, 32, 33, 33, 34, 34, 35

Gruppe1: 21, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41

2

Häufigkeitsverteilungen mit unterschiedlicher Streuung und gleichem Mittelwert

Merkmalsausprägungen

Häu

fig

keit

geringe Streuung

mittlere Streuung

große Streuung

3

Streuung(Beispiel)Alter, Gruppe121, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41

Alter, Gruppe227, 28, 28, 29, 29, 30, 30, 31, 31, 32, 32, 33, 33, 34, 34, 35

0

2

4

6

8

10

12

14

16

20 25 30 35 40 45

0

2

4

6

8

10

12

14

16

20 25 30 35 40 45

4

Spannweite(Beispiel)Alter, Gruppe121, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41

Alter, Gruppe227, 28, 28, 29, 29, 30, 30, 31, 31, 32, 32, 33, 33, 34, 34, 35

0

2

4

6

8

10

12

14

16

20 25 30 35 40 45

0

2

4

6

8

10

12

14

16

20 25 30 35 40 45

5

Streuungsmaß1Spannweite (Variationsbreite)

Definition:

Spannweite = Abstand zwischen

• dem minimalen und

• dem maximalen Merkmalswert xmax –xmin

• Beispiel: Zensuren: 1,1,2,2,2,2,5Spannweite = 5-1 = 4

• Nachteil

– empfindlich gegen Ausreißer

– nicht anwendbar bei offenen Klassen

6

Spannweite bei Klassen

• Spannweite bei Klassen

= Abstand zwischen

• der Untergrenze der untersten Klasse• der Obergrenze der obersten Klasse

• Problem

– Man muss alle Klassen vorher schließen

7

Mittlerer Quartilsabstand(Beispiel)Alter, Gruppe121, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41

Alter, Gruppe227, 28, 28, 29, 29, 30, 30, 31, 31, 32, 32, 33, 33, 34, 34, 35

0

2

4

6

8

10

12

14

16

20 25 30 35 40 45

0

2

4

6

8

10

12

14

16

20 25 30 35 40 45

Q1=29

Q3=33

MQ =(33-29) /2 =2

Q1=37

Q3=25

MQ =(37-25) /2 =6

8

• Quartilsabstand

= Abstand zwischen

• dem untersten und • dem obersten Quartil Q3-Q1

• Semiquartilsabstand (=mittlerer Quartilsabstand=MQA=MQ)

= mittlere Abweichung vom Zentralwert

Streuungsmaß 2Quartilsabstände

21Q3Q

2

)1Q(ZZ)3(Q

9

• Semiquartilsabstand (mittlerer Quartilsabstand=MQA,=MQ)

= mittlere Abweichung vom Zentralwert (Q3-Q1)/2

• Zeichnung: Whisker-Box-Plot (nicht klausurrelevant)

Quartilsabstand: Zeichnung

Z

Q1 Q3

Quartilsabstand

halber Quartilsabstand

10

• Mittlerer Quartilsabstand(MQM)

• ½(Q1-Q3)

– Beispiel:

Quartilsabstand: Beispiel

Merkmale 1 2 3 4 5 6 7 8

Häufigkeit 1 1 3 5 1 4 2 3

Z=4Q1=3 Q3=6

MQM=3

11

Quartilsabstand und die Gestalt der Verteilung

• linkssteil (Streuung vorwiegend nach rechts)

• rechtssteil (Streuung vorwiegend nach links)

• symmetrisch

2

31 QQZ

2

31 QQZ

2

31 QQZ

13

1

ZQ

QZ

13

1

ZQ

QZ

13

1

ZQ

QZ

12

Quartilsabstand und die Gestalt der Verteilung

• linkssteil (Streuung vorwiegend nach rechts)

2

31 QQZ

05

101520

2530

3540

10 11 12 13 14

x n

10 40

11 20

12 14

13 13

14 13

ZQQZ 31

13

Quartilsabstand:Problemfälle

• Behandlung von Ausreißern

– Werte, die von den Rändern der Box weit entfernt sind, werden nicht berücksichtigt.

– Weit heißt: 2/3 der Boxbreite

Z=4Q1=3 Q3=6

MQM=3/2vernachlässigbare Werte

14

Mittlere absolute Abweichung(Beispiel)Alter, Gruppe121, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41

0

2

4

6

8

10

12

14

16

20 25 30 35 40 45

=x

Mittelwert=31

x Abstand vom Mittelwert

21 21-31 = --10

22 22-31= --9

....

40 40-31 = 9

41 41-31= 10

15

Mittlere absolute Abweichung(Abstände zum Mittelwert ermitteln)

Alter, Gruppe1 :vereinfachtes Beispiel21, 24, 26, 31, 36, 38, 41Mittelwert =31

x Abstand von x zum Mittelwert xi-

absoluter Abstand| xi- |

21 -10 10

24 -7 7

26 -5 5

31 0 0

36 5 5

38 7 7

41 10 10

16

Mittlere absolute Abweichung(durchschnittlichen Abstand ausrechnen)

Alter, Gruppe1 :vereinfachtes Beispiel: 21, 24, 26, 31, 36, 38, 41Mittelwert =31

x Abstand von x zum Mittelwert xi-

absoluter Abstand| xi- |

21 -10 10

24 -7 7

26 -5 5

31 0 0

36 5 5

38 7 7

41 10 10

Summe =44Durchschnittlicher Abstand =44/7=6,2857

17

quadratische Abweichung vom Mittelwert(Beispiel)Alter:21, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41

-10 10 30 50 70 90

31

32

33

36

38

38

40

41

18

quadratische Abweichung vom Mittelwert(Abstände)Alter:21, 22, 24, 24, 26, 29, 30, 31,31, 32, 33, 36, 38, 38, 40, 41

-10 10 30 50 70 90

31

32

33

36

38

38

40

41

Mittelwert=31

x Abstand vom Mittelwert

Quadrat

21 21-31 = --10 100

22 22-31= --9 81

.... ... ...

40 40-31 = 9 81

41 41-31= 10 100

19

Varianz(quadratischen Abstand zum Mittelwert ermitteln)

Alter, Gruppe1 :vereinfachtes Beispiel21, 24, 26, 31, 36, 38, 41Mittelwert =31

xi Abstand von x zum Mittelwert =xi-

quadratischer Abstand(xi- )²

21 -10 100

24 -7 49

26 -5 25

31 0 0

36 5 25

38 7 49

41 10 100

20

Varianz(Durchschnitt bilden)

Alter, Gruppe1 :vereinfachtes Beispiel21, 24, 26, 31, 36, 38, 41Mittelwert =31

x Abstand von x zum Mittelwert

xi-

quadratischer Abstand

(xi- )²

21 -10 100

24 -7 49

26 -5 25

31 0 0

36 5 25

38 7 49

41 10 100

Summe =348

Durchschnittlicher quadratischer Abstand

= 348/7 = 49,28

Recommended