371
Kombinatorik. ? Beispiel : Multiple-Choice-Klausur - 16 Fragen - Je 4 Antwortalternativen ( eine ist richtig ) - Zufälliges Ankreuzen ? Wahrscheinlichkeit für mindestens 8 Treffer ? Mögliche Lösungsstrategie : Wie viele Ankreuzmöglichkeiten gibt es insgesamt? Bei wie vielen dieser Möglichkeiten gibt es 8 Treffer ? Quotienten bilden „ Wie viele Möglichkeiten ? “ Kombinatorik 1.1 QM1_18 1

16 4 8 · Kombinatorik.? Beispiel: Multiple-Choice-Klausur 16 Fragen Je 4 Antwortalternativen (eineistrichtig) ZufälligesAnkreuzen? Wahrscheinlichkeitfürmindestens 8 Treffer?

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Kombinatorik.

? Beispiel : Multiple-Choice-Klausur

− 16 Fragen

− Je 4 Antwortalternativen ( eine ist richtig )

− Zufälliges Ankreuzen

? Wahrscheinlichkeit für mindestens 8 Treffer ?

→ Mögliche Lösungsstrategie :

Wie viele Ankreuzmöglichkeiten gibt es insgesamt?

Bei wie vielen dieser Möglichkeiten gibt es ≥ 8 Treffer ?

→ Quotienten bilden

→ „ Wie viele Möglichkeiten ? “ → Kombinatorik

1.1 QM1_18 1

? Beispiel : Aufteilen von Vpn auf Gruppen

− 20 Vpn

− Aufzuteilen in 2 Gruppen zu 10

− 10 Vpn haben kritisches, nicht sichtbares Merkmal A

? Wie wahrscheinlich sind ≥ 8 A-Vpn in Gruppe 1 ?

→ Mögliche Lösungsstrategie :

Wie viele Möglichkeiten der Verteilung gibt es ?

Bei wie vielen kommen ≥ 8 A-Vpn in Gruppe 1 ?

→ Quotienten bilden

→ „ Wie viele Möglichkeiten ? “ → Kombinatorik

? Beispiel : Lotto 6 aus 49

? Wie wahrscheinlich sind ≥ 5 Richtige ?

→ Vorgehen entsprechend

1.1 QM1_18 2

→ Notationen

♦ n ! := 1 ·2 · . . . · (n−1) ·n für natürliches n ( ‚ n Fakultät ‘ )

− Dabei : 0 ! := 1

? 1 ! = 1

? 2 ! = 1 · 2 = 2

? 3 ! = 1 · 2 · 3 = 6

? 4 ! = 1 · 2 · 3 · 4 = 24

? 5 ! = 1 · 2 · 3 · 4 · 5 = 120

] : Anzahl

? ] Möglichkeiten : Anzahl der Möglichkeiten

♦ Ist G endliche Menge, so heißt die Anzahl der Elemente von G

auch die Mächtigkeit von G

Abkürzung : |G|

? Ist A = 2, 3, 5 , so |A| = 3

1.1 QM1_18 3

→ Produktmengen.

♦ Sind A und B Mengen, so heißt

A×B := (a, b) | a ∈ A , b ∈ B

auch Cartesisches Produkt von A und B

Die Elemente (a, b) von A×B heißen Paare

? Gleichzeitiges Werfen eines Würfels und einer Münze

? Beschreibung der mögichen Ergebnisse ?

A = 1, 2, 3, 4, 5, 6 (Würfelergebnisse )

B = W,Z (Münzenergebnisse )

Ergebnisse des zusammengesetzten Versuchs :

→ A×B mit

( a , b )

Würfel Münze................................................................................

..............................

...........................................................

? ( 2 , Z) : Würfel : 2 Münze : Z

? ] Ergebnisse der zusammengesetzten Versuchs ?

→ Äquivalent : |A×B | = ?

1.1 QM1_18 4

• Ist |A | = m und |B | = n , so |A×B | = m · n

on Begründung am Beispiel Würfel und Münze :

A = 1, 2, 3, 4, 5, 6 (Würfelergebnisse )

B = W,Z (Münzenergebnisse )

Veranschaulichung des Cartesischen Produkts

1 2 3 4 5 6

W

Z

A

B

t t t t t tt t t t td

B o entspricht ( 2 , Z )

→ Offenbar : |A×B | = 6× 2 = 12

? Bekannt : Koordinatensystem als Veranschaulichung von R× R

1

1

.............................................................................................................................................................................................................................................................................................................................................................................................................................................................. ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......................

...................

x

y q (3, 2)........................................................................

1.1 QM1_18 5

• Ist |A | = m und |B | = n , so |A×B | = m · n

on Begründung am Beispiel Würfel und Münze :

A = 1, 2, 3, 4, 5, 6 (Würfelergebnisse )

B = W,Z (Münzenergebnisse )

Systematische Herstellung der Möglichkeiten− durch sukzessives Auswahlverfahren

......................................................................................................................................................................................................................................................................................................................................

...........................................................................................................................................................................................................................

........................................................................................................................................

........................................................................................................................................

...........................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................................................................................................................................................................................................................................

...............................................................................................................................

...............................................................................................................................

...............................................................................................................................

...............................................................................................................................

...............................................................................................................................

...............................................................................................................................

...............................................................................................................................

...............................................................................................................................

...............................................................................................................................

...............................................................................................................................

...............................................................................................................................

1 2 3 4 5 6

W Z W Z W Z W Z W Z W Z

(1)

(2)

(3)

......................................................................................................................................................................................................................................................................................................................

......................................................................................................................................................................................................................................................................................................................

......................................................................................................................................................................................................................................................................................................................

..........................................................................................................................................................................................................................................................................................................................................................

(1) : Wahl des ersten Elements a von ( a , b ) ∈ A×B

− 6 Möglichkeiten

(2) : Wahl des zweiten Elements b von ( a , b ) ∈ A×B

− Jeweils 2 Möglichkeiten

(3) : Fertig

B entspricht ( 2 , Z )

→ Offenbar : ] Wahlmöglichkeiten insgesamt : 6 · 2 = 12

B : Beachte : ‚ jeweils ‘ ↔ Multiplikation

1.1 QM1_18 6

• Ist |A | = m und |B | = n , so |A×B | = m · n

on Kurz, allgemein :

Es gibt m Möglichkeiten für a

Für jede davon : n Möglichkeiten für b

→ Also : m · n Möglichkeiten für ( a , b )

→ Produkte von mehr als zwei Mengen

♦ A×B × C := (a, b, c) | a ∈ A , b ∈ B , c ∈ C

Elemente (a, b, c) heißen Tripel

♦ Entsprechend A×B × C ×D

Elemente (a, b, c, d) heißen Quadrupel

♦ Etc. etc.

Mit dem Latein am Ende ?

Elemente von A1 × A2 × . . .× An heißen n-Tupel

? Statt ‚ Quintupel ‘ also auch ‚ 5-Tupel ‘

Ist (a1, . . . , an) n-Tupel , so heißen die ai Komponenten

? Die dritte Komponente von (1, 9, 7, 1) ist 7

1.1 QM1_18 7

Statt A× A× . . .× A (n Mal ) auch : An

? Viermalige Durchführung eines Wahrnehmungsexperiments

− Einzelergebnisse jeweils + oder −

? Beschreibung der Ergebnisse der Gesamtversuchs ?

A = +,−

Gesamtergebnisse : A4

( a1 , a2 , a3 , a4 )

1. 2. 3. 4. Versuch.......................................................

...................

.......

.......

.......

.......

.......

....................

...................

.......

.......

.......

.......

.......

....................

...................

.......

.......

.......

.......

.......

....................

...................

? (+,−,−,+) : + bei Versuch 1 , − bei Versuch 2 , . . .

? ] Gesamtergebnisse ?

? Würfeln mit drei Würfeln ( verschiedenfarbig )

? Beschreibung der möglichen Ergebnisse ?

A = 1, 2, 3, 4, 5, 6 ( ein Würfel )

Gesamtergebnisse : A3

? ( 2, 5, 2 ) : 1. Würfel : 2 , 2. Würfel : 5 , 3. Würfel : 2

? ] Gesamtergebnisse ?

1.1 QM1_18 8

• |A | = m , |B | = n , |C | = k ⇒ |A×B×C | = m·n·k

on Auswahl eines (a, b, c) in 3 Schritten

......................................................................................................................................................................................................................................................

.............................................................................................

.........................................................................................................................................................................................................................................................................................................................................................................

...................................................................................................................

...................................................................................................................

...................................................................................................................

...................................................................................................................

......................................................................................................................................................................................................................

.............................................................................................

...................................................................................................

...................................................................................................

.............................................................................................

...................................................................................................

...................................................................................................

.............................................................................................

...................................................................................................

...................................................................................................

.............................................................................................

...................................................................................................

...................................................................................................

.............................................................................................

...................................................................................................

...................................................................................................

.............................................................................................

...................................................................................................

Möglichkeiten

m

jeweils n

jeweils k

...........................................................................................................................................................................................................................................................................................

...........................................................................................................................................................................................................................................................................................

...........................................................................................................................................................................................................................................................................................

→ Insgesamt also m · n · k Möglichkeiten

4 Analog für mehr als drei ‚ Faktoren ‘

→ Spezialfall

• Ist |A | = n , so |Ak | = nk

1.1 QM1_18 9

B Wichtige Technik in der Kombinatorik :

− Finde geeignete ‚ Kodierung ‘

→ Übersetze dadurch neue Probleme in bekannte

? Wie viele Möglichkeiten gibt es beim Würfeln mit drei Würfeln ?

Übersetzung wie oben : (mit A = 1, 2, 3, 4, 5, 6 )

Die Möglichkeiten entsprechen genau den Elementen von A3

] Möglichkeiten = |A3 | = |A |3 = 63 = 216

B Entscheidend : die richtige Kodierung

? ] Möglichkeiten bei 4-maligem Wahrnehmungsexperiment ?

Dabei : Möglichkeiten bei einmaliger Durchführung : +, −

→ ] Möglichkeiten = 24 = 16

4 Sprechweise :

Elemente von Ak heißen auch k-Tupel aus A

4 Schreibweise : ( 3 Würfel , mit A = 1, 2, 3, 4, 5, 6 )

Möglichkeiten bei drei Würfeln ↔ 3-Tupel aus A

‚↔ ‘ hier : genaue Entsprechung ( ‚ bijektiv ‘ )

→ Wegen der genauen Entsprechung : gleiche Anzahlen

1.1 QM1_18 10

? Beispiel allgemein :

− Gegeben : Versuch mit n möglichen Ergebnissen

− Ergebnisse zusammengefasst in Menge G

− Versuch wird k Mal durchgeführt

? ] Ergebnisse des Gesamtversuchs ?

Geeignete Kodierung :

Ergebnisse des Gesamtversuchs ↔ k-Tupel aus G

→ ] Gesamtergebnisse = |Gk | = nk

? Gegeben ist eine Urne U mit n Kugeln

− Es wird k Mal mit Zurücklegen gezogen

− Reihenfolge wird dabei berücksichtigt

? Wie viele mögliche Ergebnisse gibt es ?

Abgekürzt : k×ZmZmR

− k× Ziehen mit Zurücklegen mit Reihenfolge(berücksichtigung)

1.1 QM1_18 11

? ] Ergebnisse bei k×ZmZmR aus Urne U mit n Kugeln ?

4 U wird aufgefasst als Menge der Kugeln also |U | = n

→ Finde geeignete Kodierung !

Möglichkeiten ↔ k-Tupel aus U

− Übersetzung : j-te Komponente = Kugel des j-ten Zugs

? (2, 4, 1, 2) : 1. Zug : 2 , 2. Zug : 4 , 3. Zug : 1 , 4. Zug : 2

→ ] Anzahl Möglichkeiten = nk

? Weiteres Beispiel

− Gegeben : b Buntstifte und f Fächer

? ] Möglichkeiten, die Buntstifte auf die Fächer zu verteilen ?

− Es können mehrere Buntstifte in das gleiche Fach kommen

− Fächer können auch leer bleiben

→ Geeignete Kodierung ?

Menge der Fächer : F

Verteilmöglichkeiten ↔ b -Tupel aus F

− j-te Komponente : Fach für den j-ten Buntstift

? (4, 3, 4, 5) : 1. Stift : 4. Fach , 2. Stift : 3. Fach , etc.

→ ] Verteilmöglichkeiten = |F b | = f b

1.1 QM1_18 12

? Beispiel : Wie groß ist die Mächtigkeit der Potenzmenge ?

♦ Ist A eine Menge , so ist die Potenzmenge von A die Mengealler Teilmengen von A

Bezeichnung : P(A)

→ Formal : P(A) := B |B ⊆ A

? A = a, b → P(A) = ∅, a, b, a, b

? A = a → P(A) = ∅, a

? A = ∅ → P(A) = ∅

? Wie groß ist | P(A) | , wenn |A | = n ?

→ Finde geeignete Kodierung !

Elemente von A ordnen

Teilmengen B von A ↔ n-Tupel aus 0, 1

− j-te Komponente des n-Tupels : j-tes Element von A in B ?

? Ist A = 1, 2, 3, 4, 5 , so :

− 1, 3, 4 ↔ (1, 0, 1, 1, 0)

− ∅ ↔ (0, 0, 0, 0, 0)

→ ] Teilmengen von A = ] n-Tupel aus 0, 1 = 2n

1.1 QM1_18 13

→ Lexikographische Reihenfolge

→ Nützliches Hilfsmittel , auch zur Kontrolle :

− Systematisches Auflisten aller Möglichkeiten ( dann : Zählen )

? Geeignete Systematik ?

→ Wie im Lexikon

Voraussetzung : Einzelelemente müssen geordnet sein (werden )

? 4×ZmZmR aus A = a, b, c

Geeignete Kurznotation wählen : abac für (a, b, a, c)

→ Ergebnis der lexikographischen Anordnung ( spaltenweise )

aaaa abaa acaa baaa bbaa bcaa caaa cbaa ccaa

aaab abab acab baab bbab bcab caab cbab ccab

aaac abac acac baac bbac bcac caac cbac ccac

aaba abba acba baba bbba bcba caba cbba ccba

aabb abbb acbb babb bbbb bcbb cabb cbbb ccbb

aabc abbc acbc babc bbbc bcbc cabc cbbc ccbc

aaca abca acca baca bbca bcca caca cbca ccca

aacb abcb accb bacb bbcb bccb cacb cbcb cccb

aacc abcc accc bacc bbcc bccc cacc cbcc cccc

→ Tatsächlich : 81 = 34 Möglichkeiten

1.1 QM1_18 14

→ Gleich wahrscheinliche Ergebnisse

♣ Situation : Versuch mit endlich vielen möglichen Ergebnissen

− Alle Ergebnisse werden als gleich wahrscheinlich angesehen

→ Wahrscheinlichkeit eines Ereignisses dann :

] günstige Ergebnisse] Ergebnisse insgesamt

? Beispiel : Einmal Würfeln

− Mögliche Ergebnisse : 1, 2, 3, 4, 5, 6

− Gleichwahrscheinlichkeit sei plausibel

? Mögliches Ereignis : ‚ Gerade Zahl ‘

Günstige Ergebnisse : 2, 4, 6

→ Wahrscheinlichkeit für ‚ Gerade Zahl ‘ :

] günstige Ergebnisse] Ergebnisse insgesamt

=3

6=

1

2

1.1 QM1_18 15

→ Modell der Gleichwahrscheinlichkeit etwas formaler

Unterscheide : Ergebnisse und Ereignisse

? Beispiel : Würfeln

− Ergebnisse : 1 , 2 , 3 , 4 , 5 , 6

− Ereignis beispielsweise : ‚ Gerade Zahl ‘

B Ereignisse ‚ bestehen aus ‘ Ergebnissen

Menge aller Ergebnisse : Meist Ω

? Würfelbeispiel : Ω = 1, 2, 3, 4, 5, 6

Identifiziere Ereignisse mit Teilmengen von Ω

− nämlich mit denen aus den jeweils ‚ günstigen Ergebnissen ‘

? ‚ Gerade Zahl ‘ entspricht dann A = 2, 4, 6

Bei Gleichwahrscheinlichkeit aller Ergebnisse dann :

− Wahrscheinlichkeit eines Ereignisses A :

P(A ) =] günstige Ergebnisse] Ergebnisse insgesamt

=|A ||Ω |

1.1 QM1_18 16

W. : Wahrscheinlichkeit

? Beispiel : Prüfung , 5 Prüflinge

− 3 Prüfungsthemen

− Wahl des Prüfungsthemas : Karte ziehen

? W. , dass alle das gleiche Thema bekommen ?

→ Finde geeignete Formalisierung !

Menge der Themen : G = 1, 2, 3

Prüfungsmöglichkeiten durch 5×ZmZmR aus G

Ω = G5 , |Ω | = |G5 | = 35 = 243

Ereignis A : ‚ Alle bekommen das gleiche Thema ‘

− Formal : A = (1, 1, 1, 1, 1) , (2, 2, 2, 2, 2) , (3, 3, 3, 3, 3)

→ P(A ) =|A ||Ω |

=3

35=

1

34=

1

81

B Modell der Gleichwahrscheinlichkeit angemessen ?

? Bei verschiedenfarbigen Karten wohl nicht !

1.1 QM1_18 17

→ Permutationen.

♦ Sei G endliche Menge , |G | = n , k ≤ n .Eine k-Permuation aus G ist ein k-Tupel ( g1 , . . . , gk ) aus G

mit gi 6= gj für alle i 6= j

? ( 3 , 5 , 1 , 2 ) ist eine 4-Permutation aus 1, 2, 3, 4, 5, 6

? Gegeben ist eine Urne U mit n Kugeln

− Es wird k Mal ohne Zurücklegen gezogen

− Reihenfolge wird dabei berücksichtigt

? Wie viele mögliche Ergebnisse gibt es ?

Abgekürzt : k×ZoZmR

− k× Ziehen ohne Zurücklegen mit Reihenfolge(berücksichtigung)

→ Finde wieder geeignete Kodierung !

Zugmöglichkeiten ↔ k-Permutationen aus U

? ( 2 , 3 , 1 ) : 1. Zug : 2 , 2. Zug : 3 , 3. Zug : 1

4 Kodierung bekannt von ZmZmR , nur ohne Wiederholungen

→ ] Zugmöglichkeiten = ] k-Permutationen aus U

1.1 QM1_18 18

? ] k-Permutationen = ?

♣ G endliche Menge , |G | = n , k ≤ n

→ Erzeugen der k-Permutationen mit Entscheidungsbaum

? G = a, b, c, d , k = 2

............................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................

.................................................................................................................................................................

............................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................

................................................................................................................................................

................................................................................................................................................

.................................................................................................................................

................................................................................................................................................

................................................................................................................................................

.................................................................................................................................

................................................................................................................................................

................................................................................................................................................

.................................................................................................................................

................................................................................................................................................

a b c d

b c d a c d a b d a b c

.................................................................................................................................................................................................................................................................................................................

B entspricht ( c , d )

B Bei der 2. Wahl :

− Wahlmöglichkeiten verschieden , aber

− Zahl der Möglichkeiten gleich ( 3 )

→ Insgesamt 4 · 3 = 12 Möglichkeiten

1.1 QM1_18 19

? ] k-Permutationen = ?

♣ G endliche Menge , |G | = n , k ≤ n

→ Erzeugen der k-Permutationen mit Entscheidungsbaum

− in k Schritten

− 1. : 1. Komponente – n Möglichkeiten

− 2. : 2. Komponente – jeweils (n− 1) Möglichkeiten

− 3. : 3. Komponente – jeweils (n− 2) Möglichkeiten

. . . . . . . . . . . .− k. : k. Komponente – jeweils (n− (k − 1)) Möglichkeiten

→ Anzahl der Möglichkeiten insgesamt :

n · (n− 1) · (n− 2) · . . . · (n− (k − 1))

Umformung :

n · (n− 1) · (n− 2) · . . . · (n− (k − 1)) · (n− k) · (n− (k + 1)) · . . . · 1(n− k) · (n− (k + 1)) · . . . · 1

→ Das istn !

(n− k) !

1.1 QM1_18 20

• ] k-Permutationen aus G mit |G | = n :

n !

(n− k ) !

? |G | = 4 , k = 2

− ] k-Permutationen :

4 !

(4− 2) !=

1 · 2 · 3 · 41 · 2

= 3 · 4 = 12

B Formel bequeme Schreibweise

− als Rechenvorschrift weniger geeignet

? 3×ZoZmR aus Urne mit 7 Elementen

→ ] Möglichkeiten :

7 !

(7− 3) != 5 · 6 · 7 = 210

? 7-köpfiger Verein , zu bilden : 3-köpfiger Vorstand

− verschiedene Ämter

? ] mögliche Vorstände ?

Übersetzung : 3×ZoZmR aus 7 Mitgliedern

→ ] mögliche Vorstände : 210

1.1 QM1_18 21

→ Spezialfall k = n

♦ Die n-Permutationen aus G mit |G | = n heißen aucheinfach Permutationen ( von G )

4 Permutationen : Mögliche Reihenfolgen der Elemente von G

• ] Permutationen von G mit |G | = n : n !

on Begründung wie bei k-Permutationen ( nur einfacher )

4 Die allgemeine Formel stimmt :

n !

(n− n) !=

n !

0 !=

n !

1= n !

B Die Definition 0 ! = 1 erweist sich als sinnvoll

? Klausur aus 5 Aufgaben

? ] Reihenfolgen der Bearbeitung ?

Die Reihenfolgen sind gerade die Permutationen der Aufgaben

→ ] Reihenfolgen der Bearbeitung : 5 ! = 120

1.1 QM1_18 22

? Urne U mit Kugeln 0 , . . . , 9 ( Ziffern )

− 3×ZmZmR ( zufällig )

→ Ergebnis : 3-stellige Zahl (wie 385 , 121 , 007 , . . . )

? W. einer Zahl ohne Ziffernwiederholung ?

→ Geeignete Modellierung

Setze U = 0, 1, . . . , 9

Ω = U 3 , |Ω | = 103 = 1000

Annahme der Gleichverteilung sei angemessen

‚ Verschiedene Ziffern ‘ : Ereignis A

Elemente von A sind gerade die 3-Permutationen aus U

→ P(A ) =|A ||Ω |

=8 · 9 · 10

1000= .72

? W., dass mindestens 2 Ziffern gleich sind ?

→ 1 − P(A ) = .28

B Gegenereignisse

1.1 QM1_18 23

→ Kombinationen.

♦ Sei G endliche Menge , |G | = n , k ≤ n .Eine k-elementige Teilmenge von G heißt auch k-Kombinationaus G

? Gegeben ist eine Urne U mit n Kugeln

− Es wird k Mal ohne Zurücklegen gezogen

− Reihenfolge wird nicht berücksichtigt

? Wie viele mögliche Ergebnisse gibt es ?

Abgekürzt : k×ZoZoR

− k× Ziehen ohne Zurücklegen ohne Reihenfolge(berücksichtigung)

→ Finde wieder geeignete Kodierung !

Zugmöglichkeiten ↔ k-Kombinationen aus U

− Teilmenge der gezogenen Kugeln

→ ] Zugmöglichkeiten = ] k-Kombinationen aus U

B Im Ergebnis dasselbe wie Ziehen aller Kugeln auf einmal

1.1 QM1_18 24

4 Erinnerung : Bei Mengen spielt die Reihenfolge keine Rolle

? a , b , c , d = d , b , a , c ( = d , b , d , c , a etc. )

? Lexikographische Auflistung der 3-Kombinationen aus a, b, c, d, e

Elemente sind schon in natürlicher Weise geordnet

Geeignete Kurznotation vereinbaren : abe statt a , b , e

Elemente einer Teilmenge in natürlicher Ordnung notieren

→ Auflistung :

abc abd abe acd ace ade bcd bce bde cde

1.1 QM1_18 25

? ] k-Kombinationen aus G ? ( |G | = n )

→ Anzahl sei x

? Neue Frage : ] k-Permutationen ?

− Antwort bekannt : n ! / (n− k) !

Trotzdem : Neue Antwort finden !

→ Herstellung der k-Permutationen in zwei Schritten

1. Wahl der k Elemente der Permutation ( ohne Ordnung )

− x Möglichkeiten

2. Wahl einer Reihenfolge der gewählten Elemente

− Jeweils k ! Möglichkeiten

→ ] k-Permutationen : x · k !

Gleichsetzen :

x · k ! =n !

(n− k) !

→ Auflösen :

x =n !

k ! (n− k) !

1.1 QM1_18 26

• Sei G endliche Menge , |G | = n , k ≤ n .Die Anzahl der k-Kombinationen aus G ist dann

n !

k ! (n− k) !

? 3×ZoZoR aus Urne mit 5 Kugeln

n = 5 , k = 3

→5 !

3 ! (5− 3) !=

5 !

3 ! 2 !=

4 · 51 · 2

=2 · 51 · 1

= 10

B Kürzungsoperationen möglichst ökonomisch !

♦ Die Zahlen (n

k

):=

n !

k ! (n− k) !

heißen auch Binomialkoeffizienten

Sprechweise : n über k

BBinomialkoeffizient

.......

.......

.......

.......

.......

.......

.......

....................

...................

kein n !!!

1.1 QM1_18 27

→ Eigenschaften der Binomialkoeffizienten

•(n

k

)=

(n

n− k

)

on(

n

n− k

)=

n !

(n− k) ! (n− (n− k)) !

=n !

(n− k) ! k !=

n !

k ! (n− k) !=

(n

k

)

•(n

0

)=

(n

n

)= 1

on(n

0

)=

n !

0 ! (n− 0) !=

n !

1 · n != 1

4 Insbesondere :(

0

0

)= 1

•(n

1

)=

(n

n− 1

)= n

on(n

1

)=

n !

1 ! (n− 1) !=

n !

1 · (n− 1) != n

1.1 QM1_18 28

→ Eigenschaften anschaulich :

→(n

k

)=

(n

n− k

)

Gegeben G mit |G | = n

Mit Komplementbildung :

k-elementige Teilmengen ↔ (n− k)-elementige Teilmengen

? Mit G = 1, 2, 3, 4, 5, 6 :

? A = 1, 3, 4, 6 ↔ Ac = 2, 5

→ ] k-elementige Teilmengen = ] (n− k)-elementige Teilmengen

→(n

0

)=

(n

n

)= 1

→ Es gibt eine Teilmenge mit 0 Elementen ( ∅ )

→ Es gibt eine Teilmenge mit n Elementen (G selber )

→(n

1

)= n

→ Entsprechung : Elemente ↔ 1-elementige Teilmengen

− a ↔ a

1.1 QM1_18 29

→ Binomische Formeln

? ( a+ b )n = ?

? (a+ b)3 = (a+ b)(a+ b)(a+ b)

= aaa+ aab+ aba+ abb+ baa+ bab+ bba+ bbb

= a3 + a2b + a2b+ ab2 + a2b + ab2 + ab2 + b3

= a3 + 3 a2b + 3 ab2 + b3

→ Schritte :

− Alles ausmultiplizieren

− Faktoren in Produkten umordnen

− Gleiche Summanden zusammenfassen

4 Ausmultiplizieren :

− 3 ursprüngliche Faktoren (a+ b)

− Jeder davon liefert entweder a oder b

→ Alle entstehenden Produkte haben 3 Faktoren ( a oder b )

1.1 QM1_18 30

? ( a+ b )n = ?

→ Lösung :

( a+ b )n als Produkt von n Faktoren (a+ b) ausschreiben

Ausmultiplizieren

− Ergebnis : Summe von Produkten aus Faktoren a , b

− Jedes Produkt hat n solche Faktoren

Faktoren in den Produkten umordnen

− Alle Produkte haben die Form akbn−k ( k = 0, . . . , n )

Gleiche Summanden akbn−k zusammenfassen

? Wie oft kommt akbn−k vor ?

] Möglichkeiten , aus den n Faktoren (a+ b)

diejenigen k auszuwählen , die a liefern

akbn−k kommt(n

k

)Mal vor

• ( a+ b )n =n∑

k=0

(n

k

)ak bn−k

1.1 QM1_18 31

→ ( a+ b )n =n∑

k=0

(n

k

)ak bn−k

? n = 0

( a+ b )0 =0∑

k=0

(0

k

)ak b0−k =

(0

0

)a0 b0 = 1 · 1 · 1 = 1

? n = 1

( a+ b )1 =1∑

k=0

(1

k

)ak b1−k

=

(1

0

)a0 b1−0 +

(1

1

)a1 b1−1

= 1 · 1 · b + 1 · a · 1 = b + a = a + b

? n = 2

( a+ b )2 =2∑

k=0

(2

k

)ak b2−k

=

(2

0

)a0 b2−0 +

(2

1

)a1 b2−1 +

(2

2

)a2 b2−2

= 1 · 1 · b2 + 2 · a · b + 1 · a2 · 1

= b2 + 2 ab + a2 = a2 + 2 ab + b2

1.1 QM1_18 32

→ ( a+ b )n =n∑

k=0

(n

k

)ak bn−k

? n = 5

( a+ b )5 =5∑

k=0

(5

k

)ak b5−k

=

(5

0

)a0 b5−0 +

(5

1

)a1 b5−1 +

(5

2

)a2 b5−2 +

+

(5

3

)a3 b5−3 +

(5

4

)a4 b5−4 +

(5

5

)a5 b5−5

= 1 · 1 · b5 + 5 · a · b4 + 10 · a2 · b3 +

+ 10 · a3 · b2 + 5 · a4 · b1 + 1 · a5 · 1

= a5 + 5 a4b + 10 a3b2 + 10 a2b3 + 5 ab4 + b5

4 ( a − b )n = ( a + (−b) )n

1.1 QM1_18 33

→ Pascalsches Dreieck

→ Übersichtliche Anordnung der Binomialkoeffizienten

k : 0n : . 10 . . . . . 1 . 21 . . . . 1 1 . 32 . . . 1 2 1 . 43 . . 1 3 3 1 . 54 . 1 4 6 4 1 .5 1 5 10 10 5 1. . . . . . . . . . . . . . .

4 Jeder Koeffizient ist Summe der darüberliegenden

1.1 QM1_18 34

→ Nochmal : Mächtigkeit der Potenzmenge

? Wie viele Teilmengen besitzt eine Menge der Mächtigkeit n ?

→ Beantwortung in zwei Schritten :

Wie viele Teilmengen der Mächtigkeit k gibt es ?

− Dabei : k = 0 , 1 , . . . , n

Aufsummieren dieser Anzahlen

B Hier ist zu summieren !

− Aufteilung aller Möglichkeiten in disjunkte Klassen

→ Lösung also :

] Teilmengen mit Mächtigkeit k :(n

k

)

Summieren :

n∑k=0

(n

k

)=

n∑k=0

(n

k

)1k 1n−k = ( 1 + 1 )n = 2n

1.1 QM1_18 35

? ] n-Tupel aus 0 , 1 mit genau k Einsen ?

→ Finde geeignete Kodierung !

n-Tupel mit k Einsen ↔ k-elementige Teilmengen von 1, . . . , n

− Teilmenge : Stellen der Einsen

? ( 0, 1, 0, 0, 1, 1, 0 ) ↔ 2, 5, 6

4 Kodierung ist ( umgekehrt ) schon bekannt

→ ] n-Tupel mit k Einsen =

(n

k

)

? 6-köpfiger Verein braucht 2-köpfigen Vorstand

− Vorstände ganz gleichberechtigt

? ] Möglichkeiten ?

→(

6

2

)=

6 !

2 ! (6− 2) !=

6 !

2 ! 4 !=

5 · 61 · 2

= 15

1.1 QM1_18 36

♣ Gegeben : 3 M(änner) , 4 F(rauen)

? ] Möglichkeiten einer 4-köpfigen Delegation mit ≥ 2 F ?

− Delegationsmitglieder sind gleichberechtigt

→ Lösung im Überblick :

Einteilung der Möglichkeiten in disjunkte Klassen

− definiert durch die Anzahl der F

Ermittlung der ] Möglichkeiten in den einzelnen Klassen

Aufsummieren dieser Zahlen

→ Lösung konkret :

Klassen gegeben durch 2 , 3 , 4 F

? Teilproblem : ] Möglichkeiten mit genau k Frauen ?

1.1 QM1_18 37

? Teilproblem : ] Möglichkeiten mit genau k Frauen ?

? k = 2

→ Lösung in zwei Schritten :

Wahl von 2 F ( aus 4 )

− ] Möglichkeiten :(

4

2

)

Wahl von ( 4 − 2 ) = 2 M (aus 3 )

− ] Möglichkeiten :(

3

2

)

→ Jede F-Wahl kann mit jeder M-Wahl kombiniert werden

→ ] Gesamtmöglichkeiten :(

4

2

)(3

2

)= 6 · 3 = 18

? Entsprechend für k = 3 :

→ ] Gesamtmöglichkeiten :(

4

3

)(3

1

)= 4 · 3 = 12

? Entsprechend für k = 4 :

→ ] Gesamtmöglichkeiten :(

4

4

)(3

0

)= 1 · 1 = 1

1.1 QM1_18 38

→ Zurück zur Lösung :

3 disjunkte Klassen von Möglichkeiten

− 2 , 3 oder 4 F

jeweilige ] Möglichkeiten :

− 18 ( 2 F ) , 12 ( 3 F ) , 1 ( 4 F ) ,

→ ] Möglichkeiten insgesamt : Summieren

→ 18 + 12 + 1 = 31

→ Alternativlösung über das Gegenteil :

Gegenteil von ≥ 2 F : < 2 F

Hier : 1 F ( da insgesamt 3 M)

] Möglichkeiten mit 1 F : 4

] Möglichkeiten für irgendeine Delegation :(

7

4

)= 35

→ ] Möglichkeiten mit ≥ 2 F : 35 − 4 = 31

1.1 QM1_18 39

→ Hypergeometrische Verteilung

♣ Standardbeispiel : Urne mit n Kugeln ( rot oder blau )

− Davon : m rot und n−m blau

k×ZoZoR ( oder : auf einmal k Kugeln ziehen )

? W. für r rote Kugeln ? ( 0 ≤ r ≤ k )

B Voraussetzung : Alle Möglichkeiten gleich wahrscheinlich

− Kugeln seien physikalisch nicht ‚ wesentlich verschieden ‘

→ W. dann über Quotienten

] günstige Möglichkeiten] Möglichkeiten insgesamt

] Möglichkeiten insgesamt =

(n

k

)

? ] günstige Möglichkeiten = ?

1.1 QM1_18 40

? ] günstige Möglichkeiten = ?

Günstige Möglichkeit hier : r rote und k − r blaue Kugeln

→ Herstellung dieser Möglichkeiten in zwei Schritten

Wahl von r roten Kugeln ( aus m )

− ] Möglichkeiten :(m

r

)

Wahl von k − r blauen Kugeln ( aus n − m )

− ] Möglichkeiten :(n−mk − r

)

→ Jede Wahl kann mit jeder kombiniert werden

→ ] günstige Möglichkeiten :(m

r

)(n−mk − r

)

→ W. für r rote Kugeln :

(m

r

)(n−mk − r

)(n

k

)

1.1 QM1_18 41

• n Kugeln , m rot (Rest blau ) , k×ZoZoR ,− Möglichkeiten gleichwahrscheinlich

→ W. für r rote Kugeln in der Ziehung :

(m

r

)(n−mk − r

)(n

k

)

? n = 12 , m = 8 , k = 6

? W. für r = 4 rote Kugeln

(8

4

)(12− 8

6− 4

)(

12

6

) =

(8

4

)(4

2

)(

12

6

) =70 · 6924

=5

11= .4545

? W. für r = 1 rote Kugel

(8

1

)(12− 8

6− 1

)(

12

6

) =

(8

1

)(4

5

)(

12

6

) = ??

4 Geht auch nicht : 6− 1 = 5 blaue Kugeln aus 4 ziehen ?

B Herleitung war zu oberflächlich

1.1 QM1_18 42

♦ Definitionserweiterung :

(n

k

):= 0

für ganzes k mit k < 0 oder k > n

→ Dann :

? n = 12 , m = 8 , k = 6

? W. für r = 1 rote Kugel

(8

1

)(12− 8

6− 1

)(

12

6

) =

(8

1

)(4

5

)(

12

6

) =8 · 0924

= 0

→ Passt !

B Definitionserweiterung vermeidet lästige Fallunterscheidungen

1.1 QM1_18 43

? Lotto : 6 aus 49

− Zusatzzahl wird nicht berücksichtigt

? Wie wahrscheinlich sind r Richtige ? ( r = 0 , 1 , . . . , 6 )

? Wo liegt der Zufall ?

− Im Tipp ??

− In der Ziehung !

→ Voraussetzung : Alle Ziehungen sind gleich wahrscheinlich

− Plausibel ( ? )

→ Korrekte Art der Problemstellung :

− Der Tipp liegt vor ( 6 Zahlen )

− Die Kugeln werden ‚ zufällig ‘ gezogen

? W. , dass r von den 6 getippten Zahlen gezogen werden = ?

1.1 QM1_18 44

? W. , dass r von den 6 getippten Zahlen gezogen werden = ?

→ Hilfsvorstellung :

− Die getippten Zahlen sind rot , die anderen blau ( ätherisch )

→ Frage dann :

? W. für r rote Kugeln bei 6×ZoZoR

→ Zurückführung des Problems auf das Standardbeispiel

− mit n = 49 , m = 6 , k = 6

→ Lösung : Die W. für r Richtige ist

(6

r

)(49− 6

6− r

)(

49

6

) =

(6

r

)(43

6− r

)(

49

6

)

? r = 6

(6

6

)(43

6− 6

)(

49

6

) =1 · 1

13 983 816=

1

13 983 816

1.1 QM1_18 45

♣ Allgemeine Situation : n Kugeln ( rot oder blau )

− Davon : m rot und n−m blau

k×ZoZoR ( oder : auf einmal k Kugeln ziehen )

→ Neue Sichtweise :

− Die Zahl R der gezogenen roten Kugeln ist Zufallsvariable

Abkürzung : Zva

Diese Zva hat eine Verteilung

Beschreibung der Verteilung durch ihre W-Funktion : fR

4 fR gibt für jedes mögliche r die W. P(R = r ) an

→ Hier also :

− fR ordnet r die W. für Ziehung mit r roten Kugeln zu

→ Die W.-Funktion ist hier gegeben durch

fR(r) =

(m

r

)(n−mk − r

)(n

k

) ( r = 0 , . . . , k )

1.1 QM1_18 46

♦ Ist n > 0 , 0 ≤ m, k ≤ n , und ist die Verteilung einer Zva R

durch die W-Funktion fR mit

fR(r) =

(m

r

)(n−mk − r

)(n

k

) ( r = 0 , . . . , k )

gegeben , so heißt die Verteilung von R auch hypergeometrischeVerteilung mit den Parametern n , m , k

Abkürzung für diese Verteilung : H(n , m , k)

Abkürzung dafür , dass R diese Verteilung hat : R ∼ H(n , m , k)

? Ist R Zahl der Richtigen im Lotto 6 aus 49 , so gilt

R ∼ H(49 , 6 , 6)

? Gegeben : 3 M(änner) , 5 F(rauen)

− Durch Losen wird eine 4-köpfige Delegation gebildet

→ Ist R die Zahl der F in der Delegation , so gilt

R ∼ H(8 , 5 , 4)

1.1 QM1_18 47

? Die H(49 , 6 , 6)-Verteilung

? Lotto , 6 aus 49

− R : Zahl der Richtigen

− R ∼ H(49 , 6 , 6)

Verteilung von R über die W-Funktion

− Exakte Werte : hier ungekürzt , gleicher Nenner

r P(R = r) exakt P(R = r) gerundet0 6096454/13983816 0.4359651 5775588/13983816 0.4130192 1851150/13983816 0.1323783 246820/13983816 0.0176504 13545/13983816 0.0009695 258/13983816 0.0000186 1/13983816 7.15×10−8

13983816/13983816 1

0 1 2 3 4 5 60.1

.5 r rr r r r r

............................................................................................................................................................

...................................................................................................................................................

....................................................... .. .. ..

r

P(R = r)

1.1 QM1_18 48

? Lotto , 6 aus 49

? W. für mindestens 3 Richtige ?

Anders formuliert : P(R ≥ 3 ) = ?

→ ‚ R ≥ 3 ‘ setzt sich zusammen aus

‚ R = 3 ‘ , ‚ R = 4 ‘ , ‚ R = 5 ‘ , ‚ R = 6 ‘

Möglichkeiten sind ‚ disjunkt ‘

→ Wn addieren sich

P(R ≥ 3 ) = P(R = 3 ) + P(R = 4 ) + P(R = 5 ) + P(R = 6 )

= .017650 + .000969 + .000018 + .0000000715

= .01864

1.1 QM1_18 49

? Die H(8 , 5 , 4)-Verteilung

? Auslosen einer Delegation von 4 aus 3 M und 5 F

− R : Zahl der F

− R ∼ H(8 , 5 , 4)

Verteilung von R über die W-Funktion

− Exakte Werte : hier ungekürzt , gleicher Nenner

r P(R = r) exakt P(R = r) gerundet0 0/70 01 5/70 0.0714292 30/70 0.4285713 30/70 0.4285714 5/70 0.071429

70/70 1

0 1 2 3 40.1

.5

r r

r r

r..

..........................

.........................................................................................................................................................

.........................................................................................................................................................

..........................

r

P(R = r)

1.1 QM1_18 50

Elementare W-Theorie.

→ Ziel : Etwas vereinfachte Theorie endlicher W-Räume

→ Formalisierung des Konzeptes ‚ Wahrscheinlichkeit ‘

→ Grundbegriffe :

− Grundgesamtheit , Ergebnisse

− Ereignisse

− W-Maße

Ergebnisse sind die möglichen Ausgänge eines Versuchs oderZufallsexperiments

− In adäquater Genauigkeit beschrieben

− Ohne ‚ irrelevante ‘ Aspekte

? Würfel zeigt eine 6

? I.A. irrelevant : Würfel fällt auf die-und-die Stelle des Tisches

♦ Die Grundgesamtheit ist die Menge der möglichen Ergebnisse

Symbol meist Ω

♣ Ω : zunächst immer mit endlicher Mächtigkeit

1.2 QM1_18 51

? Würfeln

− Ω = 1, 2, 3, 4, 5, 6

? Würfeln mit zwei Würfeln ( unterscheidbar )

− Ω = 1, 2, 3, 4, 5, 6 × 1, 2, 3, 4, 5, 6

? (2, 5) : Erster Würfel : 2 , zweiter Würfel : 5

? Zufälliges Ziehen eines Studierenden

− Elementarbaustein für das Ziehen einer Stichprobe

Dazu : M : Menge der Männer , F : Menge der Frauen

G = M ∪ F

→ Ω = G

1.2 QM1_18 52

? Zufälliges Ziehen von 2 Studierenden aus G = M ∪ F

− Stichprobe vom Umfang 2

? Ω = ?

Wie wird gezogen ?

ZmZmR

− Ω = G×G

ZoZmR

− Ω = G×G \ (g, g) | g ∈ G

ZoZoR

− Ω = A | A ⊆ G , |A | = 2

? Roulette

− Ω = 0, 1, . . . , 36

1.2 QM1_18 53

→ Ereignisse

? Worauf sollen sich Wn beziehen ?

? ‚ Gerade Zahl ‘ beim Würfeln

? ‚ Rouge ‘ beim Roulette

? ‚ 4 Richtige‘ im Lotto

? ‚ 2 Männer ‘ beim Ziehen einer 2-er Stichprobe aus G = M ∪F

B Diese Beispiele : keine Ergebnisse

→ Sinnvoll : Einführung eines adäquaten Begriffs

→ Begriff des ‚ Ereignisses ‘

→ geeignete Formalisierung ?

1.2 QM1_18 54

→ Formalisierung des intuitiven Begriffs ‚ Ereignis ‘

Bei ‚ Ereignissen ‘ :

− ‚ Passende ‘ und ‚ nicht passende ‘ Ergebnisse

? ‚ Gerade Zahl ‘ beim Würfeln

? 2 ‚ passt ‘ , 5 ‚ passt nicht ‘

? ‚ 2 Männer ‘ bei 2×ZoZmR aus G = M ∪ F

? (Max , Moritz ) ‚ passt ‘ , ( Fritz , Heidi ) ‚ passt nicht ‘

Zusammenfassung der ‚ passenden ‘ Ergebnisse

− zu einer Teilmenge von Ω

? Würfeln , Ω = 1, 2, 3, 4, 5, 6

? ‚ Gerade Zahl ‘ → 2, 4, 6

? Würfeln mit 2 Würfeln , Ω = 1, 2, 3, 4, 5, 6 2

? ‚ Augensumme 5 ‘ → (1, 4), (2, 3), (3, 2), (4, 1)

1.2 QM1_18 55

? Zufälliges Ziehen eines Studierenden , Ω = G = M ∪ F

? ‚ Ziehen einer Frau ‘ → F

? Zufälliges Ziehen von 2 Studierenden aus G = M ∪ F

? ‚ Ziehen von 2 Männern ‘ → ?

ZmZmR , Ω = G×G

? ‚ Ziehen von 2 Männern ‘ → M ×M

ZoZoR , Ω = A | A ⊆ G , |A | = 2

? ‚ Ziehen von 2 Männern ‘ → A | A ⊆M , |A | = 2

? Roulette

? ‚ Rouge ‘ →

1, 3, 5, 7, 9, 12, 14, 16, 18, 19, 21, 23, 25, 27, 30, 32, 34, 36

? ‚ Manque ‘ → 1, 2, . . . , 18

1.2 QM1_18 56

4 Bisher : ‚ natürliche ‘ Zuordnung :

‚ Ereignisse ‘ → Teilmengen von Ω

→ Präzisierender Schritt :

− Ereignisse sind Teilmengen von Ω

→ Bei endlichen Grundgesamtheiten sogar ( etwas vereinfachend ) :

− Alle Teilmengen von Ω sind Ereignisse

4 Ereignisse und Teilmengen von Ω sind dasselbe

Sprechweise : Ereignis A tritt ein heißt :

− Für das Ergebnis ω des Versuchs gilt ω ∈ A

? Würfeln , A = 2, 4, 6 ( ‚ Gerade Zahl ‘ )

? Ergebnis ist 2 → A tritt ein

? Ergebnis ist 5 → A tritt nicht ein

1.2 QM1_18 57

→ Besondere Ereignisse

− Ω tritt immer ein

♦ Ω heißt das sichere Ereignis

− ∅ tritt nie ein

♦ ∅ heißt das unmögliche Ereignis

→ Sonderfall : Einelementige Ereignisse

? Würfeln : 6 ( ‚ Es fällt eine 6 ‘ )

B Unterscheide :

− Ergebnis 6

− Ereignis 6

4 Unterscheidung hier etwas künstlich

Einelementige Ereignisse heißen auch Elementarereignisse

1.2 QM1_18 58

→ Ereignisraum

Fasse alle Ereignisse zu einer Menge zusammen

→ Resultat : P( Ω )

♦ P( Ω ) heißt auch Ereignisraum oder Ereignisalgebra

4 ( Voraussetzung : |Ω | ist endlich )

? Anzahl der Ereignisse ?

• Ist |Ω | = n , so | P( Ω ) | = 2n

? Würfeln ( Ω = 1, 2, 3, 4, 5, 6 )

− ] Ergebnisse : 6

− ] Ereignisse : 26 = 64

1.2 QM1_18 59

→ Ereignisse und Mengenoperationen

4 Mengenoperationen mit Ereignissen → neue Ereignisse

4 Möglichkeit des ‚ Rechnens ‘ mit Ereignissen

B Daher die Bezeichnung Ereignisalgebra für P( Ω )

? Durchgehendes Beispiel : 2×ZmZmR aus G = M ∪ F

− Ω = G2

P1 : erste gezogene Person , P2 : zweite gezogene Person

− A = M × G (P1 ist M(ann) )

− B = G × F (P2 ist F(rau) )

1.2 QM1_18 60

Mengenoperation ∪

? Ereignis A ∪ B ?

A ∪ B tritt ein , wenn für Ergebnis ω gilt : ω ∈ A ∪ B

wenn also ω ∈ A oder ω ∈ B ( oder beides )

wenn also A eintritt oder B eintritt ( oder beides )

→ A ∪ B : A tritt ein oder B tritt ein ( oder beides )

B ‚ Oder ‘ hier ‚ nicht ausschließend ‘

? 2×ZmZmR aus G = M ∪ F , A = M × G , B = G × F

− A ∪ B = (M × G ) ∪ (G × F )

− P1 ist M oder P2 ist F ( oder beides )

A ∪ B tritt ein bei den Ergebnissen

? (Max, Moritz ) , ( Petra, Erna ) , ( Pierre, Joelle)

? A ∪ B tritt nicht ein beim Ergebnis (Nastasja, Ivan )

1.2 QM1_18 61

Mengenoperation ∩

? Ereignis A ∩ B ?

A ∩ B tritt ein , wenn für Ergebnis ω gilt : ω ∈ A ∩ B

wenn also ω ∈ A und ω ∈ B

wenn also A eintritt und B eintritt

→ A ∩ B : A tritt ein und B tritt ein

? 2×ZmZmR aus G = M ∪ F , A = M × G , B = G × F

− A ∩ B = (M × G ) ∩ (G × F ) = M × F

− P1 ist M und P2 ist F

? A ∩ B tritt ein beim Ergebnis ( Eusebius, Genoveva )

A ∩ B tritt nicht ein bei den Ergebnissen

? ( Pere, Pau ) , (Daisy, Mary ) , (Mercedes, Ramón)

1.2 QM1_18 62

Mengenoperation c

? Ereignis Ac ?

Ac tritt ein , wenn für Ergebnis ω gilt : ω ∈ Ac

wenn also ω /∈ A

wenn also A nicht eintritt

→ Ac : A tritt nicht ein

? 2×ZmZmR aus G = M ∪ F , A = M × G

− Ac = (M × G )c = F × G

− P1 ist nicht M ( also : P1 ist F )

? Ac tritt ein bei den Ergebnissen

? ( Bertha, Martha ) , ( Julia, Romeo )

? Ac tritt nicht ein bei den Ergebnissen

? (Hans, Hans ) , ( Romeo, Julia )

1.2 QM1_18 63

Mengenoperation \

? Ereignis A \B ?

A \B tritt ein , wenn für Ergebnis ω gilt : ω ∈ A \B

wenn also ω ∈ A , aber nicht ω ∈ B

wenn also A eintritt , aber B nicht eintritt

→ A \B : A tritt ein , B jedoch nicht

? 2×ZmZmR aus G = M ∪ F , A = M × G , B = G × F

− A \B = (M × G ) \ (G × F ) = M × M

− P1 ist M , P2 aber nicht F ( also : P1 und P2 sind M )

? A \B tritt ein beim Ergebnis (Hans, Franz )

A \B tritt nicht ein bei den Ergebnissen

? ( Eugen, Lisa ) , (Anna, Anna ) , ( Papagena, Papageno)

1.2 QM1_18 64

? Ausschließendes Oder

? Wie ist ausschließendes Oder zu formulieren ?

→ Beispielsweise so : (A ∪ B) \ (A ∩ B )

− A oder B tritt ein , nicht aber beide

− Also : Genau eines der Ereignisse A , B tritt ein

? 2×ZmZmR aus G = M ∪ F , A = M × G , B = G × F

− (A ∪ B)\(A ∩ B ) = ( (M × G ) ∪ (G × F ) )\(M × F )

− P1 ist M oder P2 ist F , aber nicht beides

(A ∪ B) \ (A ∩ B ) tritt ein bei den Ergebnissen

? (Hermann, Heinrich ) , (Gerda, Gerda )

(A ∪ B) \ (A ∩ B ) tritt nicht ein bei den Ergebnissen

? (Hermann, Hilde ) , (Hilde, Hermann )

1.2 QM1_18 65

→ Aussagen über Ereignisse in Mengensprache

? Beispiele hier : Experiment Würfeln mit 2 Würfeln

− Ω = 1, 2, 3, 4, 5, 6 2

S : Abkürzung für Augensumme

A ∩ B = ∅

− A und B können nicht beide eintreten

In diesem Fall heißen A und B auch disjunkt

? A : ‚ S > 8 ‘ und B : ‚ 1. Würfel zeigt 1‘ sind disjunkt

A ∪ B = Ω

− Es tritt immer (mindestens ) eines der Ereignisse A , B ein

? Für A : ‚ S > 4 ‘ und B : ‚ S < 9 ‘ gilt A ∪ B = Ω

1.2 QM1_18 66

A ⊆ B

? Bedeutung ?

Wenn A eintritt , so gilt für Ergebnis ω : ω ∈ A

Wegen A ⊆ B gilt dann auch ω ∈ B

Es tritt also auch B ein

→ A ⊆ B : Wenn A eintritt , so tritt auch B ein

? Für A : ‚ 1. Würfel ≥ 5 ‘ und B : ‚ S ≥ 4 ‘ gilt A ⊆ B

? Noch ein Beispiel mit zwei Würfeln

− G = 2, 4, 6 , U = 1, 3, 5

− A : ‚ S ist gerade ‘

→ G × U ⊆ Ac

Wenn 1. Würfel : gerade Zahl und 2. Würfel : ungerade Zahl

→ so gilt : Augensumme nicht gerade

1.2 QM1_18 67

→ Gegenereignisse

♦ Ist A Ereignis , so heißt Ac auch Gegenereignis von A

4 Wegen (Ac)c = A ist A auch Gegenereignis von Ac

Sprechweise auch : A und Ac sind Gegenereignisse

→ Eigenschaften von Gegenereignissen :

− A ∩ Ac = ∅

− A ∪ Ac = Ω

4 Es tritt immer genau eines der Ereignisse A , Ac ein

? Ein Würfel , G = 2, 4, 6 , U = 1, 3, 5

− Das Gegenereignis von G ist U

? Zwei Würfel , G = 2, 4, 6 , U = 1, 3, 5

− Das Gegenereignis von G×1, 2, 3, 4, 5, 6 ist U×1, 2, 3, 4, 5, 6

1.2 QM1_18 68

→ Disjunkte Zerlegungen

♦ Sind A1, . . . , An, A ⊆ Ω , so heißt (A1, . . . , An ) disjunkteZerlegung von A , falls

(i) Ai ∩ Aj = ∅ für i 6= j

(ii) A1 ∪ A2 ∪ . . . ∪ An = A

Abkürzung : d.Z.

? (A , Ac ) ist d.Z. von Ω

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................................................................................................

............................................................................... .............................................................................................................................................................

................................................................. ...............................................................................................................................................

........................................................ ......................................................................................................................................

.................................................... ..................................................................................................................................

.................................................. .................................................................................................................................

.................................................... ..................................................................................................................................

........................................................ ......................................................................................................................................

................................................................. ...............................................................................................................................................

............................................................................... .............................................................................................................................................................

.................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................................................................................................

...........................................................................

.............................................................................................................

................................................................................................................................

..........................................................................................................................................

...............................................................................................................................................

.............................................................................................................................................

......................................................................................................................................

.......................................................................................................................

...............................................................................................

.............................................

............................................................................................................A

Ω

? (A \B , A ∩B ) ist d.Z. von A

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

.......................................................................................................................................................................................................................................................................................................................................................................... .......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

............................................

...........................................................................................................................................................................................................................................................................................................................................

........

...........................................................................

.............................................................................................................

................................................................................................................................

..........................................................................................................................................

...............................................................................................................................................

.................................................

.................................................

....................

....................

............................................................................................................A ............................................................................................................ B

1.2 QM1_18 69

? (A \B , B \ A , A ∩B ) ist d.Z. von A ∪ B

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

.......................................................................................................................................................................................................................................................................................................................................................................... .......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

....................................................................................

.................................................................................................................

..................................................................................................................................

.......................................................................................................................

...................................................................................

....................................................................

........................................................

...........................................

............................

....................................................................................

.................................................................................................................

..................................................................................................................................

.......................................................................................................................

...................................................................................

....................................................................

........................................................

...........................................

............................

............................................

...........................................................................................................................................................................................................................................................................................................................................

........

............................................................................................................A ............................................................................................................ B

? (A , B \ A ) ist noch eine d.Z. von A ∪ B

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

.......................................................................................................................................................................................................................................................................................................................................................................... .......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

........................................................................................

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

........................................................................................ ....................

....................

.................................................

.................................................

...............................................................................................................................................

..........................................................................................................................................

................................................................................................................................

.............................................................................................................

...........................................................................

............................................................................................................A ............................................................................................................ B

? 6×ZoZoR aus G ( 10 Personen, davon 5 F(rauen) )

− Ω = A | A ⊆ G , |A | = 6

Bj : ‚ j gezogene Personen sind F ‘ ( j = 0, . . . 6 )

→ (B0 , . . . , B6 ) ist d.Z. von Ω

4 B0 = B6 = ∅

→ Auch (B1 , . . . , B5 ) ist d.Z. von Ω

1.2 QM1_18 70

→ Erinnerung : Funktionen

♦ Eine Funktion f : D → W ordnet jedem Elementdes Definitionsbereichs D eindeutig ein Element desWertebereichs W zu

Statt ‚ Funktion ‘ auch ‚ Abbildung ‘

? Beispiel : f : R → R mit f(x) = x2

1

1

......................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

x

f(x)..................................................................................................................................................................................................................................................................................................................................................................

....................................................................................................................................................................................................................................................................................................................

Kurzschreibweise auch : f : x 7→ x2

− Voraussetzung : Definitions- und Wertebereich sind klar

‚ 7→ ‘ auch bei konkreten Werten : 2 7→ 22 = 4

4 Genauer Wertebereich nicht so wichtig , solange passend

? bei x 7→ x2 Wertebereich auch [ 0, ∞ ) statt R

1.2 QM1_18 71

→ W-Maße

♦ Ist Ω 6= ∅ endliche Grundgesamtheit , so heißt eine Funktion

P : P( Ω ) → R

ein W-Maß auf Ω , falls folgende Bedingungen erfüllt sind :

(i) P(A) ≥ 0 für alle A ⊆ Ω

(ii) P(Ω) = 1

(iii) P(A ∪ B) = P(A) + P(B) falls A ∩ B = ∅

(i) : ‚ Positivität ‘ , (ii) : ‚ Normierung ‘ , (iii) : ‚ Additivität ‘

(i) , (ii) , (iii) : W-Axiome

? Idealer Würfel , Ω = 1, 2, 3, 4, 5, 6

− Durch P(A) := |A | / |Ω | wird ein W-Maß definiert

→ Axiome nachprüfen !

? P( ‚ Gerade Zahl ‘ ) = P(2, 4, 6) = 3/6 = 1/2

B Dies W-Maß trifft die Intuition

→ Allgemein bei ‚ gleichwahrscheinlichen Ergebnissen ‘

− P(A) := |A | / |Ω | liefert plausibles W-Maß

‚ Gleichverteilung ‘

1.2 QM1_18 72

→ Flächenanalogie

Hilfreich : Vorstellung der Ereignisse als Teilflächen einerGesamtfläche Ω

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

.......................................................................................................................................................................................................................................................................................................................................................................... .......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

............................................................................................................A ............................................................................................................ BΩ

W-Maß hat dann die Eigenschaften eines Flächenmaßes

? 3. Axiom :

P(A ∪ B) = P(A) + P(B) falls A ∩ B = ∅

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

....................................................................................................................................................................

...................................................................................................................................................................................................................................................................................................................................................................................................................................................................

........................................

.................................

................................................................................................................................................................................................................................................................................................................................................................................................................

............................................................................................................A ............................................................................................................ BΩ

→ W-Maße verhalten sich ähnlich wie Flächenmaße

4 In Mathematik (Maßtheorie ) einheitliche Behandlung

1.2 QM1_18 73

4 Bemerkungen

4 W-Maß als Funktion passt als Formalisierung zu

‚ Jedes Ereignis hat eine Wahrscheinlichkeit ‘

4 Verzicht auf Definition von ‚ Wahrscheinlichkeit ‘

− Nur Formulierung von Eigenschaften , denen ( hoffentlich )jeder zustimmen kann ( der an Wn glaubt )

4 Frage ‚ Gibt es Wn ‘ (Wo ? ) bleibt unberührt

4 Definition ohne quantitative Festlegungen

B Solche Festlegungen müssen bei Anwendungen gemacht werden

→ W-Modelle für gegebene Bereiche

? W-Modell für Würfeln : Gleichverteilung

? Richtig für einen bestimmten konkreten Würfel ?

− Völlige Symmetrie ? Unwuchten ?

? ‚ Richtig ‘ ?? oder besser : ‚ Angemessen ‘ ?

4 Gleichverteilungsmodell richtig für idealen Würfel

− Wo gibt es den ? Im Ideenhimmel ?

− Richtigkeit hier tautologisch

B ‚ Idealer Würfel ‘ durch Gleichverteilung definiert

1.2 QM1_18 74

→ ‚ Statistiker haben die W. von ... zu ... berechnet ‘

4 Suggeriert grobes Missverständnis

B Statistiker können gar nichts ausrechnen

− außer für ideale Situationen

− oder ( konkrete Situationen ) unter Modellannahmen

− die mehr oder weniger plausibel sind

? ‚ W. für 6 Richtige im Lotto ist 1/13983816 ‘

− Stimmt für die ideale Lottotrommel (wo ist die ? )

− wenn es keine prophetischen Fähigkeiten gibt

4 Aufgabe der Statistik :

− Entscheidung zwischen verschiedenen W-Modellen

? Ist dieser Würfel fair oder nicht ?

− Kann das Gleichverteilungsmodell verworfen werden ?

4 Für unendliche Grundgesamtheiten ist Definition des W-Maßeszu modifizieren

1.2 QM1_18 75

→ Frequentistische W-Interpretation

→ W. ist Grenzwert relativer Häufigkeiten ( r.H. )

? Frage : W. der 6 beim Würfeln ?

Es wird 180 Mal gewürfelt

Kumulative Bildung der r.H. der 6

Anfang der Daten : 52523 26612 15324 65213

Würfe ] 6en Kumulierte r.H. Dezimal5 0 0/5 .000

10 2 2/10 .20015 2 2/15 .13320 3 3/20 .150

Konvergenz :

10

.1

.5

1

........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ...................

50 100 150 n

r.H.

1/6 = .1666...rrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr...............................................................................................................................................................................................................................................................................

1.2 QM1_18 76

Konvergenz der r.H. : Empirische Tatsache ?

Konvergenz kann auch in W-Theorie bewiesen werden

→ Rechtfertigung der frequentistischen Interpretation !

! Genauer hinsehen !

Aussage der W-Theorie etwa :

− Konvergenz tritt auf mit Wahrscheinlichkeit 1

→ Zirkel !

→ Trotzdem :

− Intutition von W. als Grenzwert von r.H. ist naheliegend

− Oft nützlich bei der Plausibilisierung neuer Konzepte

1.2 QM1_18 77

→ W-Räume

♦ Eine Grundgesamtheit Ω mit einem W-Maß P heißt auchWahrscheinlichkeitsraum (W-Raum )

Formale Schreibweise : < Ω , P >

♦ Ist das W-Maß P eines W-Raums < Ω , P > gegeben durch

P(A) =|A ||Ω |

,

so heißt < Ω , P > auch Laplaceraum

B Modell der ‚ Gleichwahrscheinlichkeit ‘ der Ergebnisse

? Idealer Würfel

? ‚ Zufälliges ‘ Stichprobenziehen

4 Annahme eines Laplaceraums ist im Einzelfall zu prüfen

1.2 QM1_18 78

→ Folgerungen aus den Axiomen

• Ist (A1, . . . An) d.Z. von A so gilt :

P(A) =n∑

i=1

P(Ai)

on Zunächst n = 2

A = A1 ∪ A2 mit A1 ∩ A2 = ∅

Axiom (iii) : P(A) = P(A1 ∪ A2) = P(A1) + P(A2)

Nun : n = 3 , (A1, A2, A3) ist d.Z. von A (= A1 ∪A2 ∪A3)

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

....................................................................................................................................................................

...................................................................................................................................................................................................................................................................................................................................................................................................................................................................

........................................

.................................

................................................................................................................................................................................................................................................................................................................................................................................................................

....................................................................................................................................................................

............................................................................................................A1............................................................................................................ A3

.............................................................................................................

A2

Ω

((A1 ∪ A2), A3) ist d.Z. von A

P(A) = P(A1 ∪ A2) + P(A3) ( hier : ‚ n = 2 ‘ )

(A1, A2) ist d.Z. von A1 ∪ A2

P(A1 ∪ A2) = P(A1) + P(A2) ( schon gezeigt )

→ P(A) = P(A1 ∪ A2) + P(A3) = P(A1) + P(A2) + P(A3)

Analog : Von n = 3 zu n = 4 zu n = 5 . . .

1.2 QM1_18 79

• P(A) + P(Ac) = 1

on (A,Ac) ist d.Z. von Ω

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

........................................

..........................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................

....................................................... ..............................................................................................................

............................................. ....................................................................................................

....................................... ..............................................................................................

.................................... ...........................................................................................

................................... ..........................................................................................

.................................... ...........................................................................................

....................................... ..............................................................................................

............................................. ....................................................................................................

....................................................... ..............................................................................................................

.................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................

.....................................................

............................................................................

.........................................................................................

.................................................................................................

....................................................................................................

...................................................................................................

..............................................................................................

....................................................................................

..................................................................

................................

............................................................................AΩ

4 Wn von Gegenereignissen addieren sich zu 1

• P(A) ≤ 1 für alle A

on P(A) + P(Ac) = 1 und P(Ac) ≥ 0 (Ax. (i) )

• P(Ac) = 1− P(A)

• P(∅) = 0

on ∅ = Ωc

! Umkehrung muss nicht gelten :

− Aus P(A) = 0 folgt nicht A = ∅

1.2 QM1_18 80

• Aus A ⊆ B folgt P(A) ≤ P(B)

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

.......

.....................................

....................................................................................................................................................................................

............................................................................................................B

..................................................................................................................

...............

A

Ω

on (A, B \ A) ist d.Z. von B

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

.......

.....................................

....................................................................................................................................................................................

............................................................................................................ ..................................................

................... ................................................................... .......................................................................... ........................................................................................ ....................................................................................................................................................................................................................................................................................................................

......................................................................................

................................

..............................................................

.......................................................................

....................................................................

...................................................

Ω

P(A) + P(B \ A) = P(B)

→ Wegen P(B \ A) ≥ 0 : P(A) ≤ P(B)

1.2 QM1_18 81

• P(A ∪B) = P(A) + P(B)− P(A ∩B)

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

.......................................................................................................................................................................................................................................................................................................................................................................... .......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

............................................................................................................A ............................................................................................................ B

on Zerlege geeignet !

(A \B, A ∩B) ist d.Z. von A

(B \ A, A ∩B) ist d.Z. von B

(A \B, B \ A, A ∩B) ist d.Z. von A ∪B

P(A ∪B) = P(A \B) + P(B \ A) + P(A ∩B)

= P(A \B) + P(A ∩B) + P(B \ A) + P(A ∩B)− P(A ∩B)

= P(A) + P(B) − P(A ∩B)

• P(A ∪B) ≤ P(A) + P(B)

• P(A1 ∪ A2 ∪ . . . ∪ An) ≤ P(A1) + P(A2) + . . .+ P(An)

on Induktiv , nächster Schritt ( 2→ 3 ) beispielsweise

P(A1 ∪ A2 ∪ A3) = P((A1 ∪ A2) ∪ A3)

≤ P(A1 ∪ A2) + P(A3)

≤ P(A1) + P(A2) + P(A3)

1.2 QM1_18 82

→ W-Funktionen

? Wie gibt man ein W-Maß an ?

Eine Möglichkeit : Auflistung der Werte :

− A 7→ P(A) für alle Ereignisse A

→ Aufwändig und umständlich !

? Beim Würfel : 26 = 64 Einzelangaben

Zur Rekonstruktion aller Wn :

− Kenntnis der Wn der Elementarereignisse genügt :

Ist A = ω1 , ω2 , . . . , ωk , so gilt :

( ω1 , ω2 , . . . , ωk ) ist d.Z. von A

→ P(A) = P(ω1) + P(ω2) + . . . + P(ωk)

→ Zusammenfassung dieser Wn aller Elementarereignisse

1.2 QM1_18 83

→ Zusammenfassung der Wn aller Elementarereignisse :

♦ Ist < Ω , P > (endlicher) W-Raum , so heißt die Funktionf : Ω → R mit

f(ω) := P(ω) für alle ω ∈ Ω

auch die zu P gehörende Wahrscheinlichkeits-Funktion

Abkürzung für ‚ Wahrscheinlichkeitsfunktion ‘ : W-Funktion

• Ist f die zu P gehörende W-Funktion , so gilt für alle A ⊆ Ω :

P(A) =∑ω∈A

f(ω)

on∑ω∈A

f(ω) =∑ω∈A

P(ω) = P(A)

→ Angabe eines W-Maßes auf Ω mit |Ω | = n :

− mit Hilfe der W-Funktion f durch n Einzelangaben f(ω)

Zur Vollständigkeit :∑ω∈∅

f(ω) = 0 ( ‚ leere Summe ‘ )

1.2 QM1_18 84

? 2 ‚ reale ‘ Würfel

− 36 Angaben

− statt 236 = 68 719 476 736

? Ist < Ω , P > Laplaceraum , so ist f ≡ 1

|Ω |( ‚ konstant ‘ )

→ Eigenschaften von W-Funktionen

• Ist f W-Funktion zum W-Maß P auf Ω , so gilt :

(i) f(ω) ≥ 0 für alle ω ∈ Ω

(ii)∑ω∈Ω

f(ω) = 1

on (i) : f(ω) = P(ω) ≥ 0

(ii) :∑ω∈Ω

f(ω) = P(Ω) = 1

4 Die beiden Eigenschaften charakterisieren W-Funktionenvollständig

→ Konstruktion eines W-Maßes aus der erhofften W-Funktion

1.2 QM1_18 85

• Ist f : Ω → R Funktion auf endlichem Ω mit

(i) f(ω) ≥ 0 für alle ω ∈ Ω

(ii)∑ω∈Ω

f(ω) = 1 ,

so wird durch die Vorschrift

P(A) :=∑ω∈A

f(ω) für alle A ⊆ Ω

ein W-Maß P auf Ω definiert, dessen W-Funktion f ist

on Zeige : a) P ist W-Maß (Axiome nachprüfen )

b) W-Funktion von P ist dann f ( klar )

? Gegeben : 55 Studierende (Ω ) , einmal zufällig Ziehen

− Aber : 10 kommen nur jedes zweite Mal

? Geeignetes W-Maß ?

Konstruktion über die W-Funktion f

W-Funktion für regelmäßigen Teilnehmer : x

W-Funktion für unregelmäßigen Teilnehmer dann : x/2

Wegen (ii) muss gelten

1 =∑ω∈Ω

f(ω) = 45 · x + 10 · x2

Also 50x = 1 oder x = 1/50

1.2 QM1_18 86

→ Häufigkeiten und Wn

→ Zusammenhang für motivierende Argumentationen ( vage )

Grundlage : Frequentistische Intuition

? ] 6en bei 600-mal Würfeln ?

♣ Ein Ereignis A hat W. p

− Der Versuch wird sehr oft durchgeführt (N Mal )

? Wie oft tritt A ein ? ( ungefähr )

] Eintreten von A : n

r.H. also : n/N

Frequentistische Interpretation → n/N ≈ p

→ n ≈ N p

? ] 6en bei 600-mal Würfeln : ≈ 600 · 16

= 100

1.2 QM1_18 87

→ Bedingte Wahrscheinlichkeiten

? W. von positiver Diagnose bei Krankheit

? W. von Krankheit bei positiver Diagnose

? 2 Würfel , A : ‚ Summe > 7 ‘ , B : ‚ 1. Würfel : 3 ‘

P(A) =15

36, P(B) =

1

6, P(A ∩B) =

2

36

? W. von A ‚ unter B ‘ ?

Allgemein : Gegeben Ereignisse A , B mit P(B) > 0

? W. von A ‚ unter B ‘ ?

? Was soll das überhaupt heißen ?

Motivierung der Definition (!) mit frequentistischer Intuition

Führe Versuch oft durch (N -mal )

Betrachte nur die Ergebnisse , bei denen B eintritt

Wie groß ist davon die r.H. von A ?

→ Diese r.H. sollte etwa die ‚ bedingte W. ‘ sein

1.2 QM1_18 88

Versuch wird N -mal durchgeführt

Auftreten von B : ≈ N · P(B) Mal

Darunter : Auftreten von A : ≈ N · P(A ∩B) Mal

→ R.H. : ≈ N · P(A ∩B)

N · P(B)=

P(A ∩B)

P(B)

? Würfelbeispiel : 36000-mal Würfeln

Eintreten von B ( ‚ 1. Würfel : 3 ‘ ) : etwa

36000 · P(B) = 36000 · 16

= 6000 Mal

Dazu Eintreten von A ( ‚ Summe > 7 ‘ ) : etwa

36000 · P(A ∩B) = 36000 · 2

36= 2000 Mal

→ r.H. etwa2000

6000=

1

3

(=

P(A ∩B)

P(B)

)

1.2 QM1_18 89

♦ Sind A und B Ereignisse mit P(B) > 0 , so heißt

P(A |B) :=P(A ∩B)

P(B)

auch bedingte Wahrscheinlichkeit von A unter B

4 Definition in Harmonie mit frequentistischer Interpretation

B ‚ Bedingtheit ‘ hat allgemein nichts zu tun

− mit zeitlicher Reihenfolge

− mit Kausalität schon gar nicht

4 In speziellen Fällen jedoch oft

? 2 Würfel , A : ‚ Summe > 7 ‘ , B : ‚ 1. Würfel : 3 ‘

P(A) =15

36, P(B) =

1

6, P(A ∩B) =

2

36

→ P(A |B) =2/36

1/6=

1

3

4 P(A) ‚ ändert sich bei Eintreten von B ‘

→ Es besteht eine Art ‚ Abhängigkeit ‘ zwischen A und B

1.2 QM1_18 90

• Ist P(B) > 0 , so gilt :

(i) P(A |B) ≥ 0 für alle A ⊆ Ω

(ii) P(Ω |B) = 1

(iii) P(A1 ∪ A2 |B) = P(A1 |B) + P(A2 |B) für A1 ∩ A2 = ∅

4 Kurz : P( · |B) ist ein W-Maß auf Ω

P( · |B) ist Kurzschreibweise für : A 7→ P(A |B)

on (i) , (ii) : klar(iii) : Gilt A1 ∩A2 = ∅ , so auch (A1 ∩B)∩ (A2 ∩B) = ∅

ferner (immer) (A1 ∪ A2) ∩ B = (A1 ∩B) ∪ (A2 ∩B)

..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

.......................................................................................................................................................................................................................................................................................................................................................................... .......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.............................................................................................................

.............................................................................................................

........................................................................

A1

A2

B

Ω

P(A1 ∪ A2 |B) =P((A1 ∪ A2) ∩B)

P(B)

=P(A1 ∩B) + P(A2 ∩B)

P(B)

=P(A1 ∩B)

P(B)+

P(A2 ∩B)

P(B)

= P(A1 |B) + P(A2 |B)

1.2 QM1_18 91

• P(Ac |B) = 1 − P(A |B) etc. etc.

on P( · |B) ist W-Maß

• P(A ∩B) = P(A |B) · P(B)

• Ist (B1 , . . . , BJ ) d.Z. von Ω mit P(Bj) > 0 für alle j

und A ⊆ Ω , so gilt

P(A) =J∑

j=1

P(A |Bj)P(Bj)

„ Satz von der totalen Wahrscheinlichkeit “

on (A ∩B1 , . . . , A ∩BJ ) ist d.Z. von A :

....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

....................................................

....................................................

..............

........................................................................................................................................................

....................................................................................

....................................................................................

....................

................................................................................................................................

............................................................................

.......................................................................................................................................................

......................

......................

......................

......................

......................

......................

...............

Ω

d.Z. von Ω in die Bj

−→

....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

......................

......................

...

........

........

........

........

........

........

........

.....

..................................

..................................

.......

...................................................

...............................

.............................................................

..........

..........

..........

..........

..........

.........

............................................................

.............................................................................................................................................................................................................................................................................................................................................................................................................................

...........................................................................................................................

..........................................................................

................................................................................ ................................

............................................................................................................................

..........................................................................................................................................................A

Ω

d.Z. von A in die A ∩Bj

→ P(A) =J∑

j=1

P(A ∩Bj) =J∑

j=1

P(A |Bj)P(Bj)

4 P(A) ist gewichtetes Mittel der bedingten Wn P(A |Bj)

1.2 QM1_18 92

? 2 Würfel

− Bj : ‚ 1. Würfel zeigt j ‘ ( j = 1 , . . . , 6 )

− A : ‚ Summe ist ≥ 10 ‘

− 1. Würfel ‚ gezinkt ‘ : P(B1) = . . . = P(B5) = .1 , P(B6) = .5

? P(A) = ?

(B1 , . . . , B6 ) ist d.Z. von Ω = 1, . . . , 62

P(A |B1) = . . . = P(A |B3) = 0

P(A |B4) =1

6, P(A |B5) =

2

6, P(A |B6) =

3

6

P(A) =6∑

j=1

P(A |Bj)P(Bj)

= 0 · (.1) + 0 · (.1) + 0 · (.1) +1

6· (.1) +

2

6· (.1) +

3

6· (.5)

=1.8

6= .3

4 Vgl. : 6/36 = 1/6 bei fairem 1. Würfel

1.2 QM1_18 93

• Ist (B1 , . . . , BJ ) d.Z. von Ω mit P(Bj) > 0 für alle j

und A ⊆ Ω mit P(A) > 0 , so gilt für alle k = 1 , . . . , J

P(Bk |A) =P(A |Bk)P(Bk)

J∑j=1

P(A |Bj)P(Bj)

„ Satz von Bayes “

on P(Bk |A) =P(Bk ∩ A)

P(A)=

P(A |Bk)P(Bk)

J∑j=1

P(A |Bj)P(Bj)

4 Nenner ist P(A) ( totale W. )

4 Änderung der ‚ a-priori-Wahrscheinlichkeiten ‘ P(Bk)

− ‚ unter Zusatzinformation ‘ A

− zu ‚ a-posteriori-Wahrscheinlichkeiten ‘ P(Bk |A)

4 Interessante Frage in der Kognitionspsychologie

? Verhalten sich Organismen gemäß Bayesformel ?

1.2 QM1_18 94

? 2 Würfel

− Bj : ‚ 1. Würfel zeigt j ‘ ( j = 1 , . . . , 6 )

− A : ‚ Summe ist ≥ 10 ‘

− 1. Würfel ‚ gezinkt ‘ : P(B1) = . . . = P(B5) = .1 , P(B6) = .5

? P(Bk |A) = ?

(B1 , . . . , B6 ) ist d.Z. von Ω = 1, . . . , 62

P(A |B1) = . . . = P(A |B3) = 0

P(A |B4) =1

6, P(A |B5) =

2

6, P(A |B6) =

3

6

P(A) = .3

? P(B2 |A) =0

.3= 0

? P(B5 |A) =(2/6) (.1)

.3=

1

9

? P(B6 |A) =(3/6) (.5)

.3=

5

6

B A-posteriori-Wn P(Bk |A) : 0 , 0 , 0 ,1

18,

2

18,

15

18

4 Summe ist 1

B Vgl. mit a-priori-Wn !

4 A-posteriori-Wn bei fairem erstem Würfel :

− P(Bk |A) : 0 , 0 , 0 ,1

6,

2

6,

3

6

1.2 QM1_18 95

→ Unabhängigkeit

→ Motivierung der Definition

? Test auf Krankheit

Versuch :

− Zufälliges Ziehen eines Probanden aus Gesamtpopulation

− A : Diagnose positiv , B : Proband krank

→ Erwartung an ‚ guten ‘ Test :

− Bei Kranken erhöht sich die W. einer positiven Diagnose

− im Vergleich zur Gesamtpopulation

Formal : P(A |B) > P(A)

→ Dann besteht ‚ eine Art Abhängigkeit ‘ (A von B )

Falls P(A |B) = P(A) :

→ Test ganz unbrauchbar

→ A ‚ hängt überhaupt nicht von B ab ‘

→ Nahliegende Sprechweise :

− A ist von B unabhängig , falls P(A |B) = P(A)

1.2 QM1_18 96

‚ Intuitive ‘ Bedingung für ‚ Unabhängigkeit ‘ (A von B ) :

P(A) = P(A |B) =P(A ∩B)

P(B)

Umformung :

P(A ∩B) = P(A) · P(B)

♦ Zwei Ereignisse A und B heißen unabhängig , falls

P(A ∩B) = P(A) · P(B)

gilt

• Sind A und B unabhängig mit P(B) > 0 , so gilt

P(A) = P(A |B)

on P(A |B) =P(A ∩B)

P(B)=

P(A)P(B)

P(B)= P(A)

4 ( Technische ) Defintion also in Einklang mit Motivation

4 Unabhängigkeit ist ‚ symmetrisch ‘

! Nicht Unabhängigkeit und Disjunktheit verwechseln !

! Keine ( allgemein ) falschen Assoziationen ! (Kausalität etc. )

1.2 QM1_18 97

? 2 faire Würfel , A : ‚ 1. Würfel : 3 ‘ , B : ‚ Summe = 7 ‘

? A , B unabhängig ?

P(A) =1

6, P(B) =

1

6, P(A ∩B) =

1

36

P(A) · P(B) =1

6· 1

6=

1

36= P(A ∩B)

→ A und B sind unabhängig

? 2 faire Würfel , A : ‚ 1. Würfel : 3 ‘ , B : ‚ Summe = 8 ‘

? A , B unabhängig ?

P(A) =1

6, P(B) =

5

36, P(A ∩B) =

1

36

P(A) · P(B) =1

6· 5

36=

5

2166= 1

36= P(A ∩B)

→ A und B sind nicht unabhängig

4 Hier : P(A |B) =1

56= 1

6= P(A)

1.2 QM1_18 98

? 2 faire Würfel , A : ‚ 1. Würfel : < 5 ‘ , B : ‚ 2. Würfel > 3 ‘

? A , B unabhängig ?

P(A) =4

6, P(B) =

3

6, P(A ∩B) =

12

36

P(A) · P(B) =4

6· 3

6=

12

36= P(A ∩B)

→ A und B sind unabhängig

4 Hier Sonderfall :

− A bezieht sich auf 1. Würfel , B auf 2. Würfel

? Sind derartige Ereignisse immer unabhängig ?

− Vermutung : Ja

1.2 QM1_18 99

• Sind A und B unabhängig , so auch A und Bc

on P(A ∩Bc) = ?

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

..............................................

.........................

.......................................................................................................................................................................................................................................................................................................................................................................... .......

.......

..............................................

.........................

..........................................................................................................................................................................................................................................................................................................................................................................

............................................

...........................................................................................................................................................................................................................................................................................................................................

........

...........................................................................

.............................................................................................................

................................................................................................................................

..........................................................................................................................................

...............................................................................................................................................

.................................................

.................................................

....................

....................

............................................................................................................A ............................................................................................................ B

(A ∩B , A ∩Bc ) ist d.Z. von A

P(A) = P(A ∩B) + P(A ∩Bc)

→ P(A ∩Bc) = P(A) − P(A ∩B)

= P(A) − P(A) · P(B)

= P(A) (1− P(B))

= P(A) · P(Bc)

• Sind A , B unabhängig , so auch Ac , B , ebenso Ac , Bc

on A , B vertauschen bzw. iterieren

1.2 QM1_18 100

• Sind A und B unabhängig , P(B) > 0 , P(Bc) > 0 , so gilt

P(A |B) = P(A) = P(A |Bc)

4 Dies zeigt nochmal die Angemessenheit der Begriffsbildung

? Diagnosebeispiel : A : Diagnose positiv , B : Proband krank

Sind A , B unabhängig , so

P(A |B) = P(A |Bc)

→ Test dann in der Tat unbrauchbar

→ Unabhängigkeit von mehr als 2 Ereignissen

♦ A , B , C heißen unabhängig , falls sie paarweise unabhängigsind und zusätzlich

P(A ∩B ∩ C ) = P(A) · P(B) · P(C)

gilt

4 Unabhängigkeit von 3 Ereignissen ist also mehr alspaarweise Unabhängigkeit und auch mehr als Gültigkeit vonP(A ∩B ∩ C ) = P(A) · P(B) · P(C)

4 Analog ( immer komplizierter ) :

− Unabhängigkeit von 4 , 5 , 6 , . . . Ereignissen

1.2 QM1_18 101

→ Zufallsvariable

→ Oft interessiert bei einem Versuch nicht das genaue Ergebnis

− sondern nur ein bestimmter ‚ Aspekt ‘

? 2 Würfel , interessant ist vielleicht nur die Augensumme

→ ‚ Erfassen ‘ eines solchen ‚ Aspektes ‘

− durch eine geeignete Abbildung

? 2 Würfel , es interessiert die Augensumme

Geeignete Abbildung :

X : 1, 2, 3, 4, 5, 6 2 → 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12

X((w1, w2)) := w1 + w2

? X((3, 5)) = 8

Verkürzende Schreibweise : X(3, 5) statt X((3, 5))

− Streng genommen unkorrekt , aber praktisch

1.2 QM1_18 102

? 2 Würfel , interessant ist jetzt der 1. Würfel

Geeignete Abbildung :

X1 : 1, 2, 3, 4, 5, 6 2 → 1, 2, 3, 4, 5, 6

X1(w1, w2) := w1

? Oder : interessant ist der 2. Würfel

Geeignete Abbildung :

X2 : 1, 2, 3, 4, 5, 6 2 → 1, 2, 3, 4, 5, 6

X2(w1, w2) := w2

4 Für viele Zwecke praktischer :

− Als Wertebereich von X1 , X2 , X gleich R nehmen

Hier gilt übrigens : X = X1 + X2

B Summe von Abbildungen ist wieder Abbildung

Formale Definition :

♦ Sind X1 und X2 Abbildungen auf Ω mit Werten in denreellen Zahlen , so ist X1 +X2 die Abbildung auf Ω , diegegeben ist durch

(X1 +X2)(ω) := X1(ω) + X2(ω)

4 Analog : Differenz , Produkt , X21 , etc. etc.

1.2 QM1_18 103

? Population Ω von Männern und Frauen

− Zufälliges Ziehen einer Person

4 Elementarbaustein des Stichprobenziehens

− Interessant ist vielleicht die Intelligenz der gezogenen Person

Geeignete Abbildung : X : Ω → R

− Person 7→ IQ

? X( Julius ) = 117

− Interessant ist jetzt das Geschlecht der gezogenen Person

Geeignete Abbildung : Y : Ω → m, w

− Person 7→ Geschlecht

? Y (Petra ) = w

B Vorteil derartiger Abbildungen

− Erfassung der relevanten Information

− bei Ignorierung der irrelevanten

1.2 QM1_18 104

→ Urbild

♦ Ist X : Ω → Ω′ eine Abbildung und A ⊆ Ω′ , so heißt dieMenge

X−1(A) := ω ∈ Ω |X(ω) ∈ A

das Urbild von A unter X

? 2 Würfel , X : 1, 2, 3, 4, 5, 62 → R : Augensumme

? A = 10, 11, 12 ‚ Augensumme ≥ 10 ‘

X−1(A) gibt Antwort auf die Frage :

− Welche Ergebnisse führen zu Augensummen ≥ 10 ?

X−1(A) = (4, 6) , (5, 5) , (5, 6) , (6, 4) , (6, 5) , (6, 6)

? Zufälliges Ziehen einer Person aus Population Ω

− X : Intelligenz

? A = (100,∞) ‚ überdurchschnittlich ‘

X−1(A) gibt Antwort auf die Frage :

− Welche Personen sind überdurchschnittlich intelligent ?

X−1(A) vielleicht : Julius, Olga, Maria, Fritz, . . .

1.2 QM1_18 105

? 2 faire Würfel , X : 1, 2, 3, 4, 5, 62 → R : Augensumme

? A = 10, 11, 12 ‚ Augensumme ≥ 10 ‘

? Wie wahrscheinlich ist eine Augensumme in A ? ( also ≥ 10 )

→ Lösungsweg :

Umformulierung : Welche Ergebnisse führen zu Summe ≥ 10 ?

Antwort : (4, 6) , (5, 5) , (5, 6) , (6, 4) , (6, 5) , (6, 6)

Also die Elemente von X−1(A)

Es sind also folgende Ereignisse gleich :

− ‚ Augensumme X liegt in A ‘

− X−1(A)

Daher ist die W. einer Augensumme in A gleich P(X−1(A))

→ Lösung also : Die gesuchte W. ist P(X−1(A)) =6

36=

1

6

B Entscheidend : das interessierende Ereignis ist X−1(A)

− Davon ist die W. zu bestimmen P(X−1(A))

1.2 QM1_18 106

♦ Ist < Ω,P > ( endlicher ) W-Raum und X : Ω → Ω′ eineFunktion mit Werten in einer Menge Ω′ , so heißt X auchZufallsvariable ( auf Ω )

Abkürzung : Zva

4 Zvan ‚ erfassen ‘ ‚ relevante Aspekte ‘ eines Zufallsergebnisses

B Zufällig ist das Ergebnis ω , X(ω ) dann aber nicht mehr

→ Wn von Ereignissen , die sich auf eine Zva beziehen ?

Form solcher Ereignisse genauer :

Gegeben ist ein A ⊆ Ω′

→ Ereignis dann : Der Wert von X liegt in A

Bezeichnung für dieses Ereignis : ‚X ∈ A ‘

Bezeichnung der Wahrscheinlichkeit : P(X ∈ A)

• P(X ∈ A) = P(X−1(A))

Weitere Schreibweisen :

‚X ≥ 10 ‘ : Ereignis , dass X mindestens 10 ist

P(X ≥ 10) : W. davon

→ Etc. etc.

1.2 QM1_18 107

→ Verteilung einer Zva

• Ist < Ω , P > (endlicher) W-Raum und X : Ω → Ω′ eineZva mit Werten in einer endlichen Menge Ω′ , so ist die durchdie Vorschrift

PX(A) := P(X−1(A)) für A ⊆ Ω′

auf P(Ω′) definierte Funktion PX ein W-Maß auf Ω′

on Nachprüfen der Axiome

B PX(A) ist die W., dass X einen Wert in A annimmt

♦ Das W-Maß PX heißt auch Bildmaß von P ( unter X ) oderauch Verteilung von X

Charakterisierung wie üblich durch die W-Funktion

♦ Die zu PX gehörende W-Funktion heißt auch W-Funktion vonX

Bezeichnung meist : fX

1.2 QM1_18 108

→ Eigenschaften der W-Funktion von X

4 Ω′ erstmal immer endlich

• Ist < Ω , P > (endlicher) W-Raum mit W-Funktion f undX : Ω → Ω′ Zva mit W-Funktion fX : Ω′ → R , so gilt

fX(x) =∑ω∈Ω

X(ω)=x

f(ω)

für alle x ∈ Ω′

on fX(x) = PX(x) = P(X−1(x)) und

X−1(x) = ω ∈ Ω |X(ω) ∈ x = ω ∈ Ω |X(ω) = x

• Ist fX die W-Funktion einer Zva X : Ω → Ω′ , so gilt füralle A ⊆ Ω′ die Beziehung

PX(A) =∑x∈A

fX(x)

on fX ist W-Funktion

1.2 QM1_18 109

? Gegeben : Population Ω = a, b, c, d, e, f, g, h

− Interessant : Verteilung der Zva X : Augenfarbe

Ω′ = b, hb, db, hg, dg

− braun , hell/dunkel-blau/grün

Ungleiche Ziehungswahrscheinlichkeiten

− W-Maß P auf Ω gegeben durch W-Funktion f

ω f(ω) X(ω)

a .20 hb

b .15 dg

c .05 b

d .10 hg

e .15 b

f .10 db

g .10 hg

h .15 dg

→ Bestimme PX über fX !

fX(b) =∑ω∈Ω

X(ω)=b

f(ω) = f(c) + f(e) = .05 + .15 = .20

fX(hb) =∑ω∈Ω

X(ω)=hb

f(ω) = f(a) = .20

fX(db) = f(f) = .10

fX(hg) = f(d) + f(g) = .10 + .10 = .20

fX(dg) = f(b) + f(h) = .15 + .15 = .30

1.2 QM1_18 110

Zusammenfassung der Werte von fX

x fX(x)

b .20

hb .20

db .10

hg .20

dg .30

Veranschaulichung der W-Funktion fX

b hb db hg dg

0.1

0.2

0.3

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

........................

...................

x

fX(x)

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

r rr

rr

? H := hb, hg ‚ Helle Augenfarbe ‘

PX(H) =∑x∈H

fX(x) = fX(hb) + fX(hg) = .20 + .20 = .40

4 Natürlich gleiches Resultat mit PX(H) = P(X−1(H)) :

X−1(H) = a, d, g

→ P( a, d, g ) = f(a) + f(d) + f(g) = .20 + .10 + .10 = .40

1.2 QM1_18 111

? Verteilung der Augensumme von 2 fairen Würfeln

Ω = 1, 2, 3, 4, 5, 6 2

P : Gleichverteilung , also f(ω) = 1/36 für alle ω

Zva : X : Ω → Ω′ = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12

− X(w1, w2) = w1 + w2

→ Bestimme PX über fX

? fX( 4 ) = f(1, 3) + f(2, 2) + f(3, 1) =1

36+

1

36+

1

36=

3

36

→ Insgesamt :

x 2 3 4 5 6 7 8 9 10 11 12

fX(x)1

36

2

36

3

36

4

36

5

36

6

36

5

36

4

36

3

36

2

36

1

36

→ Veranschaulichung :

1 2 3 4 5 6 7 8 9 10 11 120

1/36

5/36

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

......................

...................

x

fX(x)

.......

.......

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.r r r r r r r r r r r

1.2 QM1_18 112

Verteilung der Augensumme X über die W-Funktion fX :

x 2 3 4 5 6 7 8 9 10 11 12

fX(x)1

36

2

36

3

36

4

36

5

36

6

36

5

36

4

36

3

36

2

36

1

36

? Wahrscheinlichkeit einer geraden Augensumme = ?

Mit G = 2, 4, 6, 8, 10, 12 :

− W. für gerade Augensumme = PX(G)

PX(G) =∑x∈G

fX(x)

= fX(2) + fX(4) + fX(6) + fX(8) + fX(10) + fX(12)

=1

36+

3

36+

5

36+

5

36+

3

36+

1

36

=18

36=

1

2

? W. einer ungeraden Augensumme ?

Gegenereignis zu ‚ gerade Augensumme ‘

→ W. für ungerade Augensumme = 1− 1

2=

1

2

1.2 QM1_18 113

→ Verallgemeinerung : Ω′ unendlich

? Würfelsumme als Funktion mit Werten in R

Fast alles kann so bleiben

PX ( genauso definiert ) erweist sich als W-Maß

Die Ereignisse in Ω′ sind alle Teilmengen von Ω′

W-Funktion fX genauso definiert

Bestimmung der W. eines Ereignisses E ( in Ω′ ) :

PX(E) =∑x∈E

fX(x)

! Bei unendlichem E : unendliche Summe , nicht definiert

→ Sondervereinbarung für diese spezielle Situation :

− Es sind nur die x mit fX(x) 6= 0 zu berücksichtigen

→ Dann funktioniert alles

B Wesentlich : Ω ist endlich

1.2 QM1_18 114

? Verteilung der Augensumme X von 2 fairen Würfeln

− Jetzt : X : Ω → R

W-Funktion fX :

− für x = 2, 3, . . . , 12 : fX(x) wie oben

− für alle anderen x : fX(x) = 0

? PX( (−1, 3.7 ] ) = ?

− Augensumme zwischen −1 (aus-) und 3.7 (einschließlich)

4 Seltsame Frage , aber manchmal sinnvoll

→ PX( (−1, 3.7 ] ) =∑

x∈(−1, 3.7 ]

fX(x)

= fX(2) + fX(3)

=1

36+

2

36=

3

36

Andere x ( z.B. −.3 ,√

2 , π ) werden nicht berücksichtigt

1.2 QM1_18 115

→ Erinnerung : Monotone Funktionen etc.

♦ Ist A ⊆ R und f : A → R , so heißt f monoton wachsend ,falls für alle x1 , x2 ∈ A mit x1 < x2 die Beziehungf(x1) ≤ f(x2) gilt

♦ Ist A ⊆ R und f : A → R , so heißt f streng monotonwachsend , falls für alle x1 , x2 ∈ A mit x1 < x2 dieBeziehung f(x1) < f(x2) gilt

4 Die Funktionswerte wachsen mit dem Argument ( ‚ streng ‘ ) bzw.werden jedenfalls nicht kleiner

4 Analog : ‚ monoton fallend ‘ und ‚ streng monoton fallend ‘

? Beispiele

.................................................................................................................................................................. ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......................

...................

.....................................................................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................. ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......................

...................

.....................................................................................................................................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................. ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......................

...................

.................................................

.....................................................................................................................................................................................

.....................................................................................................

r........................

− Links : Streng monoton wachsend

− Mitte : Monoton fallend, aber nicht streng

− Rechts : Weder noch noch noch

− Ferner : ‚ Sprungstelle ‘ , Funktionswert : Dicker Punkt

− In ‚ Sprungstelle ‘ ‚ rechtsseitig stetig ‘

1.2 QM1_18 116

→ Verteilungsfunktion

♦ Eine Zva mit Werten in R heißt auch reelle Zva

? Würfelsumme

♦ Ist < Ω, P > W-Raum und X reelle Zva auf Ω , so heißt dieFunktion

FX : R → R mit FX(x) := P(X ≤ x )

auch Verteilungsfunktion von X

In zweifelsfreien Fällen meist ‚ F ‘ statt ‚ FX ‘

4 Die Funktionswerte von FX liegen natürlich alle in [ 0, 1 ]

4 FX(x) = P(X ≤ x) = PX( (−∞, x ] ) =∑x′≤x

fX(x′)

? Zva X : Augensumme von 2 fairen Würfeln

? Verteilungsfunktion FX von X ?

1.2 QM1_18 117

? FX für Zva X : Augensumme von 2 Würfeln ?

Erinnerung : W-Funktion :

1 2 3 4 5 6 7 8 9 10 11 120

1/36

5/36

............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

........................

...................

x

fX(x)

.......

.......

.......

.......

.......

.....

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

.......

.......

.......

.......

.......

.....r r r r r r r r r r r

? FX(−2) = FX(.5) = FX(1.7) = 0

keine Änderung bis x = 2

FX(2) = 1/36 Sprung um fX(2) = P(X = 2)

? FX(2.3) = FX(√

5) = FX(2.8395) = 1/36

keine Änderung mehr bis x = 3

FX(3) = 3/36 Sprung um fX(3) = P(X = 3)

. . .

→ FX bleibt konstant zwischen möglichen Werten von X

→ In möglichen Werten x von X : Sprung um fX(x)

. . .

→ Schließlich für x ≥ 12 : FX ist konstant ( 1 )

1.2 QM1_18 118

→ Verteilungsfunktion und W-Funktion von X : Augensumme

1 2 3 4 5 6 7 8 9 10 11 121/36

5/36

10/36

15/36

20/36

25/36

30/36

36/36

................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................ ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.....................

...................

x

FX(x)

...........................................................................................................................................................................

.........................................................

.........................................................

.........................................................

.........................................................

.........................................................

.........................................................

.........................................................

.........................................................

...........................................................................................................................................................................

r r r rr

rr r r r r......................................................................................................................................................

................................................................................1 2 3 4 5 6 7 8 9 10 11 121/36

5/36

................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................ ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

......................

...................

x

fX(x)

......

..............................

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

......

.......

.......

.......

.......

.......

.......

.......

.......

....

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

....

.......

.......

.......

.......

.......

.......

......

.......

.......

.......

.......

.......

.

.......

.......

.......

...

......

......r r r r r r r r r r r

4 fX(x) liefert die Sprunggröße von FX in x

Funktionswerte von fX und FX in den ‚ Sprungstellen ‘ :

x 2 3 4 5 6 7 8 9 10 11 12

fX(x)1

36

2

36

3

36

4

36

5

36

6

36

5

36

4

36

3

36

2

36

1

36

FX(x)1

36

3

36

6

36

10

36

15

36

21

36

26

36

30

36

33

36

35

36

36

36

B Den Wert von FX in x erhält man

− durch Aufaddieren der Werte von fX bis x

1.2 QM1_18 119

→ Eigenschaften der Verteilungsfunktion

• Aus der Verteilungsfunktion FX lässt sich die Verteilung von X

eindeutig bestimmen

on Die Sprungstellen liefern hier die W-Funktion

• Die Verteilungsfunktion F einer reellen Zva hat folgendeEigenschaften :

(i) F ist monoton wachsend

(ii) F (x) → 0 für x → −∞ F (x) → 1 für x → ∞

(iii) F ist in allen Punkten x rechtsseitig stetig

on Für die bisher betrachtete Art von Zvan klar

4 Die Eigenschaften gelten allgemein für reelle Zvan

4 Jede Funktion F mit (i) − (iii) ist Verteilungsfunktion einerreellen Zva

→ Mit den Funktionen F mit (i) − (iii) hat man einenvollständigen Überblick über mögliche reelle Verteilungen

1.2 QM1_18 120

4 Verteilungsfunktionen sind weniger anschaulich als W-Funktionen

− Dafür ‚ universeller ‘

− Auch bei ‚ stetigen ‘ Zvan definiert ( nicht nur bei ‚ diskreten ‘ )

− Vergleich unterschiedlicher Arten von Verteilungen wird möglich

→ Bestimmung von Wn von Intervallen der Form (a, b ]

• Ist F die Verteilungsfunktion einer reellen Zva X , so gilt füralle a , b ∈ R mit a < b die Beziehung

P(a < X ≤ b) = F (b)− F (a)

on Die Ereignisse ‚ a < X ≤ b ‘ und ‚X ≤ a ‘ sind disjunkt

Ihre Vereinigung ist das Ereignis ‚X ≤ b ‘

P(X ≤ b) = P(a < X ≤ b) + P(X ≤ a)

→ P(a < X ≤ b) = P(X ≤ b)− P(X ≤ a)

= F (b)− F (a)

4 P(a < X ≤ b) = PX( (a, b ] )

? 2 Würfel , X : Augensumme

→ P( 3.3 < X ≤ 7.1 ) = FX(7.1)− FX(3.3)

=21

36− 3

36=

18

36=

1

2

1.2 QM1_18 121

→ Motivierung der Begriffe Abhängigkeit /Unabhängigkeit

Oft sind zwei Variablen gleichzeitig interessant

− Besonders bei Fragen nach ‚ Zusammenhängen ‘

? Gibt es Zusammenhang zwischen Geschlecht und Intelligenz ?

? Gibt es Zusammenhang zwischen Augen- und Haarfarbe ?

→ Hier : Simultane Betrachtung beider Variablen nötig

? Was soll hier ‚ Zusammenhang ‘ heißen ?

? Vereinfachtes Beispiel : Geschlecht (G) - Intelligenz (I)

Intelligenz in nur zwei Stufen :

− i (ntelligent) und u (nintelligent)

→ Vergleiche 2 mögliche Situationen S1 , S2

− S1 : Männer : 40% i , 60% u , Frauen : 40% i , 60% u

− S2 : Männer : 40% i , 60% u , Frauen : 45% i , 55% u

→ S1 : Verteilung von I ist bei Männern und Frauen gleich

→ S2 : Verteilung von I ist bei Männern und Frauen verschieden

1.2 QM1_18 122

2 mögliche Situationen S1 , S2

− S1 : Männer : 40% i , 60% u , Frauen : 40% i , 60% u

− S2 : Männer : 40% i , 60% u , Frauen : 45% i , 55% u

♠ ‚ Statistische ‘ Sichtweise :

− In S1 besteht kein Zusammenhang zwischen G und I

− In S2 besteht ein Zusammenhang zwischen G und I

→ Kriterium : Sind die Verteilungen von I gleich ?

→ Eigentlich : Rollen von G und I unsymmetrisch

Daher vielleicht besser :

− In S1 hängt I nicht von G ab

− In S2 hängt I von G ab

→ Eine Art ‚ Präzisierung ‘ von „ Abhängigkeit “

− Nicht vollständig im Einklang mit Umgangssprache !

− Betrifft nur den ‚ statistischen ‘ Aspekt der Verteilung

1.2 QM1_18 123

Zum ‚ schillernden ‘ Abhängigkeitsbegriff :

Denkbare Situation :

− Verschiedene Arten der Intelligenzentwicklung bei M und F

− Jedoch mit gleichem Resultat ( im Sinne der Verteilung )

4 Nicht gerade „ wahrscheinlich “ , aber nicht unmöglich

? ‚ Hängt ‘ dann I von G ‚ ab ‘ oder nicht ?

? Vielleicht ‚ Abhängigkeit ‘ , aber ‚ letztlich die gleiche ‘ ?

? ? ? ?

→ Hier in Zukunft : ‚ Statistischer ‘ Abhängigkeitsbegriff

B Offenbar nicht identisch mit umgangssprachlichem

! Vermeidung von unsinnigen Konfusionen durch

→ Bewusstheit und disziplinierten Sprachgebrauch !

→ Vermeidung von zügellosen sprachlichen Assoziationen !

→ Insbesondere :

− Vorschnelle ‚ kausale ‘ Assoziationen vermeiden !

1.2 QM1_18 124

→ Noch eine Frage :

? Kann es sein , dass ( im ‚ statistischen ‘ Sinn )

− I von G unabhängig ist

− G von I jedoch nicht ?

Also : Ist folgendes möglich :

− Verteilungen von I bei Männern und Frauen gleich

− Verteilungen von G bei Unintelligenten und Intelligenten nicht

? Konkretes Beispiel : Könnte etwa folgendes sein :

− Männer : 40% i , 60% u , Frauen : 40% i , 60% u

− Unintelligente : 55% M , 45% F , Intelligente : 54% M , 46% F

?

→ Ist dieser Abhängigkeitsbegriff also ‚ symmetrisch ‘ oder nicht ?

1.2 QM1_18 125

→ Gemeinsame Verteilung von Zvan

♣ Gegeben : Zwei Zvan X , Y auf einem W-Raum < Ω, P >

? Beispiel : Ω kleine Population

? X : Geschlecht , Y : Haarfarbe

→ Betrachte beide Variablen ‚ gleichzeitig ‘

→ Aus Zwei mach Eins !

♦ Sind X , Y Zvan auf < Ω, P > mit Werten in Ω′ bzw. Ω′′ ,so ist die Zva (X, Y ) : Ω → Ω′ × Ω′′ definiert durch

(X, Y )(ω) := (X(ω), Y (ω))

♦ Die Verteilung von (X, Y ) heißt auch gemeinsame Verteilungvon X und Y

4 Analog für mehr als zwei Zvan

1.2 QM1_18 126

? Gegeben : Population Ω = a, b, c, d, e, f, g, h, i, j

− Interessant : X : Geschlecht , Y : Haarfarbe

Werte von X in Ω′ = m, w

Werte von Y in Ω′′ = b, r, s

− blond , rot , schwarz

Ungleiche Ziehungswahrscheinlichkeiten

− W-Maß P auf Ω gegeben durch W-Funktion f

Ausgangssituation , zusätzlich Werte von (X, Y ) :

ω f(ω) X(ω) Y (ω) (X, Y )(ω)

a .10 m b (m, b)

b .20 w b (w, b)

c .10 w s (w, s)

d .05 m s (m, s)

e .20 w s (w, s)

f .10 w b (w, b)

g .05 w r (w, r)

h .05 m r (m, r)

i .05 m s (m, s)

j .10 w b (w, b)

1.2 QM1_18 127

Ausgangsituation

ω f(ω) X(ω) Y (ω) (X, Y )(ω)

a .10 m b (m, b)

b .20 w b (w, b)

c .10 w s (w, s)

d .05 m s (m, s)

e .20 w s (w, s)

f .10 w b (w, b)

g .05 w r (w, r)

h .05 m r (m, r)

i .05 m s (m, s)

j .10 w b (w, b)

Verteilungen von X , Y über die W-Funktionen fX , fY :

x m w

fX(x) .25 .75

y b r s

fY (y) .5 .1 .4

m w0.51

x...........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....rr

b r s0.51

y......................................................

......

................................................

r r r

Verteilung von (X, Y ) (Gemeinsame Verteilung von X , Y )

W-Funktion von (X, Y ) : f(X,Y ) oder kurz : fX,Y

Anordnung der Werte von fX,Y in passender Tabelle :

x\y b r s

m .10 .05 .10

w .40 .05 .30

1.2 QM1_18 128

Anordnung der Werte von fX,Y in passender Tabelle :

x\y b r s

m .10 .05 .10

w .40 .05 .30

Solche Tabellen heißen Kontingenztafeln oder Kreuztabellen

Bildung der Randsummen ( selbsterklärend )

x\y b r s

m .10 .05 .10 .25

w .40 .05 .30 .75

.50 .10 .40 1

B Die Randsummen sind die W-Funktionen von X und Y :

‚X = m ‘ setzt sich zusammen aus

− ‚X = m, Y = b ‘, ‚X = m, Y = r ‘, ‚X = m, Y = s ‘

Diese Ereignisse sind disjunkt

→ fX(m) = fX,Y (m, b) + fX,Y (m, r) + fX,Y (m, s)

Dabei : ‚X = m, Y = b ‘ : ‚X = m ‘ und ‚ Y = b ‘ etc.

1.2 QM1_18 129

→ Allgemeine Bezeichnungen bei Kontingenztafeln

♣ Allgemeine Situation :

− X , Y sind Zvan auf Ω mit Werten in Ω′ , Ω′′

− Ω′ = x1, x2, . . . , xI , Ω′′ = y1, y2, . . . , yJ

P(X = xi, Y = yj) = fX,Y (xi, yj) := pi,j

Statt pi,j auch pij falls Missverständisse ausgeschlossen

→ Kontingenztafel dann

x\y y1 y2 . . . yJ

x1 p11 p12 . . . p1J

x2 p21 p22 . . . p2J... ... ... ...xI pI1 pI2 . . . pIJ

4 Die eigentliche Tafel hat I Zeilen und J Spalten

Indizierung der Elemente : Reihenfolge Zeile - Spalte

Bezeichnung der Randsummen :

pi. :=J∑

j=1

pij p.j :=I∑

i=1

pij

B Summe der i-ten Zeile bzw. der j-ten Spalte

4 Der Punkt zeigt , über welchen Index summiert wird

1.2 QM1_18 130

Kontingenztafel allgemein mit Randsummen :

x\y y1 y2 . . . yJ

x1 p11 p12 . . . p1J p1.x2 p21 p22 . . . p2J p2.... ... ... ... ...xI pI1 pI2 . . . pIJ pI.

p.1 p.2 . . . p.J 1

B pi. = fX(xi) = P(X = xi)

B p.j = fY (yj) = P(Y = yj)

p1., p2., . . . , pI. heißt auch oft Randverteilung ( von X )

− nicht ganz korrekt , aber suggestiv

Entsprechend p.1, p.2, . . . , p.J : Randverteilung ( von Y )

1.2 QM1_18 131

→ Bedingte Verteilungen

♣ Voraussetzung jetzt zunächst immer :

− Alle pi. und alle p.j sind 6= 0

4 Alle Werte xi von X sollen also W. 6= 0 haben

− Alle Werte yj von Y ebenso

B Sonst : die Werte mit W. 0 weglassen

P(X = xi |Y = yj) =P(X = xi, Y = yj)

P(Y = yj)=

pijp.j

Für jedes j erfüllt xi 7→pijp.j

die W-Funktions-Bedingungen

− Funktionswerte sind ≥ 0 , ihre Summe ist 1

♦ Das für ein festes j durch die W-Funktion

xi 7→pijp.j

definierte W-Maß auf Ω′ heißt auch die bedingte Verteilung vonX unter Y = yj

4 Dies ist übrigens das Bildmaß von P( · |Y = yj) unter X

4 Ganz analog : Definition der bedingten Verteilungen von Y

unter X = xi für alle i

1.2 QM1_18 132

? Bedingte Verteilungen im Beispiel :

Kontingenztafel :

x\y b r s

m .10 .05 .10 .25

w .40 .05 .30 .75

.50 .10 .40 1

? Bedingte Verteilung von X unter Y = b ?

→ W-Funktion : m 7→ .1/.5 = .2 , w 7→ .4/.5 = .8

? Bedingte Verteilung von Y unter X = m ?

→ W-Funktion : b 7→ .4 , r 7→ .2 , s 7→ .4

→ Veranschaulichung der bedingten Verteilungen :

− Bedingte Verteilungen von X unter Y = b , r , s :

m w0.51

x......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

rr

m w0.51

x......................................................

.......

.......

.......

.......

.......

.......

.......

.....r rm w

0.51

x...........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....rr

− Bedingte Verteilungen von Y unter X = m, w :

b r s0.51

y...........................................

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

.r r rb r s

0.51

y.........................................................

.......

............................................

r r r

1.2 QM1_18 133

→ Bedingte Verteilungen :

− Bedingte Verteilungen von X unter Y = b , r , s :

m w0.51

x......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

rr

m w0.51

x......................................................

.......

.......

.......

.......

.......

.......

.......

.....r rm w

0.51

x...........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....rr

− Bedingte Verteilungen von Y unter X = m, w :

b r s0.51

y...........................................

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

.r r rb r s

0.51

y.........................................................

.......

............................................

r r r

B Vergleich der bedingten Verteilungen :

− Die bedingten Verteilungen von X sind nicht alle gleich

− Die bedingten Verteilungen von Y sind nicht alle gleich

? Hätte es auch anders sein können ?

− Einmal Gleichheit , einmal nicht ?

1.2 QM1_18 134

? Nochmal das gleiche Beispiel , nur mit verändertem P

Ausgangsituation

ω f(ω) X(ω) Y (ω) (X, Y )(ω)

a .125 m b (m, b)

b .100 w b (w, b)

c .125 w s (w, s)

d .060 m s (m, s)

e .175 w s (w, s)

f .125 w b (w, b)

g .075 w r (w, r)

h .025 m r (m, r)

i .040 m s (m, s)

j .150 w b (w, b)

Kontingenztafel :

x\y b r s

m .125 .025 .100 .250

w .375 .075 .300 .750

.500 .100 .400 1

Verteilungen von X , Y :

m w0.51

x...........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....rr

b r s0.51

y......................................................

......

................................................

r r r

1.2 QM1_18 135

Kontingenztafel :

x\y b r s

m .125 .025 .100 .250

w .375 .075 .300 .750

.500 .100 .400 1

− Bedingte Verteilungen von X unter Y = b , r , s :

m w0.51

x...........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....rr

m w0.51

x...........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....rr

m w0.51

x...........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....rr

− Bedingte Verteilungen von Y unter X = m, w :

b r s0.51

y......................................................

......

................................................

r r rb r s

0.51

y......................................................

......

................................................

r r r

4 Jetzt : Jeweilige bedingte Verteilungen alle gleich

B Übrigens : Auch gleich der jeweiligen Randverteilung

? Zufall ?

B Bemerkenswert hier :

− Die pij sind die Produkte der Randsummen

1.2 QM1_18 136

→ Motivierung der Definition für Unabhängigkeit

Vorläufiger ( statistischer ) Unabhängigkeitsbegriff :

Y ist von X ‚ unabhängig ‘ , falls die bedingten Verteilungenvon Y unter X = xi alle gleich sind ( i = 1 , . . . , I )

Entsprechend umgekehrt (X von Y )

→ Schlussfolgerungen ?

• Sind die bedingten Verteilungen von Y unter X = xi allegleich , so gilt für alle i, j die Beziehung

pij = pi. p.j

on Für jedes j sind alle P(Y = yj |X = xi ) gleich :

p1j

p1.=

p2j

p2.= . . . =

pIjpI.

=: pj

Randsumme

p.j =∑i

pij =∑i

pj pi. = pj∑i

pi. = pj

→ Für jedes i gilt

pij = pj pi. = p.j pi.

B Umgekehrt mutatis mutandis genauso

1.2 QM1_18 137

→ Definition der Unabhängigkeit von Zvan

♦ Zwei Zvan X , Y auf einem endlichen W-Raum heißenunabhängig , falls in der zugehörigen Kontingenztafelfür alle i und j die folgende Beziehung gilt :

pij = pi. p.j

Griffige Ausdrucksweise :

− Gemeinsame Verteilung ist Produkt der Randverteilungen

? Beispiel :x\y b r s

m .125 .025 .100 .250

w .375 .075 .300 .750

.500 .100 .400 1

4 Voraussetzung pi. 6= 0 , p.j 6= 0 für alle i, j entfällt

4 Definition ist symmetrisch in X , Y

? Ist Definition Abschwächung des vorläufigen Begriffs ?

1.2 QM1_18 138

• Sind X und Y unabhängige Zvan auf endlichem W-Raum ,und sind alle pi. = P(X = xi) nicht 0 , so sind die bedingtenVerteilungen von Y unter X = xi alle gleich und außerdemgleich der Randverteilung von Y

4 pi. 6= 0 , damit bedingte Wn überhaupt definiert sind

on Es gilt für alle j :

P(Y = yj |X = xi) =pijpi.

=pi.p.jpi.

= p.j

4 Analog umgekehrt

B Technische Definition also in Einklang mit Intuition

4 Es folgt jetzt auch :

− Ist Y von X ‚ unabhängig ‘ , so auch X von Y

→ Alternativformulierungen für Unabhängigkeitsbedingung :

− Für alle x ∈ Ω′ und y ∈ Ω′′ gilt

P(X = x, Y = y) = P(X = x) · P(Y = y)

− Für alle x ∈ Ω′ und y ∈ Ω′′ gilt

fX,Y (x, y) = fX(x) · fY (y)

1.2 QM1_18 139

→ Multiplikativität bei Ereignissen

• Sind X : Ω → Ω′ und Y : Ω → Ω′′ unabhängig , so giltfür alle A ⊆ Ω′ und B ⊆ Ω′′ die Beziehung

P(X ∈ A, Y ∈ B) = P(X ∈ A) · P(Y ∈ B)

on X ∈ A und Y ∈ B ⇔ (X, Y ) ∈ A×B

→ P(X ∈ A, Y ∈ B) = P((X, Y ) ∈ A×B)

=∑

(x,y)∈A×B

fX,Y (x, y)

=∑x∈A

∑y∈B

fX(x) · fY (y)

=

(∑x∈A

fX(x)

∑y∈B

fY (y)

= P(X ∈ A) · P(Y ∈ B)

⇔ : genau dann, wenn

Praktische Sprechweise : ‚X ∈ A ‘ : ‚X-Ereignis ‘ etc.

B Satz dann :

− Sind X und Y unabhängig , so sind auch ‚X-Ereignisse ‘und ‚ Y -Ereignisse ‘ unabhängig

1.2 QM1_18 140

→ Umkehrung

• Sind X : Ω → Ω′ und Y : Ω → Ω′′ Zvan , und gilt füralle A ⊆ Ω′ und B ⊆ Ω′′ die Beziehung

P(X ∈ A, Y ∈ B) = P(X ∈ A) · P(Y ∈ B) ,

so sind X und Y unabhängig

on Zeige für alle x , y die Gleichung

P(X = x, Y = y) = P(X = x) · P(Y = y)

→ Setze hierzu A = x , B = y

B Definition der Unabhängigkeit mit Bedingung

P(X ∈ A, Y ∈ B) = P(X ∈ A) · P(Y ∈ B)

wäre gleichwertig mit gegebener Definition

4 Im allgemeinen Fall versagt die Formulierung

pij = pi.p.j ,

allgemeine Definition daher später über

P(X ∈ A, Y ∈ B) = P(X ∈ A) · P(Y ∈ B)

1.2 QM1_18 141

→ Unabhängigkeit von mehr als 2 Zvan

♦ Sind Xi : Ω → Ωi ( i = 1, . . . , n ) Zvan auf < Ω, P > mitWerten in endlichen Mengen Ωi , so heißen X1, . . . , Xn

(gemeinsam) unabhängig , falls für alle x1 ∈ Ω1 , x2 ∈ Ω2 , . . . ,xn ∈ Ωn folgende Beziehung gilt :

P(X1 = x1 , X2 = x2 , . . . , Xn = xn) =

P(X1 = x1) · P(X2 = x2) · . . . · P(Xn = xn)

4 Gemeinsame Unabhängigkeit ist mehr als paarweiseUnabhängigkeit für alle Paare (n > 2 )

• Zvan Xi : Ω → Ωi ( i = 1, . . . , n ) auf < Ω, P > mitWerten in endlichen Mengen Ωi sind genau dann unabhängig ,falls für alle A1 ⊆ Ω1 , A2 ⊆ Ω2 , . . . , An ⊆ Ωn folgendeBeziehung gilt :

P(X1 ∈ A1 , X2 ∈ A2 , . . . , Xn ∈ An) =

P(X1 ∈ A1) · P(X2 ∈ A2) · . . . · P(Xn ∈ An)

• Sind X1 , . . . , Xn gemeinsam unabhängig , so gilt dies auch fürjede Teilmenge der Xi

1.2 QM1_18 142

→ Untersuchung von Fragen nach Unabhängigkeit /Abhängigkeit

Oft ist interessant , ob zwei Variablen unabhängig sind

? Geschlecht und Intelligenz

Hypothesen : Unabhängigkeit wird zur H0

Test dann auf der Basis von Stichproben

? Was ist eigentlich das W-Maß ?

− Im Beispiel naheliegend : Gleichverteilung in der Population

→ Stichprobenziehung muss zum W-Maß passen

− Im Beispiel : ‚ repräsentative ‘ Stichprobe

? Was ist eigentlich die Population ?

? ???

B Bei Anwendungen darf man nicht zu genau hinschauen

1.2 QM1_18 143

→ Funktionen von Zvan und deren Verteilung

♦ Ist X : Ω → Ω′ eine Zva auf < Ω, P > undh : Ω′ → Ω′′ eine Funktion , so ist h(X) definiert als die Zvah(X) : Ω → Ω′′ mit

h(X)(ω) := h(X(ω))

für alle ω ∈ Ω

? Ω = a, b, c, d, e, f, g, h, i, j

− W-Funktion f und reelle Zva X gegeben durch Tabelle

− Funktion h : x 7→ x2

Bezeichnung für h(X) dann auch X2

Tabelle mit vorgegebenem f , X und mit h(X) = X2

ω a b c d e f g h i j

f(ω) .15 .15 .05 .10 .15 .10 .10 .05 .10 .05

X(ω) 2 0 1 −1 −2 1 0 −2 1 −1

X2(ω) 4 0 1 1 4 1 0 4 1 1

Verteilung von X und X2 über die W-Funktionen

x −2 −1 0 1 2

fX(x) .20 .15 .25 .25 .15

y 0 1 4

fX2(y) .25 .40 .35

B W-Funktion von X2 kann auch aus fX bestimmt werden

1.2 QM1_18 144

? Summe von Zvan

− Summe als Beispiel einer Funktion von 2 Zvan

? Gegeben : W-Raum mit zwei rellen Zvan X , Y

− Bilde daraus die neue Zva S := X + Y

ω a b c d e f g h i j

f(ω) .15 .15 .05 .10 .15 .10 .10 .05 .10 .05

X(ω) 1 0 1 2 1 0 1 2 1 2

Y (ω) 0 1 2 0 2 1 0 2 1 1

S(ω) 1 1 3 2 3 1 1 4 2 3

Gemeinsame Verteilung von X und Y und Verteilung von S

x\y 0 1 2

0 .00 .25 .00

1 .25 .10 .20

2 .10 .05 .05

s 0 1 2 3 4

fS(s) .00 .50 .20 .25 .05

B fS kann auch aus Kreuztabelle bestimmt werden

• Die Verteilung einer Funktion einer ( oder mehrerer ) Zva(n)kann auch auf der Basis der Verteilung der Zva ( bzw. dergemeinsamen Verteilung der Zvan ) bestimmt werden

B Rückgriff auf das ursprüngliche P auf Ω ist nicht nötig

1.2 QM1_18 145

Ergänzungen zur Deskriptiven Statistik.

→ Qualitative Variablen ( auch : quantitative mit wenig Werten )

4 Bekannt :

− Absolute und relative Häufigkeitsverteilung einer Variablen

→ Gemeinsame Verteilung von zwei Variablen

Notation für den allgemeinen Fall :

− Variablen : X , Y

− Mögliche Werte : x1 . . . , xI (X ) , y1 . . . , yJ (Y )

− Stichprobengröße : n

n(X = xi) : Absolute Häufigkeit des Wertes xi

h(X = xi) := n(X = xi)/n : Relative Häufigkeit von xi

→I∑

i=1

n(X = xi) = n

→I∑

i=1

h(X = xi) =I∑

i=1

n(X = xi)/n

= (1/n)I∑

i=1

n(X = xi) = (1/n) · n = 1

Y analog

1.3 QM1_18 146

? Beispiel : Zusammenhang zwischen Geschlecht und Haarfarbe ?

− X : Geschlecht , Werte : m , w

− Y : Haarfarbe , Werte : b , r , s ( blond , rot , schwarz )

? Stichprobe :

V p X Y

1 w b

2 m b

3 w r

4 w b

5 w s

V p X Y

6 m s

7 w r

8 w b

9 m s

10 m r

V p X Y

11 w r

12 w b

13 w b

14 w b

15 w s

V p X Y

16 m s

17 w b

18 w s

19 w b

20 w b

Auszählen am besten mit Strichliste

x\y b r s

m | | |||w ||||| |||| ||| |||

Absolute Häufigkeiten

x\y b r s

m 1 1 3 5

w 9 3 3 15

10 4 6 20

Relative Häufigkeiten

x\y b r s

m .05 .05 .15 .25

w .45 .15 .15 .75

.50 .20 .30 1

1.3 QM1_18 147

Notationen :

n(X = xi, Y = yj) : Absolute Häufigkeit von (xi, yj)

h(X = xi, Y = yj) : Relative Häufigkeit von (xi, yj)

Kurzschreibweisen :

− nij für n(X = xi, Y = yj)

− hij für h(X = xi, Y = yj)

→ Versammlung der Häufigkeiten in Kontingenztafeln

− mit Randsummen ( analog zu Wahrscheinlichkeiten )

→ Absolute Häufigkeiten :

x\y y1 y2 . . . yJ

x1 n11 n12 . . . n1J n1.x2 n21 n22 . . . n2J n2.... ... ... ... ...xI nI1 nI2 . . . nIJ nI.

n.1 n.2 . . . n.J n

→ Relative Häufigkeiten :

x\y y1 y2 . . . yJ

x1 h11 h12 . . . h1J h1.x2 h21 h22 . . . h2J h2.... ... ... ... ...xI hI1 hI2 . . . hIJ hI.

h.1 h.2 . . . h.J 1

B ni. = n(X = xi) etc. etc.

1.3 QM1_18 148

→ Bedingte relative Häufigkeiten

4 Analog zu bedingten Wn

♣ Voraussetzung im Folgenden :

− Alle hi. und alle h.j sind 6= 0

♦ Die Zahlen

h(Y = yj |X = xi) :=n(Y = yj, X = xi)

n(X = xi)

heißen bedingte relative Häufigkeiten von Y unter X = xi

4 Kurz : h(Y = yj |X = xi) =nijni.

4 ‚X unter Y ‘ : analog

→ Berechnung mit relativen Häufigkeiten :

• h(Y = yj |X = xi) =hijhi.

on h(Y = yj |X = xi) =nijni.

=nij/n

ni./n=

hijhi.

1.3 QM1_18 149

? Bedingte relative Häufigkeiten im Beispiel

Kontingenztafeln :

x\y b r s

m 1 1 3 5

w 9 3 3 15

10 4 6 20

x\y b r s

m .05 .05 .15 .25

w .45 .15 .15 .75

.50 .20 .30 1

Bedingte relative Häufigkeitsverteilungen von Y :

y b r s

h(Y = y |X = m) .2 .2 .6

h(Y = y |X = w) .6 .2 .2

Bedingte relative Häufigkeitsverteilungen von X :

x m w

h(X = x |Y = b) .10 .90

h(X = x |Y = r) .25 .75

h(X = x |Y = s) .50 .50

1.3 QM1_18 150

→ Graphische Darstellung

? Kontingenztafel ( relative Häufigkeiten )

x\y b r s

m .05 .05 .15 .25

w .45 .15 .15 .75

.50 .20 .30 1

Darstellung der relativen Häufigkeiten :

− Zwei Möglichkeiten :

0.1

.5

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......................

...................

........................................................................................................................................................................................................................................................................................................................................

m w X

b

r

s.....................

......

....................................... ................................................................................................................................................................................................................................................................................................................................................................

........................................................................................

.................................................................. ......................

.......

.......

.......

.......

.......

.......

..........................................................................

........................................................................................

.......................................................................................................................................... ......................

.......

.......

.......

.......

.......

.......

..........................................................................

........................................................................................

..............................

................................................

.....................

.................

......................

............................

..........

.....................

.....................

.....................

.....................

.....................

.........................

...........

.....................

.....................

.....................

.....................

.....................

....................... ...........

......................

............................

.....................

0.1

0.5

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......................

...................

........................................................................................................................................................................................................................................................................................................................................................................................................

b r s Y

m

w.....................

......

....................................... .................................................................. ......................

.......

.......

.......

.......

.......

.......

..........................................................................

........................................................................................

................................................................................................................................................................................................................................................................................................................................................................ ......................

.......

.......

.......

.......

.......

.......

.......................................................................... ..........................................................................................................................................

........................................................................................

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

............... ..................................................................

B Absolute Häufigkeiten : Praktisch genauso

− Nur andere Skalierung der Ordinate

1.3 QM1_18 151

→ Bedingte relative Häufigkeiten

− Zunächst von Y ‚ unter X ‘

y b r s

h(Y = y |X = m) .2 .2 .6

h(Y = y |X = w) .6 .2 .2

Zwei Möglichkeiten der Darstellung :

0.1

0.5

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

........................

...................

........................................................................................................................................................................................................................................................................................................................................

m w X

b

r

s......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

......................................................................................... ..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................

........................................................................................

.............................................................................................................................................................................. ......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................................................................................

........................................................................................

.......................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................................................................................

........................................................................................

.................................

.....................

.....................

.....................

...................

................................................

.....................

.....................

.......................

......................

............................

..........

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

......................

...........

.....................

.....................

.....................

.....................

.....................

.....................

.....................

............................

...........

......................

............................

.....................

0.1

0.5

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

........................

...................

........................................................................................................................................................................................................................................................................................................................................................................................................

b r s Y

m

w......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

......................................................................................... .............................................................................................................................................................................. ......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................................................................................................................................................................................................................................

........................................................................................

.......................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

......................................................................................... ..............................................................................................................................................................................

........................................................................................

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

......................

......................

......................

4 Unterschiedliche jeweilige Vorteile der Diagramme

1.3 QM1_18 152

→ Bedingte relative Häufigkeiten

− Nun von X ‚ unter Y ‘

x m w

h(X = x |Y = b) .10 .90

h(X = x |Y = r) .25 .75

h(X = x |Y = s) .50 .50

Wieder zwei Möglichkeiten der Darstellung :

0.1

.5

1

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

........................................................................................................................................................................................................................................................................................................................................

m w X

b

r

s......................

.......

.......

.......

............................................. ................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

........................................................................................

.............................................................................................................................................................................. ......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................................................................................................................................................................................................................................

........................................................................................

............................................................................................................................................................................................................................................................................................................................ ......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.................................................................................................................................................................

........................................................................................

.................................

.....................

.....................

.....................

...................

................................................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

......................

............................

..........

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

..........................

...........

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.....................

.......................

...........

......................

............................

.....................

0.1

.5

1

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

........................................................................................................................................................................................................................................................................................................................................................................................................

b r s Y

m

w......................

.......

.......

.......

............................................. .............................................................................................................................................................................. ......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.................................................................................................................................................................

........................................................................................

................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................ ......................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

......................................................................................................................................................................................................................................... ............................................................................................................................................................................................................................................................................................................................

........................................................................................

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

...............

......................

......................

......................

1.3 QM1_18 153

→ Bedingte Verteilungen und Randverteilung

• h(X = xi) =J∑

j=1

h(X = xi |Y = yj)h(Y = yj)

on Rechte Seite ist∑j

hijh.j

h.j =∑j

hij = hi.

4 Randverteilung von Y : analog

4 Analog auf theoretischer Ebene für Wahrscheinlichkeiten

4 Vgl. Satz von der totalen Wahrscheinlichkeit

B Andere Formulierung :

− Randverteilung ist gewichtetes Mittel der bedingten Verteilungen

− Gewichte stammen aus der anderen Randverteilung

4 Gemeint ist :

− Jede relative Randhäufigkeit hi. ist gewichtetes Mittel ...

B Gewichte sind dabei unabhängig von i

1.3 QM1_18 154

→ Umrechnung bedingter relativer Häufigkeiten

• h(Y = yk |X = xi) =h(X = xi |Y = yk)h(Y = yk)∑j h(X = xi |Y = yj)h(Y = yj)

on Zähler : hik , Nenner : hi.

4 h(X = xl |Y = yj) analog

4 Analog auf theoretischer Ebene für Wahrscheinlichkeiten

4 Vgl. Satz von Bayes

→ Stichprobe und Population

Interessant sind Verhältnisse in Populationen

? Sind zwei Variablen abhängig oder unabhängig ?

Untersuchung solcher Fragen mit Hilfe von Stichproben

♠ Populationsverhältisse sollten sich in Stichprobe widerspiegeln

− Jedenfall mehr oder weniger

→ Ein Hauptthema der Statistik :

− Möglichkeit von Rück ‚ schlüssen ‘

1.3 QM1_18 155

→ Unabhängigkeit /Abhängigkeit in Stichproben

→ Entsprechende Fragen sind interessant für Populationen

− für die Stichprobe eigentlich weniger

→ Trotzdem : Verhältnisse in Stichprobe können Hinweise geben

→ Bildung hilfreicher Begriffe

♦ Zwei Variabe X und Y heißen ( in der Stichprobe )unabhängig , falls in der Kontingenztafel für alle i, j folgendeBeziehung gilt :

hij = hi. h.j

4 Imitation des Unabhängigkeitsbegriffs auf Stichprobenebene

Bei Unabhängigkeit in der Population sollte hoffentlich in derStichprobe ‚ näherungsweise ‘ Unabhängigkeit gegeben sein

‚ Starke Abweichung ‘ von der Unabhängigkeit in der Stichprobespricht gegen Unabhängigkeit in der Population

→ Aufgabe :

− Entwicklung eines ‚ Maßes ‘ für den Grad der Abhängigkeit

1.3 QM1_18 156

→ Ein Gegenbegriff zur Unabhängigkeit

→ Motivation :

− Eine ‚ starke ‘ Abhängigkeit liegt vor , wenn man aus derAusprägung einer Variable auf die Ausprägung der anderen‚ schließen ‘ kann

? Beispiel : Kontingenztafel relativer Häufigkeiten

x\y y1 y2 y3

x1 .00 .25 .00

x2 .35 .00 .40

→ Hier kann von Y auf X ‚ geschlossen ‘ werden

− Nicht aber von X auf Y

? Beispiel :x\y y1 y2 y3

x1 .10 .25 .00

x2 .25 .00 .40

→ In keiner Richtung ist ein ‚ Schluss ‘ möglich

? Beispiel :x\y y1 y2 y3

x1 .25 .00 .00

x2 .00 .00 .45

x3 .00 .30 .00

→ ‚ Schlüsse ‘ sind in beide Richtungen möglich

1.3 QM1_18 157

♦ Zwei Variablen X und Y heißen vollständig abhängig ( in derStichprobe ) , falls für ihre Kontingenztafel (mindestens ) eineder folgenden Bedingungen gilt :

(i) In jeder Zeile steht höchstens eine Zahl 6= 0

(ii) In jeder Spalte steht höchstens eine Zahl 6= 0

4 (i) : Y ist von X abhängig , (ii) : X von Y

4 Dieser Abhängigkeitsbegriff ist bestenfalls ‚ statistisch ‘

− ‚ Bestenfalls ‘ : Bezug auf die Stichprobe , nicht die Population

4 Vollständige Abhängigkeit und Unabhängigkeit schließen sich aus

− Trivialfälle (Variablen mit nur einer Ausprägung ) ausgenommen

B Sie sind aber nicht das jeweilige Gegenteil

− Es gibt Fälle ‚ dazwischen ‘

4 Da alle Randsummen 6= 0 sind ( allgemeine Voraussetzung )

− kann man ‚ höchstens ‘ durch ‚ genau ‘ ersetzen

1.3 QM1_18 158

→ Erwartete relative Häufigkeiten

♦ Sind hij die relativen Häufigkeiten in einer Kontingenztafel , soheißen die Zahlen

eij := hi. h.j

auch erwartete relative Häufigkeiten

? Kontingenztafel mit Randsummen :

x\y y1 y2 y3

x1 .05 .05 .15 .25

x2 .45 .15 .15 .75

.50 .20 .30 1

→ Tafel der eij mit Randsummen :

x\y y1 y2 y3

x1 .125 .050 .075 .250

x2 .375 .150 .225 .750

.500 .200 .300 1

→ Die Randsummen bleiben erhalten

•∑i

eij = h.j ,∑j

eij = hi.

on∑i

eij =∑i

hi.h.j = h.j∑i

hi. = h.j · 1 = h.j

1.3 QM1_18 159

4 ‚ Erwartete ‘ relative Häufigkeiten :

− ‚ Erwartet ‘ bei Unabhängigkeit

4 Die eij sind denkbare relative Häufigkeiten (≥ 0 ,∑

: 1 )

− mit gleichen ( gegebenen ) Randsummen

− die bei Unabhängigkeit vorliegen müssten

→ Idee für ein Maß der Abweichung von Unabhängigkeit :

− Vergleiche die hij mit den eij

♦ Sind hij die relativen Häufigkeiten in der Kontingenztafel vonzwei Variablen X und Y , so heißt die Zahl

ϕ2 :=I∑

i=1

J∑j=1

(hij − eij)2

eij

auch ϕ2-Koeffizient der Kontingenztafel

4 ϕ2 ist genau dann 0 wenn hij = eij für alle i, j

− also genau bei Unabhängigkeit

4 ϕ2 wächst mit den Unterschieden zwischen den hij und eij

B ϕ2 scheint sich als Abhängigkeitsmaß zu eignen

1.3 QM1_18 160

? Berechnungsbeispiel

Kontingenztafel mit Randsummen :

x\y y1 y2 y3

x1 .05 .05 .15 .25

x2 .45 .15 .15 .75

.50 .20 .30 1

→ Tafel der eij :

x\y y1 y2 y3

x1 .125 .050 .075

x2 .375 .150 .225

Berechnung

(i, j) hij eij (hij − eij)(hij − eij)2

eij(1, 1) .05 .125 −.075 .045

(1, 2) .05 .050 .000 .000

(1, 3) .15 .075 .075 .075

(2, 1) .45 .375 .075 .015

(2, 2) .15 .150 .000 .000

(2, 3) .15 .225 −.075 .025

.160

→ ϕ2 = .16

? (Was sagt uns das ? )

1.3 QM1_18 161

→ Alternative Berechnungsformeln

• ϕ2 =∑i,j

h2ij

eij− 1 =

∑i,j

n2ij

ni. n.j− 1

on ϕ2 =∑i,j

(hij − eij)2

eij

=∑i,j

(h2ij

eij− 2hij + eij

)

=∑i,j

h2ij

eij− 2

∑i,j

hij +∑i,j

eij

=∑i,j

h2ij

eij− 2 + 1

=∑i,j

h2ij

eij− 1

∑i,j

h2ij

eij=∑i,j

(nij/n)2

(ni./n)(n.j/n)=∑i,j

n2ij

ni. n.j

4 Vorteil : Meist schnelleres Rechnen

− Nachteil : Bedeutung nicht so klar

→ Ursprüngliche Formel für Definition geeigneter

1.3 QM1_18 162

→ Eigenschaften

Abkürzung : L = Min( I, J )

? Für I = 2 und J = 3 ist L = 2

• ϕ2 ≥ 0

• ϕ2 = 0 ⇔ X und Y sind unabhängig

• ϕ2 ≤ L− 1

• ϕ2 = L− 1 ⇔ X und Y sind vollständig abhängig

4 Werte 0 und L− 1 haben Bedeutung

? Werte dazwischen ? ‚ Weder – noch ‘

? Vergleichbarkeit von Werten ?

− Je größer ϕ2 , um so größer die Abhängigkeit ??

4 Vergleiche vielleicht möglich bei Tafeln gleicher Größe

? Können wir jetzt das Ausmaß der Abhängigkeit ‚ messen ‘ ?

? Bringt der Koeffizient neue nichtstatistische Einsichten ?

1.3 QM1_18 163

→ Verwandte Indizes

♦ ϕ′ :=

√ϕ2

L− 1heißt auch Cramérs V

4 ϕ′ ‚ erbt ‘ die Eigenschaften von ϕ2

− Vorteil : Maximalwert ist hier immer 1

• 0 ≤ ϕ′ ≤ 1

• ϕ′ = 0 ⇔ X und Y sind unabhängig

• ϕ′ = 1 ⇔ X und Y sind vollständig abhängig

♦ χ2 := nϕ2 heißt auch χ2-Koeffizient

Zur Unterscheidung auch Pearson-χ2

• 0 ≤ χ2 ≤ n (L− 1)

• χ2 = 0 ⇔ X und Y sind unabhängig

• χ2 = n (L− 1) ⇔ X und Y sind vollständig abhängig

B χ2 wird für einen verbreiteten Test auf Unabhängigkeit benutzt

1.3 QM1_18 164

→ Alternative Berechnung von χ2

• χ2 =∑i,j

(nij −

ni.n.jn

)2

ni.n.jn

on n eij = nni.n

n.jn

=ni.n.jn

χ2 = nϕ2 = n∑i,j

(hij − eij)2

eij

=∑i,j

n2 (hij − eij)2

n eij=∑i,j

(n (hij − eij))2

n eij

=∑i,j

(nij −

ni.n.jn

)2

ni.n.jn

4 Für die praktische Rechnung womöglich bequemere Formeln

− Vgl. ϕ2

Die n eij =ni.n.jn

heißen auch erwartete Häufigkeiten

4 ‚ Erwartet ‘ bei Unabhängigkeit und gegebenen Randsummen

B Meist keine möglichen Häufigkeiten, da keine natürliche Zahlen

1.3 QM1_18 165

→ χ2 mit anderen Bezeichnungen

fo,ij := nij : ‚ beobachtete Häufigkeiten ‘

− f : ‚ frequency ‘ , o : ‚ observed ‘ ,

fe,ij := n eij =ni.n.jn

: ‚ erwartete Häufigkeiten ‘

− e : ‚ expected ‘

→ Mit diesen Bezeichnungen :

χ2 =∑i,j

(nij −

ni.n.jn

)2

ni.n.jn

=∑i,j

(fo,ij − fe,ij)2

fe,ij

4 Vergleich von beobachteten und erwarteten Häufigkeiten

1.3 QM1_18 166

→ Testen mit χ2

Hypothesen :

H0 : X und Y sind unabhängig

H1 : nicht H0

B Die Hypothesen beziehen sich auf die ‚ Population ‘

→ Theoretische Ebene

B X und Y werden als Zvan betrachtet

→ Vorgehen :

− Ziehen einer ‚ Zufallsstichprobe ‘

− Berechnen von χ2

− Verwerfen von H0 für große Werte

4 Kritische Werte in geeigneten Tabellen

B Wie üblich : Schwache Position von H0

4 Ein ganz ähnlicher Test benutzt eine eine andere , auch χ2

genannte Statistik ( ‚Maximum-Likelihood-χ2 ‘ )

1.3 QM1_18 167

→ Mehr als zwei Variablen

? Ein Beispiel mit drei Variablen

Hat ein Gen G etwas mit einer Eigenschaft E zu tun?

Geschlecht wird bei Untersuchung berücksichtigt

Jetzt : Drei Variablen

− X : Gen (Werte : g+ , g− : vorhanden : ja , nein )

− Y : Eigenschaft (Werte : e+ , e− : vorhanden : ja , nein )

− Z : Geschlecht (Werte : m , w )

→ Statt Kontingenztafel jetzt : ‚ Kontingenzquader ‘

............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................ .......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

...............................................................................................................................................

........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..............................................................................................................................................................................................................................................................................................

.....................................................................................................

..............................................................................................................

............................................................................................

........................................................................................... ...................

........................................................................................... ...................

........................................................................................... ...................

........................................................................................... ...................

......................................................................

...................

......................................................................

...................

m

w

g−g+

e−e+

Z

X

Y

→ Datendarstellung : ‚ schichtweise ‘

? Beispielsweise eine Schicht m und eine Schicht w

1.3 QM1_18 168

............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................ .......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

...............................................................................................................................................

........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..............................................................................................................................................................................................................................................................................................

.....................................................................................................

..............................................................................................................

............................................................................................

........................................................................................... ...................

........................................................................................... ...................

........................................................................................... ...................

........................................................................................... ...................

......................................................................

...................

......................................................................

...................

m

w

g−g+

e−e+

Z

X

Y

? Beispiel ‚ daten ‘ (Werte der Übersichlichkeit halber )

Z = m

x\y e+ e−g+ 1 2

g− 3 4

Z = w

x\y e+ e−g+ 5 6

g− 7 8

Andere Anordnung :

X = g+

z\y e+ e−m 1 2

w 5 6

X = g−z\y e+ e−m 3 4

w 7 8

Dritte mögliche Anordnung :

Y = e+

z\x g+ g−m 1 3

w 5 7

Y = e−z\x g+ g−m 2 4

w 6 8

1.3 QM1_18 169

→ Randverteilungen

→ Sinnvoll : Zunächst von je zwei Variablen

............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................ .......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

...............................................................................................................................................

........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..............................................................................................................................................................................................................................................................................................

.....................................................................................................

..............................................................................................................

............................................................................................

........................................................................................... ...................

........................................................................................... ...................

........................................................................................... ...................

........................................................................................... ...................

......................................................................

...................

......................................................................

...................

m

w

g−g+

e−e+

Z

X

Y

? DatenZ = m

x\y e+ e−g+ 1 2

g− 3 4

Z = w

x\y e+ e−g+ 5 6

g− 7 8

Randverteilungen von X und Y , Z und Y , Z und X

− mit jeweiligen Randverteilungen der Einzelvariablen

X , Y

x\y e+ e−g+ 6 8 14

g− 10 12 22

16 20 36

Z , Y

z\y e+ e−m 4 6 10

w 12 14 26

16 20 36

Z , X

z\x g+ g−m 3 7 10

w 11 15 26

14 22 36

B Randverteilungen von X , Y , Z müssen jeweils gleich sein

1.3 QM1_18 170

→ Bedingte Verteilungen

B Unterschiedliche Arten von bedingten Verteilungen

? DatenZ = m

x\y e+ e−g+ 1 2

g− 3 4

Z = w

x\y e+ e−g+ 5 6

g− 7 8

? Beispiele für bedingte Verteilungen :

? Bedingte ( gemeinsame ) Verteilung von X , Y für Z = m

− mit Randverteilungen

Z = m

x\y e+ e−g+ .1 .2 .3

g− .3 .4 .7

.4 .6 1

B Randverteilungen hier :

− Bedingte Verteilungen von X und Y für Z = m

? Bedingte Verteilung von X für Z = m und Y = e+

Z = m, Y = e+

x g+ g−.25 .75 1

4 Vgl. bedingte Verteilung von X und Y für Z = m

1.3 QM1_18 171

→ ‚ Bedingte Unabhängigkeit ‘

? Ein Beispiel für mögliche Überraschungen

? DatenZ = m

x\y e+ e−g+ 1 9

g− 9 81

Z = w

x\y e+ e−g+ 81 9

g− 9 1

Bedingte gemeinsame Verteilungen von X und Y :

Z = m

x\y e+ e−g+ .01 .09 .1

g− .09 .81 .9

.1 .9 1

Z = w

x\y e+ e−g+ .81 .09 .9

g− .09 .01 .1

.9 .1 1

→ ‚ Bedingte Unabhängigkeit ‘ für m und für w

Randverteilung von X und Y ( relative Häufigkeiten )

x\y e+ e−g+ .41 .09 .5

g− .09 .41 .5

.5 .5 1

→ Ziemlich deutliche Abhängigkeit insgesamt

− trotz Unabhängigkeit für m und w für sich genommen !

1.3 QM1_18 172

? Noch ein Beispiel

? DatenZ = m

x\y e+ e−g+ 25 0

g− 0 25

Z = w

x\y e+ e−g+ 0 25

g− 25 0

→ Vollständige Abhängigkeit bei m und bei w

Randverteilung von X und Y ( relative Häufigkeiten )

x\y e+ e−g+ .25 .25 .5

g− .25 .25 .5

.5 .5 1

→ Unabhängigkeit insgesamt

− trotz vollständiger Abhängigkeit für m und w getrennt

B Begrifflichkeit ist komplizierter

− als man vielleicht ( naiv ) zuerst denkt

! Gefahren unreflektierten Daherassoziierens !

1.3 QM1_18 173

→ Quantitative Daten

? Gegeben sind Daten von 20 Vpn in einer Variable X

− 4, 2, 1, 5, 3, 1, 5, 3, 2, 5, 2, 3, 1, 2, 0, 4, 2, 2, 1, 2

xi : Wert von Vp i

! Andere Verwendung des Symbols xi als vorher

? x5 = 3

Häufigkeitsauszählung ( geordnet )

wj : mögliche Werte ( j = 1, . . . J )

− nach Größe geordnet : w1 < w2 < . . . < wJ

nj : absolute Häufigkeit von wj

♦ hj := nj/n : relative Häufigkeit von wj

→ Tabelle mit ‚ kumulierten relativen Häufigkeiten ‘ F (wj)

j wj nj hj F (wj)

1 0 1 0.05 .052 1 4 0.20 .253 2 7 0.35 .604 3 3 0.15 .755 4 2 0.10 .856 5 3 0.15 1.00∑

20 1.00

1.3 QM1_18 174

j wj nj hj F (wj)

1 0 1 0.05 .052 1 4 0.20 .253 2 7 0.35 .604 3 3 0.15 .755 4 2 0.10 .856 5 3 0.15 1.00∑

20 1.00

Neu nur : die kumulierten relativen Häufigkeiten F (wj)

Formal :

♦ F (wk) :=k∑

j=1

hj

4 Analogie : Verteilungsfunktion

Bedeutung von F (wj) :

− Anteil der Stichprobe mit Werten ≤ wj

? F (3) = .75

→ 75% der Vpn haben einen Wert ≤ 3

→ 25% der Vpn erreichen einen höheren Wert als 3

♦ 100F (w) heißt auch Prozentrang von w

? Der Prozentrang von 3 ist 75

1.3 QM1_18 175

Der Prozentrang einer Vp ist der Prozentrang ihres X-Wertes

4 Über den Prozentrang kann man manchmal (mit aller Vorsicht )Personen in verschiedenen Situationen vergleichen

? Zwei Gruppen schreiben verschiedene Statistikklausuren

− A aus Gruppe 1 erreicht 19 Punkte

− B aus Gruppe 2 erreicht 23 Punkte

? Wer ist besser ?

? ??? ( ‚ Ist es nachts kälter als draußen ? ‘ )

Nun seien zusätzlich die Prozentränge bekannt

− Prozentrang von A : 86 , Prozentrang von B : 47

→ (Mit aller Vorsicht ) A ist besser

B Voraussetzung für derartige Vergleiche :

− Die beiden Gruppen sind hinsichtlich der Leistung etwa gleich

4 Prozentrang wird oft in Diagnostik verwendet

? Leistungsbeurteilung

→ Antwort auf die Frage :

− Wo steht ein Proband in seiner Vergleichsgruppe ?

− Voraussetzung : ‚ Normstichproben ‘

1.3 QM1_18 176

j wj nj hj F (wj)

1 0 1 0.05 .052 1 4 0.20 .253 2 7 0.35 .604 3 3 0.15 .755 4 2 0.10 .856 5 3 0.15 1.00∑

20 1.00

Umgekehrte Fragestellung :

? Welchen Wert braucht man für einen Prozentrang von 85 ? ( 4 )

4 Welchen Wert braucht man für einen Prozentrang von 50 ?

Nicht ganz klar

→ Geeignete Konventionen nötig

→ Darstellung der kumulierten relativen Häufigkeiten

− analog zur Verteilungsfunktion

?

0 1 2 3 4 50

.5

1

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ............................................................................................................................................................................................................................................................................................................................................................................................

...................

x

F

........................................................................

........................................................................

........................................................................

........................................................................

........................................................................

.................................................................................................................................

rr

r r r r

4 Sprunggrößen im Balkendiagramm der relativen Häufigkeiten

1.3 QM1_18 177

→ Kenngrößen für quantitative Variablen

→ Maße der zentralen Tendenz

? Wo liegen die Daten ‚ im Mittel ‘ ?

→ Weit verbreitet : Mittelwert

♣ Situation : n Vpn liefern in Variable X die Werte x1, . . . , xn

− Mögliche Werte geordnet : w1, . . . , wJ

− Relative Häufigkeiten der Werte : h1, . . . , hJ

♦ In der gegebenen Situation heißt

MX :=1

n

n∑i=1

xi

auch Mittelwert der Variable X

Schreibweise manchmal auch M(X)

Berechnung mit relativen Häufigkeiten

• MX =J∑

j=1

wjhj

4 Gewichtetes Mittel der möglichen Werte , Gewichte : hj

1.3 QM1_18 178

→ Verhalten des Mittelwerts bei Transformationen

♦ Eine Funktion f : R → R mit

f(x) = a x+ b

heißt manchmal auch lineare Transformation

4 Nicht die glücklichste Bezeichnung

Erinnerung : Schaubild :

1.............................................................................................................................................................................................................................................................................................................................................................................................................................................................. ........................................................................................................................................................................................................................................................................................................................................................

...................

x

f(x)

....................................

....................................

....................................

....................................

....................................

....................................

....................................

....................................

....................................

....................................

....................................

....................................

....................................

....................................

....................................

....................................

................................

.....................................................................................................................................................................................................

a

1

b

? Umrechnungen von Intervallskalen

B Genauer :

− Intervallskalen sind dadurch definiert, dass die möglichenUmrechnungen von einer Skala in eine andere genau die linearenTransformationen mit a 6= 0 sind

? Umrechnung Celsius → Fahrenheit : F =9

5C + 32

1.3 QM1_18 179

Bildung neuer Variablen

Ist X eine Variable und f eine Funktion auf dem Bereich dermöglichen Werte von X , so ist f(X) die Variable, die denWert f(x) annimmt , falls X den Wert x annimmt

? X : Temperatur in Celsius

Y =9

5X + 32 : Temperatur in Fahrenheit

? Ist Y = X2 und hat Vp 4 in X den Wert 3 , so hat sie in Y

den Wert 9 (x4 = 3 ⇒ y4 = 9 )

Analog : Funktionen von 2 Variablen

− Summen , Produkte , etc. etc.

• Ist X eine reellwertige Variable und Y = aX + b , so gilt füreine gegebene Stichprobe

MY = aMX + b

on Werte von X : x1, . . . , xn (n Vpn )

Werte von Y dann : y1 = ax1 + b, . . . , yn = axn + b

MY =1

n

∑i

yi =1

n

∑i

(a xi + b)

=1

n

∑i

a xi +1

n

∑i

b = a1

n

∑i

xi +1

nn b

= aMX + b

1.3 QM1_18 180

? Beispiel für bequemere Rechnungen :

? Gesucht ist der Mittelwert von , 4020 , 4050 , 3990

Fasse Zahlen auf als Transformationen von 2 , 5 , −1

− unter der Transformation Y = 10 X + 4000

Mittelwert von 2 , 5 , −1 ist 2

→ Mittelwert der Originaldaten ist 10 · 2 + 4000 = 4020

→ Mittelwert von Summen

• Sind X und Y reellwertige Variable und Z = X + Y , so giltfür eine gegebene Stichprobe

MZ = MX +MY

on Werte von X und Y : x1, . . . , xn bzw. y1, . . . , yn (n Vpn )

Werte von Z dann : z1 = x1 + y1, . . . , zn = xn + yn

MZ =1

n

∑i

zi =1

n

∑i

(xi + yi)

=1

n

∑i

xi +1

n

∑i

yi

= MX +MY

? Intelligenztest Z ist Summe aus zwei Untertests X , Y

→ Mittelwert des Tests ist Summe der Mittelwerte der Untertests

1.3 QM1_18 181

→ Verallgemeinerung

? X und Y sind Tests von Intelligenzkomponenten

− Gesamttestergebnis Z ist 2X + 3Y − 5

− Untertests also verschieden ‚ gewichtet ‘

− Zusätzlich Konstante (−5 ) ,

− vielleicht für glatten Gesamtmittelwert

? Mittelwert von Z ?

Mehrfache Anwendung der Regeln ( verschiedene Möglichkei-ten )

MZ = M(2X + 3Y − 5) = M((2X + 3Y )− 5)

= M(2X + 3Y )− 5 = M((2X) + (3Y ))− 5

= M(2X) +M(3Y )− 5 = 2MX + 3MY − 5

Insgesamt :

→ MZ = M(2X + 3Y − 5) = 2MX + 3MY − 5

1.3 QM1_18 182

→ Linearkombinationen

♦ Sind X1 , X2 , . . . , Xm reellwertige Variablen unda1 , a2 , . . . , am und b Zahlen , so heißt die Variable

m∑j=1

ajXj + b

auch Linearkombination von X1 , X2 , . . . , Xm

a1 , a2 , . . . , am : Koeffizienten

b : additive Konstante

? Bildung des Gesamtscores eines Tests

− aus mehreren Untertests Xj

− mit unterschiedlichen ‚ Gewichtungen ‘

4 Verschiedener Sprachgebrauch in der Linearen Algebra

B Die ( fast ) einfachste Möglichkeit , die Xj zu kombinieren

? Verwendung beispielsweise in ‚ Regressionen ‘

? Gesucht : Linearkombination der Schulnoten , die Studienerfolg‚ optimal ‘ ‚ vorhersagt ‘

1.3 QM1_18 183

→ Mittelwert von Linearkombinationen

• M

(m∑j=1

ajXj + b

)=

m∑j=1

ajM(Xj) + b

? M(X − Y ) = MX −MY

− X − Y ist Linearkombination von X , Y

− Koeffizienten : 1 , −1 ; additive Konstante : 0

4 ‚ Mittelwert der Differenz ist Differenz der Mittelwerte ‘

? Behandlung wirkungsvoll ?

Untersuchung der Änderung bei mehreren Vpn

→ Durchschnittliche Änderung ist Änderung der Durchschnitte

→ Allgemein aber :

− Vorsicht bei der Bildung solcher ‚ Verdrehsätze ‘

→ „ You might just as well say “ added the Dormouse , . . . „ that ‚ Ibreathe when I sleep “ ist the same thing as ‚ I sleep when Ibreathe ‘ ! “

− Lewis Carroll : Alice’s Adventures in Wonderland :A Mad Tea-Party

1.3 QM1_18 184

→ Binäre Variable

♦ Eine Variable , die nur die Werte 0 und 1 annimmt , heißtauch binär

• Ist X binär , so gilt

MX = h(X = 1)

on MX = 0 · h(X = 0) + 1 · h(X = 1) = h(X = 1)

→ Mittelwerte von Funktionen von Variablen

4 Ist f lineare Transformation , so gilt

Mf(X) = f(MX)

? Gilt das auch für beliebige Funktionen ?

? f(x) = x2

? Daten :X −1 0 1

X2 1 0 1

MX = 0 MX2 = 2/3

→ Hier also : MX2 6= (MX)2

→ Mf(X) = f(MX) gilt also nicht allgemein

1.3 QM1_18 185

4 Der Mittelwert einer Summe ist die Summe der Mittelwerte

? Gilt Analoges auch für das Produkt ?

? Miniaturbeispiel :

Vp X Y XY

1 2 0 2 · 0 = 0

2 0 2 0 · 2 = 0

MX = 1 , MY = 1 , MXY = 0

→ MXY = MX MY gilt also nicht allgemein

X ≥ 0 bedeutet : xi ≥ 0 für alle i

X ≤ Y bedeutet : xi ≤ yi für alle i

• Ist X ≥ 0 so gilt MX ≥ 0 und

MX = 0 ⇔ xi = 0 für alle i

• Ist X ≤ Y , so auch MX ≤MY

on (Y −X) ≥ 0 ⇒ MY −MX = MY−X ≥ 0

⇒ MX ≤MY

1.3 QM1_18 186

→ Mittelwert bei Ordinalskalen

♦ Ordinalskalen sind Skalen , bei denen die zulässigenSkalentransformationen die streng monotonen Funktionen sind

B Bei solchen Transformationen bleibt Ordnung erhalten

− Ordnung ist hier das einzige Interpretierbare

? Was macht der Mittelwert bei monotonen Transformationen ?

? Gegeben : Variable X , die nur nichtnegative Werte annimmt

f(x) = x2 ist dann streng monoton

→ Y = X2 ist also eine gleichberechtigte Skala

? 2 Gruppen ; Werte in X und Y :

Gruppe 1 Gruppe 2X 2 3 2 1 1 4

Y 4 9 4 1 1 16

? Welche Gruppe ist besser ? → Vergleich über Mittelwert

Gruppe 1 : MX = 2 1/3 MY = 5 2/3

Gruppe 2 : MX = 2 MY = 6

→ Für X ist Gruppe 1 besser , für Y Gruppe 2

→ Mittelwert scheint hier nicht besonders sinnvoll

→ Mittelwert bei Ordinaldaten verbieten ?

1.3 QM1_18 187

→ Median : Ein weiteres Maß der zentralen Tendenz

♦ Definition über Verfahren zur Bestimmung :

Ordne Daten aufsteigend nach Größe

→ Der Median ist dann

− der mittlere Wert ( ungerade Anzahl von Daten )

− der Mittelwert der beiden mittleren Werte ( gerade Anzahl )

Symbol : MdX

B Es gibt auch andere Definitionen

? Daten : 3, 1, 2, 5, 0, 1, 5

Ordnen : 0, 1, 1, 2 , 3, 5, 5

→ Median ist 2

? Daten : 1, 3, 2, 1, 4, 1

Ordnen : 1, 1, 1 , 2 , 3, 4

→ Median ist (1 + 2)/2 = 1.5

1.3 QM1_18 188

→ Eigenschaften des Medians

• Mindestens 50% der Daten sind ≤Md und mindestens 50%

sind ≥Md

→ Median bei monotonen Transformationen

• Ist f monoton auf dem Wertebereich von X , so gilt

Mdf(X) ≈ f(MdX)

B Bei ungerader Zahl von Daten gilt ‚ = ‘

on Begründung wird durch Beispiele klar

? X ≥ 0 und f(x) = x2 , Y = X2

Ungerade Anzahl von Daten :

? Daten : 3, 1, 2, 5, 0, 1, 5 Y : 9, 1, 4, 25, 0, 1, 25

geordnet : 0, 1, 1, 2 , 3, 5, 5 Y : 0, 1, 1, 4 , 9, 25, 25

Gerade Anzahl von Daten :

? Daten : X : 1, 3, 2, 1, 4, 1 Y : 1, 9, 4, 1, 16, 1

geordnet : X : 1, 1, 1 , 2 , 3, 4 Y : 1, 1, 1 , 4 , 9, 16

MdX = 1.5 (MdX)2 = 2.25 MdY = 2.5

→ Immerhin : (MdX)2 und MdY beide zwischen den beidentransformierten mittleren X-Werten , in diesem Sinn ‚ ≈ ‘

1.3 QM1_18 189

→ Median und Mittelwert

4 Median verhält sich ‚ einigermaßen berechenbar ‘ bei monotonenTransformationen

− Im Gegensatz zum Mittelwert

→ Median ist für Ordinaldaten (womöglich ) besseres Maß derzentralen Tendenz als Mittelwert

→ Daten in Extrembereichen

? Daten : 1, 7, 500, 4, 3 M = 103 Md = 4

Änderung des ‚ Extremdatums ‘

? Daten : 1, 7, 200, 4, 3 M = 43 Md = 4

B Median ist weniger anfällig für Schwankungen inExtrembereichen als Mittelwert

→ Vorteil oder Nachteil : je nach Untersuchungsabsichten

? Reaktionszeiten

? Einkommen

1.3 QM1_18 190

→ Median , Mittelwert und Verteilungsform

B Relative Lage von Median und Mittelwert kann Hinweis aufVerteilungsform geben

− Bei ‚ einigermaßen symmetrischen ‘ Verteilungen solltenMittelwert und Median etwa übereinstimmen

− Diskrepanzen geben Hinweise auf Asymmetrie

? Beispiel einer asymmetrischen Verteilung mit M und Md :

0

.5

......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ..............................................................................................................................................................................................................................................

...................

x

h

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...............................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

.......

.......................................................................................................................................................................................................

.......

.......

.......

.......................................................................................................................................................................................................................................................................................................

.......

........................................................................................

.......

.......

.......

.......

.......

.......

.......

.......

....................

...................

.......

.......

.......

.......

.......

.......

.......

.......

....................

...................

Md M

♦ Eine Verteilung mit M > Md heißt rechtsschief oder linkssteil

♦ Eine Verteilung mit M < Md heißt linksschief oder rechtssteil

4 Terminologie uneinheitlich

1.3 QM1_18 191

→ Modus : noch ein Maß der zentralen Tendenz

♦ Der häufigste Wert einer Verteilung heißt auch Modus

B Unter Umständen gibt es mehrere Modi

? Daten : 2, 4, 3, 2, 3, 6, 4, 5, 3

→ Modus ist 3

? Daten : 2, 4, 3, 2, 3, 6, 2, 5, 3

→ Modi sind 2 und 3

4 Den Modus kann man auch für qualitative Variablen bilden

→ Perzentile , Quartile

Der Wert mit Prozentrang 75 heißt auch 75. Perzentil etc.

4 Geeignete Konventionen für ‚ Prozentrang ‘ sind nötig

25. Perzentil : 1. Quartil , 75. Perzentil : 3. Quartil

4 Median wird manchmal auch als 2. Quartil = 50. Perzentildefiniert

B Andere Definition als die hier verwendete

1.3 QM1_18 192

→ Boxplot

Überblick über die Lage der Daten

Vorbereitung : Eine Alternativdefinition der Quartile

− Nicht ganz äquivalent zu der Definition oben

Defintion über Herstellungsverfahren :

Daten ordnen , in zwei ‚ Hälften ‘ teilen

− Ungerade Datenzahl : Mittleren Wert verdoppeln

→ 1. und 3. Quartil : Mediane der beiden ‚ Hälften ‘

? Beispiel : gerade Anzahl von Daten :

Daten 1 , 7 , 3 , 2 , 5 , 8 , 2 , 6

geordnet 1 , 2 , 2 , 3 , 5 , 6 , 7 , 8

‚ Hälften ‘ 1 , 2 , 2 , 3 5 , 6 , 7 , 8

Quartile (mit Median) 2 4 6.5

? Beispiel : ungerade Anzahl von Daten :

Daten 1 , 7 , 3 , 2 , 5 , 8 , 2 , 6 , 9

geordnet 1 , 2 , 2 , 3 , 5 , 6 , 7 , 8 , 9

‚ Hälften ‘ 1 , 2 , 2 , 3 , 5 5 , 6 , 7 , 8 , 9

Quartile (mit Median) 2 5 7

1.3 QM1_18 193

→ Boxplot , schrittweise

? Daten : 2 , 14 , 5 , 4 , 6 , 4 , 5 , 6 , 9 , 11 , 3

1. : Daten mit Box aus Quartilen mit Median

0 1......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ...................

x

r r rr rr rr r r r.............................

.......

.......

.......

.......

.

.......

.......

.......

.......

.

........................................................................................................................................................................................................

........................................................................................................................................................................................................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......................

...................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......................

...................

.......

.......

.......

.......

..........................

...................

Median1. Quartil 3. Quartil

2. : Normalbereich :

− Box um Faktor 1.5 in beide Richtungen vergrößern

3. : Extreme Punkte im Normalbereich markieren ( ‚ Antennen ‘ )

0 1......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ...................

x

r r rr rr rr r r r.............................

.......

.......

.......

.......

.

.......

.......

.......

.......

.

.......

.......

................

........................................................................................................................................................................................................

.......................................................................................................................................................................................................................................................................................................................... ........................................................................................................................................................................................................

.........................................................

.........................................................

...............................................................................................................................................................................................................................................................................................................................

4. : ‚ Ausreißer ‘ als Punkte eintragen

0 1......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ...................

x

r r rr rr rr r r r.............................

.......

.......

.......

.......

.

.......

.......

.......

.......

.

.......

.......

................

........................................................................................................................................................................................................

.......................................................................................................................................................................................................................................................................................................................... ........................................................................................................................................................................................................ r

4 Unterschiedliche Konventionen für ‚ Normalbereich ‘

4 Gelegentlich weitere Unterteilung der ‚ Ausreißer ‘

1.3 QM1_18 194

→ Boxplots zum Gruppenvergleich

? Daten aus drei Gruppen (A , B , C )

A 2, 3, 5, 4, 6, 4, 5, 6, 6, 9, 8, 14

B 1, 7, 9, 6, 8, 12, 9, 9, 16, 7, 8, 16

C 4, 5, 3, 9, 6, 5, 8, 3, 4, 2, 6

→ Zum Vergleich :

− Originaldaten

− Boxplots ( jetzt senkrecht )

− Mittelwert ± Standardabweichung

A B C

1

10

....................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.....................

...................

rrr rr rr r rrr

r

r

rr rr rr r rrr r

rr rr rr rr rrr

A B C

1

10

....................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.....................

...................

........................................

........................................

........................................

....................

....................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

.......

.......

.

r

........................................

........................................

........................................

....................

....................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

.

r

r r

........................................

........................................

........................................

....................

....................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

.......

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..

A B C

1

10

....................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.....................

...................

r..............................................................................................................................................................................

.............................

............................. r...................................................................................................................................................................................................................................

.............................

.............................

r.....................................................................................................................

.............................

.............................

1.3 QM1_18 195

→ Kenngrößen für quantitative Variablen

→ Maße der Datenvariabilität

? Wie stark ‚ streuen ‘ die Daten ?

→ Varianz , Streuung

♦ Liefern n Vpn in Variable X die Werte x1, . . . , xn mitMittelwert MX , so heißt

S2X :=

1

n

n∑i=1

(xi − MX )2

die Varianz von X , und

SX :=√S2X

die Streuung oder Standardabweichung von X

Statt S2X gelegentlich auch : V (X)

→ Die Varianz ist ein Mittelwert :

S2X = M((X −MX)2)

→ Die Eigenschaften des Mittelwerts können verwendet werden

B Varianz ist mittlere quadrierte Abweichung vom Mittelwert

1.3 QM1_18 196

4 Begriff ist zunächst nicht besonders intuitiv

? Warum nicht einfach mittlere Abweichung vom Mittelwert ?

− Die mittlere Abweichung vom Mittelwert ist immer 0

? Warum nicht mittlere absolute Abweichung vom Mittelwert :

1

n

n∑i=1

|xi −MX |

‚ m.a.A.‘ ( vom Mittelwert )

− Damit kann man nicht so leicht rechnen

− Angemessener hierbei übrigens : Median statt Mittelwert

4 Vorteil der Varianz : Enger Zusammenhang mit Kovarianz

→ Alternative Berechnung :

• S2X = MX2 − (MX)2

on S2X = M( (X −MX)2 )

= M(X2 − 2MX X + M 2X )

= M(X2 ) − M(2MX X ) + (MX)2

= M(X2 ) − 2MX M(X ) + (MX)2

= M(X2 ) − 2 (MX)2 + (MX)2

= M(X2 ) − (MX)2

1.3 QM1_18 197

→ Eigenschaften der Varianz

• S2X ≥ 0

→ Folgerung :M(X2) ≥ (MX)2

• S2X = 0 ⇔ Alle Daten sind gleich ( nämlich MX )

on Alle Daten gleich ⇔ Alle Daten gleich MX

Die Summanden (xi −MX)2 sind alle ≥ 0

• S2aX+b = a2 S2

X , SaX+b = |a|SX

on S2aX+b = M(((aX + b)−M(aX + b))2)

= M((aX + b− (aMX + b))2)

= M((aX + b− aMX − b)2)

= M((a(X −MX))2) = M(a2(X −MX)2)

= a2 M((X −MX)2) = a2 S2X

SaX+b =√S2aX+b =

√a2 S2

X = |a|SX

4√a2 ist |a| , nicht unbedingt a ( Beispiel : a = (−5) ! )

? Varianz von 1001, 1002, 1003 ist Varianz von 1, 2, 3

1.3 QM1_18 198

• Die Varianz einer binären Variable X mit h := h(X = 1) ist

S2X = h (1− h)

on Hier ist X2 = X , daher

S2X = M(X2)− (MX)2 = h − h2 = h (1− h)

? Gilt vielleicht S2X+Y = S2

X + S2Y ?

? Miniatur-Gegenbeispiel :

Vp X Y X + Y

1 0 2 2

2 2 0 2

→ S2X = S2

Y = 1 , aber S2X+Y = 0

→ Streuung und m.a.A. vom Mittelwert ( ‚ A ‘ ) :

4 Es gilt immer : A ≤ SX

4 Eine Umkehrung der Form SX ≤ K · A gilt für kein K

→ Mittelwert ± Streuung :

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................tMS S

4 Entweder : Alle Daten liegen ‚ auf dem Rand ‘

− Oder : Es gibt Daten sowohl ‚ außerhalb ‘ als auch ‚ innerhalb ‘

1.3 QM1_18 199

→ Markoffsche Ungleichung

? 5 Bekannte verdienen durchschnittlich 3 000

− Einer davon verdient 20 000

! Geht nicht !

• Ist X ≥ 0 und K > 0 , so gilt

h(X ≥ K) ≤ MX

K

Markoffsche Ungleichung

4 Eigentlich eine ganze ‚ Familie ‘ von Ungleichungen

− Für jedes K eine

? Verdienstbeispiel (X : Verdienst ) : Setze K = 20 000

h(X ≥ 20 000) ≤ 3 000

20 000= .15

→ Das entspricht höchstens .15 · 5 = .75 Personen !

1.3 QM1_18 200

• Ist X ≥ 0 und K > 0 , so gilt

h(X ≥ K) ≤ MX

K

on Definiere neue Variable Y durch

Y :=

K falls X ≥ K

0 falls X < K

? Ein Beispiel mit K = 5 :

X 1 4 7 11 3 9 2

Y 0 0 5 5 0 5 0

Y ≤ X

MY ≤ MX

MY = 0 · h(Y = 0) + K · h(Y = K) = K · h(X ≥ K)

K · h(X ≥ K) = MY ≤ MX

→ h(X ≥ K) ≤ MX

K

1.3 QM1_18 201

→ Eine Umformulierung ( ‚ komplementäre Aussage ‘ )

• Ist X ≥ 0 und K > 0 , so gilt

h(X < K) ≥ 1 − MX

K

on h(X < K) + h(X ≥ K) = 1

h(X < K) = 1− h(X ≥ K)

→ h(X < K) = 1− h(X ≥ K) ≥ 1 − MX

K

? Verdienstbeispiel (X : Verdienst ) :

− 5 Personen verdienen im Durchschnitt 3 000

? Setze K = 8 000

h(X < 8 000) ≥ 1 − 3 000

8 000=

5

8

Das entspricht mindestens5

8· 5 =

25

8= 3.125 Personen

→ Mindestens 4 verdienen weniger als 8 000

1.3 QM1_18 202

→ Tschebyscheffsche Ungleichung

• Ist X Variable mit Mittelwert MX und Streuung SX > 0 , sogilt für jedes k > 0 die Beziehung

h( |X −MX | ≥ k SX) ≤ 1

k2

Tschebyscheffsche Ungleichung

4 Wieder eine ganze Familie von Ungleichungen

− für jedes k eine

B Abschätzung der Häufigkeit von Werten ‚ weit weg ‘ von MX

− ‚ Weit weg ‘ : in Streuungseinheiten

? k = 2 :

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.

..................................................................................................................tMS S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..................................... .......................................................................................................................................................................................................................................................... ......................................................................................................................................................................................................................

→ Höchstens 25% der Daten im schwarzen Bereich (mit Rand )

? k = 10 :

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.

.............................t. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..................................... ................................................................................................................................................................. .............................................................................................................................

→ Höchstens 1% der Daten im schwarzen Bereich (mit Rand )

1.3 QM1_18 203

• Ist X Variable mit Mittelwert MX und Streuung SX > 0 , sogilt für jedes k > 0 die Beziehung

h( |X −MX | ≥ k SX) ≤ 1

k2

on Setze Y := (X −MX)2

Dann : MY = S2X

Ferner : Y ≥ 0

Markoffsche Ungleichung mit Y

− und k2MY an Stelle des dortigen K

h(Y ≥ k2MY ) ≤ MY

k2MY=

1

k2

Y ≥ k2MY ⇔ (X −MX)2 ≥ k2S2X

⇔ |X −MX | ≥ k SX

→ h(|X −MX | ≥ k SX) ≤ 1

k2

1.3 QM1_18 204

→ Eine Umformulierung ( ‚ komplementäre Aussage ‘ )

• Ist X Variable mit Mittelwert MX und Streuung SX > 0 , sogilt für jedes k > 0 die Beziehung

h( |X −MX | < k SX) ≥ 1 − 1

k2

on h( |X −MX | < k SX) + h( |X −MX | ≥ k SX) = 1

h( |X −MX | < k SX) = 1− h( |X −MX | ≥ k SX)

1− h( |X −MX | ≥ k SX) ≥ 1 − 1

k2

→ h( |X −MX | < k SX) ≥ 1 − 1

k2

B Abschätzung der Häufigkeit von Werten ‚ nahe bei ‘ MX

− ‚ Nahe bei ‘ : in Streuungseinheiten

? k = 2 :

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.

..................................................................................................................tMS S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

→ Mindestens 75% der Daten im schwarzen Bereich ( ohne Rand )

? k = 10 :

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.

.............................t. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.

............................................................................................................................. .....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

→ Mindestens 99% der Daten im schwarzen Bereich ( ohne Rand )

1.3 QM1_18 205

B Tschebyscheffsche Ungleichung stiftet Beziehung zwischen

− Streuung einerseits

− relativen Häufigkeiten von Daten andererseits

→ Eine Klärung des ‚ unintuitiven ‘ Streuungsbegriffs

→ Tschebyscheffsche Ungleichung ‚ absolut ‘ :

• Ist X Variable mit Mittelwert MX und Streuung SX > 0 , sogilt für jedes K > 0 die Beziehung

h( |X −MX | ≥ K) ≤ S2X

K2

on Setze in der Original-Ungleichung K/SX für k ein

→ ‚ Komplementär ‘ dazu :

• Ist X Variable mit Mittelwert MX und Streuung SX > 0 , sogilt für jedes K > 0 die Beziehung

h( |X −MX | < K) ≥ 1 − S2X

K2

1.3 QM1_18 206

→ Z-Transformation

♦ Ist X Variable mit Mittelwert MX und Streuung SX > 0 , soheißt die Variable

ZX :=X −MX

SX

auch z-Transformierte von X . Für einen möglichen Wert x

heißt

zx :=x−MX

SX

auch der zu x gehörende z-Wert.

B Der z-Wert zx von x gibt an ,

− wie weit x von MX entfernt ist

− gemessen in Standardabweichungen

− Richtung entspricht Vorzeichen

? Mit MX = 5 und SX = 2 gilt für x = 8

z8 =8− 5

2=

3

2= 1.5

−1 0 1 2 3 4 5 6 7 8 9 x

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.

...............................................................................................................................................................................................................................................................................................................................................................................................................t tMS S

1.3 QM1_18 207

→ Umgekehrt :

? Mit MX = 5 und SX = 2 gilt für ein x : zx = −2

? x = ?

−1 0 1 2 3 4 5 6 7 8 9 x

.......

.......

.......

.......

.......

.

.......

.......

.......

.......

.......

.

..............................................................................................................................................................................................................................................................................................................................................................................................................................tt MS S

→ Lösung gleich allgemein :

zx =x−MX

SX⇒ x = SX zx + MX

? Im Beispiel :

x = 2 · (−2) + 5 = 1

→ z-Transformation : Verwenden einer neuen Skala :

−1 0 1 2 3 4 5 6 7 8 9 x

...........................

.......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................t ......

......

......

......

......

......

......

......

......0 1 2−1−2−3 z

Noch enger :

−1 0 1 2 3 4 5 6 7 8 9 x

.................................................................................................................................................................................................................................................................................................................................t ..................

......

......

......

......

......

......

......

......

......0 1 2−1−2−3 z

1.3 QM1_18 208

→ Eigenschaften von ZX

B ZX entsteht aus X durch eine lineare Transformation :

ZX =X −MX

SX=

1

SXX − MX

SX

→ ZX hat die Form aX + b

− a = 1/SX , b = −MX/SX

→ Kennwerte von ZX

• MZX= 0 , S2

ZX= 1

on MZX=

1

SXMX −

MX

SX= 0

S2ZX

=1

S2X

S2X = 1

4 Mittelwert und Varianz von ZX sind ‚ einfachstmöglich ‘

− ‚ Standardisierung ‘

1.3 QM1_18 209

→ Vergleiche mit Hilfe von z-Werten

? A erreicht in Klausur 1 18 Punkte

− B erreicht in Klausur 2 15 Punkte

? Wer ist besser ? ????

Zusatzinformation : Kennwerte der Klausuren

− Klausur 1 : Mittelwert : 16 , Streuung : 4

− Klausur 2 : Mittelwert : 14 , Streuung : 1

z-Werte : A : .5 , B : 1

→ (Mit aller Vorsicht ) B ist besser

B Voraussetzung für derartige Vergleiche :

− Die Klausurgruppen sind leistungsmäßig etwa gleich

4 Vgl. : Vergleiche über Prozentränge

1.3 QM1_18 210

→ Weitere Maße der Datenvariabilität

Mittlere absolute Abweichung :

1

n

n∑i=1

|xi −MX |

− Passender vielleicht : Md statt M

Interquartilabstand

− 3. Quartil − 1. Quartil

Range

− Größter Wert − kleinster Wert

B Boxplot veranschaulicht Interquartilabstand und Range

4 Manchmal verwendet man statt S2X als ‚ Varianz ‘ auch

s2X :=

1

n− 1

n∑i=1

(xi −MX)2

4 Rechtfertigung : Inferenzstatistik

! Aufpassen bei Taschenrechner oder Statistikprogrammen !

1.3 QM1_18 211

→ Kovarianz , Korrelation

♣ Zwei Variablen X und Y in derselben Stichprobe erhoben

− Anzahl der Vpn : n

− Jede Vp i liefert zwei Werte : xi für X und yi für Y

− Mittelwerte : MX und MY

− Varianzen : S2X und S2

Y

♦ In dieser Situation heißt die Zahl

KovX,Y :=1

n

n∑i=1

(xi −MX)(yi −MY )

auch Kovarianz von X und Y

♦ Sind SX und SY beide 6= 0 , so heißt die Zahl

rX,Y :=KovX,Y

SX SY

auch Korrelation von X und Y

4 Ist SX oder SY gleich 0 , so ist rX,Y nicht definiert

♣ Generelle Voraussetzung , wenn von Korrelation die Rede ist :

− SX und SY sind 6= 0

Manchmal KovXY und rXY statt KovX,Y und rX,Y

1.3 QM1_18 212

→ Datendarstellung

Datendarstellung als Punktwolke

− Zusätzlich : Zentroid : (MX , MY )

0 1 2 3 4 5 6 7 8 90123456789

....................................................................................................................................................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

X

Y

r r

rr

rr

rr

r rda...........................................................................................(MX ,MY )

4 Das Zentroid kann als ‚ Schwerpunkt ‘ betrachtet werden

Dem Verständnis förderlich :

− Einteilung der Ebene in 4 Quadranten I–IV

0 1 2 3 4 5 6 7 8 90123456789

....................................................................................................................................................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

X

Y

r r

rr

rr

rr

r rda...........................................................................................................................................................................

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

.

III

III IV

1.3 QM1_18 213

→ Beiträge zur Kovarianz

KovX,Y :=1

n

n∑i=1

(xi −MX)(yi −MY )

....................................................................................................................................................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

X

Y

q q

qq

qq

qq

q qda...........................................................................................................................................................................

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

.

III

III IV

Beiträge ≥ 0 in I und III

− Beiträge ≤ 0 in II und IV

Betragsmäßig große Beiträge durch Punkte ‚ weit im Innern ‘

Viele Punkte ‚ weit ‘ in I und III , wenige in II und IV

→ große positive Kovarianz

Viele Punkte ‚ weit ‘ in II und IV , wenige in I und III

→ große negative Kovarianz

→ Kovarianz gibt Hinweis auf Form der Punktwolke

− wenigstens in ‚ gutartigen ‘ Fällen

1.3 QM1_18 214

→ Kovarianz als Mittelwert :

→ KovX,Y =1

n

n∑i=1

(xi −MX)(yi −MY )

= M((X −MX)(Y −MY ))

→ Alternative Rechnung :

• KovX,Y = MXY − MX MY

on KovX,Y = M((X −MX)(Y −MY ))

= M(XY −MX Y −MY X +MXMY )

= M(XY )−M(MX Y )−M(MY X) +MXMY

= MXY −MXMY −MYMX +MXMY

= MXY −MXMY

1.3 QM1_18 215

→ Berechnung von MXY auf Grund einer Kontingenztafel

Mögliche Werte von X und Y : x1 . . . xI , y1 . . . yJ

! Achtung : hier : geänderte Bedeutung von ‚ xi ‘ , ‚ yj ‘

Häufigkeiten der Kombination xi, yj :

− nij ( absolut ) hij ( relativ )

→ MXY =1

n

I∑i=1

J∑j=1

nij xi yj =I∑

i=1

J∑j=1

nijnxi yj

=I∑

i=1

J∑j=1

hij xi yj

→ Spezialfall :

− X und Y sind ( in der Stichprobe ) unabhängig

Dann : hij = hi. h.j

MXY =I∑

i=1

J∑j=1

hij xi yj =I∑

i=1

J∑j=1

hi. h.jxi yj

=

(I∑

i=1

hi.xi

)(J∑

j=1

h.j yj

)= MX MY

• Sind X und Y ( in der Stichprobe ) unabhängig , so gilt

MXY = MX MY

1.3 QM1_18 216

→ Eigenschaften

− in vielen kleinen Schritten

− Z etc. : Weitere in der Stichprobe erhobene Variable

(a) KovX,Y = 0 , falls X und Y unabhängig sind

on Dann : MXY = MXMY

→ KovX,Y = MXY −MXMY = MXMY −MXMY = 0

! Umkehrung gilt nicht :

− Aus KovX,Y = 0 folgt nicht die Unabhängigkeit

4 Aussagen passen eher auf die theoretische Ebene

(b) KovX,Y = KovY,X

(c) KovX+Z, Y = KovX,Y + KovZ,Y

on M(X+Z)Y = MXY +ZY = MXY +MZY

M(X+Z)MY = (MX +MZ)MY = MXMY +MZMY

KovX+Z, Y = M(X+Z)Y −M(X+Z)MY

= MXY +MZY − (MXMY +MZMY )

= MXY −MXMY +MZY −MZMY

= KovX,Y + KovZ,Y

4 KovX+Z, Y = KovX,Y + KovZ,Y : Wie ‚ Ausmultiplizieren ‘

1.3 QM1_18 217

(d) KovX,Y +Z = KovX,Y + KovX,Z

on Begründung : entweder analog zu (c) oder

KovX,Y +Z(b)= KovY +Z,X

(c)= KovY,X + KovZ,X

(b)= KovX,Y + KovX,Z

4 Beweistechnik : ‚ Transport ‘ einer für das erste Argument vonKov bewiesenen Tatsache auf das zweite Argument

Dabei : Argumente von KovX,Y : X und Y

4 Auch hier : Analogie zum ‚ Ausmultiplizieren ‘

(e) KovaX+b, Y = aKovX,Y

on M(aX+b)Y = MaXY +bY = aMXY + bMY

M(aX+b)MY = (aMX + b)MY = aMXMY + bMY

KovaX+b, Y = M(aX+b)Y −MaX+bMY

= aMXY + bMY − (aMXMY + bMY )

= aMXY − aMXMY

= a (MXY −MXMY ) = aKovX,Y

4 ‚ Ausklammern ‘ von a

4 Konstante b fällt weg

1.3 QM1_18 218

(f) KovX, cY +d = cKovX,Y

on Analog (e) oder mit (e) und (b) wie bei (d)

4 ‚ Ausklammern ‘ von c , Konstante d fällt weg

(g) KovaX+b, cY +d = acKovX,Y

on Nacheinander (e) und (f)

(h) S2X = KovX,X

4 Wesentlicher Vorzug der Varianz als Variabilitätsmaß :

− Zusammenhang mit der Kovarianz

− Kovarianzeigenschaften können genutzt werden

→ Vgl. die folgenden Eigenschaften

(i) S2X+Y = S2

X + S2Y + 2KovX,Y

on S2X+Y

(h)= KovX+Y,X+Y

(c)= KovX,X+Y + KovY,X+Y

(d)= KovX,X + KovX,Y + KovY,X + KovY,Y(b)= KovX,X + KovY,Y + KovX,Y + KovX,Y

(h)= S2

X + S2Y + 2KovX,Y

4 Assoziation : Binomische Formel

1.3 QM1_18 219

(j) S2aX+bY +c = a2 S2

X + b2 S2Y + 2 abKovX,Y

on S2aX+bY +c = S2

aX+bY

(i)= S2

aX + S2bY + 2KovaX, bY

(g)= a2 S2

X + b2 S2Y + 2 abKovX,Y

4 Assoziation : Binomische Formel

? Spezialfall : S2X−Y = S2

X + S2Y − 2KovX,Y

(k) KovX,Y = rX,Y SX SY

(l) rX,Y = rY,X

on (b)

(m) raX+b, cY +d =

rX,Y falls ac > 0

−rX,Y falls ac < 0

on raX+b, cY +d =KovaX+b, cY +d

SaX+b ScY +d

(g)=

acKovX,Y

|a|SX |c|SY

=ac

|a| |c|· KovX,Y

SX SY=

ac

|ac|rX,Y

B Bei linearen Transformationen von X und Y :

− höchstens Vorzeichenwechsel der Korrelation

1.3 QM1_18 220

(n) rX,Y = rZX ,ZY= KovZX ,ZY

on rZX ,ZY= rX,Y : (m) , (1/SX)(1/SY ) > 0

− rZX ,ZY= KovZX ,ZY

: SZX= SZY

= 1

(o) rX,Y ≤ 1

rX,Y = 1 ⇔ Y = aX + b für ein a > 0

on 0(∗)≤ S2

ZX−ZY

(j)= S2

ZX+ S2

ZY− 2KovZX , ZY

(n)= 1 + 1− 2 rX,Y = 2− 2 rX,Y

→ rX,Y ≤ 1

‚ = ‘ : ‚⇒ ‘ : Gelte also rX,Y = 1

Dann muss ‚ = ‘ bei (∗) gelten

ZX − ZY = c (konstant)

ZY = ZX − c

Y/SY −MY /SY = X/SX −MX/SX − c

→ Y = (SY /SX)X + . . . (additive Konstante)

‚ = ‘ : ‚⇐ ‘ : Gelte also Y = aX + b mit a > 0

→ rX,Y = rX,aX+b(m)= rX,X

=KovX,X

SX SX

(h)=

S2X

S2X

= 1

1.3 QM1_18 221

(p) rX,Y ≥ −1

rX,Y = −1 ⇔ Y = aX + b für ein a < 0

on Wie (o) mit ZX + ZY statt ZX − ZY

(q) −1 ≤ rX,Y ≤ 1

rX,Y = ±1 ⇔ Y = aX + b für ein a 6= 0

Vorzeichen von r dann gleich Vorzeichen von a

− X , Y unabhängig ⇒ rX,Y = 0

on (o) , (p) , (a)

(r) |KovX,Y | ≤ SX SY

− ‚ = ‘ genau bei ‚ perfektem linearen Zusammenhang ‘

‚ Perfekter linearer Zusammenhang ‘ :

− Y = aX + b oder X = aY + b

on |KovX,Y |SX SY

= | rX,Y |(q)

≤ 1

Behauptung dann mit (q)

Leichte Zusatzüberlegungen :

− Behauptung gilt auch für SX = 0 oder SY = 0

1.3 QM1_18 222

(s) Die Variablen X und Y seien binär mit Kontingenztafel

X\Y 0 1

0 h11 h12 h1.1 h21 h22 h2.

h.1 h.2 1

→ Dann gilt : KovX,Y = h11h22 − h12h21

on KovX,Y = MXY − MXMY = h22 − h2.h.2= h22 − (h21 + h22) (h12 + h22)

= h22 − h21h12 − h21h22 − h22h12 − h222

= h22 (1 − h21 − h12 − h22) − h21h12

= h22h11 − h21h12

(t) Sind X und Y binär , so gilt

rX,Y =h11h22 − h12h21√h1.h2.h.1h.2

, r2X,Y = ϕ2

on (s) ( ‚ r2 = ϕ2 ‘ : Übung )

1.3 QM1_18 223

(u) Ist X = a1X1 + a2X2 + b und Y = c1Y1 + c2Y2 + d , so gilt

KovXY = a1c1 KovX1Y1+ a1c2 KovX1Y2

+ a2c1 KovX2Y1+ a2c2 KovX2Y2

on (c) , (d) , (g)

4 Assoziation : ‚ Ausmultiplizieren ‘

4 Additive Konstanten fallen weg

B Rechenschema (mit kij := KovXiYj) :

c1 c2

a1 k11 k12

a2 k21 k22

Zahlen in ‚ Matrix ‘ mit Zahlen am Rand multiplizeren

→ Aufsummieren

Einführung von Abkürzungen :

K =

(k11 k12

k21 k22

), a =

(a1

a2

), c =

(c1

c2

)

4 Abkürzende Schreibweise :

KovX,Y = a′Kc

B (Matrizenrechnung )

1.3 QM1_18 224

(v) Ist X =I∑

i=1

aiXi + b und Y =J∑

j=1

cjYj + d , so gilt

KovXY =I∑

i=1

J∑j=1

aicj KovXiYj

on Verallgemeinerung von (u)

4 Kovarianz von zwei Linearkombinationen

Ausführliche Schreibweise :

Kov

(I∑

i=1

aiXi + b ,

J∑j=1

cjYj + d

)=

I∑i=1

J∑j=1

aicj KovXiYj

4 Wieder Assoziation ‚ Ausmultiplizieren ‘

4 Rechenschema , ‚ Matrizenschreibweise ‘ :

− wie im ‚ (2× 2)-Fall ‘

4 Rechenschema : Eher zur Veranschaulichung der Aufgabe

B Praktisches Rechnen : u.U. anders gruppieren , z.B. :

I∑i=1

J∑J=1

aicj KovXiYj=

I∑i=1

ai

(J∑

j=1

cj KovXiYj

)

1.3 QM1_18 225

(w) Ist U =m∑i=1

aiXi + b und V =m∑i=1

ciXi + d , so gilt

KovUV =m∑i=1

m∑j=1

aicj KovXiXj

on Spezialfall von (v)

4 Wieder : Kovarianz von zwei Linearkombinationen

− Hier speziell : Linearkombinationen derselben Xi

B Beachte : Ein Index muss umbenannt werden

4 Beachte :

− KovXiXi= S2

Xi

− KovXiXj= KovXjXi

→ Spezialfall : V = U

S2U =

m∑i=1

a2i S

2Xi

+ 2∑i<j

aiaj KovXiXj

4 Zusammenfassend zu den Eigenschaften der Kovarianz :

→ Viele Formulierungen sind nun ‚ redundant ‘

? (c) , (d) , (e) , (f) , (g) , (u) , (w) : alle in (v) enthalten

1.3 QM1_18 226

→ Kovarianzmatrizen , Korrelationsmatrizen

? In einer Miniaturstichprobe werden drei Variablen erhoben

Vp X1 X2 X3

1 8 3 2

2 7 8 0

3 8 3 2

4 10 5 0

5 −5 2 0

6 8 3 2

Berechnung von Varianzen und Kovarianzen

→ Zweckmäßigerweise übersichtliche Anordnung in einer ‚ Matrix ‘ :

25 4 2

4 4 −1

2 −1 1

In Zeile i , Spalte j : KovXiXj

→ Kovarianzmatrix

In der ‚ Diagonale ‘ : KovXiXi= S2

Xi

Es gilt : KovXiXj= KovXjXi

Die Matrix ist symmetrisch

1.3 QM1_18 227

♦ Sind m Variablen X1, . . . Xm in einer Stichprobe erhobenworden , so heißt die Matrix

KovX1X1KovX1X2

. . . KovX1Xm

KovX2X1KovX2X2

. . . KovX2Xm

... ... . . . ...KovXmX1

KovXmX2. . . KovXmXm

auch Kovarianzmatrix von X1, . . . Xm

B In der Diagonale stehen die Varianzen

Kovarianzmatrix ist daherS2X1

KovX1X2. . . KovX1Xm

KovX2X1S2X2

. . . KovX2Xm

... ... . . . ...KovXmX1

KovXmX2. . . S2

Xm

4 Wegen KovXiXj= KovXjXi

:

− Kovarianzmatrizen sind symmetrisch

4 Kovarianzmatrix spielen zentrale Rolle in der

Multivariaten Statistik

! Manchmal enthalten ‚ Kovarianzmatrizen ‘ die ‚ korrigiertenStichprobenkovarianzen ‘ statt der Kovarianzen

− Division durch (n− 1) statt durch n

1.3 QM1_18 228

♦ Sind m Variablen X1, . . . Xm in einer Stichprobe erhobenworden , so heißt die Matrix

rX1X1rX1X2

. . . rX1Xm

rX2X1rX2X2

. . . rX2Xm

... ... . . . ...rXmX1

rXmX2. . . rXmXm

auch Korrelationsmatrix von X1, . . . Xm

B In der Diagonale stehen Einsen ( rXiXiist immer 1 )

Korrelationsmatrix ist daher1 rX1X2

. . . rX1Xm

rX2X11 . . . rX2Xm

... ... . . . ...rXmX1

rXmX2. . . 1

4 Korrelationsmatrizen sind symmetrisch

4 Es gibt auch noch die ‚ SSCP-Matrizen ‘

− Vorstufe zu Kovarianzen : Keine Division durch n

‚ Sum of Squares and Cross Products ‘

? Kovarianz- , Korrelations- und SSCP-Matrix im Beispiel :25 4 2

4 4 −1

2 −1 1

1 .4 .4

.4 1 −.5

.4 −.5 1

150 24 12

24 24 −6

12 −6 6

1.3 QM1_18 229

Kennwerte von Zufallsvariablen.

4 Analoge Begriffsbildungen wie in Deskriptiver Statistik

? Theoretische Gegenstücke zu Mittelwert , Varianz , . . .

B Formal analoge Eigenschaften

→ Erwartungswert

♦ Ist X : Ω → R eine reelle Zva auf einem endlichen W-Raum< Ω, P > mit W-Funktion f , so heißt die Zahl

E(X) :=∑ω∈Ω

X(ω) f(ω)

auch Erwartungswert von X

Symbol für Erwartungswerte : Oft µ

? Gewinnspiel mit fairem Würfel , X ; ‚ Nettogewinn ‘

− X : 1 7→ 0 , 2, 3, 5 7→ 2 , 4, 6 7→ −3

→ E(X) = 0 · 16

+ 2 · 16

+ 2 · 16

+ (−3) · 16

+ 2 · 16

+ (−3) · 16

= 0

4 Rechnung womöglich etwas umständlich (?)

1.4 QM1_18 230

? Dasselbe Gewinnspiel :

− X : 1 7→ 0 , 2, 3, 5 7→ 2 , 4, 6 7→ −3

Jetzt aber mit gezinktem Würfel : W-Funktion :

− f : 1, 2, 3, 4, 5 7→ .1 , 6 7→ .5

→ E(X) = 0 · (.1) + 2 · (.1) + 2 · (.1) + (−3) · (.1) + 2 · (.1) + (−3) · (.5)

= −1.2

B Hier ist E(X) kein möglicher Wert

− Also auch keiner , den man erwarten kann

4 Erwartungswert ist so etwas wie Durchschnitt auf lange Sicht

Führe Experiment sehr oft durch (N Mal )

Häufigkeit des Ergebnisses ω : etwa N f(ω)

→ Mittelwert der Werte von X dann

MX ≈1

N

∑ω∈Ω

X(ω)N f(ω) =∑ω∈Ω

X(ω) f(ω) = E(X)

→ Das erste Gewinnspiel ist ‚ fair ‘ , das zweite nicht

‚ Fair ‘ : Erwartungswert des Nettogewinns ist 0

1.4 QM1_18 231

→ Alternative Berechnung

• E(X) =∑x

xP(X = x) =∑x

xfX(x)

on E(X) =∑ω∈Ω

X(ω)f(ω) =∑x

∑ω∈Ω

X(ω)=x

X(ω)f(ω)

=∑x

(x∑ω∈Ω

X(ω)=x

f(ω))

=∑x

x P(X = x)

=∑x

x fX(x)

? Gewinnspiel mit unfairem Würfel :

x −3 0 2

fX(x) .6 .1 .3

→ E(X) =∑x

x fX(x)

= (−3) · (.6) + 0 · (.1) + 2 · (.3) = −1.2

4 E(X) ist gewichtetes Mittel der Werte von X

− Gewichte : Werte der W-Funktion fX

4 Vgl. Formel für Mittelwert mit relativen Häufigkeiten

− M =∑wj hj

− Relative Häufigkeiten ↔ Wahrscheinlichkeiten

1.4 QM1_18 232

→ Erwartungswert von Funktionen von X

? E(X2) =∑ω∈Ω

X2(ω) f(ω)

? Gewinnspiel mit gezinktem Würfel , Gewinn X :

− X : 1 7→ 0 , 2, 3, 5 7→ 2 , 4, 6 7→ −3

W-Funktion :

− f : 1, 2, 3, 4, 5 7→ .1 , 6 7→ .5

→ E(X2) =

02 · (.1) + 22 · (.1) + 22 · (.1) + (−3)2 · (.1) + 22 · (.1) + (−3)2 · (.5)

= 0 + .4 + .4 + .9 + .4 + 4.5 = 6.6

→ Allgemein :

E(h(X)) =∑ω∈Ω

h(X(ω)) f(ω)

4 Hierbei braucht X nicht reellwertig zu sein

1.4 QM1_18 233

→ Alternativschreibweise mit fX

• E(h(X)) =∑x

h(x) fX(x) =∑x

h(x)P(X = x)

on E(h(X)) =∑ω∈Ω

h(X(ω))f(ω) =∑x

∑ω∈Ω

X(ω)=x

h(X(ω))f(ω)

=∑x

(h(x)

∑ω∈Ω

X(ω)=x

f(ω))

=∑x

h(x) P(X = x)

=∑x

h(x) fX(x)

? Gewinnspiel mit unfairem Würfel :

x −3 0 2

fX(x) .6 .1 .3

→ E(X2) =∑x

x2 fX(x)

= (−3)2 · (.6) + 02 · (.1) + 22 · (.3)

= 5.4 + 0 + 1.2 = 6.6

1.4 QM1_18 234

→ Regeln

4 Analog zu Regeln über den Mittelwert

• Ist X(ω) = c für alle ω ∈ Ω , so gilt E(X) = c

on E(X) =∑ω∈Ω

c f(ω) = c∑ω∈Ω

f(ω) = c · 1 = c

• E (aX + b) = aE(X) + b

on E (aX + b) =∑ω∈Ω

(aX(ω) + b) f(ω)

=∑ω∈Ω

a X(ω) f(ω) +∑ω∈Ω

b f(ω)

= a∑ω∈Ω

X(ω) f(ω) + b∑ω∈Ω

f(ω)

= aE(X) + b

• E (X ± Y ) = E(X) ± E(Y )

on E (X ± Y ) =∑ω∈Ω

(X(ω)± Y (ω)) f(ω)

=∑ω∈Ω

X(ω) f(ω) ±∑ω∈Ω

Y (ω) f(ω)

= E(X) ± E(Y )

1.4 QM1_18 235

→ Regeln

• E

(m∑j=1

ajXj + b

)=

m∑j=1

aj E(Xj) + b

on Geeignete Kombination früherer Regeln

• Ist X binär , P(X = 1) = p , so E(X) = p

on E(X) = 0 ·P(X = 0) + 1 ·P(X = 1) = P(X = 1) = p

X ≥ 0 : X(ω) ≥ 0 für alle ω ∈ Ω

X ≤ Y : X(ω) ≤ Y (ω) für alle ω ∈ Ω etc. etc.

• Ist X ≥ 0 , so E(X) ≥ 0

on E(X) =∑ω∈Ω

X(ω) f(ω)

Alle Summanden sind ≥ 0

→ Also ist auch die Summe ≥ 0

• Ist X ≤ Y , so E(X) ≤ E(Y )

on X ≤ Y ⇒ Y −X ≥ 0

E(Y )− E(X) = E(Y −X) ≥ 0

→ E(X) ≤ E(Y )

1.4 QM1_18 236

Erinnerung : Beim Mittelwert gilt

− Ist X ≥ 0 und MX = 0 , so gilt xi = 0 für alle i

? Hat der Erwartungswert die gleiche Eigenschaft ?

? Beispiel :ω a b c d

f(ω) .5 0 .5 0

X(ω) 0 7 0 13

X ≥ 0 und E(X) = 0 · (.5) + 7 · 0 + 0 · (.5) + 13 · 0 = 0

→ Also : E(X) = 0 , ohne dass X überall 0 ist

→ Das Problem liegt bei b und d

4 Immerhin : Die W. für die ‚ Ausnahmesituation ‘ b, d ist 0

− Oder anders : Die W. für den ‚ Normalfall ‘ ist 1

1.4 QM1_18 237

→ ‚ Fast sicher ‘

♦ Eine Eigenschaft liegt fast sicher ( f.s. ) vor , falls dieWahrscheinlichkeit , dass sie vorliegt , gleich 1 ist

4 Anders formuliert :

− Die Wahrscheinlichkeit von ‚ Ausnahmen ‘ ist 0

? Im Beispiel gilt X = 0 ( f.s. )

• Ist X ≥ 0 und E(X) = 0 , so gilt X = 0 ( f.s. )

on Ist E(X) = 0 , so∑ω∈Ω

X(ω) f(ω) = 0

Dann müssen alle Summanden 0 sein

Ist X(ω) 6= 0 , so muss f(ω) = 0 gelten

→ P( ω ∈ Ω |X(ω) 6= 0 ) = 0

• Ist X = c f.s. , so gilt E(X) = c

on E(X) =∑x

xP(X = x)

= c · P(X = c) + 0 + · · · + 0

= c · 1 = c

1.4 QM1_18 238

→ Markoffsche Ungleichung

• Ist X ≥ 0 und K > 0 , so gilt

P(X ≥ K) ≤ E(X)

K

on Definiere neue Variable Y durch

Y :=

K falls X ≥ K

0 falls X < K

Y ≤ X

E(Y ) ≤ E(X)

E(Y ) = 0 · P(Y = 0) + K · P(Y = K) = K · P(X ≥ K)

K · P(X ≥ K) = E(Y ) ≤ E(X)

→ P(X ≥ K) ≤ E(X)

K

4 Alles genau wie im deskriptiven Fall

− bis auf M ↔ E , h ↔ P

• Umformulierung : Ist X ≥ 0 und K > 0 , so gilt

P(X < K) ≥ 1 − E(X)

K

on Genau wie im deskriptiven Fall

1.4 QM1_18 239

→ Erwartungswert eines Produkts

• Ist f(X,Y ) die W-Funktion der gemeinsamen Verteilung von X

und Y , so gilt

E(XY ) =∑x,y

xy f(X,Y )(x, y)

on Ist h(x, y) := xy , so XY = h(X, Y )

→ Formel ist Alternativschreibweise für E(h(X, Y ))

• Sind X und Y unabhängig , so gilt

E(XY ) = E(X)E(Y )

on Hier ist f(X,Y )(x, y) = fX(x) fY (y)

→ E(XY ) =∑x,y

xy f(X,Y )(x, y)

=∑x,y

xy fX(x)fY (y)

=

(∑x

x fX(x)

)(∑y

y fY (y)

)

= E(X)E(Y )

1.4 QM1_18 240

→ ‚ Populationsmittelwert ‘

B Oft wird das Wort ‚ Populationsmittelwert ‘ verwendet

4 Bedeutung manchmal nicht ganz klar

4 Häufig wohl synonym zu ‚ Erwartungswert ‘

B Problematisch , da

− ‚ Mittelwert ‘ zunächst auf die deskriptive Ebene gehört

− entsprechende Assoziationen geweckt werden

− zum Erwartungswert ein W-Maß gehört

4 Sinnvoll vielleicht dann , wenn aus einer endlichen Populationzufällig gezogen wird ( gleiche W. für alle Mitglieder )

→ Bezeichnung ( ‚ Populationsmittelwert ‘ für / statt‚ Erwartungswert ‘ ) ist ( oberflächlich ) eingängig

→ Bei genauem Hinsehen aber oft verwirrend

? Kann man immer sinnvoll von einer Population sprechen ?

? Reaktionszeiten einer festen Vp

1.4 QM1_18 241

→ Kennwerte von Zufallsvariablen : Varianz , Streuung

♦ Ist X : Ω → R eine reelle Zva auf einem endlichen W-Raummit E(X) = µ , so heißt die Zahl

V(X) := E((X − µ)2

)auch Varianz von X . Die Wurzel

√V(X) aus der Varianz

heißt auch Streuung oder Standardabweichung

Bezeichnung der Streuung von X : Gelegentlich auch σ(X)

Symbol für Varianzen oft σ2 ( Streuung dann σ )

4 Begriffsbildung parallel zur Varianz der deskriptiven Statistik :

S2X = M(X−MX)2

Eigenschaften weitgehend ‚ übertragbar ‘

Begründungen ebenso ( bei geeigneten ‚ Übersetzungsregeln ‘ )

→ ‚ Übersetzungsregeln ‘ : M ↔ E , h ↔ P

? Beispiel : Alternativformel : V(X) = E(X2)− µ2

on V(X) = E ( (X − µ)2 ) = E (X2 − 2µX + µ2 )

= E (X2 ) − E (2µ X ) + µ2

= E (X2 ) − 2µE (X ) + µ2

= E (X2 ) − 2µ2 + µ2 = E (X2 ) − µ2

1.4 QM1_18 242

? Gewinnspiel mit gezinktem Würfel , Gewinn X :

− X : 1 7→ 0 , 2, 3, 5 7→ 2 , 4, 6 7→ −3

W-Funktion :

− f : 1, 2, 3, 4, 5 7→ .1 , 6 7→ .5

Schon berechnet : E(X) = −1.2 , E(X2) = 6.6

→ V(X) = E(X2)− (E(X))2 = 6.6 − 1.44 = 5.16

→ Eigenschaften

B Begründungen weitgehend wie bei deskriptiver Varianz

• V(X) ≥ 0

• Folgerung : E(X2) ≥ (E(X))2

• V(X) = 0 ⇔ X ist f.s. konstant (= µ )

4 Hier Abweichung vom deskriptiven Fall ( ‚ f.s. ‘ )

X ist f.s. konstant :

− Es gibt eine Konstante c mit P(X = c) = 1

4 Diese Konstante c ist dann gleich E(X) = µ

1.4 QM1_18 243

• V(X) = 0 ⇔ X ist f.s. konstant (= µ )

on ‚⇒ ‘ : Es gelte also V(X) = E((X − µ)2) = 0

(X − µ)2 ist ≥ 0

Aus E((X − µ)2) = 0 folgt daher : (X − µ)2 = 0 f.s.

→ Also X − µ = 0 f.s. , also X = µ f.s.

‚⇐ ‘ : Es gelte also X = c f.s.

E(X) = c , also c = µ

X2 = c2 f.s. , also E(X2) = c2

→ V(X) = E(X2)− (E(X))2 = c2 − c2 = 0

• V(aX + b) = a2 V(X) , σ(aX + b) = | a | σ(X)

on Wie im Deskriptiven

• Ist X binär , P(X = 1) = p , so V(X) = p (1− p)

on Wie im Deskriptiven

Oft 1− p =: q , dann : V(X) = pq

1.4 QM1_18 244

→ Tschebyscheffsche Ungleichung

• Ist X reelle Zva mit Erwartungswert µ und Streuung σ > 0 ,so gilt für jedes k > 0 die Beziehung

P( |X − µ| ≥ k σ) ≤ 1

k2

on Wie im Deskriptiven

• ‚ Komplementär ‘ :

P( |X − µ| < k σ) ≥ 1 − 1

k2

In ‚ absoluten Einheiten ‘ :

• Ist X reelle Zva mit Erwartungswert µ und Streuung σ > 0 ,so gilt für jedes K > 0 die Beziehung

P( |X − µ| ≥ K) ≤ σ2

K2

• ‚ Komplementär ‘ :

P( |X − µ| < K) ≥ 1 − σ2

K2

1.4 QM1_18 245

→ Z-Transformation

♦ Ist X reelle Zva mit Erwartungswert µ und Streuung σ > 0 ,so heißt die Zva

ZX :=X − µσ

auch z-Transformierte von X . Für einen möglichen Wert x

heißt

zx :=x− µσ

auch der zu x gehörende z-Wert.

• E(ZX) = 0 , V(ZX) = 1

on Wie im Deskriptiven

4 Bemerkungen zur Notation : Weitgehend gilt :

Griechische Buchstaben : Theoretische Größen ( ‚ Parameter ‘ )

? µ , σ

Lateinische Buchstaben : Empirische Größen

? M , S

1.4 QM1_18 246

→ Kovarianz , Korrelation

♦ Sind X und Y reelle Zvan auf demselben ( endlichen )W-Raum mit E(X) =: µX , E(Y ) =: µY , so heißt

Kov(X, Y ) := E ((X − µX)(Y − µY ))

auch Kovarianz von X und Y

♦ Sind außerdem die Streuungen σX von X und σY von Y

beide 6= 0 , so heißt die Zahl

ρ(X, Y ) :=Kov(X, Y )

σX σY

auch Korrelation von X und Y

Symbol für ( theoretische ) Korrelationen : Meist ρ

4 Begriffsbildung wie im Deskriptiven

4 Leider ähnliche Notation für empirischen und theoretischen Fall

B Auch Bezeichnungen oft gleich ( ‚ Varianz ‘ , ‚ Kovarianz ‘ , . . . )

B Bei Verwendung von Korrelationen :

− Stillschweigende Voraussetzung : σX 6= 0 , σY 6= 0

1.4 QM1_18 247

→ Eigenschaften

4 Alles ( auch Begründungen ) ganz wie im deskriptiven Fall

• Kov(X, Y ) = E(XY ) − E(X)E(Y )

• Sind X und Y unabhängig , so gilt

Kov(X, Y ) = 0

4 Aussage ‚ passt ‘ hierher ( theoretische Ebene )

− Analoge empirische Aussage ist nicht so sinnvoll

• Kov(X, Y ) = Kov(Y,X)

• Kov( aX + b , c Y + d ) = ac Kov(X, Y )

• Kov(X + Y , U + V ) =

Kov(X,U) + Kov(X, V ) + Kov(Y, U) + Kov(Y, V )

• Kov( I∑

i=1

aiXi + b ,J∑

j=1

cjYj + d)

=

I∑i=1

J∑j=1

aicj Kov(Xi, Yj)

1.4 QM1_18 248

→ Weitere Eigenschaften

• V(X) = Kov(X,X)

• V(X ± Y ) = V(X) + V(Y ) ± 2Kov(X, Y )

• V(aX + bY + c) =

a2V(X) + b2V(Y ) + 2 abKov(X, Y )

• Kov(X, Y ) = ρ(X, Y )σX σY

• ρ(aX + b, c Y + d) =

ρ(X, Y ) falls ac > 0

−ρ(X, Y ) falls ac < 0

• ρ(X, Y ) = ρ(ZX , ZY ) = Kov(ZX , ZY )

• −1 ≤ ρ(X, Y ) ≤ 1

ρ(X, Y ) = ±1 ⇔ Y = aX + b f.s. für ein a 6= 0

Vorzeichen von ρ dann gleich Vorzeichen von a

• |Kov(X, Y ) | ≤ σX σY

4 Etc. etc.

4 Kovarianzmatrizen und Korrelationsmatrizen

− ganz wie im deskriptiven Fall

1.4 QM1_18 249

Regression.

→ Vorübung

? An n Personen wurde Größe Y gemessen

− Werte : y1 , . . . , yn

− Einzeldaten sind verloren

− Kennwerte M , S2 , Median , . . . sind erhalten

? Gesucht : Größe einer der Personen

→ Genauer : ‚ Beste Vermutung ‘

Was soll hier ‚ beste ‘ heißen ?

− Zunächst : Keine klare Bedeutung

Ungefähr :

− Vermutung soll ‚ möglichst nahe ‘ am tatsächlichen Wert liegen

‚ Möglichst nahe ‘ : auch unklar

Daher : Bedeutungsverleihung durch Präzisierung

1.5 QM1_18 250

→ Beste Vermutung über verlorene Daten

→ Gesucht : ‚ Optimale ‘ Vermutung a

→ ‚ Optimalität ‘ muss präzisiert werden

Mehrere Möglichkeiten

? Naheliegend :

− Vermutung soll im Durchschnitt möglichst nahe am Ziel liegen

− Genauer dann wohl :

− Mittlere absolute Abweichung soll minimal werden

→ Forderung dann :

− 1

n

∑i

|yi − a| soll minimal werden

→ Hier ist der Median eine Lösung für a

− Unter Umständen : Eine von vielen – unschön !

? Weitere Möglichkeit der Präzisierung :

− Durchschnittliche quadrierte Abweichung soll minimal werden

Zunächst weniger einleuchtend – trotzdem . . .

1.5 QM1_18 251

→ Beste Vermutung über verlorene Daten

→ Gesucht : ‚ Optimale ‘ Vermutung a

→ ‚ Optimalität ‘ muss präzisiert werden

? Möglichkeit der Präzisierung :

− Durchschnittliche quadrierte Abweichung soll minimal werden

Formal :

− 1

n

∑i

(yi − a)2 = M((Y − a)2) soll minimal werden

Kleine Rechnung :

M((Y − a)2) = M(((Y −MY ) + (MY − a))2)

= M((Y −MY )2 + 2(Y −MY )(MY − a) + (MY − a)2)

= M((Y −MY )2) +M(2(Y −MY )(MY − a)) + (MY − a)2

= S2Y + 2(MY − a)M(Y −MY ) + (MY − a)2

= S2Y + 2(MY − a) · 0 + (MY − a)2

= S2Y + (MY − a)2 ≥ S2

Y

→ Minimum wird genau erreicht für a = MY

− Jetzt ist also der Mittelwert die ‚ beste Vermutung ‘

− Der ist auch immer eindeutig – schön !

4 Minimale durchschnittliche quadrierte Abweichung ist S2Y

B Je nach Präzisierung : Unterschiedliche ‚ beste Vermutung ‘

1.5 QM1_18 252

→ Regression

→ Ziel :

− ‚ Vorhersage ‘ einer Variable Y durch eine Variable X

→ Beispiele :

? Y : Diplomnote , X : Abiturnote

? Y : Ergebnis Klausur 2 , X : Ergebnis Klausur 1

? Y : Hilfsbereitschaft , X : Stimmung

− geeignet operationalisiert

→ Form der Vorhersagegleichung :

y = b x + a

B ( Fast ) einfachstmöglich – Geradengleichung

→ Aufgabe :

− Finde b und a so , dass Vorhersage möglichst ‚ gut ‘ wird

X : Prädiktor

Y : Kriterium

Sprechweise : Regression von Y auf X

1.5 QM1_18 253

→ Gesucht : beste Vorhersage

Wie so oft :

→ Bezeichnungen etwas irreführend

♣ Situation : Beide (!) Variablen liegen in einer Stichprobe vor

→ Daher : Eher ‚ Rekonstruktion ‘ von Y als ‚ Vorhersage ‘

? Vielleicht auch :

− Beide Variablen lagen einmal in einer Stichprobe vor

− Kennwerte wurden berechnet

− Die Daten von Y sind verloren gegangen

− Noch vorhanden sind die Daten von X und die Kennwerte

→ Gesucht dann :

− ‚ Beste Vermutung ‘ über den Y -Wert einer Person

Zur Verfügung stehen : X-Wert und Kennwerte

→ Hier ist Ausdruck ‚ Rekonstruktion ‘ passend

1.5 QM1_18 254

→ ‚ Beste Vorhersage ‘

4 Manchmal ist Ausdruck ‚ Vorhersage ‘ gerechtfertigt

Eine Voraussetzung dafür beispielsweise :

− Stichprobenverhältnisse können als ‚ repräsentativ ‘ gelten

? Beispiel : X : Abiturnote , Y : Diplomnote

Große repräsentative Stichprobe aus einem Jahrgang

Erhebung von X und Y

Ermittlung der hier optimalen ‚ Vorhersagegleichung ‘

Später ( anderer Jahrgang )

− Keine Veränderungen in relevanten Umständen wie :

? Ausbildungssystem , Verteilung von Studienplätzen . . .

→ Naheliegend :

− Gefundene Gleichung für Vorhersagen zu benutzen

− ‚ Vorhersage ‘ jetzt im üblichen Wortsinn

1.5 QM1_18 255

→ Bedeutung von ‚ Vorhersage ‘ im allgemeinen Fall

‚ Vorhersage ‘ legt Assoziationen nahe :

− Zeitliche Reihenfolge , womöglich ‚ kausale ‘ ‚ Einflüsse ‘

→ Diese Assoziationen sind ( allgemein ) unangebracht

− Jedenfalls nicht durch statistische Prozedur gerechtfertigt

4 In Einzelfällen können sie angemessen sein

B Im allgemeinen Fall aber :

− Statistik kann auch hier keine Kausalinterpretationen begründen

4 Immerhin : ‚ Stützung ‘ möglich

− Eigentliche Rechtfertigung aber außerhalb der Statistik

? Beispielsweise durch experimentelle Anordnungen

? Beispiel zu ‚ zeitliche Reihenfolge ‘

− ‚ Vorhersage ‘ der Leistung in früherer Klausur durch spätere

− Mögliche Anwendung des statistischen Verfahrens

− Kann auch sinnvoll sein ( Fehlen bei Klausur 1 )

1.5 QM1_18 256

→ Regression hier ‚ nur ‘ deskriptiv

− Nur Auffinden der ‚ optimalen ‘ Vorhersagefunktion

4 Es gibt auch eine Regression in der Inferenzstatistik

− Verfahren anfangs wie hier

→ Zusätzlich aber : Testen von theoretischen Vorstellungen mög-lich

→ Voraussetzung dafür :

− Glaube an bestimmte Modellvoraussetzungen

→ Allgemeines Lineares Modell ( ALM)

♣ Situation :

− Werte von zwei Variablen X und Y liegen vor

− ( beide ) erhoben an n Vpn

− Werte : x1 . . . xn bzw. y1 . . . yn

? Miniaturbeispiel : 3 Vpn

Vp X Y

1 2 2

2 4 4

3 3 6

1.5 QM1_18 257

Miniaturbeispiel :Vp X Y

1 2 2

2 4 4

3 3 6

Graphische Darstellung :

1

1.............................................................................................................................................................................................................................................................................................................................. ............................................................................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

r

Daten mit einer möglichen ‚ Vorhersagegerade ‘ :

1

1.............................................................................................................................................................................................................................................................................................................................. ............................................................................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r r

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

...........................

...

...

...

...

...

...

...

...

...

...

...

...

...

...

.

...

...

...

...

...

...

...

...

..

..................

Eingezeichnet sind :

− Tatsächliche Werte , vorhergesagte Werte und Abweichungen

1.5 QM1_18 258

Zum Vergleich : noch eine andere mögliche Vorhersage :

1

1.............................................................................................................................................................................................................................................................................................................................. ............................................................................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r r

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

...........................

...

...

...

...

...

...

...

...

...

...

...

...

...

...

.

...

...

...

...

...

...

...

...

..

..................

1

1.............................................................................................................................................................................................................................................................................................................................. ............................................................................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r r

.......................................................................................................................................................................................................................................................................................................................................................................................................................................

...

...

...

...

...

...

...

...

...

...

...

.. .....................................................

? Welche Vorhersage ist besser ?

Die Frage hat ( noch ) keinen Sinn

→ ‚ Besser ‘ muss präzisiert werden

→ Einführung von geeigneten Bezeichnungen

Y := bX + a : Vorhersage als Variable

yi := b xi + a : Vorhersagewert für Vp i

ei := yi − yi : ‚ Vorhersagefehler ‘ bei Vp i

E := Y − Y : Vorhersagefehler ( als Variable )

→ Y = Y + E

4 Y setzt sich ( additiv ) zusammen aus

− Vorhersage Y

− Fehler ( ‚ Residuum ‘ ) E

1.5 QM1_18 259

? Situation bei Vp 1 ( 1. mögliche Vorhersagegerade )

1

1.............................................................................................................................................................................................................................................................................................................................. ............................................................................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r r

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

...........................

...

...

...

...

...

...

...

...

...

...

...

...

...

...

.

...

...

...

...

...

...

...

...

..

..................

...

...

...

...

...

...

...

...

...

...

...

.............................................................

............................................................

x1

y1

y1

e1

y = bx+ a

B e1 ist hier negativ

→ Präzisierung des ‚ Gütekriteriums ‘

Bestimme für jede mögliche Vorhersagegeraden∑

i=1

e2i

− Summe der quadrierten Vorhersagefehler

→ Festlegung , was ‚ besser ‘ hier bedeuten soll :

Eine Vorhersage ‚ ist ‘ umso ‚ besser ‘ , je kleiner∑e2i

− Für die optimale Vorhersage muss∑e2i minimal sein

Methode der kleinsten Quadrate , least squares fit

? Kann ein Minimum erreicht werden ? Wenn ja , wie ?

4 Andere Festlegungen für ‚ Optimalität ‘ wären möglich

− So lässt sich aber besonders gut rechnen

1.5 QM1_18 260

→ Vergleich von zwei Vorhersagen im Miniaturbeispiel

Vorhersage 1 (V1) : y = .5x + 3.5

Vorhersage 2 (V2) : y = x + 2

1

1.............................................................................................................................................................................................................................................................................................................................. ............................................................................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r r

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

...........................

...

...

...

...

...

...

...

...

...

...

...

...

...

...

.

...

...

...

...

...

...

...

...

..

..................

V11

1.............................................................................................................................................................................................................................................................................................................................. ............................................................................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r r

.......................................................................................................................................................................................................................................................................................................................................................................................................................................

...

...

...

...

...

...

...

...

...

...

...

.. .....................................................

V2

Daten V1 : y = .5x+ 3.5 V2 : y = x+ 2

Vp i xi yi yi ei e2i yi ei e2

i

1 2 2 4.5 −2.5 6.25 4 −2 4

2 4 4 5.5 −1.5 2.25 6 −2 4

3 3 6 5.0 1.0 1.00 5 1 1∑9.50 9

→ V2 ist besser

? Lässt sich V2 weiter verbessern ? Wenn ja , wie ?

1.5 QM1_18 261

→ Minimierung von∑e2i

→ Genauer : Ziel :

− Finde a und b so , dass für die zugehörige Vorhersage

y = bx + a

die Summe der quadrierten Fehler minimal wird

4 Unklar : Gibt es überhaupt ein Minimum ?

(Äquivalente ) Umformulierung des Ziels :

→ Minimiere ME2 =1

n

∑e2i statt

∑e2i

ME2 = S2E + (ME)2

− Zerlegung von ME2 in zwei Summanden

Summanden getrennt untersuchen

S2E = S2

Y−Y = S2Y−(bX+a)

= S2Y + b2 S2

X − 2 bKovX,Y

ME = MY−Y = MY−(bX+a)

= MY − bMX − a

1.5 QM1_18 262

→ Ziel : Minimiere ME2

ME2 = S2E + (ME)2

S2E = S2

Y + b2 S2X − 2 bKovX,Y

(ME)2 = (MY − bMX − a )2

4 1. Summand ohne a

4 2. Summand ≥ 0

Minimum 0 wird erreicht für ME = 0

ME = 0 wird erreicht mit

→ a = MY − bMX

→ Aufgabe daher nur noch : Minimiere S2E

− Restaufgabe enthält nur noch b als ‚ Parameter ‘

B Gesamtminimum wird dann erreicht mit a = MY − bMX

♣ Voraussetzung zunächst : S2X 6= 0 , S2

Y 6= 0

1.5 QM1_18 263

→ Ziel : Minimiere S2E

Trick : Quadratische Ergänzung

S2E = S2

Y + b2 S2X − 2 bKovX,Y

= b2 S2X − 2 bKovX,Y +

(KovX,Y )2

S2X

+ S2Y −

(KovX,Y )2

S2X

=

(b SX −

KovX,Y

SX

)2

+

(S2Y −

(KovX,Y )2

S2X

)

4 2. Summand hängt nicht mehr von b ab ; Umformung :(S2Y −

(KovX,Y )2

S2X

)=

(S2Y −

S2Y (KovX,Y )2

S2Y S

2X

)= S2

Y ( 1 − r2X,Y )

4 1. Summand ist ≥ 0

− Minimum 0 erreichbar durch geeignete Wahl von b

→ b =KovX,Y

S2X

=KovX,Y

SX SY

SY

SX= rX,Y

SY

SX

• Gesamtmininierungsaufgabe wird gelöst durch

b =KovX,Y

S2X

= rX,YSY

SX, a = MY − bMX

− Das so erreichte Mininum von ME2 ist

S2E = S2

Y ( 1 − r2X,Y )

1.5 QM1_18 264

? Lösung im BeispielVp X Y

1 2 2

2 4 4

3 3 6

MX = 3 , MY = 4

S2X = 2/3 , S2

Y = 8/3 , KovX,Y = 2/3 , rX,Y = .5

b =KovX,Y

S2X

=(2/3)

(2/3)= 1

a = MY − bMX = 4 − 1 · 3 = 1

→ Vorhersagegleichung :

y = x + 1

Summe der quadrierten Abweichungen :

Daten y = x+ 1

Vp i xi yi yi ei e2i

1 2 2 3 −1 1

2 4 4 5 −1 1

3 3 6 4 2 4∑0 6

Alternativ :∑e2i = nME2 = nS2

E = nS2Y ( 1 − r2

X,Y )

= 3 · (8/3) · ( 1 − .52) = 8 · (3/4) = 6

1.5 QM1_18 265

→ Vergleich mit den früheren Versuchen

Vorhersage 1 (V1) : y = .5x + 3.5∑e2i = 9.5

Vorhersage 2 (V2) : y = x + 2∑e2i = 9

Optimale Vorhersage : y = x + 1∑e2i = 6

Vorhersagegeraden mit Zentroid ( e)

1

1............................................................................................................................................................................................................................................................................ ...................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r r

e..............

............................

............................

............................

............................

............................

............................

............................

............................

............................

.............

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

.

...............

V1 1

1............................................................................................................................................................................................................................................................................ ...................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r r

e.................................................................................................................................................................................................................................................................................................................................................................

...

...

...

...

...

...

...

...

...

.. ............................................

V2 1

1............................................................................................................................................................................................................................................................................ ...................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r re

.................................................................................................................................................................................................................................................................................................................................................................

...

...

...

...

...

...

...

...

...

...

.............................

Optimal

4 Beobachtungen im Beispiel :

−∑ei = 0 (muss so sein )

− Vorhersagegerade geht durch Zentroid

1.5 QM1_18 266

→ Nur zur Vollständigkeit : ( uninteressante ) Ausnahmefälle

S2X = 0

Dann sind die X-Werte konstant (= MX )

Es gilt dann auch : KovX,Y = 0

→ b kann beliebig gewählt werden

Viele mögliche Vorhersagen

4 Relevant ist dabei nur der einzige X-Wert MX

− Dort stimmen die möglichen Geraden überein

→ S2E = S2

Y

S2Y = 0 ( und S2

X 6= 0 )

Dann sind die Y -Werte konstant (= MY )

Es gilt dann auch : KovX,Y = 0

→ b = 0 , a = MY

→ S2E = 0

♣ Voraussetzung im Folgenden : S2X 6= 0 , S2

Y 6= 0

Vereinbarung :

− Ab jetzt bezeichnen a , b , Y , E etc. immer die zur optimalenVorhersage gehörenden Zahlen /Variablen

1.5 QM1_18 267

→ Eigenschaften der Lösung

• Vorhersagegerade geht durch Zentroid

on Vorhersage für MX ist

bMX + a = bMX + (MY − bMX ) = MY

•∑ei = 0 , ME = 0

on Gilt per Konstruktion

• KovX,E = 0

4 Naheliegend : ‚ Fehler E hat mit X nichts mehr zu tun ‘

− Sonst wäre auch Fehler noch ‚ teilweise vorhersagbar ‘

B So darf man eigentlich nicht reden !

on KovX,E = KovX,Y−(bX+a) = KovX,Y − bKovX,X

= KovX,Y −KovX,Y

S2X

S2X

= KovX,Y − KovX,Y = 0

1.5 QM1_18 268

→ Varianzzerlegung

• KovY ,E = 0

on KovY ,E = KovbX+a,E = bKovX,E = b · 0 = 0

• S2Y = S2

Y+ S2

E

on S2Y = S2

Y +E= S2

Y+ S2

E + 2KovY ,E

= S2Y

+ S2E

S2Y: ‚ Vorhersagevarianz ‘ , ‚ aufgeklärte Varianz ‘ ( absolut )

S2E : ‚ Fehlervarianz ‘ , ‚ Residualvarianz ‘ , ‚ Restvarianz ‘

4 S2Y = S2

Y+ S2

E :

→ ( additive ) ‚ Zerlegung ‘ der Varianz von Y in

− aufgeklärte Varianz S2Y

− Restvarianz S2E

4 Varianzzerlegungen sind beliebt

! Vorsicht mit Assoziationen ! ( aufgeklärt – erklärt )

1.5 QM1_18 269

→ Varianzzerlegung : S2Y = S2

Y+ S2

E

• S2E = S2

Y ( 1 − r2X,Y )

• S2Y

= r2X,Y S

2Y

on S2Y

= S2Y − S2

E = S2Y − S2

Y ( 1 − r2X,Y )

= S2Y − S2

Y + S2Y r

2X,Y = r2

X,Y S2Y

♦ Die ZahlS2Y.X := S2

E ( = S2Y ( 1 − r2

X,Y ) )

heißt auch Schätzfehlervarianz . Die Zahl

SY.X := SE ( = SY

√1 − r2

X,Y )

heißt auch Standardschätzfehler

→√

1− r2 als Funktion von r ( Pythagoras )

−1.0 −0.5 0.0 0.5 1.0

0.5

.................................................................................................................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

........................

...................

r

√1− r2

1.0

.......

.......

.......

.......

.......

.......

...................................................................................................................................

....................

.......................

...........................

......................................

......................................................................................................................................................................................................................................................................................................................................................................................................

B ‚ Klein ‘ wird die Funktion erst in der Nähe von ±1

1.5 QM1_18 270

→ Versuch einer Interpretation von SY.X

Streuung als ‚ Maß der Unsicherheit ‘ über die Lage der yi

Vgl. Tschebyscheff

B Ungleichungen à la Tschebyscheff auch für Regression

? Links : Ohne Regression , rechts : mit Regression

− Beste Vorhersage ohne Regression : MY

1

1............................................................................................................................................................................................................................................................................ ...................................................................................................................................................................................................................................................................................................................................

...................

X

Y

qq

qe.........................................................................................................................................................................................................................................................

.........................................................................................................................................................................................................................................................

.........................................................................................................................................................................................................................................................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.....

............................

............................

......................................................

............................................

.

SY

1

1............................................................................................................................................................................................................................................................................ ...................................................................................................................................................................................................................................................................................................................................

...................

X

Y

qq

qe

.................................................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................................................................................................................................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

...

....................................................................................................................................................................................................

SY.X

Halbe ‚ Streifenbreite ‘ ohne Regression : SY

Halbe ‚ Streifenbreite ‘ mit Regression : SY.X = SY

√1− r2

X,Y

− ‚ Streifenbreite ‘ immer in Richtung y-Achse

→ ‚ Verkleinerungsfaktor ‘ durch Regression :√

1− r2X,Y

? Im Beispiel :√

1− r2X,Y =

√1− .52 =

√.75 = .866

4 Verkleinerung geringer , als vielleicht erwartet

B Korrelation .5 gilt oft schon als recht erfreulich

1.5 QM1_18 271

→ Weitere Eigenschaften

• 0 ≤ S2Y.X ≤ S2

Y

S2Y.X = 0 ⇔ r2

X,Y = 1 ⇔ perfekter linearer Zusammenhang

S2Y.X = S2

Y ⇔ r2X,Y = 0 ⇔ Vorhersage konstant

on S2Y.X = S2

Y ( 1 − r2X,Y )

− b = rX,Y (SY /SX)

B Interpretation von rX,Y = 0

• MY = MY , S2Y

= r2X,Y S

2Y

on MY = MY−E = MY − ME = MY − 0 = MY

• rY ,Y = | rX,Y |

on Y = bX + a , daher rY ,Y = ± rX,Y

‚ Vorfaktor ‘ (± ) ist Vorzeichen von b = rX,Y (SY /SX)

also Vorzeichen von rX,Y

→ rY,Y = | rX,Y |

4 rX,Y = 0 ist hier vereinbarungsgemäß ausgeschlossen

− Bei rX,Y = 0 wäre b = 0 , also SY = 0

1.5 QM1_18 272

→ Varianzzerlegung ‚ relativ ‘

• 1 =S2Y

S2Y

+S2E

S2Y

,S2Y

S2Y

= r2X,Y

on Dividiere S2Y = S2

Y+ S2

E durch S2Y

− Ebenso für S2Y

= r2X,Y S

2Y

♦ Der quadrierte Korrelationskoeffizient

r2X,Y =

S2Y

S2Y

heißt auch Determinationskoeffizient

4 Anteil der aufgeklärten Varianz an der Gesamtvarianz von Y

? Determinationskoeffizient im Beispiel : .52 = .25

→ Eigenschaften des Determinationskoeffizienten

• 0 ≤ r2X,Y ≤ 1

r2X,Y = 1 ⇔ perfekter linearer Zusammenhang

r2X,Y = 0 ⇔ Vorhersage konstant

4 Statt ‚ perfekter linearer Zusammenhang ‘ suggestiver :

− Y ist durch X ‚ vollständig determiniert ‘

B Missverständnisse drängen sich hier geradezu auf !

− Es handelt sich ja nur um eine Stichprobe

1.5 QM1_18 273

→ Regression von X auf Y

→ Aufgabe : Regression von X auf Y

? Kann man vielleicht die Regression von Y auf X benutzen ?

..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

X

Y

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

.....................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

................................................................................................................................................................................................................................................................

.........................................................................................................................................................................................................................................................................

........

Regression von Y auf X

?

...........................................

→ Vorgehen zur Beantwortung der Frage

Bestimme die Regression von X auf Y

Stelle die Regressionsgerade im x-y-System dar

Vergleiche mit der Regressionsgerade ‚ Y auf X ‘

4 Es reicht , die Steigungen zu vergleichen

Steigungen : b (Y auf X ) , b′ (X auf Y , im y-x-System )

Steigung der Gerade ‚X auf Y ‘ im x-y-System : 1/b′

Zum Vergleich : Quotient der Steigungen : b/(1/b′) = bb′

1.5 QM1_18 274

→ Vergleich der Steigungen im x-y-System

Quotient der Steigungen ist bb′

b = rX,YSY

SX, b′ = rX,Y

SX

SY

bb′ = rX,YSY

SXrX,Y

SX

SY= r2

X,Y

→ Übereinstimmung der Steigungen nur für rX,Y = ± 1

Dann aber auch Übereinstimmung der Geraden

− Beide gehen ja durch das Zentroid

→ rX,Y 6= ± 1 : Geraden stimmen nicht überein

− Immerhin haben Steigungen gleiches Vorzeichen

? Die beiden Regressionsgeraden im Beispiel :

1

1............................................................................................................................................................................................................................................................................ ...................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

re

.................................................................................................................................................................................................................................................................................................................................................................

..........................................................................................................................................................................................................................................................................................................................................

Y auf X

X auf Y

1.5 QM1_18 275

? Warum stimmen die Regressionsgeraden nicht überein ?

→ Andere ( quadrierte ) ‚ Abstände ‘ sind zu minimieren

− Bei Y auf X : parallel zur y-Achse

− Bei X auf Y : parallel zur x-Achse

1

1............................................................................................................................................................................................................................................................................ ...................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

rr r re

.................................................................................................................................................................................................................................................................................................................................................................

...

...

...

...

...

...

...

...

...

...

.............................

Y auf X1

1............................................................................................................................................................................................................................................................................ ...................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

r

rrr

e

..........................................................................................................................................................................................................................................................................................................................................

........

...............

........

X auf Y

→ Eine weitere ähnliche Aufgabe

? Suche Gerade , bei der die Summe der quadrierten Abständesenkrecht zur Gerade minimal ist !

→ Lösung ist (meist ) wieder eine andere Gerade

? Im Beispiel :

1

1............................................................................................................................................................................................................................................................................ ...................................................................................................................................................................................................................................................................................................................................

...................

X

Y

rr

r

rrr

e

............................................................................................................................................................................................................................................................................................................................

......

..............

.........

B Problematisch ist daher die Formulierung :

− ‚ Die die Punktwolke am besten repräsentierende Gerade ‘

1.5 QM1_18 276

→ Multiple ( lineare ) Regression

Erweiterung gegenüber der ‚ einfachen linearen Regression ‘ :

− Mehrere Prädiktoren

→ Ziel :

− ‚ Vorhersage ‘ einer Variable Y durch mehrere Variablen Xj

Bezeichnung wieder : Y : Kriterium , Xj : Prädiktoren

Anzahl der Prädiktoren : m

− Prädiktoren also : X1 , . . . , Xm

Vorhersagegleichung wieder ( fast ) einfachstmöglich :

y =m∑j=1

bjxj + a

bj : Regressionsgewichte , a : additive Konstante

→ Beispiele :

? Vorhersage der Diplomnote mit mehreren Abiturnoten

? Vorhersage der Hilfsbereitschaft mit Stimmung und Vermögen

1.5 QM1_18 277

→ Datensituation

♣ Werte der Variablen Xj und Y liegen für n Vpn vor

xij : Wert von Vp i in Variable Xj

Zusammenfassung der Daten in ‚ Datenmatrix ‘

Vp X1 X2 . . . Xm Y

1 x11 x12 . . . x1m y1

2 x21 x22 . . . x2m y2... ... ... ... ... ...n xn1 xn2 . . . xnm yn

Erster Schritt : Ermittlung von Kennwerten :

− Mittelwerte MX1, . . . , MXm

, MY

− Varianzen S2Xj

, S2Y

− Kovarianzen KovXj ,Xk, KovXj ,Y

Kovarianzen ( und Varianzen ) :

− wie üblich in Kovarianzmatrix versammeln

1.5 QM1_18 278

? Beispiel

→ Ziel : Vorhersage des Studienerfolgs Y (Durchschnittsnote )

− Prädiktoren : Abiturpunkte in Deutsch (D ) und Mathe (M )

− ferner Ergebnis eines speziellen Eignungstests (T )

Anfang einer möglichen Datenmatrix :

Vp D M T Y

1 10 10 110 2.8

2 8 15 120 1.1... ... ... ... ...

Mögliche Vorhersage mit der Gleichung

Y = −.1D − .2M − .05T + 11

4 Gewichte : −.1 , −.2 , −.05

− Additive Konstante : 11

? Vorhersage für Vp 1 :

−.1 · 10 − .2 · 10 − .05 · 110 + 11 = 2.5

? Vorhersage für Vp 2 :

−.1 · 8 − .2 · 15 − .05 · 120 + 11 = 1.2

Vorhersagen passen ganz gut zu den tatsächlichen Y -Werten

1.5 QM1_18 279

→ Geometrische Darstellung

4 Noch möglich im Fall von 2 Prädiktoren X1 und X2

Datendarstellung dann im dreidimensionalen Raum

Achsen : X1 , X2 , Y

Jeder Vp i entspricht ein Punkt im R3 : (xi1 , xi2 , yi )

→ Vorhersagefunktion :

Jedem Paar (x1 , x2 ) wird vorhergesagter Wert zugeordnet :

y = b1 x1 + b2 x2 + a

Graph ist dann allgemein ‚ eine Art Gebirgsoberfläche ‘

über der x1-x2-Grundebene

Im Fall dieser einfachen Funktion ist der Graph eine Ebene

a : ‚ Durchstoßpunkt ‘ der Y -Achse

b1 , b2 : Steigungen der Schnittgeraden des Graphen

mit der X1-Y - bzw. X2-Y -Ebene

1.5 QM1_18 280

→ Bezeichnungen wie bei der einfachen linearen Regression :

Y :=m∑j=1

bjXj + a : Vorhersage als Variable

yi :=m∑j=1

bj xij + a : Vorhersagewert für Vp i

ei := yi − yi : Vorhersagefehler bei Vp i

E := Y − Y : Vorhersagefehler ( als Variable )

→ Aufgabe : Finde die optimale Vorhersagefunktion

− wieder im Sinne der kleinsten Quadrate

→ Genauer : Finde Gewichte bj und Konstante a so ,

− dass für die zugehörige Vorhersage Y =∑bjXj + a

die Summen∑

i=1

e2i

der quadrierten Fehler minimal wird

1.5 QM1_18 281

→ Minimiere∑e2i durch geeignete Wahl der bj , a

→ Vorgehen ähnlich wie bei einfacher linearer Regression

Minimierung von ME2 statt∑e2i

Zerlegung : ME2 = S2E + (ME)2

In S2E kommt a nicht mehr vor

Minimum 0 von (ME)2 wird erreicht durch geeignetes a :

ME = MY −∑

bjMXj− a

→ Wähle also ( für gegebene bj ) : a = MY −∑bjMXj

→ Aufgabe nun noch : Minimiere S2E durch geeignete bj

Heuristik :

− In der einfachen Regression galt KovX,E = 0

Vielleicht muss hier etwas Ähnliches gelten

1.5 QM1_18 282

• Falls KovXj ,E 6= 0 gilt für irgendein j , so ist die VorhersageY nicht optimal

on Gegeben sei also Vorhersage Y mit KovXj ,E 6= 0

→ Zeige : Diese Vorhersage lässt sich verbessern

Ansatz : Modifikation zu neuer Vorhersage Y ′ = Y + dXj

− d bleibt vorerst noch unbestimmt

− Also : Y ′ =∑

k bkXk + a + dXj

4 Bei Y ′ ändert sich im Vergleich zu Y nur bj

− Zum alten bj wird d hinzuaddiert

Der Fehler E ′ von Y ′ ist

E ′ = Y − Y ′ = Y − (Y + dXj)

= (Y − Y ) − dXj = E − dXj

S2E′ = S2

E + d2 S2Xj− 2 dKovXj ,E

Wähle jetzt d =KovXj ,E

S2Xj

S2E′ = S2

E +(KovXj ,E)2

(S2Xj

)2S2Xj− 2

KovXj ,E

S2Xj

KovXj ,E

= S2E −

(KovXj ,E)2

S2Xj

< S2E

→ S2E lässt sich also tatsächlich verkleinern

1.5 QM1_18 283

Ergebnis bisher :

− Ist KovXj ,E 6= 0 für ein j , so ist Y nicht optimal

Umgekehrt ausgedrückt :

− Beim optimalen Y müssen alle KovXj ,E gleich 0 sein

→ Kleiner Exkurs

− ‚ Notwendige ‘ und ‚ hinreichende ‘ Bedingungen

A : Y ist optimal

B : Alle KovXj ,E sind 0

→ Hier ist B eine notwendige Bedingung für A

− Wenn B nicht gilt , kann auch A nicht gelten

− Wenn A gilt , so muss auch B gelten

→ Außerdem ist A eine hinreichende Bedingung für B

− Wenn A gilt , so gilt auch B

→ Frage für später :

? Ist hier B auch eine hinreichende Bedingung für A ?

1.5 QM1_18 284

→ Umformulierung der gefundenen Bedingung

(Notwendige ) Bedingung für Optimalität

− Alle KovXj ,E müssen 0 sein

KovXj ,E = KovXj ,Y−Y = KovXj ,Y − KovXj ,Y

KovXj ,Y= KovXj ,

∑k bkXk+a

=m∑k=1

bk KovXj ,Xk

→ KovXj ,E = 0 ⇔m∑k=1

KovXj ,Xkbk = KovXj ,Y

• Ist eine Vorhersage Y =∑bjXj + a optimal , so müssen die

Gleichungenm∑k=1

KovXj ,Xkbk = KovXj ,Y

gelten für alle j = 1, . . . , m

4 Dies sind m Gleichungen mit m Unbekannten bj

Sie heißen Normalengleichungen (Ngln )

4 Die Gleichungen lassen sich als eine Orthogonalitätsbedingunginterpretieren und ‚ normal ‘ bedeutet manchmal ‚ senkrecht ‘

1.5 QM1_18 285

? Ein Beispiel :

♣ Zwei Prädiktoren X1 , X2 , Kriterium Y

− Mittelwerte : MX1= 4 , MX2

= 1 , MY = 3

− Kovarianzmatrix von X1, X2, Y : 4 −2 6

−2 9 5

6 5 25

Ngln :

4 b1 + (−2) b2 = 6

(−2) b1 + 9 b2 = 5

B Koeffizientenschema : Kovarianzmatrix von X1 und X2 :(4 −2

−2 9

)

B Rechte Seite : Kovarianzen von X1 und X2 mit Y

Lösung : b1 = 2 , b2 = 1

Damit : a = MY − (b1MX1+ b2MX2

) = 3 − (8+1) = −6

→ Einziger Kandidat für optimale Vorhersage :

Y = 2X1 + X2 − 6

? Noch unklar : Ist diese Lösung wirklich optimal ?

1.5 QM1_18 286

→ Ergebnis bisher :

− Die bj einer optimalen Lösung müssen die Ngln erfüllen

Unklar :

? Sind die Ngln immer lösbar ? Eindeutig ?

? Liefert eine Lösung der Ngln wirklich eine optimale Vorhersage ?

• Die Ngln besitzen immer eine Lösung , die ‚ meistens ‘ aucheindeutig ist

on Begründung ist umfangreich

• Jede Lösung der Ngln liefert eine optimale Vorhersage

on Geeignete Umformungen

→ Vorgehen bei multipler Regression :

Aufstellen und Lösen der Ngln (→ b1 , . . . , bm )

Ermitteln von a als a = MY −∑bjMXj

Vereinbarung :

− Ab jetzt bezeichnen a , bj , Y , E etc. immer zu eineroptimalen Vorhersage gehörende Zahlen /Variablen

1.5 QM1_18 287

→ Eigenschaften der Lösung

• Für MX1, . . . , MXm

wird MY vorhergesagt

4 Vorhersage geht also durch ‚ Zentroid ‘ (MX1, . . . , MXm

, MY )

on Einsetzen von MX1, . . . , MXm

für X1 , . . . , Xm liefert∑bjMXj

+ a =∑

bjMXj+ (MY −

∑bjMXj

) = MY

• ME = 0

on Gilt per Konstruktion

• KovY ,E = 0

on KovY ,E = Kov∑ bjXj+a,E =∑bj KovXj ,E = 0

• MY = MY , S2Y

= KovY ,Y =∑bj KovXj ,Y

on MY = MY−E = MY − ME = MY

S2Y

= KovY ,Y = KovY ,Y−E = KovY ,Y − KovY ,E

= KovY ,Y = Kov∑ bjXj+a,Y

=∑

bj KovXj ,Y

1.5 QM1_18 288

→ Varianzzerlegung

• S2Y = S2

Y+ S2

E

on S2Y = S2

Y +E= S2

Y+ S2

E + 2KovY ,E

= S2Y

+ S2E

S2Y: ‚ Vorhersagevarianz ‘ , ‚ aufgeklärte Varianz ‘ ( absolut )

S2E : ‚ Fehlervarianz ‘ , ‚ Residualvarianz ‘ , ‚ Restvarianz ‘

• ME2 = S2E = S2

Y − S2Y

= S2Y −

∑bj KovXj ,Y

→ Varianzzerlegung relativ

• 1 =S2Y

S2Y

+S2E

S2Y

♦ Die Zahl

R2 :=S2Y

S2Y

heißt auch Determinationskoeffizient

4 Relativer Anteil der aufgeklärten Varianz

B Voraussetzung dabei immer : S2Y 6= 0

1.5 QM1_18 289

♦ Die ZahlR :=

√R2 =

SY

SY

heißt auch multiple Korrelation zwischen Y und X1 , . . . , Xm

• Ist S2Y6= 0 , so gilt R = rY,Y

4 R dann also : Korrelation der optimalen Vorhersage mit Y

on rY ,Y =KovY ,Y

SY SY=

S2Y

SY SY=

SY

SY= R

• S2Y

= R2 S2Y , S2

E = S2Y ( 1 − R2 )

• 0 ≤ R2 ≤ 1

R2 = 1 ⇔ perfekter Vorhersage (S2E = 0 )

R2 = 0 ⇔ Vorhersage konstant (S2Y

= 0 )

♦ Die Zahl

S2Y.X1,...,Xm

:= S2E ( = S2

Y ( 1 − R2 ) )

heißt auch Schätzfehlervarianz . Die Zahl

SY.X1,...,Xm:= SE ( = SY

√1 − R2 )

heißt auch Standardschätzfehler

1.5 QM1_18 290

• 0 ≤ S2Y.X1,...,Xm

≤ S2Y

S2Y.X1,...,Xm

= 0 ⇔ R2 = 1 ⇔ perfekte Vorhersage

S2Y.X1,...,Xm

= S2Y ⇔ R2 = 0 ⇔ Vorhersage konstant

on S2Y.X1,...,Xm

= S2Y ( 1 − R2 )

? Kennwerte im Beispiel

♣ Zwei Prädiktoren X1 , X2 , Kriterium Y

− Mittelwerte : MX1= 4 , MX2

= 1 , MY = 3

− Kovarianzmatrix von X1, X2, Y : 4 −2 6

−2 9 5

6 5 25

Lösung der Ngln : b1 = 2 , b2 = 1

→ Optimale Vorhersage : Y = 2X1 + X2 − 6

→ S2Y

=∑bj KovXj ,Y = 2 · 6 + 1 · 5 = 17

→ S2E = S2

Y − S2Y

= 25− 17 = 8

→ R2 =S2Y

S2Y

=17

25= .68 , R =

√.68 = .825

→ S2Y.X1,X2

= S2E = 8 , SY.X1,X2

=√

8 = 2.828

1.5 QM1_18 291

→ β-Gewichte

♣ Gelegentlich : Regression mit standardisierten Variablen

− Standardisierung bei Prädiktoren und Kriterium

− Die Fälle ‚ SXj= 0 ‘ und ‚ SY = 0 ‘ sind jetzt ausgeschlossen

Standardisierte Prädiktoren : Z1 , . . . , Zm ( ‚ Zj‘ statt ‚ ZXj‘ )

Standardisiertes Kriterium : ZY

Gewichte heißen zur Unterscheidung βj ( ‚ β-Gewichte ‘ )

Ngln im standardisierten Fall :m∑k=1

KovZj ,Zkβk = KovZj ,ZY

Kovarianzen der standardisierten Variablen sind Korrelationender unstandardisierten

Ngln im standardisierten Fall also :m∑k=1

rXj ,Xkβk = rXj ,Y ( j = 1, . . . , m )

4 Unterschied zum unstandardisierten Fall :

− Kovarianzen werden durch Korrelationen ersetzt

? Beziehung zur Lösung im unstandardisierten Fall ?

− Also : Beziehung der βj zu den bj ?

1.5 QM1_18 292

→ Beziehung zwischen den βj und den bj

• Sind die Zahlen bk Lösungen der Ngln im unstandardisertenFall , so sind die Zahlen

bkSXk

SY

Lösungen der Ngln im standardisierten Fall und umgekehrt

on Voraussetzung : Die bk lösen die unstandardisierten Ngln :m∑k=1

KovXj ,Xkbk = KovXj ,Y

Division durch SXjSY , Einfügung des Faktors 1 = SXk

/SXk

m∑k=1

KovXj ,Xk

SXjSY

SXk

SXk

bk =KovXj ,Y

SXjSY

Umgruppierenm∑k=1

KovXj ,Xk

SXjSXk

(SXk

SYbk

)=

KovXj ,Y

SXjSY

Umformenm∑k=1

rXj ,Xk

(SXk

SYbk

)= rXj ,Y

→ Die (SXk/SY ) bk lösen also die standardisierten Ngln

Umkehrung umgekehrt

1.5 QM1_18 293

→ Ngln , standardisiert und unstandardisiert

Sind b1, . . . , bm Lösungen der Ngln im unstandardisierten Fall ,so sind

βj := bjSXj

SY( j = 1, . . . ,m )

Lösungen der Ngln im standardisierten Fall und umgekehrt

→ Im (Normal )-Fall eindeutiger Lösbarkeit gilt

βj = bjSXj

SY( j = 1, . . . , m )

Additive Konstante ( standardisiert ) :

MZY−∑

βj MZj= 0 −

∑βj · 0 = 0

→ Ist die Vorhersage

Y =∑

bjXj + a

optimal im unstandardisierten Fall , so ist mit

βj = bjSXj

SY( j = 1, . . . , m )

die VorhersageZY =

∑βjZj

optimal für die standardisierten Variablen

→ Grenzfall m = 1

β = bSX

SY= rX,Y

SY

SX

SX

SY= rX,Y

1.5 QM1_18 294

? β-Gewichte im Beispiel

♣ Zwei Prädiktoren X1 , X2 , Kriterium Y

− Mittelwerte : MX1= 4 , MX2

= 1 , MY = 3

− Kovarianzmatrix von X1, X2, Y : 4 −2 6

−2 9 5

6 5 25

Lösung der Ngln : b1 = 2 , b2 = 1

→ Optimale Vorhersage : Y = 2X1 + X2 − 6

Korrelationsmatrix von X1, X2, Y : 1 −1/3 3/5

−1/3 1 1/3

3/5 1/3 1

Ngln für die standardisierten Variablen :

β1 + (−1/3) β2 = 3/5

(−1/3) β1 + β2 = 1/3

Lösung : β1 = 4/5 , β2 = 3/5

→ Optimale Vorhersage

ZY = .8Z1 + .6Z2

4 In der Tat :

β1 = (SX1/SY ) b1 , β2 = (SX2

/SY ) b2

1.5 QM1_18 295

→ Beziehung der beiden Regressionsgleichungen

→ Schreibe die Originalregressionsgleichung mit z-Werten

Einsetzen von Xj = SjZj + Mj

Y =∑

bjXj + a

=∑

bj(SXjZj + MXj

) + a

=∑

bjSXjZj +

∑bjMXj

+ MY −∑

bjMXj

=∑

bjSXjZj + MY

Standardisiere Y (mit der Y -Standardisierung )

Y −MY

SY=

(∑bjSXj

Zj + MY

)− MY

SY

=

∑bjSXj

Zj

SY=∑

bjSXj

SYZj

=∑

βj Zj

Vergleich mit standardisierter Regressionsgleichung :

ZY =∑

βjZj

→ ZY ist die standardisierte VorhersageY −MY

SY

→ Beide Regressionsgleichungen sind ‚ eigentlich ‘ gleich

1.5 QM1_18 296

→ Sonderfall : Unkorrelierte Prädiktoren

Kovarianzmatrix hat hier außerhalb der Diagonalen Nullen

In der Diagonale stehen die Varianzen der Prädiktoren

j-te Ngl allgemein :m∑k=1

KovXj ,Xkbk = KovXj ,Y

j-te Ngl hier :

S2Xjbj = KovXj ,Y

Lösung :

bj =KovXj ,Y

S2Xj

B bj ist gleichzeitig das Gewicht der einfachen Regression auf Xj

Aufgeklärte Varianz :

S2Y

=∑

bjKovXj ,Y =∑ KovXj ,Y

S2Xj

KovXj ,Y

=∑ (KovXj ,Y )2

S2XjS2Y

S2Y

=∑

r2Xj ,Y

S2Y

1.5 QM1_18 297

Aufgeklärte Varianz bei unkorrelierten Prädiktoren :

S2Y

=∑

r2Xj ,Y

S2Y

B r2Xj ,Y

S2Y ist die aufgeklärte Varianz bei Regression auf Xj

→ Bei unkorrelierten Prädiktoren also :

− Insgesamt aufgeklärte Varianz ist Summe der durch diePrädiktoren einzeln aufgeklärten Varianzen

4 Derartige Zerlegungen sind besonders beliebt

4 Die Varianzaufklärung ist hier sozusagen additiv

Division durch S2Y :

R2 =S2Y

S2Y

=∑

r2Xj ,Y

B Multipler Determinationskoeffizient ist Summe derDeterminationskoeffizienten aus den einfachen Regressionen

4 Eindruck :

− Man kann die Prädiktoren in unterschiedlichem Maß für dieVorhersage (?) verantwortlich machen (?)

− Das ‚ Maß ‘ ist durch die Determinationskoeffizienten gegeben

B Vorsicht vor überschießenden Assoziationen

1.5 QM1_18 298

→ β -Gewichte bei unkorrelierten Prädiktoren

Hier gilt :

βj = bjSXj

SY= rXj ,Y

SY

SXj

SXj

SY= rXj ,Y

→ Zusammenfassung : Bei unkorrelierten Prädiktoren gilt :

• Die Regressionsgewichte sind dieselben wie bei den einzelneneinfachen linearen Regressionen :

bj =KovXj ,Y

S2Xj

= rXj ,YSY

SXj

• Die Varianzaufklärung ist additiv :

S2Y

=∑

r2Xj ,Y

S2Y

• Der multiple Determinationskoeffizient ist die Summe derDeterminationskoeffizienten aus den einfachen Regressionen

R2 =∑

r2Xj ,Y

• Die β -Gewichte sind gleichzeitig die Korrelationen :

βj = rXj ,Y

1.5 QM1_18 299

→ Zum Vergleich : Korrelierte Prädiktoren

4 Verhältnisse sind unübersichtlicher

4 Verhältnisse sind womöglich verwirrend

− jedenfalls bei übermäßiger Assoziationssucht

Gewichte aus multipler und einfachen Regressionen müssen nichtgleich sein

? Im Beispiel : Multiple Gewichte : b1 = 2 , b2 = 1

− Gewichte aus einfachen Regressionen : 1.5 (X1) , 5/9 (X2)

4 Manchmal ändern sich auch Vorzeichen

− (Na und ? )

Die aufgeklärte Varianz ist nicht additiv

? Im Beispiel : Multipel aufgeklärte Varianz : 17 ( von 25 )

− Einfach aufgeklärte Varianzen : 9 (X1 ) , 25/9 = 2.777 (X2 )

Entsprechend : Determinationskoeffizienten sind nicht additiv

? Im Beispiel : R2 : .68

− Einfache Determinationskoeffizienten : .36 (X1 ) , 1/9 (X2 )

4 Hier ist die durch beide Variablen aufgeklärte Varianz größer alsdie Summe der einzeln aufgeklärten Varianzen

− (Na und ? )

1.5 QM1_18 300

→ Verhältnisse bei korrelierten Prädiktoren

β -Gewichte sind nicht gleich den Korrelationen

? Im Beispiel : β -Gewichte : .8 , .6

− Korrelationen : .6 , 1/3 = .333

4 Gelegentlich auch Diskrepanz in den Vorzeichen

4 Bisweilen sind β -Gewichte auch > 1 oder < −1

− (Na und ? )

4 Möglicher Grund dafür , dass β-r-Diskrepanzen ( z.B.verschiedene Vorzeichen ) als unangenehm erlebt werden :

− Bedürfnis , beides als Indikator für ‚ Zusammenhang ‘ zuinterpretieren

→ Andererseits : Wem r nicht passt , dem bleibt noch β ...

B ‚ Merkwürdigkeiten ‘ verschärfen sich bei hohen Prädiktorkorre-lationen

‚Multikollinearität ‘

B Unangenehm dabei auch : Lösungen werden ‚ instabil ‘

− Kleine Änderungen in Daten können zu großen Änderungen inden Gewichten führen

1.5 QM1_18 301

→ Interpretation der Regressionsgleichung

→ Die Regression liefert die optimale Vorhersage

→ Fertig

→ Andererseits :

− Die Form der Regressionsgleichung

Y =∑

bjXj + a

fordert zu weitergehenden Interpretationen geradezu heraus

→ Etwa : Beschreibung von Mechanismen ( kausal ? )

− (Die sind dann aber denkbar primitiv )

Genauer vielleicht : Die Xj ‚ beeinflussen ‘ Y

− Regressionsgewichte zeigen die Stärke der Einflüsse ( ?? )

→ Zu solchen Interpretationen besteht ( bisher ) kein Anlass

1.5 QM1_18 302

→ Möglicher Hintergrund für weitergehende ‚ Interpretation ‘

→ Glaube an ein Modell :

− Die Xj ‚ beeinflussen ‘ in der Tat Y

− Einflüsse in Form der Regressionsgleichung

− also : ‚ linear ‘ und ‚ additiv ‘

− ‚ wahre ‘ Gewichte sind allerdings unbekannt

− Alle wesentlichen Einflüsse sind im Modell erfasst

− Weitere Einflüsse sind jedenfalls ‚ unabhängig ‘ von ihnen

− Sie machen den ‚ Fehler ‘ aus

− Zusätzlich : gewisse technische Voraussetzungen

B Glaube an das Modell ist außerstatistisch zu rechtfertigen

→ Wenn das Modell stimmt , so gilt :

− Die Regressionsgleichung ‚ schätzt ‘ die ‚ wahre Gleichung ‘

− in gewissem Sinne sogar optimal

→ Das heißt :

− Die bj sind ( gute ) Schätzer der ‚ wahren Gewichte ‘

4 Die bj liefern dann in der Tat Hinweise auf Einflüsse

B Inferenzstatistik wird benötigt

1.5 QM1_18 303

→ ‚ Atheoretische ‘ Fragen

→ Auch ohne den Glauben an ein Modell können sich pragmatischeFragen stellen

? Beispiel :

→ Ziel : Zukünftige Vorhersagen mit der Regressionsgleichung

? Xj : Abinoten und Testergebnisse , Y : Studienendnote

4 Voraussetzung hier :

− ‚ Verhältnisse bleiben so wie in der Stichprobe ‘

→ Mit weniger Prädiktoren wird die Vorhersage einfacher

− Weniger Daten sind zu erheben

− Einfachere Rechnung

? Kann man Prädiktoren weglassen ?

− Jedenfalls ohne die ‚ Vorhersagegüte ‘ deutlich zu mindern ?

→ Problem : Beurteilung der ‚ Nützlichkeit ‘ von Prädiktoren

? Sind Regressionsgewichte hier nützlich ?

4 Bei solchen Fragen ist gelegentlich ein ziemlich merkwürdigerEinsatz der Inferenzstatistik zu beobachten

1.5 QM1_18 304

→ ‚ Interpretation ‘ der Regressionsgewichte

→ Gelegentlich Fragen der Art :

? Kann man die Regressionsgewichte interpretieren ? Wie ?

? Was soll das denn heißen ?

B Generell : Was ist bei derartigen Formulierungen eigentlich mitdem Wort ‚ interpretieren ‘ gemeint ?

→ Unproblematisch ist jedenfall folgende ‚ Interpretation ‘ :

Sind zwei Konstellationen von Prädiktorwerten gegeben

− die sich im j-ten Prädiktor um 1 unterscheiden

− sonst jedoch nicht

→ so unterscheiden sich die zugehörigen Vorhersagen um bj

→ Konkret :

− Die beiden Konstellationen : x11, . . . , xm1 und x12, . . . , xm2

− Bedingungen : xk1 = xk2 für k 6= j , xj2 = xj1 + 1

Unterschied der zugehörigen Vorhersagen y1 und y2 :

y2 − y1 =

(∑k

bkxk2 + a

)−

(∑k

bkxk1 + a

)

=∑k

bkxk2 −∑k

bkxk1 =∑k

(bkxk2 − bkxk1)

=∑k

bk (xk2 − xk1 ) = bj (xj2 − xj1 ) = bj · 1 = bj

1.5 QM1_18 305

‚ Interpretation ‘ von bj

→ Unterscheiden sich zwei Konstellationen von Prädiktorwerten um1 in Xj und sonst nicht , so unterscheiden sich die zugehörigenVorhersagen um bj

Analog allgemeiner für beliebiges c :

→ Unterscheiden sich zwei Konstellationen von Prädiktorwerten umc in Xj und sonst nicht , so unterscheiden sich die zugehörigenVorhersagen um bj c

Bisherige ‚ Interpretation ‘ sprachlich etwas ungelenk

Griffiger wäre :

→ Ändert sich Xj um 1 , und bleiben die anderen Prädiktorenunverändert , so ändert sich die Vorhersage um bj

B Problem : Einladung zu kausalen Fehldeutungen

− Etwa : bj beschreibt die Größe des Einflusses von Xj

4 Allerdings :

− Zulässig kann eine solche Deutung sein bei Richtigkeit einesentsprechenden Modells (mit allen seinen Voraussetzungen )

Im Folgenden ( nach dieser Warnung ) :

− Verwendung der griffigeren Formulierung

1.5 QM1_18 306

→ Vergleich von Gewichten

Einfluss-Assoziationen legen Gedanken nahe wie :

− Je größer das Gewicht bj ,um so relevanter / einflussreicher / ... ist Xj

Vergleich der ‚ Bedeutsamkeit ‘ von Prädiktoren über Vergleichder Größe ihrer Gewichte ( ? )

? Beispiel : Vorhersage der Weitsprungleistung Y

− Prädiktoren : Beinlänge X1 und Muskelkraft X2

Vorhersagegleichung vielleicht : Y = .8X1 + 1.5X2 + 3

− Einheiten dabei : Y , X1 : m , X2 : kp

→ Hier spielt X2 eine wichtigere Rolle als X1

Umskalierung : X2 wird jetzt in p gemessen

Umschreiben der Vorhersagegleichung :

Y = .8X1 + .0015X2 + 3

→ Nun ist auf einmal X1 viel wichtiger ???

→ Naiver Vergleich von Gewichten ist Unsinn

1.5 QM1_18 307

→ ‚ Interpretation ‘ von β -Gewichten

Die b -Gewichte ändern sich bei Skalenänderungen

Daher : Zu Vergleichen nicht gut geeignet ( ? )

→ Möglicher Ausweg : Übergang zu ausgezeichneten Skalen

− durch Standardisierungen

→ Wähle als ‚ Skaleneinheit ‘ also eine Standardabweichung

Statt ‚ Standardabweichung ‘ griffiger : ‚ Standardeinheit ‘

? Um wieviel ändert sich die Vorhersage ,

− wenn sich Xj um eine Standardeinheit ändert ( von Xj )

− ( und die anderen Prädiktoren gleich bleiben ) ?

Änderung von Y dann um bj SXj

Das sind bj SXj/SY Standardeinheiten von Y

→ Also : βj Standardeinheiten von Y

→ ‚ Interpretation ‘ von βj :

→ Ändert sich Xj um eine Standardeinheit ( von Xj ) , undbleiben alle anderen Prädiktoren gleich , so ändert sich Y

um βj Standardeinheiten ( von Y )

1.5 QM1_18 308

Sind die βj ‚ nützlicher ‘ als die bj ?

→ Kommt drauf an

→ Die βj können nützlicher sein ,

− falls die Skalierungen der Xj ohne Zusammenhang sind

− und die Standardeinheiten ‚ natürliche Einheiten ‘ sind

Standardeinheit ist ‚ natürlich ‘ :

− z.B. bei zufälligem Ziehen aus ‚ natürlicher Population ‘

− spiegelt dann eine ‚ natürliche Schwankung ‘ von Xj wider

Standardeinheit ist nicht ‚ natürlich ‘ :

− z.B. bei willkürlicher Variation von Xj in einem Experiment

Gelegentlich auftauchende Formulierung :

− Im Gegensatz zu den b-Gewichten sind die β-Gewichteinterpretierbar

Formulierung unklar und interpretationsbedürftig

− gemeint wohl im Sinne der ‚ Interpretation ‘ der βj

Außerdem : Formulierung viel zu undifferenziert

→ Typisches Beispiel für Vernebelung

1.5 QM1_18 309

Interpretation von Gewichten

? Sind Gewichte ‚ interpretierbar ‘ hinsichtlich ihrer Größe

− als Indikatoren der ‚ Bedeutsamkeit ‘ der Prädiktoren ?

− sind sie untereinander in dieser Hinsicht vergleichbar ?

→ Kommt drauf an

Beim Glauben an ein Modell mit allen Voraussetzungen :

− womöglich ja

? b oder β ?

− Kommt drauf an

Bei der atheoretischen Bestimmung einer optimalen Vorhersage

− eher nicht

B Gerade bei starker Multikollinearität :

→ Bei Hinzufügung oder Wegnahme von Prädiktoren können sichGewichte drastisch ändern

− Von stark positiv zu stark negativ

− Von 0 oder praktisch 0 zu sehr groß

− Oder umgekehrt

→ Sind Gewichte dann überhaupt noch ‚ ernstzunehmen ‘ ?

4 Trotzdem vielleicht brauchbar als Anregung für ein Modell

1.5 QM1_18 310

→ Gewichte und Korrelationen

Beide in gewisser Weise Indikatoren für ‚ Zusammenhang ‘

Bei stark korrelierten Prädiktoren :

− Oft widersprüchliche Hinweise

? Im Beispiel : β1 = .8 , rX1,Y = .6

B Manchmal auch unterschiedliche Vorzeichen

? Was soll man ‚ ernstnehmen ‘ ?

Beim Glauben an ein Modell (mit allen Voraussetzungen )

− Gewichte haben inhaltliche Bedeutung

→ Korrelationen womöglich eher zweitrangig

Ohne ein Modell

− Gewichte sind oft nur Mittel zum Zweck

− inhaltlich womöglich von zweifelhaftem Wert

→ Hier sind eher Korrelationen relevant

B Schwammigkeit des Begriffs ‚ Zusammenhang ‘

1.5 QM1_18 311

→ Polynomiale Regression

? Sind alle ‚ Zusammenhänge ‘ ‚ linear ‘ ?

− Natürlich nicht

→ Ziel : Auch ‚ nichtlineare ‘ Zusammenhänge ‚ beschreiben ‘

? Beispiel : Erregung X und Leistung Y

− Leistung ist bei mittlerer Erregung hoch

− bei niedriger und hoher Erregung niedrig

? Mögliche Datensituation

........................................................................................................................................................................................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

..........................

...................

X

Y

qq

q

qq

qqq qqq

qq q

qq qq qqq qq qq qq

q qqq

q qqq

qqq

q q

qqq q

qq q q qqq qqq qq

qqqq q qqq qq

q

q qq q

qq qq

qq qq

qq qq qq

qq qq qqq

qqq qq

q qqq q q

qqq

qq qqq

q

q qqqqqqq

qq

qqq

q

qq qqq q

qqq qq qq

qq qqqq

qq

qq q qqq qq q qq qqq qq qq qq qq q qqq q

qq

qq qq qqq

q qq qq qq

q qqq q qq q

qq

‚ Umgekehrt U-förmiger Zusammenhang ‘

Form der Punktwolke parabelähnlich

→ Vorhersagegleichung vielleicht in Form einer Parabelgleichung

Quadratische Regression

1.5 QM1_18 312

→ Quadratische Regression

♣ Es liegen Daten in Variablen X und Y von n Vpn vor

− Punktwolke erinnert an Parabel

− Oder : Theorie legt parabelförmigen Zusammenhang nahe

→ Ziel : Sage Y möglichst gut vorher

− jetzt durch Gleichung der Form

y = a x2 + b x + c

Möglichst gut : Wieder im Sinne der kleinsten Quadrate

→ Lösung : X2 als weiterer Prädiktor

− dann multiple Regression

? Mögliche Originaldaten und Daten mit zusätzlichem Prädiktor

Vp X Y

1 2 3

2 5 3

3 4 6... ... ...

Vp X X2 Y

1 2 4 3

2 5 25 3

3 4 16 6... ... ... ...

→ Multiple Regression von Y auf X1 : = X und X2 : = X2

4 Gewichte : b für X1 = X , a für X2 = X2

− additive Konstante : c

1.5 QM1_18 313

→ Maximum ?

Nach erfolgreicher Regression vielleicht interessant :

− Wo ist die Vorhersage maximal ?

? Bei welcher Erregung wird maximale Leistung vorhergesagt ?

− Wie groß ist dies Maximum ?

Kurvendiskussion

→ Ergebnis :

− y = a x2 + b x + c hat Extremum in x = −b /(2 a)

− Wert von y dort : −b2/(4a) + c

− Maximum für a < 0 , Minumum für a > 0

........................................................................................................................................................................................................................................................................................................................................................................................................................... ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

X

Y

......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

..........................................................

−b/(2a)

−b2/(4a) + c

y = ax2 + bx+ c

1.5 QM1_18 314

→ Polynomiale Regression

Verallgemeinerung :

− Vorhersage von Y jetzt durch Gleichung der Form

y = ak xk + ak−1 x

k−1 + . . . + a1 x + a0

4 Vorhersage also durch Polynom vom Grad k

→ Vorgehen völlig analog zur quadratischen Regression

Einführen von Xk , Xk−1 , . . . , X2 als weitere Prädiktoren

→ Multiple Regression von Y auf Xk , Xk−1 , . . . , X2 , X

− Zahl der Prädiktoren jetzt k

Weitere Verallgemeinerung :

− Vorhersage mit noch allgemeineren Funktionen

− Statt / neben Potenzen von x auch zugelassen :

− z.B. sin(x) , cos(x) , log(x) , . . .

→ Vorgehen völlig analog

1.5 QM1_18 315

→ Moderatormodelle

♣ ( Theoretische ) Vorstellung :

− X1 ‚ beeinflusst ‘ Y ( linear ) – bis auf ‚ Fehler ‘

− jedoch unterschiedlich je nach Wert von X2

X2 dann : Moderator

? Y : Hilfsbereitschaft , X1 : Stimmung , X2 : Vermögen

Illustration ( ohne ‚ Fehler ‘ )

................................................................................................................................................................................................................................................................................................................ ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

X1

Y

....................................................................

....................................................................

....................................................................

....................................................................

....................................................................

....................................................................

...............................................................

X2 klein

................................................................................................................................................................................................................................................................................................................ ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

X1

Y

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

X2 groß

B Auch die Steigung kann sich ändern

? Reicht Modell der multiple Regression auf X1 und X2 ?

1.5 QM1_18 316

→ Modellierung der ‚ Moderatorwirkung ‘

? Reicht Regression von Y auf X1 und X2 ?

Vorhersagegleichung :

y = b1x1 + b2x2 + a = b1x1 + ( b2x2 + a )

Bei jeweils festem x2 :

− y ist lineare Funktion von x1

− Jedoch : Steigungen sind alle gleich (Geraden parallel )

Leichte Modifikation

Wohl simpelste Möglichkeit : X1X2 als weiterer Prädiktor

Vorhersagegleichung dann :

y = b1x1 + b2x2 + b3(x1x2) + a

= ( b1 + b3x2 )x1 + ( b2x2 + a )

Bei jeweils festem x2 :

− y ist lineare Funktion von x1

− Steigung ( b1 + b3x2 ) ändert sich mit x2

− Additive Konstante ( b2x2 + a ) ebenso

→ Das reicht ja dann wohl

1.5 QM1_18 317

→ Vorgehen bei Untersuchung von ‚ Moderatorwirkungen ‘

Multiple Regression von Y auf X1 , X2 und X3 := X1X2

Inferenzstatistische Prüfung :

? Unterscheidet sich b3 ‚ signifikant ‘ von 0 ?

→ Wenn ja , wird X2 als Moderator betrachtet

→ Implikationen des Modells

− Für jeden festen Wert x2 von X2 ist Vorhersage linear in X1

− Die Geradensteigungen hängen linear von x2 ab

− Die additiven Konstanten hängen linear von x2 ab

− Alle Geraden gehen durch den Punkt

(x1, y ) = (−b2/b3 , −b1b2/b3 + a )

................................................................................................................................................................................................................................................................................................................ ..........................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

X1

Y

...............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

............................

..

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

......

...

...

...

...

...

...

...

...

...

..............................

−b2/b3

−b1b2/b3 + a

− Geraden für 7 Werte von x2 mit jeweils gleichen Abständen

4 (Naheliegende Frage : Ist das alles plausibel ? )

1.5 QM1_18 318

→ Partialkorrelation

♣ Mögliche Situation : 3 Variablen X , Y , Z

− Negative Korrelation zwischen X und Y für festes z

− Positive Korrelation zwischen X und Y insgesamt

? Hypothetisches Beispiel :

− X : Deutschleistung , Y : Matheleistung , Z : Klasse

1

1......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... .................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

...................

X

Y

q q q qq qqqqq

q qq

q q q qq qqq q qqqqq qq

qqqqqqq q

qqq qq qq

qqqq

qqqq

qq qqq q qqq

qq qq q q qqq

qq

qq qq

qqq

qq qq

q qq q

qqqq qq q q

qq qqqq

qqqq q q qqqq q

qqqq q

qq qq qqqqq qq qq q

qqq qqq qqq q

q qqq q q

q

qq

qq qq q

q qq

qqqq qq qq qqq qq q

qqq

qq

qq

qq

qq qq q qq

qqqqq

q qq qq

qq

r = .5

Z = 6

Z = 8

Eindruck :

− ‚ Wahrer ‘ Zusammenhang wird durch r nicht korrekt erfasst

? Analoge ähnliche Beispiele :

− Großes r für festes z , Unkorreliertheit insgesamt

− r = 0 für festes z , r = .9 insgesamt

− etc. etc.

1.5 QM1_18 319

→ Ziel : Ermittung der ‚ wahren ‘ Korrelation

→ Vielleicht ist es möglich und zielführend ,

− den ‘ Einfluss ‘ von Z ‚ herauszurechnen ‘

− und dann die ‚ bereinigten ‘ Variablen zu korrelieren

‚ Herausrechnen ‘ des ‚ Einflusses ‘ mittels Regression

Die ‚ bereinigten ‘ Variablen wären dann die Residuen

B Sinnvolles Resultat ergibt sich dabei wohl nur dann ,

− wenn ‚ Einfluss ‘ von Z auf X und Y etwa linear ist

→ Vorgehen also :

Regressionen von X und Y auf Z

Interessant sind nun die Residuen

→ Diese sind zu korrelieren

4 Jetzt werden also die früher uninteressanten Fehler wichtig

X , Y : Fehler bei Regressionen von X und Y auf Z

→ Ziel : Formel für das Endergebnis

1.5 QM1_18 320

→ Durchführung der Rechnung

Regressionen : X = bX Z + aX , Y = bY Z + aY

Gewichte dabei : bX =SX

SZrXZ , bY =

SY

SZrY Z

Die jetzt interessanten Residuen :

− X = X − X = X − bX Z − aX

− Y = Y − Y = Y − bY Z − aY

Kovarianz :

KovX,Y = KovX − bX Z − aX ,Y − bY Z − aY

= KovX,Y − bX KovZ,Y − bY KovX,Z + bXbY KovZ,Z

= rXY SX SY −(SX

SZrXZ

)( rY Z SY SZ )

−(SY

SZrY Z

)( rXZ SX SZ ) +

(SX

SZrXZ

) (SY

SZrY Z

)S2Z

= rXY SX SY − SX SY rXZ rY Z

− SY SX rY Z rXZ + SX SY rXZ rY Z

= rXY SX SY − SX SY rXZ rY Z

= SX SY ( rXY − rXZ rY Z )

1.5 QM1_18 321

Fortsetzung der Rechnung

SX : Standardschätzfehler bei Regression von X auf Z

SX = SX

√1 − r2

XZ

SY : analog

SY = SY

√1 − r2

Y Z

→ Korrelation von X und Y :

rXY =KovX,Y

SX SY

=SX SY ( rXY − rXZ rY Z )

SX

√1 − r2

XZ SY

√1 − r2

Y Z

=rXY − rXZ rY Z√

1 − r2XZ

√1 − r2

Y Z

♦ Die ZahlrXY.Z :=

rXY − rXZ rY Z√1 − r2

XZ

√1 − r2

Y Z

heißt auch Partialkorrelation von X und Y ohne Z

Sprechweise : Z wird herauspartialisiert

1.5 QM1_18 322

? Beispiel

− Daten aus dem Beispiel zur multiplen Regression

− Variablen passenderweise umbenannt :

− Statt X1 , X2 , Y jetzt X , Y , Z

Korrelationsmatrix (Reihenfolge : X , Y , Z ) : 1 −1/3 3/5

−1/3 1 1/3

3/5 1/3 1

→ Partialkorrelation :

rXY.Z =rXY − rXZ rY Z√

1 − r2XZ

√1 − r2

Y Z

=(−1/3) − (3/5) (1/3)√1 − (3/5)2

√1 − (1/3)2

=(−1/3) − 1/5√

16/25√

8/9

=− 8/15

(4/5)(2/3)√

2=− 1√

2=−√

2

2

= −.7071

1.5 QM1_18 323

→ Bedeutung der Partialkorrelation

B Unklar :

− Erfüllt die Partialkorrelation die motivierenden Wünsche ?

Erläuterung der Bedeutung :

− Darlegung des Verfahrens

4 Lage womöglich etwas unbefriedigend

→ Geometrische Interpretation :

Betrachte Punktwolke im X-Y -Z-Koordinatensystem

Konstruiere ‚ Regressionsgerade im Dreidimensionalen ‘

z 7→ ( bX z + aX , bY z + aY )

‚ Drehe ‘ Gerade senkrecht zur X-Y -Ebene

− Datenpunkte sollen ‚ folgen ‘

Betrachte nun die Situation von oben

‚ Projiziere ‘ also die ‚ neuen ‘ Datenpunkte auf X-Y -Ebene

Ergebnis : Punktwolke in X-Y -Ebene

→ Partialkorrelation ist Korrelation dieser Punktwolke

1.5 QM1_18 324

→ Bedeutung der Partialkorrelation

Gelegentlich hört man folgenden Spruch :

− Die Partialkorrelation ist die Korrelation von X und Y beikonstant gehaltenem Z

→ ( Schön wär’s )

Versuch einer Interpretation

Dazu besondere Datensituation :

− Z nimmt nur endlich viele Werte an

− Für jeden dieser Werte : mehrere Beobachtungen

− Für jeden Wert dann : eine Korrelation von X und Y

? Beispiel :

X Y Z

1 2 1

3 4 1

5 3 1

X Y Z

9 2 2

7 4 2

5 3 2

X Y Z

4 5 3

5 8 3

6 5 3

Korrelationen von X und Y für Z = 1, 2, 3 : .5, −.5, 0

B Die Korrelation von X und Y bei konstantem Z gibt es hiergar nicht

4 Ist der Spruch dann sinnvoll ?

rXY.Z = −.39

? (Was sagt uns das ? )

1.5 QM1_18 325

Versuch einer Interpretation

Voraussetzung ab jetzt :

− Die Korrelationen für verschiedene z sind alle gleich

? Ist dann die Partialkorrelation gleich dieser Korrelation ?

? Beispiel :

X Y Z

−2 −1 1

0 1 1

2 0 1

X Y Z

−3 0 2

−1 2 2

1 1 2

X Y Z

−1 −2 3

1 0 3

3 −1 3

Korrelationen von X und Y für Z = 1, 2, 3 : .5, .5, .5

B Hier gibt es die Korrelation bei konstantem Z

Partialkorrelation : .09

→ Partialkorrelation ist nicht Korrelation bei konstantem Z

→ Betrachtung der Zentroide der Teilgruppen ( dreidimensional )

Zentroide : ( 0, 0, 1 ) , (−1, 1, 2 ) , ( 1, −1, 3 )

→ Zentroide liegen nicht auf einer Gerade

4 Das spricht gegen ‚ Linearität ‘ der Einflüsse

B Partialkorrelation passt hier qua Konstruktion nicht

1.5 QM1_18 326

→ Versuch einer Interpretation

? Noch ein Beispiel :

X Y Z

−20 −1 1

0 1 1

20 0 1

X Y Z

−1 0 2

1 2 2

3 1 2

X Y Z

0 1 3

2 3 3

4 2 3

Korrelationen von X und Y für Z = 1, 2, 3 : .5, .5, .5

B Hier gibt es die Korrelation bei konstantem Z

→ Betrachtung der Zentroide der Teilgruppen ( dreidimensional )

Zentroide : ( 0, 0, 1 ) , ( 1, 1, 2 ) , ( 2, 2, 3 )

→ Zentroide liegen auf einer Gerade

Partialkorrelation : .34

→ Partialkorrelation ist nicht Korrelation bei konstantem Z

→ Betrachtung der Varianzverhältnisse S2X/S

2Y

Varianzverhältnisse S2X/S

2Y für Z = 1, 2, 3 : 400 , 4 , 4

→ Varianzverhältnisse sind nicht gleich

1.5 QM1_18 327

→ Versuch einer Interpretation

? Ein letztes Beispiel :

X Y Z

−2 −1 1

0 1 1

2 0 1

X Y Z

−1 0 2

1 2 2

3 1 2

X Y Z

0 1 3

2 3 3

4 2 3

Korrelationen von X und Y für Z = 1, 2, 3 : .5, .5, .5

B Hier gibt es die Korrelation bei konstantem Z

→ Betrachtung der Zentroide der Teilgruppen ( dreidimensional )

Zentroide : ( 0, 0, 1 ) , ( 1, 1, 2 ) , ( 2, 2, 3 )

→ Zentroide liegen auf einer Gerade

Varianzverhältnisse S2X/S

2Y für Z = 1, 2, 3 : 4 , 4 , 4

→ Varianzverhältnisse sind gleich

Partialkorrelation : .5

→ Endlich klappt es mal

1.5 QM1_18 328

→ Interpretation der Partialkorrelation

→ Damit der Spruch zur Partialkorrelation sinnvoll und richtig istmüssen offenbar einige Bedingungen erfüllt sein

4 In der Tat gilt in der untersuchten Datensituation :

− Wenn

− die Korrelationen für alle z gleich sind und

− die Zentroide auf einer Gerade liegen und

− die Varianzverhältnisse gleich sind

→ dann ist

− Partialkorrelation = Korrelation bei konstantem Z

4 Bei ähnlich starken Voraussetzungen gilt ein entsprechender Satzauch auf theoretischer Ebene

4 Derartige Voraussetzungen werden meistens gemacht

→ Dann stimmt der Spruch ja doch wieder !

1.5 QM1_18 329

→ Vektorrepräsentation

→ Vorübungen

Notationen

PQ : Strecke von P nach Q

⊥ : senkrecht

‖ : parallel

∠ : Winkel

→ Eine Frage zu ( orthogonalen ) Projektionen

♣ Situation :

Gegeben sind : Ebene E , darin Gerade g , Punkt P

E g

Pt

..........................................................................

..........................................................................

..........................................................................

..........................................................................

..........................................................................

.....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

.....

..............................................

..............................................

..............................................

..............................................

..............................................

..............................................

..............................................

..

→ Aufgabe : Lot von P auf g

Erste Möglichkeit : direkt

Vorschlag : Erst Lot auf E , dann von dort Lot auf g

? Gleiches Ergebnis ?

1.5 QM1_18 330

Situation

E g

Pt

..........................................................................

..........................................................................

..........................................................................

..........................................................................

..........................................................................

.....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

.....

..............................................

..............................................

..............................................

..............................................

..............................................

..............................................

..............................................

..

Zweimal Lote fällen von P auf g

E g

P

L1

t

t..........................................................................

..........................................................................

..........................................................................

..........................................................................

...........................................................

...........................................................................................................................................................................................................................

...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

.....

..............................................

..............................................

..............................................

..............................................

..............................................

..............................................

..............................................

..

E

P

L1

g

L2

L′2

t

t t.....................................

..........................................................................

..........................................................................

..........................................................................

..........................................................................

................................................................ ................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

....................

....................................................................................................................................................................................................................................

..............................................

..............................................

..............................................

..............................................

..............................................

.......................................

......................

..............................................

..............................................

..............................................

...............

links : direkt - Ergebnis : L1

rechts : in zwei Schritten

− erst auf E - Ergebnis : L′2

− dann von L′2 auf g - Ergebnis : L2

? L1 = L2 ?

→ Ja !

1.5 QM1_18 331

• L1 = L2

on E ′ : Ebene ⊥ g durch P

− Schnittpunkt : L1

− Schnittgerade : h ( h ⊥ g )

E

E ′

h

g

P

L1

t

t..........................................................................

................... ....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

.....

..............................................

..............................................

..............................

...........................................................................................................................................................................................................................

..............................................

..............................................

..............................................

...............

.....................................................................................................................................................................................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.

E

E ′

h

g

P

L1

g′Q

t

t t.....................................

........................................................ .....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

..............................

....................

..............................................

..............................................

..............................

..............................................

..............................................

..............................................

......................

..............................................

............................

...........................................................................................................................................................................................................................

...........................................................................................................................................................................................................................................................

..............................................

..............................................

...............

.....................................................................................................................................................................................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................................................................................................................................................................................

.....................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.

→ Weiter rechte Abbildung :

Lot von P auf h : Fußpunkt : Q

g′ : Parallele zu g durch Q

PQ ist ⊥ zu h und g′ ( wegen g′⊥E ′ )

PQ ist ⊥ zu E

→ Q = L′2

Wegen g ⊥ h ist L1 Fußpunkt des Lots von L′2 auf g

→ L1 = L2

1.5 QM1_18 332

→ Skalentransformationen

♣ Gegeben :

− Achse mit Nullpunkt ( 0 ) Richtung und Einheit ( e )

t....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ...................

0

.......

.......

.......

.......

.

.......

.......

.......

.......

...............................................................................................

e

→ Hierdurch wird eine Skala etabliert :

s....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ..................................

.......

.......

................

.......

.......

................

.......

.......

................

.......

.......

................

0 1 2 3 4 5−1−2−3 ssPQ

? Skalenwerte der Punkte P und Q : 4.5 und −3

→ Bedeutung der Skalenwerte : Abstand zu 0 in e - Einheiten

− links vom Nullpunkt : negatives Vorzeichen

→ Aufgabe :

− Was passiert beim Übergang zu einer anderen Einheit ?

t....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ................................................

.......

.......

.......

.......

................................................................................................................................................

0

e2

.......

.......

.......

.......

.

.......

.......

.......

.......

............................................................................................... e1

1.5 QM1_18 333

Gegeben sind jetzt zwei Einheiten : e1 und e2

t....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ................................................

.......

.......

.......

.......

................................................................................................................................................

0

e2

.......

.......

.......

.......

.

.......

.......

.......

.......

............................................................................................... e1

Es entstehen zwei Skalen

s....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... .................................................

..............................

..............................

.......

.......

................

.......

.......

................

.......

.......

................

.......

.......

.

0 1 2 3−1

0 1 2 3 4 5−1−2

Skala 2

Skala 1

Es gelte : e2 = k e1 ( im Beispiel : k = 1.5 )

→ Gegeben sei Punkt P

− Skalenwerte : x1 auf Skala 1 , x2 auf Skala 2

? Beispiel :

s sP....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... .................................................

..............................

..............................

.......

.......

................

.......

.......

................

.......

.......

................

.......

.......

.

0 1 2 3−1

0 1 2 3 4 5−1−2

Skala 2

Skala 1

? Umrechnung x1 ↔ x2 ?

Es muss gelten : x2 e2 = x1 e1

x2 ( k e1 ) = x1 e1 oder (x2 k ) e1 = x1 e1

→ Umrechnungen also : x1 = k x2 und x2 = (1/k)x1

? Im Beispiel : x1 = 4.5 und x2 = 3 bei k = 1.5

1.5 QM1_18 334

→ Allgemeine Koordinatensysteme

− Achsen müssen nicht orthogonal sein

− Einheiten der Achsen müssen nicht gleich groß sein

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

....................................................

.................................................................

.........................................................................................................................................................................................................................................................................................................................................................................................................................................................................

...................

................

................

............................................................................

x1

x2 P

1

1

t

........................

........................

........................

........................

........................

............

............

............

............

............

............

............

............

............

...............

...............

...............

...............

...............

...............

...............

...............

...............

..............................

..............................

..............................

..............................

..............................

............................................................................................................................................................................................................................................................................................................................................................................................

? Der Punkt P hat die Koordinaten ( 1.5 , 2 )

! Achtung :

− Ablesen mit Hilfslinien parallel zu den Achsen

− an den Endpunkten der Achsenabschnitte

− Nicht ( ! ) mit Loten auf die Achsen

1.5 QM1_18 335

→ Allgemeine Koordinatensysteme – mit ‚ absolutem ‘ Maßstab

Zusätzlich zum Koordinatensystem jetzt : Längenmaßstab

? Beispielsweise hier mit Einheit 1 cm

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ...............................

.............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

......

......

......

......

......

......

......

......

......

......

......

.........

......

......

......

......

......

......

...

x1

x2

P

1

1 t....................................

....................................

....................................

....................................

..........................................................

.......

......................

.......

......................

.......

......................

.......

......................

.......

..................

..................

..................

..................

..................

..................

..................

..................

.............................

....

...............

...............

...............

...............

...............

...............

...............

...............

Skaliere Achsen alternativ mit ‚ absoluter ‘ Einheit

? Umrechnung der Skalenwerte ?

Hierzu :

k1 , k2 : Achseneinheiten in ‚ absoluten ‘ Einheiten

4 Also :

− Einheit von Achse i = ki absolute Einheiten

? Hier : k1 = 2 , k2 = 2.5

1.5 QM1_18 336

Koordinatenumrechnung :

− Achseneinheiten ↔ absolute Einheiten

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ...............................

.............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

......

......

......

......

......

......

......

......

......

......

......

.........

......

......

......

......

......

......

...

x1

x2

P

1

1 t....................................

....................................

....................................

....................................

..........................................................

.......

......................

.......

......................

.......

......................

.......

......................

.......

..................

..................

..................

..................

..................

..................

..................

..................

.............................

....

...............

...............

...............

...............

...............

...............

...............

...............

k1 , k2 : Achseneinheiten in ‚ absoluten ‘ Einheiten

x1 , x2 : Koordinaten in Achseneinheiten

a1 , a2 : Koordinaten in absoluten Einheiten

→ Umrechnung : ai = ki xi und xi = (1/ki) ai

? Im Beispiel ( Punkt P ) :

− k1 = 2 , k2 = 2.5

− a1 = 3 , a2 = 5

− x1 = 1.5 , x2 = 2

Sprechweise :

− Achsenkoordinaten (xi ) ↔ absolute Koordinaten ( ai )

1.5 QM1_18 337

→ Erinnerung an den Kosinus

♦ Definition vereinfacht über Illustration :

1

1

..................................................................................................................................................................................

.......

.......

..............................................

...................................................

αx

y

...................................................................................................................cos(α)

1

.

.

.

.

............

....

....

....

.................................

........................................ . . . . . . . . . . . . . . . . . .

. . .. .

.........................

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

− Funktionsgraph :

−180 −90 90 180 270 360

−1

−.5

.51

............................................................................................................................................................................................................ ...................α

.......

.......

.......

.......

.......

.......

.......

........................

...................

...........................................

............................................................................................................................................................................................................................................................................................

....................................................................................................................................................................................................................................................................................................................................................................................................................

............................................................................................................................................................................................................................................................................................

.................

cos(α)

B ( Lokale ) Umkehrfunktion : arccos ( arcus cosinus )

− arccos ist definiert auf [ 0 , 180 ]

1.5 QM1_18 338

Kosinus

1

1

..................................................................................................................................................................................

.......

.......

..............................................

...................................................

αx

y

...................................................................................................................cos(α)

1

.

.

.

.

............

....

....

....

.................................

........................................ . . . . . . . . . . . . . . . . . .

. . .. .

.........................

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

−180 −90 90 180 270 360

−1

−.5

.51

............................................................................................................................................................................................................ ...................α

.......

.......

.......

.......

.......

.......

.......

........................

...................

...........................................

............................................................................................................................................................................................................................................................................................

....................................................................................................................................................................................................................................................................................................................................................................................................................

............................................................................................................................................................................................................................................................................................

.................

cos(α)

→ Nützlich:

− cos(0) = 1

− cos(60) = .5

− cos(90) = 0

− cos(180) = −1

− cos(−α) = cos(α)

− cos(180 − α) = − cos(α)

− Kosinus ist positiv für spitze Winkel, negativ für stumpfe

1.5 QM1_18 339

→ Rechtwinklige Dreiecke

.......

.......

..............................................

...

α........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

a

bc ∠ ( a, b ) = 90

→ Pythagoras :a2 + b2 = c2

→ Rechtwinklige Dreiecke und Kosinus :

a = c cos(α)

B Beachte Ähnlichkeit mit Dreieck aus der Definition des Kosinus

→ Allgemeiner für beliebige α :

− Dabei : a auf Gerade mit ausgezeichneter Richtung

.......

.......

..............................................

.........................

......................................................................................................

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

...

α..............................................

............................................................................................

............................................................................................

............................................................................................

........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................a

bc ∠ ( a, b ) = 90

Vereinbarung : a soll hier negativ sein ( ‚ Skalenwert ‘ )

− Dann gilt wieder : a = c cos(α)

− Außerdem Pythagoras : a2 + b2 = c2

1.5 QM1_18 340

→ Vektoren ( vereinfacht )

♣ Situation : ( ein- , zwei- , drei- , . . . -dimensional )

− Ein Punkt ist als Nullpunkt ausgezeichnet

♦ Vektoren sind Pfeile, die von diesem Punkt ausgehen

? Beispiele von Vektoren ( hier zweidimensional ) :

t................................................................................................................................................................................... ..............................................................................................................................................................

........................................................................................................................................................................................................................

...............................................................................................................................................................................................................................................................

......................................................................................................................

Bezeichnungen von Vektoren : fette Kleinbuchstaben (x )

→ Operationen mit Vektoren

Vervielfachen eines Vektors

4 Richtungswechsel bei negativen Vielfachen

? Beispiel : Ein Vektor x sowie 2x und (−1.5)x :

t x2x

(−1.5)x

......................................................................................................................................................................................................................................................................................................................... ...................

....................................................

....................................................

....................................................

....................................................

..................................................

...................................................................................................................................................................... ...................

1.5 QM1_18 341

→ Operationen mit Vektoren

Addition von Vektoren

− Zweiten Summanden an der Spitze des ersten ansetzen

? Beispiel

tx

yx + y

.......................................................................................................................................................................................................................................................................................................

......................................................................................................................................................................................................................................................................................................................... ...................

.......................................................................................................................................................................................................................................................................................................

................................................................................................................................................................................................................................................

Differenz von Vektoren : y − x

− Entweder : y + (−1)x

− Oder : Welcher Vektor ergibt zu x addiert y ?

tx

y − xy

−x....................

........................................

........................................

........................................

........................................

........................................

...........................................

........................................

........................................

........................................

........................................

........................................

...............................................................

.................................................................................................................................................................................................................................................... ...................

......................................................................................................................................................................................................

.......................................................................................................................................................................................................................................................................................................

tx

y − xy

.......................................................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................... ...................

......................................................................................................................................................................................................

.......................................................................................................................................................................................................................................................................................................

1.5 QM1_18 342

Die Addition von Vektoren ist kommutativ

? Beispiel

tx

yx + y

.......................................................................................................................................................................................................................................................................................................

......................................................................................................................................................................................................................................................................................................................... ...................

.......................................................................................................................................................................................................................................................................................................

................................................................................................................................................................................................................................................

tx

yy + x

......................................................................................................................................................................................................................................................................................................................... ...................

......................................................................................................................................................................................................................................................................................................................... ...................

.......................................................................................................................................................................................................................................................................................................

................................................................................................................................................................................................................................................

? Beide Darstellungen zusammen :

tx

yx + y

.......................................................................................................................................................................................................................................................................................................

......................................................................................................................................................................................................................................................................................................................... ...................

......................................................................................................................................................................................................................................................................................................................... ...................

.......................................................................................................................................................................................................................................................................................................

................................................................................................................................................................................................................................................

B Beachte das Parallelogramm !

1.5 QM1_18 343

Linearkombinationen

♦ Sind x1 , . . . , xn Vektoren und a1 , . . . , an Zahlen, so heißt∑ai xi

auch Linearkombination der xi mit Koeffizienten ai

4 Hier gibt es nichts in der Art einer additiven Konstanten

? Beispiele von Linearkombinationen

tx

y

1.5x + .5y

(−.5)x− 1.5y

............................................................................................ ....

..................................

............

............

.............................................................................................

......

......................................................................................................................................................................................................................................................................................................................... ...................

.......................................................................................................................................................................................................................................................................................................

....................................................................................................................................................................................................................................................................................................................................................................................... ...............................................................................................................................................................................................................................................................................................................................................................

→ Ad-hoc-Definition der Linearen Unabhängigkeit

♦ Linear unabhängig ( l.u. ) heißen

− zwei Vektoren , falls sie nicht auf einer Geraden liegen

− drei Vektoren , falls sie nicht in einer Ebene liegen

1.5 QM1_18 344

→ Linearkombinationen

Die Vielfachen eines Vektors x 6= 0 bilden eine Gerade

t x

..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

...................................................................................................................................................................... ...................

4 Gemeint ist genauer :

− die Spitzen der Vielfachen von x bilden eine Gerade

4 Es soll die griffigere Sprechweise oben benutzt werden

B Die Gerade ist dabei die Gerade , ‚ auf der x liegt ‘

Sprechweise auch : die von x aufgespannte Gerade

Analog bei zwei l.u. Vektoren x und y :

− Die Linearkombinationen von x und y bilden eine Ebene

tx

y....................................................................................................................................................................................................................................................................................................................................................................................................................

......................................................................................

......................................................................................

......................................................................................

......................................................................................

.................................................................

.............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

.............

..............................................................................................................................................................................................................................................................................................................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

......

................................................................................................... ...................

................................................................................................................................................................. ...................

B Die Ebene ist dabei die , ‚ auf der x und y liegen ‘

Sprechweise auch : die von x und y aufgespannte Ebene

B Alle Punkte der Ebene sind Linearkombinationen von x und y

1.5 QM1_18 345

Längen von Vektoren

♦ ‖x‖ : Länge des Vektors x (Norm )

→ Offenbar gilt : ‖ax‖ = |a| ‖x‖

Vektoren und Koordinatensysteme

♣ Gegeben : zwei l.u. Vektoren x und y

Betrachte die von x und y aufgespannte Ebene

→ Die Vektoren etablieren hier ein Koordinatensystem :

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ...............................

.............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

....................................................................................

....................................................................................

................................................

.................................................................................................................................................................. ...................

x

y

1

1

y

xt

....................................

....................................

....................................

....................................

..........................................................

.......

......................

.......

......................

.......

......................

.......

......................

.......

..................

..................

..................

..................

..................

..................

..................

..................

.............................

....

...............

...............

...............

...............

...............

...............

...............

...............

− Ursprung im Nullpunkt

− Einheiten an den Vektorspitzen

Name für das Koordinatensystem : x -y -System

Bennenung der Koordinaten : x , y

1.5 QM1_18 346

Linearkombinationen und Koordinatensysteme

→ Gegeben nun : Linearkombination u der l.u. Vektoren x , y

? Beispiel : u = 1.5x + 2y

....................................................................................

....................................................................................

................................................

.................................................................................................................................................................. ...................

............................................................................................................................................................................................................................................................................................................................................

................................................................................................................................................................. ...................

x

y

1

1y

x

u

t

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ...............................

.............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..........................................................................................................................................................................................................................................................................................................................................................................................................

......................................................................................................................................................................................................................................... ...................

1

1

....................................

....................................

....................................

....................................

..........................................................

.......

......................

.......

......................

.......

......................

.......

......................

.......

..................

..................

..................

..................

..................

..................

..................

..................

.............................

....

...............

...............

...............

...............

...............

...............

...............

...............

Offenbar liegen aufeinander :

− verschobene Vektoren zur Herstellung von u aus x , y

− Hilfslinien zum Ablesen der Koordinaten von u

− ( gemeint ist vereinbarungsgemäß die Vektorspitze )

→ Daher stimmen überein :

− Koeffizienten der Linearkombination

− Koordinaten im x -y -System

1.5 QM1_18 347

Ermittlung von Koeffizienten einer Linearkombination

Gegeben ( graphisch ) : Linearkombination u von x , y

− Ferner : Maßstab

? Koeffizienten der Linearkombination ?

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5

....................................................................................

....................................................................................

................................................

.................................................................................................................................................................. ...................

............................................................................................................................................................................................................................................................................................................................................

................................................................................................................................................................. ...................

x

y

1

1y

x

u

t

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ...............................

.............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

......

......

......

......

......

......

......

......

......

......

......

.........

......

......

......

......

......

......

...

1

1

....................................

....................................

....................................

....................................

..........................................................

.......

......................

.......

......................

.......

......................

.......

......................

.......

..................

..................

..................

..................

..................

..................

..................

..................

.............................

....

...............

...............

...............

...............

...............

...............

...............

...............

→ Lösung : Ablesen der Koordinaten !

? Wie Koordinaten (x , y ) ablesen ohne ‚ Ticks ‘ ?

Ermitteln in absoluten Einheiten (→ ax , ay )

B Ggf. Vorzeichen beachten !

Wegen ax = x ‖x‖ , ay = y ‖y‖ :

→ Koordinaten : x = ax / ‖x‖ , y = ay / ‖y‖

? Hier : ax = 3 , ‖x‖ = 2 , ay = 5 , ‖y‖ = 2.5

1.5 QM1_18 348

→ Vektorrepräsentation

♣ Gegeben sind endlich viele Variablen X1 , . . . , Xk

• Es ist möglich , die Variablen durch Vektoren x1 , . . . , xk so zurepräsentieren , dass

‖xi‖ = SXifür alle i

cos (∠ (xi , xj )) = rXi , Xjfür alle i , j

Vektornamen : Variablennamen fett und klein (X ↔ x )

Sind diese Bedingungen erfüllt , so sprechen wir von einer(Vektor- ) Repräsentation ( der Variablen X1 , . . . , Xk durchdie Vektoren x1 , . . . , xk )

B Zweite Bedingung aufgelöst :

∠ (xi , xj ) = arccos ( rXi , Xj)

? Beispiel : Gegeben sind X , Y mit

− SX = 4 , SY = 2 , rX ,Y = .5

arccos ( .5 ) = 60

→ Mögliche Repräsentation

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5................................................................................................................................................................................................................................................................................................................ ........................................................................................................................................................................................................

x

y

t ............................................................

............... 60

1.5 QM1_18 349

? ( Bekanntes ) Beispiel mit drei Variablen

? Kovarianzmatrix von X1, X2, Y : 4 −2 6

−2 9 5

6 5 25

− Mittelwerte : MX1

= 4 , MX2= 1 , MY = 3

− ( hier uninteressant )

Korrelationsmatrix von X1, X2, Y : 1 −1/3 3/5

−1/3 1 1/3

3/5 1/3 1

Winkel ( gerundet ) für die Repräsentation :

− arccos (−.333 ) = 109

− arccos ( .6 ) = 53

− arccos ( .333 ) = 71

→ Repräsentation durch x1 , x2 , y

− Längen : ‖x1‖ = 2 , ‖x2‖ = 3 , ‖y‖ = 5

− Winkel :

− ∠ (x1 , x2 ) = 109

− ∠ (x1 , y ) = 53

− ∠ (x2 , y ) = 71

1.5 QM1_18 350

Vektorrepräsentation – Anmerkungen

Repräsentation kurz :

Variablen ↔ VektorenStreuungen ↔ LängenKorrelationen ↔ Winkel ( via cos )

4 Je mehr Variablen , um so mehr ‚ Dimensionen ‘ sind nötig

? Eindeutigkeit ?

− Verschiedene Variablen ↔ verschiedene Vektoren ?

→ Nein !

• x = y genau dann wenn X = Y + c ( c : Konstante )

on X = Y + c ⇔ rX,Y = 1 , SX = SY

⇔ ∠ (x , y ) = 0 , ‖x‖ = ‖y‖

⇔ x = y

4 ( Stimmt analog auch falls Streuungen 0 sind )

→ Eindeutigkeit der Repräsentanten : bis auf additive Konstanten

B Additive Konstanten ‚ gehen verloren ‘

1.5 QM1_18 351

→ Anwendung : Abschätzung von Korrelationen

♣ Gegeben : Variablen X , Y , Z

− rX,Y = .5 , rY, Z = .8

? rX,Z = ?

− Kann man Grenzen angeben ?

→ Betrachte Vektorrepräsentation durch x , y , z !

arccos ( .5 ) = 60 , arccos ( .8 ) = 37 ( etwa )

∠ (x , y ) = 60 , ∠ (y , z ) = 37

? Was kann man über ∠ (x , z ) sagen ?

→ Geometrische Einsicht : ∠ (x , z ) wird minimal / maximal ,

− falls x , y , z in einer Ebene liegen

→ Richtungen von x , y und ‚ Extremrichtungen ‘ für z

.......................................................................................................................................................................................................................................................................................................................................................................

....................................................................................................................................................................................................................................................................................................................................................

...................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.........................

...................

..........................................................................................

..........................................................................................

..........................................................................................

.........................................................................................

60

37

37

x

y

z1

z2

t..........

........................

..............................................................................

....................

.......................

..............................

......................................

.......

........................................................................................................

Maximaler / minimaler ∠ (x , z ) : 97 / 23

→ Minimales / maximales rX,Z : −.12 / .92 ( etwa )

1.5 QM1_18 352

Vektorrepräsentation – Erweiterung

♣ Gegeben : Repräsentation von X1 , . . . , Xk durch x1 , . . . , xk

→ Ziel : Erweiterung auf Linearkombinationen

Repräsentiere Linearkombination der Variablen

− durch ‚ entsprechende ‘ Linearkombination der Vektoren

♦ Genauer :

− Repräsentiere U =∑aiXi + b durch u =

∑ai xi

4 Additive Konstante b bleibt unberücksichtigt

Nun sind auch alle Linearkombinationen der Xi ‚ repräsentiert ‘

Ergebnis : Erweiterte Repräsentation

? Bleiben Eigenschaften erhalten ?

→ Ja ! Zusätzlich werden Linearkombinationen respektiert

1.5 QM1_18 353

Vektorrepräsentation – Erweiterung

• Für die erweiterte Repräsentationen der Linearkombinationen U

der Variablen Xi durch Vektoren u gilt

‖u‖ = SU für alle U

cos (∠ (u1 , u2 )) = rU1 , U2für alle U1 , U2

Ist ferner V =∑ai Ui + b eine Linearkombination der U , so

wird V repräsentiert durch∑ai ui

4 V ist hier auch Linearkombination der Xi also ‚ ein U ‘

Erweiterte Repräsentation der Linearkombinationen kurz :

Variablen ↔ VektorenStreuungen ↔ LängenKorrelationen ↔ Winkel ( via cos )Linearkombinationen ↔ entsprechende Linearkombinationen

B Bei Linearkombinationen :

− Links : Linearkombinationen von Variablen

− Rechts : Linearkombinationen von Vektoren

− Koeffizienten bleiben gleich

− Additive Konstante bleibt rechts unberücksichtigt

4 Wegen cos ( 90 ) = 0 :

− unkorreliert ↔ orthogonal

1.5 QM1_18 354

? Ein Beispiel

♣ Gegeben sind Variablen X , Y mit

− SX = 4 , SY = 3 , rXY = −.75

→ Interessant seien nun Linearkombinationen :

− U = 2X + Y + 3 , V = X − Y − 7

? Streuungen und Korrelation von U , V ?

Rechnung : Kovarianzmatrix von U , V :(37 32

32 43

)

→ SU = 6.08 , SV = 6.56 , rUV = .80

→ Graphische Lösung : ( arccos (−.75 ) = 139 )

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5

tx 2x

y

−y

u

v

................................................................................................................................................................................................................................................................................................................ .........................................................................................

......................................................................

......................................................................

..........................................

............................................................................................................................................

............................................................................................................................................

............................................................................................................................................

................................ ...................

...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ...................

...................................................................................................................... ................................................... ....

→ ∠ (u , v ) = 37 , cos ( 37 ) = .80 – klappt !

1.5 QM1_18 355

→ Graphische Ermittlung der Korrelation

♣ Situation : u und v repräsentieren Variable U , V

u

v

.................................................................................................................................................................................................................................................................................................................................................... ...................

.............................................................................................................................................................................................................................................................................................. ........................................................................................

? rUV = ?

→ Winkel α messen , rUV = cos (α )

? Hier : α = 37 , cos ( 37 ) = .8 ( etwa )

→ Alternative : Lot fällen

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5

u

v

.................................................................................................................................................................................................................................................................................................................................................... ...................

.............................................................................................................................................................................................................................................................................................. ...................

.................................................................................................................................................................

.....................................................................

Lotfußpunkt in absoluten Koordinaten ( auf u - Achse ) : l

l = ‖v‖ cos (α )

→ rUV = cos (α ) = l / ‖v‖

? Hier : rUV = 3 / 3.75 = .8 – passt !

B Bei α > 90 sind cos (α ) und l negativ

1.5 QM1_18 356

→ Einfache lineare Regression in Vektorrepräsentation

♣ Gegeben X , Y mit SX = 4 , SY = 2 , rXY = .5

→ Ziel : Regression von Y auf X

− Interessant sei nur das Gewicht b

→ Rechnung : b = r SY / SX = .5 · 2 / 4 = .25

→ Ziel nun : Graphische Lösung

− ohne bisheriges Wissen zur rechnerischen Lösung

Graphische Darstellung ( arccos ( .5 ) = 60 )

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5 tx

y

................................................................................................................................................................................................................................................................................................................ ........................................................................................................................................................................................................

Mögliche Vorhersagen :

− Lineare Transformationen Y = bX + a von X

Gesucht : b der optimalen Vorhersage ( a hier irrelevant )

Vorhersage ist optimal , wenn SE minimal ist

− (E = Y − Y )

1.5 QM1_18 357

Optimale Vorhersage graphisch

→ Gesucht : Vorhersage Y mit kleinstem SE

Mögliche Vorhersagen graphisch : Vielfache von x

− Also : die durch x aufgespannte Gerade : g

4 Genauer : Die Vektorspitzen der möglichen Vorhersagen bildendie durch x aufgespannte Gerade

Wir benutzen weiter die griffigere Sprechweise

? Eine mögliche Vorhersage : Y = .5X + a

Graphisch samt zugehörigem Fehler :

tx

ye

y g........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................ ..............................................

..........................................................................................................................................................

.....................................................................................................................................................................................

.................................................................................................................................................................. ................... .....................................................................................................................................................................................

Diese Vorhersage ist sicher nicht optimal

Bei der optimalen Vorhersage muss e⊥ g gelten

→ Optimale Vorhersage also durch Lotfällen

tx

ye

y g........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................ ..............................................

..........................................................................................................................................................

.......................

.......................

.......................

.......................

.......................

...............................................

........................................................................................... ................... ...............................................................................................................................................

...................

1.5 QM1_18 358

Optimale Vorhersage graphisch

Optimale Vorhersage durch Lotfällen

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5 tx

ye

y g.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ..............................................

..........................................................................................................................................................

.......................

.......................

.......................

.......................

.......................

...............................................

........................................................................................... ................... ...............................................................................................................................................

...................

Kontrolle :

− ‖ y‖ = 1 , ‖x‖ = 4

→ Achsenkoordinate b von y : 1 / 4 = .25 – stimmt !

B Achsenkoordinate : Bzgl. x-Koordinatensystem auf g

4 ( Eigentlich : Koordinate der Spitze von y . . . )

→ Konstruktion von e :

− Offenbar Lotfällen von y auf Gerade h⊥ g durch Nullpunkt

tx

ye

y g

h

..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....

........................................................................

................................................................................................................................................................................................................................................................................................................ ........................................................................................................................................................................................................

.......................

.......................

.......................

.......................

.......................

...............................................

........................................................................................... ...................

4 Ganz genau : h ist ⊥ g in der x -y - Ebene

1.5 QM1_18 359

→ Kontrolle ( theoretisch )

♣ Allgemeine Situation

tx

ye

y g

α..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ..............................................

.................................................................................................................................................................................................................................

.......................

.......................

.......................

.......................

.......................

.......................

.......................

.......................

.......................................

.............................................................................................................................. ................... ............................................................................................................................................................................................................

...................

.......

.......

..................................................

....

cos (α ) = rXY

Lotfußpunkt ( absolute Koordinaten ) : ‖y‖ cos (α )

Lotfußpunkt in x - Koordinaten : ‖y‖ cos (α ) / ‖x‖

Wegen Repräsentationseigenschaften :

‖y‖ cos (α ) / ‖x‖ = SY rXY / SX = rXY (SY /SX) = b

→ Kommt hin !

? Alles in Ordnung auch bei negativem rXY ?

tx

y e

y g................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ..............................................

..........................................................................................................................................................

.......................

.......................

.......................

.......................

.......................

...............................................

.............................................................................................................................................................................................................................................................

...................

→ Ja ; cos , Koordinaten und Regressionsgewicht jetzt negativ

1.5 QM1_18 360

Anmerkungen zur linearen Regression

Fehlerstreuung im Beispiel ?

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5 tx

ye

y g.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................. ..............................................

..........................................................................................................................................................

.......................

.......................

.......................

.......................

.......................

...............................................

........................................................................................... ................... ...............................................................................................................................................

...................

Ausmessen liefert : ‖e‖ = 1.7 ( etwa )

Rechnung : SE = SY

√1− r2 = 2

√1− .25 = 1.73

→ Stimmt !

4 Analog : SY (Messen und Rechnen ergeben beide 1 )

Betrachte rechtwinkliges Dreieck (mit Seitenlängen ) :

tx

ye

y

.................................................................................................................................................................................................................................................................................................................................................... ...............................................................................................................................................................................................................................................................................

.......................

.......................

.......................

.......................

.......................

.......................

.......................

.......................

.......................................

.............................................................................................................................. ................... ............................................................................................................................................................................................................

...................

‖y‖ ‖e‖

‖ y‖..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

Pythagoras : ‖y‖2 = ‖ y‖2 + ‖e‖2

Übersetzt ( Eigenschaften der Repräsentation ) :

S2Y = S2

Y+ S2

E – Varianzzerlegung !

→ Also : Varianzzerlegung ↔ Pythagoras

1.5 QM1_18 361

→ Multiple lineare Regression in Vektorrepräsentation

♣ Gegeben : Prädiktoren X1 , X2 , Kriterium Y

− Bekannt : Kovarianzmatrix von X1 , X2 , Y

→ Ziel : Regression von Y auf X1 , X2

− Wieder sind nur die Gewichte interessant

→ Problem soll mit Repräsentation erneut gelöst werden

− Also : Fehlerstreuung soll minimiert werden

Vektorrepräsentation einer solchen Situation :

x1

x2

y

U.........................................................................................................................................................................................................................................................................................................................................................................

......................................................................................

......................................................................................

......................................................................................

......................................................................................

......................................................................................

......................

.........................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

..................................

.............

..............................................................................................................................................................................................................................................................................................................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

......

........................................................................................

........................................................................................

........................................................................................

...........................................................................................................

................................................................................................... ...................

................................................................................................................................................................. ...................

Mit eingezeichnet : U : von x1 , x2 aufgespannte Ebene

Die Punkte von U sind die Linearkombinationen von x1 , x2

Sie repräsentieren also die möglichen Vorhersagen

Abstand eines Punktes aus U zu y

− ist Fehlerstreuung der zugehörigen Vorhersage

→ Minimale Fehlerstreuung bei minimalem Abstand

→ Lösung wieder durch Lotfällen

1.5 QM1_18 362

→ Lösung des Regressionsproblems durch Lotfällen

x1

x2

y

y

e

U.........................................................................................................................................................................................................................................................................................................................................................................

......................................................................................

......................................................................................

......................................................................................

......................................................................................

......................................................................................

......................

.........................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..................................

..................................

..................................

..................................

..................................

..................................

.............................

..................................

..................................

...

..............................................................................................................................................................................................................................................................................................................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

......

........................................................................................

........................................................................................

........................................................................................

...........................................................................................................

................................................................................................... ...................

................................................................................................................................................................. ...................

............................................................................................................................................................................................................................................................................................................... ................... ..........................................................................................................................................................................................................................................

.............................

........

........

........

........

4 ( e ist hier passend zur Addition Y = Y + E dargestellt )

Koordinaten von y im x1 -x2 -System

− sind Gewichte der optimalen Vorhersage

→ Damit sind die gesuchten Gewichte gefunden

4 Lösung also durch Lotfällen

− ‚ normal ‘ bedeutet manchmal ‚ senkrecht ‘

Daher der Name ‚ Normalengleichungen ‘

4 Das Dreieck aus y , y , e ist rechtwinklig

Wieder : Pythagoras :

‖y‖2 = ‖ y‖2 + ‖e‖2

Übersetzt mit Eigenschaften der Repräsentation :

S2Y = S2

Y+ S2

E

→ Also wieder : Varianzzerlegung ↔ Pythagoras

1.5 QM1_18 363

? Schon verwendetes Beispiel

? Kovarianzmatrix von X1, X2, Y : 4 −2 6

−2 9 5

6 5 25

→ Rechnung lieferte : b1 = 2 , b2 = 1 , β1 = .8 , β2 = .6

− Determinationskoeffizient : R2 = .68

− Korrelationen waren : rX1X2= −.33 , rX1Y = .6 , rX2Y = .33

→ Vektorrepräsentation durch x1 , x2 , y mit

− ‖x1‖ = 2 , ‖x2‖ = 3 , ‖y‖ = 5

− ∠ (x1 , x2 ) = 109 , ∠ (x1 , y ) = 53 , ∠ (x2 , y ) = 71

Perspektivische Darstellung :

x1

x2

y

y

e

U.........................................................................................................................................................................................................................................................................................................................................................................

......................................................................................

......................................................................................

......................................................................................

......................................................................................

......................................................................................

......................

.........................................................................................................................................................................................................................................................................................................................................................................................................................................................................

..................................

..................................

..................................

..................................

..................................

..................................

.............................

..................................

..................................

...

..............................................................................................................................................................................................................................................................................................................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

............................................

......

........................................................................................

........................................................................................

........................................................................................

...........................................................................................................

................................................................................................... ...................

................................................................................................................................................................. ...................

............................................................................................................................................................................................................................................................................................................... ................... ..........................................................................................................................................................................................................................................

.............................

........

........

........

........

→ Passt !

1.5 QM1_18 364

Beispiel , Fortsetzung

Die x1 -x2 - Ebene

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5.................................................................................................................................................................. ...................

x1............................................................................................................................................................................................................................................................

x2

............................................................................................................................................................................................................................................................................................................................................y

..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.........................................................................................................................................................................................................................................................................................................................................................................................................

......................................................................................................................................................................................................................

.............................................................................................................................................................................................................................................................................................

4 y befindet sich senkrecht über y

− senkrecht : Zur Zeichenoberfläche

Koordinatenablesen an Endpunkten der Achsenabschnitte :

− absolut : 4 (x1 ) , 3 (x2 )

Wegen ‖x1‖ = 2 , ‖x2‖ = 3 :

− Achsenkoordinaten : 4 / 2 = 2 (x1 ) , 3 / 3 = 1 (x2 )

→ In der Tat : die Gewichte b1 , b2

Die absoluten Koordinaten ( ai ) sind

ai = bi ‖xi‖ = bi SXi= ( biSXi

/SY )SY = βi SY = βi ‖y‖

→ βi = ai / SY = ai / ‖y‖

B β-Gewichte sind also absolute Koordinaten

− bis auf Faktor SY = ‖y‖

? Hier (SY = 5 ) : β1 = 4/5 = .8 , β2 = 3/5 = .6 – stimmt !

1.5 QM1_18 365

Beispiel , Fortsetzung

Jetzt Lote von y auf die Achsen fällen :

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5.................................................................................................................................................................. ...................

x1............................................................................................................................................................................................................................................................

x2

............................................................................................................................................................................................................................................................................................................................................

y

.............................................................................................................................................................................................................................................................................

............................................................................................................................................................................................................................................................................................................................

...............................................................................

...........................................

.........................................................

Erinnerung : Lotfällen von y auf eine Achse

− Zwei Möglichkeiten : Direkt oder

− Lot auf U (→ y ) dann Lot von y auf Achse

Die Lotfußpunkte in der Zeichnung hätte man auch erhalten ,

− wenn man direkt von y Lote auf die Achsen gefällt hätte

→ Die Lotfußpunkte liefern die Vorhersagen mit jeweils einem xi

− also die von einfachen linearen Regressionen mit einem Prädiktor

→ Möglicher Vergleich einfacher und multipler Regressionen

1.5 QM1_18 366

Multiple und einfache Regressionen

Multiple und einfache Regressionen im Bild :

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5.................................................................................................................................................................. ...................

x1

............................................................................................................................................................................................................................................................

x2

............................................................................................................................................................................................................................................................................................................................................

y

......................................................................................................................................................................................................................................... ...................y1

.............................................................................................................................................................

y2

......................................................

........................................................................................................................................................................................................................

...........................................

.........................................................

Y1 , Y2 : Vorhersagen von Y durch X1 , X2

− y1 , y2 : Repräsentierende Vektoren

Bei einfachen linearen Regressionen liefern Lotfußpunkte

− in Achsenkoordinaten : Regressionsgewichte

− in absoluten Koordinaten : r SY = β SY

− bis auf Faktor SY = ‖y‖ also r = β

? Im Beispiel sind die Lotfußpunkte

− in absoluten Koordinaten : 3 (x1 ) , 1.66 (x2 )

− in Achsenkoordinaten : 3/2 = 1.5 (x1 ) , 1.66/3 = .55 (x2 )

− Das waren in der Tat die Regressionsgewichte

Absolute Koordinaten durch SY = ‖y‖ = 5 :

− 3/5 = .6 (x1 ) , 1.66/5 = .33 (x2 )

− Das waren in der Tat die Korrelationen

1.5 QM1_18 367

→ Vergleich einfache – multiple Regression

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5.................................................................................................................................................................. ...................

x1............................................................................................................................................................................................................................................................

x2

............................................................................................................................................................................................................................................................................................................................................

y

.............................................................................................................................................................................................................................................................................

..........................................................................................................................................................................................................

......................................................................................................................................................................................................................

.............................................................................................................................................................................................................................................................................................

..................................................................................................................

...............................................................................

→ ‚ Optische ‘ Vergleiche sind möglich

− hinsichtlich einfacher Regressionen und multipler Regression

− über Koordinatenlinien und Lote

Achsenkoordinaten liefern

− über Koordinatenlinien Gewichte der multiplen Regression

− über Lote Gewichte bei einfachen Regressionen

Absolute Koordinaten liefern

B bis auf gemeinsamen ( ! ) Faktor SY = ‖y‖

− über Koordinatenlinien β-Gewichte der multiplen Regression

− über Lote Korrelationen mit den Prädiktoren

→ Möglicher ‚ optischer ‘ Vergleich β-Gewichte ↔ Korrelationen

− was Größenverhältnisse angeht

− Faktor SY = ‖y‖ ist ja überall gleich

1.5 QM1_18 368

→ Varianzaufklärung

→ Vergleich Varianzaufklärung einfache – multiple Regressionen

− Änderung der Varianzaufklärung

− bei Hinzufügen oder Wegnehmen von Prädiktoren

....................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

..................................................................................

................................................................................................

0 1 5.................................................................................................................................................................. ...................

x1

............................................................................................................................................................................................................................................................

x2

............................................................................................................................................................................................................................................................................................................................................

y

......................................................................................................................................................................................................................................... ...................y1

.............................................................................................................................................................

y2

......................................................

........................................................................................................................................................................................................................

Determinationskoeffizient ist jeweils S2Y/ S2

Y

Determinationskoeffizienten einfache Regressionen :

− S2Y1/ S2

Y = ‖ y1‖2/‖y‖2 = 32/52 = .36

− S2Y2/ S2

Y = ‖ y2‖2/‖y‖2 = 1.662/52 = .11

Determinationskoeffizient multiple Regression :

− S2Y/ S2

Y = ‖ y‖2/‖y‖2 = 4.12/52 = .67

4 (Hinreichende ) Übereinstimmung mit früheren Rechnungen

B Gemeinsamer Nenner S2Y = ‖y‖2

→ Varianzaufklärungen verhalten sich wie ‖ y1‖2 : ‖ y2‖

2 : ‖ y‖2

1.5 QM1_18 369

→ Partialkorrelation

Gegeben nun Variable X , Y , Z

→ Z soll auspartialisiert werden

→ Verfahren : Korrelation der Residuen

→ Ziel : Veranschaulichung durch Vektorrepräsentation

Erinnerung an Konstruktion des Residuums in Repräsentation :

− Hier wird X durch Z vorhergesagt (Residuum : X )

tz

xx

x

..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

.......

....

........................................................................

................................................................................................................................................................................................................................................................................................................ ........................................................................................................................................................................................................

.......................

.......................

.......................

.......................

.......................

...............................................

........................................................................................... ...................

→ Senkrechte Projektion von x auf Gerade ⊥ z

Analog für Y ↔ y

Zusammen :

− x und y werden senkrecht projiziert

− Auf die Ebene ⊥ z

→ Partialkorrelation über Winkel zwischen projizierten Vektoren

4 Projektion auf Ebene , da Situation jetzt dreidimensional

1.5 QM1_18 370

Partialkorrelation

? Beispiel : Kovarianzmatrix von X , Y , Z : 4 −2 6

−2 9 5

6 5 25

Bekanntes Beispiel , nur Variablen umbenannt

− X1 → X , X2 → Y , Y → Z

→ Vektorrepräsentation durch x , y , z mit

− ∠ (x , y ) = 109 , ∠ (x , z ) = 53 , ∠ (y , z ) = 71

................................................................................

....................................................................................

....................................................................................................................................................................

....................................................... ...........................................................................................................................................................................................................................................................................................................................................................................................................

............................................................................................................................................. ................................................................................................................................................................................................................... ...................

z

x

x

y

y

....................................................................................

......................................................................

.........................................................................................

..............................................................................................

..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

....................................................................................................................

....................................................................................................................

............................................................

................................

................................

...........................

...................

................................

.........

x und y werden senkrecht auf Ebene ⊥ z projiziert

− Ergebnis : x , y

→ Winkel zwischen x , y liefert Partialkorrelation

? Im Beispiel sollte ∠ ( x , y ) etwa 134 sein

→ Kosinus davon : etwa −.7 – passt !

1.5 QM1_18 371