Datentabelle für 2 Merkmale. Kontingenztafel der absoluten Häufigkeiten X Y

Preview:

Citation preview

Datentabelle für 2 Merkmale

Kontingenztafel der absoluten Häufigkeiten

XY

Kontingenztafel der relativen Häufigkeiten

XY

X: Art des Betriebes 1 = Handelsbetriebe2 = Freie Berufe (Leistungsbetriebe)3 = Fertigungsbetriebe

Y: Art der hinterzogenen Steuer1 = Lohnsteuer2 = Einkommenssteuer3 = Umsatzsteuer4 = Sonstiges

Betriebe und hinterzogene SteuerKontingenztabelle

Kontingenztafel Streudiagramm

Korrelationsrechnung

G. Gelbrich: Statistik für Anwender. Shaker

Kovarianz

Merkmal

Datensatz

Merkmal

Datensatz

Korrelationskoeffizientnach Bravais-Pearson

Eigenschaften

X und Y unabhängig

X größer Y größer

X größer Y kleiner

Positiver strikter Zusammenhang

Negativer strikter Zusammenhang

Korrelationskoeffizientbei verschiedenen Konstellationen

von Ausprägungen

Korrelationskoeffizient: 0.905Korrelationskoeffizient: 1.00

Korrelationskoeffizient: 0.19Korrelationskoeffizient: 0.52

Korrelationskoeffizient: -0.14Korrelationskoeffizient: 0.00

Vorsicht beim Gebrauch des Korrelationskoeffizienten!

Fibonacci-Zahlen

Störche und Geburten

RegressionsrechnungLineare Regression

Datentabelle für 2 Merkmale

Mögliche Funktionenklassenfür die

Regressionsrechnung

Lineare FunktionenLineare Funktionen

Polynome

Exponentialfunktionen(Exponentielles Wachstum; x ist die Zeit)

Gompertz-Kurven

Logistische Funktionen

Approximation durch eine Gerade

Prinzip der kleinsten Quadrate(Kleinst-Quadrat-Schätzung)

Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrate minimiert wird:

Bestimme f, so dass

minimal !!

Aufgaben der Regressionsrechnung

Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die „Zukunft“extrapolieren. Man erstellt eine „Prognose“.Dazu bedient man sich der gefundenen Funktion f, um für eine „Zeit“ x der “Zukunft“ den Wert y = f(x)zu schätzen.

1. Extrapolation

2. Interpolation

Man interessiert sich für den Wert von y = f(x)für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachtetenWerten liegen:

Wieder bedient man sich der Funktion f, um eine Interpolation der Werte

durchzuführen.

Lineare RegressionFinde reelle Zahlen a und b,so dass der Wert von

minimal wird!

ihr Minimum annimmt!

Mit anderen Worten: Finde den „Punkt“ (a ,b), an dem die Funktion

Steigung der Regressionsgeraden

Schnitt der Regressionsgeraden mit der y-Achse bei

BestimmtheitsmaßMaß für die Güte der Anpassung der Daten an die Regressionsfunktion

Dabei ist

In einem Kaufhauskonzern mit 10 Filialen soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind:

X: Werbeausgaben in 1000 EuroY: Umsatzsteigerung in 10 000 Euro

Demonstrationsbeispiel Lineare Regression

Mittelwerte Varianzen

Kovarianz

Steigung der Regressionsgeraden

Schnitt der Regressionsgeraden mit der y-Achse bei

Recommended