28
Statistik : Prof. Dr. Jan Kirenz Variablen und Skalenniveaus Photo Credit: Unsplash, Roman Mager Analytics Grundlagen

Analytics Basics: Variablen und Skalenniveau

Embed Size (px)

Citation preview

Page 1: Analytics Basics: Variablen und Skalenniveau

Statistik

: Prof. Dr. Jan Kirenz

Variablen und Skalenniveaus

Photo Credit: Unsplash, Roman Mager

Analytics Grundlagen

Page 2: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Was ist eigentlich eine Variable?

In der Datenanalyse wird häufig die Bezeichnung Variable verwendet.

Variable

Der Begriff „Variable“ bedeutet dasselbe wie Merkmal.

Page 3: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Was ist ein Merkmal?

Merkmale sind bestimmte Informationen (z.B. Alter, Interessen,…) über Personen, die Teil einer Personengruppe (Grundgesamtheit) sind, über die man mehr erfahren möchte.

Merkmal

Unter Grundgesamtheit versteht man die Gesamtmenge aller Personen, über die eine Aussage getroffen werden soll (also die gesamte Zielgruppe).

Page 4: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Grundgesamtheit

Tools zur Bestimmung der Grundgesamtheit

Verbraucheranalyse (VA)https://online.mds6.de/mdso6/b4p.php

Facebook Werbeplaner (enthält nur Personen, die bei FB sind)https://www.facebook.com/business/products/ads

Gruner und Jahr Zählservice guj.zaehlservice.de/perl/index.pl

Übersicht über verschiedene Zielgruppenmodellewww.verbraucheranalyse.de/publikationen/zielgruppenmodelle

Page 5: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Bei einer Befragung ist ein Merkmal einfach eine gestellte Frage in einem Fragebogen (z.B. Alter, Geschlecht, Nutzung digitaler Medien,…)..

Was bedeutet Ausprägung?

MerkmalsausprägungPhoto Credit: Unsplash, Helloquence

Page 6: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Merkmale haben unterschiedliche Ausprägungen.

Was bedeutet Ausprägung?

Merkmalsausprägung

Das Merkmal „Haarfarbe“ kann beispielsweise die Ausprägungen „braun, brünett, …“ haben.

Photo Credit: Unsplash, Helloquence

Page 7: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Welche Berechnungen mit Variablen durchgeführt werden können, hängt von deren Skalenniveau ab.

Variablen haben Skalenniveaus

Jede Variable hat ein sogenanntes Skalenniveau. Üblicherweise unterscheidet man zwischen 4 verschiedene Skalenniveaus:

1. Nominal 2. Ordinal3. Intervall4. Verhältnis

Skalenniveau

Page 8: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Skalenniveaus: Beispielhafte Fragen

Nominal

Page 9: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Skalenniveaus

Eine Variable ist nominalskaliert, wenn die möglichen Ausprägungen nur benannt werden können (sie haben eine „Identität“).

Nominal

„sind die Ausprägungen gleich oder unterschiedlich?“

Page 10: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Skalenniveaus

Es ist nicht möglich, die Werte in einer Rangfolge zu bringen.

D.h. die Ausprägungen können nicht „sortiert“ werden (z.B. von klein nach groß).

Nominal

„sind die Ausprägungen gleich oder unterschiedlich?“

Page 11: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Skalenniveaus

NominalMit nominalskalierten Daten lassen sich keine Rechenoperationen (Addition, usw.) durchführen, sondern nur Aussagen über Häufigkeiten machen (z.B. wie viele Personen sind weiblich oder männlich?).Beispiele: Geschlecht, Haarfarbe, Augenfarbe, Nationalität, Geburtstort, Telefonnummer,…

Page 12: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Skalenniveaus: Beispielhafte Fragen

Ordinal

Page 13: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Eine Variable ist ordinalskaliert, wenn die möglichen Ausprägungen in eine Rangfolgegebracht werden können.

„ist eine Ausprägung gleich, kleiner oder größer als eine andere?“

Skalenniveaus

Ordinal

Page 14: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Die Abstände zwischen den Werten sind jedoch ohne Aussagekraft.

D.h. es kann nicht bestimmt werden, wieviel besser/schlechter eine Ausprägung im Vergleich zu einer anderen ist.

„ist eine Ausprägung gleich, kleiner oder größer als eine andere?“

Skalenniveaus

Ordinal

Page 15: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Werte können sortiert werden. Es können keine Rechenoperationen durchgeführt werden (z.B. Addition und Subtraktion).

Beispiele: Schulnoten, Markenpräferenzen, Einstellungen,…

Skalenniveaus

Ordinal

Page 16: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Eine Intervallskala ist eine sinnvolle Rangordnung von Ausprägungen mit gleichen Abständen zwischen den Werten.

„wie groß ist die Differenz zwischen Ausprägungen?“

Skalenniveaus

Intervall

Page 17: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Es gibt jedoch keinen „natürlichen" Nullpunkt.

D.h. der Nullpunkt ist willkürlich gesetzt (oftmals gibt es auch negative Werte).

„wie groß ist die Differenz zwischen Ausprägungen?“

Skalenniveaus

Intervall

Page 18: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Es können zwar Angaben zur Größe von Unterschieden gemacht werden (zwischen 10 und 20 Grad Celsius beträgt der Unterschied 10 Grad), nicht jedoch zu Verhältnissen: 20 Grad Celsius ist nicht (physikalisch) doppelt so warm wie 10 Grad.

Beispiele: Geburtsjahr, Raumtemperatur in Celsius

Skalenniveaus

Intervall

Page 19: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Eine Verhältnisskala ist eine sinnvolle Ordnungvon Messwerten mit gleichen Abständen.

„wie ist das Verhältnis zwischen Ausprägungen?“

Skalenniveaus

Verhältnis

Page 20: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Der Nullpunkt ist natürlich.

Eine Ausprägung von 0 bedeutet daher, dass der Messwert nicht vorhanden ist. Es existieren keine negativen Werte.

Skalenniveaus

Verhältnis

„wie ist das Verhältnis zwischen Ausprägungen?“

Page 21: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Es können Aussagen über Verhältnissegetroffen werden.

Beispielsweise ist eine 20 Jahre alte Person doppelt so alt wie eine 10 jährige Person.

Beispiele: Alter, Körpergröße, Mediennutzung in Minuten.

Skalenniveaus

Verhältnis

Page 22: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Page 23: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Übersicht über die SkalenniveausSkalenniveau

Skalenniveau Operationen Interpretation Beispiele

Nominalskala =/≠ gleich oder ungleich

Geschlecht (Mann/Frau)

Ordinalskala =/≠; </> kleiner, gleich oder größer

Schulnoten (sehr gut, gut, …)

Intervallskala =/≠; </>; +/− Bildung von Differenzen

Temperatur (Celsius)

Verhältnisskala =/≠; </>; +/−; ×/÷

Aussagen zu Verhältnissen

Alter (Jahre), Körpergröße (cm)

Page 24: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Informationsgehalt

Nicht metrische Daten Metrische Daten

Messniveau Nominalniveau Ordinalniveau Intervallniveau Verhältnis-/ Relationsniveau

Beschreibung der Messwert-eigenschaften

Bestimmung von Gleichheit und Ungleichheit (z.B: A≠B)

Zusätzlich: Bestimmung

einer Rangfolge (z.B. A<B)

Zusätzlich: Gleiche Intervalle

zwischen den Messwerten und

willkürlicher Nullpunkt

(z.B. (10-5)∼ (15-10))

Zusätzlich: Bestimmung von Verhältnissen und

natürlicher Nullpunkt

(z.B. (A÷B) ∼(A=2B)

IdentitätRang

AbstandVerhältnis

x xx

xxx

xxxx

Beispiele für Variablen

Geschlecht, Wochentag,…

Schulnoten, Präferenzen,…

Temperatur, Kalenderzeit,…

Gewicht, Alter, Umsatz,…

Page 25: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

In einer Umfrage wurden 15 Personen nach ihrem Familienstand befragt

Beispiel

Variable bzw. Merkmal = Familienstand

Ausprägung = ledig, verheiratet, geschieden, verwitwet.

Skalenniveaus

Photo Credit: Unsplash, Helloquence

Page 26: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Welches Skalenniveau hat die Variable „Familienstand“?

Frage: Skalenniveau

Folgende Informationen haben wir durch die Befragung erhalten:

Ausprägung = 8 ledig, 4 verheiratet, 2 geschieden, 1 verwitwet.

Photo Credit: Unsplash, Roman Mager

Page 27: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Antwort: Skalenniveau = Nominal.

Merkmalsausprägung Häufigkeit

Verheiratet 4

Ledig 8

Geschieden 2

Verwitwet 1

Frage: Skalenniveau

Page 28: Analytics Basics: Variablen und Skalenniveau

Prof. Dr. Jan Kirenz

Wiederholungsfragen

l In einem Fragebogen wurden die unten aufgeführten Merkmale erhoben. Bitte geben Sie jeweils das entsprechende Skalenniveau pro Merkmal an:

1. Körpergröße : _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

2. Alter: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

3. Geschlecht: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

4. Note in dem Fach Sport: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

5. Punkte (0-100) in der letzten Deutsch-Prüfung: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

6. Nationalität: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

7. Telefonnummer: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

8. Studiengang: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

9. monatliche Miete in Euro: _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

10. Entfernung zwischen Wohnung und Arbeitsstätte (in Meter): _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

28