L E I B N I Z - R E C H E N Z E N T R U M€¦ · Web viewDas heißt: die Signifikanz ist nur dann relevant—und darf auch nur dann inspiziert und berichtet werden—wenn der Mittelwert

Leibniz-Rechenzentrumder Bayerischen Akademie der Wissenschaften

SPSS für Windows

Eine Einführung

Dr. Michael Wiseman

10. Auflage, 1. Revision / Juli 2005

SPSS für Windows

Inhaltsverzeichnis

Einleitung..........................................................................................4Datenbestände für die Übungen und Beispiele.................................4

Teil 1: Handhabung der Bedienungsoberfläche.................................4Starten des Programms...................................................................4Der Dateneditor...............................................................................5

Dateneingabe........................................................................6Zugriff auf Dateien...............................................................11Datenmanipulation..............................................................14Datensicherung...................................................................17Mehr als ein Datensatz?.......................................................17Auswahl gezielter Untermengen der Fälle............................19

Steuerung der Statistik-Prozeduren: Überblick...............................21Das wissensbasierte Informationssystem von SPSS........................22Ausgabefenster und der Viewer.....................................................23

Mehrere Viewer-Fenster.......................................................24Werkzeuge im Viewer..........................................................24

OLAP (OnLine Analytic Processing): Interaktive Datenanalyse........25Pivot-Tabellen......................................................................26

Grafik 27Statische Grafik...................................................................28Profildiagramme..................................................................32Interaktive Grafik.................................................................35

Syntax-Fenster..............................................................................41Exportieren von SPSS-Ausgabe nach Word.....................................42Übungen zu Teil 1..........................................................................42

Teil 2: Anwendungsbeispiele...........................................................44Beschreibende Statistik.................................................................44

Häufigkeiten und Histogramme...........................................44Einfache beschreibende Statistik und Grafiken.....................45Verteilungsstatistiken und -darstellungen............................45Kreuztabellen: Untersuchung kategorialer Variablen............48

Prüfstatistik...................................................................................48Korrelation...........................................................................48Mittelwertvergleiche: T-Test.................................................51Mittelwertvergleiche: Einfaktorielle Varianzanalyse (ANOVA)53Nichtparametrische Vergleiche............................................54

Übungen zu Teil 2..........................................................................57

Anhang A: Beispielfragebögen........................................................58

Anhang B: Dokumentation..............................................................59

2

SPSS für Windows

3

SPSS für Windows

EinleitungZiel der vorliegenden Schrift ist es, eine kurze Einführung in die am häufigst benötigten Aspekte des Umgangs mit der deutschsprachigen Version des Programms SPSS unter Windows und weitestgehend auch unter Macintosh-Systeme ab OS 9 zu geben. Ausführliche Anleitungen zur gesamten Funktionalität des Programms finden Sie in der Originaldokumentation der Firma SPSS, die als zusätzliche CD zu unserer Lizenz mitgeliefert wird.

Das Programm SPSS für Windows enthält eine Fülle von Möglichkeiten, die in einer Schrift dieser Größe nicht angesprochen werden können.

Die vorliegende Schrift setzt gute Kenntnisse der Oberfläche von Windows voraus.

Datenbestände für die Übungen und BeispieleAlle Übungen und Beispiele dieser Schrift benutzen Datenbestände, die Sie entweder auf CD vom Benutzersekretariat des Leibniz-Rechenzentrums (LRZ) (Raum-Nr. S0502, Tel. (089) 289-28761) erhalten, oder aber über das Internet holen können:

Unter dem Begriff Datenbestände für die Übungen und Beispiele befinden sich alle in dieser Einführung angesprochenen Dateien: Klicken Sie mit der rechten Maustaste den gewünschten Dateinamen an, wählen Sie die Option Verknüpfung speichern unter ... und speichern Sie die gewählte Übungsdatei lokal ab.

Teil 1: Handhabung der BedienungsoberflächeStarten des ProgrammsSPSS kann durch Doppelklicken (mit der linken Maustaste) auf dem SPSS-Icon gestartet werden. Beim Starten des Programms erscheint folgendes Fenster, das verschiedene Möglichkeiten vor allem bezüglich des Zugriffs auf Daten anbietet:

Durch Anklicken des Feldes Dieses Dialogfeld nicht mehr anzeigen können Sie das künftige Erscheinen dieses Fensters permanent unterdrücken.

4

SPSS für Windows

Der DateneditorUnmittelbar nach dem Starten des Programms öffnet sich ein (leeres) Dateneditorfenster. Die oberste Zeile dieses Fensters beschreibt dessen Funktion (SPSS Daten-Editor) und enthält den Namen des Fensters: Hier Unbenannt, ein Hinweis darauf, dass das Fenster in Form einer Datei noch nicht gespeichert wurde:

Die zweite Zeile („Datei...Bearbeiten...Ansicht“ usw.) enthält die Hauptmenüleiste. Diese erlaubt es, wie bei anderen Windows-Anwendungen auch, verschiedene Funktionen des Programms zu aktivieren.

Die dritte Zeile enthält den fensterspezifischen Werkzeugkasten, der die schnelle Aktivierung häufig benötigter Dienste der Hauptmenüleiste im Kontext des Dateneditors realisieren lässt.

Der „Körper“ des Fensters enthält nummerierte Zeilen und mit der Überschrift var versehene Spalten. Jede Zeile entspricht einem Fall (Patient, befragte Person, …), jede Zeile einer Variablen (systolischer Blutdruck, Alter in Jahren, Geschlecht…)

Die leeren Zellen deuten an, dass noch keine Daten zur Verfügung stehen. (Wie SPSS Daten erhält, sehen wir später.)

Unten links im Datenfenster findet man zwei Reiter:

Diese erlauben es, entweder die eingetragenen Daten — hier noch keine, also das leere Datenfenster — oder die Variablendefinitionen, die wir später kennen lernen, zu besichtigen.

Das letzte allgemein gültige Element ist die Informationszeile, die Sie ganz unten im aktiven Fenster sehen:

Im Laufe dieser Einleitung lernen Sie weitere Felder dieser Zeile kennen.

Übung

Klicken Sie den Menüpunkt Datei: an! Es erscheint ein Fenster, das Ihnen verschiedene Möglichkeiten im Bereich der SPSS-Dateiverwaltung anbietet. Wie in Windows üblich, werden die aktuell benutzbaren Elemente durch eine dunklere Färbung gekennzeichnet: Ganz unten in diesem Fenster steht Ihnen z.B. die Möglichkeit zur Verfügung, SPSS zu verlassen (Beenden). Darüber steht eine Liste weiterer Funktionen, die man durch Anklicken sofort aktivieren kann:

5

SPSS für Windows

Klicken Sie Öffnen + Daten... an, so erscheint das übliche Windows-Datei-Manager-Fenster, das Ihnen erlaubt, eine Datei zu öffnen. Dieselbe Funktionalität ist über das übliche Öffnen-Werkzeug im Werkzeugkasten verfügbar.

Übung

Öffnen Sie die Datei data.sav!

Das Dateneditorfenster enthält die zu untersuchenden Daten und dient zur allgemeinen Datenverwaltung – Einlesen, Transformieren, Berechnung neuer Variablen und vieles andere mehr:

Unterhalb des schon besprochenen Werkzeugkastens befindet sich eine zweigeteilte Zeile, die Information zu dem aktiven Datenfeld gibt: Das Zelleneditorfeld enthält den Wert 57. Im Feld links davon steht 1:Bogen: Dieser Wert gehört zu dem 1. Fall des Datensatzes und zur Variablen Bogen. Im Datenteil des Fensters ist das entsprechende Feld markiert (schwarz umrandet).

Dateneingabe

Unternimmt man eine Studie, so beobachtet man pro Fall (Patient, Schüler usw.) verschiedene Variablen wie z.B. im obigen Datenfenster Geschlecht, Alter in Jahren, Englischnote usw. Jeder Fall liefert bestimmte Werte (Daten) zu diesen Variablen: Der erste Fall in diesem Beispiel lieferte den Fragebogen Nummer 57, besucht den Schultyp 1, ist 14 Jahre alt, männlich, ist in der 9. Klasse, ... Die beobachteten Werte variieren (daher die Bezeichnung „Variable“): Zum Beispiel ist der erste Schüler in diesem Datensatz 14 Jahre alt, der zweite ebenfalls, der dritte 10 und so weiter. Die Werte dieser Spalte variieren, der Begriff „Alter“ bleibt jedoch konstant: Diese gesamte Spalte zur Variablen Alter enthält ausschließlich die Altersangaben der Kinder.

6

SPSS für Windows

Es ist von außerordentlicher Wichtigkeit für die gesamte Statistik (insbesondere für die Prüfstatistik), dass folgende Konventionen eingehalten werden!

Jede Zeile (Reihe) des Datenfensters enthält Daten zu einem einzigen Fall;

kein Fall erscheint in mehr als einer Reihe;

jede Spalte des Datensatzes enthält Werte zu einer einzigen Variablen.

AnmerkungEs ist selbstverständlich möglich, Datensätze mit mehr als einer Zeile pro Fall in SPSS einzulesen und zu verwalten. Solche Datensätze müssen jedoch vor der Anwendung statistischer Prozeduren so umgestaltet werden, dass sämtliche zu analysierenden Variablen eines jeden Falles in einer einzigen Zeile erscheinen. Das Programm SPSS enthält Kommandos für diese Umgestaltung.

VariablendefinitionSPSS benötigt eine Zuordnung von Daten zu Variablen, die auch zur Kommunikation zwischen dem Benutzer und dem Programm dient, z.B. um bestimmte Variablen zu korrelieren oder um Grafiken zu erzeugen. Diese Zuordnung geschieht über die Vergabe von Variablennamen: Jede Spalte muss mit einem eindeutigen Namen versehen werden.

Oberhalb der Spalten in der Dateiansicht des Daten-Editor-Fensters befindet sich eine Leiste mit diesen Variablennamen:

Die Variablen in der aktiven Datei heißen also Bogen, Schultyp usw. – insgesamt zehn Variablen.

Aber auch weitere Informationen zu Ihren Variablen können bzw. müssen definiert werden. Über den Reiter Variablenansicht (links unten im SPSS Daten-Editor-Fenster) gelangen Sie zu folgender Darstellung der Variablen, die solche Definitionen ermöglicht:

Dieses Fenster enthält Einzelheiten zu diesen Definitionen:

Name

Hier können Sie die Namen Ihrer Variablen eingeben. Variablennamen dürfen bis zu 64 Zeichen lang sein, wovon das Erste ein Buchstabe sein muss. Sonst darf das Unterstreichenzeichen (_) zwar verwendet werden, jedoch lieber nicht als letztes Zeichen eines Variablennamens. Sonderzeichen (vor allem das Leerzeichen) sollten bzw. müssen auch vermieden werden. Trotz dieser maximalen Länge von 64 Zeichen, sollte in der Praxis diese Länge 18 Zeichen nicht überschreiten, denn SPSS hackt einfach rechts ab, falls nicht genug Platz in der Tabelle oder Diagramm zur Verfügung steht.

!Tipp

Sie machen sich das Leben einfacher, wenn Sie inhaltlich sinnvolle Namen zur Kennung der Variablen benutzen: Alter ist ein wesentlich besserer Variablenname als etwa x3 oder Gandalf oder Ähnliches.

Typ

Klicken Sie im Typ-Feld neben der Variablen Bogen die Option „Numerisch“ und anschließend auf dem Symbol in diesem nun schwarz umrandeten Feld! Es öffnet sich folgendes Fenster:

7

SPSS für Windows

Es befinden sich hier unter anderem die häufigsten Daten Typen Numerisch (das Feld ist für numerische Werte – Zahlen – vorgesehen, die mathematisch verarbeitet werden können) und String (das Feld enthält beliebige Zeichen, typischerweise Buchstaben). String-Variablen haben keine numerische Bedeutung und können natürlich auch nicht numerisch verarbeitet werden. Die Breite des Feldes (das heißt: Anzahl Stellen insgesamt) und gegebenenfalls auch davon die Anzahl Dezimalstellen könnten an dieser Stelle gesetzt oder geändert werden (siehe den folgenden Punkt „Spaltenformat und Dezimalstellen“).

!Tipp

Meiden Sie (zum Beispiel bei Variablen wie Geschlecht) String-Variablen – Variablen deren Daten, die Zeichen- oder Zeichenfolgen enthalten, wie etwa „m“ und „w“ für die Ausprägungen einer Variablen Geschlecht; denn die gesamten nichtparametrischen Statistiken von SPSS verstehen diese nicht.

Spaltenformat

Die Breite des Feldes und die Anzahl Dezimalstellen können auch hier gesetzt bzw. geändert werden. Beide Angaben können die Gestaltung der statistischen Ergebnistabellen und -grafiken von SPSS beeinflussen. Hiervon ein kleines Beispiel: Beide der folgenden Tabellen enthalten den Mittelwert der Variablen Alter. Die erste Tabelle basiert auf der Definition „Dezimalstellen = 1“:

Die zweite Tabelle basiert auf der Definition „Dezimalstellen = 2“:

!Tipp

Es ist daher zu empfehlen, bei allen metrischen Variablen, bei denen Sie zum Beispiel Mittelwerte berechnen möchten, die SPSS Formatierungsvoreinstellung (Feldbreit: 8; davon Dezimalstellen: 2) unverändert zu akzeptieren. Bei Gruppierungsvariablen wie etwa Geschlecht könnte man, wie hier, die Anzahl Dezimalstellen auf 0 setzen: Dieser Schritt ist aber nicht notwendig.

Variablenlabel

Das Variablenetikett (Variablenlabel) erlaubt die Definition einer längeren Beschreibung (formal bis zu 256 Zeichen lang), die alle Zeichen der Tastatur enthalten darf (Sonderzeichen, Groß- und Kleinschreibung u.s.w.): Empfehlenswert ist trotzdem eine Länge von ca. 18 Zeichen, denn ist ein Etikett zu lang für bestimmte Ausgaben (Tabellen oder Grafiken), so hackt SPSS das nicht passende Ende des Etiketts einfach ab.

!Tipp

Diese längeren Variablenlabels erscheinen in fast allen Ausgabetabellen und -grafiken von SPSS, die Sie mühelos in Ihre Word-Datei importieren können. Nehmen Sie sich die Zeit, schon bei der Dateneingabe diese Etikette so festzulegen, wie sie in Ihrer Arbeit erscheinen sollen. Sie sparen sich dadurch viel spätere Mühe.

8

SPSS für Windows

Wertelabels

Bei Variablen mit wenigen Ausprägungen empfiehlt es sich, diese einzeln zu etikettieren. Geschlecht beispielsweise hat gewöhnlich zwei Ausprägungen: männlich und weiblich.

Klicken Sie im Feld Wertelabels der Variablen Geschlecht und dann auf dem Symbol in diesem nun schwarz umrandeten Feld! Es erscheint folgendes Fenster:

Neben dem Feld Wert geben Sie 0 ein – den Wert, der im Datenfenster die Ausprägung „männlich“ kennzeichnet: Darunter im Feld Wertelabel geben Sie männlich ein! Drücken des Knopfes Hinzufügen überträgt diese Angabe in das untere Teilfenster. Verfahren Sie ähnlich mit 1 und weiblich; sodass das Fenster nun so aussieht:

Mit OK werden diese Definitionen übernommen.

Fehlende Werte

Es kommt oft vor, dass Daten einfach fehlen – der Patient ist entlassen worden; der Befragte gab keine Antwort; die Frage des Bogens wurde einfach nicht ausgefüllt. Üblicherweise lässt man die Datenfelder zu solch fehlenden Werten einfach leer. Das Feld sähe dann so aus:

Manchmal jedoch fehlen Variablen aus unterschiedlichen Gründen, die man getrennt kodieren und untersuchen möchte. Beispiel: Bei einer Umfrage bei Passanten auf der Straße zu politischen Ansichten ist eine Verweigerung aus Gewissensgründen (etwa: „Das geht niemanden was an“) eine ganz andere, als Langeweile (etwa: „Ich will nicht mehr, hab' was Wichtigeres zu tun“). Will man zwischen unterschiedlich motivierte Lücken im Datensatz unterschieden, so kann man an dieser Stelle Sonderkodierungen vereinbaren, die als fehlend gelten, die man jedoch nach Bedarf gezielt untersuchen könnte:

Klicken Sie im Feld Fehlende Werte neben der Variablen IQ und dann auf dem Symbol um folgendes Fenster zu erhalten:

9

SPSS für Windows

Die Voreinstellung (das, was SPSS macht, falls Sie keine Angaben machen) ist die, dass fehlende Werte lediglich durch leere Felder (keine Eingabe) im Eingabefenster gekennzeichnet sind. Die zweite Möglichkeit (Einzelne fehlende Werte) erlaubt die Angabe von bis zu drei verschiedenen Kodierungen; die letzte die Angabe sowohl von einem Bereich (vom kleinsten bis zum größten Wert, die als fehlend zu behandeln sind) und nach Bedarf von einem einzigen, speziellen Wert.

!Tipp

Nehmen Sie als Kodierung für fehlende Werte solche, die auf keinen Fall als normale Antworten vorkommen können! Bei einer Angabe zum Alter von Schulkindern wäre zum Beispiel ein Wert wie -999 eine sinnvolle Angabe, die Sie in doppelter Weise vor Eingabefehlern schützt – das Alter kann weder negativ noch so groß wie 999 werden.

Spalten

Diese Angabe spezifiziert, wie breit die Spalte im Dateneditorfenster sein soll. Sie hat keinen Einfluss auf die Gestaltung von Tabellen oder Grafiken. Es empfiehlt sich, diese Breite bei der Voreinstellung zu lassen, damit man den Variablennamen in voller Länge sieht. (Versuchen Sie aus Spaß, diesen Wert bei einer beliebigen Variablen auf 1 zu setzen und beobachten Sie die Ergebnisse!)

Ausrichtung

Auch diese Angabe berührt lediglich das Erscheinungsbild des Dateneditorfensters und gibt an, ob die Daten links- oder rechtsbündig im Datenfeld angezeigt werden sollten. Auch hier besteht kein Grund, die SPSS-Voreinstellung (rechtsbündig) zu ändern.

Messniveau

SPSS unterscheidet drei Messlevels (mehr zu diesem Thema finden Sie in der LRZ-Schrift SPSS for Windows – Special Topics: Einige Grundbegriffe der Statistik: Siehe Anhang B: Dokumentation):

1. Nominal: Nominalskalierte Variablen mit einigen, wenigen Ausprägungen (wie zum Beispiel Geschlecht mit den Ausprägungen 0 für männlich und 1 für weiblich) besitzen keine numerisch/mathematische Bedeutung: Sie dienen lediglich zur Klassifizierung oder Gruppierung der Fälle. Solche Variablen dürfen Zeichenketten („m“ und „w“, etwa) oder aber auch Zahlen beinhalten, aber: Auch wenn zum Beispiel „männlich“ als „1“ und „weiblich“ als „2“ kodiert wären, besäßen diese Werte trotzdem keine numerische Bedeutung, sondern fungieren nach wie vor lediglich als Etikett. Man könnte ja die Etikettierung genau anders herum vornehmen (1 = weiblich, 2 = männlich), oder (99 = männlich, 999 = weiblich) oder... . Die rein etikettierende Funktion solcher „Zahlen“ (die im rechnerischen Sinne gar keine Zahlen sind, sondern lediglich beliebige Zeichen) bleibt unverändert.

2. Ordinal: Die eingetragenen Werte geben bei ordinalen Variablen eine Reihenfolge an. Kodiere man zum Beispiel Alter in drei Gruppen (jung, mittel, alt), so wüsste man zwar, dass eine Person der Gruppe „jung“ jünger ist als Personen der beiden anderen Gruppen, wüsste aber nicht, wie viel jünger. Würde man die Variablen mit „1“ (jung) „2“ (mittel) und „3“ (alt), so wüsste man also, dass zwar Personen der Gruppe 1 jünger sind als die der Gruppe 2 und Personen beider Gruppen jünger sind als Personen der Gruppe 3: Man könnte aber nicht behaupten, Personen der Gruppe 2 wären doppelt so alt wie die der Gruppe 1.

3. Metrisch: Variablen, deren Werte numerische Bedeutung haben. Beispiel: Alter in Jahren – ein zehnjähriges Kind ist (innerhalb der Messpräzision) doppelt so alt wie ein fünfjähriges. Der Altersunterschied zwischen einer 16- und einer 18-jährigen Person ist genauso groß wie der zwischen einer 75- und einer 77-jährigen Person.

10

SPSS für Windows

!Tipp

Noch einmal (da es so wichtig ist): Es lohnt sich, sich bei der Datendefinition Mühe zu machen, denn die dort festgelegten Etikette werden auch, soweit möglich, von den Statistik- und Graphikprozeduren zur Gestaltung der Ausgabe benutzt, sodass diese sofort ohne weiteres Editieren in druckfertigen Arbeiten übernommen werden kann.

Zugriff auf Dateien

Zu jeder Variablen müssen dem Programm die zu analysierenden Rohdaten bereitgestellt werden. Hierzu gibt es einige Möglichkeiten:

Eingabe von Rohdaten im SPSS-Daten-Editor-Fenster

Über den Menüpunkt Datei + Neu + Daten öffnen Sie eine neues, leeres Daten-Editor-Fenster. In diesem Fenster ist ein Datenfeld schwarz umrandet (unmittelbar nach dem Öffnen eines neuen Fensters ist dies das erste Feld oben links). Tippen Sie als Beispiel nun die Zahl 017 ein.

Zunächst erscheint diese Eingabe im Zelleneditorfeld oberhalb der Datenfelder: Hier können Sie Änderungen vornehmen. Mit der Eingabe-Taste wird die Zahl (ohne führende „0“) in das Datenfeld übertragen, und das Eingabefeld positioniert sich eine Zeile weiter nach unten. Sie können die Eingabe auch mit der Pfeil-rechts- oder der Tabulator-Taste quittieren und somit ein Feld weiter rechts weiterpositionieren.

!Tipp

Legen Sie zunächst im Variablensichtfenster sämtliche Variablendefinitionen fest. Erst dann tragen Sie Ihre Daten ein!

Übung

Anhang A enthält zwei ausgefüllte Beispielfragebögen zu den Variablen Bogen, Schultyp, Alter, Geschlecht, Klasse, Deutsch, Mathe, Englisch, IQ und Chancen. Öffnen Sie über Datei + Neu + Daten ein leeres Dateneditorfenster, legen Sie die Variablendefinitionen fest und tragen Sie die Daten der beiden Bögen ein! Sichern Sie diese Datei (über Datei + Speichern) unter dem Namen meindat!

Anmerkung:

Die Deutsch-, Englisch- und Mathenoten sind zwar unter dem allgemeinen Begriff „Noten“ hier subsumiert, dieser übergeordnete Begriff ist aber mit keiner eigenen Eingabe verbunden – und benötigt also keine Spalte für sich. Wir definieren lediglich die Variablen für die wir einzelne Eingaben haben – hier also Deutsch, Englisch und Mathe.

Öffnen einer schon bestehenden SPSS-Systemdatei

Öffnen Sie einfach die Datei!

Einlesen von Text-Daten

Text-(ASCII-)Daten sind einfach Rohdaten, die zum Beispiel mit einem üblichen Textverarbeitungsprogramm eingegeben wurden. Datei + Textdaten lesen öffnet ein Fenster, das die Auswahl einer Text-Datei ermöglicht. Wählen Sie die Datei data.txt aus! Es öffnet sich der Assistent für Textimport:

11

SPSS für Windows

Das untere Subfenster (Textdatei:) stellt die einzulesenden Daten dar, wobei die erste Zeile (wie hier) Variablennamen enthalten darf, die restlichen Zeilen Daten enthalten müssen (ein eventuell erscheinendes, kleines Quadrat entspricht einem Tabulator in der ursprünglichen Datei).

Klicken sie nun auf Weiter >! Das Fenster zum zweiten Schritt der Definition öffnet sich. Im oberen Teil des Fensters wird nach der Art der Formatierung der Daten gefragt. Mit Trennzeichen bedeutet, dass die Daten zu den Variablen durch bestimmte Zeichen (Leerzeichen, Kommata,..) getrennt sind:

Feste Breite bedeutet, dass sämtliche Daten zu allen Variablen in bestimmten Spalten erscheinen.

Der untere Teil des Fensters zeigt die ersten vier Zeilen der einzulesenden Datei an.

12

SPSS für Windows

Nach Auswahl der passenden Option und anklicken von Weiter > öffnen sich weitere, sich selbsterklärende Steuerungsfenster zum flexiblen Einlesen von fest- oder frei formatierten Klartextdatensätze.

Einlesen von „fremden“ Dateiformaten

Excel-Datenbestände

Das Einlesen von Daten aus Excel-Tabellen oder -Mappen geschieht einfach über die übliche Funktion Datei öffnen und Auswahl des Dateityps Excel (*.xls):

Markieren Sie nun die gewünschte Datei und klicken Sie auf Öffnen:

Klicken Sie Variablennamen einlesen, um SPSS mitzuteilen, dass die erste (und ausschließlich die erste!) Zeile der angezeigten Excel-Tabelle SPSS-Variablennamen enthält: Diese müssen die bekannten SPSS-Namenskonventionen einhalten – maximal 64 Zeichen lang, wovon das erste ein Buchstabe sein muss, die restlichen Buchstaben oder Ziffern ('_', jedoch nicht als letztes Zeichen; keine Sonderzeichen!) sein dürfen. Handelt es sich um eine Excel-Mappe, die ja mehrere Tabellen enthalten kann, so erscheint ein leicht erweitertes Fenster, das Ihnen erlaubt, eine bestimmte Tabelle dieser Mappe zu selektieren und einzulesen.

Wollen Sie lediglich einen Teil der Tabelle in SPSS einlesen, so definieren Sie im Feld Bereich diesen gewünschten Teil – zum Beispiel B1:D26, um die zweite, dritte und vierte Variablen, deren SPSS-Variablennamen und die ersten 25 Datenzeilen der Datei einzulesen.

Datenbankzugriffe

SPSS bietet über den Hauptmenüpunkt Datei + Datenbank öffnen... die Möglichkeit an, Daten aus verschiedenen fremden Quellen wie zum Beispiel Oracle- oder DBase-Datenbanken zur Verfügung zu stellen und über Datenbankabfragen, bestimmte Datenmengen im SPSS-Dateneditorfenster zur Verfügung zu stellen. Die SPSS-Manuale enthalten Einzelheiten dazu.

Gestaltung der Variablenlisten

Typisch für die Steuerung von SPSS-Prozeduren ist ein Steuerungsfenster, die eine Liste der definierten Variablen beinhaltet:

13

SPSS für Windows

Die Gestaltung dieser Variablenliste kann über Bearbeiten + Optionen... unter dem Reiter Allgemein und dort unter Variablenlisten gesteuert werden:

Die obere Hälfte dieses Subfensters steuert die Darstellung als Variablenetikett (Labels anzeigen) oder aber (wie hier) Variablennamen (Namen anzeigen). Die untere Hälfte steuert die Reihenfolge der Darstellung: (wie hier) Alphabetisch oder aber in der Reihenfolge des Erscheinens im Datenfenster (Datei).

Wählen Sie die alphabetische Reihenfolge der Variablennamen (wie oben) aus!

Datenmanipulation

Falls nicht schon getan, öffnen Sie die Datei data.sav!

Es ist manchmal notwendig, bestehende Variablen zu verändern oder aus bestehenden Variablen neue zu berechnen. Unter dem Menüpunkt Transformieren bietet SPSS hier einige Möglichkeiten an:

Umkodieren

Umkodieren unterstützt das Verändern der Werte einer schon vorhandenen Variablen (In dieselben Variablen...) – die alten Werte werden dabei überschrieben (vernichtet) – sowie das Erzeugen einer neuen Variablen (In andere Variablen...).

!Tipp

Es ist ratsam, eine neue Variable zu kreieren, statt die alte zu vernichten, denn oft braucht man die alten Werte doch noch.

Übung

Aktivieren Sie Transformieren + Umkodieren + In andere Variablen …! Übertragen Sie nun die Variable Alter in das Fenster Eingabe Var.: -> Ausgabe var.: - (der Text Eingabe Var. ändert sich automatisch in Numerische Var.). Benennen Sie die neu zu kreierende (Ausgabe) Variablen und sein längeres Etikett wie etwa in folgender Abbildung:

14

SPSS für Windows

Mit Ändern wird die Verbindung der neuen mit der ursprünglichen Variablen festgelegt.

Um nun die neuen Werte zu erzeugen gibt es zwei Möglichkeiten:

Die Taste Falls... erlaubt die Auswahl bestimmter Fälle, für welche die Datenänderung durchgeführt werden soll.

Die Taste Alte und neue Werte... öffnet folgendes Fenster:

Unter der Rubrik Alter Wert definiert man den Wert, der zu ersetzen ist, unter Neuer Wert gibt man die Ersatzwerte an. Wert erlaubt unter anderem die Angabe eines einzelnen Wertes. Fehlende Werte können gesondert behandelt werden. Mit Bereich wird ein Bereich von Werten festgelegt. Beispiele:

erlaubt die Angabe eines Bereichs – hier für Werte der Variablen alter von 13 bis 15.

erlaubt die Angabe eines Bereichs vom kleinsten im Datenbestand enthaltenen Wert bis zum angegebenen Wert (hier für Werte bis 12

Jahren).

erlaubt die Angabe eines Bereichs vom angegeben Wert bis zum größten im Datenbestand enthaltenen Wert (hier für Werte ab 16).

Unter Neuer Wert können Sie nun die gewünschte neue Kodierung eingeben und mittels Hinzufügen festlegen.

Übung

Folgende Tabelle verbindet die Werte der ursprünglichen Variablen Alter mit denen der zu erzeugenden Variablen Altersgruppierung:

Alter Altersgruppierung

bis 14 Jahren 1

14 bis 17 Jahren 2

17 Jahre und älter 3

Führen Sie die Umkodierung durch! Vergessen Sie nicht, von der Variablenansicht des Datenfensters aus, die Wertelabels entsprechend zu definieren!

Anmerkung: Wie zu erwarten: Gruppe 1 enthält Jugendliche bis 13,999... Jahren; Gruppe 2 von 14 bis 16,999... Jahren; Gruppe 3, 17 Jahre und älter.

Berechnen

Transformieren + Berechnen... öffnet folgendes Fenster:

15

SPSS für Windows

Im Zielvariablen-Feld wird der Name der zu kreierenden Variablen eingegeben. Das Feld Numerischer Ausdruck erhält eine Beschreibung, wie diese Zielvariable zu berechnen ist. Unter Funktionsgruppe wählen Sie Statistisch und im Fenster „Funktionen und Sondervariablen“ Mean aus (dabei ignorieren Sie diese hässliche Mischung aus Englisch und Deutsch)! Im Subfenster links davon erscheint eine Erklärung des Angeklickten.

Übung

Berechnen Sie die neue Variable Schnitt, die den Mittelwert pro Schüler der Schulnoten (Variablen: Deutsch, Englisch, Mathe) enthält. Die Funktion MEAN(numAusdr,numAusdr,...) aus der Funktionsliste kann hierzu benutzt werden: Diese kurze Beschreibung der Funktion deutet an, dass die verschiedenen Ausdrücke (hier einfach: Variablen), deren Mittelwert berechnet werden soll, durch Kommata zu trennen sind. Benutzen Sie den nach oben hinweisenden, dreieckigen Pfeil, um die Funktion und die Variablennamen ins Subfenster Numerischer Ausdruck zu übertragen!

Ihr ausgefülltes Steuerfenster sollte nun so aussehen:

Führen Sie (mit OK) den Vorgang durch! Inspizieren Sie das Dateneditorfenster: Die neu berechnete Variable befindet sich am rechten Ende des Fensters.

!Tipp

Fehlt bei einem bestimmten Fall ein Wert bei einer (oder mehreren) Variablen (hier: Deutsch, Englisch, Mathe) so erhält die Zielvariable (hier: Schnitt) den Mittelwert der restlichen, nicht fehlenden Werte. Sollte bei irgendeinem Falle alle drei Werte fehlen, so wird auch die Zielvariable als fehlend definiert.

Übung

Definieren Sie passende Ausprägungs-Etiketten für die gerade erzeugte Variable!

16

SPSS für Windows

Umkodieren in aufeinander folgende Zahlen

Mehrere Prozeduren in SPSS erkennen String- (Zeichenketten-)Variablen nicht, sodass Einträge wie: „j“ für „jung“, „m“ für „mittel“, „a“ für „alt“ in Zahlen umkodiert werden müssten. Zudem verlangen mehrere Prozeduren eine Kodierung kategorialer Variablen als aufeinander folgenden Zahlen (zum Beispiel: 1, 2, 3, statt 7, 19, 23), anderer laufen merklich effizienter mit einer solchen Kodierung. Es mag also durchaus Sinn machen , Stationen eines Krankenhauses mit den Nummern der Station zu identifizieren, für die Verarbeitung mit SPSS ist dies jedoch nicht zu empfehlen: Ein Umkodierung ist angebracht. SPSS bietet ein bequemes Werkzeug hierfür. Über Transformieren … automatisch umkodieren erhält man das Steuerungsfenster dazu. Übertragen Sie die Variable Klasse ins Subfenster Variable -> Neuer Name und definieren Sie einen Namen für die neue Variable. Die restlichen Möglichkeiten des Fensters sind selbsterklärend.

Datensicherung

Der Inhalt des Dateneditorfensters (das heißt natürlich auch: des Datenbestandes) kann über das Werkzeug-kastensymbol oder aber über Datei + Speichern gespeichert (gesichert) werden. Mit Speichern unter. . . können Sie Ihre Daten auch unter einem anderen Namen oder zum Beispiel als Excel-Datei speichern.

!Tipp

Falls Sie Ihre Daten ändern, so sichern Sie diese sofort, ohne auf das Ende der Arbeitssitzung zu warten! So beugen Sie unnötige Datenverluste vor.

Mehr als ein Datensatz?

SPSS erlaubt lediglich ein einziges aktives Datenfenster. Man kann zwar mehrere SPSS-Sitzungen parallel zueinander starten, das wären aber unabhängige Sitzungen: man könnte z.B. die Variablen- und Wertelabels aus einer Datei (mittels Kopieren und Einfügen) in einer zweiten übernehmen, aber die Analyse beider Datensätze ist nur dann möglich, wenn diese Dateien zusammengefügt werden – d.h.: Daten können nur zusammen untersucht werden, wenn sie in einem und demselben Datenfenster sind. Wie fügt man also zwei Datensätze zusammen?

Daten + Dateien zusammenfügen bietet zwei Möglichkeiten an:

Hinzufügen von zusätzlichen Fällen

Über Fälle hinzufügen... teilt man SPSS einfach den Namen der Datei mit, die die Daten der zusätzlichen Fälle enthält. Diese werden ans untere Ende Ihres Datensatzes hinzugefügt. Gewöhnlich enthalten beide Dateien Daten zu denselben Variablen. Kommen aber Variablen in der einen Datei vor, die in der anderen nicht definiert sind, so erzeugt SPSS automatisch eine Variable, deren Werte im entsprechenden Teil der neuen Datei einfach fehlen (das heißt: Sie werden als „fehlend“ gespeichert).

17

SPSS für Windows

Hinzufügen von zusätzlichen Variablen

Um zusätzliche Variablen (über Fälle hinzufügen...) hinzuzufügen muss man etwas präziser vorgehen: Damit die Dateien korrekt gemischt werden können, müssen beide nach einer gemeinsamen Variablen sortiert sein.

!Tipp

Alle Datendateien sollten ausnahmslos eine spezielle Variable enthalten, die zur eindeutigen Identifikation der Fälle dient (Schlüsselvariablen)! Eine solche Variable ist unter anderem schon bei der Datenkorrektur oder beispielsweise bei der Suche nach „Ausreißern“ eine große, bei dem Mischen von Dateien eine schier unumgängliche Hilfe.

Bevor Sie den Mischvorgang starten, sortieren Sie beide Dateien aufsteigend nach diesem gemeinsamen Schlüsselvariablen! Da lediglich eine Datei im Datenfenster zur Verfügung stehen kann, müssen Sie diese sortieren und schließen, um dann die zweite Datei zu öffnen und ebenfalls nach dem gemeinsamen Schlüssel zu sortieren. Dies geschieht über Daten + Fälle sortieren. . .

Übung

Öffnen Sie die Datei demog.sav, die die demographischen Variablen Schultyp, Alter, Geschlecht, Klasse und die Schlüsselvariablen Bogen enthält. Übertragen Sie letztere ins Sortieren Nach:-Fenster und sortieren Sie den Datenbestand aufsteigend nach dieser Schlüsselvariablen! Speichern Sie diese Datei unter dem Namen demog_sortiert.sav und öffnen Sie die Datei scores.sav, die die Variablen Deutsch, Englisch, Mathe, Chancen und selbstverständlich auch die Schlüsselvariablen Bogen enthält. Sortieren Sie auch diese Datei aufsteigend nach der gemeinsamen Schlüsselvariablen und speichern Sie sie unter dem Namen scores_sortiert.sav!

Nach Daten + Dateien zusammenfügen + Variablen hinzufügen... wählen Sie die Datei demog.sav aus. Folgendes Fenster öffnet sich:

Das Fenster Ausgeschlossene Variablen listet die Variablen auf, die nicht in der gemischten Datei erscheinen werden – hier die Variable Bogen aus der Datei demog.sav (+ kennzeichnet Variablen der hinzuzufügenden Datei, * die der aktuellen Arbeitsdatei). Diese Variable Bogen ist ja schon im Fenster Neue Arbeitsdatei enthalten, das die Variablen der gemischten Datei anzeigt. Wir können und sollten jedoch diese Variablen als Schlüsselvariablen zur Verknüpfung beider Dateien benutzen: D.h. Fälle beider Dateien werden anhand dieser gemeinsamen Variablen verglichen und erst dann zusammengefügt, falls die Werte der Schlüsselvariablen in beiden Dateien übereinstimmen – ein zusätzlicher Schutzmechanismus, der für die Abstimmung beider Dateien sorgt. Übertragen Sie nun Bogen in das Fenster Schlüsselvariablen und führen Sie die Mischung aus!

18

SPSS für Windows

!Tipp – und eine Warnung!

Da man das Programm SPSS mehrmals starten kann, könnte man es einmal mit dem einen, einmal mit dem anderen Teildatensatz starten, die Variablen/Fälle im dem einen Teil markieren, mit Bearbeiten + Kopieren in die Zwischenablage kopieren, zur anderen Instanz von SPSS wechseln, um dort über Bearbeiten + Einfügen die Daten zuzumischen. Dieser Vorgang ist zwar schnell und beim Hinzufügen von zusätzlichen Fällen sogar zu empfehlen: Beim Hinzumischen von zusätzlichen Variablen fehlt jedoch der wichtige Schutzmechanismus der Schlüsselvariablen.

Auswahl gezielter Untermengen der Fälle

Falls nicht schon getan, öffnen Sie die Datei data.sav!

Untersuchungen anhand einer kategorialen (Gruppierungs-)Variablen

Es ist oft notwendig, eine bestimmte Analyse mit unterschiedlichen Datenmengen zu wiederholen: Pro Krankenhaus oder -station, Schultyp, Bundesland usw. – d.h. nach den Ausprägungen einer oder mehrerer kategorialen Variablen.

Daten + Datei aufteilen... öffnet folgendes Fenster:

Per Voreinstellung werden alle Fälle – ohne Gruppierung – untersucht (Alle Fälle analysieren, keine Gruppen bilden).

Die Auswahl Gruppen vergleichen erzeugt – abhängig von der aufgerufenen Prozedur – einen Vergleich zwischen den Gruppen, produziert z.B. eine Tabelle mit nach Gruppen geordneten Einträgen.

Die Auswahl Ausgabe nach Gruppen aufteilen erzeugt z.B. getrennte Tabellen, eine pro Gruppe.

Die Definition solcher Gruppen geschieht über die Auswahl einer kategorialen (Gruppierungs-) Variablen (wie etwa Schultyp), die ins Subfenster Gruppen basierend auf übertragen wird.

!Tipp

Die Informationszeile ganz unten im SPSS Datenfenster zeigt im rechten Feld an, dass Datei aufteilen aktiviert ist:

Vergessen Sie nicht, diese Funktion wieder zu deaktivieren, sobald der gesamte Datenbestand wieder untersucht werden soll! Diese Deaktivierung geschieht über das Fenster Datei aufteilen... und die Auswahl der Option Alle Fälle analysieren, keine Gruppen bilden: Die Meldung (Datei aufteilen an) in der Informationszeile verschwindet.

Auswahl auch anhand von kontinuierlichen Variablen

SPSS bietet einige Möglichkeiten an, bestimmte Fälle anhand der Werte ihrer Variablen zur Analyse auszuwählen – zum Beispiel: Alle Patienten der Neurochirurgie, die über 45 Jahre alt, privat versichert sind und mindestens einmal schon operiert wurden. So lange die Auswahl in Kraft bleibt, werden nur Daten der selektierten Fälle untersucht, die der restlichen Fälle ignoriert.

19

SPSS für Windows

Beispiel

Man möchte die Werte lediglich der Kinder untersuchen, die a) weiblich und b) älter als 13 Jahre sind.

Daten + Fälle auswählen. . . öffnet folgendes Fenster:

Dieses Fenster bietet einige Varianten an, wir besprechen jedoch lediglich die Möglichkeit Falls Bedingung zutrifft. Aktiviert man diese Option und klickt man auf Falls... so kann man z.B. Folgendes definieren:

Das „&“ bedeutet, dass beide Bedingungen gleichzeitig erfüllt werden müssen, bevor ein Fall selektiert wird. Mittels Weiter und OK bewirkt man, dass bis zur Deaktivierung des Filters, nur Mädchen (Geschlecht = 1) über 13 Jahre (Alter > 13) untersucht werden.

!Tipp

Auch hier zeigt die Informationszeile an, dass ein Filter aktiviert ist:

Zudem sind in der grauen, linken Spalte des Datenfensters in der Datenansicht alle nicht ausgewählten Fälle durchstrichen.

Nicht vergessen, auch diesen Filter wieder auszuschalten (mittels Daten + Fälle auswählen und anklicken von „Alle Fälle“), sobald er nicht mehr benötigt wird.

Steuerung der Statistik-Prozeduren: ÜberblickÜbung zur Vorbereitung

20

SPSS für Windows

Starten Sie SPSS und lesen Sie die Datei datal.sav ein!

!Tipp

Ist SPSS schon aktiviert, geht dies wie beschrieben über Datei + Öffnen. Sonst kann es schneller sein, im Windows Explorer die Datei zu suchen und einfach auf deren Symbol „doppelzuklicken“. SPSS wird dann automatisch mit dem ausgewählten Datensatz gestartet. Bei von SPSS schon benutzten Dateien, kann man auch über Datei ... Zuletzt verwendete Daten diese besonders schnell öffnen.

Über den Hauptmenüpunkt Analysieren + Deskriptive Statistiken + Kreuztabellen... öffnen Sie als Beispiel für die typische SPSS-Prozedursteuerung das Steuerfenster für Kreuztabellen: Aus der Variablenliste links klicken Sie die Variable Geschlecht an und übertragen Sie diese durch Anklicken des Dreieck-nach-rechts-Taste in das Zeilen- Subfenster. Übertragen Sie auf ähnliche Weise die Variable Schultyp in das Subfenster Spalten:

Dieses Fenster weist einige Eigenschaften aus, die immer wieder bei der Steuerung der Statistik-Routinen auftreten:

links erscheint eine Variablenliste;

rechts davon erscheint ein (oder mehrere) Fenster für die zu analysierende(n) Variable(n);

dazwischen sind dreieckige Pfeilknöpfe, die die Übertragung markierter Variablen in die eine oder andere Richtung ermöglichen.

Getrennt von diesen Variablenauswahldiensten befinden sich prozedurspezifische Steuerungsmöglichkeiten – in diesem Fall zwei (durch Anklicken) ankreuzbare Schalter und vier Knöpfe, die weitere Steuerungsfenster öffnen. Einige dieser Möglichkeiten werden später näher beschrieben.

Das „Anklicken“ in einem Prozedurfenster generiert (zunächst unsichtbare) Steuerbefehle für SPSS. Ganz rechts sind vier Knöpfe, die das Ausführen dieser Befehle betreffen:

OK führt die Befehle aus

Einfügen kopiert die (sonst unsichtbaren) Befehle in Klartext in ein Syntax-Fenster: Dort können Sie „per Hand“ editiert (erweitert, geändert) werden. Syntax-Fenster werden später besprochen.

Zurücksetzen bringt das Fenster in den ursprünglichen Zustand wieder (d.h. alles, was man definiert hat, wird „vergessen“ und die Voreinstellungen wieder in Kraft gesetzt).

Abbrechen schließt das Fenster, ohne die Befehle auszuführen.

Hilfe bietet Unterstützung und lnformationen mittels der Windows-typischen Hypertext-Schnittstelle an.

Klicken Sie nun auf OK!

21

SPSS für Windows

Das wissensbasierte Informationssystem von SPSSÜber die rechte Maustaste kann die wissensbasierte Datenbank des Programms konsultiert werden.

Beispiel:

Über Analysieren + Mittelwerte vergleichen wählen Sie Mittelwerte... aus, um einfache Statistiken zu Gruppenmittelwerten und -unterschieden zu erhalten. Die Abhängige Variable soll das IQ, die Unabhängige Variable die Art der Schule sein:

Über Optionen... gelangen Sie nun zu einem Fenster, das eine Fülle von Statistiken anbietet. Angenommen, Sie möchten wissen, was die Option Anova Tabelle und Eta (im Kästchen unten links) bedeutet, so klicken Sie mit der rechten Maustaste in dessen Textfeld, um folgende Erklärung zu erhalten:

Wählen Sie nun Anova Tabelle und eta aus und lassen sie mittels Weiter und OK unter anderem folgende Tabelle erzeugen:

Zusammenhangsmaße

Eta Eta-Quadrat

Intelligenzquotient * Art der Schule ,725 ,525

Aktivieren Sie durch Doppelklick diese Tabelle, klicken Sie mit der rechten Maustaste auf der Überschrift Eta-Quadrat, danach auf Direkthilfe. Sie erhalten über das nun erscheinende Steuerfenster, Auswahl Direkthilfe, detailliertere Auskunft:

Ausgabefenster und der ViewerUnmittelbar nach dem Starten von SPSS ist lediglich das Daten-Editor-Fenster offen. Falls kein Ausgabefenster schon geöffnet wurde, so öffnet das Ausführen einer Prozedur automatisch ein Ausgabefenster, das die Ergebnisse der SPSS-Vorgänge erhält. Nach Aufruf der Datei-Informationen und der Prozedur Kreuztabelle sähe die Ausgabedatei (eher: ein Teil davon) so aus:

22

SPSS für Windows

Alle Meldungen von SPSS, vor allem auch statistische Ausgabe wie Tabellen und Grafiken, erscheinen in einem solchen Viewer-Fenster. Dieser Viewer ermöglicht sowohl die schnelle Positionierung innerhalb der unter Umständen umfangreichen Ergebnisse als auch die flexible Gestaltung dieser Ergebnisse.

Das Viewer-Fenster teilt sich in ein Übersichtsfeld (links) und ein Inhaltsfeld (rechts). Die Trennlinie zwischen beiden Feldern kann mit Hilfe der linken Maustaste verschoben werden.

Das Übersichtsfeld ist ein hierarchisch geordnetes Inhaltsverzeichnis, das Ihre Arbeitssitzung mit SPSS protokolliert. Im Beispiel zeigt es an, dass die Ausgabe zwei „Absätze“ (eine Kreuztabelle und Ausgabe der Prozedur „Mittelwerte“) enthält. Den Inhalt beispielsweise des Übersichtsabsatzes Kreuztabellen kann man durch einen Klick auf dem Minuszeichen links von der Crosstabs-Überschrift verstecken. Das Minus- ändert sich dann in ein Pluszeichen. Ein erneuter Klick darauf zeigt wiederum den gesamten Inhalt wieder an.

Dieser Absatz Kreuztabellen enthält vier Elemente: Klicken Sie auf Titel. Der rote Pfeil im Übersichtsfeld bewegt sich zum Titel und auch im Inhaltsfeld erscheint ein roter Pfeil neben dem Inhalt des Titels. Der Titel selbst ist mit einem verziehbaren Rahmen versehen.

Im Übersichtsfeld neben Titel ist ein kleines, offenes Buchsymbol: Ein Doppelklick darauf „schließt“ das Buch; auch der Inhalt im Ausgabefenster wird unsichtbar. (Der Inhalt wird dadurch nicht gelöscht: Das erreicht man erst mit Markierung des Elements bzw. der Elemente und Betätigung der Löschtaste der Tastatur.) Ein zweiter Doppelklick öffnet das Buch: Dessen Inhalt erscheint erneut im Ausgabefenster.

Übung

Über einen Doppelklick im Titelfeld ändern Sie „Kreuztabelle“ in „Crosstabs“. Versuchen Sie auch, mehrere Zeilen einzutippen. Beenden Sie diese Verarbeitung durch Klicken irgendwo außerhalb des Feldes.

Mehrere Viewer-Fenster

Für seine Ausgabe benötigt SPSS mindestens ein Viewer-Fenster. Es ist auch möglich, mehrere solche Fenster zu öffnen. Das Öffnen eines neuen Fensters geschieht über Datei + Neu + Ausgabe. Nun muss zwischen

aktiven und nicht-aktiven

und

23

SPSS für Windows

designierten und nicht designierten Fenstern unterschieden werden:

Ein aktives Viewer-Fenster ist das aktuell angeklickte Fenster, wo sich der Cursor üblicherweise befindet. Dieses Fenster ist durch eine unterschiedliche Färbung (mit der Windows-Voreinstellung dunkelblau) der obersten Zeile gekennzeichnet. Klickt man in einem zweiten Viewer-Fenster, so wird dieses aktiv, alle anderen bleiben/werden deaktiviert.

Ein designiertes Fenster ist das Viewer-Fenster, in dem aktuell SPSS seine Ausgabe (Grafiken, Tabellen, ...) schreibt. Das designierte Fenster wird durch ein rotes Ausrufezeichen im Informationsbereich (links neben den Prozess-Mitteilungen) angezeigt:

Entsprechend gibt es im Werkzeugkasten eines nicht designierten Viewer-Fensters ein rotes Ausrufezeichen: Anklicken dieses Zeichens macht dessen Fenster zum designierten.

Übung

Öffnen Sie ein neues Viewer-Fenster und machen Sie dieses zum designierten Fenster! Führen Sie das Kreuztabellen-Beispiel wieder aus!

Werkzeuge im Viewer

Der Viewer bietet einige Werkzeuge zur bequemen Gestaltung Ihrer Ausgabe:

Drei Werkzeuge zum Einfügen von Textelementen erlauben das Einfügen

von einer Absatzüberschrift bzw. von Titelzeilen bzw. von beliebigem Text.

Übung

Fügen Sie eine neue Absatzüberschrift ein!

Zwei Werkzeuge zum Öffnen/Schließen von Absatzinhalten

Expandieren bzw. Kollabieren (Öffnen bzw. Schließen) von Absätzen. Diese Werkzeuge haben dieselbe Wirkung wie das Anklicken der Plus- bzw. Minus-Zeichen im Inhaltsübersicht des Viewers.

Werkzeuge zum Verändern der Hierarchie:

Schiebt das markierte Element eine Stufe höher bzw. tiefer in der Hierarchie.

Werkzeuge zum Anzeigen und zum Verstecken von Ausgabeteilen:

Den sichtbaren Ausgabeteil unsichtbar bzw. den unsichtbaren sichtbar machen.

Übungen

1. Öffnen Sie die Anmerkungen (per Voreinstellung zunächst nicht sichtbar).

2. Wiederholen Sie den Kreuztabellen-Vorgang (um eine zweite Prozedurausgabe zu erzeugen).

3. Machen Sie den Inhalt des 1. Kreuztabellen-Absatz unsichtbar! Verschieben Sie den zweiten Kreuztabellen-Absatz vor den ersten (markieren und anschließend mit gedruckter Maustaste verschieben)! Fügen Sie einen beliebigen Text unmittelbar nach dem Titel der ersten Kreuztabelle ein!

4. Löschen Sie die Anmerkungen aus beiden Absätzen!

5. Löschen Sie den gesamten 2. Kreuztabellen-Absatz!

OLAP (OnLine Analytic Processing): Interaktive DatenanalyseÖffnen Sie falls nötig die Datendatei data1.sav!

Vom Datenfenster aus mittels Analysieren + Berichte + OLAP-Würfel... (OLAP: OnLine Analytic Processing = interaktive, analytische Verarbeitung) erhält man ein Steuerungsfenster, das das Erzeugen von interaktiv (um)gestaltbaren Tabellen mit zusammenfassenden Statistiken ermöglicht:

24

SPSS für Windows

Übertragen Sie die Variablen Deutsch, Englisch und Mathe (in der Reihenfolge) in das Fenster Auswertungsvariablen, die Variable Geschlecht in das Fenster Gruppenvariable(n)! Klicken Sie nun den Statistiken...-Knopf an und aktivieren Sie lediglich Anzahl der Fälle, Mittelwert sowie Standardabweichung aus (d.h.: entfernen Sie durch Markieren und Klicken des Dreiecks-nach-links die restlichen Statistiken)! Klicken Sie Weiter an! Geben Sie über Titel... „Noten und Geschlecht“ als Titel und „LRZ-Kurs“ als Erklärung ein. Über Weiter und OK erhalten Sie folgende Ausgabetabelle:

Noten und Geschlecht

Geschlecht: Insgesamt

N MittelwertStandardabweichung

Deutschnote 250 6,9920 2,60057

Englischnote 250 6,5800 3,70656

Mathematiknote 250 7,1040 2,54383

LRZ-Kurs

Die Überschrift „Geschlecht Insgesamt“ deutet an, dass die ausgegebenen Statistiken für die gesamte Stichprobe (also: für beide Geschlechter zusammen) gelten. Solche so genannte Pivot-Tabellen enthalten jedoch die gesamten angeforderten Informationen. Aktivieren Sie durch Doppelklick die Tabelle! Sie wird durch eine schraffierte Umrandung markiert und die Überschrift ergänzt sich um den Knopf . Klicken Sie diesen Knopf, um die Statistiken für weibliche bzw. männliche Fälle zu inspizieren!

Übung

Aktivieren Sie (falls nötig) mit Doppelklick die Tabelle und wählen Sie die Subtabelle zu den männlichen Fällen aus! Klicken Sie mit der rechten Maustaste in der Überschrift Mittelwert und wählen Sie im nun erscheinenden Fenster Auswählen und dort Datenzellen und Beschriftungen! Anschließend wählen Sie (wieder über die rechte Maustaste) Diagramm erstellen und Linie!

Sie erhalten folgende graphische Darstellung der markierten Spalte:

25

SPSS für Windows

Deutschnote Englischnote Mathematiknote

Variablen

4,0000

5,0000

6,0000

7,0000

8,0000

Wer

teNoten und GeschlechtGeschlecht : männlichStatistik : Mittelwert

(Wie solche Grafiken editiert und weiter gestaltet werden können, lernen wir später.)

Pivot-Tabellen

Tabellen, wie zum Beispiel gerade mit OLAP kreiert, heißen im SPSS-Jargon Pivot-Tabellen. Diese können auch über andere Prozeduren erzeugt werden und bieten eine sehr bequeme Möglichkeit, Daten zu untersuchen und deren Darstellung zu gestalten.

Doppelklicken Sie nun diese gerade erzeugte OLAP-Tabelle an. Die Menüleiste ändert sich in

Wählen Sie unter dem Menüpunkt Pivot die Option Pivot-Leisten aus (unter Umständen kann diese Option schon ausgewählt sein)! Das nun erscheinende Fenster

ist sowohl eine bildliche Darstellung als auch eine Steuerungsmöglichkeit der Tabelle. Positionieren Sie den

Kursor auf ein Pivot-Symbol , um zu sehen, welchen Teil der Tabelle dieses symbolisiert. Das Pivot-Symbol der Spalten-Leiste entspricht zum Beispiel den gewählten Statistiken: Häufigkeit (hier Anzahl

26

SPSS für Windows

genannt), Prozent innerhalb der Zeilen und Prozent innerhalb der Spalten. Ziehen Sie dieses Symbol aus der Leiste Schicht nach Zeile ...

...und inspizieren Sie die veränderte Tabelle! Ziehen Sie nun das Symbol für Variablen (aktuell das linke Quadrat der Zeile) nach Spalte, das für Geschlecht nach Zeile und beobachten Sie die Veränderung der tabellarischen Darstellung!

Durch Pivoting kann man also auf bequemer Weise Zeilen, Spalten und Schichten tauschen.

!Tipp

Die Menüpunkte des Pivot-Fensters bieten einige einfache Aktionen automatisch an, unter anderem:

Zeilen und Spalten vertauschen

Schichten in Zeilen verschieben

Schichten in Spalten verschieben

Dieses einfache Beispiel zeigt lediglich das Prinzip des Arbeitens mit Pivot-Tabellen. Solche Tabellen können deutlich komplexer sein als die unseres kleinen Beispiels: Die Steuerung auch komplexerer Tabellen bleibt aber prinzipiell unverändert.

Grafik(Falls nicht getan: Öffnen Sie die Datei data.sav!)

Grafische Ausgabe kann als „Nebenprodukt“ einiger Prozeduren (wie zum Beispiel, wie gesehen, OLAP-Würfel) erzeugt werden, wird aber meist über den Menüpunkt Grafiken kreiert.

Über Analysieren + Deskriptive Statistik + Häufigkeiten öffnen Sie folgendes Prozedurfenster, über das man beispielsweise ebenfalls Grafiken als Nebenprodukt erzeugen kann:

Übertragen Sie die Variable Englisch in das Variable(n)-Fenster; schalten Sie Häufigkeitstabellen anzeigen aus (die darauf erscheinende Warnung können Sie ignorieren!) und betätigen Sie die Taste Statistik..., um ein Subfenster mit weiteren Steuermöglichkeiten zu öffnen. Wählen Sie Mittelwert und Standardabweichung (Std. Abweichung) aus! Quittieren Sie mit Weiter... Ihre Auswahl! Öffnen Sie nun das Diagramme...-Subfenster und aktivieren Sie Histogramme und Mit Normalverteilungskurve:

27

SPSS für Windows

Quittieren Sie mit Weiter diese Auswahl und führen Sie über OK die Prozedur aus!

Es erscheint die übliche Titelzeile (hier: Häufigkeiten), eine zusammenfassende Statistiktabelle mit den von Ihnen ausgewählten Statistiken, sowie die gewünschte Graphik.

Statische Grafik

Über Grafiken + Galerie erhält man einen Überblick über die verschiedenen von SPSS unterstützten Grafiktypen.

Weitere Einzelheiten zur Steuerung bestimmter Grafiktypen erhält man durch Anklicken des entsprechenden Symbols.

An dieser Stelle beschreiben wir die am häufigst anzutreffenden Grafikdarstellungen.

BalkendiagrammeÜber Grafiken + Balken erhält man folgendes Steuerfenster:

Die Option Einfach erlaubt die Darstellung von Balken pro Ausprägung einer Kontrollvariablen. Klicken Sie Definieren an:

28

SPSS für Windows

Das Feld Kategorienachse erhält den Namen der (Gruppierungs-)Variablen, deren Ausprägungen zusammengefasst werden sollen (z.B. Schultyp). Per Voreinstellung stellen die so entstehenden Balken die Anzahl der Fälle pro Ausprägung dar. Die Balken können aber andere Funktionen der kategorialen Variablen darstellen: Kumulative Anzahl, Prozent- und kumulative Prozentangaben. Auch mathematische und statistische Funktionen einer zweiten Variablen können dargestellt werden – zum Beispiel die mittlere Deutschnote pro Ausprägung der Variablen Schultyp. Diese Möglichkeiten sind über das Feld Bedeutung der Balken steuerbar.

Über Titel... können Titelzeilen, eine Subtitelzeile sowie Fußnotenzeilen festgelegt werden. Optionen... bietet einige Möglichkeiten zur Behandlung von fehlenden Werten an, unter anderem auch, ob fehlende Angaben in Form eines zusätzlichen Balkens dargestellt werden sollen. Felder anordnen nach erlaubt eine Unterteilung der Darstellung nach den Ausprägungen einer zusätzlichen kategorialen Variablen.

Übung

Erzeugen Sie ein Balkendiagramm, das die kumulative Prozentanteile der Ausprägungen der Schultypen dar-stellt! Übertragen Sie die Variable Geschlecht ins Subfenster Felder anordnen nach und Zeilen!

Unter Bedeutung der Balken klicken Sie Andere Statistik und übertragen Sie die Variable Mathe ins Subfenster Variable. Per Voreinstellung wird der Mittelwert berechnet. Unter Optionen wählen Sie nun Fehlerbalken anzeigen, darunter Standardabweichung und als Multiplikator tragen Sie die Zahl 1 ein.

Übung

Erzeugen Sie ein Balkendiagramm, das die mittleren (mittels Andere Auswertungsfunktion) geschätzten Berufschancen (Variable: Chancen) pro Schultyp darstellt!

Wählt man als Bartyp Gruppiert aus, so wird nach einer zweiten kategorialen Variablen (Gruppen definieren durch) verlangt, deren Ausprägungen die Gruppierung festlegt:

29

SPSS für Windows

Die Auswirkung dieser zweiten Variablen sieht man am einfachsten anhand eines Beispiels:

Übung

Erzeugen Sie ein gruppiertes Balkendiagramm der mittleren Englischnote pro Schultyp (Kategorienachse), ergänzt durch die Gruppierungs-Variablen (Gruppen definieren durch) Geschlecht!

Der Balkentyp Gestapelt ähnelt Gruppiert, die Gruppierungen werden jedoch nicht neben- sondern übereinander dargestellt:

Übung

Erzeugen Sie ein gestapeltes Balkendiagramm der Häufigkeiten der Ausprägungen der Variablen Schultyp (an der Kategorienachse, ergänzt durch die Stapel-Variablen (Stapel definieren durch) Geschlecht!

Gruppen von Fällen (Auswertung über Kategorien einer Variablen), von einzelnen Variablen (Auswertung über verschiedene Variablen) oder von Einzelfällen (Werte einzelner Fälle) können über Grafiken + Balken... grafisch zusammengefasst werden.

Linien-, Flächen-, Kreisdiagramme und BoxplotsDie Steuerung von Linien-, Flächen- und Kreisdiagrammen (Linie..., Fläche... und Kreis...) ähnelt der von Balkendiagrammen sehr und wird deswegen hier nicht näher beschrieben. Boxplots werden später besprochen.

StreudiagrammeStreudiagramme sind das grafische Pendant zu Korrelationen bzw. Regressionsanalysen. Sie werden über Grafiken + Streu-/Punkt-Diagramm... erzeugt:

Übung

Generieren Sie ein einfaches Streudiagramm der Variablen IQ (X-Achse) und Chancen (Y-Achse)!

Aktivieren Sie durch Doppelklick in der Grafik den Diagramm-Editor: Klicken Sie einen der kleinen Kreise

des Diagramms an, um alle zu markieren! Über das Werkzeug fügen Sie eine lineare Anpassungslinie (die Regressionslinie) hinzu!

Übung

Über Streu-/Punkt-Diagramm erzeugen Sie ein einfaches Punktdiagramm, in dessen Zeilen die Verteilung nach Schultypen dargestellt wird!

Gestaltung der graphischen AusgabeOft ist das von SPSS gestaltete Diagramm nicht genau die, die man haben will. Um Diagramme zu editieren, doppelklicke man in der Grafik um den Diagrammeditor zu starten.

Das Prinzip des grafischen Editierens ist einfach: Anklicken und Ändern. Hier gibt es mehrere Varianten:

1. einfaches Anklicken und das gewünschte Werkzeug aus dem Werkzeugkasten benutzen;

30

SPSS für Windows

oder

2. einfaches Klicken, dann noch einmal Klicken, um z.B. Text zu ändern;

oder

3. Doppelklicken und die darauf erscheinende Fenstersteuerung anwenden;

oder aber

4. einfaches Anklicken mit der rechten Maustaste, um an weitere Werkzeuge zu gelangen.

Die einzige Möglichkeit, diese flexiblen und umfangreichen Gestaltungsmöglichkeiten kennen zu lernen, ist zu experimentieren. Daher einige Übungen:

Übung:

Erzeugen Sie ein Balkendiagramm der Häufigkeit der Schüler pro Schultyp! Aktivieren sie durch Doppelklick in dieser Grafik den Diagrammeditor!

Klicken Sie die Beschreibung der Y-Achse („Absolute Werte“) an und ändern Sie (ein zweites Anklicken ist dazu nötig) diese in „Häufigkeit“! Klicken Sie in einem der Balken, um alle zu markieren. Klicken Sie anschließend den Balken für die Hochbegabtenschule und ändern Sie dessen Farbe (Werkzeug in der 2. Reihe)!

Über die rechte Maustaste fügen Sie eine Bezugslinie für die Y-Achse bei 55, eine zweite bei 35! Färben Sie die Line bei 55 rot! Ändern Sie die Stärke beider Linien zu 3!

Das Ergebnis:

Schließen Sie den Diagrammeditor!

Übung:

Über Grafiken + Balken + Definieren und OK erzeugen Sie das Diagramm erneut! Aktivieren Sie den Diagramm-Editor, markieren Sie die Balken und über den Menüpunkt Transformieren ändern Sie den Grafik Typ in eine Liniendarstellung! Wählen Sie eine gestrichelte Linienform mit der Stärke 5 aus!

31

SPSS für Windows

Profildiagramme

Profildiagramme (siehe Diagramm unten) sind nur mit einigen Tricks zu erzeugen. Drei Schritte sind notwendig:

1. Aggregieren der Datei so, dass die unabhängige (Gruppierungs-)Variable als „Break“-Variable, die abhängigen als zu aggregierende Variablen fungieren. Die Funktion belassen wir bei Mittelwert (Mean).

Dies geschieht über Daten + Aggregieren ... und erzeugt eine neue Datei mit so vielen Fällen wie Ausprägungen der „Break“-Variablen, jeweils mit den Mittelwerten pro Ausprägung der aggregierten Variablen.

Mit der Data data.sav und dem Steuerfenster zum Aggregieren wie folgt ausgefüllt

enthält die neue Datei (hier: aggr.sav) zwei Fälle (den Ausprägungen der Variablen Geschlecht entsprechend) mit den jeweiligen Mittelwerten der Noten:

2. Transponieren (über: Daten + Transponieren) dieser Datei, wobei die „Namensvariable“ die unabhängige Variablen (hier: Geschlecht) , die „Variablen“ die abhängigen Variablen (hier: die Noten) sind.

Nun sieht die aggregierte Datendatei so aus:

Über den Reiter „Variablenansicht“ ändern Sie die Variablenlabel-Definitionen, um Folgendes zu erreichen:

3. Nach der Definition der Variablenlabels erzeuge man mittels Grafiken + Linie ... und die Auswahl von Mehrfach sowie Auswertung über verschiedene Variablen das Diagramm: Die CASE_LBL (für das Diagramm in „Noten“ umbenannt) bildet die Kategorienachse, die restlichen Variablen werden ins Feld Linien entsprechen übertragen. Als Titel wähle man „Leistungsprofile der Geschlechter“.

Das Ergebnis nach etwas Überarbeiten mit dem Diagrammeditor (versuchen Sie, dies selber zu realisieren!) ist ein Diagramm der Notenprofile beider Geschlechter:

32

SPSS für Windows

Deutsch Englisch Mathe

Fach

0,0

2,5

5,0

7,5

10,0

12,5

15,0M

ittle

re A

bi-N

ote

männlichweiblich

Identifizierung einzelner Punkte (Fälle) einer Grafik

Übung

Erzeugen Sie ein einfaches Streudiagramm, das den Grad des Zusammenhangs zwischen der Englischnote (Y-Achse) und dem IQ (X-Achse) darstellt. Aktiveren Sie durch Doppelklick den Diagrammeditor, klicken Sie

dort auf das Symbol und markieren Sie mit dem daraus entstehenden neuen Cursor einige, beliebige Punkte des Diagramms, um die Fälle zu identifizieren. Die ausgegebene Zahl ist die aktuelle Reihenfolge des markierten Falles im Datenfenster (entspricht also der grauen Spalte links neben den Daten). Klicken Sei erneut, um diese Identifkationszahl wieder verschwinden zu lassen! Ein zweites Anklicken des Werkzeugs ändert den Cursor in die übliche Pfeil-Variante zurück.

Zur Identifikation der Fälle kann man bei einigen Grafiktypen eine Variablen zur Fallbeschriftung angeben, deren Werte beim Anwenden dieses Werkzeugs angezeigt werden. Erzeugen Sie erneut das Streudiagramm, übertragen Sie jedoch die Variable Bogen ins Feld „Fallbeschriftung“! Wiederholen Sie obige Editiervorgänge!

33

SPSS für Windows

Interaktive Grafik

(Falls nicht schon getan, starten Sie SPSS mit dem Datensatz data.sav!)

Gesteuert wird die interaktive Grafik über Grafiken + Interaktiv:

Anhand der Band-(Schleifen-)Grafik werden weitere Aspekte der Steuerung der interaktiven Grafik vorgestellt: Wählen sie Band...! Es erscheint das zwar Band-spezifische, aber in seinen Gestaltungsmöglichkeiten für die interaktive Grafik typische Steuerungsfenster:

34

SPSS für Windows

Die Reiter (Variablen zuweisen, Bänder, Fehlerbalken, Titel und Optionen) beschreiben steuerbare Aspekte der Grafik. Allgemein zu allen interaktiven Grafiken ist Variablen zuweisen:

links ist die übliche Variablenliste mit drei der Grafik zugrunde gelegten Variablentypen:

1. SPSS-interne Variablen wie Count (Anzahl, Häufigkeit):

2. Kategoriale Variablen mit einigen, wenigen Ausprägungen, üblicherweise ohne numerische Bedeutung, wie hier Geschlecht:

3. Skalen-Variablen, die eine Quantifizierung implizieren, wie hier IQ:

rechts oben ein Knopf zur dimensionalen Gestaltung (2D oder 3D) der Graphik:

Darunter befindet sich eine Darstellung der X-Achse (waagrechter Pfeil), der Y-Achse (senkrechter Pfeil) und einer möglichen Z-Achse (nach „hinten“ weisender Pfeil), jeweils mit (hier noch leeren) Felder für die darzustellenden Variablen:

Per Voreinstellung wird bei der Band-Grafik die Anzahl Fälle in der Y-Richtung pro Wert der X-Achsen-variablen dargestellt.

Übung

Übertragen Sie (bei der interaktiven Grafik heißt das: Packen und Ziehen) die Variablen Deutsch in das X-Achsen- (horizontales) Variablenfeld.

Mit OK erzeugen Sie die Grafik. Aktivieren Sie mit einem Doppelklick die interaktive Steuerung, unter anderem mit folgendem Steuerungsfenster (der so genannten 3-D Palette):

Mit den Rändelrädern können Sie die Grafik in waag- bzw. senkrechter Richtung, mit dem Rotationswerkzeug

in beiden Richtungen gleichzeitig drehen; mit der Lampe die Lichtquelle sowohl in der Stärke als auch in der Positionierung ändern. Experimentieren Sie!

Das interaktive Werkzeugkasten

unterstützt weitere Steuerungsmöglichkeiten:

35

SPSS für Windows

bietet die restlichen Steuerungsfelder des Fensters Variablen für Grafik zuweisen interaktiv an:

So können Sie zum Beispiel statt der Deutschnote eine andere Variablen auf der waagrechten Achse darstellen; oder weitere Variablen farblich darstellen; oder Variablen zur Gestaltung der Linientypen bzw. Größe von Symbolen benutzen; oder die 3D-Darstellung in eine 2D-Darstellung mit 3D-Effekt aktivieren.

Übungen:

Ziehen Sie die Variablen Geschlecht in das Feld Farbe: unter Legendenvariablen und inspizieren Sie das Ergebnis!

Ziehen Sie die Variablen Geschlecht in die Z-Achse (3. Dimension, nach „hinten“ weisend)!

Markieren Sie das Mädchen-darstellende Band und ändern Sie Farbe und Schraffur !

Ziehen Sie nun das Geschlecht in das Feld Styles: unter Legendenvariablen und inspizieren Sie das Ergebnis!

Übertragen Sie anschließend die Art der Schule in das Feld Feldvariablen und inspizieren Sie das Ergebnis!

erlaubt das Einfügen weiterer Elemente in der Grafik. Klicken Sie das Werkzeug an und wählen Sie Balken aus!

bietet über ein Übersichtsbild (den Diagramm-Manager) die Steuerung verschiedener Elemente der Grafik an:

36

SPSS für Windows

Durch Markieren des gewünschten Bildaspektes und z.B. Auswahl von Bearbeiten... können sie weitere Gestaltungsmöglichkeiten realisieren. Experimentieren Sie damit!

!Tipp

Ein Doppelklick auf den gewünschten Grafikteil aktiviert automatisch die Funktion des Editierens.

ordnet automatisch Elemente einer Grafik.

Mit den Pfeilen bzw. können ausgeführte Befehle rückgängig gemacht bzw. wieder aktiviert werden.

Mittels kann die 3D-Gestaltung gesteuert werden:

Die 3D-Beleuchtung unterstützt die gleiche Funktionalität wie die Lampe der 3D-Palette; und letztere kann mittels des Feldes neben 3D-Palette aktiviert oder deaktiviert werden.

Über das 3D-Symbol kann die Grafik als 2D, 2D mit 3D-Wirkung oder aber mit einem 3D-Koordinatensy stem gestaltet werden.

Am linken Rande des interaktiven Diagrammeditors befinden sich weitere Werkzeuge, um

zwischen dem Zeiger , Texteingabe bzw. Rotierungswerkzeug zu schalten.

einfache Aspekte der Grafik zu gestalten: Farben, Schraffurmuster, Symbole und Symbolgrößen, Linientypen und -stärke.

Die rechte Maustaste bietet auch viele kontextspezifische Gestaltungsmöglichkeiten an. Vor allem verlangen einige Prozeduren bestimmte Datentypen: Versucht man zum Beispiel ein Histogramm von Ordinal-Variablen zu erzeugen, so erscheint die Fehlermeldung

Nach dem Quittieren mit OK kann der Typ der Variablen über die rechte Maustaste geändert werden.

37

SPSS für Windows

Man verlässt den interaktiven Diagrammeditor durch Klicken im Ausgabefenster irgendwo außerhalb des Diagramms.

!Tipp:

Die beste Möglichkeit, die Vielseitigkeit der Grafikfunktionalität kennen zu lernen, ist zu experimentieren. Also: Spielen Sie!

Übungen:

Versuchen Sie, folgende Grafiken nachzubilden:

1. Balkendiagramm mit veränderter Balkenform und visueller Kennung ausgewählter Balken:

2. Verbundliniendiagramm:

!Tipp dazu:

Geschlecht ins Feld „Muster“ ziehen! Über den Reiter „Verbundlinien die Variante „Linie“ aktivieren!

38

SPSS für Windows

3. Histogramm: 3D-Darstellung zweier Gruppen, Gitter-Linien, spezieller Färbungsstil.

!Tipp – und ein ganz wichtiger dazu!

Viele dieser dreidimensionalen, bunt gefärbten und beleuchteten Grafiken sehen zwar imposant aus. Man muss sich aber über den Zweck solcher Grafiken Gedanken machen: Im universitären Bereich geht es nicht darum, zu imponieren, sondern zu informieren – Daten zusammenzufassen, Ergebnisse schnell und präzis zu vermitteln.

Vergleichen Sie folgende Grafiken:

Informativer und vor allem deutlich leichter zu lesen ist die zweite, einfachere Variante, die somit für wissenschaftliche Berichte besser geeignet ist. Beantworten Sie durch Inspizieren dieser beiden Grafiken beispielsweise die Frage „Wie viele Kinder haben genau 11 Punkte bei Ihrer Deutschprüfung erreicht?“.

39

SPSS für Windows

(In diesem Falle allerdings täuscht die Darstellung als Line eine kontinuierliche Variable vor. Angenommen, nur ganzzählige Note wären vergeben, so wäre ein Balkendiagramm vorzuziehen.)

Übung:

Erzeugen Sie entweder mit der konventionellen oder mit der interaktiven Grafik in Balkendiagramm: Y-Achse ist die Anzahl, X-Achse die Deutschnote.

Syntax-FensterSPSS wird durch Kommandos gesteuert. Eine Vielzahl dieser Steuerbefehle wird automatisch durch Anklicken erzeugt und ausgeführt, ohne dass der Anwender etwas von den Befehlen im Hintergrund merkt. Man kann solche Befehle aber explizit in einem speziellen Syntax-Fenster schreiben lassen und dort editieren (ändern, ergänzen, ...). Diese Syntax-Fenster spielen eine wichtige Rolle in der Handhabung des Programms, denn mehrere Optionen und sogar ganze Prozeduren können nur über sie gestartet und gesteuert werden.

Das SPSS Syntax Reference Guide enthält detaillierte Beschreibungen der Befehlssyntax des Base Systems; Syntax zu den restlichen, fortgeschritteneren Teilen des Programms sind in den Spezialhandbüchern enthalten (siehe Anhang B: Dokumentation).

Syntax-Fenster haben weitere Vorteile:

zur Protokollierung Ihrer Analysen (zum Beispiel als Anhang in Ihrer Arbeit)

zur exakten Wiederholen von Vorgängen, etwa mit anderen Datensätzen (so genanntes „Batch-Processing“)

zum Wiederholen von Vorgängen nach Beseitigung von Datenfehlern. Es ist erstaunlich, wie oft Datenfehler auch nach vielen Analysen entdeckt werden, und mehr als lästig, nach der Korrektur, alle Analysen wiederholen zu müssen – es sei denn, Sie haben diese in Form von Syntaxbefehlen gespeichert.

!Tipp

Viele Statistikprozeduren benötigen wesentlich komplexere Befehle als die dieses einfachen Beispiels. Gerade in solchen Fällen kann es Zeit sparend sein, beim ersten Aufruf einer Prozedur die Ausgabe so zu gestalten, wie man sie haben will und die Syntax dazu zu generieren, um dann bei weiteren Aufrufen (zum Beispiel, um andere Variablen zu untersuchen), das Syntaxfenster einfach zu editieren und auszuführen.

Und so wird’s gemacht:

Die meisten Fenster unterstützen einen Knopf Einfügen, mit welchem man die durch Anklicken generierten Befehle in ein Syntax-Fenster schreiben lassen kann.

Wie bei Viewer-Fenstern kann man auch mehrere Syntax-Fenster öffnen. Auch hier gelten die Begriffe aktiv und designiert; und die Schaltung zwischen den möglichen Zuständen wird genauso wie bei Viewer-Fenstern realisiert.

Übung

Über Analysieren + Deskriptive Statistiken + Kreuztabellen übertragen Sie Geschlecht ins Feld „Zeilen“, Schultyp ins Feld „Spalten“.

Betätigen Sie nun Einfügen (statt OK): Es öffnet sich automatisch ein Syntax-Fenster mit den Befehlen zu Ihrem Kreuztabellen-Aufruf:

40

SPSS für Windows

Positionieren Sie den Cursor irgendwo innerhalb des Befehls: Klicken Sie nun auf , um eine Zusammen-fassung der Kreuztabellen-Syntax zu erhalten: Für die genaue Steuerung braucht man wohl die (umfangreichen und unübersichtlichen) Syntax-Handbücher — die Befehle sind jedoch oft so verständlich, dass man ohne weitere Kenntnisse sie sinnvoll ändern kann. So ist es im obigen Beispiel klar, dass eine Kreuztabelle der Variablen Geschlecht und Schultyp erzeugt wird. Möchte man eine Kreuztabelle von Geschlecht und Klasse, so könnte man die Syntaxbefehle selbst per Hand ändern, ohne die Klickerei zu wiederholen – ändern Sie einfach per Hand „Schultyp“ in „Klasse“.

Ausgeführt werden Befehle im Syntaxfenster durch Markieren der auszuführenden Befehle und Klicken des

Knopfes . Schließen Sie danach dieses Fenster!

Exportieren von SPSS-Ausgabe nach WordDer bekannte Vorgang Kopieren + Einfügen (Copy + Paste) funktioniert zwischen SPSS und Word wie bei anderen Programmen auch.

Beim Exportieren von Tabellen allerdings führt dieser Vorgang zu Erzeugen einer Word-Tabelle, deren Formatierung oft unbefriedigend ist. Wendet man statt Einfügen die Option Inhalte Einfügen und Grafik, so erscheint die Tabelle in der meist attraktiveren Form, wie SPSS sie produziert. Das Editieren dieser Tabelle innerhalb von Word ist zwar nicht mehr leicht möglich, denn Word versteht sie ja als Grafik, aber in den seltenen Fällen, wo eine Veränderung notwendig ist, ist diese sowieso bequem und rapide in SPSS zu realisieren.

Übungen zu Teil 1Schließen Sie die SPSS-Sitzung!

Starten Sie SPSS!

Starten Sie SPSS mit der Datei data2.sav!

Inspizieren Sie die Definition der Variablen Geschlecht und stellen Sie sicher, dass folgende Definitionen gelten:

Variablenetikett: „Geschlecht“;

Wertelabels: m = „männlich“, w = „weiblich“;

Spaltenformat: 8, Dezimalstellen: 2.

Mit der interaktiven Grafik erzeugen Sie eine 2-dimensional Verbundlinie, die die Anzahl ($count) Personen pro Deutschnote für beide Geschlechter getrennt (Geschlecht ins Feld „Muster“ übertragen) darstellt! Über den Reiter „Verbundlinien“ schalten Sie die Punkte aus, die Linien ein! Klicken Sie OK!

Im interaktiven Diagramm-Editor entfernen Sie (rechte Maustaste!) die Erläuterung („Punkte/Linie zeigen Häufigkeiten“)! Entfernen Sie ebenfalls mit der rechten Maustaste die senkrechten Verbundlinien!

Ändern Sie bei beiden Achsen über den Reiter „Beschriftungen“ die Zahlendarstellung so, dass keine Nachkommastellen angezeigt werden! Die X-Achse hat von 0 bis 15 in Schritten von 5 zu laufen:

41

SPSS für Windows

männlichweiblich

Geschlecht

2,50 5,00 7,50 10,00 12,50

Deutschnote

0

5

10

15

Anz

ahl

Öffnen Sie ein neues, leeres Datenfenster! (Die gerade benutzte Datei data2.sav müssen Sie nicht sichern!)

Erfinden Sie und geben Sie Daten für vier Patienten einer Klinik für Gewichtskontrolle ein:

Patientennummer (3-stellig, keine Nachkommastellen, Werte größer 25); Geschlecht (0=männlich, 1 = weiblich); und zwei experimentelle Messungen zwischen 1 und 25 (Variablennamen: id geschl exp_1 exp_2), wobei die 2. Messung größer/gleich die 1. sein soll.

Sichern Sie diese Daten in der Datei kg2.sav!

Lesen Sie Datei kgl.sav ein, die Daten zu weiteren Patienten der Gewichtskontrollstudie enthält! Mischen Sie die neuen Fälle aus kg2.sav hinzu!

Berechnen Sie pro Fall die Differenz zwischen den beiden experimentellen Variablen!

Sortieren Sie die Datei absteigend nach dem Wert dieser Differenz!

Bilden Sie ein neue Gruppierungsvariablen (gruppe): Ist die eben berechnete Differenz kleiner 10, so erhält gruppe den Wert 1, sonst den Wert 2.

Erstellen Sie eine Kreuztabelle gruppe geschl! Aktivieren Sie die durch Doppelklick in der Tabelle die OLAP-Funktionalität und tauschen Sie die Reihen und Spalten dieser Tabelle! Ändern Sie die Überschrift in Therapieerfolg und Geschlecht!

Erstellen Sie ein Histogramm der berechneten Differenz! Ändern Sie Farbe und Schraffur der Grafik!

Sichern Sie die gesamte Datei unter dem Namen kg_gesamt.sav!

Beenden Sie die SPSS-Sitzung!

42

Teil 2: AnwendungsbeispieleSPSS unterstützt eine sehr breite Palette von statistischen Prozeduren. Dieser Teil des Kurses befasst sich mit einigen wenigen der häufigeren und einfacheren Anwendungsgebieten.

Das Ziel hierbei ist ein Zweifaches: 1. Das bisher Gelernte zu befestigen und auszubauen; 2. Grundkenntnisse der Steuerung und der Interpretation einiger Basisstatistikverfahren zu vermitteln.

Dieser Teil behandelt:

einfache beschreibende Statistik

einfache vergleichende (inferentielle oder Prüf-) Statistik

Zur Vorbereitung:

Öffnen Sie die Datei data2.sav!

Beschreibende Statistik

Häufigkeiten und Histogramme

Über Analysieren + Deskriptive Statistiken + Häufigkeiten erhalten Sie folgendes Fenster:

Zur Erinnerung: Typisch für die Steuerung der Statistik- und Grafikprozeduren sind:

die Liste der Variablen (links) (die ja mittels Bearbeiten + Optionen unter dem Reiter Allgemein und dort unter Variablenlisten umgestaltet werden kann)

!Tipp

Klicken Sie mit der rechten Maustaste auf einem Variablennamen (nehmen Sie hier Geschlecht als Beispiel) und anschließend auf Info zu Variable, um ein kurze Zusammenfassung deren Variablendefinition zu erhalten!

Das nach rechts weisende Dreieck erlaubt das Übertragen markierter Variablennamen nach weiteren Fenstern – im aktuellen Falle (Prozedur Häufigkeiten) ein einziges Variable(n)...-Fenster.

Die Knöpfe oben rechts haben folgende Funktionen:

OK führt die Befehle aus.

Einfügen schreibt die Befehle in Klartext in ein Syntax-Fenster.

Zurücksetzen bringt das Fenster in den ursprünglichen Zustand wieder (d.h. alles, was bisher definiert wurde, wird „vergessen“ und die vorherigen Definitionen wiederhergestellt).

Abbrechen schließt das Fenster, ohne die Befehle auszuführen.

7. Auflage / April 2000

SPSS für Windows

Hilfe Bietet Unterstützung und lnformationen mittels der Windows-typischen Hypertext-Schnittstelle an.

Weitere, prozedurspezifische Optionen können durch Auswählen bzw. Knopfdruck gesteuert werden.

Zur grafischen Darstellung von Häufigkeiten gibt es zwei Möglichkeiten:

1. Kontinuierliche Variablen, bei denen prinzipiell jeder Wert innerhalb eines Bereichs und der Messpräzision vorkommen kann, werden als Histogramme dargestellt. Beispiele: Alter in Jahren, Größe in cm.

!Tipp

Hier ist es ratsam, die Option Häufigkeitstabellen anzeigen auszuschalten! (Falls Sie sehen wollen, warum, lassen Sie sie eingeschaltet!)

2. Diskrete (kategoriale, meist Gruppierungs-)Variablen, die lediglich einige, wenige Werte (Ausprägungen oder Kategorien) aufweisen, können als Balken(Säulen-) oder Kreisdiagramme dargestellt werden. Beispiele: Geschlecht, Altersgruppierungen, Nationalität. Hier hat die Häufigkeitstabelle wieder einen Sinn.

Übung

Erzeugen Sie (mittels Häufigkeiten) ein Histogramm der (kontinuierlichen) Variablen IQ (vergessen Sie nicht, die Häufigkeitstabelle auszuschalten)! Wählen Sie über den Knopf Statistik... Mittelwert und Std.-Abweichung (Standardabweichung), über den Knopf Diagramme... Histogramme sowie Mit Normalverteilungskurve aus!

Einfache beschreibende Statistik und Grafiken

Über Analysieren + Deskriptive Statistiken + noch einmal Deskriptive Statistiken erhält man eine Tabelle mit ausgewählten Statistiken.

Übung

Aktivieren Sie die Prozedur Deskriptive Statistiken und untersuchen Sie die Variable IQ!

Verteilungsstatistiken und -darstellungen

Über Analysieren + Deskriptive Statistiken + Explorative Datenanalyse... kann man explorative sowie einige beschreibende Statistiken und Grafiken erzeugen – Boxplots, beispielsweise.

Übung

Geben Sie mittels Explorative Datenanalyse beschreibende Statistiken zur abhängigen Variablen Attitude aus! Benutzen Sie die Variable Geschlecht als einzigen Eintrag in der Faktorenliste, um getrennt pro Geschlecht beschreibende Statistiken auszugeben!

Das Explore-Fenster unmittelbar vor dem Ausführen sieht so aus:

Über den Knopf Diagramme... erzeugen Sie Boxplots: Schalten Sie die Stengel-Blatt-Darstellung aus!

44

SPSS für Windows

m w

Geschlecht

0,00

1000,00

2000,00

3000,00

4000,00

5000,00

6000,00Ei

nste

llung

zur

eig

enen

Zuk

unft

29

49

Zur Interpretation eines Boxplots:

Für die Schüler (m) und Schülerinnen (w) getrennt werden die Verteilungen nichtparametrisch dargestellt: Der dicke Balken im schraffierten Bereich (Box) ist der Median: Würde man die Stichprobe anhand der dargestellten Variablen Attitude sortieren, so ist der Median der Wert, der die Person genau in der Mitte dieser Sortierung geliefert hat. Hätten z.B. 264 Fälle Werte zur Variablen Attitude geliefert, so ist der Median der Wert, den die 132. Person lieferte. Hier haben wir die Mediane beider Geschlechter getrennt dargestellt. 50% der Fälle insgesamt liegen in der Box: Der obere Rand der Box halbiert wiederum die obere Hälfte der Stichprobe (der Rand liegt also am 75. Perzentil). Entsprechendes gilt für die untere Hälfte: Der untere Rand entspricht dem 25. Perzentil. Die kleinen Kreise zeigen so genannte Ausreißer an – Werte, die mehr als 1,5 Box-Längen vom 75. Perzentil entfernt liegen. Noch extremere Werte werden als Sternchen dargestellt: Diese liegen mehr als 3 Box-Längen vom 75. bzw. 25. Perzentil entfernt. Die dünnen, waagrechten Striche zeigen die höchsten bzw. niedrigsten beobachteten Werte, die keine Ausreißer sind.

Zur inhaltlichen Interpretation dieses Boxplots: im Schnitt sehen die Schülerinnen dieser Stichprobe ihre Zukunft mit weniger Zuversicht entgegen als die Schüler.

Solche Plots sagen natürlich nichts über die statistische Signifikanz des Unterschieds aus, das heißt, inwieweit man den Schluss ziehen darf, dass Mädchen im Allgemeinen Ihre Zukunftschancen schlechter einschätzen als Buben – dafür werden die später zu besprechenden statistischen Tests benötigt. Sie sind jedoch eine wichtige, visuelle Darstellung der Daten.

!Tipp

Es gehören sowohl passende statistische Tests als auch geeignete grafische Darstellungen gemeinsam in einer Veröffentlichung!

Diese Plots helfen auch bei der zentralen Frage nach dem praktischen Belang vom Unterschied (formal: nach dem Effekt), eine Frage, die nur aus inhaltlichen (zum Beispiel in diesem Fall didaktischen) Überlegungen entschieden werden kann.

einige Ausreißer (vor allem Fall 49) sind in diesem Boxplot erkennbar: Die Daten dieser Fälle sollten näher inspiziert werden, denn solche Extremwerte könnten falsch eingetragene Daten sein (bei diesem aktuellen Datensatz sind sie es nicht).

45

SPSS für Windows

Man könnte überlegen, ob die angezeigten Ausreißer aus der Analyse ausgeschlossen werden sollten:

!Tipp

Der Diagrammeditor bietet folgendes Werkzeug an, durch das man individuelle Punkte identifizieren und auch entfernen kann:

Übung

Aktivieren Sie durch Doppelklick im Bereich der Grafik den Diagrammeditor, und benutzen Sie dieses Identifikationswerkzeug um die Fall-Identifikation zu inspizieren bzw. auszuschalten!

!Tipp

Ausreißer können auch über die Sortierfunktion von SPSS identifiziert werden. Sortieren Sie (im Datenfenster über Daten + Fälle sortieren...) den Datenbestand absteigend nach der Variablen Attitude: Die Fälle mit extrem hohen Werten sind dann die ersten des Datenfensters. Fälle mit extrem niedrigen Werten sind am unteren Ende der Daten.

Über Analysieren + Tabellen + Einfache Tabellen... können die relevanten Statistiken tabellarisch ausgegeben werden. Übertragen Sie die Variablen wie folgt:

Wählen Sie unter Statistik... 25. Perzentil, Median sowie 75. Perzentil (in dieser Reihenfolge) aus und führen Sie mit OK die Analyse durch, um folgende Tabelle zu erhalten (Anmerkung: die Überschrift „Geschlecht“ und die Wertelabels „männlich“ und „weiblich“ erscheinen natürlich nur bei entsprechend definiertem Labels!):

Geschlecht

männlich weiblich

25. Perzentil Median 75. Perzentil 25. Perzentil Median 75. Perzentil

Einstellung zur eigenen Zukunft 2447,29 3151,02 3595,96 1684,30 2013,12 2449,53

Übung

Erzeugen Sie eine Tabelle der Mittelwerte und Standardabweichungen der Variablen IQ der drei Schultypen!

Übung

Erzeugen Sie eine Tabelle mit denselben Mittelwertstatistiken, aber für Schüler und Schülerinnen getrennt!

!Tipp

Experimentieren Sie auch mit der komplexeren Tabellenvariante (Analysieren + Tabellen + Allgemeine Tabellen...)!

46

SPSS für Windows

Kreuztabellen: Untersuchung kategorialer Variablen

Öffnen Sie, falls nötig, die Datei data2.sav!

Über Analysieren + Deskriptive Statistiken + Kreuztabellen kann man Kreuztabellen gestalten.

Übung

Öffnen Sie ein neues Ausgabe-Fenster!

Übung

Erzeugen Sie eine Kreuztabelle: Ausprägungen der Variablen Klasse bilden die Zeilen, Ausprägungen der Variablen Altersgp bilden die Spalten dieser Tabelle!

Übung

Öffnen Sie erneut das Kreuztabellen-Steuerungsfenster und fügen Sie als Schicht-Variablen Geschlecht hinzu! Klicken Sie OK, aktivieren Sie die so erzeugte Pivot-Tabelle (und falls nötig über den Menüpunkt „Pivot“ die Pivot-Leisten-Fenster) und gestalten Sie diese Tabelle so um, dass die Schichten durch Altersgp, die Zeilen durch Klasse und die Spalten durch Geschlecht bestimmt werden!

Inspizieren Sie alle Schichten dieser Tabelle!

PrüfstatistikDie klassischen parametrischen Testverfahren (T-Test, Varianzanalyse, ...) basieren auf Annahmen der Verteilung der zu untersuchenden (abhängigen) Variablen. In den meisten Fällen wird die so genannte „Normalität“ dieser Verteilung angenommen. (Die LRZ-Schrift SPSS for Windows Special Topics: Einige Grundbegriffe der Statistik enthält Einiges zu diesem Thema: Siehe Anhang B.)

Korrelation

Falls nötig, öffnen Sie die Datei data.sav!

Die passende Grafik zur Korrelation ist das Streudiagramm – hier anhand der Korrelation zwischen IQ und der Mathenote: Grafiken + Streu-/Punkt-Diagramm… + Auswahl von Einfaches Streudiagramm:

47

SPSS für Windows

(Es ist üblich, die abhängige Variable in der Y-, die unabhängige in X-Achse darzustellen: in diesem Fall wird die Mathenote als von dem IQ abhängig betrachtet.)

Das Ergebnis:

80,00 100,00 120,00 140,00 160,00

Intelligenzquotient

0,00

2,00

4,00

6,00

8,00

10,00

12,00

14,00

Mat

hem

atik

note

Jeder Punkt im Diagramm stellt eine oder mehrere Personen dar: deutlich zu sehen ist das für eine positive Korrelation typische Muster, eine von unten links nach oben rechts steigende Punktwolke.

48

SPSS für Windows

Der dazugehörige Korrelationskoeffizienten ist entweder der Pearson’sche Koeffizient r, der den linearen Zusammenhang zwischen zwei Variablen quantifiziert; oder aber der Spearman’sche Koeffizient rho, der den monotonen Zusammenhang misst. (Dementgegen, was in einigen Büchern zu lesen ist, setzt die Berechnung des Pearson’schen Koeffizienten keine Normalverteilung voraus! Die Normalverteilung wird lediglich für die Berechnung der Signifikanz dieses Koeffizienten angenommen.). Das Steuerungsfenster erlaubt es auch, ein- oder zweiseitige Signifikanzen zu berechnen, unterstützt jedoch leider keine Korrektur für die Signifikanzwerte mehrerer gegenseitig abhängigen Koeffizienten.

Füllen Sie das mittels Analysieren + Korrelation + Bivariat … geöffnete Steuerfenster wie folgt aus:

um die Ergebnisse zu r und zu rho zu erhalten:

Korrelationen

1 ,708**,000

263 263,708** 1,000263 263

Korrelation nach PearsonSignifikanz (1-seitig)NKorrelation nach PearsonSignifikanz (1-seitig)N

Intelligenzquotient

Mathematiknote

Intelligenzquotient

Mathematiknote

Die Korrelation ist auf dem Niveau von 0,01 (1-seitig) signifikant.**.

Korrelationen

1,000 ,661**. ,000

263 263,661** 1,000,000 .263 263

KorrelationskoeffizientSig. (1-seitig)NKorrelationskoeffizientSig. (1-seitig)N

Intelligenzquotient

Mathematiknote

Spearman-Rho

Intelligenzquotient

Mathematiknote

Die Korrelation ist auf dem 0,01 Niveau signifikant (einseitig).**.

Es ist üblich im Falle vom Pearson’schen Koeffizienten nicht nur den einfachen r sondern auch r2 als Maß der Effektgröße (Proportion gegenseitig erklärter Varianz) zu berichten. In Ihrer Arbeit könnte zum Beispiel stehen:

49

SPSS für Windows

Zum Testen der Hypothese, dass IQ und Mathe einen positiven linearen Zusammenhang aufweisen wurde der Pearson’sche Koeffizient r herangezogen. Die Hypothese wurde bestätigt: r = 0,71, p < 0,001; r2 = 0,50 – d.h. 50% der gemeinsamen Varianz wird durch diesen Koeffizienten erklärt.

Mittelwertvergleiche: T-Test

Der T-Test erlaubt Mittelwertvergleiche entweder:

anhand von einer Variablen gemessen an zwei zu vergleichenden Gruppen; oder

innerhalb einer einzigen Gruppe anhand von zwei zu vergleichenden Variablen (d.h.: jeder Fall liefert beide Variablen).

Öffnen Sie, falls nicht schon getan, die Datei data2.sav!

Gruppenvergleiche mit dem T-Test bei unabhängigen Stichproben

Der T-Test für unabhängige Stichproben testet, ob zwei Gruppen sich im Mittel anhand von einer Variablen statistisch unterscheiden. Über Analysieren + Mittelwerte vergleichen + T-Test bei unabhängigen Stichproben... erhält man folgendes (hier: schon ausgefülltes Fenster):

(Die zu vergleichenden Ausprägungen „0“ und „1“ der Gruppierungsvariablen Geschlecht werden über den Knopf Gruppen def. ... festgelegt.) Klicken Sie OK!

Unsere Hypothese: Mädchen haben im Mittel signifikant höhere Noten in Englisch als Junge.

Das Ergebnis dieses Tests:

Der erste Teil dieser Ausgabe (Gruppenstatistiken) enthält beschreibende Statistiken zu den beiden Gruppen: Hier werden die Geschlechtsgruppen anhand der Englischnote verglichen. Die Mädchen haben einen rein numerisch höheren Mittelwert als die Jungen. Ob dieser im statistischen Sinne höher ist, wird in der zweiten Tabelle dargestellt.

50

Gruppenstatistiken

21 3,3810 1,65759 ,3617229 9,4483 2,09738 ,38947

Geschlechtmw

EnglischnoteN Mittelwert

Standardabweichung

Standardfehler des

Mittelwertes

Test bei unabhängigen Stichproben

,897 ,348 -10,992 48 ,000 -6,06732 ,55197 -7,17714 -4,95751

-11,415 47,578 ,000 -6,06732 ,53153 -7,13629 -4,99836

Varianzen sind gleichVarianzen sind nichtgleich

EnglischnoteF Signifikanz

Levene-Test derVarianzgleichheit

T df Sig. (2-seitig)Mittlere

DifferenzStandardfehler der Differenz Untere Obere

95% Konfidenzintervallder Differenz

T-Test für die Mittelwertgleichheit

SPSS für Windows

Der klassische T-Test beruht auf der Annahme der gleichen Varianzen für beide zu vergleichenden Gruppen. Die Spalten mit der Überschrift Levene Test der Varianzgleichheit teilen mit, inwieweit diese Annahme erfüllt ist. Ist dieser F-Test signifikant (oft wird hier p < 0,1 als Grenzwert genommen), so unterscheiden sich die Varianzen und man lese die unterste Zeile der Tabelle (Varianzen sind nicht gleich), die eine Korrektur für die ungleichen Varianzen enthält. Ist er – wie hier – nicht signifikant, so lese man die Zeile davor (Varianzen sind gleich).

Eine Veröffentlichung zu dieser Studie könnte folgendes berichten:

Im Schnitt ist die Englischnote der Mädchen (Mittelwert: 9,45, Standard Abweichung 2,10) signifikant höher als die der Jungen (Mittelwert 3,38, Standard Abweichung 1,66): T = -10,992, df = 48, p < 0,001.

In diesem Beispiel testen wir die einseitige Hypothese, dass Mädchen im Schnitt höhere Englischnoten als Buben erhalten. Das heißt: die Signifikanz ist nur dann relevant—und darf auch nur dann inspiziert und berichtet werden—wenn der Mittelwert der Mädchen rein numerisch in der Tat höher ist als der der Buben. Der vom Programm ausgegebene Signifikanzwert ist aber ein zweiseitiger Wert, der gleichzeitig beide Möglichkeiten testet: Mädchen besser als Buben und/oder Buben besser als Mädchen. Demnach ist dieser zweiseitige p-Wert genau das Doppelte vom einseitigen Wert, den wir für unsere Hypothese benötigen. Die Justierung ist also einfach: Man halbiere den ausgegebenen Wert. Wäre der zweiseitige Signifikanzwert zum Beispiel p = 0,06, so wäre der einseitige p = 0,03.

Im aktuellen Fall ist dieser von SPSS ausgegeben Wert 0,000, da SPSS per Voreinstellung lediglich drei Stellen ausgibt. Das heißt, der wahre Wert ist auf jeden Fall kleiner 0,001 (p < 0,001) und auch für den korrigierten, halbierten Wert gilt dies natürlich ebenfalls.

!Tipp:

Enthält die SPSS-Ausgabe – wie in diesem Fall – als Signifikanzwert „0,000“, so berichten Sie dies als „ p < 0,001“! Sonst nach „ p = “ geben Sie den von SPSS ausgegebenen Wert an!

Gruppenvergleiche mit dem T-Test für abhängige Stichproben

Der T-Test für gepaarte Stichproben testet, ob zwei Variablen, pro Fall gemessen, sich im Mittel unterscheiden. Über Analysieren + Mittelwerte vergleichen + T-Test bei gepaarten Stichproben... aktivieren Sie das Steuerungsfenster und übertragen Sie die Variablen Mathe und Englisch ins Feld „Gepaarte Variablen“.

Wir testen die Hypothese, dass die Noten in Englisch und in Mathe sich im Mittel unterscheiden. Das Ergebnis:

Der p-Wert von 0,876 erreicht kein auch nur annähernd signifikantes Level: Statistisch betrachtet unterscheiden sich die Englisch- und Mathenoten nicht. In Ihrem Bericht könnten Sie schreiben:

Die Englischnote (Mittelwert: 6,90, Standardabweichung: 3,58) ist zwar numerisch leicht höher als die Mathematiknote (Mittelwert: 6,80, Standardabweichung: 2,41), diese Differenz ist jedoch statistisch nicht signifikant (T = 0,157, df= 49, p = 0,876, n.s.).

51

Statistik bei gepaarten Stichproben

6,9000 50 3,57571 ,505686,8000 50 2,40747 ,34047

EnglischnoteMathematiknote

Paaren1

Mittelwert NStandardabweichung

Standardfehler des

Mittelwertes

Test bei gepaarten Stichproben

,10000 4,50510 ,63712 -1,18034 1,38034 ,157 49 ,876Englischnote -Mathematiknote

Paaren1

MittelwertStandardabweichung

Standardfehler des

Mittelwertes Untere Obere

95% Konfidenzintervallder Differenz

Gepaarte Differenzen

T df Sig. (2-seitig)

SPSS für Windows

Mittelwertvergleiche: Einfaktorielle Varianzanalyse (ANOVA)

Der parametrische Test für Mittelwertunterschiede einer Variablen zwischen mehreren (mehr als zwei) Gruppen (Ausprägungen einer einzigen Klassifikationsvariablen wie zum Beispiel Schultyp eingeteilt in 1: Realschule, 2: Gymnasium und 3: Hochbegabtenschule) ist die einfaktorielle Varianzanalyse (ANOVA). Auch dieser Test setzt nicht nur die Normalität der Variablen sondern auch die Varianzhomogenität (das heißt: Statistisch dürfen die Varianzen der Gruppen sich nicht unterscheiden) voraus!

Über Analysieren + Mittelwerte vergleichen + Einfaktorielle ANOVA. . . erhält man folgendes Steuerungsfenster:

Übung

Testen Sie, ob die drei Schultypen (Faktor = Gruppierungsvariable) sich anhand der Mathematiknote (abhängiger Variablen) unterscheiden!

!Tipp

Da der ANOVA-Test die Homogenität der Varianz voraussetzt, müssen Sie dies auch testen: Über Optionen... schalten Sie den Test ein!

Die Ausgabe bestätigt: Der Levene-Test in der ersten Tabelle zeigt keine signifikante Abweichung von der Homogenität der Varianzen (auch hier wird einen Grenzwert von 0,1 oft akzeptiert). Wir dürfen also ohne Bedenken die klassische ANOVA-Tabelle (die zweite Tabelle) interpretieren: Diese bestätigt, dass ein signifikanter Gruppenunterschied besteht:

Berichten könnte man:

Die drei Schultypen unterscheiden sich signifikant: F(2;47)=9,467, p<0,001.

Der klassische ANOVA hört damit auf – meistens will man aber nicht nur testen, ob es Unterschiede zwischen den Gruppen gibt, sondern auch welche Gruppen sich signifikant voneinander unterscheiden. Liefert also der klassische Test ein signifikantes Ergebnis, so wiederhole man die Analyse und schalte dabei über den Knopf Post Hoc. . . einen nachträglichen Test, der formal dann und nur dann angewendet werden darf, falls der Test,

52

Test der Homogenität der Varianzen

Mathematiknote

,149 2 47 ,862

Levene-Statistik df1 df2 Signifikanz

ONEWAY ANOVA

Mathematiknote

81,555 2 40,778 9,467 ,000202,445 47 4,307284,000 49

Zwischen den GruppenInnerhalb der GruppenGesamt

Quadratsumme df

Mittel derQuadrate F Signifikanz

SPSS für Windows

wie gerade durchgeführt, einen signifikanten Unterschied zwischen allen Gruppen nachgewiesen hat. In diesem Fall ist dies gegeben, so dass man aus der Testgruppe Varianz-Gleichheit angenommen (wie vom Levene Test bestätigt) einen passenden Test für diese paarweisen Vergleiche auswählen kann. Ein häufig angewandter Ansatz zum Vergleich der Gruppen bei Homogenität der Varianzen ist (wie hier ausgewählt) der von Bonferroni:

Die Ausgabe dazu:

Diese Tabelle vergleicht alle Ausprägungen der Klassifizierungsvariablen paarweise miteinander: Schultyp 1 mit Schultypen 2 und 3; Schultyp 2 mit Schultypen 1 und 3 usw. Die Spalte Signifikanz gibt pro Paar den für multiple gegenseitig abhängige Vergleiche korrigierten Signifikanzwert aus. Hier unterscheiden sich also die Schultypen 2 und 3 anhand der Mathematiknote nicht, die anderen Paare doch.

Deutet der Levene-Test dagegen auf einen signifikanten Unterschied zwischen den Gruppenvarianzen, so schalte man einen der Tests aus der Rubrik Keine Varianz-Gleichheit angenommen ein.

Nichtparametrische Vergleiche

Falls nötig: Öffnen Sie die Datei data2.sav!

Vergleich von zwei Gruppen

Häufig benutzte nichtparametrische Pendants zum T-Test für zwei unabhängige Stichproben sind der Mann-Whitney-U-Test und der Wilcoxon-W-Test.

Zunächst inspizieren wir die Englischnoten der beiden Geschlechter anhand eines Boxplots:

53

Mehrfachvergleiche

Abhängige Variable: MathematiknoteBonferroni

-2,49519* ,77495 ,007 -4,4191 -,5712-3,11722* ,73242 ,000 -4,9356 -1,29882,49519* ,77495 ,007 ,5712 4,4191-,62202 ,68871 1,000 -2,3319 1,08783,11722* ,73242 ,000 1,2988 4,9356,62202 ,68871 1,000 -1,0878 2,3319

(J) Art der SchuleGymnasiumHochbegabtenschuleRealschuleHochbegabtenschuleRealschuleGymnasium

(I) Art der SchuleRealschule

Gymnasium

Hochbegabtenschule

MittlereDifferenz (I-J)

Standardfehler Signifikanz Untergrenze Obergrenze

95%-Konfidenzintervall

Die mittlere Differenz ist auf der Stufe .05 signifikant.*.

SPSS für Windows

m w

Geschlecht

0

2

4

6

8

10

12

14En

glis

chno

te

Testen wir nun mit dem nichtparametrischen Mann-Whitney-Test, ob der dargestellte Unterschied statistische Signifikanz erreicht: Analysieren + Nichtparametrische Tests + Zwei unabhängige Stichproben...:

Das Ergebnis:

Ränge

21 11,19 235,0029 35,86 1040,0050

GeschlechtmännlichweiblichGesamt

EnglischnoteN Mittlerer Rang Rangsumme

54

SPSS für Windows

Statistik für Testa

4,000235,000

-5,940

,000

Mann-Whitney-UWilcoxon-WZAsymptotischeSignifikanz (2-seitig)

Englischnote

Gruppenvariable: Geschlechta.

Sowohl Mann-Whitney als auch Wilcoxon bauen ihre Tests auf einen Vergleich der Rangreihen der Fälle nach der zu untersuchenden Variablen. Die obere Tabelle enthält eine Zusammenfassung dieser Rangstatistiken: Der mittlere Rang anhand der Englischnote der Jungen ist in unserem Beispiel 11,19, der der Mädchen 35,86. Überwiegend liegen die Jungen in den niedrigeren, haben also im Schnitt schlechtere Englischnoten als die Mädchen. Ob dieses „schlechter“ signifikant ist, wird in der unteren Tabelle berichtet. Der U-Wert von Mann-Whitney beträgt 4, oder als Z-Werte ausgedrückt einen Wert, der fast sechs Standardabweichungen vom theoretischen Mittelwert entfernt liegt. Die 2-seitige Signifikanz (p < .001) bestätigt den Eindruck des Boxplots.

Anmerkung:

Die SPSS-Realisierung der nichtparametrischen Verfahren zu Gruppenvergleichen erkennt „String“ (Zeichen-ketten-)Variablen gar nicht. Hätte man bei Geschlecht zum Beispiel „m“ und „w“ eingegeben, um zwischen den Geschlechtern zu unterscheiden, so würde der Variablenname in der Variablenliste nicht einmal erscheinen, und man müsste die Variable mittels Transformieren + Umkodieren so verändern, dass numerische Werte, wie etwa „0“ und „1“, die Buchstaben ersetzen. Aus diesem ganz praktischen Grund könnte man diese Variablen von vornherein so realisieren.

Paarweise Vergleiche von Variablen

Ein häufig anzutreffendes Äquivalent zum paarweisen T-Test ist der Wilcoxon-Test, der über Analysieren + Nichtparametrische Tests + Zwei verbundene Stichproben... zu erreichen ist.

Übung

Wiederholen Sie den Vergleich zwischen den Variablen Englisch und Mathe aller Schüler, jedoch mit dem nichtparametrischen Wilcoxon-Test! Interpretieren Sie die Ergebnisse!

55

Ränge

28a 21,25 595,0021b 30,00 630,001c

50

Negative RängePositive RängeBindungenGesamt

Mathematiknote -Englischnote

N Mittlerer Rang Rangsumme

Mathematiknote < Englischnotea.

Mathematiknote > Englischnoteb.

Mathematiknote = Englischnotec.

SPSS für Windows

Vergleiche von mehr als zwei Gruppen

Nichtparametrische, einfaktorielle Varianzanalysen (also: Vergleiche von mehr als zwei Gruppen) können mit dem Kruskal-Wallis-Test realisiert werden: Analysieren + Nichtparametrische Tests + K unabhängige Stichproben.

Übung

Versuchen Sie, mit Ihrem nun erworbenen Wissen, den Kruskall-Wallis Test anzuwenden, um die drei Schultypen anhand der Variablen IQ zu vergleichen!

Die SPSS-Ausgabe dazu:

Übungen zu Teil 2Öffnen sie die Datei alcohol.sav!

Inspizieren Sie die Liste der Variablen (am einfachsten über den Hauptmenüpunkt Extras + Variablen...), um ein „Gefühl“ für den Inhalt dieser Datei zu bekommen!

Benutzen Sie grafische Methoden, um die Verteilungen der Variablen stre_v und stre_n zu untersuchen!

Erzeugen Sie eine Grafik der Verteilungen der Variablen stre_v und stre_n, die (parametrisch) die Werte der Stadt- und Landbewohner vergleicht! Gestalten Sie diese Grafik so, dass sie für eine Veröffentlichung benutzt werden könnte! Exportieren Sie diese Grafik nach Word!

Erzeugen Sie eine Tabelle, die der gerade erzeugten Grafik entspricht (Inhalt: Mittelwert und Streuung der beiden Variablen, für Stadt- und Landbewohner getrennt)! Exportieren Sie auch diese Tabelle nach Word!

56

Statistik für Testb

-,175a

,861

ZAsymptotischeSignifikanz (2-seitig)

Mathematiknote -

Englischnote

Basiert auf negativen Rängen.a.

Wilcoxon-Testb.

Ränge

11 8,5514 18,4320 34,1545

Art der SchuleRealschuleGymnasiumHochbegabtenschuleGesamt

IntelligenzquotientN Mittlerer Rang

Statistik für Testa,b

29,4532

,000

Chi-QuadratdfAsymptotische Signifikanz

Intelligenzquotient

Kruskal-Wallis-Testa.

Gruppenvariable: Art der Schuleb.

SPSS für Windows

Berechnen Sie eine neue Variable, die den Unterschied zwischen Stress-Level vor und Stress-Level nach Alkoholeinnahme enthält!

Unterscheiden sich Stadt- und Landbewohner anhand der Alkoholeinnahme? Anhand des Stress-Levels vor Alkoholeinnahme? Anhand des Stress-Levels nach Alkoholeinnahme? Anhand des Stress-Unterschieds vor gegen nach Alkoholeinnahme? Sind diese Unterschiede statistisch signifikant?

Wiederholen Sie den Geschlechtsvergleich, aber veranlassen Sie, dass SPSS die Tests getrennt für Stadt und Land durchführt!

Falls Sie signifikante Unterschiede finden, erzeugen Sie passende Grafiken dazu!

Anhang A: BeispielfragebögenFragebogen-Nr.: 116 Noten (1 - 15):

Deutsch: 2Schultyp (1 - 3): 1 Englisch: 6

Mathematik: 2Alter: 10

IQ: 99Geschlecht (0=m, 1=w): 0

Chancen: 72Klasse (5 - 13): 5

Fragebogen-Nr.: 150 Noten (1 - 15):

Deutsch: 1Schultyp (1 - 3): 1 Englisch: 4

Mathematik: 1Alter: 10

IQ: 91Geschlecht (0=m, 1=w): 0

Chancen: 26Klasse (5 - 13): 5

57

SPSS für Windows

Anhang B: DokumentationDie gesamte Dokumentation zur deutschen bzw. englischen Variante des Programms SPSS erhalten Sie beim Kauf einer Lizenz als zweite CD zum Programm.

Folgende LRZ-Schriften zum Programm sind sowohl im Internet als auch in gedruckter Form verfügbar:

1. Wiseman, M. SPSS für Windows. München, 1999: Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften. Erreichbar über

http://www/lrz-muenchen.de/services/software/statistik/SPSS

Inhalt: Übersicht über Inhalt und Leistung des Pakets; Einarbeiten in das Programm; statistische Fachberatung; Tipps und Tricks

2. Wiseman, M. SPSS für Windows Special Topics: Einige Grundbegriffe der Statistik. München, 1999: Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften. Auch im Internet:

http://www.lrz-muenchen.de/services/schulung/unterlagen/grundbegriffe/

Inhalt: Erklärungen und Diskussion zu folgenden Begriffen der Statistik: Skalenniveau; Normal-verteilung (Bedeutung? Wann notwendig? Wie überprüfen?); Signifikanz, Effektgröße, Power; „Exakte Statistik“ und kleine Stichproben

3. Wiseman, M. SPSS für Windows Special Topics: Lineare Regression. München, 1999: Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften. Auch im Internet:

http://www.lrz-muenchen.de/services/schulung/unterlagen/regression/

Inhalt: Detaillierte Diskussion mit Beispielen über die Anwendung und Problematik des Regressionsmodells

4. Wiseman, M. SPSS für Windows: Eine Einführung. (Die vorliegende Schrift) München, 1999: Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften. Auch im Internet:

http://www.lrz-muenchen.de/services/schulung/unterlagen/spss-einfuehrung/

Inhalt: die vorliegende Schrift

58

http://www.lrz-muenchen.de/services/schulung/unterlagen/spss-einfuehrung/

http://www.lrz-muenchen.de/services/schulung/unterlagen/regression/

http://www.lrz-muenchen.de/services/schulung/unterlagen/grundbegriffe/

http://www/lrz-muenchen.de/services/software/statistik/SPSS

Documents

L E I B N I Z - R E C H E N Z E N T R U M€¦ · Web viewDas heißt: die Signifikanz ist nur dann relevant—und darf auch nur dann inspiziert und berichtet werden—wenn der Mittelwert