17
Testat-Aufgabenblatt Labor Statistik Seite 1/17 TBB2, WKB2/Prof. Melzer Labor Statistik Sommersemester 2017 Testat-Aufgabenblatt Regelungen für das Labor und das Testat Die vier Aufgaben des Testat-Aufgabenblattes (sr_aufg_1 bis sr_aufg_4) sollen von Ihnen mit Microsoft Excel selbständig bearbeitet werden. Die Datendateien zu diesen Testat-Aufgaben sind individualisiert. Welche Dateien Sie persönlich bearbeiten müssen, können Sie an den beiden Endziffern Ihrer Matrikelnummer sehen. Beispiel: Wenn Ihre Matrikelnummer 123456 ist, bearbeiten Sie die Dateien im Unterverzeichnis „Endziffer_56“. Nach der Bearbeitung einer Aufgabe müssen Sie Ausdrucke aus Ihrer Excel-Datei sowie zusätzliche Erläuterungen in Papierform (am besten mit einer Heftklammer zusammengeheftet) abgeben. Als Deckblatt ist die Seite 3 dieses Aufgabenblattes auszudrucken und auszufüllen. Pro Abgabe (nicht pro Aufgabe) reicht ein Deckblatt. Eine Einreichung der Unterlagen per E-Mail ist nicht möglich. Bei jeder von den vier Aufgaben ist auf dem Aufgabenblatt angegeben, was genau Sie zu der jeweiligen Aufgabe abgeben müssen. Endtermin für die Abgabe: sr_aufg_1, sr_aufg_2: Mi. 03.05.17 (WKB), Mi. 10.05.17 (TBB) sr_aufg_3, sr_aufg_4: Mi. 31.05.17 (WKB), Mi. 31.05.17 (TBB) Verspätet abgegebene Ergebnisse werden nicht berücksichtigt. Sinnvollerweise sollten Sie die Aufgaben nicht erst kurz vor dem Abgabetermin bearbeiten. Es ist nicht notwendig, die Ergebnisse der 4 Testat-Aufgaben gleichzeitig abzugeben. Bitte geben Sie die einzelnen Aufgaben möglichst bald nach Fertigstellung ab! Wenn Sie rechtzeitig abgeben, haben Sie auch mehr Zeit für eventuell notwendige Korrekturen. Die Aufgaben sr_aufg_1, sr_aufg_2 und einen Teil von sr_aufg_4 können Sie bereits mit den Kenntnissen aus dem Kapitel „Beschreibende Statistik“ lösen. Das Testat wird allerdings erst erteilt, wenn alle vier Aufgaben erfolgreich (d. h. vollständig und richtig) bearbeitet wurden. Wichtig: Das Testat ist eine Studienleistung. Sie müssen das Testat wie eine Prüfung (Klausur) beim Prüfungsamt anmelden; sonst kann ein bestandenes Testat nicht registriert werden! Bitte beachten Sie außerdem: Sollten zu einer Aufgabe oder einem Aufgabenteil zwei übereinstimmende Ausarbeitungen eingereicht werden (oder sich in irgendeiner anderen Form herausstellen, dass Sie die Aufgaben nicht selbst bearbeitet haben), werden beide nicht anerkannt. è Insbesondere dürfen Sie die Excel-Datei von anderen nicht kopieren. Kopieren eines Excel-Blattes stellt keine selbständige Bearbeitung der Aufgabe dar. è Geben Sie Ihre eigene Excel-Datei nicht an andere weiter. Das Testat kann ebenfalls nicht erteilt werden, wenn Sie nicht die für Sie vorgesehenen Daten bearbeiten (falsche Endziffern). (Fortsetzung auf der nächsten Seite) Prof. Dr. Karin Melzer Fakultät Grundlagen

Prof. Dr. Karin Melzer Labor Statistik Sommersemester 2017 ...kamelzer/statistik/Testat_Aufgabenblatt.pdf · Testat-Aufgabenblatt Labor Statistik Seite 2/17 TBB2, WKB2/Prof. Melzer

Embed Size (px)

Citation preview

Testat-Aufgabenblatt Labor Statistik Seite 1/17 TBB2, WKB2/Prof. Melzer

Labor Statistik Sommersemester 2017 Testat-Aufgabenblatt Regelungen für das Labor und das Testat

Die vier Aufgaben des Testat-Aufgabenblattes (sr_aufg_1 bis sr_aufg_4) sollen von Ihnen mit Microsoft Excel selbständig bearbeitet werden. Die Datendateien zu diesen Testat-Aufgaben sind individualisiert. Welche Dateien Sie persönlich bearbeiten müssen, können Sie an den beiden Endziffern Ihrer Matrikelnummer sehen. Beispiel: Wenn Ihre Matrikelnummer 123456 ist, bearbeiten Sie die Dateien im Unterverzeichnis „Endziffer_56“. Nach der Bearbeitung einer Aufgabe müssen Sie Ausdrucke aus Ihrer Excel-Datei sowie zusätzliche Erläuterungen in Papierform (am besten mit einer Heftklammer zusammengeheftet) abgeben. Als Deckblatt ist die Seite 3 dieses Aufgabenblattes auszudrucken und auszufüllen. Pro Abgabe (nicht pro Aufgabe) reicht ein Deckblatt. Eine Einreichung der Unterlagen per E-Mail ist nicht möglich. Bei jeder von den vier Aufgaben ist auf dem Aufgabenblatt angegeben, was genau Sie zu der jeweiligen Aufgabe abgeben müssen.

Endtermin für die Abgabe: sr_aufg_1, sr_aufg_2: Mi. 03.05.17 (WKB), Mi. 10.05.17 (TBB) sr_aufg_3, sr_aufg_4: Mi. 31.05.17 (WKB), Mi. 31.05.17 (TBB)

Verspätet abgegebene Ergebnisse werden nicht berücksichtigt. Sinnvollerweise sollten Sie die Aufgaben nicht erst kurz vor dem Abgabetermin bearbeiten. Es ist nicht notwendig, die Ergebnisse der 4 Testat-Aufgaben gleichzeitig abzugeben. Bitte geben Sie die einzelnen Aufgaben möglichst bald nach Fertigstellung ab! Wenn Sie rechtzeitig abgeben, haben Sie auch mehr Zeit für eventuell notwendige Korrekturen.

Die Aufgaben sr_aufg_1, sr_aufg_2 und einen Teil von sr_aufg_4 können Sie bereits mit den Kenntnissen aus dem Kapitel „Beschreibende Statistik“ lösen. Das Testat wird allerdings erst erteilt, wenn alle vier Aufgaben erfolgreich (d. h. vollständig und richtig) bearbeitet wurden. Wichtig: Das Testat ist eine Studienleistung. Sie müssen das Testat wie eine Prüfung (Klausur) beim Prüfungsamt anmelden; sonst kann ein bestandenes Testat nicht registriert werden! Bitte beachten Sie außerdem:

• Sollten zu einer Aufgabe oder einem Aufgabenteil zwei übereinstimmende Ausarbeitungen eingereicht werden (oder sich in irgendeiner anderen Form herausstellen, dass Sie die Aufgaben nicht selbst bearbeitet haben), werden beide nicht anerkannt.

è Insbesondere dürfen Sie die Excel-Datei von anderen nicht kopieren. Kopieren eines Excel-Blattes stellt keine selbständige Bearbeitung der Aufgabe dar.

è Geben Sie Ihre eigene Excel-Datei nicht an andere weiter.

• Das Testat kann ebenfalls nicht erteilt werden, wenn Sie nicht die für Sie vorgesehenen Daten bearbeiten (falsche Endziffern).

(Fortsetzung auf der nächsten Seite)

Prof. Dr. Karin Melzer Fakultät Grundlagen

Testat-Aufgabenblatt Labor Statistik Seite 2/17 TBB2, WKB2/Prof. Melzer

• Ich behalte mir vor, mir bei Unklarheiten Ihre Excel-Datei von Ihnen erläutern zu lassen oder Sie mit Hilfe einer neuen Aufgabe zu prüfen. In einem solchen Fall wird das Testat nur erteilt, wenn Ihre Erläuterungen zeigen bzw. die Prüfung ergibt, dass Sie die Aufgaben selbständig lösen können.

Die Excel-Dateien mit Ihren Bearbeitungen sind daher zum Ende des Prüfungszeitraumes aufzubewahren.

• Bei Fehlern in Ihrer Ausarbeitung erhalten Sie normalerweise von mir eine E-Mail mit einer Aufforderung zur Verbesserung; benutzen Sie dazu bitte Ihr Hochschul-E-Mail-Konto. Bitte lesen Sie daher regelmäßig Ihr E-Mail-Postfach. Beachten Sie auch die Fristen, die ich ggf. zur Nachbesserung setze. Wenn ich Ihnen keine Frist nenne, gilt der Abgabetermin der jeweiligen Aufgabe auch für die Verbesserungen.

Ich behalte mir allerdings vor, im Falle von besonders zahlreichen oder schwerwiegenden Fehlern das Testat nicht zu erteilen (z. B. wenn eine Aufgabe trotz mehrfacher Nachbesserung immer noch nicht richtig ist).

In der Datei „Teilergebnisse_xy.txt“ (xy = Endziffern Ihrer Matrikelnr.) sind von manchen Teilaufgaben einige Stellen der Ergebnisse angegeben, z. B. ??,67??. Jedes Fragezeichen steht für eine von Ihnen zu bestimmende Ziffer. Im Beispiel hat das Ergebnis 2 Vorkommastellen, und die beiden ersten Nachkommastellen lauten „67“.

Hinweis: Die Datei mit den Teilergebnissen ist nur aus technischen Gründen im .txt-Format abgespeichert. Sie muss nicht in Excel eingelesen werden, sondern kann auch mit Microsoft Word, WordPad oder dem Editor gelesen werden.

Geben Sie keine Ausarbeitungen ab, die von den Resultaten in der Datei „Teilergebnisse_xy.txt“ abweichen, sondern suchen Sie in einem solchen Fall bitte zunächst selbst den Fehler. Nutzen Sie die Hilfeangebote, wenn Sie Probleme mit einer Aufgabe haben:

è Ich habe in dieses Aufgabenblatt verschiedene „Tipps“ integriert. Bitte lesen und beachten Sie diese sorgfältig. Dadurch erhalten Sie u. a. Hinweise auf einige in der Vergangenheit besonders häufig vorgekommene Fehler. Vermeiden Sie diese!

è Kommen Sie zu den Beratungsterminen im Rechnerpool (Termine werden im Intranet veröffentlicht).

è Sofern die Beratungstermine im Rechnerpool nicht ausreichen, vereinbaren Sie mit mir einen individuellen Gesprächstermin oder kommen Sie in meine regelmäßige Sprechstunde.

Eine Liste der durchgesehenen Testataufgaben wird auf meiner Homepage im Intranet veröffentlicht und regelmäßig aktualisiert. Dort ist ggf. durch „K/N“ angezeigt, wenn ich zu einer Aufgabe eine Korrektur angefordert habe oder eine Nachfrage habe. Wenn Sie Ihren Eintrag in der Liste regelmäßig überprüfen, helfen Sie bei der Vermeidung von Erfassungsfehlern mit.

Aus Datenschutzgründen ist diese Liste nicht nach Matrikelnummern sortiert, sondern nach einer Kennnummer, die nur für diese Liste generiert wird. Die Kennnummer sollte nur Ihnen und mir bekannt sein. Lassen Sie andere Personen Ihre persönliche Kennnummer nicht wissen. Ein zusätzlicher kleiner Hinweis am Schluss der allgemeinen Regelungen: Sie brauchen keine Blätter abzugeben, auf denen keine Ergebnisse von Ihnen, sondern nur die von mir bereitgestellten Daten stehen. Sparen Sie dieses Papier ein!

Auf der folgenden Seite finden Sie die Seite, die bei allen Ausarbeitungen als Deckblatt zu benutzen ist.

Testat-Aufgabenblatt Labor Statistik Seite 3/17 TBB2, WKB2/Prof. Melzer

Labor Statistik Sommersemester 2017 Nachname: Vorname:

Matrikelnummer:

Semester: WKB2, TBB2

Hochschul-E-Mail-Adresse:

Bearbeitete Aufgabe(n) (bitte ankreuzen): sr_aufg_1 Erstabgabe Korrektur

Ich habe die allgemeinen Tipps auf Seite 4 oben sowie die Hinweise und Tipps zu Aufgabe sr_aufg_1 auf Seite 6 des Aufgabenblattes gelesen und beachtet.

Ich habe die Richtigkeit meiner Ergebnisse von Aufgabe sr_aufg_1 mit Hilfe der Datei „teilergebnisse_xy.txt“ kontrolliert. (xy = Endziffern der Matrikelnummer)

sr_aufg_2 Erstabgabe Korrektur

Ich habe die allgemeinen Tipps auf Seite 4 oben sowie die Hinweise und Tipps zu Aufgabe sr_aufg_2 auf den Seiten 7 und 8 des Aufgabenblattes gelesen und beachtet.

Ich habe die Richtigkeit meiner Ergebnisse von Aufgabe sr_aufg_2 mit Hilfe der Datei „teilergebnisse_xy.txt“ kontrolliert. (xy = Endziffern der Matrikelnummer)

sr_aufg_3 Erstabgabe Korrektur

Ich habe die allgemeinen Tipps auf Seite 4 oben sowie die Hinweise und Tipps zu Aufgabe sr_aufg_3 auf Seite 12 des Aufgabenblattes gelesen und beachtet.

Ich habe die Richtigkeit meiner Ergebnisse von Aufgabe sr_aufg_3 mit Hilfe der Datei „teilergebnisse_xy.txt“ kontrolliert. (xy = Endziffern der Matrikelnummer)

sr_aufg_4 Erstabgabe Korrektur

Ich habe die allgemeinen Tipps auf Seite 4 oben sowie die Hinweise und Tipps zu Aufgabe sr_aufg_4 auf den Seiten 14 – 16 des Aufgabenblattes gelesen und beachtet.

Ich habe die Richtigkeit meiner Ergebnisse von Aufgabe sr_aufg_4 mit Hilfe der Datei „teilergebnisse_xy.txt“ kontrolliert. (xy = Endziffern der Matrikelnummer)

Die beiden Endziffern der sechs-stelligen Matrikelnummer 7abcxy bestimmen, welche Daten Sie bearbeiten sollen, NICHT die Endziffern der vierstelligen Kennnummer!

Testat-Aufgabenblatt Labor Statistik Seite 4/17 TBB2, WKB2/Prof. Melzer

Allgemeine Tipps zu dem Labor Statistik Viele Fehler rühren allein daher, dass

• der Aufgabentext nicht richtig gelesen wurde oder • die Aufgaben in Eile, nachlässig oder unkonzentriert bearbeitet wurden.

Arbeiten Sie sorgfältig!

Fehler von vornherein vermeiden kostet weniger Zeit, als wenn man Fehler nachträglich korrigieren muss.

Bitte beachten Sie besonders: Die beiden Endziffern Ihrer sechsstelligen Matrikelnummer bestimmen, welche Daten Sie zu bearbeiten haben. Die vierstellige Kennnummer, die in der ersten Stunde ausgegeben wurde, wird hingegen ausschließlich für die im Netz bereitgestellte Liste der durchgesehenen Testataufgaben verwendet. Wenn Sie die falschen Daten verwenden, kann Ihre Ausarbeitung nicht anerkannt werden. Testat-Aufgabe sr_aufg_1 Sie sollen für die Personalabteilung der NANU-AG die Altersverteilung der Beschäftigten analysieren. In der Datei sr_aufg_1_xy.txt im Unterverzeichnis Endziffer_xy („xy“ steht für die beiden Endziffern Ihrer Matrikelnummer) finden Sie die dafür erforderlichen Daten. Diese Datei enthält folgende fünf Felder, die durch Semikolons getrennt sind: Personalnummer, Anrede („Herr“ oder „Frau“), Vorname, Nachname, Geburtsdatum. a) Lesen Sie Daten in Excel ein. Kontrollieren Sie, ob Sie die richtigen Daten verwenden

(Endziffern der Matrikelnummer, siehe den Hinweis „Bitte beachten Sie besonders:...“ oben). b) Führen Sie eine Datenbereinigung durch. Erläutern Sie Ihr Vorgehen in einer Tabelle. c) Berechnen Sie das Alter der Beschäftigten zum Stichtag 31.12.2005.

Mit „Alter“ ist hier die Anzahl der vollendeten Lebensjahre gemeint. Beispiel: Wer am 30.06.1975 geborgen ist, ist zum Stichtag 30 Jahre alt. (Niemand würde von sich sagen, er wäre „30,5 Jahre alt“.) Folglich wird diese Person in der Alterklasse 21 – 30 Jahre mitgezählt.

d) Stellen Sie die Altersverteilung der Beschäftigten in einem gruppierten Säulendiagramm dar, in dem Männer und Frauen getrennt ausgewiesen werden. Es sollen die Altersklassen bis (einschließlich) 20 Jahre, 21 – 30 Jahre, 31 – 40 Jahre, 41 – 50 Jahre und über 50 Jahre gewählt werden und die Säulen mit den zugehörigen Anzahlen beschriftet werden. Auf der nächsten Seite ist ein verkleinertes Muster (mit anderen Zahlenwerten) angegeben.

e) Stellen Sie die Altersverteilung der männlichen Beschäftigten und der weiblichen Beschäftigten in je einem Kreisdiagramm („Tortendiagramm“) dar. Die Kreissektoren sind mit den zugehörigen Prozentzahlen zu beschriften. Auf der nächsten Seite ist ein verkleinertes Muster (mit anderen Zahlenwerten) angegeben Hinweis: Es ist nicht erforderlich, die in Excel voreingestellte Größe der Kreise zu verändern; d. h. die beiden Kreise dürfen gleich groß sein, auch wenn die Anzahl der männlichen und der weiblichen Beschäftigten unterschiedlich groß ist.

f) Berechnen Sie Mittelwert, empirische Varianz, empirische Standardabweichung, Median und Spannweite der Alterszahlen f1) für alle Beschäftigen; f2) getrennt für Männer und Frauen.

(Fortsetzung auf der nächsten Seite)

Testat-Aufgabenblatt Labor Statistik Seite 5/17 TBB2, WKB2/Prof. Melzer

Testat-Aufgabe sr_aufg_1 (Fortsetzung) Bitte beachten Sie die Fortsetzung auf der nächsten Seite!

Muster zu 1d) Altersverteilung NANU-AGStichtag: 31.12.2005

3

6

16

22

44

6

20

17

4

0

5

10

15

20

25

bis 20 21 - 30 31 - 40 41 - 50 über 50

Alter in Jahren

Anz

ahl

Frauen

Männer

Muster zu 1e)

Altersverteilung der weiblichen Beschäftigten der NANU-AGStichtag 31.12.2005

6%

12%

31%

43%

8%

bis 20 Jahre21 - 30 Jahre31 - 40 Jahre41 - 50 Jahreüber 50 Jahre

Testat-Aufgabenblatt Labor Statistik Seite 6/17 TBB2, WKB2/Prof. Melzer

Hinweise: Für die Aufgabe sr_aufg_1 sind abzugeben: 1.) Eine Erläuterung der Datenbereinigungsschritte aus b). Geben Sie dazu in einer Tabelle an,

bei welchen Datensätzen Bereinigungsschritte erforderlich waren (Liste der Personalnummern der bereinigten Datensätze) und beschreiben Sie für jeden einzelnen Datensatz in dieser Liste, warum eine Bereinigung erforderlich war und welche Bereinigungsschritte Sie durchgeführt haben: Löschung, Änderung (welche?) usw.

2.) Ein Ausdruck des Säulendiagramms aus d). 3.) Je ein Ausdruck der beiden Kreisdiagramme aus e). 4.) Ein Ausdruck Ihrer Excel-Berechnungen zu f). Bitte kontrollieren Sie Ihre Resultate vor der Abgabe mit den Ihnen zur Verfügung gestellten Teilergebnissen (Datei „Teilergebnisse_xy.txt“) und beachten Sie auch die unten gegebenen Tipps. Die Unterlagen sind in Papierform abzugeben (keine E-Mail), am besten zusammengeheftet. Als Deckblatt ist die (ausgefüllte) Seite 3 dieses Aufgabenblattes voranzustellen. Die Excel-Dateien mit Ihren Bearbeitungen sind bis zum Ende des Prüfungszeitraumes aufzubewahren. Spätester Abgabetermin: Mi. 03.05.17 (WKB), Mi. 10.05.17 (TBB)

Tipps zu Aufgabe sr_aufg_1

Bitte überprüfen Sie:

• Sind alle Diagramme so beschriftet (z. B. mit Anzahlen), wie das auf dem Aufgabenblatt verlangt wurde? (Vgl. auch die Muster auf der vorigen Seite.)

• Haben Sie die Angabe von Median und Spannweite in 1f) nicht vergessen? Die Nachkommastellen der in Aufgabenteil f) zu berechnenden Mittelwerte, Varianzen und Standardabweichungen finden Sie in der Datei „Teilergebnisse_xy.txt“ (xy = Endziffern Ihrer Matrikelnummer). Wenn diese Werte nicht mit Ihren Ergebnissen übereinstimmen, sollten Sie u. a. die folgenden Punkte kontrollieren.

• Haben Sie alle Datensätze mit unbrauchbaren Geburtsdaten gelöscht? („Phantasievolle“ Abänderungen oder erfundene Werte sind hier fehl am Platz.)

• Haben Sie umgekehrt alle Datensätze verwendet, bei denen man das Alter zum Stichtag ausrechnen kann?

• Ist bei Ihnen „Alter“ immer ein ganzzahliger Wert, wie auf dem Aufgabenblatt erläutert? Beispiel: Wer am 30.06.1975 geborgen ist, ist zum Stichtag 30 Jahre alt. Folglich wird diese Person in der Altersklasse 21 – 30 Jahre mitgezählt. Ein Alter von 30,5 oder von 42,66 Jahren darf also bei Ihrer Berechnung nicht auftreten.

Benutzen Sie die richtige Formel für die Altersberechnung zum Stichtag? Überprüfen Sie an ein paar Beispielen, ob das richtige Alter berechnet wird. Am besten benutzen Sie für diese Überprüfung Geburtstage Ende Dezember oder Anfang Januar: Geburtstag 31.12.1975 → Alter 30; Geburtstag 01.01.1976 → Alter 29.

Testat-Aufgabenblatt Labor Statistik Seite 7/17 TBB2, WKB2/Prof. Melzer

Testat-Aufgabe sr_aufg_2 Untersuchen Sie die Bevölkerungsentwicklung der USA. In der Datei sr_aufg_2_xy.txt im Unterverzeichnis Endziffer_xy („xy“ steht für die beiden Endziffern Ihrer Matrikelnummer) finden Sie die dafür erforderlichen Daten. Diese Datei enthält zwei Spalten fester Breite: Jahreszahl und Anzahl der Einwohner der USA in Millionen (zu einem festen Stichtag in dem angegebenen Jahr). a) Lesen Sie Daten in Excel ein. b) Stellen Sie die Bevölkerungsentwicklung in einem Streudiagramm dar. c) Untersuchen Sie alle von Excel angebotenen Möglichkeiten, eine Regressionskurve durch die

Punkte zu legen. Stellen Sie alle Möglichkeiten in einer Tabelle dar. d) Wählen Sie aus den von Ihnen untersuchten Möglichkeiten die am besten geeignete Kurve.

Erläutern Sie Ihre Wahl. e) Zeichnen Sie in das Diagramm die optimale Regressionskurve aus d) ein. Das Diagramm soll

außerdem die Gleichung der Regressionskurve und das Bestimmtheitsmaß enthalten. f) Berechnen Sie aus den Ihnen vorgelegten Daten eine Prognose über die Bevölkerungszahl der

USA im Jahr 2020. Erläutern Sie Ihr Vorgehen.

Hinweise: Für die Aufgabe sr_aufg_2 sind abzugeben: 1.) Eine Tabelle zu c). Aus der Tabelle sollten mindestens ersichtlich sein: der Typ der

Regressionskurve sowie das zugehörige Bestimmtheitsmaß. 2.) Eine Erläuterung, welche Regressionskurve Sie in d) gewählt haben (mit Begründung,

warum der von Ihnen gewählte Typ am besten geeignet ist). 3.) Ein Ausdruck des Diagramms aus b) mit der optimalen Regressionskurve aus d) / e) sowie

deren Gleichung und Bestimmtheitsmaß. 4.) Das Ergebnis Ihrer Berechnungen zu f). 5.) Eine Erläuterung, wie Sie bei f) vorgegangen sind. Bitte kontrollieren Sie Ihre Resultate vor der Abgabe mit den Ihnen zur Verfügung gestellten Teilergebnissen (Datei „Teilergebnisse_xy.txt“) und beachten Sie auch die unten gegebenen Tipps. Die Unterlagen sind in Papierform abzugeben (keine E-Mail), am besten zusammengeheftet. Als Deckblatt ist die (ausgefüllte) Seite 3 dieses Aufgabenblattes voranzustellen. Die Excel-Dateien mit Ihren Bearbeitungen sind bis zum Ende des Prüfungszeitraumes aufzubewahren. Spätester Abgabetermin: Mi. 03.05.17 (WKB), Mi. 10.05.17 (TBB)

Tipps zu Aufgabe sr_aufg_2 Aufgabe 2c): Ihre Tabelle sollte 9 Einträge enthalten. „Gleitender Durchschnitt“ liefert keine Regressionskurve und braucht daher nicht berücksichtigt zu werden. Bitte beachten Sie die Fortsetzung auf der nächsten Seite!

Testat-Aufgabenblatt Labor Statistik Seite 8/17 TBB2, WKB2/Prof. Melzer

Tipps zu Aufgabe sr_aufg_2 (Fortsetzung) Aufgabe 2d): Beachten Sie bei der Auswahl der optimalen Regressionskurve die Hinweise, die bei dem Regressionsbeispiel in der Einführungsstunde im Rechnerpool gegeben wurden. Aufgabe 2f): Überprüfen Sie mit Hilfe Ihres Diagramms e), ob der von Ihnen berechnete Prognosewert plausibel ist. Zwei Stellen des korrekten Prognosewertes können Sie aus der Datei „Teilergebnisse_xy.txt“ (xy = Endziffern Ihrer Matrikelnummer) ablesen.

Testat-Aufgabenblatt Labor Statistik Seite 9/17 TBB2, WKB2/Prof. Melzer

Testat-Aufgabe sr_aufg_3 In dieser Aufgabe wird die Lotterie „KENO“ untersucht, die die staatlichen Lottogesellschaften täglich (von Montag bis Samstag) anbieten. Bei dieser Lotterie besteht ein Tippfeld aus 70 Zahlen. Ein Teilnehmer an der Lotterie kann selbst entscheiden, wie viele dieser Zahlen er ankreuzt (mindestens 2, höchstens 10) und welchen Betrag er einsetzt (1, 2, 5 oder 10 Euro). Die Abbildung zeigt ein Muster eines KENO-Spielscheins. Von den 70 Zahlen werden 20 Gewinnzahlen gezogen. Je nachdem, wie viele der Gewinnzahlen er angekreuzt hatte, bekommt der Lotterieteilnehmer einen festen Geldbetrag ausgezahlt. Der Gewinnplan (Stand 01.01.2005) ist im Folgenden aufgelistet. (Es gibt Sonderregelungen für die jeweils höchsten Gewinnklassen bei 10 oder 9 getippten Zahlen; diese sollen nicht berücksichtigt werden und sind daher nicht hier aufgeführt.) KENO-Gewinnquoten bei 10 getippten Zahlen

Anzahl richtig getippter Zahlen Feste Auszahlung je 1 € Einsatz

10 100.000 € 9 1.000 € 8 100 € 7 15 € 6 5 € 5 2 € 0 2 € (Fortsetzung auf der nächsten Seite)

Muster

Testat-Aufgabenblatt Labor Statistik Seite 10/17 TBB2, WKB2/Prof. Melzer

Testat-Aufgabe sr_aufg_3 (Fortsetzung) KENO-Gewinnquoten bei 9 getippten Zahlen

Anzahl richtig getippter Zahlen Feste Auszahlung je 1 € Einsatz

9 50.000 € 8 1.000 € 7 20 € 6 5 € 5 2 € 0 2 € KENO-Gewinnquoten bei 8 getippten Zahlen

Anzahl richtig getippter Zahlen Feste Auszahlung je 1 € Einsatz

8 10.000 € 7 100 € 6 15 € 5 2 € 4 1 € 0 1 € KENO-Gewinnquoten bei 7 getippten Zahlen

Anzahl richtig getippter Zahlen Feste Auszahlung je 1 € Einsatz

7 1.000 € 6 100 € 5 12 € 4 1 € Testat-Aufgabe sr_aufg_3 (Fortsetzung) KENO-Gewinnquoten bei 6 getippten Zahlen

Anzahl richtig getippter Zahlen Feste Auszahlung je 1 € Einsatz

6 500 € 5 15 € 4 2 € 3 1 € KENO-Gewinnquoten bei 5 getippten Zahlen

Anzahl richtig getippter Zahlen Feste Auszahlung je 1 € Einsatz

5 100 € 4 7 € 3 2 € (Fortsetzung auf der nächsten Seite)

Testat-Aufgabenblatt Labor Statistik Seite 11/17 TBB2, WKB2/Prof. Melzer

Testat-Aufgabe sr_aufg_3 (Fortsetzung) KENO-Gewinnquoten bei 4 getippten Zahlen

Anzahl richtig getippter Zahlen Feste Auszahlung je 1 € Einsatz

4 22 € 3 2 € 2 1 € KENO-Gewinnquoten bei 3 getippten Zahlen

Anzahl richtig getippter Zahlen Feste Auszahlung je 1 € Einsatz

3 16 € 2 1 € KENO-Gewinnquoten bei 2 getippten Zahlen

Anzahl richtig getippter Zahlen Feste Auszahlung je 1 € Einsatz

2 6 € Ablesebeispiel: Sie haben auf dem Spielschein in einem Tippfeld 7 Zahlen angekreuzt; Ihr Einsatz beträgt 2 €. Wenn Sie unter Ihren 7 Zahlen genau 5 Richtige sind, erhalten Sie 122 ⋅ € = 24 € ausbezahlt (d. h. Ihr Gewinn beträgt 22 €). Wenn Sie statt dessen nur 3 Richtige haben, erhalten Sie nichts (d. h. Sie haben einen Verlust in Höhe Ihres Einsatzes von 2 €). a) Die Zufallsvariablen 10X beschreibt den Gewinn eines Lotterieteilnehmers, der in einem

Tippfeld 10 Kästchen ankreuzt und 2 € einsetzt. Berechnen Sie Erwartungswert, Varianz und Standardabweichung von 10X .

b) Berechnen Sie ebenso die Erwartungswerte, Varianzen und Standardabweichungen von 29 ,, XX … , d. h. dem Gewinn bei Ankreuzen von 9 (bzw. 8, ..., 2) Kästchen in einem Tippfeld

jeweils bei Einsatz von 2 €. c) Wie viele Kästchen pro Tippfeld sollte ein KENO-Spieler ankreuzen, der den Erwartungswert

seines Gewinns maximieren möchte? d) Beantworten Sie die in Datei sr_aufg_3d_xy.txt im Unterverzeichnis Endziffer_xy gestellte

Frage (xy = Endziffern Ihrer Matrikelnummer). Welche Excel-Funktion verwenden Sie hier? Welche Werte muss man für die Parameter einsetzen?

Hinweis: Die Datei sr_aufg_3d_xy.txt ist nur aus technischen Gründen im .txt-Format abgespeichert. Sie muss nicht in Excel eingelesen werden, sondern kann auch mit Microsoft Word, WordPad oder dem Editor gelesen werden.

Bitte beachten Sie die Fortsetzung auf der nächsten Seite!

Testat-Aufgabenblatt Labor Statistik Seite 12/17 TBB2, WKB2/Prof. Melzer

Testat-Aufgabe sr_aufg_3 (Fortsetzung)

Hinweise: Für die Aufgabe sr_aufg_3 sind abzugeben: 1.) Ein Ausdruck Ihrer Excel-Berechnungen zu a) und b). (Vollständige Berechnungen, nicht

nur Endergebnisse). 2.) Ihre Antwort zu c). 3.) Ein Ausdruck Ihrer Excel-Berechnung zu d). 4.) Eine Erläuterung, welche Excel-Funktion Sie bei d) verwendet haben und welche Werte Sie

für die Parameter eingesetzt haben. Bitte kontrollieren Sie Ihre Resultate vor der Abgabe mit den Ihnen zur Verfügung gestellten Teilergebnissen (Datei „Teilergebnisse_xy.txt“) und beachten Sie auch die unten gegebenen Tipps. Die Unterlagen sind in Papierform abzugeben (keine E-Mail), am besten zusammengeheftet. Als Deckblatt ist die (ausgefüllte) Seite 3 dieses Aufgabenblattes voranzustellen. Die Excel-Dateien mit Ihren Bearbeitungen sind bis zum Ende des Prüfungszeitraumes aufzubewahren. Spätester Abgabetermin: Mi. 31.05.17 (WKB), Mi. 31.05.17 (TBB)

Tipps zu Aufgabe sr_aufg_3 Zum allgemeinen Vorgehen bei Aufgabe sr_aufg_3 sollten Sie auch die Aufgabe 66 beachten, die in der Statistik-Vorlesung behandelt wird und bei der eine ähnliche Fragestellung vorliegt. Einige Nachkommastellen der bei a) und b) zu berechnenden Standardabweichungen sowie der bei d) zu berechnenden Wahrscheinlichkeit finden Sie in der Datei „Teilergebnisse_xy.txt“ (xy = Endziffern Ihrer Matrikelnummer). Aufgabe 3d): Hier treten (je nach Matrikelnummer) Formulierungen wie "höchstens 9-mal", "mindestens 9-mal" oder "genau 9-mal" auf. Verwechseln Sie diese nicht!

Testat-Aufgabenblatt Labor Statistik Seite 13/17 TBB2, WKB2/Prof. Melzer

Aufgabe 4 MR1 - Histogramm und Normalverteilungsdichte

0

5

10

15

20

25

654 - 655 655 - 656 656 - 657 657 - 658 658 - 659 659 - 660 660 - 661 661 - 662 662 - 663 663 - 664

X

Anz

ahl

Häufigkeit in der Messreihe angepasste NV-Dichte

Testat-Aufgabe sr_aufg_4 In den Dateien sr_aufg_4_xy_MR1.txt, sr_aufg_4_xy_MR 2.txt und sr_aufg_4_xy_MR3.txt (xy = Endziffern Ihrer Matrikelnummer) finden Sie drei verschiedene Messreihen. Es soll jeweils untersucht werden, ob bei der Messreihe eine Normalverteilung vorliegt und falls ja, welche Normalverteilung in Frage kommt. a) Lesen Sie die drei Messreihen in Excel ein. b) Berechnen Sie für jeden der drei Messreihen Mittelwert, empirische Varianz, empirische

Standardabweichung, Median und Spannweite. c) Erstellen Sie für jeden der drei Messreihen ein Histogramm.

Erläutern Sie hierzu auch die Wahl der Klassen: Wie viele Klassen haben Sie gewählt (und warum diese Anzahl von Klassen)? Wie haben Sie die Klassengrenzen festgelegt und warum? Welche Excel-Funktion haben Sie beim Auszählen benutzt?

d) Entscheiden Sie anhand des Histogramms für jeden der drei Messreihen, ob eine Normalverteilung vorliegt. Begründen Sie Ihre Entscheidung.

e) Sofern bei einer Messreihe eine Normalverteilung vorliegt, erstellen Sie ein weiteres Diagramm, das sowohl das Histogramm als auch die (an das Histogramm angepasste) Dichtekurve der passenden Normalverteilung zeigt. Auf der nächsten Seite ist ein verkleinertes Muster (mit anderen Zahlenwerten) eines solches Diagramms angegeben (für den Fall, dass bei Messreihe MR1 eine Normalverteilung vorliegt). • Welche Normalverteilungsdichte haben Sie gezeichnet, d. h., welche Werte haben Sie für

die Parameter µ bzw. σ eingesetzt? f) Erläutern Sie zu dem/den bei e) gezeichneten Diagramm(en):

• Um welchen Faktor unterscheiden sich die im Histogramm dargestellten Anzahlen von den Funktionswerten der Normalverteilungsdichte?

• Wie haben Sie diesen Faktor bei der Erstellung des Diagramms berücksichtigt? Mussten Sie die Skalierung der y-Achse(n) ändern? Wenn ja, wie? Wenn nein, warum nicht?

g) Erstellen Sie für die Messreihe(n), die normalverteilt ist/sind, ein zusätzliches Diagramm, das diejenige Verteilungsfunktion zeigt, die zu der in e) gezeichneten Dichte gehört.

(Fortsetzung auf der nächsten Seite)

Testat-Aufgabenblatt Labor Statistik Seite 14/17 TBB2, WKB2/Prof. Melzer

Hinweise: Für die Aufgabe sr_aufg_4 sind abzugeben: 1.) Ein Ausdruck Ihrer Excel-Berechnungen zu b). 2.) Ein Ausdruck der drei Histogramme zu c). 3.) Eine Erläuterung zu c). Wie viele Klassen haben Sie gewählt (und warum diese Anzahl von

Klassen)? Wie haben Sie die Klassengrenzen festgelegt und warum? Welche Excel-Funktion haben Sie beim Auszählen benutzt?

4.) Eine Erläuterung zu d). Geben Sie dabei für jede der drei Messreihen an, ob eine Normalverteilung vorliegt. • Falls nein, begründen Sie, warum eine Normalverteilung nicht in Frage kommt. • Falls ja, geben Sie an, welche Normalverteilung Sie bei e) gezeichnet haben, d. h.,

welche Werte Sie für die Parameter µ bzw. σ eingesetzt haben. 5.) Für jede normalverteilte Messreihe ein Ausdruck des Diagramms e), das gleichzeitig

Histogramm und Normalverteilungsdichte zeigt. 6.) Die folgenden Erläuterungen zu Aufgabenteil f):

• Um welchen Faktor unterscheiden sich die im Histogramm dargestellten Anzahlen von den Funktionswerten der Normalverteilungsdichte?

• Wie haben Sie diesen Faktor bei der Erstellung des Diagramms berücksichtigt? Mussten Sie die Skalierung der y-Achse(n) ändern? Wenn ja, wie? Wenn nein, warum nicht?

7.) Für jede normalverteilte Messreihe ein Ausdruck des Diagramms mit der Verteilungsfunktion aus Aufgabenteil g)

(Fortsetzung auf der nächsten Seite)

Muster zu 4e)

Testat-Aufgabenblatt Labor Statistik Seite 15/17 TBB2, WKB2/Prof. Melzer

Bitte kontrollieren Sie Ihre Resultate vor der Abgabe mit den Ihnen zur Verfügung gestellten Teilergebnissen (Datei „Teilergebnisse_xy.txt“) und beachten Sie auch die unten gegebenen Tipps. Die Unterlagen sind in Papierform abzugeben (keine E-Mail), am besten zusammengeheftet. Als Deckblatt ist die (ausgefüllte) Seite 3 dieses Aufgabenblattes voranzustellen. Die Excel-Dateien mit Ihren Bearbeitungen sind bis zum Ende des Prüfungszeitraumes aufzubewahren. Spätester Abgabetermin: Mi. 31.05.17 (WKB), Mi. 31.05.17 (TBB)

Tipps zu Aufgabe sr_aufg_4 Aufgabe 4b): Die ersten beiden Nachkommastellen der von Ihnen zu berechnenden Kennzahlen finden Sie in der Datei „Teilergebnisse_xy.txt“ (xy = Endziffern Ihrer Matrikelnummer). Aufgabe 4c): Überprüfen Sie, ob Ihre Klasseneinteilung sinnvoll ist:

• Nicht sinnvoll ist es beispielsweise, wenn die Obergrenze der ersten Klasse das Minimum der gegebenen Daten ist.

• Für ebenfalls nicht sinnvoll halte ich z. B. eine Klasse, die von 46,988 bis 48,013 geht. (Hier würde man eher die „glatten“ Grenzen 47 – 48 wählen.)

Achten Sie darauf, dass Ihr Diagramm tatsächlich ein Histogramm ist. U. a. bedeutet das, dass die Säulen des Diagramms aneinander stoßen.

Kontrollieren Sie auch, ob die Achsen Ihres Diagramms ordentlich beschriftet sind. Aufgabe 4e): Vergleichen Sie zum Vorgehen bei dieser Aufgabe auch die entsprechende Aufgabe zur Normalverteilungsdichte, die in der Statistik-Vorlesung behandelt wird (Aufgabe 84).

Beachten Sie beim Zeichnen der Normalverteilungsdichte: • Es ist nicht möglich, die Normalverteilungsdichte dadurch zu erhalten, dass man

eine Trendlinie in das Histogramm einzeichnet. • Achten Sie darauf, dass die NV-Dichte nicht um eine halbe Säulenbreite

gegenüber dem Histogramm verschoben ist (siehe hierzu die Abbildungen auf der nächsten Seite).

Testat-Aufgabenblatt Labor Statistik Seite 16/17 TBB2, WKB2/Prof. Melzer

Aufgabe 4 MR1 - Histogramm und Normalverteilungsdichte

0

5

10

15

20

25

654 - 655 655 - 656 656 - 657 657 - 658 658 - 659 659 - 660 660 - 661 661 - 662 662 - 663 663 - 664

X

Anz

ahl

Häufigkeit in der Messreihe angepasste NV-Dichte

Aufgabe 4 MR1 - Histogramm und Normalverteilungsdichte

0

5

10

15

20

25

654 - 655 655 - 656 656 - 657 657 - 658 658 - 659 659 - 660 660 - 661 661 - 662 662 - 663 663 - 664

X

Anz

ahl

Häufigkeit in der Messreihe angepasste NV-Dichte

Beispiel für eine richtige Lösung von Aufgabe 4e): Beispiel für eine falsche Lösung von Aufgabe 4e):

NV-Dichte richtig zentriert

falsch: NV-Dichte um 0,5 zu weit links

Testat-Aufgabenblatt Labor Statistik Seite 17/17 TBB2, WKB2/Prof. Melzer

Aufgabe 4g): Die Verteilungsfunktion einer normalverteilten Zufallsvariablen ist eine streng monotone stetige Funktion. Achten Sie darauf, dass Ihr Diagramm auch tatsächlich eine solche Funktion zeigt.

Achten Sie auch darauf, dass die Achsen sinnvoll markiert und beschriftet sind. In diesem Aufgabenteil sollte insbesondere die x-Achse eine „normale“ Skalierung haben und nicht eine Klasseneinteilung (von ... bis ...) zeigen. Die untenstehende Abbildung zeigt ein Beispiel für eine Lösung von Aufgabenteil 4g).