24
F-Praktickm Einführung in die Statistik Erika Garutti ([email protected] ) Universität Hamburg, Institut für Experimentalphysik Wednesday, January 21, 15

Einführung in die Statistik - physnet.uni-hamburg.de · F-Praktickm Einführung in die Statistik Erika Garutti ([email protected]) Universität Hamburg, Institut für Experimentalphysik

Embed Size (px)

Citation preview

F-Praktickm

Einführung in die Statistik

Erika Garutti ([email protected])

Universität Hamburg, Institut für Experimentalphysik

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 232

references: this course contains material taken from:

• V. Blobel/E. Lohrmann “Statistische Methoden der Datenanalyse” • M. Erdmann, T. Hebbeker: “Experimentalphysik 5 - Moderne Methoden der Datenanalyse, Springer Spektrum, 2013”

• Dr. H.J. Simonis, Fakultät für Physik, Praktikum Klassische Physik• http://www.physi.uni-heidelberg.de/Einrichtungen/AP/anleitungen/apl/Fitmethoden.pdf• wikipedia

disclaimer

please do not distribute these slides electronically without permission

keep them for yourself

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Alle Messungen, egal wie sorgfältig und wissenschaftlich sie auch durchgeführt werden, unterliegen Meßabweichungen. Die Kenntnis dieser Meßunsicherheit kann für die Bewertung eines Meßergebnisses entscheidend sein.

Beispiel:Eine Messung ergibt (I) c = (3.09 ± 0.15)·108 m/s.Das Ergebnis ist in Übereinstimmung mit dem "wahren" Wert (Literaturwert: (II) c = 2.99792458·108 m/s)Angenommen die Messung wäre zu (III) c = (3.09 ± 0.01)·108 m/s bestimmt worden.Dann steht das Meßergebnis im Widerspruch zum "wahren" Wert!

Die Messung einer physikalischen Größe ohne Angabe der Messunsicherheit ist wertlos!

Einleitung

3

(III)

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Darstellung von Meßergebnissen

Messung einer physikalischen Größe bedeutet, experimentell die Maßzahl zur vorgegebenen Maßeinheit zu ermitteln:

G = (x ± Δx) [G]

Zur vollständigen Angabe eines Meßergebnisses gehört die Angabe der Meßzahl, gegeben durch den Bestwert der Messung x, sowie die Angabe der Meßabweichung Δx, und der Maßeinheit.

Man unterscheidet zwei Schreibweisen:

1) Angabe der absoluten Meßabweichung, diese kennzeichnet den Bereich, innerhalb dessen der wahre Wert mit einer geforderten Wahrscheinlichkeit liegt:

G = (x ± Δx) [Maßeinheit]

Dies ermöglicht den einfachen Vergleich mit anderen Messungen

4Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Darstellung von Meßergebnissen

Messung einer physikalischen Größe bedeutet, experimentell die Maßzahl zur vorgegebenen Maßeinheit zu ermitteln:

G = (x ± Δx) [G]

Zur vollständigen Angabe eines Meßergebnisses gehört die Angabe der Meßzahl, gegeben durch den Bestwert der Messung x, sowie die Angabe der Meßabweichung Δx, und der Maßeinheit.

Man unterscheidet zwei Schreibweisen:

2) Angabe der relativen Meßabweichung:

G = x [Maßeinheit] ± Δx/x

Hieran erkennt man die Präzision der Messung (grob ↔ präzise)

Δx/x wird meistens in Prozent angegeben.

5Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Signifikante Stellen eines Messergebnisses

Regel 1: Im Praktikum sollen Meßabweichungen („Fehler“) auf eine signifikante Stelle gerundet werden.

Regel 2: Die letzte signifikante Stelle des Meßwertes soll dieselbe Größenordnung haben wie die Meßunsicherheit. (Ausnahme: werden die Ergebnisse in Rechnungen weiter verwendet, so wird mindestens eine weitere signifikante Stelle mitgenommen und nur das Endergebnis auf eine signifikante Stelle gerundet.)

Beispiel: Die Messung der Erdbeschleunigung liefert als rechnerisches Ergebnis: g = 9.8243 m/s2 und Δg = ± 0.02385 m/s2

nach Regel 1 folgt: Δg = ± 0.02 m/s2

nach Regel 2 folgt: g = 9.82 m/s2

d.h. wir schreiben: g = (9.82 ± 0.02) m/s2

bzw: g = 9.82 m/s2 ± 0.2 %6

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Signifikante Stellen eines Messergebnisses

Hinweis (1): die Schreibweise sollte übersichtlich gewählt werden:

Beispiel: Masse eines Objekts: m = (0.0000082 ± 0.0000003) kg (korrekt, aber schwer lesbar) m = 0.0000082 kg ± 0.3 mg (dito)

m = (8.2 ± 0.3) x 10-6 kg (das liest sich leichter) m = (8.2 ± 0.3) mg

Hinweis (2): Implizite Fehlerangabe:

Man findet manchmal in wissenschaftlichen Schriften Meßwerte ohne Fehlerangabe. Hier kann man folgendes über den Fehler annehmen:

Alle angegebenen Stellen sind signifikant; der Fehler ist kleiner als die halbe folgende Stelle.

Beispiel: U = 250 V bedeutet: U = (250.0 ± 0.5) V

7Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Fehleranalyse

Zu jeder Messung muss eine Fehleranalyse durchgeführt werden. Dabei werden Ursache und Grösse von Meßabweichungen untersucht. Wir wollen zwei Begriffe unterscheiden:

Präzision: kennzeichnet die Reproduzierbarkeit einer Messung („Streuung“). Sie wird durch den statistischen Fehler charakterisiert.

Genauigkeit: gibt an, wie nahe der Meßwert dem "wahren" Wert ist. Sie wird durch den systematischen Fehler charakterisiert.

8Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Grobe Abweichungen

Ursachen: 1) Fehlerhafte Bedienung von Meßgeräten (z.B. falsch kalibriert)2) Irrtum beim Protokollieren oder der Auswertung (z.B. Zahlendreher)3) Meßverfahren oder Meßbedingung ungeeignet

Grobe Abweichungen müssen durch sorgfältiges Experimentieren und Kontrolle (mindestens eine Kontrollmessung möglichst durch eine zweite Person) vermieden werden.Grob fehlerhafte Werte einer Meßreihe werden nicht weiter verwendet.

Eine nicht zu unterschätzende Fehlerquelle ist eine mangelnde Objektivität des Experimentators. Oft entstehen falsche Meßresultate auch dadurch, dass der Experimentator das Resultat, das er haben will, aus unzureichenden Daten herausliest oder sogar Daten manipuliert.

9

kleiner Exkurs: der Fall “Einstein-Rupp Experiment” ...

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Systematische Abweichungen

Systematische Abweichungen zeigen bei identischen Meßbedingungen immer um den gleichen Betrag in die gleiche Richtung. Sie können durch Meßwiederholung weder erkannt noch eliminiert werden. Daher beeinflussen sie die Genauigkeit einer Messung. Sie sind erfassbar durch Variation der Meßmethode oder der Meßbedingungen.

10

Die gute Nachricht: Erkannte systematische Fehler können korrigiert werden.

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Systematische Abweichungen

Beispiel: Messung der Länge eines Tisches mit einem Metallmaßstab.

Präzision = 1/2000; T = 30°C → Ergebnis L = 1.982 m

Systematische Fehlerquellen:

a) Eichfehler: Maßstab geeicht bei 20°C → Korrektur: α = 0.0005 K-1

L' = L·[1 + 0.0005·(30-20)] = 1.005·L → L' = 1.992 m

b) Parallaxenfehler: Beobachtung des Maßstabes unter einem Winkel → ΔL = 1 mm

→ L" = 1.992 ± 0.001 m

Falls systematische Fehler aus meßtechnischen Gründen oder auf rechnerischem Wege nicht erfasst werden können, muss man die Meßabweichungen abschätzen.

11Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Zufällige Meßabweichungen

Zufällige (statistische) Abweichungen beeinflussen das Meßergebnis bei identischen Meßbedingungen unterschiedlich in Betrag und Vorzeichen. Sie sind zufällig in dem Sinne, dass ihre Ursachen im Einzelnen nicht verfolgt werden können. Sie sind unvermeidbar und nicht exakt erfassbar. Sie bestimmen die Präzision einer Messung.

Die gute Nachricht:Zufällige Fehler lassen sich durch Meßwiederholung und Mittelung reduzieren

Aufgrund des stochastischen Verhaltens schreibt man den Meßwerten einen Wahrscheinlichkeitscharakter zu. Der “wahre Wert“ liegt mit einer bestimmten Wahrscheinlichkeit in dem durch die Meßabweichung definierten Bereich.

12Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Meßreihen

Meßreihen stellen eine Stichprobe aus der Menge aller möglichen Meßwerte dar. Jede Meßreihe hat eine zu berechnende Wahrscheinlichkeit, daß sie die Grundgesamtheit repräsentiert.

Sind nur zufälligen Fehler im Spiel, wird die beherrschende Grundgesamtheit durch die Normalverteilung beschrieben.

13Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Mit zunehmender Anzahl von Messungen nähert sich die Häufigkeitsverteilung irgendwelche Zufallsvariablen mit IRGENDEINER Wahrscheinlichkeitsdichteeiner Gaussfunktion mit Mittelwert = 0 und Varianz =1

!!! Voraussetzung: rein statistische Fehler

14

Zentraler Grenzwertsatz(Central Limit Theorem)

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Illustration: Zentraler Grenzwertsatz (uniform verteilte Zufallszahlen)

15

Beispiel aus der Teilchenphysik: Vielfachstreuung!

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Wichtige Wahrscheinlichkeitsverteilungen

16

(in backup)

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Gauß-Verteilung (Normal-Verteilung)

17Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Gauß-Fehler

18Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 2319

Physics

theory:mathematical model of nature

experiment:measurements of observable quantities

prediction (hypothesis)no prediction

agrees with prediction

contradicts predictionopen

questions?

theory

theory

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Data - Theorie anpassung

1) Messdaten Auswertung mit eine Bekannte Theorie:

Das Ziel der Auswertung besteht darin, durch eine bestmögliche Anpassung der Theoretischefunktion (Fitfunktion) die unbekannten Parameter (a) und deren Fehler zu bestimmen.

Beispiel: Radioaktiver Zerfall eines Kerns mit Lebensdauer τ = a

2) Unbekannte TheorieMessdaten sollen genutzt werden um Theorien zu testen und sie entweder zu bestätigen oder zu widerlegen.

Methoden:a) Maximum-Likelihood-Fit: Maximiere Ubereinstimmung Theorie(a) / Experimentb) χ2-Fit: = Spezialfall (auch: `Methode der kleinsten Quadrate')

20Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

χ2-fit Methode (Unkorreliert, 1-dim.)

Gegeben seien N Messwerte yi(xi) mit stat. unkor. Gauß- Fehlern σi. Die Beziehung zwischen x und y sei durch eine Funktion y = f(x|a) mit a=frei Parameter gegeben, die an die Daten angepasst werden soll.

Die χ2 Funktion ist dann definiert durch:

Die Grösse χ2 misst die quadratische Abweichung der Datenpunkte von der Fitkurve in Einheiten ihrer Messfehler σi.

Die χ2 Statistik behauptet nun, dass die bestmögliche Anpassung der Fitkurve an die Daten erreicht wird durch Minimieren von χ2. Falls die Fitfunktion freie Parameter (a) enthält werden diese so lange variiert, bis das Minimum von χ2 gefunden ist.

Qualitat des Fits: Falls gut: χ2min ist χ2-verteilt !!!21

2 =NX

i=0

✓yi � f(xi|a)

�i

◆2

, 0 < �

2< 1

always positive number, useful to describe error distributions

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

χ2-Verteilung Ndof = N degrees of freedom (N frei Parameter)

Die χ2-Verteilung hängt ab von der Zahl der Freiheitsgrade der Anpassung.

k = N – Ndof = (Zahl der Messpunkte – Zahl der zu fittenden Parameter).

22

f(�2|Nd

o

f

) k = N - Ndof

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

χ2-Verteilung Ndof = N degrees of freedom (N frei Parameter)

Die χ2-Verteilung hängt ab von der Zahl der Freiheitsgrade der Anpassung.

k = N – Ndof = (Zahl der Messpunkte – Zahl der zu fittenden Parameter). Für eine große Zahl von Freiheitsgraden (> 10) nutzt man zur Abschätzung der Güte des Fits das ‚reduzierte χ2’ = Q = χ2 / k

23

f(�2|Nd

o

f

) k = N - Ndof

Die Wahrscheinlickeit des Fits hängt von Q ab, und dieses sollte bei einer großen Zahl von Freiheitsgraden etwa Q=1 sein, damit der Fit hohe Wahrscheinlichkeit hat.

Wednesday, January 21, 15

E. Garutti Introduction to statistics F-Praktikum / 23

Beispiel: χ2-fit

24

Fitfunktion:

Frei Parameter: const, μ, σ

Ndof = 74 ?Q= χ2 / k ~1

Wednesday, January 21, 15