Upload
tranphuc
View
215
Download
0
Embed Size (px)
Citation preview
A posse ad esse
Einführung
DeduktionDer Goldstandard wissenschaftlichen Arbeitens
etablierte Theorie
Hypothese
Vorhersage (Modell)
bestätige widerlege
füge hinzu verwerfe
Experiment/Beobachtung
Alkoholkonsum und Schwangerschaft
Theorie: Alkoholkonsum wirkt teratogen.Hypothese: Alkoholkonsum während der Schwangerschaft
beeinflusst die Hirnentwicklung.Vorhersage: Während der Schwangerschaft exponierte
Kinder zeigen vermehrt Verhaltensprobleme.Beobachtung: Ermittlung und Vergleich der Häufigkeit von
Verhaltensauffälligkeiten unter jeweils 100 exponierten und nicht exponierten Kindern.
www.come-over.to
Etymologielat. statisticus ("staatswissenschaftlich")
Definition"Statistik bezeichnet die Mathematik des Sammelns, Ordnens und Interpretierens numerischer Daten, insbesondere zur Analyse von Populationscharakteristika auf der Grundlage von Stichproben."
American Heritage® Dictionary
Was ist Statistik ?
Zusammenfassung experimenteller und observationaler DatenDeskriptive Statistik (Graphiken, Tabellen, Plots etc.)
Schätzung von Behandlungseffekten Schätztheorie (Mittelwert, Standardabweichung, Konfidenzintervall etc.)
Entscheidungsfindung auf der Basis empirischer BeobachtungenHypothesentests (Signifikanz, Power, P-Werte etc.)
Modellierung des Zusammenhangs von Faktoren Assoziations- und Regressionsanalyse (Korrelationskoeffizient, lineare Regression etc.)
Was ist Statistik ?(fast) ein Kursplan
kritische Bewertung von Beobachtungen
Berücksichtigung des ZufallsErgänzung des "gesunden Menschenverstands"
Verständnis der wissenschaftlichen Literatur
Verstehen von Zweck und DesignBeurteilung der wissenschaftlichen Glaubwürdigkeit
Design und Durchführung von Experimenten
Wahl der angemessenen statistischen MethodeWahl des angemessenen Studiendesignsrichtiger Gebrauch von Formeln und Softwarerichtige Interpretation von Resultaten
Wozu Statistik ?für Medizinstudenten
"... das systematische Auffinden, Bewerten, und Nutzen aktueller wissenschaftlicher Ergebnisse als Grundlage
klinischer Entscheidungen."
Evidenzbasierte Medizin
Rosenberg W, Donald A (1995). Evidence based medicine: an approach to clinical problem solving. BMJ 310: 1122-1126
"... verlangt, dass Sie den richtigen Artikel zur richtigen Zeit lesen und anschließend Ihr Verhalten (und, was oft
viel schwieriger ist, das Verhalten anderer Leute) dementsprechend ändern"
Greenhalgh T (1997). How to read a paper: the basics of evidence based medicine. BMJ, London
Evidenzbasierte Medizin
1975 1980 1985 1990 1995 2000 2005 2010 2015
0,2×106
0,4×106
0,6×106
0,8×106
1,0×106
1,2×106
1,4×106
Anz
ahl N
euei
nträ
ge
Jahr
Variation in Populationen
Gegenstand der Statistik ist die Untersuchung von Art und Variabilität eines gegebenen
Merkmals in einer Population.
- Welches sind die häufigen oder durchschnittlichenWerte des Merkmals?
- Wie stark variiert das Merkmal?- Gibt es bezüglich des Merkmals distinkteTeilpopulationen?
- Welches sind die Normalwerte des Merkmals?- Sind abnormale Werte des Merkmals pathologisch ?- Ist das Merkmal mit anderen Merkmalen assoziiert ?
Population und Stichprobe
Eine Population ist eine (üblicherweise große) Gruppe von Objekten, über die eine Aussage getroffen werden soll.
Eine Stichprobe besteht aus einer (üblicherweise kleinen) Anzahl von Mitgliedern der Population.
Population
Populations-Parameter
Stichprobe
Stichproben-Statistik
Daten ErhebenSchlussfolgerung
StichprobeZiehen
InferenzBilden
Population und Stichprobe
unterernährt (WHO): BMI<18.5, untergewichtig (NHANES): BMI<19.1US-Durchschnitt 20-29 Jahre: BMI=22.7
http://www.pbs.org/wgbh/amex/missamerica/sfeature/sf_list.html
Suzette CharlesSharlene WellsSusan AkinKellye CashKaye Lani Rae RafkoGretchen CarlsonDebbye TurnerMarjorie VincentKate ShindleNicole JohnsonAngela Perez BaraquioKatie Harman
198419851986198719881989199019911998199920012002
17.718.216.817.618.819.117.917.820.219.620.319.5
Jahr Name BMI
Weiblicher Body-Mass-Index (BMI)
Deskriptive Statistik
Die deskriptive Statistik dient dazu, Daten in verständlicher Weise zusammenzufassen.
Graphische Methoden sind besser als numerische Methoden dazu geeignet, Muster in Daten zu erkennen. Numerische Ansätze sind meistens präziser and objektiver.
Variablentypen
Qualitative Variable- nominal: Kategorien ohne Anordnung(z.B. Geschlecht, AB0-Blutgruppe)
- ordinal: Kategorien mit Anordnung (z.B. verbale Examensnoten, Tumor-Stadien)
Quantitative Variable- diskret: ganze Zahlen(z.B. Zellzahl, Nachkommenzahl)
- stetig: reelle Zahlen(z.B. Körpergewicht, Blutdruck)
Anzahl Kategorien
Stichprobengröße
k
Beobachtungen ix
qualitative Daten
absolute Häufigkeiten ih k...1i =
Stichprobencharakteristika
relative Häufigkeiten ii hn1
p ⋅=
n
n...1i =
Deskriptive Statistik
AB0-Blutgruppen
k=4
0 A B AB
0 A B AB
1 2 3 4i
28 32 10 5
0.373 0.427 0.133 0.067
37.3 42.7 13.3 6.7
hi
pi
100⋅pi
n=75
Quantile (Median)Mittelwert
quantitativ
ModalwertQuantile (Median)
qualitativordinal
Modalwertqualitativ nominal
LagemaßeTyp
Datenbeschreibung
Interquartilabstand Standardabweichung
Mediandeviation
Streuungsmaße
Lagemaße
Index Qualitativer Variation (IQV)
IQVInterquartilabstand
Der Modalwert einer Stichprobe ist deren (nicht immer eindeutig bestimmter) häufigster Wert.
0 A B AB
1 2 3 4i
28 32 10 5
0.373 0.427 0.133 0.067
37.3 42.7 13.3 6.7
hi
pi
100⋅pi
Lagemaßequalitative Daten
Das α-Quantil einer Stichprobe ist der Wert, für den die relative Häufigkeit kleinerer Werte
höchstens α und die relative Häufigkeit größerer Werte höchstens 1-α beträgt.
αx~
ordinale und quantitative Daten
45.0x~
< < < < < < < < <
0.40<0.45 0.50<1-0.45=0.55
Lagemaße
Weiblicher Body-Mass-Index (BMI)
9.17x~ 40.0 =
16.817.617.717.817.9
18.218.819.119.519.620.220.3
[BMI]BMI
17.718.216.817.618.819.117.917.820.219.620.319.5
α=0.40
60.058.012
7 ≤=
Sortieren
40.033.012
4 ≤=
)x~,x~(x~ 75.050.025.0 heißt 1. (2., 3.) Quartil
50.0x~ wird als Median bezeichnet.
ordinale und quantitative Daten
Lagemaße
Apgar-Score
erhoben jeweils 1, 5 und 10 Minuten nach der Geburt
benannt nach Dr. Virginia Apgar, der ersten auf die medizinische Versorgung
Neugeborener spezialisierten Kinderärztin
Der Apgar-Score ist die Summe der einzelnen Scores zu einem
Bewertungszeitpunkt.0 10tot voll vital
n=15
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
7 9 4 6 9 8 10 5 10 9 6 8 9 10 7xi
k=11
6x~ 25.0 =
8x~ 50.0 =
9x~ 75.0 =
1 2 3 4 5 6 7 8 9 10scorei
0 0 0 1 1 2 2 2 4 3hi
Apgar-Score
2 (0.13) 11 (0.73)
6 (0.40) 7 (0.47)
8 (0.53) 3 (0.20)
Vorteile der Quantilerobust gegen Ausreißer,anwendbar auf ordinale Daten,liefern in der Regel sinnvolle Werte,intuitiv nahe liegend
Nachteile der Quantileverwenden nur einen Teil der Information(nämlich deren Reihenfolge),sind nicht notwendigerweise eindeutig bestimmt
ordinale und quantitative Daten
Lagemaße
Der Mittelwert einer Stichprobe bezeichnet den Durchschnitt aller Werte, d.h.
∑ =⋅= n
1i ixn
1x
Vorteil des Mittelwertsverwendet alle verfügbare Information
Nachteile des Mittelwertsnur für quantitative Messungen sinnvoll,empfindlich gegen Ausreißer
x
quantitative Daten
Lagemaße
Suzette CharlesSharlene WellsSusan AkinKellye CashKaye Lani Rae RafkoGretchen CarlsonDebbye TurnerMarjorie VincentKate ShindleNicole JohnsonAngela Perez BaraquioKatie Harman
198419851986198719881989199019911998199920012002
17.718.216.817.618.819.117.917.820.219.620.319.5
Jahr Name BMI
6.1812
5.223x == 5.18
28.182.18
x~ 50.0 =+=
Weiblicher Body-Mass-Index (BMI)
Suzette CharlesSharlene WellsSusan AkinKellye CashKaye Lani Rae RafkoGretchen CarlsonDebbye TurnerMarjorie VincentKate ShindleNicole JohnsonAngela Perez BaraquioKatie HarmanVenus Rubens
1984198519861987198819891990199119981999200120021630
17.718.216.817.618.819.117.917.820.219.620.319.542.6
Jahr Name BMI
5.2013
1.266x ==
8.18x~ 50.0 =
Weiblicher Body-Mass-Index (BMI)
Der Mittelwert markiert den Schwerpunkt der Daten.
Weiblicher Body-Mass-Index (BMI)
Quantile (Median)Mittelwert
quantitativ
ModalwertQuantile (Median)
qualitativordinal
Modalwertqualitativ nominal
LagemaßeTyp
Datenbeschreibung
InterquartilabstandStandardabweichung
Mediandeviation
Streuungsmaße
Index Qualitativer Variation (IQV)
Streuungsmaße
IQVInterquartilabstand
Spannweite R=xmax-xmin
Interquartilabstand 25.075.0 x~x~IQR −=
Die Spannweite ist empfindlich gegen Ausreißer.
Streuungsmaßequantitative Daten
0 1 2 3 4 5 6 7 8 9 10vi
0 0 0 0 1 1 2 2 2 4 3hi
6x~ 25.0 = 9x~ 75.0 =vmin=4, R=6
, IQR=3
vmax=10
1 0 0 0 1 1 2 2 2 4 3hi
vmin=0, R=10vmax=10
6x~ 25.0 = 9x~ 75.0 =, IQR=3
Apgar-Score
Mediandeviation 50.0y~MAD =
50.0ii x~xy −=mit
Standardabweichung1n
)xx(s
n
1i
2i
−−
= ∑ =
Streuungsmaßequantitative Daten
17.718.216.817.618.819.117.917.820.219.620.319.5
xi
16.817.617.717.817.918.218.819.119.519.620.220.3
x[i]
123456789101112
i
0.80.31.70.90.30.60.60.71.71.11.81.0
yi y[i]
0.30.30.60.60.70.80.91.01.11.71.71.8
0.810.163.241.000.040.250.490.642.561.002.890.81
2i )xx( −
85.02
9.08.0MAD =+= 12.1
11
89.13s ==
6.18x = 5.18x~ 50.0 =
Weiblicher Body-Mass-Index (BMI)
17.718.216.817.618.819.117.917.820.219.620.319.542.6
00.1MAD =
74.612
48.544s ==
12345678910111213
xii 2i )xx( −
7.845.29
13.698.412.891.966.767.290.090.810.041.00
488.41
0.00.30.60.70.80.91.01.21.41.51.72.023.8
y[i]
5.20x = 8.18x~ 50.0 =
Weiblicher Body-Mass-Index (BMI)
Stichprobenwerte xi
Zerlege die Spannweite der xi in k gleichgroße Intervalle (Klassen) der Breite (xmax-xmin)/k:
(x1,a2] (a2,a3] ... (ak,xn].
Bestimme die Klassenhäufigkeiten hi.
nk ≈ für n≤1000
)n(log10k 10⋅≈ für n>1000
DatenbeschreibungHistogramm
a1-a2 a2-a3 a3-a4 a4-a5 a5-a6 a6-a7 a7-a8
h1
h4
h2
Häufigkeit
Dimension
DatenbeschreibungHistogramm
0
5
10
15
20
25
30
10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90
0
5
10
15
20
25
30
10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 900
5
10
15
20
25
30
10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90
0
5
10
15
20
25
30
10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90
symmetrisch linkssteil
rechtssteil bimodal
DatenbeschreibungHistogramm
Box-Whisker-Plot
*
innererZaun
innererZaun
äußerer Zaun
IQR
25.0x~ 50.0x~ 75.0x~
1.5⋅IQR1.5⋅IQR
3⋅IQR3⋅IQR
o
äußerer Zaun
Datenbeschreibung
kleinster Wert im inneren Zaun Ausreißer
möglicher Ausreißer
größter Wert im inneren Zaun
20.120.320.520.8
21.521.622.522.7
23.824.624.524.8
25.429.133.0
x[i]
123456789101112131415
i
8.20x~ 25.0 =7.22x~ 50.0 =8.24x~ 75.0 =
0.48.208.24IQR =−=
Weiblicher Body-Mass-Index (BMI)
15
20
25
30
35
1 Minute: 5, 6, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9, 105 Minuten: 6, 6, 7, 7, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10
10 Minuten: 7, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10
Apgar-Score
Zusammenfassung
- Statistische Aussagen über die Variation von Merkmalen in Populationen werden auf der Grundlage repräsentativer Stichproben getroffen.
- Deskriptive Statistik dient der klaren und verständlichen Zusammenfassung von Daten und erlaubt es so, wichtige Muster oder Regelmäßigkeiten in Daten zu identifizieren.
- Experimentelle Variable lassen sich grob als entweder qualitativ oder quantitativ klassifizieren, wovon erstgenannte wiederum entweder nominal oder ordinal skaliert sind.
- Zu den numerischen und graphischen Verfahren der deskriptiven Datenauswertung gehören Lage- und Streuungsmaße sowie Histogramme und Box-Whisker-Plots, die Besonderheiten der Datenverteilung aufzeigen.
"Kontrollierte klinische Studien, in denen Patienten, die ein Medikament bekommen haben, mit solchen verglichen werden, die einer anderen Behandlung unterzogen wurden, ist der beste wissenschaftliche Weg zur Klärung, was ein Medikament tatsächlich bewirkt. Aus diesem Grund sind kontrollierte klinische Studien für die FDA die einzige rechtliche Grundlage zur Feststellung, dass ein neues Medikament seine Wirksamkeit hinreichend unter Beweis gestellt hat."
aus: Flieger, Testing Drugs in People
klinische StudienAnhang
Phase I"first-in-man", freiwillige Probanden, Dosis-Wirkung, Sicherheit, Verträglichkeit
Phase II"proof of concept", Untersuchung von Effizienz und Wirksamkeit an Patienten (kleine Fallzahlen), Dosis-Findung, eventuell Kontrollgruppe
klinische StudienAnhang
Phase 0 (Präklinik)Suche nach neuen therapeutischen Wirkstoffen, Labor- oder Tierexperiment, Pharmakokinetik, Toxizität
Phase IIIan Patienten (große Fallzahlen), Vergleich mit etablierten Behandlungen oder Placebo (Kontrollgruppe), Nebenwirkungen, Nachweis der Wirksamkeit als Voraussetzung für die Zulassung
Phase IVEtablierung als Standardbehandlung, Monitoring von Nebeneffekten
klinische StudienAnhang
1. Klinische Studien müssen in Übereinstimmung mit den ethischen Prinzipien der Deklaration von Helsinkidurchgeführt werden, was die Einhaltung der GCP und ihrer regulatorischen Anforderung impliziert.
2. Vor einer Studie müssen die vorhersehbaren Risikengegen den erwarteten Nutzen für Studienteilnehmer und Gesellschaft abgewogen werden. Eine Studie darf nur dann durchgeführt werden, wenn der erwartete Nutzen die Risiken rechtfertigt.
© Minister of Public Works and Government Services Canada 1997
Good Clinical Practice (GCP)Anhang
3. Rechte, Sicherheit und Wohlbefinden der Teilnehmer haben absolute Priorität and stehen über den Interessen von Wissenschaft und Gesellschaft.
4. Die verfügbare klinische und nicht-klinische Information über das zu untersuchende Produkt muss die Notwendigkeit der geplante Studie hinreichend belegen.
5. Klinische Studien müssen wissenschaftlich sinnvoll sein und in einem detaillierten Protokoll klar beschrieben werden.
© Minister of Public Works and Government Services Canada 1997
Good Clinical Practice (GCP)Anhang
6. Eine Studie muss in Übereinstimmung mit einem Protokoll durchgeführt werden, das zuvor die Zustimmung einer unabhängigen Ethikkommission erhalten hat.
7. Medizinische Handlungen und Entscheidungen stehen immer in der Verantwortung eines qualifizierten Arztesoder Zahnarztes.
8. Alle an der Durchführung einer Studie Beteiligten müssen durch entsprechende Ausbildung, Training und Erfahrung für ihre Aufgaben qualifiziert sein.
© Minister of Public Works and Government Services Canada 1997
Good Clinical Practice (GCP)Anhang
9. Von jedem Teilnehmer ist vor Einschluss in eine Studie die informierte Zustimmung zur Teilnahme einzuholen.
10. Informationen zu einer Studie müssen so gespeichert und gehandhabt werden, dass alle diesbezüglichen Berichte und Interpretationen überprüfbar bleiben.
11. Die Vertraulichkeit von personenbezogenen Daten muss zur Wahrung der Grundrechte der Teilnehmer und unter Beachtung einschlägiger gesetzlicher Regelungen gesichert werden.
© Minister of Public Works and Government Services Canada 1997
Good Clinical Practice (GCP)Anhang
12. Die zum Einsatz kommenden Produkte müssen gemäß der jeweils anwendbaren Good Manufacturing Practice (GMP) hergestellt, behandelt und gelagert werden. Sie müssen in Übereinstimmung mit dem Studienprotokoll verwendet werden.
13. Für alle Aspekte der Studie müssen entsprechende Maßnahmen zur Qualitätssicherung implementiert werden.
© Minister of Public Works and Government Services Canada 1997
Good Clinical Practice (GCP)Anhang
“R ist eine frei verfügbare Programmiersprache und -umgebung für statistische Analysen, die eine große Vielzahl rechnerischer und
graphischer Methoden bereithält.”
Das R-ProjektAnhang
Das R-ProjektAnhang