21
Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April 2013 c Roland Rau Survival-Analyse — 01. Sitzung 1 / 21

Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

  • Upload
    vanlien

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Einführung in die Survival-Analyse(Modul: Methoden II)

ROLAND RAU

Universität Rostock, Sommersemester 2013

02. April 2013

c© Roland Rau Survival-Analyse — 01. Sitzung 1 / 21

Page 2: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Formalia & Übersicht

Seminar: wöchentlich um 09:15 in Raum 227 (PC-Pool) der Ulmenstr. 69

# Datum Inhalt / Anmerkungen01 02.04. Einführung02 09.04. PAA03 16.04.04 23.04.05 30.04.06 07.05.07 14.05.08 21.05. (evtl. Puffer) Projektwoche09 28.05. “TTT” — “Testat, Teams & Themen”10 04.06.11 11.06.12 18.06.13 25.06. RR: Dienstreise14 02.07. Referate15 09.07. Referate

TBA Abgabe der Hausarbeiten

geplante Themen (in eventuell veränderter Reihenfolge)•Was ist Survival Analyse?• Die elementaren Funktionen: S(x), h(x) [= µ(x)], H(x), f (x)• Zensierung & Trunkierung• Vorstellung: Datensatz zur Erstellung der

Seminararbeiten (wird bei studip.uni-rostock.de liegen)• typische Datenstruktur für Survival-Analyse• Einfache, parametrische Survival-Modelle• Likelihood Konstruktion & deren Schätzung• “Nichtparametrische” Schätzung• Kaplan-Meier-Verfahren

(incl. Konfidenzintervallen und -bändern)• Log-Rank Test• Odd-Aalen Schätzer• Vergleich von Kaplan-Meier- und Odd-Aalen-Verfahren•Was sind “Proportional Hazards” Modelle?• Unterschiede zu “AFT” Modellen• Einfache parametrische Modelle mit Kovariaten

(incl. “piecewise-constant model”)• Vergleich zur Sterbetafel• Semiparametrische Survival-Regression: Das Cox Modell• Überprüfung der Proportionalitätsannahme im Cox-Modell• stratifiziertes Cox-Modell• zeitabhängige Kovariaten im Cox-Modell• Datensimulation bei der Survival-Analyse(die Umsetzung am Computer erfolgt mittels der Sprache R)(siehe www.r-project.org)

c© Roland Rau Survival-Analyse — 01. Sitzung 2 / 21

Page 3: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

einführende und weiterführende Literatur

KLEIN und MOESCHBERGER (2003): Survival Analysis :Techniques for Censored and Truncated Data, Springer(persönliche Einschätzung RR: Das beste der vier Bücher)

KLEINBAUM und KLEIN (2005): Survival Analysis. ASelf-Learning Text, Springer(persönliche Einschätzung RR: Wohl leichter verständlich als dieanderen drei Bücher)

COX und OAKES (1984): Analysis of Survival Data, Chapman& Hall(persönliche Einschätzung RR: Einer der Klassiker)

COLLETT (1994): Modelling Survival Data in MedicalResearch, Chapman & Hall(persönliche Einschätzung RR: ebenfalls weit verbreitet und gut lesbar)

c© Roland Rau Survival-Analyse — 01. Sitzung 3 / 21

Page 4: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Begriffsklärung:

Ich verwende die Begriffe:Ereignis(daten)analyseSurvival AnalyseEvent History Analysis

synonym.

c© Roland Rau Survival-Analyse — 01. Sitzung 4 / 21

Page 5: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Was ist das besondere der Survival Analyse?

Statistische Datenanalyse

Zentrales Element der Analyse:Zeitdauer bis zu einem Ereignisin aller Regel auch: welchen Einfluss üben Kovariaten auf die Dauer bis zumEintritt dieses Ereignisses aus?

Beispiele für Zeitdauern und Ereignisse: . . .

c© Roland Rau Survival-Analyse — 01. Sitzung 5 / 21

Page 6: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Was ist das besondere der Survival Analyse?

Statistische Datenanalyse

Zentrales Element der Analyse:Zeitdauer bis zu einem Ereignisin aller Regel auch: welchen Einfluss üben Kovariaten auf die Dauer bis zumEintritt dieses Ereignisses aus?

Beispiele für Zeitdauern und Ereignisse:

Zeitdauer EreignisZeit seit Geburt TodZeit seit Diagnose mit Krankheit x Tod aufgrund von Krankheit xAlter bei Beginn der Erwerbstätigkeit Alter bei RenteneintrittZeit seit Studienbeginn Ende des StudiumsAlter nach dem 15. Geburtstag Geburt des ersten Kindes. . . . . .

Es ist also wichtig, dass gleich zu Beginn klar definiertwird, was die Prozesszeit ist, und um welches Ereignis essich handelt!

c© Roland Rau Survival-Analyse — 01. Sitzung 6 / 21

Page 7: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Was ist das besondere der Survival Analyse?

Warum brauchen wir hierfür besondere Methoden, warum nicht einfach “ne normalelineare Regression drüberjagen”?

yZeitdauer = a + bxkovariate

Hauptsächlich zwei Gründe:

“normale lineare Regression” beruht auf der Normalverteilungsannahme mitdem Wertebereich [−∞,∞]. Zeitdauern sind aber notwendigerweise imWertebereich [0,∞],

Manche Ereignisse werden gar nicht beobachtet. Aber es ist bekannt, wie langeeine Person dem Risiko ausgesetzt war, das Ereignis zu erfahren.

c© Roland Rau Survival-Analyse — 01. Sitzung 7 / 21

Page 8: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Die elementaren Funktionen der Survival-Analyse

vgl. für die formalen Aspekte:Kapitel 2 in Klein und Moeschberger (2003)

X sei die Zeitdauer/Prozesszeit bis zu einem spezifizierten Ereignis(z.B. Geburt eines zweiten Kindes seit dem ersten Kind, Zeit seit Infektion biszum Ausbruch einer Krankheit, Zeitdauer seit 1968 bis der 1. FC Nürnbergwieder einmal deutscher Meister wird, . . . .)

Wichtige definitorische Frage nicht nur: “Was ist das Ereignis?”sondern auch: “Wann ist der Nullpunkt der Prozesszeit?”(z.B. bei Beispiel Geburt eines zweiten Kindes seit dem ersten Kind: Ein zweitesKind kann nicht einen Monat nach der Geburt eines geboren werden.)

c© Roland Rau Survival-Analyse — 01. Sitzung 8 / 21

Page 9: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Die elementaren Funktionen der Survival-Analyse

vgl. für die formalen Aspekte:Kapitel 2 in Klein and Moeschberger (2003)

X sei die Zeitdauer/Prozesszeit bis zu einem spezifizierten Ereignis

Die Survival- / Survivor- /Überlebensfunktion ist definiert als:

S(x) = Pr(X > x)

Sofern es sich bei X um eine kontinuierliche Zufallsvariable handelt, soist S(x) eine kontinuierliche, monoton fallende Funktion.Ist X eine diskrete Zufallsvariable, so handelt es sich bei S(x) um eineabfallende Treppenfunktion.

c© Roland Rau Survival-Analyse — 01. Sitzung 9 / 21

Page 10: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

hypothetische Beispiele für Survival-Kurven

0 5 10 15 20 25 30

0.0

0.2

0.4

0.6

0.8

1.0

Prozesszeit x

S(x

)

c© Roland Rau Survival-Analyse — 01. Sitzung 10 / 21

Page 11: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

interaktives Beispiel: S(x) für Frauen, Deutschland-Ost

survivalanimation.r

c© Roland Rau Survival-Analyse — 01. Sitzung 11 / 21

Page 12: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Die elementaren Funktionen der Survival-Analyse

vgl. für die formalen Aspekte:Kapitel 2 in Klein and Moeschberger (2003)

X sei die Zeitdauer/Prozesszeit bis zu einem spezifizierten Ereignis

Die Survival- / Survivor- /Überlebensfunktion ist definiert als:

S(x) = Pr(X > x)

Die komplementäre Funktion ist die (kumulative) VerteilungsfunktionF(x) mit der dazugehörigen Dichtefunktion f (x):

F(x) = Pr(X ≤ x) = 1 − S(x) =

x∫0

f (t)dt

Daraus resultiert natürlich:

S(x) = 1 − F(x) = 1 −x∫

0

f (t)dt =

∞∫x

f (t)dt

Und:f (x) = −dS(x)

dx

c© Roland Rau Survival-Analyse — 01. Sitzung 12 / 21

Page 13: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Die elementaren Funktionen der Survival-AnalyseX sei die Zeitdauer/Prozesszeit bis zu einem spezifizierten EreignisDie Survival- / Survivor- /Überlebensfunktion ist definiert als:

S(x) = Pr(X > x)

Die komplementäre Funktion ist die (kumulative) Verteilungsfunktion F(x) mit derdazugehörigen Dichtefunktion f (x):

F(x) = Pr(X ≤ x) = 1− S(x) =

x∫0

f (t)dt

Daraus resultiert natürlich:

S(x) = 1− F(x) = 1−x∫

0

f (t)dt =

∞∫x

f (t)dt

Und:

f (x) = −dS(x)

dxFrage:

Welchen Funktionen entsprechen S(x) und f (x) in derSterbetafel?

Hilft dies beim Verständnis der Gleichung: f (x) = − dS(x)dx ?

c© Roland Rau Survival-Analyse — 01. Sitzung 13 / 21

Page 14: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

interaktives Beispiel: f(x) für Frauen, Deutschland-Ost

survivalanimationdx.r

c© Roland Rau Survival-Analyse — 01. Sitzung 14 / 21

Page 15: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Die elementaren Funktionen der Survival-Analyse

X sei die Zeitdauer/Prozesszeit bis zu einem spezifizierten Ereignis

S(x) = Pr(X > x)

F(x), f (x):

Statistische Modelle beziehen sich neben der Survival-Funktion S(x)hauptsächlich auf eine weitere Funktion: die hazard function, hazard rate, forceof mortality, intensity, conditional failure rate, Übergangsrate, Hazardrate, . . . (alldiese Begriffe werden für dasselbe Konzept verwendet)Sie ist definiert als:

h(x) = lim∆x→0

Pr(x ≤ X < x + ∆x | X ≥ x)

∆x

(In der Demographie wird anstatt von h(x) häufig µ(x) verwendet.)

für eine kontinuierliche Zufallsvariable X gilt damit:

h(x) =f (x)

S(x)und da f (x) = −

dS(x)

dx⇒ h(x) =

− dS(x)dx

S(x)=−d ln S(x)

dx

c© Roland Rau Survival-Analyse — 01. Sitzung 15 / 21

Page 16: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Geplant für die nächste Veranstaltung:

Wiederholung S(x), f (x), h(x)

Kumulativer Hazard H(x)

Was tun bei nicht vollständig beobachteter Prozesszeit?(→ Zensierung und Trunkierung)(grobe) Vorstellung des Datensatzes für die Hausarbeit

Beim Datensatz wird es sich um einen Teil des öffentlichverfügbaren “National Health Interview Survey”(http://www.cdc.gov/nchs/nhis.htm) handeln. Wirwerden dabei (vermutlich) die Interviewwelle des Jahres 1997verwenden mit dem dazugehörigen Mortality-Follow-Up bis insJahr 2006.

c© Roland Rau Survival-Analyse — 01. Sitzung 16 / 21

Page 17: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

“Hausaufgabe”

Gehen Sie die Folien noch einmal in Ihrem eigenen Tempo durch. VergewissernSie sich, dass Sie die Basis-Funktionen S(x), f (x), h(x) verstehen und wissen,wie man die eine Funktion durch die andere ausdrücken kann.

Erstellen Sie sich für unser Seminar ein Arbeitsverzeichnis auf Ihrem eigenenLaptop/Rechner oder auf Ihrem Uni-Laufwerk; beispielsweise:

C:\Sommer2013\Survival

Registrieren Sie sich bei der Human Mortality Database (“HMD”,www.mortality.org)

Laden Sie sich dort eine “1x1” Sterbetafel für Frauen für ein beliebiges Landherunter.

Laden Sie sich von meiner Uni-Homepage die Datei survivalanimation.rherunter.

Öffnen Sie dieses Skript in R und versuchen Sie es “zum Laufen” zu bekommen.Beachten Sie dabei, dass Sie das Paket rpanel vermutlich noch installierenmüssen. Zudem sollten Sie nicht vergessen, dass man vermutlich für diePfadangaben den doppelten Backslash unter Windows benötigt. Also

setwd("C:\\Sommer2013\\Survival")

und NICHT:

setwd("C:\Sommer2013\Survival")

c© Roland Rau Survival-Analyse — 01. Sitzung 17 / 21

Page 18: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Vielen Dank für Ihre Aufmerksamkeit!

c© Roland Rau Survival-Analyse — 01. Sitzung 18 / 21

Page 19: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Collett, D. (1994). Modelling Survival Data in Medical Research. Texts inStatistical Science. London, UK: Chapman & Hall.

Cox, D. and D. Oakes (1984). Analysis of Survival Data. London, UK:Chapman & Hall.

Klein, J. P. and M. L. Moeschberger (2003). Survival Analysis : Techniquesfor Censored and Truncated Data. Statistics for Biology and Health. NewYork, NY: Springer.

Kleinbaum, D. G. and M. Klein (2005). Survival Analysis. A Self-LearningText. New York: Springer.

c© Roland Rau Survival-Analyse — 01. Sitzung 19 / 21

Page 20: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Lizenz

This open-access work is published under the terms of the CreativeCommons Attribution NonCommercial License 2.0 Germany, whichpermits use, reproduction & distribution in any medium for non-commercialpurposes, provided the original author(s) and source are given credit.

Für ausführlichere Informationen:http://creativecommons.org/licenses/by-nc/2.0/de/ (Deutsch)

http://creativecommons.org/licenses/by-nc/2.0/de/deed.en (English)

c© Roland Rau Survival-Analyse — 01. Sitzung 20 / 21

Page 21: Einführung in die Survival-Analyse (Modul: Methoden II) · Einführung in die Survival-Analyse (Modul: Methoden II) ROLAND RAU Universität Rostock, Sommersemester 2013 02. April

Kontakt

Universität RostockInstitut für Soziologie und DemographieLehrstuhl für DemographieUlmenstr. 6918057 RostockGermany

Tel.: +49-381-498 4044Fax.: +49-381-498 4395Email: [email protected]

Sprechstunde im Sommersemester 2013: Mittwochs, 09:00–10:00(und nach Vereinbarung)

c© Roland Rau Survival-Analyse — 01. Sitzung 21 / 21