87
Universität Ulm Fakultät für Mathematik und Wirtschaftswissenschaften Institut für Versicherungswissenschaften Modellierung von Sterbewahrscheinlichkeiten mit Verweildauer- und Kalenderzeiteffekten Masterarbeit in Wirtschaftsmathematik vorgelegt von Lucia Teigiszerová am 07.11.2013 Gutachter Jun. Prof. Dr. Marcus C. Christiansen Prof. Dr. Hans-Joachim Zwiesler

Modellierung von Sterbewahrscheinlichkeiten mit

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Modellierung von Sterbewahrscheinlichkeiten mit

Universität Ulm

Fakultät für Mathematik und Wirtschaftswissenschaften

Institut für Versicherungswissenschaften

Modellierung von Sterbewahrscheinlichkeiten mitVerweildauer- und Kalenderzeiteffekten

Masterarbeit

in Wirtschaftsmathematik

vorgelegt vonLucia Teigiszerová

am 07.11.2013

Gutachter

Jun. Prof. Dr. Marcus C. ChristiansenProf. Dr. Hans-Joachim Zwiesler

Page 2: Modellierung von Sterbewahrscheinlichkeiten mit

Danksagung

Zuerst möchte ich mich bei Herrn Jun. Prof. Dr. Marcus C. Christiansen für die Vergabe dieserMasterarbeit bedanken. Seine stets geduldige und hilfsbereite Betreuung während der zahlrei-chen Konsultationen, sowie seine konstruktive Kritik und Vorschläge, haben sehr zum Gelingendieser Masterarbeit beigetragen.

Weiter geht mein Dank auch an Prof. Dr. Hans-Joachim Zwiesler, der mich auf das Thema derMasterarbeit aufmerksam gemacht und mir die Teilnahme an dem damit verknüpften Projektermöglicht hat.

Ich möchte mich weiter bei Andreas Niemeyer für seinen Einsatz und Betreuung meiner Master-arbeit bedanken. Sein bereitwilliges Beantworten meiner Fragen und sofortige Konsultationenim Falle der Unklarheiten haben mir sehr geholfen.

Desweiteren möchte ich mich sehr bei Alessa Thoma und Ann-Kristin Hayon für das sorgfältigeund manchmal anstrengende Korrekturlesen bedanken. Dem Ing. Marek Hrabák danke ich fürseine inspirierenden Ideen und freundliche Unterstützung beim Verlauf meiner Masterarbeit.

Schliesslich würde ich gern einen ganz lieben Dank meiner Familie, insbesondere meinen Eltern,und meinen Freunden sagen, die mich die ganze Zeit unterstützt, motiviert und an mich geglaubthaben.

Page 3: Modellierung von Sterbewahrscheinlichkeiten mit

Inhaltsverzeichnis

Abbildungsverzeichnis v

Tabellenverzeichnis vii

Abkürzungsverzeichnis viii

1. Einleitung 1

2. Theoretische Grundlagen 32.1. Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.2. Das Lee-Carter Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2.1. Schätzen des Lee-Carter Modells . . . . . . . . . . . . . . . . . . . . 102.2.2. Modellierung des Zeitindex κt und die Prognose der Sterberate . . . . . 12

3. Erweiterung des Lee-Carter Modells 153.1. Modellansätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2. Grenzbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4. Datenbeschreibung 194.1. Allgemeine Datensatzstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . 194.2. Betrachtete Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204.3. Bestimmung der Parameter aus den Daten . . . . . . . . . . . . . . . . . . . . 22

4.3.1. Kalenderjahr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224.3.2. Alter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224.3.3. Verweildauer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234.3.4. Sterberate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4.4. Grafische Darstellung der Parameter . . . . . . . . . . . . . . . . . . . . . . . 29

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells 385.1. Schätzen mit der Tucker-Methode . . . . . . . . . . . . . . . . . . . . . . . . 38

5.1.1. Modell mit dem additiven Parameter αxv . . . . . . . . . . . . . . . . 455.1.2. Modell mit dem additiven Parameter αv . . . . . . . . . . . . . . . . . 485.1.3. Modell mit dem additiven Parameter αx . . . . . . . . . . . . . . . . . 525.1.4. Modell ohne additiven Parameter . . . . . . . . . . . . . . . . . . . . 55

5.2. Schätzen mit der Zerlegung des Logarithmus . . . . . . . . . . . . . . . . . . 575.3. Vergleich der Modellansätze . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

iii

Page 4: Modellierung von Sterbewahrscheinlichkeiten mit

Inhaltsverzeichnis

6. Prognose des Modells 616.1. Modellierung des Zeitindex κt . . . . . . . . . . . . . . . . . . . . . . . . . . 616.2. Prognosebildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

7. Zusammenfassung 68

A. Quelltexte 70

Literaturverzeichnis 75

iv

Page 5: Modellierung von Sterbewahrscheinlichkeiten mit

Abbildungsverzeichnis

2.1. Voraussetzung (2.11) nach Pitacco et al. (2009, S. 94). . . . . . . . . . . . . . 52.2. Lee-Carter Parameter für die Sterblichkeit der Männer in Italien (vgl. Biffis und

Denuit, 2006, S. 14). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

4.1. Zusammenhang zwischen der Gestorbenenopulation D40,2013 und den Ausgangs-populationen L40,2012 und L39,2012 in Anlehnung an Zwiesler et al. (2011). . . . 25

4.2. Zusammenhang zwischen der Gestorbenenopulation D40,1,2013 und den Aus-gangspopulationen L40,1,2012, L40,0,2012, L39,1,2012 und L39,0,2012 in Anlehnungan Zwiesler et al. (2011). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4.3. Verlauf der logarithmierten Sterberate aus dem Datensatz FDZ-RV (2011) in derZeit ohne Berücksichtigung (a) der Verweildauer (b) des Alters. . . . . . . . . 32

4.4. Verlauf der logarithmierten Sterberate aus dem Datensatz FDZ-RV (2011) beiunterschiedlichen Verweildauerklassen ohne Berücksichtigung (a) der Kalender-zeit (b) des Alters. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.5. Logarithmierte Sterberate bei unterschiedlichen Altersgruppen anhand des Da-tensatzes FDZ-RV (2011) ohne Berücksichtigung (a) der Kalenderzeit (b) derVerweildauer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.6. Abstieg der logarithmierten Sterberate aus dem Datensatz FDZ-RV (2011) inder Zeit bei den EM-Rentnern im Alter (a) 40−44 (b) 55−59. . . . . . . . . . 35

4.7. Abstieg der logarithmierten Sterberate aus dem Datensatz FDZ-RV (2011) mitder Verweildauer bei den EM-Rentnern im Alter (a) 40−44 (b) 55−59. . . . . 35

4.8. Zeitverlauf der logarithmierten Sterberate anhand des Datensatzes FDZ-RV (2011)bei allen Altersgruppen mit Verweildauer von (a) weniger als einem Jahr (b) biszu zwei Jahren (c) bis zu vier Jahren (d) mehr als sechs Jahren. . . . . . . . . . 36

5.1. Verlauf des Parameters αxv anhand des Datensatzes FDZ-RV (2011). . . . . . . 475.2. Verlauf der Parameter βx, γv und κt anhand des Datensatzes FDZ-RV (2011). . 475.3. Pearson-Residuen im Modell mit dem additiven Parameter αxv anhand der Daten

FDZ-RV (2011). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485.4. Verlauf der Parameter αv und γv im Modell mit dem additiven Parameter αv in

Anlehnung an den Datensatz FDZ-RV (2011). . . . . . . . . . . . . . . . . . . 505.5. Verlauf des Parameters δxt im Modell mit dem additiven Parameter αv in Anleh-

nung an den Datensatz FDZ-RV (2011). . . . . . . . . . . . . . . . . . . . . . 515.6. Pearson-Residuen im Modell mit dem additiven Parameter αv in Anlehnung an

den Datensatz FDZ-RV (2011). . . . . . . . . . . . . . . . . . . . . . . . . . . 51

v

Page 6: Modellierung von Sterbewahrscheinlichkeiten mit

Abbildungsverzeichnis

5.7. Verlauf der Parameter αx und βx im Modell mit dem additiven Parameter αxanhand des Datensatzes FDZ-RV (2011). . . . . . . . . . . . . . . . . . . . . . 53

5.8. Verlauf des Parameters δvt im Modell mit dem additiven Parameter αx in Anleh-nung an den Datensatz FDZ-RV (2011). . . . . . . . . . . . . . . . . . . . . . 54

5.9. Pearson-Residuen im Modell mit dem additiven Parameter αx in Anlehnung anden Datensatz FDZ-RV (2011). . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5.10. Verlauf der Parameter βx, γv und κt im Modell ohne additiven Parameter nachder Tucker-Analyse in Anlehnung an die Daten FDZ-RV (2011). . . . . . . . . 56

5.11. Pearson-Residuen im Modell ohne additiven Parameter nach der Tucker-Analysein Anlehnung an die Daten FDZ-RV (2011). . . . . . . . . . . . . . . . . . . . 56

5.12. Verlauf der Parameter βx, γv und κt im Modell ohne additiven Parameter nachder Zerlegung des Logarithmus in Anlehnung an den Datensatz FDZ-RV (2011). 58

5.13. Pearson-Residuen im Modell ohne additiven Parameter nach der Zerlegung desLogarithmus in Anlehnung an den Datensatz FDZ-RV (2011). . . . . . . . . . 58

6.1. Prognose des Zeitindex κt für die Jahre 2010 – 2029 in Anlehnung an den Da-tensatz FDZ-RV (2011). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

6.2. 95% Intervallprognose der logarithmierten Sterberate der EM-Rentner bei un-terschiedliecher Verweildauer (0, 3 und 5 Jahre) in Anlehnung an die DatenFDZ-RV (2011). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

6.3. 95% Intervallprognose der logarithmierten Sterberate der EM-Rentner mit stei-gendem Alter (42, 48, 53 und 59 Jahre) in Anlehnung an die Daten FDZ-RV(2011). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

vi

Page 7: Modellierung von Sterbewahrscheinlichkeiten mit

Tabellenverzeichnis

4.1. Generationen der Personen im Alter von 40 bis 59 Jahren in den Berichtsjahren1993 – 2008 aus 1 % der Stichprobe FDZ-RV (2011). . . . . . . . . . . . . . 26

4.2. Generationen der Personen im Alter von 40 bis 59 Jahren in jeder Verweildau-erklasse aus 1 % der Stichprobe FDZ-RV (2011) im Berichtsjahr (a) 1993 (b)2008. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4.3. Exposure-to-Risk ET Rxvt in einzelnen Klassen aus 1 % der Stichprobe FDZ-RV(2011) im Berichtsjahr (a) 1993 (b) 2008. . . . . . . . . . . . . . . . . . . . . 30

4.4. Totenanzahl Dxvt in einzelnen Klassen aus 10 % der Stichprobe FDZ-RV (2011)im Berichtsjahr (a) 1994 (b) 2009. . . . . . . . . . . . . . . . . . . . . . . . . 31

5.1. 3D-ANOVA der anhand des Datensatzes FDZ-RV (2011) berechneten logarith-mierten Sterberaten nach dem Subtrahieren des Gesamtmittels M···. . . . . . . 42

vii

Page 8: Modellierung von Sterbewahrscheinlichkeiten mit

Abkürzungsverzeichnis

3D-ANOVA Dreidimensionale Analyse der Varianz

ARIMA Autoregressive Integrated Moving Average

DRV Deutsche Rentenversicherung

EM-Rente Erwerbsminderungsrente

EM-Rentner Erwerbsminderungsrentner

FDZ-RV Forschungsdatenzentrum der Rentenversicherung

RÜG Rentenüberleitungsgesetz

SUF Scientific Use File

viii

Page 9: Modellierung von Sterbewahrscheinlichkeiten mit

1. Einleitung

Die Lebenserwartung der Menschen und der demografische Wandel sind Hauptfaktoren in derLebensversicherung. Aufgrund von Abschätzungen bezüglich der Mortalitätsrate werden pro-duktbezogene Prämien, versicherungstechnische Rückstellungen und Überschüsse kalkuliert. InAbhängigkeit von der Art der Versicherung stellt das Unter- oder Überschätzen der Lebenser-wartung ein Risiko dar, was eine direkte Auswirkung auf die Bildung der Reserven und desSolvenzkapitals des Verischerungsunternehmens hat. Darum ist die Untersuchung der Sterblich-keitsfaktoren und eine Modellentwicklung von großer Bedeutung.

Die breite Anwendung in diesem Bereich hat das Lee-Carter Modell (vgl. Lee und Carter,1992) gefunden. Hier wird der Logarithmus der Sterberate mit Hilfe von Zeit- und Altersef-fekten sowie deren Kombination beschrieben. Bei der Parameterabschätzung wird die Metho-de der kleinsten Quadrate zusammen mit der Singulärwertzerlegung verwendet. Weiter wirdder Zeitindex als eine Zeitreihe modelliert und die Prognose mit seinen vorhergesagten Wer-ten berechnet. Das Lee-Carter Modell ermöglicht eine langfristige Prognose der zukünftigenLebenserwartung, was für die Prämien- und Reservenkalkulation in der Lebensversicherung be-sonders nützlich ist. Im Laufe der Zeit wurden mehrere Erweiterungen des ursprünglichen Lee-Carter Modells entwickelt. Aufgrund unterschiedlicher Abschätzung der Zeitindizes entstandendie Lee-Miller Variante (vgl. Lee und Miller, 2001) und die Booth-Maindonald-Smith Variante(vgl. Booth et al., 2002). Die Anwendung neuer Verfahren, wie nicht parametrische Glättung,Maximum-Likelihood-Methode und Kalman-Filter, erfolgt in den Modellen von Hyndman undUllah (2007) und Jong und Tickle (2006). Renshaw und Haberman (2006) führten einen zusätz-lichen Kohorteparameter ein und stellten darüberhinaus das sogennante Age-Period-Cohort Mo-dell dar. Die multidimensionale Hauptkomponentenanalyse mittels der Tucker-Methode wurdein der Arbeit von Russolillo et al. (2011) in den Lee-Carter Ansatz implementiert.

Im Vergleich zur gesunden Population ist die Lebenserwartung der Bevölkerung mit einer Berufs-unfähigkeits- oder Erwerbsminderungsrentenversicherung durch mehrere Faktoren bedingt. DieLebenserwartung der Berufsunfähigen kann mithilfe des Eintrittsalters, der Verweildauer undder Berufsunfähigkeitskategorie durch Sterblichkeitsgesetze modelliert werden, siehe Ainslie

1

Page 10: Modellierung von Sterbewahrscheinlichkeiten mit

1. Einleitung

(2000) und Pitacco (2012). Ein anderer Ansatz ohne Verweildauereffekt, bei dem die Lebens-erwartung der Berufsunfähigen durch einen Sterblichkeitszusatz zur Mortalität der gesundenPopulation berechnet wird, findet bei Rickayzen und Walsh (2002) und Rickayzen (2007) An-wendung. In den Arbeiten von Sandström (1987) und Haberman und Pitacco (1999) wurdendie spezifischen Sterbewahrscheinlichkeiten in Kombination mit der Reaktivierungswahrschein-lichkeit als eine einzige Ausscheidewahrscheinlichkeit modelliert. Der semimarkowsche Ansatzfür alle Zustandsänderungen in Verbindung mit dem Todesfall nutzten Renshaw und Haberman(2000) und Aro et al. (2013).

Das Ziel ist die Entwicklung eines Modells, in dem die Sterbewahrscheinlichkeit der Erwerbs-minderungsrentner (EM-Rentner) in Deutschland beschrieben wird. Dabei zählen zu den unter-suchten Faktoren das derzeitige Alter der EM-Rentner, das Kalenderjahr und die Verweildauerder jeweiligen Person in der Lebensversicherung. Als Modellierungsansatz wird das Lee-CarterModell verwendet. Dabei wird versucht, es um einen Verweildauereffekt zu erweitern.

Diese Masterarbeit ist in sieben Kapitel aufgeteilt. In Kapitel 2 werden die Grundbegriffe defi-niert und ihre Zusammenhänge erläutert. Dann wird das Lee-Carter Modell mit seinen Schät-zungsmethoden charakterisiert. Die Erweiterung des Lee-Carter Modells für drei Parameter Al-ter, Kalenderzeit und Verweildauer wird in Kapitel 3 behandelt. Kapitel 4 beschäftigt sich mitden verwendeten Daten und ihrer Analyse. Der Hauptteil dieser Abschlussarbeit bildet Kapitel 5,in dem die praktische Modellentwicklung erfolgt. Zuerst werden die genutzten Schätzverfahrendargestellt und auf mehrere Modellansätze angewendet. Dadurch gewonnene Ergebnisse wer-den anhand mehrerer Kriterien verglichen. Aus allen Modellansätzen wird einer ausgewählt, fürden in Kapitel 6 die Prognose der Sterberate ermittelt wird. Zum Schluss werden die Ergebnissein Kapitel 7 zusammengefasst. Aufgrund problematischer Stellen im Modell werden möglicheFragestellungen und Forschungsziele für die Zukunft gesetzt.

2

Page 11: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

2.1. Definitionen

In dieser Arbeit wird mit x das Alter der jeweiligen Person und mit t das betrachtete Kalender-jahr bezeichnet. Falls nicht spezifiziert, wird stets vorausgesetzt, dass x ∈ [0,ω), wobei ω dasmaximale erreichbare Alter darstellt, und t ∈ [0,∞). Als Grundlage für dieses Kapitel wurde dieQuelle von Pitacco et al. (2009) herangezogen.

Definition 2.1. Sei Tx die zufällige Restlebensdauer einer x-jährigen Person mit Tx ∈ (0,ω− x)und h≥ 0. Die Zufallsvariable hqx, definiert durch

hqx = P(Tx ≤ h) , (2.1)

heißt die Sterbewahrscheinlichkeit einer x-jährigen Person innerhalb des Zeitintervalls h.

Aus Definition 2.1 können wir die Überlebenswahrscheinlichkeit eines x-Jährigen h px im Zeit-intervall h ableiten als

h px = 1− hqx = P(Tx > h) , h≥ 0. (2.2)

Wir werden meistens mit den Wahrscheinlichkeiten qx und px arbeiten, die nach (2.1) und (2.2)die einjährigen Sterbe- und Überlebenswahrscheinlichkeiten einer x-jährigen Person bestim-men.

Definition 2.2. Die Zufallsvariable S(h) mit h≥ 0, gegeben durch die Formel

S(h) = P(T0 > h) , (2.3)

wird die Erlebensfunktion genannt und charakterisiert die Wahrscheinlichkeit, dass ein Neuge-borener mindestens das Zeitintervall h überlebt.

3

Page 12: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

Mithilfe der Erlebensfunktion können die Sterbe- und Überlebenswahrscheinlichkeiten rekon-struiert werden. Nach (2.2) gilt, dass

h px = P(Tx > h) = P(T0 > x+h|T0 > x) =P(T0 > x+h)

P(T0 > x).

Nach Anwendung der Definition 2.2 erhalten wir

h px =S(x+h)

S(x). (2.4)

Definition 2.3. Sei T0 die Restlebensdauer eines Neugeborenen mit T0 ∈ (0,ω) und h ∈ [0,∞).Die Verteilung der Zufallsvariable T0 ist definiert durch die Verteilungsfunktion F0(h) und dieDichte f0(h), wobei

F0(h) = P(T0 < h) = 1−S(h) (2.5)

f0(h) =d

dhF0(h) =−

ddh

S(h). (2.6)

Definition 2.4. Die Zufallsvariable µx, bestimmt durch

µx = limh→0

P(Tx ≤ h)h

, (2.7)

ist die Sterbeintensität des x-Jährigen. Die Sterbeintensität wird oft als „die Momentansterblich-keit im Alter x“ interpretiert (vgl. Pitacco et al., 2009, S. 55).

Lemma 2.5. Sei S(x) die Erlebensfunktion mit x ∈ [0,ω) und F0(h) die Verteilungsfunktion derRestlebensdauer T0. Dann gilt unter der Bedingung S(0) = 1

S(x) = exp(−∫ x

0µu du

), 0≤ u≤ x. (2.8)

Beweis. Aus Definition 2.3 ergibt sich

Fx(h) = P(Tx < h) =P(x < T0 < x+h)

P(x < T0)=

F0(x+h)−F0(x)S(x)

. (2.9)

Nach Einsetzen von (2.9) in (2.7) berechnen wir

µx =1

S(x)limh→0

F0(x+h)−F0(x)h

=ddhF0(x)

S(x)=− d

dhS(x)S(x)

=− ddh

lnS(x).

Durch Integrieren und Auflösen nach S(x) erhalten wir die gewünschte Formel. �

4

Page 13: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

Alter

Kalenderjahrt t+1

x+1

x

t - xt - x -1

Abbildung 2.1.: Voraussetzung (2.11) nach Pitacco et al. (2009, S. 94).

Definition 2.6. Seien S(x) die Erlebensfunktion und µx die Sterbeintensität einer Person imAlter x, dann heißt die Zufallsvariable

mx =

∫ 10 S(x+u)µx+udu∫ 1

0 S(x+u)du(2.10)

zentrale Todesrate der Person im Alter x. Die zentrale Todesrate mx beschreibt das Verhalten derSterbeintensität µx im Intervall (x,x+1).

Bisher haben wir alle Größen nur in der Abhängigkeit vom Alter x dargestellt. Jetzt werdensie um einen Zeitparameter t erweitert. Dadurch ist Tx(t) die Restlebensdauer einer Person, dieim Kalenderjahr t ihren x-ten Geburtstag erreicht hat. Die Sterbewahrscheinlichkeit einer imKalenderjahr t x-jährigen Person im Zeitintervall h ist analog zu Definition 2.1 durch hqx(t) =P(Tx(t)> h) angegeben. Die Überlebenswahrscheinlichkeit h px(t) ergibt sich dann als h px(t) =1− hqx(t). Die Definition der Sterbeintensität µx(t) für einen x-Jährigen im Jahr t wird alsµx(t) = limh→0 P(Tx(t)≤ h)/h umgeschrieben. Ensprechend dazu wird durch Einsetzen derSterbeintensität µx(t) auch die Definition der zentralen Sterberate mx(t) erweitert.

5

Page 14: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

Seien das Alter x und das Kalenderjahr t ganzzahlig. Wir nehmen an, dass die Sterbeintensitätµx(t) innerhalb eines Jahres konstant bleibt. Mathematisch kann dies mit

µx+ξ1(t +ξ2) = µx(t), 0≤ ξ1,ξ2 < 1 (2.11)

formuliert werden. Es heißt, dass der unterjährige Zuwachs zum Alter x und Kalenderjahr t aufdie Sterberate µx(t) keine Auswirkung hat. Für die bessere Darstellung der Voraussetzung wirdein Lexis-Diagramm konstruiert. Die x-Achse repräsentiert den Kalenderjahrverlauf und die y-Achse den Altersverlauf. Beide Achsen tragen die Einheit „Jahre“, wodurch alters- und zeitab-hängige Rechtecke entstehen. In Abbildung 2.1 ist zu sehen, dass die Sterbeintensität innerhalbeines Rechtecks konstant bleibt, sich jedoch zwischen verschiedenen Rechtecken unterschei-det.

Unter Voraussetzung (2.11) können wichtige Schlussfolgerungen erzeugt werden:

• Aus (2.4) und (2.8) ergibt sich für die einjährige Überlebenswahrscheinlichkeit im Alter xund Jahr t, dass

px(t) = exp(−∫ 1

0µx+ξ (t +ξ )dξ

)= exp

(−µx(t)ξ

∣∣∣∣10

)= exp(−µx(t)) . (2.12)

• Für die unterjährige Überlebenswahrscheinlichkeit mit der Zeitspanne s, wobei 0≤ s < 1,erhalten wir mit Hilfe von (2.12), dass

s px(t) = exp(−∫ s

0µx+ξ (t +ξ )dξ

)= exp(−sµx(t)) =

[exp(−µx(t))

]s= (px(t))

s .

(2.13)

• Die Sterbeintensität µx(t) und die zentrale Todesrate mx(t) stimmen unter Voraussetzung(2.11) überein, was direkt aus Definition 2.6 resultiert.

Die Personen, die innerhalb einer Zeitperiode sterben können, sind durch ihre Ausgangspopu-lation bestimmt. Die Anzahl der x-jährigen Personen im Kalenderjahr t wird Exposure-to-Riskgenannt und mit ET Rxt bezeichnet.

Lemma 2.7. Für ein Kalenderjahr t seien Dxt die Totenanzahl der Personen im Alter x undET Rxt der entsprechende Exposure-to-Risk. Dann wird die zentrale Sterberate mxt unter Vor-aussetzung (2.11) als ein Maximum-Likelihood-Schätzer der Sterbeintensität µx(t) bezeichnet,

6

Page 15: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

wobei gilt:

mxt = µx(t) =Dxt

ET Rxt(2.14)

Beweis. Seien δi eine Indikatorvariable mit

δi =

1, im Falle des Todes der x-jährigen Person i

0, sonst(2.15)

und τi ein Zeitbruch des Jahres t, in dem die x-jährige Person i gelebt hat, so gilt, dass

Lxt

∑i=1

δi = Dxt undLxt

∑i=1

τi = ET Rxt . (2.16)

Schließlich sei Yi, i = 1, . . . ,Lxt eine Zufallsvariable mit den Realisationen yi = τδii . Yi = yi be-

deutet dabei, dass die Person i im Jahr t im Zeitintervall τi gelebt hat. Unter Annahme (2.11)und aus den Formeln (2.12) und (2.13) berechnen wir

P(yi = 1) = px(t) = exp(−µx(t)) , falls δi = 0, (2.17)

P(yi = τi) = τi px(t)µx+τi (t + τi) = exp(−τiµx(t))µx(t), falls δi = 1. (2.18)

Durch Zusammensetzen von (2.17) und (2.18) ergibt sich für die Zufallsvariable Yi die Dichte

f (yi|µx(t)) = exp(−τiµx(t))(µx(t))δi . (2.19)

Sind die Lebensdauer der Personen τi in der Grundgesamtheit unabhängig, kann die Likelihood-Funktion wie folgt ermittelt werden:

L (µx(t)|y1, . . . ,yLxt ) =Lxt

∏i=1

exp(−τiµx(t))(µx(t))δi

= exp

(−µx(t)

Lxt

∑i=1

τi

)µx(t)∑

Lxti=1 δi

= exp(−µx(t)ET Rxt)(µx(t))Dxt

7

Page 16: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

Bei der Ableitung nach µx(t) berechnen wir

ddµ

L (µx(t)|y1, . . . ,yLxt ) = (µx(t))Dxt exp(−µx(t)ET Rxt)︸ ︷︷ ︸

6=0

(Dxt

µx(t)−ET Rxt

)!= 0

und erhalten somit unter Annahme (2.11)

mxt = µx(t) =Dxt

ET Rxt.

2.2. Das Lee-Carter Modell

In den folgenden Absätzen beschreiben wir das Lee–Carter Modell, das als Grundlage für diespätere Modellentwicklung verwendet wird. Wir nehmen weiter an, dass Voraussetzung (2.11)erfüllt ist und daher die Sterbeintensität µx(t) und die Sterberate mxt gleich sind. Das Lee–Carter Modell veröffentlicht von Lee und Carter (1992) im Journal of the American StatisticalAssociation hat die nachstehende Form:

lnmxt = αx +βxκt + εxt (2.20)

Die Parameter auf der rechten Seite von (2.20) repräsentieren die im Modell aufgefangenenalters- und zeitspezifischen Effekte. Konkret:

• αx beschreibt den Verlauf der logaritmierten Sterberate in Abhängigkeit vom Alter x,

• κt bezeichnet die Entwicklung der logarithmierten Sterberate in der Zeit,

• βx stellt ein Interaktionsparameter dar, der den unterschiedlichen Zeitverlauf der logarith-mierten Sterberate in Abhängigkeit vom Alter x misst. Mit anderen Worten, der Parameterβx enthält die Information, wie schnell die logarithmierte Sterberate im bestimmten Alterx mit der Zeit sinkt und

• der Fehlerparameter εxt mit E(εxt) = 0, Var(εxt) = σ2ε und unabhängigen Realisationen.

8

Page 17: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

Abbildung 2.2.: Lee-Carter Parameter für die Sterblichkeit der Männer in Italien (vgl. Biffis undDenuit, 2006, S. 14).

9

Page 18: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

Ein Beispiel der Lee-Carter Parameter αx, βx und κt für die Sterberaten der Männer in Italien istin Abbildung 2.2 aufgezeigt.

Um die Eindeutigkeit der Parameter bezüglich der Prognose zu erreichen, werden genau fest-gelegte Grenzbedingungen benötigt. Sie haben keinen Einfluss auf die geschätzten Werte dermodellierten Zielvariable und gewährleisten, dass die Prognose nur aus eindeutig bestimmtenParametern (αx, βx, κt) kalkuliert werden kann. Für das Alter x,x ∈ {x1, . . . ,xm} und das Kalen-derjahr t, t ∈ {t1, . . . , tn} muss gelten:

tn

∑t=t1

κt = 0 undxm

∑x=x1

βx = 1 (2.21)

2.2.1. Schätzen des Lee-Carter Modells

Beim Kalibrieren des Modells werden verschiedene Ansätze verwendet. Für unsere Zweckebeschäftigen wir uns nur mit dem zweistufigen Schätzungsverfahren, bei dem zuerst αx mithil-fe der Methode der kleinsten Quadrate geschätzt wird und anschließend βx und κt mittels derSingulärwertzerlegung berechnet werden. Anhand dieses Schätzungsverfahrens läuft die Para-meterabschätzung in folgenden Schritten ab:

1. Bestimmung von αx mit der Methode der kleinsten Quadrate

Es ist erwünscht, die Parameter αx, βx und κt so zu bestimmen, dass die Fehlerquadrat-summe

OLS(α,β ,κ) =xm

∑x=x1

tn

∑t=t1

(ln mxt−αx−βxκt)2

minimiert wird. Deswegen berechnen wir die partielle Ableitung

δ

δαxOLS(α,β ,κ) = 0.

Daraus ergibt sich

tn

∑t=t1

ln mxt = nαx +βx

tn

∑t=t1

κt

10

Page 19: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

und nach Anwendung der Bedingung ∑tnt=t1 κt = 0 erhalten wir die Abschätzung

αx =1n

tn

∑t=t1

ln mxt .

2. Bestimmung von βx und κt durch Singulärwertzerlegung

Nach Abziehen von αx ergibt sich die Matrix Z ∈ Rm×n

Z =

ln mx1t1− αx1 · · · ln mx1tn− αx1... . . . ...

ln mxmt1− αxm · · · ln mxmtn− αxm

.

Die Schätzer βx und κt zum Minimieren der Fehlerquadratsumme

OLS(β ,κ) =xm

∑x=x1

tn

∑t=t1

(zxt−βxκt)2

werden durch die Singulärwertzerlegung bestimmt. Dadurch kann Z in der Form

Z =

v1...

vr

λ1 0 · · · 00√

λ2 · · · 0...

... . . . ...0 0 · · ·

√λr

(

u1 · · · ur

)

ausgedrückt werden, wobei r der Rang der Matrix Z ist. Für i = 1, · · · ,r sind vi und ui dielinken und rechten Singulärvektoren der Matrix Z und

√λi sind die Wurzeln der abstei-

gend geordneten Beträge von Eigenwerten der Matrix Z. Da der größte Teil der Varianzder Zielvariable lnmxt in meisten Fällen durch den Eigenwert λ1 erklärt wird, kann dieMatrix Z wie folgt approximiert werden:

Z = βxκt ≈√

λ1v1u1T

Für die Parameter βx und κt erhalten wir somit die Schätzer

κ =√

λ1u1, β = v1.

11

Page 20: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

3. Anpassung der Schätzer αx, βx und κt an die Grenzbedingungen

Weil die geschätzten Parameter die Grenzbedingungen (2.21) nicht erfüllen, müssen dieSchätzer dementsprechend angepasst werden. Deswegen werden

• αx mit αx + βxκ ,

• βx mit βx

β•,

• und schließlich κt mit (κt−κ) β•

ersetzt, wobei β• = ∑xmx=x1

βx und κ = 1n ∑

tnt=t1 κt .

4. Anpassung des Zeitparameters κt an die jährlich betrachtete Totenanzahl

Beim Lee–Carter Modell werden die logarithmierten Sterberaten modelliert. Aus diesemGrund kann sich die geschätzte und betrachtete Totenanzahl Dxt im Jahr t unterscheiden,was einen negativen Einfluss auf die Prognose der Totenanzahl hat. Deshalb ermitteln wirbei gegebenen αx, βx einen neuen Schätzer für κt , sodass κt die folgende Gleichung erfüllt:

xm

∑x=x1

Dxt︸ ︷︷ ︸betrachtete Totenanzahl

=xm

∑x=x1

ET Rxt exp(

αx + βxκt

)︸ ︷︷ ︸

erwartete Totenanzahl

2.2.2. Modellierung des Zeitindex κt und die Prognose der Sterberate

Um die Prognose der logarithmierten Sterberate lnmxt zu erstellen, werden die künftigen Wer-te des Zeitindex κt benötigt. Aus diesem Grund werden die abgeschätzten Werte κt als einARIMA(0,1,0)-Prozess (vgl. Lee und Carter, 1992, S. 669) modelliert.

Definition 2.8. Der Prozess mit ψp 6= 0 und ξq 6= 0 gegeben durch

∇dκt = φ1∇

dκt + · · ·+φp∇

dκt +ξt +ψ1ξt−1 + · · ·+ψqξt−q (2.22)

heißt ARIMA(p,d,q)-Prozess mit den Parametern p, d und q. Dabei ist p der Grad der Autore-gression, d der Grad der Zeitverschiebung und q der Grad von „Moving-Average“. Das Symbol∇ bezeichnet den Verschiebeoperator der Zeitreihe κt und ξt Weißes Rauschen mit ξt ∼N(0,σ2

ξ)

und σ2ξ> 0.

12

Page 21: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

Aufgrund des ARIMA(0,1,0)-Prozesses können die Zeitindizes κt als

κt = κt−1 +d +ξt (2.23)

modelliert werden. Die Werte des Fehlerparameters ξt ∼ N(0,σ2) sind unabhängig und iden-tisch verteilt und d stellt einen „drift“-Parameter dar.

Aus (2.24) ergibt sich die Punktvorhersage κtn+k mit dem Prognosehorizont k ∈ N als

κtn+k = E [κtn+k|κt1, · · · ,κtn] = E

[κtn + kd +

k

∑j=1

ξtn+ j

∣∣∣∣ κt1, · · · ,κtn

]= κtn + kd (2.24)

und ihre Varianz mit

Var[

κtn+k

∣∣∣∣ κt1, · · · ,κtn

]= kσ

2.

Durch Verwendung der projezierten Zeitindizes κtn+s kann die Punktprognose der Sterberateals

mx,tn+s = exp(

αx + βxκtn+s

), s ∈ N

berechnet werden.

Unter der Annahme, dass die Residuen unabhängig und identisch verteilt sind, kann die Inter-vallprognose der Sterberate mx,tn+s mithilfe der Boostrap-Methode der Residuen (vgl. Koissiet al., 2006) kalkuliert werden. Dabei wird die Residuenmatrix R mit den Elementen

rxt =ln mxt−

(αx + βxκt

)1

(m−1)n ∑xmx=x1 ∑

tnt=t1

(ln mxt− αx− βxκt

)2

durch Ziehen mit Zurücklegen repliziert, sodass die Replizierungen Rb für b = 1, . . . ,B erzeugtwerden. Durch die Inversionsformel wird die zugehörige Matrix der Totenanzahl Db

xt berechnet,wovon wir die Gruppen der Parameter αb

x , β bx und κb

t erhalten. Auf Basis des ARIMA(0,1,0)-Modells wird die Prognose von κb

t erstellt. Mit replizierten Parametern bestimmen wir fürb = 1, . . . ,B die replizierte Prognose der Sterberate mb

xt und ordnen sie aufsteigend in jedemzukünftigen Kalenderjahr. Für ein Signifikanzniveau α ist dann das (1−2α)-prozentige In-tervall für mb

xt als(

mbαxt , m

b(1−α)xt

)definiert. Dabei bezeichnet mbς

xt ein (100× ς)-prozentiges

13

Page 22: Modellierung von Sterbewahrscheinlichkeiten mit

2. Theoretische Grundlagen

empirisches Perzentil der Werte aus der Boostrap-Prozedur, d. h. den (B× ς)-ten Wert in demsortierten Datensatz von den Sterberaten mb

xt .

14

Page 23: Modellierung von Sterbewahrscheinlichkeiten mit

3. Erweiterung des Lee-Carter Modells

Wie es in Kapitel 1 angedeutet wurde, ist es das Ziel das Lee-Carter Modell um einen Ver-weildauereffekt zu erweitern. In diesem Abschnitt werden zuerst die benötigten Größen in Ab-hängigkeit von den Parametern Alter x, Kalenderzeit t und Verweildauer v theoretisch definiert.Dann werden erweiterte Versionen des Lee-Carter Modells mit der Interpretation der Parametervorgestellt. Anschließend werden für jeden Modellansatz die notwendigen Grenzbedingungenbestimmt und ihre Funktionalität bewiesen.

Sei t das Kalenderjahr mit dem Wertebereich t ∈ {t1, . . . , tn},n ∈ N. Der Parameter x stellt dasganzzahlige Alter zum betrachteten Zeitpunkt dar, wobei die Größe x die Werte x1, . . . ,xm mitm ∈ N annehmen kann. Schließlich bedeutet die Verweildauer v die Anzahl der Jahre, die einebestimmte Person die Rente erhalten hat. Dabei stammen die Werte der Verweildauer v aus derMenge {v0,v1, . . . ,vk}, wobei k ∈ N.

Definition 3.1. Für alle x-jährigen Personen im Kalenderjahr t mit der Verweildauer v seien Dxvt

die Totenanzahl und ET Rxvt der zugehörige Exposure-to-Risk. Dann heißt die Zufallsvariablemxvt gegeben durch

mxvt =Dxvt

ET Rxvt(3.1)

Sterberate der x-jährigen Personen im Kalenderjahr t mit der Verweildauer v. Der Wertebereichder Sterberate mxvt ist theoretisch [0,1].

3.1. Modellansätze

Als mögliche Erweiterungen des Lee-Carter Modells werden folgende Modelle vorgeschla-gen:

lnmxvt = αxv+βxγvκt+εxvt (3.2)

lnmxvt = αv +γvδxt +εxvt (3.3)

15

Page 24: Modellierung von Sterbewahrscheinlichkeiten mit

3. Erweiterung des Lee-Carter Modells

lnmxvt = αx +βxδvt +εxvt (3.4)

lnmxvt = βxγvκt+εxvt (3.5)

Dabei werden die einzelnen Parameter folgendermaßen interpretiert:

lnmxvt bekannte Werte der logarithmierten Sterberate

αxv Verlauf der logarithmierten Sterberate in Abhängigkeit vom Alter x in verschiedenenVerweildauerklassen v

αv Verlauf der logarithmierten Sterberate in Abhängigkeit von der Verweildauer v

αx Verlauf der logarithmierten Sterberate in Abhängigkeit vom Alter x

κt Verlauf der logarithmierten Sterberate in der Zeit t

βx Interaktionsparameter des Alters bei unterschiedlichem Niveau des Zeitparametersκt und des Verweildauerparameters γv

γv Interaktionsparameter der Verweildauer bei unterschiedlichem Niveau des Zeitpara-meters κt und des Altersparameters βx

δxt Zeitmuster der logarithmierten Sterberate in verschiedenen Altersklassen, das sichaus dem Produkt βxκT

t ergibt

δvt Zeitmuster der logarithmierten Sterberate mit unterschiedlicher Verweildauer, dassich aus dem Produkt γvκT

t ergibt

εxvt Fehlerparameter mit E(εxvt) = 0, Var(εxvt) = σ2ε und unabhängigen Realisationen

Die Gründe für die Auswahl der Modellansätze (3.2)-(3.5) sowie die Bildung der parameterab-hängigen Matrix δ bei den Modellen (3.3) und (3.4) stehen eng im Zusammenhang mit demverwendeten Schätzverfahren. Dementsprechend wird mehr zu diesem Thema in Kapitel 5 er-läutert.

3.2. Grenzbedingungen

Ähnlich wie beim originalen Lee-Carter Modell (2.20) in Kapitel 2 müssen für die Eindeutig-keit der erweiterten Modelle bestimmte Grenzbedingungen eingeführt werden. Angefangen mitModell (3.2) sehen wir, dass für beliebige c1,c2,c3 ∈ R die Parameter

αxv = αxv + c1βxγv, βx =βx

c2, γv =

γv

c3und κt = c2c3 (κt− c1)

16

Page 25: Modellierung von Sterbewahrscheinlichkeiten mit

3. Erweiterung des Lee-Carter Modells

dieselbe logarithmierte Sterberate lnmxvt als αxv, βx, κt und γv liefern. Weil die möglichen Trans-formationen der Parameter αxv, βx, γv und κt durch drei beliebige Konstanten c1, c2 und c3

bestimmt werden, werden drei Grenzbedingungen benötigt.

Lemma 3.2. Das erweiterte Modell (3.2) ist unter den Grenzbedingungen

tn

∑t=t1

κt = 0 undxm

∑x=x1

βx =vk

∑v=v1

γv =−1 (3.6)

eindeutig.

Beweis. Angenommen, dass das Modell

αxv +βxγvκt + εxvt = lnmxvt

mit unbekannten Parametern αxv, βx, γv und κt gilt, wobei Grenzbedingungen (3.6) erfüllt sind.Wir setzen voraus, dass es αxv, βx, γv und κt gibt, für die ebenso gilt, dass

αxv + βxγvκt + εxvt = lnmxvt ,

wobei

tn

∑t=t1

κt = 0 undxm

∑x=x1

βx =vk

∑v=v1

γv =−1.

Aus beiden Parametersätzen kann man dieselben logarithmierten Sterberaten lnmxvt konstruie-ren, sodass gilt

αxv +βxγvκt = αxv + βxγvκt .

Nach Anwendung der Summation über alle Kalenderjahre t und Einsetzen der Grenzbedingung

∑tnt=t1 κt = ∑

tnt=t1 κt = 0 resultiert

nαxv +βxγv

tn

∑t=t1

κt = nαxv + βxγv

tn

∑t=t1

κt

und somit

αxv = αxv.

17

Page 26: Modellierung von Sterbewahrscheinlichkeiten mit

3. Erweiterung des Lee-Carter Modells

Wegen seiner Eindeutigkeit kann der Parameter αxv vom Logarithmus der Sterberate lnmxvt

subtrahiert werden. Weiter muss gelten, dass

βxγvκt = βxγvκt .

Unter den Grenzbedingungen für βx, βx, γv und γv wird mit

κt

vk

∑v=v1

γv

xm

∑x=x1

βx = κt

vk

∑v=v1

γv

xm

∑x=x1

βx

weitergerechnet, was in der Eindeutigkeit des Zeitparameters κt resultiert. Dadurch kann derParameter κt aus dem Dreierprodukt βxγvκt gekürzt werden. Auf dieselbe Weise rechnen wirweiter und erhalten die Eindeutigkeit des Parameters γv nach Anwendung der Grenzbedingung

∑xmx=x1

βx = ∑xmx=x1

βx =−1. Daraus ergibt sich direkt auch die Eindeutigkeit des letzten Parame-ters βx, womit das Lemma bewiesen ist. �

Bei den Modellen (3.3), (3.4) und (3.5) reicht es aus, nur zwei Grenzbedingungen zu benutzen,weil die Transformationen der Parameter nur von zwei Konstanten c1,c2 ∈ R abhängen. Sokönnen die Parameter wie folgt transformiert werden:

αv = αv + c1γv, γv =γv

c2, δxt = c2 (δxt− c1) in Modell (3.3)

αx = αx + c1βx, βx =βx

c2, δvt = c2 (δvt− c1) in Modell (3.4)

βx =βx

c1, κt =

κt

c2, γv = c1c2γv in Modell (3.5)

Lemma 3.3. Modelle (3.3), (3.4) und (3.5) sind unter folgenden Grenzbedingungen eindeutigbestimmt:

vk

∑v=v1

γv =−1,xm

∑x=x1

tn

∑t=t1

δxt = 0 in Modell (3.3) (3.7)

xm

∑x=x1

βx =−1,vk

∑v=v1

tn

∑t=t1

δvt = 0 in Modell (3.4) (3.8)

xm

∑x=x1

βx =−1,vk

∑v=v1

γv =−1 in Modell (3.5) (3.9)

Beweis. Die Vorgehensweise ist analog zum Beweis von Lemma 3.2. �

18

Page 27: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

Nach der theoretischen Einführung in die Problematik beschreiben wir jetzt den Datensatz, mitdem gearbeitet wird. Dabei legen wir großen Wert auf die Datensatzstruktur, ausführliche undverständliche Ableitung der gebrauchten Größen, sowie genaue Beschreibung der betrachtetenEffekte zwischen der logarithmierten Sterberate und den Parametern.

4.1. Allgemeine Datensatzstruktur

Für die Modellierungszwecke werden die Daten aus dem Forschungsdatenzentrum der Renten-versicherung (vgl. FDZ-RV, 2011) verwendet. Konkret handelt es sich um den SUF (ScientificUse File) Demografiedatensatz Rentenwegfall/-bestand 1993 – 2009.

Der Rentenbestand stellt 1% aus allen laufenden Renten dar, die innerhalb des Berichtsjahres biszum 31.12. ausgezahlt wurden. Da die Rente stets zu Beginn des Monats ausbezahlt wird, sindim Rentenbestand auch die Personen enthalten, die im Dezember den Rentenanspruch verlorenhaben. Für uns stellt der Rentenbestand deshalb die Menge aller lebenden Rentenempfängerzum 30.11. des Berichtsjahres dar.

Im Rentenwegfall sind 10 % aller Fälle enthalten, die während des Berichtsjahres bis einschließ-lich 30.11. und im Dezember des Vorjahres wegen Todes entfallen sind. Der Monat des Wegfallsist im oben genannten Datensatz der Monat, in dem die letzte Rentenzahlung erfolgt ist. Den Zu-sammenhang zwischen dem Rentenbestand und dem Rentenwegfall erläutern wir im folgendenBeispiel: Wenn der Rentenbestand im Berichtsjahr 2003 zum 30.11.2003 eine Ausgangspopu-lation darstellen würde, wäre der Rentenwegfall im Berichtsjahr 2004, d. h. ab 1.12.2003 bis30.11.2004, die entsprechende Gestorbenenpopulation.

Die Daten der Deutschen Rentenversicherung (DRV) sind in 16 Basisfiles auf zwei verschiede-ne Weisen gestaltet. Es handelt sich dabei um die Rentenbestände in den Berichtsjahren 1993 –2008 und die Rentenwegfälle in den Berichtsjahren 1994 – 2009. Die demografischen Datensät-ze bestehen sowohl aus Personen mit einem Rentenanspruch ohne Rentenzahlung (Nullrente),

19

Page 28: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

als auch aus Personen mit einem Rentenbezug, der zu einer regelmäßigen Rentenzahlung führt.Die Files beinhalten nicht nur Rentner mit deutscher Nationalität, sondern auch Rentenemp-fänger mit nicht deutscher Nationalität, die einen Rentenanspruch besitzen. Außerdem werdenverschiedenartige Renten dokumentiert, wie Erwerbsminderungsrenten, Renten wegen Altersoder Erziehungsrenten.

4.2. Betrachtete Merkmale

In jedem Datensatz des Rentenbestands und Rentenwegfalls werden insgesamt 27 Merkmale proPerson betrachtet. Um die Konsistenz des Datensatzes zu erhalten, werden in dieser Arbeit diein den Datensätzen eingeführten Namen und Bezeichnungen der Merkmale benutzt. Für unsereZwecke sind relevant:

• Berichtsjahr JA

• Geburtsjahr des Versicherten GBJAV S

• Geburtsmonat des Versicherten GBMOV S

• Jahr des erstmaligen Rentenbeginns RT BE1

• Jahr des Rentenwegfalls RTWF1

• Monat des Rentenwegfalls RTWF2

• Rentenart RTAT

Die Merkmale Berichtsjahr und Geburtsjahr des Versicherten sind in der Form JJJJ angegebenund enthalten keine fehlenden Werte. Geburtsmonat des Versicherten ist in der Form MM ange-geben, während fehlende Werte mit 99 bezeichnet werden. Aufgrund der gesetzlichen Reformseit dem 21. Dezember 2012 über einheitliche Tarife für Frauen und Männer (Unisex-Tarife),wird das Geschlecht des Versicherten bei der Prämienkalkulation nicht berücksichtigt (vgl. DRV,2013b). Von daher bleibt es außer unserem Betracht.

Unter dem Merkmal Jahr des erstmaligen Rentenbeginns ist der erstmalige Beginn einer kon-tinuierlichen Rentenzahlung zu verstehen, wobei die Änderung der Leistungsart, die Änderungder Rente beim Teil-/Vollrentenbezug oder die Änderung durch Umwertung nicht beachtet wer-den. Im Falle einer Unterbrechung der Rentenzahlung nehmen wir die erste Rentenzahlung nachder Zeitlücke in Betracht. Fehlende Werte sind mit 0000 oder JJJJ verschlüsselt. Der genaue Mo-nat im Jahr des erstmaligen Rentenbeginns, seit dem der Rentenbezug besteht, ist nicht bekannt

20

Page 29: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

(vgl. FDZ-RV, 2011). Dies hat eine Auswirkung auf die Kalkulation der nötigen Parameter, wasin folgenden Absätzen besprochen wird.

Jahr des Rentenwegfalls und Monat des Rentenwegfalls sind Kennzeichen, die das Jahr undden Monat ermitteln, wann die Person den Rentenanspruch wegen Todes verloren hat. In beidenMerkmalen gibt es keine fehlenden Werte. Durch das Merkmal Rentenart wird die Art der Renteangegeben (vgl. FDZ-RV, 2011). In unserer Forschung interessieren wir uns für die RentenartEM-Rente. Um den Umfang des Datensatzes zu erweitern, haben wir zusätzlich noch die EM-Rente nach Rentenüberleitungsgesetz (RÜG) betrachtet, die ähnliche Eigenschaften wie EM-Rente ausweist. Die Rentenart EM-Rente nach RÜG umfasst alle für die neuen Bundesländergesetzlich angepassten EM-Renten, die frühestens seit 1992 ausgezahlt wurden. Deshalb sind indieser Arbeit ausschließlich die Personen mit dem Wert RTAT = {1,11} relevant.

Augrund des Charakters der EM-Rente, die in dieser Abschlussarbeit weiter untersucht wird,muss bei der Interpretation der Daten auf folgende Tatsachen geachtet werden:

• In dem untersuchten Datensatz gibt es keine EM-Renten als Nullrenten, d. h. es werdenkeine EM-Rentner berücksichtigt, die wegen Hinzuverdienst keine Rentezahlungen erhal-ten.

• Alle Bundesländer sind im Datensatz enthalten, d. h. sowohl Westdeutschland, als auchOstdeutschland.

• Aus der Charakteristik des Merkmals Jahr des erstmaligen Rentenbeginns ergibt sich, dassdie Rentenbezugszeit nicht nur einer Rentenart entsprechen muss, da die Änderungen derLeistungsart nicht berücksichtigt werden. Die EM-Rente kann z. B. ab einem Alter von65 Jahren in eine Altersrente umgewandelt werden.

• Die Leistungen erfolgen nicht gleich nach dem erwerbsmindernden Ereignis, wie z. B.Krankheit oder Unfall. Zuerst werden die versicherungsrechtlichen und medizinischenVoraussetzungen für die Erwerbsminderungsfähigkeit durch die Deutsche Rentenversi-cherung geprüft. Zu den versicherungsrechtlichen Bedingungen gehören eine Wartezeitvon fünf Jahren und eine minimale Beitragszahlungszeit von drei Jahren. Unter medizini-schen Voraussetzungen wird beispielsweise die maximale Stundenzahl verstanden, die derBetroffene in einem Beruf pro Tag noch ausüben kann. Die maximale Stundenzahl solltehöchstens sechs Stunden am Tag betragen. Erst wenn alle Bedingungen erfüllt sind, kanndie Erwerbsminderungsfähigkeit erfolgen (vgl. DRV, 2013a).

• Die EM-Rente wird in den meisten Fällen als befristete Rente beantragt, weil die deut-sche Rentenversicherung nach einer bestimmten Zeit die Anspruchsvollberechtigung auf

21

Page 30: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

die Erwerbsminderungsrente prüft (vgl. DRV, 2013a). Personen mit verbessertem Ge-sundheitszustand können deshalb aus dem Rentenbestand ausgewiesen und somit in denRentenwegfall zugeordnet werden. Aufgrund der unbekannten Ursache der Ausscheidungim zur Verfügung gestellten Datensatz wird dieser Effekt vernachlässigt und es wird vor-ausgesetzt, dass alle Personen wegen dem Tod ausscheiden.

4.3. Bestimmung der Parameter aus den Daten

Ziel ist es, die Sterberate auszurechnen, wozu, gemäß Definition 3.1, die GestorbenenanzahlDxvt im Rentenwegfall und der Exposure-to-Risk ET Rxvt im Rentenbestand benötigt werden.Um die entsprechenden Bestände Dxvt und ET Rxvt zu bestimmen, sind deswegen die ParameterKalenderjahr, Alter und Verweildauer sowohl im Rentenbestand, als auch im Rentenwegfallnötig.

4.3.1. Kalenderjahr

Das Kalenderjahr t wird aufgrund der Zeitinkonsistenz bei den Datensätzen Rentenwegfall undRentenbestand als Zeitintervall

[1.12.(t−1),30.11. t] (4.1)

definiert, wobei t ∈ {1993, . . . ,2008} für die Kalenderjahre im Rentenbestandund t ∈ {1994, . . . ,2009} für die Kalenderjahre im Rentenwegfall. Aufgrund dieser Definitionwerden alle im Datensatz vorhandenen Berichtsjahre, bezeichnet durch das Merkmal JA, umeinen Monat zurück verschoben, was eine direkte Auswirkung auf die Bestimmung des Altersund der Verweildauer hat. Somit ist beispielsweise der Geburtsmonat des Versicherten GBMOV Sim Dezember 1980 erst im Kalenderjahr 1981 als Anfangsmonat enthalten. Bei der Verweildau-er ist der Einfluss analog, falls wir anstatt des Geburtsmonats des Versicherten GBMOV S denMonat des Rentenwegfalls RTWF2 betrachten.

4.3.2. Alter

• Im Rentenbestand wird das ganzzahlige Alter der Personen zum Stichtag 30.11. im Be-richtsjahr t, also zum letzten Tag des neu definierten Kalenderjahres, untersucht. Wegender Jahresverschiebung müssen alle im Dezember geborene Fälle gedanklich ins nächste

22

Page 31: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

Berichtsjahr geschoben werden, was ihr Alter um ein Jahr erniedrigt. Das jeweilige Alterergibt sich als:

x =

{JA−GBJAV S, GBMOV S≤ 11

JA−GBJAV S−1, GBMOV S > 11

• Beim Rentenwegfall wird das ganzzahlige Alter der Personen zum Todesmonat RTWF2im Berichtsjahr t beobachtet, also in Zeitintervall (4.1). Alle vor ihrem Geburtstag imBerichtsjahr t gestorbene Fälle erreichen das Alter JA−GBJAV S nicht. Dies gilt auchfür alle im Dezember geborenen Personen, analog zum Alter x im Rentenbestand. Dasgesuchte Alter ist dann gegeben durch:

x =

{JA−GBJAV S−1, (GBMOV S > RTWF2)∪ (GBMOV S = 12)

JA−GBJAV S, sonst

4.3.3. Verweildauer

Die Verweildauer v bezeichnet die Anzahl der Jahre, wie lange eine Person die EM-Rente er-halten hat. Der Wertebereich der Größe v ist die Menge {0,1, . . . ,6}, wobei die Werte wie folgtinterpretiert werden:

v = 0⇐⇒ (0,12] Monate der Rentenzahlungv = 1⇐⇒ (12,24] Monate der Rentenzahlung...v = 6⇐⇒ mehr als 6 Jahre der Rentenzahlung

Es gibt keine Person mit der Rentenbezugszeit null Monate, weil die EM-Rente immer am An-fang des Monats gezahlt wird. Selbst im Falle des Todes in den ersten Monaten der Rentenbe-ziehung erfolgt die Rentenzahlung bei allen EM-Rentnern mindestens einmal.

• Die gesuchte Verweildauer im Rentenbestand wird als die Dauer der Rentenzahlung inJahren seit dem Jahr des erstmaligen Rentenbeginns RT BE1 zum 30.11. des Berichtsjah-res t bestimmt. Aus der Definition der Verweildauer resultiert die Formel:

v = JA−RT BE1

• Im Rentenwegfall ist dagegen die Dauer der Rentenzahlung in Jahren seit dem Jahr deserstmaligen Rentenbeginns RT BE1 im Todesmonat des Berichtsjahres t gesucht. Die For-

23

Page 32: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

mel erfolgt analog dem Rentenbestand:

v = JA−RT BE1

4.3.4. Sterberate

Weil die theoretische Definition der Sterberate in (3.1) allgemein ist, muss sie noch in Bezugauf die verwendeten Daten und berechneten Parameter bestimmt werden. Dabei muss gewähr-leistet sein, dass die Todesfälle aus der richtigen Ausgangspopulation stammen und somit derExposure-to-Risk ET Rxvt zur Totenanzahl Dxvt entspricht. Die empirische Formel, d. h. die andie Daten angepasste Formel wird nach diesem Kriterium gebildet. Der benutzte Ansatz wirdschrittweise für den zwei- und dreidimensionalen Fall berechnet.

• Zweidimensionaler Fall:

Wir betrachten die Zugehörigkeit zwischen der Lebendenanzahl Lxt und der GestorbenenanzahlDxt . Anschließend wird die Sterberate mxt bestimmt. Grundidee ist es, das Alter der gestorbenenPersonen im Rentenbestand zu berücksichtigen, da aus der Population von x-Jährigen, die imJahr t gestorben sind, ein Anteil im Jahr (t− 1) schon x und der andere noch (x− 1) Jahre altgewesen ist.

Sei D40,2013 die Anzahl der im Zeitintervall [1.12.2012,30.11.2013] im Alter von 40 Jahrengestorbenen Personen. Der Geburtszeitraum der Personen ist dann [1.12.1971,30.11.1973]. SeiL40,2012 die Anzahl der zum 30.11.2012 noch 40-Jährigen, die im nächsten Jahr 41 werden könn-ten. Die Generation von L40,2012 bestimmt das Zeitintervall [1.12.1971,30.11.1972]. Schließlichsei L39,2012 die Anzahl der zum 30.11.2012 noch 39-Jährigen, die im nächsten Jahr 40 werdenkönnten. Die Generation von L39,2012 ist durch [1.12.1972,30.11.1973] gegeben.

Diese Situation wird in Abbildung 4.1 veranschaulicht. Die Bestände der Lebenden L40,2012 undL39,2012 werden durch die Rechtecke dargestellt. Die Todesfälle D40,2013 befinden sich innerhalbder grauen Fläche, die somit der Ausgangspopulation der 40-Jährigen im Kalenderjahr 2013 ent-spricht. Da laut Abbildung in der Ausgangspopulation im Mittel die Hälfte der LebendenanzahlL40,2012 und L39,2012 enthalten ist, kann die Sterberate m40,2013 nach Zwiesler et al. (2011) mit

m40,2013 =D40,2013

ET R40,2013=

D40,201312 (L40,2012 +L39,2012)

geschätzt werden.

24

Page 33: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

Geburtstag

1.12.1973

1.12.1972

1.12.1971

1.12.2012 1.12.2013

39-Jährige

41-Jährige

Kalenderzeit

Ausgangspopulation der 39-Jährigen im Jahr 2012

Ausgangspopulation der 40-Jährigen im Jahr 2012

40-Jährige

Abbildung 4.1.: Zusammenhang zwischen der Gestorbenenopulation D40,2013 und den Aus-gangspopulationen L40,2012 und L39,2012 in Anlehnung an Zwiesler et al. (2011).

Unter der Annahme, dass die Todesfälle unterjährig gleichverteilt werden, sollten die Beträge derLebenden Lx, t−1 und Lx−1, t−1 etwa gleich sein. Somit ist es gewährleistet, dass der Exposure-to-Risk ET Rxt homogen bleibt, d. h. die Altersgruppen x und (x−1) gleichmäßig vertretensind. Um die Annahme für andere relevante Altersgruppen sicherzustellen, betrachten wir inTabelle 4.1 die Größe der aneinander liegenden Generationen der Personen im Alter von 40 bis59 in jedem Berichtsjahr. Wir sehen, dass die Generation der 59-Jährigen im Berichtsjahr 1993(Geburtsjahr 1934) 1327 Personen beträgt. Dagegen sind im Berichtsjahr 1993 unter den 58-Jährigen (Geburtsjahr 1934) 1273 Personen enthalten. Der Unterschied ist relativ klein. In jedemBerichtsjahr (Spalte) werden die Generationen mit absteigendem Alter kleiner. Trotzdem sinddie hintereinander folgenden Generationen vergleichbar groß, was die Annahme bestätigt.

• Dreidimensionaler Fall:

Jetzt wollen wir die Zugehörigkeit zwischen der Lebendenanzahl Lxvt und der Gestorbenenan-zahl Dxvt sicherstellen und die Sterberate mxvt berechnen. Dabei muss neben dem Alter auch dieVerweildauer der Personen im Rentenbestand berücksichtigt werden. Wegen dem unbekanntenMonat des Rentenbeginns ist es möglich, dass einige Personen im Rentenbestand die Verweil-

25

Page 34: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

Anzahl der Personen in Berichtsjahren 1993–2008 aus 1 % der Stichprobe

Generationen 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008

1934 13271935 1273 13401936 999 1220 14081937 904 1029 1335 14911938 805 1018 1235 1484 16851939 780 849 1106 1387 1546 17221940 655 740 993 1146 1373 1580 16881941 540 650 844 920 1029 1290 1425 16301942 390 442 567 658 744 881 971 1126 13001943 297 415 497 575 690 819 850 1049 1134 12221944 315 334 468 524 585 689 821 893 954 1109 11211945 197 243 320 366 402 485 577 585 658 754 850 8121946 204 218 260 330 383 400 521 528 618 675 780 806 8581947 172 203 264 333 341 405 492 531 654 670 794 851 953 9991948 175 196 246 284 337 397 397 485 578 602 670 813 872 910 9571949 170 190 258 301 333 369 431 483 607 609 673 710 834 914 1009 10451950 148 191 233 294 302 337 436 443 486 546 639 648 763 802 912 9631951 147 138 222 237 296 333 322 385 449 506 578 625 722 779 837 9541952 135 134 177 254 270 264 315 335 401 433 451 591 594 699 743 8021953 121 118 171 215 230 260 270 328 369 400 457 516 532 588 635 7021954 112 174 190 221 273 287 294 387 390 439 463 524 582 613 6911955 141 182 199 231 267 280 319 361 369 446 464 531 581 6061956 154 169 221 232 255 323 335 341 414 461 488 543 6061957 180 215 245 231 270 295 372 353 416 476 465 5171958 162 203 243 241 295 322 383 387 443 452 5261959 193 258 272 280 290 334 406 411 478 5001960 204 248 280 284 325 369 390 402 4881961 194 223 260 290 359 356 388 4201962 201 237 271 307 315 366 3781963 242 257 264 282 338 3981964 232 263 288 310 3371965 210 266 283 2781966 194 234 2611967 211 2381968 194

Tabelle 4.1.: Generationen der Personen im Alter von 40 bis 59 Jahren in den Berichtsjahren1993 – 2008 aus 1 % der Stichprobe FDZ-RV (2011).

26

Page 35: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

Tag des Rentenbeginns

1.12.2013

1.12.2012

1.12.2011

1.12.2012 1.12.2013 Kalenderzeit

0 Jahre

0 Jahre Ausgangspopulation mitder Verweildauer 0 im Jahr 2012

Ausgangspopulation mitder Verweildauer 1 im Jahr 2012

1 Jahr

Abbildung 4.2.: Zusammenhang zwischen der Gestorbenenopulation D40,1,2013 und den Aus-gangspopulationen L40,1,2012, L40,0,2012, L39,1,2012 und L39,0,2012 in Anlehnungan Zwiesler et al. (2011).

dauer v und andere (v−1) aufweisen. Die Approximation der Sterberate mxvt wird analog zumvorhergehenden Beispiel erklärt.

Sei D40,1,2013 die Anzahl der im Zeitintervall [1.12.2012,30.11.2013] im Alter von 40 Jahrennach (1,2] Jahren des Rentenbezugs gestorbenen Personen. Weiter seien L40,1,2012, L39,1,2012,L40,0,2012 und L39,0,2012 die Anzahl der zum 30.11.2012 40-jährigen und 39-jährigen Lebenden,die höchstens ein Jahr die Rente bezogen haben. Als nächstes soll der dritte Parameter Verweil-dauer v mitberücksichtigt werden. Der Einfachheit wegen zeigt Abbildung 4.2 die Beziehungder Ausgans- und Gestorbenenpopulationen nur in Abhängigkeit von der Verweildauer v undder Kalenderzeit t.

In Abbildung 4.2 sind auf der x-Achse das Berichtsjahr 2013 und auf der y-Achse die Zeitpunk-te, ab wann die Personen die EM-Rente erhalten haben, eingetragen. Die Bestände der Lebendenmit der Verweildauer ein Jahr oder weniger zum Stichtag 30.11.2012 werden wieder durch dieRechtecke dargestellt. Innerhalb der grauen Fläche befinden sich alle Personen, die im Jahr 2013die EM-Rente schon seit einem Jahr erhalten. Diese Personen bilden die gesuchte Ausgangspo-pulation, die als Summe der Hälften von Beständen der Verweildauerklasse 1 und 0 berechnet

27

Page 36: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

wird. Weil die Verweildaueraufteilung sowohl für Personen im Alter von 40 Jahren, als auchfür Personen im Alter von 39 Jahren erfolgt, ergibt sich analog zum Skript von Zwiesler et al.(2011) für die Sterberate m40,1,2013 folgende Schätzung:

m40,1,2013 =D40,1,2013

ET R40,1,2013=

D40,1,201312

(12L40,1,2012 +

12L40,0,2012

)+ 1

2

(12L39,1,2012 +

12L39,0,2012

)Für die Sterberate m40,0,2013 muss die Formel korrigiert werden, indem in die Ausgangspopula-tion nur Personen mit der Verweildauer von höchstens einem Jahr mitgenommen werden. Sonstwürde die Anzahl der gestorbenen EM-Rentner durch die Anzahl der lebenden Personen ohneRentenbezug geteilt werden. Dadurch wird die Schätzung für die Sterberate m40,0,2013 als

m40,0,2013 =D40,0,2013

12 (L40,0,2012 +L39,0,2012)

gegeben. Auf diese Weise erhalten wir die empirische Formel für die Sterberate mxvt :

mxvt =Dxvt

12

(12Lx,v, t−1 +

12Lx,v−1, t−1

)+ 1

2

(12Lx−1,v, t−1 +

12Lx−1,v−1, t−1

) , v≥ 1 (4.2)

mx0t =Dx0t

12 (Lx,0, t−1 +Lx−1,0, t−1)

(4.3)

Dabei ist es wichtig zu betonen, dass das Kalenderjahr t, in dem die Sterberate mxvt ausgerechnetwurde, durch das Zeitintervall in (4.1) bestimmt wird.

Ähnlich wie im zweidimensionalen Fall sollten die Bestände von Lx,v, t−1, Lx,v−1, t−1, Lx−1,v, t−1

und Lx−1,v−1, t−1 vergleichbar groß sein. Wegen der Komplexität des Datensatzes werden in Ta-belle 4.2 nur die Berichtsjahre 1993 und 2008 betrachtet. Gewünscht ist, dass die Anzahl der Per-sonen in einem Rechteck von zwei nacheinander folgenden Verweildauerklassen und Genera-tionen keine starken Abweichungen zeigt. Es ist offensichtlich, dass die Anzahl der Personen injüngeren Generationen (L40,0,1993 = 12) im Vergleich zu älteren Generationen (L59,0,1993 = 122)stark abnimmt. Doch das gewünschte Verhältnis bleibt erhalten. Die Generationen im Berichts-jahr 2008 sind viel ausgewogener. Die Senkung der Bestände ist deutlich kleiner im Vergleichzum Berichtsjahr 1993, z. B. L40,0,2008 = 19 und L59,0,2008 = 53. Abgesehen von der aufaddier-ten Anzahl der Personen mit Verweildauer 6 und mehr, ist der Unterschied zu nachfolgendenGenerationen in nebenliegenden Verweildauerklassen gering.

28

Page 37: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

4.4. Grafische Darstellung der Parameter

Im nächsten Schritt der Datenuntersuchung werden grafische Entwicklungen einzelner Parame-ter im Zusammenhang mit der logarithmierten Sterberate betrachtet. Für diese Zwecke mussteaus dem gesamten Datensatz nur ein Teil herausgenommen werden, in dem alle Klassen, d. h.Jahres-, Alters- und Verweildauerklassen, ausreichend belegt sind, sodass die logarithmierteSterberate noch definiert ist. In den für die Modellierung vorbereiteten Arbeitsdatensatz wer-den folgende Klassen verwendet:

• Kalenderjahr von 1994 bis 2009

• Alter von 40 bis 59

• Verweildauer von 0 bis 6

Verweildauerklassen im Berichtsjahr 1993

Generationen 0 1 2 3 4 5 6

1934 122 187 188 134 118 88 4901935 132 180 188 147 92 90 4441936 81 148 127 101 93 78 3711937 78 146 113 93 83 65 3261938 75 142 92 71 69 65 2911939 59 129 116 75 92 53 2561940 59 101 90 80 45 29 2511941 52 76 92 54 34 32 2001942 36 58 45 44 26 36 1451943 28 35 40 16 18 15 1451944 18 37 39 27 26 23 1451945 9 18 16 27 17 14 961946 14 17 29 16 13 13 1021947 14 25 19 16 11 7 801948 8 23 16 21 9 14 841949 7 16 22 21 15 8 811950 9 23 21 13 7 11 641951 3 22 15 9 15 14 691952 13 14 13 9 11 12 631953 12 16 9 11 9 4 60

(a)

Verweildauerklassen im Berichtsjahr 2008

Generationen 0 1 2 3 4 5 6

1949 53 94 109 94 68 71 5561950 65 88 72 73 69 62 5341951 69 82 103 61 70 65 5041952 49 63 73 68 63 54 4321953 49 77 55 54 66 46 3551954 56 77 55 57 53 41 3521955 42 50 49 47 45 46 3271956 42 47 73 43 43 28 3301957 36 59 49 34 37 36 2661958 54 60 40 39 35 40 2581959 28 53 42 45 33 28 2711960 43 39 51 31 32 30 2621961 32 37 36 34 34 31 2161962 23 28 25 22 34 22 2241963 28 47 31 30 24 31 2071964 19 30 19 29 30 21 1891965 19 32 24 27 28 23 1251966 19 34 24 25 25 24 1101967 26 27 22 21 20 21 1011968 19 11 24 22 14 13 91

(b)

Tabelle 4.2.: Generationen der Personen im Alter von 40 bis 59 Jahren in jeder Verweildauer-klasse aus 1 % der Stichprobe FDZ-RV (2011) im Berichtsjahr (a) 1993 (b) 2008.

Die Begrenzung der Altersklassen bis 59 sorgt dafür, dass mögliche Selektionseffekte ab demAlter 60 vermieden werden, wie z. B. früheres Aufnehmen der Altersrente statt der EM-Rente.

29

Page 38: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

Verweildauerklassen im Rentenbestand 1993

Alter 0 1 2 3 4 5 6

40 8.50 12.00 12.75 10.25 9.25 6.50 26.5041 12.50 13.75 13.00 10.50 10.00 9.00 34.7542 8.00 13.00 16.00 11.50 11.00 13.00 39.5043 6.00 14.25 20.25 14.50 11.00 11.75 39.5044 8.00 13.75 20.50 19.25 14.00 10.25 41.0045 7.50 13.50 19.25 20.00 16.50 11.50 46.7546 11.00 17.50 20.75 18.00 14.25 10.25 46.2547 14.00 17.50 22.50 20.00 14.00 11.00 50.5048 11.50 14.50 20.00 22.00 18.25 14.25 56.2549 13.50 20.50 27.50 27.25 24.25 20.00 69.5050 23.00 29.50 37.75 30.50 21.75 20.50 82.0051 32.00 39.25 44.50 36.25 26.00 23.75 85.2552 44.00 55.50 67.75 58.75 39.50 32.00 103.2553 55.50 72.00 89.75 79.00 53.25 35.00 128.0054 59.00 87.00 109.00 90.25 73.00 54.75 147.2555 67.00 101.25 119.75 88.50 76.75 69.75 166.2556 76.50 110.25 123.25 92.25 79.00 70.50 186.7557 79.50 113.25 133.50 108.50 92.50 79.75 210.0058 106.50 135.25 160.75 140.75 108.25 88.25 245.7559 127.00 155.25 185.75 164.25 122.75 97.00 278.00

(a)

Verweildauerklassen im Rentenbestand 2008

Alter 0 1 2 3 4 5 6

40 21.50 19.75 19.75 19.50 14.75 11.00 47.0041 22.50 20.75 21.00 22.25 19.25 17.00 56.5042 22.50 26.50 26.75 23.00 22.75 22.50 64.0043 19.00 26.00 28.50 25.00 26.25 25.00 70.5044 19.00 25.00 26.25 24.75 28.50 25.50 89.5045 23.50 31.00 31.75 27.25 28.25 26.50 112.0046 25.50 31.50 32.75 27.00 27.50 27.75 121.0047 27.50 30.00 31.50 29.25 31.00 30.25 123.2548 37.50 37.75 40.75 38.00 32.75 31.75 134.7549 35.50 40.75 46.25 42.25 35.25 30.75 147.7550 41.00 48.75 48.75 41.50 38.00 34.00 149.2551 45.00 52.25 52.00 40.50 36.25 37.00 150.0052 39.00 46.00 57.00 49.75 39.25 36.00 165.0053 42.00 45.25 54.75 53.00 44.50 40.50 182.7554 49.00 56.25 57.75 52.00 50.50 46.25 191.5055 52.50 64.75 66.00 55.25 57.50 51.50 198.5056 49.00 59.50 67.00 62.50 62.75 57.25 221.7557 59.00 65.75 80.25 76.25 65.50 63.00 263.7558 67.00 76.00 86.25 77.25 68.25 66.50 291.2559 59.00 75.00 90.75 87.00 76.00 67.50 305.75

(b)

Tabelle 4.3.: Exposure-to-Risk ET Rxvt in einzelnen Klassen aus 1 % der Stichprobe FDZ-RV(2011) im Berichtsjahr (a) 1993 (b) 2008.

30

Page 39: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

Da die Verweildauerklasse 6 aus allen potentiellen Fällen mit Verweildauer größer gleich 6 be-steht, muss bei der Interpretation der Daten in dieser Klasse auf die mögliche Verzerrung ge-achtet werden. Mit ähnlicher Vorsicht muss auch die Altersklasse 40 aufgefasst werden, in deres bei der Verweildauer 3, 4 und 5 in einigen Jahren keine toten Personen gibt. Die Sterberatein diesen leeren Klassen wird mit dem Minimum der Sterberate aus dem gesamten Datensatzgeschätzt. Die Bestände von dem Exposure-to-Risk ET Rxvt und der Totenanzahl Dxvt für Be-richtsjahre 1994 und 2009, aus denen die Sterberate mxvt berechnet wird, werden in Tabellen 4.3und 4.4 aufgezeigt.

Verweildauerklassen im Rentenwegfall 1994

Alter 0 1 2 3 4 5 6

40 5 15 7 0 0 0 841 10 8 10 3 3 6 842 13 17 6 6 4 2 443 7 16 14 5 3 2 1344 15 27 8 4 1 9 1145 7 27 13 2 7 6 1546 9 23 8 7 6 1 1147 13 25 9 10 3 3 1148 9 22 14 5 4 2 1849 13 26 20 12 3 4 2050 24 41 20 11 4 6 2551 25 43 29 17 9 7 4352 23 50 20 20 21 13 5953 39 60 41 18 16 15 7454 37 70 58 25 19 13 7455 44 65 50 30 13 23 8056 51 67 49 31 11 13 10357 42 71 49 36 27 19 11658 46 84 57 40 30 20 14459 31 77 76 58 31 28 154

(a)

Verweildauerklassen im Rentenwegfall 2009

Alter 0 1 2 3 4 5 6

40 4 7 5 4 1 0 841 6 5 1 7 3 1 842 2 12 8 3 1 1 943 13 13 3 3 2 1 1044 8 14 4 1 3 3 1445 8 19 15 5 8 5 2546 13 22 14 10 2 4 2347 12 27 14 5 7 5 2948 16 21 14 10 1 5 3149 16 32 14 10 5 13 3850 20 28 18 10 7 7 4351 16 35 10 8 7 4 6252 20 30 19 20 9 9 5653 23 40 17 14 13 9 6054 25 49 22 12 11 9 6755 23 38 25 19 16 10 8056 24 51 29 19 16 11 10157 30 50 28 12 14 21 9558 34 60 38 23 22 13 11459 26 40 30 28 30 15 162

(b)

Tabelle 4.4.: Totenanzahl Dxvt in einzelnen Klassen aus 10 % der Stichprobe FDZ-RV (2011) imBerichtsjahr (a) 1994 (b) 2009.

Für die allgemeinen Zusammenhänge zwischen den Parametern im Arbeitsdatensatz werdenmit der Software R die Pearson-Korrelationskoeffizienten kalkuliert. Zwischen dem ParameterKalenderjahr und dem Logarithmus der Sterberate ergibt sich der Korrelationskoeffizient−0.20,was die erwartete Senkung der Sterberate im Zeitverlauf beweist. Im Vergleich dazu wird derZuwachs der Sterberate mit steigendem Alter durch den Korrelationskoeffizient 0.21 zwischenden beiden Parametern aufgezeigt. Den größten Einfluß auf die Sterberate hat der ParameterVerweildauer mit dem Korrelationskoeffizient −0.53, was die Verringerung der Sterberate mit

31

Page 40: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

1995 2000 2005

−5.

0−

4.5

−4.

0−

3.5

−3.

0−

2.5

−2.

0

Kalenderjahr t

Loga

rithm

iert

e S

terb

erat

e im

Alte

r x

x=[40,44]x=[45,49]x=[50,54]x=[55,59]

(a)

1995 2000 2005

−5.

0−

4.5

−4.

0−

3.5

−3.

0−

2.5

−2.

0Kalenderjahr t

Loga

rithm

iert

e S

terb

erat

e m

it de

r V

erw

eild

auer

v

v=0v=1v=2v=3v=4v=5v=6

(b)

Abbildung 4.3.: Verlauf der logarithmierten Sterberate aus dem Datensatz FDZ-RV (2011) inder Zeit ohne Berücksichtigung (a) der Verweildauer (b) des Alters.

längerer Verweildauer nach den DAV-Selektionssterbetafeln 1997 TI für berufsunfähige Männerbzw. Frauen (vgl. Kolster et al., 1998, S. 546, 552) bestätigt.

Für eine bessere grafische Darstellung der Effekte werden die logarithmierten Sterberaten se-parat berechnet, indem die Anzahl der Lebenden und Toten in einzelnen Altersklassen zu fünftvereinigt werden. So ergeben sich die vereinigten Altersklassen 40− 44, 45− 49, 50− 54 und55− 59. Die gegenseitigen Auswirkungen der Parameter auf die logarithmierte Sterberate un-tersuchen wir zuerst in Abhängigkeit von nur zwei Parametern. Dabei wird der Einfluss desdritten Parameters nicht berücksichtigt, indem die Anzahl der Personen im Rentenbestand undRentenwegfall über alle Werte des dritten Parameters aufaddiert wird. Somit wird ein gewich-tetes Mittel der Sterberaten gebildet. Davon abgeleitete logarithmierte Sterberaten werden infolgenden Grafen gezeigt.

Grafik 4.3a stellt die Senkung der Sterberate in der Zeit bei verschiedenen Altersgruppen dar.Der Parameter Verweildauer wird vernachlässigt. Es ist erkennbar, dass die Sterberate bei jün-geren Altersgruppen deutlich schneller mit der Zeit sinkt, als bei höheren Altersgruppen. In derAltersgruppe 55−59, grün eingezeichnet, ist das Sterberateniveau mit der Zeit fast konstant. ImVergleich dazu betrachtet Grafik 4.3b wieder die Entwicklung der Sterberate in der Zeit ohneBeachtung des Alters. Ein fallender Trend ist bei keiner Verweildauerklasse zu sehen. Darauslässt sich vermuten, dass der Parameter Alter zum großen Teil für die Senkung der Sterberate inder Zeit verantwortlich ist.

32

Page 41: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

0 1 2 3 4 5 6

−5.

0−

4.5

−4.

0−

3.5

−3.

0−

2.5

−2.

0

Verweildauer v

Loga

rithm

iert

e S

terb

erat

e im

Alte

r x

x=[40,44]x=[45,49]x=[50,54]x=[55,59]

(a)

0 1 2 3 4 5 6

−5.

0−

4.5

−4.

0−

3.5

−3.

0−

2.5

−2.

0Verweildauer v

Loga

rithm

iert

e S

terb

erat

e im

Jah

r t

t=1994t=1996t=1998t=2000t=2003t=2006t=2009

(b)

Abbildung 4.4.: Verlauf der logarithmierten Sterberate aus dem Datensatz FDZ-RV (2011) beiunterschiedlichen Verweildauerklassen ohne Berücksichtigung (a) der Kalen-derzeit (b) des Alters.

Ein anderes Phänomen, das in Grafik 4.4a veranschaulicht ist, ist die schnellere Senkung derSterberate mit der Verweildauer bei niedrigeren Altersgruppen. Das hängt damit zusammen, dassbei jüngeren EM-Rentnern eine raschere Gesundheitsbesserung erwartet werden kann. Hier wirdder Effekt der Kalenderzeit vernachlässigt. Der Anstieg der Sterberate in der Verweildauerklasse6 muss vorsichtig interpretiert werden, weil es sich um eine aufaddierte Größe handelt. DieseSteigerung kann auch in Grafik 4.3b abgelesen werden. Die Kurve in der Verweildauerklasse6 ist viel höher gelegt als in der Verweildauerklasse 5. Abbildung 4.4a zeigt, dass EM-Rentnermit einem einjährigen Rentenbezug eine größere Sterberate besitzen, als EM-Rentner mit einemRentenbezug von weniger als einem Jahr. Dies steht im Gegensatz zu der bekannten Verweildau-ersabhängigkeit der Sterberate, bei der in der ersten Verweildauerklasse die größte Sterblichkeitvorkommt (vgl. Kolster et al., 1998, S. 546). Wie es in DRV (2013a) steht, wäre eine möglicheErklärung die Überprüfung der medizinischen und versicherungsrechtlichen Voraussetzungenfür die Erwerbsminderungsfähigkeit, die von der Deutschen Rentenversicherung durchgeführtwird. Infolge dieses Prozesses wird die Festlegung und Zahlung der EM-Rente verzögert. Sokann es passieren, dass einige kranke Personen sterben, bevor der Prozess zur Feststellung derErwerbsminderungsfähigkeit abgeschlossen ist. Die Verweildauerklasse 0 wird dadurch über-wiegend mit „guten“ Risiken belegt. Einen ähnlichen Verlauf der Sterberate mit der Verweil-dauer sehen wir auch in Grafik 4.4b, in der der Parameter Alter nicht berücksichtigt wird. Beim

33

Page 42: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

45 50 55

−6

−5

−4

−3

−2

Alter x

Loga

rithm

iert

e S

terb

erat

e in

der

Ver

wei

ldau

erkl

asse

v

v=0v=1v=2v=3v=4v=5v=6

(a)

45 50 55

−5.

0−

4.5

−4.

0−

3.5

−3.

0−

2.5

−2.

0Alter x

Loga

rithm

iert

e S

terb

erat

e im

Jah

r t

t=1994t=1996t=1998t=2000t=2003t=2006t=2009

(b)

Abbildung 4.5.: Logarithmierte Sterberate bei unterschiedlichen Altersgruppen anhand des Da-tensatzes FDZ-RV (2011) ohne Berücksichtigung (a) der Kalenderzeit (b) derVerweildauer.

Vergleich des Sterblichkeitsniveaus in den Jahren 1994 und 2009 ist auch die Verminderung derSterberate in der Zeit zu sehen.

Die Änderungen der Sterberate mit dem Alter ohne Berücksichtigung der Kalenderzeit sind inGrafik 4.5a aufgezeigt. Der Kurvenverlauf spiegelt die Sterbetafelwerte aus den DAV-Selektions-sterbetafeln 1997 TI für berufsunfähige Männer bzw. Frauen wider (vgl. Kolster et al., 1998, S.553), wobei die Verweildauerklasse 6 aufgrund ihres Charakters außer Betracht bleibt. Bei feh-lender Verweildauer in Grafik 4.5b verschwindet die Steigerung, die durch Verweildauerklasse6 entsteht, und es kann wieder die Verminderung der Sterberate in der Zeit betrachtet werden.

Für eine bessere Analyse der gegenseitigen Interaktionen werden nun die grafischen Auswir-kungen aller Parameter auf die logarithmierte Sterberate untersucht. Die starke Senkung derSterberate mit der Zeit und mit der Verweildauer kann in Abbildung 4.6a bei der Altersgruppe40−44 erkannt werden. Im Vergleich dazu liegen die Sterberatennievaus in Grafik 4.6b in ein-zelnen Jahren sehr nahe beieinander, was bei den EM-Rentnern im Alter 55− 59 eine geringeSenkung der Sterberate mit der Zeit aufweist. Außerdem ist ersichtlich, dass die Sterblichkeitvon älteren EM-Rentnern mit der Rentenbezugszeit nur wenig sinkt.

Einen markanten Unterschied unter den Sterberaten der EM-Rentner im Alter 40−44 mit ver-schiedener Verweildauer sehen wir in Abbildung 4.7a. In den sinkenden Niveaus der Kurven

34

Page 43: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

0 1 2 3 4 5 6

−6

−5

−4

−3

−2

−1

0

Verweildauer v

Loga

rithm

iert

e S

terb

erat

e im

Jah

r t (

Alte

r 40

−44

)

t=1994t=1996t=1998t=2000t=2003t=2006t=2009

(a)

0 1 2 3 4 5 6−

6−

5−

4−

3−

2−

10

Verweildauer v

Loga

rithm

iert

e S

terb

erat

e im

Jah

r t (

Alte

r 55

−59

)

t=1994t=1996t=1998t=2000t=2003t=2006t=2009

(b)

Abbildung 4.6.: Abstieg der logarithmierten Sterberate aus dem Datensatz FDZ-RV (2011) inder Zeit bei den EM-Rentnern im Alter (a) 40−44 (b) 55−59.

1995 2000 2005

−6

−5

−4

−3

−2

−1

0

Kalenderjahr t

Loga

rithm

iert

e S

terb

erat

e m

it de

r V

erw

eild

auer

v (

Alte

r 40

−44

)

v=0v=1v=2v=3v=4v=5v=6

(a)

1995 2000 2005

−6

−5

−4

−3

−2

−1

0

Kalenderjahr t

Loga

rithm

iert

e S

terb

erat

e m

it de

r V

erw

eild

auer

v (

Alte

r 55

−59

)

v=0v=1v=2v=3v=4v=5v=6

(b)

Abbildung 4.7.: Abstieg der logarithmierten Sterberate aus dem Datensatz FDZ-RV (2011) mitder Verweildauer bei den EM-Rentnern im Alter (a) 40−44 (b) 55−59.

35

Page 44: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

1995 2000 2005

−6

−5

−4

−3

−2

−1

0

Kalenderjahr t

Loga

rithm

iert

e S

terb

erat

e im

Alte

r x

(Ver

wei

ldau

er 0

)

x=[40,44]x=[45,49]x=[50,54]x=[55,59]

(a)

1995 2000 2005

−6

−5

−4

−3

−2

−1

0

Kalenderjahr t

Loga

rithm

iert

e S

terb

erat

e im

Alte

r x

(Ver

wei

ldau

er 1

)

x=[40,44]x=[45,49]x=[50,54]x=[55,59]

(b)

1995 2000 2005

−6

−5

−4

−3

−2

−1

0

Kalenderjahr t

Loga

rithm

iert

e S

terb

erat

e im

Alte

r x

(Ver

wei

ldau

er 3

)

x=[40,44]x=[45,49]x=[50,54]x=[55,59]

(c)

1995 2000 2005

−6

−5

−4

−3

−2

−1

0

Kalenderjahr t

Loga

rithm

iert

e S

terb

erat

e im

Alte

r x

(Ver

wei

ldau

er 6

)

x=[40,44]x=[45,49]x=[50,54]x=[55,59]

(d)

Abbildung 4.8.: Zeitverlauf der logarithmierten Sterberate anhand des Datensatzes FDZ-RV(2011) bei allen Altersgruppen mit Verweildauer von (a) weniger als einem Jahr(b) bis zu zwei Jahren (c) bis zu vier Jahren (d) mehr als sechs Jahren.

36

Page 45: Modellierung von Sterbewahrscheinlichkeiten mit

4. Datenbeschreibung

wird genau der fallende Verweildauermuster der logarithmierten Sterberate aus Grafik 4.6a abge-bildet. Bei Betrachtung der Sterberate von EM-Rentnern im Alter 55−59 sind die Unterschiededer Sterberate in verschiedenen Verweildauerklassen dagegen deutlich geringer.

In den Grafiken 4.8a und 4.8b ist es interessant zu sehen, dass die EM-Rentner im Alter 55−59mit einem Rentenbezug von höchstens einem Jahr in den Jahren 1994− 2003 eine niedrigereSterblichkeit ausweisen als jüngere EM-Rentner im Alter 40− 44. Wie in Grafik 4.8c zu er-kennen ist, klingt dieser Effekt mit einer längeren Verweildauer in der EM-Rente ab. Bild 4.8dmacht deutlich, wie stark die Sterberate mit dem Alter anwächst, wenn die Sterberatenniveausvon langjährigen EM-Rentnern (Verweildauer 6) in einzelnen Jahren beobachtet werden.

37

Page 46: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion deserweiterten Lee-Carter Modells

In diesem Kapitel beschäftigen wir uns mit der Kalibrierung der Modellansätze des dritten Ka-pitels mit dem in Kapitel 4 beschriebenen Datensatz. Bei der Parameterschätzung werden dieMethode der kleinsten Quadrate und die dreidimensionale Singulärwertzerlegung, bekannt alsdie Tucker-Methode (vgl. Tucker, 1966), verwendet.

Bei den Modellansätzen (3.2)-(3.4) wird beim Schätzen ein zweistufiges Verfahren angewendet.Mittels der Methode der kleinsten Quadrate wird der additive Parameter α abgeschätzt und vonder bekannten logarithmierten Sterberate lnmxvt subtrahiert. Analog zum originalen Lee-CarterModell (2.20) wird das Dreierprodukt βxγvκt mithilfe der Tucker-Methode auf drei Vektore zer-legt, die somit die Schätzer βx, γv und κt darstellen. Die Schätzung des Modells (3.5) erfolgtzweimal, zuerst mit der Tucker-Methode und danach durch Minimierung einer Fehlerquadrat-summe im logarithmischen Modell. Nach dem Abschätzen der Parameter folgt in allen Modellenihre Anpassung an die nötigen Grenzbedingungen sowie die Analyse der Residuen.

5.1. Schätzen mit der Tucker-Methode

Die Tucker-Methode ermöglicht die Analyse von dreidimensionalen Daten ohne Annahmen überihre Verteilung. Die Grundidee der Methode liegt in der Bestimmung von den Hauptkomponen-ten für jede Dimension und ihrem Zusammenhang zu den Daten, sowie der Verhältnisse allerHauptkomponenten untereinander. Danach erfolgt die Approximation des originalen Datensat-zes mit den Hauptkomponenten, die den Großteil der Effekte in den Daten erklären. Der Verlaufder Tucker-Methode wird in folgenden Absätzen anhand der Arbeit von Kiers und Van Mechelen(2001) erläutert.

Sei M eine dreidimensionale Matrix der logarithmierten Sterberaten lnmxvt . Davon wird die ersteDimension durch das Alter x mit x = x1, . . . ,xm repräsentiert. Die Verweildauer v mit den Werten

38

Page 47: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

v = v1, . . . ,vk bildet die zweite Dimension des Datensatzes und die dritte Dimension wird durchdas Kalenderjahr t mit dem Wertebereich t = t1, . . . , tn dargestellt. Dann können die Einträge derMatrix M als

lnmxvt ≈P

∑p=1

Q

∑q=1

R

∑r=1

axp bvq ctr gpqr

approximiert werden (vgl. Kiers und Van Mechelen, 2001). Dabei sind axp, bvq und ctr die Ein-träge der Komponentenmatrizen A ∈ Rm×P, B ∈ Rk×Q und C ∈ Rn×R. Die Komponentenma-trizen A, B und C sind spaltenweise orthonormal. Sie geben uns Information darüber, wie engein Eintrag der Matrix M mit den Hauptkomponenten der drei Dimensionen verknüpft ist. Esist erwünscht, dass jedes Element der Matrix M innerhalb einer Dimension, z. B. Alter, nurzu einer Hauptkomponente zugeordnet werden kann. In der Regel heißt es, dass es in jederZeile der Komponentenmatrix A im Vergleich zum Rest nur eine große Zahl im Betrag gibt.Dies ermöglicht die spätere Gruppierung der logarithmierten Sterberaten nach der Komponen-tenzugehörigkeit, was zur Datenreduktion führt. Die Anzahl der Hauptkomponenten der einzel-nen Dimensionen sind P für das Alter, Q für die Verweildauer und R für die Kalenderzeit. MitG ∈ RP×Q×R wird die dreidimensionale Kernmatrix bezeichnet, deren Elemente gpqr einzelneHauptkomponenten in den Daten und ihre gegenseitige Zusammenhänge beschreiben.

Wie bereits erwähnt wurde, ist unser Ziel aus den Modellen (3.2)-(3.5) das Dreierprodukt βxγvκt

auf einzelne Vektore zu zerlegen und somit die Schätzer βx, γv und κt zu erhalten. Deswegensuchen wir die größte Hauptkomponente, d. h. die betragsmäßig größte Zahl gpqr in der Kern-matrix G. Anhand der zugehörigen Indizes p, q und r werden die p-te Komponente der erstenDimension, die q-te Komponente der zweiten Dimension und die r-te Komponente der drittenDimension als Schätzer βx, γv und κt ausgewählt. Somit können die Daten folgendermaßen ap-proximiert werden:

lnmxvt ≈ gpqr axp bvq ctr (5.1)

Demnach erhalten wir für die Parameter βx, γv und κt die Schätzer

κt = gpqr btq ∀t, (5.2)

βx = axp ∀x, (5.3)

γv = cvr ∀v. (5.4)

Die oben beschriebene Tucker-Methode wird auf unseren Datensatz mittels der Matlab Proze-dur Tucker3.m angewendet, die von Kiers und Van Mechelen (2001) entwickelt wurde. Weil die

39

Page 48: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

Eingabe der Prozedur eine zweidimensionale Matrix ist, muss die dreidimensionale Matrix Mauf zwei Dimensionen m× (k×n) reduziert werden. An dieser Stelle werden die wichtigstenund für uns relevanten Schritte der Analyse erklärt.

• Dreidimensionale Analyse der Varianz (3D-ANOVA)

Als erster Schritt wird auf den Daten die dreidimensionale Analyse der Varianz durchgeführt.Wir untersuchen die Varianz der Daten in jeder Dimension, die Varianz zwischen zwei Dimen-sionen und die Varianz zwischen allen drei Dimensionen. Wie schon erwähnt wurde, stehen dieDimensionen für die Parameter Alter, Verweildauer und Kalenderzeit. Dabei wird unter Vari-anz die Abweichung der entsprechenden Erwartungswerte von dem Gesamterwartungswert inden Daten verstanden, wie es näher im Skript von Budíková et al. (2005) erläuter wird. Da-durch erhalten wir Informationen, wie viel Varianz durch die Effekte von einer, zwei oder allenDimensionen erklärt wird. Die einzelnen Effekte spiegeln die Auswirkung der entsprechendenDimension auf die Zielvariable wider. Zum Beispiel beschreibt der Alterseffekt den Verlauf derlogarithmierten Sterberate beim variierenden Alter. In den Effekten zweier Dimensionen wer-den die Einflüsse einer zusätzlichen Dimension auf das Verhalten der Zielvariable enthalten. Dasheißt, der kombinierte Effekt der Verweildauer und des Alters bildet das Altersmuster der loga-rithmierten Sterberate in unterschiedlichen Verweildauerklassen ab. Das Zusammenspiel allerDimensionen zeigt die Wirkung der Kalenderzeit auf den kombinierten Effekt des Alters undder Verweildauer.

Wir nehmen an, dass die notwendigen Erwartungswerte als Stichprobenmittel in entsprechendenDimensionen geschätzt werden. Die Matrix der logarithmierten Sterberaten lnmxvt wird weiter-hin mit M bezeichnet. Dabei bedeutet die Bezeichnung Mxv·, dass die Matrix M über die Wertedes mit einem Punkt eingezeichneten Index gemittelt wird. Nach der Arbeit von Budíková et al.(2005) seien

M··· =1

mnk

xm

∑x=x1

vk

∑v=v1

tn

∑t=t1

lnmxvt

das Gesamtmittel der Daten und

Mx·· =1kn

vk

∑v=v1

tn

∑t=t1

lnmxvt

das altersabhängige Mittel. Damit kann der Alterseffekt als die Abweichung

Mx··−M···

40

Page 49: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

ermittelt werden. Bei der Berechnung des kombinierten Effektes des Alters und der Verweildau-er müssen die einzelnen Alters- und Verweildauereffekte ausgeschlossen werden. M·v· bezeich-net das Mittel abhängig nur von der Verweildauer und Mxv· das gemeinsame Mittel des Altersund der Verweildauer. Dadurch erhalten wir für den kombinierten Effekt folgende Formel:

Mxv·−Mx··−M·v·+M···

Analog müssen bei der gesamten Wirkung aller Parameter einzelne und kombinierte Effekteberücksichtigt werden, sodass gilt:

lnmxvt−Mx·t−Mxv·−M·vt +Mx··+M··t +M·v·−M···

Dabei sind die Werte lnmxvt die bereits bekannten logarithmierten Sterberaten und M··t das zeit-abhängige Mittel. Zuletzt werden die gemeinsamen Mittel mit Mx·t über das Alter und Kalen-derzeit und M·vt über die Kalenderzeit in Kombination mit der Verweildauer bezeichnet.

Die Varianz der einzelnen Dimensionen ist durch die Quadratsummen gegeben, die für die er-wähnten Effekte folgenderweise berechnet werden (vgl. Budíková et al., 2005):

QSx = nkxm

∑x=x1

(Mx··−M···

)2

QSx,v = nxm

∑x=x1

vk

∑v=v1

(Mxv·−Mx··−M·v·+M···

)2

QSxvt =xm

∑x=x1

vk

∑v=v1

tn

∑t=t1

(lnmxvt−Mx·t−Mxv·−M·vt +Mx··+M··t +M·v·−M···

)2

Es ist üblich die einzelnen Quadratsummen durch die gesamte Quadratsumme QS zu teilen,wobei

QS =xm

∑x=x1

vk

∑v=v1

tn

∑t=t1

(lnmxvt−M···

)2.

Dadurch erhalten wir den Anteil der Varianz, der durch die jeweiligen Effekte aufgefangenwird.

Wenn die Varianzanalyse nur starke einzelne Effekte und maximal einen kombinierten Effektenthält, können die durch die restliche Dimension aggregierten Daten mithilfe der einfachenSingulärwertzerlegung untersucht werden. Bei mehreren starken kombinierten Effekten oder ei-nem signifikanten Gesamteffekt wird die Tucker-Methode benötigt. In unserem Fall treten in

41

Page 50: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

Effekte QS Anteil der Gesamtvarianz in %

Alter 82.8 8.5Verweildauer 493.9 50.9Jahr 41.5 4.3Alter × Verweildauer 48.2 4.9Alter × Jahr 61.2 6.3Verweildauer × Jahr 18.3 1.9Alter × Verweildauer × Jahr + Fehler 225.4 23.2

Gesamtsumme 971.3 100

Tabelle 5.1.: 3D-ANOVA der anhand des Datensatzes FDZ-RV (2011) berechneten logarith-mierten Sterberaten nach dem Subtrahieren des Gesamtmittels M···.

Tabelle 5.1 zwei starke Effekte auf, der Verweildauereffekt mit etwa 51 % und der Gesamtef-fekt mit 23 % der erklärten Varianz. Die kombinierten Effekte in den Daten sind gering. Vondaher kann die Tucker-Methode für unsere Daten genutzt werden. Aus diesem Grund werdendie in Kapitel 4 vorgeschlagenen Modellansätze untersucht. Wie es in der Arbeit von Kiers undVan Mechelen (2001) erwähnt wird, beinhaltet der Gesamteffekt auch den Fehler in den Daten.Deswegen sollte die Stabilität der Lösung genauer überprüft werden. Eine unstabile Lösung be-deutet, dass der Gesamteffekt eher durch zufällige Schwankungen als durch ein systematischesMuster bedingt wird. Unter solchen Umständen könnte der Gesamteffekt wegen Schwankungenvernachlässigt werden.

• Zentrierung und Skalierung

Die Tucker-Analyse wird meistens nicht auf rohen Daten durchgeführt. Vorher müssen sie zen-triert und unter bestimmten Umständen auch skaliert werden. Um diesen Schritt näher zu erklä-ren, sei X eine dreidimensionale Matrix mit den Elementen xi jk, wobei i = 1, . . . , I, j = 1, . . . ,Jund k = 1, . . . ,K. Der Eintrag xi jk bezeichnet quantitativ die Reaktion der i-ten Person auf dieVariable j in der Situation k. Die Dimensionen werden durch die Personen, Variablen und Si-tuationen definiert. Bei der Tucker-Analyse wird angenommen, dass die Werte xi jk auf einemIntervall gemessen werden. Das Intervall enthält einen neutralen Punkt, der eliminiert werdenmuss (vgl. Kiers und Van Mechelen, 2001). Abhängig davon, in welcher Dimension die neutra-len Punkte konstant bleiben, werden die Einträge xi jk über die Werte der Dimension gemitteltund von allen Elementen subtrahiert. Auf diese Weise werden die über die Personen zentrierten

42

Page 51: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

Werte gegeben als

xZi jk = xi jk−

1I

I

∑i=1

xi jk.

Aufgrund der speziellen Struktur des Datensatzes werden die Daten in jedem Modell derartzentriert, dass die abgeschätzten Werte ln mxvt möglichst nahe an den bekannten logarithmiertenSterberaten lnmxvt liegen.

Grund für die Skalierung ist, die Differenzen in der Bandbreite der Werte in jeder Klasse inner-halb einer Dimension zu entfernen und somit die verschiedenen Klassen gleichzustellen. DieseSituation kann vorkommen, wenn bei den Personen die Reaktion auf Variablen gemessen wird,bei denen die Werte signifikante unterschiedliche Extreme erreichen, z. B. Blutdruck oder Ni-veau eines Stoffs im Blut. Dann ist es wichtig, die Werte in jeder Variable entsprechend zunormieren. Im verwendeten Datensatz sind die Klassen der einzelnen Dimensionen homogenund es kommt zu keinen starken Differenzen der Bandbreite von den logarithmierten Sterbera-ten. Deshalb können wir in unserem Fall auf die Skalierung verzichten.

• Scree-Test

Mithilfe von dem Scree-Test soll die benötigte Anzahl der Hauptkomponenten P, Q und R fürjede Dimension ausgewählt werden. Dem Kiers und Van Mechelen (2001) nach, basiert dasVerfahren darauf, eine Balance zwischen möglichst guter Anpassungsfähigkeit des Modells undstarker Aussagekraft der benutzten Hauptkomponenten zu finden. Zuerst wird in jeder Dimensi-on die maximale Anzahl der im Scree-Test verwendeten Hauptkomponenten angegeben. Dannwerden für alle Kombinationen der Komponenten P+Q+R bis zu der maximalen Anzahl diezugehörigen Anpassungen in Prozenten berechnet. Weiter werden diejenige Kombinationen ge-sucht, bei denen die zuletzt eingesetzte Hauptkomponente zu einer größeren Anpassungserhö-hung des Modells führt, als die nachfolgende Kombination mit einer Komponente mehr. ZumSchluss wird eine Komponentenkombination gewählt, bei der das resultierende Modell mit sowenig Komponenten wie möglich die Daten gut beschreibt.

43

Page 52: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

• Auswertung vom Tucker

In diesem Schritt werden die Komponentenmatrizen A, B, C zusammen mit der dreidimensio-nalen Kernmatrix G berechnet. Die Kalkulation erfolgt im Sinne der Methode der kleinstenQuadrate, wobei die Fehlerquadratsumme

xm

∑x=x1

vk

∑v=v1

tn

∑t=t1

(lnmxvt−

P

∑p=1

Q

∑q=1

R

∑r=1

axp bvq ctr gpqr

)2

minimiert wird. Die Lösung aus der Tucker-Analyse ist nicht eindeutig.

• Stabilität der Lösung

Für die Überprüfung der Stabilität der Komponentenmatrizen A, B und C werden die Daten meis-tens in der ersten Dimension zufällig auf zwei gleich große Stichproben aufgeteilt. Mit diesenStichproben wird die Tucker-Analyse ausgewertet. Die so entstandenen KomponentenmatrizenB und C sollten bei den kleineren Stichproben das gleiche Verhalten wie bei der Gesamtstichpro-be ausweisen. Um die Komponentenmatrizen der beiden Stichproben auf Gleichheit zu testen,werden nach Tucker (1951) die Kongruenzkoeffizienten betrachtet. Sind die Werte der Kon-gruenzkoeffizienten größer als 0.85, zeigt dies Stabilität. Kongruenzkoeffizienten im Intervall(0.70,0.85) symbolisieren eine durchschnittlich stabile Lösung und die Werte unter 0.70 eineunstabile Lösung. Analog kann auch die Stabilität der dreidimensionalen Kernmatrix G unter-sucht werden. Dabei wird die Komponentenmatrix A entsprechend der Unterstichproben aufdie Komponentenmatrizen A(1) und A(2) zerlegt. Danach werden aus den KomponentenmatrizenA(1), B, C und A(2), B, C zwei Kernmatrizen G(1) und G(2) berechnet und ihre Einträge vergli-chen. Wenn die Differenzen im Betrag gering sind, so ist die Kernmatrix G stabil.

• Anpassungsgüte und Analyse der Residuen

Um festzustellen, inwiefern das Modell die Daten beschreibt, wird der DeterminationskoeffizientR2 in der Form

R2 = 1−∑

xmx=x1 ∑

vkv=v1 ∑

tnt=t1 (ln mxvt− lnmxvt)

2

∑xmx=x1 ∑

vkv=v1 ∑

tnt=t1 (lnmxvt−m)2 (5.5)

bestimmt. Dabei ist

m =1

mnk

xm

∑x=x1

vk

∑v=v1

tn

∑t=t1

lnmxvt

44

Page 53: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

der Gesamtmittelwert über alle Dimensionen, ln mxvt und lnmxvt stellen die geschätzten unddie realen logarithmierten Sterberaten dar. In der Residuenanalyse werden die standardisiertenPearson-Residuen rxvt betrachtet, die nach Steuten (2012) mit

rxvt =Dxvt− Dxvt√

Dxvt(5.6)

gegeben sind. Dabei bezeichnen Dxvt und Dxvt die betrachtete und die geschätzte Totenanzahl.Die geschätzte Totenanzahl Dxvt ergibt sich aus dem Produkt vom realen Exposure-to-RiskET Rxvt und den geschätzten Sterberaten mxvt = exp(ln mxvt). Die grafische Darstellung der Re-siduen erfolgt im Zusammenhang mit der Ausgabe der Matlab Prozedur, sodass wir anstatt einerdreidimensionalen Residuenmatrix mit Dimensionen m× k× n eine zweidimensionale MatrixR ∈ Rm×(k×n) betrachten.

5.1.1. Modell mit dem additiven Parameter αxv

In dem Modell

lnmxvt = αxv +βxγvκt + εxvt

wird der Parameter αxv mittels der Methode der kleinsten Quadrate geschätzt, indem die Fehler-quadratsumme

OLS(α,β ,γ,κ) =xm

∑x=x1

vk

∑v=v1

tn

∑t=t1

(ln mxvt−αxv−βxγvκt)2

minimiert wird. Dafür berechnen wir die partielle Ableitung δ

δαxvOLS(α,β ,γ,κ) = 0

tn

∑t=t1

ln mxvt = nαxv +βxγv

tn

∑t=t1

κt

und unter der Bedingung ∑tnt=t1 κt = 0 erhalten wir die Abschätzung:

αxv =1n

tn

∑t=t1

ln mxvt

45

Page 54: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

Die 3D-ANOVA der Differenz lnmxvt − αxv weist einen starken Gesamteffekt mit 60 % der er-klärten Varianz auf. Vor der Tucker-Analyse werden die Daten über die Kalenderjahre zentriert.Aufgrund des Scree-Testes werden drei Hauptkomponenten für das Alter, vier Komponenten fürdie Verweildauer und drei Komponenten für die Kalenderjahre ausgewählt. Außerdem ist g122

der größte Eintrag der Kernmatrix G. Die Lösung ist aber unstabil, was mehrere Kongruenzko-effizienten kleiner als 0.70 der Komponentenmatrizen der Verweildauer und des Kalenderjahresbestätigen. Die daraus resultierende Folge ist die Existenz der möglichen Schwankungen inner-halb des Dreierproduktes βxγvκt . Nach der Tucker-Analyse werden die Schätzer βx, γv und κt

mit (5.2) berechnet.

Weil die Parameter βx, γv und κt an die Grenzbedingungen (3.6) angepasst werden müssen,berechnen wir die skalierten Parameter αxv, βx, γv und κt als

αxv = αxv + βxγvκ

βx =βx

−∑xmx=x1

βx

γv =γv

−∑vkv=v1 γv

κt = (κt−κ)

(−

xm

∑x=x1

βx

)(−

vk

∑v=v1

γv

)

mit κ als Mittel des geschätzten Zeitindex gegeben durch:

κ =1n

tn

∑t=t1

κt

Den Verlauf der skalierten Parameter in diesem Modell können wir in den Abbildungen 5.1und 5.2 sehen. Der Parameter αxv bildet die Alterseffekte in verschiedenen Verweildauerklassenab, die in unseren Daten anwesend sind. Der Zeitparameter κt schildert korrekt die Senkungder logarithmierten Sterberate in der Zeit. Die Interaktionsparameter βx und γv zeigen großeSchwankungen und darum ist ihre Aussagekraft relativ gering, was auch die Unstabilität derLösung andeutet. Trotzdem ist die Anpassungsgüte des Modells nach (5.5) relativ hoch mit71 % erklärter Varianz und musterfreien Residuen, wie es in Abbildung 5.3 zu sehen ist.

46

Page 55: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

40 42 44 46 48 50 52 54 56 58 60-5

-4.5

-4

-3.5

-3

-2.5

-2

-1.5

Alter x

Alph

a x

v=0v=1v=2v=3v=4v=5v=6

Abbildung 5.1.: Verlauf des Parameters αxv anhand des Datensatzes FDZ-RV (2011).

40 45 50 55 60-0.16

-0.14

-0.12

-0.1

-0.08

-0.06

-0.04

-0.02

0

0.02

Alter x

Beta

x

0 2 4 6-0.24

-0.22

-0.2

-0.18

-0.16

-0.14

-0.12

-0.1

-0.08

Verweildauer v

Gam

ma

v

1990 1995 2000 2005 2010-30

-20

-10

0

10

20

30

40

Jahr t

Kapp

a t

Abbildung 5.2.: Verlauf der Parameter βx, γv und κt anhand des Datensatzes FDZ-RV (2011).

47

Page 56: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

Abbildung 5.3.: Pearson-Residuen im Modell mit dem additiven Parameter αxv anhand der Da-ten FDZ-RV (2011).

5.1.2. Modell mit dem additiven Parameter αv

Beim Modell

lnmxvt = αv + γvδxt + εxvt

mit dem zusammengesetzten Parameter δxt = βxκTt erfolgt die Schätzung des Verweildauerpa-

rameters αv analog zum Verfahren des Modells mit dem additiven Parameter αxv. Während derBerechnung der partiellen Ableitung δ

δαvOLS(α,β ,γ,κ) = 0 erhalten wir

xm

∑x=x1

tn

∑t=t1

ln mxvt = mnαv + γv

xm

∑x=x1

tn

∑t=t1

δxt .

Das können wir in die Form

αv =1

mn

xm

∑x=x1

tn

∑t=t1

ln mxvt−γv

mn

xm

∑x=x1

tn

∑t=t1

δxt (5.7)

48

Page 57: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

umwandeln und unter der Grenzbedingung ∑xmx=x1 ∑

tnt=t1 δxt = 0 folgende Abschätzung behal-

ten:

αv =1

mn

xm

∑x=x1

tn

∑t=t1

ln mxvt

Der Grund, warum in diesem Modell mit einer Matrix δxt anstatt der einzelnen Parameter βx undκt gearbeitet wird, liegt in der Schätzungsweise des Parameters αv. In (5.7) sehen wir, dass einemögliche Transformation αv nur durch Zuaddieren eines k-dimensionalen skalierten Vektorsγv bzw. Konstante entstehen kann. Mit anderen Worten kann αv nur von der Verweildauer vabhängen.

Anhand folgenden Beispiels wird diese Problematik näher erläutert. Sei das verwendete Modellin der Form lnmxvt = αv +βxγvκt + εxvt . Dabei sind die transformierten Parameter durch

αv = αv + c, βx = βx, γv = γv und κt = κt− c

gegeben, wobei c ∈ R. Wegen der Eindeutigkeit wird gefordert, dass

αv +βxγvκt = αv +βxγvκt .

Das lässt sich umschreiben als

αv− αv = cβxγv.

Offensichtlich gilt dies nicht, weil auf der rechten Seite eine Matrix und auf der linken Seite einVektor vorkommt. Aus diesem Grund werden die Parameter in eine Matrix δxt zusammengefasst,für die nur eine Grenzbedingung gesetzt wird.

Nach 3D-ANOVA werden durch den Gesamteffekt 47 % der Varianz aus den Daten lnmxvt− αv

erklärt. Die Tucker-Analyse von den über die Verweildauer zentrierten Daten entdeckt in allenDimensionen drei relevante Komponenten. Mittels der Kernmatrix G wird die stärkste Kompo-nentenkombination durch den Eintrag g223 gegeben. Die Stabilität der Lösung ist niedrig, wasdie Kongruenzkoeffizienten der Komponentenmatrizen für die Verweildauer und das Kalender-jahr mit einem Wert geriner als 0.80 bestätigen.

Die geschätzten Parameter αv, γv und δxt werden wegen den Grenzbedingungen (3.7) folgender-weise reskaliert:

αv = αv + γvδxt

49

Page 58: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

0 1 2 3 4 5 6-4

-3.5

-3

-2.5

Verweildauer v

Alph

a v

0 1 2 3 4 5 6-2

-1.5

-1

-0.5

0

0.5

1

1.5

2x 10

15

Verweildauer v

Gam

ma

v

Abbildung 5.4.: Verlauf der Parameter αv und γv im Modell mit dem additiven Parameter αv inAnlehnung an den Datensatz FDZ-RV (2011).

γv =γv

−∑vkv=v1 γv

δxt =(

δxt−δx,t

)(−

vk

∑v=v1

γv

)

Davon sind δxt = βxκTt und δxt =

1mn ∑

xmx=x1 ∑

tnt=t1 βxκt .

In Abbildung 5.4 werden die Verweildauereffekte in den Daten gezeigt. Das Verweildauermus-ter der logarithmierten Sterberate wird durch den Parameter αv und die Verweildaueränderungenbei variierendem Alter und Kalenderjahr durch γv angegeben. Den Zeitverlauf der logarithmier-ten Sterberate in allen Altersklassen sehen wir in Abbildung 5.5, wobei die Senkung der loga-rithmierten Sterberate bei höherem Alter schwächer wird. Die Anpassungsgüte des Modells ist55 %. Die Residuen in Abbildung 5.6 enthalten ein schwaches Muster, welches mit blauer Far-be eingezeichnet ist. Aufgrund dessen wird die Totenanzahl Dxvt bei jüngeren EM-Rentnern inletzten Kalenderjahren im Vergleich zur Realität überschätzt. Das zeigt eine reale Verbesserungder Sterberate bei jüngeren EM-Rentner, die in diesem Modell verzerrt wird.

50

Page 59: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

1994 1996 1998 2000 2002 2004 2006 2008 2010-6

-4

-2

0

2

4

6x 10

-16

Jahr t

Kapp

a t

x=40x=41x=42x=43x=44x=45x=46x=47x=48x=49x=50x=51x=52x=53x=54x=55x=56x=57x=58x=59

Abbildung 5.5.: Verlauf des Parameters δxt im Modell mit dem additiven Parameter αv in An-lehnung an den Datensatz FDZ-RV (2011).

Abbildung 5.6.: Pearson-Residuen im Modell mit dem additiven Parameter αv in Anlehnung anden Datensatz FDZ-RV (2011).

51

Page 60: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

5.1.3. Modell mit dem additiven Parameter αx

Das Modell hat die Form

lnmxvt = αx +βxδvt + εxvt

mit dem zusammengesetzten Interaktionsparameter δvt . Der Schätzer für den Altersparameterαx wird analog zu den vorhergehenden Modellen anhand der Methode der kleinsten Quadrateermittelt. Nach dem Ableiten der Fehlerquadratsumme berechnen wir

vk

∑v=v1

tn

∑t=t1

ln mxvt = knαx +βx

vk

∑v=v1

tn

∑t=t1

δvt .

Dadurch erhalten wir

αx =1kn

xm

∑x=x1

tn

∑t=t1

ln mxvt−βx

kn

vk

∑v=v1

tn

∑t=t1

δvt (5.8)

und nach Einsetzen der Bedingung ∑vkv=v1 ∑

tnt=t1 δvt = 0 ergibt sich für αx die Schätzung

αx =1kn

vk

∑v=v1

tn

∑t=t1

ln mxvt .

Der Altersparameter αx in (5.8) kann nur durch einen gleichdimensionalen Vektor bzw. durcheine Konstante transformiert werden. Wegen der Eindeutigkeit folgt analog zum Modell mit demadditiven Parameter αv, dass die einzelnen Parameter γv und κt in einer Matrix δvt abgebildetsein müssen.

Das Ergebnis aus der 3D-ANOVA deutet auf einen schwachen Gesamteffekt mit 25 % der Va-rianz hin. Die Tucker-Analyse wird auf die über die Dimension Verweildauer zentrierten Datenangewendet. Die benötigte Hauptkomponentenanzahl ist mittels des Scree-Testes auf drei für dasAlter, zwei für die Verweildauer und drei für die Kalenderjahre bestimmt. Davon wird die wich-tigste Kombination durch den Eintrag g212 bestimmt. Ähnlich wie in den vorherigen Modellenist die Stabilität der Lösung niedrig.

Die Anpassung der abgeschätzten Parameter auf die Grenzbedingungen (3.8) erfolgt folgender-maßen:

αx = αx + βxδvt

52

Page 61: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

40 45 50 55 60-4

-3.9

-3.8

-3.7

-3.6

-3.5

-3.4

-3.3

-3.2

Alter x

Alph

a x

40 45 50 55 60-0.075

-0.07

-0.065

-0.06

-0.055

-0.05

-0.045

-0.04

-0.035

-0.03

Alter x

Beta

x

Abbildung 5.7.: Verlauf der Parameter αx und βx im Modell mit dem additiven Parameter αxanhand des Datensatzes FDZ-RV (2011).

βx =βx

−∑xmx=x1

βx

δvt =(

δvt−δvt

)(−

xm

∑x=x1

βx

)

Dabei sind δvt und δvt gegeben als:

δvt = γvκt und δvt =1nk

vk

∑v=v1

tn

∑t=t1

γvκt

In Abbildung 5.7 betrachten wir die Alterseffekte in diesem Modell. Der Parameter αx beschreibtden Verlauf der logarithmierten Sterberate abhängig vom Alter, den wir in den Daten sehen kön-nen. Das Verhalten des Interaktionsparameters βx ist durch die Effekte der Verweildauer undder Kalenderzeit gegeben. Anhand Abbildung 5.8 werden die Zeitindizes bei unterschiedlicherVerweildauer dargestellt. Sie weisen keine Senkung auf, was gemäß des Datensatzes erwartetwird. Das Sterberatenniveau in höheren Verweildauersklassen ist dabei steigend, was die Inter-pretation erschwert. Die Anpassungsgüte des Modells liegt bei 62 % erklärter Varianz. Wie esin Abbildung 5.9 zu sehen ist, enthalten die Residuen kein signifikantes Muster.

53

Page 62: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

1994 1996 1998 2000 2002 2004 2006 2008 2010-20

-15

-10

-5

0

5

10

15

Jahr t

Kapp

a t

v=0v=1v=2v=3v=4v=5v=6

Abbildung 5.8.: Verlauf des Parameters δvt im Modell mit dem additiven Parameter αx in An-lehnung an den Datensatz FDZ-RV (2011).

Abbildung 5.9.: Pearson-Residuen im Modell mit dem additiven Parameter αx in Anlehnung anden Datensatz FDZ-RV (2011).

54

Page 63: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

5.1.4. Modell ohne additiven Parameter

Weil das Modell

lnmxvt = βxγvκt + εxvt

keinen additiven Parameter beinhaltet, wird auf die dreidimensionale Matrix von logarithmiertenSterberaten lnmxvt direkt die Tucker-Methode angewendet. Die 3D-ANOVA der Daten wurdebereits in Absatz 5.1 durchgeführt und die Existenz eines Gesamteffektes und somit die Not-wendigkeit der dreidimensionalen Analyse wurde bestätigt. Die Daten werden diesmal nichtzentriert. Für die relevante Anzahl der Komponenten nehmen wir aufgrund des Scree-Testes füralle Dimensionen zwei. Mit dem Wert g111 aus der Kernmatrix erhalten wir eine stabile Lö-sung mit Kongruenzkoeffizienten größer als 0.80 in allen Komponentenmatrizen. Die geschätz-ten Effekte aus der dreidimensionalen Singulärwertzerlegung sollten dementsprechend wenigSchwankung enthalten.

Nach der wegen den Grenzbedingungen (3.9) notwendigen Reskalierung der Parameter mit

βx =βx

−∑xmx=x1

βx(5.9)

γv =γv

−∑vkv=v1 γv

(5.10)

κt = κt

(−

xm

∑x=x1

βx

)(−

vk

∑v=v1

γv

)(5.11)

erhalten wir die Parameter βx, γv und κt , die in Abbildung 5.10 dargestellt werden. Es ist ersicht-lich, dass die Daten in Alters-, Verweildauer- und Zeiteffekte zerlegt werden, die unseren Datenentsprechen. Der Determinationskoeffizient R2 beträgt 64 % der Varianz. In Abbildung 5.11 istbei den abgebildeten Residuen ein Muster zu sehen. Bei den EM-Rentnern mit Verweildauer(1,4] Jahre im Alter von 57 bis 59 Jahren gibt es in den Kalenderjahren 1994 – 1999 eine höheregeschätzte Totenanzahl, was zu negativen Werten der Residuen führt. Dieser Effekt klingt mitder Zeit ab.

55

Page 64: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

40 45 50 55 60-0.058

-0.056

-0.054

-0.052

-0.05

-0.048

-0.046

-0.044

Alter x

Beta

x

0 2 4 6-0.17

-0.16

-0.15

-0.14

-0.13

-0.12

-0.11

-0.1

Verweildauer v

Gam

ma

v

1990 1995 2000 2005 2010-510

-500

-490

-480

-470

-460

-450

-440

-430

Jahr t

Kapp

a t

Abbildung 5.10.: Verlauf der Parameter βx, γv und κt im Modell ohne additiven Parameter nachder Tucker-Analyse in Anlehnung an die Daten FDZ-RV (2011).

Abbildung 5.11.: Pearson-Residuen im Modell ohne additiven Parameter nach der Tucker-Analyse in Anlehnung an die Daten FDZ-RV (2011).

56

Page 65: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

5.2. Schätzen mit der Zerlegung des Logarithmus

Um die Ergebnisse aus der Tucker-Analyse mit einer anderen Schätzungsmethode zu verglei-chen, haben wir uns entschieden Modell (3.5) noch einmal zu schätzen. Dabei werden beideSeiten des Modells logarithmiert. Weil die Werte der Sterberate im Intervall (0,1) liegen, nimmtdie logarithmierte Sterberate lnmxvt die Werte in dem Bereich (−∞,0) an. Deswegen werden dieWerte − lnmxvt logarithmiert und wir erhalten

ln(− lnmxvt) = ln(−βxγvκt)+ εxvt .

Für eine bessere Interpretation werden die negativen Vorzeichen auch zu den Parametern κt undγv hinzugefügt. Nach der Anwendung der Eigenschaften des Logarithmus ergibt sich

ln(− lnmxvt) = ln(−βx)+ ln(−γv)+ ln(−κt)+ εxvt .

Die Schätzer βx, γv und κt werden durch die Minimierung der Fehlerquadratfunktion

xm

∑x=x1

vk

∑v=v1

tn

∑t=t1

[ln(− lnmxvt)− ln(−βx)− ln(−γv)− ln(−κt)]2

unter der Bedingungen ∑xmx=x1

ln(−βx) = 0 und ∑vkv=v1 ln(−γv) = 0 berechnet. Die Schätzung

erfolgt iterativ mittels der Matlab Funktion fmincon und die geschätzten Parameter βx, γv undκt werden mithilfe von (5.9) – (5.11) entsprechend den Grenzbedingungen (3.9) reskaliert. Diereskalierten Parameter βx, γv und κt zeigen in Abbildung 5.12 identische Effekte wie bei derSchätzung mit der Tucker-Analyse. Die Lösung weist nur geringe Sensitivität bei unterschiedli-chen Anfangswerten auf, was die Stabilität der Lösung zeigt. Die Anpassungsgüte des Modellsist durch R2 mit 64 % der erklärten Varianz gegeben. In diesem Modell besitzen die Residuenanhand Abbildung 5.13 analoge Eigenschaften wie nach der Tucker-Analyse.

5.3. Vergleich der Modellansätze

Der Vergleich der geschätzten Modellansätzen wird nach den folgenden Kriterien durchge-führt:

• Interpretierbarkeit der Parameter

• Stabilität der Lösung

57

Page 66: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

40 45 50 55 60-0.058

-0.056

-0.054

-0.052

-0.05

-0.048

-0.046

-0.044

Alter x

Beta

x

0 2 4 6-0.17

-0.16

-0.15

-0.14

-0.13

-0.12

-0.11

-0.1

Verweildauer v

Gam

ma

v

1990 1995 2000 2005 2010-510

-500

-490

-480

-470

-460

-450

-440

-430

Kalenderjahr t

Kapp

a t

Abbildung 5.12.: Verlauf der Parameter βx, γv und κt im Modell ohne additiven Parameternach der Zerlegung des Logarithmus in Anlehnung an den Datensatz FDZ-RV(2011).

Abbildung 5.13.: Pearson-Residuen im Modell ohne additiven Parameter nach der Zerlegungdes Logarithmus in Anlehnung an den Datensatz FDZ-RV (2011).

58

Page 67: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

• Anpassungsgüte des Modells

• Residuen

• Einfachheit und Grenzbedingungen des Modells

Was die Interpretierbarkeit der Parameter angeht, liefert Modell (3.5) die aussagekräftigstenErgebnisse. Jeder Parameter charakterisiert somit einen Effekt, der auf die logarithmierte Ster-berate eine Wirkung hat. Obwohl die additiven Parameter αx, αv und αxv in den Modellen (3.2),(3.3) und (3.4) eine klare Darstellung des Alters- und Verweildauereffektes ermöglichen, lassensich die Interaktionsparameter nur schwer interpretieren. Das ist insbesondere der Fall bei denModellen (3.2) und (3.4). In Modell (3.2) weisen die Parameter βx und γv starke Schwankungenauf, was dadurch gegeben sein kann, dass die Alters- und Verweildauereffekte mit dem Para-meter αxv eliminiert werden. Die Schwierigkeiten mit der Interpretierbarkeit des Modells (3.4)liegen darin, dass der Interaktionsparameter δvt ein ungewöhnliches Muster besitzt. Demnachergibt sich in höheren Verweildauerklassen größere Sterberate, was im Widerspruch zu unserenDaten steht.

Die schlechte Interpretierbarkeit der Parameter in den Modellen (3.2) und (3.3) kann durch dieUnstabilität der Lösung der Tucker-Analyse verursacht werden. Das heißt, die additiven Parame-ter αxv und αv enthalten die Mehrheit der Information, sodass in den Interaktionsparametern nurzufällige Schwankungen verbleiben. Im Vergleich dazu zeigt sich Modell (3.5) stabil, sowohlnach der Anwendung der Tucker-Analyse, als auch mittels der iterativen Schätzung.

Trotz der Unstabilität ist die Anpassungsgüte von allen Modellen größer als 50 % der Varianz.Davon erklärt Modell (3.2) den größten Teil der Daten mit R2 = 71%. Modell (3.5) ohne ad-ditiven Parameter hat eine Aussagekraft von 64 % der Varianz in den Daten. Danach sinkt dieAnpassungsgüte R2 = 62% in Modell (3.3). Die Werte der Sterberate werden am wenigsten inModell (3.4) angepasst, bei dem der Determinationskoeffizient R2 = 55% beträgt.

Bei den Modellen (3.2) und (3.4) sind die Residuen musterfrei. Dagegen besitzen die Residuendes Modells (3.3) von 40- bis 50-jährigen EM-Rentner in den Jahren 2003 – 2009 stark negativeWerte. Letztendlich können wir in Modell (3.5) ein geringes Muster von negativen Residuenbetrachten, das die Verweildauerklassen 1 – 3 der Altersgruppen 57 – 59 in den Jahren 1994 –1999 betrifft.

Aufgrund unterschiedlicher Komplexität der Modelle wurden für ihre Eindeutigkeit in Kapi-tel 3 Grenzbedingungen eingeführt. Für Modell (3.2) mit der größten Komplexität werden dreiGrenzbedingungen benötigt. Modelle (3.3) und (3.4) besitzen wegen ihrer speziellen Struktur

59

Page 68: Modellierung von Sterbewahrscheinlichkeiten mit

5. Kalibrierung und Diskussion des erweiterten Lee-Carter Modells

zwei Grenzbedingungen. Zu den Modellen mit einer niedrigen Komplexität gehört Modell (3.5),für dessen Eindeutigkeit auch nur zwei Grenzbedingungen verwendet werden.

Nach der Zusammenfassung der Eigenschaften ist unser Ziel ein passendes Modell zu wählen,für das im nächsten Kapitel die Prognose berechnet wird. Gewünscht ist, ein Modell zu erstellen,in dem sich alle oben genannten Kriterien ausgleichen. Als ein einfach strukturiertes und stabilesModell mit guter Interpretierbarkeit und höher Aussagekraft wird Modell (3.5) ausgewählt.

60

Page 69: Modellierung von Sterbewahrscheinlichkeiten mit

6. Prognose des Modells

In Kapitel 5 wurden vier Modellansätze mit ihren Eigenschaften betrachtet. Die Qualität derModelle haben wir aufgrund mehrerer Kriterien beurteilt und als einen möglichen Modellansatzmit guter Interpretierbarkeit und Anpassungsgüte das Modell

lnmxvt = βxγvκt + εxvt

ausgewählt. Hier haben die Parameter βx, γv und κt die Bedeutung von Alters-, Verweildauer-und Kalenderzeiteffekten, durch die die Sterberate der EM-Rentner in Deutschland beeinflusstwird. Nach der Bestimmung der Schätzer der Einflussfaktoren mithilfe der Zerlegung des Loga-rithmus in Absatz 5.2 ist das Ziel, die zukünftige Sterberate auf Basis des entwickelten Modellszu ermitteln. Damit beschäftigen wir uns in diesem Kapitel.

6.1. Modellierung des Zeitindex κt

Analog zu Kapitel 2 soll der geschätzte Zeitindex κt mittels der Formel (2.23) als einARIMA(0,1,0)-Prozess modelliert werden. Hierfür sind der Koeffizient der Autoregression p,sowie der „Moving-Average“-Koeffizient q gleich 0. Der Koeffizient der Differenzierung d wirdauf 1 gesetzt. Um die Auswahl des ARIMA(0,1,0)-Prozesses praktisch zu begründen, wird zu-erst die Nichtstationarität der Zeitreihe untersucht. Anhand des fallenden Trends der Abbildung5.12 sieht man, dass der Zeitindex κt eine nicht stationäre Zeitreihe bildet, wie es Pitacco et al.(2009) andeutet. Der Augmented Dickey-Fuller Test auf den einmal differenzierten Werten vonκt besitzt einen p-Wert kleiner als 1 %. Darum ist das weitere Differenzieren zum Entscheidender Stationarität nicht nötig und somit ist d = 1. Die Unkorrelierheit der Residuen wird anhanddes Ljung-Box-Pierce Tests überprüft, wobei die Nullhypothese der Unkorrelierheit mit dem p-Wert von 0.02 bei einem Signifikanzniveau von 5 % abgelehnt wird. Im Gegensatz dazu wird dieAnnahme über die Normalverteilung der Residuen mit dem Jaque-Bera Test bestätigt, bei demdie Nullhypothese der Normalverteilung mit dem p-Wert von 0.26 bei einem Signifikanzniveauvon 5 % nicht verworfen wird. Aufgrund der korrekten Prognose des Zeitindex κt in Abbildung

61

Page 70: Modellierung von Sterbewahrscheinlichkeiten mit

6. Prognose des Modells

1990 1995 2000 2005 2010 2015 2020 2025 2030-650

-600

-550

-500

-450

-400

Kalenderjahr t

Kap

pa t

95% IntervallPrognose

Abbildung 6.1.: Prognose des Zeitindex κt für die Jahre 2010 – 2029 in Anlehnung an den Da-tensatz FDZ-RV (2011).

6.1 wird mit dem ARIMA(0,1,0)-Modell trotz der schwachen Korrelation der Residuen weitergearbeitet. Nach der Begründung des verwendeten stochastischen Prozesses werden die Wertevon κt anhand der Formel (2.24) prognostiziert.

Die geschätzten Werte des Zeitparameters κt zusammen mit der 95% Intervallprognose für dieJahre 2010 – 2029 werden in Abbildung 6.1 dargestellt. In den Jahren 1994 – 2009 treten beimSchätzer κt signifikante Schwankungen auf, die in der Prognose κt durch die Zeitreihenmodel-lierung eliminiert werden. Die Punktprognose des Zeitindex κt für die Jahre 2010 – 2029 zeigteine starke Senkung auf, was mit dem sinkenden Zeitmuster der logarithmierten Sterberate inder gesunden Population übereinstimmt (vgl. Biffis und Denuit, 2006). Trotzdem ist es wichtigzu betonen, dass die Vorhersage aufgrund einer relativ kurzen Zeitperiode von 16 Jahren berech-net wurde und dadurch mit möglicher Unzuverlässigkeit verbunden ist. Die Grenzen des 95%Prognoseintervalls werden mittels der Annahme über die Normalverteilung der Fehlerparameterξ in (2.23) bestimmt.

62

Page 71: Modellierung von Sterbewahrscheinlichkeiten mit

6. Prognose des Modells

6.2. Prognosebildung

Die Punktprognose der Sterberate mx,v, tn+s für den Zeithorizont s wird mittels der Punktprognosedes Zeitindex κtn+s als

mx,v, tn+s = exp(

βxγvκtn+s

), s ∈ N (6.1)

berechnet. Für die praktischen Zwecke ist es aber nötig eine Intervallprognose zu erstellen,mithilfe deren die Wahrscheinlichkeit künftiger Werte der logarithmierten Sterberate innerhalbbestimmten Grenzen beurteilt werden kann. Dafür wird die in Kapitel 2 erwähnte Boostrap-Methode angewendet, deren Einzelschritte hier ausführlicher erläutert werden. Weil keine An-nahmen über die Verteilung der logarithmierten Sterberaten getroffen werden, entscheiden wiruns für das Verfahren, bei dem die Bootstrap-Methode auf die Residuen eingesetzt wird (vgl.Pitacco et al., 2009). Die Voraussetzung dafür sind musterfreie Pearson-Residuen, die anhandder Formel (5.6) bestimmt werden. Wie es in Abbildung 5.13 zu sehen ist, enthalten die Residu-en aus Modell (3.5) keine starken Effekte und können darum für die Bootstrap-Methode benutztwerden. Die Bootstrap-Methode erfolgt analog zum Artikel von Koissi et al. (2006) in folgendenSchritten:

1. Nach der Berechnung der Residuenmatrix R mit Pearson-Residuen wird sie B-mal durchZiehen mit Zurücklegen repliziert. Dadurch erzielen wir eine Reihe von ResiduenmatrizenR(b) mit den Einträgen r(b)xvt . Dabei ist b = 1, . . . ,B.

2. Aus jeder replizierten Residuenmatrix R(b) wird die geschätzte Totenanzahl D(b)xvt mittels

der Inversionsformel berechnet. Die Herleitung der Inversionsformel erfolgt aus der Defi-nition der Pearson-Residuen

rxvt =Dxvt− Dxvt√

Dxvt

mit der betrachteten Totenanzahl Dxvt und geschätzten Totenanzahl Dxvt . Dies führt zu

Dxvt + rxvt

√Dxvt−Dxvt = 0.

Durch die Substitution X =√

Dxvt erhalten wir die quadratische Gleichung

X2 + rxvt X−Dxvt = 0,

63

Page 72: Modellierung von Sterbewahrscheinlichkeiten mit

6. Prognose des Modells

deren Lösung unter der Bedingung X > 0 mit

X1 =−rxvt

2+

√r2

xvt

4+Dxvt oder

X2 =−rxvt

2−√

r2xvt

4+Dxvt

gegeben ist.

3. Aufgrund der geschätzten Totenanzahl D(b)xvt und bekannten Exposure-to-Risk ET Rxvt wer-

den die Sterberaten m(b)xvt anhand von (2.14) kalkuliert. Danach wird auf die Logarithmen

der neu geschätzten Sterberaten ln m(b)xvt das Minimierungsverfahren mit der Zerlegung des

Logarithmus angewendet, um die Replizierungen der anwesenden Parameter β(b)x , γv

(b)

und κt(b) für b = 1, . . . ,B zu erzeugen.

4. Mithilfe des ARIMA(0,1,0)-Prozesses werden die replizierten Zeitindizes κ(b)t noch ein-

mal abgeschätzt und aus den künftigen Werten κ(b)t wird die Prognose der Sterberate er-

zeugt. Weil wir in dieser Arbeit stets mit logarithmierten Sterberaten lnmxvt arbeiten, wirddementsprechend die Prognose für die logarithmierten Sterberaten ermittelt. Von daherwird aus der Formel (6.1) die logarithmierte Sterberate lnmxvt abgeleitet.

5. Aufgrund dessen werden B Replizierungen der Punktprognosen für die logarithmierteSterberate ln mx,v, tn+s mit einem Prognosehorizont s erzeugt. Um die obere und untereGrenze des Prognoseintervalls zu bestimmen, werden die relevanten Werte der logarith-mierten Sterberate ln mx,v, tn+s aus jeder replizierten Matrix herausgenommen und aufstei-gend sortiert. Dadurch wird eine steigende Reihe der möglichen Prognosenwerte gebildet,aus der die benötigten Quantile als empirische Perzentile geschätzt werden. Somit folgt,dass die untere Grenze des (1−2α)% Prognoseintervalls als der (B×α)-te Wert und dieobere Grenze als der (B× (1−α))-te Wert in der sortierten Reihe bestimmt werden. DasSymbol α bedeutet in dieser Situation die Größe des maximalen Fehlers bei der Prognose.

Die Boostrap-Methode wird mithilfe der Software MATLAB durchgeführt. Dabei werden dieWerte 1000-mal repliziert, um möglichst zuverlässige Intervallgrenzen zu ermitteln. Anhandvon mehreren Berechnungen erstellen wir den künftigen Verlauf der logarithmierten Sterbera-te in den Jahren 2010 – 2029 für die Altersklassen 42, 48, 53 und 59 in Kombination mit derVerweildauer von 0, 3 und 5 Jahren. Der Grund für die Wahl dieser Klassen liegt in der Eliminie-rung von verzerrten Klassen, deren Aussagekraft dadurch schwächer ist. Darum werden bei derPrognose die Altersklassen 40 und 41 nicht berücksichtigt, weil einige Betrachtungen leer sind,siehe Kapitel 4. Die Verweildauerklasse 6 wird aufgrund ihres Charakters bei der Veranschau-lichung der Prognose auch ausgeschlossen. In folgenden Abbildungen wird die 95% Intervall-

64

Page 73: Modellierung von Sterbewahrscheinlichkeiten mit

6. Prognose des Modells

2010 2015 2020 2025 2030

-5.5

-5

-4.5

-4

-3.5

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e m

it de

r V

erw

eild

auer

0

95% IntervallPrognose

2010 2015 2020 2025 2030

-5.5

-5

-4.5

-4

-3.5

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e m

it de

r V

erw

eild

auer

3

95% IntervallPrognose

2010 2015 2020 2025 2030

-5.5

-5

-4.5

-4

-3.5

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e m

it de

r V

erw

eild

auer

5

95% IntervallPrognose

(a) Alter von 42 Jahren

2010 2015 2020 2025 2030

-5

-4.8

-4.6

-4.4

-4.2

-4

-3.8

-3.6

-3.4

-3.2

-3

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e m

it de

r V

erw

eild

auer

5

95% IntervallPrognose

2010 2015 2020 2025 2030

-5

-4.8

-4.6

-4.4

-4.2

-4

-3.8

-3.6

-3.4

-3.2

-3

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e m

it de

r V

erw

eild

auer

3

95% IntervallPrognose

2010 2015 2020 2025 2030

-5

-4.8

-4.6

-4.4

-4.2

-4

-3.8

-3.6

-3.4

-3.2

-3

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e m

it de

r V

erw

eild

auer

0

95% IntervallPrognose

(b) Alter von 59 Jahren

Abbildung 6.2.: 95% Intervallprognose der logarithmierten Sterberate der EM-Rentner bei un-terschiedliecher Verweildauer (0, 3 und 5 Jahre) in Anlehnung an die DatenFDZ-RV (2011).

65

Page 74: Modellierung von Sterbewahrscheinlichkeiten mit

6. Prognose des Modells

2010 2015 2020 2025 2030

-4

-3.8

-3.6

-3.4

-3.2

-3

-2.8

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e im

Alte

r 42

95% IntervallPrognose

2010 2015 2020 2025 2030

-4

-3.8

-3.6

-3.4

-3.2

-3

-2.8

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e im

Alte

r 48

95% IntervallPrognose

2010 2015 2020 2025 2030

-4

-3.8

-3.6

-3.4

-3.2

-3

-2.8

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e im

Alte

r 53

95% IntervallPrognose

2010 2015 2020 2025 2030

-4

-3.8

-3.6

-3.4

-3.2

-3

-2.8

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e im

Alte

r 59

95% IntervallPrognose

(a) Verweildauer von weniger als einem Jahr

2010 2015 2020 2025 2030

-5.4

-5.2

-5

-4.8

-4.6

-4.4

-4.2

-4

-3.8

-3.6

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e im

Alte

r 59

95% IntervallPrognose

2010 2015 2020 2025 2030

-5.4

-5.2

-5

-4.8

-4.6

-4.4

-4.2

-4

-3.8

-3.6

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e im

Alte

r 53

95% IntervallPrognose

2010 2015 2020 2025 2030

-5.4

-5.2

-5

-4.8

-4.6

-4.4

-4.2

-4

-3.8

-3.6

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e im

Alte

r 48

95% IntervallPrognose

2010 2015 2020 2025 2030

-5.4

-5.2

-5

-4.8

-4.6

-4.4

-4.2

-4

-3.8

-3.6

Kalenderjahr t

Die

loga

rithm

iert

e S

terb

erat

e im

Alte

r 42

95% IntervallPrognose

(b) Verweilduer von bis zu 6 Jahren

Abbildung 6.3.: 95% Intervallprognose der logarithmierten Sterberate der EM-Rentner mit stei-gendem Alter (42, 48, 53 und 59 Jahre) in Anlehnung an die Daten FDZ-RV(2011).

66

Page 75: Modellierung von Sterbewahrscheinlichkeiten mit

6. Prognose des Modells

prognose der logarithmierten Sterberate für die Jahre 2010 – 2029 dargestellt. Die abgebildetePunktprognose ist mittels der Formel (6.1) bestimmt.

In Abbildung 6.2a können wir die Prognose der logarithmierten Sterberate der EM-Rentnerim Alter 42 mit der Verweildauer von 0, 3 und 5 Jahren betrachten. Einer der Effekte in derZukunft ist die stark sinkende Tendenz vom Sterberatenniveau mit höher Verweildauer. Dagegensinkt das Niveau der Sterberate im Alter 59 langsamer, wie in Abbildung 6.2b zu sehen ist. Dasentspricht der Wirkung vom Alter auf die logarithmierte Sterberate. Der Verlauf in der Zeit beibeiden Altersklassen ist ähnlich, was wir durch die unveränderte Steigung sehen können.

Der zukünftige Verlauf der logarithmierten Sterberate in Verweildauerklasse 0 mit variirendemAlter wird in Abbildung 6.3a dargestellt. Es ist interessant zu sehen, wie der Altersverlauf derSterberate in der entsprechenden Verweildauerklasse auch auf die Prognose wirkt. Zuerst istein Zuwachs der logarithmierten Sterberate mit dem Alter erkennbar, was sich bei dem höchstenAlter verändert und die logarithmierte Sterberate dementsprechend sinkt. Andererseits kann manin Abbildung 6.3b einen ähnlichen Verlauf der Prognose mit Verweildauer 5 betrachten mit derAusnahme des Altersmusters, das deutlich schwächer ist.

Die Punktprognose liegt nicht immer in der Mitte des Prognoseintervalls, was dadurch gegebensein kann, dass die Residuen, mit denen wir arbeiten, doch nicht ganz musterfrei sind. Trotz-dem ist es wichtig zu bemerken, dass die Prognose nur die Effekte abbildet, die in den Datenanwesend sind. Wie es Pitacco et al. (2009) betont, können anhand der Prognose keine un-erwarteten Änderungen im Sterberatenniveau, wie plötzliche Verbesserungen in der Medizin,sozio-politische Einflüsse oder schlagartige Epidemien prognostiziert werden.

67

Page 76: Modellierung von Sterbewahrscheinlichkeiten mit

7. Zusammenfassung

In dieser Masterarbeit wurde die Sterberate der EM-Rentner in Deutschland anhand der Datender Deutschen Rentenversicherung näher untersucht. Unser Ziel war es, ein Modell zu entwi-ckeln, in dem die vorkommenden Effekte bedingt durch das Alter, Kalenderjahr und die Ver-weildauer der jeweiligen erwerbsminderungsfähigen Person erläutert werden. Für diesen Zweckwurde als Grundlage das Lee-Carter Modell gewählt, das bei der Modellierung der Mortalität inverschiedenen Ländern eine praktische Anwendung hat. In dem Modell wird die Sterberate mit-hilfe von alters- und zeitbedingten Parametern geschätzt. Bei der Erweiterung des Lee-CarterModells um den Parameter der Verweildauer wurde die dreidimensionale Singulärwertzerle-gung, auch als die Tucker-Methode genannt, benutzt. Dieses Verfahren wurde dann auf vier vor-geschlagene Modellansätze angewendet, um die relevanten Parameter zu ermitteln. Aufgrunddes Vergleichs von Eigenschaften jedes einzelnen Modellansatzes haben wir das Modell oh-ne additiven Parameter ausgewählt. Für diesen Modellansatz wurde anschließend mithilfe derZeitreihenanalyse und der Bootstrap-Methode die Prognose der Sterberate berechnet, um diekünftige Modellaussagekraft zu zeigen.

Die EM-Rentner stellen eine spezifische Menschengruppe dar, deren Anzahl im Vergleich zurgesunden Population in Deutschland relativ gering ist. Um möglichst eine konsistente Stichpro-be für die Modellierungszwecke zu erreichen, mussten unsere Daten altersabhängig begrenztwerden. Das hat den Stichprobenumfang noch weiter vermindert. Dadurch sind die Daten miteiner Schwankung verbunden, was einen negativen Einfluss auf die Intensität der untersuchtenEffekte hat. Dafür wäre es in folgenden Untersuchungen hilfreich, mit einem größeren Datensatzzu arbeiten, um das zufällige Rauschen eliminieren zu können.

Bei der Anwendung der Tucker-Methode sind einige Probleme aufgetaucht, die aufgrund ihrerUneindeutigkeit verursacht wurden. Die gelieferte Lösung wird einerseits durch die vom Scree-Test bestimmte Anzahl der Hauptkomponenten in jeder Dimension beeinflusst. Zusätzlich hatdie Wirkung die maximale Anzahl der Komponenten, die beim Scree-Test verwendet werdenkönnen. Das hat Einfluss auf die Struktur der dreidimensionalen Kernmatrix, die folglich eineganze andere Komponentenkombination als relevant ausgibt. Die Verläufe der einzelnen Para-meter werden somit verändert, was die resultierende Interpretierbarkeit erschweren kann. Weil

68

Page 77: Modellierung von Sterbewahrscheinlichkeiten mit

7. Zusammenfassung

die Ergebnisse dadurch mit einer Unsicherheit verknüpft sind, ist es empfohlen sie mit eineranderen Methode zu überprüfen, wie es z. B. für das Modell ohne additiven Parameter gemachtwurde.

Ein weiteres Thema, mit dem man sich in der Zukunft beschäftigen kann, ist die Güte der Pro-gnose der Sterberate und die Kriterien für ihre Bestimmung. Das wurde in dieser Abschlussarbeitnicht ausführlich diskutiert, weil es sich um eine Erweiterung der ursprünglichen Problematikhandelt. Im Zusammenhang damit steht eng die Modellierung des zeitabhängigen Parametersκt . Wegen der schwachen Korrelierheit der Residuen ARIMA(0,1,0)-Modell wäre eine Opti-on einen anderen stochastischen Prozess anzuwenden, z. B. mit einem zusätzlichen Parameterder Autoregression wie ARIMA(1,1,0). Letztendlich ist es wichtig zu unterstreichen, dass diePrognose anhand einer relativ kurzen Zeitperiode erstellt wurde. Die Untersuchungen auf derBasis von längeren Zeitreihen könnten für die Erläuterung der Sterberaten bei den EM-Rentnernnützlich sein.

69

Page 78: Modellierung von Sterbewahrscheinlichkeiten mit

A. Quelltexte

Im Anhang werden die wichtigsten Quelltexte hinzugefügt, die in der Software MATLAB pro-grammiert wurden. Aufgrund der Arbeit mit den dreidimensionalen Matrizen, die für die prak-tischen Zwecke oft in zweidimensionale Matrizen umgewandelt werden mussten, wurden dieFunktionen ThreeToTwo.m und TwoToThree.m erstellt.

In der Funktion ThreeToTwo.m wird eine Matrix mit den Dimensionen 20×7×16 in eine Matrixmit Dimensionen 20× (7×16) umgeschrieben.

1 %% UMWANDLUNG EINER 3D−MATRIX IN EINE 2D−MATRIX2

3

4 % Eingabe: X ... eine 20x7x16 Matrix

5 % Ausgabe: Y ... eine 20x112 Matrix

6

7 function Y = ThreeToTwo(X)

8

9 Y =[];

10 for a = 1:20

11 row =[];

12 for j =1:16

13 %%

14 % In jedem Schritt werden in der ersten Dimension der Matrix X

15 % (Alter a) die Verweildauerklassen 0−6 mit den Kalenderjahren j

16 % kombiniert. Die Spalten der Matrix Y sind definiert als

17 % Verweildauer 0 im Jahr 1994, Verweildauer 1 im Jahr 1994, ...,

18 % Verweildauer 6 im Jahr 2009.

19 row = [ row X(a,:,j)];

20 end

21 Y = [Y ;row];

22 end

23

24 end

70

Page 79: Modellierung von Sterbewahrscheinlichkeiten mit

A. Quelltexte

Eine inverse Operation wird mit der Funktion TwoToThree.m durchgeführt, in der eine 20×112Matrix in eine Matrix mit Dimensionen 20×7×16 umgeschrieben wird.

1 %% UMWANDLUNG EINER 2D−MATRIX IN EINE 3D−MATRIX2

3

4 % Eingabe: Y ... eine 20x112 Matrix

5 % Ausgabe: X ... eine 20x7x16 Matrix

6

7 function X = TwoToThree(Y)

8

9 plane = repmat(0, [20 7 16]);

10 i=1;

11 for s = 1:7:112;

12 %%

13 % In jedem Schritt werden in jeder Zeile der Matrix Y (Altersklassen)

14 % die Werte auf die Verweildauerklassen 0−6 in Kalenderjahren i

15 % geteilt. Aus den Kalenderjahren i wird die dritte Dimension

16 % der Matrix X gebildet.

17 plane(1:20,1:7,i) = Y(:,s:s+6);

18 i = i+1;

19 end;

20 X = plane;

21

22 end

Beim Schätzen von Modell (3.5) wurde in Kapitel 5 die Fehlerquadratsumme mittels der MAT-LAB Funktion fmincon minimiert. Dabei haben wir die Fehlerqudratsumme anhand der Funkti-on myfun.m angegeben.

1 %% BERECHNUNG DER FEHLERQUADRATSUMME

2

3

4 % Eingabe: x ... (20+7+16) x 1 Vektor der Werte für Parameter des Alters,

5 % der Verweildauer und der Kalenderzeit

6 % m ... (20x7x16)−dimensionale Matrix von ln(− ln m_{xvt})

7 % Ausgabe: f ... Fehlerquadratsumme

8

9 function f = myfun(x,m)

10

11 d1 = 20; % Altersklassen

12 d2 = 7; % Verweildauerklassen

71

Page 80: Modellierung von Sterbewahrscheinlichkeiten mit

A. Quelltexte

13 d3 = 16; % Kalenderjahren

14

15 a = x(1:d1)';

16 b = x(d1+1:d1+d2)';

17 c = x(d1+d2+1:d1+d2+d3)';

18 % Aufteilung der Eingabevariable x auf den Altersvektor a, Verweildauer−19 % vektor b und Kalenderzeitvektor c

20

21 sum = 0;

22 for i = 1:d1

23 for j = 1:d2

24 for k = 1:d3

25 %%

26 % In jedem Schritt wird das Fehlerquadrat mit zugehörigen

27 % Indizes berechnet und zuaddiert, sodass die Fehler−28 % quadratsumme entsteht.

29 sum = sum + (m(i,j,k) − a(i) − b(j) − c(k))^2;

30 end

31 end

32 end

33

34 f = sum;

35

36 end

Die Quelltexte zum Schätzen der Parameter in Modell (3.5) zusammen mit der Modellierungder Zeitreihe κt sind Teile der MATLAB Prozedur Bootstrap.m. Deswegen werden sie hier nichtexplizit gezeigt. Die Prozedur Bootstrap.m dient zum Erstellen der Prognose der logarithmiertenSterberate. Für die Berechnung der 95% Intervallprognose wird die Bootstrap-Methode anhanddes in Kapitel 6 beschriebenen Algorithmus benutzt. Bei der Punktprognose werden die Schätzerβx und γv aus Modell (3.5) und die Prognose des Zeitindex κtn+20 aus dem ARIMA(0,1,0)-Prozess gebraucht.

1 %% PROGNOSE MIT DER BOOTSTRAP−METHODE2

3 %% Punktprognose der logarithmierten Sterberate ln m_{xvt}

4 kappa_point = textread('kappa_point.txt');

5 beta_point = textread('beta_point.txt');

6 gamma_point = textread('gamma_point.txt');

7 % Eingabe der geschätzten Parameter

8

9 matrix_point = beta_point * gamma_point';

72

Page 81: Modellierung von Sterbewahrscheinlichkeiten mit

A. Quelltexte

10 M_point = zeros(20,7,length(kappa_point));

11 for l = 1:length(kappa_point)

12 M_point(1:20,1:7,l) = matrix_point .* kappa_point(l);

13 end

14 % Berechnung der (20x7x20)−Matrix der Punktprognose

15

16 %% 95% Intervallprognose der logarithmierten Sterberate ln m_{xvt}

17 predyears = 20; % Prognosehorizont

18 k = 20*112; % Dimension eines Vektors mit Pearson−Residuen19 dimlist = 10; % Anzahl der Replizierungen

20

21 D = csvread('D.csv');

22 ETR = csvread('ETR.csv');

23 res = csvread('res_pearson.csv');

24 % Datensätze mit Totenanzahl, Exposure−to−Risk und Pearson−Residuen25

26 Dres = reshape(D(:,4), [7 20 16]);

27 Dper = permute(Dres, [2 1 3]);

28 Dreal = ThreeToTwo(Dper);

29 % reale Totenanzahl D_{xvt} aus dem Datensatz mit Dimensionen 20x(7x16)

30

31 ETRres = reshape(ETR(:,4), [7 20 16]);

32 ETRper = permute(ETRres, [2 1 3]);

33 ETRreal = ThreeToTwo(ETRper);

34 % realen Exposure−to−Risk ETR_{xvt} aus dem Datensatz mit den Dimensionen

35 % 20x(7x16)

36

37 %% 1. Replizierung der Pearson−Residuen38 res_vec = reshape(res, k, 1);

39 list_rrep = cell(1,dimlist);

40 for i=1:length(list_rrep)

41 %%

42 % Die Residuenmatrix wird repliziert und in einer Liste 'list_rrep'

43 % gespeichert.

44 rep_i = randsample(res_vec, k, true);

45 list_rrep{i} = reshape(rep_i, 20, 112);

46 end

47

48 %% 2. Berechnung der geschätzten Totenanzahl anhand der Inversformel

49 list_drep = cell(1,dimlist);

50 for i=1:length(list_drep)

51 res_work = list_rrep{i};

52 Dhat_i = ( − res_work/2 + sqrt((res_work.^2)/4 + Dreal) ).^2;

53 list_drep{i} = Dhat_i;

73

Page 82: Modellierung von Sterbewahrscheinlichkeiten mit

A. Quelltexte

54 end

55

56 %% 3. Berechnung der geschätzten logarithmierten Sterberaten

57 list_logmrep = cell(1,dimlist);

58 for i=1:length(list_logmrep)

59 %%

60 % Aus der geschätzten Totenanzahl D_{xvt} und dem realen Exposure−to−61 % Risk ETR_{x,v,t} wird logarithmierte Sterberate berechnet

62 % und die Werte "−Inf" mit dem Minimum geschätzt.

63 D_work = list_drep{i};

64 logm = log(D_work./ETRreal);

65 infima = (logm == −Inf);66 logm(infima)=min(logm(¬infima));67 list_logmrep{i} = logm;

68 end

69

70 %% 4. Berechnung der Parameter 'beta_x', 'kappa_t' und 'gamma_v'

71 list_newlogmrep = cell(1,dimlist);

72 for i=1:length(list_newlogmrep)

73

74 logm = list_logmrep{i};

75 m = log(−TwoToThree(logm));76 % Berechnung der Werte ln (− ln m_{xvt})

77

78 Aeq = [ones(1,20) zeros(1,23); zeros(1,20) ones(1,7) zeros(1,16)];

79 beq = [0;0];

80 a0 = repmat(10, [20 1]);

81 b0 = repmat(10, [7 1]);

82 c0 = repmat(10, [16 1]);

83 x0 = [a0;b0;c0];

84 [x,fval] = fmincon(@(x)myfun(x,m),x0,[],[],Aeq,beq);

85 % Minimierung der Fehlerquadratsumme in der Funktion 'myfun.m' mit

86 % Grenzbedingungen sum(ln(−beta))=sum(ln(−gamma))=0 und

87 % Anfangswerten a0, b0 und c0

88

89 beta = −exp(x(1:20,:))./−sum(−exp(x(1:20,:)));90 gamma = −exp(x(21:27,:))./−sum(−exp(x(21:27,:)));91 kappa = (−sum(−exp(x(1:20,:))) )*( −sum(−exp(x(21:27,:))) ...

)*(−exp(x(28:43,:)));92 % Berechnung der Parameter mit den Grenzbedingungen sum(beta) =

93 % sum(gamma) = −194

95 model = arima(1,1,0);

96 EstMd = estimate(model, kappa);

74

Page 83: Modellierung von Sterbewahrscheinlichkeiten mit

A. Quelltexte

97 [Y,YMSE] = forecast(EstMd, predyears,'Y0', kappa);

98 % Modellierung der Kalenderzeit kappa und Erstellung der Prognose

99 % mit dem Zeithorizont 'predyears'

100

101 matrix = beta * gamma';

102 M = zeros(20,7,length(Y));

103 for j = 1:length(Y)

104 M(1:20,1:7,j) = matrix .* Y(j);

105 end

106 % Berechnung der 3D−Matrix mit den prognostizierten logarithmierten

107 % Sterberaten

108 list_newlogmrep{i} = M;

109 % Liste der Matrizen mit der Prognose

110 end

Schliesslich werden für eine bestimmte Verweildauerklasse v und Altersklasse x die Ober- undUntergrenze des 95% Intervalls folgendermaßen bestimmt:

1 %% Bestimmung der Grenzen des 95 % Prognoseintervalls

2

3 verwd = 1;

4 alter = 20;

5 obs = zeros(length(list_newlogmrep),1);

6 lb = zeros(predyears,1); % Obergrenze

7 point = zeros(predyears,1); % Punktprognose

8 ub =zeros(predyears,1); % Untergrenze

9

10 for j = 1:predyears

11 for i=1:length(list_newlogmrep)

12 W = list_newlogmrep{i};

13 obs(i) = W(alter,verwd,j);

14 end

15 obs_sort = sort(obs);

16 lb(j) = obs_sort(dimlist*0.025);

17 point(j) = M_point(alter,verwd,j);

18 ub(j) = obs_sort(dimlist*0.975);

19 % Aus jeder replizierten Matrix der Prognose wird die logarithmierte

20 % Sterberate für die Verweildauer 'verwd' und das Alter 'alter' in einem

21 % Vektor 'obs' gespeichert und sortiert. Die Perzentile werden als die

22 % Obergrenze 'ub' und die Untergrenze 'lb' gespeichert.

23 end

75

Page 84: Modellierung von Sterbewahrscheinlichkeiten mit

Literaturverzeichnis

Ainslie, R. (2000). Annuities and insurance products for impaired lives. The Actuary.

Aro, H., Djehiche, B., und Löfdahl, B. (2013). Stochastic modeling of disability insurance in amulti-period framework. Scandinavian Actuarial Journal.

Biffis, E. und Denuit, M. (2006). Lee-carter goes risk-neutral: an application to the italianannuity market. Giornale dell’Istituto Italiano degli Attuari, 69:33–53.

Booth, H., Maindonald, J., und Smith, L. (2002). Applying lee-carter under conditions of varia-ble mortality decline. Population Studies, 56:325–336.

Budíková, M., Lerch, T., und Mikoláš, Š. (2005). Základní statistické metody. Masarykovauniverzita v Brne.

DRV (2013a). Erwerbsminderungsrente: Das Netz für alle Fälle. Online verfügbar unter:http://www.deutsche-rentenversicherung.de/cae/servlet/contentblob/232616/publicationFile/56111/erwerbsminderungsrente_das_netz_fuer_alle_faelle.pdf [zuletzt geprüft am 07.07.2013].

DRV (2013b). Rendite der gesetzlichen Rentenversicherung. Online verfügbar un-ter: http://www.deutsche-rentenversicherung.de/cae/servlet/contentblob/232714/publicationFile/57810/rendite_der_gesetzlichen_rv.pdf [zuletzt ge-prüft am 07.07.2013].

FDZ-RV (2011). SUF Demografiedatensatz Rentenwegfall/-bestand 1993-2009. Deutsche Ren-tenversicherung.

Haberman, S. und Pitacco, E. (1999). Actuarial models for disability insurance. Chapman andHall/CRC.

Hyndman, R. J. und Ullah, M. S. (2007). Robust forecasting of mortality and fertility rates: afunctional data approach. Computational Statistics&Data Analysis, 51:4942–4956.

76

Page 85: Modellierung von Sterbewahrscheinlichkeiten mit

LITERATURVERZEICHNIS

Jong, P. D. und Tickle, L. (2006). Extending lee-carter mortality forecasting. MathematicalPopulation Studies, 13:1–18.

Kiers, H. A. und Van Mechelen, I. (2001). Three-way component analysis: Principles and illus-trative application. Psychological Methods, 6(1):84–110.

Koissi, M., Shapiro, A., und Hognas, G. (2006). Evaluating and extending the lee-cartermodel for mortality forecasting: Bootstrap confidence interval. Insurance: Mathema-tics&Economics, 38:1–20.

Kolster, N., Loebus, H., und Mörtlbauer, W. (1998). Neue Rechnungsgrundlagen für die Berufs-unfähigkeitsversicherung DAV1997. Blätter der DGVFM, 23(4):519–592. Online verfüg-bar unter: http://dx.doi.org/10.1007/BF02808361 [zuletzt geprüft am 11.10.2013].

Lee, R. D. und Carter, L. R. (1992). Modelling and forecasting u.s. mortality. Journal of theAmerican Statistical Association, 87:659–671.

Lee, R. D. und Miller, T. (2001). Evaluating the performance of the lee-carter method for fore-casting mortality. Demography, 38:537–549.

Pitacco, E. (2012). Mortality of disabled people. Technical report, University of Trieste-Dipartimento di Scienze Economiche, Aziendali, Matematiche e Statistiche B. de Finetti.

Pitacco, E., Denuit, M., Haberman, S., und Olivieri, A. (2009). Modelling Longevity Dynamicsfor Pensions and Annuity Business. Oxford.

Renshaw, A. E. und Haberman, S. (2000). Modelling recent time trends in uk permanent healthinsurance recovery, mortality and claim inception transition intensities. Insurance: Mathe-matics and Economics, 27:365–396.

Renshaw, A. E. und Haberman, S. (2006). A cohort-based extension to the lee-carter model formortality reduction factors. Insurance: Mathematics and Economics, 38:556–570.

Rickayzen, B. D. (2007). An analysis of disability - linked annuities (report no. actuarial re-search paper no. 180). Technical report, City University London-Faculty of ActuarialScience&Insurance.

Rickayzen, B. D. und Walsh, D. E. P. (2002). A multi-state model of disability for the unitedkingdom: Implications for future need for long-term care for the elderly. British ActuarialJournal, 8:341–393.

Russolillo, M., Giordano, G., und Haberman, S. (2011). Enxtending the lee-carter model: athree-way decomposition. Scandinavian Actuarial Journal, 2:96–117.

77

Page 86: Modellierung von Sterbewahrscheinlichkeiten mit

LITERATURVERZEICHNIS

Sandström, A. (1987). An empirical study of t-frequencies and termination functions in long-term sickness insurance in sweden. Meddelande nr 71, The Research Council of ActuarialScience, 71:2–50.

Steuten, D. (2012). Stochastic mortality modelling and management of longevity riskwith pricing and reserving applications to annuity products. PhD thesis, UniversitätDuisburg-Essen. Online verfügbar unter: http://duepublico.uni-duisburg-essen.de/servlets/DocumentServlet?id=30788 [zuletzt geprüft am 20.10.2013].

Tucker, L. (1951). A method for synthesis of factor analysis studies. Personnel Research SectionReport 984, Department of the Army, Washington.

Tucker, L. (1966). Some mathematical notes on three-mode factor analysis. Psychometrika,31(3):279–311.

Zwiesler, H.-J., Spodarev, E., und Boenke, R. (Wintersemester 2010/2011). Stochastische Risi-komodellierung und statistische Methoden. Technical report, Akademie für Wissenschaft,Wirtschaft und Technik an der Universität Ulm e.V.

78

Page 87: Modellierung von Sterbewahrscheinlichkeiten mit

Ehrenwörtliche Erklärung

Ich erkläre hiermit ehrenwörtlich, dass ich die vorliegende Arbeit selbstständig angefertigt habe;die aus fremden Quellen direkt oder indirekt übernommenen Gedanken sind als solche kennt-lich gemacht. Die Arbeit wurde bisher keiner anderen Prüfungsbehörde vorgelegt und auch nochnicht veröffentlicht.

Ich bin mir bewusst, dass eine unwahre Erklärung rechtliche Folgen haben wird.

Ulm, den 07.11.2013

Lucia Teigiszerová