91
Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research Prof. Dr. Andreas Hilbert [email protected] http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon +49 351 463-32359 Telefax +49 351 463-32736 Rico Ludwig Chris Reiche Patrick Schwabe Ausgewählte Aspekte der BI: Projektseminar Endpräsentation Mat. Nr.: 3111685 Mat. Nr.: 3206958 Mat. Nr.: 3235860

Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

  • Upload
    bliss

  • View
    23

  • Download
    0

Embed Size (px)

DESCRIPTION

Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling Kampagnen-Management Fazit Literatur. Die Linusbank Allgemeine Marktübersicht. Höhere Preissensitivität Häufig 2 bis 4 Bankverbindungen Entwicklung kostenloser Girokonten : 2000: gesamt: 6 % - PowerPoint PPT Presentation

Citation preview

Page 1: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Prof. Dr. Andreas [email protected]

http://wiid.wiwi.tu-dresden.de01062 Dresden

Telefon +49 351 463-32359Telefax +49 351 463-32736

Rico LudwigChris ReichePatrick Schwabe

Ausgewählte Aspekte der BI:Projektseminar

Endpräsentation

Mat. Nr.: 3111685Mat. Nr.: 3206958Mat. Nr.: 3235860

sas
Abbildungsverzeichnis!!!
Page 2: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation

Die LinusbankProblembeschreibungProjektplanData UnderstandingData PreparationModelingKampagnen-ManagementFazitLiteratur

Page 3: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 3

Die LinusbankAllgemeine Marktübersicht

• Höhere Preissensitivität

• Häufig 2 bis 4 Bankverbindungen

• Entwicklung kostenloser Girokonten:– 2000: gesamt: 6 %

– 2005: gesamt: 10 % - 2 % Onlinekonten

– 2010: gesamt 20 % - 19 % Onlinekonten

• Allgemeine Demografie am Markt:– 21 % jünger als 30

– 15 % älter als 70 Jahre

– 19 % zwischen 40 und 49

– Andere Altersgruppen jeweils ca. 15 %

Page 4: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 4

Die LinusbankUnternehmenssicht

• Mittelgroße Filialbank mit 500.000 Kunden

• 5 Produkte :

• Umfangreiches Data Warehouse mit historisierter Datenbasis

• Sowohl Online- als auch Filialgeschäft

Page 5: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation

Die LinusbankProblembeschreibung

Was der Kunde sagt

Was der Kunde will

ProjektplanData UnderstandingData PreparationModeling…

Page 6: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 6

ProblembeschreibungWas der Kunde sagt

„Wir wollen den Produktbesitz und die Produktnutzung unserer Bestandskunden intensivieren, um dem Wettbewerbsdruck zu begegnen. Allerdings sind die Kosten unserer jeweils produktbezogenen Cross- und Up-Selling-Kampangen hoch, und zu häufig sollten die Kunden auch nicht angesprochen werden. Deshalb wollen wir mit unseren Kampagnen vorranging die wertvollsten Kunden adressieren. Leider können wir den Erfolg von Kampagnen nur schwer beurteilen. Anhand von Vergangenheitsdaten wissen wir, dass sich unsere Kunden hinsichtlich ihres Produktbesitzes, ihrer Produktnutzung sowie ihrer Reaktion auf Kampagnen zum Teil deutlich unterscheiden.“

„Wir wollen den Produktbesitz und die Produktnutzung unserer Bestandskunden intensivieren, um dem Wettbewerbsdruck zu begegnen. Allerdings sind die Kosten unserer jeweils produktbezogenen Cross- und Up-Selling-Kampangen hoch, und zu häufig sollten die Kunden auch nicht angesprochen werden. Deshalb wollen wir mit unseren Kampagnen vorranging die wertvollsten Kunden adressieren. Leider können wir den Erfolg von Kampagnen nur schwer beurteilen. Anhand von Vergangenheitsdaten wissen wir, dass sich unsere Kunden hinsichtlich ihres Produktbesitzes, ihrer Produktnutzung sowie ihrer Reaktion auf Kampagnen zum Teil deutlich unterscheiden.“

Page 7: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 7

ProblembeschreibungWas der Kunde will

• Kosten für Kampagnen sehr hoch

• Kunden nutzen wenige Produkte

• Keine Erfolgsmessung der Kampagnen

• Wertvolle Kunden unbekannt

• Ziele:– Kundenzufriedenheit und Bindung erhöhen

– Wertvolle Kunden identifizieren

– Kosten reduzieren

– Erfolgsmessung für Marketingkampagnen einführen

Page 8: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation

Die LinusbankProblembeschreibungProjektplan

ProjektablaufKoordination der Projektarbeit

Data UnderstandingData PreparationModelingKampagnenauswertung…

Page 9: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 9

ProjektplanProjektablauf

• Orientierung des Projektablaufes an den Phasen des CRISP-DM

• Einarbeitung in Bankgeschäft und Daten der Linusbank

• Festlegen der Teilziele für Projektablauf

• Erarbeiten von Kennzahlen auf Basis der vorhandenen Daten

• Evaluation der erstellten Modelle und ableiten von Handlungsempfehlungen

sas
Projektgrafik anpassen
Page 10: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 10

ProjektplanKooperation der Projektarbeit

• http://altranprojektseminar.wikispaces.com

Page 11: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation

…ProjektplanData Understanding

Übersicht über vorhandene DatenProduktverteilungProdukterträgeKundenanalyseKundenwertkonzept

Data Preparation…

Page 12: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 12

Deskriptive AnalyseÜbersicht über vorhandene Daten

Page 13: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 13

Deskriptive AnalyseProduktverteilung (Gesamt)

• Girokonto hat größten Produktanteil

• Kredit nur vergleichsweise geringer Anteil

• Anteil für Riester und Sparen minimal

sas
sparkarte u kreditkarte raus !!!!!!1111eineinseinself
Page 14: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 14

Deskriptive AnalyseProduktverteilung (im Monat Juni)

Page 15: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 15

Deskriptive AnalyseProduktverteilung (im Monat Dezember)

Page 16: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 16

Deskriptive AnalyseProduktverteilung

• Deutliche Unterschiede in der Produktverteilung zwischen den

Monaten Juni und Dezember erkennbar

• Zurückzuführen auf wirksame Marketingkampagnen

• Alle Informationen über erstes Halbjahr im Datensatz für Juni

enthalten

• Juni - Datensatz stellt Basis unserer Annahmen und Berechnungen dar

• Später: Vergleich und Güteanalyse mit Daten des Dezembers

Page 17: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 17

Deskriptive AnalyseProdukterträge

• Riester und Kredit haben die höchsten Anteile an den Erträgen

• Zins, Giro und Depot vergleichsweise niedriger Ertragsanteil

Jahresertrag Laufzeitertrag

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Riester

Zins

Giro

Depot

KreditProdukt Jahresertrag Laufzeitertrag

Riester 530 € 1970 €

Zins 140 € 290 €

Giro 40 € 260 €

Depot 25 € 90 €

Kredit 450 € 570 €

sas
lehrstuhlformat
Page 18: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation

…ProjektplanData Understanding

Übersicht über vorhandene DatenProduktverteilungProdukterträgeKundenanalyseKundenwertkonzept

Data Preparation…

Page 19: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 19

Deskriptive AnalyseKundenanalyse 1/4

Die absolute Zahl der Kunden, die 1, 2, 3, 4 oder 5 und mehr Produkte besitzen

Die relativen Änderungen der Kunden mit einer bestimmten Anzahl an Produkten

Page 20: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 20

Deskriptive AnalyseKundenanalyse 2/4

Umsatzanalyse nach Monaten sowie Zahl der Kunden, die einen Vertrag abgeschlossen haben und Zahl der abgeschlossenen Verträge.

sas
Page 21: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 21

Deskriptive AnalyseKundenanalyse 3/4

• Übersicht über das Volumen von Kreditkunden abhängig von der Kreditwürdigkeit

sas
Übersicht über das Volumen von Kreditkunden abhängig von der Kreditwürdigkeit
Page 22: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 22

Deskriptive AnalyseKundenanalyse 4/4

• Mehr Filial- als Onlinekunden

• Kaum Unterschiede in der Altersstruktur im Vergleich Online/ Offline

Page 23: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 23

Deskriptive AnalyseKundenwertkonzept 1/3

Motivation:• Banken besitzen nur beschränkte Ressourcen für Aktivitäten der Kundenbindung

• Ziel ist es Kundensegmente zu identifizieren, die den Einsatz dieser Ressourcen

rechtfertigen

• Ermöglichung einer spezifischen Art der Betreuung von Bestandkunden und potenziellen

Neukunden

• Ausschöpfung von Cross- & Up-Selling-Potenzialen

Mögliche Verfahren• Qualitative Segmentierung

• ABC-Analysen

• Kundendeckungsbeitragsrechnung

• Kunden-Scoring-Modelle

• Kunden-Portfolio-Analyse

• Customer Lifetime Value

Quelle: http://www.mapone.de/images/abcanalyse.jpg

sas
leerzeichen
Page 24: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 24

Deskriptive AnalyseKundenwertkonzept 2/3

Kundenwert lässt sich über viele Faktoren bestimmen:• Beziehungsdauer

• Kreditwürdigkeit

• Transaktionsvolumen

• Erwartete Kaufwahrscheinlichkeit für die Zukunft

• Generierter Umsatz

• Hohes Einkommen

Durch welche Daten lassen sich solche Kunden erkennen?• Kreditvolumen

• Kreditwürdigkeit

• Einlagen - Netto - Volumen

• Einlagenvolumen

• Saldo Girokonto

• Beziehungsdauer

Page 25: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 25

Deskriptive AnalyseKundenwertkonzept 3/3

Versuchsansatz:

Kunden unterteilen in A, B und C Kunden

• A Kunden sind wertvoll

• B Kunden haben keinen besonderen Wert, schädigen die Linusbank aber nicht

• C Kunden schädigen die Linusbank

Mögliche einflussreiche Größen für Kundenwertbestimmung:

• Produktnutzung_X X ist die Menge an Produkten, welche einen besonders hohen Anteil am

Umsatz/Gewinn der Linusbank haben

• Dauer_X Gewichtungsfaktor für die wichtigsten X Produkte der Linusbank

• Anzahl_X Gewichtungsfaktor für die wichtigsten X Produkte der Linusbank

• Volumen_X Gewichtungsfaktor für die wichtigsten X Produkte der Linusbank

• Kreditwürdigkeit Risikominimierung

• Vermögensausprägung viel Vermögen bedeutet viel Kapital für die Linusbank

• Beziehungsdauer Zeichen für Loyalität

• Cross-Selling_Potenzial_X Möglichkeit der Aufwertung des Kunden durch Kampagnen

sas
Pfeile schön machen
Page 26: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation

…Data UnderstandingData PreparationModelingKampagnen-ManagementFazitLiteratur

Page 27: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 27

Data PreparationDatenbereinigung

• Ausschluss von „toten“ Kunden, um eine saubere Datenbasis für die

Folgemodelle zu erzeugen?

– Nur bedingt sinnvoll, da diese Kunden durch die Kampagnen reaktiviert werden

– Denkbarer Nutzen etwa bei Assoziationsanalyse für den Warenkorb, wobei Konten-

Tabelle nur Kunden enthält, die mindestens ein Produkt besitzen

• Modelle arbeiten fehlerhaft, aber der gezielte Ausschluss (klar definierter)

wertloser Kunden ist fehlerfrei, sodass das Endmodell eine höhere Güte

aufweisen müsste

• Normierung der Datensätze erforderlich, da Daten sowohl metrisch skaliert

vorliegen (z. B. Kredithöhe oder Beziehungsdauer) oder nominal bzw. ordinal

(z. B. Geschlecht, Familienstand, Kreditwürdigkeit)

• Verbindung der Datensätze über die Kundennummer möglich (jeder Kunde

hat eine eindeutige Kundennummer)

Page 28: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 28

Data PreparationAusschluss von Datenmaterial

• Produktnutzung_Giro und Dauer_Giro beinhalten die gleichen

Fakten

• Wenn die Produktnutzung = 0 ist auch die Dauer_Giro = 0

• Daraus folgt, dass Dauer_Giro überflüssig ist

• ebenso bei Zins, Kredit, Riester, Depot, Kreditkarte, Sparkarte,

Baufinanzierung

• Ausschluss von Kreditkarte, Baufinanzierung und Termingeld,

Sparkarte laut Aufgabenstellung (keine adäquaten Daten)

Page 29: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 29

Data PreparationTransformierung von Datensätzen

Tabelle Konten und Kunden• Verknüpfung der beiden Tabellen für

jeden Monat mit den Informationen:– Beziehungsdauer

– Alter

– Vertriebskanal

– Produktnutzungsdauer (Giro, Zins, Kredit, Riester, Depot, Sparkarte)

Nutzen der Produkte wurde binär kodiert

• Kunde nutz Produkt 1

• Kunde nutz Produkt nicht 0

Alter:

bis 17: Minderjährig(wird ausgeschlossen)

18-2930-3940-4950-59ab 60

Beziehungsdauer:

0-3: Neukunde3-12: 1 Jahr13-24: 2 Jahre25-60: 3-5 Jahre51-120: 6-10 Jahreab 121: mehr als 10 Jahre

sas
Produktnutzung 0 1!!
Page 30: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 30

Data PreparationKundenwert

• Für eine erste Analyse genügt ein relativ einfacher

Initialkundenwert, der auf Basis des Laufzeitertrags ermittelt wird.

In weiteren Schritt kann anhand von den verschiedenen

Prognosemodellen ein Score für jeden Kunden erzeugt werden, der

in einen präziseren und feiner abgestimmten Kundenwert einfließt.

• Für die aktuelle Aufgabe genügt der Initialkundenwert.

• Kunden haben zu einem bestimmten Zeitpunkt ein eine Menge an

Produkten mit unterschiedlichem Ertrag erworben

• Je nach Ertrag erzeugen diese Kunden einen höheren oder

niedrigeren Umsatz

• Kunden werden anhand dieses Umsatzes in verschiedene Werte-

Klassen eingeteilt

Patrick
ist die folie überflüssig????
Page 31: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 31

Data PreparationKundenwert

Ermittlung des Kundenwertes abhängig von der Zielstellung, wobei

Ziele nicht klar voneinander trennbar sind:

• Erhöhung der Kundenbindung?

• Steigerung der Produktdurchdringung je Kunde?

• Steigerung des durchschnittlichen Umsatzes?

• Verbesserung der Kundenzufriedenheit?

Hier: Steigerung der Produktdurchdringung und erhöhen des

Umsatzes

(Cross Selling)

Page 32: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 32

Data PreparationKundenwert

Dazu: Ermittlung passender Kennzahlen notwendig.

Möglich sind:

• Einlagenvolumen

• Kreditwürdigkeit

• Produktumsatz

• Beziehungsdauer

ABER:

Modell soll möglichst einfach gestaltet werden, sodass so viele

Eigenschaften wie

notwendig und so wenige wie möglich verwendet werden.

Dafür bieten sich der Produktumsatz (Laufzeiterträge) und das erwartete

Cross

Selling Potential an (ermittelt anhand der Prognosemodelle)

Page 33: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 33

Data PreparationKundenwert

Vorgehen zur Kundenwertbestimmung

Zweistufiges Vorgehen:

• Schritt 1:

- Initialkundenwert besteht lediglich aus Produktumsatz, da Potential

noch nicht bekannt ist

- Dieser Kundenwert fließt in Prognose-Modell ein

• Schritt 2:

- tatsächlicher Kundenwert erzeugt durch neuen Kundenwert aus

Ergebnis des

Prognose-Modells

- Berechnung anhand der Scores für die einzelnen

Kaufwahrscheinlichkeiten der Produkte

Page 34: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 34

Data PreparationKundenwert

Berechnung Initialkundenwert:

•Summe der Laufzeiterträge der Kunden und Einteilung in Klassen A bis E

Berechnung des tatsächlichen Kundenwertes:

• Summe der Einzelscores für die Kaufwahrscheinlichkeiten für

die 5 Produkte

(Maximal erreichbarer Wert: 5 Punkte)

• Beinhaltet durch Berücksichtigung des Initialkundenwertes

bereits die jeweiligen Umsätze

• erneute Einteilung der Kunden in Klassen A bis E anhand der

Höhe des

Gesamtscores.

Page 35: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 35

Data PreparationKundenwert

Hilfsmittel: ABC-Analyse

• Klassische ABC-Analyse gruppiert Kunden prozentual in Klassen ein, die einen

bestimmten Umsatzanteil ausmachen

• jedoch in SQL extrem komplex zu implementieren

• Abgewandelter Algorithmus sortiert Kunden absteigend nach Umsatz und ordnet

absolute Mengen in die Klassen ein, sodass die ersten 50.000 Kunden mit dem höchsten

Umsatz Klasse A darstellen, die nächsten Kunden Klasse B usw.

• Die Mengen wurden so definiert, dass ca. 20 % der Kunden (A und B) 80 % des

Umsatzes generieren

• A: 0 - 50.000

• B: 50.000 – 100.000

• C: 100.000 – 150.000

• D: 150.000 – 200.000

• E Über 200.000

Page 36: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation…Data UnderstandingData PreperationModeling

AssoziationsanalyseClusteranalysePrognosemodelle

Page 37: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 37

Teil der Aufgabenstellung:

Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester.

Ziel der AnalyseEindruck darüber gewinnen, welche Produkte häufig gemeinsam genutzt werden.

ModelingAssoziationsanalyse

Page 38: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 38

Assoziationsanalyse Vorbereitung der Daten für Assoziationsanalyse

• Benötigter Datensatz: – Konten

• Enthaltene Daten:

– Kundennummer als ID

– Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1

– Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0

oder 1

– Alter in 5 Stufen nominal

– Kreditwürdigkeit (gut, schlecht, unbekannt) nominal

– Beziehungsdauer

– Kanal (Online, Filiale) binär

Page 39: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 39

AssoziationsanalyseEinstellungen

• Der Datenfluss im Diagramm:

• Reduzieren der Werte, da Transaktionen wie Kredit oder Riester im verhältnis zur Gesamtzahl der Transaktionen relativ selten auftreten. Sie sollen aber trotzdem in der Analyse erscheinen

• Die Filtereinstellungen, um nicht zu berücksichtigende Produkte auszuschließen:

sas
bild schön machen :)
Page 40: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 40

Assoziationsanalyse Ergebnis 1/2

• Das Ergebnis der Analyse mit dem ermittelten Warenkorb.

• Hier zu sehen sind nur die Regeln, die auf der rechten Seite genau ein Ergebnis erzeugen.

Page 41: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 41

Assoziationsanalyse Ergebnis 2/2

• Überblick über alle erzeugten Regeln:

Page 42: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 42

Assoziationsanalyse Fazit

• Häufig zusammen gekauft werden Zins, Depot und Riester in allen möglichen Kombinationen.

• Macht Sinn, da alle drei Produkte im Kern Sparprodukte darstellen.

• Starken Lift erzeugen Riester-Produkte, die sowohl für Zins, als auch Zins Kombination mit Giro oder Depot häufig nachgefragt werden.

• Diese Produkte werden jedoch vergleichsweise selten verkauft.

Handlungsmöglichkeiten:

Kunden, die bereits ein oder mehrere Produkte besitzen, könnten

entsprechend interessiert sein an den ermittelten Kombinationen. So

bietet es sich an, Besitzer von Zins, die noch über kein Depot verfügen,

ein Produktangebot vorzubereiten bzw. Depot-Besitzern auch

Linuszins anzubieten.

Page 43: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation…Data UnderstandingData PreperationModeling

AssoziationsanalyseClusteranalysePrognosemodelle

Kampagnen-ManagementFazitLiteratur

Page 44: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 44

Modeling Clusteranalyse

Teil der Aufgabenstellung:Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester.

Ziel der AnalyseEindruck über die Kundenstruktur gewinnen. Gibt es typische Nutzergruppen, die ähnliche Eigenschaften aufweisen?

Page 45: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 45

ClusteranalyseVorbereitung der Daten für Clusteranalyse

• Benötigter Datensatz: Kunden_binary200812

• Enthaltene Daten:

– Kundennummer als ID

– Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1

– Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0

oder 1

– Alter in 5 Stufen nominal

– Kreditwürdigkeit (gut, schlecht, unbekannt) nominal

– Beziehungsdauer

– Kanal (Online, Filiale) binär

Page 46: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 46

ClusteranalyseVorgehen

• Nachdem der Clusternode keine zufriedenstellenden Ergebnisse hervorbrachte, kam der SOM/Kohonen-Node zum Einsatz.

• Vorgehen:

• Sampling-Node mit Simple-Random (12345) als Starteinstellung und 4x6 Clustern.

• Anschließend Beobachtung des Distance-Plots auf eine gleichmäßige Verteilung der Cluster und Prüfung der Clusterhäufigkeit in den Statistics.

• Schrittweise Reduzierung der Clusterzahl brachte bei 2x3 Clustern das erste gute Ergebnis, bei dem die Cluster gut verteilt waren und keine Häufung mehr auftrat.

• Als wichtige Variablen zeigt sich stets die Beziehungsdauer, die Vermögensausprägung, Giro, Depot, Zins, Kredit.

Page 47: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 47

ClusteranalyseErgebnis 1/5

• Ergebnis der Clusteranalyse

Page 48: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 48

ClusteranalyseErgebnis 2/5

• Das Ergebnis der Analyse mit dem ermittelten Distanzgraphen.

Page 49: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 49

ClusteranalyseErgebnis 3/5

• Das Alter wurde nicht in die Cluster-Unterscheidung einbezogen.

Page 50: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 50

ClusteranalyseErgebnis 4/5

• Die Verteilung der Produkte auf die verschiedenen Cluster

Page 51: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 51

ClusteranalyseErgebnis 5/5

• Während Vermögensausprägung durchaus einen Einfluss hat, ist die Kreditwürdigkeit in allen Clustern gleich verteilt.

sas
Rand wegschneiden
Page 52: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 52

ClusteranalyseFazit

Es zeigen sich drei auffällige Cluster-Gruppierungen:

• So gibt es stets ein Cluster Kreditkunden, das einen erheblichen Anteil an Kreditkunden beinhaltet, die eine stark negative Vermögensausprägung aufweisen und eine mittlere Beziehungsdauer ab 3 Jahren erreichen.

• Die zweite Gruppe sind die Sparkunden mit positiver Vermögensausprägung, langer Bindungsdauer teils über 10 Jahre und allen drei Spar-Produkten Zins, Depot und Giro.

• Die dritte Gruppe umfasst die verbleibenden Cluster mit vorrangig ausgeglichenem Vermögen und häufig einem Girokonto oder Depot.

Handlungsmöglichkeiten:Es lässt sich erkennen, dass im Cluster der Sparkunden die klassischen Sparprodukte häufig nachgefragt werden. Ein Ansatz wäre, Kunden zu finden, die ebenfalls vermögend sind, aber noch nicht alle Produkte besitzen. Zusätzlich ist eine Aktion denkbar, bei der Kunden, die alle Produkte besitzen, aber nur geringe Einlagen aufweisen, zusätzliches Geld überweisen, weil sie mit hoher Wahrscheinlichkeit noch woanders über Konten mit

Spareinlagen verfügen.

Page 53: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation…Modeling

AssoziationsanalyseClusteranalysePrognosemodelle

StandardprognosemodelleGiroKreditRiesterZinsDepotScores

Fazit…

Page 54: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 54

Modeling Prognosemodelle

Teil der Aufgabenstellung:Entwickeln Sie jeweils ein produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte linuskredit, linusdepot, linusgiro, linuszins und linusriester.

Ziel der ModelleKlassifikation von Kunden, um Wahrscheinlichkeiten für Produktabschlüssen zu prognostizieren.

Page 55: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 55

Modeling Vorbereitung der Daten für die Prognosemodelle

• Benötigte Datensätze:– Kundendaten_200806

– Kundendaten_200812

• Transformationen:– Alter (nominal 5 Klassen)

– Vermögensausprägung (ordinal -1 0 und 1)

– Produktnutzung (binär für jedes Produkt)

– Beziehungsdauer (nominal 5 Klassen)

• Kundenwert (Initialwert):– Klasse (nominal A bis E)

– Umsatz (metrisch)

• Ausgangsdaten:– Kundennummer (id)

– Alter (nominal 5 Klassen)

– Kanal (binär)

– Kreditwürdigkeit (nominal 3 Klassen)

– Vermögensausprägung (ordinal -1 0 und 1)

– Giro (binär)

– Kredit (binär)

– Riester (binär)

– Zins (binär)

– Depot (binär)

– Beziehungsdauer (nominal 5 Klassen)

– Klasse (nominal 5 Klassen)

– Umsatz (interval 115-4365)

Page 56: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 56

Erstellung von StandardprognosemodellenVorgehen 1/2

• Aufgrund der Daten in Kundendaten_200806 Modelle entwickeln, welche

Prognosen für Produktabschlüsse erstellen

• Prognosen werden mit den tatsächlichen Daten aus Kundendaten_200812

verglichen und anhand der Misclassification Rate und dem Fehler zweiter

Art bewertet

- FZA sollte möglichst klein sein, da er potentiellen Kunden angibt, die nicht

angesprochen werden

• Um ein möglichst optimales Prognosemodell zu erhalten werden zunächst drei

Standardmodelle erstellt und davon das geeignetste weiter optimiert

• Bevorzugt wird nach Möglichkeit der Entscheidungsbaum, da er viele positive

Eigenschaften wie Verständlichkeit und hohe Performance besitzt

• Ausschluss von Kundendaten, welche bereits durch Kampagnen angesprochen

wurden, um die Ergebnisse nicht zu verfälschen

Page 57: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 57

Erstellung von StandardprognosemodellenVorgehen 2/2

• Anlegen zwei paralleler

Datenstränge für je Trainings- bzw.

Validierungsdaten aus

Kundendaten_200806 und Testdaten

aus Kundendaten_200812

Page 58: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 58

Erstellung von StandardprognosemodellenEinstellungen 1/3

• "Umsatz" aus Datensatz ausschließen, da indirekt im Kundenwert

enthalten:

• Anlegen von fünf Pfaden (mit je zwei Datensträngen) für jedes Produkt

• Jeweiliges Produkt als Target definieren:

Page 59: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 59

Erstellung von StandardprognosemodellenEinstellungen 2/3

• Künstliches Angleichen der Verteilung in den Target-Variablen, um neutralen Trainingsdatensatz zu erhalten

• Gleichverteilung der Daten für Target, sodass keine Ausprägung der Variable dominiert

sas
Gleichverteilung der Daten für Target, sodass keine Ausprägung der Variable dominiert
Page 60: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 60

Erstellung von StandardprognosemodellenEinstellungen 3/3

• Datenstränge für Training, Validierung und Test aufteilen:

• Standardmodelle des Künstlichen Neuronalen Netzes, der Regresion und des Entscheidungsbaums erstellen:

Page 61: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 61

Erstellung von StandardprognosemodellenVergleich

• Standardmodelle im Assesment-Node vergleichen• Besonders geeignetes Modell auswählen, welches weiter zu optimieren

ist

• Auswahl anhand von Missclassifcation für Test

• Erkärung:

- Test: Vergleich des Modells mit Dezember

- Validation: Zur Optimierung Trainingsmodelle

• Bevorzugte Auswahl für Entscheidungsbaum, sofern er nicht wesentlich

schlechter ist

sas
hässlich :-)
sas
Auswahl anhand von Missclassifcation für TestErkärung: Test: Vergleich des Modells mit DezemberValidation: Zur Optimierung TrainingsmodelleAuswahl für bevorzugt für Entscheidungsbaum, sofern er nicht wesentlich schlechter ist
Page 62: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 62

Optimierungen EntscheidungsbaumEinstellungen

• Wichtigstes Bewertungskriterium ist die Missclassifiation Rate im Testdatensatz und der

prozentuale Fehler zweiter Art

• Wenn alle Standardmodelle auf ähnlichen Niveau sind wird der Entscheidungsbaum

versucht zu optimieren

• Wenn sich größere Abweichungen ergeben werden zusätzlich zum Entscheidungsbaum

auch andere Modelle optimiert

• Optimierung Entscheidungsbaum:

– Absenkung es Signifikanzlevels

im Chi-Quadrat-Test

– Absenkung der minimalen

Beobachtungen je Blattkonten

– Erhöhung der benötigten

Beobachtungen für jede Split-

Suche

Page 63: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 63

Optimierungen Neuronales NetzEinstellungen

• Modelauswahl Kriterium auf Misclassification Rate ändern

• Versteckte Neuronen erhöhen, direkte Verbindungen zulassen

Page 64: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 64

Optimierungen RegressionEinstellungen

• Methode auf Backward ändern

• Validation Misclassification als Kriterium wählen

Page 65: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation…Modeling

AssoziationsanalyseClusteranalysePrognosemodelle

StandardprognosemodelleGiroKreditRiesterZinsDepotScores

Kampagnen-Management

Fazit…

Page 66: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 66

PrognosemodelleGiro

• Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt

zusammen:

• Neuronal Network: 0.0586713728

- Optimiert: 0.0597251027

- Verschlechterung um 0,1 %

• Tree: 0.1738551315

- Optimiert: 0.1620013139

- Verbesserung um 1,2 %

• Regression: 0.2132549094

• Neuronales Netz ist bestes Modell, konnte aber nicht weiter optimiert werden

• Entscheidungsbaum konnte auch mit Optimierungen nicht entsprechend verbessert werden

Neuronales Netz wird als Prognosemodell für Grio genommen

Page 67: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 67

PrognosemodelleGiro

• Fehler zweiter Art von 4,7 %

Page 68: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 68

PrognosemodelleKredit

• Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt

zusammen:

• Neuronal Network: 0.0032127169

• Tree: 0.0019142331

- Optimiert: 0.0014273017

- Verbesserung um 0,05 %

• Regression: 0.003813008

• Alle Modelle liegen nah beieinander auf sehr hohem Niveau

• Der Entscheidungsbaum konnte somit auch nicht mehr nennenswert optimiert werden.

Optimierter Entscheidungsbaum wird als Prognosemodell für Kredit genommen

Page 69: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 69

PrognosemodelleKredit

• Sehr geringer Fehler zweiter Art von nur 0,8 %

Page 70: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 70

PrognosemodelleKredit

• Entscheidungsregeln im optimierten Entscheidungsbaum

Page 71: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 71

PrognosemodelleRiester

• Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt

zusammen:

• Neuronal Network: 0.2605778768

- Optimiert: 0.2564376715

- Verbesserung von 0,4 %

• Tree: 0.3665022092

- Optimiert: 0.2368728181

- Verbesserung um 12,9 %

• Regression: 0.2132549094

• Entscheidungsbaum mit Abstand am schlechtesten

• Optimierungen bei anderen Modellen versprach kein Erfolg

• Optimierung bei Entscheidungsbaum verbessern Ergebnis signifikant, sodass Ergebnis

vergleichbar wird mit anderen Modellen

Optimierter Entscheidungsbaum wird als Prognosemodell für

Riester genommen

Page 72: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 72

PrognosemodelleRiester

• extrem hoher Fehler zweiter Art von 47 %

Page 73: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 73

PrognosemodelleRiester

• Entscheidungsregeln im optimierten Entscheidungsbaum

Page 74: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 74

PrognosemodelleZins

• Die Misclassifikation Rates im Testdatensatz stellen sich wie folgt

zusammen:

• Neuronal Network: 0.1646240451

• Tree: 0.1215602417

- Optimiert: 0.1165543805

- Verbesserung um 0,5 %

• Regression: 0.1986989398

• Entscheidungsbaum ist per se schon sehr gut, konnte aber nicht signifikant optimiert werden.

Optimierter Entscheidungsbaum wird als Prognosemodell für Zins genommen

Page 75: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 75

PrognosemodelleZins

• extrem hoher Fehler zweiter Art von 44 %

Page 76: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 76

PrognosemodelleZins

• Entscheidungsregeln im optimierten Entscheidungsbaum

Page 77: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 77

PrognosemodelleDepot

• Die Misclassification Rates im Testdatensatz stellen sich wie folgt

zusammen:

• Neuronal Network: 0.0889100723

- Optimiert: 0.0765976632

- Verschlechterung von 1,2 %

• Tree: 0.0921871981

- Optimiert: 0.0380347551

- Verbesserung von 5,4 %

• Regression: 0.1226526169

• Der Entscheidungsbaum ist ein guter Ausgangspunkt für das Modell und liefert optimiert, die besten Ergebnisse.

optimierter Entscheidungsbaum wird als Prognosemodell für Depot genommen

sas
Missclassification überall mit C geschrieben??
Page 78: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 78

PrognosemodelleDepot

• 6,9 % Fehler zweiter Art

Page 79: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 79

PrognosemodelleDepot

• Entscheidungsregeln im optimierten Entscheidungsbaum

Page 80: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 80

PrognosemodelleScores

• Extraktion der Scores:

– Entscheidungsregeln der Modelle werden extrahiert und über einen

SAS-Code in Prognosewahrscheinlichkeiten für Kunden zu dem

jeweiligen Produkt gespeichert.

– Aus dem Prognosewahrscheinlichkeiten und dem alten Kundenwert wird

anschließend der neue Kundenwert berechnet

Patrick
Überflüssig?weil schon bei konzept zum Kundenwert drin?
Page 81: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation…Modeling

AssoziationsanalyseClusteranalysePrognosemodelle

StandardprognosemodelleGiroKreditRiesterZinsDepotScores

Kampangen - Management

Fazit…

Page 82: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 82

Kampagnen-ManagementVorgehen 1/2

Grundsätzliche Arbeitsweise:

• Vergleich der durchschnittlichen Monatsumsätze für das beworbene

Produkt und die gesamte Abschlussmenge

• Kundenbasis:

• Wirkgruppe (nahm an Kampagne teil)

• Kontrollgruppe (nahm nicht an Kampagne teil)

Datenbasis:

• Kampagnen-Tabelle (Kundennummer, Name, Wirkgruppe, Abschluss)

• Konten-Tabelle (Kundennummer, Abschluss, Produkt)

• Produkt-Tabelle (Name, Laufzeitertrag)

Page 83: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 83

Kampagnen-ManagementVorgehen 2/2

• Für eine Bewertung der Kampagne wird nun untersucht, ob die

angeschriebenen Kunden im Verhältnis einen höheren Umsatz

erzeugt haben als die Kunden, die nicht angeschrieben wurden (also die

Kontrollgruppe).

• Dazu kann der Gesamtumsatz betrachtet werden. Zur besseren

Deckungsbeitragsbewertung ist jedoch die Betrachtung des

Umsatzes besser, der ausschließlich mit dem beworbenen Produkt

erzielt wurde.

Page 84: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 84

Kampagnen-Management Kreditmailing-Vergleich

Ermitteln der Anzahl der angeschriebenen Kunden für die Kampagne:

• Alle Kunden in Wirkgruppe=1 mit Kampagnename = Kreditmailing sind die

Wirkgruppe (32.680 Kunden)

• Alle Kunden in Wirkgruppe=0 mit Kampagnename = Kreditmailing sind die

Kontrollgruppe (3.610 Kunden)

• Für die Bewertung des Prognosemodells wurde ein Modell für Kredit auf Basis der

Kundendaten mit Stand 200805 prognostiziert, wobei für das Training alle Kunden

gefiltert wurden, die an Kampagnen teilgenommen haben.

• Die ermittelten Kunden mit einer Kreditkaufwahrscheinlichkeit werden anschließend

nach Wahrscheinlichkeit gescored.

• Für eine Bewertung anhand der gemachten Kampagne wurden nur die Kunden

angeschrieben, die sowohl in der Kampagne Kreditmailing aufgeführt waren als auch

vom eigenen Prognosemodell als "Kaufkunden" bewertet wurden.

• Daraus ergibt sich eine Wirkgruppe mit 32183 Kunden. Die Kontrollgruppe bleibt gleich.

Page 85: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 85

Kampagnen-ManagementKreditmailing-Vergleich

Umsatz Wirkgruppe (Zeitraum 6 bis 8)

• Kredit: 3.908.480 EURabzgl. Kosten 32.680 * 1,20 = 39.216 EURNettoumsatz 3.869.264 EUR

Durchschntl. Brutto-Umsatz: 39,87 EURDurchschntl. Netto-Umsatz: 39,47 EUR

Einbezogene Kunden über 3 Monate: 98.040

Umsatz Wirkgruppe (Zeitraum 6 bis 8)

– mit eigenem Prognose-Modell Kredit auf Basis von Mai für August

• Kredit: 3.811.950abzgl. Kosten 32183 * 1,20 = 38.619,6Nettoumsatz 3.775.800

Durchschntl. Brutto-Umsatz: 39,48 EURDurchschntl. Netto-Umsatz: 39,08 EUR

Einbezogene Kunden über 3 Monate: 90.375

Page 86: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 86

Kampagnen-ManagementErgebnis im Vergleich zur Kontrollgruppe 1/2

Kontrollgruppe (Zeitraum 6 bis 8):

Umsatz Kredit 6 bis 8: 376.270 EUR

Durchschntl. Umsatz: 34,743 EUR

Einbezogene Kunden über 3 Monate: 10.830

Kampagnen-Ergebnisse im Vergleich zu Kontrollgruppe

Lift der Kampagne mit Brutto- und Netto-Ergebnissen

39,866 EUR / 34,743 EUR = 14,75 %

39,466 EUR / 34,743 EUR = 13,59 %

Lift der prognostizierten Kampagne mit Brutto- und Netto-

Ergebnissen

39,482 EUR / 34,743 EUR = 13,64 %

39,082 EUR / 34,743 EUR = 12,48 %

Page 87: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 87

Kampagnen-ManagementErgebnis im Vergleich zur Kontrollgruppe 2/2

Page 88: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

Fakultät Wirtschaftswissenschaften Professur für Wirtschaftsinformatik – Business Intelligence Research

Endpräsentation…Modeling

AssoziationsanalyseClusteranalysePrognosemodelle

Kampangen - Management

FazitLiteratur

Page 89: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 89

FAZIT 1/2

• Assoziation– Analyse zeigt guten Ersteindruck über das Kaufverhalten der Kunden

– Bietet hilfreiche Ergebnisse mit geringem Aufwand

– Bietet im Gegensatz zu teureren Kampagnen-Aktionen eine günstige Cross-Selling-Grundlage im direkten Verkaufsgespräch

• Clustering– Ermöglichte Identifikation wesentlicher Kundengruppen in bestehender

Kundenbasis

– Bietet guten Ansatz um Kampagnen speziell auf diese Kundengruppen wie Kreditkunden oder Sparkunden auszurichten

– Alternativ können auch neue Kampagnen entwickelt werden, um neue Kundengruppen abhängig von der Firmenstrategie aufzubauen

• Prognose für Produkte– Prognose für Kredit, Depot und Giro liefert gute Ergebnisse

– Bei Zins und Riester verursacht der hohe Fehler zweiter Art hohe Opportunitätskosten, da Anteil positiver Kunden sehr gering ist

Page 90: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 90

FAZIT 2/2

• Scoring

– Aufwändig zu ermitteln

– Nutzen des Scores und Umfang der einbezogenen Attribute extrem

abhängig vom Ziel der Kundenbewertung

– Für Produktprognose schon sehr einfacher Score auf Umsatzbasis

ausreichend, da Modelle bereits über hohe Aussagekraft verfügen

• Kampagnen-Management

– Kampagnen sehr nützlich für Umsatzsteigerung je Kunde im Vergleich

zur nicht angeschriebenen Kontrollgruppe

– Kampagnen-Ergebnisse mit Prognose-Modell erreichen vergleichbar

gute Werte trotz eingeschränkter Datenauswahl

Page 91: Die Linusbank Problembeschreibung Projektplan Data Understanding Data Preparation Modeling

TU Dresden Professur für Wirtschaftsinformatik – Business Intelligence Research

Ausgewählte Aspekte der BI: Projektseminar Zwischenpräsentation– Seite 91

Literatur

• H. Hippner et: „Handbuch Data Mining im Marketing“

• Randall Matignon: „Data Mining Using SAS Enterprise Miner“ (2007)

• ????