Big Data und Predictive Analytics...Prozesse und Strukturen einer "vom Markt her"...

Preview:

Citation preview

Big Data und Predictive Analytics

Digitalisierungam Beispiel der Steuer- und Zollverwaltung

27. Februar 2018

Hermann Madlberger MBA MPA seit 1/2018 Alleingesellschafter-Geschäftsführer

der madlberger digitalisierungsberatung gmbh

seit 6/2016 Leiter des Predictive Analytics Competence Centersim Bundesministerium für Finanzen

seit 4/2010 Fachprojektmanager "POS – Prozessorientierte Sicht" und "Datamining“

4/2009 einjährige Karenzierung

2007 - 2009 Vorstand der Steuerfahndung Österreich

2004 - 2007 Regionalmanager für Wien

1999 - 2004 Leiter der Organisationsabteilung BMF („Bundessteuerinspektor“)

1993 - 1999 Leiter der Prüfungsabteilung im Finanzamt für Körperschaften

Masterthesis 2008: Marketing in der öffentlichen Verwaltung - Strategie, Märkte,Prozesse und Strukturen einer "vom Markt her" geführten Steuerverwaltung erschienen im VDM Verlag Dr. Müller - ISBN-10: 3639106381

WKO Club IT - Madlberger©2018 27. 2. 2018

2

Big Data und Predictive Analytics

Umsetzung in 3 Projekten

3 Projekte

Prozessorientierte Sicht (auf die Daten) – PoS Gesamtüberblick für das Topmanagement und Detailsicht für dieTeamleiterInnen

Data MiningIn den Daten geprüfter und ungeprüfter Fälle Muster finden, die aufMaßnahmenrelevanz schließen lassen

Predictive Analytics Competence CenterAnwendungsmöglichkeiten verbreitern und Nachhaltigkeit sichern

WKO Club IT - Madlberger©2018 27. 2. 2018

4

Projekt Prozessorientierte Sicht – PoS

Anforderung: Den Inhalt des Steuer-Data Warehouse sichtbar zu machen

Ziel: Entwicklung eines Reports mit 4 DimensionenZeit / Abgabenprozesse / Organisationseinheiten / Steuersubjekte

Weg:Vom Core-DWH zum Dimensions-/Fakten-DWH

WKO Club IT - Madlberger©2018 27. 2. 2018

5VO

M B

USI

NESS

(FA

CH

BEREIC

H) Z

U

ENTW

ICK

ELN

Daten am Beispiel Umsatzsteuererklärung

WKO Club IT - Madlberger©2018 27. 2. 2018

6

Reporting als Voraussetzung für Qualität

WKO Club IT - Madlberger©2018 27. 2. 2018

7Datenverständnis schaffen für 245 Spalten (=Metadaten)

Projekt Data Mining

Anforderung:Die vorhandenen Daten besser nutzbar machen

Ziel: Ergebnisse durch analytische Methoden optimieren

Weg: Proof of Concept - Auswahl von 4.000 Prüfungsfällen

bei gleichzeitiger Entwicklung des CRISP-DM-Prozesses

mit einem interdisziplinärem Team (Fach/Analyse/IT)WKO Club IT - Madlberger©2018 27. 2. 2018

8

Methodik und Prozesse (CRISP-DM )

WKO Club IT - Madlberger©2018 27. 2. 2018

9

1. Übersetzung der Problemstellung

2. Datenextraktion

3. Datenexploration

4. Datenbereinigung

5. Datenaufbereitung

6. Modelldatenerstellung

10. Beurteilung der Ergebnisse

9. Einsatz der Modelle

8. Beurteilung der Modelle

7. Modeling

Cross Industry Standard Process for Data Mining

Fachliche Aufgabe

Technische Aufgabe

Projekt Predictive Analytics (1)

Anforderung:Die Nutzung der Daten institutionalisieren und optimieren

Ziel: Nachhaltiger Einsatz moderner Analytics Methoden in allen Bereichenund deren Integration in die Geschäftsprozesse

Weg: Schaffung der organisatorischen, personellen, prozessualen undtechnischen Voraussetzungen zur nachhaltigen Nutzung innovativerAnalytics-Methoden

WKO Club IT - Madlberger©2018 27. 2. 2018

10

Projekt Predictive Analytics (2)

WKO Club IT - Madlberger©2018 27. 2. 2018

11

Projekt Predictive Analytics (3)

WKO Club IT - Madlberger©2018 27. 2. 2018

12

Projekt Predictive Analytics (4)

WKO Club IT - Madlberger©2018 27. 2. 2018

13Quelle: https://www.egeli-informatik.ch/the-agile-scrum-framework/

Projekt Predictive Analytics (5)

WKO Club IT - Madlberger©2018 27. 2. 2018

14Quelle: https://www.sas.com/en_us/software/fraud-management.html

Machine Learningaus den Ergebnissen bisher geprüfter Jahre seit 2006

WKO Club IT - Madlberger©2018 27. 2. 2018

15

5.065 2,25%

219.746 97,75%

224.811 100,00%

Gut-Fälle 0Schlecht-Fälle 1

Gesucht: Unterschiede zwischen den Gruppen 0 und 1 =>Unterschiedliche Daten-Muster erkennen

Modeling

WKO Club IT - Madlberger©2018 27. 2. 2018

16

Einfacher Entscheidungsbaumvon 20% zu 70% Trefferanteil

WKO Club IT - Madlberger©2018 27. 2. 2018

17

Gesamter Entscheidungsbaum

WKO Club IT - Madlberger©2018 27. 2. 2018

18

Methode und Test

WKO Club IT - Madlberger©2018 27. 2. 2018

19

TRAIN 104.362 102.267 2.095 60 %

VALIDATE 34.787 34.133 654 20 %

TEST 34.788 34.105 683 20 %

173.937 170.505 3432

Mehrergebnisse Lohnabgaben 2014je Prüfung im Schnitt für Zentrale 99% (– 0,5% Fälle unten und oben)

WKO Club IT - Madlberger©2018 27. 2. 2018

20

Mehrergebnisse Lohnabgaben 2014 / 2016je Prüfung im Schnitt für Zentrale 99% (– 0,5% Fälle unten und oben)

WKO Club IT - Madlberger©2018 27. 2. 2018

21

Prozessintegration

WKO Club IT - Madlberger©2018 27. 2. 2018

22

Tax Compliance

Effektivität – Effizienz

Verwaltungskosten

End – to - End

Kultur – Customer Journey

Danke für die Aufmerksamkeit!

WKO Club IT - Madlberger©2018 27. 2. 2018

23

Recommended