Klaus A. Kuhn, Oliver Kohlbacher, Ulrich Mansmann, Fabian Prasser
und das DIFUTURE Konsortium
TU München, Univ. Tübingen, Univ. München und Partner
01ZZ1603[A-D] und 01ZZ1804[A-H]
DIFUTURE: das Konsortium
o TU München, Klinikum rechts der Isar
o Universität München, Klinikum der Universität
o Universität Tübingen, Klinikum der Universität
o Universität Ulm und Universitätsklinikum Ulm (seit 2/2019)
o bauen Datenintegrationszentren (DIZ) auf, arbeiten an Anwendungsfällen, beginnend mit Multipler Sklerose (MS)
o Universität Augsburg, Klinikum Augsburg
o Universitätsklinikum im Aufbau, DIZ bis 2021, Anwendungsfall MS
o Vernetzungspartner
o Universitätsklinikum Regensburg
o Universitätsklinikum des Saarlands, Universität des Saarlands
o Übernehmen Lösungen, sind in die Konzeptionierung einbezogen
o Streben perspektivisch ebenfalls Datenintegrationszentren an
o Industriepartner
o Kairos
Anwendungsfälle von DIFUTURE
Anwendungsfälle von DIFUTURE sind auf Krankheiten ausgerichtetsollen zu nachweisbaren Verbesserungen von Verläufen führenkein primär „methodischen“ Anwendungsfälle
Ziele aller AnwendungsfälleIntegration und Analyse von Daten zur gezielten Ausrichtung vonVorbeugung, Diagnosestellung, Therapie, NachsorgeEntwicklung und Bereitstellung von
entscheidungsunterstützenden KomponentenTreatment Decision Score MS: Prospektive Beobachtung u. Validierung
Übergeordnetes Ziel ist Präzisionsmedizin, personalisierte Medizin
Krankheiten im Fokus der Use Cases
Multiple Sklerose ab 2016/17
Parkinson Erkrankung ab 2017
Onkologie, Kardiologie, Schlaganfall ab 2020, weitere (onkolog.) ab 2022
bauen methodisch aufeinander auf, erweitern Konzepte und Lösungen
VorgehenIntegration von Versorgungsdaten und Forschungsdaten
Verlaufsbeobachtung erfolgt strukturiert / abgestimmt / standardisiert
Standardisierung der Bildgebung
Technik, strukturierte und abgestimmte Befunde
Patienten geben Daten zu ihrem Zustand selbst ein (pat. rep. outcomes)
Erhöhung der Datenqualität; zusätzlich auch Analysen von Freitexten
Anwendungsfälle von DIFUTURE
Integrierte Daten, bereinigte Daten
IT Systeme/Geräte: Krankenhaus, Praxen, Kassen, KV, Patienten und Bürger
5
Ansatz von DIFUTURE
AnalysenMachineLearning
Studien
Qualität
Neue VerfahrenEntscheidungs-unterstützung
Lernendes Gesundheits-
system
IT als Rückgrat der Tanslation
Bett
Labor
Daten
DatenschutzAnonymisierung
Informationsextraktion, Aufbereitung, Harmonisierung
Integrierte Daten, DWH
PortalDatenzugang
IT Systeme/Geräte: Krankenhaus, Praxen, Kassen, KV, Patienten und Bürger
AnalysenMachineLearning
Studien
Datenintegrationszentrum DIFUTUREForschungssysteme
Datenintegrationszentrum
17.09.2019 7
Data Lake
Klinische Primärsysteme
Projekt-DWH
Projektspezifische Pseudonymisierung
Konnektoren
Übergabe der klinischen Daten mittels KonnektorenDatei- oder REST-basiert: sowohl generisches JSON als auch diverse Standards ( XML, HL7 v2, )
Pseudonymisierung der Daten für DL und für die WeiterverarbeitungTreuhandstelle / Trust Center (TC) als Pseudonymisierungsinstanz
Data Lake (DL)Technische Harmonisierung im JSON-Format auf PostgreSQL-DB
Strukturelle und semantische Integration auf dem Data Lake & beim Export
Bereitstellung der Daten für projektspez. Data Warehouses (DWH)
Konzept
TC
& z.B. PHT
MII Jahresversammlung 2019 – Dortmund Jörg Peter und Fabian Prasser
• Welche Daten sind vorhanden?data discovery
DIC A DIC B DIC C
Anfrage
Verteilte Anfragen
• Generiert und validiert Hypothesen
• Setzt Maschinelles Lernen ein, bspw.Verteilte Regression, SVMs
• “Data Analysis Trains”• GO-FAIR Initiative• Implementation Network Personal Health Trains
Verteiltes Rechnen
DIC A DIC B DIC C
Ru
nti
me
Anfrage
Verteilte Ansätze in DIFUTURE
Multiple Sklerose
Seit 2010: Verlaufsdaten mit Texten, strukturierten Daten, Bildern
- Verteilte Analyse: funktionale Hypothesen, prognostische Regeln
- Regeln zur optimalen/gezielten Behandlungsentscheidung
Ab 01/2018: weitere Verlaufsdaten und neu diagnostizierte Patienten (>500)
- Standardisierung von Bildgebung und Befunddokumentation
- Versorgungsdaten und prospektive Studie
- Verteilte Analysen, Auswertung der Studie
- Validierung der Regeln, Erstellen neuer Hypothesen
- Bewertung der Regeln anhand des Behandlungsergebnisses
KVB: Muster vor Erstdiagnose? Begleitkrankheiten?
neu diagnostizierte
bekannte
Patienten
Standorten>5.000
KVBn=30.000
Aktueller Stand, Beispiele
Strukturierte Verlaufsdokumentation
StrukturierteBildbefundungMRT
Quelle:Prof. Dr. J. Kirschke
Selektion nach Verlauf in i2b2 (CIS zu RRMS innerhalb von drei Jahren)
Hinweis: Die Darstellung veranschaulicht lediglich die Funktionalität. Die Daten wurden hierfür verändert.
Darstellung Verlauf in i2b2
Hinweis: Die Darstellung veranschaulicht lediglich die Funktionalität. Die Daten wurden hierfür verändert.
I2b2: Kohortensuche nach Symptomatik
Hinweis: Die Darstellung veranschaulicht lediglich die Funktionalität. Die Daten wurden hierfür verändert.
tranSMART
Hinweis: Die Darstellung veranschaulicht lediglich die Funktionalität. Die Daten wurden hierfür verändert.
Warehousing & PortaleBereitstellung der integrierten Daten inprojektspezifischen Data Warehouses
Erweiterung von tranSMART / Glowing BearOpen Source Weiterentwicklung
Ausschreibung & Projektauftrag an Firma The Hyve (NL)
Dockerisierung der Projekt-DWH
HL7-FHIR basierter Import
Aufteilung von tranSMART Instanzen (Slicing & Dicing)
Filterung nach genomischen Varianten durchAnbindung an einen Genomic Variant Store
Verwendung von i2b2/tranSMART für MS-UCDockerisierte i2b2/tranSMART Instanzen für Daten des MS-UCs
Neben DIFUTURE-UCs erfolgreich in Mikrobiom-Profiling-Projekt zusammen mit Trust Center Komponente verwendet (TUM)
17.09.2019 17MII Jahresversammlung 2019 – Dortmund Jörg Peter und Fabian Prasser
Beispiel für Sekundärdatennutzung
Hapfelmeier, A., Gasperi, C., Donnachie, E., & Hemmer, B. (2019). A large case-control study on vaccination as risk factor for multiple sclerosis. Neurology, 10-1212:
“..to investigate the hypothesis that vaccination is a risk factor for MS in a systematic retrospective analysis of ambulatory claims data …
Ambulatory claims data held by BASHIP cover all members of the statutory health insurance, approximately 85% of the population of Bavaria. It was available for each quarterly billing period between 2005-2017 …
- 223,035 participants (12,262 patients with MS and 210,773 controls) …
Our findings, derived from a very large number of patients and 3 matched control cohorts …. support the assumption that vaccinations are not associated with a higher likelihood of an MS diagnosis ……”
Vielen Dank an alle DIFUTURE Mitarbeiter!
Involviert sind Informatiker/innen, Biostatistiker/innen,Bioinformatiker/innen, Ärztinnen/Ärzte, Vorstandsmitglieder und weitere Personen
8. & 9. Oktober i2b2 tranSMART FoundationTübingen i2b2 tranSMART 2019 European Symposium
10. Oktober DIFUTURE Symposium 2019Tübingen
27. – 29. November 2. Münchner Digital Health SummitMünchen