13
Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich , ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Embed Size (px)

Citation preview

Page 1: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Pfad Akt.Nr.: xxxx/xxxxx/xxxx

Analyse Medizinischer Freitexte

Lukas Faulstich , ID GmbH & Co. KGaA

Projekttreffen ByMedConnect | München, 12.03.2010

Page 2: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Übersicht

• Motivation: Einsatzszenarien der medizinischen Informationsextraktion

• Herausforderungen bei der Analyse medizinischer Freitexte

• Lösungen: IE-Tool / Web-Komponenten / ID Logik Word-AddIn

• Zusammenfassung

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 2

Page 3: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Einsatzszenarien der medizinischen Informationsextraktion

Ziel:

• Inhaltliche Erschließung von medizinischen Dokumenten (z.B. Befunden, Arztbriefen)

Anwendungsmöglichkeiten:

• Recherche semantisches Retrieval

• Codierung Erkennung von abrechnungsrelevanten Diagnosen / Prozeduren / Medikationen

• Plausibilisierung Abgleich mit vorhandener Codierung

Arzneimitteltherapiesicherheit

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 3

Page 4: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Herausforderungen bei der inhaltlichen Erschließung

• vielfältige Formulierungsvarianten

• teilweise mangelhafte Textqualität

• Formeln

• negierte Aussagen

• semantische Beziehungen

• irrelevante Informationen (anwendungsabhängig)

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 4

Page 5: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Linguistische Varianz in med. Freitexten

Beispiel: Gastritis

• Synomyme: Magenschleimhautenzündung

• Unterbegriffe: akute G~, chronische G~, Refluxgastritis, Ménétrier(-Syndrom) ...

• Akronyme: DG (diffuse Gastritis)

• Verkürzungen: gastr, gastr.

• Schreibfehler: Gastirtis, Zeichensetzung

• Getrennt- / Zusammenschreibung: Entzündung der Magenschleimhaut

• dt. / lat. Schreibweise: Kolon, Colon

• Groß-/Kleinschreibung: im = IM = Innenmeniskus?

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 5

Page 6: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Lösung: IE-Tool

• linguistische Textaufbereitung

• Verschlagwortung mit Konzepten (Indizes) der Wingert-Nomenklatur

• semantische Repräsentation

• Verknüpfung der semantischen Repräsentation mit ID MACS® – medical semantic network – (MSN)

• Visualisierung

• Beispielapplikationen (Retrieval, Codierung)

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 6

Page 7: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Textaufbereitungs-Pipeline

Un-strukturierter Text

Un-strukturierter Text

GliederungSatz-

segmentierung

Parsen / Floskeln

erkennen

Segment-ierung

Abk.-Exp.

semant.BeziehungenExtraktion Indexierung

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 7

Page 8: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

IETool: Visualisierung

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 8

Page 9: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

IETool: Codierung von Medikationen

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 9

Page 10: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Arzneimitteltherapiesicherheit: Web-Portal ID PHARMA CHECK®

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 10

Page 11: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Lösung: ID Logik WordAddIn

Medizinische Text-Retrieval-Systeme | Folie 11

Page 12: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Fazit

• Freitextanalyse medizinischer Dokumente verspricht attraktive Anwendungen für Retrieval, Codierung, Plausibilisierung u.a.m.

• heuristische Verfahren sind fehlerbehaftet vollautomatische Anwendungen weniger sinnvoll interaktive Anwendungen vorzuziehen

• ID LOGIK® Terminologieserver bietet verschiedene Dienste zur Informationsextraktion

• Einbindung dieser Dienste z.B. im Word-AddIn

• Web Components bündeln Dienste für bestimmte Anwendungen

Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 12

Page 13: Pfad Akt.Nr.: xxxx/xxxxx/xxxx Analyse Medizinischer Freitexte Lukas Faulstich, ID GmbH & Co. KGaA Projekttreffen ByMedConnect | München, 12.03.2010

Pfad Akt.Nr.: xxxx/xxxxx/xxxx

Vielen Dank für Ihre Aufmerksamkeit !