28
Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Embed Size (px)

Citation preview

Page 1: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Forschungsschwerpunkt Biomedizinische Semantik

Stefan SchulzMUG-IMI, 2.3.2011

Page 2: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Grundannahmen

• Informationen in medizinischer Praxis und klinischer Wissenschaft werden kommuniziert:– vor allem anderen: in freitextlicher Form– strukturiert, aber mit proprietären Attributen / Werten (z.B. Archimed)– strukturiert mit standardisierten Werten– strukturiert mit numerischen Werten– als Biosignale

• Symbole (Zeichen) haben Bedeutungen– Symbole repräsentieren Denkeinheiten (Begriffe)– Zumeist Korrelate zu Objekten einer realen Welt– Interpretation des Benutzerkontextes fundamental

Page 3: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Ziel: Semantische Interoperabilität

Kommunikation ohne Bedeutungsverlust / -verzerrung: Vielfältige Probleme: • A1 möchte alle Patienten mit Magenulkus (K25) zählen,

aber A2 hat auch die Patienten mit Verdacht auf Magenulkus mit ICD-10:K25 kodiert.

• Magenulkus ist eine nicht kodierte Nebendiagnose. Freitextsuche nach „Magenulkus“ findet nicht Texte mit „Magenulcus“

• Suche auch erfolgreich bei Arztbriefen mit – „Magenulkus“in der Familienanamnese steht– „Der Patient bekam Omeprazol zur Prophylaxe eines Magenulkus

• Gastroskopieberichte mit „keine Ulzera“, „Ulzera können nicht ausgeschlossesn werden“

– Negation erkannt?– Magenulkus ausgeschlossen?

• Was ist mit „Stressulcus im Corpusbereich“ ? – Verarbeitung auf lexikalischer, semantischer und ontologischer Ebene

Page 4: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Semantik findet auf mehreren Ebenen statt

Page 5: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Semantik findet auf mehreren Ebenen statt

Page 6: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Semantik findet auf mehreren Ebenen statt

Page 7: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Wortfragment-basierte

Dokumenten-indexierung

• Identifikation kleinster bedeutungstragender Elemente der Medizinsprache: Wortfragmente („subwords“)

• Gruppierung bedeutungstragender Wortfragmente • Erstellung eines Subword-Thesaurus• Nachweis des Vorteils bei sprachinternem und

sprachübergreifenden Dokumentenretrieval

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}

„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Page 8: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Indexierung durch Wortfragmente

abdominadenomakutanalysantibiotausmassbasisbiologblutchirurgchronidarmdatendiagnosteingriffempfindlichentzuendepidemiologexpressfamilifapfeinheredithinsichtlichhnpccimmunindikiortitiskarzinklinkolitiskolon

kombinkrankkrohnlymphmodalmolekulmultinonoperation ordnosispankreaspankreatperitonpolypprojektprophylaktpunktresektschwerpunktstellsuppressthematherapueber ulzerversuszeitzielzytzytokin

Page 9: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Indexierungdurch Subwort – Synonymklassen-IDs

qxxqkyyxyqwxyyxqkxzzkqyzyyzqkqkkqkkyqkqzzkyzxqkqqxqxkzqkqxkzkqxqqkkzzkqzyzqyyzyzkkzyxqkzqqyqqqkqxxzxqkzxkqqqqyyyzxkzxqkkkqkzzqkqqzkzyzqkqzzzqqzzyyyyyqkkqyzqqqkqzzkqkyzyyqqkkkkxyzqkzxqkyzkkzqxyqqkqkz

zzyqkkyzxqkzyzzqyzyyzqkqzkqkyzzkqzzkyzqkqqqxxkzyqqxkzxqqkxxqzkqzqzyyyzykykzyqkxzqqqzqkqkqzzxqkyyxkqqqyyyyzxkzxqkkqqkzzqqkzkzqkyqkqzzzqqzzyyqqkzqkqyzqqqqzzkkkyzykqqkkkyqxyzqkqqkqkqy

{entzuend; itis}

{pankreas; pankreat; bauchspeicheldrues}

{periton; bauchfell}

Page 10: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Evaluation

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Recall

Prec

isio

n

Deutsch – Deutsch – Wortindex

Deutsch – Deutsch – Subwort- Synonymklassen

0,5

0,55

0,6

0,65

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Recall

Prec

isio

n

Englisch – Englisch – Wortbasierter Index

Deutsch – Englisch – Subwort- Synonymklassen

Deutsch – Englisch – Automatische Anfrageübersetzung

0,5

0,55

0,6

0,65Szenario 1 Szenario 2

Page 11: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Semantik findet auf mehreren Ebenen statt

Page 12: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Erstellen von Domänenontologien

• BioTop: – Festlegung fixer Kategorien und Relationen für die

Repräsentation grundlegender biomedizinischer Terme– Axiomatische Fixierung von „Grundwahrheiten“, die in der

medizinischen Wissenschaft und Praxis unumstritten sind und als „Trivialwissen“ wissensbasierten Anwendungen zur Verfügung gestellt werden

– Verwendung des Semantic-Web-Standards OWL

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}

„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Page 13: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

BioTop: Beispiel

nach Klassifikation:

Page 14: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Einsatz von BioTop

• Als Top-Level-Ontologie in verschiedenen Projekten:– DebugIT (EU): institutionenübergreifende Identifikation von

Patientenrisiken: semantische Queries (z.B. bei welchen Patienten wurde die Medikation auf Grund eines Antibiogramms geändert)

– NTDO: Strukturierung von Wissen über vernachlässigte tropische Erkrankungenz.B. Welcher Erreger kann in welcher geographischen Region durch welches Insekt übertragen werden

– Ontologie medizinischer Lernziele (Informationsobjekte!)

• Als Exempel für „Good Practice Ontology Design“– BioTop beschränkt stark die „Freiheit“ des Ontologieentwicklers– Derzeit zusätzliche Ontology Design Patterns in Arbeit– Empirische Studie zu Ontologiedesign mit Versuchspersonen geplant

Page 15: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Sicherung der Qualität von

Domänenontologien (I)

• SNOMED CT– Riesige, zunehmend ontologiebasierte internationale

Terminologie für die Beschreibung der Inhalte elektronischer Krankenakten

– Mitglied im Content Committee der IHTSDO und im IHTSDO-WHO-Beirat

• Aufgaben: Erstellung von Modellierungsrichtlinien, Formulierung von Übersetzungsrichtlinien, Sicherung ontologischer Korrektheit

• Harmonisierung SNOMED – WHO-Klassifikationen, z.B. bei der Erstellung von ICD-11

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}

„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Page 16: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Sicherung der Qualität von

Domänenontologien (II)

• OBO (Open Biomedical Ontologies) Foundry– Mitwirkung bei der Erstellung von Modellierungsprinzipien– Qualitätschecks anhand von Stichproben:

Chordin isoform 1 unmodified form subclassOf Chordin isoform 1 and lacks_modification

some Post-translational protein modification

Ureter_Small_Cell_Carcinoma subclassOf Disease_May_Have_Finding some Pain

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}

„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Page 17: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Semantik findet auf mehreren Ebenen statt

Page 18: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}

„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Ontologien und Terminologien im klinischen Kontext

• Beispiel: automatische Kodierung von Inhalten der elektronischen Patientenakte mittels SNOMED CT

• Quelle: Entlassberichte aus Krankenhaus in Brasilien (portugiesisch)

• Ziel SNOMED CT (spanisch, englisch)• Methode: NLP-Pipeline mit verschiedenen

Verarbeitungsschritten, u.a. morphosemantische Indexierung

Page 19: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

sentencedetecting

spellchecking

acronymexpansion

NErecognition

POStagging

NPextraction

contextdetection

morpho-semanticabstraction

SCT - EN

SCT - SP

subsetcreation

morpho-semanticabstraction

MID-Representation

SNOMED CT

MID-Representation

Term candidates

Page 20: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Gold standard (kappa = 0.89)

Page 21: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Ergebnisse

Number of tokens (MIDs) Correct Mappings2 66%3 71%4 80%5 89%6 79%7 80%8 75%9 45%10 25%

Total 78 %

Page 22: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

FehleranalyseCategory % Description

Extraction of NPs 20

MorphoSaurusmapping 24

no mapping (1/3) false mapping (2/3)

false context 3660 % negation40% other contexts

spelling problems 4

acronym problems 1

other errors 15

Page 23: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Kontext 1

death

acute abdomen

CTabdomen

aortic aneurysm

aneurysm-ectomy

vascular prosthesis

systemicinfection

multiple organ failure

vasoactive drug

hemodialysis

Patient admitted with acute abdomen. Abdominal CT: leaking abdominal aortic aneurism. Emergency aneurysmectomy with prosthesis. Postoperative evolution with systemic inflammatory response syndrome, multiple organ failure and hemodynamic instability. Despite application of vasoactive drugs, volume replacement and hemodialysis, the patient's condition worsened evolving to death.

death

death

Ontologie, z.B. SNOMED CT

Page 24: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Kontext 2

incisionalhernia herniorrhaphy

operation room

liver transplant

operation

• exists • doesn’t exist• reference to a

plan

operation

• reference to a suspendedplan

• exists • referenceto a plan

• NOT referringto the samepatient

• reference to a new plan

• not yet executed

Patient with incisional hernia admitted for herniorrhaphy, but operation was suspended because operation room was urgently needed for liver transplant. Discharged with orientation and rescheduled operation.

Ontologie, z.B. SNOMED CT

Page 25: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Automatisches vs. Manuelles Kodieren

Quality

Volume

fair motivation

low motivation

high motivationenough time

Page 26: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Automatisches vs. Manuelles Kodieren

Quality

Volume

fair motivation

low motivation

high motivationenough time ?

Page 27: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe

• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}

„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase

• Theorie der Realität- Kategorien- Axiome

• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus

• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger

Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“

Terminologie Ontologie

Epistemologie

Beantragte / geplanteProjekte

• Eingereicht:– EU – NoE SemanticHealthNet: Harmonisierung semantischer EHR –

Standards– CEHRTAIN (IP): Prototyp sprachübergreifender EHR-Interoperabilität– RealEH: Semantische Aufarbeitung der elektronischen Krankenakte

zur Sekundärnutzung

• In Vorbereitung (gemeinsam mit JR + Averbis): Ö-Bridge und EU-SME – Antrag zu EHR – Retrieval + Summarization

• In Vorbereitung (gemeinsam mit Averbis + IHTSDO): Terminology Services / Cloud Computing

Page 28: Forschungsschwerpunkt Biomedizinische Semantik Stefan Schulz MUG-IMI, 2.3.2011

Auf purl.org/steschu Links zu Präsentationen und Publikationen