38
Vorlesung SS 07 Biomedizinische Informationssysteme INHALTE 2. Vorlesung SS 07 Motivation Informationsverarbeitung Biologie / Medizin / Medizinische Informatik Grundlagen: Datenbanken und Informationssysteme

Vorlesung SS 07Biomedizinische Informationssysteme INHALTE 2. Vorlesung SS 07 Motivation Informationsverarbeitung Biologie / Medizin / Medizinische Informatik

Embed Size (px)

Citation preview

Vorlesung SS 07 Biomedizinische Informationssysteme INHALTE

2. Vorlesung SS 07

Motivation

Informationsverarbeitung

Biologie / Medizin / Medizinische Informatik

Grundlagen: Datenbanken und Informationssysteme

Medizin

Die Wissenschaft von der Krankheitsursache, der Heilung und Vorbeugung von Krankheiten.

 

Medizinische Informatik (Trampisch)

Mittels Methoden und Werkzeuge der Informatik sollen Struktur und Wirkungsweise der informationsverarbeitenden Systeme in der Medizin analysiert werden. Hier stehen die Komponenten im Bereich der Gesundheitsversorgung im Mittelpunkt.

Es werden Methoden aus der Mathematik (Statistik, usw.), der Informatik, der Linguistik und der Biometrie eingesetzt.

Vorlesung Biomedizinische Informationssysteme MOTIVATION

1

Kernpunkte:

Automatisierte Datenerfassung und Auswertung:

Uninterpretierte Präsentation von Daten, wie z.B. EKG, CT, Labor, Intensiv-Pflege-Überwachung.

Elektronische Datenhaltung:

Chipkarte und elektronische Krankenakte.

Informations-Anwendungen:

Interpretierte, sinnvermittelnde Daten, wie z.B. die elektronische Krankenakte.

Wissensverarbeitung:

Erste Systeme in der Anwendung.Vorlesung Biomedizinische Informationssysteme MOTIVATION

2

American Medical Association (AMA)  

Medizinische Informatik ist eine Disziplin, die mit der Hilfe von Computern und Netzwerken versucht, Informationen zur Unterstützung der Pflege, der biomedizinischen Forschung und der Lehre bereitzustellen.

Die Anwendungen werden in vier Gruppen eingeteilt:

(1) Speichern / Wiederfinden (Retrieval) von Informationen,

(2) Kommunikation,

(3) Aus- und Weiterbildung in der Medizin und

(4) entscheidungsunterstützende Systeme in der Medizin.

Vorlesung Biomedizinische Informationssysteme MOTIVATION

3

 Topics der Medizinischen Informatik

- Medizinische Terminologie.

- Das Gesundheitsversorgungssystem der BRD.

- Medizinische Physik und Biophysik:

Tomographie, Mikroskopie, Chromatographie, ...

- Bild- und Signalverarbeitung in der Medizin / Biologie:

Schnittbilder, Mikroskopie, Laborsysteme, …

4

Vorlesung Biomedizinische Informationssysteme MOTIVATION

 Topics der Medizinischen Informatik

- Krankenhauskommunikations- und -informationssysteme:

KKIS, Kommunikationssysteme, Datenbanken,

Archivsysteme, Workflow-Modelle, BWL.

- Wissensbasierte Systeme.

- Laborinformationssysteme.

- Bioinformatik dynamischer Systeme. 

5

Vorlesung Biomedizinische Informationssysteme MOTIVATION

Grundlegende Begriffe

Krankheit (im engeren Sinn) Bezeichnet das Vorhandensein von subjektiv Empfindungen bzw. objektiv feststellbaren körperlichen, geistigen bzw. seelischen Veränderungen bzw. Störungen.

Symptome Krankheitszeichen, so dass man auch die pathologischen Befunde unter diesen Begriff fassen kann. Deshalb wird von Symptomen gesprochen, obwohl man Symptome und Befunde meint.Vorlesung Biomedizinische Informationssysteme BEGRIFFE

6

DiagnoseDie Krankheit erkennen / benennen.

DifferentialdiagnoseÄhnliche Krankheitsbilder unterscheiden.

Um eine Krankheit erkennen zu können - Diagnostik:Direkte und indirekte Verfahren - es fallen Daten an.

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

7

Informationsquellen für die Diagnose (klassisch):

- Anamnese, - Untersuchungsbefunde und - Krankheitsverlauf.

Das Krankheitsbild eines Patienten:

- Symptome und

- pathologische Befunde.

Eine Reihe von möglichen Krankheiten (Hypothesenfokus), die diese Symptome erklären können.

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

8

Induktion

Der Schluss von den Symptomen auf die Krankheiten.

1. Eine der Hypothesen als bestmögliche ansehen.

2. Ableiten, welche weiteren Symptome vorliegen müssten. Dieser Schritt heißt Deduktion!

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

9

TherapieDie Behandlung einer Krankheit, die symptomatisch oder kausal sein kann. Medikamente, Operationen, Bestrahlung, etc.

Therapeutische EntscheidungenAuf jeder Stufe der Diagnostik kann Therapie erforderlich werden.

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

10

Der therapeutischer Entscheidungsprozeß umfasst:

1. Auswahl einer Therapie,

2. Planung und

3. Überwachung.

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

11

Molekulare Medizin (Biomedizin)Anwendung der Methoden der Molekularen Biologie im Bereich der

Diagnose (z. B. diagnostische Chips) und

Therapie (z. B. Gentherapie).

Gendefekte / Mutationen

Die Biosynthesekette ist unterbrochen, was mehr oder weniger starke Auswirkung auf den Metabolismus hat.

Die Reparaturenzyme sind defekt.

Die RNA-Moleküle sind defekt.

usw.

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

12

Molekulare Medizin (Biomedizin)

 Modelle der Genregulation

Grundlegend: Jacob und Monod Modell der Regulation. 

Britton-Davidson Modell: Klasse der abstrakten Modelle.

Abstrakte Modelle: Kauffmans binäres Automatensystem und die logische Repräsentation der metabolischen Netzwerke von Thomas.

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

13

METABOLISCHE WIRKNETZE

Der Metabolismus umfasst die biochemischen Prozesse einer Zelle:

Biosynthese,

Proteinsynthese sowie

Zellkommunikation.

Darüber hinaus docking, um z.B. Gene zu aktivieren, Biosynthesen zu realisieren oder Induktor-Rezeptor Bindungen darzustellen.

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

14

METABOLISCHE WIRKNETZE

Biosynthese: Enzymatisch gesteuerte biochemische Reaktionen im Metabolismus. Bedingen solche Übergänge einander, so spricht man von metabolic pathways.

Enzym: Ein Protein mit der Eigenschaft, biochemische Prozesse zu katalysieren und unverändert aus dieser Reaktion hervorzugehen.

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

15

Stoffwechselerkrankungen

Erbliche Erkrankungen, deren Symptome durch einen biochemischen Defekt im Stoffwechsel des Organismus verursacht werden.

Die Symptome können in ihrer Ausprägung sehr variabel sein. Häufig treten sie innerhalb der ersten Lebenstage des Neugeborenen auf.  

Therapie

Viele dieser Erkrankungen können durch eine diätetische Therapie behandelt werden. Dabei werden z.B. die Substanzen vermieden, die vom Organismus nicht abgebaut werden können, oder alternative Stoffwechselwege werden medikamentös unterstützt.

Vorlesung Biomedizinische Informationssysteme BEGRIFFE

16

Biochemische Reaktionsketten: Michal 2007Bekannt sind u.a. der Zitronensäurezyklus oder der Harnstoffzyklus. 

17

Genotyp

Metabolic Pathways

Phänotype

Drugs

SynthesisReg

ulatio

n

Influence

Effect

EMBL

TRANSFAC

KEGG

WIT

Ramedis

METAGENE

OMIM

ASDB

RListe

......

......Relevante Datenbanken

18

Grundlegende Definitionen

Datenbank:

Eine Datensammlung, die Fakten über Anwendungen eines modellierten Ausschnittes der Realwelt repräsentiert, die dauerhaft (persistent) und weitgehend redundanzfrei gespeichert wird.

Datenbank-Management-System (DBMS):Eine Sammlung von Programmen, die das anwendungsabhängige Erzeugen, Ändern und Löschen einer Datenbank ermöglicht.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

19

Datenbanksystem:

Kombination eines Datenbank-Management-Systems mit einer oder mehreren, unterscheidbaren Datenbanken.

Die Abfrage der Daten - Abfragesprache

z.B. die Structured Query Language (SQL).

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

20

Datenbanksystem

Anforderungen an Datenbanksysteme / Codd’schen Regeln: 

1. Operationen: Speichern, ändern und suchen.

2. Benutzersichten: Zugriffe auf Datenbankbeschreibungen.

3. Benutzersichten: Nutzerspezifische Auswahl der Daten.

4. Integration: Einheitliche und nichtredundante Datenverwaltung.

5. Konsistenzüberwachung: Korrektheit des Datenbestandes.

6. Datenschutz: Ausschluss unautorisierter Zugriffe.

7. Transaktionen: Mehrere Datenbank-Operationen als funktionelle Einheit.

8. Synchronisation: Parallele Transaktionen koordinieren.

9. Datensicherung: Widerherstellung von Daten und Systemfehlern.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

21

Informationssystem (IS):

Ein komplexes, zusammengesetztes Softwaresystem mit aufeinander bezogenen informationsverarbeitenden Komponenten. Diese können in Erzeugung, Speicherung, Umformung, Transport und Darstellung gegliedert werden.

In der Biomedizin werden die Begriffe Informationssystem und Datenbank häufig synonym verwendet.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

22

...

INTERFACE

S c h n i t t s t e l l e / I n t e g r a t i o n

Anwendungssoftware

Nutzer Nutzer

WWW

.......Externe DB

DB

Aufbau eines InformationssystemsAufbau eines Informationssystems

Informationssystem (IS)

Eigenschaften eines IS:: 

-    Realisiert eine dauerhafte (persistente) Speicherung von Daten. Dabei ist eine Datenbank oder ein Datenbanksystem Bestandteil eines Informationssystems.

-      Wertet die gespeicherten Daten anwendungsspezifisch aus.

-        Ist durch Anpassung und Erweiterung dynamisch.

-       Integriert weitere (externe) Informationsquellen.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

24

Datenquelle

Sie besteht aus mindestens einem Computer, auf dem Daten gespeichert werden können und auf die über Schnittstellen zugegriffen werden kann.

Die Datenquelle ist immer autonom verfügbar.

Demgegenüber ist eine Datenbank immer im Kontext mit einem Datenbanksystem zu sehen.  

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

25

Flat-File

Eine Datei, die eine bestimmte, implizite Struktur besitzt.

Ist ein Flat-File auf einem Rechner verfügbar, so wird diese Kombination auch als Datenquelle verstanden.

Ein Flat-File besteht aus verschiedenen Zeilen, in denen Daten häufig in ASCII-Format enthalten sind.

Beispiel: Ausschnitt aus der Flat-File Datenbank KEGG: 

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

26

ENTRY EC 2.1.3.3

NAME Ornithine carbamoyltransferase

Citrulline phospharylase

Ornithine transcarbamylase

CLASS Transferases

Transferring one-carbon groups

Carboxyl- and carbamoyltransferases

SYSNAME Carbamoyl-phosphate:

L-ornithine carbamoyltransferase

...

Das Zeilenende ist durch bestimmte Zeichen gekennzeichnet (in der Regel Enter).

Die Trennsymbole (z.B. Sonderzeichen) zur Unterscheidung der Daten innerhalb einer Zeile.

Auch eine Unterscheidung innerhalb der Zeile ist möglich, wie in unserem Beispiel dargestellt. So sind auf der linken Seite Schlüsselwörter wie z.B. ENTRY, NAME und SYSNAME zu erkennen.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

27

Eine Datenbank soll auch die Redundanzfreiheit sicherstellen.

Von einer Datenquelle ist dies nicht zu fordern!

Datenintegration

Redundanzfreie und einheitliche Verwaltung aller von Anwendungen bzw. von Anwendern benötigten Daten.

Weiteres Ziel: Die Zusammenführung von Informationen, die verteilt in Datenquellen vorliegen.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

28

Noch größere Anforderungen an die Zusammenführung von Daten bzw. Informationen stellt die Informationsfusion.

Informationsfusion

Ein Prozess, dessen Aufgabe es ist, Daten oder Informationen aus verschiedenen, zum Teil heterogenen Datenquellen zu kombinieren, zu verdichten, zu interpretieren und daraus Informationen einer neuen Qualität abzuleiten.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

29

Grundlegend für Biomedizinische Informationssysteme ist die Integration spezifischer Datenquellen.

Die Entwicklung von komplexen Informations-systemen, die über Internet global zugreifbar sind und letztlich eine multidimensionale Datenbank umfassen, die durch Analysealgorithmen gezielt ergänzt wird.

Die Integration der relevanten Datenquellen und Analysetools.

Grundlegend für unsere Fragestellungen sind die Datenbanken, die die metabolischen Prozesse repräsentieren.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

30

BioMed-Informationssysteme

1. Elektronische Netzwerke – Fragestellungen direkt im Expertenkreis diskutieren.

BIONET-Netzwerk!

2. Erfassen der Datenbestände (Datenbanken)

Kann in vielen Bereichen weitgehend automatisiert werden: Sequenzierung, Proteomics, Laborwertbestimmung, usw.

3. Elektronische Datenhaltung erlaubt über Internet den weltweiten direkten Zugriff (Informationssysteme aufbauen).

Datenbankabfragesprachen ermöglichen auch erste Methoden der Datenanalyse.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

31

Modellentwicklung auf der Basis dieser BioMed-Daten führt direkt

auch zur Implementation hypothetischer Welten.

Modellierung und Simulation!

Informationssystem im Internet – Kennzeichen:

1. Die persistente Speicherung von Daten.

2. Die Möglichkeit der Datenabfrage.

3. Die Auswertung und die Analyse der Daten.

4. Die Einhaltung der Integritätsbedingungen.

5. Die Integration externer Datenquellen.

6. Die Existenz einer Benutzerschnittstelle.

7. Die Möglichkeit der verteilten Modellierung.Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

32

Dateibasierte Informationssysteme

Oft dateibasierte Datenhaltungssysteme, in denen die Daten bereits in HTML-Dateien oder anderen strukturierten Dateien gespeichert sind.

Eine Datenunabhängigkeit ist hier nicht gegeben.

Die Systeme dienen nur der Repräsentation der Daten, die durch Nutzung des Internets und seiner Dienste erfolgt.

Die Änderungen der Datenbestände werden nur von ausgewählten Personen vorgenommen.

Zugriff: HTML-Browser.

Die Zugriffszeiten sind von der Netzauslastung abhängig.

Navigierender Zugriff (Angabe URL).Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

33

Internet-Schnittstelle

CGI-Schnittstellen und Mechanismen aus der Java-Welt wie Servlets oder Applets.

Dadurch ist eine komplexe Verarbeitung und Darstellung von Daten möglich.

 

Lokale Installation eines Systems

Über das Internet erreichbar - einige Systeme bieten die Möglichkeit eine komplette oder partielle Kopie auf einem lokalen Rechner zu installieren.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

34

Verteilte Informationssysteme

Hauptaufgabe: Das Zusammenführen von räumlich getrennt gespeicherten aber logisch teilweise zusammengehörenden Daten.

Der Zugriff von verschiedenen Rechnern auf verteilte Datenbestände.

 

Klassifikation: Zentrale, verteilte und Multidatenbanksysteme

Zentrale DBS: Klassische Systeme - DMBS und Datenbank.

Verteilte DBS: Einem DBMS - der Datenbestand ist hier auf mehrere Rechner verteilt.

MultiDBsystem: Verbund von mehreren Datenbanksystemen, die jeweils ihr eigenes DBMS besitzen.

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

35

DatawarehouseDie Daten werden aus teilweise heterogenen Systemen in ein einzelnes darüberliegendes Datenbanksystem extrahiert. Bei der Extraktion der Daten müssen Transformationen bezüglich der unterschiedlichen Datenmodelle und Schemata durchgeführt werden.Die Daten werden der weiteren Analyse unterzogen (Data Mining).

Vorlesung Biomedizinische Informationssysteme GRUNDLAGEN

36

DATA

Metadaten

Analyse

Visualisierung

Data-Warehouse

Bereinigung Umformatierung...

Data-Mining

Weitere Dateneingaben

Datenbanken

37