Einführung in Microarray Genexpressionsdaten Ewgenij Proschak Yusuf Tanrikulu Seminar:Aktuelle...

Preview:

Citation preview

Einführung in Microarray Genexpressionsdaten

Ewgenij ProschakYusuf Tanrikulu

Seminar: Aktuelle Themen der Bioinformatik13.05.2004

Organizer: Prof. Dr. D. MetzlerTutor: Lin Himmelmann

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

2

Ablauf

13.05.2004 Einführung in Microarray Genexpressionsdaten

20.05.2004 Feiertag

27.05.2004 Varianzstabilisierung der Genexpressionsdaten

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

3

Inhalt

EinleitungDurchführung eines Microarray-

ExperimentsAuslesen der DatenVisualisierungWeiterverarbeitungMustererkennung

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

4

Einleitung

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

5

Einleitung

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

6

Einleitung

Prof. Dr. Wolfgang Huber Gen-

Transkriptionsanalyse mit DNA Microarrays

Statistical Computing Computational Biology

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

7

Durchführung eines Microarray-Experiments

Zutaten: cDNA Unterlage mRNA

Ergebnis

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

8

Durchführung eines Microarray-Experiments

Flashanimation

DVD

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

9

Auslesen der Daten

Laser- oder Betastrahlendetektor

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

10

Auslesen der Daten – Batcheffekte

Verfälschungen des Experimentergebnisses: Spotting PCR Amplifikation Probenaufbereitung RNA-Abbau Array-Beschichtung

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

11

Visualisierung

Wieso?

Frühzeitige Erkennung von Experimentierfehlern und Hintergrundrauschen

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

12

Visualisierung-Falschfarbenrepräsentation

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

13

Visualisierung – Histogramm

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

14

Visualisierung –Scatterplot

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

15

Wieterverarbeitung-Maße für die Genexpression

Aussagen über absolute Genexpression nicht möglich

Gründe: RNA-Stabilität Hybridisierung PCA

Ausweg:

Ratios Log-Ratios

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

16

Weiterverarbeitung-Exkurs

Heteroskedastizität Varianz nicht konstant

Homoskedastizität Varianz konstant

Nächstes Mal

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

17

Weiterverarbeitung

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

18

Mustererkennung-Methoden

Projektionsmethoden Hauptkomponentenanalyse SOMs

Clusteralghorithmen Hierarchisches Clustering

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

19

Mustererkennung-Hauptkomponentenanalyse

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

20

Mustererkennung-Hauptkomponentenanalyse

Projektion des Datensatzes auf die Hauptkomponenten

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

21

Mustererkennung-Hauptkomponentenanalyse

Aufstellen der Covarianzmatrix

Finden der Eigenvektoren

Projektion des Datensatzes auf die Eigenvektoren mit den größten Eigenwerten

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

22

Mustererkennung-Hauptkomponentenanalyse

Ergebnisse (Alter et al. 2000):

Eigenvektor mit dem größten Eigenwert: Hintergrundrauschen kann herausgefiltert werden

Danach Projektion auf die beiden nachfolgenden Eigenvektoren periodische Funktion von der Zeit repräsentiert den Zellzyklus

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

23

Mustererkennung-Self Organizing Maps

X

Z

Y

SOM

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

24

Mustererkennung-Self Organizing Maps

Algorithmus:

1. Zufälliges Aussuchen eines Musters

2. Ermitteln des Gewinnerneurons

3. Aktualisieren der Neuronengewichte

4. Zurück zu 1 oder terminieren

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

25

Mustererkennung-Self Organizing Maps

LernzeitVoronoi-Verteilung

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

26

Mustererkennung-Clusteralgorithmen

Basiert auf globaler Ähnlichkeitsmessung

Ziel: Aus den Genexpressionsdaten auf funktionelle

Verwandschaft oder Coregulation zu schließen.

Annahme: Gene, die gemeinsame Eigenschaften

aufweisen, haben ähnliche Expressionsprofile.

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

27

Mustererkennung-Hierarchisches Clustern

Top-downBottom up

13.05.2004 Einführung in Mictoarray Genexpressionsdaten

28

Mustererkennung-Hierarchisches Clustern

Anwendungsbeispiel:

CAGE

Ewgenij Proschak

To be continued…

Yusuf Tanrikulu

Recommended