32
Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Methoden & Tools für die Expressionsdatenanalyse Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Embed Size (px)

Citation preview

Page 1: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1

Methoden & Tools für die Methoden & Tools für die ExpressionsdatenanalyseExpressionsdatenanalyse

Page 2: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-2Expressionsdatenanalyse

Vorgehensmodell Vorgehensmodell ExpressionsdatenverarbeitungExpressionsdatenverarbeitung

Bildanalyse

Normalisierung/Filterung

Datenauswertung

Page 3: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-3Expressionsdatenanalyse

BildanalyseBildanalyse

Bilddatei einlesen Spot-Raster berechnen Abbildung Spot-Intensitäten auf numerische Werte

- Bestimmung der Spot-Grenzen- Berechnung der Spot-Intensität- Ermittlung der Bild-Hindergrundintensitäten und Korrektur

Spotintensität Qualitätskontrolle Ausgabe Textdatei

Ziel: Numerische Darstellung Arrays

Page 4: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-4Expressionsdatenanalyse

NormalisierungNormalisierung

Mathematisch:Skalierung des Wertebereichs auf einen bestimmten Bereich, üblicherweise zwischen 0 und 1 (bzw. 100 Prozent)

Mess-Ergebnisse mit unterschiedlicher Grundlage vergleichbar z.B.:(50 Studenten mit der Note 1 vs. 10% mit Note 1)

Aber: Bioinformatik:- Background Correction- Normalization- Quantification / Summarization

Ziel: Vergleichbarkeit von Arrays

Page 5: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-5Expressionsdatenanalyse

Normalisierung: DurchschnittNormalisierung: Durchschnitt

Forderung:Verhältnis der Durchschnittsintensitäten (AVG) der Hybridisierungen ist gleich

Mathematisch:AVGHyb1 = AVGHyb2

Beispiel:- Hyb1: (1,2,5,1,6)- Hyb2: (100,200,500,100,600)

- AVGHyb1 = 3 AVGHyb2 = 300

- AVGHyb1 / AVGHyb2 = 0,01

- Hyb2norm = Hyb2 * 0,01

- Hyb2norm = (1,2,5,1,6)

Page 6: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-6Expressionsdatenanalyse

Normalisierung: QuantilNormalisierung: Quantil

Normalisierung über ein Set von Hybridisierungen.

Annahme: Die meisten Gene sind in allen Experimenten gleich stark expremiert→ Die Chips haben gleiche Intensitätsverteilung

Normalisiere so, dass die Quantilen jedes Chips gleich sind.

Page 7: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-7Expressionsdatenanalyse

Normalisierung: Quantil - BeispielNormalisierung: Quantil - Beispiel

Hyb1 Hyb2

G1 1 10

G2 2 30

G3 5 5

G4 3 20

Hyb1 Hyb2 AVG

5 30 17,5

3 20 11,5

2 10 6

1 5 3

Hyb1 Hyb2

G1 3 6

G2 6 17,5

G3 17,5 3

G4 11,5 11,5

1. 2.

3.

4 Quantile

Page 8: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-8Expressionsdatenanalyse

TM4 - TM4 - http://www.tm4.org/http://www.tm4.org/

Page 9: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-9Expressionsdatenanalyse

TM4 - Überblick ITM4 - Überblick I

Software von TIGR (The Institute of Genomic Ressearch):

“Microarrays have emerged as the premier tool for studying gene expression on a genomic scale.

Advances in the precision of array printers and scanners as well as improved laboratory protocols allow for assays of tremendous complexity and scope.

Scientist seeking to harness the potential of this technique are often challenged by the prodigious quantities of data produced.

Well-designed, user-friendly software is the key to tracking, integrating, qualifying, and ultimately deriving scientific insight from the experimental results.

In support of our ongoing work in microarray analysis of gene expression, we developed a suite of software that allow users in the laboratory to capture, manage, and analyze effectively data from DNA microarray experiments.”

Page 10: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-10Expressionsdatenanalyse

TM4 - Überblick IITM4 - Überblick II

4 Hauptkomponenten: TIGR Spotfinder: Bildanalyse Microarray Data Analysis System (MIDAS): Normalisierung,

Filterung Multi Experiment Viewer (MeV): Interpretation der Ergebnisse Microarray Data Manager (MADAM):

Zusatzmodule: MIAME-compliant MySQL database Automated Microarray Pipeline ExpressConverter SlideMap …

Page 11: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-11Expressionsdatenanalyse

TIGR – Spotfinder ITIGR – Spotfinder I

Page 12: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-12Expressionsdatenanalyse

TIGR – Spotfinder IITIGR – Spotfinder II

Page 13: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-13Expressionsdatenanalyse

TIGR – Spotfinder: Interne TIGR – Spotfinder: Interne DokumentationDokumentation

Ausschnitt aus:

ftp://occams.dfci.harvard.edu/pub/bio/training/TIGRSpotfinder.ppt

Page 14: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-14Expressionsdatenanalyse

MIDAS: Microarray Data Analysis MIDAS: Microarray Data Analysis System ISystem I

Page 15: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-15Expressionsdatenanalyse

MIDAS: Microarray Data Analysis MIDAS: Microarray Data Analysis System IISystem II

Page 16: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-16Expressionsdatenanalyse

MIDAS:MIDAS: Interne DokumentationInterne Dokumentation

Ausschnitt aus:

http://www.tm4.org/documentation/MIDAS2_19.ppt

Page 17: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-17Expressionsdatenanalyse

MeV: MultiExperiment Viewer IMeV: MultiExperiment Viewer I

Page 18: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-18Expressionsdatenanalyse

MeV: MultiExperiment Viewer IIMeV: MultiExperiment Viewer II

Page 19: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-19Expressionsdatenanalyse

MeV:MeV: Interne DokumentationInterne Dokumentation

Ausschnitt aus:

http://www.tm4.org/documentation/mev_advanced.ppt

Page 20: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-20Expressionsdatenanalyse

MeV:MeV: Implementierte Clustering Implementierte Clustering MethodenMethoden

1. HCL: Hierarchical clustering2. ST: Support Trees 3. SOTA: Self Organizing Tree Algorithm 4. RN: Relevance Networks5. KMC: K-Means/K-Medians Clustering6. KMS: K-Means / K-Medians Support7. CAST: Clustering Affinity Search Technique8. QTC: QT CLUST9. SOM: Self Organizing Maps10. GSH: Gene Shaving11. FOM: Figures of Merit12. PTM: Template Matching13. TTEST: T-tests14. SAM: Significance Analysis of Microarrays15. ANOVA: Analysis of Variance16. TFA: Two-factor ANOVA17. SVM: Support Vector Machines18. KNNC: K-Nearest-Neighbor Classification19. DAM: Discriminant Analysis Module20. COA: Correspondence Analysis21. PCA: Principal Components Analysis22. TRN: Expression Terrain Maps23. EASE: Expression Analysis Systematic Explorer

Page 21: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-21Expressionsdatenanalyse

MADAM: MicroArray DAta ManagerMADAM: MicroArray DAta Manager

Page 22: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-22Expressionsdatenanalyse

MADAM: Interne DokumentationMADAM: Interne Dokumentation

Ausschnitt aus: ftp://occams.dfci.harvard.edu/pub/bio/training/madam_4_0.ppt

Page 23: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-23Expressionsdatenanalyse

  Expression Profiler  Expression Profiler  http://www.ebi.ac.uk/expressionprofiler/http://www.ebi.ac.uk/expressionprofiler/

Page 24: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-24Expressionsdatenanalyse

  Expression Profiler: Expression Profiler: Eingabemöglichkeiten Eingabemöglichkeiten 

Page 25: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-25Expressionsdatenanalyse

Auswahl eines Arrays aus Auswahl eines Arrays aus ArrayExpressArrayExpress

Page 26: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-26Expressionsdatenanalyse

Auswahl eines Arrays aus Auswahl eines Arrays aus ArrayExpressArrayExpress

Page 27: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-27Expressionsdatenanalyse

  Expression Profiler  - mögliche Expression Profiler  - mögliche SichtenSichten

Page 28: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-28Expressionsdatenanalyse

  Expression Profiler: Ergebnisse als Text-Expression Profiler: Ergebnisse als Text-DateiDatei

Page 29: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-29Expressionsdatenanalyse

  Expression Profiler: Ergebnisse Expression Profiler: Ergebnisse grafisch Igrafisch I

Page 30: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-30Expressionsdatenanalyse

  Expression Profiler: Ergebnisse Expression Profiler: Ergebnisse grafisch IIgrafisch II

Page 31: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-31Expressionsdatenanalyse

  Expression Profiler: Ergebnisse Expression Profiler: Ergebnisse grafisch IIIgrafisch III

Page 32: Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M. Lange Folie #7-1 Methoden & Tools für die Expressionsdatenanalyse

Vorlesung Einführung in die Bioinformatik - U. Scholz & M. Lange Folie #7-32Expressionsdatenanalyse

  Expression Profiler: Ergebnisse Expression Profiler: Ergebnisse grafisch IVgrafisch IV