16
Bioinformatik Was Wieso Warum ch 10. O

Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Embed Size (px)

Citation preview

Page 1: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Bioinformatik

Was Wieso Warum

Esther Ratsch 10. Oktober 2003

Page 2: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Was ist Bioinformatik?

• Anwendung von Methoden der Informatik auf biologische Probleme

• Speicherung großer Datenmengen

• Kombination großer Datenmengen auf der Suche nach neuem Wissen

• Unterstützt Laborbiologie an deren Grenzen

• Planung von Experimenten

Page 3: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Was ist Bioinformatik?

• Verschiedene Arten der Bioinformatik, z.B.:

• Sequenzanalyse

• Modellierung von Proteinstrukturen

• Simulation von Netzwerken

• Erstellung von Datenbanken

Page 4: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Genom und Gene

gacaaggtga caggggacag gtgctctcat gcatggctga tgggaggatg aggtaaaatc 60 ttcagcaggc catttgacta tcaatattaa aaagccctaa aacacgcata cccaaatacg 120 caggaatttt acttcttgcc taaggaaata attgacgatg tggcgagaga tttaactcca 180 tggatgctta tcctagtact acttataata atgaaaatca gaaacaactc taagtatcta 240 atgagataga attagttaat aaatcatata aaatagttat atgaaatatt atacagacat 300 aaaaatgaag taaacctgta tttattgaca cagggagatg ctcagactaa aattgttaag 360 taccgaaagt agatggtaaa acaatattta aagttcttct tatcaatata taaaaatata 420 tattagtgtt tacatatagg atatcaaatt cttaaatgag gtattggtga gtggtgggat 480 tatgggcaat tattttcctt cctagtgttt atttatgtga agacaatgat aaaccttgaa 540 agaaaaaagt acccacaatc tcaccttgat gatgagtaat tttgatttat ttttattttt 600 gcatactcgt gttctcaaac ttttcatcag tgaaaattat attacttaaa ggatgaaaaa 660 tcatttccaa aagcctctaa aattctagag cctgattcac aaagagccac tcgaccaact 720 tcacacacag caagtcactg gcagggcaaa agcttggttc cccttctcag caggggacag 780 aatccctgga cacactggga agatattctg ggtgttgctg tcccttgtcc cttggccaag 840 aggtggtctg ggcatagaag acaagagtgg gccgggcgcg gtggctcacg cctgtaatcc 900 caacagtggg tggatcagga ggaggtcagg agtttgagac cagcctggcc aacatgttga 960 aaccccatct ctactaaaaa tacaaaatat tagccgggca tggtggcggg cgcctgtaat 1020 cccagctact tgggaggctg aggcaggaga attgcttgaa cccaggaggc agaggttgca 1080 gtgagccgag attgcaccac tgtactccac tccgccaaca gtgagagccc tgtctcaaaa 1140 aaaaaaaaaa aaaaagagtg ggtggcggga aggtggctga aggtaggagg gggaacctaa 1200 atgggacatg ggaggcatgg ttggcacgag ctcagcctga ccagggccca gagaggtaga 1260 ctgattcagt caaaagtcgt agtacttttc ctgctgagat tggtggccct tttgctgggc 1320 tttctcaagc aagaaatatc ctcttctgtt tcagaattat tctgaatcat taacccaagt 1380 cctcccaact gcactgatcc tgtcccagag aggccctggg ctgcatcacc taactgatca 1440 ctaaccacaa ccagttctgc tctctcctgg ttcctgaaat ccaggagcag atggtggtgg 1500 ggaggaggag tttggagaca gccctctacc agaagccaag aagaaagggg agtgaggagg 1560 gatagaggaa gttatcttgg tcctgcgccc acagtcccca gggtcctcct tcctgtgaag 1620 cccaacggtc tccagccaga tttcctgtcc ccttagcccc accaagaacc agaggctgcc 1680 cattgggtgg ctgttggatg caggttactg ttggagtggg ggatggccac ctgaggccaa 1740 ttgggtcatc tttactccag gtctcccttt catcctcctg tcttccctgg gggcactcta 1800 ttccctgcaa ttccttgggc taccagttcc tgacttttgt tcctttcaaa ggaaccctgg 1860 ataaacagtg taaccagaat ttcagagggg ttagttgtgt gtatcccctg gggacaagca 1920 ccggtatagg cacacaatgg tgagctgaga aatcttgggc tggtagtgct aaattcaaag 1980 gctgggacag gctgggccat ggctcatgcc tgtaatccca gcactttgga ggctgaggca 2040 gtggatcact tgaggtcagg agttcaagac cagcctggcc aacatggtga aaccctgtat 2100 ctactaaaaa tacaaaaatt agcttcttgc ctaaggaaaa atacaaaaat tacttcttgc 2160 ctaaggaaat aattgatgat gtggctagag gctagggcgt ggtggcgggc acctgtaatc 2220 ccagctactc gggaggctga ggcagaagaa tcgcttgaac cattgcacat cagcctgggc 2280 aacagagcaa gataaccgtc tcaaaaaaaa aaaaaaaaaa aaaaaggctg gggacaatgc 2340 tggccctcct tcctgcccct tcccc........

Teil der Sequenz des Gens für die leichte und schwere Kette der menschlichen Myeloperoxidase; EMBL AC X15377

•Genom: Bauplan des Organismus •DNA: 4 Nukleotide (A,C,T und G)•Unterteilt in Gene, die für Proteine kodieren•Genomprojekte:

-Viele Buchstaben- Wenig Sinn

Page 5: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Vom Gen zum Protein

• Transkription: DNA RNA

• Translation: RNA Protein

• Protein: aufgebaut aus Aminosäuren (20)

Page 6: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Sequenzanalyse

• Wo sind Gene in dem Buchstaben- Haufen?

gatccagctg taccattatg taatataata agacacggac gcac……...

MFKPVDFSETSPVPPDIDLAPTQSPHHVAPSQDSSYDLLS…………..………. SMLKNKSFLLHGKDYPNNADNNDNEDIRAKTMNRSQSHV

• Ähnlichkeitssuchen zur Vorhersage der Verwandtschaftsbeziehungen eines Proteins und damit seiner Funktion

Page 7: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Proteine

MFKPVDFSETSPVPPDIDLAPTQSPHHVAPSQDSSYDLLS…………..………. SMLKNKSFLLHGKDYPNNADNNDNEDIRAKTMNRSQSHV

gatccagctg taccattatg taatataata agacacggac gcac……...

Page 8: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Struktur-Modellierung

• 3-dimensionale Struktur bestimmt die Funktion

• Experimentelle Struktur- aufklärung zeitaufwändig (damit teuer) und teilweise sehr schwer bis garnicht durchführbar.

• Struktur ist durch Sequenz festgelegt und kann daher (näherungsweise) vorhergesagt werden.

• Vorhersage basierend auf physikalischen Kräften oder Ähnlichkeitsanalysen.

Page 9: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Reaktionen und Stoffwechselwege

MFKPVDFSETSPVPPDIDLAPTQSPHHVAPSQDSSYDLLS…………..………. SMLKNKSFLLHGKDYPNNADNNDNEDIRAKTMNRSQSHV

gatccagctg taccattatg taatataata agacacggac gcac……...

Page 10: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Enzyme

• Enzyme sind Bio-Katalysatoren (Reaktionsbeschleuniger)

• Sie binden die Reaktanden und vereinfachen damit deren Interaktion, d.h. die Reaktion zwischen ihnen

• Klassifizierung: EC-Nummer, z.B 2.7.1.40:

–2 Transferases–2.7 Transfering phosphorus containing group–2.7.1 Phosphotransferases with an alcohol group as acceptor–2.7.1.40 Pyruvate kinase

Pyruvate kinase complex with bis mg-atp-na-oxalate; Pfam

Page 11: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Biochemische Netzwerke

Page 12: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Simulationen

• Das Gesamtheitnetzwerk ist sehr komplex und kann nicht intuitiv erfaßt werden.

• Einfluß einzelner Vorgänge auf das Gesamtergebnis vorhersagen

• Testen von Modellen/Hypothesen

• Mathematische Beschreibung der Prozesse nötig

Page 13: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Beispiel einer Simulation

Experimentell bestimmte (oben) und simulierte (unten) Calcium-Konzentration in Leberzellen.

Page 14: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Datenbanken

• Große Datenmengen• Speicherung so, daß Daten weiter nutzbar• Unterscheidung nach Inhalt

(Proteinstrukturen, Reaktionen, Sequenzen) und Speicherformat (Tabelle, einfacher Text)

• Unterstützen alle anderen Felder als Datenquelle und durch Speicherung der entstandenen Daten

Page 15: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Ein Beispiel - Peroxidasen

• Große Gruppe von Enzymen

• Katalysieren viele verschiedene Reaktionen

• Vorkommen in Pflanzen, Tieren, Pilzen und Bakterien

• Abwehr von Krankheitserregern (bei Tieren und Pflanzen)

Page 16: Bioinformatik Was Wieso Warum Esther Ratsch 10. Oktober 2003

Tagesablauf

• Suche nach Daten zu Peroxidasen und ihren Reaktionen in verschiedenen Datenbanken

• Nutzung ähnlicher Daten zur Simulation einer der katalysierten Reaktionen

• Modellierung der Struktur der zugehörigen Peroxidase

• Verbesserung der Simulation durch Daten, die bei der Modellierung des Proteins gewonnen werden