13
Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen [email protected] SS 2012 5. Biologische Netzwerke - Gut vernetzt hält besser 2 Überblick • Einleitung • Hierarchie biologischer Netzwerke • Netzwerkmaße • Skalenfreie Netzwerke • Kleine-Welt-Netzwerke 3 Von der Biologie zur Systembiologie Im vergangenen Jahrhundert studierte die Biologie • Struktur von Proteinen • Struktur von DNA/RNA • Replikation • Transkription • Translation • Interaktion von Molekülen • ...

Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen [email protected]

  • Upload
    hatu

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

Einführung in dieBioinformatik

Kay NieseltIntegrative Transkriptomik

Zentrum für Bioinformatik Tü[email protected]

SS 20125. Biologische Netzwerke -Gut vernetzt hält besser

2

Überblick

• Einleitung• Hierarchie biologischer Netzwerke• Netzwerkmaße• Skalenfreie Netzwerke• Kleine-Welt-Netzwerke

3

Von der Biologie zur Systembiologie

Im vergangenen Jahrhundert studierte dieBiologie

• Struktur von Proteinen• Struktur von DNA/RNA• Replikation• Transkription• Translation• Interaktion von Molekülen• ...

Page 2: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

4

Von der Biologie zur Systembiologie

Aufgrund neuer Technologien, die dieEntschlüsselung von Genomen, Transkriptomen,Proteomen, usw. erlaubt, studiert die Biologiein diesem Jahrhundert systematisch

• Zellen• Organe• Organismen• Zelluläre Prozesse: Kommunikation, ...

⇒ Systeme - Systembiologie

5

Biologische Systeme sind lebendigeNetzwerke

• Netzwerk-Ansätze zur Beschreibung undAnalyse komplexer vernetzter Systeme

• Netzwerke spielen eine entscheidendeRolle in der Systembiologie

• Daten von Genen, Proteinen undMetaboliten können direkt als Netzwerkinterpretiert oder in Netzwerkeeingebettet werden

6

Netzwerk-Biologie

Barabasi, Oltvai, Nature Rev. Genetics, 5:101 (2004)

Page 3: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

7

Vielfalt biologischer Netzwerke

• Metabolische Netzwerke• Regulatorische Netzwerke• Interaktionsnetzwerke• Phylogenetische Netzwerke• Neuronale Netzwerke• Soziale Netzwerke

8

Netzwerke sind Graphen

• Visualisierung / Modellierung vonNetzwerken mittels Graphen

• Knoten sind Metabolite, Gene, Proteine,Neuronen, ...

• Kanten zwischen je zwei Knotenbeschreiben Reaktionen, Interaktionen,neuronale Verbindungen, ...

9

Netzwerke sind Graphen

• Knoten: Gene/Proteine/Taxa ...• Kanten: Interaktionen

• Kanten repräsentieren:– Protein-Protein-Interaktionen– Protein-DNA-Interaktionen (TF-Bindung)– Genetische Interaktionen– Regulatorische Interaktionen (positiv/negativ)

• Kanten können Richtungen haben

Protein-Protein-Interaktion

Gen A reguliert Gen B

Page 4: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

10

• Metabolische Netzwerke

• Interaktionsnetzwerke

• Regulatorische Netzwerke

• Signalnetzwerke

• Evolutionäre Netzwerke

Eine Hierarchie biologischer Netzwerke

11

Metabolische Netzwerke

• Für viele Zellprozesse wird Energie benötigt• Energie wird durch Metabolismus erlangt:

– (1) katabolische Reaktion: große Moleküle werdenzu kleinen reduziert (Beispiel Glykolyse)

– (2) anabolische Reaktion: komplexe Molekülewerden aus kleinen synthetisiert (Beispiel:Aminosäuresynthese)

• Metabolismus ist ein strukturierterNetzwerkprozess

Metabolismus = Stoffwechsel

12

Metabolische Netzwerke

• KEGG (Kyoto Encyclopedia of Genes andGenomes)

• Große Datenbank mit Informationen überGene, Biomoleküle, Stoffwechselwege,Reaktionsgleichungen etc.

• Sammlung von Netzwerkdiagrammen(manuelles Layout!)

http://www.genome.jp/kegg/

Page 5: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

13

Netzwerk von KEGG

http://www.genome.jp/kegg/

14

Eine Hierarchie biologischer Netzwerke

• Metabolische Netzwerke

• Interaktionsnetzwerke

• Regulatorische Netzwerke

• Signalnetzwerke

• Evolutionäre Netzwerke

Barabasi & Oltvai, Nat. Rev. Genetics (2004), 5:101

15

• Metabolische Netzwerke

• Interaktionsnetzwerke

• Regulatorische Netzwerke

• Signalnetzwerke

• Evolutionäre Netzwerke

Eine Hierarchie biologischer Netzwerke

Page 6: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

16

Wyrick and Young, Deciphering gene regulatory Netzwerke, Curr Op genet & Devl.

Eine Hierarchie biologischer Netzwerke

• Metabolische Netzwerke

• Interaktionsnetzwerke

• Regulatorische Netzwerke

• Signalnetzwerke

• Evolutionäre Netzwerke

17

Eine Hierarchie biologischer Netzwerke

Graph generiert mit SplitsTree4, Huson et al.

• Metabolische Netzwerke

• Interaktionsnetzwerke

• Regulatorische Netzwerke

• Signalnetzwerke

• Evolutionäre Netzwerke

18

Knoten/Kanten in biol. Netzwerken

• Metabolische Netzwerke:

• Interaktionsnetzwerke:

• Regulatorische Netzwerke:

• Evolutionäre Netzwerke:

Metabolite/Reaktionen

Proteine/Interaktionen

Proteine/Aktivierung, ...

Spezies/Evolution

Page 7: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

Analyse biologischer Netzwerke

• Untersuchung struktureller Eigenschaftenvon Netzwerken: besseres Verständnis fürAufbau, Robustheit gegenüber Störungen,Bedeutung zentraler Elemente

• Analyse und Visualisierung von Daten imKontext zugrunde liegender biologischerProzesse und Netzwerke

• Untersuchung des dynamischen Verhaltensder Prozesse mittels Simulation, um dieAntwort eines biologischen Systems aufÄnderungen vorherzusagen

20

Netzwerktopologien

Barabasi & Oltvai, Nat. Rev. Genetics (2004), 5:101

Zufällige Netzwerke

Skalenfreie Netzwerke

Hierarchische Netzwerke

21

Netzwerkmaße

• Knotengrad, -verteilung• Pfadlängen• Durchmesser• Zentralität• Clusterkoeffizient

Page 8: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

22

Gut vernetzt hält besser• Eines der einfachsten Maße ist der Knotengrad k für

jeden Knoten in einem Graphen

k=5

23

Gut vernetzt hält besser• Die Gradverteilung P(k)

entspricht der Wahrscheinlichkeit, dassein Knoten den Grad k hat.

• Für ein geg. Netzwerk berechnet manP(k), in dem man alle Knoten miteinem gegebenen Grad zählt.

24

Skalen-freie Netzwerke• In vielen biologischen Netzwerken

folgt die Gradverteilung demPotenzgesetz

P(k) ~ k-γ

γ ist der Gradexponent; γ liegtmeistens zwischen 2 und 3

• Die meisten Knoten habenniedrigen Grad, aber es gibtHubs, d.h. Knoten mit sehrvielen Verbindungen

• Wenn log(P(k)) eines Netzwerkesals Funktion von k eine Geradedarstellt, ist das Hinweis aufPotenzgesetz ⇒ skalenfreies Netzwerk

Zhu & Qin. Structural comparison of metabolic networks, BMC Bioinformatics 2005, 6:8

Page 9: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

25

Hubs - Drehkreuze

www.hemispheresmagazine.com

26

Hubs• Hubs finden sich oft in

biologischen Netzwerken

Beispiel:• PPI-Netzwerk in Hefe

Barabasi & Oltvai, Nat. Rev. Genetics (2004), 5:101

27

Pfadlängen und Zentralität• Die durchschnittliche kürzeste Pfadlänge zwischen je

zwei Knoten ist ein Maß, wie schnell man von einembeliebigen Knoten zu einem anderen kommt.

• Weiterer wichtiger Parameter ist derGraphendurchmesser: die Länge des längstenkürzesten Pfades im Graphen

• Zentralität eines Knoten:relative Anzahl der kürzestenPfade, die den Knoten enthalten.

http://en.wikipedia.org/wiki/Centrality

Farbton (Rot=0 nach Blau=max) repräsentiert Knoten-Zentralität.

Page 10: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

28

Beispiel

• ∅ Pfadlänge: 1,75

• Durchmesser: 3• Zentralität für Knoten mit Grad 5: 1,3

29

Clusterkoeffizient• Maß für Transitivität in einem Netzwerk

(Ist Knoten A mit Knoten B verbunden und B mitKnoten C, ist dann auch A mit C verbunden?)

• Globaler Clusterkoeffizient:

• Lokaler Clusterkoeffizient:

n = Anzahl der Kanten, die zwischen den ki Nachbarnvon Knoten i verlaufen

ki(ki-1) = Anzahl möglicher Kantenverbindungen zwischen allen Nachbarn von Knoten i.

30

Beispiel

• Lokaler Clusterkoeffizient für Knotenmit Grad 5: (2*1)/20 = 0,1

Page 11: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

31

Small-World Netzwerke

• Nachbarn eines Knotens stärker vernetzt alsin zufällig organisierten Netzwerken

• Durchschnittliche Pfadlänge zwischen zweiKnoten des Netzwerks sehr kurz

• Skalenfreie Netzwerke haben dieseEigenschaft, da ‘Hubs’ das schnelleDurchlaufen ermöglichen

• Beispiel: Metabolische Netzwerke sind Kleine-Welt-Netzwerke, die meisten Paare vonMetaboliten sind mittels 3-4 Reaktionenverbunden.

32

Stabilität• Biologische Netzwerke sind meist robust gegenüber

Störungen (Perturbationen)• Skalenfreie Netzwerke sind sehr robust gegenüber

zufälligen Deletionen: die Mehrheit der Knoten habengeringen Grad

• Hubs, auf der anderen Seite, sind sehr gefährdet: ihreDeletion könnte zum Zerfall des Netzwerkes inTeilnetzwerke führen

33

Stabilität

Beispiel des Protein-Protein-Interaktionsnetzwerkes in Hefe:

• Knoten sind farbkodierthinsichtlich Effekts einerKnock-out-Mutante– Rot: letal– Grün: nicht letal– Orange: langsames Wachstum– Gelb: unbekannt

• Hubs sind oft rot!

Page 12: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

Aufgaben der Bioinformatik

• Repräsentation der Netzwerke undzugehöriger Daten– Datenstrukturen– Datenbanken– Datenintegration

• Analyse und Simulation der Netzwerke undder durch sie repräsentierten Prozesse– Algorithmen– Simulation– Statistik– Maschinelles Lernen

• Darstellung und Exploration– Visualisierung

Analyse biologischer Netzwerke

• Biologische Netzwerke sind oft modular undorganisiert

• Untersuchung von kleinen, vielfachvorkommenden Teilgraphen -> Netzwerk-Motive!

• Netzwerk-Motive haben besondere Bedeutungfür Signaltransduktions- und GenregulatorischeNetzwerke

Pavlopoulos GA, BioData Mining 2011

36

Cytoscape

http://www.cytoscape.org/what_is_cytoscape.html

• open source Software-Plattform• Visualisierung komplexer Netzwerke• Integration beliebiger Attributdaten• > 100 Plugins• Anwendungsdomänen: Bioinformatik, soziale Netzwerke,

semantisches Web

Page 13: Einführung in die Bioinformatik - ab.inf.uni-tuebingen.de · Einführung in die Bioinformatik Kay Nieselt Integrative Transkriptomik Zentrum für Bioinformatik Tübingen Kay.Nieselt@uni-tuebingen.de

37

Zusammenfassung

• Netzwerke finden sich in allenBereichen der Biologie

• Viele dieser sind skalenfreie-Netzwerkeund weisen Eigenschaften der “KleinenWelt” auf.

• Die Bioinformatik und dieSystembiologie tragen in vielenBereichen wie Analyse, Visualisierung,Interpretation ... bei

38

Links

• http://www.genome.jp/kegg• http://string.embl.de/• http://www.cytoscape.org/