41
8. Vorlesung SS 2010 Softwarewerkzeuge 1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst vieler zellulären Prozesse wichtige Fragen: (1) wie soll man die Gesamtheit der metabolischen Reaktionen beschreiben? (2) weshalb interagieren mehrere Protein zu großen Komplexen? Inhalt V8: (1) stöchiometrische Matrix (2) Flux Balance Analysis - Methode (3) Beispiele für permanente Proteinkomplexe (4) Proteininteraktionsnetzwerke

8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

Embed Size (px)

Citation preview

Page 1: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 1

V8 Systembiologie• Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane

Betrachtung möglichst vieler zellulären Prozesse

• wichtige Fragen: (1) wie soll man die Gesamtheit der metabolischen Reaktionen beschreiben?

(2) weshalb interagieren mehrere Protein zu großen Komplexen?

• Inhalt V8: (1) stöchiometrische Matrix

(2) Flux Balance Analysis - Methode

(3) Beispiele für permanente Proteinkomplexe

(4) Proteininteraktionsnetzwerke

Page 2: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 2

Die Glykolyse

Page 3: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 3

Metabolische Pfade

Page 4: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 418. Lecture WS 2008/09 Bioinformatics III 4

EcoCyc DatabaseE.coli genome contains 4.7 million DNA bases.How can we characterize the functional complement of E.coli and according towhat criteria can we compare the biochemical networks of two organisms?

EcoCyc contains the metabolic map of E.coli defined as the set of all known pathways, reactions and enzymes of E.coli small-molecule metabolism.

Analyze - the connectivity relationships of the metabolic network- its partitioning into pathways- enzyme activation and inhibition- repetition and multiplicity of elements such as enzymes, reactions, and substrates.

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 5: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 518. Lecture WS 2008/09 Bioinformatics III 5

EcoCyc Analysis of E.coli MetabolismE.coli genome contains 4391 predicted genes, of which 4288 code for proteins.

676 of these genes form 607 enzymes of E.coli small-molecule metabolism.

Of those enzymes, 311 are protein complexes, 296 are monomers.

Organization of protein complexes. Distribution of subunit counts for all EcoCyc protein complexes. The predominance of monomers, dimers, and tetramers is obvious

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 6: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 618. Lecture WS 2008/09 Bioinformatics III 6

ReactionsEcoCyc describes 905 metabolic reactions that are catalyzed by E. coli.

Of these reactions, 161 are not involved in small-molecule metabolism,e.g. they participate in macromolecule metabolism such as DNA replication andtRNA charging.

Of the remaining 744 reactions, 569 have been assigned to at least one pathway.

The next figures show an overview diagram of E. coli metabolism. Each node in the diagram represents a single metabolite whose chemical class is encoded by the shape of the node. Each blue line represents a single bioreaction. The white lines connect multiple occurrences of the same metabolite in the diagram.

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 7: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 718. Lecture WS 2008/09 Bioinformatics III 7

Reactions

(A) This version of the overview shows all interconnections between occurren-ces of the same metabolite to communicate the complexity of the interconnections in the metabolic network.

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 8: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 818. Lecture WS 2008/09 Bioinformatics III 8

ReactionsThe number of reactions (744) and the number of enzymes (607) differ ...WHY??

(1) there is no one-to-one mapping between enzymes and reactions –some enzymes catalyze multiple reactions, and some reactions are catalyzedby multiple enzymes.

(2) for some reactions known to be catalyzed by E.coli, the enzyme has not yet been identified.

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 9: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 918. Lecture WS 2008/09 Bioinformatics III 9

Assignment of EC numbersOf the 3399 reactions defined in the ENZYME database (version 22.0), 604 occur in E.coli.This means that the remaining 301 reactions of E.coli do not have assigned EC numbers.

The number of EC class reactions present in E. coli against the total number of EC reaction types. The blue bars signify the percent contribution of each class for all known reactions in E. coli; the green bars signify the percent coverage of the EC classes in the known reactions in EcoCyc.

Due to the apparently finer classification of classes 1-3, the two measures display an inverse relationship: More reactions in E. coli belong to classes 1-3, although they represent a smaller percentage of reactions listed in the EC hierarchy.

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 10: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 1018. Lecture WS 2008/09 Bioinformatics III 10

CompoundsThe 744 reactions of E.coli small-molecule metabolism involve a total of 791 different substrates.

On average, each reaction contains 4.0 substrates.

Number of reactions containing varying numbers of substrates (reactants plus products).

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 11: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 1118. Lecture WS 2008/09 Bioinformatics III 11

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Each distinct substrate occurs in an average of 2.1 reactions.

Compounds

Page 12: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 1218. Lecture WS 2008/09 Bioinformatics III 12

PathwaysEcoCyc describes 131 pathways:

energy metabolismnucleotide and amino acid biosynthesissecondary metabolism

Pathways vary in length from a single reaction step to 16 steps with an average of 5.4 steps.

Length distribution of EcoCyc pathways

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 13: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 1318. Lecture WS 2008/09 Bioinformatics III 13

PathwaysHowever, there is no precise biological definition of a pathway.

The partitioning of the metabolic network into pathways (including the well-known examples of biochemical pathways) is somehow arbitrary.

These decisions of course also affect the distribution of pathway lengths.

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 14: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 1418. Lecture WS 2008/09 Bioinformatics III 14

Enzyme Modulation

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 15: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 1518. Lecture WS 2008/09 Bioinformatics III 15

Reactions Catalyzed by More Than one EnzymeDiagram showing the number of reactions that are catalyzed by one or more enzymes. Most reactions are catalyzed by one enzyme, some by two, and very few by more than two enzymes.

For 84 reactions, the corresponding enzyme is not yet encoded in EcoCyc.

What may be the reasons for isozyme redundancy?

(2) the reaction is easily „invented“; therefore, there is more than one protein family that is independently able to perform the catalysis (convergence).

(1) the enzymes that catalyze the same reaction are homologs and have duplicated (or were obtained by horizontal gene transfer),acquiring some specificity but retaining the same mechanism (divergence)

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 16: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 1618. Lecture WS 2008/09 Bioinformatics III 16

Enzymes that catalyze more than one reactionGenome predictions usually assign a single enzymatic function.However, E.coli is known to contain many multifunctional enzymes.Of the 607 E.coli enzymes, 100 are multifunctional, either having the same active site and different substrate specificities or different active sites.

Number of enzymes that catalyze one or more reactions. Most enzymes catalyze one reaction; some are multifunctional.

The enzymes that catalyze 7 and 9 reactions are purine nucleoside phosphorylase and nucleoside diphosphate kinase.

Take-home message: The high proportion of multifunctional enzymes implies that the genome projects significantly underpredict multifunctional enzymes!

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 17: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 1718. Lecture WS 2008/09 Bioinformatics III 17

Reactions participating in more than one pathway

The 99 reactions belonging to multiple pathways appear to be the intersectionpoints in the complex network of chemicalprocesses in the cell.

E.g. the reaction present in 6 pathways corresponds to the reaction catalyzed by malate dehydrogenase, a central enzyme in cellular metabolism.

Ouzonis, Karp, Genome Res. 10, 568 (2000)

Page 18: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 18

Beschreibung vernetzter Metabolischer Pfade

Page 19: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 19

Stöchiometrische Matrix

Page 20: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 20

Flux balancingAny chemical reaction requires mass conservation.Therefore one may analyze metabolic systems by requiring mass conservation.

Only required: knowledge about stoichiometry of metabolic pathways and metabolic demands

For each metabolite:

Under steady-state conditions, the mass balance constraints in a metabolic network can be represented mathematically by the matrix equation:

S · v = 0

where the matrix S is the m n stoichiometric matrix,m = the number of metabolites and n = the number of reactions in the network. The vector v represents all fluxes in the metabolic network, including the internal fluxes, transport fluxes and the growth flux.

)( dtransporteuseddegradeddsynthesizei

i VVVVdtdXv

Page 21: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 21

Flux balance analysisSince the number of metabolites is generally smaller than the number of reactions (m < n) the flux-balance equation is typically underdetermined.

Therefore there are generally multiple feasible flux distributions that satisfy the mass balance constraints.The set of solutions are confined to the nullspace of matrix S.

To find the „true“ biological flux in cells ( e.g. Heinzle, Volmer, UdS) one needs additional (experimental) information,or one may impose constraints

on the magnitude of each individual metabolic flux.

The intersection of the nullspace and the region defined by those linear inequalities defines a region in flux space = the feasible set of fluxes.

iii v

Page 22: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 22

Feasible solution set for a metabolic reaction network

(A) The steady-state operation of the metabolic network is restricted to the region within a cone, defined as the feasible set. The feasible set contains all flux vectors that satisfy the physicochemical constrains. Thus, the feasible set defines the capabilities of the metabolic network. All feasible metabolic flux distributions lie within the feasible set, and (B) in the limiting case, where all constraints on the metabolic network are known, such as the enzyme kinetics and gene regulation, the feasible set may be reduced to a single point. This single point must lie within the feasible set.

Edwards & Palsson PNAS 97, 5528 (2000)

Page 23: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 23

E.coli in silico

Page 24: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 24

E.coli in silico

vcii vcZZ

Zmutant

Page 25: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 25

E.coli in silico

Edwards & Palsson

PNAS 97, 5528 (2000)

+ and – means growth or no growth. means that suppressor mutations have been observed that allow the mutant strain to grow.

glc: glucose, gl: glycerol, succ: succinate, ac: acetate.

In 68 of 79 cases, the prediction is consistent with exp. predictions.Red and yellow circles are the predicted mutants that eliminate or reduce growth.

Page 26: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 26

Rerouting of metabolic fluxes(Black) Flux distribution for the wild-type. (Red) zwf- mutant. Biomass yield is 99% of wild-type result. (Blue) zwf- pnt- mutant. Biomass yield is 92% of wildtype result. The solid lines represent enzymes that are being used, with the corresponding flux value noted.

Note how E.coli in silico circumvents removal of one critical reaction (red arrow) by increasing the flux through the alternative G6P P6P reaction.

Edwards & Palsson PNAS 97, 5528 (2000)

Page 27: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 27

Proteinkomplexe: RNA Polymerase II

Page 28: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 28

Proteinkomplexe: Spliceosom

Page 29: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 29

Proteinkomplexe: Ribosom

Page 30: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 30

Proteinkomplexe: Proteasom

Page 31: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 31

Proteinkomplexe: Apoptosom

Page 32: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 32

Proteininteraktionsnetzwerke

Page 33: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 33

Proteininteraktionsnetzwerke

De Las Rivas, PLOS Comp Biol. 6, e1000807 (2010)

Page 34: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 34

Proteininteraktionsnetzwerke

De Las Rivas, PLOS Comp Biol. 6, e1000807 (2010)

Page 35: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 35

Proteininteraktionsnetzwerke

De Las Rivas, PLOS Comp Biol. 6, e1000807 (2010)

Page 36: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 36

Proteininteraktionsnetzwerke

De Las Rivas, PLOS Comp Biol. 6, e1000807 (2010)

Page 37: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 37

Proteininteraktionsnetzwerke - Visualisierung

Page 38: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 38

Proteininteraktionsnetzwerke - Visualisierung

Page 39: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 39

Proteininteraktionsnetzwerke - Visualisierung

Page 40: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 40

Proteininteraktionsnetzwerke

De Las Rivas, PLOS Comp Biol. 6, e1000807 (2010)

Page 41: 8. Vorlesung SS 2010Softwarewerkzeuge1 V8 Systembiologie Idee: Methoden der Systembiologie ermöglichen die integrierte, simultane Betrachtung möglichst

8. Vorlesung SS 2010 Softwarewerkzeuge 41

Auffinden aktiver Teilnetze/Pfade