9
HAUPTBEITRAG / PETRINETZE IN DER SYSTEMBIOLOGIE } Petrinetze in der Systembiologie Ina Koch Einführung Die biologischen Wissenschaften unterliegen seit etwa 20 Jahren einem Wandel, der durch die Entwicklung neuer experimenteller Technolo- gien, sogenannter Hochdurchsatz-Technologien, hervorgerufen wurde. Mithilfe dieser Technolo- gien, wie z. B. DNS-Microarrays oder Protein- Microarrays [55], ist es möglich geworden, z. B. eine große Anzahl von Genprodukten, wie Prote- ine, gleichzeitig zu testen. Daraus resultierte die Entwicklung der unterschiedlichsten sogenann- ten omik-Gebiete, welche die entsprechenden ome, d. h., die Gesamtheit der jeweiligen biochemischen Spezies, wie z. B. aller Gene oder aller Proteine, beinhalten. So bezeichnet das Genom die Gesamt- heit der Gene, das Transkriptom die Gesamtheit der Transkripte, das Proteom die Gesamtheit der Proteine, das Metabolom die Gesamtheit der Meta- boliten. Neuere Begriffe sind das Komplexom, das alle Komplexe umfaßt, oder das Interaktom für die Gesamtheit aller Interaktionen biochemischer Spezies. Die sich ergebenden Datenmengen ermöglichen es, nicht nur ein Molekül zu betrachten (reduktio- nistisches Vorgehen), sondern in einem holistischen Ansatz die Wechselwirkungen zwischen den betei- ligten biochemischen Spezies in ihrer Gesamtheit zu beschreiben. Der holistische Ansatz führt zur Entwicklung unterschiedlichster Methoden, um biochemische Systeme so zu modellieren, dass ihr dynamisches Verhalten sowohl unter normalen Be- dingungen als auch nach Änderungen von Druck, Temperatur oder anderen Störungen des Systems vorhergesagt werden kann, einem Hauptanlie- gen der Systembiologie. Für diesen sich rasant entwickelnden Wissenschaftszweig kann man mitt- lerweile viele Definitionen finden. Stellvertretend sei die folgende Definition gegeben, die neben den Interaktionen auch die unterschiedlichen Abstrakti- onsniveaus, auf denen modelliert wird, hervorhebt: ,,In der Systembiologie geht es darum, die komple- xen und dynamischen Abläufe einer Zelle oder eines Organs, z. B. bei Umweltanpassung, Alterung oder Immunabwehr, zu verstehen und abzubilden. Die große Fülle von Daten über einzelne Zellbestandteile bzw. -funktionen, die auf verschiedenen Ebenen der Lebensprozesse gewonnen wurde (Genom, Proteom, Metabolom) muß in einen sinnvollen Gesamtzusam- menhang gebracht und im Computer nachgebildet werden, sodass Simulationen und Vorhersagen auch ohne Experimente im Labor möglich werden.“ [31]. Mit der Aufklärung (Sequenzierung) ganzer Genome und dem Wissen der stöchiometrischen Reaktionsgleichungen, die die Mengenverhältnisse der beteiligten Stoffe beschreiben, ist man nun in der Lage, genomweite Modelle zu entwickeln und zu analysieren, wie z. B. für Hefe (Saccharomyces cerevisiae (S. cerevisiae)[16] oder Escherichia coli (E.coli)[34]). Durch die Vielfalt der experimentellen Me- thoden entstehen jedoch Daten unterschiedlicher Qualität und Quantität. Demzufolge werden spezi- elle Methoden für bestimmte Abstraktionsniveaus DOI 10.1007/s00287-013-0757-1 © Springer-Verlag Berlin Heidelberg 2014 Ina Koch Molekulare Bioinformatik, Institut für Informatik, Exzellenzcluster Frankfurt ,,Makromolekulare Komplexe“, Johann Wolfgang Goethe-Universität Frankfurt am Main, Robert-Mayer-Straße 11–15, 60325 Frankfurt am Main E-Mail: [email protected] Informatik_Spektrum_37_3_2014 211

Petrinetze in der Systembiologie

  • Upload
    ina

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Petrinetze in der Systembiologie

HAUPTBEITRAG / PETRINETZE IN DER SYSTEMBIOLOGIE }

Petrinetze in der SystembiologieIna Koch

EinführungDie biologischen Wissenschaften unterliegen seitetwa 20 Jahren einem Wandel, der durch dieEntwicklung neuer experimenteller Technolo-gien, sogenannter Hochdurchsatz-Technologien,hervorgerufen wurde. Mithilfe dieser Technolo-gien, wie z. B. DNS-Microarrays oder Protein-Microarrays [55], ist es möglich geworden, z. B.eine große Anzahl von Genprodukten, wie Prote-ine, gleichzeitig zu testen. Daraus resultierte dieEntwicklung der unterschiedlichsten sogenann-ten omik-Gebiete, welche die entsprechenden ome,d. h., die Gesamtheit der jeweiligen biochemischenSpezies, wie z. B. aller Gene oder aller Proteine,beinhalten. So bezeichnet das Genom die Gesamt-heit der Gene, das Transkriptom die Gesamtheitder Transkripte, das Proteom die Gesamtheit derProteine, das Metabolom die Gesamtheit der Meta-boliten. Neuere Begriffe sind das Komplexom, dasalle Komplexe umfaßt, oder das Interaktom fürdie Gesamtheit aller Interaktionen biochemischerSpezies.

Die sich ergebenden Datenmengen ermöglichenes, nicht nur ein Molekül zu betrachten (reduktio-nistisches Vorgehen), sondern in einem holistischenAnsatz die Wechselwirkungen zwischen den betei-ligten biochemischen Spezies in ihrer Gesamtheitzu beschreiben. Der holistische Ansatz führt zurEntwicklung unterschiedlichster Methoden, umbiochemische Systeme so zu modellieren, dass ihrdynamisches Verhalten sowohl unter normalen Be-dingungen als auch nach Änderungen von Druck,Temperatur oder anderen Störungen des Systemsvorhergesagt werden kann, einem Hauptanlie-gen der Systembiologie. Für diesen sich rasant

entwickelnden Wissenschaftszweig kann man mitt-lerweile viele Definitionen finden. Stellvertretendsei die folgende Definition gegeben, die neben denInteraktionen auch die unterschiedlichen Abstrakti-onsniveaus, auf denen modelliert wird, hervorhebt:,,In der Systembiologie geht es darum, die komple-xen und dynamischen Abläufe einer Zelle oder einesOrgans, z. B. bei Umweltanpassung, Alterung oderImmunabwehr, zu verstehen und abzubilden. Diegroße Fülle von Daten über einzelne Zellbestandteilebzw. -funktionen, die auf verschiedenen Ebenen derLebensprozesse gewonnen wurde (Genom, Proteom,Metabolom) muß in einen sinnvollen Gesamtzusam-menhang gebracht und im Computer nachgebildetwerden, sodass Simulationen und Vorhersagen auchohne Experimente im Labor möglich werden.“ [31].

Mit der Aufklärung (Sequenzierung) ganzerGenome und dem Wissen der stöchiometrischenReaktionsgleichungen, die die Mengenverhältnisseder beteiligten Stoffe beschreiben, ist man nun inder Lage, genomweite Modelle zu entwickeln undzu analysieren, wie z. B. für Hefe (Saccharomycescerevisiae (S. cerevisiae) [16] oder Escherichia coli(E.coli) [34]).

Durch die Vielfalt der experimentellen Me-thoden entstehen jedoch Daten unterschiedlicherQualität und Quantität. Demzufolge werden spezi-elle Methoden für bestimmte Abstraktionsniveaus

DOI 10.1007/s00287-013-0757-1© Springer-Verlag Berlin Heidelberg 2014

Ina KochMolekulare Bioinformatik, Institut für Informatik,Exzellenzcluster Frankfurt ,,Makromolekulare Komplexe“,Johann Wolfgang Goethe-Universität Frankfurt am Main,Robert-Mayer-Straße 11–15, 60325 Frankfurt am MainE-Mail: [email protected]

Informatik_Spektrum_37_3_2014 211

Page 2: Petrinetze in der Systembiologie

{ PETRINETZE IN DER SYSTEMBIOLOGIE

ZusammenfassungDieser Artikel zeigt die Anwendung von Petri-netzen in der Systembiologie. Anhand einesbiochemischen Beispiels werden Konzepte zurautomatischen Dekomposition biochemischerSysteme eingeführt. Der Artikel fokussiert aufKonzepte, die unter Steady-State-Bedingungengelten. Interessanterweise basieren all dieseKonzepte auf minimalen, semi-positivenTransitions-Invarianten. Es wird beschrieben,welche neuen Definitionen für Netzwerkde-kompositionen sich ableiten lassen und wiesie biologisch interpretiert werden können.Am Beispiel des Citratzyklus wird veranschau-licht, wie durch solch eine Analyse ein neuerStoffwechselweg vorhergesagt werden konnte.

entwickelt, die aus informatisch-mathematischerSicht auf unterschiedlichen Konzepten beruhen. Sowerden zur Darstellung genregulatorischer Abhän-gigkeiten häufig aussagenlogische Beschreibungenverwendet, da man oft nur die binäre Informationvorliegen hat, ob ein Gen exprimiert, d. h. aktiv, istoder nicht. Mittlerweile kann man aus der Quan-tität der Genprodukte Aussagen darüber treffen,wie stark ein Gen exprimiert ist. Für solche Mess-daten sind probabilistische und/oder stochastischeAnsätze zur Beschreibung besser geeignet.

Für eine Reihe gut untersuchter metabolischerSysteme liegen kinetische Daten vor, meist die Kon-zentrationen der beteiligten Metaboliten und dieReaktionsgeschwindigkeiten ihrer durch spezi-elle Enzyme katalysierten Umwandlungen. Daherwerden kontinuierliche Modelle verwendet, wo-bei auf der Grundlage bestimmter Kinetiken, wiez. B. dem Massenwirkungsgesetz, der Michaelis-Menten-Kinetik oder der Hill-Kinetik, gewöhnlicheDifferentialgleichungen abgeleitet werden. Oft sindjedoch für solche Ansätze die kinetischen Parameternicht bekannt. Die Stöchiometrie der Reaktionen,d. h. die Verhältnisse der Mengen von Substrat- undProdukt-Molekülen einer Reaktion, sind dagegenexperimentell leichter zugänglich. StöchiometrischeMethoden, die mit diskreten Stoffmengen arbeitenund auf den Lösungen linearer Gleichungssystemeberuhen, sind in diesen Fällen wertvoll. Diese Mo-delle sind von besonderer Bedeutung, da man mitihrer Hilfe Aussagen zur Netzwerkdynamik treffen

kann, ohne die kinetischen Parameter zu kennen, dieoftmals experimentell schwierig, vor allem in vivo,zu bestimmen sind und sehr sensibel auf gering-fügige Änderungen in der Umgebung des Systemsreagieren. In der Literatur beschriebene kinetischeDaten sind meistens nicht übertragbar, da die ex-perimentellen Bedingungen oft nicht vergleichbarsind.

An dieser Stelle kommen die Petrinetze (PN) insSpiel, die sich aufgrund ihrer Semantik, der vielenbereits implementierten Analysemethoden und ih-rer klaren intuitiven Visualisierung hervorragenddazu eignen, biochemische Netzwerke zu modellie-ren. Mehr noch, kann man wegen der konsequentenTrennung der aktiven und der passiven Teile einesSystems, leicht hybride Modellansätze definieren,die z. B. sowohl diskrete als auch kontinuierlicheSchaltregeln aufweisen. Diese hybriden Ansätzegewinnen für viele biochemischen Anwendungenimmer mehr an Bedeutung, da so z. B. der Einflussder Genexpression auf den Metabolismus inner-halb eines einheitlich wohldefinierten Formalismusbehandelt werden kann. Somit werden verschie-dene Abstraktionsniveaus innerhalb eines Modellsbeschrieben.

Es hat sich gezeigt, dass das in der Biologieetablierte Konzept der Elementarmoden alsTransitions-Invarianten bereits 20 Jahre eher de-finiert wurde, ohne jemals in die biologischeAnwendung gekommen zu sein. Auch wenn bereitsvon Carl Adam Petri sehr zeitig die Anwendungder PN auf chemische Reaktionsgleichungssys-teme vorgeschlagen wurde, begann erst 1993 mitder Masterarbeit von Reddy [40] und seinen Pu-blikationen [41, 42] die Anwendung von PN inder Systembiologie. Reddy modellierte den gutuntersuchten, kombinierten Stoffwechselweg derGlykolyse und des oxidativen Pentosephosphat-wegs in roten Blutkörperchen, den Erythrozyten,in Säugerzellen. An diesem konkreten Beispieldiskutierte er PN-Eigenschaften, wie z. B. Lebendig-keit, Beschränktheit, Reversibilität, Erreichbarkeitund Transitions-Invarianten, und zeigte derenInterpretierbarkeit für metabolische Netzwerke.

Mittlerweile gibt es zahlreiche Anwendun-gen der PN auf unterschiedlichste biochemischeSysteme und Fragestellungen. So wurden me-tabolische Systeme [26, 54], Signalwege [46],Genregulation [20, 25] und Transport- und Kom-plexbildungsprozesse des Spleissosoms [6, 23] mit

212 Informatik_Spektrum_37_3_2014

Page 3: Petrinetze in der Systembiologie

PN analysiert. Medizinische Anwendungen, ins-besondere zur Eisen-Homöostase, beschreibt [45].Eine ebensolche Vielfalt findet man im angewen-deten Methodenspektrum. Als Beispiele seien hierdie Anwendung zeitbewerteter PN [38], gefärbterPN [4, 17], stochastischer PN [32, 52], kontinuierli-cher PN [2], hybrider PN [10, 30] und Fuzzy-PN [57]angeführt.

Es entstanden neue, an die Bedürfnisse derBiologie angepasste Software-Werkzeuge, sowohlPN-Editoren als auch Analyse-Werkzeuge, wie z. B.MonaLisa [11], Cell Illustrator [33] oder Snoopy [13].Auf der Basis der Transitions-Invarianten, die fürbiochemische Systeme eine fundamentale Rollespielen, entstanden neue Konzepte zur Netzwerk-dekomposition [19, 46] und Netzwerkreduktion [1].

Der vorliegende Artikel hat nicht den Anspruch,einen umfassenden Überblick über alle Anwen-dungen der PN in der Systembiologie zu geben, dadies bei der Fülle an Arbeiten den vorgegebenenRahmen sprengen würde. Dazu wird auf das 2011erschienene Buch ,,Modeling in Systems Biology:The Petri Net Approach“ [25] und einige ältere Über-sichtsartikel [7, 35] verwiesen. In dieser Arbeit sollvielmehr der Einfluss von PN auf die Systembiolo-gie vorgestellt werden. Dies wird anhand der ausbiochemischen Anwendungen inspirierten neuenKonzepte zur Definition funktionaler Module durchNetzwerkdekomposition gezeigt.

Im Folgenden wird zuerst die Modellierung bio-chemischer Netzwerke anhand des Citratzyklus inE. coli betrachtet. Danach wird die Interpretationvon Invarianten in der Biologie erläutert, wobeiauf deren Definition und Berechnung eingegangenwird. Auf dieser Grundlage werden Definitionenfunktionaler Module eingeführt und die sich darausergebende Netzwerkdekomposition diskutiert.

Wie wird ein biochemisches Systemals Petrinetz dargestellt?

Modelliert man ein biochemisches Netzwerk,werden die beteiligten chemischen Spezies wiez. B. Metaboliten, Proteine, Enzyme, DNS, RNS,als Plätze und die chemischen Reaktionen, wiez. B. enzymkatalysierte Reaktionen, Aktivierung,Deaktivierung, Phosphorylierung, Dephospho-rylierung, Ubiquitinierung, Deubiquitinierung,Komplexbildung, Protein-DNS-Wechselwirkung,Protein-Protein-Interaktion, als Transitionenmodelliert. Ist die Stöchiometrie, d. h. das Men-

genverhältnis der beteiligten Spezies bekannt,werden die Kanten durch die stöchiometrischenFaktoren der entsprechenden chemischen Reak-tionsgleichungen gewichtet. Damit bekommt dasPN-Modell quantitative Eigenschaften. Die Markenentsprechen dann diskreten Mengen der biochemi-schen Spezies, wie z. B. einer Anzahl von Molekülenoder einem Mol von Molekülen. Der Markenflussverwirklicht die Dynamik des Systems. Er kannals Stofffluss, so bei metabolischen Netzwerken,oder als Informationsfluss, wie etwa bei Signalwe-gen, interpretiert werden. Die darunter liegendenSchaltregeln definieren, ob die Dynamik zeitlos,zeitbewertet, deterministisch, stochastisch oderkontinuierlich abläuft. So wird z. B. bei kontinuier-lichen Netzen durch die Schaltregel eine bestimmteKinetik implementiert, wobei man nicht mehr mitdiskreten Marken arbeitet, sondern mit Konzen-trationen der biochemischen Spezies. Methodischerhält man dann dieselben Differentialgleichungs-systeme, wie aus der klassischen Systembiologie seitden 1970er-Jahren bekannt, siehe z. B. [21].

Der CitratzyklusZur Veranschaulichung soll ein Beispiel des zentra-len Kohlenstoff-Metabolismus in E. Coli betrachtetwerden. Dieses Beispiel wurde gewählt, da die theo-retische Analyse des Modells [29, 48] zur Vorhersageeines neuen Stoffwechselweges führte, der dann auchexperimentell bestätigt wurde [15, 56]. Zudem ist dasBeispiel zwar sehr klein, aber komplex genug, umwichtige Aspekte der Netzwerkdekomposition zuveranschaulichen.

Die Plätze stellen die Metaboliten dar und dieTransitionen die chemischen Reaktionen der Meta-bolitenumwandlungen, wobei die Transitionen nachden Enzymen, welche die jeweilige Reaktion kataly-sieren, bezeichnet sind, siehe Abb. 1 und Tab. 1. Dadie stöchiometrischen Faktoren in den zugrundeliegenden Reaktionen den Wert 1 besitzen, tragendie gerichteten Kanten im PN eben dieses Gewicht.

Der Citratzyklus, auch Citronensäurezyklus,Tricarbonsäurezyklus oder Krebs-Zyklus genannt,stellt eine Reihe biochemischer Reaktionen dar,die den Schwerpunkt des zentralen Kohlenstoff-Metabolismus in aeroben Zellen bilden. JedesMolekül, das in eine Acetylgruppe oder Dicarbon-säure umgewandelt werden kann, kann über diesenWeg verstoffwechselt werden. Dabei wird sowohlchemische Energie generiert, die gespeichert werden

Informatik_Spektrum_37_3_2014 213

Page 4: Petrinetze in der Systembiologie

{ PETRINETZE IN DER SYSTEMBIOLOGIE

Abb. 1 Das Petrinetz zum zentralen Kohlen-stoff-Metabolismus in E. coli, erstellt undanalysiert mit der Software MonaLisa [11]. DiePlätze stellen die Metaboliten dar und dieTransitionen die chemischen Reaktionen. DieTransitionen sind nach den Enzymen, welchedie jeweilige Reaktion katalysieren, benannt.Die vollständigen Bezeichnungen sind inTabelle 1 gelistet. Die rot eingefärbtenTransitionen stellen den bekannten Weg derkatabolischen Repression dar

kann, als auch wichtige chemische Zwischen-produkte für die Biosynthese von Aminosäuren,Nukleinsäuren u. a. Somit findet eine vollständigeOxidation von Kohlenhydraten zu Kohlendioxidstatt, über Phosphoenolpyruvat (einem Metabolitenaus der Glykolyse), Pyruvat, Acetyl-Coenzym A, Ci-trat, Isocitrat, α-Ketoglutarat, Succinyl-Coenzym A,Succinat, Fumarat, Malat, Oxalacetat und wieder

Tabelle1

Abkürzungen der Abb. 1 und 2

Abkürzung Name

Acetyl-CoA Acetyl-Coenzym AaK-D α-Ketoglutarat-DehydrogenaseCoA Coenzym ACS Citrat-SynthaseI-D Isocitrat-DehydrogenaseI-L Isocitrat-LyaseM-D Malat-DehydrogenaseM-S Malat-SynthaseP-D Pyruvat-DehydrogenaseP-K Pyruvat-KinasePEP PhosphoenolpyruvatPEP-C Phosphoenolpyruvat-CarboxykinaseS-CoA-S Succinyl-CoA-SynthetaseS-D Succinat-Dehydrogenase

Phosphoenolpyruvat. Dieser Weg findet typischer-weise beim Wachstum von Bakterien statt, wennausreichend Glucose als Kohlenstoffquelle vorhan-den ist, was eine Unterdrückung von Prozessenauf der Basis alternativer Kohlenstoffquellen zurFolge hat. Er wird auch als katabolische Repressionbezeichnet. Für die Details sei der interessierte Le-ser auf biochemische Lehrbücher verwiesen, wiez. B. [5].

Funktionale Netzwerkdekompositiondurch Transitions-Invarianten

1973 definierte Lautenbach [28] Invarianten fürPN, die Platz-Invarianten (P-Invarianten) undTransitions-Invarianten (T-Invarianten). Sie berech-nen sich aus linearen Gleichungssystemen, die ausder Inzidenzmatrix des Netzes, welche der Stöchio-metrischen Matrix für chemische Gleichungssystemeentspricht, abgeleitet werden. Die nicht-trivialenLösungen dieser Gleichungssysteme bilden dieinvarianten Eigenschaftsvektoren.

Die Inzidenzmatrix C eines PN ist eine (n×m)-Matrix mit n und m als Anzahl der Plätze bzw. derTransitionen. Jeder Matrixeintrag cij gibt die Än-derung der Markenzahl im Platz pi an, wenn dieTransition tj schaltet. Eine T-Invariante ist definiertals ein semi-positiver Vektor x ∈ Nm

0 , der folgendeGleichung erfüllt:

C · x= 0. (1)

214 Informatik_Spektrum_37_3_2014

Page 5: Petrinetze in der Systembiologie

Eine P-Invariante wird analog als semi-positiverVektor y ∈ Nn

0 definiert, der folgende Gleichungerfüllt, nun unter Verwendung der transponiertenMatrix CT :

CT · y= 0. (2)

Eine P-Invariante definiert dann eine Menge vonPlätzen, deren gewichtete Markensumme immerkonstant bleibt und eine T-Invariante eine Multi-menge von Transitionen, deren Schalten wieder zurAnfangsmarkierung zurückführt.

Die Nicht-Null-Elemente einer Invarianten xwerden als Trägermenge von x mit supp (x) bezeich-net. Da ein lineares Gleichungssystem i. A. unendlichviele Lösungen hat, betrachtet man minimale Lö-sungen. Eine Invariante x ist minimal, wenn ihreTrägermenge keine Trägermenge einer anderenInvarianten z enthält, d. h.,

� ∃ invariant z : supp (z) ⊂ supp (x), (3)

und der größte gemeinsame Teiler aller Nicht-Null-Einträge von x ist 1.

Bei biochemischen Systemen wird angenom-men, dass sie nach einer gewissen Einschwingphaseeinen Gleichgewichtszustand, den sogenanntenSteady-State, erreichen, in welchem die Summealler chemischen Spezies konstant bleibt. Der Lö-sungsraum für die möglichen Wege im Steady-Statewird geometrisch durch einen konvexen Kegel be-grenzt. Aufbauend auf Arbeiten von Clarke [8, 9],publizierten Schuster et al. 1993 einen Algorithmuszur Berechnung aller minimalen Wege in diesemKegel, wobei auch Lösungen auf den Kanten desKegels einbezogen sind. Diese minimalen Lösun-gen bezeichneten sie als Elementare Flussmodenoder Elementarmoden, da sie als Stoffflüsse unterSteady-State-Bedingungen interpretiert werdenkönnen [49, 50]. In der Analyse biochemischerNetzwerke kommt diesen Elementarmoden eine be-sondere Bedeutung zu, da jeder Elementarmodus,ausgedrückt durch seine beteiligten Reaktionen,ein bestimmtes Netzwerkverhalten im Steady-Statecharakterisiert. Da die Menge der Reaktionen allerElementarmoden die minimale Menge an Enzymen(die eben diese Reaktionen katalysieren) darstellt,die für den Erhalt dieses Steady-States notwendig ist,und da durch Linearkombination der Lösungsvekto-ren jedes Netzwerkverhalten erzeugt werden kann,charakterisiert die Menge aller Elementarmoden

das gesamte grundlegende Verhalten des Systems imSteady-State. Das kann zur Netzwerkverifizierungherangezogen werden, indem man jeden Elemen-tarmodus auf seine biologische Interpretierbarkeitprüft. Ist ein Modus nicht interpretierbar, hat manmeistens einen Modellierungsfehler vorliegen, oder,in eher seltenen Fällen, einen neuen Weg entdeckt,den man dann experimentell zu validieren versucht,wie im Beispiel des Citratzyklus. Außerdem ergibtsich daraus, dass jede Reaktion mindestens in ei-nem Elementarmodus enthalten sein muss, da sieansonsten nicht zum Gesamtverhalten des Systemsbeiträgt.

Eine weitere wichtige Interpretation für bioche-mische Netzwerke ist, dass die Elementarmoden,einschließlich der zwischen ihnen liegendenMetaboliten und Kanten, das Netz in zusammen-hängende Teilnetze zerlegen, die jeweils einebestimmte biologische Funktion definieren. Man hatsomit eine Netzwerkdekomposition unter Steady-State-Bedingungen realisiert. Diese automatischewohldefinierte Netzwerkdekomposition ist insbe-sondere für die Behandlung sehr großer Netze (auchin anderen Gebieten) von grundlegender Bedeutung.

Wie aus der Mathematik bekannt (Farkas-Minkowski-Weyl-Theorem, siehe dazu eineausführliche Abhandlung in [47]), lässt sich dieganzzahlige lineare Optimierung geometrisch alsOptimierung über einem konvexen Polyeder auffas-sen und stellt damit einen Spezialfall der konvexenOptimierung dar. Somit kann man leicht zeigen,dass Elementarmoden minimalen, semi-positivenT-Invarianten (im folgenden kurz TI genannt)entsprechen [51].

Das Beispielnetz zum Citratzyklus aus denAbb. 1 und 2 enthält zwei TI, von welchen eine TI(Abb. 1) die katabolische Repression beschreibt.Die zweite TI (Abb. 2), ein Zyklus über Phospho-enolpyruvat, Pyruvat, Acetyl-Coenzym A, Citrat,Glyoxylat, Succinat, Fumarat, Malat, Oxalacetat undwieder Phosphoenolpyruvat, war vorher experi-mentell nicht beobachtet worden. Durch gezielteExperimente konnten Fischer und Sauer [15] zeigen,dass beim Bakterium E. coli unter Glucose-Mangelin einer langsam wachsenden Kultur genau dieserZyklus, später auch Phosphoenolpyruvat-Glyoxylat-Zyklus genannt, gemeinsam mit dem klassischenCitratzyklus vorkommt. Somit wurde durch die Aus-wertung aller TI eine neue Funktionalität entdeckt,die später durch gezielte Experimente validiert wer-

Informatik_Spektrum_37_3_2014 215

Page 6: Petrinetze in der Systembiologie

{ PETRINETZE IN DER SYSTEMBIOLOGIE

Abb. 2 Das PN des zentralenKohlenstoff-Metabolismus in E. coli ausAbb. 1. Die rot gefärbten Transitionen derzweiten TI charakterisieren den neugefundenen Phosphoenolpyruvat-Glyoxylat-Stoffwechselweg

den konnte. Abb. 2 zeigt das PN des Citratzyklus vonAbb. 1 mit der Einfärbung der neuen TI.

Das Konzept der Elementarmoden ist in derSystembiologie etabliert, sodass sich zahlreiche Pu-blikationen zu seiner Anwendung finden lassen. Indiesem Zusammenhang gibt es zwei Probleme: (1)Die Berechnung aller TI ist EXPSPACE-schwer [12]und ist daher für große Netzwerke nicht mehr hand-habbar, und (2) die Zahl der TI steigt exponentiellmit der Größe und Komplexität des Netzwerks. Dasmacht die biologische Interpretation aller TI schwie-rig, da dies manuell durch Experten geschieht.Demzufolge sind weitere Netzwerkdekompositionensinnvoll, um diese Komplexität noch handhabenzu können. Dies soll im nachfolgenden Kapitelbetrachtet werden.

Funktionale BausteineDie grundlegende Idee besteht darin, gleiche Teileder Trägermenge der Lösungsvektoren zusammen-zufassen, einmal exklusiv als disjunkte Teilnetze undeinmal mit überlappenden Teilnetzen. Somit wurdenmaximal common transition sets, auch MCTS oderMCT-sets genannt [44], und T-cluster [18] definiert.

MCTS. Für alle i, j ∈ {1, . . ., m} befinden sich dieTransitionen ti und tj in der gleichen MCTS, genaudann, wenn sie exklusiv in den selben minimalenT-Invarianten vorkommen:

χ{0}(xi)= χ{0}(x j), (4)

mit χ{0} als charakteristische Funktion, die an-zeigt, ob ein Argument gleich 0 ist. Dies führt zumaximalen Transitionsmengen, wobei für jedeTransitionsmenge ϑ folgendes gilt:

∀x ∈ X : ϑ ⊆ supp(x) ∨ ϑ ∩ supp(x)= ∅, (5)

mit X als Menge aller minimalen T-Invarianten x.Diese Gruppierung gemäß Gleichung (4) reprä-

sentiert eine Äquivalenzrelation in T, der Mengeder Transitionen, was zu einer Dekompositionvon T führt. Die Äquivalenzklassen ϑ sind MCTS.Damit bilden MCTS disjunkte Teilnetze, die imGegensatz zu T-Invarianten nicht unbedingt zu-sammenhängend sein müssen. Diese disjunktenTeilnetze können als funktionale Bausteine desNetzes interpretiert werden.

Im Beispiel des Citratzyklus ergeben sich fol-gende MCTS: MCTS1 = {PEP_input, CO2_output,P-K, P-D, C-S, M-D, Fumarase, S-D, Acokinase},MCTS2 = {I-D, aK-D, S-CoA-S} und MCTS3 ={P-C, M-S, I-L}. MCTS1 beschreibt den Teil der bei-den Stoffwechselwege, der in beiden TI vorkommtund kann als Rückgrat der Funktionalität des Ci-tratzyklus interpretiert werden. Die anderen beidenMCTS enthalten die jeweils unterschiedlichen Teileder beiden TI, MCTS2 für den herkömmlichen Wegund MCTS3 für den neuen Weg.

T-cluster. Um das harte Kriterium der MCTS aufzu-weichen, sodass überlappende Teilnetze entstehenkönnen und damit auch eine zusammengesetzte bio-

216 Informatik_Spektrum_37_3_2014

Page 7: Petrinetze in der Systembiologie

logische Funktionalität beschrieben werden kann,werden T-Cluster definiert. Auch hier betrachtetman die Trägermengen der Lösungsvektoren undversucht, die Transitionen zu gruppieren. Doch nunverwendet man ein anderes Ähnlichkeitsmaß undclustert mit hierarchischen Cluster-Verfahren, wieUPGMA oder Neighbour-Joining. Als Ähnlichkeits-maß kann z. B. der Tanimoto-Index [3] dienen. Nachdiesem wird die Ähnlichkeit von zwei T-Invariantenti und tj wie folgt berechnet:

s(ti, tj)= sij =a

a + b + c

mit a als der Anzahl der Transitionen in beidenInvarianten und b und c als den Anzahlen der Tran-sitionen in der Invarianten ti bzw. tj. Der Abstandzwischen zwei Invarianten beträgt dann [53]

dij = 1 – sij.

Nach dem Aufbau der Abstandsmatrix könnenunterschiedliche Cluster-Verfahren angewendetwerden. Wie viele Cluster man erhält, hängt vonder Definition eines Schwellwerts für die Clusterzahlab, d. h. wo konkret der Clusterbaum abgeschnittenwerden soll. Im Gegensatz zu den MCTS erhält mandann Cluster, die überlappen können, d. h. Cluster,welche die gleichen Transitionen enthalten können.

Zusammenfassung und AusblickDer vorliegende Artikel versucht, Einblick in einwichtiges Anwendungsgebiet für Petrinetze zugeben, in die Systembiologie. Nach einer allgemei-nen Einführung in das Thema wird Augenmerkauf die automatische Netzwerkdekomposition zurBestimmung funktionaler Module gelegt. Fokus-siert wird dabei auf die minimalen, semi-positivenTransitions-Invarianten, die charakteristische, zu-sammenhängende Teilnetze definieren, wenn sichdas System im Steady-State befindet. Diese TI könnensowohl zur Netzwerkverifizierung bekannter Wegeals auch zur Entdeckung neuer Wege herangezogenwerden. Außerdem können Transitionen, die nichtzum Netzwerkverhalten beitragen, gefunden undgegebenenfalls eliminiert werden. Aufgrund der im-mensen Zahl von TI schon für mittelgroße Modelleist eine weitere Dekomposition sinnvoll. Hier werdenMCTS und T-cluster vorgestellt, die einmal dis-junkte Teilnetze und einmal überlappende Teilnetzerepräsentieren. All diese Konzepte sind in der Sys-tembiologie etabliert. Sie zeigen, dass viele wichtige

Aussagen zur Netzwerkdynamik auch ohne Kenntnisder kinetischen Parameter getroffen werden können.

Es wurden natürlich auch andere mathemati-sche Formalismen für die Modellierung biochemi-scher Systeme angewendet, wie das π-Kalkül [39,43]. Auch die automatische Netzwerkdekompositionim Steady-State ist Gegenstand vieler Arbeiten, soz. B. die Definition von minimal cut sets [24] als derminimalen Menge von Transitionen, die notwendigsind, um eine bestimmte biologische Funktion zuinhibieren oder die Definition von minimal metabo-lic behaviours und dem reversible metabolic space,was zur Klassifizierung von irreversiblen, pseudo-irreversiblen und vollständig reversiblen Reaktionenführt [27]. Ähnliche Ansätze, aber unter der Be-rücksichtigung der stöchiometrischen Verhältnisse,stellen enzyme subsets [37] und Cluster nach [36]dar. Darauf aufbauend kann eine Netzwerkreduktionerfolgen, wobei die CTI(Covered by Transition- Inva-riants)-Eigenschaft beibehalten wird, siehe dazu [1].Es ist zu beachten, dass all diese Anwendungenunter Steady-State-Bedingungen, sowohl ohne alsauch mit Berücksichtigung der stöchiometrischenRelationen, gelten.

Die Anwendungen von PN in der Systembio-logie sind von großem Interesse und werden vonvielen Gruppen weiter entwickelt. Auch wenn in derquantitativen Analyse die gleichen Algorithmen wiein der klassischen Systembiologie verwendet wer-den, ist die intuitive grafische Darstellung, gekoppeltmit einem Editor, verschiedenen Analysemethodenund der Simulation, von großem Vorteil. Anderer-seits ist es hier oftmals ratsam, über wohl-definierteSchnittstellen, wie SBLM [14], die Werkzeuge derklassischen Systembiologie, wie z. B. Copasi [22],zu nutzen, da diese Werkzeuge viele speziell aufbiologische Systeme abgestimmte Methoden undErweiterungen bieten. Schlussfolgernd kann mansagen, dass die Stärke der PN vor allem in der diskre-ten Modellierung und der Möglichkeit zur hybridenModellierung liegt.

In diesem Artikel sind einige wichtige An-wendungsaspekte speziell für die Biologie gezeigtworden. Wegen der Größe und Komplexität dieserSysteme bedarf es neuer Ansätze und Ideen, um z. B.eine Erreichbarkeitsanalyse durchführen zu können.

DanksagungIch möchte insbesondere den Initiatoren dieser Son-derausgabe, Wolfgang Reisig und Jörg Desel, für

Informatik_Spektrum_37_3_2014 217

Page 8: Petrinetze in der Systembiologie

{ PETRINETZE IN DER SYSTEMBIOLOGIE

die Einladung zu diesem Beitrag danken. Ein be-sonderer Dank gilt Stefan Schuster, der mich 1997auf die Arbeiten von Reddy aufmerksam machte,für viele anregende Diskussionen. Weiterhin dankeich Jörg Ackermann, Falk Schreiber, Björn Junker,Andrea Sackmann, Eva Grafahrend-Belau, AstridSpeer und Stefanie Grunwald für eine fruchtbareZusammenarbeit.

Literatur1. Ackermann J, Einloft J, Nöthen J, Koch I (2012) Reduction techniques for network

validation in systems biology. J Theor Biol 315:71–802. Ackermann J, Koch I (2011) Quantitative Analysis. In: Koch I, Reisig W, Schreiber F

(eds) Modeling in Systems Biology: The Petri Net Approach, Comp. Biol., Sprin-ger, Berlin, Heidelberg, 153–178

3. Backhaus K, Erichson B, Plinke W, Weiber R (2003) Multivariate Analysis Methods.An Application-Oriented Introduction, 10. Aufl. Springer, Berlin

4. Bahi-Jaber N, Pontier D (2003) Modeling transmission of directly transmitted in-fectious diseases using colored stochastic Petri nets. Math Biosci 185:1–13

5. Berg JM, Tymoczko JL, Stryer L (2002) Biochemistry. 5. Aufl. W.H. Freeman andCompany, New York

6. Bortfeldt RH, Schuster S, Koch I (2010) Exhaustive analysis of the modular struc-ture of the spliceosomal assembly network: a Petri net approach. In Silico Biol10:89–123

7. Chaouiya C (2007) Petri net modelling of biochemical systems. Brief Bioinf 8(4):210–219

8. Clarke BL (1981) Complete set of steady states for the general stoichiometric dy-namical system. J Chem Phys 75:4970

9. Clarke BL (1988) Stoichiomteric network analysis. Cell Biophys 12:237–25310. Doi A, Nagasaki M, Matsuno H, Miyano S (2006) Simulation based validation of

the p53 transcriptional activity with hybrid functional Petri net. In Silico Biol6(1–2):1–13

11. Einloft J, Ackermann J, Nöthen J, Koch I (2013) Monalisa – visualization and ana-lysis of functional modules in biochemical networks. Bioinform 29:1469–1470

12. Esparza J (1998) Decidability and complexity of Petri net problems – an introduc-tion. LNCS 1491:374–428

13. Fieber M (2004) Design and implementation of a generic and adaptive tool forgraph manipulation. Master’s thesis, Brandenburg University of Technology atCottbus

14. Finney A, Hucka M (2003) Systems biology markup language: level 2 and beyond.Biochem Soc Trans 31:1472–1473

15. Fischer E, Sauer U (2003) A novel metabolic cycle catalyzes glucose oxidation andanaplerosis in hungry Escherichia coli. J Biol Chem 278(47):46446–46451

16. Förster J, Famili I, Fu P, Palsson BØ, Nielsen J (2003) Genome-scale reconstructionof the Saccharomyces cerevisiae metabolic network. Genome Res 13:244–253

17. Genrich H, Küffner R, Voss K (2001) Executable Petri net models for the analysisof metabolic pathways. J Software Tools Techn Transfer 3(4):394–404

18. Grafahrend-Belau E (2006) Classification of T-invariants in biochemical Petri netsbased on different cluster analysis techniques. Master’s thesis, Technical Univer-sity of Applied Sciences Berlin

19. Grafahrend-Belau E, Schreiber F, Heiner M, Sackmann A, Junker BH, Grunwald S,Speer A, Winder K, Koch I (2008) Modularisation of biochemical networks throughhierarchical cluster analysis of T-invariants of biochemical Petri nets. BMC Bioinf9:90

20. Grunwald S, Speer A, Ackermann J, Koch I (2008) Petri net modelling of gene re-gulation of the Duchenne muscular dystrophy. BioSyst 92:189–205

21. Heinrich R, Rapoport TA (1974) A linear steady-state treatment of enzymaticchains. General properties, control and effector strength. Eur J Biochem 42:89–95

22. Hoops S, Sahle S, Gauges R, Lee C, Pahle J, Simus N, Singhai M, Xu L, Mendes P,Kummer U (2006) COPASI – a COmplex PAthway SImulator. Bioinform 22(24):3067–3074

23. Kielbassa J, Bortfeldt R, Schuster S, Koch I (2009) Modeling of the U1 snRNP as-sembly pathway in alternative splicing in human cells using Petri nets. ComputBiol Chem 33:46–61

24. Klamt S, Gilles ED (2004) Minimal cut sets in biochemical reaction networks. Bio-inform 20(2):226–234

25. Koch I (2010) Petri Nets and GRN models. In: Das S, Caragea D, Welch S, Hsu WH(eds) Handbook of Research on Computational Methodologies in Gene RegulatoryNetworks. IGI Global, Hershey, NY, 604–637

26. Koch I, Junker BH, Heiner M (2005) Application of Petri net theory for modellingand validation of the sucrose breakdown pathway in the potato tuber. Bioinf 21:1219–1226

27. Larhlimi A, Bockmayr A (2009) A new constraint-based description of the steady-state flux cone of metabolic networks. Disc Appl Math 157:2257–2266

28. Lautenbach K (1973) Exact conditions of liveness for a class of Petri nets. Num-mer 82 in Berichte der GMD. Gesellschaft für Mathematik und Datenverarbeitung,Sankt Augustin

29. Liao J, Hou S-Y, Chao Y-P (1996) Pathway analysis, engineering, and physiologi-cal considerations for redirecting central metabolism. Biotechn Bioengin 52:129–140

30. Matsuno H, Doi A, Nagasaki M, Miyano S (2000) Hybrid Petri net representation ofgene regulatory network. Proc Pac Symp Biocomput 5:338–349

31. MTZ-Stiftung (2012) Definition of systems biology. http://www.mtzstiftung.de/die_mtz_awards_projekte/mtz_bioquant_award/definition_systembiologie/, letz-ter Zugriff: 15.1.2014

32. Mura I (2011) Stochastic Modeling. In: Koch I, Reisig W, Schreiber F (eds) Mode-ling in Systems Biology: The Petri Net Approach. Comp. Biol., Springer, Berlin, Hei-delberg, 121–152

33. Nagasaki N, Saito A, Jeong E, Li C, Kojima K, Ikeda E, Miyano S (2011) Cell Illus-trator 4.0: a computational platform for systems biology. Stud Health Technol In-form 162:160–181

34. Orth JD, Conrad TM, Na J, Lerman JA, Nam H, Feist AM, Palsson BØ (2011) A com-prehensive genome-scale reconstruction of Escherichia coli metabolism. Mol Sys-tems Biol 7:535

35. Peleg M, Rubin D, Altman RB (2005) Using Petri net tools to study properties anddynamics of biological systems. J Am Med Inf Assoc 12(2):369–371

36. Pèrés S, Vallée F, Beurton-Aimar M, Mazat JP (2011) Acom: a classificationmethod for elementary flux modes based on motif finding. BioSyst 103(3):410–419

37. Pfeiffer T, Sánchez-Valdenebro I, Nuño JC, Montero F, Schuster S (1999) META-TOOL: for studying metabolic networks. Bioinf 15(3):251–257

38. Popova-Zeugmann L, Heiner M, Koch I (2005) Time Petri nets for modeling andanalysis of biochemical networks. Fundam Inform 67:149–162

39. Priami C, Regev A, Shapiro E, Silverman W (2001) Application of a stochasticname-passing calculus to representation and simulation of molecular processes.Inf Proc Lett 80:25–31

40. Reddy VN (1994) Modeling biological pathways: a discrete event systemsapproach. Master’s thesis, University of Maryland, USA

41. Reddy VN, Liebman MN, Mavrovouniotis ML (1996) Qualitative analysis of bioche-mical reaction systems. Comput Biol Med 26(2):9–24

42. Reddy VN, Mavrovouniotis ML, Liebman MN (1993) Petri net representations inmetabolic pathways. In: Hunter L, Searls D, Shavlik J (eds) Proceedings of the FirstInternational Conference on Intelligent Systems for Molecular Biology, volume 1,Menlo Park, California, USA, AAAI Press, 328–336

43. Regev A, Silverman W, Shapiro E (2001) Representation and simulation of bioche-mical processes using the pi-calculus process algebra. Proc Pac Symp Biocomp6:459–470, 2001

44. Sackmann A (2005) Modelling and Simulation of signaltransduction pathways ofSaccharomyces cerevisiae based on Petri net theory. Diploma thesis, Ernst MoritzArndt-University Greifswald

45. Sackmann A, Formanowicz D, Formanowicz P, Koch I, B�lazewicz J (2007) An ana-lysis of the Petri net based model of the human body iron homeostasis process.Comput Biol Chem 31:1–10

46. Sackmann A, Heiner M, Koch I (2006) Application of Petri net based analysis tech-niques to signal transduction pathways. BMC Bioinf 7:482

47. Schrijver A (1998) Theory of Linear and Integer Programming. Wiley-VCH, Wein-heim

48. Schuster S, Dandekar T, Fell DA (1999) Detection of elementary flux modes in bio-chemical networks: a promising tool for pathway analysis and metabolic engi-neering. Trends Biotechn 17(2):53–60

49. Schuster S, Hilgetag C (1994) On elementary flux modes in biochemical reactionsystems at steady state. J Biol Syst 2:165–182

50. Schuster S, Hilgetag C, Schuster R (1996) Determining elementary modes of func-tioning in biochemical reaction networks at steady state. In: Ghista DN (ed) Bio-medical and Life Physics. Vieweg, Wiesbaden, 101–114

51. Schuster S, Pfeiffer T, Moldenhauer F, Koch I, Dandekar T (2002) Exploring the pa-thway structure of metabolism: Decomposition into subnetworks and applicationto Mycoplasma pneumoniae. Bioinf 18:352–361

218 Informatik_Spektrum_37_3_2014

Page 9: Petrinetze in der Systembiologie

52. Srivastava R, Peterson MS, Nentley WE (2001) Stochastic kinetic analysis of theEscherichia coli stress circuit using σ -32 targeted antisense. Biotechol Bioeng231(1):120–129

53. Steinhausen D, Langer K (1977) Cluster analysis. An Introduction to methods forautomatic classification. de Gruyter, Berlin

54. Voss K, Heiner M, Koch I (2003) Steady state analysis of metabolic pathways usingPetri nets. In Silico Biol 3(3):367–387

55. Wang L, Li P (2011) Microfluidic DNA microarray analysis: a review. Anal ChimActa 687(1):12–27

56. Wick LM, Quadroni M, Egli T (2001) Short- and long-term changes in proteomecomposition and kinetic properties in a culture of Escherichia coli during transi-tion from glucose-excess to glucose limited growth conditions in continuous cul-ture and vice versa. Environ Microbiol 3:588–599

57. Windhager L, Erhard F, Zimmer R (2011) Fuzzy Modeling. In: Koch I, Reisig W,Schreiber F (eds) Modeling in Systems Biology: The Petri Net Approach, Comp.Biol., Springer, Berlin Heidelberg, 179–205

Informatik_Spektrum_37_3_2014 219