43
Genregulation Literatur - Alberts/Lehninger - Kim Sneppen & G. Zocchi: Physics in Molecular Biology - E. Klipp et al. : Systems Biology in Practice Vorlesung System-Biophysik 11. Dez. 2007 Physik der Transkriptionskontrolle und Expressionsanalyse

Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Embed Size (px)

Citation preview

Page 1: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Genregulation

Literatur

- Alberts/Lehninger- Kim Sneppen & G. Zocchi: Physics in Molecular Biology- E. Klipp et al. : Systems Biology in Practice

Vorlesung System-Biophysik 11. Dez. 2007

Physik der Transkriptionskontrolle und Expressionsanalyse

Page 2: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Vom genetischen zum systemischen Ansatz

Genregulation

mRNA Regulation

DNA Mutationen / Evolution

Proteinfunktionen

Raumzeitliche StrukturbildungMorphogenese

Signaltransduktion=> Themen der Systembiophysik

Page 3: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Biologische Musterbildung und Morphogenese30. Okt 07

!

E + Sk1" # " ES

k2" # " E + P

!

k"1# $ $

Enzymatische ReaktionenMichaelis-Menton-KinetikInhibierung, Regelung

Reaktions-Diffusions-Modell von „Morphogenen“

Biochemische Netzwerke

Page 4: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Modell-System E.coli

E.coli besitzt ein einziges DNA Molekül mit 4.6 106 Basenpaaren. Es kodiertfür 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt desGenoms übersteigt die Strukturinformation der exprimierten Proteine.-> regulatorische Mechanismen sind auf dem Genom kodiert.

Genregulation erlaubt Anpassung an UmweltveränderungenSteuerung des Metabolischen Netzwerks (Stoffwechsel)

Page 5: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Inhalt

Grundlagen: Monod Modell, Lac OperonStatistische Physik DNA-bindender ProteineModellierung genregulatorischer Netzwerke(ODE & Boolsche Netze)Dynamik der Protein-DNA BindungDNA loopingAnalyse von GenexpressionsdatenSynthetische Netzwerke (Seminar)

Page 6: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Das Operon-Modell

operon

Operon: Genetische Funktionseinheit, die aus regulierten Genen mit verwandter Funktionbesteht und enthält:- Promotor: Bindungsstelle für RNA-Polymerase- Operator: kontrolliert Zugang der RNA-Polymerase zu Strukturgen- Strukturgene: Polypeptide codierende Gene

Francois Jacob und Jaques Monod, 1961

Page 7: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Der Trp Operator als Schalter:• Innerhalb des Promoters liegt eine kurz Region regulatorischer DNA,

die als Bindungsstelle eines Repressors arbeitet. Bindet der Repressor,so ist das Ankoppeln der RNA Pol sterisch unterdrückt.

Page 8: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Die Aussenseite von DNA kannvon Proteinen erkannt werden:

Die verschiedenen Basenpaarewerden anhand ihrer Ränder erkannt=> DNA-Bindungsmotive

Page 9: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Durch Bindung des Tryptophan an das Tryptophan-Repressorprotein wir die Konformation des Repressors verändert

Page 10: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Identifizierung von Promoter Sequenzen

Page 11: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Transkriptions-Aktivatorproteine schalten Gene ein

Page 12: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Gen-Regulation mit Feedback:lac-Operon

LacI

IPTG, TMG

Page 13: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Campbell, N.A., Biology

A cis-regulatory element or cis-element is a region of DNA or RNA that regulatesthe expression of genes located on that same strand. This term is constructed fromthe Latin word cis, which means "on the same side as". These cis-regulatoryelements are often binding sites of one or more trans-acting factors.

IPTG (Isopropyl β-D-1-thiogalactopyranoside)This compound is used as a molecular mimic of allolactose, a lactosemetabolite that triggers transcription of the lac operon. Unlike allolactose, the sulfur (S) atom creates a chemical bond which isnon-hydrolyzable by the cell, preventing the cell from "eating up" or degrading the inductant. IPTG induces activity of beta-galactosidase, an enzyme that promotes lactose utilization, by binding and inhibiting the lac repressor. In cloning experiments,the lacZ gene is replaced with the gene of interest and IPTG is then used to induce gene expression.

Non-metabolizable inducer are used to inducegene expression

Page 14: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Variation der Protein-Konzentration mit IPTG

Northern Blot: Bestimme die Konzentration von messenger RNA (mRNA)

Externe und interne Induktor-Konzentration gleich, sobald System im GleichgewichtDie Konzentration von mRNA nimmt bis 60% monoton mit der Induktor-Konzentrationzu, bei höheren Konzentrationen Sättigung

Operon ermöglicht Variation der Protein-Konzentration. Wasfehlt noch zum Schalter?

60

40

20

0

[mR

NA

]

0.100.00

[IPTG Induktor]Long, C et al, J.Bacteriol. 2001

Page 15: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Transkription und Translation in E.coliTypische Zeiten und Raten

1 Molekül / Zelle = 1nMGesamtmasse 2.5 106 Da

TRANSKRIPTIONInitierungsrate 1/s - 1/18sTranskriptionsrate: 30bps-90bps

TRANSLATION10.000-15.000 RibosomeTranslationsrate 6-22 codons/s(40 Proteine/mRNA)

Page 16: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

The arabinose system1

Uptake

Reporter

Regulator

Break down

pBAD24 2~55 copies/cell

[1] R. Schleif. Trends in Genetics, 16(12):559–565, 2000[2] L. M. Guzman, D. Belin, M. J. Carson, and J. Beckwith. J.Bacteriol., 177(14):4121–4130, 1995[3] D. A. Siegele and J. C. Hu. Proc. Natl. Acad. Sci. USA, 94(15):8168–8172, 1997

Page 17: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

automated data aquisition

define ROIs

measure total intensity

DICtn

N

DICt0

Fluorescencet0

t1

tn

background correction

calibration and conversion into molecular units

Time-lapse Fluorescence Microscopy and Quantitative ImageProcessing

Page 18: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Judith Leierseder Diplomarbeit

Page 19: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

8x105

6

4

2

0

To

tal

Flu

ore

sce

nce

[a

.u.]

806040200

Time [min]

0.2% arabinose

Single cell expression kinetics

30min 40min 60min50min 70min

5min 15min 35min 45min25min

Saturating induction

Subsaturating induction

Image series correspond to blue curves

Fluorescence measurement• Cell outlines are determined using bright field images• The signal is integrated within the outline in each fluorescence image

8x105

6

4

2

0

To

tal

Flu

ore

sce

nce

[a

.u.]

806040200

Time [min]

0.01% arabinose

Page 20: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Gene expression modelDeterministic rate model with time delay d

8x105

6

4

2

0

Z(!

) [a

.u.]

806040200

! [min]

Reporter module Uptake module

Induction: t=0min

Page 21: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Curve Fitting

Fixed Parameters

Saturating induction

Subsaturating induction

Fit Parameters

Fit expression function

Time delay

Proteinsynthesisrate

Literature

Measured

8x105

6

4

2

0

To

tal

Flu

ore

sce

nce

[a

.u.]

806040200

Time [min]

0.01% arabinose

8x105

6

4

2

0

To

tal

Flu

ore

sce

nce

[a

.u.]

806040200

Time [min]

0.2% arabinose

Page 22: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Zeitskala der Suche nach der Bindungsstelle

!

D =kT

6"#R

!

P(r,t) =1

4"tDexp #

r2

4Dt

$

% &

'

( )

!

tdiffusion =d2

2D

Stokes Einstein Gleichung(z.B. DGFP=3-7µm2/s)

Wahrscheinlichkeitsverteilung

1µm

Typische Zeitskala dass ein Protein einenbeliebigen Punkt in E.coli findet : tD ≈ 0.1s

Page 23: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Diffusion zu einer absorbierenden Scheibe

!

J = "D4#r2dC

dr

!

dC

dt=1

r2Dd

dr4"r2

dC

dr

#

$ %

&

' (

!

C(r) =J

D4"r+ C(#)

!

C(") = N V

!

C(") = 0

!

J = 4"#DN

V

!

"on

=V

4#D$N% 20s N

Page 24: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Verweildauer der Transkriptionsfaktoren

!

1

" off=1

" onV # exp $G kT( ) = 4%D& M[ ] # exp $G kT( )

(mit τon=20s/N folgt, dass 1Molekül in 1µm3 einen Operator gerade halb besetzt)

für spezifische Bindungsstellen (Operator)mit 1M-1=1.6nm3 and ΔGspez=-12.6kcal/mol, ε=1folgt

!

" off # 20s

für unspezifische Bindungsstellen mit ΔGuspez=-10-4 kcal/mol,

!

" off #10$4s

Page 25: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Die Suche auf dem DNA Strang

!

" =L2

2D1

# 200.000s # 2Tage

Unspezifische Bindung von TFs and DNA ist ein Problem, da die Suche aufnach der Bindungsstelle auf dem Strang länger dauert. Wenn die Verweildauerunendlich wäre, würde ein ein-dimensionaler random walk

dauern (L=1.5mm und D1≈D)

Page 26: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Die Suche auf der DNA wird durch „Sprünge“ aufbenachbarte DNA Stränge beschleunigt

!

" #l2

D1

$

% &

'

( ) *L

l#Ll

D1

Mit L=1.5mm, l=150nm folgt

!

" # 50s

Page 27: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Kombinatorische Genregulation: Genetische Netze

transcriptiontranscription

translationtranslation

Genregulatorisches Genregulatorisches ProteinProtein

Page 28: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Ein Transkriptions-Aktivator und ein Transkriptions-Repressorkontrollieren das lac-Operon

Page 29: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Thermodynamisches Modell einer kombinatorischen Transkriptions Logik

ΔP : Bindungswahrscheinlichkeit

Gerland et al. PNAS, 2005

Genregulation folgt denPrinzipien von„Boltzmann-Maschinen“

Page 30: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Statistische Physik der Protein - DNA Bindung

!

CI +O"CIO

!

K =k+

k"

=CI[ ] O[ ]CIO[ ]

!

"

!

" =CIO[ ]Ototal[ ]

=CI[ ]

K + CI[ ]

Bindungsisotherme:

Page 31: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Kooperativität durch Dimer-Bildung

!

CI( )D

+O"CIO

!

KD

=CI( )

M[ ]

2

CI( )D

[ ] !

"

!

" =CIO[ ]Ototal[ ]

=CI( )

M[ ]

2

K #KD

+ CI( )M

[ ]2

Kooperative Bindung

!

CI( )M

+ CI( )M" CI( )

D

!

"

Page 32: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Das statistische Gewicht des „on“ Zustands

!

Pon

=Z(on)

Z

!

Pon

Poff

=Z(on)

Z(off )="

cexp #$ % G kT( ) =

CI[ ]K

Die freie Energiedifferenz DG ist auf eine freie Konzentration von 1Mfestgelegt. Die wahre Änderung der freien Energie der Bindung hängtvon der Konzentration des Transkriptionsfaktors in Lösung ab:

!

"G* = kT ln Z(on)( ) # ln Z(off )( )( ) = "G # kT ln CI[ ]( )

Page 33: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Modell für lac Netzwerk

GlukoseKonz.konstant

GFP: Reportermolekül, Abbildung durchFluoreszenz-Mikroskopie=> je höher das Fluoreszenz-Signal destomehr LacZ,Y wird exprimiert

Page 34: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Experimenteller Nachweis eines Schalters

Anfang: nicht induziert

Nach Induktion 2 Populationen:induzierte Population grün, nichtinduzierte Population weiß

Bistabiler Bereich (grau)

Pfeil zeigt den Anfangs-Zustand Zustand derBakterien hängt vom Ausgangs-Zustand ab!

=> Schalter mit Hysterese

Ozbudak et al, Nature 2004

Page 35: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Modellierung genregulatorischer Netzwerke

• ein Beispiel:

Page 36: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Modellierung auf der Ebene der mRNA

Page 37: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Verlauf der mRNA Konzentrationen

Problem: Die kinetischen Bindungskonstanten sindin der Regel nicht bekannt

stationärerZustand

Page 38: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Vereinfachung kombinatorischer Netzwerke

transcriptiontranscription

translationtranslation

Genregulatorisches Genregulatorisches ProteinProtein

Page 39: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Abstraktion genetischer Netze

Gen X

Gen Y

Gen Z

+

-

Page 40: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Boolesche Netze(Kauffman 1989)

Page 41: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Boolsche Netzwerkmodelle

• N Gene (Knoten)

• mit 2N unterschiedlichen Zuständen

• durch mögliche Regeln verküpft

• wobei K die Anzahl „inputs“ pro Knoten ist

!

22K

Page 42: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Boolsche Regeln für N=2 und K=2

Page 43: Genregulation - LMU München · E.coli besitzt 6ein einziges DNA Molekül mit 4.6 10 Basenpaaren. Es kodiert für 4226 Proteine und einige RNA Moleküle. Der Informationsgehalt des

Zurück zum Beispiel

Beobachtung:wenn a=0, dann wird0101 stationär

wenn a=1, dannoszillatorisches Verhalten1000->1001->1111->1010->1000