28
Populationsgenetik 3: Kopplungsungleichgewicht (LD) Peter N. Robinson Institut für medizinische Genetik Charité Universitätsmedizin Berlin 28. Juni 2008 Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 1 / 60 Hardy-Weinberg-Gesetz Letztes Mal ... Eigenschaften eines einzelnen Genlocus: Allelfrequenzen, Genotypfrequenzen Hardy-Weinberg-Gesetz: Beziehung zwischen Allel- und Genotypfrequenzen p 2 + 2pq + q 2 Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 3 / 60

Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Embed Size (px)

Citation preview

Page 1: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Populationsgenetik 3: Kopplungsungleichgewicht (LD)

Peter N. Robinson

Institut für medizinische GenetikCharité Universitätsmedizin Berlin

28. Juni 2008

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 1 / 60

Hardy-Weinberg-Gesetz

Letztes Mal . . .

Eigenschaften eines einzelnen Genlocus:Allelfrequenzen, Genotypfrequenzen

Hardy-Weinberg-Gesetz: Beziehungzwischen Allel- und Genotypfrequenzen

p2 +2pq +q2

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 3 / 60

Page 2: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Kopplungsungleichgewicht

Dieses Mal . . .

Eigenschaften von Gruppen von Genorten

Haplotypen

Kopplungsgleichgewicht

Kopplungsungleichgewicht

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 4 / 60

Eine Geschichte zweier Mutationen

Heute existierende Alleleentstanden durch weitzurückliegendeMutationsereignisse

A

A

A

A

A

A

A

A

A

A

A

A

GA

A

A

A

A

A

A

A

A

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 5 / 60

Page 3: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Eine Geschichte zweier Mutationen (2)

Nach einem erstenMutationsereignis entstand eineweitere Mutation auf demselbenChromosom . . .

G T

A T

G T

A C

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 6 / 60

Eine Geschichte zweier Mutationen (2)

Rekombination führt zu neuenKombinationen der Allele

G T

A T

A C

A T

CG

G T

A C

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 7 / 60

Page 4: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Kopplungsungleichgewicht

Linkage Disequilibrium: LDChromosomen sind MosaikeI RekombinationI MutationI Genetische DriftI Natürliche Auslese (Selektion)

Kombinationen von Allelen in nahbeieinander liegenden Loci: weitzurückliegende (”ancestral”)Haplotypen

"Vorfahr-Chromosom"

Heutige Chromosomen

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 8 / 60

Gründereffekt und LD

Eine in der Stammpopulation bestehende, große genetische Variabilitätreduziert sich bei der Gründung einer Kolonie durch wenig Individuen

Häufige Ursache von LD in menschlichen Populationen

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 9 / 60

Page 5: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

LD und Kartierung (Vorschau)

In einer späteren Vorlesung werden wir die Bedeutung des LD für dieEntdeckung von genetischen Varianten, die mit einer erhöhtenAnfälligkeit für häufige Krankheiten wie Diabetes, Herzinfarkt,Schlaganfall, Allergie, . . ., eingehen

Dieses Mal wollen wir die mathematischen Hintergründe und diebiologischen Grundlagen erklärenWichtig: Unterscheide Linkage und Linkage Disequilibrium (LD):I Linkage:gemeinsame Vererbung zweier Loci in FamilienI LD: Beziehung zwischen zwei Allelen an 2 Loci in einer Population

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 10 / 60

Genotyp vs. Haplotyp

1 HaplotypI ”haploider Genotyp”I Eine Rekombination wird nur selten zwei Loci trennen, die nahe

beieinander auf einem Chromosom liegenI Deshalb werden Gruppen von Allelen, die auf demselben

Chromosomenabschnitt liegen eher zusammen (als durch Rekombinationgetrennt) als Block übertragen werden

2 GenotypI die (diploide) genetische Ausstattung eines Individuums an einem oder

mehreren Loci. Beide Exemplare eines Allels werden berücksichtigt, z.B.der Genotyp an einem Locus mit Allelen A und a kann AA, Aa oder aasein.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 11 / 60

Page 6: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Kopplungsungleichgewicht

Ein Kopplungsungleichgewicht (LD) besteht zwischen zwei Genloci, dieauf einem Chromosom eng beieinander liegen, und deshalbzusammenvererbt werden.

Zwei eng beieinander liegende Loci werden dann nicht zusammenvererbt, wenn zwischen ihnen eine Rekombination erfolgt.BegriffeI HaplotypfrequenzI D, D

′, r2

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 12 / 60

LD: D

A und a: zwei Allele von einem Locus (Allelfrequenz pA und pa)

B und b zwei Allele eines anderen Locus. (Allelfrequenz pB und pb)

Häufigkeiten von Kombinationen dieser Allele innerhalb einer Populationvon Gameten†: pAB,pAb,paB und pab.

†zur Erinnerung sind Gameten Keimzellen, d.h. haploide Zellen, die im Gegensatz zudiploiden Zellen jeweils nur ein Exemplar jedes Locus haben.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 14 / 60

Page 7: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

LD: D

Die entsprechenden Allelfrequenzen ergeben sich aus der Summe derGenotypfrequenzen:

pa = pab +paB pA = pAb +pAB = 1−pa

undpb = pab +pAb pB = pAB +paB = 1−pb

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 15 / 60

Kopplungsgleichgewicht

Sind die beiden Genloci untereinander im Kopplungsgleichgewicht†, dannist die Wahrscheinlichkeit, dass eine Gamete das Allel a aufweist,unabhängig von der Wahrscheinlichkeit, dass sie das Allel b aufweist

pab = pa×pb

†zum Beispiel weil die Genloci auf unterschiedlichen Chromosomen gelegen sindPeter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 16 / 60

Page 8: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Kopplungsungleichgewicht

Sind die Loci nicht im Kopplungsgleichgewicht, dann gilt

pab 6= pa×pb

.

Wir führen die Variable D ein, um die Abweichung vomKopplungsgleichgewicht zu beschreiben:

pab = papb +D (1)

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 17 / 60

LD

Hieraus folgt

paB = pa−pab

= pa−papb−D

= pa (1−pb)−D

= papB−D

Eine analoge Berechnung zeigt:

pAb = pApb−D

und†

pAB = pApB +D

†s. SkriptPeter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 18 / 60

Page 9: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

LD

Die am häufigsten verwendete Definition der LD-Koeffiziente D ist jedoch

D = pABpab−pAbpaB (2)

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 19 / 60

LD

Diese Formel leitet sich von der Definition (1) ab:

D = pab−papb

= pab− (paB +pab)(pAb +pab)

= pab−paBpAb−pabpab−paBpab−pAbpab

= pab (1−pab−paB−pAb)−paBpAb

= pab (pAB)−paBpAb

= pABpab−pAbpaB

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 20 / 60

Page 10: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

D und AllelfrequenzenDie Abbildung zeigt den Einfluss von unterschiedlichen Allelfrequenzen auf dieSpannweite von D.

0 0.2 0.4 0.6 0.8 1−0.25

−0.2

−0.15

−0.1

−0.05

0

0.05

0.1

0.15

0.2

0.25

Repulsion

D

LD−Koeffiziente

LD−Koeffiziente (pA= 0.5, p

B = 0.5)

LD−Koeffiziente (pA= 0.1, p

B = 0.1)

Abbildung: Abhängigkeit der LD-Koeffiziente D von den Allelfrequenzen und vom Gradan Repulsion. 0 = komplette Coupling von AB und ab, 1,0 = komplette Repulsion(Überschuss an Ab und aB).

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 21 / 60

Wie lange dauert es, bis ein Kopplungsungleichgewichtverschwunden ist?

0 20 40 60 80 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Generationen

Ant

eil L

D

θ=0.001

θ=0.01

θ=0.1

θ=0.5

Di = (1−θ)i D0

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 22 / 60

Page 11: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

matlab

generat ionen = [ 1 : 1 0 0 ] ;

Theta =[0.001 0.01 0.1 0 . 5 ] ;D=zeros (100 ,4 ) ; % 100 Reihen <−> 100 Generationen

% 4Spalten <−> v i e r Werte von Theta

D( 1 , : ) = ones ( 1 , 4 ) ; %I n i t i a l i s i e r u n g

f o r k=2:100D( k , : ) = D( k−1 ,:) .∗ (1−Theta ) ;

end

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 23 / 60

matlab

p l o t ( generat ionen ,D( : , 1 ) , ’ bd ’ ) ;hold on ;p l o t ( generat ionen ,D( : , 2 ) , ’ r−. ’ ) ;p l o t ( generat ionen ,D( : , 3 ) , ’mo ’ ) ;p l o t ( generat ionen ,D( : , 4 ) , ’ k− ’ ) ;x l a b e l ( ’ Generationen ’ ) ;y l a b e l ( ’ A n t e i l LD ’ ) ;

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 24 / 60

Page 12: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Beispiel: Normalisierende Selektion

Als etwas ausführlicheres Beispiel des Einflusses des LD wollen wir dienormalisierende Selektion untersuchen.

Die natürliche Auslese wirkt häufig gegen Individuen an den Extremendes phänotypischen Spektrums und begünstigt Ausprägungen einesphänotypisches Merkmals, die dem Mittelwert des Merkmals in derBevölkerung nahe sind. Dieses Phänomen ist zunächst Hermon Bumpus1898 aufgefallen†

†Bumpus, Hermon C. 1898. Eleventh lecture. The elimination of the unfit as illustrated by theintroduced sparrow, Passer domesticus. (A fourth contribution to the study of variation.) Biol.Lectures: Woods Hole Marine Biological Laboratory, 209-225.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 26 / 60

Beispiel: Normalisierende Selektion

Nach einem schweren Wintersturm wurden 136 Hausschwalbenuntersucht, wovon die Hälfte überlebte

Unter den überlebenden fand sich ein Überschuss an Vögeln mitdurchschnittlichen Maßen hinlicklich Flügellänge, während Vögel mitkurzen oder langen Flügeln öfter als erwartet gestorben waren.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 27 / 60

Page 13: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Normalisierende Selektion: Eine Simulation

Phänotyp 8 9 10 11 12

Genotypen abab

aBabAbab

aBaBaBAbAbAbABab

aBABABAb

ABAB

Fitness 0,8 0,9 1,0 0,9 0,8

a bzw. b: +2 cm

A bzw. B: +3 cm

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 28 / 60

Normalisierende Selektion: Eine Simulation

Anfangs Kopplungsgleichgewicht mit p(a) = 0,55, p(A) = 0,45,p(b) = 0,6 und p(B) = 0,4

Ohne LD gilt p(ab) = p(a)p(b) usw.

Die diploiden Genotypfrequenzen für erwachsenen Schwalben könnenaus den haploiden Genotypfrequenzen der Gameten wie folgt berechnetwerden†:

p

(abab

)= p(ab)p(ab) p

(aBab

)= 2p(aB)p(ab)

†Der Faktor 2 kommt daher, dass der Gamet aB von der Mutter und der Gamet ab vom Vaterkommen kann oder auch umgekehrt.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 29 / 60

Page 14: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Normalisierende Selektion: Eine Simulation

0 20 40 60 80 1000

0.5

1

Generation

Fre

quen

z

0 20 40 60 80 1000

0.01

0.02

0.03

0.04

Generation

Fre

quen

z

pab

paB

pAb

pAB

|d|

Abbildung: Normalisierende Selektion

Im folgenden wird der matlab-Code1 erklärt, womit die Simulationdurchgeführt wurde.

1kann von http://compbio.charite.de heruntergeladen werden.Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 30 / 60

matlab/octave-Code

Unter der Annahme eines Kopplungsgleichgewichts gilt p(ab) = p(a)p(b) usw.

p_a =0.3 ;p_b =0.7 ;ngenerat ions =100;

p_A=1−p_a ;p_B=1−p_b ;

%Am Anfang : Kopplungsgle ichgewicht −> p ( ab)=p ( a ) p ( b ) usw .p_ab=p_a∗p_b ;p_aB=p_a∗p_B ;p_Ab=p_A∗p_b ;p_AB=p_A∗p_B ;

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 31 / 60

Page 15: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

matlab/octave-Code

Der nächste Code-Abschnitt definiert die Vektoren d als 100×1-Vektor undgenotype_freq als 100×4-Matrix. Diese Variablen werden für Generationen1 . . .100 die Werte für die LD-Koeffiziente D und die Frequenzen der vierGenotypen festhalten. Die matlab-Funktion zeros(M,N) alloziert Speicher füreine M×N-Matrix.

d= zeros ( ngenerat ions , 1 ) ;genotype_freq = zeros ( ngenerat ions , 4 ) ;

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 32 / 60

matlab/octave-Code

Im folgenden berechnen wir für die erste Generation D :

D = p(AB)p(ab)−p(Ab)p(aB)

und speichern das Ergebnis im ersten Feld von d. Wir speichern dieGenotypfrequenzen der ersten Generation in der ersten Reihe vongenotype_freq.

D=p_AB∗p_ab − p_Ab∗p_aB ;d (1)=D;genotype_freq ( 1 , : ) = [ p_ab , p_aB , p_Ab , p_AB ] ;

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 33 / 60

Page 16: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

matlab/octave-Code

Ab jetzt simulieren wir eine normalisierende Selektion mit der Funktiongtype_select

Rekombinationsfrequenz θ = 0,1

f o r i =2: ngenerat ions% Calcu la te and s to re genotype f requenc ies[ p_ab , p_aB , p_Ab , p_AB ] = gtype_se lec t ( p_ab , p_aB , p_Ab , p_AB ) ;genotype_freq ( i , : ) = [ p_ab , p_aB , p_Ab , p_AB ] ;%Calcu la te and s to re LDd ( i )=p_AB∗p_ab − p_Ab∗p_aB ;

end

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 34 / 60

matlab/octave-Code

gtype_select

f u n c t i o n [ p_ab , p_aB , p_Ab , p_AB ] = . . .g type_se lec t ( p_ab , p_aB , p_Ab , p_AB)

%Rekombinationsfrequenz 0.1the ta =0 .1 ;

%% Se lek t ion auf Grund des Phaenotyps%% 8−9−10−11−12 cm Fluegel laengef i t n e s s _8 = 0 . 8 ;f i t n e s s _9 = 0 . 9 ;f i t ness_10 = 1 . 0 ;f i t ness_11 = 0 . 9 ;f i t ness_12 = 0 . 8 ;

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 35 / 60

Page 17: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

matlab/octave-Code

gtype_select

%% phenotype = 8 cmp_ab_ab=p_ab^2 ∗ f i t n e s s _8 ;

%% phenotype = 9 cmp_ab_aB = 2∗p_ab∗p_aB ∗ f i t n e s s _9 ;p_ab_Ab = 2∗p_ab∗p_Ab ∗ f i t n e s s _9 ;

%% phenotype = 10 cmp_Ab_aB = 2∗ p_Ab ∗ p_aB ∗ f i t ness_10 ;p_AB_ab = 2∗p_AB∗p_ab ∗ f i t ness_10 ;p_Ab_Ab = p_Ab^2 ∗ f i t ness_10 ;p_aB_aB = p_aB^2 ∗ f i t ness_10 ;

. . . ( usw . )

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 36 / 60

matlab/octave-Code

Die Summe der einzelnen Häufigkeiten muss 1 ergeben, weshalb wirrenormalisieren müssen:

%Renormalizet o t a l = p_ab_ab + p_ab_aB + p_ab_Ab + p_Ab_aB + p_AB_ab + . . .

+ p_Ab_Ab + p_aB_aB + p_Ab_AB + p_aB_AB + p_AB_AB ;p_ab_ab = p_ab_ab / t o t a l ;p_ab_aB = p_ab_aB / t o t a l ;. . . ( usw . )

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 37 / 60

Page 18: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Rekombination & Gameten

Einige, aber nicht alle Rekombinationen führen zu neuen Haplotypen2:

Genotyp� Gameten

AB/ABθ

� AB & AB

ab/Abθ

� Ab & ab

aB/abθ

� ab & aB

aB/Abθ

� ab & AB

ab/abθ

� ab & ab

2Bemerke, dass wir der Einfachkeit halber die Rekombination so modellieren, dass bei einerRekombination alle Chromatiden rekombinieren und nicht nur zwei der vier Chromatiden (vgl.Abb. 2.11 von Strachan und Read)

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 38 / 60

matlab/octave-Code

Wir können nun die Frequenz des Haplotyps ab unter den Gametenberechnen als

p(ab) = p

(abab

)• Jeder Gamet: ab

+ 0.5×p

(abaB

)• Jeder 2. Gamet: ab

+ 0.5×p

(abAb

)• Jeder 2. Gamet: ab

+ (1−θ)×0.5×p

(ABab

)• Jeder 2. nicht rek. Gamet: ab

+ θ ×0.5×p

(AbaB

)• Jeder 2. rek. Gamet: ab

Die Berechnungen für die übrigen drei Gametengenotypen erfolgen analog.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 39 / 60

Page 19: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

matlab/octave-Code

p_ab = p_ab_ab . . .+ 0.5 ∗ p_ab_aB . . .

+ 0.5 ∗ p_ab_Ab . . .+ (1− t he ta ) ∗ 0.5 ∗ p_AB_ab . . .+ the ta ∗ 0.5 ∗ p_Ab_aB ;

p_aB = 0.5 ∗ p_ab_aB . . .+ 0.5 ∗ (1− t he ta )∗ p_Ab_aB . . .+ p_aB_aB . . .+ 0.5∗p_aB_AB . . .

+ 0.5∗ t he ta∗p_AB_ab ;. . . ( usw . )

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 40 / 60

matlab/octave-CodeNach 90 Generationen hat fast jedes Individuum den Genotyp Ab/Abund somit den günstigsten Phänotyp (Flügellänge 10 cm).D steigt anfangs und sinkt mit zunehmender Fixation der Allele A und b.

0 20 40 60 80 1000

0.5

1

Generation

Fre

quen

z

0 20 40 60 80 1000

0.01

0.02

0.03

0.04

Generation

Fre

quen

z

pab

paB

pAb

pAB

|d|

Abbildung: Normalisierende Selektion

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 41 / 60

Page 20: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Die neutrale Theorie der molekularen Evolution

Die Neutrale Theorie der molekularen Evolution bzw. die verwandte Ideeeiner molekularen Uhr wurden in den 1960er–1980er Jahren von MotooKimura eingeführt

Die Evolutionsrate der Aminosäuresequenzen bestimmter Proteine weistüber lange evolutionäre Zeiträume eine konstante Rate auf, was sich alsFolge der Genetischen Drift erklären lässt.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 43 / 60

Die neutrale Theorie der molekularen Evolution

Frühe Darwinistische Theoriengingen davon aus, dass alleSequenzveränderungen einenEinfluss auf die Fitness habenund somit vorteilhaft odernachteilhaft sind

Nach der neutralen Theorie dermolekularen Evolution sind diemeisten Aminosäurenpositionenneutral, Veränderungen habenkeinen wesentlich EInfluss auf dieFitness

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 44 / 60

Page 21: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Die neutrale Theorie der molekularen Evolution

Vorteilhafte Mutationen: Relativ selten

Nachteilhafte Mutation dagegen werden durch die natürliche Ausleseschnell vom Genpool entfernt

Ein relativ großer Anteil der denkbaren Veränderungen derAminosäuresequenz eines Proteins hat keinen wesentlichen Effekt aufdie Funktion des Proteins

Die Anhäufung (Akkumulation) dieser Mutation hängt demnach von derMutationsrate ab

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 45 / 60

Die neutrale Theorie der molekularen Evolution

µ0

Die Mutationsrate µ ergibt sich aus die Rate für nachteilhafte (µ−), vorteilhafte(µ+) und neutrale (µ0) Mutationen. Da vorteilhafte Mutationen selten sind undnachteilhafte durch Selektion schnell aus der Population entfernt werden,fokussieren wir uns auf µ0.Sei Ne die effektive Populationsgröße. Für eine Population einer haploidenSpezies beträgt die Anzahl Mutationen pro Generation Neµ0.Es kann gezeigt werden, dass die Wahrscheinlichkeit, dass eine neutraleMutation durch genetische Drift fixiert wird, 1/Ne beträgt. Daher beträgt die

Anzahl von neutralen Mutationen, die Pro Generation fixiert werden Neµ0

Ne= µ0

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 46 / 60

Page 22: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Die neutrale Theorie der molekularen Evolution

Intuitiv: Obwohl in einer größeren Population mehr Mutationen auftreten,die Wahrscheinlichkeit dass eine spezifische Mutation in der Populationfixiert wird sinkt proportional zur Populationsgröße

Nach dem neutralen Modell bestimmt daher die Mutationsrate µ0 diemolekulare Evolutionsgeschiwndigkeit unabhängig von derPopulationsgröße

Dies ist ein wichtiges Ergebnis (Vorhersage):

Die molekulare Evolutionsrate in einer Spezies ist dieselbewie die neutrale Mutationsrate in Individuena

aMerke dass die Mutationsrate und auch die Evolutionsrate sich für unterschiedlicheProteine unterscheiden.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 47 / 60

Die evolutionäre Zeit mit der molekularen Uhr messen

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 48 / 60

Page 23: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Die evolutionäre Zeit mit der molekularen Uhr messen

0 200 400 600 800 1000 1200 14000

20

40

60

80

100

120

140

160

180

200

220

Millionen Jahre seit Divergenz

Anz

ahl A

A−

Sub

stitu

tione

n pr

o 10

0 R

este

n

Fibrinopeptide

Haemoglobin

Cytochrom c

Die evolutionäre Rate ist unterschiedlich für unterschiedliche Proteine(unterschiedlicher Anteil an neutralen Resten, andere Faktoren)

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 49 / 60

Welche sind die wichtigen Positionen in einem multiplenAlignment?

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 50 / 60

Page 24: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Welche sind die wichtigen Positionen in einem multiplenAlignment?

”Neodarwinistische Antwort”Die Positionen, welche Veränderung aufweisen, sind besonders interessant,weil sie uns zeigen, wo die positive Selektion gewirkt hat

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 51 / 60

Synthetische Theorie der Evolution (1950–1960

G.G: Simpson, 1964)Der Konsens ist, dass neutrale Gene oder Allele sehr selten sein müssen, fallssie überhaupt existieren. Für einen Evolutionsbiologen erscheint eshochunwahrscheinloch, dass Proteine, die ja durch Gene bestimmt werden,funktionslose Teile haben, dass schlummernde Gene üvber vieleGenerationen hinweg existieren oder dass Moleküle sich auf eine regelmäßigeaber nicht adaptive Art und Weise verändern sollen. Die natürliche Auslese istder Komponist des genetischen Codes, und die DNA, RNA und Protein seineBoten

Nach dieser Ansicht: Unterschiede in Alignments→ Folge der positivenSelektion

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 52 / 60

Page 25: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Welche sind die wichtigen Positionen in einem multiplenAlignment?

Antwort nach der Theorie der neutralen molekularen EvolutionDie Positionen, welche (über ausreichend lange evolutionäre Zeiträume)unverändert geblieben sind, stellen die interessantesten Positionen dar, weilsie uns zeigen, wo die negative Selektion gewirkt hat (d.h., Mutationen indiesen Positionen sind nachteilhaft)

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 53 / 60

Neutralisten-Selektionisten-Debatte

Lange Zeit wurde angezweifelt, dass es überhaupt neutrale Mutationengeben kann

Das erscheint heute klar. Auch Darwin hat die neutrale Theorie dermolekularen Evolution vorweggenommen:

Charles Darwin, On the Origin of Species by Means of NaturalSelection, 6th ed., 1872Variations neither useful nor injurious would not be affected by naturalselection, and would be left either a fluctuating element, as perhaps we see incertain polymorphic species, or would ultimately become fixed...

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 54 / 60

Page 26: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Synonyme und nichtsynonyme Substitutionen

Synonyme SubstitutionenNukleotidsubstitutionen in einem Kodon, welche die kodierte Aminosäure nichtverändern. Zum Beispiel CTT=Leucin. CTT→CTA=Leucin,CTT→CTC=Leucin und CTT→CTG=Leucin

Nichtsynonyme SubstitutionenNukleotidsubstitutionen in einem Kodon, welche die kodierte Aminosäureverändern. Zum Beispiel CTT=Leucin. CTT→ATT=Isoleucin,CTT→GTT=Valin und CTT→TTT=Phenylalanin

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 55 / 60

Proteine vs. DNA

Proteine sind die moleküle, die biologische Funktionen erfüllen

Annahme: Die natürliche Auslese wirkt daher auf Proteinebene und vielweniger auf DNA-Ebene

Schlussfolgerung: Die Mutationsrate für synonyme Substitutionen gibt(ungefähr) die neutrale Mutationsrate an

Die Mutationsrate für nichtsynonyme Substitutionen variiert dagegen jenach Typ und Stärke der natürlichen Auslese

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 56 / 60

Page 27: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Proteine vs. DNA

Sei bei einem Alignment zweier DNA-Sequenzen dS die Anzahl dersynonymen Substitutionen und dN die Anzahl der nichtsynonymen

Dann ist dN > dS ein Hinweis auf positive Selektion

dN < dS ein Hinweis auf negative Selektion

Zahlreiche Methoden sind entwickelt worden, um z.B. solche Methodenauf multiple Alignments anzuwenden, um Hinweise auf Neutralität inbestimmten Codons/Abschnitten zu suchen.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 57 / 60

Mäuse und Menschen

Der letzte gemeinsame Vorfahr von Mäusen und Menschen lebte vor ca.75 Million Jahren

Die Genomsequenzen dieser Organismen unterscheiden sich an ca.jedem zweiten Nukleotid

Weniger als 1% der 25.000proteinkodierende Gene in derMaus haben kein homologes Genbeim Menschen. VieleProteinsequenzen zeigen eineÜbereinstimmung von über 90%

Urheberrechtlich geschütztes Bild entfernt

X-Chromosom: Syntenieblöcke. Pevzner et al. (2003) Genome Res.13:

37–45.

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 58 / 60

Page 28: Peter N. Robinson Hardy-Weinberg-Gesetzcompbio.charite.de/tl_files/Lehre/Molekulargenetik_II/dias/linkageDisequilibrium.pdf · Kopplungsungleichgewicht Ein Kopplungsungleichgewicht

Bei der Betrachtung eines multiplen Alignments...

Wichtigste Voraussetzung: Die Divergenz ist ausreichend hoch, so dass manfunktionell bedeutsame Elemente durch ihren hohen Grad an Konservierungerkennen kann

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 59 / 60

The End of the Lecture as We Know It

Diese Vorlesungsdias stehenunter der GNU-Lizenz für freieDokumentationb

Kontakt:[email protected]

Vorlesungsskript Kapitel 3,Strachan & Read Kapitel 15.4

Bromham L, Penny D (2003) Themodern molecular clock. NatureReviews Genet 4:216–224.

bhttp://www.gnu.org/licenses/fdl.txt

Lectures were once useful; but now, when all can read, and books areso numerous, lectures are unnecessary. If your attention fails, and youmiss a part of a lecture, it is lost; you cannot go back as you do upon a

book... People have nowadays got a strange opinion that everythingshould be taught by lectures. Now, I cannot see that lectures can do asmuch good as reading the books from which the lectures are taken. I

know nothing that can be best taught by lectures, except whereexperiments are to be shown. You may teach chymistry by lectures. You

might teach making shoes by lectures!

Samuel Johnson, quoted in Boswell’s Life of Johnson (1791).

Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 60 / 60