peter n. robinson...
Post on 13-Aug-2019
215 Views
Preview:
TRANSCRIPT
Populationsgenetik 3: Kopplungsungleichgewicht (LD)
Peter N. Robinson
Institut für medizinische GenetikCharité Universitätsmedizin Berlin
28. Juni 2008
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 1 / 60
Hardy-Weinberg-Gesetz
Letztes Mal . . .
Eigenschaften eines einzelnen Genlocus:Allelfrequenzen, Genotypfrequenzen
Hardy-Weinberg-Gesetz: Beziehungzwischen Allel- und Genotypfrequenzen
p2 +2pq +q2
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 3 / 60
Kopplungsungleichgewicht
Dieses Mal . . .
Eigenschaften von Gruppen von Genorten
Haplotypen
Kopplungsgleichgewicht
Kopplungsungleichgewicht
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 4 / 60
Eine Geschichte zweier Mutationen
Heute existierende Alleleentstanden durch weitzurückliegendeMutationsereignisse
A
A
A
A
A
A
A
A
A
A
A
A
GA
A
A
A
A
A
A
A
A
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 5 / 60
Eine Geschichte zweier Mutationen (2)
Nach einem erstenMutationsereignis entstand eineweitere Mutation auf demselbenChromosom . . .
G T
A T
G T
A C
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 6 / 60
Eine Geschichte zweier Mutationen (2)
Rekombination führt zu neuenKombinationen der Allele
G T
A T
A C
A T
CG
G T
A C
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 7 / 60
Kopplungsungleichgewicht
Linkage Disequilibrium: LDChromosomen sind MosaikeI RekombinationI MutationI Genetische DriftI Natürliche Auslese (Selektion)
Kombinationen von Allelen in nahbeieinander liegenden Loci: weitzurückliegende (”ancestral”)Haplotypen
"Vorfahr-Chromosom"
Heutige Chromosomen
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 8 / 60
Gründereffekt und LD
Eine in der Stammpopulation bestehende, große genetische Variabilitätreduziert sich bei der Gründung einer Kolonie durch wenig Individuen
Häufige Ursache von LD in menschlichen Populationen
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 9 / 60
LD und Kartierung (Vorschau)
In einer späteren Vorlesung werden wir die Bedeutung des LD für dieEntdeckung von genetischen Varianten, die mit einer erhöhtenAnfälligkeit für häufige Krankheiten wie Diabetes, Herzinfarkt,Schlaganfall, Allergie, . . ., eingehen
Dieses Mal wollen wir die mathematischen Hintergründe und diebiologischen Grundlagen erklärenWichtig: Unterscheide Linkage und Linkage Disequilibrium (LD):I Linkage:gemeinsame Vererbung zweier Loci in FamilienI LD: Beziehung zwischen zwei Allelen an 2 Loci in einer Population
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 10 / 60
Genotyp vs. Haplotyp
1 HaplotypI ”haploider Genotyp”I Eine Rekombination wird nur selten zwei Loci trennen, die nahe
beieinander auf einem Chromosom liegenI Deshalb werden Gruppen von Allelen, die auf demselben
Chromosomenabschnitt liegen eher zusammen (als durch Rekombinationgetrennt) als Block übertragen werden
2 GenotypI die (diploide) genetische Ausstattung eines Individuums an einem oder
mehreren Loci. Beide Exemplare eines Allels werden berücksichtigt, z.B.der Genotyp an einem Locus mit Allelen A und a kann AA, Aa oder aasein.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 11 / 60
Kopplungsungleichgewicht
Ein Kopplungsungleichgewicht (LD) besteht zwischen zwei Genloci, dieauf einem Chromosom eng beieinander liegen, und deshalbzusammenvererbt werden.
Zwei eng beieinander liegende Loci werden dann nicht zusammenvererbt, wenn zwischen ihnen eine Rekombination erfolgt.BegriffeI HaplotypfrequenzI D, D
′, r2
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 12 / 60
LD: D
A und a: zwei Allele von einem Locus (Allelfrequenz pA und pa)
B und b zwei Allele eines anderen Locus. (Allelfrequenz pB und pb)
Häufigkeiten von Kombinationen dieser Allele innerhalb einer Populationvon Gameten†: pAB,pAb,paB und pab.
†zur Erinnerung sind Gameten Keimzellen, d.h. haploide Zellen, die im Gegensatz zudiploiden Zellen jeweils nur ein Exemplar jedes Locus haben.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 14 / 60
LD: D
Die entsprechenden Allelfrequenzen ergeben sich aus der Summe derGenotypfrequenzen:
pa = pab +paB pA = pAb +pAB = 1−pa
undpb = pab +pAb pB = pAB +paB = 1−pb
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 15 / 60
Kopplungsgleichgewicht
Sind die beiden Genloci untereinander im Kopplungsgleichgewicht†, dannist die Wahrscheinlichkeit, dass eine Gamete das Allel a aufweist,unabhängig von der Wahrscheinlichkeit, dass sie das Allel b aufweist
pab = pa×pb
†zum Beispiel weil die Genloci auf unterschiedlichen Chromosomen gelegen sindPeter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 16 / 60
Kopplungsungleichgewicht
Sind die Loci nicht im Kopplungsgleichgewicht, dann gilt
pab 6= pa×pb
.
Wir führen die Variable D ein, um die Abweichung vomKopplungsgleichgewicht zu beschreiben:
pab = papb +D (1)
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 17 / 60
LD
Hieraus folgt
paB = pa−pab
= pa−papb−D
= pa (1−pb)−D
= papB−D
Eine analoge Berechnung zeigt:
pAb = pApb−D
und†
pAB = pApB +D
†s. SkriptPeter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 18 / 60
LD
Die am häufigsten verwendete Definition der LD-Koeffiziente D ist jedoch
D = pABpab−pAbpaB (2)
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 19 / 60
LD
Diese Formel leitet sich von der Definition (1) ab:
D = pab−papb
= pab− (paB +pab)(pAb +pab)
= pab−paBpAb−pabpab−paBpab−pAbpab
= pab (1−pab−paB−pAb)−paBpAb
= pab (pAB)−paBpAb
= pABpab−pAbpaB
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 20 / 60
D und AllelfrequenzenDie Abbildung zeigt den Einfluss von unterschiedlichen Allelfrequenzen auf dieSpannweite von D.
0 0.2 0.4 0.6 0.8 1−0.25
−0.2
−0.15
−0.1
−0.05
0
0.05
0.1
0.15
0.2
0.25
Repulsion
D
LD−Koeffiziente
LD−Koeffiziente (pA= 0.5, p
B = 0.5)
LD−Koeffiziente (pA= 0.1, p
B = 0.1)
Abbildung: Abhängigkeit der LD-Koeffiziente D von den Allelfrequenzen und vom Gradan Repulsion. 0 = komplette Coupling von AB und ab, 1,0 = komplette Repulsion(Überschuss an Ab und aB).
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 21 / 60
Wie lange dauert es, bis ein Kopplungsungleichgewichtverschwunden ist?
0 20 40 60 80 1000
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Generationen
Ant
eil L
D
θ=0.001
θ=0.01
θ=0.1
θ=0.5
Di = (1−θ)i D0
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 22 / 60
matlab
generat ionen = [ 1 : 1 0 0 ] ;
Theta =[0.001 0.01 0.1 0 . 5 ] ;D=zeros (100 ,4 ) ; % 100 Reihen <−> 100 Generationen
% 4Spalten <−> v i e r Werte von Theta
D( 1 , : ) = ones ( 1 , 4 ) ; %I n i t i a l i s i e r u n g
f o r k=2:100D( k , : ) = D( k−1 ,:) .∗ (1−Theta ) ;
end
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 23 / 60
matlab
p l o t ( generat ionen ,D( : , 1 ) , ’ bd ’ ) ;hold on ;p l o t ( generat ionen ,D( : , 2 ) , ’ r−. ’ ) ;p l o t ( generat ionen ,D( : , 3 ) , ’mo ’ ) ;p l o t ( generat ionen ,D( : , 4 ) , ’ k− ’ ) ;x l a b e l ( ’ Generationen ’ ) ;y l a b e l ( ’ A n t e i l LD ’ ) ;
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 24 / 60
Beispiel: Normalisierende Selektion
Als etwas ausführlicheres Beispiel des Einflusses des LD wollen wir dienormalisierende Selektion untersuchen.
Die natürliche Auslese wirkt häufig gegen Individuen an den Extremendes phänotypischen Spektrums und begünstigt Ausprägungen einesphänotypisches Merkmals, die dem Mittelwert des Merkmals in derBevölkerung nahe sind. Dieses Phänomen ist zunächst Hermon Bumpus1898 aufgefallen†
†Bumpus, Hermon C. 1898. Eleventh lecture. The elimination of the unfit as illustrated by theintroduced sparrow, Passer domesticus. (A fourth contribution to the study of variation.) Biol.Lectures: Woods Hole Marine Biological Laboratory, 209-225.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 26 / 60
Beispiel: Normalisierende Selektion
Nach einem schweren Wintersturm wurden 136 Hausschwalbenuntersucht, wovon die Hälfte überlebte
Unter den überlebenden fand sich ein Überschuss an Vögeln mitdurchschnittlichen Maßen hinlicklich Flügellänge, während Vögel mitkurzen oder langen Flügeln öfter als erwartet gestorben waren.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 27 / 60
Normalisierende Selektion: Eine Simulation
Phänotyp 8 9 10 11 12
Genotypen abab
aBabAbab
aBaBaBAbAbAbABab
aBABABAb
ABAB
Fitness 0,8 0,9 1,0 0,9 0,8
a bzw. b: +2 cm
A bzw. B: +3 cm
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 28 / 60
Normalisierende Selektion: Eine Simulation
Anfangs Kopplungsgleichgewicht mit p(a) = 0,55, p(A) = 0,45,p(b) = 0,6 und p(B) = 0,4
Ohne LD gilt p(ab) = p(a)p(b) usw.
Die diploiden Genotypfrequenzen für erwachsenen Schwalben könnenaus den haploiden Genotypfrequenzen der Gameten wie folgt berechnetwerden†:
p
(abab
)= p(ab)p(ab) p
(aBab
)= 2p(aB)p(ab)
†Der Faktor 2 kommt daher, dass der Gamet aB von der Mutter und der Gamet ab vom Vaterkommen kann oder auch umgekehrt.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 29 / 60
Normalisierende Selektion: Eine Simulation
0 20 40 60 80 1000
0.5
1
Generation
Fre
quen
z
0 20 40 60 80 1000
0.01
0.02
0.03
0.04
Generation
Fre
quen
z
pab
paB
pAb
pAB
|d|
Abbildung: Normalisierende Selektion
Im folgenden wird der matlab-Code1 erklärt, womit die Simulationdurchgeführt wurde.
1kann von http://compbio.charite.de heruntergeladen werden.Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 30 / 60
matlab/octave-Code
Unter der Annahme eines Kopplungsgleichgewichts gilt p(ab) = p(a)p(b) usw.
p_a =0.3 ;p_b =0.7 ;ngenerat ions =100;
p_A=1−p_a ;p_B=1−p_b ;
%Am Anfang : Kopplungsgle ichgewicht −> p ( ab)=p ( a ) p ( b ) usw .p_ab=p_a∗p_b ;p_aB=p_a∗p_B ;p_Ab=p_A∗p_b ;p_AB=p_A∗p_B ;
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 31 / 60
matlab/octave-Code
Der nächste Code-Abschnitt definiert die Vektoren d als 100×1-Vektor undgenotype_freq als 100×4-Matrix. Diese Variablen werden für Generationen1 . . .100 die Werte für die LD-Koeffiziente D und die Frequenzen der vierGenotypen festhalten. Die matlab-Funktion zeros(M,N) alloziert Speicher füreine M×N-Matrix.
d= zeros ( ngenerat ions , 1 ) ;genotype_freq = zeros ( ngenerat ions , 4 ) ;
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 32 / 60
matlab/octave-Code
Im folgenden berechnen wir für die erste Generation D :
D = p(AB)p(ab)−p(Ab)p(aB)
und speichern das Ergebnis im ersten Feld von d. Wir speichern dieGenotypfrequenzen der ersten Generation in der ersten Reihe vongenotype_freq.
D=p_AB∗p_ab − p_Ab∗p_aB ;d (1)=D;genotype_freq ( 1 , : ) = [ p_ab , p_aB , p_Ab , p_AB ] ;
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 33 / 60
matlab/octave-Code
Ab jetzt simulieren wir eine normalisierende Selektion mit der Funktiongtype_select
Rekombinationsfrequenz θ = 0,1
f o r i =2: ngenerat ions% Calcu la te and s to re genotype f requenc ies[ p_ab , p_aB , p_Ab , p_AB ] = gtype_se lec t ( p_ab , p_aB , p_Ab , p_AB ) ;genotype_freq ( i , : ) = [ p_ab , p_aB , p_Ab , p_AB ] ;%Calcu la te and s to re LDd ( i )=p_AB∗p_ab − p_Ab∗p_aB ;
end
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 34 / 60
matlab/octave-Code
gtype_select
f u n c t i o n [ p_ab , p_aB , p_Ab , p_AB ] = . . .g type_se lec t ( p_ab , p_aB , p_Ab , p_AB)
%Rekombinationsfrequenz 0.1the ta =0 .1 ;
%% Se lek t ion auf Grund des Phaenotyps%% 8−9−10−11−12 cm Fluegel laengef i t n e s s _8 = 0 . 8 ;f i t n e s s _9 = 0 . 9 ;f i t ness_10 = 1 . 0 ;f i t ness_11 = 0 . 9 ;f i t ness_12 = 0 . 8 ;
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 35 / 60
matlab/octave-Code
gtype_select
%% phenotype = 8 cmp_ab_ab=p_ab^2 ∗ f i t n e s s _8 ;
%% phenotype = 9 cmp_ab_aB = 2∗p_ab∗p_aB ∗ f i t n e s s _9 ;p_ab_Ab = 2∗p_ab∗p_Ab ∗ f i t n e s s _9 ;
%% phenotype = 10 cmp_Ab_aB = 2∗ p_Ab ∗ p_aB ∗ f i t ness_10 ;p_AB_ab = 2∗p_AB∗p_ab ∗ f i t ness_10 ;p_Ab_Ab = p_Ab^2 ∗ f i t ness_10 ;p_aB_aB = p_aB^2 ∗ f i t ness_10 ;
. . . ( usw . )
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 36 / 60
matlab/octave-Code
Die Summe der einzelnen Häufigkeiten muss 1 ergeben, weshalb wirrenormalisieren müssen:
%Renormalizet o t a l = p_ab_ab + p_ab_aB + p_ab_Ab + p_Ab_aB + p_AB_ab + . . .
+ p_Ab_Ab + p_aB_aB + p_Ab_AB + p_aB_AB + p_AB_AB ;p_ab_ab = p_ab_ab / t o t a l ;p_ab_aB = p_ab_aB / t o t a l ;. . . ( usw . )
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 37 / 60
Rekombination & Gameten
Einige, aber nicht alle Rekombinationen führen zu neuen Haplotypen2:
Genotyp� Gameten
AB/ABθ
� AB & AB
ab/Abθ
� Ab & ab
aB/abθ
� ab & aB
aB/Abθ
� ab & AB
ab/abθ
� ab & ab
2Bemerke, dass wir der Einfachkeit halber die Rekombination so modellieren, dass bei einerRekombination alle Chromatiden rekombinieren und nicht nur zwei der vier Chromatiden (vgl.Abb. 2.11 von Strachan und Read)
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 38 / 60
matlab/octave-Code
Wir können nun die Frequenz des Haplotyps ab unter den Gametenberechnen als
p(ab) = p
(abab
)• Jeder Gamet: ab
+ 0.5×p
(abaB
)• Jeder 2. Gamet: ab
+ 0.5×p
(abAb
)• Jeder 2. Gamet: ab
+ (1−θ)×0.5×p
(ABab
)• Jeder 2. nicht rek. Gamet: ab
+ θ ×0.5×p
(AbaB
)• Jeder 2. rek. Gamet: ab
Die Berechnungen für die übrigen drei Gametengenotypen erfolgen analog.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 39 / 60
matlab/octave-Code
p_ab = p_ab_ab . . .+ 0.5 ∗ p_ab_aB . . .
+ 0.5 ∗ p_ab_Ab . . .+ (1− t he ta ) ∗ 0.5 ∗ p_AB_ab . . .+ the ta ∗ 0.5 ∗ p_Ab_aB ;
p_aB = 0.5 ∗ p_ab_aB . . .+ 0.5 ∗ (1− t he ta )∗ p_Ab_aB . . .+ p_aB_aB . . .+ 0.5∗p_aB_AB . . .
+ 0.5∗ t he ta∗p_AB_ab ;. . . ( usw . )
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 40 / 60
matlab/octave-CodeNach 90 Generationen hat fast jedes Individuum den Genotyp Ab/Abund somit den günstigsten Phänotyp (Flügellänge 10 cm).D steigt anfangs und sinkt mit zunehmender Fixation der Allele A und b.
0 20 40 60 80 1000
0.5
1
Generation
Fre
quen
z
0 20 40 60 80 1000
0.01
0.02
0.03
0.04
Generation
Fre
quen
z
pab
paB
pAb
pAB
|d|
Abbildung: Normalisierende Selektion
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 41 / 60
Die neutrale Theorie der molekularen Evolution
Die Neutrale Theorie der molekularen Evolution bzw. die verwandte Ideeeiner molekularen Uhr wurden in den 1960er–1980er Jahren von MotooKimura eingeführt
Die Evolutionsrate der Aminosäuresequenzen bestimmter Proteine weistüber lange evolutionäre Zeiträume eine konstante Rate auf, was sich alsFolge der Genetischen Drift erklären lässt.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 43 / 60
Die neutrale Theorie der molekularen Evolution
Frühe Darwinistische Theoriengingen davon aus, dass alleSequenzveränderungen einenEinfluss auf die Fitness habenund somit vorteilhaft odernachteilhaft sind
Nach der neutralen Theorie dermolekularen Evolution sind diemeisten Aminosäurenpositionenneutral, Veränderungen habenkeinen wesentlich EInfluss auf dieFitness
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 44 / 60
Die neutrale Theorie der molekularen Evolution
Vorteilhafte Mutationen: Relativ selten
Nachteilhafte Mutation dagegen werden durch die natürliche Ausleseschnell vom Genpool entfernt
Ein relativ großer Anteil der denkbaren Veränderungen derAminosäuresequenz eines Proteins hat keinen wesentlichen Effekt aufdie Funktion des Proteins
Die Anhäufung (Akkumulation) dieser Mutation hängt demnach von derMutationsrate ab
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 45 / 60
Die neutrale Theorie der molekularen Evolution
µ0
Die Mutationsrate µ ergibt sich aus die Rate für nachteilhafte (µ−), vorteilhafte(µ+) und neutrale (µ0) Mutationen. Da vorteilhafte Mutationen selten sind undnachteilhafte durch Selektion schnell aus der Population entfernt werden,fokussieren wir uns auf µ0.Sei Ne die effektive Populationsgröße. Für eine Population einer haploidenSpezies beträgt die Anzahl Mutationen pro Generation Neµ0.Es kann gezeigt werden, dass die Wahrscheinlichkeit, dass eine neutraleMutation durch genetische Drift fixiert wird, 1/Ne beträgt. Daher beträgt die
Anzahl von neutralen Mutationen, die Pro Generation fixiert werden Neµ0
Ne= µ0
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 46 / 60
Die neutrale Theorie der molekularen Evolution
Intuitiv: Obwohl in einer größeren Population mehr Mutationen auftreten,die Wahrscheinlichkeit dass eine spezifische Mutation in der Populationfixiert wird sinkt proportional zur Populationsgröße
Nach dem neutralen Modell bestimmt daher die Mutationsrate µ0 diemolekulare Evolutionsgeschiwndigkeit unabhängig von derPopulationsgröße
Dies ist ein wichtiges Ergebnis (Vorhersage):
Die molekulare Evolutionsrate in einer Spezies ist dieselbewie die neutrale Mutationsrate in Individuena
aMerke dass die Mutationsrate und auch die Evolutionsrate sich für unterschiedlicheProteine unterscheiden.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 47 / 60
Die evolutionäre Zeit mit der molekularen Uhr messen
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 48 / 60
Die evolutionäre Zeit mit der molekularen Uhr messen
0 200 400 600 800 1000 1200 14000
20
40
60
80
100
120
140
160
180
200
220
Millionen Jahre seit Divergenz
Anz
ahl A
A−
Sub
stitu
tione
n pr
o 10
0 R
este
n
Fibrinopeptide
Haemoglobin
Cytochrom c
Die evolutionäre Rate ist unterschiedlich für unterschiedliche Proteine(unterschiedlicher Anteil an neutralen Resten, andere Faktoren)
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 49 / 60
Welche sind die wichtigen Positionen in einem multiplenAlignment?
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 50 / 60
Welche sind die wichtigen Positionen in einem multiplenAlignment?
”Neodarwinistische Antwort”Die Positionen, welche Veränderung aufweisen, sind besonders interessant,weil sie uns zeigen, wo die positive Selektion gewirkt hat
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 51 / 60
Synthetische Theorie der Evolution (1950–1960
G.G: Simpson, 1964)Der Konsens ist, dass neutrale Gene oder Allele sehr selten sein müssen, fallssie überhaupt existieren. Für einen Evolutionsbiologen erscheint eshochunwahrscheinloch, dass Proteine, die ja durch Gene bestimmt werden,funktionslose Teile haben, dass schlummernde Gene üvber vieleGenerationen hinweg existieren oder dass Moleküle sich auf eine regelmäßigeaber nicht adaptive Art und Weise verändern sollen. Die natürliche Auslese istder Komponist des genetischen Codes, und die DNA, RNA und Protein seineBoten
Nach dieser Ansicht: Unterschiede in Alignments→ Folge der positivenSelektion
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 52 / 60
Welche sind die wichtigen Positionen in einem multiplenAlignment?
Antwort nach der Theorie der neutralen molekularen EvolutionDie Positionen, welche (über ausreichend lange evolutionäre Zeiträume)unverändert geblieben sind, stellen die interessantesten Positionen dar, weilsie uns zeigen, wo die negative Selektion gewirkt hat (d.h., Mutationen indiesen Positionen sind nachteilhaft)
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 53 / 60
Neutralisten-Selektionisten-Debatte
Lange Zeit wurde angezweifelt, dass es überhaupt neutrale Mutationengeben kann
Das erscheint heute klar. Auch Darwin hat die neutrale Theorie dermolekularen Evolution vorweggenommen:
Charles Darwin, On the Origin of Species by Means of NaturalSelection, 6th ed., 1872Variations neither useful nor injurious would not be affected by naturalselection, and would be left either a fluctuating element, as perhaps we see incertain polymorphic species, or would ultimately become fixed...
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 54 / 60
Synonyme und nichtsynonyme Substitutionen
Synonyme SubstitutionenNukleotidsubstitutionen in einem Kodon, welche die kodierte Aminosäure nichtverändern. Zum Beispiel CTT=Leucin. CTT→CTA=Leucin,CTT→CTC=Leucin und CTT→CTG=Leucin
Nichtsynonyme SubstitutionenNukleotidsubstitutionen in einem Kodon, welche die kodierte Aminosäureverändern. Zum Beispiel CTT=Leucin. CTT→ATT=Isoleucin,CTT→GTT=Valin und CTT→TTT=Phenylalanin
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 55 / 60
Proteine vs. DNA
Proteine sind die moleküle, die biologische Funktionen erfüllen
Annahme: Die natürliche Auslese wirkt daher auf Proteinebene und vielweniger auf DNA-Ebene
Schlussfolgerung: Die Mutationsrate für synonyme Substitutionen gibt(ungefähr) die neutrale Mutationsrate an
Die Mutationsrate für nichtsynonyme Substitutionen variiert dagegen jenach Typ und Stärke der natürlichen Auslese
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 56 / 60
Proteine vs. DNA
Sei bei einem Alignment zweier DNA-Sequenzen dS die Anzahl dersynonymen Substitutionen und dN die Anzahl der nichtsynonymen
Dann ist dN > dS ein Hinweis auf positive Selektion
dN < dS ein Hinweis auf negative Selektion
Zahlreiche Methoden sind entwickelt worden, um z.B. solche Methodenauf multiple Alignments anzuwenden, um Hinweise auf Neutralität inbestimmten Codons/Abschnitten zu suchen.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 57 / 60
Mäuse und Menschen
Der letzte gemeinsame Vorfahr von Mäusen und Menschen lebte vor ca.75 Million Jahren
Die Genomsequenzen dieser Organismen unterscheiden sich an ca.jedem zweiten Nukleotid
Weniger als 1% der 25.000proteinkodierende Gene in derMaus haben kein homologes Genbeim Menschen. VieleProteinsequenzen zeigen eineÜbereinstimmung von über 90%
Urheberrechtlich geschütztes Bild entfernt
X-Chromosom: Syntenieblöcke. Pevzner et al. (2003) Genome Res.13:
37–45.
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 58 / 60
Bei der Betrachtung eines multiplen Alignments...
Wichtigste Voraussetzung: Die Divergenz ist ausreichend hoch, so dass manfunktionell bedeutsame Elemente durch ihren hohen Grad an Konservierungerkennen kann
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 59 / 60
The End of the Lecture as We Know It
Diese Vorlesungsdias stehenunter der GNU-Lizenz für freieDokumentationb
Kontakt:peter.robinson@charite.de
Vorlesungsskript Kapitel 3,Strachan & Read Kapitel 15.4
Bromham L, Penny D (2003) Themodern molecular clock. NatureReviews Genet 4:216–224.
bhttp://www.gnu.org/licenses/fdl.txt
Lectures were once useful; but now, when all can read, and books areso numerous, lectures are unnecessary. If your attention fails, and youmiss a part of a lecture, it is lost; you cannot go back as you do upon a
book... People have nowadays got a strange opinion that everythingshould be taught by lectures. Now, I cannot see that lectures can do asmuch good as reading the books from which the lectures are taken. I
know nothing that can be best taught by lectures, except whereexperiments are to be shown. You may teach chymistry by lectures. You
might teach making shoes by lectures!
Samuel Johnson, quoted in Boswell’s Life of Johnson (1791).
Peter N. Robinson (Charité) Populationsgenetik (3) 28. Juni 2008 60 / 60
top related