coalescência dna é capaz de replicarevolucao/popgen/coalesc.pdf · replicação do dna gene tree...
TRANSCRIPT
1
Por causa da replicação, um únicotipo de gene pode existir notempo e no espaço de forma quetranscenda os indivíduos quetemporaamente carregam o gene.
Alguns alelos são idênticos porserem descendentes replicados deum único alelo ancestral
DNA é capaz de replicarCoalescência
Coalescênciado DNA
Replicação doDNA
Gene Tree(all copies ofhomologous DNAcoalesce to acommon ancestralmolecule)
Teoria do coalescente
Se µ << 1 e Prob (coal) << 1DNA não replica e sofre mutaçãoem uma geração
Tempo
TempoCoalescência
Cada reprodução pode envolver qualquer um dos N indivíduous,e é um evento independente de outras• Assim, a probabilidade de que dois gametas venham domesmo parental é de 1/N• Em diplóides, a probabilidade de ibd / coalescência é 1/(2N)• Populações não são ideais, logo a probabilidade decoalescência em uma geração é de 1/2Nef
Coalescência em uma população ideal de N diplóides
2
Pcoalescence há exatamente t gerações é a probabilidade de nãocoalescência pelas 1as t-1 gerações no passado seguida por umevento de coalescência na geração t:
Amostrando dois genes ao acaso
probabilidade denão coalescênciaem t-1 gerações
probabilidadede coalescência
na geração t
A variância do tempo médio de coalescência de dois genes (σ2ct)
é a média da espectativa de (t - 2Nef)2 :
O tempo médio de coalescência será:
Amostrando dois genes ao acaso
• Se n = 10, o tempo coberto por eventos de coalescência deve variar entre 0.0444Nef e 3.6Nef.
• Se n = 100, o tempo coberto por eventos de coalescência deve variar entre 0.0004Nef e 3.96Nef.
Não precisa grande amostra para inferir coalescências antigas, masprecisa de muitas para inferir coalescências recentes
Amostrando n genes ao acasoOs tempos médios para a 1a e a última coalescência são:
4Nef/[n(n-1)] e 4Nef(1-1/n)
Árvore de Coalescência
E(T5,4) = 2N/10
E(T2,1) = 2Ngerações
E(T3,2)=2N/3
E(T4,3)=2N/6
Tempo
presente
Teoria da coalescência
Se µ << 1 e Prob (coal) << 1DNA não replica e sofremutação em uma geração
Tempo
• Tanto para 2 quanto n- coalescências, o tempo médio decoalescência é proporcional a Nef enquanto a variância é a Nef
2.• O relógio molecular segue Poisson em que a média = variância.• O coalescente é um processo evolutivo irregular, com muitavariação inerente que não pode ser eliminada por n maiores; éinato ao processo evolutivo e chamado de estocasticidadeevolutiva.
A variância do tempo de coalescência de n genes é:
Amostrando n genes ao acaso
3
Experimento de Buri em deriva genética
Problema: Não há réplicas na maioria dos dados reais,os eventos ocorreram apenas uma vez.
Tempo de fixação (coalescência) em 105réplicas do mesmo processo evolutivo
Mutação criavariação edestrói ibd
Coalescênciacom mutação
Coalescência antes da mutação
Mutação
Mutação antes da coalescência
Assumindo µ muito pequeno e Nef muito grande
P de mutação e coalescência na mesma geração é baixa
Mutação e Coalescência:Diversidade genética
Com µ << Nef pode ser simplificado para:
4
= Heterozigosidade esperada
Com µ << Nef pode ser simplificado para:
Mutação e Coalescência:Diversidade genética Árvores de Genes são genealogias de genes. Como cópias
diferentes em loci homólogos estão relacionados pela ordem deeventos de coalescência.
Árvore de gene e árvore de haplótipos
Únicos passos quepodemos “ver” são osmarcados por eventosmutacionais
Árvores de Genes são genealogias de genes. Como cópiasdiferentes em loci homólogos estão relacionados pela ordem deeventos de coalescência.
Árvore de gene e árvore de haplótipos
A esta árvore de maisbaixa resoluçãochamamos de árvorede haplótipos ou dealelos.
Árvore de haplótipo
Árvore de haplótipo -- Antigas e recentes
Dobzhansky & Sturtevant (1936): An Inversion Tree for Drosophilapseudoobscura (A) and D.persimilis (B)
5
Idealmente cada inversão ocorre apenas uma vez na árvore e a árvoreminimiza o número total de mutações – Modelo de Alelos Infinitos
Idealmente cada inversão ocorre apenas uma vez na árvore e a árvoreminimiza o número total de mutações -- Máxima Parcimônia
Máxima Parcimônia (e outros métodos) permite inferir estados deancestrais extintos.
Árvore é enraizada com espécie relacionada que estejafilogeneticamente fora do grupo de interesse - Grupo externo.
Árvore de inversões não equivale sempre a árvore de espécies, oupopulações - Polimorfismo Transpecífico.
Árvore de gene e árvore de haplótipos
Polimorfismo transpecífico (polimorfismoancestral, sorteamento de linhagem) – Quandoalguns dos haplótipos encontrados em uma espéciesão genealogicamente mais aparentados alinhagens de haplótipos encontrados em outraespécie do que a linhagens da própria espécie.
6
Árvore de gene e árvore de haplótipos
Polimorfismo transpecífico, ou polimorfismoancestral, ou ainda sorteamento de linhagem
Freqüência e topologia são misturadas. Mutação é mais provável emhaplótipos comuns. Politomias e ramos pequenos são esperadas.
Modelo de Sítios Infinitos
1
2
3
4
5
Mutações1 2 3 4 5 6
Seqü
ênci
as
7
Cada mutação ocorre em um nucleotídeo diferente
LPL Has 10 Exons Over 30 kb of DNA on Chromosome 8p22
Sequenced 9,734 bp from the 3’ End of Intron 3 to the 5’ End of Intron 9
Sequenced:24 Individuals from North Karelia, Finland (World’s Highest Frequency of CAD)23 European-Americans from Rochester, Minnesota24 African-Americans from Jackson, Mississippi
Found 88 Variable Sites
Ignored Singleton and Doubleton Sites and Variation Due to a Tetranucleotide Repeat,butPhased the Remaining 69 Polymorphic Sites by a Combination of Using AlleleSpecificPrimer Pairs and Haplotype Substraction
The Phased Site Data Identified 88 Distinct Haplotypes
Genetic Survey of Lipoprotein Lipase
Ln-Likelihood ratio teste de homogeneidade = 99.8, 3 df, p = 1.75 x 10-7
Ln-Likelihood ratio teste de homogeneidade nas 3 classes mutáveis = 12.3, 2 df, p = 0.002
Análise de sítios altamente mutáveis
Type of Site # Nt # polym % polym p/ nt
CPG
198 19
9.6% Mononucleotide runs > 5
456 15
3.3% Poly α arrest site ± 3 nucleotides [TG(A/G)(A/G)GA]
264
8 3.0%
All other nucleotides
8,866 46
0.5%
Região Tipo do Sítio 0-1 Homoplasias >2 Homoplasias
5’ e 3’ Altamente mutável
11 14 Flanqueadora
Todos os outros
22 5
Sítios altamente mutáveis em LPL e homoplasia
Recombinational Hotspot
Altamente mutável
3 7 Todos os
outros 5 2
Todos Altamente mutável
14 21 Todos os
outros 27 7
Fisher's Exact Test: P = 0.0013 sob a hipótese nula de homogeneidade
Fisher's Exact Test: P = 0.0013 sob a hipótese nula de homogeneidade
7
ε4
ε3ε2
Árvore dehaplótipos
da Apolipo-protein E
Árvore de haplótipos da Apolipo-protein E
4036
Coalescente dehaplótipos deApo-protein E
ε4
Anos(x 105)
ε2 ε39 16 6 27 2 28 1 14 29 30 12 13 17 20 5 31
3.2
1.6
0.0
0.8
2.43937
4075
5229B
624
308
3673
545
2440
3106
19981163
1522 3701 2907
4714951
73
Árvore dehaplótipos
da Apolipo-protein E
560
560
560
560560
560
1575
624
624624
624
1522
5361
5361
5361
4951
4951
4951
832
83224401998 19983937
5229B
4075
1163 4036
73
471
14
1119
17 20 18
23
1512
25
13
10 16
24
2
22
67 5
1
1575
560
624 624
21
26
4
3
31
3106
28545
27 3673
308
29 3701
8
302907
9
ε3
ε2
ε4
Sítios 560 e 624 estão em umarepetição Alu
Modelo de Sítios Finitos
1
2
3
4
5
Mutações1 2 3 4 5 6
Seqü
ênci
as
7
Um conjunto finito de nucleotídeos são sujeitos à mutaçãoe podem sofrer eventos mutacionais múltiplos
Uso de métodos não apropriados para estudosintraspecíficos
Porque não apropriados:• baixa divergência• ancestral não está extinto• Politomia• reticulação• tamanho amostral grande
8
Parcimônia estatística
Redes ou árvores que alocam homoplasia entrehaplótipos menos divergentes com probabilidademenor do que 0.05 são eliminadas em favor deoutras que alocam tais homoplasias entrehaplótipos mais divergentes
Árvore genealógica Em estudos intraspecíficos:•NÃO esperamos que o ancestral esteja extinto;• Politomias são esperadas. Na verdade, politomiassão PROVÁVEIS;• Como alelo ancestral não está extinto, esperamosque alelos mais antigos tenham maior freqüência.Por outro lado, novos alelos devem ter baixafreqüência;• É mais provável que um alelo raro seja derivadode um alelo comum do que de outro raro;
Podemos usar estasesperanças para resolver“loops” ou homoplasias nosdados
Árvore de haplótipos
Em estudos intraspecíficos:•NÃO esperamos que o ancestral esteja extinto;• Politomias são esperadas. Na verdade, politomiassão PROVÁVEIS;• Como alelo ancestral não está extinto, esperamosque alelos mais antigos tenham maior freqüência.Por outro lado, novos alelos devem ter baixafreqüência;• É mais provável que um alelo raro seja derivadode um alelo comum do que de outro raro;
Podemos usar estas esperanças para resolver“loops” ou homoplasias nos dados
Máxima parcimônia Parcimônia estatística
Árvore genealógica Em estudos intraspecíficos:•NÃO esperamos que o ancestral esteja extinto;• Politomias são esperadas. Na verdade, politomiassão PROVÁVEIS;• Como alelo ancestral não está extinto, esperamosque alelos mais antigos tenham maior freqüência.Por outro lado, novos alelos devem ter baixafreqüência;• É mais provável que um alelo raro seja derivadode um alelo comum do que de outro raro;
Podemos usar estasesperanças para resolver“loops” ou homoplasias nosdados
Árvore de haplótipos
• Geralmente NÃO sabemos a raiz;• Alelos antigos tem mais chance de serem nósinternos, ao invés de pontas (tips).
560
560
560
560560
560
1575
624
624624
624
1522
5361
5361
5361
4951
4951
4951
832
83224401998 19983937
5229B
4075
1163 4036
73
471
14
1119
17 20 18
23
1512
25
13
10 16
24
2
22
67 5
1
1575
560
624 624
21
26
4
3
31
3106
28545
27 3673
308
29 3701
8
302907
9
ε3
ε2
ε4
Árvore dehaplótipos
da Apolipo-protein E
Um único haplótipo pode ter segmentos de DNA que tiverampadrões de mutação e coalescência diferentes no passado.Não existe uma única história evolutiva para estes haplótiposrecombinantes.Quando a recombinação é comum e uniforme, mesmo a idéiade uma árvore de haplótipos torna-se biologicamente semsentido.
Importante investigar sua presença!
Coalescência e recombinação
9
A recombinação ocorre emtodos os genótipos, masmuda o estado do gametaparental apenas em duplosheterozigotos.
A recombinação muda a fasede marcadores polimórficos.
Para se detectar e estudar arecombinação, é essencial terdados com fase conhecida(como haplótipos)
PROBLEMA: Queremos estimar os haplótipos e suas freqüênciasno pool gênico, mas não podemos observá-los em todos osindivíduos.
GENOTIPAGEM N HAPLÓTIPOSPOSSÍVEIS
A/A A/A T/T HOMOZYGOTE 21 AATG/G A/A T/T HOMOZYGOTE 19 GATA/A C/A T/T SINGLE HETEROZYGOTE 9 ACT/AATA/G A/A T/T SINGLE HETEROZYGOTE 39 AAT/GATA/G C/A T/T DOUBLE HETEROZYGOTE 9 ACT/GAT or AAT/GCTA/G A/A T/C DOUBLE HETEROZYGOTE 2 AAT/GAC or AAC/GATA/G C/A T/C TRIPLE HETEROZYGOTE 1 ACT/GAC or AAT/GCC or
ACC/GAT or AAC/GCT
1a Solução: Subtração de Haplótipos (Clark, Mol. Biol. Evol. 7:111-122, 1990).
GENOTIPAGEM N HAPLÓTIPOSPOSSÍVEIS
A/A A/A T/T HOMOZYGOTE 21 AATG/G A/A T/T HOMOZYGOTE 19 GATA/A C/A T/T SINGLE HETEROZYGOTE 9 ACT/AATA/G A/A T/T SINGLE HETEROZYGOTE 39 AAT/GATA/G C/A T/T DOUBLE HETEROZYGOTE 9 ACT/GAT or AAT/GCTA/G A/A T/C DOUBLE HETEROZYGOTE 2 AAT/GAC or AAC/GATA/G C/A T/C TRIPLE HETEROZYGOTE 1 ACT/GAC or AAT/GCC or
ACC/GAT or AAC/GCT
Os haplótipos neste grupo são conhecidos!
1a Solução: Subtração de Haplótipos (Clark, Mol. Biol. Evol. 7:111-122, 1990).
GENOTIPAGEM N HAPLÓTIPOSPOSSÍVEIS
A/A A/A T/T HOMOZYGOTE 21 AATG/G A/A T/T HOMOZYGOTE 19 GATA/A C/A T/T SINGLE HETEROZYGOTE 9 ACT/AATA/G A/A T/T SINGLE HETEROZYGOTE 39 AAT/GATA/G C/A T/T DOUBLE HETEROZYGOTE 9 ACT/GAT or AAT/GCTA/G A/A T/C DOUBLE HETEROZYGOTE 2 AAT/GAC or AAC/GATA/G C/A T/C TRIPLE HETEROZYGOTE 1 ACT/GAC or AAT/GCC or
ACC/GAT or AAC/GCT
Os haplótipos neste grupo são conhecidos!
Tais haplótipos são também possibilidades em genótiposcom fase ambígua
1a Solução: Subtração de Haplótipos (Clark, Mol. Biol. Evol. 7:111-122, 1990).
GENOTIPAGEM N HAPLÓTIPOSPOSSÍVEIS
A/A A/A T/T HOMOZYGOTE 21 AATG/G A/A T/T HOMOZYGOTE 19 GATA/A C/A T/T SINGLE HETEROZYGOTE 9 ACT/AATA/G A/A T/T SINGLE HETEROZYGOTE 39 AAT/GATA/G C/A T/T DOUBLE HETEROZYGOTE 9 ACT/GAT or AAT/GCTA/G A/A T/C DOUBLE HETEROZYGOTE 2 AAT/GAC or AAC/GATA/G C/A T/C TRIPLE HETEROZYGOTE 1 ACT/GAC or AAT/GCC or
ACC/GAT or AAC/GCT
Os haplótipos neste grupo são conhecidos!
A solução que inferir menos haplótipos novos será a preferida
2a Solução: Algoritmo EM (Estimation-Maximization)(Templeton et al. Genetics 120: 1145-1154, 1988).
Estima probabilidades de várias fases de genótipos pelo uso dasfreqüências dos haplótipos em um modelo de Hardy-Weinberg.
10
2a Solução: Algoritmo EM (Estimation-Maximization)(Templeton et al. Genetics 120: 1145-1154, 1988).
Estima probabilidades de várias fases de genótipos pelo uso dasfreqüências dos haplótipos em um modelo de Hardy-Weinberg.Repetir tal procedimento até que as freqüências estabilizem.
2a Solução: Algoritmo EM (Estimation-Maximization)(Templeton et al. Genetics 120: 1145-1154, 1988).
Estima probabilidades de várias fases de genótipos pelo uso dasfreqüências dos haplótipos em um modelo de Hardy-Weinberg.Repetir tal procedimento até que as freqüências estabilizem.
2a Solução: Algoritmo EM (Estimation-Maximization)(Templeton et al. Genetics 120: 1145-1154, 1988).
Nem tão bem resolvido quanto o algoritmo de HaplotypeSubstraction.Pode ser uma vantagem, e uma desvantagem.
3a Solução: Algoritmo Bayesiano (Stephens et al., Am J. Hum Gen.68: 978-989,2001)Divide the individuals into those with unambiguous haplotypes and those with ambiguous haplotypes.Unlike haplotype subtraction and like EM, ambiguous individuals always remain ambiguous(although the probabilities could become very small). Then:
1. Let G be the vector of genotypes and H(0) some initial guess of the vector of haplotypes(just like EM).
2. Choose an individual, i, uniformly and at random (thus avoiding order effects) from theset of ambiguous individuals.
3. Sample Hi(t+1) from P(Hi|G,H-I
(t))where H-I is the set of haplotypes excluding individual i.
Go back to 2 and keep repeating until converge to a stationary distribution (they show thiswill always occur). Thus, you now have P(H|G).
However, where we do we get P(Hi|G,H-I(t))?
Como detectar eventos de recombinação em LPL
5NR
2JNR 79R70R
7
8
13
20
29 31 33 56 53
5
65
25
7 813
16
11J
611931J
66 29 36 69
5
16
1236J
Branch "A" {Como detectar eventos de recombinação em LPL
α=3, β=5, κ=3, p =0.0179, crossover between sites 13 and 29.1 10 20 30 40 50 60 69
2JNR CAGTTTCCCT CAGCACGATC GCAATTGCAC CTCAATGTAT AGTTGTAACC GAGTCCGCAT AACTATAGG5NR CAGTTTATCT CACCACGATA GCAATTGCAC CTCAATGTAT AGTTGTAACC GAGTCCGCAT AACTATAGGNode a CAGTTTATCT CACCACGATC GCAATTGCTC TTTAATGTAT AGTTGTAACC GAATCAGCAT AACTATAGG
α=2, β=7, κ=2, p =0.0278, crossover between sites 16 and 19.
Node d CAGTTTATCT CACCACGATC GCAACTGCTC TTTAATGTAT AGTTGTAACC GAATCAGCAT AACTATAGG11J CAGTATATCT CACCATGATC GCAACTGCTC TTTAATGTAT AGTTGTAACC GAATCAGCAT AACTATAGGNode e CAGTATATCT CACCATGAGC GCAATTGCAC TTTAA?GTAT AGTTGTAACC GAATCAGCAT CACTGGAGA
11J CAGTATATCT CACCATGATC GCAACTGCTC TTTAATGTAT AGTTGTAACC GAATCAGCAT AACTATAGGNode e CAGTATATCT CACCATGAGC GCAATTGCAC TTTAA?GTAT AGTTGTAACC GAATCAGCAT CACTGGAGAT-1 CAGTTTATCT CACCACGAGC GCAATTGCAC TTTAA?GTAT AGTTGTAACC GAATCAGCAT CACTGGAGA
11
Distribuição de recombinantes em LPL LD e recombinational Hotspot em LPL
Reich, D. E. et al. Nature Genetics 32, 135-142, 2002.“recombination 'hot spots' are a general feature of the humangenome and have a principal role in shaping genetic variation inthe human population.”
Recombinação cria novas fases em sítios polimórficos, quepodem ser medidas por:
D = gABgab-gAbgaB
• D mede o grau de associação entre dois sítios naquelapopulação
• D é criado por várias forças evolutivas e eventos históricos,inclusive a mutação.
Hardy Weinberg em 2 loci
Ou seja, evolução ocorre!
O equilíbrio é alcançadogradualmente, na taxa r.Informações históricas sãomedidas por D, que decai como tempo.Em loci com alta ligação podepersistir por grandes períodos.
Hardy Weinberg em 2 loci
Dt = D0(1-r)t
Existe a tendência de usar D como medida daproximidade na molécula de DNA
Isto se justifica quando r >> µ
Quando r < µ ou r ≈ µ ; o desequilíbrio está medindoproximidade no processo de coalescência.
Desequilíbrio e Coalescência
12
ε4
ε3ε2
Árvore dehaplótipos
da Apolipo-protein E
O gene ApoE
Stengård et al. (1996)mostraram quesubstituições de aminoácidos em ApoE temgrande impacto namortalidade por doençascoronarianas em umestudo longitudinal.
01234567
CAD MortalityRelative to
CAD Mortalityof 3/3
3/33/42/4 & 4/4
0. 0.5 1. 1.5 2. 2.5 3. 3.5 4. 4.5 5. 5.5
Exon 1
Exon 2
Exon 3
Exon 4
73 308
471545560624832
1163
15221575
1998
2440
2907
3106
3673
393740364075
4951
5229A
5229B5361
3701*
Região Gênica da Apoprotein E
0. 0.5 1. 1.5 2. 2.5 3. 3.5 4. 4.5 5. 5.5
Exon 1
Exon 2
Exon 3
Exon 4
73 308
471545560624832
1163
15221575
1998
2440
2907
3106
3673
393740364075
4951
5229A
5229B5361
3701*
Estes dois sítios estão em desequilíbrio
Região Gênica da Apoprotein E
560
560
560
560560
560
1575
624
624624
624
1522
5361
5361
5361
4951
4951
4951
832
83224401998 19983937
5229B
4075
1163 4036
73
471
14
1119
17 20 18
23
1512
25
13
10 16
24
2
22
67 5
1
1575
560
624 624
21
26
4
3
31
3106
28545
27 3673
308
29 3701
8
302907
9
Árvore dehaplótiposda Apo-
lipoprotein E
560
560
560
560560
560
1575
624
624624
624
1522
5361
5361
5361
4951
4951
4951
832
83224401998 19983937
5229B
4075
1163 4036
73
471
14
1119
17 20 18
23
1512
25
13
10 16
24
2
22
67 5
1
1575
560
624 624
21
26
4
3
31
3106
28545
27 3673
308
29 3701
8
302907
9
Estes haplótipos sãoT no sítio 832 e C
em 3937
Estes haplótipos são G nosítio 832 e T em 3937
Árvore dehaplótiposda Apo-
lipoproteinE
13
0. 0.5 1. 1.5 2. 2.5 3. 3.5 4. 4.5 5. 5.5
Exon 1
Exon 2
Exon 3
Exon 4
73 308
471545560624832
1163
15221575
1998
2440
2907
3106
3673
393740364075
4951
5229A
5229B5361
3701*
Sítio 3937 é um polimorfismo de a.a. queafeta a função de ApoE e infarto
Região Gênica da Apoprotein E
0. 0.5 1. 1.5 2. 2.5 3. 3.5 4. 4.5 5. 5.5
Exon 1
Exon 2
Exon 3
Exon 4
73 308
471545560624832
1163
15221575
1998
2440
2907
3106
3673
393740364075
4951
5229A
5229B5361
3701*
Sítio 3937 é um polimorfismo de a.a. queafeta a função de ApoE e infarto
Suponha que apenas esta região tenhasido sequenciada
Região Gênica da Apoprotein E
0. 0.5 1. 1.5 2. 2.5 3. 3.5 4. 4.5 5. 5.5
Exon 1
Exon 2
Exon 3
Exon 4
73 308
471545560624832
1163
15221575
1998
2440
2907
3106
3673
393740364075
4951
5229A
5229B5361
3701*
Sítio 832 está associado na árvore dehaplótipos com o sítio 3937
Região Gênica da Apoprotein E
Suponha que apenas esta região tenhasido sequenciada
Sítio 3937 é um polimorfismo de a.a. queafeta a função de ApoE e infarto
0. 0.5 1. 1.5 2. 2.5 3. 3.5 4. 4.5 5. 5.5
Exon 1
Exon 2
Exon 3
Exon 4
73 308
471545560624832
1163
15221575
1998
2440
2907
3106
3673
393740364075
4951
5229A
5229B5361
3701*
Região Gênica da Apoprotein E
Sítio 832 pareceria com a maiorassociação com função de ApoE e infarto
Suponha que apenas esta região tenhasido sequenciada
0. 0.5 1. 1.5 2. 2.5 3. 3.5 4. 4.5 5. 5.5
Exon 1
Exon 2
Exon 3
Exon 4
73 308
471545560624832
1163
15221575
1998
2440
2907
3106
3673
393740364075
4951
5229A
5229B5361
3701*
Você seriacapaz de
inferir destaassociação que
o marcadormais perto dosítio funcionalestaria aqui?
Região Gênica da Apoprotein E
Sítio 832 pareceria com a maiorassociação com função de ApoE e infarto
Suponha que apenas esta região tenhasido sequenciada
Para que servem árvores de haplótipo
• As árvores de haplótipo estimam umahistória evolutiva que pode gerar hipótesessobre o significado atual da variaçãogenética
• Fornecem uma ferramenta poderosa para sedetectar associações entre genótipo efenótipo