parsimonia - centro de ciencias genómicas unamvinuesa/tlem/docs/parsimonytlem.pdf · -william of...
Post on 24-Mar-2020
8 Views
Preview:
TRANSCRIPT
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 1
Parsimonia
¨la cantidad mínima neta de evolución¨
Edwards, A.W.F., L.L. Cavalli-Sforza. 1964. Thereconstruction of evolution. Annals of Human Genetics27:105-106.
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 2
Relación entre métodos para reconstruirfilogenias
UPGMA
Neighbourjoining
parsimonia
máximaverosimilitud
inferencia Bayesiana
mínimaevolución
distancias sitios
crite
rio d
eop
timiz
ació
nal
gorit
mo
de
agru
pam
ient
o
Page y Holmes (1998)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 3
La navaja de Ockham
“For nothing ought to be posited without areason given, unless it is self-evident....”
-William of Ockham (c. 1288 - c.1348)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 4
Willi Hennig
Grundzüge einer Theorieder PhylogenetischenSystematik (Hennig,1950)
Phylogenetic Systematics(Hennig, 1966)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 5
Principios Hennigianos
Los caracteres derivadoscompartidos-lassinapomorfías brindan laúnica evidencia para identificarrelaciones relativas (tiemporelativo en que se compartióun ancestro común)
Hennig, W. 1966. Phylogenetic Systematics. Trasdución por D.D. Davis & R. Zangerl.University of Illinois Press. 263 pp.
autapomorfíasinapomorfíaplesiomorfía
autapomorfía-estado derivado únicoplesiomorfía-estado ancestral
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 6
Un principio HennigianoSe buscará la conformidad máxima
entre evidencia (principio auxiliar p.121). Para escoger entre hipótesisalternativas (cladogramas), sedecidirá con base en cual presentala cantidad mayor de evidencia; elnúmero máximo de sinapomorfíasque pueden ser interpretadascomo homólogos
"checking, correcting and rechecking"
Hennig, W. 1966. Phylogenetic Systematics. Trasdución por D.D. Davis & R. Zangerl.University of Illinois Press. 263 pp.
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 7
aves
aletasantebrazos
alasalas alas
Shuh (2000)
dinos
aurio
spte
rodac
tilos
coco
drilos
larga
tijas
tortug
asmurc
iélag
ootr
os m
amífe
rosan
fibios
pece
s
Homologíaamnion
plumas
pelo
vejiga
no vejiga
exc. acído úrico
escamas
no escamas
no escamasmolleja
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 8
aves
aletasantebrazos
alasalas alas
Shuh (2000)
dinos
aurio
spte
rodac
tilos
coco
drilos
larga
tijas
tortug
asmurc
iélag
ootr
os m
amífe
rosan
fibios
pece
s
Homología transformacional
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 9
Diferentes criterios de optimización
Optimización de Farris
Optimización de Fitch (parsimonia de Wagner)
Optimización de Dollo
Optimización de Camin y Sokal
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 10
Los caracteres multiestado se tratan como reversibles yno aditivos (desordenados)
0 a 1 vale un paso, 1 a 2 vale un paso, 0 a 2 vale unpaso
Estados no tienen que ser números enteros
cambios de 0 a 2 cuentan como 1 paso1 2
0
Optimización de Fitch(parsimonia de Wagner)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 11
Los caracteres multiestado se tratan como reversibles yordenados
0 a 1 vale un paso, 1 a 2 vale un paso, 0 a 2 vale dospasos
Estados no tienen que ser números enteros
¿inserciones y deleciones?
0 1 2
Optimización de Farris (1970)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 12
Parsimonia de Dollo"Ley de Dollo": Un carácter complejo puede evolucionar
(de la misma manera) una sola vez
Si se supone que 0 es el estado ancestral, el estadoderivado puede surgir una sola vez, pero se puedeperder múltiples veces
Se prohíbe el parelelismo—la homoplasia sólo se tratancomo reversiones
Se ha aplicado para sitios de restricción (unaderivación, pero múltiples pérdidas)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 13
Parsimonia de Dollo
Soluciones que no violan la restricción de Dollo
El estado 1 (derivado, en este caso) se pierde una, o múltiples veces
A B C D0 01 1
1
1
0
A B C D0 01 1
1
1
1
Swofford (1993) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 14
Parsimonia de Dollo
¿Cuál de las dos reconstrucciones viola la restricción de Dollo?
Swofford (1993)
0
0 0
01 1
1110 0 0
00
1 1
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 15
Dollo y sitios de restricción
Los sitios de restricción son más fáciles deperder por mutación que su ganancia.
HhaIGCGC
12 posibles mutaciones resultan en la pérdida del sitio
ACGCSolo 1 de 12 posibles mutaciones restaura el sitio
-1
+3
- +- 0 3+ 1 0
matriz de pasopara “Dollo relajado”
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 16
Camin-Sokal
se prohíbe la reversión---la homoplasia solopueden tratarse como paralelismos
supone que se sabe el estado ancestral
posible aplicación: deleciones pequeñas (queno sobrelapan)
poca relevancia actual
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 17
Parsimonia de Camin y Sokal
Caminalcules: las mejores reconstrucciones minimizaron loscambios de estados; "parsimonia"
Camin, J.H. & R. R. Sokal. 1965. A method for deducing branchingsequences in phylogeny. Evolution 19:311-326 Taller
Latinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 18
ACCTRAN y DELTRAN
Cuando haya más de una optimización posible...
Swofford (1993)
A B C D0 01 1
ACCTRAN favorece reversiones
1->0
0->1
DELTRAN favorece paralelismos
0->1 0->1
A B C D0 01 1
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 19
Matriz de DNA
A ...CGAATGTCATCG...B ...CGGATGCGACCC...
C ...CGGGTGCGACTG...
D ...TGAACCTCATGG...
E ...TGAACGTCGTGC...
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 20
A ...000000000000...B ...001000110101...
C ...001100110110...
D ...100011000020...
E ...100010001021...
con pesos iguales
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 21
Argumentación Hennigiana
los caracteres son polarizados0=plesiomórfico y 1=apomórfico
111 123456789012A 000000000000B 001000110101C 001100110110D 100011000020E 100010001021
B C
4
9
D E
15 7
810
3
2 nada
C
6
D E
11 11
12
B E
Se agrupan los taxacaracter por caracter
B C AD E
1
3
578
1011
41112126 9
Se ensambla el árbol
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 22
Optimización de Fitch
A B C D E
A - 5 6 4 5
B - 3 9 8
C - 9 10
D - 3
E -
Matriz de Manhattan
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 23
Optimización de FarrisMatriz de ManhattanA B C D E
A - 5 6 5 6
B - 3 10 9
C - 10 10
D - 3
E -
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 24
El Método de Wagner(Kluge y Farris 1969; Farris 1970)
algoritmo
conecta los taxones de uno en uno
se le añade lo que muestre el menor número de diferencias
taxa hipotéticos representan los sitios de bifurcación
produce un cladograma (no siempre el más parsimonioso)
polariza los caracteres mediante un ancestro hipotético o posteriormente con un grupo externo
Kluge y Farris (1969); Farris (1970)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 25
1 1 1
taxón 1 2 3 4 5 6 7 8 9 0 1 2A C G A A T G T C A T C G
B C G G A T G C G A C C C
C C G G G T G C G A C T G
D T G A A C C T C A T G G
E T G A A C G T C G T G C * * * * * * * * * * *
* * * * * * * *informativosvariables
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 26
El árbol más parsimonioso
C
B
A D
E
formato Newick: (((C,B),A),(D,E))
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 27
sitio 1
m: # mínimo de cambios = 1s: # cambios observados = 1
índice de consistencia (ic) = m/s
1/1 = 1
el caracter no presentahomoplasia sobre este árbol
C
B
A D
E
1
CT
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 28
sitio 4
m: # mínimo de cambios = 1s: # cambios observados = 1
índice de consistencia (ic) = m/s
1/1 = 1
el caracter no presentahomoplasia sobre este árbol, perotampoco es informativo--autapomorfía
C
B
A D
E
4
AG
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 29
sitio 12
m: # mínimo de cambios = 1s: # cambios observados = 2
índice de consistencia (ic) = m/s
1/2 = 0.5
homoplasia: cuando un estado decaracter surge más de una vez
el caracter presentahomoplasia sobre este árbol
C
B
A D
E
12GC
12
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 30
el algoritmo de Fitch (1971)sitio 12
*cobra un paso
cobra 2 pasos para todos lossitios con el patrón:xyxxy
GC G CG
{CG}* {CG}*
{G}
{G}
S T = 0S T
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 31
el algoritmo de Sankoff (1975)
A -> C = 2.5+A -> A = 0
T -> C = 1+T -> A = 2.5
A C G T
Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 32
A C G T
A
C
A
G2.5
0
1
el algoritmo de Sankoff (1975)
Felsenstein (2004)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 33
el algoritmo de Sankoff (1975)
A C G T
A -> A = 2.5+3.5
G -> G = 3.5+3.5
Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 34SaimiriLemur Macaca
Hylobates
Tarsius
PanGorilla HomoPongo
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 35
ArchivoNEXUS
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 36
1 de 2AMPs
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 37
2 de 2AMPs
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 38
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 39
consistencyindexci = m/s
homoplasyindexhi = 1-ci
retentionindexri = (g-s) / (g-m)
rescaledconsistencyindexrc = ci X ri
L= Longitud Length
m = pasos minMin steps
s = pasos árbolTree steps
g = pasos maxMax steps
des /diagnose
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 40
estados 111211222311311222322211311221frec estados men 0001003424004001
111111111122222222223 123456789012345678901234567890Lemur_catta AAGCTTCATAGGAGCAACCATTCTAATAATHomo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATPan AAGCTTCACCGGCGCAATTATCCTCATAATGorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATPongo AAGCTTCACCGGCGCAACCACCCTCATGATHylobates AAGCTTTACAGGTGCAACCGTCCTCATAATMacaca_fuscata AAGCTTTTCCGGCGCAACCATCCTTATGATM._mulatta AAGCTTTTCTGGCGCAACCATCCTCATGATM._fascicularis AAGCTTCTCCGGCGCAACCACCCTTATAATM._sylvanus AAGCTTCTCCGGTGCAACTATCCTTATAGTSaimiri_sciureus AAGCTTCACCGGCGCAATGATCCTAATAATTarsius_syrichta AAGTTTCATTGGAGCCACCACTCTTATAATvariables * **** * ******* * **informativos (pics) **** * ****** * *
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 41
g = pasos maxMax steps
c t t
t
c
c
c
c
c
c
c
c
posición 7
pasos mínimos: m=1pasos máximos: g = 3
c
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 42
111111111122222222223 123456789012345678901234567890Lemur_catta AAGCTTCATAGGAGCAACCATTCTAATAATHomo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATPan AAGCTTCACCGGCGCAATTATCCTCATAATGorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATPongo AAGCTTCACCGGCGCAACCACCCTCATGATHylobates AAGCTTTACAGGTGCAACCGTCCTCATAATMacaca_fuscata AAGCTTTTCCGGCGCAACCATCCTTATGATM._mulatta AAGCTTTTCTGGCGCAACCATCCTCATGATM._fascicularis AAGCTTCTCCGGCGCAACCACCCTTATAATM._sylvanus AAGCTTCTCCGGTGCAACTATCCTTATAGTSaimiri_sciureus AAGCTTCACCGGCGCAATGATCCTAATAATTarsius_syrichta AAGTTTCATTGGAGCCACCACTCTTATAAT
pasos mínimos: m=1pasos sobre el árbol: s=1pasos máximos: g = 1
ri = (g-s)/(g-m)=(1-1)/(1-1)=0/0
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 43
111111111122222222223 123456789012345678901234567890Lemur_catta AAGCTTCATAGGAGCAACCATTCTAATAATHomo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATPan AAGCTTCACCGGCGCAATTATCCTCATAATGorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATPongo AAGCTTCACCGGCGCAACCACCCTCATGATHylobates AAGCTTTACAGGTGCAACCGTCCTCATAATMacaca_fuscata AAGCTTTTCCGGCGCAACCATCCTTATGATM._mulatta AAGCTTTTCTGGCGCAACCATCCTCATGATM._fascicularis AAGCTTCTCCGGCGCAACCACCCTTATAATM._sylvanus AAGCTTCTCCGGTGCAACTATCCTTATAGTSaimiri_sciureus AAGCTTCACCGGCGCAATGATCCTAATAATTarsius_syrichta AAGTTTCATTGGAGCCACCACTCTTATAAT
pasos mínimos: m=1pasos sobre el árbol: s=2pasos máximos: g = 3
ri = (g-s)/(g-m)=(3-2)/(3-1)=1/2=0.5 Taller
Latinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 44
111111111122222222223 123456789012345678901234567890Lemur_catta AAGCTTCATAGGAGCAACCATTCTAATAATHomo_sapiens AAGCTTCACCGGCGCAGTCATTCTCATAATPan AAGCTTCACCGGCGCAATTATCCTCATAATGorilla AAGCTTCACCGGCGCAGTTGTTCTTATAATPongo AAGCTTCACCGGCGCAACCACCCTCATGATHylobates AAGCTTTACAGGTGCAACCGTCCTCATAATMacaca_fuscata AAGCTTTTCCGGCGCAACCATCCTTATGATM._mulatta AAGCTTTTCTGGCGCAACCATCCTCATGATM._fascicularis AAGCTTCTCCGGCGCAACCACCCTTATAATM._sylvanus AAGCTTCTCCGGTGCAACTATCCTTATAGTSaimiri_sciureus AAGCTTCACCGGCGCAATGATCCTAATAATTarsius_syrichta AAGTTTCATTGGAGCCACCACTCTTATAAT
CI HIRI RC
pasos sobre el árbol = 3
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 45
usertype 2_1 = 4 [weights transversions 2 times transitions]
a c g t [a] . 2 1 2 [c] 2 . 2 1 [g] 1 2 . 2 [t] 2 1 2 . ;
Hayasaka, K., T. Gojobori, and S. Horai. 1988. Molecular phylogeny and evolution of primate mitochondrial DNA. Mol. Biol. Evol. 5:626-644.]
2 2
1
a
c t
2 <= 2 + 1
Inequidad del Triángulod(ac) <= d(ct) + d(at)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 46
ctype 2_1:all;hs;1 AMP
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 47
Savolainen, V.J., M.W. Chase, S.B. Hoot, C.M. Morton, D.E Soltis, C. Bayer, M.F.Fay, A.Y. de Bruijin, S. Sullivan, Y.-L. Qiu. 2000. Phylogenetics of flowering plantsbased on combined analysis of plastid atpB and rbcL gene sequences. Syst. Biol.49:306-362. Taller
Latinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 48
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 49
Pesos sucesivos
"Successive Weighting" (Farris 1969)
a posteriori
Se puede asignar pesos según CI, RI o RC en PAUP(hay que justificar porque se escoge uno de los tres!)
El resultado final depende mucho del árbol inicial
No se usa mucho actualmenteTallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 50
¿Porqué calcular todos los árbolesposibles?
Para espantar a los taxónomos.-Felsenstein (1978)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 51
A
B
C
A C
B D
A B
C D
A C
D B
A B
C D
6
710
8
9
A C
B D
1
25
3
4
A B
C D
11
1215
13
14
todos los posibles árboles bifurcadossin raíz
3 taxa
4 taxa
5 taxa
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 52
número de taxa número de árboles
número de árboles enraizados y bifurcados
1 12 13 34 155 1056 9457 10,3958 135,1359 2,027,02510 34,459,42511 654,729,07512 13,749,310,57513 316,234,143,22514 7,905,853,580,62515 213,458,046,676,87516 6,190,283,353,629,37517 191,898,783,962,510,62518 6,332,659,870,762,850,62519 221,643,095,476,699,771,87520 8,200,794,532,637,891,559,37521 319,830,986,772,877,770,815,62522 13,113,070,457,687,988,603,440,625 Felsenstein (2004)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 53
número de árboles bifurcados sin raíz
B (t) = (2i - 5)i = 3
t
IIB (t): número de árboles sin raíz para t taxa
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 54
ejemplo para 8 taxa
(2 x 3 - 5) x (2 x 4 - 5) x (2 x 5 - 5)x (2 x 6 - 5) x (2 x 7 - 5) x (2 x 8 - 5)
1 x 3 x 5 x 7 x 9 x 11 = 10,395
B (t) = (2i - 5)i = 3
t
II
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 55
Árboles etiquetados
• no enraizados• enraizados• bifurcados
– nodos internos con 3 grados• multifurcados
– nodos internos con >= 3 grados• forma
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 56
métodos de búsquedas
Aproximadas (heurísticas)empezar a partir de un árbol
predefinido (actual)NJescogido al azaradición secuencial
con el orden de agregar taxa 1) como tal, 2) más cerca, 3) más lejos,4) simple (Wagner), 5) al azar
intercambio de ramasnearest neighbor interchangesubtree pruning regraftingtree bisection reconnection
Exactasexhaustiva (hasta 11 taxa)branch-and-bound (hasta ca. 25 taxa)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 57
punto de inicio
óptima local óptima global
óptima local vs. óptima global
algoritmos codiciosos escogen la primera opción mejor que la actual
Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 58
nearest neighbor interchange (NNI)subárbol
disolver las conexiones de una rama interior
reformar las conexiones en una de dos maneras
tres topologías posiblespara 4 taxa
a
db
c
a
db
c
a
db
c a
db
c
Felsenstein (2004)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 59
subtree pruning and regrafting (SPR)
disolver una rama interior, remover un subárbol
agrega el subárbol a otra rama (*)
el resultado
a
db
ce f
a
db
ce f
a
db
ce f4
32
1*
c
fd
ea b
Swofford (1993) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 60
tree bisection and reconnection (TBR)
separa un subárbol
conectar una rama, a la rama del otro
el resultado
a
db
ce f
a
db
ce f
disolver una rama
a
db
ce f
a
fe
cb d
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 61
TBR puede considera más árboles queSPR y NNI
NNI: 2 (n - 3)
SPR: 4 (n - 3)(n - 2)
TBR: no hay formula exactanúmero máximo es (2n1 - 3)(2n2 - 3)
para n = 6 taxa,
NNI: 2 (6 - 3) = 6 vecinos
SPR: 4 (6 - 3)(6 - 2) = 48 vecinos Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 62
Nuevos métodos de búsquedasheurísticas
Matraca (parsimony ratchet; Nixon 1999)cada iteración aplica pesos a alguna proporción de los
caracteres
Fusión de árboles (Goloboff 1999)intercambia subárboles con los mismos taxa entre dos árboles
óptimos o casi óptimos
Búsqueda sectorial (Goloboff 1999)Deriva de árboles (Tree-drifting/Simulated Annealing;
Goloboff 1999)durante intercambio de ramas, se acepta árboles subóptimos
con una cierta probabilidad
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 63
Nixon, K.C. 1999. The parsimony ratchet, a newmethod for rapid parsimony analysis. Cladistics15:407-414.
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 64
branch-and-bound
5
7L=7
3L=9
límite superior
4L=9
empate límite superior
5L=9
6L=9
7L=11
8L=10
9L=7
10L=10
11L=8
12L=10
13L=11
14L=11
15 árboles posibles,evaluó 3 subárboles más 11 árboles
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 65
Árboles de consenso
Para resumir clados compartidos entre árboles diferentes (p. ej.AMPs, muestreo de árboles Bayesianos)
Estricto: combina en un árbol aquellos componentes queaparecen repetidos en TODOS los árboles originales. Este árbolde consenso tiene menor resolución que todos los tipos deconsenso
De mayoría: árbol que incluye los componentes que aparecen enla mayoría de los originales (>50%; la mitad más uno). Esteárbol de consenso puede ser inconsistente con uno o más delos árboles originales
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 66
Árboles de consenso
321
B D E GF H IA C C D E GF H IA B C E B GF H IA D
B D E GF H IA
consenso estricto
C B D E GF H IA C
mayoría
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 67
D.S. Gernandt, S.A. Magallón, G. Geada López, O. Zeron Flores, A. Willyard y A. Liston.2008. Use of Simultaneous Analyses to Guide Fossil-based Calibrations of PinaceaePhylogeny. International Journal of Plant Sciences 169:1086-1099.
consenso estricto de 5 AMPs658 caracteres informativosL=2167, ICe=0.559, IR=0.676bootstrap/decaimiento
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 68
Bootstrap
Remuestreo (Felsenstein 1985)
Remuestreo con reemplazamiento de los datos originales
Cada replicado tiene la misma cantidad de caracteres (y taxa) peroalgunas caracteres están representados una o más veces yotros no aparecen
Con cada matriz se puede obtener diferentes árboles. El apoyo deuna rama será el porcentaje de veces que el grupo que defineaparece en el conjunto de árboles de las replicados debootstrap
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 69
char 1 2 3 4 5 6 7 8 9 10 11 12A 1 0 0 0 1 1 0 0 0 1 1 1B 1 0 0 0 1 0 0 0 0 1 1 0C 0 0 0 0 0 0 0 0 1 1 1 0D 0 1 1 1 0 0 0 1 0 1 0 0E 0 1 1 1 0 0 0 1 0 1 0 1F 0 0 0 0 0 0 0 0 0 0 0 0
char 1 1 3 4 4 4 6 7 10 10 11 11A 1 1 0 0 0 0 1 0 1 1 1 1B 1 1 0 0 0 0 0 0 1 1 1 1C 0 0 0 0 0 0 0 0 1 1 1 1D 0 0 1 1 1 1 0 0 1 1 0 0E 0 0 1 1 1 1 0 0 1 1 0 0F 0 0 0 0 0 0 0 0 0 0 0 0
matriz original
matriz para una réplica de bootstrap
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 70
Se puede aplicar el bootstrap conpesos
char 1 2 3 4 5 6 7 8 9 10 11 12A 1 0 0 0 1 1 0 0 0 1 1 1B 1 0 0 0 1 0 0 0 0 1 1 0C 0 0 0 0 0 0 0 0 1 1 1 0D 0 1 1 1 0 0 0 1 0 1 0 0E 0 1 1 1 0 0 0 1 0 1 0 1F 0 0 0 0 0 0 0 0 0 0 0 0rep1 2 0 1 3 0 1 1 0 0 2 2 0rep2 0 1 1 2 2 1 2 0 1 0 0 2rep3 1 2 0 0 1 2 0 2 1 1 0 2rep4 1 1 0 1 2 0 1 1 2 2 0 1repn 0 2 2 0 1 1 2 0 1 1 2 0
pesosm
atriz original
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 71
Jackknife
char 1 2 3 4 5 6 7 8 9 10 11 12A 1 0 0 0 1 1 0 0 0 1 1 1B 1 0 0 0 1 0 0 0 0 1 1 0C 0 0 0 0 0 0 0 0 1 1 1 0D 0 1 1 1 0 0 0 1 0 1 0 0E 0 1 1 1 0 0 0 1 0 1 0 1F 0 0 0 0 0 0 0 0 0 0 0 0
char 1 2 4 5 8 12A 1 0 0 1 0 1B 1 0 0 1 0 0C 0 0 0 0 0 0D 0 1 1 0 1 0E 0 1 1 0 1 1F 0 0 0 0 0 0
50% jackknifesegundo orden = borrar caracteres
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 72
Decay Index
Bremer (1988)
Apoyo de Bremer o índice de descomposición
Examina cuantos pasos extra se requieren para que se pierda unarama que está presente en todos los AMPs
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 73
Intentos de derivar parsimoniade máxima verosimilitud
Farris (1973, 1977)Felsenstein (1979, 1981)Goldman (1990)Ningún mecanismo en común (Penny et al.
1994 y Tuffley & Steel 1997)muchos parámetros, inconsistente
L = Prob (Datos Árbol) La verosimilitud (likelihood) mide la probabilidad de los datos dado el árbol
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 74
Parsimonia con pesos iguales
Se porta como máxima verosimilitud cuando las tasasde cambio en los caracteres son bajas
En otras palabras, el criterio de minimizar cambios(parsimonia) es adecuado cuando los cambios sonpocos
¿Entonces, qué hacer cuando las tasas son más altas?
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 75
El Modelo de Goldman
Goldman (1990)
produce resultados idénticos a parsimonia con pesosiguales
Supuestos:–la misma cantidad de cambio evolutivo (promedio)ocurre en cada rama del árbol–la verosimilitud depende en una combinaciónparticular de estados de caracteres
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 76
Propiedades estadísticas de métodosde reconstrucción filogenéticos
consistencia: converge en el parámetro verdadero alagregar más datos (al acercar a datos infinitos)
no sesgado: su valor promedio para muchos muestreosse centra en el parámetro correcto
eficiencia: la varianza de los muestreos converge a unvalor mínimo (encuentra la respuesta correcta conmenos datos)
robustez: si es consistente, no sesgado y/o eficientebajo un rango amplio de distribuciones de muestreo
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 77
Atracción de ramas largas
consistente
inconsistente
“Zona de Felsenstein”
Felsenstein (2004) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 78
¿Dónde fallan los métodos?
Huelsenbeck et al. (1996)
UPGMA Parsimonia
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 79
Simulaciones con longitudes deramas iguales
Huelsenbeck et al. (1996) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 80
Simulaciones con dos ramasexternas largas
Huelsenbeck et al. (1996)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 81Page & Holmes (1998) TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 82
"Romper" ramas largas
Hillis (1996)
atracción presenta más problemas cuando las ramas largas están próximas
18S nrDNA228 angiospermas
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 83
Parsimonia y reconstrucción delongitudes de ramas
Muchas reconstrucciones más parsimoniosos son posibles sobreel mismo árbol
Mediante modelos probabilísticos, se ha calculado la frecuencia deerror en asignar estados a nodos internos mediante parsimonia(Maddison 1984)
Se puede calcular el promedio de longitudes pero depende de laposición de la raíz
los promedios subestiman el número de cambios trascurridos
métodos de distancia y de verosimilitud toman en cuenta laprobabilidad de cambios
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 84
“La zona de Farris”
Cuando especies hermanas tienen ramas largas,parsimonia converge en la solución correcta antesque verosimilitud
Felsenstein (y Swofford): "El sesgo inherente enparsimonia favorece la solución correcta"
No es la contraparte de atracción de ramas largas
Felsenstein (2004)
TallerLatinoamericano deEvolución Molecular,22 de Junio al 3 deJulio del 2009. CCG-UNAM, México
David Gernandt 85
Parsimonia e inconsistencia: otrasconsideraciones
¿Es consistencia el criterio más relevante para escogerentre métodos?
¿Las condiciones que causan atracción de ramaslargas son comunes?
Parsimonia se parece a verosimilitud bajo muchascondiciones, pero mucho más rápido y más simplede entender y explicar
top related