t. bayes, phil. trans. roy. soc., 330 (1763). bayesian inference of phylogeny p(ti|s) probability of...

Post on 28-Jan-2016

213 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

T. Bayes, Phil. Trans. Roy. Soc., 330 (1763).

Bayesian Inference of Phylogeny

T

TipTiSp

TipTiSpSTip

)()(

)()()(

Ι

ΙΙ

p(Ti|S) probability of the tree Ti given the sequence data Sp(S|Ti) probability or likelihood of the data S given tree Ti

p(Ti) prior probability of Ti

“The denominator sums the probabilities over all possible trees”

ESTIMACION BAYESIANA• Inferencias están basadas en la

probabilidad de distribución posterior de un parámetro.

• La unión de las probabilidades de todos los parámetros son calculados.

• Las probabilidades están basadas en algún modelo (esperado a priori), luego de aprender algo de los datos.

ESTIMACION BAYESIANA

DADOS

ESTIMACION BAYESIANA

• ¿Cuál es la probabilidad de tomar un dado trucado?

• Respuesta :1/10.

• Esta número representa la probabilidad a priori de tomar un dado sesgado.

ESTIMACION BAYESIANA

Supongamos ahora que otra persona toma un par de dados de la caja y los tira.

Resultando:

¿Podemos creer que este resultado esta sesgado?

Dos aproximaciones: Maximum Likelihood e Inferencia Bayesiana.

PROBABILIDADES

OBSERVACION NORMALES SESGADOS

PR

PR

NORM

SESG

PROBABILIDADES

ESTIMACION BAYESIANA

Pr [Sesgados

INFERENCIA BAYESIANA

ESTIMACION BAYESIANA

11 44

posterior

a priori

Probabilidad a posteriori

Likelihood Probabilidad a priori

Σ de todas las probabilidades a posteriori

Integración de todas las posibles combinaciones de largo de ramas y modelos de sustitución nucleotídica.

INFERIR UNA FILOGENIA

POSIBLES FILOGENIAS

Arboles equiprobables

Proporcional a observaciones: supuestos ej. alineamiento

Combinación: probabilidades a priori y Likelihood

ALINEAMIENTO

Estimación de las probabilidades a posteriori : ¿Cómo aproximarse?

• Calcular esta probabilidad implica: involucrar todos los árboles posibles….para cada árbol se debe integrar sobre todas las combinaciones de largo de rama y modelos de sustitución nucleotídica.

(IMPOSIBLE ANALÍTICAMENTE!!!) • Por necesidad la solución debe ser aproximada

• Método de Montecarlo

Monte Carlo y cadenas Markovianas (MCMC)

• MCMC trabaja del siguiente modo:• a) Comienza una cadena markoviana con un

árbol ya sea 1) elegido al azar o 2) elegido por el investigador.

• b) Un nuevo árbol es propuesto….el proceso de cambio del arbol 1 al 2 debe satisfacer las siguientes condiciones:

1) El mecanismo debe ser estocástico; 2) cada arbol posible debe ser obtenido por aplicaciones repetidas del mismo mecanismo y 3) la cadena debe ser aperiodica.

MARKOV CHAIN MONTE CARLO (MCMC)

At each step in the chain a new tree is proposed by altering the At each step in the chain a new tree is proposed by altering the topology, or by changing branch lengths or the parameters of the topology, or by changing branch lengths or the parameters of the

model of sequence evolution.model of sequence evolution.

The Metropolis-Hastings algorithm is then used to accept or reject The Metropolis-Hastings algorithm is then used to accept or reject the new tree.the new tree.

• Involucra correr algunas cadenas independientemente.

• La primera cadena que se cuenta (cold chain) el resto se denomina cadenas accesorias (heated chain).

• Saltos son intentados al azar entre dos cadenas distintas.

• Se necesita correr varios análisis independientes para confirmar convergencias.

METROPOLIS-COUPLED MARKOV CHAIN MONTE CARLO (MCMCMC o MC3)

Resultado de esta búsqueda se obtiene un tercer término para la estimación de las probabilidades a posteriori (Proposal Ratio o Término de Hasting)

INFERENCIA FILOGENÉTICA BAYESIANA

Phylogenetic tree

DNA Data

Evolutionary modelLikelihood

Prior probability

Posterior prob.

MCMC

Starting treeProposal

A sequence of Samples

inferencia

Approximate the distribution

MrBayes: Bayesian Inference of Phylogeny

MrBayes is a program for Bayesian inference of phylogeny using Markov chain Monte Carlo methods. Avaialble for Mac, PC, and Unix.

Métodos filogenéticos más usados

Data set

Algorithm

Algorithmicmethod

Optimization method

Distance matrix Character data

UPGMA

Neighbor-join

Fitch-Margolish

StatisticalSupported

Maximum Parsimony

MaximumLikelihood

Bayesian Methods

Search Strategy

Greedy search

Divide &Conquer

Stochastic search

DCM, HGT, Quartet

GA, SAMCMC

ExhaustiveBranch & Bound

Exact search

Stepwise additionGlobal arrangementStar decomposition

Mapping characters onto phylogenies

Mapping Uncertainty

parsimony ML

Bayesian

Phylogenetic and Mapping Uncertainty

top related