a genome scan method to identify selected loci : a bayesian perspective. matthieu foll 28 aout 2008...
TRANSCRIPT
A genome scan method to identify selected loci : A Bayesian perspective.
Matthieu Foll 28 aout 2008Journées MAS
2
Environnement
Migration
Taille efficace
Adaptation locale
Différentiation génétique
Dérive
Sélection naturelle
Fitness
Quel facteur ?
Intensité ?
Quel facteur ?
Intensité ?Quel gène ?
L’adaptation locale
3
Environnement
Migration
Taille efficace
Adaptation locale
Différentiation génétique
Dérive
Sélection naturelle
Fitness
Quel facteur ?
Intensité ?
Quel facteur ?
Intensité ?Quel gène ?
L’adaptation locale
Mesurer les variations génétiques• « La variation, qu’elle qu’en soit la cause, est le
phénomène essentiel de l’évolution » William Bateson
• Variation des fréquences alléliques• Outils :
▫Statistiques bayésiennes▫Marqueurs moléculaires▫Génétique des populations
4
L’ile et le continent
5
p
p
p ~ Beta(θp, θ(1-p))
θ=4NmA de fréquence p a de fréquen 1- p
FST=1/(1+θ)Probabilité que deux gènes tirés aléatoirementdans une population aient un ancêtre commun dans celle-ci
Sewall Wright, 1931
6
Avec plusieurs iles :
7
p
p1 p2 pJ…
Avec plusieurs allèles :Beta Dirichlet
Sans continent, avec beaucoup d’iles :
8
p4
p2
p3
p1
FST 1
FST 3
FST 4
FST 2
p
Estimer les fréquences alléliques
•Dans chaque population j :• Deux allèles : A de fréquence pj et a 1-
pj
• On prélève nj allèles aléatoirement : épreuves de Bernoulli
• Le nombre total de A est une loi binomiale de paramètres nj et pj
• •
9
nj
pjp
rob
ab
ilit
é
nj pj
•Cas multi-allélique : A1, A2… Ak
▫Chaque tirage peut donner k différents allèles
▫La distribution binomiale devient « multinomiale »
10
Le modèle complet :
11
n1
p1
n2
p2
nJ
pJ
…
…
p
FST 1
FST 2 FST
J
Multinomial
Dirichlet
N
pFST
Dirichlet-Multinomial
12
Environnement
Migration
Taille efficace
Adaptation locale
Différentiation génétique
Dérive
Sélection naturelle
Fitness
L’adaptation locale
Identifier la sélection
•Force neutre : influence tous les marqueurs
•Force adaptative : influence certains marqueurs▫FST plus élevé : sélection directionnelle
▫FST plus faible : sélection balancée
•On peut séparer ces effets en posant (Beaumont et Balding 2004) :
13
Les améliorations :
•Pour chaque locus i on propose le modèle neutre alternatif (αi=0)
•Sauts réversibles pour estimer la probabilité que chaque locus soit soumis à la sélection
•Extension aux marqueurs dominants
14
Foll & Gaggiotti 2008 (in press)
Les AFLP : un marqueur dominant•Détecte la présence d’une bande d’une
longueur donnée chez un individu•Pas de différence détectable si un individu
possède 2 fois la même bande (homozygote)▫Présence [A] = AA ou Aa▫Absence [a] = aa
15
Les marqueurs AFLP •Comment estimer les fréquences
alléliques ?•Hardy-Weinberg : f([a])=f(a)²=q²
▫Hypothèses restrictives•Prise en compte de la
consanguinité :▫f([a])=f(aa)
=q² (1-FIS)+q FIS
AA: p²
Aa: 2pq
aa: q²
AA: p
aa: q
(1-FIS) FIS
Outbred
Inbred
16
Simulations :•10 scénarios avec 1000
marqueurs chacun•SNP AFLP •Microsatellites très
performants
17
Données humaine HGDP
•53 populations, 1056 individus•Forte violation du modèle en iles supposé•Simulations de l’expansion spatiale : 4-5%
de faux positifs pour p>0.99•Sur 560 marqueurs : 15% sous sélection
directionnelle, 8% sous sélection balancée
18
Résumé•Fst = indicateur de la différentiation locale•Séparation variation neutre / adaptative•Modèle bayesien en iles, plutôt robuste•Avoir plusieurs populations : permet de
détecter de la sélection balancée•Utilisable pour des espèces non-modèles
(AFLP)
•Merci : Oscar Gaggiotti, Mark Beaumont
19