genetica di popolazioni 1
TRANSCRIPT
Genetica di popolazioni
Guido BarbujaniDip. Scienze della Vita e Biotecnologie Università di Ferrara [email protected]
Obiettivi del corso:
Capire le basi genetiche dell’evoluzione
Arrivare a porsi domande scientificamente corrette
Arrivare a poter leggere criticamente un articolo
POWERPOINT: http://utenti.unife.it/guido.barbujani/index.php?lng=it&p=5
ESERCIZI: http://darwin.eeb.uconn.edu/simulations/simulations.html
TESTO ADOTTATOJ.H. Relethford (2013) Genetica delle popolazioni umane. Ambrosiana, 36 Euro.
Conner & Hartl. Elementi di Genetica ecologica, Piccin
Frankham, Ballou, Briscoe. Fondamenti di Genetica della
conservazione, Zanichelli
Hartl & Clark. Principles of poplation genetics. Sinauer
ALCUNE DOMANDE IMPORTANTI
• Con che frequenza troviamo unioni consanguinee nelle popolazioni, e quali effetti hanno?
• Cosa ci dice la diversità genetica riguardo alla storia delle diverse specie?
• Come possiamo utilizzare dati genetici per ricostruire la storia delle migrazioni?
• Perché alcune popolazioni presentano frequenze elevate di alleli patologici?
• Perché alcune piccole popolazioni sono così diverse da quelle vicine?
Cose da ricordare, per cominciare
1. Cos’è un gene, un allele, un aplotipo2. Com’è fatto il DNA3. Com’è fatto un gene Eucariote4. Com’è fatto un gene procariote5. Com’è la struttura dei geni (siti codificanti, siti di
regolazione, introni, esoni)6. Come funzionano i geni
Cosa vuol dire che due geni sono associati?
Se le coppie A,a e B,b sono associate che gameti produce il genotipo AaBb e il genotipo Aa BB?
Se AaBb si incrocia con AaBb che tipi di figli può avere?
Se AaBb si incrocia con aabb che tipi di figli può avere?
Cosa si intende per locus genico?
Cosa si intende per allele?
Cosa vuol dire che due geni sono indipendenti?
Se le coppie A,a e B,b sono indipendenti che gameti produce il genotipo AaBb? E il genotipo Aa BB?
Che cos’è il crossing-over?
Se c’è crossing-over tra due geni associati, gli effetti del crossing-over sono evidenziabili nei gameti?
In che modo i geni codificano le proteine?
Cosa significa dire che i gameti sono aploidi?
Qual è la differenza tra meiosi e mitosi?
Che differenza c’è tra popolazione e specie?
Quanti alleli di un dato locus ci sono in una popolazione?
Specie diverse con lo stesso numero di cromosomi si possono incrociare?
Programma del corso
1. Diversità genetica
2. Equilibrio di Hardy-Weinberg
3. Inbreeding
4. Linkage disequilibrium
5. Mutazione
6. Deriva genetica
7. Flusso genico e varianze genetiche
8. Selezione
9. Mantenimento dei polimorfismi e teoria neutrale
10. Introduzione alla teoria coalescente
11. Struttura e storia della popolazione umana
+ Lettura critica di articoli
Programma del corso
1. Diversità genetica
2. Equilibrio di Hardy-Weinberg
3. Inbreeding
4. Linkage disequilibrium
5. Mutazione
6. Deriva genetica
7. Flusso genico e varianze genetiche
8. Selezione
9. Mantenimento dei polimorfismi e teoria neutrale
10. Introduzione alla teoria coalescente
11. Struttura e storia della popolazione umana
+ Lettura critica di articoli
Conosciamo 1,6 milioni di specie, stimiamo che ne esistano >10 milioni
Prima di tutto: non c’è genetica senza variabilità
Variabilità morfologica
1. Variabilità morfologica2. Variabilità serologica3. Variabilità proteica4. Variabilità del DNA
4.1. Varianti di singolo nucleotide: Single-Nucleotide Polymorphisms (SNP)4.2. Varianti di lunghezza: Inserzioni/delezioni (Indel), Variable Number of Tandem Repeats (VNTR), Short Tandem Repeats (STR)4.3. Varianti strutturali: Copy-Number Variation (CNV)
Quanto DNA in una cellula?
Nell’uomo: 6 miliardi di paia di basi nei 46 cromosomi1 base ≈ 0,8 mμ6 miliardi di basi ≈ 5 m di DNA in 5-20 μ
5-20 μ
Quanto DNA in una cellula?
6 miliardi di paia di basi1 base ≈ 0,8 mμ6 miliardi di basi ≈ 5 m di DNA in 5-20 μ
Foglio A4, 60 battute per riga. 30 righe = 1800 basi su ogni foglio, due facciate ≈ 2000 basi
Se 100 fogli = 1 cm6 miliardi di paia di basi ≈ 15000 cm = 150 m
Variabilità genetica: Proteine, Test serologici
J.B.S. Haldane: Frequenza dell’allele AB0*B in Europa
Variabilità genetica: Proteine, sequenze amminoacidiche
Variabilità genetica: Sequenze di DNA
Applicazioni: Confronti fra sequenze in casi forensi
Applicazioni: Genetic variation in Arabidopsis thaliana: SNPsNordborg et al., 2005 PLoS Biology
Some human genome statisticsTotal size 3 190 491 286 bp (male, haploid) [was 3 283 984 159 in Dec. 2011]N of protein-coding genes 21 224 [were 20 442]N of RNA genes 15 952N of pseudogenes 14 427N of gene exons 679 045N of gene transcripts 194 015N of short variants 52 126 039 (+ 13.4 million: Lachance et al. 2012)N of structural variants 6 303 392
From Ensembl Release 68, July 2012
Nucleotide differences with chimp 1.5 %Structural differences with chimp 4%Human genes missing in chimp 60 (expressed mainly in cerebral cortex and testes)
From Wu et al. (2011) PLoS Genet
Some human genome statistics
I geni trascritti in proteine rappresentano negli Eucarioti fra il 5% e il 10% del genoma
Parte del restante 90-95% non è funzionale (junk DNA), ma un’altra parte contiene importanti siti di regolazione
Human-mouse alignment
Human-chimp alignment
Tipi di polimorfismo studiati nel DNA
1. Single Nucleotide Polymorphism: SNP2. Inserzione/delezione3. Variazione del numero di copie: Indel, STR, VNTR, 4. Variazione strutturale: CNV
Tipi di polimorfismo studiati nel DNA
1. SNP
2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010)2012: Almeno 65 milioni di SNPs nel genoma umano (Lachance et al. 2012)
Tipi di polimorfismo studiati nel DNA
1. SNP: Restrizione
Tipi di polimorfismo studiati nel DNA
1. SNP: Fasi preparatorie al sequenziamento
Tipi di polimorfismo studiati nel DNA
1. SNP: Sequenziamento
Qual è il vantaggio del sequenziamento rispetto alla restrizione?
Tipi di polimorfismo studiati nel DNA
1. SNP: Costruzione di aplotipi
Tipi di polimorfismo studiati nel DNA
1. SNP: Effetti fenotipici
Cioè in regioni: regolatrici codificanti intergeniche introniche
Con sostituzioni: nonsinonime sinonime
Tipi di polimorfismo studiati nel DNA
1. SNP: Effetti fenotipici
Tipi di polimorfismo studiati nel DNA
2. Inserzione/delezione: Indel
Tipi di polimorfismo studiati nel DNA
2. Inserzione/delezione: Indel
Pereira et al. Genet. Mol. Res. 5 (1): 63-71 (2006)
Tipi di polimorfismo studiati nel DNA
2. Inserzione/delezione: Indel, inserzione di un retrovirus
Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: STR
Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: STR
Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: STR
Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: STR & VNTR
Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: CNV
Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: CNV
An ~11kb deletion on chromosome 8 revealed by ultra-high resolution CGH. Blue lines: individuals with two copies. Red line: individual with zero copies.
Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: CNV
La CGH (Comparative Genomic Hybridization) rileva variazioni del numero di copie di geni.
Competizione per il legame su cromosomi in metafase di due DNA genomici marcati con fluorocromi diversi. Un DNA è estratto dal paziente in esame mentre l’altro DNA è un pool di DNA genomico di riferimento.
Si legherà in proporzione più DNA se maggiore sarà il numero di copie presenti in quel locus rispetto al numero di copie presenti nel DNA genomico di controllo. Viceversa se ne legherà meno se minore sarà il numero di copie presenti in quel locus rispetto al numero di copie presenti nel DNA genomico di controllo.
3. Variazione del numero di copie: CNV
Marques-Bonet et al. (2009) Trends in Genetics 25:443-454
Average mutation rates for different polymorphisms(per locus per generation)
VNTR 10-1 – 10-2
STR 10-2 – 10-4
SNPs 10-6 – 10-8
Indel (retrovirus) 10-10 – 10-11
CNV ?
In the mitochondrial DNA hypervariable region, up to 5 x 10-5 per site per generation
Quand’è che una popolazione può dirsi variabile?
A B
Misure di diversità genetica
• N di alleli• Eterozigosi osservata:
Ho = N genotipi eteroz./N genotipi totali
• Eterozigosi attesa:
H = 1 –Σ pi2
(la frazione di individui che ci si aspetta siano eterozigoti a un gene sconosciuto)
Quand’è che una popolazione può dirsi variabile?
A BN alleli = 5 N alleli = 2HO = 0.4 HO = 0.6H = 0.35 H = 0.5
Quando il genotipo individuale è difficile da prevedere
Quand’è che una popolazione può dirsi variabile?
• Quando molti siti del DNA sono variabili
diversità nucleotidica:
π = N siti polimorfici / N totale siti• Quando ci sono grandi differenze molecolari fra I suoi membri
mismatch medio:
k = Σ dij / [N (N-1) / 2]
Il mismatch è il numero di sostituzioni fra coppie di individui
TCTAGA
CCTAGA CCTAGG
CTTAGA CTTAAA
1 2
3
1
1
2 21
2 2
Σ dij = 17 k = 1.7
Un’applicazione: variabilità STR in popolazioni di lupi scandinavi (Flagstad et al. 2003)
N alleli HO H
1829-1889 5.0 0.66 0.74
1890-1939 4.4 0.61 0.68
1940-1980 3.1 0.45 0.52
Finlandia 4.9 0.69 0.72
Quanto polimorfismo c’è nel DNA della nostra specie?
Goldman et al. (1987) PNAS
Livelli di diversità fra
uomo e scimpanzè
Tempi di dissociazione indicano una
differenza pari all’1.76%
(Sibley & Ahlquist, 1984)
Livelli di polimorfismo nell’uomo: SNP
35 milioni di SNP fra uomo e scimpanzè. Su un totale di 3 miliardi di basi (genoma aploide) 1.23% (Chimpanzee Genome Sequencing Consortium, 2005)
Di questi SNP, 1.06% fissati fra specie 0.17% polimorfici nell’uomo
Kaessmann et al. (2001)
Livelli di polimorfismo nell’uomo: Indel
Origine della duplicazione
Siti di inserzione
Marquès-Bonet et al. (2009)
Livelli di polimorfismo nell’uomo: genomi completi
Nel 2010 erano 14 i genomi interamente sequenziati (6
miliardi di paia di basi)
Africa del sud
Americani bianchi
Yoruba
Asiatici
Polimorfici almeno lo 0.13% dei siti
Nel 2010 erano 14 i genomi interamente sequenziati (6 miliardi di paia di basi)
Nel 2014 i genomi umani interamente sequenziati sono migliaia
PopulationNumber of
Individual DNA SamplesAfrican Caribbean in Barbados [ACB] 79
African Ancestry in SW USA [ASW] 62
British From England and Scotland [GBR] 100
Chinese Dai in Xishuangbanna, China [CDX] 100
Colombian in Medellín, Colombia [CLM] 105
Finnish in Finland [FIN] 100
Han Chinese in Beijing, China [CHB] 120Han Chinese South [CHS] 150Iberian Populations in Spain [IBS] 150Japanese in Tokyo, Japan [JPT] 120
Kinh in Ho Chi Minh City, Vietnam [KHV] 100
Luhya in Webuye, Kenya [LWK] 120
Mexican Ancestry in Los Angeles [MXL] 71
Peruvian in Lima Peru [PEL] 105Puerto Rican in Puerto Rico [PUR] 105Toscani in Italia [TSI] 114
Yoruba in Ibadan, Nigeria [YRI] 62
Livelli di polimorfismo nell’uomo: genomi completi
N of markers
Samples FST Reference
599,356 SNPs
209 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba
0.13 Weir et al. 2005
1,034,741 SNPs
71 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba
0.10 Weir et al. 2005
1,007,329 SNPs
269 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba
0.12 International HapMap Consortium 2005
443,434 SNPs
3845 worldwide distributed individuals 0.052 Auton et al. 2009
2,841,354 SNPs
210 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba
0.11 Barreiro et al. 2008
243,855 SNPs
554 individuals from 27 worldwide populations 0.123 Xing et al. 2009
100 Alu insertions
710 individuals from 23 worldwide populations 0.095 Watkins et al. 2008
67 CNVs 270 individuals from 4 populations with ancestry in Europe, Africa or Asia
0.11 Redon et al. 2006
Le stime genomiche di FST per la popolazione umana globale sono ∼ 0.12
Le popolazioni umane esprimono ∼ 12% della varianza massima possibile, date le loro frequenze alleliche
100%
100%100%
I membri della nostra comunità sono solo un po’ più simili a noi dei membri di comunità molto lontane
88%88%
88%
Cosa vuol dire?
Due persone dello stesso continente possono essere
geneticamente più distanti di persone di
continenti diversi.
In the 117 megabases (Mb) of sequenced exome-containing intervals, the average rate of nucleotide difference between a pair of the Bushmen was 1.2 per kb, compared to an
average of 1.0 per kb between a European and Asian individual. Schuster et al. (2010)
In media, ci sono differenze più grandi fra due africani che fra europei e asiatici
Nota beneLa variabilità interna di una popolazione è solo uno degli
aspetti della variabilità genetica:
Variabilità tra individui della stessa popolazione
Variabilità tra individui di popolazioni diverse
Variabilità tra individui di gruppi di popolazioni diverse
eccetera
PS: Cos’è una popolazione?
Hendrick: un gruppo di individui che si accoppiano e coesistono nel tempo e nello spazio
In pratica, si usano come unità operative di analisi gruppi di individui localizzati nello spazio, che spesso hanno in comune vari tratti culturali, come mezzi di sussistenza, lingua, casta (in India), religione.
La scelta dell’unità operativa di analisi dipende spesso (a) dalla domanda scientifica che ci si pone e (b) dalla effettiva disponibilità di dati
Riassunto• La genetica di popolazioni è un ramo della genetica, e quindi si
occupa di studiare la variabilità• Si può descrivere la variabilità o diversità genetica a partire dal
fenotipo (morfologia o proteina) o dal genotipo (DNA)• La diversità del DNA è dovuta a polimorfismi di singolo nucleotide
(SNP), alla presenza di elementi ripetuti (STR e VNTR) e alla presenza di delezioni, inserzioni o duplicazioni (CNV)
• Per quantificare la diversità genetica si ricorre a statistiche, fra cui: (1) numero di alleli; (2) eterozigosi osservata; (3) eterozigosi attesa; (4) polimorfismo nucleotidico; (5) differenze a coppie o mismatch