che cosa abbiamo imparato la scorsa lezione: fattori...
TRANSCRIPT
Che cosa abbiamo imparato la scorsa
lezione:
Fattori che determinano e limitano la
variabilità umana: mutazioni, deriva
genetica, migrazioni, selezioni, sistema di
accoppiamento
Che cosa impareremo oggi:
Come studiamo la variabilità molecolare: i
polimorfismi SNPs
La variabilità genetica a livello molecolare
Singole sost. nucleotidiche
Piccole inserzioni/delezioni
Microsatelliti
Minisatelliti
Altri VNTR
Inserzioni di elementi retrotrasponibili
Varianti strutturali microscopiche e submicroscopiche
Variabilità nel numero di cromosomi
Variabilità nel numero di ploidia
Generalmente non
polimorfici
(frequenza < 0.01%)
La variabilità genetica a livello molecolare
Dove si trovano le mutazioni?
Alcune mutazioni sono distribuite in
modo casuale nei cromosomi, altre
presentano una distribuzione non
omogenea
La variabilità genetica a livello molecolare
Tasso di mutazione
I differenti tipi di mutazione
differiscono circa il loro tasso di
mutazione per diversi ordini di
grandezza
DNA a sequenze ripetute
•sequenze distribuite a intervalli
regolari (ripetizioni intersperse),
•sequenze raggruppate insieme
(ripetizioni in Tandem)
Polimorfismi del DNA
Mutazioni di singole paia di basi
Inserzioni/delezioni
SNPs (polimorfismi di singoli nucleotidi)
gli SNPs comprendono gli RSP:
RSP (restriction site polymorphism) chegenerano RFLP (restriction fragment length polymorphism)
Polimorfismi del DNA
• VNTRs (variable number of tandem repeat) (MINIsatelliti)
• STRs (short tandem repeat) (MICROsatelliti)
Tipi di polimorfismo studiati nel DNA
1. SNP
2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010)2014: Almeno 67 milioni di SNPs nel genoma umano (Ensemble Rel. 75)
1. SNPs
SNPs
Transizioni
Tranversioni
Le transizioni sono 2 volte più
frequenti delle transversioni
E’ la forma di variazione del DNA più comune.
Confrontando due cromosomi umani omologhi, si osserverà una SNP
ogni mille basi
Confrontando una popolazione di cromosomi omologhi, si osserverà uno
SNP ogni 200 basi.
Le SNPs sono 10 volte più frequenti delle ins/del
Le mutazioni vengono distinte in base ai loro effetti sulla
lettura della tripletta che codifica un aminoacido:
Mutazioni missenso: cambiamento aminoacido;
Mutazioni nonsenso: cambiamento da codone che
specifica per aminoacido a codone di stop;
Mutazione neutra: cambiamento di un codone il cui
aminoacido non altera la funzionalità proteica;
Mutazione silente: cambiamento codone, ma non
dell’aminoacido (degenerazione del codice);
Mutazione frameshift: origina da inserzioni o delezioni:
alterazione schema di lettura del DNA.
Base substitution can be caused by chemical and physical
mutagens
Spontaneous, endogenous chemical processes going on in
all cells that lead to base modification or loss (Deamination
(loss of NH2): cytosine to uracil)
DNA repair processes can fix much genome damage
Repair system:Mismatch repair, Base-excision repair
Il tasso di mutazione è differente nelle diverse classi di SNPs ed è
importante nelle genetica evolutiva
Type of mutation Mutation rate
All SNPs 1,20x10-8
Transitions 8,15x10-9
Transitions at CpG 1.12x10-7
Transversions 3.87x10-9
Transversions at CpG 9.59x10-9
Il dinucleotide CpG è un hotspot di mutazione
SNP Distribution
SNP Distribution is not uniform for any of the three
categories:
– Over a complete genome (1/3 in coding, 2/3 in non-coding).
– Over all the chromosomes (fewer SNPs in sex chromosomes).
– Over a single chromosome (SNPs often concentrated around a
specific location).
Tipi di polimorfismi studiati nel DNA
1. SNP: Costruzione di aplotipi
Nomenclatura SNPs
Esempio:
546A>T (cDNA)
Gln78His (proteina)
rs2306220
Database per SNPs
www.ncbi.nlm.gov (dbSNP)
1000 genome
…
dbSNP contiene oltre 53 milioni di SNPs umani
MAF almeno del 5%
Come evidenziare il polimorfismo?
RFLP= restriction fragment length polymorphism
Enzimi di Restrizione
Sono endonucleasi di tipo II (classe delle idrolasi) in grado di tagliare
i legami fosfodiesterei del DNA per dare frammenti specifici.
L’attività endonucleasica e la funzione di metilazione del DNA sono
separate. Non hanno bisogno di ATP.
Endonucleasi di tipo I e III: sono
enzimi bifunzionali e necessitano di
ATP come coenzima.
Tipo I: taglio casuale
Tipo III: taglio in siti
specifici (24-26 coppie
di basi a valle del sito di
riconoscimento).
A volte la mutazione patogena puo’ abolire o creare direttamente un sito
di restrizione specifico (RFLP)
Mutazione che determina l’anemia falciforme, che distrugge un sito MstII e genera un RFLP specifico per la malattia
MstII: CCTNAGG
Lewin, IL GENE VIII, Zanichelli
editore S.p.A. Copyright © 2006
sito di restrizione
Gli enzimi di restrizione possono generare diversi tipi di estremità: coesive (sticky ends) e piatte (blunt ends)
1 2 3 4 5 6 7 8 9 10 1112131415 M
0.7 kb
0.4 kb
0.75 kb
1.25 kb
1.1 kb
0.4kb 0.7kb
BamHI* (Bacillus amyloliquefaciens)
Separazione su gel di agarosio dei frammenti originati dalla
digestione enzimatica del prodotto di PCR del DNA
proveniente da 15 diversi individui
I soggetti 1, 2, 6-10, 12,
14 e 15 sono omozigoti
per la presenza del sito
I soggetti 3, 5 e 11
sono eterozigoti per la
presenza/assenza del
sito
I soggetti 4 e 13 sono
omozigoti per
l’assenza del sito
Se le SNPs non si trovano su un sito di restrizione si
possono esaminare con:
•Sequenziamento
•HPLC (Denaturing high-performance liquid
chromatography)
•Microarray
SNPs: sequenziamento
1. SNP: Sequenziamento
Elettroferogramma
generato da un
sequenziatore automatico
N
Sito di
eterozigosi
C/G
individuo
omozigote
individuo
eterozigote
Rilevazione delle mutazioni
mediante DHPLC
Essa si basa sulla differente velocità
di migrazione, in un mezzo simile ad
un gel quale è la colonna HPLC, per
gli eteroduplex e omoduplex. Questi
duplex si formano quando un
frammento amplificato di DNA
mutato ed uno non mutato vengono
denaturati termicamente e lasciati
ricombinare (mismatch).
Una qualsiasi variazione tra la
molecola originale (wild type) e
quella
mutata porta alla formazione di un
eteroduplex (combinazione di due
catene di DNA a singola catena non
perfettamente corrispondenti,
caratterizzata dalla presenza di una
"bolla" dove c'è la mutazione).
L'eteroduplex si comporta cromatograficamente
in modo differente (solitamente più veloce)
La presenza di una mutazione si evidenzia sotto
forma di picchi ulteriori rispetto al "wild"; il grande
vantaggio per il ricercatore è che - pur non
caratterizzando la mutazione (cioè non viene
definito come è stata modificata la sequenza) - la
DHPLC è in grado di rivelarne la presenza
all'interno del frammento analizzato
Gli eteroduplex migrano
più lentamente rispetto
agli omoduplex
Tessuto della prostata,
normaleTessuto della prostata,
tumorale
Un microarray è un supporto solido
(vetro, silice o plastica) sul quale
sono stati posizionati diverse
migliaia di cDNA (sonde) in spot
separati. Ciascuno spot rappresenta
un gene, in quanto contiene
numerose copie di un cDNA
corrispondente a tale gene.
I microarrays(comunemente conosciuto come gene chip, chip
a DNA, biochip o matrici ad alta densità
In questo esempio i cDNA
sono stati posizionati su di un
vetrino, simile ai normali
vetrini usati per l’istologia.
I microarray sfruttano una tecnica di ibridazione inversa,
che consiste nel fissare tutti i segmenti di DNA (detti
probe o sonda) su un supporto e nel marcare invece
l'acido nucleico che vogliamo identificare (detto target). È
una tecnica che è stata sviluppata negli anni '90 e oggi
permette l'analisi dell'espressione genica monitorando in
una sola volta gli RNA prodotti da migliaia di geni.
DNA microarray: una collezione di microscopiche sonde (probe)
Ordinate
Miniaturizzate
Immobilizzate su una superficie solida (attualmente vetro)
I probe possono essere attaccati al substrato mediante:
-Legame diretto, fisico o chimico
-Legame indiretto, mediante molecole linker
•Risoluzione di 0.7 Kb
•1.8 milioni SNPs e oligonucleotidi che coprono regioni povere di SNPs combinati insieme
Affymetrix Genome-Wide Human SNP Array 6.0
Intensità di segnale rilevata da uno scanner e i dati elaborati da un software
PROTOCOLLO
Affimetrix 6.0
E’ possibile avere 500,000 probe in uno spazio di 1.28 cm2
Ogni singolo probe è costituito da milioni di oligonucleotidi identici
Il nuovo Affymetrix Genome-Wide Human SNP Array 6.0 caratterizza 1.8
milioni di marcatori genetici, inclusi più di 906,600 single nucleotide
polymorphisms (SNPs) e più di 946,000 probes (sonde) per
l’individuazione di copy number variation (CNV).
La disponibilità di milioni di SNPs fornisce una mappa di alta densità lungo
tutto il genoma, la quale può raggiungere adeguato potere per investigare
varianti genomiche associate con malattie multifattoriali.
I microarry rappresentano un sistema di analisi che velocizza
considerevolmente l’esplorazione genomica permettendo, infatti, di
esaminare contemporaneamente l’espressione di migliaia di geni o un
ampio numero di polimorfismi genetici.
Array di oligonucleotidi ad alta densitàIbridizzazione
La scannerizzazione del
chip ci fornisce
un’immagine in cui il
grado di ibridizzazione
viene evidenziato da una
diversa intensità di
emissione nel rosso. La
rilevazione dell’immagine
infatti è possibile grazie al
legame alla biotina di un
composto fluorescente
(streptavidina-ficoeritrina)
Array di oligonucleotidi ad alta densitàIbridizzazione
A differenza degli
array a DNA
spottato, il sistema
Affimetrix prevede
l’ibridizzazione di un
singolo campione
su ogni genechip
il microarray viene esposto ad una
sorgente di luce laser.
Gli spettri di emissione vengono
quindi raccolti da uno scanner e le
immagini monocromatiche indicanti i
livelli diversi di espressione genica
vengono pseudocolorate da un
software di acquisizione d’immagine.
De Risi J.L. et al Science 1997; 278:680-686.
Heller R.A. et al PNAS 1997; 94:2150-2155.
Principali applicazioni dei microarray
cDNA microarray: per misurare i livelli di espressione di determinati
geni
microarray SNP (“Single Nucleotide Polymorphism”) e array di
mutazione: per la genotipizzazione e identificazione di polimorfismi
(SNPs) in una popolazione.
microarray CGH (“Comparative Genomic Hybridization”): per
osservare perdite o guadagni di materiale genomico o un cambiamento
nel numero di copie di un gene particolare coinvolto in una malattia.
Altre tecnologie:
Sequenom
NGS: whole exome sequencing e whole genome
sequencing
SNPs: aplotipo1. SNP: Restrizione
The likelihood of recombination between 2 loci
depends on their relative positions
But it is not simple physical distance…
The tendency of particular alleles to be co-
inherited with neighbouring loci is called Linkage
Disequilibrium (LD)
(2 allele is found togheter more often than
expected)
International HapMap Project
•Progetto iniziato nel 2002
•Si propone di “catalogare” le varianti comuni
del DNA umano in una Mappa degli Aplotipi
•Analizzati 270 soggetti provenienti da
differenti gruppi etnici
obiettivo 1SNPs ogni 5Kb
Per un totale di 3.8 milioni di SNPs
http://hapmap.ncbi.nlm.nih.gov/
Sono stati trovati haplotype blocks and hotspot di ricombinazione
Hotspot (Myers motif). They are thought to be a binding site for
a meiosis-specific protein, wich acts to modify histone H3,
possibly trigging hotspot activity.
Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns of variation. Science.
CEPH panel
Illumina Bead Chip 650K (642,690)
N = 938genetic ancestry of each individual
individuals from the same population show similar ancestry proportions – population
structuring robust (confirmed also by PCA)
Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns of variation. Science.
maximum-likelihood tree
sub-saharan africa
middle east
europe
south/central asia
east asia
america
oceania
main result: confirmation of the Out of Africa
Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns of variation. Science.
Alcuni risultati
PCA: I e II componente
In nero
Ogliastra,
In rosso
Trexenta
e Sulcis
Polimorfismi del DNA: minisatelliti e microsatelliti
Allele A TACCAAGGTACACACACGGTACCATGG
Allele B TACCAAGGTACACACACACGGTACCATGG
Allele C TACCAAGGTACACACACACACGGTACCATGG
Allele D TACCAAGGTACACACACACACACGGTACCATGG
Allele A TACCAAGGTACGGACGGACGGACGGGGTACCATGG
Allele B TACCAAGGTACGGACGGACGGACGGACGGGGTACCATGG
Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: STR & VNTR
STRs (Short Tandem Repeats) e VNTR (Variable Number of Tandem Repeat)
Marcatori genetici molto utilizzati nel campo della genetica di popolazione e nel campo forense.
Gli STRs vengono classificati in base alla
lunghezza dell’unità ripetuta
dinucleotidi
trinucleotidi
Tetra, penta e esanucleotidi
I trinucleotidi, localizzati spesso negli esoni, posso essere la
causa di patologie
Scegliendo opportunamente 5 STR, la probabilità che essi risultino uguali in individui non imparentati è < 1/1012.
Il kit per il riconoscimento di individui (identifiler) usato in medicina forense è costituito da 15 STR tetranucleotidi:
HUMTH01, D21S22, D18S51, HUMVFA31, HUMFIBRA, D8S1179, HUMTPOX, HUMCSF1PO, D16S539, D7S820, D13S317, D5S818, D3S1358,
D19S433, D2S1338
Nomenclatura degli STR
Se il marcatore è parte di un gene, il nome del gene è usato per la designazione (TH01)
Se il marcatore si trova al di fuori di un gene, esso viene designato in base alla posizione cromosomica (D16S539):
D: DNA
16: cromosoma 16
S: sito
539: 539mo locus descritto sul cromosoma 16
Test di paternità
Frequenza e localizzazione VNTR e STR
Rappresentano il 5-10% del genoma eucariotico
Le classi più rappresentate sono le ripetizioni monomeriche e
dinucleotidi
Ad eccezione dei trinucleotidi sono localizzati in regioni non
codificanti del DNA
I VNTR si trovano prevalentemente nelle regioni sottostanti il
telomero;
Gli STR sono distribuiti in modo relativamente uniforme
all’interno del genoma; anche se gli esanucleotidi si sono stati
ritrovati più frequentemente nelle regioni telomeriche.
La variabilità genetica a livello molecolare2. microsatelliti o short tandem repeats (STRs)
I microsatelliti sono distribuiti in modo omogeneo nel genoma umano
La variabilità genetica a livello molecolare2. microsatelliti o short tandem repeats (STRs)
I microsatelliti possono essere perfetti, interrotti o composti e vengono ulteriormente
classificati in base alla lunghezza del motivo ripetuto (dinucleotide repeats,
trinucleotide repeats ecc..)
perfetti
interrotti
composti
Ruolo DNA satellite
DNA spazzatura?????
Partecipazione alla ricombinazione meiotica?
Ruolo nel ripiegamento della cromatina?
Siti di legame per specifiche proteine nucleari?
Origine del DNA satellite
•Scambio ineguale durate il crossing over meiotico
•Slittamento di due filamenti (stand slippage) durate la replicazione
Perché i microsatelliti sono così polimorfici?
L’elevato tasso di mutazione nei microsatelliti è dovuto a
scivolamento della polimerasi in replicazione
La variabilità genetica a livello molecolare2. microsatelliti o short tandem repeats (STRs)
•Tasso di mutazione molto elevato
•La mutazione avviene generalmente per
aumento o diminuzione di una singola
unità ripetitiva
•Mutazioni per aumento più frequenti di
mutazioni per diminuzione
•Il tasso di mutazione per ciascun
microsatellite è correlato con la lunghezza
dell’allele
Rosenberg et al., 2008. Genetic structure of human populations. Science.
test the correspondence of predefined groups with those inferred from individual multilocus genotypes
clustering method that identifies subgroups that have distinctive allele frequencies
CEPH panel; multiplex for 377 STRs
Rosenberg et al., 2008. Genetic structure of human populations. Science.
individuals from the same predefined population nearly always shared similar membership coefficient
world-level boundaries between major clusters mostly correspond to major physical barriers (oceans, Himalaya, Sahara)
Rosenberg et al., 2008. Genetic structure of human populations. Science.
STRUCTURE
efficiently detects isolated and homogeneous groups
Karitiana,
Brasile
Surui,
BrasileMaya,
Messico
Melanesia
Australia
Nuova
GuineaRep. Centro
Africana
Zaire
Gabon
Cina
CambogiaGiappone
Nord Italia
Nord Europa
Sardegna
Sicilia
Baschi
Corsica
Switzerland
Siracusa
Palermo
Ragusa
AgrigentoCaltanissetta
Messina
Catania
Egypt
Andalusia
Morocco
Catalonia
Basques
Poland
Alia
Hungary
Germany
Lombardy
TuscanyPortugal
Da: Genetic Analysis of a
Sicilian population using 15
STRs.
Calò C.M., Garofano L., Mameli
A., Pizzamiglio M., Vona G.
Human Biology, 75: 163-178;
2003
Stutter o Shadow Bands
Un problema da affrontare nell’analisi dei microsatelliti è la formazione, durante il processo di amplificazione, di prodotti aspecifici chiamati“stutter o shadowbands”
La formazione dei prodotti aspecifici è legata alla processività della Taq Polimerasi(Lawyer F. et al.PCR Methods Appl.,1993 May; 2 (4): 275-
287) piuttosto che alla struttura secondaria del DNA
Infatti l’utilizzo di una DNA polimerasi termostabile con un’alta processività può ridurre notevolmente la formazione di prodotti aspecifici
ELETTOFORETOGRAMMA
Stutter o Shadow Bands
Nel caso delle ripetizioni dinucleotidiche,la stutter band prevalente è di 2 bp più piccola rispetto al picco principale,con in più la formazione di statter bands di 4 e 6bp più piccole anche visibili(Murray V. et al. Nucleic AcidsRes,1993,21:2395-2398)
Questo comporta che per ciascun allele si abbia un pattern con più bande il che rende complicata l’interpretazione dei dati, in modo particolare per campioni di DNA che sono una miscela di due o più individui
La tendenza, adesso, è di utilizzare marcatori tri- o tetra-nucleotidici che danno risultati più evidenti
Sequenze ripetute sparse
•SINE (short interpersed repeated sequences): 100-500 bp
•LINE (long interspersed repeated sequences)
Conosciute come retrotrasposoni.
Trasposoni: frammenti di DNA che si spostano all’interno del
genoma.
Si distinguono 2 classi: LTR (con sequenze lunghe ripetute
terminali) e non LTR, tra queste ultime individuiamo:
DNA ripetitivo intersperso
Le singole unità ripetute non sono raggruppate ma sparse in più punti del genoma. Gli esempi più comuni sono le sequenze SINEs (Short Interspersed Nuclear Element) e LINEs (Long Interspersed Nuclear Element)
LINEsSono associate prevalentemente a DNA genomico ricco in A/Tperché tendono a posizionarsi in regioni del cromosoma povere di geni allo scopo di imporre il minimo impatto mutazionale al genoma.
SINEsSono associate prevalentemente a DNA genomico ricco in G/C. Perché? Sembra che tali sequenze svolgano una qualche funzione positiva per il genoma: esse sarebbero espresse in condizioni di stress ed i risultanti RNA legherebbero una particolare protein chinasi PKR e bloccherebbero la sua capacità di inattivare la traduzione.
Più frequenti nei Primati e quindi nell’uomo.
Famiglia SINE:
Polimorfismo di inserzione/delezione Alu
Si trovano negli introni e nelle regioni non tradotte
Presentano un’organizzazione dimerica: 2 sequenze
omologhe separate da una regione ricca di Adenina.
E 2 unità sono omologhe al gene 7 SL RNA da cui derivano
La mobilizzazione delle Alu all’interno del genoma è chiamata retrotrascrizione: movimento di materiale genetico da una posizione cromosomica ad un’altra, tramite un intermediario, la polimerasi III del RNA
Replicazione Alu: una copia rimane nel luogo originale (matrice) mentre l’altra si inserirà nella nuova posizione. Questo processo potrebbe rappresentare l’espansione degli elementi Alu nel genoma umano, ma i fattori che controllano la retrotrascrizione non sono ancora ben chiari.
Il fatto che le Alu, pur essendo localizzate in regioni non codificanti, sono state mantenute dalla selezione naturale, suggerisce l’ipotesi di una loro attività funzionale.
La famiglia degli elementi Alu sono suddivisi in un certo numero di sottofamiglie, caratterizzate da una serie gerarchica di mutazioni, questo ci permette di individuare sottofamiglie di differenti età.
Alu più antiche: PS (primate specific)
AS (antropoid specific)
CS (catarrine specific)
HS (human spcefic)
Le Alu più giovani sono rappresentate dalla sottofamiglia Y (Ya e Yb)
Identificazione e tipizzazione di polimorfismi Alu
•Identificazione: ricerca in database di
elementi Alu giovani (famiglia Alu Y),
che hanno una più elevata probabilità di
essere stati trasposti durante
l’evoluzione umana e quindi di essere
polimorfici.
•Tipizzazione: tramite PCR, con primers
che fiancheggiano il sito di inserzione
ed elettroforesi su gel d’agarosio.
•Sono i polimorfismi più facili da
analizzare
Copy Number Variations (CNVs)
Segmenti di DNA con estensione maggiore di 1 Kb presenti nel genoma con un
numero variabile di copie.
Contribuiscono:
• alle differenze fenotipiche tra gli individui
• alla patogenesi di malattie, sia mendeliane che multigeniche
Essendo noi diploidi (meta' del genoma ci viene dal padre e
meta' dalla madre), di ogni tratto di DNA o di ogni gene
abbiamo sempre un numero di copie pari a 2. Se ne abbiamo
3, 4, 5 (1, 2 3 copie in piu', rispettivamente), o 1 o zero, allora
abbiamo, per quel locus, una variazione del numero di copie.
Questa variabilita' insospettata della popolazione umana e'
stata giudicata come uno dei "breakthrough" (notizia bomba)
del 2007 da parte di Science.
Copy Number Variation (CNV)
Si è stimato che circa 360 MB di DNA sono soggette a copy number variation. Circa il 12% dell’intero genoma aploide
Essendo state trovate in individui normali, molte
di queste sembrano neutre. Pian piano, però, ha
preso corpo una lunga lista di malattie o
predisposizioni a malattie, tumori compresi.
Ma il punto più interessante, ovviamente, e'
quello evolutivo, sempre perchè "niente in
biologia ha senso se non alla luce
dell'evoluzione".
Esempio amilasi.
Trovato tra i geni presenti in numero di copie variabili
nella popolazione. Il gene per l’amilasi e’ presente
nella saliva dove inizia la digestione dell’amido.
L'amido era sicuramente presente nella dieta di
cacciatori/raccoglitori in zone aride. I ricercatori sono
andati a vedere se il numero di copie fosse da
correlare appunto alle abitudini alimentari nelle varie
popolazioni. Quale era l’ipotesi? Che le duplicazioni
avessero rappresentato un vantaggio per le
popolazioni di cacciatori/raccoglitori, con diete in cui
l'amido era ben presente. L’ipotesi era corretta!
Le duplicazioni insorgono a caso. E' il vantaggio
selettivo che le propaga poi nella popolazione, poiché i
portatori hanno maggiore probabilità di arrivare all'età
adulta e quindi di fare figli. La loro fitness e' più alta. E
per sottolineare come il vantaggio sia sempre relativo
ad un dato ambiente, veniamo ai nostri giorni. Ora il
vantaggio forse si e' ribaltato! Se il cibo, abbondante,
viene sfruttato fino in fondo, c'e' il rischio di ingrassare,
e quindi... la fitness si abbassa.
CNVs polimorfiche
Frank et al., 2007PosizionaleMTUS1
(esone4)SiNoComuni
Cancro al seno familiare
Sebat et al., 2007b;
Szatmari et al., 2007
Sconosciut
oMultipliVari
Non
applicabileComuniAutismo
Le Maréchal et al., 2006DosaggioPRSS1PochiSiRarePancreatiteereditaria
Rovelet-Lecrux et al.,
2006; Cabrejo et al., 2006DosaggioAPPSiNoRare
Morbo di
Alzheimer
Ibáñez et al., 2004; Chartier-Harlin et al., 2004; Singleton et al.,
2003
DosaggioSNCASiNoRareMorbo di Parkinson
precoce
Lachman et al., 2007PosizionaleGSK3BPochiNoComuniDisturbo bipolare
Fellermann et al., 2006DosaggioDEFB4NoSiComuniMalattia di
Crohn
Yang et al., 2004DosaggioC4A/C4BNoSiComuniSLE
Aitman et al., 2006; Fanciulli et al., 2007
DosaggioFCGR3BNoSiComuni
SLE, Poliangite
microscopica e
Granulomatosi Wegener
McKinney et al., 2007DosaggioCCL3L1NoSiComuni
Atritereumatoide e
Diabete di tipo 1
Gonzalez et al., 2005DosaggioCCL3L1NoSiComuniHIV-1/AIDS susceptibility
ReferenzaEffettoGeniSNPsDuplicazionisegmentali
CNVSindrome
Frank et al., 2007PosizionaleMTUS1
(esone4)SiNoComuni
Cancro al seno familiare
Sebat et al., 2007b;
Szatmari et al., 2007
Sconosciut
oMultipliVari
Non
applicabileComuniAutismo
Le Maréchal et al., 2006DosaggioPRSS1PochiSiRarePancreatiteereditaria
Rovelet-Lecrux et al.,
2006; Cabrejo et al., 2006DosaggioAPPSiNoRare
Morbo di
Alzheimer
Ibáñez et al., 2004; Chartier-Harlin et al., 2004; Singleton et al.,
2003
DosaggioSNCASiNoRareMorbo di Parkinson
precoce
Lachman et al., 2007PosizionaleGSK3BPochiNoComuniDisturbo bipolare
Fellermann et al., 2006DosaggioDEFB4NoSiComuniMalattia di
Crohn
Yang et al., 2004DosaggioC4A/C4BNoSiComuniSLE
Aitman et al., 2006; Fanciulli et al., 2007
DosaggioFCGR3BNoSiComuni
SLE, Poliangite
microscopica e
Granulomatosi Wegener
McKinney et al., 2007DosaggioCCL3L1NoSiComuni
Atritereumatoide e
Diabete di tipo 1
Gonzalez et al., 2005DosaggioCCL3L1NoSiComuniHIV-1/AIDS susceptibility
ReferenzaEffettoGeniSNPsDuplicazionisegmentali
CNVSindrome
Beck et al., 1992Delezione/
InversioneIDSXq28X-linkedSindrome di Hunter
Small et Warren, 1998Delezione/Duplicazion
e
Emery/FLN1
Xq28X-linkedDistrofia muscolare
Emery-Dreifuss
International IP Consortium, 2000
DelezioneNEMOXq28X-linkedIncontinenza
pigmenti
Stankiewicz et Lupski, 2002
DelezioneRCP/GC
PXq28X-linkedDaltonismo
Bonifas et al., 1987; Conary et al., 1987; Ballabio et Andria, 1992
DelezioneSTSXp22.32X-linkedIttiosi
Edelmann et al., 1999a; Edelmann et al., 1999b; Shaikh et al., 2000
DelezioneTBX122q11.2Autosomica dominante
Di George/ Sindrome
velocardiofacciale
(DGS/VCFS)
Stankiewicz et Lupski, 2002
DelezioneGH117q23.3Autosomica recessiva
Nanismo pituitario
Dorschner et al., 2000DelezioneNF117q11.2Autosomica dominante
Neurofibromatosi 1 (NF1)
Chance et al., 1994; Lupski, 1998; Boerkoel et al., 1999
DelezionePMP2217p12Autosomica dominante
Neuropatia tomaculare (HNPP)
Chance et al., 1994; Lupski, 1998 ; Boerkoel et al., 1999
Duplicazione
PMP2217p12Autosomicadominante
Charcot-Marie-Tooth 1A(CMT1A)
Potocki et al., 2000Duplicazion
e?17p11.2
Autosomicadominante
Potocky-Lupski(PLS)
Chen et al., 1997; Slageret al., 2003; Bi et al., 2004; Girirajan et al., 2005
DelezioneRAI117p11.2Autosomicadominante
Smith-Magenis(SMS)
Harteveld et al., 2005Delezioneα-
globina16p13.3
Autosomicarecessiva
α-talassemia
Christian et al., 1999; Amos-Landgraf et al., 1999
DelezioneOBE1A15q11.2-
q13Autosomica dominante
Angelman(AS)
Christian et al., 1999;
Amos-Landgraf et al., 1999
DelezioneSNRPN15q11.2-
q13
Autosomica
dominante
Prader-Willi
(PWS)
Galanello et al., 2004; Harteveld et al., 2005
Delezioneβ –
globina11p15.5
Autosomica recessiva
β-talassemia
Fardella et al., 2001Duplicazion
eCYP11B
1/28q21
Autosomica dominante
Iperaldosteronismo familiare I
Pérez Jurado et al., 1998; Peoples et al., 2000
Delezione/Inversione
ELN/GTF21
7q11.23Autosomica dominante
Williams-Beuren(WBS)
Tusié-Luna et White, 1995
DelezioneCYP216p21.3Autosomica recessiva
Iperplasia adrenale congenita III
Wirth et al., 1997Inversione/Duplicazion
e
SMN5q13.2Autosomica
recessiva
Atrofia muscolare
spinale
Petrov et al., 2008DelezioneFRG14q35Autosomica
dominante
Distrofia muscolare fascio-scapolo
omerale
Saunier et al., 2000; Konrad et al., 1996
DelezioneNPHP12q13Autosomica recessiva
Nefronoftisi giovanile familiare
Tayebi et al., 2003DelezioneGBA1q21Autosomica recessiva
Sindrome di Gaucher
Nozu et al., 2007DelezioneCLCNKA
/B1p36
Autosomica dominante
Sindrome di Bartter
ReferenzeCNVGenePosizion
eEreditarietàSindrome
Beck et al., 1992Delezione/
InversioneIDSXq28X-linkedSindrome di Hunter
Small et Warren, 1998Delezione/Duplicazion
e
Emery/FLN1
Xq28X-linkedDistrofia muscolare
Emery-Dreifuss
International IP Consortium, 2000
DelezioneNEMOXq28X-linkedIncontinenza
pigmenti
Stankiewicz et Lupski, 2002
DelezioneRCP/GC
PXq28X-linkedDaltonismo
Bonifas et al., 1987; Conary et al., 1987; Ballabio et Andria, 1992
DelezioneSTSXp22.32X-linkedIttiosi
Edelmann et al., 1999a; Edelmann et al., 1999b; Shaikh et al., 2000
DelezioneTBX122q11.2Autosomica dominante
Di George/ Sindrome
velocardiofacciale
(DGS/VCFS)
Stankiewicz et Lupski, 2002
DelezioneGH117q23.3Autosomica recessiva
Nanismo pituitario
Dorschner et al., 2000DelezioneNF117q11.2Autosomica dominante
Neurofibromatosi 1 (NF1)
Chance et al., 1994; Lupski, 1998; Boerkoel et al., 1999
DelezionePMP2217p12Autosomica dominante
Neuropatia tomaculare (HNPP)
Chance et al., 1994; Lupski, 1998 ; Boerkoel et al., 1999
Duplicazione
PMP2217p12Autosomicadominante
Charcot-Marie-Tooth 1A(CMT1A)
Potocki et al., 2000Duplicazion
e?17p11.2
Autosomicadominante
Potocky-Lupski(PLS)
Chen et al., 1997; Slageret al., 2003; Bi et al., 2004; Girirajan et al., 2005
DelezioneRAI117p11.2Autosomicadominante
Smith-Magenis(SMS)
Harteveld et al., 2005Delezioneα-
globina16p13.3
Autosomicarecessiva
α-talassemia
Christian et al., 1999; Amos-Landgraf et al., 1999
DelezioneOBE1A15q11.2-
q13Autosomica dominante
Angelman(AS)
Christian et al., 1999;
Amos-Landgraf et al., 1999
DelezioneSNRPN15q11.2-
q13
Autosomica
dominante
Prader-Willi
(PWS)
Galanello et al., 2004; Harteveld et al., 2005
Delezioneβ –
globina11p15.5
Autosomica recessiva
β-talassemia
Fardella et al., 2001Duplicazion
eCYP11B
1/28q21
Autosomica dominante
Iperaldosteronismo familiare I
Pérez Jurado et al., 1998; Peoples et al., 2000
Delezione/Inversione
ELN/GTF21
7q11.23Autosomica dominante
Williams-Beuren(WBS)
Tusié-Luna et White, 1995
DelezioneCYP216p21.3Autosomica recessiva
Iperplasia adrenale congenita III
Wirth et al., 1997Inversione/Duplicazion
e
SMN5q13.2Autosomica
recessiva
Atrofia muscolare
spinale
Petrov et al., 2008DelezioneFRG14q35Autosomica
dominante
Distrofia muscolare fascio-scapolo
omerale
Saunier et al., 2000; Konrad et al., 1996
DelezioneNPHP12q13Autosomica recessiva
Nefronoftisi giovanile familiare
Tayebi et al., 2003DelezioneGBA1q21Autosomica recessiva
Sindrome di Gaucher
Nozu et al., 2007DelezioneCLCNKA
/B1p36
Autosomica dominante
Sindrome di Bartter
ReferenzeCNVGenePosizion
eEreditarietàSindrome
Beck et al., 1992Delezione/
InversioneIDSXq28X-linkedSindrome di Hunter
Small et Warren, 1998Delezione/Duplicazion
e
Emery/FLN1
Xq28X-linkedDistrofia muscolare
Emery-Dreifuss
International IP Consortium, 2000
DelezioneNEMOXq28X-linkedIncontinenza
pigmenti
Stankiewicz et Lupski, 2002
DelezioneRCP/GC
PXq28X-linkedDaltonismo
Bonifas et al., 1987; Conary et al., 1987; Ballabio et Andria, 1992
DelezioneSTSXp22.32X-linkedIttiosi
Edelmann et al., 1999a; Edelmann et al., 1999b; Shaikh et al., 2000
DelezioneTBX122q11.2Autosomica dominante
Di George/ Sindrome
velocardiofacciale(DGS/VCFS)
Stankiewicz et Lupski, 2002
DelezioneGH117q23.3Autosomica recessiva
Nanismo pituitario
Dorschner et al., 2000DelezioneNF117q11.2Autosomica dominante
Neurofibromatosi 1 (NF1)
Chance et al., 1994; Lupski, 1998; Boerkoel et al., 1999
DelezionePMP2217p12Autosomica dominante
Neuropatia tomaculare (HNPP)
Chance et al., 1994; Lupski, 1998 ; Boerkoel et al., 1999
Duplicazione
PMP2217p12Autosomicadominante
Charcot-Marie-Tooth 1A(CMT1A)
Potocki et al., 2000Duplicazion
e?17p11.2
Autosomicadominante
Potocky-Lupski(PLS)
Chen et al., 1997; Slageret al., 2003; Bi et al., 2004; Girirajan et al., 2005
DelezioneRAI117p11.2Autosomicadominante
Smith-Magenis(SMS)
Harteveld et al., 2005Delezioneα-
globina16p13.3
Autosomicarecessiva
α-talassemia
Christian et al., 1999; Amos-Landgraf et al., 1999
DelezioneOBE1A15q11.2-
q13Autosomica dominante
Angelman(AS)
Christian et al., 1999; Amos-Landgraf et al., 1999
DelezioneSNRPN15q11.2-
q13Autosomica dominante
Prader-Willi(PWS)
Galanello et al., 2004; Harteveld et al., 2005
Delezioneβ –
globina11p15.5
Autosomica recessiva
β-talassemia
Fardella et al., 2001Duplicazion
eCYP11B
1/28q21
Autosomica dominante
Iperaldosteronismo familiare I
Pérez Jurado et al., 1998; Peoples et al., 2000
Delezione/Inversione
ELN/GTF21
7q11.23Autosomica dominante
Williams-Beuren(WBS)
Tusié-Luna et White, 1995
DelezioneCYP216p21.3Autosomica recessiva
Iperplasia adrenale congenita III
Wirth et al., 1997Inversione/Duplicazion
e
SMN5q13.2Autosomica
recessiva
Atrofia muscolare
spinale
Petrov et al., 2008DelezioneFRG14q35Autosomica
dominante
Distrofia muscolare fascio-scapolo
omerale
Saunier et al., 2000; Konrad et al., 1996
DelezioneNPHP12q13Autosomica recessiva
Nefronoftisi giovanile familiare
Tayebi et al., 2003DelezioneGBA1q21Autosomica recessiva
Sindrome di Gaucher
Nozu et al., 2007DelezioneCLCNKA
/B1p36
Autosomica dominante
Sindrome di Bartter
ReferenzeCNVGenePosizion
eEreditarietàSindrome
Beck et al., 1992Delezione/
InversioneIDSXq28X-linkedSindrome di Hunter
Small et Warren, 1998Delezione/Duplicazion
e
Emery/FLN1
Xq28X-linkedDistrofia muscolare
Emery-Dreifuss
International IP Consortium, 2000
DelezioneNEMOXq28X-linkedIncontinenza
pigmenti
Stankiewicz et Lupski, 2002
DelezioneRCP/GC
PXq28X-linkedDaltonismo
Bonifas et al., 1987; Conary et al., 1987; Ballabio et Andria, 1992
DelezioneSTSXp22.32X-linkedIttiosi
Edelmann et al., 1999a; Edelmann et al., 1999b; Shaikh et al., 2000
DelezioneTBX122q11.2Autosomica dominante
Di George/ Sindrome
velocardiofacciale(DGS/VCFS)
Stankiewicz et Lupski, 2002
DelezioneGH117q23.3Autosomica recessiva
Nanismo pituitario
Dorschner et al., 2000DelezioneNF117q11.2Autosomica dominante
Neurofibromatosi 1 (NF1)
Chance et al., 1994; Lupski, 1998; Boerkoel et al., 1999
DelezionePMP2217p12Autosomica dominante
Neuropatia tomaculare (HNPP)
Chance et al., 1994; Lupski, 1998 ; Boerkoel et al., 1999
Duplicazione
PMP2217p12Autosomicadominante
Charcot-Marie-Tooth 1A(CMT1A)
Potocki et al., 2000Duplicazion
e?17p11.2
Autosomicadominante
Potocky-Lupski(PLS)
Chen et al., 1997; Slageret al., 2003; Bi et al., 2004; Girirajan et al., 2005
DelezioneRAI117p11.2Autosomicadominante
Smith-Magenis(SMS)
Harteveld et al., 2005Delezioneα-
globina16p13.3
Autosomicarecessiva
α-talassemia
Christian et al., 1999; Amos-Landgraf et al., 1999
DelezioneOBE1A15q11.2-
q13Autosomica dominante
Angelman(AS)
Christian et al., 1999; Amos-Landgraf et al., 1999
DelezioneSNRPN15q11.2-
q13Autosomica dominante
Prader-Willi(PWS)
Galanello et al., 2004; Harteveld et al., 2005
Delezioneβ –
globina11p15.5
Autosomica recessiva
β-talassemia
Fardella et al., 2001Duplicazion
eCYP11B
1/28q21
Autosomica dominante
Iperaldosteronismo familiare I
Pérez Jurado et al., 1998; Peoples et al., 2000
Delezione/Inversione
ELN/GTF21
7q11.23Autosomica dominante
Williams-Beuren(WBS)
Tusié-Luna et White, 1995
DelezioneCYP216p21.3Autosomica recessiva
Iperplasia adrenale congenita III
Wirth et al., 1997Inversione/Duplicazion
e
SMN5q13.2Autosomica
recessiva
Atrofia muscolare
spinale
Petrov et al., 2008DelezioneFRG14q35Autosomica
dominante
Distrofia muscolare fascio-scapolo
omerale
Saunier et al., 2000; Konrad et al., 1996
DelezioneNPHP12q13Autosomica recessiva
Nefronoftisi giovanile familiare
Tayebi et al., 2003DelezioneGBA1q21Autosomica recessiva
Sindrome di Gaucher
Nozu et al., 2007DelezioneCLCNKA
/B1p36
Autosomica dominante
Sindrome di Bartter
ReferenzeCNVGenePosizion
eEreditarietàSindrome
Jakobsson et al., 2008. Genotype, haplotype and copy-number variation in worldwide human populations. Nature.
SNPs
CNVs
Tipo di marcatore Tipo di mutazione ProprietàTasso di mutazione
SNPTransizioniTrasversioni
Stato ancestrale definito da confronto
con outgroup
Eventi unici o <10-9
INDELInserzione/Delezione di elementi ripetitivi del
genoma
Stato ancestrale
notoEventi unici
MICROSATELLITI SEMPLICI
(STR)
Inserzione/Delezione di moduli omogenei
ripetuti in tandem
RicorrentiComposti da blocchi di repeats di 2-5 bp
10-3
MINISATELLITI Inserzione/Delezione di
moduli ripetuti in tandem
RicorrentiComposti da blocchi di repeats >10 bp
10-2
MARCATORI DEL DNA
evoluzione lenta
evoluzione rapida
In qualsiasi tipo di applicazione dovrete scegliere tra diversi tipi di marcatori.
Per fare questo bisogna tener conto di una serie di caratteristiche dei diversi
marcatori, che possono essere più o meno importanti a seconda dei casi:
• distribuzione sul genoma
• tasso di mutazione
• grado di eterozigosità
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
Caratteristiche biologiche
Caratteristiche tecniche
• distribuzione nel genoma: sufficiente che i geni non siano in LD per una più
facile trattazione statistica: OK tutti i marcatori
• tasso di mutazione: non rilevante
OK tutti i marcatori
• grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore
l’informazione. OK minisatelliti, STRs
• ereditarietà mendeliana: importante per una più facile trattazione statistica
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
• tipizzazione mediante PCR: fondamentale: spesso quantità di DNA minime
• possibilità di automazione su larga scala: non rilevante
• distribuzione nel genoma: sufficiente che i geni non siano in LD per una più
facile trattazione statistica: OK tutti i marcatori
• tasso di mutazione: non fondamentale ma da tenere in considerazione
OK tutti i marcatori
• grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore
l’informazione: OK minisatelliti, STR
• ereditarietà mendeliana: importante per una più facile trattazione statistica
OK STR, SNPs
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
• tipizzazione mediante PCR: non rilevante se non in relazione ai costi
• possibilità di automazione su larga scala: non rilevante
• distribuzione nel genoma: fondamentale, omogeneamente distribuiti e
comuni nel genoma: OK STRs e SNPs
• tasso di mutazione: molto importante, OK SNPs
• grado di eterozigosità: importante
OK STRs e parte degli SNPs (quelli con H elevata)
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
• possibilità di automazione su larga scala: OK SNPs
• distribuzione nel genoma: non rilevante
• tasso di mutazione: fondamentale, deve essere contenuto
OK SNPs, NO STRs
• grado di eterozigosità: non rilevante
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
• tipizzazione mediante PCR: non rilevante se non in relazione ai costi
• distribuzione nel genoma: non rilevante
• tasso di mutazione: dipende dal contesto, possono essere usati SNPs, Alu,
STRs, ma in modo diverso
• grado di eterozigosità: +/- importante a seconda dei casi
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo: fondamentale
Utilizzo degli SNPs in ambito forense
Svantaggio: biallalici (poco polimorfici)
Vantaggio: necessitano di amplificati di dimensioni minori
di 100 bp (utile per DNA degradato)
Numero SNPS per ottenere risultati significativi: 25-45
Correlazione di alcuni SNPs con caratteri fenotipici
SLC24A5, TYR e SL45A2 sembrano correlati con la
pigmentazione cutanea
MC1R correla con il colore rosso dei capelli