a brief introduction to molecular systematics

85
A Brief Introduction to Molecular Systematics David S. Horner Dip. Scienze Biomolecolari e Biotecnologie [email protected]

Upload: kadeem-chase

Post on 02-Jan-2016

56 views

Category:

Documents


0 download

DESCRIPTION

A Brief Introduction to Molecular Systematics. David S. Horner Dip. Scienze Biomolecolari e Biotecnologie [email protected]. Letteratura consigliata. Phylogenetic analyses: a brief introduction to methods and their application David S Horner and Graziano Pesole † - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: A Brief Introduction to Molecular Systematics

A Brief Introduction to Molecular Systematics

David S. Horner

Dip. Scienze Biomolecolari e Biotecnologie

[email protected]

Page 2: A Brief Introduction to Molecular Systematics

Letteratura consigliataPhylogenetic analyses: a brief introduction to methods and their applicationDavid S Horner and Graziano Pesole†Expert Rev. Mol. Diagn. 4(3), 339–350 (2004)

Phylogeny for the faint of heart:a tutorialSandra L. Baldauf TRENDS in Genetics Vol.19 No.6 June 2003

Page 3: A Brief Introduction to Molecular Systematics

Computers are like air-conditioning …

They stop working if you open Windows

ATTENZIONE

Page 4: A Brief Introduction to Molecular Systematics

“In Biologia Nulla Ha Senso Se Non è Visto da una Prospettiva Evolutiva”

Theodosius Dobzhansky (1900-1975)

(“senza questa prospettiva [la biologia] diventa semplicemente un cumulo di fatti scollegati: alcuni sono interessanti, ma non dipingono insieme un quadro coerente”)

Page 5: A Brief Introduction to Molecular Systematics

Questa scuola tradizionale era dominante fino agli anni ‘60. È basata sull’assunzione che il modo migliore di ricostruire le relazioni di un gruppo è di studiarlo per tutta la vita.Poi, lo specialista pubblica una filogenesi basata sulle sue impressioni

Ha il vantaggio che genera esperti bravi.Ma ha anche lo svantaggio che non è per niente un approccio oggettivo

I risultati sono poco riproducibili.

Tassonomia evolutiva

Page 6: A Brief Introduction to Molecular Systematics
Page 7: A Brief Introduction to Molecular Systematics
Page 8: A Brief Introduction to Molecular Systematics

Molecole come documenti della storia evolutiva

• “Ci possiamo chiedere dove, nella vita, c’è la quantità più alta di informazione rispetto al passato, e come possiamo estrarla?”

• “Forse nei vari tipi di macromolecole (sequenze) che portano l’informazione genetica”

Emile Zuckerkandl – Linus Pauling

Page 9: A Brief Introduction to Molecular Systematics

Evoluzione Molecolare• TUTTI le sequenze molecolari (naturali)

sono prodotti di processi evolutivi• Possiamo usare sequenze per inferire

rapporti evolutivi tra sequenze (e tra organismi)

• Se riusciamo capire come costretti selettivi influenzano l’evoluzione di diversi tipi di sequenze (geni codificanti, regione promotrice, “junk DNA” etc), magari potremmo PREDIRE il ruolo svolto da sequenze sotto esame.

Page 10: A Brief Introduction to Molecular Systematics

Perche ci interessa l’evoluzione molecolare?

• Per capire la storia naturale di organismi e ambienti

• Per identificare e classificare nuove specie• Per capire processi evolutivi• Per la predizione e modificazione di funzione/

specificità di geni/enzimi. • Studi basasti sull’evoluzione molecolare può

aiutarci ad associare i cambiamenti funzionali con le sostituzioni responsabili.

• Sviluppo di medicine/vaccini (selezione)• Biomonitoraggio (ecologia molecolare)

Page 11: A Brief Introduction to Molecular Systematics

Quale è il più stretto parente dei

“baci di dama” ?

UFO

Gioiellometallaro

Fragola vampira

Space alien

Page 12: A Brief Introduction to Molecular Systematics
Page 13: A Brief Introduction to Molecular Systematics
Page 14: A Brief Introduction to Molecular Systematics
Page 15: A Brief Introduction to Molecular Systematics

L’omologia è…..

• Omologia: similarita risultando da eredita da un genitore stessa. L’identificazione e l’analisi di omologia sono fundamentale nella sistematica filogenetica.

• 70% homology?

Page 16: A Brief Introduction to Molecular Systematics

Typical Eukaryote Gene Structure

Page 17: A Brief Introduction to Molecular Systematics

Eredita dei geni

• Geni vengono ereditati dai genitori• La loro sequenza puo cambiare con tempo

(mutazione)• Cambiamementi possono essere ereditati• A volte, geni vengono DUPLICATI opure PERSI• Nel arco del tempo evolutivo, solo sequenze

“importanti” vengono conservate

• Possiamo applicare il concetto di omologia a geni

Page 18: A Brief Introduction to Molecular Systematics

• Mutations are random events: their occurrence is independent of their selective value - i.e., they do not occur when they are needed any more often than they would otherwise.

• Mutations at any single locus are rare events: mutation rates at a typical locus are about 1 in 106 gametes.

Page 19: A Brief Introduction to Molecular Systematics

Some types of mutations.• Substitution: one nucleotide is substituted for

another, frequently this causes no change in the resulting organism, sometimes the change can be dramatic.

• Insertion: DNA is inserted into a gene, either one nucleotide or many. Sometimes, entire genes are inserted by viruses and transposable elements.

• Deletion: DNA bases are removed.• Small insertions and deletions can inactivate large

stretches of a gene, by causing a frame shift that renders a gene meaningless.

• Duplication: an entire gene is duplicated. • Transposition: DNA is moved to a new place in

the genome, frequently this happens because of errors in meiosis or transposable elements.

Page 20: A Brief Introduction to Molecular Systematics

Meccanismi dell’evoluzione

sostituzioni puntiformi

A

G

T

C

Purine Pirimidine

Tran

sizi

oni

Tran

sizioni

Transversioni

Page 21: A Brief Introduction to Molecular Systematics

Transizioni vs Transversioni

Le transizioni sono più frequenti delle trasversioni. La frequenza delle mutazioni puntiformi (1 per 10-9 - 10-10 bases incorporate) è molto inferiore di quanto atteso (circa 10-6) a causa dei sistemi di riparazione.

Meccanismi dell’evoluzione

Page 22: A Brief Introduction to Molecular Systematics

Soppressione di “CpG”

Modificazione “epigenetica” (metilazione) di residui “C” nella dinucleotide “CG” e diffusa in tanti organismi

Il C metilato e sensibile a un processo di “diaminazione” che cambia C>T (U).

Dopo replicazione, se l’errore no e messo a posto da proofreading, succede una transizione in una delle eliche prodotte.

Page 23: A Brief Introduction to Molecular Systematics

Mutazioni PUNTIFORMI: conseguenze

Dipendono da:1) Regione del gene che viene colpita

(promotore, regioni trascritte non tradotte, regione codificante…)

2) natura della mutazione3) Selezione Naturale

Page 24: A Brief Introduction to Molecular Systematics

Mutazione e Fissazione

Per essere geneticamente rilevante una mutazione deve essere ereditata, cioè deve avvenire nella linea germinale e diffondersi in una proporzione significativa della popolazione (fissazione).

Nella filogenesi molecolare studiamo mutazioni fissi.

Meccanismi dell’evoluzione

Page 25: A Brief Introduction to Molecular Systematics

• Mutazione sinonima

Page 26: A Brief Introduction to Molecular Systematics

• Mutazione missenso (nonsinonima)

Page 27: A Brief Introduction to Molecular Systematics

• Mutazione nonsenso (nonsinonima)

Page 28: A Brief Introduction to Molecular Systematics

Indel nella seq. codificante per una proteina

• Mutazione frameshift

Page 29: A Brief Introduction to Molecular Systematics

La teoria neutrale di Kimura (1968)

• Geni sono stati, in qualche senso, gia “ottimizzati” dal processo evolutivo

• La maggior parte delle nuove mutazioni sono deleterie o neutrale.

• La maggior parte della variazione osservata è neutrale, poichè le mutazioni deleterie vengono rapidamente eliminate.

• Orologio molecolare

Page 30: A Brief Introduction to Molecular Systematics

• Tomoko Ohta 1973: ha introdotto il concetto di “nearly neutral evolution” (evoluzione quasi neutrale) (mutazioni poco deleterie possono essere fissate nella popolazione).

• Saul G. Needleman – Christian D. Wunsch 1970 Allineamento ottimale di due sequenze omologhe.

• Anni ‘70 - Biologia molecolare “moderna”– Clonaggio di DNA– Sequenziamento di DNA

• Anni ‘80– PCR– micro computer– Primi “Tree of life”

Page 31: A Brief Introduction to Molecular Systematics
Page 32: A Brief Introduction to Molecular Systematics
Page 33: A Brief Introduction to Molecular Systematics
Page 34: A Brief Introduction to Molecular Systematics

DNA vs Proteins

… Ser Gly Arg His Lys … UCU GGU CGU CAU AAA UCC GGC CGC CAC AAG UCG GGG CGG UCA GGA CGA AGU AGC

Tante sequenze nucleotidiche diverse possono codificare la stessa sequenza proteica

Page 35: A Brief Introduction to Molecular Systematics

Selezione al livello di DNA.Una stima semplice per sequenze codificante

Per 2 sequenze:

Ka è la proporzione di siti non-sinonimi dove c’e’ stato un sostituzione.

Ks è la proporzione di siti sinonimi dove c’e’ stato un sostituzione.

Se: Ks / Ka >1 ci sono costretti che preventano sostituzioni aminoacidici

Ks / Ka =1 non c’e’ selezione

Ks / Ka <1 c’e’ slezione positiva (cambiamenti vengono seletti)

Page 36: A Brief Introduction to Molecular Systematics

DNA vs Proteins(A)

GAP of: h2a_hum.seq x h2a_mus.seq February 6, 19102 20:25 ..

Percent Similarity: 86.768 Percent Identity: 86.768

. . . . . 1 ATGTCTGGACGTGGTAAGCAAGGAGGCAAAGCTCGCGCCAAAGCGAAATC 50 ||||| || ||||| |||||||||||||| || |||||||| || || || 1 ATGTCCGGTCGTGGCAAGCAAGGAGGCAAGGCCCGCGCCAAGGCCAAGTC 50 . . . . . 51 CCGCTCTTCTCGCGCTGGTCTCCAGTTCCCGGTGGGCCGAGTGCACCGCC 100 || ||||| || || || || |||||||||||||| || |||||||| | 51 GCGGTCTTCCCGGGCCGGGCTACAGTTCCCGGTGGGGCGTGTGCACCGGC 100 . . . . . 101 TGCTCCGTAAAGGCAACTACGCAGAGCGGGTTGGGGCAGGCGCGCCGGTG 150 |||| || || ||||||||||| ||||| || || || ||||||||||| 101 TGCTGCGGAAGGGCAACTACGCGGAGCGCGTGGGCGCCGGCGCGCCGGTA 150 . . . . . 151 TACCTGGCGGCGGTGTTAGAGTACCTGACCGCCGAGATCCTGGAGCTGGC 200 ||| ||||||||||| | |||||||| || |||||||||||||||||||| 151 TACATGGCGGCGGTGCTGGAGTACCTAACGGCCGAGATCCTGGAGCTGGC 200 . . . . . 201 CGGCAACGCGGCTCGCGACAACAAGAAGACTCGCATCATCCCGCGCCACT 250 ||||||||||| ||||||||||||||||| |||||||||||||||||| 201 GGGCAACGCGGCCCGCGACAACAAGAAGACGCGCATCATCCCGCGCCACC 250 . . . . . 251 TGCAGCTGGCCATCCGCAACGACGAGGAGCTCAACAAACTGCTAGGCCGG 300 ||||||||||||||||||||||||||||||||||||| ||||| ||| 251 TGCAGCTGGCCATCCGCAACGACGAGGAGCTCAACAAGCTGCTGGGCAAA 300 . . . . . 301 GTGACCATTGCTCAGGGCGGCGTCCTTCCTAACATCCAGGCCGTGCTTCT 350 ||||| || || |||||||||||||| || ||||||||||||||||| || 301 GTGACGATCGCGCAGGGCGGCGTCCTGCCCAACATCCAGGCCGTGCTGCT 350 . . . . 351 GCCTAAGAAGACCGAGAGTCACCACAAGGCCAAGGGCAAGTGA 393 ||| |||||||| ||||| ||||| ||||| |||||||||||| 351 GCCCAAGAAGACGGAGAGCCACCATAAGGCGAAGGGCAAGTGA 393

(B)

GAP of: h2a_hum.pep x h2a_mus.pep February 6, 19102 20:25 ..

Percent Similarity: 100.000 Percent Identity: 98.473 . . . . . 1 MSGRGKQGGKARAKAKSRSSRAGLQFPVGRVHRLLRKGNYAERVGAGAPV 50 |||||||||||||||||||||||||||||||||||||||||||||||||| 1 MSGRGKQGGKARAKAKSRSSRAGLQFPVGRVHRLLRKGNYAERVGAGAPV 50 . . . . . 51 YLAAVLEYLTAEILELAGNAARDNKKTRIIPRHLQLAIRNDEELNKLLGR 100 |:|||||||||||||||||||||||||||||||||||||||||||||||: 51 YMAAVLEYLTAEILELAGNAARDNKKTRIIPRHLQLAIRNDEELNKLLGK 100 . . . 101 VTIAQGGVLPNIQAVLLPKKTESHHKAKGK* 131 ||||||||||||||||||||||||||||||| 101 VTIAQGGVLPNIQAVLLPKKTESHHKAKGK* 131

DNA : 52 cambiamenti

Protein : 2 cambiamenti

Page 37: A Brief Introduction to Molecular Systematics

Spinach and Azotobacter ferredoxins

Protein sequence vs structure

1 .AFVVTDNCIKCKYTDCVEV.CPVDCFYEGPNFLVIHPDECID...CALC 45 |: || .. |: ||. || |.: :| .:|.|| :. . 1 XAYKVT....LVTPTGNVEFQCPDDVY.....ILDAAEEEGIDLPYSCRA 41 . . . . . 46 EPECPAQAIFSEDEVPEDMQEFIQLNAELAEVWPNITEKKDPLPDAEDWD 95 :. :...: :..:.: :| |.|:: :.::.|.|. :| |:.|.. . 42 GSCSSCAGKLKTGSLNQDDQSFLD.DDQIDEGWV.LTCAAYPVSDVTIET 89 . 96 GVKGKLQHLER 106 |:.| 90 HKKEELTA... 97

Page 38: A Brief Introduction to Molecular Systematics

Il grado di conservazione segua l’ordine:

DNA < Sequenze Proteiche

< Struttura Secondaria Proteica

< Struttura Tridimensionale Proteica

DNA vs Proteine

Page 39: A Brief Introduction to Molecular Systematics

Esiste un orologio molecolare?

• L’idea di orologio molecolare fu inizialmente suggerita da Zuckerkandl e Pauling nel 1962

• Era basata sull’osservazione che i tassi di sostituzione aminoacidica nelle emoglobine animali erano approssimativamente proporzionali alle distanze temporali - stimate dai reperti fossili

Page 40: A Brief Introduction to Molecular Systematics

• *Stolen from a great site nitro.biosci.arizona.edu/.../Lecture47.html • Although its importance, relative to Darwininan evolution, is debated, this theory is farily well supported by now.

• Rates of molecular evolution vary among proteins, and among organisms. Some proteins allow much less neutral variation, and evolve more slowly.

• Interestingly, population size is not that important for rates of molecular evolution (it cancels out in the math, small populations drift faster, but have fewer mutants per generation)

Page 41: A Brief Introduction to Molecular Systematics

Non esiste un orologio molecolare universale

• La proposta iniziale vedeva l’orologio come un processo di tipo Poisson con un tasso costante

• Ora si sa che è più complesso. Differenze nel tasso di sostituzione esistono per:– Differenti siti di una stessa molecola – Differenti geni– Differenti regioni dei genomi– Differenti genomi entro una stessa cellula – Differenti gruppi tassonomici analizzati per lo

stesso gene

• Non esiste un orologio molecolare universale

Page 42: A Brief Introduction to Molecular Systematics

Multi-gene families: Evolution by gene duplication

• Gene duplication is the most important mechanism for generating new genes and new biochemical processes.

This mechanism has facilitated the evolution of complex organisms:

• In the genomes of eukaryotes, internal duplications of gene segments have occurred frequently. Many complex genes might have evolved from small primordial genes through internal duplication and subsequent modification.

• Vertebrate genomes contain many gene families absent in invertebrates.

• Many gene duplications have occurred in the early evolution of animals (“Biology’s Big Bang”, “Cambrian explosion”, ~570-505 million year ago).

Page 43: A Brief Introduction to Molecular Systematics

A duplication may involve

• a single gene (complete gene duplication)

• part of a gene (internal or partial gene duplication)

• part of a chromosome (partial polysomy)

• an entire chromosome (aneuploidy or polysomy)

• the whole genome (polyploidy)

Types of duplication events

Page 44: A Brief Introduction to Molecular Systematics

Duplicazioni Geniche

Subito dopo una duplicazione genica, c’e’ una coppia di geni identici….

Cosa può succedere?

Page 45: A Brief Introduction to Molecular Systematics

Destini dei geni duplicati

• Possono mantenere la stessa funzione e pattern di espressione

• Possono accumulare mutazioni (nella regione codificante o nel promotore) e diventare pseudogeni

Page 46: A Brief Introduction to Molecular Systematics

Origine di pseudogeni

• Tanti geni duplicati diventano PSEUDOGENI e a volte vengono persi dal genoma.

• PSEUDOGENE : una sequenza di DNA non-funzionale, derivata da un gene funzionale.

• Alcuni pseudogeni hanno una funzione e altri vengono riabilitate.

Page 47: A Brief Introduction to Molecular Systematics

Origine di subfunzioni:

• I geni derivati dalla duplicazione assumono diversi aspetti della funzione del gene ancestrale

• Tali cambiamenti succedono spesso rapidamente dopo la duplicazione.

Page 48: A Brief Introduction to Molecular Systematics

Origine di neofunzioni

Cambiamenti funzionali della proteina risultano da sostituzioni nella regione codificante

Pattern diversi dell‘esspresione (diversi tissuti/tempi durante lo sviluppo) risultano da sostituzioni nelle regioni regulatrici.

Page 49: A Brief Introduction to Molecular Systematics

Ortologhi e paraloghi

a Ab c BC

Gene ancestrale

Duplicazione ci da 2 copie = paraloghi nello stesso genoma

ortologhiortologhi

paraloghi

Page 50: A Brief Introduction to Molecular Systematics

hanno entrambe l’implicazione di omologia

Ortologia vs Paralogia

Ortologia Sequenze derivate da un gene ancestrale comune dopo un evento di SPECIAZIONE

Paralogia Sequenze derivate da un gene ancestrale comune dopo un evento di DUPLICAZIONE GENICA

Page 51: A Brief Introduction to Molecular Systematics

Ruolo delle duplicazioni geniche nell‘evoluzione dell‘organismo

• generano nuovo materiale genetico per l‘evoluzione di nuove funzioni/complessità

• duplicazioni specie-specifiche possono permettere l‘evoluzione di funzioni specie-specifiche che possono facilitare l‘adattamento all‘ambiente

• Duplicazioni e generazione di pseudogeni popolazione-specifica contribuiscono all‘isolamento riproduttivo (speciazione)

Page 52: A Brief Introduction to Molecular Systematics

AGGGCCCTTGAGGGTCCTTGThis is the FIRST substitution eventAGGGCCCTTGAGGGTCCTTGThe SECOND event has a 1/20 chance (in this case), of

occurring at the SAME positionAGGGCCCTTGAGGGGCCTTG

After a Duplication/Speciation

Page 53: A Brief Introduction to Molecular Systematics

• La saturazione è dovuta a cambiamenti multipli dello stesso sito durante la divergenza (dopo una ramificazione)

• La maggior parte dei dati contiene alcuni siti che evolvono rapidamente e che sono potenzialmente saturati (es. Nelle sequenze codificanti per proteine la terza posizione dei codoni)

• Nei casi più eclatanti i dati diventano essenzialmente casuali e non è possibile rintracciare informazioni circa le relazioni evolutive

Saturazione nei dati di sequenza:

Page 54: A Brief Introduction to Molecular Systematics

Cambiamenti multipli a un singolo sito - cambiamenti nascosti

G CA G T G

2

3

1

pos 1

pos 2

Numero di cambiamenti

Seq 1 AGCGAGSeq 2 GCCGAC

pos 3C A C

Page 55: A Brief Introduction to Molecular Systematics

Distanza Genetica

0

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

1,8

2

0 0,5 1 1,5 2

Time

Geneti

c D

ista

nce

expected difference

observed difference

La proporzione osservata di cambiamenti non riflette bene il reale numero di cambiamenti evolutivi quando il livello di divergenza è alto.

Saturation

Correction

Page 56: A Brief Introduction to Molecular Systematics

Introduzione agli alberi filogenetici

Page 57: A Brief Introduction to Molecular Systematics

Phylogenetic systematics

• Omologia: si riferisce all’evidenza di un progenitore comune (common descent)

• Usa alberi per indicare relazione

• Gruppi monofiletici (clades) - contengono organismi (o sequenze) che sono più strettamente imparentate fra di loro di quanto siano imparentate con altre organismi (o sequenze) al di fuori del gruppo.

Page 58: A Brief Introduction to Molecular Systematics

Terminologia I

• Node/nodo: un punto di ramificazione su un albero filogenetico

Page 59: A Brief Introduction to Molecular Systematics

E. coli

Arabidopsis

Riso

Danio

Uomo

Topo

Ratto

Ramo

Nodo

Page 60: A Brief Introduction to Molecular Systematics

Terminologia II• Taxon: Un livello di classificazione,

una specie, un genere, una famiglia. Usato nella filogenesi molecolare anche per descrivere un OTU.

• OTU (Operational Taxonomic Unit), una “foglia” di un albero filogenetico, può essere una specie oppure una sequenza

Page 61: A Brief Introduction to Molecular Systematics

E. coli

Arabidopsis

Riso

Danio

Uomo

Topo

Ratto

Ramo

Nodo

Taxon/OTU

Taxon

Page 62: A Brief Introduction to Molecular Systematics

• Clade/Gruppo monofiletico: un gruppo che contiene tutti gli OTU che sono discesi da un nodo.

• Gruppo parafiletico: un gruppo tassonomico che NON contiene tutti gli OTU che sono discesi da un nodo.

Page 63: A Brief Introduction to Molecular Systematics

E. coli

Arabidopsis

Riso

Danio

Uomo

Topo

Ratto

Nodo Ancestrale

Clade/Gruppo

monofiletico

Page 64: A Brief Introduction to Molecular Systematics

I rettili non costituiscono un gruppo strettamente monofiletico. sono PARAFILETICI

Arabidopsis

Topo

Homo

Gecco

Dinosauro

Falcone

Passero Clade?…..SI

Page 65: A Brief Introduction to Molecular Systematics

Cladogrammi Cladogrammi mostrano l’ordine delle ramificazioni, lunghezze dei rami non significano niente

E. coli

Arabidopsis

Riso

Danio

Uomo

Topo

Ratto

E. coli

Arabidopsis

Riso

Danio

Uomo

Topo Ratto

Page 66: A Brief Introduction to Molecular Systematics

Filogrammi le lunghezze dei rami indicano il grado di divergenza

E. coli

Arabidopsis

Riso

Danio

Uomo

Topo Ratto

Filogrammi

Page 67: A Brief Introduction to Molecular Systematics

ACCTC ACGTC

ACGTC ?

G>C?

Difficile sapere la direzione

ACCTC ACGTC

ACCTC ?

C>G ?

Page 68: A Brief Introduction to Molecular Systematics

OUTGROUP (Scelta)

Una divergenza BASALE al INGROUP

Non TROPPO lontano/divergente

Meglio provare con piu di un outgroup

Page 69: A Brief Introduction to Molecular Systematics

Alberi e Radici

Riso

Arabdopsis

E. coli

Danio

Ratto

Topo

Homo

Albero non radicato

Page 70: A Brief Introduction to Molecular Systematics

E.coli OUTGROUP

radice

Danio

Topo

Ratto

Homo

Arabidopsis

RisoGruppo monofiletico

Gruppo monofiletico

Radicato da un“outgroup”

Alberi e Radici

Page 71: A Brief Introduction to Molecular Systematics

Alberi e Radici

Riso

Arabdopsis

E. coli

Danio

Ratto

Topo

Homo

Albero non radicato

Page 72: A Brief Introduction to Molecular Systematics

Danio

radice

E. coli

Topo

Ratto

Homo

Arabidopsis

RisoGruppo monofiletico

Gruppo monofiletico

Alberi e Radici

Page 73: A Brief Introduction to Molecular Systematics

Alberi di geni e alberi di specie

Facciamo spesso l’assunzione che sono la stessa cosa…..

a

b

c

A

B

CAlbero di geni

Albero di specie

Page 74: A Brief Introduction to Molecular Systematics

Ortologhi and paraloghi

a Ab c BC

Gene ancestrale

Duplicazione ci da 2 copie = paraloghi nello stesso genoma

ortologhiortologhi

paraloghi

Page 75: A Brief Introduction to Molecular Systematics

Ortologhi and paraloghi

ChimpA* HomoA TopoA

Gene ancestrale

Duplicazione ci da 2 copie = paraloghi nello stesso genoma

ortologhiortologhi

paraloghi

ChimpB HomoB*TopoB*

Page 76: A Brief Introduction to Molecular Systematics

Ortologhi and paraloghi

ChimpA* HomoA TopoA

Gene ancestraleDuplicazione ci da 2 copie = paraloghi nello stesso genoma

ortologhiortologhi

paraloghi

ChimpB HomoB*TopoB*

Pesce

Page 77: A Brief Introduction to Molecular Systematics

Ortologhi e paraloghi

UomoTopoChimp

Un albero che contiene una selezione non completa di paraloghi e ortologhi

Pesce

Page 78: A Brief Introduction to Molecular Systematics

hanno entrambe l’implicazione di omologia

Ortologia vs Paralogia

Ortologia Sequenze derivate da un gene ancestrale comune dopo un evento di SPECIAZIONE

Paralogia Sequenze derivate da un gene ancestrale comune dopo un evento di DUPLICAZIONE GENICA

Page 79: A Brief Introduction to Molecular Systematics

L’albero filogenetico questo gene contiene un misto di ortologhi e

paraloghi

Salmonella

Danio 1

Ratto 1

Topo 1

Homo 1

Topo 2

Ratto 2

Homo 2

E.coli

Solanum tuberosum

Brassica

Riso

Gene duplication

POLITOMIA

Page 80: A Brief Introduction to Molecular Systematics

L’albero filogenetico di questo gene contiene un misto di ortologhi e

paraloghi

Salmonella

Danio 1

Ratto 1

Topo 1

Homo 1

Topo 2

Ratto 2

Homo 2

E.coli

Solanum tuberosum

Brassica

Riso

Gene duplication

Danio 2?

Page 81: A Brief Introduction to Molecular Systematics

Numero di alberi distinti in funzione del numero di

taxa

10 2*106

22 3*1023

50 3*1074

100 2*10182

1000 2*102860

N taxa N trees

Page 82: A Brief Introduction to Molecular Systematics

Phylogenetic systematics

• Omologia: si riferisce all’evidenza di un progenitore comune (common descent)

• Usa alberi per indicare relazione• Gruppi monofiletici (clades) - contengono

organismi (o sequenze) che sono più strettamente imparentate fra di loro di quanto siano imparentate con altre organismi (o sequenze) al di fuori del gruppo.

Page 83: A Brief Introduction to Molecular Systematics

Newick Format((A,B),(C,D));

A

B

C

D

A B C D

Page 84: A Brief Introduction to Molecular Systematics

Multifurcazioni

((A,B,C),(D,E));

DCA BE

Page 85: A Brief Introduction to Molecular Systematics

Lunghezza di Rami

((A:1,B:1):2,(C:2,D:1):3):0;=

A B

C

D

1 1

23

12