filoģenēze. klāsteru un kladistiskās metodes filoģenētisko koku rekonstruēšanā
DESCRIPTION
Filoģenēze. Klāsteru un kladistiskās metodes filoģenētisko koku rekonstruēšanā . Lekciju saraksts . Gray and Atkinson (2003) Nature , 426:6965. Meredith et al . (2011) Science , 334: 521. Filoģenētiskā analīze . Pamatā pieņēmum s, ka dzīvajiem organismiem ir kopīga izcelsme - PowerPoint PPT PresentationTRANSCRIPT
Filoģenēze. Klāsteru un kladistiskās metodes filoģenētisko koku
rekonstruēšanā
Lekciju saraksts
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 2
N.p.k. Datums Lekcijas temats
1. 15.09.2011Ievadlekcija. Prasības kursa apgūšanai un literatūras avoti. Bioinformātikas jēdziens. Kas ir bioinformātika un kāpēc tā biologiem vajadzīga? Bioloģija, statistika, informācijas tehnoloģijas un programmēšana kā bioinformātikas pamatelementi
2. 22.09.2011 Bioloģiskās informācijas veidi un apjoms. Genomu organizācija. Modernās genomu analīzes metodes3. 29.09.2011 Genomu evolūcija. Salīdzinošā genomika 4. 06.10.2011 Bioloģiskās informācijas datubāzes. Informācijas meklēšanas un iegūšanas sistēmas 5. 13.10.2011 Dažādu bioloģiskās informācijas datubāžu izmantošanas piemēri
6. 20.10.2011 Nukleīnskābju un proteīnu sekvenču līdzības pamatprincipi. Nukleīnskābju un proteīnu sekvenču pāru salīdzināšana. BLAST veidi
7. 27.10.2011 Nukleīnskābju un proteīnu sekvenču līdzības pamatprincipi. Nukleīnskābju un proteīnu sekvenču pāru salīdzināšana. BLAST veidi
8 03.11.2011 Nukleīnskābju un proteīnu daudzkārtējās salīdzināšanas metodes, to priekšrocības un pielietošanas nosacījumi. Datorprogrammas nukleīnskābju un proteīnu sekvenču daudzkārtējai salīdzināšanai
9 10.11.2011 Filoģenētika. Klāsteru un kladistiskās metodes filoģenētisko koku rekonstruēšanā Datorprogrammas nukleīnskābju un proteīnu sekvenču filoģenētiskajai analīzei
10. 17.11.2011 Seminārs un uzdevumu pārbaude par tēmām, kas saistītas ar informācijas meklēšanu datu bāzēs un sekvenču homoloģijas meklēšanu
11. 24.11.2011 Makromolekulu telpiskā struktūra un tās paredzēšana. DNS topoloģija. Proteīnu struktūras paredzēšana, modelēšana un pielietojums farmakoloģijā
12. 01.12.2011 Genoma ekspresijas analīze. Transkriptomika. DNS čipi genomu polimorfisma analīzē. Gēnu ekspresijas ģenētika
13. 08.12.2011 Proteomika un sistēmu bioloģija. Tīklveida struktūras kā bioloģisko sistēmu dabiska sastāvdaļa.
14. 15.12.2011Seminārs un uzdevumu pārbaude par tēmām, kas saistītas ar filoģenētisko analīzi un proteīnu sekundārās struktūras paredzēšanu. Bioinformātikas perspektīvas. Bioinformātika kā priekšnosacījums modernās bioloģijas apgūšanai
15. 22.12.2011 Eksāmens
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 3
Gray and Atkinson (2003) Nature, 426:6965
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 4
Meredith et al. (2011) Science, 334: 521
Filoģenētiskā analīze
Pamatā pieņēmums, ka dzīvajiem organismiem ir kopīga izcelsme Filoģenētiskās analīzes uzdevums – rekonstruēt taksonomisko vienību savstarpējo radniecību • Homoloģija• Līdzība • Klasteri
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 5
Dendrogrammas
• Dendrogrammas topoloģija – norāda taksonomisko vienību radniecību
• Zaru garumi – norāda evolucionāro attālumu vai laiku kopš taksonomiskās vienības nodalījās.
• Dendrogrammas mezgli (node) – norāda kopējo priekšteci
• Molekulārais pulkstenis – atkarīgs no mutāciju ātruma. To kalibrē izmantojot fosīliju datus
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 6
Filoģenētisko koku veidošana
• Dendrogrammas var veidot (rekonstruēt taksonomisko vienību evolūciju) izmantojot dažādas pazīmes – morfoloģiskas, valodnieciskas, bioķīmiskas, molekulārās sekvences
• Problēmas būtība ir tāda, ka evolūcijas rekonstruēšanai mums jāiztiek ar novērojumiem par mūsdienu organismiem (atsevišķi izņēmumu – fosīlā DNS)
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 7
Evolūcijas trīs ‘ziloņi’
• Iedzimtība • Mainība • (Dabiskā) izlase
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 8
Molekulārā evolūcija
• Viens no pretrunīgākajiem filoģenēzes jautājumiem - vai iespējams izmantot molekulāros datus evolūcijas ātruma noteikšanai
• Mutāciju ātrums, neitrālas, kaitīgas un izdevīgas mutācijas • Dažādās līnijās evolūcijas ātrums var atšķirties • Molekulārās evolūcijas neitrālā teorija (Neutral theory of
molecular evolution) – Motoo Kimura • Izlase darbojas uz organismiem un populācijām, bet
mutācijas DNS un proteīnu molekulās ir tās, kas piešķir organismam priekšrocības, tādējādi izlase netieši iedarbojas uz DNS molekulu
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 9
Molekulārās evolūcijas neitrālā teorija
Apgalvo, ka lielākā daļa mutāciju ir selektīvi neitrālas vai gandrīz neitrālas un to frekvences populācijā ir atkarīgas no stohastiskiem procesiem, tai skaitā ģenētiskā dreifa
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 10
Molekulārās evolūcijas neitrālā teorija
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 11
• Ja lielākā daļa mutāciju ir neitrālas vai gandrīz neitrālas, tad to nostiprināšanās populācijā notiks ar aptuveni vienādu ātrumu -> tās var izmantot kā molekulāro pulksteni
• Populācijā var būt augsts polimorfisma līmenis, ja mutācijas ir gandrīz neitrālas
• Neitrāla mutācija nenozīmē, ka tā neietekmē gēna funkciju, bet gan to, ka dabiskās izlases darbība uz organismiem ar šo mutāciju ir vāja
Filoģenēzes rekonstrukcija
• Divi galvenie filoģenētisko koku rekonstrukcijas veidi: 1. fenētiskā (klasteru) pieeja – netiek izdarīti pieņēmumi par taksonomisko vienību evolūciju un vēsturi. Nosaka attālumu starp sugām un konstruē koku izmantojot hierahisko klasterēšanu 2. kladistiskā pieeja – novērtē iespējamos evolūcijas ceļus, nosaka priekšteču īpašības, piemēram, DNS secības katrā mezglā un izvēlas optimālo koku balstoties uz izvēlēto evolūcijas modeli
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 12
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 13
Klasteru pieeja Kladistiskā pieeja
Klasteru metodes filoģenēzē
• Nosaka līdzības pakāpi starp visiem taksonomisko vienību pāriem, piemēram, visiem DNS sekvenču pāriem no daudzkārtēja sekvenču salīdzinājuma
• Atrod visradniecīgāko pāri un tam pamatā izveido pirmo mezglu (kopējo priekšteci), tad turpina salīdzinājumu ar nākamo līdzīgāko vienību u.t.t.
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 14
ATCC
ATGC
TTCG
TCGG
ATCC ATGC TTCG TCGGATCC 0 1 2 4
ATGC 0 3 3
TTCG 0 2
TCGG 0ATCC ATGC
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 15
ATCC ATGC TTCG TCGGATCC 0 1 2 4
ATGC 0 3 3
TTCG 0 2
TCGG 0
(ATCC, ATGC) TTCG TCGG(ATCC, ATGC) 0 1/2(2+3)=2.5 1/2(4+3)=3.5
TTCG 0 2
TCGG 0 TTCG TCGG
ATCC ATGC TTCG TCGG
0.5 0.5 1 1
1.5 1.5
Klasteru metodes
• UPGMA (Unweighted Pair Group Method with Arithmetic mean) – zaru garumi ir līdzvērtīgi pusei no attāluma starp taksonomiskajām vienībām
• NJ (Neighbour Joining) – UPGMA modifikācija, kas ņem vērā nevienādu evolūcijas ātrumu dažādos koka zaros NJ tiek pielietota, piemēram, Clustal programmā, lai izveidotu koku pēc kura vadoties veido daudzkārtēju sekvenču salīdzinājumu
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 16
Kladistiskās metodes filoģenētiskajā analīzē
• Izvērtē taksonomisko vienību iespējamo radniecību izvēloties optimālo filoģenētiskos koku balstoties uz noteiktu evolūcijas modeli
• Populārākās kladistiskās metodes ir maksimālās taupības (maximum parsimony) un maksimālās varbūtības (maximum likelihood) metodes (saīsināti MP un ML)
• Atšķirībā no fenētiskajām metodēm balstās uz DNS un aminoskābju sekvenču datiem
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 17
MP metode
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 18
ATCC ATGC TTCG TCCG
ATCC TTCG
TTCC
C->G
T->A C->G
T->C
ATGC ATCCTTCG TCCG
ATCC TTCG
TTCC
C->G
T->A C->G
T->CA->T T->AC->G G->C
Atšķirīgs evolūcijas ātrums dažādos dendrogrammas zaros
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 19
A B C DA 0 3 3 3B 0 2 2C 0 1D 0
A B C DA 0 3 3 20B 0 2 20C 0 20D 0
A B C D A B C D
MP metode
• Optimālais filoģenētiskais koks ir tas, kura rekonstruēšanai nepieciešams vismazāk mutāciju
• MP metode rekonstruē ne tikai koka topoloģiju, bet arī priekšteču sekvences katrā mezglā
• Zaru garums atbilst attālumam starp taksonomiskajām vienībām
• Iespējama situācija, kad pastāv vairāki vienādi varbūtīgi filoģenētiskie koki
• Molekulāro sekvenču salīdzinājumā pastāv informatīvi (parsimony informative) un neinformatīvi (parsimony non-informative) saiti (nukleotīdu vai aminoskābju pozīcijas)
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 20
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 21
C (cilvēks)C (šimpanze)C (gorilla) T (orangutans)T (gibons)
C (cilvēks)C (šimpanze)C (gorilla) C (orangutans)T (gibons)
*
ML metode
• ML ne tikai saskaita mutācijas, kas nepieciešamas koka rekonstrukcijai, bet arī nosaka šo mutāciju kvantitatīvo varbūtību
• ML metode rekonstruē ne tikai koka topoloģiju, bet arī priekšteču sekvences katrā mezglā
• Zaru garums atbilst evolucionārajam attālumam starp taksonomiskajām vienībām
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 22
Filoģenētisko koku novērtējums
• Vai dažādi gēni (molekulārie marķieri) ļauj rekonstruēt līdzīgus filoģenētiskos kokus?
• Vai mums vispār ir svarīgs filoģenētiskais koks kā evolūcijas procesa reprezentācija?
• Varbūt mūs vienkārši interesē cik radniecīgas ir molekulārās sekvences no dažādām organismu grupām
• Bieži vien koka forma neļauj adekvāti atspoguļot radniecības attiecības starp taksonomiskajām vienībām. Piemēram, mūsdienu labības šķirņes ir veidotas no neliela skaita vecākaugu krustojot tos dažādās kombinācijās
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 23
Filoģenētisko koku novērtējums
• Statistiskie testi filoģenētisko koku novērtējumam Jackknifing – nejauši izvēlēta sākotnējo datu daļa tiek analizēta līdzīgā veidā. Ja daļa datu dod līdzīgu koku kā viss datu kopums, filoģenētiskajam kokam var ticēt Bootstrapping – sākotnējie dati tiek randomizēti un no tiem tiek izveidots jauns līdzīga izmēra datu fails, ko analizē ar to pašu metodi. Parasti analizē vismaz 100 randomizētas datu kopas katrai izveidojot savu filoģenētisko koku. No tiem izveido konsensus koku
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 24
Filoģenētiskās analīzes programmas
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 25
http://evolution.genetics.washington.edu/phylip/software.html
Filoģenētiskās analīzes programmas
• PHYLIP http://evolution.gs.washington.edu/phylip.html
• PHYLIP interneta variants http://bioweb2.pasteur.fr/gensoft/phylogeny/parsimony.html
• Felsenstein, J. (1989) PHYLIP - Phylogeny Inference Package (Version 3.2). Cladistics, 5: 164-166
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 26
Filoģenētisko koku apskates programmas
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 27
Filoģenētisko koku apskates programmas
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 28
TreeView http://taxonomy.zoology.gla.ac.uk/rod/treeview.hml Page RDM (1996) TREEVIEW: An application to
display phylogenetic trees on personal computers. Computer Applications in the Biosciences, 12: 357-358
Alfa globīnu gēnu filoģenēze
• Cilvēka un dzīvnieku hemoglobīnu veido divas alfa un divas beta globīna subvienības (a2b2)
• Filoģenētiskai analīzei nepieciešams sekvenču daudzkārtējs salīdzinājums
• Salīdzināsim MP un ML metodes filoģenēzes rekonstrukcijā
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 29
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 30
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 31
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 32
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 33
PROTPARS
• Rezultāti parādās 2 failos: outfile – satur informāciju par filoģenētisko analīzi outtree – satur filoģenētisko koku (šajā gadījumā 3 dažādus vienādi parsimoniskus kokus)
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 34
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 35
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 36
PROML
• ML programma aminoskābju sekvenču analīzei
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 37
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 38
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 39
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 40
Bootstrapping
• Izmanto to pašu alfa globīnu aminoskābju sekvenču salīdzinājumu
• Izmanto programmu seqboot no PHYLIP paketes, lai veiktu bootstrapping izveidojot 100 datu kopas
• Analizē 100 datu kopas ar protpars programmu, iegūstot filoģenētiskos kokus visām 100 datu kopām
• Izmanto programmu consense, lai iegūtu konsensus filoģenētisko koku
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 41
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 42
1
2
3
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 43
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 44
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 45
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 46
Filoģenētiskās analīzes programmas
• MEGA (Molecular Evolutionary Genetics Analysis) (http://www.megasoftware.net/)
• Tamura K, Dudley J, Nei M, Kumar S (2007) MEGA4: Molecular Evolutionary Genetics Analysis (MEGA) software version 4.0. Molecular Biology and Evolution 24: 1596-1599
• Kumar S, Tamura K, Nei M (2004) MEGA3: Integrated Software for Molecular Evolutionary Genetics Analysis and Sequence Alignment Briefings in Bioinformatics 5:150-163
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 47
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 48
Seminārs 17.11.2011.
Seminārs
• Uzdevumu risinājumi - prezentācija, kurā parādās risinājums soli pa solim
• Diskusija par metodēm un iegūtajiem rezultātiem
• Konsultācija - ?
2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 50