memahami urutan genom -...

Post on 25-Feb-2018

225 Views

Category:

Documents

5 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Memahami Urutan

Kuliah Umum22 Janu22 Janu

Habib RLaboratorium Genom

Genom

m BB Biogenari 2013ari 2013

Rijzaanimika & Bioinformatika

Manual Kehidupan

"Life DOES come read

VisiGen on DN

n

with instructions, them."

NA Sequencing

Gen vs Genom

Gen vs Genom

Gen vs. Genom

Gen:Genetika (genetics)1 atau beberapa genzoom-in

Genom:Genomika (genomics)Banyak atau seluruh gezoom-out

en

-om & -omika

Genom (gen+kromoso1920), genomika (1980-om: obyek kajian, -omArti: total atau keselurugenom+bioinformatika

Genomika, metagenomepigenomika, proteomiknutrigenomika, farmakotoksikogenomika, glikom

http://omics.org

m, Prof. Hans Winkler, 0-an), -omika (1990-an)ika: bidang kajianuhan(2000-an):

mika, transkriptomika, ka, metabolomika, ogenomika, mika, ekspresomika ...g

-omika

“Omika adalah istilah ubidang ilmu sains dan tinteraksi obyek informa'om' [ ] Fokus utamanom . [...] Fokus utamanobyek informasi sepert2) menemukan jalinan merekayasa jaringan dmemahami dan memanpengaturan; dan 4) medan sub-bidang -omika

omics.org

mum untuk sebuah teknik yang mempelajari asi hayati dalam berbagai nya adalah: 1) pemetaannya adalah: 1) pemetaan i gen, protein dan ligan; interaksi antar obyek; 3) an obyek untuk nipulasi mekanisme nggabungkan aneka -om

a.”

Pengurutan Genom

Sanger, 1975Berbasis kloning, PCR(gel/kapiler)500-1000 pb

m Gen. 1

R dan elektroforesis

Metode Sanger

Sanger utk. Genom

Shotgun sequencingGenom bakteri Haemophilus influenzae

1,830,137 pb25.000 potongan (50K reads)Program bionformatika utk. merakit urutan genom utuh

m

Shotgun Sequenci

Gen

Bacaa

Berjenjang

Bacaa

Pera

Ran

Urutan

ing

nom

an acak

Seluruh Genom

an acak

akitan

ngka

Genom

Pengurutan Genom

2005 (30 tahun setelah

m: Gen. 2

h Sanger)

Pengurutan Genom

Next-generation sequeTanpa kloning!

Pemain (kimia)( )454/Roche (pyrosequenSolexa/Illumina (reversiSolid/ABI (sequencing-b

m: Gen. 2

ncing (NGS)

ncing)ible terminator)by-ligation)

HiSeq2000

Illumina/Solexa seq

PP

P

P

quencing

Pemotongan genomPenambahan adapter

Pustaka DNA genom Pembentukan gugus

Perbanyakan potongan genom pada flow celllewat PCRSolid-state cloning

Pembacaan urutan

Penyiapan Pustaka

Pemotongan GenomNebulizer (gas)Sonicator (suara)g-Tube (gaya sentrifugag Tube (gaya sentrifugaTransposon (enzim)

a Genom

al)al)

Penyortiran ukuran

Proses pembentukan gDNA oleh mesin sekuepanjang potongan DNA

n potongan

gugus dan pembacaan enser hanya efektif pada A tertentu (100 – 500 pb)

Penempelan adaptter

Adapter untuk manipulasi dalam proses lanjutan

Barcode, indeksPemilihan ukuran & kuantifikasi

Bioanalyzer, qPCR

cBOT

Robot pembuat clusterr (gugus)

Pembentukan Gug

Penempelan potongan DNA dari pustaka genom ke flow cell & perbanyakan molekul DNA membentuk gugus 1000-an molekul melalui PCR

us

Pembacaan urutan

Illumina: pengurutan m(sequencing-by-synthe

n DNA

elalui sintesis sis, SBS)

Pembacaan urutan

Siklus 1

Siklus 2

Siklus 3

Siklus 4

Siklus 5, ...

1 2

n DNA

Bacaan 1: GCTGABacaan 2: AGCCG1 lajur flow cell => 100-200 juta gugus/bacaan200 juta gugus/bacaan

Pembacaan urutan

Single-end & Paired-eBacaan ujung tunggal

n DNA

nd reads& ujung berpasangan

Pengurutan Genom

Tanpa perbanyakan poLangsung dari 1 molekNanoteknologi, semikon

H liHelicosIon Torrent

Mendeteksi pelepasan dNTP oleh polimerase

Pacific BiosciencesSingle molecule real tim

m: Gen. 3

otongan DNA!kul DNAnduktor, sensor plasma

proton saat penyisipan

me (SMRT) sequencing

Helicos

Ion Torrent

Pac Bio

Perbandingan

Sanger 8

Roche / 454 4

AB / SOLiD 2x

Illumina / Solexa 2x

800 nt ~80 kb

450 nt 0.5 Gb

50 nt 60 Gb

100 nt 300 Gb

bases 1 Gb

10 Gb

ABsho

(

100 Gb

Perbandingan

rea

per machine run

10 bp 10

1 Gb

100 Mb

10 Mb

1 Mb

B/SOLiDv3, Illumina/GAIIort-read sequencers

454 GS FLX

10+Gb in 50-100 bp reads,>100M reads, 4-8 days)

From John McPherson, OICR

ad length1,000 bp00 bp

ABI capillary sequencer

454 GS FLX pyrosequencer

(100-500 Mb in 100-400 bp reads,0.5-1M reads, 5-10 hours)

(0.04-0.08 Mb in 450-800 bp reads,96 reads, 1-3 hours)

Perakitan urutan gSelayang pandang proses pembacaan selur

Reads

Potongan DNA genom

Contigs

Scaffolds

Pemetaanscaffolds

Peta genom

enomruh genom dengan teknik shotgun.

Gambaran menyeluruh dari semua reads yang saling bersambung dan

membentuk sebuah contig.

Perakitan urutan g

Tampilan dekat: urutan basa dari tiap read

(bacaan) dan posisinya dalam contig(sambungan).

Tampilan dekat: urutan basa dari contig yang

terbentuk.

enom

Istilah

Read (bacaan)Contig (sambungan)Scaffold (rangka)Scaffold (rangka)Gap (celah)

Celah fisik dan celah urCoverage (liputan)Depth (kedalaman)Quality score (skor kua

rutan

alitas basa)

Coverage depth (d

Coverage is the term uto which a large asseminstances of smaller obin which coverage is mread coverage of a genread coverage of a gencontigUkuran genom 1 MbSekuensing: 1 juta bacLiputan: panjang total b

(1 juta X 100 pb) / 1 juta

alamnya liputan)

sed to quantify the extent mbly object is covered by bjects. The three contexts ost often discussed are

nome read coverage of anome, read coverage of a

aan, 100 pbbacaan/ukuran genoma pb = 100X

Panjang potongan genom:

n

L

Panjang potongan genom:jumlah bacaan: npanjang tiap bacaan: l

Definisi: Coverage C = n

Berapa liputan yang cukup?

Model Lander-WatermanDengan asumsi sebaran C=10 akan menghasilkannukelotida.

L

C

L

L

n l / L

n:bacaan yang seragam,

n 1 celah per 1 juta

Q30

Skor kualitas basaSkala phred

QV = - 10 * log10(Pe)

P

g ( )Pe= kemungkinan salah.

Q30: kemungkinan salah 1/1000

99.9% benar

Phred Quality Perror(obs. base)

3 50.12%5 31.62%10 10.00%15 3.16%20 1.00%25 0.32%30 0.10%35 0.03%40 0.01%

Hasil pembacaan

@HWI_0023:1:1:16103

TTATGTGTTTATTACGTTNTTTACGGGTTATTTA

++

hhhhhhghhhhhhghdeeBhhghfffaehghhcX

Berkas format FastqSetiap basa memiliki ko

3:1200 N:0:1

NTTTG......AATGTTTA

Bee__......hfhhghhg

ode skor kualitas

Distribusi skor kuaalitas basa

Harga Genom

Penerapan

Pengurutan DNA, analianalisa ekspresi RNA, variasi DNA struktural, protein-DNA (Chip-Seqanalisa small RNA deanalisa small RNA, de metatranskriptomika, seMesin sama, pendekata

Penyiapan sampel/pustAnalisa data/bioinforma

isa pengaturan gen, penemuan SNP dan GWAS, analisa interaksi

q), analisa DNA metilasi, novo metagenomikanovo metagenomika, ekuensing amplikon,...aan berbeda dalam:taka genomatika

Genomika Fungsio

Sekuen genom +Koleksi mutan

Penyisipan T-Dt ki imutagen kimia

Profil ekspresi gen menMicroarray, ES

Sekuen genom lainPlasma nutfah

AnotasiPrediksi struktuontology), seku

onal

DNA, penandaan transposon, iawi

nyeluruhST, pustaka cDNA, transkriptom

terkait, spesies lain

ur dan fungsi gen (gene uen pengatur

Anotasi

>contig-1GAAAGATCGCTGGTTA

CTCTAATCACTTTTTTTCGCGGTTTCTGCGGATCCGAGTTAAACGCAAGAACCACAGAAAACGTCGTTTCTCGTTCT

APA

CAACCGAATATACAGCTTCTGCTCTGTAATCGTGCCATAAAATAAAGTAACTGATAGTCGCGCCTGAAACAGAAAATATCTCCTCGTTTCCG

A INI?

Anotasi

>gi|359806297Glycine maDATE 3A-like (LOC100

ATGGACCCTCTTGTCATAGATGTTTTGGAGCCTCTCTTA

FEATURES Location/Qsource 1..522

/organism="Glycin/chromosome="18

gene 9..122/note="protein HE

ax protein HEADING 815541)TTGGACGTGTAGTAGG

CTTTCACTAGTTGCGTC

Qualifiers

ne max"8"

ADING DATE 3A-like"

Anotasi

Memahami urutan genoUrutan genom (sambun

Tingkat DNA:gDimana exon, translasi, prom

Tingkat protein:Motif, domain,

Tingkat proses:Seluler, lokasi biokimia

omngan/rangka)

intron, situs awal transkripsi, moter, homologi

situs aktif, enzim

dalam sel, fungsi dalam sel, alur

Penerapan

De novo SequencingPerakitan genom tanpaDraft vs. FinishedContig (sambungan) daContig (sambungan) dapanjangChromosome

Targeted ResequencinFokus pada daerah tertMultiplex (sekali perunu

rujukan

an scaffold (rangka) yangan scaffold (rangka) yang

gtentu: exon, motif, familyutan, banyak sampel)

Penerapan

EpigenetikaMetilasi DNA (ChipSeq)Modifikasi histonKemudahan akses krom

MetagenomikaDe novo sequencing saKeragaman 16S DNAmetatranskriptom

)

matin

ampel lingkungan

Contoh

A complete reference gindeed a valuable resoimprovement is finding variation.

Urutan genom rujukan ipemuliaan tanaman adamemanfaatkan variasi g

genome sequence is urce, but the key to crop and exploiting genetic

itu berharga, tetapi kunci alah menemukan dan genetis

Contoh

A map of rice genome vaof cultivated rice

Nature. 20

S iSequencing:1529 genom padi:

446 Oryza rufip1083 Oryza sa

15 genom pembanding coverage)1 O. Rufipogon (100X coutgroug (50X coverage

ariation reveals the origin

012 Oct 25;490(7421):497-501.

pogon (paired-end, 2X coverage)ativa (paired-end, 1X coverage)

(outgroup, wild oryza 3X

coverage, de novo), 1 e)

Metode

Pemetaan thd. genom Identifikasi SNPGenetika populasi

GWASPopulasi pemetaan, BILAsosiasi fenotipe

AnotasiBLAST, prediksi model

rujukan

L & CSSL

gen, lokasi SNP

Contoh

Resequencing 50 accewild rice yields markersagronomically importan

Xun Xu, Susan McCoucnature biotechnology VJANUARY 2012Cultivar: 40

Japonica: 24Indica: 12

Wild type: 10Rufipogon: 5Nivara: 5

essions of cultivated and s for identifying nt genesch et alVOLUME 30 NUMBER 1

Hasil

Jutaan SNP teridentifikMenguak proses dome

Japonica dan indica secdidomestikasiJaponica bernenek moyChina

Penemuan genRibuan gen terseleksi smungkin penting secara

Penemuan markaSNP untuk pemuliaan p

kasiestikasi padi:cara independen

yang O. Rufipogon dari

selama proses domestikasi, a agronomis

padi

Terima kasih

top related