tÀi liỆu hỌc tẬp tin sinh hỌc ĐẠi cƯƠng trần văn lăng …

20
1 TIN SINH HỌC ĐẠI CƯƠNG (Introduction to Bioinformatics) PGS.TS. Trần Văn Lăng Email: [email protected] A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 1 TÀI LIỆU HỌC TẬP Trần Văn Lăng, Ứng dụng Tin học trong việc giải quyết một số bài toán của Sinh học phân tử. Nxb. Giáo dục, 2008, 230tr. A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 2 2 TÌM KIẾM TRÌNH TỰ TƯƠNG ĐỒNG TRÊN NGÂN HÀNG DỮ LIỆU Chương 2 : A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 3 3 NỘI DUNG Một số ngân hàng dữ liệu trình tự DNA Cơ sở dữ liệu cấu trúc PDB BLAST trong việc tìm kiếm tương đồng A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 4 4

Upload: others

Post on 16-Oct-2021

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

1

TIN SINH HỌC ĐẠI CƯƠNG(Introduction to Bioinformatics)

PGS.TS. Trần Văn LăngEmail: [email protected]

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY

1

TÀI LIỆU HỌC TẬP

• Trần Văn Lăng, Ứng dụng Tin học trong việc giải quyết một số bài toán của Sinh học phân tử. Nxb. Giáo dục, 2008, 230tr.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 2

2

TÌM KIẾM TRÌNH TỰ TƯƠNG ĐỒNG TRÊN NGÂN HÀNG DỮ LIỆU

Chương 2:

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 3

3

NỘI DUNG

• Một số ngân hàng dữ liệu trình tự DNA• Cơ sở dữ liệu cấu trúc PDB• BLAST trong việc tìm kiếm tương đồng

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 4

4

Page 2: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

2

MỘT SỐ NGÂN HÀNG DỮ LIỆU TRÌNH TỰ DNA

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 5

5

1. Một số ngân hàng dữ liệu

• GenBank• EMBL• DDBJ

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 6

6

GenBank

• GenBank là cơ sở dữ liệu trình tự gen của NIH (National Institutes of Health)

• Nhằm tập hợp các trình tự DNA được công bố kèm theo lời chú thích

• http://www.ncbi.nlm.nih.gov/genbank/

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 7

7

• 20/9/2012: có 126.551.501.141 bases, từ 135.440.924 sequences.

• 15/8/2013: có 154.192.921.011 bases, từ 167.295.840 sequences.

• 15/8/2014: có 165.722.980.375 bases, từ 174.108.750 sequences

• 15/8/2015: có 199.823.644.287 bases, từ 187.066.846 sequences

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 8

8

Page 3: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

3

• 15/8/2016: có 217.971.437.647 bases, từ 196.120.831 sequences

• 15/01/2019: có 303.709.510.632 bases, từ 212.260.377 sequences

• 15/02/2020: có 399.376.854.872 bases, từ 216.214.215 sequences

• 15/4/2020: 415.770.027.949 bases, 216.531.829 sequences

(Xem ftp://ftp.ncbi.nih.gov/genbank/gbrel.txt)

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 9

9

• Ví dụ, cần tìm giống lúa Việt Nam–Vào trang

http://www.ncbi.nlm.nih.gov

–Nhập vào dòng tìm kiếm tương ứng, chẳng hạn “Vietnam Rice”

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 10

10

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 11

11

• Kết quả đưa ra một danh sách liên quan đến “Vietnam Rice”

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 12

12

Page 4: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

4

• Chọn “Southern rice black-streaked dwarf virus isolate Son La major capsid protein gene, complete cds”, liên quan đến virus lúa

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 13

13

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 14

14

• Để nhận kết quả, chọn nút “Send” ở góc trên bên phải.

• Chẳng hạn, chọn như hình bên để ghi ra file với đầy đủ thông tin theo GenBank

• Khi đó, trên default download folder có tập tin sequence.gb

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 15

15

• Ban đầu GenBank được xây dựng ở Phòng thí nghiệm quốc gia Los Alamos, Hoa Kỳ (LANL -Los Alamos National Laboratory).

• Sau đó, vào năm 1990, được đưa về Trung tâm quốc gia Thông tin Công nghệ sinh học (NCBI -National Center for Biotechnology Information).

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 16

16

Page 5: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

5

• Để cung cấp nguồn tài nguyên về các thông tin sinh học phân tử.

• Thông qua GenBank, NCBI hỗ trợ và phân phối nhiều cơ sở dữ liệu thông tin sinh học khác nhau cho cộng đồng.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 17

17

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 18

GenBank là một bộ phận của International Nucleotic Sequence Database Collaboration

18

• The International Nucleotic Sequence Databases Collaboration phát triển và duy trì sự hợp tác giữa DDBJ, EMBL và GenBank được 24 năm nay (2018)

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 19

19

Sự hợp tác giữa 3 ngân hàng

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 20

20

Page 6: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

6

• Người ta có thể gửi các trình tự sinh học lên GenBank nhờ công cụ:–Sequin (http://www.ncbi.nlm.nih.gov/projects/Sequin/)

• Khi đó người dùng có thể chú giải nhiều thông tin cho trình tự khám phá của mình

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 21

21

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 22

22

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 23

23

http://www.ncbi.nlm.nih.gov/projects/Sequin/

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 24

24

Page 7: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

7

EMBL (http://www.embl.de)

• EMBL là Phòng Thí nghiệm sinh học phân tử của Châu Âu, European Molecular Biology Laboratory

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 25

25

http://www.embl.de

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 26

26

• EMBL thành lập năm 7/1974 với sự tài trợ và giúp đỡ của 17 thành viên thuộc các nước Châu Âu và Israel.

• Cơ sở vật chất của EMBL bao gồm phòng thí nghiệm chính ở Heidelberg (Đức), các trạm ở Hamburg (Đức), Grenoble (Pháp) và Hinxton (Anh), cùng với một chương trình nghiên cứu đặt tại Monterotondo (Ý).

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 27

27

• Trong EMBL có European Bioinformatics Institute (EBI) –là một viện nghiên cứu học thuật về tin sinh học đặt

ở Wellcome Trust Genome Campus ở Hinxton gần Cambridge,

–được thành lập năm 1994.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 28

28

Page 8: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

8

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 29

29

• Ngân hàng EMBL chứa 247.335.689 trình tự bao gồm 429.512.389.024 nucleotide (20 Sep 2012).

• Việc truy cập cũng tiện lợi giống như sử dụng GenBank của NCBI

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 30

30

• Chẳng hạn, Genome đầy đủ của virus dạ dày người C117 (Human enterovirus C117 strain LIT22) được công bố ngày 14 Sep 2012

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 31

31

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 32

32

Page 9: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

9

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 33

33

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 34

34

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 35

35

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 36

36

Page 10: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

10

DDBJ (http://www.ddbj.nig.ac.jp)

• DNA Data Bank of Japan bắt đầu các hoạt động lưu trữ ngân hàng dữ liệu DNA từ năm 1986

• Đặt tại Viện Di truyền quốc gia Nhật Bản - NIG (National Institute of Genetics).

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 37

37

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 38

38

• Việc tìm kiếm trên DDBJ cũng đơn giản và tương tự như trên EMBL hay GenBank.

• Chẳng hạn, chúng ta có ID của bộ gen đầy đủ về Human enterovirus C117 là JX262382

• Việc tìm kiếm như sau:

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 39

39

http://getentry.ddbj.nig.ac.jp/top-e.html

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 40

40

Page 11: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

11

Kết quả tìm kiếm

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 41

41

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 42

42

• Cũng có thể lấy toàn bộ dữ liệu từ các ngân hàng này bằng cách dùng giao thức ftp để truyền tập tin.

• Cụ thể–ftp://ftp.ddbj.nig.ac.jp –ftp://ftp.ebi.ac.uk–ftp://ftp.ncbi.nih.gov

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 43

43

CƠ SỞ DỮ LIỆU CẤU TRÚC PDB

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 44

44

Page 12: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

12

2. Cơ sở dữ liệu PDB

• PDB (Protein Data Bank) là một trong những cơ sở dữ liệu sinh học phân tử đầu tiên trên thế giới được thành lập trước cả những cơ sở dữ liệu DNA.

• Kể từ khi cấu trúc protein đầu tiên được công bố năm 1950 thì mãi đến những năm 1970 thế giới vẫn không có một sự biến động nào đáng kể về số lượng cấu trúc protein.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 45

45

• Năm 1971, PDB được thành lập ở Brookhaven National Laboratory.

• Từ 1998, PDB được chuyển đến cho Research Collaboratory for Structural Bioinformatics (RCSB)

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 46

46

http://www.rcsb.org/pdb/home/home.do

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 47

47

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 48

48

Page 13: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

13

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 49

49

• Trong ngân hàng PDB, –có 84.645 dữ liệu cấu trúc (20/9/2012).–10/9/2013, có 93.788 cấu trúc–23/9/2014, có 103.557 cấu trúc–09/9/2015, có 111.956 cấu trúc–15/9/2016, có 122.583 cấu trúc–18/2/2018, có 138.279 cấu trúc–01/3/2019, có 149.424 cấu trúc

• Chẳng hạn, có thể tìm cấu trúc của “Human Enterovirus”

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 50

50

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 51

51

Protein ID: 3N6L

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 52

52

Page 14: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

14

• Để coi cấu trúc của protein có trong PDB, có thể sử dụng trực tiếp từ trang web của PDB.

• Hoặc có thể coi từ các phần mềm khác. Chẳng hạn, với Jmol viết bằng Java

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 53

53

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 54

54

Mô hình CSDL Protein

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 55

55

Ý nghĩa của các table

• Table PROTEIN: Lưu trữ tên protein, đây là bảng chính trong cơ sở dữ liệu protein

• Table PRO_HEADER: Mỗi mẫu tin trong bảng dữ liệu là mẫu tin duy nhất định nghĩa một tập tin PDB thông qua khoá chính. Mẫu tin này cung cấp thông tin phân loại thực thể. Cuối cùng là thông tin về ngày mà nó được lưu trữ ở PDB.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 56

56

Page 15: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

15

• Table PRO_OBSLTE: Xuất hiện khi cấu trúc của protein bị loại.

• Table PRO_TITLE: Chứa tiêu đề mô tả nội dung của cấu trúc và bất kỳ thủ tục hoặc điều kiện để phân biệt cấu trúc này với cấu trúc khác.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 57

57

• Table PRO_CAVEAT: Cảnh báo các lỗi phục vụ trong một cấu trúc, một mẫu tin sẽ xác định cấu trúc bị rút ra khỏi tập hợp cấu trúc công bố.

• Table PRO_COMPND: Mẫu tin compnd mô tả nội dung của cấu trúc. Mỗi đại phân tử tìm thấy trong cấu trúc được mô tả trong một tập hợp token: giá trị cặp và được tham chiếu đến thành phần mẫu tin compnd khác.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 58

58

• Table PRO_SOURCE: Mẫu tin chỉ định loại tài nguyên sinh học hoặc hoá học của mỗi phần tử sinh học trong cấu trúc.

• Table PRO_KEYWDS: Lưu trữ một tập hợp những khoá thích hợp đến cấu trúc. Các khoá trong bảng KEYWDS cung cấp một ý nghĩa để phân loại cấu trúc.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 59

59

• Table PRO_EXPDTA: Đại diện thông tin về thực nghiệm. Mẫu tin này bắt buộc và xuất hiện trong tất cả cấu trúc

• Table PRO_AUTHOR: Lưu tên của những người tìm ra cấu trúc.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 60

60

Page 16: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

16

• Table PRO_REVDAT: Lưu lại lịch sử sửa đổi của cấu trúc từ khi được công bố.

• Table PRO_SPRSDE: Chứa danh sách mã ID của các cấu trúc bị lạc hậu, bị rút ra khỏi tập dữ liệu đã công bố.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 61

61

• Table PRO_JRNL: Lưu trữ những bài báo mô tả quá trình thực nghiệm tìm ra kết quả. Một cấu trúc có ít nhất một tham chiếu JRNL.

• Table PRO_REMARK1: Lưu trữ chi tiết thực nghiệm, giải thích, ghi chú và thông tin không nằm trong những mẫu tin khác.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 62

62

• Có thể tìm trong tài liệu về cấu trúc của CSDL DNA và Protein

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 63

63

TÌM KIẾM TƯƠNG ĐỒNG TRONG NGÂN HÀNG DỮ LIỆU

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 64

64

Page 17: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

17

BLAST

• BLAST (Basic Local Alignment Search Tool) là công cụ tìm các vị trí tương đồng cục bộ giữa các trình tự sinh học DNA và Protein.

• Được phát triển bởi NCBI.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 65

65

• BLAST tìm kiếm giữa chuỗi truy vấn với chuỗi có trong CSDL bằng:–Phương pháp heurictic–Giải thuật Smith-Waterman

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 66

66

• Mặc dù không chính xác bằng thuật giải Smith-Waterman, nhưng phương pháp heurictic vẫn được chọn lựa bởi cho tốc độ tìm kiếm nhanh gấp nhiều lần khi phải truy vấn trong ngân hàng dữ liệu lớn

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 67

67

• Có 5 chương trình BLAST chính:–nucleotide blast–protein blast–Blastx–tblastn–tblastx

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 68

68

Page 18: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

18

• nucleotide blast: để tìm một trình tự nulcleotide từ CSDL nucleotide

• Thuật toán sử dụng:–blastn, megablast, discontiguous megablast

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 69

69

• protein blast: tìm một trình tự peptide, hoặc polypeptide từ CSDL protein.

• Thuật toán: –blastp, psi-blast, phi-blast, delta-blast

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 70

70

• blastx: tìm một trình tự nucleotide đã biên dịch từ CSDL protein

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 71

71

• tblastn: tìm một trình tự protein từ CSDL nucleotide đã biên dịch

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 72

72

Page 19: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

19

• tblastx: tìm một trình tự nucleotide đã biên dịch từ CSDL nucleotide đã biên dịch.

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 73

73

BLAST (http://blast.ncbi.nlm.nih.gov)

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 74

74

Ví dụ

• Tạo DNA ngẫu nhiên từ http://www.bioinformatics.org/sms2/random_ dna.html

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 75

75

• Sau đó chuyển vào trang dùng Nucleotide BLAST

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 76

76

Page 20: TÀI LIỆU HỌC TẬP TIN SINH HỌC ĐẠI CƯƠNG Trần Văn Lăng …

20

• Kết quả tìm kiếm được:

A.Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 77

77