マイクロアレイと次世代シークエンス データ解析の ......smyd3 smyd4 smyd5 + + +...

48
生物学者のための マイクロアレイと次世代シークエンス データ解析の実際 2011年11月15日 帝京大学 東京医科歯科大学大学院疾患生命科学研究部ゲノム構造制御 田中裕二郎 chromatinstructure.wordpress.com

Upload: others

Post on 28-Jun-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

生物学者のための

マイクロアレイと次世代シークエンス

データ解析の実際

2011年11月15日 帝京大学

東京医科歯科大学大学院疾患生命科学研究部ゲノム構造制御田中裕二郎

chromatinstructure.wordpress.com

Page 2: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

なぜ次世代シークエンス(NGS)か

1. ヒストンメチル基転移酵素ASH1

2. ストレス応答の転写制御因子ネットワーク

マイクロアレイとNGSのデータ解析

1. 遺伝子発現プロファイリング

a. マイクロアレイ・データから興味ある遺伝子を探索する

b. RNA‐seq

2. ChIP解析

a. ChIP‐on‐chip

b. ChIP‐seq

Page 3: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

trxGに属するASH1の分子機能

SET Bromo PHD BAHhistone chaperone homology region2958

ASH1: discs absent, small, or homeotic‐1

Shearn, A. et al. Imaginal disc abnormalities in lethal mutants of Drosophila. PNAS 68, 2594, 1971.

Beisel, C. et al. Histone methylation by the Drosophila epigenetic transcriptional regulator Ash1. Nature 419, 857, 2002.

Methylation of H3 K4, K9, H4 K20

Byrd, K.N. and  Shearn, A. ASH1, a Drosophila trithorax group protein, is required for methylation of lysine 4 residues on histone H3. PNAS 100, 11535, 2003.

Methylation of H3 K4Global reduction of methyl‐K4 in ash1‐/‐ embryos

Page 4: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 5: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 6: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

哺乳類の31のSETドメインメチル基転移酵素

pre‐SET domain

post‐SETdomain

Target

SETD7SETD8

‐‐

‐‐

H3K4H4K20

EZH1EZH2

++

‐‐

H3K27H3K27

SETDB1 + + H3K9

SUV39H1SUV39H2SETMARG9aGLP

+++++

+++++

H3K9H3K9NDH3K9H3K9

ASH1NSD1NSD2NSD3SET2

++++‐

+++++

H3K36H3K36H3K36H3K36H3K36

MLL1MLL4MLL2MLL3SET1ASET1B

‐‐‐‐‐‐

++++++

H3K4H3K4H3K4H3K4H3K4H3K4

MLL5KIAA1757

‐‐

++

NDND

Smyd1Smyd2Smyd3Smyd4Smyd5

+++‐‐

+++++

NDH3K36H3K4NDND

Page 7: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

1. Dual function of histone H3 lysine 36 methyltransferase ASH1 in regulation of Hox gene expression. Tanaka Y, Kawahashi K, Katagiri Z, Nakayama Y, Mahajan M, Kioussis D. PLoS ONE, 2011 (in press)

2. Regulation of early T cell development by the PHD finger of histone lysine methyltransferase ASH1. Tanaka Y, Nakayama Y, Taniguchi M, Kioussis D. Biochem Biophys Res Commun 18:588‐594, 2008.

3. Trithorax‐group protein ASH1 methylates histone H3 lysine 36. Tanaka Y, Katagiri Z, Kawahashi K, Kioussis D, Kitajima S. Gene 397:161‐168, 2007.

Page 8: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 9: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

ASH1

K4me3

K27me3

K36me3

Control

ASH1のゲノム標的を知りたい

ChIP‐seq解析

Page 10: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 11: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

ストレス反応に於けるゲノムスケールでの転写応答

マイクロアレイ + ChIP‐on‐chip解析

Page 12: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 13: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

モチーフ・スキャン

Page 14: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 15: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 16: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

http://chromatinstructure.wordpress.com/protocol/

Page 17: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 18: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

プラットフォーム

マイクロアレイ NGS

• ChIP‐on‐chip• エクソンアレイ

• ChIP‐seq• RNA‐seq

蛍光画像解析 配列情報解析

発現レベルまたはピークの一覧

パスウェイ解析、GO、GSEA、モチーフ解析

データ処理

遺伝子リスト

パターンの相似性または違いで分類

Page 19: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

基本はデータの整形

ほとんどExcelでやってしまいます

ばらつきを補正する

使えるデータを選別する

各種解析ツールが読み込める形式に変換する

Page 20: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

マイクロアレイによる遺伝子発現プロファイリング

Page 21: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

マイクロアレイの種類

GeneChip (Affymetrix) Agilent ArrayHuman Genome U133 Plus 2.0 Array(約47,000の転写産物/約54,000のプローブセット)Mouse Genome 430 2.0 Array(約34,000の確認されたマウス遺伝子を含む)

SurePrint G3 Human Gene Expression 8x60K(27,958のEntrez Gene RNAを含む、34,127の転写産物および7,419のlincRNA)Whole Human Genome 4x44K v2(27,958のEntrez Gene RNAを含む、34,127の転写産物)SurePrint G3 Mouse Gene Expression 8x60K(39,430 Entrez Gene RNAおよび16,251のlincRNA)Whole Mouse Genome 4x44K v2(39,430 Entrez Gene RNA)

新試薬「Low Input Quick Amp Labeling Kit(LIQA)」により、少ないtotal RNA(数十ng)からの解析が可能

アレイ間の差が小さいことが特長 設計、ハイブリ条件を 適化することで、5ケタのダイナミックレンジ

1種類の遺伝子に対して11~20種類の25merのプローブを設計することで信頼性の高いデータ

SurePrintテクノロジーで印刷された60 merの高品質カスタムオリゴアレイプローブ

total RNA 2 μg以上(100~500 ng/μl) total RNA 1 μg以上(100~500 ng/μl)

Page 22: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

Agilent Array

Low Input Quick Amp Labeling Kit (1カラー用)24反応分 ¥198,000

8x15Kアレイフォーマット用消耗品(ガスケットスライド) ¥20,000

RNA Spike In Kit(1カラー用) ¥67,000

SurePrint G3 Human/Mouse GEマイクロアレイキット 8x60K x 3枚 ¥513,000

Gene Expression Hybridization Kit ¥22,400

Gene Expression Wash Pack ¥32,000

Page 23: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

アレイ間の補正

1. 遺伝子名の順に並び替える Excel>データ>並べ替え

2. House Keeping遺伝子のデータを集める

3. House Keeping遺伝子の倍率の平均で割る

4. 補正したシグナル値の順に並び替える Excel>データ>並べ替え

5. 度数分布を描く Excel>データ>データ分析>ヒストグラム

6. 発現していない遺伝子を分ける (ratioの分母にしない)

ばらつきの原因はプローブの作成効率ハイブリ条件

GeneSpringの補正法はpercentilemedianhousekeeping genes

Page 24: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

de Jonge HJ et al. PLoS One. 2007 Sep 19;2(9):e898.

Evidence based selection of housekeeping genes

Page 25: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

Log2(normalized signals)

Freq

uenc

yLog2(normalized signals)

Freq

uenc

y

Page 26: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

発現データから興味ある遺伝子を見つける

発現パターンの違いに着目

Fold Change

p値の評価によっていろいろ(多重比較の補正)

発現パターンの類似性に着目

クラスター分析

階層的クラスター vs. 非階層的クラスター

遺伝子間の(非類似度)の尺度

クラスター同士を結合する基準

Page 27: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

これからは、RNA-seq

Page 28: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

RNA-seqのメリット

ダイナミックレンジが広い高感度正確

• 相似配列や変異の識別• マイクロアレイではバイアスが避けられない• alleleの識別

1bp単位の解像度事前の知識や仮説が必要ないこと生物学的に意味のある情報(splicing, editing, UTR)ハイスループット安い(?)

Page 29: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

Ribominus (Invitrogen) Oligo(dT) beads (Dynabeads)

Page 30: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 31: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

RNAの品質チェック

Page 32: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

RNA-seqデータ解析ツール

Broad Institute GenePattern

• TopHat (Bowtie)参照ゲノムへのアラインメント

• Cufflinks発現量の計算

Page 33: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

遺伝子リストから機能を見つける

Gene Ontology GO

パスウェイ解析 (KEGG, BioCarta) DAVID

遺伝子セット発現解析 GSEA

転写因子モチーフ・スキャン TRANSFAC ProJASPARMAPPER

Page 34: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

GenePatternとDAVIDによるパスウェイ解析

Page 35: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

ChIP‐on‐chip解析

Page 36: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 37: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 38: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

ChIP‐seq解析

Page 39: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

ChIP-seq実験

1. Covaris 超音波破砕 2. ChIP‐seq Sample Prep Kitライブラリー作成

3. クラスター形成 (cBot)

Page 40: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

GA‐L 22 8 83 16482 16048 0 1TGCATAAAGTGCTTCCACCCACATCTCACTGGTCCAAATCTAGTCATGTGGCCACAATTAACTACAAGGAAGGTgghhfhhhgfhhhhhhehghbgdfefgchdba`dc_]a_eabaad^^aa_aad_a¥¥a_^acaaa_G¥_[U¥[Uchr8.fa 118054696R 74 346

Y

BWA

MACS

画像処理 (Base Calling)

Page 41: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

ChIP-seqデータ解析ツール

• BWA (Burrow‐Wheeler Transform Aligner)• Bowtie

参照ゲノムへのアラインメント

• MACS (Model‐Based Analysis of ChIP‐Seq)ピーク検出

Page 42: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

Evaluation of Algorithm Performance in ChIP‐Seq Peak Detection. PLoS ONE, 2010

Page 43: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

UCSCゲノムブラウザーの使い方

Page 44: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 45: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 46: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 47: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36
Page 48: マイクロアレイと次世代シークエンス データ解析の ......Smyd3 Smyd4 Smyd5 + + + ‐ ‐ + + + + + ND H3K36 H3K4 ND ND 1. Dual function of histone H3 lysine 36

SEQAnsweres

A reasonably thorough table of next‐gen‐seq software available in the commercial and public domain

http://seqanswers.com/forums/showthread.php?t=43

次世代シークエンス解析ソフト