実習1: mega6...
TRANSCRIPT
実習1: MEGA6 のダウンロードとインストール
MEGAのWebサイトは http://www.megasoftware.net/(下図)。正式には、左側の[Windows]ボタンをクリックし、名
前とメールアドレスを入力して[Submit Request]をクリックすると、ダウンロード用のアドレスがメールで送られる。
実習2: 配列データのダウンロードとアライメント 例題データ (data): Actin gene coding region 1.配列データのダウンロード
(1) MEGA のメインメニュー[Alignment] – [Query Databanks] を選択する。
(2) Accession number を入力し、[Search] ボタンをクリックする。
(3) 遺伝子全長(1374bp)の配列データが表示される。「CDS」のリンクをクリックすると(①)、CDS の部分だけマークさ
れる(②)。右下の「GenBank」をクリックすれば、タンパク質コード領域(1134bp)の配列だけが表示される(③)。ス
クロールして配列データを確認する。
①
②
③
※CDS (coding sequence)をクリックしないと、イントロンを含むものと含まないものが混在し、アライメントに支障が出る
ので注意する。
(4) [Add to Alignment] ボタンをクリックする。
(5) [Input Sequence Label] ダイアログボックス(右図)が表示されるので、以下のように選択する。
1.「First word」は種名である「Homo sapiens」を選択する。
2. 「Second word」は遺伝子名である「ACTA1」を選択する。
3. 今回は 「Use Initial for Genus Name」 のチェックを外す。
(6) 同じ要領で以下のデータを全て Alignment Explorer にダウンロードする。(スペースで区切って、複数の番号をク
エリにすれば、一度に検索できる。)
gi:5016087: Homo sapiens, actin, alpha 1, skeletal muscle gi:16359157: Homo sapiens, actin, beta gi:11038618: Homo sapiens, actin, gamma 1 gi:11038625: Homo sapiens, actin, gamma 2, smooth muscle, enteric gi:4501882: Homo sapiens, actin, alpha 2, smooth muscle, aorta gi:15928833: Mus musculus, actin, alpha 1, skeletal muscle gi:23271068: Mus musculus, actin, gamma, cytoplasmic gi:28277650: Danio rerio, actin, alpha 1, skeletal muscle gi:3044209: Danio rerio. beta-actin gi:1552221: Oryzias latipes, mRNA for muscle actin gi:3336983: Oryzias latipes, mRNA for cytoplasmic actin gi:156772: Drosophila melanogaster, actin gene, complete cds, locus 88F gi:156758: Drosophila melanogaster, actin gene, complete cds, locus 5C gi:170985: Yeast (Saccharomyces cerevisiae) actin gene gi:2588915: Pneumocystis carinii mRNA for actin
gi:1049306: Arabidopsis thaliana actin-2 gi:30409355: Oryza sativa gi:6934187: Vigna radiata actin
2.配列データのアライメント
(1) 「Translated Protein Sequences」タブをクリックし、アミノ酸配列を表示する。
(2) 「Ctrl+A」で全配列の全領域を選択し、ClustalW(W)ボタンをクリックし、表示される「ClustalW Parameters」ダイア
ログボックスの「OK」ボタンをクリックし、アライメントを行う。
この条件(デフォルト設定)で得られるアライメントの N 末端領域(開始コドンのすぐ下流)のアライメント精度は通
常よくない。アライメントの精度は DNA 配列でも確認してみよう。
(3) アライメントの最上行(灰色)をドラグし、最初の 10 アミノ酸座だけ選択、アライメントしてみる。
(4) 同じ領域について、「Gap Opening Penalty」(Pairwise と Multiple の 2 箇所)を「1」にしてアライメントしてみる。
※理想的には領域毎に適切な「Gap penalty」値を用いてアライメントを行うのがよい。
※構造・機能ドメインのような領域を区別するための情報がある場合、積極的に利用するとよい。
(5) 「DNA Sequences」タブをクリックし、DNA 酸配列に戻した後、「Save Session」でデータフ ァイルを保存する。
実習3:分子系統樹の作成
1.近隣結合法による系統樹の作成とブートストラップ・テスト
(1) 作成したアライメントファイルを開き、[Data] – [Phylogenetic Analysis] をクリックする。
(2) メインメニュから [Phylogeny]-[Construct/Test Neighbor-Joining Tree] をクリックする。
(3) 「Analysis Preferences」で以下のように設定し、DNA 塩基配列(下図左)、タンパク質アミノ酸配列(下図右)のそ
れぞれ場合について系統樹を作成してみる。配列間の距離は、取りあえず p-distance (proportion of different
sites)を用いる(一般的には多重置換を補正する他の方法の方がよい)。
(4) [Compute] をクリックすれば系統樹が作成され、Tree Explorer に表示される(下図)。
(5) Tree Explorer を使って系統樹の形を整える。まず、植物(Arabidopsis、Oryza、Vigna)より、菌類(Saccharomyces、
Pneumocystis)の方が動物に近縁なので、系統樹の根(root)の位置を変え、植物が外群(outgroup)になるように
する。
root が付くべき、植物に至る枝をクリックして選択する。(Click on the branch leading to plants.)
↓
ボタンをクリックして root の位置を変更し、同様に、 や を使ってクラスターの順番を整える。
系統樹全体の大きさ、線の太さ、フォントなどは、 をクリックして[Options] ダイアログを表示させ、設定する。
(6) ブートストラップ法によって、系統樹の安定性を検定してみる。「Analysis Preferences」の[Test of Phylogeny] で
「Bootstrap method」を選択する。
(7) Tree Explorer では、 をクリックすると系統樹全体の書式を整えることができる。枝の太さを 2 pt にしてみよう。
さらに、特定のクラスターを選択し、 をクリックすると、選択されたクラスターの属性を設定することができる。脊
椎動物の細胞骨格型のクラスターを青、筋肉型を赤で着色してみよう。
2.最尤法による系統樹の推定
(1) メインメニュから [Models]-[Find Best DNA/Protein Models] をクリックする。
(2) Analysis Preferences の [Substitution Type] で「Amino acid」を選択する。
以下のような結果が出るはず。すなわち、LG+G モデルが最適であると考えられる。
(3) メインメニュから [Phylogeny]-[Construct/Test Maximum Likelihood Tree] をクリックする。
(4)「Analysis Preferences」で以下のように “Best Model” に設定し、系統樹を作成してみる。
(5)得られた最尤系統樹。
※この場合、生物学的には、上の NJ 系統樹の方が妥当な樹形となる。
3.RelTimeによる分岐時間推定
(1)ここでは細胞骨格型のアクチン遺伝子のみを用い、種間の分岐年代推定を行ってみる。脊椎動物には paralog が
複数あるので、以下のように Sequence Data Explorer を使って beta actin のみをチェックする。
(2)次に最尤法で系統樹を推定する。モデルは LG+G を用いる。
(3)Tree Explorer の RelTime のボタン をクリックする。
(4)今回のデータは、進化速度の一定性が乏しく、サイト数も小さいので誤差は求めない。「No」を選択する。
(5)ヒトと酵母の分岐年代を入植するので「Yes」を選択する。
(6)「New」をクリックする。
(7)Taxon A に Homo sapiens、Taxon B に Saccharomyces cerevisiae を選択し、Min および Max Divergence Time に
1216(Time Tree of Life より)を入力し、[Save Change]→[Compute]の順にクリックする([Compute]の前に[New]
をクリックすれば、他の Min、Max Divergence Time を追加入力することができる)。
(8)以下のような Time Tree に変換される。Human-Drosophila、Saccharomyces- Pneumocystis の分岐年代は「Time
Tree of Life 」 ( http://www.timetree.org/ ) で示されるものに非常に近い値であるが、 Human-Danio 、
Oryza-Arabidopsis は実際よりも大きな値となっている。これは、進化速度の系統間差が大きいことと、基準となる
分岐年代(Human-Yeast: 1216 MYA)が古い年代であるためと思われる(多重置換の補正が十分でないと、古
い分岐年代を起点とすると新しい分岐年代は古め、新しい分岐年代を起点とすると古い分岐年代は新しめにバ
イアスして推定される)。