実習1： mega6...

実習１： MEGA6 のダウンロードとインストール

MEGAのWebサイトは http://www.megasoftware.net/（下図）。正式には、左側の［Windows］ボタンをクリックし、名

前とメールアドレスを入力して［Submit Request］をクリックすると、ダウンロード用のアドレスがメールで送られる。

実習２：配列データのダウンロードとアライメント例題データ (data)： Actin gene coding region １．配列データのダウンロード

（１） MEGA のメインメニュー[Alignment] – [Query Databanks] を選択する。

http://www.megasoftware.net/

（２） Accession number を入力し、[Search] ボタンをクリックする。

（３）遺伝子全長（1374bp）の配列データが表示される。「CDS」のリンクをクリックすると（①）、CDS の部分だけマークさ

れる（②）。右下の「GenBank」をクリックすれば、タンパク質コード領域（1134bp）の配列だけが表示される（③）。ス

クロールして配列データを確認する。

①

②

③

※CDS （coding sequence）をクリックしないと、イントロンを含むものと含まないものが混在し、アライメントに支障が出る

ので注意する。

（４） [Add to Alignment] ボタンをクリックする。

（５）［Input Sequence Label］ダイアログボックス（右図）が表示されるので、以下のように選択する。

1．「First word」は種名である「Homo sapiens」を選択する。

2. 「Second word」は遺伝子名である「ACTA1」を選択する。

3. 今回は「Use Initial for Genus Name」のチェックを外す。

（６）同じ要領で以下のデータを全て Alignment Explorer にダウンロードする。（スペースで区切って、複数の番号をク

エリにすれば、一度に検索できる。）

gi：5016087: Homo sapiens, actin, alpha 1, skeletal muscle gi：16359157: Homo sapiens, actin, beta gi：11038618: Homo sapiens, actin, gamma 1 gi：11038625: Homo sapiens, actin, gamma 2, smooth muscle, enteric gi：4501882: Homo sapiens, actin, alpha 2, smooth muscle, aorta gi：15928833: Mus musculus, actin, alpha 1, skeletal muscle gi：23271068: Mus musculus, actin, gamma, cytoplasmic gi：28277650: Danio rerio, actin, alpha 1, skeletal muscle gi：3044209: Danio rerio. beta-actin gi：1552221: Oryzias latipes, mRNA for muscle actin gi：3336983: Oryzias latipes, mRNA for cytoplasmic actin gi：156772: Drosophila melanogaster, actin gene, complete cds, locus 88F gi：156758: Drosophila melanogaster, actin gene, complete cds, locus 5C gi：170985: Yeast (Saccharomyces cerevisiae) actin gene gi：2588915: Pneumocystis carinii mRNA for actin

gi：1049306: Arabidopsis thaliana actin-2 gi：30409355: Oryza sativa gi：6934187: Vigna radiata actin

２．配列データのアライメント

（１）「Translated Protein Sequences」タブをクリックし、アミノ酸配列を表示する。

（２）「Ctrl+A」で全配列の全領域を選択し、ClustalW（W）ボタンをクリックし、表示される「ClustalW Parameters」ダイア

ログボックスの「OK」ボタンをクリックし、アライメントを行う。

この条件（デフォルト設定）で得られるアライメントの N 末端領域（開始コドンのすぐ下流）のアライメント精度は通

常よくない。アライメントの精度は DNA 配列でも確認してみよう。

（３）アライメントの最上行（灰色）をドラグし、最初の 10 アミノ酸座だけ選択、アライメントしてみる。

（４）同じ領域について、「Gap Opening Penalty」（Pairwise と Multiple の 2 箇所）を「1」にしてアライメントしてみる。

※理想的には領域毎に適切な「Gap penalty」値を用いてアライメントを行うのがよい。

※構造・機能ドメインのような領域を区別するための情報がある場合、積極的に利用するとよい。

（５）「DNA Sequences」タブをクリックし、DNA 酸配列に戻した後、「Save Session」でデータファイルを保存する。

実習３：分子系統樹の作成

１．近隣結合法による系統樹の作成とブートストラップ・テスト

（１）作成したアライメントファイルを開き、[Data] – [Phylogenetic Analysis] をクリックする。

（２）メインメニュから [Phylogeny]-[Construct/Test Neighbor-Joining Tree] をクリックする。

（３）「Analysis Preferences」で以下のように設定し、DNA 塩基配列（下図左）、タンパク質アミノ酸配列（下図右）のそ

れぞれ場合について系統樹を作成してみる。配列間の距離は、取りあえず p-distance （proportion of different

sites）を用いる（一般的には多重置換を補正する他の方法の方がよい）。

（４） [Compute] をクリックすれば系統樹が作成され、Tree Explorer に表示される（下図）。

（５） Tree Explorer を使って系統樹の形を整える。まず、植物（Arabidopsis、Oryza、Vigna）より、菌類（Saccharomyces、

Pneumocystis）の方が動物に近縁なので、系統樹の根（root）の位置を変え、植物が外群（outgroup）になるように

する。

root が付くべき、植物に至る枝をクリックして選択する。(Click on the branch leading to plants.)

↓

ボタンをクリックして root の位置を変更し、同様に、やを使ってクラスターの順番を整える。

系統樹全体の大きさ、線の太さ、フォントなどは、をクリックして[Options] ダイアログを表示させ、設定する。

（６）ブートストラップ法によって、系統樹の安定性を検定してみる。「Analysis Preferences」の[Test of Phylogeny] で

「Bootstrap method」を選択する。

（７） Tree Explorer では、をクリックすると系統樹全体の書式を整えることができる。枝の太さを 2 pt にしてみよう。

さらに、特定のクラスターを選択し、をクリックすると、選択されたクラスターの属性を設定することができる。脊

椎動物の細胞骨格型のクラスターを青、筋肉型を赤で着色してみよう。

２．最尤法による系統樹の推定

（１）メインメニュから [Models]-[Find Best DNA/Protein Models] をクリックする。

（２） Analysis Preferences の [Substitution Type] で「Amino acid」を選択する。

以下のような結果が出るはず。すなわち、LG+G モデルが最適であると考えられる。

（３）メインメニュから [Phylogeny]-[Construct/Test Maximum Likelihood Tree] をクリックする。

（４）「Analysis Preferences」で以下のように “Best Model” に設定し、系統樹を作成してみる。

（５）得られた最尤系統樹。

※この場合、生物学的には、上の NJ 系統樹の方が妥当な樹形となる。

３．RelTimeによる分岐時間推定

（１）ここでは細胞骨格型のアクチン遺伝子のみを用い、種間の分岐年代推定を行ってみる。脊椎動物には paralog が

複数あるので、以下のように Sequence Data Explorer を使って beta actin のみをチェックする。

（２）次に最尤法で系統樹を推定する。モデルは LG+G を用いる。

（３）Tree Explorer の RelTime のボタンをクリックする。

（４）今回のデータは、進化速度の一定性が乏しく、サイト数も小さいので誤差は求めない。「No」を選択する。

（５）ヒトと酵母の分岐年代を入植するので「Yes」を選択する。

（６）「New」をクリックする。

（７）Taxon A に Homo sapiens、Taxon B に Saccharomyces cerevisiae を選択し、Min および Max Divergence Time に

1216（Time Tree of Life より）を入力し、［Save Change］→［Compute］の順にクリックする（［Compute］の前に［New］

をクリックすれば、他の Min、Max Divergence Time を追加入力することができる）。

（８）以下のような Time Tree に変換される。Human-Drosophila、Saccharomyces- Pneumocystis の分岐年代は「Time

Tree of Life 」（ http://www.timetree.org/ ）で示されるものに非常に近い値であるが、 Human-Danio 、

Oryza-Arabidopsis は実際よりも大きな値となっている。これは、進化速度の系統間差が大きいことと、基準となる

分岐年代（Human-Yeast： 1216 MYA）が古い年代であるためと思われる（多重置換の補正が十分でないと、古

い分岐年代を起点とすると新しい分岐年代は古め、新しい分岐年代を起点とすると古い分岐年代は新しめにバ

イアスして推定される）。

実習1： mega6...

Documents