生物群集解析のための類似度とその応用 : rを使っ …日本生態学会誌61 : 3...

19
生物群集解析のための類似度とその応用 誌名 誌名 日本生態學會誌 ISSN ISSN 00215007 巻/号 巻/号 611 掲載ページ 掲載ページ p. 3-20 発行年月 発行年月 2011年3月 農林水産省 農林水産技術会議事務局筑波産学連携支援センター Tsukuba Business-Academia Cooperation Support Center, Agriculture, Forestry and Fisheries Research Council Secretariat

Upload: others

Post on 21-Aug-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

生物群集解析のための類似度とその応用

誌名誌名 日本生態學會誌

ISSNISSN 00215007

巻/号巻/号 611

掲載ページ掲載ページ p. 3-20

発行年月発行年月 2011年3月

農林水産省 農林水産技術会議事務局筑波産学連携支援センターTsukuba Business-Academia Cooperation Support Center, Agriculture, Forestry and Fisheries Research CouncilSecretariat

Page 2: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

日本生態学会誌 61: 3 -20 (2011)

総説

生物群集解析のための類似度とその応用:

Rを使った類似度の算出、グラフ化、検定

秀幸 1*.1.・岡村寛2"1

1 Institute for Ch巴mistryand Biology ofthe Marine Environment, Carl-von-Ossietzky University 01denburg

2(独)水産総合研究センター遠洋水産研究所

Similarity indices, ordination, and community analysis tests using the software R

Hideyuki Doi1桁 ,Hiroshi Okamura2t

lInstitut巴forChemistry and Biology ofthe Marine Environment, Carl-von-Ossietzky University Old巴nburg,

2 National Research Institute of Far Seas Fisheries/University ofWashington

要旨:群集生態学では、古くから類似度指数を用いた解析が頻繁に用いられてきた。しかし近年、汎用性の高い新たな

類似度や検定手法が提案されているにもかかわらず、それらが十分に普及し利用されているとは言い難い。そこで、本

総説では、現在までに発表されている代表的で有用な類似度、それを使ったグラフ表示、統計的検定について解説を行

う。各類似度の成り立ち、指数ごとの特性、利用方法について初学者向けの説明を試みる。各種手法の理解の助けのため、

統計ソフト沢の veganパッケージを用いた分析を取りよげ、例題や付録の Rコードを用いて vegaれによる解析手}II貨を紹

介する。利用実態としては、 Jaccard指数など古くから提案されている指数が近年でも多く用いられているが、 Chaoに

よって近年開発された指数は希少種を考慮した汎用性の高い類似度指数として優れており、 Chao指数の利用が促進さ

れることが望ましい。また、類似度を用いた検定についても PERMANOVAなどの新しい統計手法の利用が図られるべ

きである。今後の群集解析において、これらの手法が取り入れられることにより、より適J切切な生態系の評価が行わjれ/工L

新たな発見につながることがj期現待される。

キーワード :Rソフトウェア、 Chao指数、 PERMANOVA、統計検定、 NMDS

Abstract: Similarity indic巴sare frequ巴ntlyus巴din ecological analyses to compare community structure between ecosystems and

experimental treatments. However, many ecological analyses have used classical similarity indices, even though new similarity

indices and statistical tests have been proposed. In this review, we introduce r巴presentativeand useful similarity indices and

statistical tests for analyzing ecological communities. We recommend using the statistical software R with the "vegan" package

to analyze similarity indices. We synthesized the frequency with which similarity indic巴shave been used for ecological studies

and found that classical similarity indices, such as th巴Jaccardindex, have been used by researchers in the past decade. Here, we

emphasize that the Chao index is one of the best options among similarity indices when considering the probability of rare species

in communities.τ'0 test for differences in community similarity, PERMANOVA is one of the best tests for ecological analyses.

Ecologists should use adequate similarity indices and tests.

Keywords: R statistical software, Chao index, PERMANOVA, Statistical test, NMDS

2010 If三 I月4日受付、 2010年 10月29日受理

*e-mail: hideyl出 .doi@uni-oldenbぽ g.de

「附著者は本総説にMして同等の貢献をしている。1現所属:広島大学サステナブル・デイベロップメント実践研究センター

Present address: Institute for Sustainable Sciences and Development,日iroshimaUniversity 2 Present Address: University ofWashington

3

Page 3: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

はじめに

生物群集は、生息場所(もしくは観測された範閤)に

存在する複数の生物種からなる集団であり、生態学の研

究において最も重要な分類階層の一つである。それゆえ、

生物群集を扱う生態学は群集生態学として、生態学の中

心分野となっている(宮下・野田 2004)0 また、群集レ

ベルの多様性の保全を検討するために、保全生態学の分

野においても群集解析は欠かせないものである (B巴rkes

2004 ; Su et al. 2004) 0さらに近年、メタ群集理論などの

発展により、群集生態学が進展してきており(野田

2008 ;瀧本 2008)、群集理論が空間的・時照的に拡張さ

れるなかでも、各局所群集の構造の違いを詳細に評価す

る必要がある(宮下・野田 2004;野田 2008;瀧本 2008)0

群集生態学は主に群集の種構成や構造の変化に着rl3し

て、現在まで研究が進められてきた。そのため、群集生

態学の研究においては、生物群集構造の比較解析が群集

動態把握の基礎となる O 複数の生物群集問の構造を比較

するには、群集類似度指数(以下、類似度と略記)を用

いた解析が行われることが多い。類似度とは、ある群集

Aと群集 Bの開の類似性に翻する指標である O 要するに、

どの程度 A、B調群集が似ているかを定量的に示すもの

である。よって、類似度を用いることで定量的に群集構

造の変化を取り扱うことができる O また、類似度による

群集問の距離を用いることで多次元尺度法などを用いて

グラフ上に視覚化することもできる O このように群集構

造の変化を理解する出発点として類似度解析は秘めて重

要 である (Legendreand Legendre 1998 ; Krebs 1999 ;

Morlon et aI. 2008) 0本総説でこの綾紹介するように様々

な類似度指数が提案されているが、大きく分けて、個体

数を元にする指標と在・不在データを冗にする指標があ

る(詳細は後述)。尚、近年、種の頻度分布に加え、種間

・系統鴎係を加味した多様性指数や類似度指数が提案

されているが、それらは本総説では取り上げないので、

他の文献を参考にしていただきたい(例えば、 Warwick

and Clarke 2001 大垣 2008)。

一方で現在では、 Hubbell(2001)において生物群集の

統一中立説が提案されて以来、群集動態モデルを利用し

た群集解析が発展しつつあり、様々な数理モデルを用い

た解析が多く用いられるようになってきた。これら先進

的な解析を行う前にも、類似度解析を用いて、まずは生

物群集変化の外観を捉えることは重要で、ある (Morlonet

al. 2008 ; Bunn et al. 2010)。本総説では、そのような観点

から類似度解析に焦点を当てて紹介するが、もちろん本

-岡村克

4

総説で紹介した解析手法だけで生物群集がすべてうまく

解析できるわけではないs また、今設はこのような数理

モデルからの群集解析が広まっていくと考えられる。高

度な数理モデルを利用した群集動態解析については、い

くつか日本語のt込書が出ているのでそちらを参考にされ

たい (Hubbell2009 ;瀧本 2008)0

類似度は古くから使われている古典的手法であるが、

現在でも広く利用され続けている。その手IJ点はいくつか

あるが、まず挙げられるのが、時に数寄一数千種から構

成される複雑な群集の類似性の比較を一つの(統)計量

によって要約して記述することができるということであ

る。そのままだと複雑すぎて同じか違うか判断できない

が、類似疫を使えば、ひとつの指標によって類似の程度

を判断することが可能で、あり、その後の解析も辻較的容

易に行うことができる O このようにひとつの指標によっ

て群集聞の際連性を代表させることは、 i洋条を lつの集

団として考える群集生態学に適した手法であると考えら

れるだろう。さらに、類似度を用いることで多次元尺度

法(後述)などの投眠法によって、群集構造の変化を顕

示することも可能となり、類似度行列に対するノンパラ

メトリック検定によりある特徴をもった群集開の差の有

無を統計的に評価することができる。このような評価手

法の確立・進歩によって、群集生態学の中で、適切な類

似度とそれらを用いた適切な手法を用いて研究を進める

ことがますます重要となってきている。

しかし、さまざまな類似度が提案されている中で、ど

の類似度を用いるべきか、どのような検定手法を利用す

るべきかという解説は少なく、特に近年提案された新し

い類似度やその検定手法についての邦文での解説はほと

んどないのが現状である O そこで、筆者らは近年提案さ

れたものも含めて、方法の開発者よりもむしろ方法のユ

ーザ、ー(多くの生態学者がそうであろう)が理解しやす

いように、類似度、検定手法の基礎概念を解説し、また

その利用実態についてレビューを行う。さらに、それら

の解析方法について、近年、生態学コミュニティーをは

じめとする自然科学分野によって広く利用されている統

ソフト R (http://cran.r-project.org/、2011年 3丹3日確認)

の veganパッケージを用いた解析法を紹介することにす

る (http://cc.oulu.fi/-jarioksa/softhelp/vegan.html、2011年 3

月3B確認)。本稿の読者らは、例データを使って付録 3

(http://cse.fra.affrc.go.jp/okamura/program/vegan/泌氏x.html、

2011年 3月3日確認)にある Rコードを実行することに

よって、各種方法がどのように用いられるかを容易に把

援することができるであろう O これにより、群集の類似

Page 4: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

生物群集解析のための類似度とその志用

定解析に慣れていない初学者が統計解析を行う際のハー

ドルを大幅に低くすることが期待される。 veganは、群集

生態学の分析を広範に取り扱った優れた Rパッケージで、

近年の群集生態学論文の中でも広く和服されている(例

えば、 Lindoet al. 2008 ; Bunn et al. 2010) 0 本稿で紹介す

る内容は veganの機能の一部であるが、本総説がきっか

けとなって veganがより広く活用され、ひいては群集生

態学の発展につながることは、筆者らの願いのひとつで

ある O

ヨド稿の構成は、次の通りである O 最初に、代表的な類

似震に関して、その意味や計算の仕方を初学者にもわか

りやすい形で紹介した後、各指数の近年の利用状況、理

論的観点からどの指数が良いかといったことについて紹

介する。次に、類似疫に基づくグラフ表示、類似度の検

定手法について、再び、意味や計算手法についてできるだ

け分かりやすい直線的な解説を行う O 最後に、群集生態

学研究の類似度とその検定手法を用いた最近の事例を紹

介し、類似度を使った群集生態学の将来展望について議

論する。

類似度

本総説で絹介するすべての計算部では、 veganのアウト

プットにあわせて非類似度(完全に同じ場合は小さな値

(例えば0)、完全に違っている場合は大きな依(例えばI)

となるような指数)を扱う(一般に類似度のとる範関は

0-1の開に限定されないが、しばしばかlの間の値をとる

ものが使用される (Krebs1999))。基本的なデータは表!

のような形のものとなる。ここで、行は比較したい群集を、

列は種を示す。したがって、行列の行 i、列jの要素引は、

群集 iのサンプjレ内の種jの出現個体数である O このデー

タ(表 iもしくは表 lを在不在データに改めた表4) を

使って、いくつかの代表的で有用な(非)類似度を紹介

する O 尚、本総説で用いられる毘語に関しては、付録 l

にまとめる O

Bray幽 Curtis指数

2つの群集に出現する種組成が似ているということは、

種の数を nとするとき、 n次元空間上の点がごく近い距

離にあるということを意味すると考えるのは自然で、ある。

例えば、表 1の群集Aと群集 Bの類似度は、その聞の距

D= 63.25

5

表l.仔uデータ(1弱体数)。

群集¥穣 SI S2 S3 S4 S5 S6

A 100 90 80 20 10 。8 150 100 50 。 。 。C 。 。 。 50 100 150

D 10 9 8 2 。

で与えられる O これはユークリッド距離であるが、違う

距離の測定も考えられる O 絶対債を使うとき、

D =1100 -150 1 + 1 90 -100 1 +…+10…01=120

となり、これはマンハッタン誼離といわれるものである。

どちらの距離を用いても、全ての種数が等しいならば、

距離は Oとなり、 Oが完全な類似を示すことがわかる。

一方、 2つの群集が異なる場合には、距離による指数は

国定した上限値を持たない。群集Bと群集 Cに対する、

ユーク 1)ッド距離は 264.58、マンハッタン距離は 600で、

これらの数字は、パターンは同じでも出現数が異なれば

変わってくる(たとえば、群集の各種の出現数を 2倍す

ると結果が変わる)。表 lの群集Bと若手集 Cは共通の種

を持たないので、これらの群集はどのような指数を使つ

でも完全に“異なる"というはっきりした結論が欲しい

ところである。々似ているときに Oであれば、異なってい

るときには iとなるような襟準化された指数が望ましい

だろう O

Bray-Curtis指数はマンハッタン距離を標準化したもの

で、群集jの種組成を (Xlj,…ぷず)、群集kの種組成を (X1b

-…ぷρとするとき、次の形で与えられる.

2]Xij -Xikl B=尚

之(Xij十九)

上の式の分母と分子を見比べれば、出現種に重なりがな

いとき最大値 lをとることが分かる。よって、この指数

を使えば表 lの群集 8と群集 Cの指数は 1となる(この

ように、 Bray嶋 Curtis指数は、群集が似ているとき Oで、

まったく異なるときに最大値 iをとるものであるので、

正確には非類似度である)。似ているとき lで、異なると

きOをとるようにしたければ、l一β を計算すれば良い (1

-β は:L2min(XρXik)/:L(Xij+Xik)となる)。

表 lのデータと Rのパッケージ veganを利用して、

Bray-Curtis指数を計算してみよう(詳細は付録 3)。ここ

Page 5: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

土居秀幸・岡村 寛

表2. 指数の結果。 小さい)色々な値をとる。これより、標準化することが

1洋条 A B C 必要になる。 O一lの範囲の値をとるためには、最大値

B 0.20

C 0.90 1.00

D 0.82 0.84 0.98

では、 vegdistという関書士をf吏う o 1Hま3にしたカ宝って、

表 1のデータ(ここでは testdataとする)を用意し、

vegdist(testdata, method="bray")

と打ち込んで実行すると、表2にある結果が得られる

(Bray-Curtis指数は vegdist関数の methodのデフォルトに

なっているので、 m巴thodを指定しなくても Bray-Curtis指

数による結果が得られる)。これは各群集開の Bray-Curtis

指数である。群集 BとCの指数は1.0となっており、最

も似ていないということを表す。その他の数値も大体納

得がいくものであるが、群集 A とDの指数が 0.82とな

っているところ治宝気になるところである。群集AとDは、

表 lから分かるようにその種の出現比率は等しく、異な

るのは標本サイズ(標本ごとのデータ数)だけである。

しかし、 BrayωCurtis指数はこれらを異なるものと判断し

ていることになる。これは、 Bray-Curtis指数が種組成の

情報だけを利用して、標本サイズの違いを考慮しないた

めである。また、 Bray-Curtis指数はサンフ勺レの抽出率に

大きく依存する (Chaoet al. 2006b) 0

Morisita指数

Morisita指数は Bray-Curtis指数のように距離に基づく

ものではなく、襟本抽出理論を基礎としている (Krebs

1999, p.391)。そのため、標本サイズの差が考慮されるこ

とになる(標本サイズの差を明示的に考癒することによ

り、標本サイズ、が変わっても、指標の伎は不変となる)。

2つの群集j、kからそれぞれひとつ標本を抜き出すと

いう状況を考える。群集j、kの標本サイズの総和を Nj、

Nk、各種 iごとの襟本サイズを Xij、Xikとするとき、どち

らも同じ種である確率は、

ぜら Xυ Xik. -----'7:i' Nj Nk

で与えられる。群集jとkが似ていなければ、この確率

は小さくなり、似ていれば大きくなるはずである。表 1

の群集BとCのように共通の種がなければ、上の確率は

Oとなる。しかし、 Bray-Curtis指数とは逆に、群集が似

ているとき必ずしも 1にならず、状況によって (1より

6

になるような状況(すなわち最も似ている場合)の伎で

割ってやれば良いが、それは同じ群集から 2つ標本を抜

き出したときに同じ種となる確率

十 Xグ (Xグ 1)一 -'7:i' Nj (Nj -1)

である。ここで、問じ群集から 2つ抜き出すので、 l回

目の抽出時の総標本サイズは Njであるが、 2回目の抽出

では 11う lで、対応する種の観測数もん 1となるこ

とより、上式の右側で… lされていることが理解できる。

2つの群集j、kがあるので、それぞれの群集に対してよ

の式を計算し、その平均値で割ってやることにしよう O

このようにして、 Morisita指数、

2工XijXikC,ー… J=1

ん (λ トλk)NjNk

が得られる O ここで、

勺 工Xij(Xυ一 1) 什 L:Xik(X政一 1)訓一一一~… 入'j(Nj-l) ラル Nk(Nk-l)

である。 Morisita指数は、完全に似ているときにはぼ lの

値をとり、完全に異なっているときは Oとなる。上の式

のλの中の一 lにより、たとえ問じ群集組成を持ってい

たとしても、Gは Iにならず、 lより少し大きい値をとる。

そこで、 λjとんの一 1を取り除いて、 λj=IX;}/N/などと

したものを Horn指数という(別の定義の Horn指数もあ

るので注意 (Krebs1999)) 0 Horn指数は正確に Oとlの

問をとり、最大値が lを超えることはない。 Horn指数の

他の利点は、すべてX/Nの比率で表現されるため比率が

分かっていれば良く、 N、Xが必ずしも整数でなくても良

いところである。

表 lのデータを使って、今度は Morisita指数を計算する。

veganでは非類似度を扱うので、ここでは 1-cλ の結果

が与えられる。

vegdist(testdata, method="morisita")

と打ち込んで=実行すると、表 3にある結果が得られる(詳

細は付録 3)0Hom指数を使いたい場合は、 method="hom"

とすれば良い。表 3では、群集A とDの指数は Oとなっ

ており、標本サイズの違いがうまく考慮されていること

が分かる(上記にある式を用いて計算した結果は ιが 1

を超えるため負の億になるが、 veganでは自動的に Oに補

正される)。群集 A とDは向じ組成(比率)を持ってい

Page 6: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

生物群集解析のための類似度とその応用

表3. Morisita 指数、日om指数の結果。

Morisita

群集 A B C

B 0.06

C 0.93 1.00

D 0.00 0.03 0.93

Hom

群集 A B C

B 0.07

C 0.93 1.00

D 0.00 0.07 0.93

るので、それらの群集 B、Cとの関係は陀じになってい

て欲しいが、Morisita指数で、はわずかに値が異なっている o

Horn指数では、そのあたりも補正されていることが分か

る(表 3)0 Morisita指数は標本サイズの影響を大きく受

けないという点で評価されている (Wolda1981)。また、

シミュレーションテストにより、 Morisitaの指数はほとん

ど不偏であるが、日ornの指数は類似度を若干過小推定す

る(非類似度を過大推定する)ことが知られている

(Ricklefs and Lau 1980 ; Wolda 1981 ; Chao et al. 2006b) 0

一方で、 Morisita指数は、一部の偲体数が綴端に大きい種

の影響を強く受け、希少種の影響は小さく見積もられる

という欠点があることが知られている (Wolda1981)。

Jaccard指数

Jaccard指数は存在/不在データに適用されるものであ

る。表 lは各種の個体数を示しているが、在/不在デー

タではその種がいるかいないかという 110の情報しか得

られないような状況である O 表 lのデータを種の在/不

在のデータに変換すると、表4のようになる O このデー

タは Rでは、 veganの関数 vegdistを使って表 iのデータ

から作ることができる。しかし、そうした変換は vegan

の関数に組み込まれているので、ここでは testdataをその

まま使って説明するが、読者は想定されているデータと

して表4を頭に入れておいて欲しい。

表4のデータから群集 AとBを取り出そう。 2つの群

集に共通に存在する種の数、ひとつの群集にしか存在し

ない種数を数えると、群集のヰ1の在不在が2x 2分割表

の形で整理できて、表 5のようになる。もし、時群集が

似ているならば、共通して存在する種の数は多くなり、

異なっているならば共通して存在する種の数は少なくな

るはずである。したがって、ここでは群集聞に共通に存

7

表4 例データ(在/不夜)。

群集¥稜 SI S2

A

B

C 。 。D

表 5.f1iJデータ(A, B)。

存在する種数A

存在しない稜数

表6.Jaccard指数の結果。

寂/不忍データ

1洋条 A

B 0.40

C 0.67

D

111!11本数データ

若手集

B

C

D

0.00

A

0.10

0.91

0.0。

S3 S4

。。

存在する穏数

3

B

1.00

0.40

fヨ

1.00

0.10

S5 S6

。。 。

存在しない種数

2

C

0.67

C

0.91

在する種数が類似度の指標となる。これを 0-1の問の

数字になるように標準化する必要があるが、群集 Aに存

在する総種数を品、群集8に存在する総種数を SB、間群

集に共通に存在する稜数を S,18とするとき、

J= SA/J

SA +S/J… SA/J

を類似、度の指数とするものを Jaccard指数と呼ぶ。非類似

疫は 1-J = (SA+SS -2S,18)/(S.汁SB-SAB)である。表 5の

データに対する非類似度は、 1-3/(5+3… 3) = 0.4となる。

分割表による類似度には他の定式化もあり、たとえば

Sorensen指数として知られているものは 2S,18/(あ+ら)と与

えられる。その他の指数に関しては、 Legendreand

Legendre (1998)、Koleffet al. (2003) などが詳しい。

RでJaccard指数を計算するには、

vegdist(t巴stdata,method口 "jaccard",binary=T)

とすればよい。 binarγ=Tによって、元の testdataは表4の

ような 0/1データに変換されている。 Jaccard指数の計算

結果を表 6に示す。 designdistは2x 2の分割表データに

Page 7: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

土賠秀幸・岡村

対して vegdistで1及えるよりも広い指標を計算できるもの

であるので、特定の指数を扱いたいときは、 designdistと

いう関数を用いることができる O たとえば、 Sorensen指

数は次のようにして計算される:

des i gnd i s t( tes tda taラ method口 I(A+B-2*J)/(A+B)",

terms="binary")

ここで、 method="(A+B削2吋)/(A+B)"のA、8、Jは上の

Sρ 品、 SABに対応する O 類似度ではなく、非類似度にな

っていることに注意 (method口勺勺/(A+B)"とすれば、類

似度となる)0 designdistを使えば、その他さまざまな指

安土 (Wolda 1981 ; Legendre and Legendre 1998 ; Krebs

1999; Koleff et al. 2003)を自由に計算することができる(詳

細はイ寸録 3)。

ここで、表4のデータに Bray-Curtis指数を適用するこ

とを考えよう O 分母は出現した種の総数となるのであ+ら

である。分子は、種が共通であるときは 0、片方だけに

種が出現する場合は lとなる。 片方だけに種が出現する

場合の総数は S汁S!l 2SA!lであるから、結局 011データ

に対する Bray糊 Curtis指数は Sorensen指数と詞値である O

Jaccard指数と Sorensen指数の隠係より (Sorensen指数 z

2J/(J十1))、 Jaccard指数と 011データに対する Bray“Curtis

指数の詞には 1-J= 2B/(lやめの関係が成り立つ。

Chao et al. (2005)は、 Morisita指標と同様に確率的な標

本i'rlJ出の考え方に基づいて、 Jaccard指数を倒体数データ

に拡張した。 Jaccard指数を変形すると、

J= (SIB / S A ) + (S AB / S B)一(SAB/ SA)(S,1ll / SB)

となるが、 SAB/SAは群集Aから選んだ穂が共通の種であ

る許可11卒、 SAB/んは群集 Bから選んだ種が共通の種である

確率で、分子はそれらを掛けたものであるから、陪1洋条

から選んだ種が共通種である 1{{J1~~ となっている。{路体 lこ

対して同様な考えを拡張すると、種 iから種Sノ18が共通

種と仮定するとき、群集 Aから選んだ種が共通極である

確率 UAは、総↑閲体数を I1A、群集 A、積 lのf周{本数を X;A

として、

X" X吋 X,,

U 4=-4L十一よ"ト・・・十一ーとにnA nA nA

となる o UBを向様に定義すると、個体数データに対する

Jaccard 指数は、

nu u

u

nυ U

+

U

一一J

となる。この考えは、 Sorens巴11指数やその他の在/不在

データに対する指数に対しでも、同f~長 lこ適用される O

表 iの1洋条 CとDに対して計算を行えば、 Uc 0.5、

Uρ= 0.1となり、 f=0.091で、 1-Jム 0.91となる O

この個体数に対する Jaccard指数は veganには実装され

ていない。実際のところ、この指数をさらに拡張した

Chao指数が得られており、シミュレーションテストによ

りChao指数は Jaccard指数より{愛れていることが確認さ

れているため (Chaoet al. 2005, 2006b)、veganには入っ

ていないのであろう o Rを使って依イ本数の Jaccard指数を

計算するのは難しくないので、箔単なプログラム例を付

録 3に与える O 結果を表 6下段に示す。

Chao指数

Jaccard指数は標本サイズの影響を強く受ける。また、

在/不在データだけにしか適用できないという問題があ

った。 Chaoet al. (2005) は、 Jaccard指数に上で示したよ

うな確率的な基礎を与え、個体数データにも適用できる

ような拡張を行った (Sorensen指安土等に対しでも問様に

拡張される)。しかし、古典的な Jaccard指数でも個体数

データに拡張された Jaccard指数でも、それらがサンプリ

ングによって得られたデータであることを考慮していな

い。種のサンプリングデータは、種数一個体数曲線の関

係から、 4寺lこ小スケールでのサンプリングであった場合、

一般に多くの希少種がサンプリングされないまま記録さ

れないことになる (Greenand Young 1993)。そのような

場合、 1洋条問で共通の希少種がたとえ存在したとしても、

サンプルでは Oとなっているので、観測値に基づく類似

度は過小推定される傾向にある。そこで、発見されなか

った共通の種の効果を考悲した方法が必要と考えられた。

群集 Aと群集 8の(実務の)共通種の数をミjf] とする。

希少種はサンプリングにより出現しない可能性があり、

たまたま両方の1洋条で、見落とされ Oとなった場合、実際

には共通種の数は SABであるのに、それから両方ーの群集

でOになるものの種数だけ51いたものが観測された共通

積の数となることになる O したがって、上の個体数デー

タの Jaccard指数に対して、両方の群集で(サンプリング

の結果、見落とされて)0になるものの権率分だけ上乗

せしてやる必要があることになる。観測された共通種の

数を D,J[Jとすると、俗体数データの Jaccard指数の[1"は、

牛(XiA , (nB -1)んや Y=デーー十一一一一-L」 LI(XIB=l)

A 合 η4 刀B 2/+2合 nA

で置き t笑えられることになる。ここで、

8

Page 8: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

生物群集解析のための類似度とその応用

表7.Chao指数の結果。

群集 A 8 C

B 0.10

C

D

0.91

0.00

1.00

0.10 0.90

ん=エ:;lJl[XiA ;::: I,XiB = 1]は群集 Bで 1倒体だけの発....,ρ!

見の共通種数、 f品 2= L;:;lJ l[Xu/ ;::: I,XiB = 2]は群集 8で

2個体だけの発見の共通種数で、 Iはその括弧の中の式が

成立すればしそうでなければOとなる定義関数であるo

Eんの右辺の第 1項は俗体数データの Jaccard指数の UA と

しいので、第 2項が両1洋条で見落とされた共通種の相

対個体数の推定値であることが分かる O この導出は難解

であるが(たとえば、 Chaoet a1. 2006a)、発見されなかっ

たものの頻度は、 l俗だけ発見されたものの頻度、 2偲だ

け発見されたものの頻度から推測されるという考えに基

づいて、ノンパラメトリックな方法で導出されている

(Chao et a1. 2005, 2006a) 0 '1洋条 Bでも同様にUIiを定義す

ると、 Chao指数は、

J … UAUIl -U刷。

A+U[J -u./U[J

で与ーえらi1..る。

実際に、表 lのデータを使って計算してみよう o '1洋条

CとDでは、群集 Dに 11限体だけ発見された種、 2個体

だけ発見された種が見られる O これらは両方 1種である

から、よ/=.1ヮ出 1となる O この{院を代入すると、

30 1 1 100 U,コ=u〆÷一一一一一一=0.5+0.1611 = 0.6611 、 、 30 2300

であるが、群集 Cには i個体だけ発見された種がないの

で、 UD = UD立 0.1となる O 結局、 1-JCh山口 0.90となり、

個体数データに藍接 Jaccard指数を適用した場合よりほん

の少し笹い非類似度が得られた。この数字の差は、サン

プリングによる見落としを考寝しない個体数データに対

する Jaccard指数のバイアスによるものと考えられる O

veganのvegdistには Chao指数が組み込まれている O

1データに対して、 Chao指数を得るには、 vegdist(testdata,

method出 "chaoっとすれば良い(詳綿は付録 3)。結果を表

7に与える。

一授の調査によるシンプルな在/不在データには Chao

指数を使うことはできないが、繰り返し鵠査によりサン

プルされた複数の在/不在データに対しでは問機な Chao

9

指数の計算がI写能である (Chaoet a1. 2005)。

類似度指数の利用

類似度指数の利用実態を鵠べるために、 2009年 10月

21 BにISIWeb of Scienc巴を用いて、本総説で紹介した各

類似度指数名 (Bray制 Curtis、Morisita、Jaccard、Chao) と

"simi1arity"の組み合わせをキーワードとして検索した。

もちろん、論文によっては方法を明記していないものも

あるが、検索結果は利用状況の呂安になると考えられる O

Bray田 Curtis、Morisita、Jaccardについては、 i奇麗の指数と

してそれぞれ、 Bray、日orn、Sorensenもキーワードに加

えて検索した。その結果、 Jaccard/Sorenscn指数が最も利

用されていることが分かった(図 1L これは、 Jaccard指

数が特に DNAjyIio析を{史った遺伝的な類似度を検討するの

に広く使われているためであると考えられる(例えば、

Dombek et a1. 2000 ; Bonin et a1. 2007, j宣伝的な類似度への

適応については下記参照)。また、特に大型動物や鳥類な

ど、在・不在の観測データを持つ群集解析においても、

Jaccard 指数がよく使われている。また、 Bray-Curtis、

Jaccard指数は、過去だけでなく、近年でも多くの論文で

使われていることがみてとれる O 特に Bray-Curtis指数は、

後述する多次元尺度法の類似度として用いられることが

多い。 Bray-Curtis指数は Morisita、Chaoよりも科用され

ており、 2005ij三に提案された Chaoについては、もちろ

ん近年に提案されたばかりということもあり、現在まで

8

Cαココ

ぴL。C曲3 L

ぐC百LDEO

、。。剛刷

」い。コ ロてr

ε コz

~ コ

1985

Jaccard/Sorensen I

f、J

/ ¥J

./ Bray-Curtisl臼f号Y/¥

ヘ/'/¥Morisita/Horn --./¥

J 、 r 、/、

/'/、公ィプ〆Chaoーノ

1990 1995 2000 2005

Year

12111.各類似皮指数で検索された論文数の経年変化。詳しくは本

文“類似皮指数の手IJHf'を参照。

Page 9: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

土居秀幸・関村寛

のところほとんど利用されていない(閲 1)。

現在まで多くの類似度 (Legendreand Legendr巴 1988;

Krebs 1999 ; Ko1eff et al. 2003 ; Chao et al. 2005)が知られ

ているが、そのうちのどれを用いるのが良いかという問

題を理論的な観点から扱う O 類似震は上で述べられたよ

うに異なる観点から、類似H の程度を定義しており、異な

る方法による結果の債の比較には意味がない。例えば、

Jaccard指数で類似度が 0.5であるとき、 Sorensen指数は

0.67となり、異なる指数間で類似度の絶対値をうんぬん

するべきではない (0.5の舗には半分似ているといったよ

うな意味はない)。

類似度には、上で見たように在ー不在データに対する

ものと、個体数データに対するもの、の 2つのタイプが

ある。個体数データそのものが得られない場合も多く、

在ー不在データによる類似度は広く用いられている。在飾

不在データに対するモデルにはそれぞれ特徴があり、磁

の存夜様式(上の SA、品、 S,jsの在り'jJ)に応じてェ異なる

パターンを示すことが知られている (Ko1effet al. 2003) 0

その中でも SOI・ensen指数は、シミュレーションにより

の億からのバイアスの大きさ等の観点で比較的良いパフ

ォーマンスを示すことが知られており (Wo1da1981 ;

Chao et al. 2006b)、在眠不在データに対してしばしば推薦

される類似度となっている o Jaccard指数は、 Sorensen指

数よりもパフォーマンスが若干劣るが (Chaoet al.

2006b)、極端に劣るほどではなく、上の利用実態にある

ようによく用いられる指数である。Cordosoet al. (2009)は、

シミュレーションにより在/不在データに対する性能評

価を行ったが、 Jaccard指数が推薦する指数のひとつとし

て取り上げられている(ここでは、 Sorensen指数の性能

は他のものに比して劣っている)0

Bray-Curtis 指委主は、シミュレーションで良いパフォー

マンスを示す指数とは言えず、しばしば有効性に疑問が

呈されている (Wo1da1981 ; Chao et al. 2006b)。しかし、

多次元尺度法によるグラフ表示で Bray-Curtis指数がよく

用いられることもあり、広く使用されている O

個イ本数を用いた指数では、シミュレーションテストに

より、 Mor・lslta指数、 Horn指数のパフォーマンスが優れ

ていることが報告されている (Wo1da1981 ; Krebs 1999)。

Chao et al. (2006b)は、拡張的なシミュレーションを行い、

彼らが開発したサンプリングによる見落としを補正する

Chao指数は、最も優れたパフォーマンスを示すことを明

らかにした。特に、サンプリング率が低く、希少種が多

く存在するとき、 Chaoの方法は有効であろう。その導出

は複雑ではあるが、上にあるように Rパッケージの

veganはChao指数の利用を可能にするので、 Chao指数は

今後広く利用されるようになるものと考えられる。

なお、推定された類似度の標準誤差や信頼区間につい

ては、ブートストラップ法 (Efronand Tibshirani 1991)な

どにより評価できるであろう (Kiflawiand Spencer 2004)。

多次元尺度法

生物群集データの多変量解析において、非類似度のよ

うな距離測定値に基づいて、似たグループを近くに、異

なったグループを遠くに配置した視覚的な留を示すよう

な次元縮小法は頻繁に用いられている。次元縮小法とし

て主成分分析がよく知られているが、類似度を薩接利用

してデータの配置を行いたいこと、主成分分析で用いら

れる正規性や線形性の仮定が生物群集の分析にそぐわな

い(加藤 1996;大垣 1999) という理由から、群集生態学

においては多次元尺度法 (MDS:multi-dimensional scaling)

と呼ばれる方法が利用されることが多い(例えば、

Katano et al. 2009 ; Hudson and Henry 2009) 0 多次元尺度法

も比較的古くから知られている方法である O

MDSの計算方法はいくつか知られているが、基本的なア

ルゴリズムは次のようなものである (Man1y2005) :

1 それぞれの群集 iに2次元空間上の点 (Xli,X2i)を対応、

させる。

2. 各点の開のユークリッド距離

duzJ(XII-Xij)2÷(X21-X2j)2を計算する。

3. インプットデータである距離(非類似度)行列んを

dijに回帰して、推定値dυ を作ってやる。このdυ は、元

の距離データ δ"が大きければ大きいといったように元の

んの関係を反映しつつ、ののスケールに対応するような

値となっている O

4. 上の 2つの親離のとめの差に関する次のような量

エエ(dii-diY

LLdJ を考える。この最はストレスと呼ばれる。

5. ストレスが小さくなるように点 (Xjη X2i)の位置を変え

る。

ハUI

Page 10: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

生物群集解析のための類似度とその応用

巴00

DFO口

D D

D

山口口守口

C

s 白白口。口

。JD

出白口口l

o 口

日DFO守口a' C A '" o

A

関 3. 非計最多次元尺度 (NMDS) による群#~の~rMl配笹。 Br註y­

Curtis指数を利用。

0.6 0.4 0.2 0.0 -0.2 -0.4

lliI2. 計五七多次元尺度法 (MDS) による 1洋条のZ医院1配霞。

Morisita指数を利用。

0.6 0.4 0.2 。。即日 2

害事がなされる (http://cc.oulu.fi/-jarioksa/softhelp/vegan.

html、2011年 3月 3日確認;詳細は付録 3)0

6. ストレスが十分小さくなるまで、 ヒのステップ 2~5

を繰り返す。

類似度の検定

類似度の検定の問題を考えよう。上のようにして得た類

似度は、ある集iヨI閣で異なるだろうか。類似度を決定す

るような重要な環境要閣は何だろうか。手近にあるデー

タからそのような問題に答えるために、統計的仮説検定

の考え方が必要になる O しかし、類似度は、 Bray-Curtis

指数で述べたように、従来のユークリッド距離とは違う

親離を用いている (Bray-Curtis指数で定義された距離は、

ユークリッド距離と異なる特性を持つ semimetricと呼ば

れる距離になっている (Legendreand Legendre 1998)) 0

また、生態学データは、よく利用される正規分布に従わ

ない場合が多く、従来の方法では不十分である場合も多

い。そこで、類似度行列を用いた検定には、正規分布の

ようなパラメトリックな分布仮定を用いないノンパラメ

トリック法を利用した独自の方法が考案されている。

こに、その代表的なものを紹介する。

Mantel test

ここでは、我々の関心は 2つの(類似度)行列が関連

しているかどうかである。ひとつは上で求めたような各

群集の種の類似度指数の行列であり、もうひとつは各群

集を代表する環境指数の類似度などである o 2つの行列

11

最終的に得られる点仏j,X2i)の位置で群集を配置すること

により、類似度に従って群集の関連性が2次元平面上に

図示されることになる O 上のステップ 3で、距離 dijとん

の回帰として線形田婦や多項式関帰を用いたものを計量

(metric) 多次元尺度法 (MDS)、元のデータの}IJ質序情報

だけを利用して単調回帰 (monotonicregression) を行うも

のを非計量 (non-metric)多次元尺度法 (NMDSもしくは

nMDS) と呼ぶ (Manly2005)。最終的な(収束後の)ス

トレスはあてはまりの尺度となり、 0.1より小さければ良

いあてはまり、 0.2より大きいとあてはまりは思い(平面

上への射影は十分ではない)、といった判断がなされる(大

垣 1999;金 2005)。ストレスとして他の定義も考えられ

る (Edwardsand Oman 2003 ;金 2005)。

古典的な計量多次元尺度法は、主座標分析 (principal

coordinate analysis) とも呼ばれ、 Rに実装されている

(Edwards and Oman 2003 : Dixon 2003 :金 2005)0計量多

次元尺度法の例として、例データ testdataを用いて、非類

似度として Morisita指数を用いると、図 2のような 2次

元プロットを描くことができる(詳細は付録 3)。非計量

多次元尺度の場合として、 Bray-Curtis指数を利用した結

果を図 3に示す。類似度行列の中にゼロがあるとき、

V巴ganで非計量多次元尺度を計算しようとするとエラーが

出るが、ゼロを小さな正数で置き換えることによって計

Page 11: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

土居秀幸・岡村

表8. 環境指数。

群集

B

C

D

A

0.15

0.86

0.05

B C

0.97

0.02 0.94

に関連があるということは、環境指標が似ていると種組

成も似ているといったことを表すことになる。それ故、

ある環境指数と種組成との関連の程度が有意に大きいな

らば、その環境要鴎は群集の多様性を決定する袈国と考

えることができる O

8のような環境指数の類似度行持があるとする。こ

れとよで求めた類似度に関連があるかを統計的に確認す

ることにする。もし、 2つの行列がよく似ているならば、

2つの行列の成分の値は似ていて、各成分に対して相関

を計算すれば大きな値になると考えられる。しかし、仮

に表 8の群集の}II真番を入れかえてみるとする O つまり、

群集 AをB、群集 CをDなどとして、名前を入れかえて、

その行列と表 iの行列を比較する。この場合に計算され

る相隠が冗の行間関の相関より大きければ、各若手集開の

2つの類似度の関連性は疑わしいと考えられる。なぜ、なら、

これは異なる群集のベア問の環境指数の方が、種の類似

度と関連が大きいということであり、その環境指数が群

集ベア開の植の類似度を説明すると考える根拠は薄くな

るからである。この考えを一般化して、ランダムに群集

の名前を入れ替えることにより、 2つの行列院の相関係

数の並べ替え検定 (permutationtest) を行うのが Mantel

testである O 帰無仮説は、 2つの行列の要素11りは関連して

いない、というものである (Legendreand Legendre 1998 ;

Fortin and Dale 2005 ; Manly 2005)。並べ替え検定では、

この帰1!!~仮説のもとで得られる検定統計量の分布をシミ

ュレーションで作ってやり、その分布に対して元のデー

タから得られる検定統計量が極端に大きなものかどうか

で仮説検定を行う。表 iのデータから計算した Chao指数

の結果(表 7)を表 8のデータと比較することを考えよう。

たとえば、表 8の群集をランダムに並べ替えてやって、 C、

8、D、Aが得られたとする O このとき、表 8のデータは、

表 9のようになる O 表 7と表 8の相関は 0.99、表 7と表

9の相関は-0.42である O この結果からすると表 7と表

8の行列はかなり似ていると考えられる O 本当に似てい

るか確認するため、並べ替えを何度も実行し(10,000回

以上が望ましい (F01iinand Dale 2005))、それぞれに相関

係数を計算して帰無分布を作り、帰無分布に対して元の

行列間の相関係数がどのぐらい極端な値かを見てやる O

表9. 表8の環境指数を並べ稼えたもの。

群集 A B C

C

D

0.97

0.94

0.86

0.02

0.15 0.05

ここでは、veganの関数mantelを利用してやろう(付録 3)0

mantelを使った結来、 P僚は 8%だ、った。 5%有意水準で

見てわずかに大きいものの、かなり小さな P値であり、

障者の関連性の高さを示唆するものである(この場合、

群集の数が少ないので、有意差が出にくい例となってい

る)。通常、 2つの行列の関連性の正負に関してはあらか

じめ決まっているので、この場合、片側検定になってい

ることに注意が必要である。並べ替えたデータ(表 9)

に対しでも Manteltestを実行すると、かなり大きな P値

(0.88) となる O ここでは、 Pearsonの相関係数を使った例

を示したが、 method="spearman" , method=" kendalJ"と

指定することにより、ノンパラメトリック相関係数でも

許算可能である。 31回以上の行列潤の関f系を知りたいと

きは、pmiialMante¥ testを利用することができる (Legendre

and Legendre 1998)。

ANOSIM也NalysisQf妄i担ilarities)

次に、類似度がその群集にイす隠するある要因と関連し

ているかどうか、という問題を考える。表 lの群集 Aと

8は 1950年代のデータで、群集 C、Dは問地域を 2000

年代に調査した結果得られたデータであったとしよう。

1950ヨド1-cのグループA、Bと2000if三1-tのグループ C、D

の類似度に違いはあるであろうか。帰無仮説は、 2つの

グループ陀に差はない(同じ母集団分布からのサンプル

である)というものである O このような状況で類似疫の

違いを検定するための方法は、 ANOSIM(Analysis of

Similarities) と日乎ばれている (Legendreand Legendre

1998)0 ANOSIMは}II別立を使った統計量に基づくノンパ

ラメトリックな方法で、 Manteltestと開様に並べ替え検

定によって実行される。考え方は、分散分析に似て、グ

ループ内とグループ間の統計量の差を見て、グループ|習

の差がグループ内の差よりも大きいときは、グループ間

に有意な差があると考えるものである O 表 7の非類似度

に小さいものから順{立をつけると、表 10のようになる。

これから、グループ間の平均順位九は (5吋 +6+2.5)/4

3.625、グループ内の平均順位rwは(2.5十4)/2= 3.おとなる o

ANOSIMの検定統計量ー Rは、

12

Page 12: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

生物群集解析のための類似度とその応用

表 10. 表7の結来を順位化したもの。灰色部分はグループ内、

白部分はグループ問の類似皮指数。

群集 A B C

B 2.5

C

D

5

R=(九一九)/ {η(11 1)/4}

6

2.5 4

で与えられる O ここで、 11は群集の数で今の場合は 11=4

だから、 Rの僚は 0.1おとなる。この Rの値を並べ替え

シミュレーションで得る R*の分布と比較することにな

るO

実際に veganの関数anoSllllを使って計算してみよう(詳

細は付録 3)0表 7のChaoの方法による結果の類似度行

列を使って、 A、Bがグループ l、C、Dがグループ2と

する o anosim 表?の行列、 c(I,1ム2)) として実行して

やると計算結果を得ることができる(付録 3)0 この場合、

結果の P値は 0.314となって有意で、ないという結果が得

られる。

類似度を順位に変換することは必ずしも必要で、はない

が、 NMDSによって与えられる群集問のパターンとの調

和を考えて)11引立統計が用いられる。また、 ANOSIMは、

上の Mante1testと密接に関係している o Mante1 testや

ANOSIMは、 U検定のように分布の同{菌性を仮定してい

るので (Legendreand Legendre 1998)、グループ開の分散

が大きく異なる場合、 Type1 errorやTypeII errorが過大に

なるという問題が起こると考えられる o veganの作者であ

るOkanscnは、この方法に関して疑問を呈し、次に紹介

する PERMANOVAの使用を勧めている O

PERMANOVA

このプ'jj去は、 PERMANOVA(PERmutationa1 Mu1tivariate

ANa1ysis Qf主Ariance) や NPMANOVA(主onE.arametric

盟企NO況がとして知られ、一般の距離行列に対してノン

パラメトリック(多変量)分散分析を行うことを目的と

して開発された。すなわち、ここでは類似度が複数の要

因によってどのように影響を受けるかを検討したい。分

散分析は、グループ間の変動(距離)とグループ内の変

動(毘離)を比較して、グループ間の変動(距離)が相

対的に大きいときグループ関に差があると判断する方法

であるはnderson2001 清出ほか 2004)。ここで、全変

動はグループ内の変動とグループ潤の変動の和に等しい

という性質が用いられる (Craw1ey2005) 0変動を計算す

13

る!努に、重心の位置(通常の(ユークリッド)距離では

平均)を知る必要があるが、これを一般の距離に対して

求めるのは悶難である。そこで、 McArd1eand Anderson

(2001)、 Anderson(2001) は、平均に対ーする 2乗和が各

点の開の 2乗和を点の数で割ったものに等しいという性

質(興味のある読者は付録 2の解説を参照のこと)を利

用して、一般の距離に対しでも変動の言十算を可能にする

方法を考案した。通常の分散分析の場合、会変動 SS7は

グループ詞の変動 SSAとグループ内の変動 SSwの和にな

るが、上の性質(付録 2参照)を使えば、 2点 i、j照の

距離をのとするとき、全変動 SSrは、

お T寸どかとなり、グルーフ。内の全変動 SSwは同様に考えれば、

お11Z72系ld;εη

となる O ここで、 Nは全群集の数、 η はグループ内の群集

の数である(ここで、簡単のため、グjレープ内のi洋条の

数は等しいとしているが、分散分析と同様に等しくない

場合も扱うことが可能である (McArd1eand Anderson

2001)) 0また、引は iとjが同じグループであればしそ

うでなければOとなる変数である。これを使って、グル

ープ間変動 SSAは、 SSA= SSr -SSwから計算される。その

結果、分散分析と同様に、 G をグループの数とするとき、

F

F=~'SA /(α1) SS//, /(N a)

が得られるので、これを使って Fが大きいとき、帰無仮

説(グループ問に差がない)を楽部することになる O こ

のFは従来の分散分析における F統計量とは異なり、 F

分布との比較はなされない。帰無分布は、これまでと問

様に並べ替えシミュレーションによって構成される。群

集の)IIR番をランダムに並べ替えて計算した F*の分布に対

して、在見測された Fカ宝かなりブにきいとき、グループ間に

謹がないという仮説は棄却されることになる。 Anderson

(2001)は、並べ替えシミュレーションの回数として、有

意水準 5%の検定には最小でし000回、有意水準 1%の検

定では最小で 5,000聞が必要であるとしている。並べ替

え検定のようなノンパラメトリック検定を使うことは、

生態学データが正規分布に従うことはまれであること、

ユークリッド距離以外の距離を舘う場合があること、変

Page 13: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

土居秀幸・潤村 寛

数間の柏関が自然、に考慮されることなどから、有効であ

ると考えられる (Anderson2001)。

veganでは関数 adonisによって PERMANOVAを実行で

きる。部データをf吏って、計算してみよう(詳細は付S柔3)。

ここでは、 A、Bが 1950年代のグループ 1、C、Dが

2000年代のグループ2とする。また、そのときの季節は

Aが春、 B、Cが夏、 Dが冬とする。 adonisを使って例デ

ータ testdataに対する計算を行うと、年代によるグループ

化の変数を与-えたときは P11直=8%となり、 5%有意水準

で見て有意でなかった。年代のグループ化と、季節のグ

ループ化問方を見たときには、年代のグループ化は小さ

なp値となり、有意な結果となった。

類似度を用いた研究例

群集!将1fTにおいて、類似度とそれによる関連性の罰示、

検定は今や必須と言える解析手法であり、膨大な数の論

文で解析が行われている。ここではさまざまな利用分野

のヰ:から、一般的な群集生態学、保全生態学的な研究、

遺伝データを使った研究の各分野を取り上げて、それぞ、

れ実際の利用ケースを紹介する O

今までの多くの研究では、 Primerソフトウェア (Primer

ver. 6, Primer-E Ltd., Ivybridge, UK) などの商用ソフトウェ

アが広く用いられていた。しかし、 Primer(ver. 5以下)

による計算には問題がある部分も見つかっており

(Yoshioka 2008)、さらに Primerの最新パージョン (ver.6)

においても本総説で紹介した Chao指数が利用できない。

近年では Rを用いて統計解析をしている論文が増えてお

り、それにともなって veganの利用が増えてきているよ

うである O 今後は 1)Chao指数、 PERMANOVAなどの最

新の統計手法もサポートしていること、 2)open sourceで

統計学者による最新手法の公開が絶え陪なく続いている

こと、 3) なによりフリーソフトであることから、 Rの

veganパッケージの利用がさらに促進されると考えられ

るO

一般的な群集生態学における利用餌

一般的な群集生態学の仮説を検証するj二でLも、類似、度

の解析は古くから広く用いられてきた。古典的な利用例

としては、 Wilson(1974) による鳥類群集と生息場所の

関係、 Menge(1976) による岩礁湖間帯の生物群集と生

息場所の関係、 Salaet al. (1989) による植物群集への捕

食者の影響についての研究などの例が挙げられるo

Wilson (1974)では Hom指数、話enge(1976)では Bray-

14

Curtis指数、 Salaet al. (1989)では Bray-Curtis指数によ

るグラフ (MDSではなく、 polarordinationによる)を解

析に用いている。このように、多くの古典的な群集生態

学的研究において、類似度は広く利用されてきた。

近年では、類似度はメタ群集の解析によく用いられて

いる O その多くは、 Leiboldet al. (2004) によって提案さ

れた、メタ群集の 4つのパラダイム(種選別、個体数効果、

パッチダイナミクス、中立モデル)を検証するものであ

る(詳しくは瀧本 2008を参照)。その一例として、

Yamamoto et al. (2007)では、松島湾の高に生息する蝶群

集を用いて、資源として燥の幼虫が導食する食革群集の

(非)類似度と蝶群集の類似度を Manteltestで比較したと

ころ、有意な正の関係が得られた。しかし、生息場所聞

の距離とは有意な関係は認められなかったことから、彼

らは燦群集の成立には、メタ群集は種の特性に関わらず

ランダムな移入と絶滅でがとまっているとする中立モデル

よりも、資源のニッチが群集を規定するとするパッチダ

イナミクスの効果が大ききことを実証した。このように

群集の類似度はメタ群集の 4つのパラダイムを検証する

のに非常に有用である。近年では variationpartitioningを

類似度行列、生患、場所の距離行列、生息場所環境の違い

の行列に適用することで、メタ群集の 4つのパラダイム

を定量的に検証する研究も知られている(詳しくは瀧本

2008を参罰)。ただし、今のところ Chao指数を使ってメ

タ群集の 4つのパラダイムを検証した例は皆無で、あり、

多くの希少種の存在が考えられるような群集開でのメタ

1洋条の解析においては、 Chao指数を使うことでまた加の

結果がもたらされる可能性がある O

保全生態学的における利用例

保全生態学的な研究においても、類似度の解析は多用

されている O 特に群集があるインパクトや改善を受けた

ときに、群集構造がどのように変化するかについては

MDSによる類似度のグラフ化が有効である。ータjを挙げ

ると、 Katanoet al. (2009)では、ダムが設置されて環境

が劣化しているダム下流の底生動物群集を対象として、

ダム下流の生物群集が支出合流によってもたらされる改

醤効果(穂プールの供給、土砂の供給、水質悪化の緩和

など)について検討した。支川による改善効果がどのよ

うに変化するかを Bray-Curtis指数による N抗 DSと

ANOSIMを用いて解析した。その結果、ダム産下では、

群集はリファレンスサイト(自然状態である地点)と比

べて NMDS上でかなり異なった位震に配置されたが、支

川合流後にはリファレンスにかなり近くなることが示さ

Page 14: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

生物群集解i'fTのための類似度とその応用

れた。このことから支川合流によってもたらされる改普A

効果は、ダムによって劣化された群集をある稜度自然状

態に近づけることがわかった。このように、環境改変や

環境改善の群集への効果が、 NMDSなどのグラフ化や類

似度行列の検定によって定性的・定量的に検討できる。

Su et al. (2004)では、分類群横断的な保全計闘を考え

るとき、従来は種数などの種多様性指数が用いられてき

たが、それだけでは不十分であり、類似度を用いるのが

適切であると主張している。その一部として、草地生態

系の鳥、燥、植物の各群集についての例をあげている。

その結果によると、種数はすべての比較の組み合わせ(剖

えば、鳥の種数と燥の種数など全部で 3つの組み合わせ)

においてさまざまなパターンが見られ、法則性はみられ

なかった。一方、各群集の類似度はすべての組み合わせ(各

地点伺での島、燥、植物群集の類似度の比較)において、

なlEの持関を示した。このように、分類群内の種数

は互いに関連性がないので、様々な分類群の種多様性保

を考える際、共通の指標として用いるには適さないこ

ともある。逆に、 Suet al. (2004)が取り上げた例では、

類似度によって分類群開に共通の傾向が認められ、分類

群横断的に群集構造を捉えるには、種数よりも類似度が

より汎用性が高いと考えられた。 Suet al. (2004)は、様々

な分類群にわたる群集全体を保全するような保全計画を

立案する場合には、種数だけでなく類似度などの指数も

同時に用いることが望ましいと主張している O このよう

に、保全生態学においても今後、類似度を保全計画立案

のための指数のーっとして用い、類似疫の変化をもって

保全の効来を検証していくことが重要になるであろう。

遺伝データを使った研究における利用例

遺伝データによって、群集だけでなく、 f図体群の遺伝

的多型!の類似性を検討・するために、類似度はよく用いら

れている (Boninet al. 2007) 0従来は種の在/不在や儲体数、

現存量などに類似度が用いられてきたが、近年では遺伝

的多型の解析に対する利用が多く見られる O 例えば、

AFLP (Amplified Fragment Length Polymorphism) などの

遺伝多型解析は、個体群内の遺伝的な違いなどを検討す

るのによく用いられる。方法としては、 DNAをある特定

の塩基配列部位を切断する制限酵素で断片化して、その

軒片の長さの違いによって、電気泳動上でゲルバンドの

違いとして検出される(陶山 2005)。そして、ゲルバン

ドの有無を在・不在データとして扱い、主に Jaccardや

Sorensen指数によって、各個体群問の遺伝的な類似度が

求められている (Boninet al. 2007)。遺伝的なデータを用

15

いた詳しい解析については、 Boninet al. 2007のレビュー

を参考にされたい。

細菌群集などの群集解析においては、DGGE(Den島知ring

Gradient Gel Electrophoresis、変性斉IJ濃度勾配ケゃル電気泳動

法)など遺伝子多型解析が行われることが多い。類似度

はこれら遺缶子多担解析から得られる結果を評価するの

にもよく用いられている (Dombeket al. 2000) 0 主に

Jaccard指数などの在不在データを扱う指数が用いられて

おり、それには DGGEなと会で、のゲ、ルバンドの有無を在不

在として扱っている。しかし、 DGGEなどの遺伝子解析

によって得られた OTU(Operational Taxonomic Unit,ゲル

バンドの違いによって分けられた分類群単位)は、直譲

の種数を表していないことから、これらの情報から群集

解析を行うことには批判も多い(例えば、Lindstromet al.

2007)。このことから、類似度などを遺信子多型からの情

報に適用することには注意が必要で、あると考えられ、現

状では DGGEなどから得られた直接の種数を表さない

OTUを用いた類似度解析は推奨できない。また近年では

次世代シーケンサーを用いた、環境中のメタゲノム解析

が盛んに行われてきており、これらの膨大なデータから

情報を引き出すためには類似度解析が有効かもしれない。

まとめと展望

本総説では、類似度とその解析方法について体系的な

解説を行った。近年では Chao指数のような汎用性が高い

指数が潤発されており、現在のところ利用頻度は高くな

いが、今後、群集生態学の論文のrtでChao指数を日にす

る機会は多くなっていくであろう O すでにいくつかの論

文で、Chao指数が用いられているが、他の指数(Bray-Curtis

など)と異なった結果をもたらす場合(例えばLindoet

al. 2008) と、そうでない場合(例えばBunnet al. 2010)

が見られる O この違いは、元々群集にどれほど希少種が

いて過小評価になっているか、サンプルサイズ、種数な

ど様々な理性1から生じていると考えられる。ただし、

Chao指数を用いている論文でも MDSによる視覚化には

Bray-Curtisが用いられている場合が多い。しかし、バイ

アスの大きい類似度の寵用は、その後の類似度を利用し

た解析にも問題をもたらす百]能性がある。本総説では、

希少種が多い状況では Chao指数を用いることを推奨して

いるが、解析の一貫性を考えて、 Chao指数を類似度とし

て採用する場合には抗DSやその検定においても Chao指

数を用いるのが良いと考えられる。ただし、 Chao指数は

使われ出したとはいえ、まだそれほど一般的に認知され

Page 15: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

土居秀幸.I潟村 覚

ているとはいえないので、解析方法についてある程度解

説を船えておくことが翠ましい。また、 PERMANOVAは、

いくつかの論文ですでに利用されており(例えば、

Hudson and Henry 2009)、シミュレーションによって合理

性が確認されていること、汎用性が高いことから、今後

は従来の ANOSIMに代わる手法になっていくと考えられ

るO

本総説では、類似度を用いた解析の欠点については、

特に触れていなかった。確かに、類似度は群集構造を比

較するのに有用であるが、指数化する際に大*日に情報を

減らしているという欠点がある。数百 数千という種の

偲体数、在 .71二在などのデータがたった lつの指標で比

較されるので、重要な情報が失われる可能性がある O こ

の問題については、類似度解析と河持に類似度JJ、外を用

いた方法によって環境要国との多変量解析 (CCA、RDA、

variation partitioningなど)の結果も考慮して総合的な評

価を行うことが有用となる o I洋条の多変量j~HJfについて

は、これら解析方法の多くがveganですでにサポートさ

れており、 veganを使いこなすことによって、最新の手法

による類似度、多変量解析を含めた多くの重要な群集解

析手法を実行することが可能になる。

1洋条生態学は、これからも生態学の中心的課題に取り

組む一大分野として発展していくであろう O また、近年

蓄積が進む長期陪・広範聞に及ぶ大規模な群集データセ

ットは、 1洋条生態学に新たな仮説検証の機会を与えると

考えられるが、このよつな大規模なデータを一元的に解

析するためにも類似度解析は有効であると考えられる(例

えば、 Hudsonand Henry 2009)。実例でも述べたように、

類似度指数は群集解析にとどまらず遺伝的なデータの解

析や、保全計画立案の指標としても用いられつつあり、

古くから知られ使用され続けている解析手法ながら、今

後のさらなる発展と利用が期待される。このように、生

態学会般の研究において欠かせない道呉となっている類

似度解析であるが、本総説で解説した各手法の特性を考

慮して、適切な手法を用いて!終析を進めることが肝要で

ある。適切な手法を用いることが、新しい頑健な知見を

見いだす大きな助けになると期待2される。本総説が類似

度や Eえを使った統計解析の初学者の助けになり、我が閣

の生態学研究の発展に寄与することになるならば、著者

らの大きな喜びである。

明究員制度、独立行政法人国際農林水産業研究センター/

国際共開研究人材育成推進・支援事業による助成を受け

た。大関芳NI、奥図武弘、 i育部雅史、米IIi奇史部、萩野友聡、

漬 111奇畏克の各氏には本稿の校関をお願いし、有益なコメ

ントをいただいた。また、野田隆史氏、島谷健一郎、お

よび無記名の奪読者により原稿は大いに改善された。こ

こに謝意を表する O

引用文献

Anderson MJ (2001) A new method for non-parametric

multivariate analysis ofvariance. Aust EcoI26:32-46

Ander・sonMJ, Millar RB (2004) Spatial variation and effects

of habitat on tempcrate reef fish assemblages in northeastem

New Zealand. J Exp Mar Biol Eco1305:19ト221

Berkes F (2004) Rethil1kil1g community-based conservation

Conserv Biol 18:62ト630

Bonin A. Ehr匂hD, Manel S (2007) Statistical al1alysis of

amplified fragment length polymorphism data: a toolbox for

molecular ecologists and cvolutionists. Mol Ecol 16・3737叩

3758

BUI1I1 WA, Jenkins MA, Brown CB, Sanders NJ (2010) Change

within and among forest cOl11muniti巴s:the il1fluence of

historic disturbance, el1virol1l11ental gradiel1ts, and community

attributes. Ecography il1 press

Chao A, Chazdol1 RL, Colwell RK, Sh巴nT (2005) A l1ew

statistical approach for assessing sil11ilarity of species

cOl11positiol1 with incidence and abundance data. Ecol Let

8:148-159

Chao A, Shel1 TJ, Hwang WH (2006a) Applicatiol1 of Laplace's

boul1darY-l11ode approxil11ations to estil11ate species and

shared species richness. Aust New Zealand J Stat 48: 117-128

Chao A, Chazdon RLラ Colw巴11RK, Shen TJ (2006b)

Abundance同 basedsimilarity indices al1d their estil11atiol1

when there are unseen speci巴S il1 samples. Biometrics

62:36ト371

Cordoso Pラ BorgcsPAV, Veech JA (2009) Testil1g the

performal1ce of beta diversity measures based on incidence

data: the robustness to undersampling. Diversity and

Distributions 15: 108ト1090

Crawly MJ (2005) Statistics: An Introduction using R. Wiley,

New York. (野間口謙太郎・菊池泰樹訳 (2008)統計

学・ Rを用いた入門書.共立出版,東京)

Dixon P (2003) VEGAN, a package of R functions for

community ecology. J Veg Sci 14:927叩 930

Dombek PEラ JohnsonLK, Zimmerley ST, Sadowsky MJ

(2000) Use of repetitive DNA Sequences and the PCR

to differentiate Escherichia co/i isolates from human and

animal sources. Appl Env Microbiol 66:2572-2577

謝辞 Edwards J, Oman P (2003) Dimensional reduction for data

mapping. R News 3/3:2-7

本研究を遂行するにあたり、日本学術振興会海外特別 Efron B, Tibshirani RJ (1991) Statistical analysis in the

16

Page 16: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

生物群集解析ーのための類似度とその応用

computer age. Science 253:390-395

Fortin MJ, Dale M (2005) Spatial Analysis -a guide for

ecologistsヘCambridgeUniversity Press, Cambridge

Green RH, Young RC (1993) Sampling to detect rare species.

Ecol App13:35ト356

Hudson JMG, Henry GHR (2009) Increased plant biomass in

a High Arctic heath community from 1981 to 2008. Ecology

90:2657-2663

日ubbellSP (2001) The unified neutral theory of biodiversity

and biogeography. Princeton University Press

Hubbell, SP (乎尾聡秀・鳥谷健一郎・村上正志訳)(2009)

群集生態学一生物多様性学と生物地理学の統一中立理

論.丈一総会出版,東京

Katano 1, Negishi JN, Minagawa T, Doi H, Kawaguchi Y,

Kayaba Y (2009) Longitudinal macroinvertebrate

organization over contrasting discontinuities: effects of a

dam and a tributary. J N Ame Benthol Soc 28:331-351

加藤和弘(1996)生物群集の多変量解析とその地域環境計

画への応用.ランドスケープ研究 60:46-55

Kiflawi M, Spencer M (2004) Intervals and hypothesis testing

for beta diversity. Ecology 85:2895胸 2900

金 明哲 (2005)Rと多次元尺度法 ESTRELA139:56-61

浩田雅史・関村 克・米111奇史郎・王子松一彦 (2004)資源選

択性の統計解析-1.基礎的な概念と計算方法Iloi乳類科

学 44:129胸 146

Koleff P, Gaston KJ, Lennon JJ (2003) Measuring beta diversity

for presence-absence data. J Ani Ecol 72:367-382

Krebs CJ (1999) Ecological M巴thodology.Addison Wesley

Longman

Leibold MA, Holyoak M,話ouquetN, Amarasekare P, Chase

JM, Hoopes MF, Holt RD, Shurin JB, Law R, Tilman D,

Loreau M, Gonzalez A (2004) The metacommunity concept:

a framework for multi-scale community ecology. Ecol Let

7:601-613

Legendre P, Legendre L (1998) Numerical Ecology. 2nd English

Edition. EIsevier

Lindo Z, Winchester NN, Didham RK (2008) Nested pattems

of community assembly in the colonisation of artificial

canopy habitats by oribatid mites. Oikos 117・1856-1864

Lindstrom ES, Eiler A, Langenheder S, Bertilsson S, Drakare

S, Ragnarsson H, Tranvik LJ (2007) Does ecosystem size

determine aquatic bact巴rialrichenssワComment.Ecology

88:252-253

Manly BFJ (2005) Multivariate Statistical Methods -A primer佃

3rd巴d.Chapman and Hall/CRC, Boca Raton, FL. USA

McArdle BH, Anderson MJ (2001) Fitting multivariate models

to community data: a comment on distanc巴-basedredundancy

analysis. Ecology 82:290拘 297

Menge BM (1976) Organization of the New England rocky

intertidal community: Role of predation, competition, and

environmental heterogeneity. Ecol Monogr 46:355-393

宮下 直・野田隆史 (2004)群集生態学.東京大学出版会,

東京

Morlon H, Chuyong G, Condit R, Hubbel1 S, Kenfack D,

17

Thomas D, Valencia R, Green JL (2008) A general

framework for the distance-decay of similarity in ecological

communities. Ecol Let 1l:904-917

Mountford MD (1962) An index of similarity and its application

to c1assification problems. In: Murphy PW (巴d)Progress in

Soil Zoology, Butterworths, pp 43-50

野田経史 (2008)メタ群集の共存メカニズム一統合的に理

解する.(大串隆之・近藤倫生・野田i在史編)群集生態学

第5巻・メタ群集と空陪スケール.京都大学出版会,京都

大壊俊一(1999)群集組成の多変量解析.Argonauta 1: 15ω26

大垣俊一 (2008) 多様震と類似度、分類学的新指標.

Argonauta 15: 1 0-22

Ricklefs RE, Lau M (1980) Bias and dispersion of overlap

indices: results of some Monte Carlo simulations. Ecology

61:1019俗 1024

Sala OE, Oesterheld M, L巴onRJC, Soriano A (1989) Grazing

effects upon plant community structure in subhumid

grasslands of Argentina. Plant Ecol 67: 1573-5052

Su JC, D巴binskiDM, Jakubauskas ME Kindscher K (2004)

Beyond species richness: Community similarity as a measure

of cross-taxon congruence for coars巴-filterconservation.

Conserv BioI18:167-173

i淘111佳久 (2005)遺伝子の指紋:AFLP分析を用いた森林

構造の解明 ササ群落の隠された構造を暴く一(西脇盟

也・|匂山佳久)森の分子生態学遺伝子が語る森林のす

がた丈一総合出版,東京

瀧本 岳 (2008)メタ群集の理論と適用.(大麻隆之・近藤

f命生・野田陵史編)群集生態学第5巻.メタ群集と空間

スケーjレ.京都大学出版会,京都

Warwick RM, Clarke KR (2001) Practical measures of marine

biodiversity based on relatedness of species. Ocean Mar Biol

AnnR巴v39:207-231

Wilson MF (1974) Avian community organization and habitat

structure. Ecology 55:1017ぺ029

羽W勺oldaH (1981) S剖1I紅m託刈i孔la叙r江yindices, sampl 巴 size and diversity.

Oecologia 50:296-302

Yoshioka PM (2008) Misid巴ntificationof the Bray-Curtis

similarity index. Mar Ecol Prog Ser 368:309-310

Yamamoto N, Yokoyama J, Kawata M (2007) Relative

resource abundance explains butterfly biodiversity in island

eommunities. Pro Natl Acad Sci USA 104: 10524ぺ0529

付録 l 用語

帰無分布.帰無仮説が成り立つと仮定したときのデータ

の確率分布。

ノンパラメトリック(検定)・データの篠率分布に特定の

分布を仮定しない検定。データの順位変換やランダマイ

ゼーション法がよく用いられる。

パラメトリック(検定):データ生成プロセスとして正規

分布や二項分布などのような特定の確率分布を佼定した

検定。

Page 17: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

となることが分かる O すなわち、積の項は 2乗の項に変

形され、 kが Iとj以外の1iEfで N 2俄あることから、

いーが2は最初の 2備とあわせて 2+ (N -2)口 N儒生成さ

れ、 }II買番が異なるものは閉じものとしたので、結局、

土居秀幸・同村

4H{(Yl-y)十+(人1-yJ+(九 1-Yi)

「IIll1111J

、aE》且.

、、‘

E.,,,J,

νy 〆N

νy

d

〆/,z.. 、、

十十

=オ72土N(Yi_y)2

となる o Nに関して整理すると、証明したかった式が得

らi1..たことになる。

標本サイズ (samplesize) 抽出した標本(サンプル)内

のデータの個数。

(襟本)抽出率:母集団のサイズ(データの総個数)に対

する標本サイズの割合。

類似度 Csimilarity) 類似度指数。呉なる群集問の種多様

性(種組成)の差を指数化したものO 似ているほど大き

な値をとり、違っているほど小さな値をとる。

非類似度 Cdissimilarity) 類似度の逆で、異なる群集聞の

謹多様性が違っているほど大きな値をとり、似ているほ

ど小さな値をとる指数。

在・不在データ・その種が存在するかしないかの情報だ

けを記録したデータ。 1(いる)、 o(いない)の二値情報

で構成される O

veganパッケージは R本体には最初からインストール

されておらず、最初に C民生N (http://vegan.r-forge.r-project.

org/、2011年 3月 3日確認)やパッケージインストーラ

ーなどからのダウンロード・インストーjレが必要となる O

Rを起動し、ツールパーのパッケージをクリックし、表

示されたメニューの中から「パッケージのインストール

ー」を選んでクリックすると、 CRANmirrorというのが

出てくる。その中から、例えばJAPAN(Tokyo)を選ぶと、

packagesの一覧が出てくるので、 veganを選んでクリック

すると veganがインストールされる。

本稿では、 Iえによるデータ解析の基本的な説明は行わ

ないので、下のコマンドの意味に興味がある読者は

Crawley (2005) などを参照すること。

尚、下の Rコードは、ホームページ (http://cse企a.affrc.

go.jp/okamura/program/vegan/index.html、2011年 3月 3日

確認)にも掲載されている。

本総説で解説した Rコード付録 3

二乗和の性質に対する注釈

本文中で述べた「平均に対する 2乗和が各点の聞の 2

乗和を点の数で、割ったものに等しいという性繋Jに関す

る簡単な解説を与える O この性質を数式で、書くと、

付録2

土仏-Y)" =

が成り立つということになるo ここで y= ~L九である。最初に、左辺の (Yi-y)2を変形してみよう。

-yf 十勺り~)

n

l一ゲ

Yi+1ー・・・-Yλ,}2

Y i ) + (y i+1 -Y i )

l)Yi-YI-"'-Yト l

立法{(YI-Yi)+ 旬

十一+(Y,y-YiW

#必要なパッケージの呼び出し

library(MASS)

library( vegan)

上の最後の式を展開すると、 2乗の項と積の項が現れる。

i= 1, "', Nのデータに対して、たとえば(YI 必ず は順番

が異なるものは同じ式となるので、展開式の中の 2乗の

項としては i= 1と2の場合の 2翻現れることになる。積

の項、を考えてみよう。 kを(i,j) (i宇 j)とは異なる添字と

して、 #類似度の計算

#例データを testdataに入力

testdataくー matrix(c( 1 00, 150,0, 1 0,90, 1 00,0,9 ,80,50ラ0,8,20,0,50,

2,10,0,100,1,0,0,150,0)

,nrow口 4,ncol=6)

18

Yi)(Yk -Y)

2(Yi -Yj)(Yi -Yk)+2(Yj -Y;)(Yj Yk)

+2(Yk

= (Yi -y)2十(Yi-Yk)ユ+(Yj-Ykf

Page 18: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

生物1洋条解析のための類似度とその応用

rownames( testdata)くー c("A",官","C","D")

as.dist(res)

colnames(testdat昌)くー paste("S",1: 6,sep=" ")

# Bray-Curtis指数

V巴gdist(testdata,method="br註y")

jac.abund(testdata,method="jaccard")

jac.abund(testdata,method="sorensen")

# Morisita指数

vegdist(testdata, method="morisita")

)

O

QU -l

puw 一一d

nu

hut

ρしwl

守A-au t

QU

'廿へ

AU

O

H

qu-いh

hugG

c

q

#

V

#多次元尺産法 (MDS,NMDS)

#Horn 指数

V巴gdist(testdata,method="horn") # Morisita指数による MDS(図 2)

# Jaccard 指数

moridistく-vegdist(testdata, "morisita")

morimdsく輸 cmdscale(moridist,k = 2)

testdata2くー decostand(testdata,"pa")

vegdist(testdata2,method="jaccard")

vegdist(testdata,method口 "jaccard",binary=T)

plot(morimds, type="n", xlab詰 11", ylab=" ")

text(morimds,dimnam巴s(testdata)[[l]])

# Bray-Curtis f旨妥士による NMDS(図 3)

# Sorensen 指数 bcdist <-vegdist(testdata, "bray")

designdist(testdata, method="(A+B蜘 2* J) / (A + B)" , bcmdsくー isoMDS(bcdist,k = 2)

t巴rms=ピ"もbina包lγγ"ツ plot(bcl立mτl1ds$point鉛s,typ巴二詰d之='川", x刈lab="", y計lab="")

text(bcmds$points,dimnames(testdata)[[ 1]])

# 11き|体数データのための Jaccard. Sorensen指数

jac.abundく伽 function(x,method="jaccard") {

n1くー nrow(x)

# Chao指数による NMDS(類似度 Oを小さな正数で置き

換えている)

Nく“ rowSums(x)

yく跡 x/i吋

chmdsく句 metaMDS(testdata,dist="chao", k口 2,

zerodist="add")

plot( chmds$points, tザype=ピ"

t臼巴X刈t(いChl打mηlds$pointおs,d必Imna創m巴s(t匂es幻tda瓜ta吟)[[1円]]))

resく-matrix(O,nrowヰ n1,ncol=n1)

#類似震の検定

for (i in 1 :(n1-l)){

for U in (i+ 1):nI){ #データを envlに入力

Uく-sum((y[i,]*y[j,]>O)*y[i,]) envlく凶 matrix(c(0,0.15,0.86,0.05,0.15,0,0.97,0.02,0.86,0.97,0,

Vく-sum((y[i,]*y[j,]>O)*y[j,]) 0.94,0.05,0.02,0.94,0),nrow口 4,ncol=4)

if (method=="jaccard") res[j,i]く伽 l-ifelse(U*V>O,じ*V/

(じ+V-U*V),O) # Table 8の形式

if (method=口 "sorensenつres[j,i]く- 1ぺfelse(U*V>O, env2く-envl[c(3ユ,4,1),c(3,2,4, 1)]

2*U*V/(U+V),0)

# Mantel test

envlくー as.dist(env 1)

env2く制 as.dist(env2)

rownames(res)く-colnames(res)くー rownames(x)

19

Page 19: 生物群集解析のための類似度とその応用 : Rを使っ …日本生態学会誌61 : 3 -20 (2011) 総説 生物群集解析のための類似度とその応用: Rを使った類似度の算出、グラフ化、検定

chaolくー V巴gdist(testdata,method=" chao ")

cor( as.numeric( chao 1 ),as.numeric(巴nvl))

cor( as.numeric( chao 1 ),as.numeric( env2))

mantel( chao 1 ,env 1)

mantel( chao 1 ,env2)

#ANOSIM

土居秀幸・関村寛

20

anosim( chao 1 ,c( 1,1ム2))

# NPMANOVA (PERMANOVA)

Xlく-c(l, 1 ,2,2)

X2く輔 c(l,2,2,3)

adonis( testdata~ X 1 ,method口 chao )

adonis( testdata~ X 1 + X2,m巴thod口 chao )