Úvod do gradientové analýzy

Koncept společenstva

(Mike Austin)

Koncept kontinuální proměnlivosti

(Mike Austin)

Skutečná situace je někde mezi tím a je složitější

Původně (a v teorii)

• Koncept společenstva byl základem klasifikačních metod

• Koncept kontinuální proměnlivosti byl základem ordinačních metod (gradientové analýzy)

A v praxi ...

• Pokud potřebuji vegetační mapu (nebo kategorie stanovišť pro ochranu přírody) – budu užívat klasifikaci

• Pokud mne zajímají změny, gradienty, vztahy – použiji gradientovou analýzu (ordinace)

Metody gradientové analýzy

pH

CO

VE

R

0

10

20

30

40

5 6 7 8 9

• Pro krátký gradient je model lineární odezvy dobrou aproximací

• Pro delší gradient ale není

Model druhové odezvy

Pozor!

• Ve většině případů ani lineární ani unimodální model nepopisují skutečný vztah většiny druhů k prostředí

• Užívám metody založené na jednom z těchto modelů ne proto, že bych věřil, že se druhy podle nich opravdu chovají, ale protože je považuji za rozumný kompromis mezi realitou a uchopitelností (srovnávání mezi druhy)

Odhad parametrů unimodální křivkymetodou váženého průměrování

n

ii

n

iii

Abund

AbundEnvSpWA

1

1)(

n

ii

n

iii

Abund

AbundSpWAEnvDS

1

1

2))((..

Optimum Tolerance

Environmental variable

Sp

eci

es

ab

un

da

nce

0

1

2

3

4

5

0 20 40 60 80 100 120 140 160 180 200

604.9/564)(

1

1

n

ii

n

iii

Abund

AbundEnvSpWA

Výpočet váženého průměru

Environmental variable

Sp

eci

es

ab

un

da

nce

0

1

2

3

4

5

0 20 40 60 80 100 120 140 160 180 200

Techniky založené na lineárním modelu druhové odezvy jsou vhodné pro homogenní data, metody váženého průměrování (unimodální) jsou vhodné pro více heterogenní data

Pro kratší gradient ...

s

ii

s

iii

Abund

AbundIVSampWA

1

1)(

Kalibrace (vážené průměrování)

Nitrogen IV Sample 1 IV x abund. Sample 2 IV x abund.Drosera rotundifolia 1 2 2 0 0

Andromeda polypofila 1 3 3 0 0Vaccinium oxycoccus 1 5 5 0 0Vaccinium uliginosum 3 2 6 1 3

Urtica dioica 8 0 0 5 40Phalaris arundinacea 7 0 0 5 35

Total 12 16 11 78Nitrogen (WA): 1.333

(=16/12)7.090

(=78/11)

Ordinační metody

Ordinační diagram: druhy a vzorky

Blízkost znamená podobnost a (ještě více) odlehlost nepodobnost

Ordinační diagram:přidány charakteristiky prostředí

Dvě formulace cílů ordinačních metod

• Najdi uspořádání vzorků v ordinačním prostoru, které nejlépe odpovídá jejich vzájemné podobnosti v druhovém složení.Mnohorozměrné škálování (multidimensional scaling) – PCoA a NMDS

• Najdi „latentní“ proměnné (ordinační osy), nejlépe předpovídající hodnoty pro všechny druhy (tj. druhové složení vzorků).Je třeba zvolit model druhové odezvy (lineární vs. unimodální) – odpovídající míry distance!

Dvě formulace cílů (2)

• Obě formulace cílů ordinačních metod (konfigurace bodů vs. hledání latentních vysvětlujících proměnných – gradientů) často vedou k jednomu řešení:

• Lineární metoda PCA - osy jsou nejlepší prediktory pro lineární model a rozmístění bodů odráží Eukleidovské distance

• Unimodální metoda CA - osy jsou nejlepší (±) prediktory pro unimodální model a rozmístění bodů odráží chi-square distance

Manipulace s daty• Transformace je algebraická funkce, kterou lze

aplikovat nezávisle na každou hodnotu (log, √)

• Standardizace (sensu lato) se provádí ve vztahu k hodnotám ostatních druhů ve vzorku (standardization by samples) nebo ve vztahuk hodnotám druhu v ostatních vzorcích (standardization by species)

• Dva typy standardizace: centrování (odečtení průměru, obvykle pro druhy) a standardizace (v užším smyslu) – vydělení normou

2,2

1,12,1 )( j

s

jj XXED

Při užití Eukleidovské distance s daty, u kterých chceme standardizovat přes vzorky, je lepší použít standardizaci normou, nikoliv na konstantní součet

Eukleidovská distance (lineární metody)

Chi-square distance(unimodální metody)

2

1 2

2

1

1212

1

n

i

ii

i S

X

S

X

S

Si+ je součet hodnot všech druhů ve vzorku iS+j je součet hodnot druhu j přes všechny vzorky

Hlavní výsledky ordinační metody

• Skóre vzorků (sample scores): hodnoty latentních proměnných pro jednotlivé vzorky (jejich pozice na ordinační ose)

• Skóre druhů (species scores): parametr modelu druhové odezvy, fitovaného pro každý druh zvláště.

• Pro unimodální metodu jsou skóre druhů jejich optima a skóre vzorků lze získat ze skóre druhů a také naopak.

Výpočet ordinačního modelumetodou váženého průměrování

• [1] začni libovolnými skóre pro vzorky (xi)

• [2] vypočti skóre druhů (yj) váženým průměrováním (regresí) ze skóre vzorků (xi)

• [3] vypočti nová skóre vzorků (xi) váženým průměrováním (kalibrací) ze skóre druhů (yj)

• [4] standardizuj rozsah skóre vzorků („natáhni osu“)

• [5] při již malé změně skóre ukonči, jinak [2]

eigenvaluecharakteristické č.

Charakteristická čísla

• Čím větší charakteristické číslo (eigenvalue), tím více je „jeho“ ordinační osa schopna vysvětlovat data

• V metodách váženého průměrování (WA, unimodální metody) je vždy <= 1 a rovné 1 jen pro dokonalé oddělení (perfect partitioning)

Omezená ordinace(constrained ordination)





• [5] při již malé změně skóre ukonči, jinak [2]

Omezená ordinace(constrained ordination)




• [3a] vypočti mnohonásobnou regresi skóre vzorků (xi) na charakteristikách prostředí a použij fitované hodnoty jako nová skóre vzorků (x’i)


• [5] při již malé změně skóre ukonči, jinak [2]Ordinační osa je zde lineární kombinací charakteristik prostředí

Základní ordinační metody

• Detrending: ->detrended CA=DCA (a DCCA)

• Hybridní analýzy

Linear methods Weighted averaging

Unconstrained Principal ComponentsAnalysis (PCA)

Correspondence Analysis (CA)

Constrained Redundancy Analysis(RDA)

Canonical CorrespondenceAnalysis (CCA)

PCA CA

RDA CCA

Detrending a obloukový efekt

• Druhá osa je z definice lineárně nezávislá na první

• To ale nezabrání kvadratické závislosti (arch effect)

• Detrending (by segments) je heuristický způsob, jak zabránit tomu, aby jako druhá (či vyšší) ordinační osa byla „nalezena“ takováto závislost

• Detrending by polynomials

Dva pohledy na použití charakteristik prostředí

• Můžeme spočítat nepřímou ordinaci (PCA/CA/DCA) a interpretovat její výsledky pomocí změřených charakteristik

• Můžeme spočítat omezenou ordinaci (RDA/CCA)

• Tyto přístupy jsou komplementární a máme-li změřené charakteristiky prostředí, je správné použít oba přístupy

• Porovnání výsledků umožní lépe posoudit význam studovaných charakteristik prostředí

Použití kategoriálních proměnných

• Dummy variables

• Jejich použití v regresi odpovídápoužití faktorů v analýze variance

Testy hypotéz v omezené ordinaci

• V omezené ordinaci (=přímá gradientová analýza, CCA nebo RDA) jsou charakteristiky prostředí součástí modelu

• Má zde tedy smysl testovat hypotézy o vztahu složení společenstva k prostředí

• Distribuce testových statistik je neznámá nebo neurčitelná (závislá na konkrétních datech)

• Monte Carlo permutační testy

Monte Carlo permutační test

Plantheight

Nitrogen(as

measured)

1-stpermutation

2-ndpermutation

3-rdpermutation

4-thpermutation

5-thetc

5 3 3 8 5 5 ...

7 5 8 5 5 8 ...

6 5 4 4 3 4 ...

10 8 5 3 8 5 ...

3 4 5 5 4 3 ...

F-value 10.058 0.214 1.428 4.494 0.826 0.###

Úvod do gradientové analýzy

Documents