Úvod do gradientové analýzy
DESCRIPTION
Úvod do gradientové analýzy. Koncept společenstva. (Mike Austin). Koncept kontinuální proměnlivosti. ( Mike Austin). Skutečná situace je někde mezi tím a je složitější. Původně (a v teorii). Koncept společenstva byl základem klasifikačních metod - PowerPoint PPT PresentationTRANSCRIPT
Úvod do gradientové analýzy
Koncept společenstva
(Mike Austin)
Koncept kontinuální proměnlivosti
(Mike Austin)
Skutečná situace je někde mezi tím a je složitější
Původně (a v teorii)
• Koncept společenstva byl základem klasifikačních metod
• Koncept kontinuální proměnlivosti byl základem ordinačních metod (gradientové analýzy)
A v praxi ...
• Pokud potřebuji vegetační mapu (nebo kategorie stanovišť pro ochranu přírody) – budu užívat klasifikaci
• Pokud mne zajímají změny, gradienty, vztahy – použiji gradientovou analýzu (ordinace)
Metody gradientové analýzy
pH
CO
VE
R
0
10
20
30
40
5 6 7 8 9
• Pro krátký gradient je model lineární odezvy dobrou aproximací
• Pro delší gradient ale není
Model druhové odezvy
Pozor!
• Ve většině případů ani lineární ani unimodální model nepopisují skutečný vztah většiny druhů k prostředí
• Užívám metody založené na jednom z těchto modelů ne proto, že bych věřil, že se druhy podle nich opravdu chovají, ale protože je považuji za rozumný kompromis mezi realitou a uchopitelností (srovnávání mezi druhy)
Odhad parametrů unimodální křivkymetodou váženého průměrování
n
ii
n
iii
Abund
AbundEnvSpWA
1
1)(
n
ii
n
iii
Abund
AbundSpWAEnvDS
1
1
2))((..
Optimum Tolerance
Environmental variable
Sp
eci
es
ab
un
da
nce
0
1
2
3
4
5
0 20 40 60 80 100 120 140 160 180 200
604.9/564)(
1
1
n
ii
n
iii
Abund
AbundEnvSpWA
Výpočet váženého průměru
Environmental variable
Sp
eci
es
ab
un
da
nce
0
1
2
3
4
5
0 20 40 60 80 100 120 140 160 180 200
Techniky založené na lineárním modelu druhové odezvy jsou vhodné pro homogenní data, metody váženého průměrování (unimodální) jsou vhodné pro více heterogenní data
Pro kratší gradient ...
s
ii
s
iii
Abund
AbundIVSampWA
1
1)(
Kalibrace (vážené průměrování)
Nitrogen IV Sample 1 IV x abund. Sample 2 IV x abund.Drosera rotundifolia 1 2 2 0 0
Andromeda polypofila 1 3 3 0 0Vaccinium oxycoccus 1 5 5 0 0Vaccinium uliginosum 3 2 6 1 3
Urtica dioica 8 0 0 5 40Phalaris arundinacea 7 0 0 5 35
Total 12 16 11 78Nitrogen (WA): 1.333
(=16/12)7.090
(=78/11)
Ordinační metody
Ordinační diagram: druhy a vzorky
Blízkost znamená podobnost a (ještě více) odlehlost nepodobnost
Ordinační diagram:přidány charakteristiky prostředí
Dvě formulace cílů ordinačních metod
• Najdi uspořádání vzorků v ordinačním prostoru, které nejlépe odpovídá jejich vzájemné podobnosti v druhovém složení.Mnohorozměrné škálování (multidimensional scaling) – PCoA a NMDS
• Najdi „latentní“ proměnné (ordinační osy), nejlépe předpovídající hodnoty pro všechny druhy (tj. druhové složení vzorků).Je třeba zvolit model druhové odezvy (lineární vs. unimodální) – odpovídající míry distance!
Dvě formulace cílů (2)
• Obě formulace cílů ordinačních metod (konfigurace bodů vs. hledání latentních vysvětlujících proměnných – gradientů) často vedou k jednomu řešení:
• Lineární metoda PCA - osy jsou nejlepší prediktory pro lineární model a rozmístění bodů odráží Eukleidovské distance
• Unimodální metoda CA - osy jsou nejlepší (±) prediktory pro unimodální model a rozmístění bodů odráží chi-square distance
Manipulace s daty• Transformace je algebraická funkce, kterou lze
aplikovat nezávisle na každou hodnotu (log, √)
• Standardizace (sensu lato) se provádí ve vztahu k hodnotám ostatních druhů ve vzorku (standardization by samples) nebo ve vztahuk hodnotám druhu v ostatních vzorcích (standardization by species)
• Dva typy standardizace: centrování (odečtení průměru, obvykle pro druhy) a standardizace (v užším smyslu) – vydělení normou
2,2
1,12,1 )( j
s
jj XXED
Při užití Eukleidovské distance s daty, u kterých chceme standardizovat přes vzorky, je lepší použít standardizaci normou, nikoliv na konstantní součet
Eukleidovská distance (lineární metody)
Chi-square distance(unimodální metody)
2
1 2
2
1
1212
1
n
i
ii
i S
X
S
X
S
Si+ je součet hodnot všech druhů ve vzorku iS+j je součet hodnot druhu j přes všechny vzorky
Hlavní výsledky ordinační metody
• Skóre vzorků (sample scores): hodnoty latentních proměnných pro jednotlivé vzorky (jejich pozice na ordinační ose)
• Skóre druhů (species scores): parametr modelu druhové odezvy, fitovaného pro každý druh zvláště.
• Pro unimodální metodu jsou skóre druhů jejich optima a skóre vzorků lze získat ze skóre druhů a také naopak.
Výpočet ordinačního modelumetodou váženého průměrování
• [1] začni libovolnými skóre pro vzorky (xi)
• [2] vypočti skóre druhů (yj) váženým průměrováním (regresí) ze skóre vzorků (xi)
• [3] vypočti nová skóre vzorků (xi) váženým průměrováním (kalibrací) ze skóre druhů (yj)
• [4] standardizuj rozsah skóre vzorků („natáhni osu“)
• [5] při již malé změně skóre ukonči, jinak [2]
eigenvaluecharakteristické č.
Charakteristická čísla
• Čím větší charakteristické číslo (eigenvalue), tím více je „jeho“ ordinační osa schopna vysvětlovat data
• V metodách váženého průměrování (WA, unimodální metody) je vždy <= 1 a rovné 1 jen pro dokonalé oddělení (perfect partitioning)
Omezená ordinace(constrained ordination)
• [1] začni libovolnými skóre pro vzorky (xi)
• [2] vypočti skóre druhů (yj) váženým průměrováním (regresí) ze skóre vzorků (xi)
• [3] vypočti nová skóre vzorků (xi) váženým průměrováním (kalibrací) ze skóre druhů (yj)
• [4] standardizuj rozsah skóre vzorků („natáhni osu“)
• [5] při již malé změně skóre ukonči, jinak [2]
Omezená ordinace(constrained ordination)
• [1] začni libovolnými skóre pro vzorky (xi)
• [2] vypočti skóre druhů (yj) váženým průměrováním (regresí) ze skóre vzorků (xi)
• [3] vypočti nová skóre vzorků (xi) váženým průměrováním (kalibrací) ze skóre druhů (yj)
• [3a] vypočti mnohonásobnou regresi skóre vzorků (xi) na charakteristikách prostředí a použij fitované hodnoty jako nová skóre vzorků (x’i)
• [4] standardizuj rozsah skóre vzorků („natáhni osu“)
• [5] při již malé změně skóre ukonči, jinak [2]Ordinační osa je zde lineární kombinací charakteristik prostředí
Základní ordinační metody
• Detrending: ->detrended CA=DCA (a DCCA)
• Hybridní analýzy
Linear methods Weighted averaging
Unconstrained Principal ComponentsAnalysis (PCA)
Correspondence Analysis (CA)
Constrained Redundancy Analysis(RDA)
Canonical CorrespondenceAnalysis (CCA)
PCA CA
RDA CCA
Detrending a obloukový efekt
• Druhá osa je z definice lineárně nezávislá na první
• To ale nezabrání kvadratické závislosti (arch effect)
• Detrending (by segments) je heuristický způsob, jak zabránit tomu, aby jako druhá (či vyšší) ordinační osa byla „nalezena“ takováto závislost
• Detrending by polynomials
Dva pohledy na použití charakteristik prostředí
• Můžeme spočítat nepřímou ordinaci (PCA/CA/DCA) a interpretovat její výsledky pomocí změřených charakteristik
• Můžeme spočítat omezenou ordinaci (RDA/CCA)
• Tyto přístupy jsou komplementární a máme-li změřené charakteristiky prostředí, je správné použít oba přístupy
• Porovnání výsledků umožní lépe posoudit význam studovaných charakteristik prostředí
Použití kategoriálních proměnných
• Dummy variables
• Jejich použití v regresi odpovídápoužití faktorů v analýze variance
Testy hypotéz v omezené ordinaci
• V omezené ordinaci (=přímá gradientová analýza, CCA nebo RDA) jsou charakteristiky prostředí součástí modelu
• Má zde tedy smysl testovat hypotézy o vztahu složení společenstva k prostředí
• Distribuce testových statistik je neznámá nebo neurčitelná (závislá na konkrétních datech)
• Monte Carlo permutační testy
Monte Carlo permutační test
Plantheight
Nitrogen(as
measured)
1-stpermutation
2-ndpermutation
3-rdpermutation
4-thpermutation
5-thetc
5 3 3 8 5 5 ...
7 5 8 5 5 8 ...
6 5 4 4 3 4 ...
10 8 5 3 8 5 ...
3 4 5 5 4 3 ...
F-value 10.058 0.214 1.428 4.494 0.826 0.###