využitie teórie fuzzy množín pri zhlukovaní objektov
DESCRIPTION
Využitie teórie fuzzy množín pri zhlukovaní objektov. Branislav Benikovský Ladislav Dudáš 9.4.2003. Obsah. Úvod Klasická zhluková analýza Niektoré pojmy z fuzzy množín Fuzzy zhlukovanie Hierarchické fuzzy zhlukovanie Nehierarchické fuzzy zhlukovanie Aplikácie. Branko-Granko & Dudy. - PowerPoint PPT PresentationTRANSCRIPT
Využitie teórie fuzzy množín pri zhlukovaní objektov
Branislav Benikovský
Ladislav Dudáš
9.4.2003
Obsah
1. Úvod
2. Klasická zhluková analýza
3. Niektoré pojmy z fuzzy množín
4. Fuzzy zhlukovanie
5. Hierarchické fuzzy zhlukovanie
6. Nehierarchické fuzzy zhlukovanie
7. Aplikácie
Branko-Granko & Dudy
1. Úvod
• Umelá inteligencia a zhlukovanie
• Umelá inteligencia a fuzzy množiny
• Umelá inteligencia a hybridné systémy
• Spojenie zhlukovania a teórie fuzzy množín
Branko-Granko & Dudy
2. Klasická zhluková analýza
• Definícia objektu
• Definícia nepodobnosti objektov
imiii xxxo ,,, 21
hssh
shsh
sh
OOdOOd
OOOOd
OOd
ROOd
,,
0,
0,
: 0
Branko-Granko & Dudy
2. Klasická zhluková analýza
• Definícia zhluku– Možno definovať ako množinu A
lkAOAO
jiAOO
OOdOOdlkji
,min,max,,
• Definícia nepodobnosti zhlukov
ABDBAD
BAD
AAD
,,
0,
0,
Branko-Granko & Dudy
2. Klasická zhluková analýza
• Zhlukovacie metódy delíme na– Hierarchické zhlukovacie metódy
• Aglomeratívne zhlukovacie metódy• Divízne zhlukovacie metódy
– Nehierarchické zhlukovacie metódy• Optimalizačné zhlukovacie metódy• Metódy analýzy modusov
Branko-Granko & Dudy
3. Niektoré pojmy z fuzzy množín
• Definícia fuzzy množiny– Nech X je univerzum– Nech M je množiny na intervale <0;1>– Nech je na množine M definovaný zväz
MxXxxxFM AA |,
Branko-Granko & Dudy
3. Niektoré pojmy z fuzzy množín
• Normálny tvar fuzzy množiny– Má trojuholníkový tvar– Má jeden prvok so stupňom príslušnosti 1.0
• Konvexnosť fuzzy množín– Pre z intervalu <0;1> musí platiť
yxyx AAA ,min1
Branko-Granko & Dudy
3. Niektoré pojmy z fuzzy množín
• t – normy– Operácie, ktoré spĺňajú podmienky
aaT
dbTbaTdbca
cbTaTcbaTT
abTbaT
1,
,,
,,,,
,,
• Známa t – norma
yxyxT AA ,min, Branko-Granko & Dudy
3. Niektoré pojmy z fuzzy množín
• t – conormy– Operácie, ktoré spĺňajú podmienky
• Známa t – conorma
aaS
dbSbaSdbca
cbSaScbaSS
abSbaS
0,
,,
,,,,
,,
yxyxS AA ,max, Branko-Granko & Dudy
4. Fuzzy zhlukovanie
• Klasické objekty sú popísane– Kvantitatívne– Kvalitatívne– Binárne
• Pre popis sa vyberá konkrétna hodnota
• Nie vždy sa tak dá objekt popísať– Popis pomocou fuzzy množín– Zavedenie vágnosti, neurčitosti do popisu
Branko-Granko & Dudy
4. Fuzzy zhlukovanie
• Popis objektu fuzzy množinami
• Popis objektu lingvistickými premennými
hmhhh fxfxfxfO ,,, 21
hmhhh LPLPLPfO ,,, 21 • Množina fuzzy objektov
nfOfOfOfO ,,, 21
Branko-Granko & Dudy
4. Fuzzy zhlukovanie
• Nepodobnosť fuzzy objektov
sh fOfOfd ,
• Zhluk fuzzy objektov– Podmnožina A množiny všetkých fuzzy
objektov fO
lkAfOAfO
jiAfOfO
fOfOfdfOfOfdlkji
,min,max,,
Branko-Granko & Dudy
4. Fuzzy zhlukovanie
• Nepodobnosť fuzzy zhlukov– Je ju možné vypočítať ak platí
fAfBfDfBfAfD
fBfAfD
fAfAfD
,,
0,
,0
1,00 je singleton v 0
Znak vyjadruje čiastočné usporiadanie na fuzzy zhlukoch
Branko-Granko & Dudy
4. Fuzzy zhlukovanie
• Definujme si
BAbaz
BAbaz
BA
BA
Tz
UBA
,minsup,sup
,
,max,max
• Potom môžeme zadefinovaťBBABA
BABABA
• Neporovnateľné fuzzy množiny
ABABBA
Branko-Granko & Dudy
5. Hierarchické zhlukovanie
• Vytvoríme si rozklad 0
– Každý objekt tvorí vlastný zhluk– Každému zhluku sa priradí fuzzy množina
• Najčastejšie pomocou singletonu
1,00 jAh
• Vyberieme dva zhluky fAik a fAil
– Ich hodnota koeficientu nepodobnosti fD je minimálna
Branko-Granko & Dudy
5. Hierarchické zhlukovanie
• Vytvoríme nové fuzzy zhluky– Všetky fuzzy zhluky prejdú do novej iterácie
okrem vybratých dvoch fAik a fAil
– Zo zhlukov fAik a fAil vytvoríme pomocou fuzzy ťažiska nový fuzzy zhluk
• Proces iteračne opakujeme, až kým všetky objekty nepatria do jedného zhluku
• Výsledkom sú fuzzy zhlukovacie hladiny
Branko-Granko & Dudy
6. Nehierarchické zhlukovanie
• Na začiatku si zvolíme číslo c, ktoré reprezentuje počet zhlukov
• Vytvoríme si počiatočný rozklad množiny fuzzy objektov fO na c zhlukov– Najčastejšie vybratie c náhodných objektov
• Takto sme vytvorili rozklad 1
cSSS ,12,11,11 ,,,
Branko-Granko & Dudy
6. Nehierarchické zhlukovanie
• Vypočítame ťažiská jednotlivých zhlukov– Označme si ich fvj
• Prechádzame všetky fuzzy objekty a počítame nepodobnosť objektov a fuzzy zhlukov
• Vytvoríme nové zhluky, tak aby platilo kfvfOfdkfvfOfdSfO ji
cjjihki ,min,
,,2,1,1
Branko-Granko & Dudy
6. Nehierarchické zhlukovanie
• Ak sa zmenili jednotlivé objekty v zhlukoch, tento proces iterujeme
• Ak sa nezmenili jednotlivé objekty v zhlukoch, tento proces končí a výsledkom je fuzzy rozklad
ckkkk SSS ,2,1, ,,,
Branko-Granko & Dudy
7. Aplikácie
• dáta tvorené 3 riekami a 2 prítokmi– 61 tried (riadkov)– 49 príkladných stránok (stĺpcov) so 7
stupňami príslušnosti• binárne členy obnovenia/neobnovenia stavov• indikačný kľúč vzoriek riek z ktorých boli vzorky
odobraté• maximálna hĺbka riek na strane vzoriek• štandartná odchýlka od hĺbky
Branko-Granko & Dudy
7. Aplikácie
• stredná šírka• stupeň tieňovania od stromov, ktoré sú previsnuté
nad riekami• % riečisko pokryté vodnými živočíchmi
– kódované R alebo U (obnovenie = restored alebo neobnovenie = unrestored stavov )
Branko-Granko & Dudy
7. Aplikácie
• A. Fuzzy C – means analýza
Branko-Granko & Dudy
7. Aplikácie
• ak nemáme dôkaz o zoskupení funkcie príslušnosti, mali by sme rátať s optimálnym číslom zhlukov pre zoskupovanie stavov
• Začíname s fuzzy C – means– Compare Partition Coefficients nastavíme
min. a max. počet zhlukov na 2 alebo 5– klikneme na C Means Summary, vypočítame
tak koeficienty na vzdialenosti počtu zhlukov
Branko-Granko & Dudy
7. Aplikácie
Branko-Granko & Dudy
7. Aplikácie
• Urobíme výpočet: Fuzzy C-Means: Analysis for selected cluster number– V možnostiach dialógu (Options dialog)
nastavíme číslo klusterov na 2– V MDS setup bude predvolené nastavenie
• (Initial Start Position) – PCA• číslo rozmeru bude rovné 2• podobnosť – Euklidovská• točiaci výkon – áno• maximálny počet iterácií rovný 200
Branko-Granko & Dudy
7. Aplikácie
Branko-Granko & Dudy
7. Aplikácie
• Predvídateľné polohy sú radikálne rozdielne oproti vzorkovým polohám– pritom 90% jednotlivcov sú z tej istej rodiny
• Je to preto, lebo najmenej odlišných plôch je silne dominantných pre jednu rodinu– nepravdepodobnosť klasifikácie na opačných
stranách
• Odstránením Wyarn U z analýzy prinesie zlepšenie rozloženia zvyšku bodov zmapovania, pokiaľ vzdialenosť osí bude malá.
Branko-Granko & Dudy
7. Aplikácie
Branko-Granko & Dudy
7. Aplikácie
• Použitím Select/0 issues: Deselect Column zrušíme stĺpec Wyarn U
Branko-Granko & Dudy
7. Aplikácie
• odstránením takýchto tzv. darebných plôch, môžeme vidieť pekne zmenu rozširovania bodov - je omnoho väčšia a dovoľuje ľahšiu interpretáciu
• Môžeme regulovať relatívnu dĺžku bodov pomocou Relative Diameter slider
Branko-Granko & Dudy
7. Aplikácie
• Aby sme mohli výsledky ľahšie rozoznávať, môžeme si v tomto programe pomocou Different colours meniť farby pre ľahšie rozoznávanie zhlukov ale neukazuje nám fuzzifikovateľnosť, alebo pravdepodobnosť prináležiacu jednému zhluku alebo druhému.
Branko-Granko & Dudy
7. Aplikácie
Branko-Granko & Dudy
7. Aplikácie
Branko-Granko & Dudy
7. Aplikácie
• Z prepínania spätného a predného pohľadu medzi dvomi zhlukmi môžeme vidieť, že jedna časť (tá so šípkou) má približne rovnakú pravdepodobnosť prináležiacu ktorémukoľvek zhluku
Branko-Granko & Dudy
7. Aplikácie
Branko-Granko & Dudy
7. Aplikácie
• B. Fuzzy Ordination (usporiadanie)
• porovnávanie aktuálnej klasifikácii polôh s vážnosťou na niektoré environmentálne premenné, alebo zhlukovanie s usporiadaným generovaním z preplnených druhových spoločenstiev
Branko-Granko & Dudy
7. Aplikácie
• Plochám môžu byť priradené hodnoty, ktoré reprezentujú ich relatívnu pozíciu živočíchov pozdĺž spádu. Napríklad, pre naše rieky, spádom môže byť hĺbka vody alebo šírka rieky. Alternatívne, plochám môžu byť priradené hodnoty medzi 0 a 1 ktoré symbolizujú ich funkciu príslušnosti
Branko-Granko & Dudy
7. Aplikácie
• 1. Analýza obnovenia/neobnovenia stavu
• začatie analýzy: → Similarity (podobnosť) → Memb Unrest (príslušnosť neobnovenia) environmentálna premenná na použitie pozorovaných klasifikácií → vyberieme mieru podobnosti.
• Pokiaľ by sa použli druhové dáta → lepšie použiť nejaké kvantitatívne meranie - napr. metóda Steinhaus Quantitative.
Branko-Granko & Dudy
7. Aplikácie
• 2. Percentuálneho pokrytie iskerníka
• Začneme s Fuzzy Ordination pomocou vybratia „%Ranunc Cover“ ako environmentálnej premennej a ďalej pokračujeme ako v 1
• Po tomto postupe dostanem výsledky, v ktorých je jasný vzťah medzi environmentálnym skóre a zdanlivým skóre
Branko-Granko & Dudy
7. Aplikácie
Branko-Granko & Dudy
7. Aplikácie
Branko-Granko & Dudy
Ďakujeme za pozornosť pri prezentácia, dúfam, že vás
zaujala aspoň niektorá časť z nášho výkladu.
Podrobnejšie informácie na našej stránke
Branko-Granko & Dudy