aplikované matematické vedy - vsb.cz
TRANSCRIPT
![Page 1: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/1.jpg)
motivace
Aplikované matematické vědy
![Page 2: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/2.jpg)
motivace
S={ slunečno, zataženo }Čas: t0 = dnes, t1 = zítra, . . .Náhodná veličina: xt . . . Jaké bude počasí v čase t.
Pro zjednodužení budeme předpokládat, že to, jaké bude počasízítra, záleží jen na tom, jaké počasí je dnes.
Aplikované matematické vědy
![Page 3: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/3.jpg)
Motivace
P(xt+1 = slunečno|xt = slunečno) = 0.9
P(xt+1 = zataženo|xt = slunečno) = 0.1
P(xt+1 = slunečno|xt = zataženo) = 0.5
P(xt+1 = zataženo|xt = zataženo) = 0.5
Aplikované matematické vědy
![Page 4: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/4.jpg)
Motivace
P(x1 = slunečno) = P(x1 = slunečno|x0 = slunečno) · P(x0 = slunečno)+ P(x1 = slunečno|x0 = zataženo) · P(x0 = zataženo)
P(x1 = zataženo) = P(x1 = zataženo|x0 = slunečno) · P(x0 = slunečno)+ P(x1 = zataženo|x0 = zataženo) · P(x0 = zataženo)
Označme:
πt =(
P(xt = slunečno)P(xt = zataženo)
)Potom
πt+1 = Λπt ,
kde Λ je matice podmíněných pravděpodobností.
Aplikované matematické vědy
![Page 5: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/5.jpg)
Předpokládejme, že dnes je slunečno. Jaká je pravděpodobnost, že zítrabude slunečno/zataženo?
π0 =(
10
)π0 =
(??
)
π1 = Λπ0 =(
0.9 0.50.1 0.5
)︸ ︷︷ ︸můžeme odhadnoutna základě dřívějších
měření
Jak?
·(
10
)=(
0.90.1
)
Aplikované matematické vědy
![Page 6: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/6.jpg)
Jak nalezneme přechodovou matici?
Data za posledních 100 dní:
SZZSSSSSSSSSSZZZZZSSSSSSSSSZZSSSSSSSSSSSSSSZZSSSZZSSZSSSSZZZSSSSSSSSZSZZZSSSSSSSSSSSSZZSSSSSSSSSSSZ
Λi,j = ni,jm∑
i=1ni,j
Aplikované matematické vědy
![Page 7: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/7.jpg)
Data za posledních 100 dní:
SZZSSSSSSSSSSZZZZZSSSSSSSSSZZSSSSSSSSSSSSSSZZSSSZZSSZSSSSZZZSSSSSSSSZSZZZSSSSSSSSSSSSZZSSSSSSSSSSSZ
počet přechodů slunečno → slunečno = 65počet přechodů slunečno → zataženo = 11počet přechodů zataženo → slunečno = 10počet přechodů zataženo → zataženo = 13
————————–celkem 99 přechodů
Λ̃ =( 65
761023
1176
1323
)=(
0.8553 0.43480.1447 0.5652
)
Aplikované matematické vědy
![Page 8: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/8.jpg)
Co je „slunečno“? Co je „zataženo“?
„slunečno“ a „zataženo“ jsou dva vzájemně se vylučující stavykategoriální proměnné,každou kategorii lze charakterizovat hodnotou pozorovatelné (měřitelné)typicky spojité proměnné (teplota, tlak, vlhkost, vítr, . . . ).
vlhk
ost
vzdu
chu
teplota
Aplikované matematické vědy
![Page 9: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/9.jpg)
Co je „slunečno“? Co je „zataženo“?
„slunečno“ a „zataženo“ jsou dva vzájemně se vylučující stavykategoriální proměnné,každou kategorii lze charakterizovat hodnotou pozorovatelné (měřitelné)typicky spojité proměnné (teplota, tlak, vlhkost, vítr, . . . ).
vlhk
ost
vzdu
chu
teplota
Aplikované matematické vědy
![Page 10: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/10.jpg)
Co je „slunečno“? Co je „zataženo“?
„slunečno“ a „zataženo“ jsou dva vzájemně se vylučující stavykategoriální proměnné,každou kategorii lze charakterizovat hodnotou pozorovatelné (měřitelné)typicky spojité proměnné (teplota, tlak, vlhkost, vítr, . . . ).
vlhk
ost
vzdu
chu
teplota
Diskretizace
Aplikované matematické vědy
![Page 11: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/11.jpg)
Co je „slunečno“? Co je „zataženo“?
„slunečno“ a „zataženo“ jsou dva vzájemně se vylučující stavykategoriální proměnné,každou kategorii lze charakterizovat hodnotou pozorovatelné (měřitelné)typicky spojité proměnné (teplota, tlak, vlhkost, vítr, . . . ).
vlhk
ost
vzdu
chu
teplota
DiskretizaceDimenze dat počet kategorií
1 102 1003 1 0004 10 0005 100 000...
...n 10n
Aplikované matematické vědy
![Page 12: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/12.jpg)
Co je „slunečno“? Co je „zataženo“?
„slunečno“ a „zataženo“ jsou dva vzájemně se vylučující stavykategoriální proměnné,každou kategorii lze charakterizovat hodnotou pozorovatelné (měřitelné)typicky spojité proměnné (teplota, tlak, vlhkost, vítr, . . . ).
vlhk
ost
vzdu
chu
teplota
Diskretizace
Předpoklad: sníh a vysokáteplota nejsou možné
Aplikované matematické vědy
![Page 13: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/13.jpg)
Co je „slunečno“? Co je „zataženo“?
„slunečno“ a „zataženo“ jsou dva vzájemně se vylučující stavykategoriální proměnné,každou kategorii lze charakterizovat hodnotou pozorovatelné (měřitelné)typicky spojité proměnné (teplota, tlak, vlhkost, vítr, . . . ).
vlhk
ost
vzdu
chu
teplota
Diskretizace
Předpoklad: sníh a vysokáteplota současně nejsou možné
Aplikované matematické vědy
![Page 14: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/14.jpg)
Co je „slunečno“? Co je „zataženo“?
„slunečno“ a „zataženo“ jsou dva vzájemně se vylučující stavykategoriální proměnné,každou kategorii lze charakterizovat hodnotou pozorovatelné (měřitelné)typicky spojité proměnné (teplota, tlak, vlhkost, vítr, . . . ).
vlhk
ost
vzdu
chu
teplota
Aplikované matematické vědy
![Page 15: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/15.jpg)
Co je „slunečno“? Co je „zataženo“?
„slunečno“ a „zataženo“ jsou dva vzájemně se vylučující stavykategoriální proměnné,každou kategorii lze charakterizovat hodnotou pozorovatelné (měřitelné)typicky spojité proměnné (teplota, tlak, vlhkost, vítr, . . . ).
vlhk
ost
vzdu
chu
teplota
⇒ Shlukování
Aplikované matematické vědy
![Page 16: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/16.jpg)
Shluková analýza (cluster analysis)
Shluková analýza je souhrnným názvem pro celou řadu výpočetníchalgoritmou, jejichž cílem je rozklad daného souboru dat na několikrelativně homogenních podmnožin, shluků.
Rozklad množiny dat by měl být proveden takovým zpousobem,aby si objekty uvnitř jednotlivých shlukou byly co nejvíce podobné.
Objekty patřící do různých shlukou by si naopak měly být podobnéco nejméně.
Proces shlukování může přinášet různá výsledná rozdělení objektůdo shluků v závislosti na použitých metodách a různýchspecifikacích ⇒ hodnocení výsledků.
Aplikované matematické vědy
![Page 17: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/17.jpg)
PraxeÚloh a situací, kdy je potřeba objekty shlukovat do skupin, je nepřebernémnožství. Příklady praktického využití:
Shlukování genů s podobnými vlastnostmi exprese.
Tvorba skupin studentů se stejnými vlastnostmi.
Shlukování otázek v dotazníku, na které respondenti odpovídajípodobně.
Shlukování chemických prvků, které se chovají v nějaké situacipodobně.
Shlukování oblastí například podle spáchaných trestných činů.
Shluková analýza je často využívaná v marketingu. Napříkladshlukování zákazníků do skupin na základě dat z dotazníkovýchšetření.
Shlukování uživatelů sociálních sítí může odhalit komunity lidí.
Shlukování produktů podle jejich vlastností.
. . .
Aplikované matematické vědy
![Page 18: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/18.jpg)
PraxeÚloh a situací, kdy je potřeba objekty shlukovat do skupin, je nepřebernémnožství. Příklady praktického využití:
Shlukování genů s podobnými vlastnostmi exprese.
Tvorba skupin studentů se stejnými vlastnostmi.
Shlukování otázek v dotazníku, na které respondenti odpovídajípodobně.
Shlukování chemických prvků, které se chovají v nějaké situacipodobně.
Shlukování oblastí například podle spáchaných trestných činů.
Shluková analýza je často využívaná v marketingu. Napříkladshlukování zákazníků do skupin na základě dat z dotazníkovýchšetření.
Shlukování uživatelů sociálních sítí může odhalit komunity lidí.
Shlukování produktů podle jejich vlastností.
. . .
Aplikované matematické vědy
![Page 19: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/19.jpg)
PraxeÚloh a situací, kdy je potřeba objekty shlukovat do skupin, je nepřebernémnožství. Příklady praktického využití:
Shlukování genů s podobnými vlastnostmi exprese.
Tvorba skupin studentů se stejnými vlastnostmi.
Shlukování otázek v dotazníku, na které respondenti odpovídajípodobně.
Shlukování chemických prvků, které se chovají v nějaké situacipodobně.
Shlukování oblastí například podle spáchaných trestných činů.
Shluková analýza je často využívaná v marketingu. Napříkladshlukování zákazníků do skupin na základě dat z dotazníkovýchšetření.
Shlukování uživatelů sociálních sítí může odhalit komunity lidí.
Shlukování produktů podle jejich vlastností.
. . .
Aplikované matematické vědy
![Page 20: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/20.jpg)
PraxeÚloh a situací, kdy je potřeba objekty shlukovat do skupin, je nepřebernémnožství. Příklady praktického využití:
Shlukování genů s podobnými vlastnostmi exprese.
Tvorba skupin studentů se stejnými vlastnostmi.
Shlukování otázek v dotazníku, na které respondenti odpovídajípodobně.
Shlukování chemických prvků, které se chovají v nějaké situacipodobně.
Shlukování oblastí například podle spáchaných trestných činů.
Shluková analýza je často využívaná v marketingu. Napříkladshlukování zákazníků do skupin na základě dat z dotazníkovýchšetření.
Shlukování uživatelů sociálních sítí může odhalit komunity lidí.
Shlukování produktů podle jejich vlastností.
. . .
Aplikované matematické vědy
![Page 21: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/21.jpg)
PraxeÚloh a situací, kdy je potřeba objekty shlukovat do skupin, je nepřebernémnožství. Příklady praktického využití:
Shlukování genů s podobnými vlastnostmi exprese.
Tvorba skupin studentů se stejnými vlastnostmi.
Shlukování otázek v dotazníku, na které respondenti odpovídajípodobně.
Shlukování chemických prvků, které se chovají v nějaké situacipodobně.
Shlukování oblastí například podle spáchaných trestných činů.
Shluková analýza je často využívaná v marketingu. Napříkladshlukování zákazníků do skupin na základě dat z dotazníkovýchšetření.
Shlukování uživatelů sociálních sítí může odhalit komunity lidí.
Shlukování produktů podle jejich vlastností.
. . .
Aplikované matematické vědy
![Page 22: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/22.jpg)
PraxeÚloh a situací, kdy je potřeba objekty shlukovat do skupin, je nepřebernémnožství. Příklady praktického využití:
Shlukování genů s podobnými vlastnostmi exprese.
Tvorba skupin studentů se stejnými vlastnostmi.
Shlukování otázek v dotazníku, na které respondenti odpovídajípodobně.
Shlukování chemických prvků, které se chovají v nějaké situacipodobně.
Shlukování oblastí například podle spáchaných trestných činů.
Shluková analýza je často využívaná v marketingu. Napříkladshlukování zákazníků do skupin na základě dat z dotazníkovýchšetření.
Shlukování uživatelů sociálních sítí může odhalit komunity lidí.
Shlukování produktů podle jejich vlastností.
. . .
Aplikované matematické vědy
![Page 23: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/23.jpg)
PraxeÚloh a situací, kdy je potřeba objekty shlukovat do skupin, je nepřebernémnožství. Příklady praktického využití:
Shlukování genů s podobnými vlastnostmi exprese.
Tvorba skupin studentů se stejnými vlastnostmi.
Shlukování otázek v dotazníku, na které respondenti odpovídajípodobně.
Shlukování chemických prvků, které se chovají v nějaké situacipodobně.
Shlukování oblastí například podle spáchaných trestných činů.
Shluková analýza je často využívaná v marketingu. Napříkladshlukování zákazníků do skupin na základě dat z dotazníkovýchšetření.
Shlukování uživatelů sociálních sítí může odhalit komunity lidí.
Shlukování produktů podle jejich vlastností.
. . .
Aplikované matematické vědy
![Page 24: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/24.jpg)
PraxeÚloh a situací, kdy je potřeba objekty shlukovat do skupin, je nepřebernémnožství. Příklady praktického využití:
Shlukování genů s podobnými vlastnostmi exprese.
Tvorba skupin studentů se stejnými vlastnostmi.
Shlukování otázek v dotazníku, na které respondenti odpovídajípodobně.
Shlukování chemických prvků, které se chovají v nějaké situacipodobně.
Shlukování oblastí například podle spáchaných trestných činů.
Shluková analýza je často využívaná v marketingu. Napříkladshlukování zákazníků do skupin na základě dat z dotazníkovýchšetření.
Shlukování uživatelů sociálních sítí může odhalit komunity lidí.
Shlukování produktů podle jejich vlastností.
. . .
Aplikované matematické vědy
![Page 25: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/25.jpg)
Pojem shluk
Jednou z definic, která pojem shluk vymezuje je Van Rijsbergenovadefinice. Lze ji vyslovit následovně:Je-li dána množina objektů X = {x1, x2, . . . , xn} a libovolnýkoeficient D nepodobnosti objektů, pak shlukem nazveme takovoupodmnožinu A množiny objektou X , pro niž platí:
max D(xi , xj) < min D(xk , xl ),
kde objekty xi , xj , xl ∈ A a objekt xk 6∈ A.
Aplikované matematické vědy
![Page 26: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/26.jpg)
Metrika neboli jak měříme vzdálenosti mezi objekty
Při shlukové analýze je důležité zvolit vhodnou metriku, protože právě taovlivňuje tvar vytvořených shluků. V různých metrikách si mohou býtněkteré objekty blíže a v jiných dále.
Metrický prostorMetrickým prostorem nazýváme dvojici (X , d), kde X je libovolnáneprázdná množina a zobrazení d : X × X → R+ splňuje pro každéx , y , z ∈ X následující tři axiomy:
d(x , y) = 0 právě když x = y (identita)
d(x , y) = d(y , x) (symetrie)
d(x , y) + d(y , z) ≥ d(x , z) (trojúhelníková nerovnost).
Zobrazení d nazýváme metrikou na X , prvky množiny X obvyklenazýváme body prostoru (X , d), číslo d(x , y) nazýváme vzdálenostíobjektů x , y v prostoru (X , d).
Aplikované matematické vědy
![Page 27: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/27.jpg)
Euklidovská metrika
Vzdálenost objektů Xi a Xj v Euklidovské metrice je definovánavztahem
d(Xi ,Xj) =
√√√√ p∑k=1
(xik − xjk)2,
kde xik je hodnota k-té proměnné u i-tého objektu,xjk je hodnota k-té proměnné u j-tého objektu.
Výhoda: výpočetní jednoduchost.
Nedostatky: předpokládá nekorelovanost proměnných =⇒ v praktickýchpodmínkách obtížně splnitelný. Dále je značně závislá na měřítkuproměnných, takže je vhodné pracovat s proměnnými v normovanémtvaru, tj. takovými, které mají nulový průměr a jednotkový rozptyl - jsoutedy bezrozměrnými čísly.
Aplikované matematické vědy
![Page 28: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/28.jpg)
Hammingova metrika (Manhattanská vzdálenost,vzdálenost městských bloků (city-block distance))
Hammingova vzdálenost objektů Xi a Xj je definována vztahem
d(Xi ,Xj) =p∑
k=1|xik − xjk | .
Používá se k popisu rozdílů například mezi dvěma řetězci stejné délky.Vzdálenost se pak rovná počtu znaků, ve kterých se dané řetězce liší.Jinak řečeno, je to počet symbolů, které by bylo nutné změnit, aby bylyoba srovnávané řetězce shodné.Poed užitím této vzdálenosti se musíme ujistit, že znaky spolu nekorelují.Když tato podmínka není splnina, shluky jsou nesprávné.
Aplikované matematické vědy
![Page 29: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/29.jpg)
BA
Manhattan, rok 2020: chci se dostat z rohu 33. ulice a Pakr Avenue na roh ulic28. a 7. Avenue. Jakou vzdálenost musím urazit?
Aplikované matematické vědy
![Page 30: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/30.jpg)
BA
Manhattan, rok 2020: chci se dostat z rohu 33. ulice a Pakr Avenue na roh ulic28. a 7. Avenue. Jakou vzdálenost musím urazit?
Aplikované matematické vědy
![Page 31: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/31.jpg)
BA
Manhattan, rok 2020: chci se dostat z rohu 33. ulice a Pakr Avenue na roh ulic28. a 7. Avenue. Jakou vzdálenost musím urazit?
Aplikované matematické vědy
![Page 32: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/32.jpg)
BA
Manhattan, rok 2020: chci se dostat z rohu 33. ulice a Pakr Avenue na roh ulic28. a 7. Avenue. Jakou vzdálenost musím urazit?
Aplikované matematické vědy
![Page 33: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/33.jpg)
BA
Manhattan, rok 2020: chci se dostat z rohu 33. ulice a Pakr Avenue na roh ulic28. a 7. Avenue. Jakou vzdálenost musím urazit?
Aplikované matematické vědy
![Page 34: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/34.jpg)
BA
Manhattan, rok 2020: chci se dostat z rohu 33. ulice a Pakr Avenue na roh ulic28. a 7. Avenue. Jakou vzdálenost musím urazit?
Aplikované matematické vědy
![Page 35: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/35.jpg)
Minkovského metrika a Čebyševova metrika
Minkovského metrika zobecňuje Euklidovu i Hammingovu metriku.
• Místo druhé mocniny, resp. odmocniny, je použita obecná mocnina iodmocnina. To znamená, že zvyšuje váhu vlivu členů s větším rozdílem dílčíchsouřadnic. Čím větší mocnina, tím větší důraz na větší rozdíly mezisouřadnicemi.
d(Xi ,Xj ) = z
√√√√ p∑k=1
|xik − xjk |z
Pro z = 1 . . . Hammingova metrika,z = 2 . . . Euklidova metrika,
...Co se stane, pokud z →∞?
limx→∞
z
√√√√ p∑k=1
|xik − xjk |z = max∀k{|xik − xjk |}
=⇒ Čebyševova metrika
Aplikované matematické vědy
![Page 36: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/36.jpg)
Minkovského metrika a Čebyševova metrika
Minkovského metrika zobecňuje Euklidovu i Hammingovu metriku.• Místo druhé mocniny, resp. odmocniny, je použita obecná mocnina iodmocnina. To znamená, že zvyšuje váhu vlivu členů s větším rozdílem dílčíchsouřadnic. Čím větší mocnina, tím větší důraz na větší rozdíly mezisouřadnicemi.
d(Xi ,Xj ) = z
√√√√ p∑k=1
|xik − xjk |z
Pro z = 1 . . . Hammingova metrika,z = 2 . . . Euklidova metrika,
...Co se stane, pokud z →∞?
limx→∞
z
√√√√ p∑k=1
|xik − xjk |z = max∀k{|xik − xjk |}
=⇒ Čebyševova metrika
Aplikované matematické vědy
![Page 37: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/37.jpg)
Minkovského metrika a Čebyševova metrika
Minkovského metrika zobecňuje Euklidovu i Hammingovu metriku.• Místo druhé mocniny, resp. odmocniny, je použita obecná mocnina iodmocnina. To znamená, že zvyšuje váhu vlivu členů s větším rozdílem dílčíchsouřadnic. Čím větší mocnina, tím větší důraz na větší rozdíly mezisouřadnicemi.
d(Xi ,Xj ) = z
√√√√ p∑k=1
|xik − xjk |z
Pro z = 1 . . . Hammingova metrika,z = 2 . . . Euklidova metrika,
...
Co se stane, pokud z →∞?
limx→∞
z
√√√√ p∑k=1
|xik − xjk |z = max∀k{|xik − xjk |}
=⇒ Čebyševova metrika
Aplikované matematické vědy
![Page 38: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/38.jpg)
Minkovského metrika a Čebyševova metrika
Minkovského metrika zobecňuje Euklidovu i Hammingovu metriku.• Místo druhé mocniny, resp. odmocniny, je použita obecná mocnina iodmocnina. To znamená, že zvyšuje váhu vlivu členů s větším rozdílem dílčíchsouřadnic. Čím větší mocnina, tím větší důraz na větší rozdíly mezisouřadnicemi.
d(Xi ,Xj ) = z
√√√√ p∑k=1
|xik − xjk |z
Pro z = 1 . . . Hammingova metrika,z = 2 . . . Euklidova metrika,
...Co se stane, pokud z →∞?
limx→∞
z
√√√√ p∑k=1
|xik − xjk |z = max∀k{|xik − xjk |}
=⇒ Čebyševova metrika
Aplikované matematické vědy
![Page 39: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/39.jpg)
Minkovského metrika a Čebyševova metrika
Minkovského metrika zobecňuje Euklidovu i Hammingovu metriku.• Místo druhé mocniny, resp. odmocniny, je použita obecná mocnina iodmocnina. To znamená, že zvyšuje váhu vlivu členů s větším rozdílem dílčíchsouřadnic. Čím větší mocnina, tím větší důraz na větší rozdíly mezisouřadnicemi.
d(Xi ,Xj ) = z
√√√√ p∑k=1
|xik − xjk |z
Pro z = 1 . . . Hammingova metrika,z = 2 . . . Euklidova metrika,
...Co se stane, pokud z →∞?
limx→∞
z
√√√√ p∑k=1
|xik − xjk |z = max∀k{|xik − xjk |}
=⇒ Čebyševova metrika
Aplikované matematické vědy
![Page 40: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/40.jpg)
Minkovského metrika a Čebyševova metrika
Minkovského metrika zobecňuje Euklidovu i Hammingovu metriku.• Místo druhé mocniny, resp. odmocniny, je použita obecná mocnina iodmocnina. To znamená, že zvyšuje váhu vlivu členů s větším rozdílem dílčíchsouřadnic. Čím větší mocnina, tím větší důraz na větší rozdíly mezisouřadnicemi.
d(Xi ,Xj ) = z
√√√√ p∑k=1
|xik − xjk |z
Pro z = 1 . . . Hammingova metrika,z = 2 . . . Euklidova metrika,
...Co se stane, pokud z →∞?
limx→∞
z
√√√√ p∑k=1
|xik − xjk |z = max∀k{|xik − xjk |}
=⇒ Čebyševova metrika
Aplikované matematické vědy
![Page 41: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/41.jpg)
Jednotkové okolí bodu ve vybraných metrikách
xi
Euklidova metrika
Hammingova metrika
Čebyševova metrika
Aplikované matematické vědy
![Page 42: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/42.jpg)
Jednotkové okolí bodu ve vybraných metrikách
xi
Euklidova metrika
Hammingova metrika
Čebyševova metrika
Aplikované matematické vědy
![Page 43: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/43.jpg)
Jednotkové okolí bodu ve vybraných metrikách
xi
Euklidova metrika
Hammingova metrika
Čebyševova metrika
Aplikované matematické vědy
![Page 44: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/44.jpg)
Jednotkové okolí bodu ve vybraných metrikách
xi
Euklidova metrika
Hammingova metrika
Čebyševova metrika
Aplikované matematické vědy
![Page 45: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/45.jpg)
Mahalanobisova metrika
Všechny dosud uvedené metriky neuvažují závislost mezi objekty.
Mahalanobisova vzdálenost objektů Xi a Xj je definovánavztahem
d(Xi ,Xj) =√
(xi − xj)T C−1(xi − xj),
kde xi a xj jsou p-členné vektory proměnných u i-tého a j-téhoobjektu, C je kovarianční matice.
Tato míra vzdálenosti přihlíží k vzájemným interkorelacímproměnných. Pokud jsou proměnné nekorelovány (párové korelačníkoeficienty jsou nulové), je Mahalanobisova vzdálenost rovnačtverci euklidovské vzdálenosti.
Aplikované matematické vědy
![Page 46: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/46.jpg)
Mahalanobisova metrika
Všechny dosud uvedené metriky neuvažují závislost mezi objekty.
Mahalanobisova vzdálenost objektů Xi a Xj je definovánavztahem
d(Xi ,Xj) =√
(xi − xj)T C−1(xi − xj),
kde xi a xj jsou p-členné vektory proměnných u i-tého a j-téhoobjektu, C je kovarianční matice.
Tato míra vzdálenosti přihlíží k vzájemným interkorelacímproměnných. Pokud jsou proměnné nekorelovány (párové korelačníkoeficienty jsou nulové), je Mahalanobisova vzdálenost rovnačtverci euklidovské vzdálenosti.
Aplikované matematické vědy
![Page 47: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/47.jpg)
Mahalanobisova metrika
Všechny dosud uvedené metriky neuvažují závislost mezi objekty.
Mahalanobisova vzdálenost objektů Xi a Xj je definovánavztahem
d(Xi ,Xj) =√
(xi − xj)T C−1(xi − xj),
kde xi a xj jsou p-členné vektory proměnných u i-tého a j-téhoobjektu, C je kovarianční matice.
Tato míra vzdálenosti přihlíží k vzájemným interkorelacímproměnných. Pokud jsou proměnné nekorelovány (párové korelačníkoeficienty jsou nulové), je Mahalanobisova vzdálenost rovnačtverci euklidovské vzdálenosti.
Aplikované matematické vědy
![Page 48: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/48.jpg)
Metody shlukování
Hierarchické metodyAglomerativní - postupné „připojování“ objektůDivizní - postupné „odpojování“ objektů
Nehierarchické metodyNapř. metody „k-shlukování“
Aplikované matematické vědy
![Page 49: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/49.jpg)
Vybrané metody hierarchického shlukování
Metoda nejbližšího sousedaMetoda nejvzdálenějšího sousedaCentroidní metodaMetoda průměrné vazbyWardova metoda
Aplikované matematické vědy
![Page 50: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/50.jpg)
Metoda nejbližšího souseda (Single linkage)
Jedná se o aglomerativní hierarchickou metodu
Postup je založen na minimální vzdálenosti.
1 Nejprve se spojí dva objekty, které mají nejkratší vzdálenost⇒ shluk.
2 Postupuje se do situace, kdy všechny objekty tvoří 1 shluk.3 Problém s řetězením: spojují se dva shluky, kde vzdálenost
mezi dvěma objekty je nejmenší, ale nemusí se jednat onejbližší shluky.
Aplikované matematické vědy
![Page 51: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/51.jpg)
Metoda nejvzdálenějšího souseda
Postup je založen na maximální vzdálenosti.
Nejdelší vzdálenost mezi objekty ve shluku představujenejmenší kouli, která obklopuje všechny objekty v oboushlucích.Problém s řetězením: není.
Aplikované matematické vědy
![Page 52: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/52.jpg)
Centroidní metoda
Postup je založen na analýze vzdáleností mezi těžišti(centroidy = vektory průměrů) jednotlivých shluků.
Výhoda: menší náchylnost k ovlivnění výsledných shlukůextrémními či odlehlými objekty.
Aplikované matematické vědy
![Page 53: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/53.jpg)
Metoda průměrné vazby
Postup je založen na průměrné vzdálenosti objektů v jednomshluku ke všem objektům ve druhém shluku.
Výhoda: kritérium je zaleženo na všech objektech.
Aplikované matematické vědy
![Page 54: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/54.jpg)
Wardova metoda
Postup není založen na optimalizaci vzdáleností mezi shluky.
Jeho základem je čtverec Euklidovské vzdálenosti.
Řeší se minimalizace heterogenity shluků podle přírůstku vnitroshlukového součtu čtverců odchylek objektů od těžiště (centroidů).
Aplikované matematické vědy
![Page 55: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/55.jpg)
Dendrogram
Graf ukazuje kompletní historii spojování do shluků od jednotlivýchobjektů (vlevo) až to jednoho shluku se všemi objekty (vpravo). Naose x je vzdálenost, při které se shluky spojily.
Aplikované matematické vědy
![Page 56: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/56.jpg)
Algoritmus k-means
počet shluků se zpravidla označuje písmenem k
průměrná hodnotamnožné číslo
Aplikované matematické vědy
![Page 57: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/57.jpg)
Algoritmus k-means
počet shluků se zpravidla označuje písmenem k
průměrná hodnotamnožné číslo
Aplikované matematické vědy
![Page 58: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/58.jpg)
Algoritmus k-means
počet shluků se zpravidla označuje písmenem k
průměrná hodnotamnožné číslo
Aplikované matematické vědy
![Page 59: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/59.jpg)
Algoritmus k-means
počet shluků se zpravidla označuje písmenem k
průměrná hodnotamnožné číslo
Aplikované matematické vědy
![Page 60: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/60.jpg)
Algoritmus k-means
počet shluků se zpravidla označuje písmenem k
průměrná hodnota
množné číslo
Aplikované matematické vědy
![Page 61: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/61.jpg)
Algoritmus k-means
počet shluků se zpravidla označuje písmenem k
průměrná hodnotamnožné číslo
Aplikované matematické vědy
![Page 62: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/62.jpg)
Princip k-means algoritmu
Algoritmus metody k-means lze obecně popsat čtyřmi kroky:
1 Vyber počet shluků k, náhodně vygeneruj nebo zadej těžištěshluků.
2 Pro každý objekt vyber shluk, jehož těžiště je nejblíže. Pokudse vybraný shluk nerovná původnímu shluku, přemísti do nějobjekt.
3 Přepočítej těžiště nově vzniklých shluků.4 Jestliže nedošlo ke změně žádnéhoshluku, skonči, jinak
pokračuj bodem 2.
Aplikované matematické vědy
![Page 63: Aplikované matematické vedy - vsb.cz](https://reader030.vdocuments.site/reader030/viewer/2022012021/6168a210d394e9041f715829/html5/thumbnails/63.jpg)
Děkuji za pozornost !!!
Aplikované matematické vědy