pravděpodobnost a aplikovanájana.kalcev.cz/vyuka/kestazeni/18ast/18ast-4.pdf · 2017. 11. 23. ·...
TRANSCRIPT
Pravděpodobnost
a aplikovaná
statistika
MGR. JANA SEKNIČKOVÁ, PH.D.
4. KAPITOLA – STATISTICKÉ CHARAKTERISTIKY 16.10.2017
23.10.2017
Přehled témat
1. Pravděpodobnost
(definice, využití, výpočet pravděpodobností náhodných jevů)
2. Podmíněná pravděpodobnost
3. Náhodná veličina
4. Statistické charakteristiky (3. a 4. týden)
5. Slabý zákon velkých čísel
6. Centrální limitní věta (teorém)
7. Bodový a intervalový odhad
8. Testování hypotéz
9. Korelace a regrese
4.1 Střední hodnota
(očekávaná hodnota, očekávaná střední hodnota) pro diskrétní a pro spojitou náhodnou
veličinu (průměrná venkovní teplota)
Značení: E𝑋, E(𝑋)
Diskrétní náhodná veličina:
E 𝑋 =
𝑖=1
𝑛
𝑥𝑖𝑃(𝑋 = 𝑥𝑖) =
𝑖=1
𝑛
𝑥𝑖𝑝𝑖
Spojitá náhodná veličina:
E 𝑋 =
−∞
∞
𝑥𝑓 𝑥 𝑑𝑥
Výsledek úkolu: venkovní teplota: 9,53 °C
Výběrová střední hodnota = (aritmetický) průměr:
𝑒 𝑋 =
𝑖=1
𝑛
𝑥𝑖𝑃(𝑋 = 𝑥𝑖) =
𝑖=1
𝑛
𝑥𝑖𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖 ∙1
𝑛=
1
𝑛
𝑖=1
𝑛
𝑥𝑖 = 𝑋
4.2 Obecný moment
Značení: 𝜇𝑘′ … k-tý obecný moment
k-tého řádu (spec. k = 0, k = 1) pro diskrétní a pro spojitou náhodnou veličinu (průměrná
venkovní vlhkost)
Diskrétní náhodná veličina:
𝜇𝑘′ =
𝑖=1
𝑛
𝑥𝑖𝑘𝑝𝑖 ,
kde 𝑝𝑖 je pravděpodobnost, že 𝑋 nabývá hodnoty 𝑥𝑖
Spojitá náhodná veličina:
𝜇𝑘′ =
−∞
∞
𝑥𝑖𝑘 𝑓 𝑥 𝑑𝑥,
kde 𝑓(𝑥) je hustota pravděpodobnosti dané veličiny.
4.2 Obecný moment
𝑘 = 0:
𝜇0′ =
𝑖=1
𝑛
𝑥𝑖𝑘𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖0𝑝𝑖 =
𝑖=1
𝑛
1 ∙ 𝑝𝑖 =
𝑖=1
𝑛
𝑝𝑖 = 1
Výsledek úkolu: průměrná venkovní vlhkost: k = 0 … 1
k = 1 … 83,87 %
Výběrový obecný moment:
𝑚𝑘′ =
𝑖=1
𝑛
𝑥𝑖𝑘𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖𝑘 ∙
1
𝑛=
1
𝑛
𝑖=1
𝑛
𝑥𝑖𝑘
𝑘 = 1:
𝜇1′ =
𝑖=1
𝑛
𝑥𝑖𝑘𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖1𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖 ∙ 𝑝𝑖 = 𝐸(𝑋)
První obecný moment se nazývá střední hodnota 𝐸(𝑋)
4.3 Centrální moment
Značení: 𝜇𝑘 … k-tý centrální moment
Diskrétní náhodná veličina:
𝜇𝑘 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 𝑘𝑝𝑖 ,
kde 𝑝𝑖 je pravděpodobnost, že 𝑋 nabývá hodnoty 𝑥𝑖
Spojitá náhodná veličina:
𝜇𝑘 =
−∞
∞
𝑥𝑖 − 𝐸(𝑋) 𝑘𝑓 𝑥 𝑑𝑥 ,
kde 𝑓(𝑥) je hustota pravděpodobnosti dané veličiny.
k-tého řádu (spec. k = 0, k = 2) pro diskrétní a pro spojitou náhodnou veličinu (průměrný
barometrický tlak)
4.3 Centrální moment
𝑘 = 0:
𝜇0 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 𝑘𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 0𝑝𝑖 =
𝑖=1
𝑛
1 ∙ 𝑝𝑖 =
𝑖=1
𝑛
𝑝𝑖 = 1
𝑘 = 1:
𝜇1 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 𝑘𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 1𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) ∙ 𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖 ∙ 𝑝𝑖 − 𝐸(𝑋) ∙ 𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖 ∙ 𝑝𝑖 −
𝑖=1
𝑛
𝐸 𝑋 ∙ 𝑝𝑖 = 𝐸 𝑋 − 𝐸 𝑋 ∙
𝑖=1
𝑛
𝑝𝑖 = 0
První centrální moment je vždy 0.
4.3 Centrální moment
Druhý centrální moment je rozptyl 𝑣𝑎𝑟 𝑋 .
Třetí centrální moment se používá pro výpočet šikmosti.
Čtvrtý centrální moment se používá pro výpočet špičatosti.
𝑘 = 2:
𝜇2 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 𝑘𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 2𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖2 − 2𝑥𝑖𝐸 𝑋 + 𝐸 𝑋 2 ∙ 𝑝𝑖
=
𝑖=1
𝑛
𝑥𝑖2 ∙ 𝑝𝑖 − 2𝐸 𝑋
𝑖=1
𝑛
𝑥𝑖 ∙ 𝑝𝑖 + 𝐸 𝑋 2
𝑖=1
𝑛
𝑝𝑖 =
𝑖=1
𝑛
𝑥𝑖2 ∙ 𝑝𝑖 − 2𝐸 𝑋 ∙ 𝐸 𝑋 + 𝐸 𝑋 2 ∙ 1
=
𝑖=1
𝑛
𝑥𝑖2 ∙ 𝑝𝑖 − 2𝐸 𝑋 2 + 𝐸 𝑋 2 =
𝑖=1
𝑛
𝑥𝑖2 ∙ 𝑝𝑖 − 𝐸 𝑋 2 = 𝜇2
′ − 𝐸 𝑋 2 = 𝑣𝑎𝑟(𝑋)
4.3 Centrální moment
Výběrový centrální moment:
𝑚𝑘′ =
1
𝑛
𝑖=1
𝑛
𝑥𝑖 − 𝑋 𝑘
Výsledek úkolu: průměrný barometrický tlak: k = 0 … 1
k = 1 … 0
k = 2 … 40,78
k = 3 … 83,69
k = 4 … 5 319,19
4.4 Rozptyl
(rozptýlenost, variabilita, kolísavost) pro diskrétní a pro spojitou náhodnou veličinu
(průměrná vnitřní teplota)
Značení: 𝑣𝑎𝑟 𝑋 , 𝜎2 𝑋 , 𝑆2 𝑋 ,𝐷(𝑋) Míra rozptýlení
Jedná se o druhý centrální moment.
Diskrétní náhodná veličina:
𝑣𝑎𝑟 𝑋 = 𝜎2 𝑋 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 2 ∙ 𝑝𝑖
Spojitá náhodná veličina:
𝑣𝑎𝑟 𝑋 = 𝜎2 𝑋 =
−∞
∞
𝑥 − 𝐸 𝑋2𝑓 𝑥 𝑑𝑥
4.4 rozptyl
Diskrétní náhodná veličina (při stejných pravděpodobnostech):
𝑣𝑎𝑟 𝑋 = 𝜎2 𝑋 =1
𝑛
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 2
Výsledek úkolu: průměrná vnitřní teplota: 𝜎2 𝑋 = 32,30 °C
Pro výběr nahrazujeme střední hodnotu průměrem a upravujeme počet stupňů volnosti:
𝑣𝑎𝑟 𝑋 = 𝜎2 𝑋 =1
𝑛
𝑖=1
𝑛
𝑥𝑖 − 𝑋 2
Pokud upravujeme počet stupňů volnosti, mluvíme zpravidla výběrovém rozptylu (viz 4.6).
4.5 směrodatná odchylka
pro diskrétní a pro spojitou náhodnou veličinu (průměrná vnitřní vlhkost)
Značení: 𝑣𝑎𝑟 𝑋 , 𝜎 𝑋 , 𝑆 𝑋 , 𝐷(𝑋) Míra rozptýlení
Diskrétní náhodná veličina:
𝜎 𝑋 = var 𝑋 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 2 ∙ 𝑝𝑖
Spojitá náhodná veličina:
𝜎 𝑋 = var 𝑋 =
−∞
∞
𝑥 − 𝐸 𝑋2𝑓 𝑥 𝑑𝑥
4.5 směrodatná odchylka
Diskrétní náhodná veličina (při stejných pravděpodobnostech):
𝜎 𝑋 = var 𝑋 =1
𝑛
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 2
Výsledek úkolu: průměrná vnitřní vlhkost: 𝜎 𝑋 = 6,62 %
𝑠 𝑋 = 6,63 %
Pro výběr nahrazujeme střední hodnotu průměrem a upravujeme počet stupňů volnosti:
𝑠 𝑋 = var 𝑋 =1
𝑛 − 1
𝑖=1
𝑛
𝑥𝑖 − 𝑋 2
Zpravidla pak mluvíme o výběrové směrodatné odchylce.
4.6 Výběrový rozptyl
pro diskrétní a pro spojitou náhodnou veličinu (průměrný nárazový vítr)
Značení: 𝑣𝑎𝑟 𝑋 , 𝜎2 𝑋 , 𝑆2 𝑋 ,𝐷(𝑋) Míra rozptýlení
Jedná se o druhý centrální moment.
Diskrétní náhodná veličina (rozptyl):
𝑣𝑎𝑟 𝑋 = 𝜎2 𝑋 =
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 2 ∙ 𝑝𝑖
Spojitá náhodná veličina (rozptyl):
𝑣𝑎𝑟 𝑋 = 𝜎2 𝑋 =
−∞
∞
𝑥 − 𝐸 𝑋2𝑓 𝑥 𝑑𝑥
4.6 Výběrový rozptyl
Diskrétní náhodná veličina (při stejných pravděpodobnostech):
𝑣𝑎𝑟 𝑋 = 𝜎2 𝑋 =1
𝑛
𝑖=1
𝑛
𝑥𝑖 − 𝐸(𝑋) 2
Výsledek úkolu: průměrný nárazový vítr: 𝑠2 𝑋 = 1,06 m/s
Pro výběr nahrazujeme střední hodnotu průměrem a upravujeme počet stupňů volnosti:
𝑠2 𝑋 =1
𝑛 − 1
𝑖=1
𝑛
𝑥𝑖 − 𝑋 2
Pokud upravujeme počet stupňů volnosti, mluvíme zpravidla výběrovém rozptylu.
Vztah mezi rozptylem a výběrovým rozptylem má tvar:
𝑠2 𝑋 =𝑛
𝑛 − 1𝜎2 𝑋
4.7 výběrová směrodatná odchylka
pro diskrétní a pro spojitou náhodnou veličinu (průměrná rychlost větru)
Značení: 𝑣𝑎𝑟 𝑋 , 𝜎 𝑋 , 𝑆 𝑋 , 𝐷(𝑋)
Diskrétní náhodná veličina:
var 𝑋 =1
𝑛 − 1
𝑖=1
𝑛
(𝑥𝑖 − 𝑋)2
Spojitá náhodná veličina:
var 𝑋 =
−∞
∞
𝑥 − 𝐸 𝑋 2 𝑓 𝑥 𝑑𝑥
Výsledek úkolu: průměrná rychlost větru: 1,40 m/s
4.8 šikmost
pro diskrétní a pro spojitou náhodnou veličinu (průměrná venkovní teplota)
Značení: 𝛾1
Diskrétní náhodná veličina:
𝛾1 =𝐸 𝑋 − 𝐸(𝑋) 3
𝑣𝑎𝑟(𝑋) 3/2
Výběrový koeficient šikmosti
𝑔1 =𝑚3
(𝑚2)32
= 𝑛 𝑖=1
𝑛 𝑥𝑖 − 𝑋 3
𝑖=1𝑛 𝑥𝑖 − 𝑋 2
32
Kde 𝑋 je výběrový průměr, 𝑚2 je výběrový rozptyl a 𝑚3 je třetí výběrový centrální moment.
Výsledek úkolu: průměrná venkovní teplota: 0,380
4.9 Špičatost
pro diskrétní a pro spojitou náhodnou veličinu (průměrná venkovní vlhkost)
Značení: 𝛼4, 𝛾2 Míra špičatosti
Diskrétní i spojitá náhodná veličina:
𝛼4 = 𝛾2 =𝐸 𝑋 − 𝐸(𝑋) 4
𝑣𝑎𝑟(𝑋) 2− 3
Výběrový koeficient špičatosti:
𝑎4 = 𝑔2 =𝑚4
𝑚22 − 3 = 𝑛
𝑖=1𝑛 𝑥𝑖 − 𝑋 4
𝑖=1𝑛 𝑥𝑖 − 𝑋 2
2 − 3
kde 𝑋 je výběrový průměr,
𝑚2 je výběrový rozptyl (druhý výběrový centrální moment) a
𝑚4 je čtvrtý výběrový centrální moment.
Výsledek úkolu: průměrná venkovní vlhkost: 0,1030
4.10 Horní kvantil
Značení: 𝑥𝑝, 𝑄𝑝 Míra polohy
Kvantily tvoří inverzní funkci k distribuční funkci
Kvantil 𝑥𝑝 je tedy taková hodnota statistického znaku, před níž leží právě 𝑝 procent
shromážděných dat (seřazených podle velikosti).
Postup:
Pro uspořádaný soubor dat (vzestupně, tj. od nejmenšího k největšímu) je třeba určit pořadový index 𝑖𝑝 kvantilu 𝑥𝑝 a musí platit
𝑛𝑝 < 𝑖𝑝 < 𝑛𝑝 + 1
Kvantil 𝑥𝑝 je roven hodnotě znaku na pozici 𝑖𝑝.
Pokud jsou hodnoty celočíselné, pak se kvantil určí jako
aritmetický průměr hodnot na pozicích 𝑛𝑝 a 𝑛𝑝 + 125 % 25 % 25 % 25 %
(spec. horní kvartil) pro diskrétní a pro spojitou náhodnou veličinu (průměrný barometrický
tlak)
4.10 Horní kvantil
Speciální označení kvantilů
medián – statistický soubor je rozdělen na dvě stejně početné množiny – 𝑄0,5
kvartil – tři body, které rozdělují seřazená data do čtyř stejně početných skupin
dolní kvartil – 𝑄0,25 – 25% kvantil – hodnota, pod níž leží čtvrtina dat
horní kvartil – 𝑄0,75 – 75% kvantil – hodnota, nad níž leží čtvrtina dat
decil – horních a dolních 10 % dat
percentil – obecně
Výsledek úkolu: průměrný barometrický tlak: 968,75 mb
25 % 25 % 25 % 25 % 50 % 50 % 25 % 25 % 25 % 25 %
4.11 dolní kvantil
kvantily tvoří inverzní funkci k distribuční funkci
Kvantil 𝑥𝑝 je taková hodnota statistického znaku, před níž leží právě 𝑝 procent shromážděných dat (seřazených podle velikosti).
Pro uspořádaný soubor dat (vzestupně, tj. od nejmenšího k největšímu) je třeba určit pořadový index 𝑖𝑝 kvantilu 𝑥𝑝 a musí platit
𝑛𝑝 < 𝑖𝑝 < 𝑛𝑝 + 1Kvantil 𝑥𝑝 je roven hodnotě znaku na pozici 𝑖𝑝. Pokud jsou hodnoty celočíselné, pak kvantil se určí jako aritmetický průměr
Speciální označení kvantilů
medián – statistický soubor rozdělen na dvě stejně početné množiny 𝑄0,5
kvartil – tři body, které rozdělují seřazená data do čtyř stejných skupin
dolní kvartil – 25. percentil dat
horní kvartil – 75. percentil dat
decil – horních a dolních 10 %
percentil – obecně 25 % 25 % 25 % 25 %
(spec. dolní kvartil) pro diskrétní a pro spojitou náhodnou veličinu (průměrná vnitřní teplota)
Výsledek úkolu: průměrná vnitřní teplota: 19,9 °C
4.12 medián
kvantily tvoří inverzní funkci k distribuční funkci
Kvantil 𝑥𝑝 je taková hodnota statistického znaku, před níž leží právě 𝑝 procent shromážděných dat (seřazených podle velikosti).
Pro uspořádaný soubor dat (vzestupně, tj. od nejmenšího k největšímu) je třeba určit pořadový index 𝑖𝑝 kvantilu 𝑥𝑝 a musí platit
𝑛𝑝 < 𝑖𝑝 < 𝑛𝑝 + 1Kvantil 𝑥𝑝 je roven hodnotě znaku na pozici 𝑖𝑝. Pokud jsou hodnoty celočíselné, pak kvantil se určí jako aritmetický průměr
Speciální označení kvantilů
medián – statistický soubor rozdělen na dvě stejně početné množiny 𝑄0,5
kvartil – tři body, které rozdělují seřazená data do čtyř stejných skupin
dolní kvartil – 25. percentil dat
horní kvartil – 75. percentil dat
decil – horních a dolních 10 %
percentil – obecně 50 % 50 %
pro diskrétní a pro spojitou náhodnou veličinu (průměrná vnitřní vlhkost)
Výsledek úkolu: průměrná vnitřní vlhkost: 37,0 %
4.13 modus
Značení: 𝑚𝑜𝑑 𝑋 , 𝑥
Modus je hodnota, která se ve statistickém souboru
vyskytuje nejčastěji (má největší relativní četnost).
Diskrétní náhodné veličiny𝑃 𝑋 = 𝑥 ≥ 𝑃 𝑋 = 𝑥𝑖
Spojisté náhodné veličny
𝑓( 𝑥) ≥ 𝑓(𝑥)
dné veličiny X.
– nelze použít průměr.
pro diskrétní a pro spojitou náhodnou veličinu (průměrný nárazový vítr)
Výsledek úkolu: průměrný nárazový vítr: 0,00 m/s
4.14 minimum a maximum
Maximum je statistická funkce, kde její funkční hodnota představuje
nejvyšší hodnotu ze statistického souboru.𝑚𝑎𝑥 = 𝑥(𝑛)
Minimum je statistická funkce, kde její funkční hodnota představuje
nejnižší hodnotu ze statistického souboru.𝑚𝑖𝑛 = 𝑥(1)
pro diskrétní a pro spojitou náhodnou veličinu (průměrná rychlost větru)
Výsledek úkolu: průměrná rychlost větru:
minimum: 0,00 m/s,
maximum: 8,1 m/s
4.15 Rozpětí
Rozpětí (variační rozpětí) vyjadřuje míru variability
statistického souboru.
Rozdíl mezi největší a nejmenší hodnotou
statistického souboru.
𝑅 = 𝑚𝑎𝑥 − 𝑚𝑖𝑛 = 𝑥 𝑛 − 𝑥(1)25 % 25 % 25 % 25 %
pro diskrétní a pro spojitou náhodnou veličinu (průměrná venkovní teplota)
Výsledek úkolu:
průměrná venkovní teplota: 37,59 °C
4.16 Kvartilové rozpětí
Značení: 𝑄𝑅, 𝑅𝑄 Míra rozptýlení
1. kvartil (25% kvantil) označuje takovou hodnotu, aby čtvrtina pozorování byla menší (nebo rovna) této
hodnotě.
3. kvartil (75% kvantil) označuje takovou hodnotu, aby
čtvrtina pozorování byla větší (nebo rovna) této hodnotě.
Kvartilové rozpětí je rozdíl mezi tímto 3. a 1. kvartilem.
25 % 25 % 25 % 25 %
pro diskrétní a pro spojitou náhodnou veličinu (průměrná venkovní vlhkost)
Výsledek úkolu: průměrná venkovní vlhkost: 11,95 %
4.17 střední hodnota náhodného vektoru
náhodný vektor 𝐗 = (𝑋1, 𝑋2, … , 𝑋𝑛)𝑇
Střední hodnota náhodného vektoru je vektor středních hodnot
𝐸 𝐗 = 𝐸 𝑋1 , 𝐸 𝑋2 , … , 𝐸 𝑋𝑛𝑇
pro diskrétní a pro spojité rozdělení (průměrná venkovní teplota, průměrná venkovní vlhkost,
průměrný barometrický tlak)
Výsledek úkolu: průměrná venkovní teplota, průměrná venkovní vlhkost, průměrný
barometrický tlak: [9,39 °C, 82,54 %, 966,13 mb]
4.18 Kovarianční matice
náhodného vektoru pro diskrétní a pro spojité rozdělení (průměrná venkovní teplota,
průměrná venkovní vlhkost, průměrný barometrický tlak)
KOVARIANCE pro dvě náhodné veličiny X a Y
Kovariance vyjadřuje souvislosti (závislosti) mezi jednotlivými veličinami
𝜎𝑋,𝑌 = 𝑐𝑜𝑣 𝑋, 𝑌 = 𝐸 𝑋 − 𝐸 𝑋 𝑌 − 𝐸 𝑌
𝜎𝑋,𝑌 = 𝑐𝑜𝑣 𝑋, 𝑌 = 𝐸 𝑋𝑌 − 𝐸 𝑋 ∙ 𝐸 𝑌
Pozn.: 𝜎𝑋,𝑋 = 𝑐𝑜𝑣 𝑋, 𝑋 = 𝐸 𝑋 − 𝐸 𝑋 𝑋 − 𝐸 𝑋 = 𝐸 𝑋 − 𝐸 𝑋 2 = 𝑣𝑎𝑟(𝑋)
Kovariance může nabývat jakýchkoliv reálných hodnot, ale pro dvě
konkrétní veličiny musí platit
𝑐𝑜𝑣2 𝑋, 𝑌 ≤ 𝑣𝑎𝑟(𝑋) ∙ 𝑣𝑎𝑟(𝑌)
4.18 Kovarianční matice
KOVARIANČNÍ MATICE
Zobrazuje kovariance mezi n veličinami 𝑋1, … , 𝑋𝑛
=
𝜎11 𝜎12 … 𝜎1𝑛
𝜎21
⋮𝜎𝑛1
𝜎22 … 𝜎2𝑛
⋮ ⋱ ⋮𝜎𝑛2 … 𝜎𝑛𝑛
, 𝜎𝑖𝑗 jsou kovariance, 𝜎𝑖𝑗 = 𝑐𝑜𝑣 𝑋𝑖, 𝑋𝑗 = 𝐸 𝑋𝑖 − 𝐸(𝑋𝑖) 𝑋𝑗 − 𝐸(𝑋𝑗)
Pokud jsou 𝑋𝑖 a 𝑋𝑗 nezávislé, pak 𝑐𝑜𝑣 𝑋𝑖, 𝑋𝑗 = 0
Platí následující:
1) 𝜎𝑖𝑖 = 𝑐𝑜𝑣 𝑋𝑖 , 𝑋𝑖 = 𝑣𝑎𝑟(𝑋𝑖) a diagonální prvky matice představují rozptyly veličin
2) 𝜎𝑖𝑗 = 𝜎𝑗𝑖 (z definice) a kovarianční matice je tedy symetrická
4.18 Kovarianční matice
VÝBĚROVÁ KOVARIANČNÍ MATICE
Ve všech uvedených vztazích jsou střední hodnoty nahrazeny průměry
=
𝜎11 𝜎12 … 𝜎1𝑛
𝜎21
⋮𝜎𝑛1
𝜎22 … 𝜎2𝑛
⋮ ⋱ ⋮𝜎𝑛2 … 𝜎𝑛𝑛
, 𝜎𝑖𝑗 = 𝑐𝑜𝑣 𝑋𝑖 , 𝑋𝑗 = 𝐸 𝑋𝑖 − 𝑋𝑖 𝑋𝑗 − 𝑋𝑗
Pro vlastní výpočet lze použít vztah:𝜎𝑖𝑗 = 𝑐𝑜𝑣 𝑋, 𝑌 = 𝐸 𝑋𝑌 − 𝐸 𝑋 ∙ 𝐸 𝑌
a tedy:
𝜎𝑖𝑗 = 𝑐𝑜𝑣 𝑋𝑖 , 𝑋𝑗 = 𝐸 𝑋𝑖𝑋𝑗 − 𝐸 𝑋𝑖 ∙ 𝐸 𝑋𝑗
Pro daný výběr jsou v uvedeném vztahu opět střední hodnoty nahrazeny průměry a lze
upravit počty stupňů volnosti.
4.18 Kovarianční matice
Výsledek úkolu:
teplota (°C) vlhkost (%) tlak (mb)
teplota (°C) 32,30 -25,99 -1,87
vlhkost (%) -25,99 71,69 -2,96
tlak (mb) -1,87 -2,96 40,78
4.19 korelační matice
Korelační matice (matice korelačních koeficientů)
normováním kovariancí směrodatnými odchylkami 𝜎𝑖 =𝑣𝑎𝑟(𝑋𝑖) a 𝜎𝑗 = 𝑣𝑎𝑟(𝑋𝑗)
𝜍 = 𝑐𝑜𝑟𝑟 𝑋𝑖 , 𝑋𝑗 =𝑐𝑜𝑣 𝑋𝑖,𝑋𝑗
𝑣𝑎𝑟(𝑋𝑖) 𝑣𝑎𝑟(𝑋𝑗)
na rozdíl od kovariance nezávisí korelace na jednotkách a měřítku
jeho hodnota se nezmění lineární transformací tj. když místo 𝑋1 použijeme 𝑌1 = 𝑎 + 𝑏 ∙ 𝑋1 a místo 𝑋2 použijeme 𝑌2 = 𝑐 + 𝑑 ∙ 𝑋2
=> 𝑐𝑜𝑟𝑟 𝑋1, 𝑋2 = 𝑐𝑜𝑟𝑟 𝑌1, 𝑌2
𝑐𝑜𝑟𝑟 𝑋𝑖 , 𝑋𝑗 ∈ −1,1
náhodného vektoru pro diskrétní a pro spojité rozdělení (průměrná venkovní teplota,
průměrná venkovní vlhkost, průměrný barometrický tlak)
Výsledek úkolu:
teplota (°C) vlhkost (%) tlak (mb)
teplota (°C) 1,00 -0,59 -0,15
vlhkost (%) -0,59 1,00 0,01
tlak (mb) -0,15 0,01 1,00