Popisná statistika
Data
úplné
nepřehledné
Jejich popis
omezený
přehledný
Co zkoumáme
Centrální tendence
Rozptyl
Jsou data uniformní?
Pokud ne, jak vypadá jejich distribuce?
Jaká hodnota nejpravdivěji popíše
soubor dat?
Co zkoumáme
Centrální tendence
Průměr
Medián
…
Rozptyl
Histogram
Kvantily
Odchylka
Střední hodnota
Průměr (aritmetický, geo…)
Medián
Modus
Průměr
𝜇 = 𝑥 =𝑥1 + 𝑥2 +⋯+ 𝑥𝑛
𝑛=1
𝑛
𝑖
𝑥𝑖
𝐺 𝑥1, 𝑥2, … , 𝑥𝑛 =𝑛 𝑥1 ∙ 𝑥2 ∙ ⋯ ∙ 𝑥𝑛 =
𝑖=1
𝑛
𝑥𝑖
1𝑛
Rozdělení
0
0.5
1
1.5
2
2.5
3
0 5 10 15 20 25 30 35
Distribuce známek tříd, 1. pololetí 2014/2015
Histogram
0
1
2
3
4
5
6
1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 2.5 2.6
Histogram průměrů tří v 1. pololetí 2014/2015
Rozdělení: Gauss
Pouze pro náhodné
(statistické) jevy!
Jak poznat Gausse
Koeficient šikmosti
Koeficient špičatosti
Špičatost/kurtosis
Co s rozdělením?
Je rozdělení normální?
Pokud ANO, pak…
Data dobře popisuje jakákoli
centrální tendence
Jak měřit rozptyl
Histogram
Kvantily
Standardní odchylka
Kvantily
medián
kvartil
kvintil
decil
percentil
Mezikvartilovávzdálenost
9. – 1. decil
99. – 1. decil
Kvantily
2013 2014 2015
Box & whiskers
Odchylka
0
0.5
1
1.5
2
2.5
3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Odchylka
𝜎2 =1
𝑛
𝑖
𝑥𝑖 − 𝑥2
𝜎 =1
𝑛
𝑖
𝑥𝑖 − 𝑥2