statisztika ii. empirikus eloszlások elemzése előadó: prof. dr. besenyei lajos
DESCRIPTION
STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos. TÉMAKÖRÖK Gyakorisági sorok fajtái Kvantilisek Középértékek Szóródás. Empírikus eloszlás: A megfigyelések (kísérletek) eredményeként kapott adatok eloszlása. (elméleti eloszlás – valószínűségszámítás). - PowerPoint PPT PresentationTRANSCRIPT
STATISZTIKA II.
Empirikus eloszlások elemzése
Előadó: Prof. Dr. Besenyei Lajos
TÉMAKÖRÖK
1. Gyakorisági sorok fajtái
2. Kvantilisek
3. Középértékek
4. Szóródás
A számszerű adatok rendezési módja:
- Gyakorisági sor készítése
- Kvantilis értékek megadása
Empírikus eloszlás:
A megfigyelések (kísérletek) eredményeként
kapott adatok eloszlása.
(elméleti eloszlás – valószínűségszámítás)
Gyakorisági sor:
Valamely sokaságnak egy mennyiségi
ismérv szerinti csoportosítása
Tipikus eset: osztályközös gyakorisági sor
(kiosztott példa)
A gyakorisági sorból képezhető további
mennyiségi sortípusok:
- Értékösszeg sor
- Relatív gyakorisági és relatív értékösszegsor
- Kumulált (halmozott) gyakorisági és értékösszeg sorok
- Kumulált relatív gyakorisági és relatív értékösszegsor
(kiosztott példa)
Kvantilisek:
Az ismérvértékek elhelyezkedésének tömör
leírását adják.
Elnevezésük:
Medián (Me) ha két részre osztjuk
Kvartilis (Qj) ha négy részre osztjuk
Kvintilis (Kj) ha öt részre osztjuk
Decilis (Dj) ha tíz részre osztjuk
Percentilis (Pj) ha száz részre osztjuk
Meghatározásuk:
a) Rangsort készítünk (növekvő sorrend)
b) Meghatározzuk a kvantilis értékek sorszámát
(osztópontját).
Ahol:n= az adatok számak= az egyenlő részek számaj= 1,2,…k-1 az adott kvantilis értékeken belüli
sorszám
1 nk
js j
c) A rangsorban az sj sorszámhoz tartozó
ismérvértékek megkeresése.
A KIOSZTOTT PÉLDA ALAPJÁN:
Medián:
Kvartilisek: (Qj)
481952
1s
721954
3
481954
2
241954
1
3
2
1
s
s
s Q1=159 ezer forint
Q2= 201 ezer forint
Q3= 269 ezer forint
Me=201 ezer Ft
Decilis:
j Sorszám (sj) Decilis érték (Dj)
1 9,6 105,6
2 19,2 140,4
3 28,8 174,0
4 38,4 190,8
5 48,0 201,0
6 57,6 223,0
7 67,2 258,2
8 76,8 299,8
9 86,4 385,4
102+0,6 (108-102)=105,6
2,19962,019510
22 s
D2=140+0,2(142-140)=140,4
6,910
96195
10
11 s
Box-and-wishkers ábra:
(az adatok középső, 50%-át „dobozba” zárva tünteti fel)
xmin xmaxQ1 Me Q3
A vizsgált jövedelmek Box-and wishkers ábrája
A családok havi jövedelme 54 ezer és 490 ezer Ft között ingadozik. A családok középső 50%-a 159 ezer és 269 ezer Ft között jövedelemmel rendelkezik.
50 200150100 250 300 350 400 450 500
Xmin=54 Xmax=490Q1(159) Me Q3(269)
KÖZÉPÉRTÉKEK
A mennyiségi ismérv megfigyelt értékeit
- a centrális tendenciát - egyetlen számmal
mérik. A jellemző közös vonást emelik ki.
Értékelésükhöz elengedhetetlen a szóródás
ismerete, amellyel az eltérő sajátosságokat
lehet kiemelni.
KÖZÉPÉRTÉKEK FAJTÁI
Átlagok Helyzeti középértékek
számtani átlag Módusz (Mo)
mértani átlag Medián (Me)
(geometriai)
harmonikus átlag
négyzetes átlag
x
gx
hx
qx
a) Számtani átlag:
Egyszerű:
(tehát: ha a megfigyelt értékek helyébe a számtani átlagot tesszük, ezek kösszege egyenlő az eredeti értékek összegével.)
n
xx
f
fxx
Súlyozott:
xxn
Érzékeny a kiugró értékekre (outlierek)
A súlyok lehetnek a relatív gyakoriságok
(megoszlási viszonyszámok) is.
A súlyozott számtani átlag nagysága két
tényezőtől függ:
a) Átlagolandó értékek abszolút nagyságától és a
b) Súlyok arányaitól
Számítás a kiosztott példa alapján, egyedi adatokból:
Gyakorisági sorból:
4,22195
21036
95
449....6654
x ezer Ft
8,20095
20975
95
4752....12514758
x ezer Ft
b) Mértani átlag:
Egyszerű: Súlyozott:
Ha a megfigyelt értékek helyébe a mértani átlagot tesszük, azok szorzata megegyezik az eredeti adatok szorzatával.
Akkor használjuk, ha az értékek szorzata értelmezhető.
ng xx f fxx
c) Harmonikus átlag:
Egyszerű: Súlyozott:
d) Négyzetes átlag:
Egyszerű Súlyozott:
x
nxh 1
xff
xh
n
xxq
2
f
fxxq
2
Átlagok nagyságrendje:
Leggyakoribb a számtani átlag, használata
maxmin xxxxxx qgh
HELYZETI KÖZÉPÉRTÉKEK
Módusz (Mo)
A leggyakrabban előforduló, a „legdivatosabb – la mode”- érték
Medián (Me)
A ténylegesen középen lévő érték – ugyanannyi kisebb mint nagyobb érték található nála.
Diszkrét ismérveknél egyszerű a meghatározása. Osztályközök esetén becslést kell végezni.
Számítás a kiosztott példa alapján:
9,1905021231423
14230,150
oM ezer Ft
95,2055021
455,47200
Me ezer Ft
SZÓRÓDÁS
Az értékek különbözőségét, változékonyságát
szóródásnak nevezzük.
Mérőszámai:
a) a szóródás terjedelme (range) T
b) interkvartilis terjedelem (IQT)
c) átlagos abszolút eltérés (δ)
d) szórás (σ)
e) relatív szórás (v)
95 család havi jövedelmének adatai (ezer Ft)
2007. január 1-én
54 66 70 77 85 90 95 99 102 108 111
116 119 120 125 131 135 135 140 142 148 149
153 159 163 170 172 174 174 176 176 177 180
182 183 184 189 190 192 193 195 195 196 197
199 200 201 201 203 204 206 208 211 214 215
216 220 225 228 230 231 233 235 237 238 248
258 259 260 264 266 269 276 285 297 299 300
305 308 315 326 328 335 344 355 384 388 390
396 405 410 432 440 462 490
50 ezer forintos osztályközzel
Havi jövedelem( ezer Ft) Családok száma
50,0 – 99,9 8
100,0 – 149,9 14
150,0 – 199,9 23
200,0 – 249,9 21
250,0 – 299,9 10
300,0 – 349,9 8
350,0 – 399,9 5
400,0 – 449,9 4
450,0 – 499,9 2
Összesen: 95
jövedelem családok száma jövedelem összegeOsztályköz felső hatásánál kisebb
osztályközOsztályközép
Gyakori-ság
Relatív gyakoriság tényleges Becsült
Családok
száma
Jövedelem
összege
95 család havi jövedelmi adatai (1000 Ft)
2007. február 15-én
A struktúraváltozásról:
A megoszlási és dinamikus viszonyszámok
alakulása – a közöttük lévő összefüggés.
Példa: Egy település lakosságának száma és
megoszlása iskolai végzettség szerint 2000-ben
és 2006-ban:
Számítás
Megnevezés 2000. (I. 1.) 2006. (I. 1)AlapKözépFelső
12.5009.0003.700
10.20010.8005.100
Összesen: 25.200 26.100
Megnevezés Megoszlás % Változás % Vd
2000. I. 1. 2006. I. 1.
AlapKözépFelső
49,6
35,7
14,7
39,1
41,4
19,1
81,6
120,0
137,6Összesen: 100,0 100,0 103,6
Töltse ki tetszőleges számokkal az alábbi táblázatokat:
Egy vállalkozás adatai:Beosztás Megoszlás % Változás %
December JanuárBeosztottKözépvezetőFelsővezető
100118125
Összesen 100,0 100,0 118
Beosztás Megoszlás % Vd %December Január
BeosztottKözépvezetőFelsővezető
265222
30 5218
Összesen 100,0 100,0 92
Szórás a leggyakrabban használt szóródási mérőszám.
Kiszámítása:
egyszerű: súlyozott:
Azt mutatja, hogy az egyes (egyedi) értékek mennyivel térnek el átlagosan a számtani átlagtól, a centrális értéktől.
n
xx
2
f
xxf 2