statisztika ii. empirikus eloszlások elemzése előadó: prof. dr. besenyei lajos

30
STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Upload: fadhila

Post on 26-Jan-2016

45 views

Category:

Documents


0 download

DESCRIPTION

STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos. TÉMAKÖRÖK Gyakorisági sorok fajtái Kvantilisek Középértékek Szóródás. Empírikus eloszlás: A megfigyelések (kísérletek) eredményeként kapott adatok eloszlása. (elméleti eloszlás – valószínűségszámítás). - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

STATISZTIKA II.

Empirikus eloszlások elemzése

Előadó: Prof. Dr. Besenyei Lajos

Page 2: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

TÉMAKÖRÖK

1. Gyakorisági sorok fajtái

2. Kvantilisek

3. Középértékek

4. Szóródás

Page 3: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

A számszerű adatok rendezési módja:

- Gyakorisági sor készítése

- Kvantilis értékek megadása

Empírikus eloszlás:

A megfigyelések (kísérletek) eredményeként

kapott adatok eloszlása.

(elméleti eloszlás – valószínűségszámítás)

Page 4: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Gyakorisági sor:

Valamely sokaságnak egy mennyiségi

ismérv szerinti csoportosítása

Tipikus eset: osztályközös gyakorisági sor

(kiosztott példa)

Page 5: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

A gyakorisági sorból képezhető további

mennyiségi sortípusok:

- Értékösszeg sor

- Relatív gyakorisági és relatív értékösszegsor

- Kumulált (halmozott) gyakorisági és értékösszeg sorok

- Kumulált relatív gyakorisági és relatív értékösszegsor

(kiosztott példa)

Page 6: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Kvantilisek:

Az ismérvértékek elhelyezkedésének tömör

leírását adják.

Elnevezésük:

Medián (Me) ha két részre osztjuk

Kvartilis (Qj) ha négy részre osztjuk

Kvintilis (Kj) ha öt részre osztjuk

Decilis (Dj) ha tíz részre osztjuk

Percentilis (Pj) ha száz részre osztjuk

Page 7: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Meghatározásuk:

a) Rangsort készítünk (növekvő sorrend)

b) Meghatározzuk a kvantilis értékek sorszámát

(osztópontját).

Ahol:n= az adatok számak= az egyenlő részek számaj= 1,2,…k-1 az adott kvantilis értékeken belüli

sorszám

1 nk

js j

Page 8: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

c) A rangsorban az sj sorszámhoz tartozó

ismérvértékek megkeresése.

Page 9: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

A KIOSZTOTT PÉLDA ALAPJÁN:

Medián:

Kvartilisek: (Qj)

481952

1s

721954

3

481954

2

241954

1

3

2

1

s

s

s Q1=159 ezer forint

Q2= 201 ezer forint

Q3= 269 ezer forint

Me=201 ezer Ft

Page 10: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Decilis:

j Sorszám (sj) Decilis érték (Dj)

1 9,6 105,6

2 19,2 140,4

3 28,8 174,0

4 38,4 190,8

5 48,0 201,0

6 57,6 223,0

7 67,2 258,2

8 76,8 299,8

9 86,4 385,4

102+0,6 (108-102)=105,6

2,19962,019510

22 s

D2=140+0,2(142-140)=140,4

6,910

96195

10

11 s

Page 11: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Box-and-wishkers ábra:

(az adatok középső, 50%-át „dobozba” zárva tünteti fel)

xmin xmaxQ1 Me Q3

Page 12: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

A vizsgált jövedelmek Box-and wishkers ábrája

A családok havi jövedelme 54 ezer és 490 ezer Ft között ingadozik. A családok középső 50%-a 159 ezer és 269 ezer Ft között jövedelemmel rendelkezik.

50 200150100 250 300 350 400 450 500

Xmin=54 Xmax=490Q1(159) Me Q3(269)

Page 13: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

KÖZÉPÉRTÉKEK

A mennyiségi ismérv megfigyelt értékeit

- a centrális tendenciát - egyetlen számmal

mérik. A jellemző közös vonást emelik ki.

Értékelésükhöz elengedhetetlen a szóródás

ismerete, amellyel az eltérő sajátosságokat

lehet kiemelni.

Page 14: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

KÖZÉPÉRTÉKEK FAJTÁI

Átlagok Helyzeti középértékek

számtani átlag Módusz (Mo)

mértani átlag Medián (Me)

(geometriai)

harmonikus átlag

négyzetes átlag

x

gx

hx

qx

Page 15: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

a) Számtani átlag:

Egyszerű:

(tehát: ha a megfigyelt értékek helyébe a számtani átlagot tesszük, ezek kösszege egyenlő az eredeti értékek összegével.)

n

xx

f

fxx

Súlyozott:

xxn

Page 16: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Érzékeny a kiugró értékekre (outlierek)

A súlyok lehetnek a relatív gyakoriságok

(megoszlási viszonyszámok) is.

A súlyozott számtani átlag nagysága két

tényezőtől függ:

a) Átlagolandó értékek abszolút nagyságától és a

b) Súlyok arányaitól

Page 17: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Számítás a kiosztott példa alapján, egyedi adatokból:

Gyakorisági sorból:

4,22195

21036

95

449....6654

x ezer Ft

8,20095

20975

95

4752....12514758

x ezer Ft

Page 18: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

b) Mértani átlag:

Egyszerű: Súlyozott:

Ha a megfigyelt értékek helyébe a mértani átlagot tesszük, azok szorzata megegyezik az eredeti adatok szorzatával.

Akkor használjuk, ha az értékek szorzata értelmezhető.

ng xx f fxx

Page 19: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

c) Harmonikus átlag:

Egyszerű: Súlyozott:

d) Négyzetes átlag:

Egyszerű Súlyozott:

x

nxh 1

xff

xh

n

xxq

2

f

fxxq

2

Page 20: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Átlagok nagyságrendje:

Leggyakoribb a számtani átlag, használata

maxmin xxxxxx qgh

Page 21: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

HELYZETI KÖZÉPÉRTÉKEK

Módusz (Mo)

A leggyakrabban előforduló, a „legdivatosabb – la mode”- érték

Medián (Me)

A ténylegesen középen lévő érték – ugyanannyi kisebb mint nagyobb érték található nála.

Diszkrét ismérveknél egyszerű a meghatározása. Osztályközök esetén becslést kell végezni.

Page 22: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Számítás a kiosztott példa alapján:

9,1905021231423

14230,150

oM ezer Ft

95,2055021

455,47200

Me ezer Ft

Page 23: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

SZÓRÓDÁS

Az értékek különbözőségét, változékonyságát

szóródásnak nevezzük.

Mérőszámai:

a) a szóródás terjedelme (range) T

b) interkvartilis terjedelem (IQT)

c) átlagos abszolút eltérés (δ)

d) szórás (σ)

e) relatív szórás (v)

Page 24: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

95 család havi jövedelmének adatai (ezer Ft)

2007. január 1-én

54 66 70 77 85 90 95 99 102 108 111

116 119 120 125 131 135 135 140 142 148 149

153 159 163 170 172 174 174 176 176 177 180

182 183 184 189 190 192 193 195 195 196 197

199 200 201 201 203 204 206 208 211 214 215

216 220 225 228 230 231 233 235 237 238 248

258 259 260 264 266 269 276 285 297 299 300

305 308 315 326 328 335 344 355 384 388 390

396 405 410 432 440 462 490

Page 25: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

50 ezer forintos osztályközzel

Havi jövedelem( ezer Ft) Családok száma

50,0 – 99,9 8

100,0 – 149,9 14

150,0 – 199,9 23

200,0 – 249,9 21

250,0 – 299,9 10

300,0 – 349,9 8

350,0 – 399,9 5

400,0 – 449,9 4

450,0 – 499,9 2

Összesen: 95

Page 26: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

jövedelem családok száma jövedelem összegeOsztályköz felső hatásánál kisebb

osztályközOsztályközép

Gyakori-ság

Relatív gyakoriság tényleges Becsült

Családok

száma

Jövedelem

összege

95 család havi jövedelmi adatai (1000 Ft)

2007. február 15-én

Page 27: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

A struktúraváltozásról:

A megoszlási és dinamikus viszonyszámok

alakulása – a közöttük lévő összefüggés.

Példa: Egy település lakosságának száma és

megoszlása iskolai végzettség szerint 2000-ben

és 2006-ban:

Page 28: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Számítás

Megnevezés 2000. (I. 1.) 2006. (I. 1)AlapKözépFelső

12.5009.0003.700

10.20010.8005.100

Összesen: 25.200 26.100

Megnevezés Megoszlás % Változás % Vd

2000. I. 1. 2006. I. 1.

AlapKözépFelső

49,6

35,7

14,7

39,1

41,4

19,1

81,6

120,0

137,6Összesen: 100,0 100,0 103,6

Page 29: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Töltse ki tetszőleges számokkal az alábbi táblázatokat:

Egy vállalkozás adatai:Beosztás Megoszlás % Változás %

December JanuárBeosztottKözépvezetőFelsővezető

100118125

Összesen 100,0 100,0 118

Beosztás Megoszlás % Vd %December Január

BeosztottKözépvezetőFelsővezető

265222

30 5218

Összesen 100,0 100,0 92

Page 30: STATISZTIKA II. Empirikus eloszlások elemzése Előadó: Prof. Dr. Besenyei Lajos

Szórás a leggyakrabban használt szóródási mérőszám.

Kiszámítása:

egyszerű: súlyozott:

Azt mutatja, hogy az egyes (egyedi) értékek mennyivel térnek el átlagosan a számtani átlagtól, a centrális értéktől.

n

xx

2

f

xxf 2