statisztikai alapok

60
Statisztikai Statisztikai alapok alapok Alapfogalmak Alapfogalmak Leíró statisztikák Leíró statisztikák Dr.Ozsváth Károly Dr.Ozsváth Károly TF Informatikai és TF Informatikai és Oktatástechnológiai Tanszék Oktatástechnológiai Tanszék

Upload: kylene

Post on 26-Jan-2016

43 views

Category:

Documents


4 download

DESCRIPTION

Statisztikai alapok. Alapfogalmak Leíró statisztikák Dr.Ozsváth Károly TF Informatikai és Oktatástechnológiai Tanszék. Alapfogalmak. Statisztika : a tömegjelenségek leírásával és jellemzésével foglalkozó tudományág. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Statisztikai alapok

Statisztikai alapokStatisztikai alapok

AlapfogalmakAlapfogalmakLeíró statisztikákLeíró statisztikák

Dr.Ozsváth KárolyDr.Ozsváth KárolyTF Informatikai és Oktatástechnológiai TF Informatikai és Oktatástechnológiai

TanszékTanszék

Page 2: Statisztikai alapok

AlapfogalmakAlapfogalmak

StatisztikaStatisztika: a tömegjelenségek : a tömegjelenségek leírásával és jellemzésével foglalkozó leírásával és jellemzésével foglalkozó tudományág.tudományág.

Megállapításai és eredményei egyedi esetekre, Megállapításai és eredményei egyedi esetekre, egyénekre csak rendkívül korlátozottan és nagy egyénekre csak rendkívül korlátozottan és nagy hibahatárokkal vonatkoztathatók. hibahatárokkal vonatkoztathatók.

Page 3: Statisztikai alapok

A jelenségek leírásához többnyire A jelenségek leírásához többnyire elégséges a számtani alapműveletek elégséges a számtani alapműveletek használata.használata.

A jelenségek leírásán túlmenő A jelenségek leírásán túlmenő statisztikai elemzések központi eleme a statisztikai elemzések központi eleme a becslés, és a becsléshez kapcsolódó becslés, és a becsléshez kapcsolódó valószínűségek, hibahatárok elemzése. valószínűségek, hibahatárok elemzése.

Page 4: Statisztikai alapok

A A populációpopuláció – magyarul „alapsokaság” – magyarul „alapsokaság” – valamilyen ismertető jegyek, – valamilyen ismertető jegyek, tulajdonságok alapján összetartozó tulajdonságok alapján összetartozó egyedek összességét jelenti.egyedek összességét jelenti.

A A mintaminta a populáció vizsgált része. a populáció vizsgált része.

Page 5: Statisztikai alapok

Az adatok Az adatok jellegűk szerintjellegűk szerint lehetnek: lehetnek:

minőségi / megállapítható / kvalitatív, vagyminőségi / megállapítható / kvalitatív, vagy mennyiségi / mérhető / kvantitatív adatok.mennyiségi / mérhető / kvantitatív adatok.

Page 6: Statisztikai alapok

Az adatok Az adatok értékük / értékkészletükértékük / értékkészletük szerint lehetnek:szerint lehetnek:

bináris,bináris, diszkrét,diszkrét,

folytonos adatok.folytonos adatok.

Page 7: Statisztikai alapok

Az adatok a Az adatok a skála típusaskála típusa szerintszerint lehetnek: lehetnek:

nominális / névleges skála (nominal, nominális / névleges skála (nominal, categorical)categorical)

ordinális / sorrendi / rendező skála ordinális / sorrendi / rendező skála (orderes, ordered categorical)(orderes, ordered categorical)

intervallumskála (intervalintervallumskála (interval)) arányskála (proportionalarányskála (proportional))

Page 8: Statisztikai alapok

Adataink változókhoz, paraméterekhez Adataink változókhoz, paraméterekhez tartoznak. tartoznak.

ParaméternekParaméternek a vizsgált objektum/jelenség a vizsgált objektum/jelenség mért, számszerű jellemzőjét, tulajdonságát mért, számszerű jellemzőjét, tulajdonságát nevezzük, amelynek az alábbiak a sajátosságai nevezzük, amelynek az alábbiak a sajátosságai (Fábián-Zsidegh 1998): (Fábián-Zsidegh 1998):

számszerű, mennyiségi jellegű,számszerű, mennyiségi jellegű, egyetlen számmal jellemezhető,egyetlen számmal jellemezhető, egyértelmű,egyértelmű, pontos, értelmezhető.pontos, értelmezhető.

Page 9: Statisztikai alapok

A változóval szemben nincsenek ilyen A változóval szemben nincsenek ilyen megkötések, általánosabban használható megkötések, általánosabban használható a fogalom, vagy ha fentieknek nem a fogalom, vagy ha fentieknek nem teljesen felel meg a vizsgált teljesen felel meg a vizsgált jelenség/objektum valamely jellemzője. jelenség/objektum valamely jellemzője.

Page 10: Statisztikai alapok

Valószínűségi változóValószínűségi változó alatt az adott alatt az adott populációban vizsgált jelenség/objektum populációban vizsgált jelenség/objektum nem állandó értékű, hanem a nem állandó értékű, hanem a valószínűségi törvények szerint változó, valószínűségi törvények szerint változó, véletlentől függő, de azonos módon véletlentől függő, de azonos módon rögzített jellemzőjét értjük. rögzített jellemzőjét értjük.

Page 11: Statisztikai alapok

A statisztikában gyakran előfordul még a A statisztikában gyakran előfordul még a függő és független változókfüggő és független változók megkülönböztetése. A gyakorlatban ez azt megkülönböztetése. A gyakorlatban ez azt jelenti, hogy egyik tulajdonság jelenti, hogy egyik tulajdonság függvényében miként változik egy másik függvényében miként változik egy másik tulajdonság, ami értelemszerűen tulajdonság, ami értelemszerűen többváltozós esetekre is értelmezhető. többváltozós esetekre is értelmezhető.

Page 12: Statisztikai alapok

Szűk értelemben csak a regresszió Szűk értelemben csak a regresszió számításoknál használjuk. számításoknál használjuk.

Page 13: Statisztikai alapok

Tágabb értelmezésben az analízis tárgya Tágabb értelmezésben az analízis tárgya a függő változó, amelyet az adott a függő változó, amelyet az adott vizsgálati beállítás függvényében vizsgálati beállítás függvényében elemezünk. Különbségek elemzésénél elemezünk. Különbségek elemzésénél például a kategóriák, csoportok tekinthetők például a kategóriák, csoportok tekinthetők független változónak, melyek független változónak, melyek „függvényében” vizsgáljuk a különbségek „függvényében” vizsgáljuk a különbségek alakulását és jelentőségét, azaz alakulását és jelentőségét, azaz szignifikanciájátszignifikanciáját. .

Page 14: Statisztikai alapok

Leíró statisztikák Leíró statisztikák

A A leíró statisztikákleíró statisztikák (decriptives, basic (decriptives, basic statistic) a minta egyik változójának statistic) a minta egyik változójának alapvető jellemzőit adják meg. Ahogy a alapvető jellemzőit adják meg. Ahogy a nevében is benne van, leírják a mintát, a nevében is benne van, leírják a mintát, a minta jellemzőit foglalják magukba. minta jellemzőit foglalják magukba. Szokás Szokás alapstatisztikánakalapstatisztikának is nevezni. is nevezni.

A kapott értékek a további elemzések, A kapott értékek a további elemzések, statisztikai próbák során felhasználásra statisztikai próbák során felhasználásra kerülnek, kiindulási pontot jelentenek. kerülnek, kiindulási pontot jelentenek.

Page 15: Statisztikai alapok

A mintát alapvetően A mintát alapvetően elemszáma, elemszáma, középértékei, és adatainak középértékei, és adatainak változékonyságaváltozékonysága jellemzi. jellemzi.

A vizsgált esetek/egyedek (cases) számát A vizsgált esetek/egyedek (cases) számát elemszámnakelemszámnak nevezzük, jelölése: N, n nevezzük, jelölése: N, n (number). (number).

Page 16: Statisztikai alapok

A változékony adatok egy számmal A változékony adatok egy számmal jellemzését a jellemzését a középértékekközépértékek adják meg. adják meg. Középértékek: medián, módusz, átlag Középértékek: medián, módusz, átlag (median, modus, mean). (median, modus, mean).

Közülük legfontosabb az átlag, de a másik Közülük legfontosabb az átlag, de a másik két középérték is lényeges információkat két középérték is lényeges információkat hordoz. A különféle középértékek az hordoz. A különféle középértékek az egyes adatok elhelyezkedése, az adatok egyes adatok elhelyezkedése, az adatok eloszlása alapján egymástól kissé eloszlása alapján egymástól kissé eltérhetnek. eltérhetnek.

Page 17: Statisztikai alapok

Középértékek Középértékek A A mediánmedián a nagyság szerint rendezett a nagyság szerint rendezett

adatok közül a középső, „50%-os” érték, adatok közül a középső, „50%-os” érték, amelynél a kisebb és nagyobb adatok amelynél a kisebb és nagyobb adatok száma azonos. száma azonos.

A A móduszmódusz a leggyakrabban előforduló a leggyakrabban előforduló érték. A másik két középértékkel szemben érték. A másik két középértékkel szemben a móduszból több is lehet, mert több érték a móduszból több is lehet, mert több érték is előfordulhat azonos gyakorisággal.is előfordulhat azonos gyakorisággal.

Az Az átlagátlag vagy számtani közép az adatok vagy számtani közép az adatok összegének és elemszámának összegének és elemszámának hányadosa. Jelölése: X , x , vagy M. hányadosa. Jelölése: X , x , vagy M.

Page 18: Statisztikai alapok

Az adatok változékonyságának Az adatok változékonyságának mutatóimutatói

A középértékek önmagukban nem A középértékek önmagukban nem jellemzik kielégítően a mintát, ehhez jellemzik kielégítően a mintát, ehhez ismerni kell az adatok tömörülését, az ismerni kell az adatok tömörülését, az adatok változékonyságát mutató adatok változékonyságát mutató mérőszámokat is. Az adatok átlag körüli mérőszámokat is. Az adatok átlag körüli elhelyezkedése és tömörülése, elhelyezkedése és tömörülése, szétszórtsága, azaz szétszórtsága, azaz szóródásaszóródása több több értékkel is jellemezhető. Ezek közül értékkel is jellemezhető. Ezek közül legfontosabb és a további analízisek során legfontosabb és a további analízisek során is felhasználható mérőszám a szórás. is felhasználható mérőszám a szórás.

Page 19: Statisztikai alapok

Az adatok változékonyságának Az adatok változékonyságának „legdurvább” jellemzője a „legdurvább” jellemzője a terjedelemterjedelem, ami , ami a a szélsőértékekszélsőértékek (minimum-maximum) (minimum-maximum) közötti különbséget jelenti. közötti különbséget jelenti.

A szélsőértékek között az egyes adatok A szélsőértékek között az egyes adatok előfordulási gyakorisága adja az előfordulási gyakorisága adja az eloszlásteloszlást, ami tovább részletezhető. , ami tovább részletezhető.

Page 20: Statisztikai alapok

A nagyság szerint sorba rendezett adatok A nagyság szerint sorba rendezett adatok egyenlő darabszámú részekre bontását a egyenlő darabszámú részekre bontását a kvantilisekkvantilisek jelentik. Az adatok tetszőleges jelentik. Az adatok tetszőleges számú egyenlő részre oszthatók, a számú egyenlő részre oszthatók, a gyakorlatban azonban főleg két gyakorlatban azonban főleg két kvantilissel találkozhatunk. kvantilissel találkozhatunk.

Page 21: Statisztikai alapok

A A quartilisekquartilisek négy azonos előfordulási négy azonos előfordulási számú részre bontják az adatokat. számú részre bontják az adatokat.

Az alsó és felső quartilisek a nagyság Az alsó és felső quartilisek a nagyság szerint sorba rendezett adatok 25 és 75 szerint sorba rendezett adatok 25 és 75 százalékos határát jelentik (a „harmadik” – százalékos határát jelentik (a „harmadik” – pontosabban második – quartilis a pontosabban második – quartilis a medián, az 50 %-os érték). medián, az 50 %-os érték).

Page 22: Statisztikai alapok

A további tetszőleges pontosságú A további tetszőleges pontosságú részletezést a „százalékos” értékek, a részletezést a „százalékos” értékek, a percentilisekpercentilisek nyújtják. Jelölésük „P” nyújtják. Jelölésük „P” mellett egy szám (azaz a korábbiakban mellett egy szám (azaz a korábbiakban tárgyalt értékek percentilis megfelelői: P0, tárgyalt értékek percentilis megfelelői: P0, P25, P50, P75, P100).P25, P50, P75, P100).

Page 23: Statisztikai alapok

Az adatok változékonyságának, átlag Az adatok változékonyságának, átlag körüli elhelyezkedésének egy számmal körüli elhelyezkedésének egy számmal való jellemzése azonban az előzőek való jellemzése azonban az előzőek ellenére szükséges. ellenére szükséges.

Page 24: Statisztikai alapok

Erre szolgálhatna az Erre szolgálhatna az átlagos eltérésátlagos eltérés, az , az adatok középértéktől számított abszolút adatok középértéktől számított abszolút értékű eltéréséinek átlagolása .értékű eltéréséinek átlagolása .

Ez a mérőszám azonban a további Ez a mérőszám azonban a további statisztikai elemzésekhez nem statisztikai elemzésekhez nem használható és kiszámítása is használható és kiszámítása is körülményes. körülményes.

Page 25: Statisztikai alapok

A A szórásszórás az adatok az adatok változékonyságának általánosan változékonyságának általánosan használt mérőszáma a statisztikában.használt mérőszáma a statisztikában.

A szórást másképpen standard eltérésnek A szórást másképpen standard eltérésnek is nevezzük (standard deviation), jelölése: is nevezzük (standard deviation), jelölése: s, SD.s, SD.

Page 26: Statisztikai alapok

A szórás négyzete a A szórás négyzete a varianciavariancia, ami az adatok , ami az adatok „variálódását” jelzi, és a legtöbb statisztikai „variálódását” jelzi, és a legtöbb statisztikai módszer alkalmazásánál szerephez jut. A módszer alkalmazásánál szerephez jut. A varianciavariancia az átlagtól való eltérések az átlagtól való eltérések négyzeteinek összege osztva (n-1)-el. Jelölése: négyzeteinek összege osztva (n-1)-el. Jelölése: ss22 ,V. ,V.

Hangsúlyozni kívánom, hogy a szórás nem Hangsúlyozni kívánom, hogy a szórás nem egészen „kvázi átlagos eltérés”, mert alapját a egészen „kvázi átlagos eltérés”, mert alapját a négyzetes eltérések képezik – és ezek összegét négyzetes eltérések képezik – és ezek összegét nem az elemszámmal, hanem a nem az elemszámmal, hanem a szabadságfokkal osztjuk, ami a szórás esetében szabadságfokkal osztjuk, ami a szórás esetében (n-1) (n-1)

Page 27: Statisztikai alapok

A A négyzetes eltéréseknégyzetes eltérések (SQ, summa (SQ, summa quadrat) képezik az alapját a szórás quadrat) képezik az alapját a szórás kiszámításának. Ez a megoldás kiszámításának. Ez a megoldás számításba veszi az eltéréseket és számításba veszi az eltéréseket és egyúttal kiküszöböli a negatív előjeleket. A egyúttal kiküszöböli a negatív előjeleket. A négyzetes eltérések kvázi átlagolása adja négyzetes eltérések kvázi átlagolása adja a varianciát vagy szórásnégyzetet. a varianciát vagy szórásnégyzetet.

Page 28: Statisztikai alapok

A szórás további alapstatisztikai A szórás további alapstatisztikai mérőszámok kiinduló pontját is jelenti. mérőszámok kiinduló pontját is jelenti.

Ezek az átlag hibája és a variációs Ezek az átlag hibája és a variációs együttható.együttható.

Page 29: Statisztikai alapok

Az Az átlag hibájátátlag hibáját (standard error) más néven (standard error) más néven standard hibának, vagy átlag szórásának is standard hibának, vagy átlag szórásának is nevezik. nevezik.

Miután számításainkból végső soron az egész Miután számításainkból végső soron az egész populációra kívánunk következtetni, ezért az populációra kívánunk következtetni, ezért az elemszámoktól függően jelentkezik egy állandó elemszámoktól függően jelentkezik egy állandó hiba. Elvi jelentése az, hogy a populáció hiba. Elvi jelentése az, hogy a populáció tényleges átlaga körül hogyan szóródnak a tényleges átlaga körül hogyan szóródnak a populációból vett különböző minták átlagai, populációból vett különböző minták átlagai, illetve mennyire „pontos” az eredményünk. illetve mennyire „pontos” az eredményünk. Értékét a szórás és az elemszám Értékét a szórás és az elemszám négyzetgyökének hányadosa adja. négyzetgyökének hányadosa adja.

Jelölése: sJelölése: sxx , SE. , SE.

Page 30: Statisztikai alapok

A A variációs együtthatóvariációs együttható vagy más néven vagy más néven relatív szórásrelatív szórás az átlaghoz viszonyított az átlaghoz viszonyított százalékos formában mutatja az adatok százalékos formában mutatja az adatok változékonyságát. Segítségével különböző változékonyságát. Segítségével különböző dimenziójú és nagyságrendű változók dimenziójú és nagyságrendű változók szórása összevethető egymással. Értékét szórása összevethető egymással. Értékét a szórás és az átlag hányadosa adja. a szórás és az átlag hányadosa adja. Jelölése: v, s%, CV.Jelölése: v, s%, CV.

Page 31: Statisztikai alapok

Elemszám:Elemszám: nn

Összeg:Összeg: ∑x∑x

NégyzetösszegNégyzetösszeg ∑x∑x22

Négyzetes eltérés:Négyzetes eltérés: SQ= ∑(xSQ= ∑(xi i – x )– x )22 = =

∑∑xx22 – x *∑x = – x *∑x =

∑∑xx22 – ( ∑x ) – ( ∑x )22/n /n

Átlag:Átlag: x = ( ∑x )/nx = ( ∑x )/n

Szórás: Szórás: s = SQ/(n-1)s = SQ/(n-1)

Átlag hibája (standard hiba):Átlag hibája (standard hiba): ssxx = s/ n = s/ n

Varációs együttható: Varációs együttható: v = s/ x , v = s/ x , v% = s/ x v% = s/ x *100*100

Page 32: Statisztikai alapok

Az eredmények ábrázolásakor a Az eredmények ábrázolásakor a diagrammokon az átlagot és az átlag diagrammokon az átlagot és az átlag hibáját, vagy a szórást szokták feltüntetni. hibáját, vagy a szórást szokták feltüntetni. A statisztikai programokban ezt általában A statisztikai programokban ezt általában külön be lehet állítani, egyes grafikon külön be lehet állítani, egyes grafikon típusok pedig mindkét értéket képesek típusok pedig mindkét értéket képesek megjeleníteni. Az értékeket ± értelemben megjeleníteni. Az értékeket ± értelemben értelmezzük és általában így is ábrázoljuk.értelmezzük és általában így is ábrázoljuk.

Page 33: Statisztikai alapok

C a te g . Bo x & W h is ke r P lo t: TM

(C a s e w is e d e le tio n o f m is s in g d a ta )

Me a n Me a n ± SE Me a n ± SD

1 2 3 4

Szint

1 6 6

1 6 8

1 7 0

1 7 2

1 7 4

1 7 6

1 7 8

1 8 0

1 8 2

1 8 4

1 8 6

1 8 8

1 9 0

TM

Page 34: Statisztikai alapok

C a te g . Bo x & W h is ke r P lo t: TM

(C a s e w is e d e le tio n o f m is s in g d a ta )

Me a n Me a n ± SE Me a n ± 1 ,9 6 *SE

1 2 3 4

Szint

1 6 6

1 6 8

1 7 0

1 7 2

1 7 4

1 7 6

1 7 8

1 8 0

1 8 2

1 8 4

1 8 6

TM

Page 35: Statisztikai alapok

Me a n P lo t (TFfiu 2 0 0 6 _ 0 .s ta 2 8 v*6 7 c)

Me a n Me a n ± 0 ,9 5 C o n f. In te rva l

1 2 3 4

Szint

1 6 2

1 6 4

1 6 6

1 6 8

1 7 0

1 7 2

1 7 4

1 7 6

1 7 8

1 8 0

1 8 2

1 8 4

1 8 6

1 8 8

1 9 0

TM

Page 36: Statisztikai alapok

A leíró statisztikákhoz az előzőekben A leíró statisztikákhoz az előzőekben leírtakon túlmenően még a gyakorisági leírtakon túlmenően még a gyakorisági eloszlások és a standardizált értékek eloszlások és a standardizált értékek tartoznak.tartoznak.

Page 37: Statisztikai alapok

GyakoriságGyakoriság alatt azt értjük, hogy az egyes alatt azt értjük, hogy az egyes adataink hányszor fordulnak elő a mintában. adataink hányszor fordulnak elő a mintában.

Nagy adatterjedelem esetén az adatokat Nagy adatterjedelem esetén az adatokat egyenlő intervallumokba, egyenlő intervallumokba, osztályokbaosztályokba sorolhatjuksorolhatjuk[1][1]. Osztályba sorolt adatoknál az egy . Osztályba sorolt adatoknál az egy osztályban előforduló adatok száma jelenti a osztályban előforduló adatok száma jelenti a gyakoriságot, amit osztálygyakoriságnak is gyakoriságot, amit osztálygyakoriságnak is hívhatunk. A statisztikai programok a hívhatunk. A statisztikai programok a gyakoriságokat („frequencies”) minden egyes gyakoriságokat („frequencies”) minden egyes előforduló adatra, vagy tetszőlegesen beállított előforduló adatra, vagy tetszőlegesen beállított számú osztályra egyaránt megadják.számú osztályra egyaránt megadják.

[1][1] Ha nem programmal készíttetjük az osztályokba sorolást, akkor Ha nem programmal készíttetjük az osztályokba sorolást, akkor ügyelni kell az osztályhatárok megállapítására. A határokat úgy kell ügyelni kell az osztályhatárok megállapítására. A határokat úgy kell meghúzni, hogy egy adat ne tartozhasson két osztályba, azaz a meghúzni, hogy egy adat ne tartozhasson két osztályba, azaz a szomszédos osztályok felső és alsó határa ne legyen azonos. szomszédos osztályok felső és alsó határa ne legyen azonos. Praktikusan adatainknál egy helyiértékkel nagyobb pontosságú Praktikusan adatainknál egy helyiértékkel nagyobb pontosságú határok eleve kiküszöbölik ezt a hibázási lehetőséget.határok eleve kiküszöbölik ezt a hibázási lehetőséget.

Page 38: Statisztikai alapok

A korábbiakban már jeleztük, hogy az A korábbiakban már jeleztük, hogy az egyes adatok előfordulási egyes adatok előfordulási gyakoriságagyakorisága (frequency) valamilyen (frequency) valamilyen eloszlásteloszlást követ. A követ. A gyakorisági eloszlás grafikusan is gyakorisági eloszlás grafikusan is ábrázolható, ennek oszlopdiagramját ábrázolható, ennek oszlopdiagramját hisztogramnakhisztogramnak nevezzük. nevezzük.

Page 39: Statisztikai alapok

A hisztogram vízszintes (x) tengelyén a A hisztogram vízszintes (x) tengelyén a mért értékek helyezkednek el, míg a mért értékek helyezkednek el, míg a függőleges (y) tengelyen az előfordulási függőleges (y) tengelyen az előfordulási gyakoriságok. A gyakoriságok összessége gyakoriságok. A gyakoriságok összessége értelemszerűen azonos a minta értelemszerűen azonos a minta elemszámával (N). Megadható a elemszámával (N). Megadható a relatív relatív gyakorisággyakoriság is, ha a minta elemszámához is, ha a minta elemszámához viszonyított százalékos értékeket adjuk viszonyított százalékos értékeket adjuk meg az y tengelyen. meg az y tengelyen.

Page 40: Statisztikai alapok

Sokféle eloszlás létezik. Amennyiben Sokféle eloszlás létezik. Amennyiben minden adat egyforma gyakorisággal minden adat egyforma gyakorisággal fordulna elő, akkor az adatok fordulna elő, akkor az adatok egyenletes egyenletes eloszlásteloszlást követnének. követnének.

Page 41: Statisztikai alapok

A sokféle eloszlás közül a statisztikában, illetve A sokféle eloszlás közül a statisztikában, illetve a biológiai és társadalomtudományokban kiemelt a biológiai és társadalomtudományokban kiemelt jelentősége van a jelentősége van a normális eloszlásnaknormális eloszlásnak. .

A normális eloszlás legtöbb statisztikai A normális eloszlás legtöbb statisztikai számításnak elvi előfeltétele. A normális számításnak elvi előfeltétele. A normális eloszlás a folytonos eloszlások közé tartozik, eloszlás a folytonos eloszlások közé tartozik, grafikonját grafikonját Gauss-görbénekGauss-görbének is szokás nevezni. is szokás nevezni.

A természeti jelenségek jelentős része A természeti jelenségek jelentős része gyakorisági megnyilvánulásaiban a Gauss-gyakorisági megnyilvánulásaiban a Gauss-görbét követi. görbét követi.

Page 42: Statisztikai alapok

A normális eloszlás jellemzője, hogy A normális eloszlás jellemzője, hogy szimmetrikus, alakja harang alakú, csúcsa szimmetrikus, alakja harang alakú, csúcsa kerekített, és gyorsan lelapuló ágai elvileg a kerekített, és gyorsan lelapuló ágai elvileg a végtelenbe tartanak. A görbe szélessége és végtelenbe tartanak. A görbe szélessége és magassága sokféle lehet, elvileg végtelen sok magassága sokféle lehet, elvileg végtelen sok normális eloszlású görbe létezhet. A görbe normális eloszlású görbe létezhet. A görbe szélességének és magasságának jellemzője a szélességének és magasságának jellemzője a lapultság (kurtosis), míg a görbe lapultság (kurtosis), míg a görbe szimmetriájának jellemzője a ferdeség szimmetriájának jellemzője a ferdeség (skewness). Az adatok mindig jelentős (skewness). Az adatok mindig jelentős mértékben tömörülnek a középértékek körül, mértékben tömörülnek a középértékek körül, míg a szélső értékek felé egyre kisebb míg a szélső értékek felé egyre kisebb gyakoriságok fordulnak elő. A görbe negatív és gyakoriságok fordulnak elő. A görbe negatív és pozitív irányban is a végtelen felé tart.pozitív irányban is a végtelen felé tart.

Page 43: Statisztikai alapok

A normál görbének legfontosabb jellemzője, A normál görbének legfontosabb jellemzője, hogy adatok 68,26 %-a a középértéktől ± 1 hogy adatok 68,26 %-a a középértéktől ± 1 szórásnyi távolságra helyezkedik el. Középtől ± szórásnyi távolságra helyezkedik el. Középtől ± 2 szórásnyi távolságra az adatok 95,44%-a, míg 2 szórásnyi távolságra az adatok 95,44%-a, míg ± 3 szórásnyi távolságra az adatok 99,74%-a ± 3 szórásnyi távolságra az adatok 99,74%-a helyezkedik el. A 3 szórásnyi távolságokon helyezkedik el. A 3 szórásnyi távolságokon túlmenő, „végtelenbe nyúló” széleken már csak túlmenő, „végtelenbe nyúló” széleken már csak az adatok 0,26%-a található, amelyek akár az adatok 0,26%-a található, amelyek akár „extrém” értékeknek is tekinthetők. „extrém” értékeknek is tekinthetők.

Page 44: Statisztikai alapok

Az átlag=0, szórás=1, dimenzió nélküli Az átlag=0, szórás=1, dimenzió nélküli eloszlást standard normális eloszlást standard normális eloszlásnak nevezzük.eloszlásnak nevezzük. Bármilyen minta, Bármilyen minta, bármilyen változó egyszerűen bármilyen változó egyszerűen standardizálható, és ennek a standard standardizálható, és ennek a standard értéknek a jelölése „z” vagy esetleg „u”. Az értéknek a jelölése „z” vagy esetleg „u”. Az angol nyelvterületen – lásd statisztikai angol nyelvterületen – lásd statisztikai programokat – többnyire „Zscore” programokat – többnyire „Zscore” jelöléssel látják el, és a programok fel is jelöléssel látják el, és a programok fel is kínálják a standard értékek rögzítését.kínálják a standard értékek rögzítését.

Page 45: Statisztikai alapok

Kiszámítása nagyon egyszerű:Kiszámítása nagyon egyszerű:

Z = (xZ = (xii - átlag) / szórás - átlag) / szórás

másképpen:másképpen:

Z= (xZ= (xii – x )/s – x )/s

Page 46: Statisztikai alapok

H istog ram (Erg o 35v*45c)

TM = 45*2*normal(x; 183,9244; 5,3261)

TM

No

of o

bs

95,44%

68,26%

99,74%

P75, felső quartilis P25, alsó quartilis

P50, medián

-3 -2 -1 -0,67 0 0,67 1 2 3 0,13% 2,28% 15,87% 25% 50% 75% 84,13% 97,72% 99,87%

P100, maximumP0, minimum

-3 SD -2SD -1 SD átlag +1 SD +2 SD +3 SD

Page 47: Statisztikai alapok

Nézzünk néhány példátNézzünk néhány példáta TF 2006 évi EUROFIT a TF 2006 évi EUROFIT

méréseibőlméréseiből

Page 48: Statisztikai alapok
Page 49: Statisztikai alapok
Page 50: Statisztikai alapok
Page 51: Statisztikai alapok
Page 52: Statisztikai alapok
Page 53: Statisztikai alapok

His togram: TM

165 172 174 176 179 181 183 185 188 191 194

Category

0

1

2

3

4

5

6

7

No. of obs.

Page 54: Statisztikai alapok

His togram: TM

K-S d=,08675, p> .20; Lillief ors p> .20

Ex pec ted Normal

160 165 170 175 180 185 190 195 200

X <= Category Boundary

0

5

10

15

20

25

No. of obs.

Page 55: Statisztikai alapok

Descriptive Statistics (TFfiu2006_0)

VariableMeanStd.DevMinimumMaximumNNo.cases

MissingTTTM

78,067,946698634181,246,28165197634

Descriptive Statistics (TFfiu2006_0)

VariableValid NMeanMinimumMaximumStd.Dev.Standard

ErrorTTTM

6378,0666987,941,0063181,241651976,280,79

Descriptive Statistics (TFfiu2006_0)

VariableValid NMeanMinimumMaximumLower

QuartileUpperQuartile

VarianceStd.Dev.StandardError

TTTM

6378,063566,000098,000072,000081,000063,092687,9430901,00073563181,2381165,0000197,0000176,0000185,000039,377886,2751800,790598

Descriptive Statistics (TFfiu2006_0)

VariableValid NMeanMedianModeFrequency

of ModeMinimumMaximumVarianceStd.Dev.Standard

ErrorTTTM

6378,063577,0000Multiple566,000098,000063,092687,9430901,00073563181,2381182,0000Multiple6165,0000197,000039,377886,2751800,790598

Page 56: Statisztikai alapok

Sc atterplot: TM v s . TT

TT = -53,56 + ,72623 * TM

Correlation: r = ,57374

160 165 170 175 180 185 190 195 200

TM

60

65

70

75

80

85

90

95

100

TT

95% c onf idenc e

Page 57: Statisztikai alapok

Sc atterplot (TFf iu2006_0 28v *67c )

TT = -53,5577+0,7262*x

160 165 170 175 180 185 190 195 200

TM

60

65

70

75

80

85

90

95

100

TT

Page 58: Statisztikai alapok

www.hupe.hu/ozsvathk/www.hupe.hu/ozsvathk/

Page 59: Statisztikai alapok
Page 60: Statisztikai alapok