projektas - lidata.eu · 2.2. t – testas 2 nepriklausomoms imtims.....7 2.3 t – testas 2...
Post on 27-Apr-2018
251 Views
Preview:
TRANSCRIPT
1
Projektas
„Lietuvos HSM duomenų archyvo LiDA plėtra“
SFMIS Nr. VP1-3.1-ŠMM-02-V-02-001
SEMINARO „INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE“
MEDŽIAGA
Vydas Čekanavičius
(Paslaugų sutartis Nr. SA-2010-771/2, 2010-12-22)
Kaunas, 2011 m.
2
Turinys
1. Įvadas į statistinių hipotezių tikrinimą ........................................................................................................... 3
2. Hipotezių apie vidurkių lygybes tikrinimas .................................................................................................... 6
2.1 T – testas 1 imčiai .................................................................................................................................... 6
2.2. T – testas 2 nepriklausomoms imtims ..................................................................................................... 7
2.3 T – testas 2 priklausomoms imtims (porinis t testas) .............................................................................. 9
2.4 ANOVA .................................................................................................................................................... 10
2.5 Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA) .............................................................. 13
3. Neparametriniai kriterijai ............................................................................................................................. 15
3.1 Mann – Whitney testas .......................................................................................................................... 16
3.2 Wilcoxon testas ..................................................................................................................................... 17
3.3 Kruskal – Wallis testas ............................................................................................................................ 18
3.4 Friedman testas ..................................................................................................................................... 20
4. Požymių priklausomumo (kryžminių lentelių) analizė. ................................................................................ 21
4.1 Chi kvadrato nepriklausomumo (homogeniškumo) testas .................................................................... 21
4.2 Chi kvadrato suderinamumo testas ....................................................................................................... 23
Literatūra .......................................................................................................................................................... 25
3
1. Įvadas į statistinių hipotezių tikrinimą
Statistinės išvados (inferencinė statistika) turi vienintelį tikslą – ištyrus dalį respondentų (imtį,
imtis), padaryti išvadą apie visą populiaciją (populiacijas).
Įsivaizduokime dvi situacijas:
1) Virėjas paragauja sriubos ir nusprendţia – trūksta druskos.
2) Ekranţvaigţdė visiems TV ţiūrovams paaiškina – visi jie tokie!
Abi šios išvados yra akivaizdţiai statistinės. Virėjas prarijo šaukštą sriubos, o išvadą padarė apie
visą puodą. Ekranţvaigţdė savo patirtį apibendrino pagal gal ir nemaţą dalį, bet vis tiek tik dalį
visų jų. Matome, kad kartais apibendrinimai visiškai tikėtini (virėjas), o kartais labai abejotini
(ţvaigţdė). Inferencinėjs statistikoje viskas formalizuojama ir dar įvertinama, kiek galima tikėti
priimtu sprendimu. Visą statistinių hipotezių tikrinimą galima išskaidyti į tokius etapus:
a) Tyrimo hipotezės iškėlimas.
b) Statistinės hipotezės formulavimas.
c) Duomenų analizė.
d) Išvadų surašymas.
Aptarsime kiekvieną etapą atskirai. Tyrimo hipotezė – tai ta problema, kuri iš tikrųjų ir jaudina
tyrėją. Ji glaudţiai susijusi su tyrimo srities specifika. Pavyzdţiui, hipotezė, kad latviai valgo
daugiau ţuvies, nei lietuviai, yra sociologo (ar kulinaro, ar mediko) tyrimo hipotezė. Ji grindţiama
istoriniu kontekstu – Latvija visą laiką buvo jūrų valstybė, o Lietuva tik priešokiais, kai
prasibrukdavo prie Baltijos per kryţiuočius. Statistikos čia dar nėra. Kai politikas pasamprotauja,
kad parlamentarų darbo efektyvumas išaugs, jei jie kalbas sakys, stovėdami ant vienos kojos
(kairieji – ant kairės, dešinieji – ant dešinės), tai irgi yra tyrimo, o ne statistinė hipotezė. Ji
grindţiama ne faktais, o loginiu samprotavimu, kad tada šnekama bus trumpiau ir labiau iš esmės.
Statistinė hipotezė – tai tyrimo hipotezės formalizavimas (ir truputį matematizavimas). Visų
pirma, atitrūkstama nuo specifikos ir viskas uţrašoma standartiniais terminais. Jeigu lyginamos
vidutinės reikšmės, tai statistinė hipotezė formuluojama vidurkiams. Jeigu kalbama apie kintamųjų
priklausomybę, tai daţniausiai statistinė hipotezė keliama apie koreliacijos tarp kintamųjų stiprumą.
Standartinėse statistinėse hipotezėse naudojami tik šie terminai: vidurkiai, dispersijos,proporcijos
(procentai), koreliacija. Neparametrinėje statistikoje dar lyginami skirstiniai. Tarkime, norint
įvertinti parlamentarų darbo efektyvumą, galima tiesiog kalbėti apie vidutinį sprendimo priėmimo
laiką. Norėdami išsiaiškinti, ar vienakojis šnekėjimo metodas iš esmės efektyvesnis, turime
4
ankstesnį vidutinį sprendimų priėmimo laiką (paţymėkime jį simboliu a) palyginti su vienakojiškų
sprendimų vidutiniu laiku (paţymėkime jį simboliu ).
Visos statistinės hipotezės formuluojamos, kaip du alternatyvūs teiginiai: H0 (nulinė hipotezė),
tai teiginys apie parametrų skirtumų nebuvimą, o H1 (alternatyvioji hipotezė) – teiginys, kad
parametrai skiriasi.
H0: parametrų skirtumas yra lygus nuliui.
H1: parametrų skirtumas yra nelygus nuliui.
Net ir neparametrinėse hipotezėse skirtumas skelbiamas tik alternatyvoje H1. Pavyzdyje apie
politikus statistinė hipotezė uţrašoma taip:
H0: = a,
H1: ≠a
Ţinoma, yra ir vienpusių alternatyvų, pavyzdţiui H1: a. Reikia tik atsiminti, kad griežtos
nelygybės rašomos tik alternatyvose H1. Jos niekada nerašomos nulinėje hipotezėje H0.
Duomenų analizė – tai tinkamo statistinio kriterijaus parinkimas ir taikymas. Tiriama tik dalis
populiacijos (imtis), o apibendrinama visai populiacijai. Taip ir apsirikti galima. Klaidingi
sprendimai gali būti dviejų rūšių: kai be reikalo atmetame H0 (vadinamoji pirmos rūšies klaida) ir,
kai H0 neteisinga, o mes jos neatmetame (vadinamoji antros rūšies klaida). Minimizuoti abiejų
rūšių klaidas neįmanoma, todėl visuotinai sutarta daugiau dėmesio skirti pirmos rūšies klaidai. Kaip
taisyklė, daţniausiai siekiama parodyti, kad galioja H1 . Pavyzdţiui, politikas norėtų įrodyti, kad jo
siūlomas sprendimų pagreitinimo metodas veikia. Todėl iš anksto nusistatoma, koks maksimalus
leistinas neteisingų H0 atmetimų procentas. Tai vadinamasis reikšmingumo lygmuo. Daţniausiai
naudojamas reikšmingumo lygmuo yra 0,05. Tai reiškia, kad jeigu jau H0 atmesime, tai klaidos
tikimybė neviršys 5%.
Šiais laikais, kai statistinių hipotezių tikrinimui visuotinai naudojamos statsitinė programos,
sprendimai priimami atsiţvelgus į vadinamąsias p reikšmes. P reikšmė – tai konkretiems tiriamiems
duomenims apskaičiuota tikimybė, atmetant H0, padaryti klaidą. Šis apibrėţimas skamba labai
panašiai, kaip reikšmingumo lygmens apibrėţimas. Vis dėlto yra esminis skirtumas –
reikšmingumo lygmuo, tai teorinis etalonas, nurodantis leistiną klaidingų sprendimų procentą, o p
reikšmė yra konkreti konkretaus sprendimo klaidos tikimybė. Ji gali būti daug maţesnė uţ
reikšmingumo lygmenį (tada galima atmesti H0), o gali jį ir viršyti (tada H0 neatmetame).
5
Reikšmingumo lygmuo – iš anksto pasirinktas idealas (ne daugiau 5% klaidų), o p-reikšmė –
kiekvienai duomenų aibei sava tikimybė.
H0 atmetame, kai p-reikšmė < 0,05 (reikšmingumo lygmuo).
Kuo imtis didesnė, tuo p reikšmė maţesnė (jau taip jos skaičiuojamos). Todėl labai didelėms
imtims galime gauti maţas p reikšmes, vien dėl duomenų gausos.
Nors trokštamos išvados daromos apie populiacijos parametrus, jos visada formuluojamos,
imties duomenims ir visada naudojant ţodţių derinį statistiškai (ne)reikšminga. Ši frazė – grynų
gryniausias ţargonizmas. Ji tereiškia, kad (ne)labai tikėtina, jog H0 neteisinga. Pavyzdţiui, sakinys
imties vidurkis statistiškai reikšmingai skiriasi nuo skaičiaus a, tereiškia tokį samprotavimą:
sprendţiant iš imties duomenų, tikimybė, kad tikrasis vidurkis skiriasi nuo a labai didelė (didesnė
uţ 0,95, t.y. 95 %) . Teiginys imties vidurkis statistiškai reikšmingai nesiskiria nuo skaičiaus a
tereiškia, kad tikimybė, kad tikrasis vidurkis skiriasi nuo a maţesnė uţ 95 %. Bet tai dar
nereiškia, kad galima teigti, jog vidurkis lygus a. Gal lygus, o gal nelygus. Tiesiog pritrūko
įrodymų, kad nelygus. Panašiai, kaip paleidţiant įtariamąjį dėl įrodymų stokos.
Frazė statistiškai reikšmingas skirtumas interpretuotina taip: imtyje uţfiksuotas toks didelis
skirtumas, jog labai tikėtina, kad tai neatsitiktinumas ir toks skirtumas egzistuoja ir populiacijoje.
Reikia nepamiršti, kad statistiškai reikšmingi skirtumai gali atsirasti ir dėl didelio duomenų
skaičiaus. Todėl nereikia maišyti sąvokų statistiškai reikšmingas skirtumas ir prasmingas skirtumas.
Statistiškai reikšmingai sprendimas priimamas greičiau. Visomis trimis sekundėmis. Pelnas išaugo
statistiškai reikšmingai. Visu centu per metus. Ir ką – labai daug prasmės tokiame statistiniame
reikšmingume?
Statistiškai reikšmingas skirtumas gali būti visai nesvarbus tyrėjo išvadoms.
Įvado pabaigai priminsime keletą, ţemiau naudojamų sąvokų.
Skirstinys: Kintamojo įgyjamos reikšmės ir jų įgijimo tikimybės. Maţdaug: ţinau visas galimas
matuojamo kintamojo reikšmes ir kiek procentų respondentų populiacijoje jas turi.
Normalus kintamasis: kintamasis, kuris turi normalųjį skirstinį. Jo reikšmės išsibarsčiusios pagal
pakankamai bjauriai matematiškai aprašomą dėsnį. Praktikoje intervaliniai kintamieji, kurių
6
dauguma reikšmių yra netoli vidurkio ir kurie pakankamai simetriški laikomi beveik normaliais.
Normalių kintamųjų histogramos:
Visuose pavyzdţiuose naudojami duomenys paimti iš http://www.lidata.eu/ . Tyrimuose
naudosime:
1) „Studijų rezultatų kokybė: universitetų absolventų integracijos darbo rinkoje tyrimas“ duomenis:
LiDA0146_LAMS_STUDY_F1.
2) 2008 metų Europos Sąjungos socialinio klausimyno (European Social Survey) Lietuvos, Estijos
ir Portugalijos duomenis ESS4LT, ESS4EE ir ESS4PT.
3) Lietuvos vartotojų 2005 m tyrimas LiDA003_ZTLT_F1.
2. Hipotezių apie vidurkių lygybes tikrinimas
2.1 T – testas 1 imčiai
Visų pirma susitarsime dėl terminų:
Stjudento kriterijai dar vadinami t testais. Ir atvirkščiai.
Duomenys: 1 normali intervalinė imtis.
Statistinė hipotezė:
H0 atmetame (imties vidurkis statistiškai reikšmingai skiraisi nuo a), jei p-reikšmė < 0,05.
7
Pavyzdys: Ar 20-30 metų lietuvės savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina 6?
Failas ESS4LT: Su Select Cases atsirenkame reikiamas respondentes. Tada renkamės Analyze →
Compare Means → One sample T test. Į langelį Test Variable(s) įkeliame happy, o langelyje
Test Value uţrašome 6. Paspaudţiame OK.
Pirmojoje lentelėje pateikiamas imties vidurkis 6.88 (144 respondentai).
One-Sample Statistics
N Mean Std. Deviation Std. Error Mean
happy How happy are you 144 6.88 1.857 .155
Antrojoje lentelėje stulpelyje Sig. (2-tailed) uţrašyta p reikšmė = 0,000. Kadangi p < 0,05, tai
darome išvadą, jog tiriamos amţiaus grupės lietuvių laimingumo vidurkis (6.8) statistiškai
reikšmingai didesnis uţ 6.
One-Sample Test
Test Value = 6
t df Sig. (2-tailed)
Mean
Difference
95% Confidence Interval of the
Difference
Lower Upper
happy How happy are you 5.700 143 .000 .882 .58 1.19
2.2. T – testas 2 nepriklausomoms imtims
Duomenys: 2 normalios nepriklausomos intervalinės imtys.
Statistinė hipotezė:
H0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.
8
Pavyzdys: Ar 20-30 metų lietuviai ir estai vyrai savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina
vienodai? Failai ESS4LT ir ESS4EE. Pradţioje su komanda Data – Merge Files sujungiame abudu
failus. Renkamės Analyze → Compare Means → Independent Samples T Test.
Į langelį Test Variable(s) įkeliame happy, o į langelį Grouping variable kintamąjį cntry.
Paspaudţiame Define Groups ir įrašome Lietuvos ir Estijos kodus:
Spaudţiame Continue ir OK. Rezultatų išklotinė prasideda nuo imčių vidurkių.
Group Statistics
cntry Country N Mean Std. Deviation Std. Error Mean
happy How happy are you LT Lithuania 179 7.00 1.735 .130
EE Estonia 136 6.68 1.965 .169
9
Matome, kad Lietuvos piliečių vidutinis laimingumas yra 6.68, o estai truputį laimingesni – jų
laimingumo vidurkis yra 7,0. Norint nustatyti, ar vidurkių skirtumas yra statistiškai reikšmingas,
reikia kitoje lentelėje surasti tinkamą p reikšmę. SPSS pateikia net du t testo variantus. Vienas jų
skirtas atvejui, kai dispersijos lygios, o kitas – kai dispersijos nelygios. Formaliai sprendimas
daromas taip: pasiţiūrima į stulpelyje Levene‘s Test for Equality of Variances Sig. esančią
reikšmę. Jeigu ji ≥ 0,05 , tai t testo p reikšme laikoma viršutinis stulpelyje t-test for Equality of
Means Sig. (2-tailed) esantis skaičius. Priešingu atveju – apatinis skaičius.
Independent Samples Test
Levene's Test
for Equality of
Variances t-test for Equality of Means
F Sig. t df
Sig.
(2-
tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Lower Upper
happy
How
happy
are you
Equal variances
assumed
3.467 .064 1.512 313 .131 .316 .209 -.095 .728
Equal variances not
assumed
1.487 270.359 .138 .316 .213 -.102 .735
Matome, kad t testo p reikšmė yra lygi 0,131 > 0,05. Todėl darome išvadą, kad 20-30 metų lietuvių
ir estų vidutiniai laimingumo vertinimai statistiškai reikšmingai nesiskiria.
2.3 T – testas 2 priklausomoms imtims (porinis t testas)
Duomenys: poriniai normalieji stebėjimai.
Statistinė hipotezė:
H0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.
Pavyzdys: Ar 20-25 metų Lietuvos respondentai vienodai vertina švietimą ir sveikatos prieţiūros
įstaigas? Failas ESS4LT. Vertinimo skalė nuo 0 (labai nepatinka) iki 10 (labai patinka).
Atsirenkame norimo amţiaus respondentus. Tada renkamės Analyze → Compare Means →
Paired Samples T Test. Į laukelį Paired-Samples T Test įkeliame kintamuosius stfedu ir stfhlth.
Paspaudţiame OK.
10
Rezultatų išklotinėje matome, kad mokslo lygiu lietuviai pasitiki šiek tiek labiau (vid. 4,09), nei
sveikatos prieţiūra (vid. 3,59).
Paired Samples Statistics
Mean N Std. Deviation Std. Error Mean
Pair 1 stfedu 4.09 139 2.519 .214
stfhlth 3.59 139 2.398 .203
Lentelėje Paired Samples Test susiradę Sig. (2 – tailed) matome, kad p reikšmė = 0,007 < 0,05.
Todėl darome išvadą, kad mokslas vertinamas statistiškai reikšmingai palankiau, nei sveikatos
prieţiūra.
Paired Samples Test
Paired Differences
t df
Sig. (2-
tailed) Mean
Std.
Deviation
Std. Error
Mean
95% Confidence
Interval of the
Difference
Lower Upper
Pair 1 stfedu - stfhlth .504 2.158 .183 .142 .866 2.751 138 .007
2.4 ANOVA
ANOVA – vienfaktorės dispersinės analizės trumpinys (angl. Analysis Of Variance). Pavadinimas
– klaidinantis. ANOVA lygina dviejų ar daugiau nepriklausomų imčių vidurkius. Tai t testo
nepriklausomoms imtims apibendrinimas. Tiesiog hipotezė tikrinama, palyginant dviem būdais
įvertintą kintamųjų dispersiją: laikant, kad vidurkiai lygūs ir, kad ne. Iš čia ir ţodis dispersinė
pavadinime.
Duomenys: 2 ar daugiau nepriklausomų normaliųjų imčių. Visų imčių dispersijos turi būti
panašios. Standartinis reikalavimas – visi standartiniai nuokrypiai skiriasi ne daugiau nei dvigubai.
Statistinė hipotezė:
11
H0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.
Pavyzdys: Ar 20 -25 m lietuviai, estai ir portugalai vienodai vertina savo laimingumą? Failus
ESS4LT, ESS4EE ir ESS4PT sujungiame į vieną. Su komanda Automatic Record perkoduojame
kintamąjį cntry į skaitinį kintamąjį Acountry (1 – Estija, 2 – Lietuva, 2 – Portugalija). Su Select
Cases atsirenkame reikiamus respondentus. Pasirenkame: Analyze → Compare Means → One-
Way ANOVA. Į langelį Dependent List įkeliame happy, į langelį Factor – Acountry.
Pasirenkame Post Hoc ir paţymime Bonferroni.
Paspaudę Continue, renkamės Options. Paţymime Descriptives ir Means plot. Tada spaudţiame
Continue ir OK.
12
Rezultatų išklotinė prasideda nuo aprašomosios statistikos. Matome, kad vidutinis estų laimingumas
yra pats maţiausias, o portugalai – patys laimingiausi. Standartiniai nuokrypiai yra labai panašūs, nė
vienas nėra didesnis uţ kitus daugiau nei dvigubai.
Descriptives
happy How happy are you
N Mean Std. Deviation Std. Error
95% Confidence Interval for
Mean
Minimum Maximum Lower Bound Upper Bound
1 Estonia 80 6.29 2.039 .228 5.83 6.74 2 10
2 Lithuania 103 6.97 1.729 .170 6.63 7.31 3 10
3 Portugal 78 7.41 1.670 .189 7.03 7.79 2 10
Total 261 6.89 1.859 .115 6.67 7.12 2 10
Pagrindinėje ANOVA lentelėje suradę p reikšmę p = 0,001, padarome išvadą, kad ne visų
grupių vidurkiai vienodi (yra statistiškai reikšmingai besiskiriančių vidurkių).
ANOVA
happy How happy are you
Sum of Squares df Mean Square F Sig.
Between Groups 50.824 2 25.412 7.730 .001
Within Groups 848.172 258 3.287
Total 898.996 260
Lentelėje Multiple Comparisons matome Bonferoni testo rezultus. Statistiškai reikšmingi
vidurkių skirtumai paţymėti ţvaigţdutėmis. Estai skairiasi nuo lietuvių ir nuo portugalų, o lietuviai
ir portugalai savo laimingumu statistiškai reikšmingai nesiskiria.
Multiple Comparisons
happy How happy are you
Bonferroni
(I) Acountry
Country
(J) Acountry
Country
Mean
Difference (I-J) Std. Error Sig.
95% Confidence Interval
Lower Bound Upper Bound
1 Estonia 2 Lithuania -.683* .270 .036 -1.33 -.03
3 Portugal -1.123* .289 .000 -1.82 -.43
2 Lithuania 1 Estonia .683* .270 .036 .03 1.33
3 Portugal -.439 .272 .323 -1.10 .22
3 Portugal 1 Estonia 1.123* .289 .000 .43 1.82
2 Lithuania .439 .272 .323 -.22 1.10
*. The mean difference is significant at the 0.05 level.
Rezultatų išklotinė baigiasi vidurkių grafiku.
13
Išvadas galima aprašyti taip: taikėme ANOVA. Gavome, kad gyvenamoji vieta ir laimingumas
statistiškai reikšmingai susiję (p = 0,007). Pagal Bonferoni kriterijų vidutinis estų laimingumas
statistiškai reikšmingai skiriasi nuo lietuvių ir portugalų laimingumo. Lietuvių ir portugalų
vidutiniai laimingumai statistiškai reikšmingai nesiskiria.
2.5 Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA)
Porinio T testo apibendrinimas, kai imčių gali būti daugiau uţ 2.
Duomenys: dviejų, ar daugiau, normaliųjų stebėjimų vektoriai (x,y,z,...).
Statistinė hipotezė:
H0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.
Pavyzdys: Ar Lietuvos 20-25 m respondentai vienodai palankiai vertina partijas, teisinę sistemą ir
Europarlamentą? Failas ESS4LT. Atsirenkame reikiamo amţiaus respondentus. Pasirenkame
Analyze → General Linear Model → Repeated Measures. Langelyje Number of Levels
nurodome kelių stulpelių vidurkius lyginsime (3), paspaudţiame Add, po to Define.
Atsidariusiame langelyje perkeliame kintamuosius trstprt, trstlgl, trstep į Within Subject
Variables. Renkamės Options.
14
Perkeliame factor1 į Display Means for, paţymime laukelį Compare main effects, ir pasirenkame
Bonferroni. Paţymime Descriptive statistics. Tada Continue ir OK.
Rezultatų išklotinėje pateikti vidurkiai (skalė 1 – visiškai nepasitikiu,....,10 – visiškai pasitikiu):
Descriptive Statistics
Mean Std. Deviation N
trstprt 1.88 2.016 151
trstlgl 3.50 2.503 151
trstep 4.87 2.751 151
Ar yra statistiškai besiskiriančių vidurkių, suţinome paţiūrėję į lentelę Tests of Within-Subjet
Effects, stulpelį Sig. Šiuo atveju visos p reikšmės yra statistiškai reikšmingos (pagrindinė p reikšmė
yra eilutėje Sphericity Assumed). Taigi yra statistiškai reikšmingai besiskiriančių vidurkių.
Tests of Within-Subjects Effects
Measure:MEASURE_1
Source
Type III Sum of
Squares df Mean Square F Sig.
factor1 Sphericity Assumed 675.024 2 337.512 116.164 .000
Greenhouse-Geisser 675.024 1.876 359.828 116.164 .000
Huynh-Feldt 675.024 1.899 355.484 116.164 .000
Lower-bound 675.024 1.000 675.024 116.164 .000
Bonferoni testo rezultatai yra lentelėje Pairwise Comparisons. Matome, kad statistiškai
reikšmingai skiriasi visų trijų institucijų vertinimų vidurkiai. Išvada: pritaikius blokuotų duomenų
ANOVA ir Bonferoni testą, gavome, kad statistiškai reikšmingai skiriasi visų trijų institucijų
vertinimų vidurkiai. Palankiausiai vertinamas Europarlamentas (vid. 4.87 balo), blogiau teisinė
15
sistema (vid. 3,50 balo). Visų nepalankiausiai vertinamos partijos (vid. 1,88 balo). Visos institucijos
vertinamos blogiau, nei vidutiniškai.
Pairwise Comparisons
Measure:MEASURE_1
(I) factor1 (J) factor1
Mean
Difference (I-J) Std. Error Sig.a
95% Confidence Interval for
Differencea
Lower Bound Upper Bound
1 2 -1.616* .169 .000 -2.025 -1.206
3 -2.987* .209 .000 -3.493 -2.480
2 1 1.616* .169 .000 1.206 2.025
3 -1.371* .208 .000 -1.873 -.868
3 1 2.987* .209 .000 2.480 3.493
2 1.371* .208 .000 .868 1.873
Based on estimated marginal means
*. The mean difference is significant at the .05 level.
a. Adjustment for multiple comparisons: Bonferroni.
3. Neparametriniai kriterijai
Tai kriterijai, kuriems uţtenka rangų ir nereikia, kad kintamieji būtų normalūs. Išvadas visada
sunkiau suformuluoti ir kitiems išaiškinti. Kai visi skaičiai išrikiuojami nuo maţiausio iki
didţiausio, tai iš esmės rangas nurodo, kurioje pozicijoje konkretus stebėjimas atsidūrė. Nuo
pozicijos numerio rangas skiriasi tik tada, kai yra vienodo didumo stebėjimai, nes jų rangai turi būti
lygūs.
Stebėjimai: 1, 3, 7, 12, 23, 25, 25, 48.
Pozicijos nr: 1, 2, 3, 4, 5, 6, 7, 8.
Rangai: 1, 2, 3, 4, 5, 6.5, 6.5, 8.
Neparametriniuose kriterijuose lyginami skirstiniai, t.y. bandoma viso labo nustatyti, kurioje imtyje
daugiau didesnių skaičių. Beveik visada tai reiškia, kad išrikiuojame abiejų (visų) imčių stebėjimus
į vieną eilutę, suranguojame, o tada surandame vidutinius rangus (angl. mean rank). Ta imtis, kurios
vidutinis rangas didesnis ir įgyja daugiau didesnių reikšmių. Vidutinis rangas nėra stebėjimų
vidurkis, nes rangas nėra tas pats, kas stebėjimas. Jeigu dešimtas stovi metro dvidešimties ūgio
respondentas, tai rangas bus dšimt (jei kaimynų ūgiai skiriasi), o stebėjimas – 1,20 m.
16
3.1 Mann – Whitney testas
T – kriterijaus nepriklausomoms imtims analogas.
Duomenys: Dvi nepriklausomos intervalinės arba ranginės (kintamasis įgyja bent 5 skirtingas
rangines reikšmes) imtys.
Statistinė hipotezė:
H0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.
Pavyzdys: Ar vienodai patenkinti atlyginimu baigusieji ekonomiką vyrai ir moterys? Failas
LiDA0146_LAMS_STUDY_F1 . Atsirenkame ekonomiką baigusius (K8=57). Nuomonė apie algą
yra ranginė (K37_4: 1- labai ne, 5 – labai taip). Renkamės Analyze → Nonparametric Tests →
(Legacy Dialogs) → 2 Independent Samples. Kintamąjį K37_4 keliame į Test Variable List,
kintamąjį D1 į Grouping Variable ir nurodome lyties kodus. Spaudţiame OK.
Rezultatų išklotinėje matome, kad vyrai palankiau vertina savo algą (mean rank = 53,32), nei
moterys (41,91).
Ranks
D1|Lytis N Mean Rank Sum of Ranks
K37_4 1 Moteris 55 41.91 2305.00
2 Vyras 37 53.32 1973.00
Total 92
17
Kitoje lentelėje suradę Asymp.Sig. (2-tailed) , įsitikiname, kad p reikšmė =0,035 < 0,05. Darome
išvadą, kad vyrai statistiškai reikšmingai palankiau vertina savo atlyginimą, nei moterys.
Test Statisticsa
K37_4 K37_4|Pasitenkinimas
atlyginimu uþ esamà darbà
Mann-Whitney U 765.000
Wilcoxon W 2305.000
Z -2.105
Asymp. Sig. (2-tailed) .035
a. Grouping Variable: D1 D1|Lytis
3.2 Wilcoxon testas
T – porinio kriterijaus analogas.
Duomenys: poriniai intervaliniai arba ranginiai (kintamasis įgyja bent 5 skirtingas rangines
reikšmes) stebėjimai.
Statistinė hipotezė:
H0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.
Pavyzdys: : Ar vienodai patenkinti atlyginimu ir darbo sąlygomis baigusieji psichologiją? Failas
LiDA0146_LAMS_STUDY_F1 . Atsirenkame psichologiją baigusius (K8=60). Nuomonė apie
algą ir darbo sąlygas yra ranginė (1- labai ne, 5 – labai taip). Renkamės Analyze →
Nonparametric Tests → (Legacy Dialogs) → 2 Related Samples. Kintamuosius K37_3 ir K37_4
keliame į Test Pairs, spaudţiame OK.
18
Rezultatų išklotinėje matome, kad vidutinis rangas yra didesnis atveju, kai K37_4 < K37_3.
Ranks
N Mean Rank Sum of Ranks
K37_4 - K37_3 Negative Ranks 26a 14.63 380.50
Positive Ranks 4b 21.13 84.50
Ties 9c
Total 39
a. K37_4 < K37_3
b. K37_4 > K37_3
c. K37_4 = K37_3
Suradę kitoje lentelėje Asymp.Sig.(2-tailed), įsitikiname, kad p = 0,002 < 0,05. Darome išvadą, kad
statistiškai reikšmingai palankiau vertinamos darbo sąlygos, nei gaunamas atlyginimas.
Test Statisticsb
K37_4 - K37_3
Z -3.133a
Asymp. Sig. (2-tailed) .002
3.3 Kruskal – Wallis testas
ANOVA neparametrinis analogas (bet be post hoc testų).
Duomenys: Dvi ar daugiau nepriklausomų intervalinių arba ranginių (kintamasis įgyja bent 5
skirtingas rangines reikšmes) imčių.
Statistinė hipotezė:
H0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.
Pavyzdys: Ar 20-25 m lietuviai, estai ir portugalai vienodai vertina savo pasitenkinimą gyvenimu?
Failai ESS4LT, ESS4EE, ESS4PT. Sujungiame failus (Merge Files) ir atsirenkame tinkamo
amţiaus respondentus. Su Automatic Recode sukuriame skaitinį, šalį nurodantį, kintamąjį
Acountry. Pasitenkinimas gyvenimu (kintamasis stflife) įgyja reikšmes nuo 1 –labai nepatenkintas,
iki 10 – labai patenkintas. Pasirenkame Analyze → Nonparametric Tests → (Legacy Dialogs)
→ K Independent Samples . Į langelį Test Variable List įkeliame kintamąjį stflife. Į langelį
19
Grouping Variable įkeliame Acountry ir nurodome jo maţiausią (1) ir didţiausią (3) kodus.
Spaudţiame OK.
Pagal vidutinius rangus darome išvadą, kad palankiausiai gyvenimą vertina lietuviai, o
nepalankiausiai – portugalai.
Ranks
Acountry Country N Mean Rank
stflife How satisfied with life
as a whole
1 Estonia 159 249.21
2 Lithuania 162 197.95
3 Portugal 153 267.21
Total 474
Grafoje Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05. Todėl darome išvadą, kad yra statistiškai
reikšmingų skirtumų tarp Lietuvos, Estijos ir Portugalijos jaunimo poţiūrių į gyvenimą.
Test Statisticsa,b
stflife How satisfied with life as a whole
Chi-Square 22.387
df 2
Asymp. Sig. .000
a. Kruskal Wallis Test
Svarbu: niekur neminėjome vidurkių (geriausiu atveju – vidutinius rangus) ir netaikėme Post Hoc
testų (nes jų nėra). Todėl atsakymas ganėtinai dalinis, ne taip, kaip taikant ANOVA.
20
3.4 Friedman testas
Blokuotų duomenų ANOVA neparametrinis analogas (bet be post hoc testų).
Duomenys: 2 ar daugiau intervalinių arba ranginių (kintamasis įgyja bent 5 skirtingas rangines
reikšmes) stebėjimų vektoriai.
Statistinė hipotezė:
H0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.
Pavyzdys: Ar vienodai patenkinti atlyginimu, darbo sąlygomis ir darbo pobūdţiu baigusieji
politologiją? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame politologiją baigusius (K8=52)
respondentus. Nuomonė apie algą, darbo sąlygas ir darbo pobūdį yra ranginė (1- labai ne, 5 – labai
taip). Renkamės Analyze → Nonparametric Tests → (Legacy Dialogs) → K Related Samples.
Kintamuosius K37_2, K37_3 ir K37_4 keliame į Test Variables, spaudţiame OK.
Lentelėje Ranks nurodyti kintamųjų vidutiniai rangai. Friedman kriterijaus atveju jie rodo, kokią
vidutiniškai vietą tarp trijų kintamųjų pagal savo didumą uţima kiekvienas kintamasis. Aiškiai
matyti, kad nepalankiausiai įvertinta nuomonė apie atlyginimą (jeigu visi respondentai šiam
kintamajam būtų skyrę maţiausius balus, vidurkis būtų 1, o dabar jis 1,37).
Ranks
Mean Rank
K37_2 2.28
K37_3 2.35
K37_4 1.37
21
Nors skirtumai statistiškai reikšmingi (Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05) vis dėlto
tegalima padaryti išvadą, kad yra statistiškai reikšmingų skirtumų, vertinant darbo pobūdį, sąlygas
ir atlyginimą ir pasamprotauti apie tai, kuo labiausiai nepatenkinti respondentai. Taip, kaip
parašėme aukščiau. Post hoc kriterijų nėra.
4. Požymių priklausomumo (kryžminių lentelių) analizė.
Faktiškai kryţminių lentelių statistiniam vertinimui taikomas vienintelis – chi kvadrato kriterijus.
Reikia įsidėmėti, kad
a) Chi kvadrato kriterijus labai jautrus duomenų skaičiui. Kai duomenų nedaug, net ir dideli
procentiniai skirtumai bus pripaţinti statistiškai nereikšmingais. Kai duomenų labai daug, tai
net ir menkiausi procentiniai skirtumai tampa statistiškai reikšmingais.
b) Sudarinius kryţminę lentelę, joje neturi būti daug pustuščių langelių. Chi kvadrato statistika
tampa nepatikima, kai tokių langelių daugiau, nei penktadalis. Tada tiesiog reikėtų
sustambinti kategorijas.
4.1 Chi kvadrato nepriklausomumo (homogeniškumo) testas
Duomenys: respondentai pagal du kategorinius poţymius suskirstyti į kategorijas.
Statistinė hipotezė:
H0 atmetame (požymiai statistiškai reikšmingai susiję), jei p-reikšmė < 0,05.
Pavyzdys: Ar , išmokant grąţą, vienodai apgaudinėjami vyrai ir moterys? Failas
LiDA003_ZTLT_F1. Renkamės Analyze → Descriptive Statistics → Crosstabs.
Į langelį Row(s) įkeliame kintamąjį s01 (lytį), į Column(s) – kintamąjį a09_01.
Test Statisticsa
N 30
Chi-Square 27.519
df 2
Asymp. Sig. .000
22
Paspaudţiame Statistics ir paţymime Chi-square. Grįţtame į ankstesnį meniu.
Paspaudţiame Cells, atsidariusiame lange paţymime Row ir Column. Grįţtame į ankstenį meniu ir
spaudţiame OK.
Rezultatų išklotinėje randame lentelę Crosstabulation. Jooje pateikti procentai nerodo, kad
kaţkurią lytį apgaudinėtų daţniau. Gaunant grąţą buvo apgauti 39% vyrų ir 40,6 % moterų.
Crosstabulation
a09_01 Bûti apgautam gaunant gràþà
Total 1 Taip 2 Ne
s01 Lytis 1 Vyras Count 184 288 472
% within s01 Lytis 39.0% 61.0% 100.0%
% within a09_01 Bûti
apgautam gaunant gràþà
43.4% 45.1% 44.4%
2 Moteris Count 240 351 591
% within s01 Lytis 40.6% 59.4% 100.0%
% within a09_ Bûti
apgautam gaunant gràþà
56.6% 54.9% 55.6%
Total Count 424 639 1063
% within s01 Lytis 39.9% 60.1% 100.0%
% within a09_ 100.0% 100.0% 100.0%
Lentelėje Chi-Square Tests pateiktos net kelios p reikšmės. Kadangi šiuo atveju turime 2x2
lentelę, tai stulpelyje Exact.Sig. (2-tailed) pateikiama ir tiksli p reikšmė (0,614). Visada bus
23
aprašyta ir asimptotinė p reikšmė – stulpelyje Asymp. Sig. (2-sided) (ji lygi 0,591). Kadangi p
reikšmė didesnė uţ 0,05, tai darome išvadą, nėra statistiškai reikšmingo skirtumo tarp apgautų vyrų
ir moterų procentų. Tą pačią išvadą galima formuluoti ir kitais ţodţiais: apgaudinėjimas, išmokant
grąţą, nėra statistiškai reikšmingai susijęs su apgaudinėjamos personos lytimi.
Chi-Square Tests
Value df
Asymp. Sig. (2-
sided)
Exact Sig. (2-
sided)
Exact Sig. (1-
sided)
Pearson Chi-Square .289a 1 .591
Continuity Correctionb .226 1 .635
Likelihood Ratio .290 1 .591
Fisher's Exact Test .614 .318
Linear-by-Linear
Association
.289 1 .591
N of Valid Cases 1063
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 188.27.
b. Computed only for a 2x2 table
4.2 Chi kvadrato suderinamumo testas
Duomenys: viena imtis pagal vieną poţymį suskirstytą į kategorijas.
Spėjame kiek kokių respondentų bus (procentinę sudėtį, proporcijas)
Statistinė hipotezė:
ė ė
H0 atmetame (duomenys statistiškai reikšmingai prieštarauja spėjamoms proporcijoms skiraisi),
jei p-reikšmė < 0,05.
Pavyzdys: Ar duomenys neprieštarauja spėjimui, kad išmokant grąţą, apgaudinėjama 40 %
respondentų? Failas LiDA003_ZTLT_F1. Renkamės Analyze → Nonparametric Tests →
Legacy Dialogs) → Chi Square . Į langelį Test Variable List įkeliame a09_01.
24
Pasirenkame Values ir paeiliui suvedame procentus, kurių tikimės, pradėdami nuo maţesnio
a09_01 kodo. Kadangi kintamajema yra 1 – apgautiems ir 2 – neapgautiems, tai vedame 40 ir 60 ( o
ne 60 ir 40). Spaudţiame OK.
Pirmojoje lentelėje išrašyta, kiek ţmonių buvo apgauta (424) ir kiek jų turėtų būti imtyje, jeigu
spėjamas santykis būtų teisingas. Matome, kad neatitikimas labai maţas – tik 1,2 respondento
(trupmenos neturi gasdinti – taip tiksliau, nes matematinis modelis keičia sveikus skaičius realiais).
a09_01 Ar per pastaruosius 12 mënesiø Jums yra
tekæ: Bûti apgautam gaunant gràþà
Observed N Expected N Residual
1 Taip 424 425.2 -1.2
2 Ne 639 637.8 1.2
Total 1063
Antrojoje lentelėje suradę Asymp. Sig. eilutėje esančią p reikšmę, matome, kad ji (0,940) daug
didesnė uţ 0,05. Todėl darome išvadą, kad duomenys statistiškai reikšmingai neprieštarauja
spėjamam santykiui (apgautųjų procentui). Norime atkreipti, kad išvada švelni – neprieštarauja
spėjimui, o ne – įrodėme, kad tokių 40 procentų. Gali lygiai taip pat, tiems patiems duomenims
neprieštarauti spėjimui, kad tokių respondentų yra 39 procentai. Arba 41 %. Taigi, visada įdomiau,
kai atsiranda prieštaravimas, nes tada galima matyti – daugiau, ar maţiau buvo apgautųjų.
Test Statistics
25
a09_01 Ar per
pastaruosius 12
mënesiø Jums
yra tekæ: Bûti
apgautam
gaunant gràþà
Chi-Square .006a
df 1
Asymp. Sig. .940
Literatūra
1. V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai I, TEV, 2000.
1. V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai II, TEV, 2002.
top related