apklausų duomenų analizė - lidata.eu · metodas, bet taip pat gali būti ir pagalbinis tyrimo...
TRANSCRIPT
Projektas
„Lietuvos HSM duomenų archyvo LiDA plėtra“
SFMIS Nr. VP1-3.1-ŠMM-02-V-02-001
Apklausų duomenų analizė
SEMINARO MEDŽIAGA
dr. Eglė Butkevičienė
(Paslaugų sutartis Nr. SA-2010-771/1)
Kaunas, 2011
2
SANTRAUKA
Mokymo kursas „Apklausų duomenų analizė“ suteikia teorinių žinių ir praktinių įgūdžių, būtinų
analizuojant apklausų duomenis su statistinės analizės paketu SPSS. Šis kursas supažindina su
pagrindiniais apklausų analizės principais; jame aptariamos dažniausiai pasitaikančias apklausų
duomenų analizės problemos bei apžvelgiami pagrindiniai apklausų duomenų statistinės analizės
metodai ir mokoma parinkti tinkamus statistikos metodus realių duomenų analizei. Šio kurso metu
ugdomi gebėjimai suprasti ir interpretuoti statistinių skaičiavimų rezultatus bei apibendrinti gautus
rezultatus ir pateikti pagrįstas išvadas.
Mokymo kurso medžiagą sudaro 4 skyriai: (1) Apklausų tyrimų organizavimas ir etapai, (2) IT
panaudojimas atliekant apklausų tyrimus, (3) Apklausų duomenų apdorojimas (analizė) su SPSS ir
(4) Duomenų pateikimas ir ataskaitų rengimas.
3
TURINYS
1. APKLAUSŲ TYRIMŲ ORGANIZAVIMAS IR ETAPAI ......................................................... 4 1.1. Apklausų samprata ir rūšys ...................................................................................................... 4 1.2. Apklausų organizavimo etapai ................................................................................................. 7
2. IT PANAUDOJIMAS ATLIEKANT APKLAUSŲ TYRIMUS ................................................. 9 2.1. IT panaudojimo atliekant apklausų tyrimus galimybės ............................................................ 9 2.2. IT panaudojimas apklausų duomenų saugojimui, archyvavimui ir analizei .......................... 10
3. APKLAUSŲ DUOMENŲ APDOROJIMAS (ANALIZĖ) SU SPSS .......................................... 11 3.1. SPSS programinės įrangos specifika ...................................................................................... 11 3.2. Kintamųjų ir aprašomosios statistikos samprata .................................................................... 13 3.3. Požymių priklausomumo analizė ........................................................................................... 20 3.4. Naujo kintamojo sukūrimas perkoduojat reikšmes ................................................................ 23
4. STATISTINIŲ TYRIMŲ ATASKAITŲ RENGIMO PRINCIPAI .............................................. 25 Literatūra ........................................................................................................................................... 28
4
1. APKLAUSŲ TYRIMŲ ORGANIZAVIMAS IR ETAPAI
1.1. Apklausų samprata ir rūšys
Empiriniais tyrimais susidomėta labai seniai. Dar senovės graikai (pvz. Thales (640-550 pr.Kr.)
taikė stebėjimo metodą ir pasiūlė jį vadinti “empiriniu-moksliniu” požiūriu į pasaulį. Pastaruoju
metu vienas populiariausių empirinio tyrimo metodų yra apklausa.
Apklausa - tai tokia duomenų rinkimo technika, kai respondentai iš esmės tuo pačiu (arba artimu
jam) metu atsakinėja į raštu (anketoje) arba žodžiu (interviuotojo) pateiktus klausimus (Luobikienė,
2000).
Apklausos metodas paprastai taikomas tokiai atvejais:
1. Kai tyrimo dalyko arba atskirų jo charakteristikų neįmanoma pažinti bei ištirti kitais
empirinio tyrimo metodais (pvz., eksperimentu arba stebėjimo metu).
2. Kai tyrimo dalykas yra visuomeninės arba individualios sąmonės elementai: poreikiai,
interesai, motyvacija, nuotaikos, vertybės, įsitikinimai ir t.t.
Apklausos gali būti pagrindinis asmenybės motyvų, savybių, pažiūrų, vertybinių orientacijų tyrimo
metodas, bet taip pat gali būti ir pagalbinis tyrimo metodas, leidžiantis gauti papildomos
informacijos, kurios neįmanoma atskleisti kitais būdais.
Apklausos naudojamos tiriant viešąją nuomonę. Trumpa apklausa, kuri taikoma tiriant viešąją
nuomonę, vadinamos zondine – ekspres apklausa (Tureikytė, 2003). Šio tipo apklausos dažniausiai
naudojamos referendumuose. Apklausa yra trumpa: pateikiami 3–5 pagrindiniai klausimai, taip pat
demografinio pobūdžio klausimai.
Pavyzdys.
• Ar ketinate dalyvauti ateinančiuose rinkimuose?
o Taip - Jei taip, už kokią partiją balsuosite? _______________________
o Ne
• Jūsų amžius
• Jūsų lytis
• Jūsų išsimokslinimas
5
Apklausų rūšys:
• Apklausa žodžiu – interviu.
Interviu - sistemiškas ir tyrėjo kontroliuojamas pokalbis, susietas su konkrečiu tyrimo klausimu bei
specifiniais tyrimo tikslais (Tureikytė, 2003). Interviu metu interviuotojas ir respondentas aktyviai
konstruoja tam tikrą pasaulio versiją, kurią priimant svarstoma, koks yra ryšys tarp gautų
vertinimų ir jų aprašomo pasaulio.
Interviu tipai (žr.1 pav.):
• Standartizuotas (struktūruotas);
• Pusiau - standartizuotas (pusiau-struktūruotas);
• Giluminis (nestruktūrizuotas).
1.1.1 pav. Interviu tipai
Standartizuoti (struktūruoti) interviu:
- Iš anksto parengtas klausimynas;
- Laikomasi klausimų tvarkos.
Klausimų standartizavimas užtikrina matuojamų kintamųjų palyginamumą populiacijoje
Pusiau – standartizuoti (pusiau – struktūruoti) interviu:
- Iš anksto numatomi būtini ir galimi klausimai;
- Pusiau standartizuoto interviu procedūra ir klausimai standartizuojami tik iš dalies.
Griežtai neformalizuojamas pašnekesys ir tarp klausėjo su respondentu būna laisvesnė atmosfera.
6
Nestandartizuoti (giluminiai) interviu:
- Iš anksto neformuluojami galimi atsakymų variantai;
- Paliekama galimybė respondentams atsakymus suformuliuoti patiems;
- Naudojami „atviri“ klausimai.
Giluminis interviu – tai interviu, kurio tikslas – gauti gyvenimiškojo interviuojamojo pasaulio
aprašymus, kad būtų galima interpretuoti reiškinio prasmes.
Tai – nestruktūruotas giluminis pokalbis, apimantis išsamų nagrinėjamos temos aptarimą.
Giluminiai interviu primena žmonių tarpusavio pokalbius, kuriuose atsiskleidžia jų patirtys,
jausmai, viltys bei pasaulis, kuriame jie gyvena.
Giluminiai interviu klasifikuojami pagal turinį (Tidikis, 2003):
1) apžvalginis – kai norima susidaryti bendrą vaizdą visais klausimais, kaip nors susijusiais su
tiriamąja problema;
2) teminis – kai tyrėjas dėmesį sutelkia daugiausia į vieną tiriamą problemą, siekdamas nuosekliai ją
išnagrinėti.
Pokalbio metodas teikia galimybę (Tidikis, 2003):
1) atlikti tyrimą be iš anksto parengtos išsamios tyrimo programos;
2) gauti ne tik faktinę medžiagą, bet ir išsiaiškinti subjektyvų tiriamojo požiūrį;
3) bendrauti su tiriamuoju jam įprasta kalbos maniera ir sąvokomis;
4) išsiaiškinti, kaip tiriamasis supranta asmenines problemas, ir gauti labai intymios informacijos;
5) ne tik fiksuoti tiriamojo atsakymų turinį, bet ir tiesiogiai stebėti jo reakcijas;
6) be ypatingų sąlygų ir lėšų gauti turiningos informacijos;
7) pokalbis vienu metu gali būti panaudojamas ir kaip tyrimo metodas, ir kaip poveikio priemonė.
Tokio metodo trūkumai (Tidikis, 2003):
1) yra itin sudėtingas ir reikalauja daug laiko;
2) reikalauja aukštos tyrėjo kvalifikacijos (jis turi mokėti užmegzti kontaktą, sugebėti reikšti
susidomėjimą, supratimą ar nepritarimą, mokėti improvizuoti, atidžiai klausytis ir t. t.);
3) sąlygoja nemažą kiekį gaunamos informacijos, kurios kokybė priklauso nuo tyrėjo pasirengimo,
sąžiningumo ir kruopštumo, subjektyvumo;
4) rezultatus sunku formalizuoti.
7
• Apklausa raštu – anketavimas.
Apklausa paštu. Šio tipo apklausose respondentams siunčiamas klausimynas ir prašoma jį užpildyti.
Siunčiama su išankstiniu apmokėjimu (vokas su atgaliniu adresu). Gauti atsakymus problemiška,
kadangi neįmanoma numatyti, kiek tyrėjas surinks anketų.
Telefoninė apklausa. Šio tipo apklausos dažnai naudojamos visuomenės nuomonės tyrimuose dėl
aukšto aprūpinimo telefonais lygio. Naudojama atsitiktinių numerių atrinkimo technika (random –
digit dialing). Tokios apklausos atliekamos įdiegus kompiuterizuotas sistemas (CATI).
Respondentų atsakymai tiesiogiai fiksuojami kompiuteryje.
Internetinė apklausa. Šios apklausos tipo naudojimas sąlygotas internetinio prieinamumo. Tai
perspektyvus sociologinės informacijos gavimo būdas. Yra galimybės sudominti respondentus
atliekamu tyrimu ir užtikrinti grįžtamąjį ryšį.
Anketų rūšys (Tidikis, 2003):
- Oficiali anketa – atsakęs į klausimus asmuo parašo savo pavardę ir pateikia kitų duomenų.
- Anoniminė (bevardė) anketa – atsakęs asmuo lieka nežinomas (atsakymai žymimi tik pliusu
ar minusu, pabraukiamas atsakymas arba kaip nors kitaip žymima).
Anketavimas yra trumpesnis ir pigesnis už giluminį interviu.
1.2. Apklausų organizavimo etapai
Apklausos atlikimo procesas apima kelis etapus (pagal Giddens, 2005, p.590):
- Tyrimo plano parengimą;
- Tyrimo atlikimą;
- Tyrimo rezultatų analizę.
Galima tyrimo procesą klasifikuoti ir į du etapus (Luobikienė, 2000):
l) Iki-empirinis etapas (tyrimo planavimo etapas). Šis etapas apima tyrimo programos parengimą.
2) Empirinis etapas (tyrimo vykdymo etapas). Šis etapas apima tyrimo vykdymą, duomenų analizę
ir interpretaciją.
8
Pats tyrimo procesas atitinka bazinę tyrimų organizavimo schemą. Tyrimo proceso etapų
kiekybiniuose tyrimuose schema pateikiama 2 pav.
1.2.1 pav. Tyrimo proceso etapų kiekybiniuose tyrimuose schema
Tyrimo planas.
Plačiausia prasme planas apima visus tyrimo organizavimo ir jo atlikimo klausimus – nuo
problemos identifikavimo iki numatymo, kur bus skelbiami ir publikuojami apklausos rezultatai
(Luobikienė, 2000). Tyrimo planas padeda sistemiškai vykdyti tyrimą, daro jį aiškų ir atvirą
visuomenei (arba užsakovui).
Konstruojant apklausos vykdymo planą, reikėtų rasti atsakymus į šiuos klausimus:
- kokia strategija vadovaujantis bus surinkti (analizuojami) duomenys?
- kokia bus tyrimo konstrukcija?
- iš ko bus surinkti duomenys (kas bus apklausiamas)?
- kaip bus renkami ir analizuojami duomenys?
Tyrimo atlikimas. Tai esminis apklausos organizavimo etapas. Šiame etape vykdomi “lauko
darbai”.
Tyrimo rezultatų analizė. Apklausos rezultatų analizė svarbi teoriniu ir taikomuoju požiūriu, nes
tai leidžia patikrinti teorinius teiginius, išryškinti socialinių procesų bei reiškinių dėsningumus,
tendencijas, taip pat – parengti moksliškai pagrįstas rekomendacijas (Matulionis, 2001:177).
9
2. IT PANAUDOJIMAS ATLIEKANT APKLAUSŲ TYRIMUS
2.1. IT panaudojimo atliekant apklausų tyrimus galimybės
Šiuolaikinis perspektyvus sociologinės informacijos gavimo būdas yra internetinė apklausa.
Yra galimybės sudaryti savo internetinę anketą ir atlikti apklausą. Pavyzdžiui, galima naudotis
tokiais internetiniais tinklalapiais kaip:
- http://www.apklausa.lt
- http://www.apklausa.lt/formsbytheme.php
Internetinės apklausos turi daug privalumų lyginant su kitais apklausų tipais. Apklausos tipo
pasirinkimas paremtas įvairių apklausos būdų privalumų ir trūkumų analize (žr. 1 lentelę).
Kiekybinio tyrimo metodų privalumų ir trūkumų analizė rodo, kad daugiausiai santykinių
privalumų turi internetinė apklausa. Internetinė apklausa socialinių mokslų empiriniuose tyrimuose
yra pakankamai naujas, tačiau sparčiai populiarėjantis tyrimo metodas. Šis metodas nereikalauja
didelių finansinių ir laiko sąnaudų, o anketų grįžtamumo lygis yra santykinai aukštas. Respondentų
pasiekiamumas naudojant šį metodą priklauso nuo tiriamųjų specifikos. Aukštam respondentų
pasiekiamumui užtikrinti reikalingi tiriamųjų gebėjimai naudotis kompiuteriu ir internetu.
2.1.1 lentelė. Kiekybinių apklausos tipų palyginimas
Nr. Apklausos metodas Finansinės sąnaudos
Laiko sąnaudos
Respondentų pasiekiamumas
Grąžinimo lygis
1 Anketinė apklausa, dalyvaujant anketuotojui
Santykinai aukštos
Santykinai aukštos
Santykinai aukštas
Santykinai aukštas
2 Telefoninė apklausa Santykinai aukštos
Santykinai aukštos
Vidutinis Santykinai aukštas
3 Apklausa paštu Santykinai aukštos
Santykinai žemos
Santykinai aukštas
Santykinai žemas
4 Internetinė apklausa Santykinai žemos
Santykinai žemos
Santykinai žemas/aukštas
Santykinai aukštas
Pastaba. Lentelė sudaryta remiantis Tidikio (2003), Tureikytės (2004), Giddens (1997), Bryman (2001) darbais.
10
2.2. IT panaudojimas apklausų duomenų saugojimui, archyvavimui ir analizei
Pasaulyje yra daug internetinių tyrimų duomenų archyvų. Keletas tokių archyvų pavyzdžių:
- Roper viešosios nuomonės tyrimo centras (angl. The Roper Center for Public Opinion
Research). Dabar šis Centras yra Konektikuto universiteto dalis. Prieiga -
http://www.ropercenter.uconn.edu/.
- Tarpuniversitetinis politikos ir socialinių tyrimų konsorciumas ICPSR (angl. The Inter-
university Consortium for Political and Social Research,). Šiuo metu jame yra apie 500000
failų iš 700 institucijų. Prieiga - http://www.icpsr.umich.edu/icpsrweb/ICPSR/index.jsp.
- Vokietijos socialinių mokslų infrastruktūros tarnyba GESIS (angl. German Social
Science Infrastructure Service). GESIS yra sudarytas iš 5 padalinių, kurių vienas –
socialinių mokslų duomenų archyvas. Prieiga - http://www.gesis.org/en/institute/.
Tokio tipo archyvas yra ir Lietuvoje. Lietuvos HSM duomenų archyvas LiDA yra nacionalinė
mokslinių tyrimų infrastruktūra, atverianti tyrėjams prieigą prie empirinių duomenų. Lietuvos HSM
duomenų archyvo LiDA kūrimas pradėtas 2006 m. liepos mėn. pradėjus įgyvendinti ES Europos
socialinio fondo finansuojamą projektą „Empirinių duomenų ir informacijos HSM tyrimams
kaupimas ir valdymas: Lietuvos HSM duomenų archyvas (LiDA)" BPD2004-ESF-2.5.0-03-
392/BPD -262/F450 BPD-262 pagal Lietuvos 2004–2006 metų bendrojo programavimo dokumento
2 prioriteto „Žmogiškųjų išteklių plėtra" 2.5 priemonę „Žmogiškųjų išteklių kokybės gerinimas
mokslinių tyrimų ir inovacijų srityje". Šis projektas sėkmingai baigtas 2008 m. liepos mėn. Nuo
2009 m. vykdomas projektas „HSM duomenų archyvo LIDA plėtra“.
LiDA tikslas - tobulinti HSM studentų, mokslininkų ir kitų tyrėjų duomenų analizės kompetenciją
bei didinti Lietuvos mokslininkų ir kitų tyrėjų galimybes atlikti kokybiškus tyrimus, pagerinant ir
išplečiant prieigos prie pirminių HSM tyrimų šaltinių infrastruktūrą bei sukuriant pirminius
tarptautinio lygmens HSM duomenų šaltinius.
Dažniausiai archyvai turi savitas prieigos charakteristikas. Tarpuniversitetinio politikos ir socialinių
tyrimų konsorciumo archyvo duomenys prieinami tik registruotiems vartotojams. Registracija
galima tik ICPSR instituciniams nariams (iš visų institucijos kompiuterių tinklo darbo vietų).
Lietuvos nacionalinė narystė ICPSR suteikia teisę nemokai parsisiųsti duomenų rinkinius ar atlikti
kai kurių duomenų analizę online iš ICPSR archyvo. Lietuvos HSM duomenų archyvo LiDA teikia
atvirą prieigą prie empirinių duomenų, tačiau duomenys yra prieinami taip pat tik registruotiems
11
vartotojams. Užsiregistravus atsiunčiamas vartotojo vardas ir slaptažodis, kuriuo galima prisijungti
prie archyvo duomenų.
Internetiniuose archyvuose duomenų kaupimui ir saugojimui dažnai naudojama Nesstar programinė
įranga. Duomenų kaupimo ir saugojimo sistema NESSTAR yra sudaryta iš 3 paketų: NESSTAR
Publisher, NESSTAR Server ir NESSTAR Web. Nesstar prieiga - http://www.nesstar.com/. Nesstar
Publisher programinė įranga užtikrina HSM duomenų tvarkymo funkcijas: duomenų konvertavimą
ir redagavimą, publikavimą Nesstar Server-yje. Nesstar Server programinė įranga užtikrina HSM
duomenų talpinimo funkcijas. Ši programinė įranga užtikrina informacijos pateikimą vartotojams.
Nesstar WebView programinė įranga užtikrina HSM duomenų, patalpintų Nesstar Server-yje,
sklaidą interneto tinkle. Nesstar WebView leidžia peržiūrėti tyrimą ir duomenis, susipažinti su
metaduomenimis, atlikti požymių priklausomumo analizę, kintamųjų koreliaciją bei grafinį
duomenų atvaizdavimą. Nesstar WebView programinė įranga įgalina vartotojus atsisiųsti duomemis
įvairiais formatais (MsExel, SPSS).
Duomenys gali būti kaupiami ir saugojami įvairiais formatais: DDI document (*.xml), SPSS
System (*.sav), SPSS Portable (*.por), SPSS Syntax (*.sps), SAS (*.spl), Stata (*.dta), Statistica
(*.sta), NSDsat (*.nsf), dBase (*.dbf), DIF (*.dif), Text (*.txt) ir kitais.
Nesstar WebView veikia interneto naršyklės aplinkoje, todėl vartotojui jokios papildomos
programinės įrangos į savo kompiuterį diegti nereikia.
3. APKLAUSŲ DUOMENŲ APDOROJIMAS (ANALIZĖ) SU SPSS
3.1. SPSS programinės įrangos specifika
SPSS (angl. Statistical Package for the Social Sciences) – specializuota statistinė programinė
įranga, leidžianti vartotojams atlikti visą duomenų analizės procesą:
• įkelti duomenis iš įvairių šaltinių;
• paruošti duomenis (pvz. atlikti transformacijas, sukurti naujus kintamuosius, užkoduoti
kategorijas ir praleistas reikšmes, apjungti duomenis ir t.t.);
• išanalizuoti duomenis statistiniais metodais ir gauti reikšmingus rezultatus;
• pateikti gautus rezultatus grafikais bei analitinėmis lentelėmis;
• eksportuoti rezultatus įvairiais formatais (žr. 3.1.1 pav.).
12
3.1.1 pav. SPSS dokumentai (Janilionis, 2008)
SPSS duomenų redaktorius užtikrina du duomenų rinkmenų pateikimo vaizdus:
• Duomenų peržiūra (Data View). Pateikia duomenų reikšmes arba duomenų apibūdinimo
žymes (žr. 3.1.2 pav.).
• Kintamųjų peržiūra (Variable View). Pateikia kintamuosius apibūdinančią informaciją (žr.
3.1.3 pav.). Suvedant kintamuosius, reikia suvesti tokius SPSS kintamųjų parametrus:
• Name – kintamojo vardas • Type – tipas (pvz. skaitmeninis, tekstinis, data, valiuta ir t.t. ) • Width – duomenų ląstelės plotis – ženklų skaičius • Decimals – skaičius po kablelio, kuris bus rodomas duomenų ląstelėje • Label – kintamojo žymės • Values – kintamojo reikšmių paaiškinimai • Missing – trūkstamų reikšmių kodai • Column – stulpelių plotis • Align – išlygiavimas (dešinėje, kairėje, centruotai) • Measure – skalė (nominalinė, tvarkos, intervalų-santykių).
Aktyvi ląstelė
13
3.1.2 pav. SPSS duomenų įvesties langas
3.1.3 pav. SPSS kintamųjų parametrai
3.2. Kintamųjų ir aprašomosios statistikos samprata
Aprašomoji statistika – tai duomenų sisteminimo ir grafinio vaizdavimo metodai. Vienas iš
didžiausių aprašomosios statistikos privalumų yra tai, kad leidžia koncentruotai užrašyti
informaciją, esančią dideliuose duomenų masyvuose. Aprašomojoje statistikoje stebėtos reikšmės
pateikiamos lentelėmis, dažnių skirstiniais, grafikais (Čekanavičius ir Murauskas, 2000).
Yra skiriamos duomenų padėties ir sklaidos charakteristikos:
• Pagrindinės duomenų padėties charakteristikos Pagrindinės duomenų padėties charakteristikos yra – vidurkis, moda ir mediana, kurios apibūdina
duomenų „centrą“, bei kvantiliai (Čekanavičius ir Murauskas, 2000).
• Vidurkis (mean) – visų duomenų aibės elementų vidutinė reikšmė. Vidurkis yra labai jautrus
smarkiai besiskiriančioms reikšmėms (Augutis ir Krikštolaitis, 2006). Dažniausiai
naudojamas aritmetinis vidurkis – t.y. reikšmių suma, padalinta iš reikšmių skaičiaus.
14
• Moda (mode) – dažniausiai duomenų aibėje pasikartojanti reikšmė. Galime skaičiuoti tiek
kiekybinių, tiek kokybinių duomenų modą (Čekanavičius ir Murauskas, 2000).
• Mediana (median) – tai reikšmė, žemiau kurios yra pusė visų reikšmių ir virš kurios yra kita
pusė reikšmių, jei visos jos išrikiuotos didėjimo tvarka (skaičiuojama tik ranginio ir
kiekybinio lygmens kintamiesiems). Kuomet turime lyginį reikšmių skaičių, mediana – yra
vidurinių skaičių vidurkis, pvz. duota imtis n=10, x=(1,3,2,2,5,1,2,1,3,2), tai variacinė eilutė
bus (1,1,1,2,2,2,2,3,3,5) Xme=2. Jeigu turime nelyginį reikšmių skaičių, mediana – vidurinis
skaičius, pvz. n=9, x=(2,3,1,1,2,3,3,1,2), sudarome variacinę eilutę (1,1,1,2,2,2,3,3,3),
Xme=2.
Pagrindinės sklaidos charakteristikos yra duomenų aibės plotis, standartinis nuokrypis, dispersija,
kvartilių skirtumas ir kitimo koeficientas.
Imties aibės plotis (range) – didžiausios ir mažiausios reikšmių skirtumas. Labai jautrus išskirtims.
Imties dispersija (variance) parodo duomenų sklaidą apie vidurkį. Dispersija plačiai naudojama
siekiant palyginti kelių duomenų aibių sklaidas. Dažniausiai naudojamas sklaidos matas yra –
standartinis nuokrypis (standard deviation), kuris gaunamas ištraukus kvadratinę šaknį iš
dispersijos. Standartinis nuokrypis yra pranašesnis, nes matuojamas tais pačiais vienetais kaip ir
patys duomenys (Čekanavičius ir Murauskas, 2000).
Kvartiliais (quartile) vadinami trys taškai, dalijantys kintamojo reikšmių aibę į keturias grupes,
kurių kiekvienoje yra maždaug po 25% imties reikšmių. Kvartiliai nepriklauso nuo imties
variacinės eilutės kraštinių reikšmių, taigi jie nejautrūs išskirtims. Kvartilinis plotis (Quartile
range) viršutinio ir apatinio kvartilio skirtumas vartojamas imties sklaidai įvertinti (Augutis ir
Krikštolaitis, 2006). Kvartilinis plotis apibūdina vidurinių 50% sluoksnio duomenų reikšmių
sklaidą.
Asimetrijos koeficientas (skewness) parodo empirinio skirstinio asimetriškumą. As > 0 –
dešiniosios asimetrijos atvejis, jei As < 0 – kairiosios, jeigu As = 0 – skirstinys yra simetriškas
vidurkio atžvilgiu.
Eksceso koeficientas (kurtosis) apibūdina empirinio skirstinio smailumą (Ek > 0) ir lėkštumą (Ek <
0) .
SPSS aprašomoji statistika
Norint apskaičiuoti duomenų aprašomąsias statistikas SPSS meniu juostoje pasirenkame
Analyze → Descriptive Statistics → Frequencies. Atsidariusiame lange Statistic pažymime
15
norimas apskaičiuoti skaitines charakteristikas (žr. 3.2.2 pav.). Gauti rezultatai pateikti 3.2.3
paveiksle kartu su stačiakampe diagrama.
3.2.1 pav. SPSS aprašomosios statistikos charakteristikų skaičiavimas
Stačiakampė diagrama (Boxplot). Iš jos galime spręsti apie bendrą matuojamo kintamojo imties
centro, išsibarstymo bei maksimalios ir minimalios reikšmių vaizdą. Stačiakampėje diagramoje yra
“dėžė” – stačiakampis, braižomas nuo apatinio kvartilio iki viršutinio kvartilio, padalintas brūkšniu
į dvi dalis ties mediana. Nuo stačiakampio šono brėžiami “ūsai” – į viršų iki maksimalios ir į apačią
iki minimalios reikšmės (žr. 3.2.3 pav.). Išskirčių reikšmės pažymimos tam tikrais simboliais.
Išskirtys – tai stebėjimų reikšmės, kurios yra labai nutolusios nuo duomenų centro (Čekanavičius ir
Murauskas, 2000).
SPSS programoje norint nubraižyti stačiakampę diagramą pasirenkame meniu juostoje Graphs →
Legacy Dialogs → Boxplot. Stačiakampės diagramos leidžia palyginti keleto kintamųjų,
matuojamų tais pačiais vienetais (Summaries of separate variables), ar to paties kintamojo kelių
imčių duomenis (Summaries for groups of cases).
16
3.2.2 pav. SPSS aprašomoji statistika ir stačiakampė diagrama (Augutis ir Krikštolaitis, 2006)
SPSS dažnių skaičiavimas
Norint apskaičiuoti dažnius ir nubraižyti dažnių pasiskirstymo diagramą SPSS meniu juostoje
pasirenkama Analyze → Descriptive Statistics → Frequencies. Pažymime varnele Display
frequency tables, laukelyje Charts pasirenkame dažnių grafinio atvaizdavimo būdą: histogramą
(Histograms), stulpelinę diagramą (Bar), skritulinę diagramą (Pie)(žr. 3.2.4 pav.).
17
3.2.3 pav. SPSS dažnių skaičiavimas
SPSS gauti rezultatai pateikti 3.2.1 lentelėje ir 3.2.5 paveiksle.
3.2.1 lentelė
SPSS dažnių lentelė
B7|Pasitikejimas politikais
565 28,2 28,9 28,9376 18,8 19,2 48,1311 15,5 15,9 63,9270 13,5 13,8 77,7163 8,1 8,3 86,1149 7,4 7,6 93,756 2,8 2,9 96,540 2,0 2,0 98,616 ,8 ,8 99,44 ,2 ,2 99,68 ,4 ,4 100,0
1958 97,8 100,044 2,2
2002 100,0
Visiškai nepasitiki123456789Visiškai pasitikiTotal
Valid
NežinoMissingTotal
DažnisFrequency
% nuo bendroapklaustųjų skč.
Percent
% nuo atsakiusiųjų įklausimą Valid
Percent
Sukauptasis%Cumulative
Percent
18
3.2.4 pav. SPSS stulpelinė dažnių diagrama
Pasikliautinieji intervalai. Skirtumas tarp tikrųjų populiacijos ir turimų imties atitikmenų rodo
įvertinimo tikslumą. Statistinio įvertinimo tikslumą ir patikimumą nustato vadinamieji
pasikliautinieji intervalai (confidence intervals). Tradiciniai pasikliovimo lygmenys Q = 0,9; 0,95;
0,99.
3.2.5 pav. Pasikliautinieji intervalai su skirtingais pasikliovimo lygmenimis (Augutis ir
Krikštolaitis, 2006)
SPSS paketu galima paskaičiuoti vidurkio pasikliautinąjį intervalą meniu pasirinkus
Analyze → Descriptive Statistics → Explore ir nubraižyti jo grafiką Graphs → Legacy Dialogs →
Error Bar. Norint atlikti kintamųjų analizę pagal atskiras stebėjimų grupes, į sąrašą Factor List
reikia įkelti vieną ar kelis kategorinius kintamuosius, pagal kuriuos bus nustatytos stebėjimų grupės.
Atitinkamai braižant vidurkio pasikliautinojo intervalo grafiką atskiroms grupėms pažymime
Summaries for group of cases (žr. 3.2.7- 3.2.8 pav.).
19
3.2.6 pav. Vidurkio pasikliautinojo intervalo skaičiavimas SPSS
3.2.7 pav. Vidurkio pasikliautinojo intervalo grafiko braižymas SPSS
Gauti rezultatai pateikti 3.2.9 paveiksle.
20
3.2.8 pav. SPSS vidurkio pasikliautinojo intervalo skaičiavimo rezultatai
Kintamasis B25: Pasitenkinimas dabartine Lietuvos ekonomine situacija (skalė nuo 0 (ypatingai
nepatenkintas) iki 10 (ypatingai patenkintas)).
Apskaičiuojame populiacijos vidurkio pasikliautinąjį intervalą: PI0,95(µ) = (2,24; 2,40); 2,24<
µ<2,40.
Išvada: Su 95 % garantija (pasikliovimu) galime teigti, jog vidutiniškai populiacijoje
pasitenkinimas dabartine Lietuvos ekonomine situacija yra vertinimas intervale nuo 2,24 iki 2,40
(žr. 3.2.9 pav.).
3.3. Požymių priklausomumo analizė
Priklausomybės tarp vardinių ir rangų skalės kintamųjų analizei SPSS naudojamos požymių dažnių
lentelės (Crosstabs), taip pat yra didelė testų įvairovė priklausomybės laipsniui tarp kintamųjų
įvertinti.
Plačiausiai taikomas iš neparametrinių kriterijų yra Chi-kvadrato (χ 2) kriterijus, kuris naudojamas
hipotezėms apie kintamojo skirstinį populiacijoje tikrinti. Chi-kvadrato kriterijus parodo, ar
empirinio ir teorinio skirstinių skirtumas yra reikšmingas, t.y. tikrinama, ar turimas empirinis
skirstinys yra suderintas su teoriniu modeliu (Čekanavičius ir Murauskas, 2000).
SPSS pakete Chi-kvadrato kriterijus yra skaičiuojamas trejopai: pagal Pirsono (Pearson) formulę,
pagal tikėtinumo santykio (Likelihood Ratio) formulę bei pagal Mantelio-Haenzelio (Linear-by-
Linear) formulę. Kai duomenys aprašomi keturlauke (2x2) dažnių lentele ir kai nors vienas tikėtinas
stebėjimų skaičius mažiau penkių, papildomai skaičiuojamas tikslus Fišerio (Fisher’s) kriterijus
(Pukėnas,2009). Matuojamiems pagal intervalų skalę kintamiesiems yra skaičiuojamas Pirsono
21
(Pearson) koreliacijos koeficientas. Kai stebimi kategoriniai kintamieji matuojami pagal rangų arba
vardinę skalę naudojami kiti ryšio stiprumo matai (Čekanavičius ir Murauskas, 2000) (žr. 3.3.1
pav.).
3.3.1 pav. Ryšio tarp kintamųjų stiprumo matai SPSS
Vardų skalės kintamųjų ryšio matai
• Phi – φ koeficientas skaičiuojamas χ 2 pagrindu eliminuojant imties dydžio įtaką.
Naudojamas tada, kai duomenys aprašomi keturlaukėmis (2x2) kontingencijos lentelėmis, t.
y. taikomas binariniams kintamiesiems. Didesnių lentelių atveju didžiausia φ reikšmė
priklauso nuo lentelės dydžio ir gali viršyti 1.
• Contingency Coefficient – kontingencijos koeficientas yra φ modifikacija, pritaikyta
didesnėms kontingencijos lentelėms. Kai kurie tyrėjai rekomenduoja šį koeficientą taikyti
5x5 ir didesnėms lentelėms.
• Cramer’s V – Kramerio V koeficientas yra dažniausiai naudojamas vardinių kintamųjų ryšio
matas, skaičiuojamas χ 2 pagrindu. Jis nepriklauso nuo lentelės dydžio, kai eilučių skaičius
lygus stulpelių skaičiui. Keturlaukėms lentelėms Kramerio V koeficientas sutampa su φ
koeficientu (Pukėnas, 2009).
Ranginių kintamųjų ryšio matai
Be dažniausiai taikomo Spearman‘o ranginės koreliacijos koeficiento dar naudojami Kendall'o τ ir
Gamma ranginės koreliacijos koeficientai. Spearman‘o ir Kendall'o τ koeficientai interpretuojami
skirtingai – Spearman‘o koeficientas analogiškas Pirsono (Pearson), tik skaičiuojamas ranginiams
duomenims (o jei duomenys yra intervaliniai – jie paverčiami ranginiais).
22
SPSS yra pateikiami du Kendall'o ranginės koreliacijos koeficiento skaičiavimo variantai –
Kendall’s tau-b ir Kendall’s tau-c. Kendall'o tau-b koeficientas dažniausiai naudojamas keturlaukių
(2x2) lentelių atveju, Kendall'o tau-c koeficientas naudojamas didesnių negu 2x2 dimensijų lentelių
atveju.
SPSS požymių priklausomumo lentelės sudaromos pasirinkus komandą Analyze → Descriptive
Statistics → Crosstabs... Į laukelius Row(s) ir Colum(s) įkeliame kintamuosius, kurių požymių
priklausomumo lentelę norime sudaryti. Laukelio Cells komandų grupėje Percentages pažymime
Row, Colums ir Total (žr. 3.3.2 pav.):
Row (pagal eilutes): procentinės reikšmės skaičiuojamos pagal eilutes, t. y. kiekvienos
ląstelės reikšmė eilutės sumos atžvilgiu.
Column (pagal stulpelius): procentinės reikšmės skaičiuojamos pagal stulpelius, t.y.
kiekvienos ląstelės reikšmė stulpelio sumos atžvilgiu.
Total (viso): kiekvienos ląstelės reikšmė bendro stebėjimų skaičiaus atžvilgiu. Įkėlus į
laukelį Row(s) kintamąjį, nurodantį respondentų priklausomybę konkrečiai populiacijai,
paprastai užtenka pažymėti Column laukelį – turėsime kiekvieno atsakymo procentinę dalį
atskirai kiekvienai populiacijai (Pukėnas, 2009).
Pavyzdys. Sudarome kintamųjų “Lytis” ir “Saugumo jausmas tamsoje vaikščiojant savo rajone”
požymių priklausomumo lentelę (žr. 3.3.2 pav.).
3.3.2. pav. SPSS požymių priklausomumo lentelių sudarymas
23
3.3.1. lentelė
Kintamųjų „Lytis“ ir „Saugumo jausmas tamsoje vaikštant savo rajone“ požymių priklausomumo lentelė
F2|Lytis * C6|Saugumo jausmas tamsoje vaikšciojant savo rajone Crosstabulation
32 481 393 65 9713,3% 49,5% 40,5% 6,7% 100,0%
58,2% 59,1% 43,4% 37,1% 49,8%
1,6% 24,7% 20,2% 3,3% 49,8%23 333 512 110 978
2,4% 34,0% 52,4% 11,2% 100,0%
41,8% 40,9% 56,6% 62,9% 50,2%
1,2% 17,1% 26,3% 5,6% 50,2%55 814 905 175 1949
2,8% 41,8% 46,4% 9,0% 100,0%
100,0% 100,0% 100,0% 100,0% 100,0%
2,8% 41,8% 46,4% 9,0% 100,0%
Count% within F2|Lytis% within C6|Saugumojausmas tamsojevaikšciojant savo rajone% of TotalCount% within F2|Lytis% within C6|Saugumojausmas tamsojevaikšciojant savo rajone% of TotalCount% within F2|Lytis% within C6|Saugumojausmas tamsojevaikšciojant savo rajone% of Total
Vyras
Moteris
F2|Lytis
Total
Labai saugu Saugu NesauguLabai
nesaugu
C6|Saugumo jausmas tamsoje vaikšciojant savorajone
Total
Išvados:
- 32 respondentai (t.y. 1,6 proc.) iš 1949 atsakiusių į abu klausimus yra vyrai, kurie jaučiasi
labai saugiai tamsoje vaikščiojant savo rajone.
- 3,3 proc. respondentų vyrų jaučiais labai saugiai tamsoje vaikščiojant savo rajone.
- 58,2 proc. respondentų, kurie jaučiasi labai saugiai tamsoje vaikščiodami savo rajone, yra
vyrai.
3.4. Naujo kintamojo sukūrimas perkoduojat reikšmes Norint sumažinti duomenų įvairovę, pirminius duomenis galima perkoduoti juos apjungiant. Galima
perkoduoti tiek esamų kintamųjų reikšmes, tiek sukurti naujus kintamuosius perkoduojamų
reikšmių pagrindu (Pukėnas, 2005).
Pavyzdys Duotas kintamasis B3 “Gebėjimas susidaryti nuomonę politiniais klausimais“ su aštuoniomis kategorijomis (1-labai sunku; 2-sunku; 3-nei sunku, nei lengva; 4-lengva; 5-labai lengva; 7-atsisakė atsakyti; 8-nežino; 9-nėra atsakymo) (žr. 3.4.1 pav.).
24
3.4.1 pav. Kintamojo “Gebėjimas susidaryti nuomonę politiniais klausimais” reikšmių
paaiškinimas SPSS
Sukurkime naują kintamąjį – “politik” su trim kategorijom:
(1) – Labai sunku susidaryti nuomonę politiniais klausimais (apjungti 1 ir 2 kategorijas)
(2) – Nei sunku, nei lengva susidaryti nuomonę politiniais klausimais (3 kategorija)
(3) – Labai lengva susidaryti nuomonę politiniais klausimais (apjungti 4 ir 5 kategorijas)
Atsisakė atsakyti (7)
Nežino (8)
Nėra atsakymo (9)
SPSS meniu juostoje pasirenkame Transform Recode into Different Variables (žr. 3.4.2 pav.).
3.4.2 pav. SPSS naujo kintamojo sukūrimas perkoduojant senas reikšmes (apjungiant
kategorijas)
25
Gavome naują kintamąjį „politik“ su trim kategorijom. Variable View lange naujai sukurtam
kintamajam priskiriame naujas reikšmes Value Labels (žr. 3.4.3 pav.).
3.4.3 pav. Naujo kintamojo reikšmių žymės
4. STATISTINIŲ TYRIMŲ ATASKAITŲ RENGIMO PRINCIPAI
Statistinių tyrimų ataskaitos gali būti rengiamos ir struktūruojamos pagal kelis būdus. Vienas
galimų tyrimo ataskaitos struktūros variantų yra pateikiamas Amerikos psichologų asociacijos
(APA) (pagal Merkys et al, 2004). APA pavyzdys:
• Titulinis lapas (pavadinimas, autorius, institucija)
• Santrauka/Anotacija
• Pagrindinė ataskaitos dalis, kuri apima:
• Įvadas (įžanga) – problema ir jos ištirtumas (literatūros apžvalga), tikslas ir uždaviniai
• Tyrimo metodikos ir atlikimo pristatymas - respondentai, tiriamieji, tyrimo instrumentai ir
procedūros
• Tyrimo rezultatų pristatymas - pagrindinių rezultatų išdėstymas
• Aptarimas (diskusija) - ryšio tarp iškelto tikslo ir gautų rezultatų aptarimas (išvados), teoriniai
ir metodologiniai apibendrinimai, tolesnių tyrimų krypčių apibūdinimas (rekomendacijos).
• Literatūra/ šaltiniai
• Priedai
26
Tyrimo ataskaitos įvadas. Šios dalies paskirtis –parodyti ataskaitą kaip visumą. Paprastai ši dalis
apima 2-4 psl. Įvade pateikiama:
- problemos pagrindimas;
- tyrimo objekto (kartais ir dalyko) apibrėžimas;
- tyrimo tikslas ir uždaviniai;
- tyrimo hipotezės;
- tyrimo empirinės-eksperimentinės bazės pristatymas (tiriamieji požymiai, imtis, tipas, duomenų
surinkimo ir apdorojimo metodai, etapai ir t.t.)
- trumpa informacija apie ataskaitos apimtį, pagrindinės dalies struktūrą, priedus ir t.t.;
Tyrimo ataskaitoje negalima pamiršti pristatyti operacionalizacijos. Tai paaiškinimas, kaip
pereinama nuo teorinio modelio prie konkrečių indikatorių.
Ataskaitos viena svarbių dalių – tyrimo metodikos pristatymas. Ši dalis apima tokius aspektus
(Merkys et al, 2004):
- Tiriamųjų požymių (indikatorių) apibrėžimas ir išskleidimas; Operacionalizacija ir
operaciniai apibrėžimai;
- Tyrimo informacijos šaltiniai;
- Duomenų surinkimo organizacinės formos ir konkretūs metodai;
- Duomenų apdorojimo metodai (statistinė analizė, kategorizavimas, interpretacija);
- Tyrimo tipo pagrindimas ir apibūdinimas;
- Tyrimo etapų apibūdinimas;
- Tyrimo imtis, jos pagrindimas ir apibūdinimas; imties geografija ir imties lizdai. Tiriamieji
ir jų kategorijos, tiriamos organizacijos;
- Konkretūs tyrimo instrumentai: testai, klausimynai, stebėjimo ir turinio (content) analizės
protokolai.
27
Tyrimo rezultatų pristatymas.
Tyrimo rezultatams pristatyti dažnai naudojamos lentelės, diagramos, paveiklai.
Lentelės ir jų apipavidalinimas yra svarbūs, nes suteikia galimybę susiteminti duomenis
palyginamumo principu (Merkys et al., 2004). Pagrindinis tekstas neturi tiesiogiai ir smulkmeniškai
atpasakoti lentelės duomenų, tačiau lentelė turi būti suprantama neskaitant teksto.
Lentelėms keliami reikalavimai (Merkys et al., 2004):
• Lentelės turi būti vaizdžios ir nesunkiai suprantamos;
• Lentelės turi būti nedidelės ir lengvai apžvelgiamos;
• Lentelėse žodžiai turi būti rašomi be trumpinimų, galima naudoti tik visuotinai priimtinus
standartinius žymėjimus;
• Turi būti aišku, koks požymis (kintamasis, dimensija) atspindėtas lentelėje;
• Turi būti aišku, kokie dydžiai (absoliutūs ar procentinė išraiška) naudojami.
Lentelės pavadinimas pateikiamas virš paaiškinamos lentelės. Lentelės pavadinimas turi aiškiai
įvardinti pateikiamą turinį. Pavadinime neturi būti bereikalingų ir pasikartojančių žodžių.
Visa grafinė medžiaga įvardijama kaip PAVEIKSLAS. Paveikslu laikoma bet kokia grafinio
pobūdžio informacija, išskyrus lentelę. Tai fotografijos, piešiniai, brėžiniai, schemos, statistinius-
kiekybinius procesus atspindintys grafikai ir pan. (Merkys et al., 2004).
Paveikslo pavadinimas yra rašomas po paveikslu. Pavadinimas turi aiškiai įvardinti paveikslo turinį.
Pavadinimas rašomas panaudojant paveikslo turinį apibūdinančius raktinius žodžius ir sujungiant
juos į logiškai prasmingą sakinį.
Pasirenkant tinkamą grafiko tipą, reikia atsižvelgti į šias rekomendacijas (Merkys et al., 2004):
• Reikia atsižvelgti į skalių tipą. Vardų (nominalinės) skalės kintamieji gali būti pateikiami
stulpelinių ar skritulinių diagramų pavidalu. Klaida – kai vardų skalės kintamieji (pvz. lytis,
tautybė) pateikiami linijinės diagramos pavidalu. Tvarkos skalės kintamieji gali būti
pateikiami stulpelinių ir skritulinių diagramų pavidalu. Kintamųjų reikšmės grafike turi būti
išdėstytos nuosekliai, o ne pagal reikšmės didumą.
• Spalvų perteklius mažina paveikslo efektyvumą. Paveikslas turi būti informatyvus tiek
atspausdinus spalvotai, tiek nespalvotai. Reikia vengti “vizualinio triukšmo”.
28
Literatūra 1. Augutis J., Krikštolaitis R. (2006). Kompiuterinis tyrimo duomenų apdorojimas. – Šiauliai:
Projektas MOKOM.
2. Bryman, A. (2001). Social Research Methods. Oxford: Oxford university press. 540 p.
3. Čekanavičius V., Murauskas G. (2002). Statistika ir jos taikymai, I dalis. – Vilnius: TEV.
4. Giddens, A. (1997). Sociology (3rd ed.). Cambridge: Polity Press.
5. http://www.insol.lt/homepage.
6. http://www.lidata.eu/page.php?page=apie_archyvas
7. Janilionis V. (2008). Statistinė analizė humanitarinių ir socialinių mokslų tyrimuose. Mokymo
kursas. Projektas “Empirinių duomenų ir informacijos HSM tyrimams kaupimas ir valdymas:
Lietuvos HSM duomenų archyvas (LIDA)“.
8. Janilionis V. Statistika ir duomenų analizės programinė įranga. Distancinio mokymo kursas. –
Kaunas: KTU, 1999-2001. Prieiga per internetą: http://fmf.ktu.lt/janil/stat1.htm.
9. Merkys et al. (2004). Užsakomųjų tyrimų ataskaitos rengimas.
http://www.smm.lt/svietimo_bukle/tyrimai_sb.htm
10. Pukėnas K. (2005). Sportinių tyrimų duomenų analizė SPSS programa: mokomoji knyga. –
Kaunas: LKKA.
11. Pukėnas K. (2009). Kokybinių duomenų analizė SPSS programa: mokomoji knyga. – Kaunas:
LKKA.
12. Tidikis, R. (2003). Socialinių mokslų tyrimų metodologija.Vilnius: Lietuvos teisės
universitetas.
13. Tureikytė, (2004). Socialinių tyrimų metodai. Kn. Sociologija. Kaunas:VDU.