statistica si analiza

324
S STATISTICĂ APLICATĂ ÎN ŞTIINŢELE SOCIO - -UMANE Noţiuni de bază - Statistici univariate Cristian Opariuc-Dan Constanţa, aprilie 2010

Upload: vladut-repede

Post on 08-Nov-2015

80 views

Category:

Documents


5 download

DESCRIPTION

Statistica si Analiza - Opariuc

TRANSCRIPT

  • SSTTAATTIISSTTIICC AAPPLLIICCAATT NN TTIIIINNEELLEE SSOOCCIIOO--UUMMAANNEE Noiuni de baz - Statistici univariate Cristian Opariuc-Dan

    Constana, aprilie 2010

  • Statistic aplicat n tiinele socio-umane

    2

    Fiicei mele, Luana-tefana

    Statistica este precum fumatul La prima igar, i-e ru. Dac continui, ncepe s-i plac i n final termini prin a fi dependent. Diferena dintre statistic i fumat este c statistica nu duneaz grav sntii.

  • Cristian Opariuc-Dan

    3

    Cuprins Cuprins ............................................................................................................. 3 Prefa .............................................................................................................. 7 Cuvntul autorului ......................................................................................... 11 I. Natura msurrii n tiinele socio-umane ............................................. 15

    I.1 Variabile .......................................................................................... 18 I.1.1 Variabile discrete ..................................................................... 20 I.1.2 Variabile continui .................................................................... 21

    I.2 Scale (nivele) de msurare .............................................................. 22 I.2.1 Scale neparametrice ................................................................. 23 I.2.2 Scale parametrice ..................................................................... 26

    I.3 Prezentare general SPSS for Windows ......................................... 30 I.3.1 Bazele de date creare, salvare, deschidere ............................ 35

    II. Organizarea datelor ................................................................................ 58 II.1 Sistematizarea datelor ..................................................................... 60 II.2 Reprezentarea grafic a datelor ....................................................... 67

    III. Statistici descriptive Tendina central ............................................ 70 III.1 Populaie i eantion .................................................................... 71

    III.1.1 Eantionarea simplu randomizat ............................................ 73 III.1.2 Randomizarea pe cote .............................................................. 74 III.1.3 Eantionarea stratificat ........................................................... 75 III.1.4 Eantionarea pe cluster ............................................................ 76

    III.2 Indicatori ai tendinei centrale ..................................................... 76 III.2.1 Media ....................................................................................... 78 III.2.2 Mediana i rangurile ................................................................ 83

  • Statistic aplicat n tiinele socio-umane

    4

    III.2.3 Modul ....................................................................................... 87 III.2.4 Precizia indicatorilor tendinei centrale ................................... 88 III.2.5 Obinerea indicatorilor tendinei centrale n SPSS .................. 91

    IV. Media populaiei. Reprezentri grafice ale tendinei centrale ............ 99 IV.1 Reprezentri grafice .................................................................. 100 IV.2 Analiza grafic a tendinei centrale ........................................... 110

    IV.2.1 Graficul tulpin i frunze ................................................... 111 IV.2.2 Graficul cutie (box-plot) .................................................... 114

    IV.3 Tratarea scorurilor extreme ....................................................... 117 IV.3.1 Obinerea graficelor pentru tendina central n SPSS .......... 120

    V. Statistici descriptive mprtierea ..................................................... 125 V.1 Indicatori elementari ai mprtierii .............................................. 127

    V.1.1 Amplitudinea de variaie ........................................................ 127 V.1.2 Abaterea cuartil sau abaterea intercuartil ........................... 128

    V.2 Indicatori sintetici ai mprtierii .................................................. 132 V.2.1 Diferena medie Gini ............................................................. 132 V.2.2 Oscilaia ................................................................................. 133 V.2.3 Abaterea medie ...................................................................... 136 V.2.4 Abaterea median .................................................................. 138 V.2.5 Dispersia ................................................................................ 138 V.2.6 Abaterea standard .................................................................. 141 V.2.7 Coeficientul de variaie .......................................................... 144

    V.3 Obinerea indicatorilor mprtierii n SPSS ................................. 145 VI. Distribuia normal ........................................................................... 148

    VI.1 Modalitatea ................................................................................ 150 VI.2 Simetria ..................................................................................... 151

    VI.2.1 Coeficientul Yule ................................................................... 152

  • Cristian Opariuc-Dan

    5

    VI.2.2 Coeficientul de asimetrie Fisher ............................................ 152 VI.3 Boltirea sau excesul ................................................................... 157 VI.4 Caracterizarea distribuiei normale ........................................... 161

    VI.4.1 Notele z i note standard derivate ...................................... 163 VI.5 Transformarea datelor brute ...................................................... 170 VI.6 Sisteme de etalonare .................................................................. 174

    VI.6.1 Etaloane n cuantile ................................................................ 179 VI.6.2 Etaloane normalizate ............................................................. 182

    VI.7 Analiza distribuiei i realizarea etaloanelor n SPSS ............... 188 VI.7.1 Calculul notelor z n SPSS ................................................. 202

    VII. Probabiliti i semnificaie statistic ............................................... 208 VII.1 Patru reguli de probabilitate ...................................................... 211

    VII.1.1 Probabilitatea simpl pentru evenimente egale .................. 212 VII.1.2 Evenimentele mutual exclusive ......................................... 213 VII.1.3 Evenimentele independente ............................................... 216 VII.1.4 Probabilitatea condiionat ................................................. 217

    VII.2 Eroare standard i intervale de ncredere .................................. 219 VII.3 Metoda tiinific n tiinele socio-umane ............................... 226

    VII.3.1 Enunarea problemei .......................................................... 227 VII.3.2 Formularea ipotezelor ........................................................ 230 VII.3.3 Proiectarea cercetrii .......................................................... 245 VII.3.4 Efectuarea observaiilor ..................................................... 246 VII.3.5 Interpretarea datelor ........................................................... 246 VII.3.6 Formularea concluziilor ..................................................... 248

    VIII. Eantionare i reprezentativitate ................................................... 250 VIII.1 Populaia .................................................................................... 251 VIII.2 Surse de date .............................................................................. 252

  • Statistic aplicat n tiinele socio-umane

    6

    VIII.2.1 Sursele principale de date .................................................. 252 VIII.2.2 Sursele secundare de date .................................................. 253

    VIII.3 Eantionul .................................................................................. 253 VIII.3.1 Mrimea eantionului ......................................................... 255 VIII.3.2 Caracteristicile populaiei .................................................. 256 VIII.3.3 Procedee de eantionare ..................................................... 257 VIII.3.4 Stabilirea eantionului prin analiz .................................... 259 VIII.3.5 Determinarea mrimii eantionului .................................... 277

    VIII.4 Construcia eantioanelor n SPSS ............................................ 284 VIII.4.1 Crearea unui eantion n SPSS ........................................... 285 VIII.4.2 Analiza eantionului ........................................................... 301 VIII.4.3 Investigarea proprietilor eantionului ............................. 307

    Bibliografie .................................................................................................. 320 n loc de ncheiere ........................................................................................ 322

  • Cristian Opariuc-Dan

    7

    Prefa Apariia unei noi cri de statistic n domeniul tiinelor sociale este

    un fapt tiinific remarcabil n zona intelectual de resort din Romnia. De-numirea alternativ pentru aceast preocupare academic este Metode canti-tative n domeniul tiinelor sociale, avnd n vedere faptul c statistica este un vast ansamblu de metode folosite pentru culegerea, gruparea, prelucrarea, interpretarea i prezentarea datelor culese din sectorul cercetrii sau al prac-ticii profesionale. Din acest ansamblu de metode, psihologii i ali specialiti n domeniul socio-uman nu ntrebuineaz dect o parte. Statistica este o pre-ocupare teoretic i practic, ale crei acumulri a dat roade care se revars ntr-un vast ansamblu de domenii tiinifice i preocupri empirice, domeniul economic fiind cel mai cunoscut marelui public. Oamenii sunt din ce n ce mai bombardai pe canalele media cu informaii statistice, care se constituie, n frecvente cazuri, n surse de manipulare. Orice persoan care dorete s decodeze corect noianul de date statistice cotidiene trebuie s cunoasc sen-sul i corecta folosire a unor noiuni i a unor raportri din acest areal de pre-ocupri. Dup cum spune un statistician englez, m refer la Milton Smith, nenorocirea nu const n faptul c statisticile mint, ci n faptul c mincinoii se folosesc de statistici. Referinele domnului Cristian Opariuc se fac mai ales la domeniul psihologiei, domeniu n care autorul a avut o rodnic activitate profesional, n calitate de psiholog practician. Se poate spune c expozeul domniei sale din lucrarea de fa reprezint o statistic trit, adic aplicat prin experien profesional ntr-o mulime de situaii de cercetare tiinific i aplicaii empirice.

    Contribuia domniei sale la rspndirea teoriei i a aplicaiei statistice n domeniul socio-uman, n general, i n cel psihologic, n special, este nota-bil, avnd n vedere precizrile anterioare referitoare la contactul nemijlocit cu situaii care cereau competen i pertinen n interpretare. Pentru cei ti-neri i neexperimentai, amintesc faptul c domeniul interpretrii cantitative

  • Statistic aplicat n tiinele socio-umane

    8

    i calitative a datelor rezultate din practica profesional i cercetarea tiinifi-c a fost n grea suferin n Romnia. Introducerea consistent in Romnia a spiritului experimental n psihologie i a curentului aplicativ n diverse sec-toare de activitate cunoate o dezvoltare promitoare n perioada interbelic, mai ales prin activitatea colii experimentale de la Cluj, al crei iniiator este profesorul tefnescu Goang. Vrful de valoare academic a fost reprezentat de profesorul Nicolae Mrgineanu, prima personalitate romneasc de talie mondial din domeniul psihologiei. Format la instituii academice reputate din Statele Unite, cunosctor al personalitilor tiinifice de prim rang de nivel mondial, citat n lucrri tiinifice de anvergur, Nicolae Mrgineanu a lansat n circuitul tiinific romnesc dou lucrri, intitulate Analiza factori-lor psihici i Probleme de psihometrie, care anunau o frumoas perspec-tiv de dezvoltare a domeniului analizelor cantitative n psihologie. Din pca-te, Leviatanul s-a dovedit a fi din nou foarte imprevizibil i a adus n loc de dezvoltare cultural tiinific un pustiitor i secetos vnt asiatic peste destine-le oamenilor de valoare din domeniul cultural i tiinific. Vreme de mai bine de cinci decenii, Romnia a cunoscut dictatura celor care proveneau din zona lumpen-proletar, fapt care a afectat foarte serios progresul cercetrilor psi-hosociale. n aceast perioad, preocuprile statistico-experimentale s-au re-dus puternic, fiind aproape anihilate de o concepie ngust-pragmatic de or-ganizare a nvmntului i a cercetrii. O tiin care se ocupa cu diagnoza psihic nu putea trezi dect suspiciune n rndul unei nomenclaturi cldite pe principiul contra-seleciei valorice. n aceast perioad, lucrrile de speciali-tate au lipsit aproape cu desvrire, consecina resimindu-se n rndul pui-nilor practicieni care activau n domeniul colar, al transporturilor, industrial i militar. ntre 1948 i 1990 au existat profesioniti i cercettori din dome-niul psihologiei cu interes i iniiativ, dar mediul n care evoluau era puter-nic srcit de informaie i via tiinific. Majoritatea celor ce activau n laboratoare au avut un inventar redus de procedee de prelucrare a datelor. n lipsa unor instituii universitare de profil consolidate, care s creeze specia-

  • Cristian Opariuc-Dan

    9

    liti, au primit titulatura de psihologi absolveni de filosofie, filologie, peda-gogie, sociologie. Pentru acetia, chiar construirea etaloanelor prea o tain de neptruns.

    Dup 1990, revirimentul s-a realizat intens, progresiv. Schimburile culturale i tiinifice s-au intensificat, accesul la informaie s-a democratizat i ne gsim aproape de limita normalitii. Fac aceast afirmaie, deoarece folosirea procedurilor avansate de prelucrare statistic este nc deficitar n Romnia i rafinamentul interpretativ este nc insuficient dezvoltat.

    Cartea lui Cristian Opariuc este o contribuie notabil pentru intrarea n normalitate. Autorul nu realizeaz un inventar sec de noiuni i procedee statistice, ci se concentreaz prioritar pe explicaii amnunite i pe prezenta-rea consecinelor aplicrii de procedee statistice. n lipsa unei astfel de aten-ii, interveniile statistice n cercetare i n practica profesional se pot trans-forma n capodopere din antologia umorului. Se poate ntocmi o list apreci-abil de folosiri inadecvate ale procedurilor cantitative; de exemplu, calcula-rea mediei pentru frecvenele absolute ale modalitilor scalei nominale, in-troducerea de date lipsite de consisten scalar adecvat n analiza factorial, folosirea procedurilor parametrice n locul celor neparametrice, interpretarea ngust tehnicist a rezultatelor cercetrilor. Este apreciabil modul n care se concentreaz autorul spre evitarea situaiilor de artefact, spre adecvarea re-prezentrilor grafice, spre explicarea particularitilor situaiilor experimenta-le. De mare importan este acea parte a crii care se refer la domeniul infe-renial i la testele statistice adecvate situaiei de cercetare, fiind cunoscut situaia c n acest domeniu se fac cele mai frecvente confuzii. Interesant este faptul c aceste rezultate confuze se constituie n baz de pornire pentru alte demersuri metodologice, de unde o diluare a consistenei faptului tiinific i, drept urmare, a concluziilor care se pot trage din efectuarea unui studiu. Un merit al autorului este atenia acordat unei corecte introduceri a datelor n programul computerizat de prelucrri statistice din domeniul tiinelor so-ciale, autorul fiind lovit din greu de patima informaticii. Realizrile din

  • Statistic aplicat n tiinele socio-umane

    10

    domeniul informaticii, n special a bncilor de date n domeniul examenului psihologic, au constituit fapte de pionierat n domeniu.

    Lucrarea are un aspect cursiv i se citete uor, explicaia acestor situ-aii fiind talentul i rbdarea autorului; nimic nu este considerat de la sine neles, ambiguitile sunt excluse, identitatea noional este asigurat i veri-ficat prin exerciii. Lucrarea poate servi drept baz de tratament pentru a nltura idiosincrazia statistic a studenilor i profesionitilor din domeniul tiinelor sociale.

    Iai, 23 septembrie 2008 Prof. univ. dr. Aurel Stan

    Universitatea Al. I. Cuza, Iai

  • Cristian Opariuc-Dan

    11

    Cuvntul autorului Bun venit la cursul de statistic aplicat n tiinele socio-umane. Da-

    c ai cumprat aceast carte, probabil c suntei student sau absolvent al unei faculti pe care ai urmat-o tocmai din dorina de a scpa de matematic, de calcule, probabil c v plac mai mult cuvintele, v place s vorbii cu oame-nii, s-i nelegei i s-i ajutai, s ptrundei fenomenele i evenimentele sociale. mi imaginez surprinderea i ngrijorarea dumneavoastr n momen-tul n care, abia pind pe bncile facultii, ai aflat cu stupoare c trebuia s studiai statistic. Mai mult, c statistica v-a urmat n toi anii de facultate, inclusiv la licen. tiu! i eu, la rndul meu, am trit aceleai sentimente i nu m pot luda c am obinut, de la nceput, performane deosebite n acest domeniu. Asta pentru c statistica nu se las uor dezvluit. Totui, statistica reprezint fundamentul tiinific al unor discipline precum psihologia, socio-logia, antropologia i multe altele. Fr sprijinul su, nu am reui s vorbim astzi de inteligen, trsturi de personalitate, tipuri de memorie, nu am avea teste care s le msoare la nivelul la care reuesc acum s le msoare.

    Statistica nu este att de grea. Nu este nevoie s tim concepte avansa-te de matematic superioar pentru a nelege i aplica principii statistice. Dac tii s adunai, s scdei, s nmulii i s mprii, sunt sigur c vei putea nva foarte bine i statistica. Nu trebuie s v sperie formulele com-plexe i neinteligibile. De cele mai multe ori, aceste formule nu sunt altceva dect algoritmi, pai simpli, proceduri de calcul elementar, care v introduc n lumea fascinant a probabilitilor. Chiar dac uneori apar termeni precum logaritmi, integrale, derivate i limite, stai linitii. Nimeni nu v pune s le calculai. Unele calcule pot presupune utilizarea unui calculator tiinific i cam att.

    Am ncercat s fac din acest volum un material special i am evitat de fiecare dat s utilizez concepte matematice laborioase. Fiecare formul pe care o prezint aici va fi explicat, descompus. Uneori abundena de exemple

  • Statistic aplicat n tiinele socio-umane

    12

    i repetiiile sunt destinate fixrii unor concepte mai dificile sau mai impor-tante. Sigur c statistica presupune nc de la nceput stpnirea unor concep-te noi. Nu putem avansa dac nu nelegem sensul termenului a msura sau dac nu tim ceea ce este o variabil, un nivel de msur sau un indicator statistic. Muli dintre dumneavoastr abia acum iau contact cu aceti termeni i, desigur, lucrul acesta i sperie. Fii fr grij. O mare parte din terminolo-gia statistic o folosii deja i ai folosit-o de mii de ori. Doar c nu tiai c se numete aa i nici de unde provine. mpreun vom face lumin.

    Acest volum este unul practic. Fiecare capitol i propune obiective precise i abund de exemple i exerciii concrete. n definitiv, m interesea-z s stpnii practica statisticii, s o utilizai n activitatea dumneavoastr de zi cu zi i nu s facem speculaii teoretice pe aceast tem. Majoritatea capi-tolelor sunt formate din dou pri: un fundament teoretic i conceptual nso-it de algoritmii (paii) clasici ai unui procedeu statistic i o aplicaie folosind un pachet de programe de prelucrri statistice, SPSS for Windows. n aceast carte am utilizat mai multe versiuni SPSS, ultima fiind versiunea 15. Sunt sigur c principiile prezentate aici vor putea fi aplicate i n versiunile urm-toare. La momentul scrierii acestei cri, ultima versiune de SPSS este versi-unea 16. n general, fiecare capitol se finalizeaz cu un set de ntrebri i exerciii pe care v invit s le parcurgei singuri, deoarece sunt menite s sta-bilizeze cunotinele dobndite.

    Totui, de ce este important s studiem statistica? Desigur, argumen-tele sunt nenumrate, ns m voi rezuma doar la cteva. Cel ce nu cunoate statistic nu poate nelege articolele de specialitate. Toate cercetrile care se fac n acest domeniu folosesc metode statistice mai mult sau mai puin elabo-rate. Un specialist n domeniu care nu cunoate statistic, nu poate citi i ne-lege n profunzime coninutul unui material de specialitate, corectitudinea sau incorectitudinea datelor expuse. n alt ordine de idei, necunoscnd statistic, nu se poate face cercetare experimental, nu pot fi nelese principiile con-structive ale unui instrument sau ale unei metode de msurare a unor caliti

  • Cristian Opariuc-Dan

    13

    psihologice sau a unor fapte sociale i, prin urmare, un asemenea instrument nu va putea fi utilizat corect.

    Materialele pe care le-am folosit pentru a scrie aceast carte sunt, n marea lor majoritate, prezentate n bibliografia final. De asemenea, am utili-zat multiple surse de pe Internet, precum i experiena mea ca practician i dascl n ale statisticii. Nu pot s nu-i menionez pe cei care mi-au fost primii ndrumtori n aceast aventur i de la care am avut i nc mai am de nv-at foarte mult. Astfel, i sunt recunosctor profesorului doctor Cornel Havrneanu, mentorul i prietenul meu, care mi-a ghidat formarea i m-a susinut permanent, prietenului meu asistent doctor Ovidiu Lungu, un statisti-cian nnscut, care m-a determinat s neleg c acesta ar fi domeniul ce mi s-ar potrivi cel mai bine i care mi-a sprijinit nceputurile, lector doctor Lore-dana Ruxandra Gherasim, cu care de nenumrate ori am nvat s aplic prac-tic ceea ce tiam teoretic sau s mi fundamentez teoria plecnd de la practi-c, profesor universitar doctor Aurel Stan, care a avut bunvoina i rbdarea, alturi de cei menionai mai sus, s mi citeasc lucrarea i s mi fac ob-servaii pertinente pe seama ei, prin intermediul cruia am luat cunotin de statistic prima dat, n anii studeniei, i care, ulterior, mi-a furnizat informa-ii valoroase ce mi-au permis s m perfecionez. Fr contribuia lor, n mod sigur nu a fi ajuns niciodat s scriu aceste rnduri i lor le datorez recuno-tina mea.

    Nu pot, de asemenea, s nu mulumesc unei situaii, situaia care m-a determinat s vin din Iai la Constana. Am nvat c, statistic, un eec personal creeaz premisele unei relansri. Dac aceast situaie, dac proprii-le mele eecuri nu ar fi existat, probabil c aceast carte nu ar fi existat nici ea. ntotdeauna, chiar atunci cnd ceva pare sigur imposibil, s tii c soluia e chiar la ndemna dumneavoastr. Referitor la acest fapt, nu pot s nu mul-umesc fiicei mele, Luana-tefana, care mi-a fost sprijin i speran n toate momentele dificile i care, n ciuda vrstei, nu a ncetat s m sprijine i s m ncurajeze. i mulumesc i i dedic prima mea lucrare.

  • Statistic aplicat n tiinele socio-umane

    14

    Aceast carte nu ar fi vzut tiparul fr susinerea profesorului univer-sitar doctor Mircea Miclea, care m-a ncurajat, m-a neles i a sprijinit apari-ia acestui volum. i mulumesc i mi exprim recunotina i pe aceast cale. Nu pot, de asemenea, s nu i amintesc pe prinii mei i pe toi prietenii mei, mai mult sau mai puin apropiai, datorit crora am avut energia s ncep aceast lucrare i crora le mulumesc pentru c m-au ajutat s trec peste momentele dificile din ultimii ani i fa de care nu pot s nu mi exprim re-cunotina.

    Orict a ncerca, nu reuesc s mi scot din minte vorbele i imaginea primului meu profesor adevrat de matematic, domnul Crezant Ghenghea, din cadrul liceului industrial (pe atunci), actualmente Colegiu Naional Nicu Gane din Flticeni, care a reuit s-mi induc, cum nu a fcut nimeni, dra-gostea fa de aceast disciplin. Chiar dac nu l nelegeam n acel moment al adolescenei mele, el a fost primul (i singurul) care m-a vzut cu aptitu-dini n acest domeniu, aptitudini pe care eu nsumi mi le repudiam. A trebuit s treac muli ani ca s ajung la vorbele sale: Eti pentru tiine exacte. Nu poi scpa de ceea ce eti. Ai s-mi dai dreptate mai trziu. i i-am dat dreptate. Mi-a dori s fie acum mndru de ceea ce-am realizat i voi folosi aceast ocazie pentru a-i mulumi.

    Nu n ultimul rnd, v mulumesc dumneavoastr, care ai cumprat aceast carte, i v invit s m urmai n cltoria din lumea statisticii, s v convingei c lucrurile sunt mai simple dect credei. Eu nu pot dect s v garantez c v voi scoate la liman. Observaiile dumneavoastr sunt foarte importante pentru mine i m vor putea orienta n viitoarele lucrri sau reedi-tri ale acestui volum. Dac unele informaii nu vi se par clare, dac dorii i altceva, nu v rmne dect s-mi scriei pe adresa [email protected] i s-mi comunicai opinia dumneavoastr. V mulumesc i v doresc succes!

    Constana, joi, 8 aprilie 2010

  • Cristian Opariuc-Dan

    15

    II.. NNAATTUURRAA MMSSUURRRRIIII NN TTIIIINNEELLEE SSOOCCIIOO--UUMMAANNEE n acest capitol se va discuta despre:

    Sensul i semnificaia termenului de msurare; Variabile discrete i continui; Niveluri de msurare; Descrierea programului SPSS; Crearea unei baze de date SPSS; Operaii elementare n SPSS.

    Dup parcurgerea capitolului, cititorii vor fi capabili s: neleag conceptul de msurare n tiinele

    socio-umane; Disting ntre variabilele continui i variabilele

    discrete; Diferenieze nivelurile de msurare; Se familiarizeze cu aplicaia SPSS; Creeze o baz de date SPSS i s defineasc corect

    variabilele.

    Statistica se refer la msurare i probabiliti. Cuvntul statistic, provine din latinescul statista i desemna, pe vremuri, persoanele care se ocupau cu afacerile statului, care numrau populaia sau realizau alte aciuni ce ajutau statul s gestioneze mai bine politica de taxe i costurile rzboaie-lor. n perioada medieval, prin statistic, armatorii i calculau costurile echiprii corbiilor, incluznd n calculele lor i probabilitatea ca acestea s fie atacate de pirai sau de a naufragia (Lungu, 2001).

    Foarte multe dintre conceptele statistice au avut rdcini n alte disci-pline, unele complet diferite de matematic. Astfel, corelaiile provin din biologie, din analiza asemnrii dintre copii i prinii lor. Analiza de varian- provine din fabricile de bere i se folosea la alegerea tipului potrivit de orz i a timpului optim de fermentare, astfel nct berea s aib un anumit gust. Mai interesant este faptul c nsi teoria msurrii i are originea n psiho-logie, mai precis n studiul inteligenei i al personalitii umane, iar testele

  • Statistic aplicat n tiinele socio-umane

    16

    neparametrice provin din sociologie. Unii statisticieni ncercau chiar s de-monstreze existena lui Dumnezeu cu ajutorul numerelor, iar astzi, statistica joac un rol important n viaa noastr, indiferent dac ne referim la psiholo-gie, sociologie, tiine economice sau alte discipline.

    n viziunea lui T. Rotariu, statistica se axeaz n principal pe tratarea informaiilor numerice obinute la nivelul unor mulimi de entiti, informaii prelevate de la fiecare entitate n parte (sau de la o submulime) i care con-duc la rezultate cu referin la ansamblu, i nu la entitile componente luate individual. (Rotariu, i alii, 2006)

    Operaiile statistice presupun, prin urmare, un proces de msurare. La o analiz atent, sintagma a msura un obiect nu nseamn altceva dect a msura proprietile unui obiect. Noi nu putem msura obiectele, ci, pentru a le cunoate, msurm anumii indicatori ai proprietilor acestora. Este ade-vrat c, n anumite tiine (fizica, chimia etc.), msurarea dobndete un caracter mai concret, deoarece obiectele i proprietile acestora sunt mai accesibile observrii directe. Putem msura cu uurin lungimea i limea unei mese (deci indicatori ai proprietilor lungime i lime ale obiectului mas), deoarece aceste dou proprieti sunt direct accesibile observaiei noastre. ns, n momentul n care discutm de anxietate, depresie, inteligen-, atenie, responsabilitate, nivel de trai etc. constatm c aceste proprieti nu pot fi direct observate. Prin urmare, va trebui s deducem aceste caracte-ristici din observarea unor indicatori presupui ai proprietilor. Aadar, m-surarea n tiinele socio-umane are un caracter subtil, care scap obser-vrii directe. (Vasilescu, 1992)

    n tiinele socio-umane, noi nu cunoatem i uneori nu putem cu-noate n mod precis semnificaia mrimilor pe care le determinm, iar cifrele pe care le obinem sunt aproximri mai mult sau mai puin exacte ale realit-ii. Acest lucru se ntmpl din cauza apariiei erorilor de msurare i a fap-tului c realitatea social nu are un caracter fix, ci unul fluctuant, variabil.

  • Cristian Opariuc-Dan

    17

    Cantitatea n care un obiect este saturat ntr-o caracteristic nu este reprezen-tat printr-un punct, ci printr-un nor de puncte, care oscileaz ntr-un anumit interval, n jurul unei valori. (Vasilescu, 1992)

    Discutnd despre sensul termenului de a msura, acceptm definiia dat de S. S. Stevens (1959) prin care, n sensul su larg, msurarea n-seamn atribuirea de numere obiectelor sau evenimentelor, potrivit unor reguli. Msurarea este, deci, o funcie prin care unui obiect i corespunde un numr i numai unul, la o anumit msurare. Aceast funcie de atribuire va trebui s fie suficient de clar, pentru a permite ca unui obiect s i se atribuie un numr i numai unul i pentru a ne permite s decidem concret i corect ce numr va fi atribuit fiecrui obiect, dar i suficient de simpl pentru a putea fi aplicat. (Vasilescu, 1992)

    Spre exemplu, codificarea genului biologic al subiecilor este o msu-rare; dac persoana este brbat, i se acord valoarea 1, iar dac persoana este femeie, i se acord valoarea 2. Observm c regula de atribuire nu permite confuzii brbatul este notat cu 1, iar femeia cu 2 , ofer o selecie exhaus-tiv de categorizare a oricrui element care apare n mulimea gen biologic i este suficient de simpl pentru a fi utilizat. Acesta este un proces de msu-rare conform definiiei lui Stevens, dei putem constata cu uurin lipsa po-sibilitii de ierarhizare. Nu putem construi, la acest nivel, o ierarhie a subiec-ilor, deoarece nivelul de msurare este unul categorial. Despre nivelurile i scalele de msurare, vom discuta ns mai trziu.

    Un alt exemplu de msurare l reprezint codificarea gradelor didacti-ce: notm cu 0 preparatorul, cu 1 asistentul, 2 lectorul, 3 confereniarul, 4 profesorul. Observm, din nou, univocitatea i simplitatea regulii; ntr-o universitate, fiecare cadru didactic poate s fac parte dintr-o categorie i numai una, iar fiecare persoan se afl, la un moment dat, ntr-o asemenea categorie. n plus, observm existena unei ierarhii; confereniarul este inferi-or n grad profesorului i superior n grad lectorului, fr ns a se putea pre-

  • Statistic aplicat n tiinele socio-umane

    18

    ciza nici cu ct, nici de cte ori. Aceasta este ns, din nou, o problem a ni-velului de msurare, pe care o vom aborda ulterior.

    I.1 Variabile Am stabilit deja faptul c obiectele pot fi cunoscute prin msurarea

    indicatorilor proprietilor sale. Aadar, obiectele devin msurabile prin stabi-lirea caracteristicilor lor. Caracteristica este, prin urmare, o particularita-te, o nsuire a unui obiect sau fenomen, care constituie obiectul msur-rii. De exemplu, o mas poate fi caracterizat prin lungime, lime, nlime, greutate, form, culoare etc. Toate acestea constituie caracteristici prin care ncercm s descriem ct mai exact obiectul msurat. Cu ct avem mai multe asemenea caracteristici, cu att obiectul se contureaz mai precis.

    Caracteristicile prin care obiectul este descris, poart numele de vari-abile. O variabil reprezint un concept-cheie n statistic i nu este altceva dect un nume pentru un element a crui principal proprietate este ace-ea c variaz, i modific valorile. Prin aceast proprietate principal, vari-abilele se disting de constante, elemente care au valori fixe. De exemplu, ntr-un studiu efectuat pe o populaie general, genul biologic poate fi o vari-abil dac lotul de cercetare cuprinde att brbai, ct i femei. Dac, ns, intenionm s desfurm o cercetare numai pe femei, atunci genul biologic devine o constant, deoarece nu prezint proprietatea principal a variabile-lor, aceea de a-i modifica valorile.

    Modalitatea de realizare a unei variabile (modul n care i sunt atribui-te valorile) constituie un eveniment ntmpltor (probabilistic), de aceea vari-abila se mai numete i variabil aleatoare sau variabil stocastic. De exemplu, nlimea unor elevi dintr-o clas este o variabil care poate lua aleatoriu diferite valori pe care le pot avea elevii la aceast caracteristic. Desigur, valorile pe care le poate lua variabila se grupeaz ntr-un anumit interval de valori. Nu putem vorbi de elevi de 5 centimetri, dup cum nu pu-tem gsi elevi de 5 metri. De aceea, putem considera c nlimea elevilor din

  • Cristian Opariuc-Dan

    19

    clasa a X-a este o variabil stocastic ce poate lua aleatoriu valori din dome-niul de definiie 150 190 centimetri.

    Aadar, elementele de baz care compun domeniul de definiie al unei variabile aleatorii poart numele de valori sau scoruri. n momentul n care aceste elemente sunt numere, variabila se mai numete i variabil alea-numeric.

    O variabil aleatorie exprim, aadar, variaia unei caracteristici. Dup cum am spus, nlimea elevilor este o variabil alea-numeric; la fel greutatea acestora, capacitatea toracic, temperatura corpului sau numrul de la pantofi. Nu toate variabilele sunt ns alea-numerice. Culoarea ochilor, culoarea prului, genul biologic, tipul temperamental etc. sunt variabile ale cror valori nu pot fi exprimate prin numere, dei sunt i ele variabile aleato-rii. Asemenea variabile nu sunt considerate variabile alea-numerice.

    Toate aceste caracteristici pot fi msurate, nregistrate i catalogate i, de asemenea, difer de la o persoan la alta sau de la o situaie la alta. De aceea, toate aceste concepte le vom include sub denumirea generic de vari-abile.

    De ce suntem ns att de interesai de aceste variabile, de ce sunt im-portante i la ce ne folosesc? Rspunsul este acela c nu putem fi mulumii doar cu ideea c variabilele variaz. Ne intereseaz, n principiu, s nele-gem de ce variaz, cnd i n ce condiii variaz, care este efectul acestor va-riaii ale lor. Pentru aceasta, variabilele vor trebui mai nti definite, apoi n-registrate i, n final, supuse analizei, crend premisele extragerii unor con-cluzii i, implicit, ale generalizrii.

    Realizarea unei variabile prin intermediul scorurilor creeaz posibili-tatea abordrii conceptului statistic de frecven. Frecvena reprezint rs-punsul la ntrebarea ci indivizi, cte cazuri populeaz fiecare categorie a

  • Statistic aplicat n tiinele socio-umane

    20

    variabilei sau, aa cum exprim T. Rotariu, numrul de indivizi statistici care populeaz fiecare clas a caracteristicii (Rotariu, i alii, 2006).

    Dac ne propunem s nregistrm persoanele dintr-o sal de curs sub aspectul culorii ochilor vom avea, spre exemplu, 20 de persoane cu ochi al-batri, 13 persoane cu ochi verzi, 15 persoane cu ochi negri i 50 de persoane cu ochi cprui. Valorile care nsoesc categoriile variabilei culoarea ochilor reprezint tocmai frecvenele mai exact frecvenele absolute, deoarece mai pot exista frecvene exprimate procentual (frecvene relative) i frecvene cumulate, despre care vom discuta n urmtorul capitol.

    O variabil aleatoare poate fi discret sau continu, dup cum mul-imea de definiie a valorilor sale poate fi numrabil (discontinu) sau ne-numrabil (continu)1.

    I.1.1 Variabile discrete n cazul variabilelor discrete (care, n funcie de nivelul de msurare,

    pot fi categoriale sau ordinale vom vedea imediat ce nseamn acest lucru), mulimea de definiie a valorilor sale este o mulime discontinu (elemen-tele sale pot fi numrate), iar ntre dou valori nu poate fi interpus, n per-manen, o valoare intermediar.

    Spre exemplu, variabila culoarea ochilor este o variabil discret; ea poate lua valorile: negru, cprui, verde, albastru i putem clasifica subiecii ntr-una din aceste patru categorii. Iat c, mulimea de definiie a valorilor acestei variabile este una numrabil (are doar patru valori) i nu avem posi-bilitatea ca ntre dou valori s includem, n permanen, o a treia valoare intermediar. Nu putem vorbi despre ochi verde-albastru i apoi verde-verde-albastru i aa mai departe, la infinit.

    1 Exist mai multe clasificri ale variabilelor. Le vom aborda atunci cnd situaia o va impu-ne, pentru a nu complica inutil, la acest nivel, expunerea noastr.

  • Cristian Opariuc-Dan

    21

    Un asemenea exemplu de variabil este o variabil discret nomina-l sau variabil discret categorial, deoarece permite doar clasificri, fr a putea vorbi de o relaie de ordine sau ierarhie ntre valorile pe care le poate lua respectiva variabil.

    Un alt exemplu de variabil discret este variabila grad didactic. Ea poate lua valorile: preparator, asistent, lector, confereniar, profesor. Sigur c, i n acest caz, putem clasifica subiecii n funcie de gradul lor didactic. Nu putem ns vorbi, nici acum, de o nou categorie intermediar, de exemplu asistent-lector i apoi asistent-lector-lector i aa mai departe, lucru care i confer caracterul discret. De data aceasta ns, putem pune o relaie de ordi-ne ntre valorile variabilei. Putem vorbi de faptul c asistentul este inferior n grad lectorului sau profesorul este superior n grad confereniarului. O ase-menea variabil se numete variabil discret ordinal sau variabil dis-cret de rang.

    I.1.2 Variabile continui n cazul variabilei continui, mulimea de definiie a valorilor sale este

    una continu, ne-numrabil. Aceste variabile se mai numesc i variabile scalare (de interval sau de raport). n aceast situaie, ntre dou valori ale variabilei continui putem gsi, oricnd, o valoare intermediar. Cu alte cuvin-te, o caracteristic continu poate lua orice valoare ntre anumite limite.

    Spre exemplu, variabila nlimea subiecilor este o variabil de tip scalar (continuu). ntre un subiect de 178 centimetri i un subiect de 180 cen-timetri, putem gsi, oricnd, un subiect de 179 centimetri, apoi ntre unul de 178 i unul de 179 putem gsi un subiect de 178,5 centimetri i aa mai de-parte, la infinit.

    O asemenea variabil se caracterizeaz prin faptul c, tipul de date msurat de aceasta este format din uniti de dimensiune egal. Ca exemplu de variabile continui putem da greutatea subiectului, intervalul de tip petrecut

  • Statistic aplicat n tiinele socio-umane

    22

    pentru a juca jocuri agresive pe computer etc. Astfel, nlimea subiecilor o putem msura n centimetri, greutatea n kilograme, timpul n minute sau ore, toate acestea fcnd referire la un nalt nivel de precizie, cu valori zero abso-lute i posibiliti de construire a scalelor de raport putem spune, de exem-plu, c un subiect este de dou ori mai greu dect altul sau de dou ori mai nalt.

    I.2 Scale (nivele) de msurare n capitolul anterior am vzut c variabilele discrete pot fi categoriale

    sau de rang; cele continui de interval sau de raport. Dac acceptm definiia lui Stevens, atunci putem intui c msurarea poate fi realizat la diferite nive-luri de msurare, organizate ca n figura de mai jos.

    Nivelul nominal de msurare (clasificare) i nive-lul ordinal (de rang sau ierar-hic) se grupeaz n scala ne-parametric (nonmetric) de msurare.

    Nivelul de interval (in-tervale egale) i nivelul de raport (proporii) formeaz scala parametric (metric) de msurare.

    Observm c termenul de cuantificare dobndete sens ncepnd cu scala ordinal, deoarece abia la acest nivel ne permitem realizarea unor ierar-hii. Scala nominal nu accept cuantificare, ci doar clasificare.

    Se cuvine s facem meniunea c proprietile scalelor sunt incremen-tale, adic proprietile unui nivel inferior de msurare sunt valide i la un nivel superior de msurare, ns nu i reciproc.

    Cuantificare

    Nominal

    Ordinal

    Interval

    Raport

    Parametric

    Neparametric

    Figura 1.1 Reprezentarea schematic a nivelurilor de msurare

  • Cristian Opariuc-Dan

    23

    I.2.1 Scale neparametrice Grupeaz scala nominal i scala ordinal, scale la nivelul crora pu-

    tem pune, cel mult, o relaie de ordine ntre nivelurile variabilei. Nu putem vorbi de parametri i nici de statistici metrice. Nu are sens calculul mediei sau al altor indicatori din sfera metric, deoarece nu putem stabili un interval (cu ct) fa de care o valoare este mai mare n comparaie cu alta.

    I.2.1.1 Scala nominal (de clasificare) Reprezint primul nivel de msurare i const n clasificarea obiecte-

    lor n funcie de existena sau inexistena unei caracteristici. Aceast clasifi-care presupune existena unor categorii disjuncte, astfel nct fiecare obiect s-i gseasc locul ntr-o categorie i numai n una (Vasilescu, 1992).

    Pentru ca scala s aib sens, trebuie s existe cel puin dou categorii. O variabil nominal cu dou categorii poart numele de dihotomie sau cla-sificare dihotomic. Dac exist mai multe categorii, vorbim despre polihotomii sau clasificri multiple (polihotomice). mprirea subiecilor n brbai i femei reprezint o clasificare dihotomic. mprirea n funcie de profesie, culoarea ochilor sau a prului, grupa sanguin etc. sunt tot attea exemple de polihotomii.

    n mod curent, folosim aceast scal n vederea categorizrii subieci-lor n funcie de unul sau mai multe criterii (de obicei, n cercetarea psiholo-gic sau sociologic) sau atunci cnd culegem date n urma anchetei sau ob-servaiei.

    Proprieti ale scalei:

    Transformrile permise la nivelul acestei scale sunt (Vasilescu, 1992):

    o Redenumirea atribuirea unor noi nume (n loc de mascu-lin/feminin putem spune brbat/femeie);

  • Statistic aplicat n tiinele socio-umane

    24

    o Permutarea schimbarea ordinii elementelor, deoarece nu se poate stabili o ierarhe ntre valorile unei variabile pe aceast scal. Aceast proprietate este caracteristic doar scalei nominale.

    Operaii statistice permise n principal, operaiile de baz, deri-vate din numrare, astfel:

    o Frecvena absolut i relativ (procentul), cte observaii au fost incuse n fiecare categorie (de exemplu 25 de br-bai i 40 de femei sau 30% brbai i 78% femei);

    o Valoarea modal (modul), categoria cu frecvena cea mai mare (de exemplu, din 200 de subieci, 150 au ochi al-batri, aceasta fiind categoria cu frecvena cea mai mare modul);

    o Verificarea statistic prin 2 procedeu de comparare a frecvenelor i de verificare, dac diferenele dintre ele sunt ntmpltoare sau, din contra, semnificative, nentm-pltoare;

    o Coeficieni de corelaie ntre dou variabile cu dou valori fiecare, coeficientul , coeficientul tetragoric, coeficientul de contingen, toate bazndu-se pe lucrul cu frecvene ab-solute sau relative.

    I.2.1.2 Scala ordinal (de rang sau topologic) Reprezint al doilea nivel de msurare i const n ierarhizare, n

    funcie de mrimea unei caracteristici, fr ns a se putea preciza cu ct un nivel ierarhic este superior sau inferior altuia i nici de cte ori.

    Spre deosebire de scala nominal (ale crei proprieti le include), scala ordinal permite stabilirea unei relaii de ordine ntre date.

  • Cristian Opariuc-Dan

    25

    Strict vorbind, acesta este nivelul la care ne situm n tiinele socio-umane, n general, i n psihologie, n particular. Din perspectiva statisticii, ca disciplin matematic, nu putem vorbi de medie, abatere standard sau ali indicatori care presupun un nivel de msur cel puin de interval, deoarece o asemenea scal nu exist n domeniul socio-uman la o rigoare (nc) demon-strabil matematic. Scorurile testelor de inteligen, aptitudini, personalitate sunt variabile, avnd valori simplu ordonate la un nivel ordinal de msur. Un test de inteligen nu ne arat, de fapt, cantitatea de inteligen a subieci-lor, ci ierarhizarea acestora, poziia, rangul pe care l ocup fiecare ntr-o po-pulaie.

    Lansarea, n 1905, a scalei metrice a inteligenei de ctre Alfred Binet, se fcea cu urmtoarea meniune din partea autorului: calitile intelectuale nu se msoar precum lungimile, nu satisfac cerina aditivitii; scala permi-te un clasament ierarhic ntre inteligene diferite i, din raiuni practice, acest clasament echivaleaz cu o msurare. (Radu, i alii, 1993). Autorul a sesizat foarte bine limitele msurrii n tiinele socio-umane nc din acea perioad, limite pe care muli psihologi actuali astzi le ignor. Nu ne mir faptul c matematicienii consider aplicarea statisticii n psihologie ca fiind defectuoas.

    Datorit faptului c, dac ne-am limita doar la o msurare pe scala or-dinal, metodologia psihologic i psihosociologic ar fi srcit de aportul statisticilor parametrice (tari), pentru anumite msurtori se accept utiliza-rea scalei de interval prima care permite calculul mediei i a abaterii stan-dard ns, acest lucru se face printr-un important compromis statistico-matematic (Clocotici, i alii, 2000).

    Variabile precum gradul didactic, gradul militar, nivelul de educaie se gsesc la acest nivel de msurare, deoarece pe lng posibilitatea clasific-rii, a includerii unui individ ntr-o categorie, avem i posibilitatea ordonrii categoriilor, putnd afirma c o categorie este superioar sau inferioar alteia.

  • Statistic aplicat n tiinele socio-umane

    26

    Dac lum, de exemplu, gradele militare, putem spune c ntr-o unita-te se afl 30 de locoteneni, 10 maiori i 60 de cpitani sau 15% locoteneni, 5% maiori i 30% cpitani (ne aflm la un nivel nominal de msur), dar i c maiorii sunt superiori n grad cpitanilor sau locotenenii sunt inferiori n grad cpitanilor (nivelul ordinal de msur). Nu putem preciza ns cu ct i nici de cte ori o categorie este superioar sau inferioar alteia. Nu putem afirma c doi locoteneni fac ct un cpitan. De asemenea, este absurd s vorbim despre medie. Care este media dintre un locotenent i un cpitan??!!!

    Proprieti ale scalei:

    Aa cum am admis anterior, proprietile specifice scalei ordinale le includ pe cele ale scalei nominale, astfel nct la cele ale scalei anterioare se adaug (Vasilescu, 1992):

    Transformrile permise la nivelul acestei scale sunt cele care nu afecteaz ordinea iniial. Astfel de operaii sunt ridicarea la pute-re sau, inversa ei, extragerea de radicali. Din aceste operaii, deri-v:

    Operaiile statistice permise:

    o Frecvena sumelor n valori cumulate i procentuale, valo-rile categoriale i categoriale procentuale, valori categoria-le centile, valori de mprtiere;

    o Procedee bazate pe date categoriale: testul semnului, Mann-Whitney, Wilcoxon, Kolmogorov-Smirnov, analiza de varian Kruskal i Wallis;

    o Coeficieni de corelaie de rang: Spearman, Kendall.

    I.2.2 Scale parametrice Cuprind scalele de interval i de raport. ncepnd de la acest nivel, pu-

    tem vorbi de statistici parametrice sau metrice. Are sens de acum s calculm

  • Cristian Opariuc-Dan

    27

    media, abaterea standard sau ali indicatori care fac parte din statisticile nu-mite i statistici tari.

    I.2.2.1 Scale de interval (intervale egale) Reprezint al treilea nivel de msurare i deriv din scala ordinal, la

    care se adaug proprietatea c intervalele dintre un nivel de valori i altul sunt egale. Este un tip de msurare n care distanele dintre treptele scrii sunt distane egale sub aspectul cantitii caracteristicii de msurat.

    n psihologie, practic, nu ntlnim aceast scal dect n domeniul psihofiziologiei, n care nregistrm timpi de reacie, numr de erori, fora unei reacii etc. Acest nivel de msurare ne permite s rspundem la ntreba-rea cu ct este mai mare, dar nu i la ntrebarea de cte ori, deoarece la nivelul acestei scale nu ntlnim un punct zero absolut, ci unul arbitrar ales.

    Un exemplu clasic de scal de interval este scala de temperatur Cel-sius. Dup cum tim, punctul de zero grade Celsius este un punct arbitrar ales, definit ca punctul de nghe al apei la presiunea atmosferic de la nivelul mrii. Intervalele acestei scale sunt egale, ceea ce ne permite s spunem c apa dintr-o gleat este mai cald cu 10 grade Celsius dect apa dintr-o alt gleat, dar nu i c apa este de dou ori mai cald, deoarece punctul zero nu este un zero absolut.

    Prin analogie, ne putem referi i la scorurile unui test de inteligen, dac admitem compromisul menionat n subcapitolul anterior. Putem spune c, ntre un subiect cu un IQ de 60 i unul cu un IQ de 120 exist o diferen de 60 de puncte, dar nu c cel cu un IQ de 120 este de dou ori mai inteligent dect cel cu un IQ de 60. n definitiv, nu avem o inteligen zero. La o privire mai atent, observm i compromisul efectuat. Performana la un test de inte-ligen depinde de mai muli factori, nu numai de cei legai de inteligen. Astfel, intervin motivaia, memoria, atenia, condiiile de examen etc. Este cert c cel de al doilea subiect este mai inteligent dect primul (ne situm

  • Statistic aplicat n tiinele socio-umane

    28

    acum la nivel ordinal), ns a afirma, chiar i c este mai inteligent cu 60 de uniti pe scala IQ, consider c este hazardat (la nivel de interval). n defini-tiv, la o reexaminare a celor doi subieci cu acelai test exist o probabilitate foarte mare ca aceast distan, de 60 de puncte, s nu se pstreze. Iat o m-surare care, dei la prima vedere pare la nivel de interval, totui, mai exact, o putem situa la nivel ordinal. Diferena dintre scala inteligenei i scala tempe-ratorilor Celsius este totui foarte mare. Mai mult, intervalele pe o scal IQ sunt doar aparent egale. Diferena de 5 puncte IQ dintre un subiect cu un IQ de 60 i unul cu un IQ de 65 are cu totul alt sens n comparaie cu diferen-a dintre un subiect cu un IQ de 120 i altul cu un IQ de 125 i, de asemenea, se deosebete de diferena dintre doi subieci cu IQ 100 i 105. Cele 5 punc-te IQ nu sunt, n aceste cazuri, egal distanate.

    Proprieti ale scalei:

    Transformrile permise la acest nivel sunt cele de tip liniar, carac-teristice ecuaiei y=ax+b unde a>0 iar y este valoarea transforma-t, x valoarea care urmeaz a fi transformat, a constanta de extindere i b constanta de deplasare (Vasilescu, 1992).

    o Deplasri prin mrirea punctului zero relativ la o alt valoare (modificarea constantei b);

    o Extinderi amplificarea sau diminuarea intervalelor scalei cu acelai factor (modificarea constantei a), fr s deteri-orm rezultatul msurtorilor (de exemplu, transformarea din note z n stanine sau sten).

    Operaii statistice permise:

    o Calculul mediei aritmetice, al abaterii standard, al boltirii i al simetriei;

    o Statistici parametrice: testul t Student, F Fisher, ana-liza de varian;

  • Cristian Opariuc-Dan

    29

    o Toate tipurile de corelaii: r Pearson, raport de corelaie (R), coeficientul de regresie (b).

    Anumite operaii statistice, dei presupun scala de interval, necesit i ndeplinirea altor condiii, i anume respectarea unei legi de distribuie, n general legea distribuiei normale (gaussiene). Prin urmare, n analiza datelor, pe lng cerina nivelului de interval se impune i analiza distribuiei datelor nregistrate. Transformrile permise la nivelul acestei scale au o importan practic deosebit atunci cnd procedm la normalizarea unei distribuii sta-tistice de date.

    I.2.2.2 Scala de raport (proporii) Ultimul nivel de msurare i cel mai precis este reprezentat de

    scala de raport care are toate caracteristicile unei scale de interval la care se adaug existena unui zero absolut. n sfrit, aceast scal ne permite s rs-pundem la ntrebarea de cte ori, deoarece existena unui zero absolut face posibil compararea proporiilor.

    De exemplu, dac un subiect are greutatea de 60 de kilograme, iar un altul 120 kilograme, putem spune c al doilea subiect este cu 60 de kilograme mai greu dect primul, dar i c al doilea subiect este de dou ori mai greu dect primul, ambele afirmaii avnd sens.

    Din nefericire, un asemenea nivel de precizie nu poate fi atins n tiin-ele socio-umane, deoarece este imposibil s gsim o variabil care s admit un zero absolut. Este absurd s vorbim de o inteligen zero, de o emotivitate zero, de depresie sau anxietate zero.

    Proprieti ale scalei (Vasilescu, 1992):

    Transformrile permise la acest nivel sunt cele de tip multiplica-tiv, caracteristice ecuaiei y=ax unde a>0, iar y este valoarea transformat, x valoarea ce va fi transformat, iar a constanta de extindere. Observm dispariia constantei b, constanta de de-

  • Statistic aplicat n tiinele socio-umane

    30

    plasare, deoarece punctul zero este un punct de referin absolut i nu unul arbitrar ales. La fel ca i n cazul scalei de interval, putem amplifica sau diminua intervalul (prin modificarea constantei a) ns nu putem opera deplasri, deoarece acest lucru ar determina scderea preciziei ctre o scal de interval (am stabili un punct ze-ro arbitrar i nu absolut)

    Sunt permise toate operaiile statistice, inclusiv calculul mediei geometrice i al coeficientului de variaie.

    I.3 Prezentare general SPSS for Windows2

    SPSS sub Windows reprezint un pachet de programe interactiv, de utilitate general, destinat analizelor de date i in-clude multiple faciliti i tehnici de natur statistic. Pachetul de programe SPSS sub Windows reprezint o aplicaie care folose-te ntreaga funcionalitate a sistemului de operare Windows, regsind n structura sa utilizarea mausului, ferestrele re-

    dimensionabile i scalabile, meniuri derulan-te, casete de dialog etc. Dei majoritatea utili-zatorilor vor fi complet satisfcui utiliznd doar interfaa grafic pe care SPSS o pune la dispoziie, totui pachetul de programe dispu-ne i de un puternic limbaj de comenzi prin care se pot realiza activiti automate (scrip-turi) ce determin eficientizarea aciunilor

    2 Pe parcursul acestei prezentri, unele imagini sunt din SPSS 12.0 for Windows. Acest lucru nu incomodeaz n utilizarea altor versiuni. Toate imaginile utilizate reprezint marc nre-gistrat SPSS Inc.

    Figura 1.2 Lansarea programului SPSS for Windows

    Figura 1.3 Fereastra logo SPSS for Windows

  • Cristian Opariuc-Dan

    31

    utilizate n mod frecvent sau efectuarea unor aciuni complexe, indisponibile n interfaa grafic (SPSS, 2001).

    Programul SPSS, la fel ca orice alt aplicaie sub sistemul de operare Windows, indiferent de versiunea acestuia, la instalare i creeaz un grup de pictograme (iconuri) n seciunea Programs a meniului Start din sistemul de operare Windows. Pentru a putea lansa n execuie aplicaia, va trebui ca mai nti s efectuai clic cu maus-ul pe butonul start al desktop-ului Windows, buton situat de obicei n partea din stnga jos a ecranului. Apoi mergei la

    seciunea Programs i se va deschide o nou list care conine toate programele instalate n calculato-rul dumneavoastr (ei bine, cel puin programele la care avei acces dumneavoastr). n aceast list, cutai grupul de programe SPSS for Windows, grup n care vei gsi pictogramele de lansare ale aplicaiei SPSS. Probabil c ai identificat deja n acest grup de programe pictograma numit SPSS for Windows. Aceasta este imaginea pe care va trebui s facei clic pentru a porni aplicaia.3

    SPSS este un program extrem de complex. Lansarea acestuia debuteaz cu prezentarea unei

    ferestre introductive, denumit i fereastr logo. Ea cuprinde informaii despre versiunea programului (n cazul nostru, SPSS 12.0 Standard), deoare-ce exist i versiuni server, mai complexe, versiuni demonstrative (ca aceea pe care o putei descrca gratuit de la http://www.spss.com) sau student pentru nvare etc., precum i despre posesorul licenei de utilizare a acestui produs informatic. Se cunoate faptul c, n conformitate cu legea dreptului

    3 Desigur, n situaia n care SPSS for Windows este deja instalat pe calculatorul dumnea-voastr. Dac nu avei instalat SPSS for Windows, putei descrca o versiune demonstrativ de 30 de zile de pe site-ul http://www.spss.com Asigurai-v c avei o conexiune suficient de rapid i de stabil la Internet, deoarece fiierul este destul de mare (aproximativ 160 MB)

    Figura 1.4 Fereastra introductiv

  • Statistic aplicat n tiinele socio-umane

    32

    de autor i protecia creaiilor intelectuale, un produs software poate fi utilizat doar n cazul n care se posed o licen de utilizare pentru acesta, altfel riscndu-se pedepse severe, contravenionale sau de natur penal.

    Dup cteva secunde, fereastra de prezentare se dezactiveaz, iar apli-caia prezint o interfa prietenoas prin care ne invit s trecem la treab. Putem n aceast etap s lansm n execuie un program tutorial care ne va forma abilitile de baz n vederea utilizrii acestui pachet informatic com-plex; de asemenea, putem trece direct la introducerea datelor sau putem rula o cerere predefinit, se poate crea o nou cerere de date sau se poate deschide o baz de date existent, situa-ie n care va trebui s preci-zm locaia acesteia. Nu n ultimul rnd, putem deschide o baz de date ntr-un alt format, de exemplu Excel, Statistica sau SAS, iar SPSS va ti s converteasc aceste date pen-tru a le face disponibile.

    Exist, de asemenea, n partea de jos a acestui formu-lar introductiv, o caset denumit Dont show this dialog in the future. Dac o vei bifa, avei posibilitatea ca, la viitoarea lansare a produsului, s nu se mai afieze formularul, caz n care programul va trece direct n fereas-tra principal SPSS.

    Desigur, selectarea unei opiuni dintre cele prezentate mai sus nu n-seamn i executarea acesteia de ctre SPSS. Pentru a lansa n execuie opi-unea aleas, va trebui apsat, obligatoriu, butonul OK. Apsarea butonului Cancel indic programului c trebuie s prseasc formularul introductiv i

    Figura 1.5 Fereastra principal SPSS

  • Cristian Opariuc-Dan

    33

    s lanseze fereastra principal SPSS n modul de lucru configurat pentru o nou baz de date.

    n acest moment, nu ne intereseaz niciuna dintre opiunile predefini-te, astfel nct vom apsa butonul Cancel. Iat c formularul prezentat mai sus a disprut, fcnd loc ferestrei principale SPSS. S privim cu atenie aceast nou interfa cu utilizatorul.

    Ca orice alt aplicaie Windows, SPSS posed o bar de titlu bara albastr din partea de sus a ferestrei , n partea stng a acesteia afindu-se mesajul Untitled SPSS Data Editor. Acest mesaj ne informeaz c ne aflm n fereastra de date (editare a datelor) din SPSS i c baza de date nu a fost nc salvat (n momentul salvrii, textul Untitled este nlocuit cu nu-mele fiierului salvat pe disc). n partea dreapt a barei de titlu, avem cele trei butoane clasice ale oricrei ferestre Windows: butonul de minimizare sau de transfer al aplicaiei n bara de sarcini, butonul de maximizare extindere a aplicaiei pe ntregul ecran sau de restaurare a aplicaiei la dimensiunile inii-ale i butonul de nchidere a aplicaiei, acel buton n form de X. Sub bara de titlu, se afl meniurile, serii de etichete purtnd fiecare un nume (n limba englez), prin intermediul crora putem comanda SPSS i putem efectua ope-raiile i prelucrrile de care acesta este capabil. Nu vom insista acum asupra explicrii tuturor meniurilor, acest lucru l vom face pe parcursul prezentului curs. Bara de meniuri este urmat de bara de instrumente mici butoane cu aspectul unor pictograme care, n general, dubleaz anumite funcii din meni-uri, funcii mai des folosite. SPSS prezint o bar de instrumente dinamic, adic aspectul butoanelor i, desigur, funcionalitatea acestora se modific relaionat contextului n care ne aflm. De exemplu, vom avea anumite bu-toane n modul de introducere a datelor i alte butoane n modul de definire a varia-bilelor ori n modul de afiare a rezultate-lor analizelor de date.

    Figura 1.6 Seciunea de editare a datelor

  • Statistic aplicat n tiinele socio-umane

    34

    Dup bara de instrumente, apare seciunea de editare a datelor. Aceas-ta este format dintr-o parte needitabil, informativ, partea din stnga, n care se afieaz n permanen poziia celulei active (celul pe care am selec-tat-o). Formatul acestui identificator este un numr urmat de dou puncte i apoi numele variabilei (spre exemplu, 8:time nseamn c suntem poziionai pe rndul 8 a opta nregistrare a variabilei timp). Partea editabil arat ntotdeauna valoarea acestei variabile n poziia specificat (n cazul nostru, la rndul 8 al variabilei timp se afl valoarea 34).

    Cea mai mare parte a ferestrei principale SPSS este dedicat seciunii de date. Observm c datele, n SPSS, sunt organizate tabelar, pe linii i co-loane, analog altor aplicaii mai cunoscute, cum ar fi foile de calcul tabelar (Excel) sau bazele de date (FoxPro sau Access). Liniile (nregistrrile) sunt identificate prin numere, iar coloanele reprezint variabilele. ntr-o baz de date goal, toate variabilele sunt denumite implicit var, iar aceast de-numire este scris cu culoarea gri, reprezentnd faptul c acestea nu au fost nc definite. Navigarea prin baza de date se poate face cu cele dou casete de derulare (numite i lifturi sau controale de derulare), situate n partea dreapt, respectiv n partea de jos a ferestrei de date, la fel ca n orice program Win-dows.

    Seciunea de date conine, n partea din stnga-jos, doi marcatori de seciune foarte importani: Data View i Variable View. Aceste elemente permit co-mutarea ntre modul de vizualizare a datelor dintr-o baz de date (seciunea Data View) i modul de defi-nire a variabilelor (seciunea Variable View).

    n partea de jos a programului SPSS, se afl bara de status cu dou seciuni: seciunea de informaii, n partea stng, unde se afieaz scurte instruciuni despre diferitele funcii ale meniurilor sau ale barei de instrumen-te, i seciunea de stare a procesorului SPSS unde se afieaz informaii refe-

    Figura 1.7 Marcato-rii de seciune

  • Cristian Opariuc-Dan

    35

    ritoare la rularea unor sarcini mari consumatoare de timp. n general, ncepe-rea unei prelucrri statistice se poate face doar n condiiile n care vedei mesajul SPSS Processor is ready n aceast seciune.

    Prsirea programului SPSS se poate face fie apsnd butonul de n-chidere al aplicaiei X din colul din dreapta sus al ferestrei principale, fie folosind meniul File i apoi Exit. Dac ai fcut prelucrri de date sau modi-ficri n baza de date, programul v va solicita mai nti salvarea documentu-lui, ca msur de protecie mpotriva pierderii de informaie. Despre salvare, ns, discutm n subcapitolul urmtor.

    I.3.1 Bazele de date creare, salvare, deschidere Dup ce ne-am familiarizat cu inter-

    faa programului SPSS, este momentul s vedem cum putem deschide o baz de date existent i care sunt elementele compo-nente ale acesteia. SPSS vine nsoit de o serie de baze de date demonstrative n sco-pul facilitrii procesului de nvare. Pe parcursul acestor exerciii, vom folosi, din raiuni de compatibilitate, aceste exemple de baze de date oferite de ctre productorii programului SPSS.

    Deschiderea unei baze de date n scopul efecturii prelucrrilor statistice se poate face prin mai multe metode, rmnnd la latitudinea dumneavoastr i potrivit experienei pe care o avei s alegei metoda care v convine mai mult.

    Prima metod este aceea prin care apelm la meniul File (Fiier) i apoi poziionm cursorul maus-ului pe submeniul Open (Deschide). Apare o

    Figura 1.8 Deschiderea unei baze de date

  • Statistic aplicat n tiinele socio-umane

    36

    list de unde putem deschide o baz de date (Data), o procedur de sintax (Syntax) o foaie de rezultate (Output), un set de comenzi (Script) sau un alt tip de fiier (Other). Pentru a deschide o baz de date, va trebui selectat opiunea Data. Observai c fiecare dintre aceste opiuni este urmat de punc-te de suspensie (). ntotdeauna cnd vei ntlni aceste puncte de suspensie alturi de o comand Windows (nu doar n SPSS, ci i n orice program Win-dows), va trebui s tii c acea comand v invit la dialog. Adic se va des-chide o nou fereastr, de unde va trebui s alegei ceva sau s furnizai anu-mite informaii programului pentru a putea executa comanda respectiv.

    O alt metod prin care putei deschide o baz de date este folosirea aa-numitelor taste rapide. De obicei, meniurile sunt nsoite de combinaii de taste prin care putei efectua direct o anumit sarcin. n loc s apelm la meniul File, apoi Open i apoi Data, putem pur i simplu s inem apsat tasta Ctrl n timp ce apsm tasta O (de la Open). O astfel de combinaie se noteaz prin Ctrl+O, notaie pe care o vom folosi pe ntreg parcursul acestui curs. Vom observa c aceast combinaie are acelai efect ca i parcurgerea primei metode, avantajul fiind acela c este mult mai rapid.

    A treia metod apeleaz la numitele taste fierbini (hot-keys). O tast fierbinte este o tast folosit n combinaie cu tasta Alt. Dac vei privi cu atenie meniurile, vei putea observa c unele litere sunt subliniate de exemplu, n meniul File este subliniat litera F. innd apsat tasta Alt i apsnd apoi tasta F, vom obine deschiderea meniului File, ca i cnd am efectua clic pe acesta. n mod analog, notarea acestei combinaii se face folo-sind convenia Alt+F. Deci, pentru a deschide o baz de date, putem folosi combinaiile Alt+F deschiderea meniului File i apoi Alt+O deschiderea submeniului Open, iar, n final, Alt+A accesarea opiunii Data. Aceasta este, dac dorii, o navigare prin meniuri fr maus.

  • Cristian Opariuc-Dan

    37

    Ultima metod se refer la folosirea barei de instrumente pentru a deschide o baz de date. Pur i simplu apsai pe primul buton de pe bara de instrumente, acela care are aspectul unui dosar deschis.

    Indiferent de metoda folosit, efectul va fi acelai: deschiderea unei casete de dialog, din care putei alege baza de date pe care o vei ncrca (v mai amintii nota referitoare la punctele de suspensie?).

    S analizm puin aceast nou fe-reastr. n partea de sus avem o list deru-lant intitulat Look in: Apsnd sgeata orientat n jos din partea dreapt a acestei casete, vom putea alege directorul n care este localizat baza noastr de date. Ob-servm c directorul curent este directorul aplicaiei (SPSS), iar n seciunea de sub aceast caset este afiat coninutul acestui dosar. Putei astfel selecta orice director n care avei fiiere recunoscute de SPSS, pentru a le putea afia i/sau deschide. Alturi de caseta Look in, se afl o serie de butoane care controleaz naviga-rea prin structura de directoare de pe discul dumneavoastr. Primul buton, cel de forma unei sgei orientate n partea stng, permite navigarea la ultima aciune efectuat. Dac, de exemplu, din directorul SPSS v-ai poziionat pe directorul Windows, apsnd acest buton vei reveni din nou n directorul SPSS. La prima deschidere a acestei casete de dialog, butonul este inactiv, deoarece nu ai efectuat nc nici o aciune care s fie nregistrat. Al doilea buton, de forma unui dosar cu o sgeat orientat n sus, permite navigarea ascendent prin arborele de directoare. La o prim apsare, v vei deplasa n directorul Program Files, la urmtoarea v vei situa n directorul rdcin C:\ i aa mai departe. Cel de-al treilea buton permite crearea unui nou director n directorul curent. Apsnd pe el, vei putea crea un nou director, numit New Folder, denumire pe care o vei putea modifica dup dorin. n

    Figura 1.9 Fereastra de selectare a fiierului n vederea deschiderii

  • Statistic aplicat n tiinele socio-umane

    38

    sfrit, ultimul buton controleaz modul n care se afieaz pictogramele n caseta central. Putei alege vizualizarea pictogramelor n format mare, mic, sub form de list sau list detaliat.

    Fereastra central afieaz, dup cum am menionat, structura de sub-directoare i fiiere a directorului curent. Putei efectua dublu clic pe numele unui director pentru a afia coninutul acestuia sau pe numele unui fiier pen-tru a-l deschide n mod direct (fr a mai apsa butonul Open). Dac efectuai doar un simplu clic, numele fiierului selectat va fi afiat n caseta File name i va trebui s folosii apoi butonul Open pentru a-l deschide. Caseta derulan-t Files of type reprezint un filtru pentru fiierele afiate. Dac o vom des-chide, efectund clic pe sgeata orientat n jos din partea dreapt a acesteia, vom putea alege ce anume tip de fiiere s se afieze n seciunea central. Observm c, dei directorul SPSS conine mai multe fiiere, sunt afiate doar fiierele cu extensia .sav, adic fiierele care conin baze de date SPSS, deoarece n aceast caset de filtrare s-a ales extensia .sav. Putem alege alte extensii de fiiere care sunt afiate, de exemplu formatul Excel (.xls) sau dBase (.dbf), iar SPSS va afia doar fiierele ce au aceast extensie.

    Deschiderea propriu-zis a unui fiier se face fie efectund clic pe acesta i apsnd butonul Open, fie efectund dublu clic pe numele fiierului. Spre exemplu, vom ncrca baza de date Cars din directorul implicit SPSS, baz de date ce reprezint un inventar al diferitelor tipuri de maini i al ca-racteristicilor acestora.

    Dup deschidere, observm c s-a modificat aspectul ferestrei princi-pale SPSS. n primul rnd, n bara de titlu a aprut mesajul Cars SPSS Da-ta Editor, mesaj ce ne informeaz c am deschis baza de date Cars i c ea este pregtit pentru analiz. De asemenea, constatm c structura acesteia este compus din opt variabile, fiecare dintre ele reprezentnd o anumit ca-racteristic a mainilor. Ultima variabil, variabila Filter_$ este o variabil intern folosit de programul SPSS pentru o filtrare anterioar a datelor, vari-

  • Cristian Opariuc-Dan

    39

    abil pe care ne propunem s o tergem. Cum? Efectund clic pe numele acesteia. Observm c ntregul coninut al coloanei Filter_$ s-a selectat. n continuare, apsm tasta Delete, situat pe tastatur, n partea dreapt a gru-pului principal de taste, iar variabila a fost eliminat mpreun cu toate datele acesteia. Felicitri. Iat i prima dumneavoastr intervenie real n SPSS. Dup cum bine tim, orice prim intervenie ntr-un program nseamn o tergere a ceva. Nici noi nu puteam face excepie!

    Baza de date deschis de ctre dumneavoastr a fost afiat n seciu-nea Data view, fapt care ne atrage atenia c n acest mod putem afia i ur-mri coninutul datelor din baza de date. Dac vom efectua clic pe seciunea Variable view, vom intra n modul de definire a datelor. Dup cum ne spune i numele seciunii, aici putem vizualiza i edita denumirea, tipul i alte in-formaii referitoare la variabile. Ca s folosim un limbaj mai tehnic, dac n Data view ne aflm n seciunea datelor propriu-zise, n Variable view ne aflm n seciunea meta-datelor, adic n seciunea informaiilor despre date, unde putem interveni asupra structurii lor interne. Vom clarifica imediat, prin cteva exemple, aceste aspecte.

    Astfel, prima variabil, denumit mpg este o variabil numeric, ce accept maximum 4 caractere (adic cifre ntre 0 i 9999) i fr zecimale.

    Numele mpg nu este ns un nume intuitiv i nu ne putem da seama cu pre-cizie la ce se refer aceast variabil. Din pcate, doar versiunile de SPSS de

    Figura 1.10 Seciunea de definire a variabilelor

  • Statistic aplicat n tiinele socio-umane

    40

    la 13.0 n sus accept nume de variabile cu mai mult de 8 caractere, ns nu se permite includerea spaiilor sau a altor semne de punctuaie n denumirea acestora i de aceea va trebui s fim foarte restrictivi n momentul n care le crem. Pentru a nelege mai uor la ce anume se refer o anumit variabil, avem posibilitatea de a o eticheta, adic de a include un text descriptiv asoci-at numelui ei. n cazul nostru, eticheta variabilei ne informeaz c mpg se refer la Miles per Gallon, adic la consumul automobilului exprimat n distana pe care acesta o poate parcurge cu un galon de combustibil.

    Urmtoarea seciune prezint valorile pe care le putem defini pentru respectiva variabil. Iat, n cazul variabilei origin, care se refer la ara de producie a mainilor, observm c s-a asociat valoarea 1 pentru mainile de producie american, valoarea 2 pentru cele de producie european i valoa-rea 3 pentru cele japoneze.

    n spaiul destinat definirii variabilelor, avem, de asemenea, posibili-tatea de a controla modul de tratare a cazurilor lips, alinierea datelor n ca-drul celulelor i definirea tipului de variabil nominal, ordinal i scalar.

    Efectund clic pe aceste seciuni, ai observat c, uneori, apare n par-tea dreapt a acestora fie un buton cu punctele de suspensie care va deschide o caset de dialog unde se pot controla parametrii valorilor acceptate, fie un buton de incrementare/decrementare cu ajutorul cruia putei mri, respectiv micora o anumit valoare, fie o caset de selecie sgeata orientat n jos prin care putei deschide o list, de unde s selectai anumite valori.

    Exerciiu practic:

    n exerciiul care urmeaz vom traduce pur i simplu n romnete structura acestei baze de date i vom salva baza de date sub un nou nume, Masini (atenie, nu folosii diacriticele romneti n scrierea literelor, prin urmare, n acest caz, nu folosii litera , ci s. Deci nu vom salva cu Maini,

  • Cristian Opariuc-Dan

    41

    ci Masini), ntr-un director nou creat avnd calea C:\Exercitii SPSS (aceeai meniune referitoare la diacritice).

    n cazul primei variabile, numele va rmne acelai, iar noi vom mo-difica doar descrierea. Vom da clic n seciunea Label, acolo unde se afl afiat textul Miles per Gallon i vom scrie textul Mile per galon.

    A doua variabil se numete engine. Vom schimba numele acesteia n cilindree (ne-am ncadrat n 8 caractere), fcnd clic n coloana Name i scriind noul nume. Eticheta va deveni, pentru a doua variabil, Capacitate cilindric, pe care o vei modifica dup exemplul primei variabile.

    Procedm la fel n cazul variabilelor 2, 3, 4, 5 i 6, lsnd traducerea din englez n romn la latitudinea dumneavoastr. Atenie, ns, la acel maximum de 8 caractere cnd redenumii o variabil.

    Variabila numrul 7 se refer la ara de origine a mainilor. O vom rede-numi origine i vom modifica, desigur, eticheta. Exist ns, la acest nivel, un element n plus, i anume coloana Val-ues. V mai amintii probabil de maini-le americane, europene i japoneze. Da-c vom da clic pe celula corespunztoare coloanei Values pentru aceast variabil, constatm apariia unui mic buton cu puncte de suspensie n partea dreapt a celulei. Apsnd acest buton se deschide o nou fereastr, fereastra de confi-gurare a valorilor asociate. Vorbeam anterior despre maini de producie american, european i japonez. n aceast caset vedem lista acestor aso-cieri n partea de jos. n stnga listei, exist 3 butoane: Add cu ajutorul cruia putem crea o nou asociere, Change prin care putem modifica o asociere selectat i Remove care terge, elimin asocierea selectat. Noi ne-am pro-pus s traducem aceast structur de date n limba romn. Vom efectua clic

    Figura 1.11 Etichetarea variabilelor de nivel nominal i ordinal

  • Statistic aplicat n tiinele socio-umane

    42

    pe prima asociere 1 = American. Constatm c, automat, n caseta Value a aprut cifra 1, iar n caseta Value Label textul American. Putem deduce cu uurin c valorii 1 i s-a asociat textul American(apropo, la ce nivel de msurare ne aflm aici i ce fel de variabil este aceasta?). De asemenea, s-a activat butonul Remove, SPSS presupunnd c dorim s eliminm aceast asociere din moment ce am selectat-o. Pentru a modifica textul, efectum clic n interiorul casetei Value Label i scriem n loc de American, America (mai bine spus, tergem un n). De data aceasta, se activeaz i butonul Change, SPSS depistnd modificarea efectuat i presupunnd c vom dori s o i aplicm efectiv. Dac vei apsa acest buton (Change), vei constata c eticheta s-a modificat din 1 = American n 1 = America. Felicitri. Ai reali-zat prima traducere. Acum procedai la fel pentru Europa i Japonia. De-sigur, oricnd putei include o nou asociere. Tastai cifra 4 n caseta Value (deoarece ar urma 4 n ordine logic) i textul Romnia n caseta Value Label, apoi apsai butonul Add care ai observat c a devenit activ. Astfel ai asociat valoarea 4 mainilor de producie romneasc. n momentul n care ai terminat de efectuat toate asocierile, apsai butonul OK pentru a le memora i a prsi formularul. Reinei c apsarea butonului Cancel duce la prsirea formularului fr memorarea asocierilor.

    Apare totui o ntrebare. De ce s folosim aceste asocieri n loc de a scrie pur i simplu n baza de date America, Europa i Japonia? n primul rnd, pentru c este mai uor. Imaginai-v c avei de introdus un numr de 3000 de date n baza dumneavoastr de date. n loc s scriei de fiecare dat un text format din 6-8 caractere, vei tasta pur i simplu 1 atunci cnd v referii la America, 2 cnd v referii la Europa i 3 cnd v referii la Japonia. SPSS va ti, de fiecare dat, n urma asocierilor realizate n etapa anterioar, la ce anume se refer 1, 2 i 3. n al doilea rnd, dei 1, 2 i 3 sunt doar nite etichete pentru America, Europa i Japonia, se preteaz mult mai bine la prelucrrile statistice ulterioare, fiind date numerice.

  • Cristian Opariuc-Dan

    43

    Procedai la fel i cu ultima variabil, referitoare la numrul de ci-lindri ai motorului, pentru ca, n final, s obinei structura complet a bazei de date.

    Prin acest exerciiu, ne-am deprins cu unele elemente ale configurrii structurii bazei de date. n continuare, vom salva baza de date modificat sub denumirea de Masini. Directorul folosit va fi C:\Exercitii SPSS (atenie la diacritice!).

    Putei alege meniul File i opiunea Save sau Save as, putei apsa combinaia de taste Ctrl+S sau Alt+F, Alt+S sau putei apsa butonul de salvare de pe bara de instrumente (acela care are o dischet drept pictogra-m). Dar atenie! Diferena dintre opiunea Save i Save as este aceea c, folosind Save, se vor salva modificrile efectuate tot n baza de date iniial, n cazul nostru baza de date Cars. Noi ne-am propus s salvm baza de date sub un alt nume i ntr-un alt loc, deci nu vom putea folosi dect opiunea Save as (Salveaz ca). Se va deschide caseta de salvare a unei baze de date care are acelai aspect ca i caseta de deschidere a unei baze de date, cu ex-cepia butonului Open, n acest caz denumirea acestuia fiind Save. Folosind cunotinele dobndite anterior, va tre-bui s v poziionai cu ajutorul casetei Save in (echivalenta casetei Look in din fereastra de deschidere a bazei de date) n directorul rdcin C:\, s creai un nou director folosind butonul de creare a unui director din acest formular pe care s-l denumii Exerciii SPSS, s efectuai dublu clic pe acesta pentru a-l deschide i s introducei numele bazei de date Masini n caseta File name. Apsai apoi butonul Save pentru a salva efectiv fiierul pe disc. Ai reuit, nu-i aa?

    Figura 1.12 Fereastra de salvare a unei baze de date

  • Statistic aplicat n tiinele socio-umane

    44

    n urma acestor operaiuni, n bara de titlu SPSS va aprea mesajul Masini SPSS Data Editor, care ne informeaz c programul a salvat cu succes baza de date pe disc i a activat-o.

    Reamintim faptul c, la crearea unei noi baze de date, folosirea oric-ror opiuni de salvare (meniul File, butonul de pe bara de instrumente sau tastele rapide) duce la apariia ferestrei Save as, deoarece fiind o baz de date nou, acesteia nu i-a fost atribuit nc un nume printr-o operaie de salvare. Putei cu uurin identifica dac o baz de date are un nume (a fost salvat) sau nu, urmrind bara de titlu. Bazele de date noi sunt identificate prin mesa-jul Untitled SPSS Data Editor, n timp ce bazele de date salvate au afiat numele acestora n bara de titlu. Ai observat c, la lansarea programului SPSS, acesta creeaz automat o baz de date nou i nedefinit i ateapt din partea noastr definirea variabilelor i salvarea acesteia. Odat salvat baza de date, orice modificri efectum n ea, la salvare ele vor fi scrise automat n fiierul al crui nume este afiat n bara de titlu, fr a mai aprea fereastra de salvare de mai sus. Singura modalitate prin care putem da un alt nume bazei de date sau prin care o putem salva ntr-un alt loc este folosirea opiunii Save as.

    Crearea unei noi baze de date se poate face folosind meniul File, submeniul New i opiunea Data, combinaiile de taste Ctrl+N sau Alt+F, Alt+N, Alt+A. n oricare dintre aceste situaii, SPSS va crea o baz de date goal i nedefinit, la fel ca n cazul lansrii programului.

    Ca exerciiu, folosind cunotinele dobndite, v propunem crearea unei noi baze de date avnd urmtoarea structur i salvarea acesteia sub numele de IQ n directorul C:\Exercitii SPSS:

  • Cristian Opariuc-Dan

    45

    Variabila nume va fi de tip ir de caractere (string) i va stoca nu-mele subiecilor, toate celelalte variabile fiind numerice. Exist dou definiii de asocieri, i anume variabila sexul (1-Masculin 2-Feminin) i scoala (1-Primare 2-Gimnaziu 3-Liceul 4-Postliceala 5-Facultate)

    Dup construirea structurii de date, procedai la salvarea fiierului n locul precizat.

    Folosind cunotinele teoretice acumulate, precizai tipul fiecrei va-riabile create n acest exerciiu.

    Ne propunem n continuare aprofundarea definirii variabilelor n SPSS. Pentru aceasta, ne vom folosi de baza de date IQ creat i salvat n exerciiul anterior. n seciunea Data View, am remarcat deja prezena a zece caracteristici prin care se poate defini o variabil n SPSS. Prima dintre aces-tea se refer la numele variabilei (Name), caracteristic ce nu presupune prea multe explicaii. Numele variabilei reprezint modul n care aceasta va fi ape-lat n toate prelucrrile efectuate folosind baza de date. Nu putem ns s nu precizm c SPSS impune o serie de restricii n denumirea variabilelor (ver-siunile mai mici de versiunea 13): n primul rnd, numele acestora s nu de-peasc 8 caractere, variabilele cu nume mai lungi de 8 caractere nefiind acceptate. Apoi, nu pot fi folosite spaii sau semne de punctuaie n denumi-rea variabilelor, putnd fi ns folosit linia de subliniere pentru cazurile n care dorim s abreviem o variabil format din dou cuvinte. De exemplu, dac avem o variabil care se refer la anul naterii, o vom putea abrevia de-numind-o an_naste. Astfel, lungimea ei este de 8 caractere, fiind acceptat de SPSS, iar cele dou cuvinte componente le-am separat printr-o linie de subli-niere, fapt de asemenea acceptat de SPSS. Nu conteaz dac scriem numele variabilelor cu litere mari sau cu litere mici, deoarece, n final, SPSS le con-vertete automat n litere mici. Din punctul de vedere al primei caracteristici, baza noastr de date IQ nu creeaz probleme, fiind definite cinci nume de variabile: numele, varsta, sexul, scoala i iq.

  • Statistic aplicat n tiinele socio-umane

    46

    A doua caracteristic se refer la tipul de date ce va fi stocat n aceste variabile (Type), caracteristic pe care nu am abordat-o n detaliu n timpul prezentrii noastre de pn acum. Aceast seciune conine un buton cu trei puncte de suspensie, pe care l putem apsa pentru a deschide fereastra de configurare a tipului de date. Aceasta conine o serie de butoane de opiuni, dintre care putem selecta tipul de date pe care variabila noastr l va stoca, dup cum urmeaz:

    Tipul de date Numeric se refer la numere. Valorile acceptate vor fi, deci, numere, n format standard. Alegnd acest tip de date, putem stabili i dimensiu-nea acestora valoarea maxim pe care SPSS o poate accepta prin precizarea numrului de caractere n cmpul Width i numrul de caractere dup virgul n cmpul Decimal Places. De exemplu, numrul ma-xim de caractere 3 i 2 caractere zecimale nseamn c acea variabil poate stoca valori numerice de la 0 pn la 999,99. Acest tip de date va scrie valori-le numerice fr nici o separaie ntre sute i mii i folosind ca separator ze-cimal separatorul configurat al sistemului. Un exemplu de numr scris n acest format ar fi 78457845.57

    Tipul de date Comma se refer, de asemenea, la numere i pot fi definite la fel ca tipul anterior, numai c acestea vor fi afiate folosindu-se virgula ca separator ntre valoarea sutelor i valoarea miilor i punctul ca se-parator al valorilor zecimale. De exemplu, o valoare numeric n acest format ar arta astfel: 9,999.89. Este, practic, formatul numeric clasic american.

    Tipul de date Dot identic cu tipul de date anterior, doar c se in-verseaz rolul punctului i al virgulei. Relund acelai exemplu, numrul de

    Figura 1.13 Stabilirea tipului de date a unei variabile

  • Cristian Opariuc-Dan

    47

    mai sus va fi scris astfel: 9.999,89 n acest caz recunoatem formatul rom-nesc.

    Tipul de date Scientific notation se refer la modul tiinific de afiare a cifrelor, folosind litera E pentru a reprezenta puterile lui 10. Modul de configurare a dimensiunii variabilei este acelai, iar un exemplu de numr folosind aceast reprezentare poate fi 1.23E2 ceea ce semnific de fapt 123.00.

    Tipul de date Date se refer la date calendaristice. Alegnd aceast opiune, va trebui s configurai, selec-tnd din lista ce se va deschide, modul de afiare a datei calendaristice dintr-o mul-ime de formate care vi se ofer.

    Tipul de date Dollar se refe-r la valori monetare, avndu-se n vede-re moneda american. Putei alege i particulariza valoarea maxim pe care o poate accepta variabila din lista ce se afieaz sau putei particulariza aceast valoare, la fel ca n cazul valorilor numerice.

    Tipul de date Custom currency permite definirea unor valori monetare particularizate, valabile pentru alte ri n afara Statelor Unite. Se poate defini forma de prezentare a variabilei i valoarea maxim acceptat, la fel ca la tipul anterior.

    Tipul de date String stocheaz doar iruri de caractere, cu alte cuvinte texte, fr nici o posibilitate de prelucrare statistic. Poate fi definit i aici dimensiunea maxim pe care o poate avea variabila din punctul de vedere al numrului de caractere acceptate. n cazul nostru, variabila nume este un exemplu excelent de variabil de tip string.

    Figura 1.14 Tipul de date calendaristice

  • Statistic aplicat n tiinele socio-umane

    48

    Caracteristica a treia i caracteristica a patra a unei variabile, respectiv Width i Decimals se refer exact la valorile maxime pe care le pot accepta variabilele i la numrul de zecimale, elemente pe care le-am discutat anteri-or, iar aceste dou caracteristici nu fac dect s creeze o alt posibilitate de definire a variabilelor sub acest aspect.

    n cazul exemplului nostru, constatm c avem o singur variabil de tip string, variabila nume care poate accepta maxim 20 de caractere, toate celelalte variabile fiind de tip numeric; variabilele sexul i coala pot accepta doar o singur cifr fr zecimale, iar variabilele varsta i iq pot accepta 3 cifre fr zecimale. Aceast definiie permite stocarea subiecilor cu numele format din maxim 20 de litere, vrsta poate lua valori de pn la 999, suficient, deci, pentru scopurile noastre, acelai lucru fiind valabil i pentru coeficientul de inteligen. Sexul i nivelul de colarizare accept doar o sin-gur cifr, deoarece am convenit s asociem valoarea 1 cu sexul masculin i 2 cu sexul feminin, n mod analog procednd i cu nivelul de colarizare. Date-le au fost definite ca numerice pentru a crea posibilitatea interpretrii lor ulte-rioare, cunoscndu-se faptul c datele de tip string nu pot fi interpretate sta-tistic.

    Urmtoarea caracteristic, caracteristica Label, permite includerea unei denumiri mai intuitive a variabilei, prin care s poat fi mai uor identi-ficat i recunoscut. Astfel, variabilei nume i putem da eticheta Numele subiecilor, variabila iq o putem eticheta drept Coeficientul de inteligen- i aa mai departe. Putem include orice etichet descriptiv dorim pentru numele unei variabile, cu condiia ca lungimea acesteia s nu depeasc 255 de caractere. Deci atenie la scrierea romanelor n descrierea variabilelor!!! Aceast caracteristic mai are ns o funcie important; SPSS include etiche-ta variabilelor n rapoartele finale rezultate n urma prelucrrii datelor. Dac creai un tabel de frecven, SPSS nu va afia numai numele variabilei, de exemplu iq, ci va include i descrierea acesteia, Coeficientul de inteligen-, fcnd astfel mult mai estetice i mai inteligibile foile de raport.

  • Cristian Opariuc-Dan

    49

    Caracteristica Values am discutat-o pe larg n seciunile anterioare i nu vom mai reveni asupra ei. Menionm doar c ea permite clasificri (deci variabile categoriale) i asocieri de valori. Spre exemplu, putem asocia valoa-rea 1 sexului masculin i valoarea 2 sexului feminin, pentru a putea introduce mai uor datele i pentru a putea efectua prelucrri statistice la nivel de varia-bile nominale.

    Caracteristica Missing permite defi-nirea modului n care vor fi tratate valorile lips din cadrul unei variabile. Uneori, este important s cunoatem de ce lipsesc valori dintr-o variabil. Datele lips se pot datora, spre exemplu, faptului c subiectul refuz s rspund la o anumit ntrebare sau fap-tului c ntrebarea nu este adresat acelui subiect. Iat dou situaii care ar necesita un

    tratament separat al valorilor lips. Datele pe care le vei trata n mod explicit ca date lips pot fi supuse apoi unei analize statistice separate, fiind iniial excluse din cele mai multe calcule. Un alt exemplu, frecvent ntlnit n ches-tionarele sociologice, se refer la codificarea rspunsurilor de tip Nu tiu/Nu rspund. Majoritatea cercettorilor codeaz ac