suport curs psihodiagnostic

71
CUPRINS Capitolul I EVOLUŢIA ISTORICĂ A EVALUĂRII PSIHOLOGICE I.1. Introducere I.2. Evaluarea psihologică în antichitate I.3. Antecedentele ştiinţifice ale evaluării psihologice I.4. Constituirea şi dezvoltarea evaluării psihologice I.4.1. Contribuţia lui Galton I.4.2. Contribuţia lui Cattel I.4.3. Contribuţia lui Binet I.4.4. Contribuţia altor autori I.4.5. Repercusiunile celor două războaie mondiale I.4.6. Perioada de criză a evaluării psihologice Capitolul II CÂTEVA CLARIFICĂRI CONCEPTUALE II.1. Evaluarea şi măsurarea în psihologie II.2. Noţiunea de psihodiagnoză II.3. Test şi testare psihologică Capitolul III METODE DE BAZĂ ÎN EVALUAREA PSIHOLOGICĂ III.1. Noţiunea de metodă în psihologie III.2. Metode nepsihometrice III.2.1. Observaţia III.2.2. Convorbirea III.2.3. Ancheta be bază de interviu III.2.4. Anamneza (Metoda biografică) III.3. Metode psihometrice III.3.1. Concepte fundamentale în măsurarea psihologică III.3.1.1. Variabile statistice III.3.1.2. Scale de măsura III.3.1.3. Indici statistici de start III.3.2. Chestionarul psihologic III.3.3. Testul psihologic III.3.2.1. Definiţie III.3.2.2. Caracteristici generale ale testului psihologic III.3.2.3. Clasificarea testelor psihologice III.3.2.4. Domenii de utilizare ale testelor psihologice III.3.2.5. Surse de eroare în testarea psihologică Capitolul IV PRINCIPII PSIHOMETRICE ALE UTILIZĂRII TESTULUI PSIHOLOGIC IV.1. Standardizarea şi obiectivitatea IV.2. Fidelitatea IV.2.1. Definiţie şi noţiuni de bază IV.2.2. Metode de calcul a coeficientului de fidelitate

Upload: lauraioana

Post on 25-Jun-2015

2.099 views

Category:

Documents


22 download

TRANSCRIPT

Page 1: Suport Curs Psihodiagnostic

CUPRINS

Capitolul IEVOLUŢIA ISTORICĂ A EVALUĂRII PSIHOLOGICE

I.1. IntroducereI.2. Evaluarea psihologică în antichitateI.3. Antecedentele ştiinţifice ale evaluării psihologiceI.4. Constituirea şi dezvoltarea evaluării psihologice

I.4.1. Contribuţia lui GaltonI.4.2. Contribuţia lui CattelI.4.3. Contribuţia lui BinetI.4.4. Contribuţia altor autoriI.4.5. Repercusiunile celor două războaie mondialeI.4.6. Perioada de criză a evaluării psihologice

Capitolul IICÂTEVA CLARIFICĂRI CONCEPTUALE

II.1. Evaluarea şi măsurarea în psihologieII.2. Noţiunea de psihodiagnozăII.3. Test şi testare psihologică

Capitolul IIIMETODE DE BAZĂ ÎN EVALUAREA PSIHOLOGICĂ

III.1. Noţiunea de metodă în psihologieIII.2. Metode nepsihometrice

III.2.1. ObservaţiaIII.2.2. ConvorbireaIII.2.3. Ancheta be bază de interviuIII.2.4. Anamneza (Metoda biografică)

III.3. Metode psihometriceIII.3.1. Concepte fundamentale în măsurarea psihologică

III.3.1.1. Variabile statisticeIII.3.1.2. Scale de măsuraIII.3.1.3. Indici statistici de start

III.3.2. Chestionarul psihologicIII.3.3. Testul psihologic

III.3.2.1. DefiniţieIII.3.2.2. Caracteristici generale ale testului psihologicIII.3.2.3. Clasificarea testelor psihologiceIII.3.2.4. Domenii de utilizare ale testelor psihologiceIII.3.2.5. Surse de eroare în testarea psihologică

Capitolul IVPRINCIPII PSIHOMETRICE ALE UTILIZĂRII TESTULUI PSIHOLOGIC

IV.1. Standardizarea şi obiectivitateaIV.2. Fidelitatea

IV.2.1. Definiţie şi noţiuni de bază IV.2.2. Metode de calcul a coeficientului de fidelitate

Page 2: Suport Curs Psihodiagnostic

IV.2.2.1. Metoda analizei consistenţei interne IV.2.2.2. Metoda test-retest IV.2.2.3. Metoda formelor paralele IV.2.2.4. Metoda analizei fidelităţii interevaluatori

IV.3. Validitatea IV.3.1. Definiţie

IV.3.2. Tipuri de analiză a validităţii IV.3.2.1. Validitatea de construct IV.3.2.2. Validitatea de conţinut IV.3.2.3. Validitatea de criteriu IV.4. Dificultatea şi sensibilitatea unui test psihologic

Capitolul VETALONAREA UNEI PROBE PSIHOLOGICE

V.1. Definirea termenilorV.2. EşantionareaV.3. Metode de obţinere a normelor unui test psihologic

V.3.1. Prin transformări în clase echivalente V.3.2. Prin transformări în vârste echivalente V.3.3. Prin transformări în norme de vârstă mintală V.3.4. Prin transformări în cote standard şi cote standardizate V.3.5. Prin transformări în ranguri centile, decile şi cuartile V.3.6. Prin transformări în clasele scalei normalizate

Capitolul VICONSTRUIREA TESTELOR PSIHOLOGICE

Capitolul VIIASPECTE ETICE ALE EVALUĂRII PSIHOLOGICE

Page 3: Suport Curs Psihodiagnostic

Capitolul I

EVOLUŢIA ISTORICĂ A EVALUĂRII PSIHOLOGICE

I.1. INTRODUCERE

Starea actuală a evaluării psihologice este, fără îndoială, un produs al evoluţiei istorice adisciplinei şi al interacţiunii sale cu dezvoltarea psihologiei înseşi şi cu alte ştiinţe similare. Astfel,nu se poate să abordăm conceptul evaluării psihologice, fără să fi trecut înainte printr-o analizăistorică. McReynolds (1986) justifică această analiză istorică aducând diverse argumente; în primulrând, o cunoaştere a evoluţiei istorice a evaluării oferă o informaţie amplă şi o aplicare mai bună astării actuale a evaluării psihologice; în al doilea rând, trecutul este important prin el însuşi,deoarece face parte din moştenirea omenirii; şi, în al treilea rând, face posibil ca anumite aproximărisau directive folosite de strămoşii noştri, şi uitate de atunci, să fie redescoperite.

I.2. EVALUAREA PSIHOLOGICĂ ÎN ANTICHITATE

Analizând istoria omenirii, McReynolds (1986) încearcă să evidenţieze faptul că, încă din celemai vechi timpuri, în toate societăţile civilizate s-a utilizat un anumit procedeu de evaluare. Astfel,într-o primă etapă, care ar putea fi numită magică sau mitică, apare în multe culturi ghicirea sauprezicerea viitorului, aici putând fi inclusă astrologia. Aceasta este considerată ca fiind unul dinprimele antecedente ale evaluării psihologice. Astrologii consideră că aşa cum astrele regleazăritmicitatea ciclului zi-noapte, a mareelor, a recoltelor etc., ele determină şi o mare parte acomportamentului uman – a se înţelege caracterul uman. Cu alte cuvinte, indivizii sunt deosebit desensibili la influenţa astrelor, această influenţă fiind determinată de poziţia relativă a planetelor înmomentul naşterii. La prima vedere, se pare că există condiţiile necesare pentru un proces dediagnosticare, având în vedere că există un evaluator, un evaluat, instrumente, o intenţie pentruexplicaţie şi pronostic şi o teorie care să îl susţină. Cu toate acestea, o analiză mai detaliată ne facesă înţelegem astrologia ca pe ceva suficient de diferit de evaluarea psihologică pentru a putea ficonsiderat un antecedent. În primul rând, astrologia este o practică ce ar putea fi inclusă în magie; înal doilea rând, subiectul care face obiectul evaluării nu este individul în sine, şi nici mediul săuimediat, ci doar o dată, o oră şi un loc – de fapt se poate face o prezicere fără prezenţa persoaneicare se presupune că este evaluată; în al treilea rând, nu are nici un fel de utilitate socială, având învedere că se limitează să prezică destinul determinat de astre; şi în ultimul rând, astrologia a avut oevoluţie minimă de la începuturile sale până în prezent, fără a avea nici un fel de interacţiune cuevoluţia psihologiei, adică, psihologia s-a dezvoltat într-un mod complet independent de astrologie.Acest lucru îl demonstrează faptul că nici un astrolog nu şi-a dezvoltat teoria într-atât încât săajungă să o convertească într-o şcoală sau într-un curent psihologic. Astfel, nu există aspecte dinastrologie care să se fi transformat atât de mult încât să ajungă să se convertească într-un constructpsihologic, deci astrologia nu a fost un antecedent al actualei evaluări psihologice.

DuBois (1970) situează apariţia evaluării psihologice în China antică, unde se realiza oselecţie a copiilor care în viitor puteau să exercite funcţii în administraţia publică. Cei selecţionaţierau supuşi unui program intens de învăţare, la finalul căruia se evalua dacă acumulaseră pregătireanecesară pentru a ocupa posturile care urmau să le fie atribuite. Astfel, acesta pare a fi un antecedentclar al selectării de personal.

Un alt antecedent asupra căruia sunt de acord de obicei autorii care au studiat evoluţia istoricăa evaluării psihologice este fiziognomia (caracteristicile psihologice ale unui individ pot fi evaluateprin trăsăturile sale fizice), care îşi are rădăcinile în gândirea filosofică greacă. Potrivit luiRubinstein (1981), istoria ştiinţei demonstrează cum s-au format vechile idei ale filosofilor greci, înprocesul cognitiv practic al omului, cu acumularea de cunoştinţe de la naturişti, medici şi filosofi.

Page 4: Suport Curs Psihodiagnostic

Aceste idei s-au dezvoltat în opoziţie cu ideile mitologice privind lumea în general şi omul înparticular. Aristotel consideră că sufletul şi corpul sunt indivizibile. Astfel, fiecare dintre funcţiileorganice îşi are propriul suflet, corpul fiind considerat un organism compus din organe şiinstrumente ale sufletului. La Aristotel, psihicul se apropie de fizic, ceea ce implică o bază biologicăa caracterului. Ideile lui Aristotel şi-au găsit continuitatea la discipolul său, Teofrast. Acesta face osistematizare a principiilor fiziognomiei, care duce la crearea unor caractere diferite ce se stabilescprin intermediul observării comportamentului evident al indivizilor. Se stabileşte astfel o nozologiea caracterelor, în care sunt incluse diferite adjective ce serveau la clasificarea indivizilor în funcţiede obiceiurile lor. Ideea evaluării caracteristicilor psihologice prin intermediul caracteristicilorsomatice este prezentă mai recent în tipologiile lui Kretschmer şi Sheldon. Tot în acest context,întâlnim şi teoria lui Hipocrate care promovează patru tipuri (sangvinic, flegmatic, coleric şimelancolic) pornind de la patru clase de stări de spirit.

Această concepţie naturalistă manifestată printr-o evaluare psihologică pornind de lacaracteristici somatice (proprie fiziognomiei şi gândirii hipocratice) va fi întreruptă în Evul Mediude filozofia teologică, ce îşi va avea exponentul maxim în conceperea nebuniei ca pe o posedarediabolică. Cu scopul de a diferenţia subiecţii posedaţi de cei neposedaţi se publică, în 1486, carteaMalleus Malleficarum (Ciocanul ereticilor). În partea a doua a acesteia sunt descrise semnele carepermit identificarea vrăjitoarelor.

La graniţa dintre antecedentele filosofice şi cele biologice se află contribuţia importantă dinaceastă perioadă la evaluarea psihologică, opera lui Juan Huarte din San Juan Examen de ingeniospara las ciencias, publicată în 1575 şi tradusă în engleză, în 1698, cu titlul The tryal of wits(McReynolds, 1986). În Spania s-a reeditat de cinci ori până când a fost inclusă, în 1581, încatalogul cărţilor interzise din Lisabona, iar doi ani mai târziu în cel din Madrid (Buela-Casaly;Sierra, 1997). În această operă se abordează pentru întâia oară evaluarea într-o formă explicită. Seconsideră că oamenii diferă în ceea ce priveşte talentul lor şi că aceste diferenţe trebuie evaluatepentru a se obţine o adaptare între abilităţi, ocupaţii diferite şi tipuri de educaţie. Astfel, se considerăcă mediul influenţează învăţarea, astfel încât se recomandă ca studiile să fie realizate într-un oraşdiferit de cel natal, deoarece influenţa familiei şi a prietenilor reprezintă o piedică pentru învăţare(Pérez-Álvarez, 1991 apud. Buela-Casaly; Sierra, 1997). Este, prin urmare, precursorul cel mai claral selecţionării de personal. În cercurile universitare, evaluarea apare în paralel cu crearea primeloruniversităţi europene, unde se realizau în mod regulat examene pentru obţinerea titlurilor şi adistincţiilor (Anastasi, 1988).

În definitiv, probabil că antecedentul cel mai clar al evaluării psihologice este tendinţanaturală a omului de a-i evalua pe ceilalţi. Am putea indica o infinitate de antecedente posibile aleevaluării psihologice; cu toate acestea, pentru a contextualiza principalele evenimente care au datnaştere actualelor instrumente de evaluare, nu trebuie să mergem mai departe de secolul al XVIII-lea.

I.3. ANTECEDENTELE ŞTIINŢIFICE ALE EVALUĂRII PSIHOLOGICE

Importantele progrese ştiinţifice produse în secolul al XVIII-lea, şi mai ales în secolul al XIX-lea, vor face ca psihologia să se separe de speculaţia filosofică şi să se apropie de metoda ştiinţifică.Antecedentele ştiinţifice ale evaluării psihologice ar putea să se situeze în dezvoltarea disciplinelorca frenologia, matematica, psihofizica, psihiatria, psihologia educativă şi evoluţionismul.

Frenologia apare la sfârşitul secolului al XVIII-lea şi se bucură în curând de o marepopularitate. Creatorul acesteia, Gall (1758-1828), proporţionează prima conceptualizaresistematică a trăsăturilor, care se sprijină pe următoarele enunţuri:

Page 5: Suport Curs Psihodiagnostic

a. Facultăţile mentale sunt înnăscute.

b. Creierul este organul minţii.

c. Forma şi dimensiunea creierului se pot cunoaşte în funcţie de forma şi măsura craniului.

d. Mintea posedă facultăţi separate, creierul este format din organe separate şi fiecare facultatementală se manifestă prin intermediul unui organ cerebral diferit.

e. Dimensiunea fiecărui organ poate fi estimată în timpul vieţii iar în cazul celorlalte condiţii egale,dimeniunea este o măsură a capacităţii organului.

f. Orice organ, dacă este predominant activ, transmite corpului anumite atitudini şi mişcări, numite„limbajul său natural”.

Deşi frenologia face deja parte din istorie, ea a ajutat la fixarea ideii conform căreiacomportamentul şi organismul nu sunt entităţi independente, ci sunt strâns legate între ele. Gallpractica un sistem de diagnostic bazat pe palparea craniului pentru a cunoaşte facultăţile dominanteale fiecărui individ. Printre contribuţiile pe care, portivit lui McReynolds (1986), le aducefrenologia la evaluarea psihologică se remarcă următoarele:

a. Se creează o taxonomie mentală, în funcţie de care se pot explica diferenţele individuale.

b. Se pune accentul pe diferenţele individuale.

c. Se promovează un aspect aplicat al psihologiei.

d. Se propune paradigma de evaluare, diferenţiind elementele incluse într-o sesiune de evaluare(evaluator, subiect evaluat, profile...).

e. Se elaborează scale pentru evaluarea unor variabile de personalitate.

f. Se pune accentul pe obiectivitatea datelor.

Matematica a avut o influenţă în constituirea şi dezvoltarea ulterioară a evaluării psihologice.Prima contribuţie este reprezentată de Quetelet, un matematician belgian, care astăzi e considerat afi unul dintre fondatorii aplicării statisticii la ştiinţele sociale (Silva, 1982). Quetelet a studiatvariabilele biologice şi sociologice, observând că ambele urmau o distribuire gaussiană, astfel că adezvoltat norme şi măsuri de tendinţă centrală. Influenţa sa asupra evaluării psihologice seconcentrează pe două aspecte importante: acela de a fi unul dintre autorii care s-au interesat în modsistematic de diferenţele individuale şi faptul că metodele sale au avut o mare influenţă asupra unorautori importanţi precum Galton, Pearson şi Spearman.

Psihiatria a fost o altă disciplină care a contribuit în bună măsură la dezvoltarea evaluăriipsihologice. Efortul de a diferenţia tulburările mentale se traduce prin nevoia unor tehnici deevaluare pentru a stabili diagnostice diferenţiale. Astfel, Pinel (1745-1826) introduce o scurtăclasificare a bolilor mentale, care făcea posibil un tratament mai diferenţiat. Pinel susţine valoareaanamnezei pentru diagnostic. Însă, fără îndoială, contribuţia sa cea mai importantă a constituit-oschimbarea atitudinii în ceea ce priveşte bolnavii mintal, ajungând să-i considere drept bolnavi cudreptul la tratament şi libertate şi nu drept subiecţi ce trebuie izolaţi şi închişi, cum erau consideraţipână atunci. Ideile lui Pinel au ajuns în Italia, unde şi-au găsit un mare susţinător în persoana luiLombroso, care şi-a concentrat opera asupra relaţiei dintre aspectul penal şi cel psihiatric, punândproblema unei posibile scuze în delictele comise de bolnavii mintal. Studiul legăturii dintre

Page 6: Suport Curs Psihodiagnostic

delincvenţă şi boală l-a determinat să-şi elaboreze celebra teorie referitoare la „delincvenţaînnăscută”. Conform acestei teorii, comportamentul delincvent poate avea o origine degenerativă aorganismului, datorată efectului unor factori precum sifilisul, alcoolul, epilepsia, vârsta avansată apărinţilor etc., care ar acţiona în timpul dezvoltării fetale producând o degenerare a centrilor nervoşisuperiori, care vor constitui ulterior cauza comportamentului delincvent. Opera lui Pinel îşi atingepunctul culminant prin figura lui Kraepelin (1856-1926), care a fost interesat de problematicaclasificării tulburărilor mintale, considerând că pentru a putea face o bună evaluare şi intervenţie, enevoie întâi de o clasificare. Probabil că cea mai importantă contribuţie a sa a fost schimbarea de lao concepţie simptomatică a bolii la o concepţie evolutivă, adică, manifestările externe ale bolii suntsecundare în ceea ce priveşte originea şi evoluţia acesteia. Aportul său la evaluarea psihologică seconcentrează în mod concret asupra interesului său constant de a evalua în mod obiectivcomportamentul pacienţilor săi. Astfel, el evalua funcţii sau aptitudini precum memoria, atenţia,capacitatea de învăţare, timpul de reacţie, asocierile verbale etc. Paralel cu această etapă creşteinteresul faţă de retardaţii mintal, creându-se în Europa şi în America numeroase instituţii pentruîngrijirea acestora. Interesul pentru un tratament adecvat pentru retardaţii mintal a scos în evidenţănevoia unor criterii de diagnosticare şi de clasificare, care să permită diferenţierea între subiecţiinormali, bolnavii mintal şi retardaţi. În acest context, trebuie să-l remarcăm pe Esquirol (1772-1840), medic francez, care în 1838 a publicat o operă în două volume, în care a dedicat peste 100 depagini retardării mintale. O altă contribuţie importantă a lui Esquirol a fost concepţia sa privindretardarea mintală. Pentru acest autor, retardarea varia de la normalitate până la retardarea cea maiprofundă. Pentru aceasta a realizat mai multe încercări de a evalua şi clasifica diferitele grade şitipuri de retardare mintală, ajungând la concluzia că cel mai bun criteriu de a evalua nivelul dedeteriorare intelectuală este utilizarea limbajului. Este important să se aibă în vedere că actualelecriterii privind retardarea mintală sunt în mare parte lingvistice şi că testele de inteligenţă sunt, deobicei, destul de pline de conţinuturi verbale (Anastasi, 1988). Psihofizica poate fi considerată drepto disciplină precursoare a psihologiei ştiinţifice. Metodele imaginate de Fechner permit relaţionareaexperienţelor subiective cu măsuri obiective. Astfel, consideră că experienţele psihologice se potverbaliza şi, în consecinţă, se pot clasifica pe scale de intensitate sau discriminare.

Psihofizica avea ca postulat iniţial descoperirea unor legi generale pentru descrierea relaţiilordintre minte şi corp. Contribuţia sa la evaluarea psihologică se poate observa în studiul concret alfenomenelor psihice, făcându-se legătura dintre experienţa subiectivă şi măsurile obiective, creareaunor noi metode de investigare a acestor elemente şi sistematizarea teoretică a acestora (Zabrodin,1985, apud. Buela-Casaly; Sierra, 1997). Deşi autori precum Fechner şi Weber erau mai interesaţide legile generale decât de diferenţele individuale, odată cu ei apare situaţia de examen psihologic;astfel, de exemplu, Fechner utilizează deja autoraportul subiectului ca instrument de evaluare.

Psihologia educativă atinge punctul culminant odată cu modurile de abordare inovatoareproduse în ceea ce priveşte interesul crescând faţă de educaţie, cu şcolarizarea obligatorie ulterioară,apărând astfel nevoia de aplicare a principiilor psihologice în şcoli şi cererea unei evaluări arandamentului academic. Acest interes pentru evaluarea în mediul şcolar şi-a găsit continuitatea laautori precum Throndike, Hall şi Binet.

Evoluţionismul marchează un eveniment important în istoria ştiinţelor umane. Legătura dintreDarwin şi Galton a favorizat şi mai mult influenţa teoriilor evoluţioniste în încercarea de a explicadiferenţele individuale şi, în cele din urmă, inteligenţa umană. Baza evoluţionismului constă în arecunoaşte variabilitatea membrilor aceleiaşi specii, în care caracteristicile pot fi moştenite. Astfel,în natură se produce o selecţie naturală prin intermediul supravieţuirii membrilor celor mai puternicisau mai bine adaptaţi. La specia umană, capacitatea diferită de adaptare se numeşte inteligenţă.

Page 7: Suport Curs Psihodiagnostic

Diferenţele de inteligenţă erau perfect acceptate în societatea secolului al XIX-lea. Astfel,darwinismul social ajuta la justificarea ordinii sociale fixe.

Antecendentele cele mai ştiinţifice ale evaluării psihologice îşi au rădăcinile în primelelaboratoare de psihologie. În 1877 s-a produs prima încercare de înfiinţare a unui laborator depsihofiziologie de către savanţii britanici Venn şi Ward. Cu toate acestea, Senatul din Cambridge arespins această iniţiativă, calificându-i pe cei doi savanţi drept atei (Yakunin, 1985, apud. Buela-Casaly; Sierra, 1997). Cu doi ani mai târziu, Wundt inaugura în Leipzig (1879) primul laborator depsihologie, acest moment fiind considerat drept naşterea psihologiei ştiinţifice. Ideea lui Wundt de aapropia psihologia de fiziologie, în ciuda faptului că întâlnise o opoziţie clară în cercurile filosofice,a câştigat în curând adepţi. Cu toate acestea, această idee nu era nouă, deoarece Sechenov, uncunoscut savant rus, încercase să interpreteze fenomenele psihice dintr-un punct de vederefiziologic. De fapt, cartea sa Reflejos del cerebro (Reflecţii ale creierului) a fost editată în 1863,adică, cu 11 ani înainte ca Wundt să publice Bazele psihologiei fiziologice. Într-un articol scris în1873, Sechenov, plecând de la tradiţia materialistă a gânditorilor ruşi, susţine teza referitoare ladeterminarea obiectivă a intelectului. Ideile lui Sechenov au fost foarte bine primite în rândurilepsihiatrilor şi neurologilor ruşi, ceea ce a dus la o restructurare a psihologiei din punct de vederefiziologic. O dovadă a acestui fapt o constituie crearea primului laborator de psihologie din Rusia,înfiinţat de Bejteriev, în 1886, în clinica de bolnavi alienaţi şi boli nervoase din oraşul Kazan. Cucâţiva ani mai târziu, în 1891, se constituia Societatea Rusă de Psihologie Experimentală (Yakunin,1985, apud. Buela-Casaly; Sierra, 1997). De la crearea sa şi până la începutul secolului al XX-lea,laboratorul lui Wundt a fost considerat centrul psihologiei experimentale, fiind exemplul ce trebuiaurmat în crearea de noi laboratoare. Obiectul de studiu al noilor psihologi experimentali era acela dea ajunge să abordeze descrieri generale ale comportamentului uman. Diferenţele individuale nunumai că nu interesau pe nimeni, ci ajungeau să fie considerate drept „erori de măsurare”. Înalegerea temelor şi în anumite metode utilizate se observa influenţa medicinei şi a fiziologiei.Pelechano (1988, apud. Buela-Casaly; Sierra, 1997), consideră că tipul de psihologie experimentalăpracticată de Wundt şi de adepţii săi presupunea în realitate o limitare a dezvoltării evaluăriipsihologice. Wundt nega importanţa psihologiei diferenţiale, nu autoriza utilizarea chestionarelorpentru investigarea psihologică, nu accepta posibilitatea unei psihologii ştiinţifice în afaralaboratorului şi nici studiile filogenetice şi ontogenetice ale psihismului uman. Cu toate acestea, nutotul a fost negativ, având în vedere că psihologia experimentală a secolului al XIX-lea a ajutat lascoaterea în evidenţă a importanţei de a controla în mod riguros condiţiile în care se făceauobservaţiile. De exemplu, se controlau caracteristicile stimulului, contextul în care se prezentaacesta, instrucţiunile pe care le primea subiectul etc. În definitiv, se încerca evaluarea tuturorsubiecţilor în aceleaşi condiţii standardizate. După cum bine se ştie, toate acestea au fost acceptateîn totalitate în procesul de construire şi în aplicarea testelor (Anastasi, 1988).

I.4. CONSTITUIREA ŞI DEZVOLTAREA EVALUĂRII PSIHOLOGICE

Există un anumit consens în ceea ce priveşte considerarea lui Galton, Cattell şi Binet dreptautorii care au configurat evaluarea psihologică ca disciplină ştiinţifică. În cele ce urmează se vaface referire la ei şi se va face o trecere în revistă a diferitelor evenimente care au presupusdezvoltarea acestei discipline.

I.4.1. Contribuţia lui Galton

Galton (1822-1911) este considerat părintele psihometriei şi al psihologiei diferenţiale. Înciuda faptului că era un om multilateral în ceea ce priveşte interesele sale ştiinţifice, el a ştiut să-şiconcentreze cercetările asupra moştenirii inteligenţei umane. Considera că aceasta este înnăscută şi,astfel, prin intermediul caracterului ereditar se putea obţine o îmbunătăţire a indivizilor prin

Page 8: Suport Curs Psihodiagnostic

intermediul eugeniei. Laboratorul său antropometric din Muzeul Kensington din Londra a devenitcelebru în toată lumea. În anul 1884, când a avut loc şi celebrarea unui congres internaţional deigienă, înfiinţează un laborator antropometric şi propune vizitatorilor să afle, în schimbul a treipenny, măsura câtorva trăsături fizice, ascuţimea vizuală şi auditivă, timpul de reacţie, forţamusculară şi câteva funcţii senzoriale. Cu aceste informaţii a publicat primul tabel de baremuri, încare îşi puteau compara rezultatele vizitatorii care aveau să treacă prin laborator (DuBois, 1970).Majoritatea instrumentelor care se utilizau în laboratorul său antropometric au fost create de elînsuşi, iar unele încă se mai utilizează şi în prezent, cum este cazul barei lui Galton pentrudiscriminarea vizuală a lungimii şi seria greutăţilor gradate pentru măsurarea discriminăriichinestezice. A acordat o importanţă specială discriminării senzoriale, deoarece considera că aceastaajută la evaluarea capacităţii intelectuale. Astfel, în numeroasele evaluări realizate a descoperit căidioţii prezintă de obicei deficienţe în capacitatea de discriminare a temperaturii şi a durerii(Anastasi, 1988).

Contribuţiile cele mai relevante ale lui Galton ar putea fi rezumate în punctele următoare(Pelechano, 1988, apud. Buela-Casaly; Sierra, 1997):

a. Interesul de a face o analiză cantitativă a caracteristicilor şi diferenţelor umane. Sub acestaspect se observa o influenţă a matematicianului Quetelet, care în anul 1846 demonstrase deja cumanumiţi indicatori antropometrici urmau o distribuţie gaussiană. Astfel, Galton susţinea cădiferenţele individuale se puteau explica în mod adecvat dacă se concepeau sub formă de continuuricantitative care urmau distribuţia curbei lui Gauss.

b. Interesul pentru adunarea empirică şi sistematică de informaţii. Acesta se demonstrează prinmunca sa neobosită din laboratorul antropometric din South Kensington Museum din Londra, undea reuşit să adune date aparţinând unui număr de 9.377 de persoane, care erau evaluate într-un numărconsiderabil de probe (timp de reacţie, măsurări fizice, răspunsuri la scale de calificare...).

c. Aplicarea statisticii pentru interpretarea informaţiilor. Pe lângă utilizarea anumitor măsuride tendinţă centrală, Galton a introdus indicele de corelare (de fapt, în anul 1888 a ajuns să publiceun articol despre „Corelations and their measurement, chiefly from antropometric data”) care maitârziu avea să fie completat de Pearson, ducând la apariţia coeficientului de corelare şi pe bazacăruia avea să se stabilească modelul corelaţional.

d. Interesul pentru studiul diferenţelor individuale. Urmând teoria evoluţionistă, Galtonînţelegea diferenţele individuale ca pe un rezultat al unor mecanisme şi procese ereditare. Pentru ademonstra acest lucru, a utilizat studiul arborilor genealogici şi corelaţionarea probelor psihologiceîntre părinţi şi copii. Prin intermediul acestei metodologii a reuşit să stabilească legea întoarcerii lamedie. Galton s-a văzut obligat să abordeze această lege pentru a putea explica anumite dateprecum faptul că părinţii foarte inteligenţi tindeau să aibă fii mai puţin inteligenţi, în timp ce părinţiimai puţin inteligenţi tindeau să aibă fii mai inteligenţi.

Gândirea lui Galton şi un bun rezumat al operei sale pot fi găsite în cartea Moştenire şieugenie, în care se află o compilaţie de texte provenind din diverse opere ale sale.

I.4.2. Contribuţia lui Cattell

James McKeen Cattell (1861-1934) a fost un psiholog american cu o educaţie solidă pe care aprimit-o în Europa. Teza lui de doctorat a tratat diferenţele individuale în cadrul timpului de reacţieşi a fost realizată în laboratorul lui Wundt (Leipzig). Ulterior, a lucrat cu Galton în laboratorulantropometric din South Kensington Museum din Londra. În 1888 a fost numit profesor depsihologie la Universitatea din Pennsylvania. Doi ani mai târziu publică în revista Mind un articol

Page 9: Suport Curs Psihodiagnostic

intitulat „Mental tests and measurements”, care marchează un eveniment important în istoriaevaluării psihologice, având în vedere că este pentru prima oară când se utilizează termenul „test” înliteratura psihologică (McReynolds, 1986), iar în el se descriau testele care se aplicau anual lastudenţii universitari cu intenţia de a evalua nivelul intelectual al acestora. Ulterior s-a mutat laUniversitatea din Columbia, unde a creat prima baterie de probe de evaluare psihologică. În scurttimp, metodologia şi procedeul de elaborare a testelor au devenit foarte populare. În ultima decadă asecolului al XIX-lea, testele se aplicau, în Statele Unite, la toate tipurile de subiecţi (şcolari, studenţiuniversitari, adulţi...). Cu toate acestea, traiectoria strălucită a lui Cattell se opreşte, cel puţin parţial,în faţa criticilor aduse de Wissler şi Sharp. Primul, care fusese discipolul lui Cattell, a prezentat unstudiu detaliat în care analiza rezultatele lui Cattell, demonstrând validitatea redusă atinsă de teste.Concret, a demonstrat că coeficienţii de corelare dintre testele psihologice şi calificativele şcolareerau relativ reduşi. Pe de altă parte, Sharp a demonstrat fidelitatea scăzută şi valoarea predictivăredusă pe care o deţineau testele lui Cattell (Pelechano, 1988, apud. Buela-Casaly; Sierra, 1997).

I.4.3. Contribuţia lui Binet

Binet (1857-1911) era licenţiat în drept şi doctor în ştiinţe naturale şi a intrat în psihologia„mâinii” lui Ribot, marele iniţiator al psihologiei experimentale din Franţa. Ribot înţelegea căprogresul psihologiei se află în metodele experimentale (deşi nu era cercetător), nu degeaba a fostfondatorul primului laborator de psihologie de la Universitatea din Sorbona, în anul 1889. În anul1895, Binet înfiinţează L’Année Psychologique, prima revistă franceză de psihologie. În aceastărevistă publică un articol, „La Psychologie individuelle”, în care prezintă bazele unei noi abordări aevaluării inteligenţei. Binet manifesta acelaşi interes ca şi Galton pentru evaluarea diferenţelorindividuale, însă respingea ideea că inteligenţa umană se poate evalua prin intermediul proceselorsenzorio-motorii. În articolul lor, Binet şi Henri susţin că inteligenţa trebuie evaluată în funcţie depreformanţele subiecţilor în diverse sarcini care implică o varietate de procese mentale complexe(McReynolds, 1986). Binet şi Henri au început să evalueze procese ca memoria, atenţia, imaginaţia,înţelegerea, sensibilitatea artistică şi morală, sugestibilitatea, puterea voinţei şi abilitatea motorie.Binet include ca şi caracteristici ale comportamentului inteligent alegerea şi menţinerea unei direcţiiprecise, adaptarea pentru atingerea unui scop şi autocritica (Cronbach, 1990).

Marea şansă a lui Binet soseşte atunci când este numit de către Ministerul francez al Educaţieimembru în comisia care avea să se ocupe de căutarea unei soluţii pentru copiii cu deficienţe, careintraseră în şcoala publică în urma punerii în vigoare a învăţământului obligatoriu în Franţa. Carăspuns la această cerere, Binet, în colaborare cu Simon, elaborează o scală care conţine 30 deprobleme cu grade de dificultate crescânde. Pentru a calcula nivelul de dificultate, această scală s-aaplicat la 50 de copii normali, cu vârste cuprinse între 3 şi 11 ani şi la câţiva retardaţi mintal.Conţinutul itemilor acoperea o mare varietate de funcţii, deşi predominau problemele legate deînţelegere şi judecată. Proba rezultantă, care este cunoscută sub denumirea de scala 1905, a fostconsiderată un instrument de evaluare provizorie (Anastasi, 1988). După cum semnalează Pichot(1994, apud. Buela-Casaly; Sierra, 1997) „pentru prima oară se ieşise din epoca experienţelor delaborator pentru a se intra în viaţa concretă”. Binet şi Simon continuă să lucreze la această scală, iarîn 1908 prezintă o a doua versiune la care se adaptaseră serii de itemi pentru grupe de vârstă. Vârstamintală se stabilea în funcţie de vârsta corespunzătoare seriei celei mai ridicate obţinută per total.Având în vedere că fiecare serie, care corespunde cu o vârstă mintală determinată constă din cinciprobleme, se adăuga la vârsta de bază (aceea a seriei realizate în totalitate corect) 1/5 ani pentrufiecare test realizat corect aparţinând unor serii superioare. Vârsta mintală obţinută era comparată cuvârsta cronologică, văzându-se astfel dacă copilul urma o evoluţie normală, întârziată sau înaintată.În 1911, se prezintă o a treia versiune a scalei, în care se mărise numărul de itemi la anumiteniveluri şi se extinsese vârsta adultă. Cu toate acestea, versiunea cea mai difuzată a fost realizată de

Page 10: Suport Curs Psihodiagnostic

Terman de la Universitatea din Stanford, fiind cunoscută sub denumirea de Scala lui Stanford-Binet.La aceasta se utilizează pentru prima oară termenul de „coeficient de inteligenţă” (CI), rezultat dinîmpărţirea vârstei mintale la vârsta cronologică. Ulterior au apărut şi alte versiuni, însă un interesspecial îl prezintă versiunea realizată de Kuhlmann, în 1912 (Scala Kuhlmann-Binet), care a extinsscala în partea inferioară până la vârsta de trei luni, fiind revizuită ulterior în 1937 şi 1960. Termanefectuează încă două revizuiri şi, în cele din urmă, Thorndike o realizează pe ultima de până acum,în 1986 (Rogers, 1995).

Cu toate acestea, aceste scale nu erau lipsite de probleme. Astfel, în timp ce Galton avansamăsurarea unei inteligenţe înnăscute sau biologice, Binet apără evaluarea unei inteligenţe de originesocială. În curând mişcarea eugenică adoptă ca instrument testul lui Binet şi Simon, identificândinteligenţa înnăscută cu cea socială. Pelechano (1988, apud. Buela-Casaly; Sierra, 1997) semnaleazăfaptul că logica utilizată de Binet în construirea şi interpretarea scalei era corectă, însă văzută dintr-o perspectivă actuală avea câteva probleme importante:

a. Nu s-a demonstrat că comportamentele aplicate ar fi fost reprezentative pentru ceea ce sedorea evaluat (capacitatea intelectuală).

b. Mostra utilizată pentru clasificarea punctuaţiilor nu era reprezentativă pentru populaţia lacare se aplica ulterior.

c. Utilizarea vârstei cronologice ca şi criteriu variabil pentru măsurarea vârstei mintale,făcându-se astfel să se înţeleagă implicit că la fiecare două luni se produce o schimbare încapacitatea intelectuală.

d. Modelul acumulativ conform căruia fiecare problemă rezolvată este echivalentă cu operioadă de vârstă mintală nu a fost demonstrat.

e. Presupunerea că distribuirea punctuaţiilor este egală în fiecare grupă de vârstă nu estecorectă.

f. Se presupune că toţi copiii au o dezvoltare normativă, adică egală cu cea a grupului dereferinţă.

Pe de altă parte, tipul de probleme abordate se afla în strânsă legătură cu conţinuturileacademice, astfel că scala prezicea foarte bine performanţa academică, care nu este aceeaşi cucapacitatea intelectuală.

În ciuda problemelor metodologice care se evidenţiază în scalele lui Binet, acesta trebuieconsiderat drept cel mai mare propulsor al evaluării psihologice. Activitatea sa a fost într-adevăraceea a unui evaluator, iar influenţa lui a fost simţită timp de mai multe decenii. O bună dovadă aacestui fapt a fost numărul mare de cercetători care s-au interesat de evaluarea inteligenţei înprimele două decenii ale secolului al XX-lea. Producţia din acest domeniu era atât abundentă cât şidiversificată. De aceea, în 1921, directorii revistei Journal of Educational Psychology au organizatun congres intitulat Inteligenţa şi măsurarea acesteia la care au invitat personalităţi distinse înmaterie (Terman, Thorndike, Peterson, Thurstone etc.) pentru a discuta despre natura inteligenţei(Sternberg, 1986). Rezultatul a fost decepţionant; existau aproape tot atâtea concepţii de inteligenţăcât şi experţi care îşi dădeau cu părerea în legătură cu această temă. Confuzia era atât de mare încâtBinet a ajuns să pronunţe celebra frază „inteligenţa este ceea ce măsoară testele”. Cu toate acestea,congresul a servit la stabilirea unui anumit acord privind drumul ce trebuia urmat în viitor pentrucercetarea inteligenţei. De atunci au trecut mai mult de şaptezeci de ani şi încă nu s-a ajuns la unacord unanim referitor la ceea ce este inteligenţa şi la cum trebuie evaluată (Eysenck, 1991).

Page 11: Suport Curs Psihodiagnostic

I.4.4. Contribuţii ale altor autori

Witmer, la fel ca şi precursorul său Cattell, era interesat de studiul diferenţelor individuale. Cutoate acestea, interesul său principal se concentra asupra aplicaţiei practice a cunoştinţelorpsihologice. În anul 1896, Witmer fondează prima clinică psihologică (de fapt, această dată esteconsiderată de obicei drept începutul psihologiei clinice, deşi nu trebuie să se interepreteze căWitmer ar fi fost primul psiholog clinician) (Buela-Casaly; Sierra, 1997). Tipul de muncă ce serealizează în această clinică se regăseşte în primele numere ale revistei The Psychological Clinic,fondată în 1906 şi condusă de Witmer. Majoritatea cazurilor care se tratau proveneau din mediulşcolar. În primii ani, nu dispunea de proble specifice de evaluare, astfel că diagnosticul său se bazaîn principal pe interviu. Ulterior, când apar testele, adoptă unul din ele şi creează Witmer formboardşi Witmer cylinders, care au fost utilizate timp de mai mulţi ani în clinica lui. Se concentra asupraevaluării comportamentelor specifice ale subiecţilor şi viza tratamentul acestor comportamente. Deaceea, a fost considerat drept un predecesor al evaluării comportamentale (McReynolds, 1986).Witmer a fost un autor cu influenţă limitată în evaluarea psihologică. Cu toate acestea, marele luimerit a fost încercarea de a aplica psihologia la problemele care apar în viaţa reală. Pe de altă parte,clinica lui psihologică a servit ca model pentru multe altele care s-au înfiinţat mai târziu (Buela-Casaly; Sierra, 1997).

Spearman (1863-1945) reprezintă un alt pas important în constituirea evaluării psihologicepentru faptul de a fi aplicat metodele corelaţionale în cercetarea inteligenţei. În anul 1904 a publicatun articol important intitulat „General intelligence, objectively determined and measured”, unde sestabilesc bazele teoriei psihometrice. A fost primul autor interesat să caute o explicaţie pentrucorelarea redusă care se obţinea între diferite teste de inteligenţă şi să abordeze nevoia de a utilizaprobe paralele pentru evaluarea sa. Marea contribuţie a lui Spearman nu a fost numai unametodologică, el fiind, de asemenea, autorul primei mari teorii a inteligenţei, numită teoria celor doifactori (un factor general şi anumiţi factori specifici). Conform teoriei respective, capacitateareprezentată în factorul general (factorul g) este legată de toate sarcinile intelectuale, în timp cecapacităţile reprezentate de factorii specifici sunt legate de sarcinile simple. Pentru a explica naturafactorului g, Spearman a propus două teorii. În prima, se spunea că factorul g este legat de nivelulde energie cerebrală pe care o pot utiliza oamenii pentru a rezolva probleme intelectuale; a douaconsideră că diferenţele din factorul g se pot explica în funcţie de diferenţele individuale dincapacitatea oamenilor de a utiliza trei principii calitative de percepţie: acumularea experienţei,deducţia relaţiilor şi deducţia corelărilor (Sternberg, 1986). În anii treizeci, această schemăbifactorială va fi înlocuită cu un model multifactorial reprezentat de Thurstone.

În cele din urmă, Freud (1856-1939) vine cu o abordare a diagnosticării bazată pe tehnicile deasociere şi pe utilizarea simbolismului. În 1909, conferinţele sale de la Clark University din NewYork au favorizat difuzarea psihoanalizei în Statele Unite (Avila, 1992b, apud. Buela-Casaly;Sierra, 1997), ceea ce a dus la diagnosticul dinamic ce se va dezvolta începând cu anii treizeci cuajutorul tehnicilor proiective.

I.4.5. Repercusiunile primului şi celui de-al doilea război mondial

Există un anumit acord între autori în considerarea celor două conflicte mondiale drept faptedeterminante pentru evoluţia evaluării psihologice, între aceste două momente istorice încadrându-se ceea ce Silva (1982) numeşte „epoca clasică” a diagnosticului psihologic; astfel, potrivit acestuiautor, atât linia psihometrică cât şi cea proiectivă şi clinică a actualei evaluări psihologice încă mai

Page 12: Suport Curs Psihodiagnostic

trăiesc din marile evenimente importante din această epocă: marile teste de inteligenţă, primelechestionare de interese şi primele teste proiective.

O dată cu începerea primului război mondial, industria generată în jurul războiului afectează şipsihologia, şi mai concret evaluarea psihologică. Astfel, American Psychological Association(APA) a numit un comitet care avea să se ocupe de studierea posibilului ajutor pe care l-ar fi pututoferi psihologia. A apărut nevoia de a se selecţiona peste un milion de soldaţi, pentru care eraesenţial să se dispună de probe colective care să permită clasificarea soldaţilor în funcţie de nivelullor intelectual şi de aptitudinile lor de a oferi un anumit tip de serviciu. Având în vedere cămajoritatea testelor existente erau de aplicare individuală, a fost necesar să se recurgă la toatetipurile de teste care se puteau aplica în mod colectiv. Arthur Otis a pus la dispoziţia Armatei o seriede teste pe care le elaborase, dar pe care nu apucase să le publice (Buela-Casaly; Sierra, 1997). Eranevoie de probe de dificultate progresivă, cu răspunsuri scurte, o corectare rapidă şi obiectivă, cuforme diferite (pentru a evita învăţarea) şi de aplicare colectivă. Probele construite pentru evaluareanivelului intelectual au fost cunoscute sub numele de Army alpha test şi Army beta test. Prima seaplica la populaţia generală (instruită) şi consta din următoarele subprobe: îndeplinirea ordinelor,probleme aritmetice, sinonime şi antonime, simţ practic, analogii, informaţii şi gramatică. Fiecaresubprobă avea o dificultate crescândă şi trebuia să se răspundă la ea într-un timp limitat. A douaprobă era gândită pentru persoane analfabete sau pentru persoane care nu vorbeau limba engleză;astfel, în aceasta nu erau incluse conţinuturi verbale, ci consta din labirinturi, serii, cuburi, puzzle,construcţii geometrice, cifre-simbol şi numere. Desigur, timpul de răspuns era, de asemenea, limitat.Pentru a evalua simptomatologia neurotică s-a utilizat Woodworth personal data sheet, un inventarde personalitate elaborat de Woodworth şi care a ajuns să fie aplicat la peste un milion şi jumătatede persoane.

Influenţa acestui proces a avut o mare importanţă în dezvoltarea evaluării psihologice subdiverse aspecte sintetizate în punctele următoare (Buela-Casaly; Sierra, 1997):

a. Primul, şi poate cel mai important, a fost considerarea figurii psihologului drept unprofesionist calificat, ce poate rezolva problemele vieţii reale.

b. Perfecţionarea metodologiei de construire a testelor şi formarea unei mari baze de date(peste un milion şi jumătate de subiecţi) din populaţia generală.

c. Tipul de evaluare realizată în armată s-a adaptat la domenii precum cel industrial (selecţia şievaluarea personalului) şi cel clinic.

d. Consolidarea aplicării testelor cu conotaţia rezultantă a „psihologului care trece teste”.

Evaluarea de tip clinic nu apare la întâmplare după primul război mondial. Pe de o parte,instrumentele de evaluare clinică nu aveau nici o utilitate în sarcinile de selectare şi plasare cerutede armata americană, însă ele devin necesare după război pentru reintroducerea subiecţilor însocietate. Difuzarea tehnicilor proiective începe prin publicarea de către Rorschach, în 1921, alucrării Psychodiagnostik, deşi nu trebuie să uităm că Jung prezentase deja în 1904 proba asocieriilibere a cuvintelor (Buela-Casaly; Sierra, 1997).

Antecedentele testului lui Rorschach pot fi regăsite în vechea idee grecească, conform căreiainteracţiunea unei persoane cu o entitate ambiguă facilitează informaţii pentru cunoaştereapersoanei respective. În Renaştere, Leonardo da Vinci îi sfătuia pe discipolii săi să-şi exersezeimaginaţia contemplând formele sau figurile pe care le desena umezeala pe pereţi. Însă fără

Page 13: Suport Curs Psihodiagnostic

îndoială, antecedentul cel mai clar este tehnica numită klebsografie (dezvoltată de Klebs), careconstă din aruncarea unor picături de vopsea pe o bucată de hârtie, care apoi se îndoaie pe lajumătate, interpretându-se petele obţinute. La sfârşitul secolului al XIX-lea, Binet începe săutilizeze petele de vopsea pentru a studia capacitatea imaginaţiei vizuale. Câţiva ani mai târziu,Herman Rorschach utilizează această tehnică pentru diagnosticarea personalităţii şi tulburărilorpsihice. Din totalitatea de foi utilizate selecţionează zece cu scopul de a-şi publica metoda, ceea cenu a reuşit decât cu doi ani mai târziu, graţie medicaţiei lui Morgenthaler, care în plus i-a sugerat luiRorschach să schimbe titlul original, „Metoda şi rezultatele unui experiment diagnostic bazat peperceperea şi interpretarea formelor cauzale” cu „Psihodiagnostic”. La început, cartea a fostacceptată de puţină lume. Criticile au fost puţine şi în general nefavorabile, ceea ce i-a produs odecepţie considerabilă. Rorschach a murit fără să cunoască popularitatea pe care avea să o aibătehnica pe care o crease (Serrate, 1980, apud. Buela-Casaly; Sierra, 1997).

Câţiva ani mai târziu, Murray publică în 1935 Testul de apercepţie tematică (TAT) caalternativă la tehnica lui Rorschach. În paralel cu această dezvoltare de tehnici proiective continuăsă se facă progrese în domeniul psihometric, manifestate printr-o rafinare a tehnicilor factoriale.Astfel, Thrustone publică în 1935 Vectors of the Mind, iar în 1938 Primary mental abilities, undeinteligenţa capătă o natură multivariabilă (Rogers, 1995).

În 1939 se publică lucrarea Wechsler-Bellevue intelligence scale, prima scală a lui Wechslerpentru adulţi, cu anumite diferenţe faţă de aceea a lui Stanford-Binet: fiecare subtest includea itemipentru fiecare grupă de vârstă, punea mai puţin accentul pe rapiditatea răspunsului şi conţinea destulde multe componente nonverbale (Rogers, 1995). Alte publicaţii relevante din această perioadă suntInventarul intereselor vocaţionale al lui Strong (1927) şi Testul gestaltic al lui Bender (1938),(Buela-Casaly; Sierra, 1997).

După cum se întâmplase şi în cazul primului război mondial, al doilea război mondial are, deasemenea, drept consecinţă o dezvoltare semnificativă în construirea şi aplicarea testelor. Pentruselecţionarea personalului militar, în Statele Unite s-a dezvoltat Army general classification test(care cuprindea subprobe de lectură, vocabular, raţionament artimetic, calcul artimetic şi relaţiispaţiale), o probă de aplicare colectivă – din motive evidente – şi care a fost aplicată la peste nouămilioane de persoane, în timpul războiului. Între timp, armata britanică optase pentru utilizarea unorprobe de inteligenţă generală (care evaluau factorul g) cu conţinuturi neverbale. Două dintre probelecare s-au utilizat sunt în vigoare şi în prezent: Matricile progresive ale lui Raven şi Testul jocului dedomino al lui Anstey. În definitv, s-ar putea spune că al doilea război mondial a presupus aplicareade teste cea mai numeroasă care s-a făcut până în prezent. Se estimează că în 1944, în ţările aliate,s-au aplicat în jur de şaizeci de milioane de teste la aproximativ douăzeci de milioane de persoane(Pelechano, 1988, apud. Buela-Casaly; Sierra, 1997).

La începutul anilor patruzeci, Hathaway şi Mckinley au prezentat Minnesota multiphasicpersonality inventory (MMPI), construit conform modelului psihometric şi care constituie unadintre cele mai mari contribuţii din domeniul evaluării personalităţii şi al evaluării clinice(Goldstein şi Hersen, 1990b, apud. Buela-Casaly; Sierra, 1997). Apogeul pe care l-a atins aceastăprobă a fost enorm, continuând şi în prezent să fie unul dintre instrumentele cele mai utilizate înpractica clinică.

I.4.6. Perioada de criză a evaluării psihologice

La terminarea celui de-al doilea război mondial, în Europa începe o perioadă de reconstrucţiela toate nivelurile, însă cu o preferinţă în sectorul economic şi în cel al muncii. În acest context,psihologia rămâne într-un plan secund în aşteptarea unei mai bune situaţii economice, producându-

Page 14: Suport Curs Psihodiagnostic

se astfel o creştere a emigrării în Statele Unite – care începuse de dinainte de război – a unorimportanţi psihologi europeni. Fără îndoială, aceasta a constituit o cauză în plus care a contribuit lao dezvoltare majoră a psihologiei în Statele Unite începând cu perioada postbelică. La sfârşitulrăzboiului, Statele Unite se confruntă cu o problemă de integrare a soldaţilor în viaţa civilă.„Dezvoltata” evaluare psihologică specializată pe selecţionarea unor mase mari nu mai era la fel deutilă. Acum era necesară o psihologie orientată spre evaluarea individuală şi spre reabilitare (Buela-Casaly; Sierra, 1997).

Psihologia sovietică din timpul acestor ani nu numai că se consolidase, dar îşi şi desăvârşisecriticile privitoare la teste. Unele dintre aceste critici se rezumă la următoarele puncte (Rubinstein,1981):

a. Dacă două persoane rezolvă sau nu acelaşi test, semnificaţia psihologică a acestui fapt nueste unică, având în vedere că acelaşi rezultat poate fi motivat de procese psihice diferite. Astfel,faptul că un test a fost rezolvat sau nu, nu determină natura internă a actului psihic corespondent.

b. Conform metodei testelor, evaluarea personalităţii derivă numai din evaluarea statistică adatelor externe obţinute de individ ca răspuns la nişte întrebări determinate. Astfel, această metodăse bazează doar pe o abordare mecanică, ce porneşte de la comportament şi se orientează sprepersonalitate. Se încearcă să se stabilească evaluarea personalităţii care se dezvoltă numai cu oprobă, fără a se ţine cont de dezvoltarea individului şi de influenţa educaţiei.

c. Eroarea se accentuează dacă se doreşte stabilirea unui pronostic, pentru aceasta pornindu-sede la presupunerea că nivelul care s-a calculat prin intermediul acestui test într-un anumit grad dedzvoltare va caracteriza şi în viitor persoana evaluată. Potrivit acestei idei, se admite opredeterminare transcendentă a oricărei evoluţii ulterioare a unei fiinţe umane în funcţie decondiţiile oferite şi în mod conştient sau inconştient se neagă posibilitatea de transformare a omului:a adultului prin interacţiunea socială şi a copilului prin intermediul educaţiei.

d. Atunci când se aplică acelaşi test standard la două persoane cu o dezvoltare diferită şi încondiţii diferite, iar în funcţie de rezultatele acestuia, se doreşte să se obţină concluzii referitoare lainteligenţa lor, se comite în mod evident o greşeală, deoarece nu se ţine seama de faptul cărezultatele depind de condiţiile de evoluţie sau dezvoltare. Doi studenţi sau doi muncitori pot sărezolve testele în moduri diferite, deoarece unul dintre studenţi este mai slab pregătit, iar unul dintremuncitori mai puţin versat decât ceilalţi. Însă prin intermediul învăţării, ambii pot să-i întreacă peceilalţi.

e. Faptul că anumite teste pot fi rezolvate de un procent de 75% dintre copii aparţinând unuianumit interval de vârstă şi unui anumit mediu şcolar nu este un motiv pentru a-l considera dreptcriteriu prin intermediul căruia se poate stabili inteligenţa sau dezvoltarea intelectuală a unor copiicare au fost educaţi în condiţii foarte diferite. O astfel de concluzie ar echivala cu a nu considera cărezultatele testului depind de condiţiile de evoluţie a fiinţei umane concrete.

f. Un alt inconvenient este faptul că se utilizează scale standard şi că se încearcă clasificareaindivizilor prin intermediul unor probe în care nu se ţine cont de diferenţele individuale.

g. Trebuie scos în evidenţă şi conţinutul cazuist şi adesea provocator al acestor probe, care, îngeneral, nu iau considerare pregătirea specifică a subiectului în evaluare. Prin formularea unorprobleme care nu au legătură cu învăţarea se consideră, în mod greşit, că se pot obţine concluziireferitoare la capacitatea de învăţare a subiectului.

Page 15: Suport Curs Psihodiagnostic

Toţi aceşti factori au contribuit la o criză pe care Maloney şi Ward (1976, apud. Buela-Casaly;Sierra, 1997) au descris-o drept o perioadă de pragmatism empiric exacerbat şi cu tendinţe spreformulele şi prescripţiile de evaluare sub formă de „cărţi de bucate”. Aceşti autori vorbesc, deasemenea, despre abuzul şi utilizarea fără distincţie care s-a făcut în cazul testelor, precum şi despreinterpretarea lor greşită şi/sau despre lipsa de cunoaştere a semnificaţiei acestora.

Cu toate acestea, orice criză îşi are aspectele sale inovatoare şi pozitive; astfel, în acest contextapar numeroase publicaţii, considerate clasice în prezent, care fac referire la aspectele psihometrice.În 1950, Gulliksen publică The theory of mental test cu scopul de a sistematiza procedurile devalidare a testelor; în 1955 apare lucrarea lui Cronbach şi Meehl Construct validity in psychologicaltests; iar în 1958 se publică prima ediţie a lucrării Psychological testing, de Anastasi (Buela-Casaly;Sierra, 1997).

Într-un efort de a îmbunătăţi calitatea instrumentelor evaluării psihologice, APA creează uncomitet condus de Cronbach responsabil să elaboreze raportul Technical recommendations forpsychological and diagnostic aids din 1954 în care se menţionează necesitatea ca testele să fieînsoţite de un manual cu informaţii despre interpretarea rezultatelor, validitate, fiabilitate,administrare etc. (Rogers, 1955)

Criza externă a evaluării psihologice îşi atinge punctul culminant în mişcarea antiteste care aavut loc în Statele Unite în anii cincizeci şi, mai ales, în anii şaizeci. Realitatea era că, în ciudafaptului că primii psihometrişti au utilizat testele cu intenţia ca toţi oamenii să aibă şanse egaleexclusiv în funcţie de capacitatea lor, aceste proceduri de evaluare au favorizat până la urmă claseledominante şi privilegiate. În curând, această discuţie a trecut din cercurile ştiinţifice în viaţacitadină. Astfel, se produc fapte remarcabile precum arderea protocoalelor într-o şcoală din Texas,în 1959, interzicerea utilizării probelor psihologice în statul California şi în şcolile din New York(Buela-Casaly; Sierra, 1997). Conform părerii lui Blanco (1986 b, apud. Buela-Casaly; Sierra,1997), această revoltă antiteste a fost rezultatul a patru factori diferiţi: limitările reale atât tehnice(conceptuale, metodologice şi instrumentale) cât şi umane (lipsa de cunoştinţe, greşeli sau erori),abuzurile comise într-o administraţie nediscriminată şi neadecvată de probe, reacţiile defensive alesocietăţii în faţa unor instrumente care i-ar putea viola intimitatea şi, în ultimul rând, criticilederivate dintr-o prezentare nepotrivită a rezultatelor procesului de diagnosticare; adică, nu tehnicaînsăşi, ci utilizarea sa inadecvată poate duce la riscuri.

Capitolul IICÂTEVA CLARIFICĂRI CONCEPTUALE

II.1. Evaluarea şi măsurarea în psihologie

Evaluarea psihologică este un proces care vizează descoperirea manifestărilor realităţii,având drept scop aprecierea individului în legătură cu una sau mai multe probleme specifice:funcţiile intelectuale, aptitudinile speciale, comportamentul, diferite variabile emoţionale şi sociale.

După Albu (2000), evaluarea reprezintă “operaţiile de culegere de date despre una sau maimulte caracteristici ale unui obiect şi de prelucrare a acestora, având ca rezultat o descriere aobiectului în termeni cantitativi şi/sau calitativi”.

Evaluarea se desfăşoară în doi paşi: mai întâi se culeg date despre obiectul care trebuieevaluat, folosind un fundament sau o metodă, apoi, pe baza acestor date se formulează aprecierilecomparând valorile variabilelor pentru fiecare obiect cu cele ale altor obiecte sau cu standardelefixate.

Page 16: Suport Curs Psihodiagnostic

“A măsura” (DEX, 1984) înseamna “a determina cu instrumente sau cu aparate de măsură,cataloage, etc. valoarea unei mărimi”.

În psihologie, a măsura înseamnă a atribui numere unor fenomene, potrivit unor regulideterminate, astfel încât atributele persoanelor să fie corect reflectate prin proprietăţile numerelor.

Măsurarea în psihologie reprezintă aşadar primul pas în evaluarea psihologică, deci esteinclusă în aceasta.

Măsurarea în psihologie se realizează prin metode psihometrice care vor fi prezentate încapitolul III (Metode de bază în evaluarea psihologică).

II.2. Noţiunea de psihodiagnoză

Evaluarea în psihologie se numeste psihodiagnoză.Albu (2000) defineşte psihodiagnoza ca întreaga acţiune de evaluare a unei persoane în

privinţa unor caracteristici psihice, a conduitelor şi/sau a performanţelor sale, fie pentru a leidentifica pe cele care îi sunt specifice (sunt mai pronunţate sau din contră, mai puţin pronunţatedecât restul, ori au alte valori decât cele obişnuite în populaţia din care face parte persoana), fiepentru a descoperi cauzele care au făcut ca prin unele aspecte individul respectiv să se deosebeascăde celelalte persoane.

Concluziile formulate la sfârsitul psihodiagnozei constituie psihodiagnosticul.Scopul psihodiagnozei este stabilirea ştiintifică a caracteristicilor psihologice ale persoanei.

Această cunoaştere are un caracter deductiv deoarece pentru a desprinde caracteristicile psihologiceale persoanei (care sunt interne) se porneşte de la conduitele şi acţiunile acesteia (care sunt externe).

Izvoarele cunoaşterii psihologice sunt datele brute, adică: reacţiile fiziologice şi vegetative,reacţiile verbale, numărul de răspunsuri corecte, timpul de reacţie, etc.

Această cunoaştere se realizează prin metode nepsihometrice şi metode psihometrice.Evaluarea psihologică are o valoare relativă dacă se iau în considerare doar aspectele

cantitative ale performanţelor obţinute prin teste sau chestionare.Deseori se pledează în favoarea testelor ca metode obiective de cunoaştere dar acestea pot fi

eficiente doar dacă se îmbină cu măiestria şi competenţa specialistului.Pentru a ajunge la un psihodiagnostic corect, specialistul apelează la mai multe surse de

informare pe care le interpretează corelativ. După Albu (2000), acestea ar fi: comportamentulsubiectului (cel mai adesea în timpul examenului psihologic), limbajul corpului, scorurile la testeleşi chestionarele psihologice, anamneza (cunoaşterea evenimentelor mai importante din viaţa uneipersoane), interpretările persoanei despre diferite situaţii trăite.

II.3. Test şi testare psihologică

Testele sunt instrumente de măsură în evaluarea psihologică şi fac parte din metodelepsihometrice alături de chestionare. Testul este probă, procedură, procedeu sau instrument standardizat; itemii săi servesc dreptstimul pentru producerea şi măsurarea unui eşantion de comportament. Scorul testului va fi apreciat prin raportarea şi compararea cu o populaţie de referinţă, testatăîn condiţii identice, în raport cu care s-a construit sistemul de apreciere (barem, etalon, norme,categorii tipologice); Funcţia testului este în acelaşi timp diagnostică (apreciază starea de fapt), dar şi prognostică(anticipează categorii de comportamente mai importante decât cele măsurate efectiv); Pentru a fi cu adevărat util, testul psihologic trebuie să aibă calităţi psihometrice specificate(fidelitate, validitate, sensibilitate sau forţă de discriminare).

Page 17: Suport Curs Psihodiagnostic

Testarea psihologică este procesul de administrare, cotare şi interpretare a rezultatelor unuitest psihologic. Ea reprezintă doar o etapă în evaluarea psihologică.

Capitolul IIIMETODE DE BAZĂ ÎN EVALUAREA PSIHOLOGICĂ

III.1. Noţiunea de metodă în psihologie

Avându-şi originea în cuvântul grecesc “methodos” (cale, drum de urmat), metoda înpsihologie poate fi considerată drept calea pe care cercetătorul o urmează în demersurile saleştiinţifice în vederea obţinerii de date şi a prelucrării lor.

Zlate (2000) defineşte metoda ca fiind “... calea, itinerariul, structura de ordine sauprogramul după care se reglează acţiunile practice şi intelectuale în vederea atingerii unui scop”.

Deoarece o evaluare psihologică complexă îmbină mai multe metode pentru culegereainformaţiilor despre persoana evaluată, vor fi prezentate în continuare atât metodele psihometricecare folosesc ca instrumente chestionarul sau testul cât si metode nepsihometrice cum suntobservaţia sau interviul.

III.2. Metode nepsihometrice

III.2.1. ObservaţiaCuvântul observaţie provine din latinescul “observare” care înseamna “a privi”, “a fi atent

la”.Zlate (2000) defineşte observaţia ca “urmărirea intenţionată şi înregistrarea exactă,

sistematică, a diferitelor manifestări comportamentale ale subiectului ca şi a contextului situaţionalal comportamentului.

Observaţia, deşi are un caracter de non-invenţie, nu se reduce la simpla “lectură” a faptuluibrut, ci se prelungeşte într-un act de clasificare, de încadrare a informaţiei în anumite concepte şi deanticipare a unor relaţii (Radu,I.şi colab., 1993).

Din perspectiva evaluării psihologice, interesează observaţia focalizată pe aspecte specifice,în acest caz înregistrarea rezultatelor observaţiei realizându-se cu ajutorul unor grile de observaţiecare îi asigură un caracter sistematic.

Este util (atunci când este posibil) ca testarea psihologică să fie însoţită de observarea atentăa comportamentului subiectului în timpul testării, iar interpretarea rezultatelor să se facă corelativcu cea a comportamentelor observate, prin găsirea de semnificaţii. Un rol important îl are aiciexperienţa proprie a observatorului.

III.2.2. ConvorbireaComparativ cu metoda observaţiei, convorbirea permite sondarea mai profundă a vieţii

interioare a subiectului. Informaţiile pe care cercetătorul urmăreşte să le obţina sunt referitoare lamotive, aspiraţii, trăiri afective, interese (Cosmovici, 1996). Cel care utilizează metoda convorbiriiîn evaluarea psihologică trebuie să câştige încrederea subiecţilor şi să asigure un climat destins, deîncredere reciprocă. Specific acestei metode este schimbarea locului şi rolurilor partenerilor (celcare a întrebat poate să şi răspundă, cel care a răspuns poate să şi întrebe)(Neveanu,P.;Zlate,M.;Creţu,T., 1993).

Page 18: Suport Curs Psihodiagnostic

III.2.3. Ancheta pe bază de interviuAncheta pe bază de interviu este foarte asemănătoare cu metoda convorbirii, presupunând

raporturi verbale între participanţi, în scopul obţinerii unor informaţii. De obicei interviul estedinainte structurat, întrebarile fiind deţinute dinainte şi în acest fel capătă o amprentă oarecumoficială. Spre deosebire de metoda convorbirii, în ancheta pe bază de interviu fiecare participant îşipăstrează rolul de emiţător sau de receptor.

III.2.4. Anamneza (Metodă biografică)Anamneza vizează cunoaşterea “istoriei personale” a fiecărui individ, necesară în stabilirea

profilului personalităţii sale şi în explicarea comportamentului actual al persoanei.Metoda se concentrează asupra succesiunilor diferitelor evenimente din viaţa individului, a

relaţiilor dintre evenimentele-cauză şi evenimentele-efect, dintre evenimentele-scop şievenimentele- mijloc.

Pentru a pătrunde în esenţa vieţii unui individ şi a o explica, investigaţia trebuie adâncitătreptat, trecând de la evenimentele externe, formale, superficiale, la cele interne, psihologice, deconţinut.

III.3. Metode psihometrice

III.3.1. Concepte fundamentale în măsurarea psihologică

III.3.1.1. Variabile statisticeAnaliza statistică a unei populaţii se face pornind de la însuşirile ei. O însusire care poate fi

urmărita la toate unităţile statistice din populaţia investigată se numeşte caracteristică statistică.Valorile pe care le ia o caracteristică statistică se numesc modalităţi. Modalităţile statistice

sunt stabilite de cercetător în funcţie de scopul investigaţiei. De exemplu caracteristica statistică“vârstă” poate fi exprimată prin ani împliniţi, intervale de vârsta, etc.

O caracteristică pentru care în populatie există o singură modalitate se numeşte constantă.O caracteristică pentru care în populaţia statistică există cel puţin două modalităţi se numeşte

variabilă statistică.Pentru ca o variabilă să poată fi utilizată (de exemplu atunci când se doreşte construirea unui

test pentru măsurarea variabilei respective), ea trebuie definită operaţional, adică trebuiesc precizatetoate activităţile concrete pe care cercetătorul le face pentru măsurarea ei.

În psihologie nu se măsoara persoanele, ci anumite caracteristici ale persoanei, care pot ficonstante (inteligenta) sau variabile (motivaţia).

Atribuirea de numere (măsurarea) este posibilă doar printr-o cale indirectă, utilizând o scalăde măsurare a comportamentelor.

III.3.1.2. Scale de măsurăDin punct de vedere matematic, măsurarea este funcţia care atribuie fiecărui element din

mulţimea de persoane/obiecte (numite mulţime de definiţie) un număr şi numai unul (din mulţimeaîn care funcţia ia valori) numit măsura elementului, conform unei anumite reguli.

Fiecare sistem de reguli defineşte câte un tip de măsurare sau câte un tip de scală. În practicapsihologică sunt utilizate patru tipuri de scale: nominale, ordinale, de interval şi de raport.

Scalele nominaleMăsurarea pe o scală nominală poate fi realizată ori de câte ori caracteristica studiată

permite împărţirea în clase de elemente echivalente. Specific ei este relaţia de echivalenţă. Oricaredouă submulţimi ale unei clase nu trebuie să se intersecteze.

Page 19: Suport Curs Psihodiagnostic

Un exemplu ar fi variabilele referitoare la sexul persoanelor. O clasă are 31 de elevi din care14 băieti şi 17 fete.

Măsura unui element este doar o etichetă şi serveşte pentru denumirea acestuia. Nu esteposibilă realizarea unei analize statistice în afara modului şi a frecvenţelor.

Scalele ordinaleMăsurarea pe o scală ordinală realizează ierarhizarea claselor. Aceste scale presupun o

relaţie de echivalenţă şi o relaţie de ordine între elemente, dar deşi clasele sunt ordonate, distanţadintre ele nu poate fi estimată.

De exemplu muncitorii unei secţii sunt ierarhizaţi în funcţie de randamentul lor, de la celmai eficient la cel mai puţin eficient, fară a se cunoaste distanţa exactă dintre ei. Statistic, pot ficalculate centilele şi mediana sau coeficientul de corelaţie al lui Spearman, iar grafic putem realizahistograme.

Scalele de intervalMăsurarea pe o scală de interval presupune o unitate de măsura comună şi constantă.

Caracteristic scalelor de interval sunt: relaţia de echivalenţă, relaţia de ordine şi cunoaştereadistanţei dintre clase (deoarece se stabileşte un punct 0 arbitrar).

De exemplu, măsurarea inteligenţei se realizează pe o scală de interval.Măsurarea pe o scală de interval permite utilizarea celor mai numeroşi indici statistici

(medie, abatere standard, coeficienţi de corelaţie) precum şi reprezentarea grafică prin histograme şipoligoane de frecvenţă.

Scalele de raport (sau de proporţii)Posedă proprietăţile scalelor de interval dar au un punct 0 nonarbitrar (adică se poate aprecia

în mod obiectiv când un element este lipsit de caracteristica studiată). În psihologie măsurarea nu serealizează pe scale de proporţii deoarece nu exista puncte 0 nonarbitrare (absenţa absolută ainteligenţei, a capacităţii perceptive, a motivaţiei, etc.).

III.3.1.3. Indici statistici de startÎn situaţia tipică a testării psihologice, ne interesează poziţia unui individ în cadrul unui grup

mai larg. Interpretarea măsurii unei cote depinde de cunoaşterea poziţiei relative a ei într-un grup dereferinţă. Acest lucru presupune strângerea prealabilă de date asupra acestei colectivităţi şiîntocmirea unui tabel de norme, adică a unui etalon (Radu,I.şi colab., 1993).

Ordonarea şi gruparea datelorDatele brute obţinute în urma unei testări în vederea construirii unui etalon sau a calculării

indicilor de fidelitate sau de validitate, sunt transcrise informatic şi devin fişier de date (bază dedate). Aceste date brute pot fi numărul de răspunsuri corecte la un test sau răspunsurile tuturorsubiecţilor testaţi, la fiecare item.

Ca prim pas se urmăreşte modul de organizare al datelor, distribuţia lor. Graficul de bazăeste histograma care ia cel mai frecvent trei forme: distribuţie simetrică, distribuţie asimetrică şidistribuţie în formă de i sau j. Forma disribuţiei ne ghidează spre prelucrările statistice pe care levom face în continuare. Pentru distribuţie normală se calculează media, dispersia şi abatereastandard, pentru distribuţie asimetrică se determină mediana, iar pentru distribuţiile în formă de isau j se determină modul, respectiv frecvenţa.

Semnificaţia mediei şi a abaterii standardCu ajutorul programelor de prelucrare statistică se calculează tendinţa centrală a datelor

(media, mediana, modul). Dispersia (variaţia) şi abaterea standard indică organizarea interioară a

Page 20: Suport Curs Psihodiagnostic

distribuţiei, adică împrăştierea datelor în jurul mediei, oferindu-ne informaţii despre variabilitateagrupului studiat.

În psihologie nu putem lucra pe întreaga populaţie ci doar pe un eşantion reprezentativextras din acea populaţie. Dar, extrapolând indicii eşantionului la populaţie comitem o anumităeroare a cărei valoare trebuie să fie cât mai mică.

“m” reprezintă media în populaţie iar media în eşantion. S-a stabilit ca ± 1.96 Γ în raportcu media acoperă 95% din rezultate iar 5% cad în afara acestui interval (câte 2.5% de o parte şi dealta spre extremităţile grupului), iar 99% din rezultate sunt cuprinse în intervalul m ± 2.58 Γ în timpce 1% sunt exterioare acestui intreval.

Pentru a evalua eroarea ce o comitem când luăm drept bază media eşantionului m în loculmediei adevărate a populatiei m (pe care nu o putem practic determina), se calculeaza eroareastandard a mediei E cu formula E= .

Riscul de a greşi atunci când facem o afirmaţie se numeşte prag de semnificaţie. Intervalul( – 1.96E; + 1.96E) se numeşte interval de încredere la pragul de semnificaţie de 0.05 ceea ceînseamnă că riscul ca adevărata medie în populaţie să cadă în afara intervalului este de 5%, iarintervalul ( – 2.58E; + 2.58E) este interval de încredere la p=0.01.

Cotele (scorurile) standardUn scor standard este un scor care a fost transformat dintr-o scală în alta, ultima fiind una pe

baza căreia se pot face comparaţii. Cele mai cunoscute sunt scorurile z şi T.Scorul z are o distribuţie etalon în care m=0 si Γ=1. Transformarea variabilei brute x se face

pe baza formulei: z= .

În tabelul legii normale reduse, trebuiesc reţinute două repere: pentru |z|=1.96 citim 0.05 iarpentru |z|=2.58 citim 0.01.

Scorurile T au o distribuţie a cărei medie este 50 iar abaterea standard este 10.Scorul care se gaseste la 5Γ sub medie este un scor T=0 iar 5Γ peste medie va fi 100.

Avantajul la scorurile T este că nu au valori negative.

III.3.2. Chestionarul psihologic

Holban şi colab.(1978) definesc chestionarul ca o “investigaţie în fondul intim al individuluipentru dezvăluirea motivelor, opiniilor, atitudinilor, intereselor acestuia, incursiune care se bazeazăpe o succesiune logică şi psihologică de itemi adresaţi persoanei şi ale căror răspunsuri suntconsemnate în scris”.

Se prezintă astfel şi o clasificare a chestionarelor în chestionare de opinii şi atitudini,chestionare de interese, chestionare motivaţionale şi la care pot fi adăugate chestionarele depersonalitate (de exemplu Inventarele Minnesota).

Un chestionar este un ansamblu de întrebări scrise sau de imagini alese şi aranjate astfelîncât să servească obţinerii de informaţii despre o temă fixată, care au rolul de a determina dinpartea celui care răspunde un comportament verbal sau non-verbal ce se înregistrează în scris.(Albu, 2000)

Construirea unui chestionar presupune o muncă laborioasă prin parcurgerea mai multoretape:

- stabilirea temei (obiectului) chestionarului- documentarea cu privire la obiectul respectiv- stabilirea ipotezelor- selectarea eşantionului

Page 21: Suport Curs Psihodiagnostic

- aplicarea pilot a chestionarului pentru a vedea dacă a fost bine elaborat- definitivarea chestionarului- administrarea chestionarului- recoltarea şi analiza datelor obţinute- stabilirea concluziilor având în vedere ipotezele formulate

După Albu (2000), elementele componente ale unui chestionar sunt consemnele (adicăinstrucţiunile şi informaţiile date persoanelor care răspund la chestionar şi care sunt prezentate într-o manieră identică tuturor subiecţilor) şi întrebările sau imaginile.

După tipurile întrebărilor cuprinse în chestionar putem distinge: chestionare cu întrebariînchise (răspunsurile sunt furnizate dinainte, subiectul trebuind să aleagă), chestionare cu întrebărideschise (subiectul are deplina libertate de a răspunde dar răspunsurile sunt dificil de analizat dinpunct de vedere calitativ) şi chestionare cu întrebări mixte.

III.3.3. Testul psihologic

III.3.3.1. DefiniţieÎn DEX (1984) prin test se înţelege proba prin care se examinează în psihologia

experimentală unele aptitudini fizice şi psihice ale unei persoane; materialul (fişe, tablouri, scheme)cu care se face aceasta probă.

Anastasi (1976) definea testul ca o măsura obiectivă şi standardizată a unui eşantion decomportament.

Cronbach (1970) spunea despre test că este un procedeu sisematic pentru observareacomportamentului unei persoane şi a cărui descriere se face pe baza unei scale numerice sau a unuisistem categorial.

O definiţie complexă a testului este dată de Aurel Stan (2002): “procedeu standardizat deinvestigaţie psihodiagnostică punând în evidenţă, prin diferite modalităţi de stimulare a subiecţilor,comportamentele relevant psihodiagnostice, exploatabile informaţional, pe baza comparăriirezultatelor obţinute cu cele aparţinând unor eşantioane reprezentative de persoane aflate într-osituaţie de examinare identică şi care foloseşte, în descrierea si explicarea concluziilor, termeniştiinţifici specifici teoriei pe care se bazează construcţia sa“

III.3.3.2. Caracteristicile testului psihologic1. Este un instrument de evaluare a comportamentului, alături de alte instrumente ale

metodei experimentale. El serveşte la măsurarea unor atribute psihice sau/ şi predicţia unorcomportamente.

2. Este un instrument standardizat. Standardizarea se referă la modalitatea deadministrare, cotare şi raportare la etalon. Standardizarea testului implică astfel un proces deobiectivizare şi uniformizare cu privire la aceste etape ale testării psihologice.

3. Este alcătuit dintr-o colecţie de itemi sau stimuli specifici care generează o reacţiespecifică din partea subiecţilor testaţi. (Stan, 2002)

4. Vizează un eşantion de comportament. Dacă un psiholog doreşte să evaluezevocabularul unui copil sau aptitudinile sale aritmetice, va trebui să îşi aleagă din totalitateacomportamentelor disponibile câteva reprezentative pentru a le include într-o probă psihologică.

5. Are ca scop evidenţierea unor comportamente “relevant diagnostice” princompararea rezultatelor obţinute cu cele reprezentând eşantioane reprezentative de persoane.

Testele psihologice sunt utilizate în general pentru a stabili un diagnostic psihologic, pentrua face aprecieri şi predicţii referitoare la subiecţi şi pentru a lua decizii asupra persoanelor în cadrulunei evaluări psihologice.

Page 22: Suport Curs Psihodiagnostic

III.3.3.3. Clasificarea testelor psihologiceAlbu (2000) prezintă o clasificare a testelor psihologice astfel:

· după modul de executare a sarcinii de către subiect:o teste oraleo teste scrise (creion – hârtie)o teste de performanţă (cu manipulare de obiecte şi piese sau teste administrate de

calculator)· după gradul de utilizare a limbajului în rezolvarea sarcinii:

o teste verbale (teste de vocabular sau de rafinament verbal)o teste non-verbale (de exemplu completarea unor figuri lacunare)

· după numărul de persoane care pot fi examinate simultan:o teste individualeo teste colective

· după timpul de execuţie a sarcinii:o teste cu limită de timpo teste cu timp de lucru nelimitat

· în funcţie de comportamentele evaluate de itemii lor:o teste cognitive:

§ teste de aptitudini§ teste de succes educaţional

o teste afective:§ chestionare de personalitate§ tehnici proiective§ teste obiective de personalitate

· după modul de stabilire a cotei la test:o teste obiective (cotarea răspunsurilor se face după o regulă prestabilită)o teste subiective (folosite în psihologia clinică şi care permit ca mai mulţi evaluatori

să coteze foarte diferit răspunsurile aceleiaşi persoane, testele proiective făcând partedin această categorie)

· după modul în care se interpretează scorurile testelor:o teste normative (scorul individual se interpretează prin raportare la un etalon)o teste centrate pe criteriu (în care de la început a fost stabilit nivelul acceptat de

performanţă, iar rezultatul este exprimat prin “a reuşit” sau “nu a reuşit”)o teste idiografice (presupun completarea aceleiaşi forme a chestionrului în ocazii

diferite pentru a vedea evoluţia în timp a scorului)o teste ipsative (presupun interpretarea scorurilor pentru un subiect prin compararea

între ele sau prin compunerea scorurilor altor persoane. Un exemplu este testul deinterese profesionale în care subiectul trebuie să aleagă afirmaţia care i se portiveştecel mai mult şi/ sau informaţia care i se potriveşte cel mai puţin)

III.3.3.4. Funcţiile testelor psihologice

Orice test are o funcţie diagnostică şi una prognostică, valoarea lor depinzând de scopul pentru carea fost creat instrumentul respectiv. Dar, aşa cum apreciază Anne Anastasi, de multe ori predicţia sebazează pe diagnosticul unui potenţial sau al unei capacităţi: ”nici un test psihologic nu poate facemai mult decât să măsoare un comportament. Dacă un asemenea comportament poate servi ca unindicator efectiv al altui comportament, acesta poate fi determinat numai prin cercetare empirică” aitemilor.

Page 23: Suport Curs Psihodiagnostic

III.3.3.5. Domenii de utilizare a testelor psihologiceDintre domeniile de aplicabilitate ale testelor psihologice pot fi amintite: psihologia clinică,

psihologia şcolară, consilierea psihologică, psihologia muncii sau neuropsihologia.În psihologia clinică, cel mai adesea este vizată evaluarea psihopatologiei mai ales prin

probe proiective şi chestionare de personalitate. Printre probele cele mai aplicate în psihologia clinicăse numără testele Roschach, Szondi, Lusher, TAT (Thematic Aperception Test), chestionarul Eysenck,Schmiescheck, inventarul MMPI (Minnesota Multifazic Personality Inventory). Evaluarea inteligenţeieste un alt aspect vizat în psihologia clinică. Psihologul clinician intervine diagnostic şi terapeutic în:· Aprecierea normalităţii/ anormalităţii dezvoltării neuropsihice a copilului şi adolescentului (clinica

pediatrică).· În investigarea dezordinilor de personalitate, a stărilor reactiv-anxioase, a tentativelor de suicid sau

a stărilor de criză.· În comportamentul deviant, asocial, antisocial sau delictual.· În pervertirea instinctelor alimentare (anorexie, obezitate, bulimie).· În aprecierea dezordinilor neurologice sau psihiatrice, calculul indicelui de deteriorare, ca şi în

recuperarea unor funcţii mintale pierdute total sau parţial.· În diagnoza şi recuperarea problemelor aduse de involuţie, sau de patologia asociată îmbătrânirii.· În expertizarea capacităţii de muncă sau a deficienţelor de intelect pentru acordarea certificatelor de

persoană handicapată.

În psihologia şcolară, prin aplicarea testelor psihologice, este vizată evaluareamaturităţii şcolare, evaluarea progresului în procesul informativ – educativ, evaluarea potenţialului deînvăţare, evaluarea copiilor cu cerinţe speciale. Prima arie în care s-a produs dezvoltarea şi utilizareatestelor mentale (pentru a respecta termenul propus de Cattell) a fost câmpul educaţional, şcoala, prinbateria creată şi publicată de Binet şi Simon în 1905. La aproape un secol de la lansarea primei Scalemetrice a inteligenţei, şcoala rămâne în continuare marele beneficiar al psihodiagnozei. Utilizareaacesteia pe terenul educaţiei are funcţii complexe:· Depistarea copiilor cu o subdotare intelectuală (debilitate mintală, intelect de limită), sau cu alte

caracteristici neuropsihiatrice, pentru a li se crea condiţii favorabile de tratament psihopedagogicdiferenţiat, prin şcoli speciale sau prin integrare în învăţământul de masă.

· Depistarea supradotaţilor, pentru instituirea unei pedagogii a excelenţei (curriculum diferenţiat).· Diagnosticarea problemelor de învăţare şi a celor comportamentale (de conduită), pentru a stabili

programe educaţionale adecvate (“educaţia pe măsură”).· Selecţia educaţională prin teste standardizate la colegii sau universităţi (nu ca o procedură unică, ci

în asociere cu altele, cum ar fi scrisorile de recomandare, mediile din timpul anilor de studiu laanumite discipline şcolare, interesele elevului în afara şcolii etc.).

· Testele educaţionale (docimologice sau de cunoştinţe), pentru a verifica fie gradul de atingere alobiectivelor operaţionale, fie pentru a face un diagnostic –local, regional sau naţional – alînvăţământului însuşi ca sistem, fie pentru a detecta cunoaşterea minimă prin posesia căreia sepoate face o certificare a educaţiei primite într-un ciclu sau tip de şcoală.

Prin intermediul psihodiagnosticului şcolar se poate asigura personalizarea învăţământului şitratarea diferenţiată a elevilor, determinarea nevoilor de educaţie, orientarea şcolară şi profesională,selecţia elevilor pentru programe speciale, determinarea potenţialului de învăţare şi promovareametodelor de diagnostic formativ, controlul şi autocontrolul procesului educativ, surprindereaelementelor motivaţional-afective legate de învăţare, radiografierea grupului şi a dinamicii sale etc.Credem că zona celei mai vaste şi mai fructuoase întâlniri dintre ştiinţa testelor (psihometria) şi ştiinţaexaminării (docimologia, doxolgia sau docimastica) este cel al evaluării. Chiar randamentuil şcolar, caraport dintre aptitudinile, interesele elevului şi gradul de acoperire al obiectivelor operaţionale,

Page 24: Suport Curs Psihodiagnostic

exprimate prin calificative, note sau medii şcolare, este locul unde testarea psihologică şi ceaeducaţională se întâlnesc în modul cel mai fericit.

În consilierea psihologică se urmăreşte evaluarea aptitudinii, evaluarea comportamentuluisocial sau evidenţierea intereselor în scopul orientării şcolare şi profesionale.

Cum ar putea fi acest copil mai puţin conflictual în grup? Ce carieră ar fi cea mai potrivităpentru persoana X? Ce activităţi i s-ar putea recomanda după pensionare lui Y, pentru a se potrivicu structura sa cognitivă şi cu interesele sale? Cum ar putea depăşi solicitările prea stresante opersonalitate de tip A, pentru a preveni un infarct? Sunt doar câteva din întrebările la care poaterăspunde psihodiagnoza în domeniul consilierii.

În psihologia muncii, cu ajutorul testelor, psihologul urmăreşte:· să evalueze forţa de muncă, pentru a face o selecţie în domeniul profesiunilor;· să prevină fluctuaţia forţei de muncă şi accidentele de muncă;· să avizeze periodic activităţile cu risc (lucrul la înălţime, portul de armă etc.);· să ofere criterii valide de promovare şi să ajute la construirea carierei;· să identifice structura aptitudinală, cea a factorilor de personalitate şi a intereselor pentru a ajuta

la reprofesionalizare şi la reconversie profesională;· să asiste tehnic reciclarea şi reprofilarea într-o lume în care schimbarea devine condiţia sa

permanentă;· să contribuie la ameliorarea climatului de muncă prin cunoaşterea dinamicii grupurilor.

În neuropsihologie, testele se folosesc pentru evaluarea leziunilor cerebrale.

III.3.3.6. Surse de eroare în testarea psihologicăOrice scor la un test psihologic este rezultatul unui scor real şi al unei erori pe măsură.

Măsura în care scorurile la un test exprimă de fapt valorile reale ale contextului măsurat presupunecalcularea fidelităţii testului respectiv, dar acest lucru va fi analizat la momentul potrivit.

Situaţia ideală, dar niciodată întâlnită în practică, este absenţa erorii. Cele mai frecventesurse de erori în testarea psihologica ar putea fi sintetizate astfel:

· caracteristici stabile ale persoanei (altele decât cele măsurate):o abilitatea generală a înţelegerii instrucţiunilor (dată de nivelul intelectual);o deprinderi de rezolvare ale testelor;o cunoaşterea de către subiect a răspunsurilor la unii itemi;o deprinderi specifice care pot influenţa modul de rezolvare a testului în cauză (de

exemplu deprinderea în jocurile sega sau pe calculator influenţează performanţa întestele de atenţie);

· caracteristicile situaţiei în care are loc testarea:o caracteristicile temporare ale persoanei: starea de sănătate, oboseala, motivaţia,

tensiunea emoţională;o condiţiile fizice ale administrării testului (de căldură, luminozitate, etc.);o interacţiunea dintre personalitatea examinatorului şi cea a subiecţilor;o factori de distragere a atenţiei (un zgomot neaşteptat, etc.) ;

· caracteristici ale testului folosit:o probabilitatea ghicirii răspunsurilor la itemii cu alegere multiplă;o modul de administrare al testului (pe calculator sau creion – hârtie);o greşeli în formularea unor itemi (itemul este ambiguu, nu este înţeles de subiecţi

deoarece conţine neologisme, nu este potrivit populaţiei căreia îi este destinat, etc.).

Page 25: Suport Curs Psihodiagnostic

Capitolul IVPRINCIPII PSIHOMETRICE ALE UTILIZĂRII TESTULUI PSIHOLOGIC

IV.1. Standardizarea şi obiectivitateaStandardizarea este o condiţie fundamentală a testului psihologic, unde orice variaţie a condiţiilorproduce o variaţie a rezultatelor.

Standardizarea se referă la două aspecte:1. interpretarea rezultatelor unui subiect prin raportare la un standard sau etalon, adică la media

performanţelor obţinute la acelaşi test şi în aceleaşi condiţii de administrare de un eşantionreprezentativ de subiecţi;

2. uniformizarea condiţiilor în care are loc examenul psihologic, adică standardizarea tehniciide administrare, cotare şi interpretare a rezultatelor;Obiectivitatea se referă la măsurarea fără ambiguitate a capacităţilor persoanelor, decievaluatori diferiţi trebuie să obţină aceleaşi rezultate la evaluarea unui subiect.Obiectivitatea mai este numită şi concordanţă interpersonală (Stan, 2002) şi este un aspectce ţine de standardizarea testelor psihologice.

IV.2. Fidelitatea

IV.2.1. Definiţie şi noţiuni de bazăAcest principiu psihometric se referă la precizia cu care un test măsoară o caracteristică. Se

spune că un test este fidel dacă atunci când se aplică de mai multe ori în aceleaşi condiţii, rezultatelesunt identice de fiecare dată. Conceptul de fidelitate aplicat la un test este similar cu cel utilizatatunci când facem referire la o armă, care este considerată fiabilă dacă atunci când un bun trăgătortrage cu ea de mai multe ori, reuşeşte să nimerească în acelaşi loc, caz în care se spune că existăprecizie în tragere.

Fidelitatea absolută înseamnă absenţa totală a erorii de măsură, deci scorul obţinut este egalcu scorul real. Dar acest lucru nu se întâmplă niciodată în practică şi atunci vorbim doar desprefidelitatea relativă a unui test.

Deci, orice scor la un test psihologic este rezultatul dintre scorul real şi eroarea de măsură.X = V + E

undeX = scorul măsurat (observat)V = scorul realE = eroarea de măsură

Coeficientul de fidelitate reflectă doar mărimea raportului dintre dispersia scorurilor observate şidispersia erorilor de măsură. În acelaşi fel variaţia dintre scorurile măsurate va fi egală cu variaţiadintre scorurile reale şi variaţia scorurilor eronate.

S2X = S2

V + S2E

Coeficientul de fidelitate are expresia:rxx= , şi ia valori în intervalul [0,1]

Dacă scorul măsurat este egal cu scorul real (deci eroarea este 0), coeficientul de fidelitateva avea valoarea 1.

Dar cum în practică acest lucru nu este posibil, pentru ca un test să fie considerat fideltrebuie să aibă un coeficient de fidelitate mai mare decât 0.70.

Page 26: Suport Curs Psihodiagnostic

Fidelitatea şi eroarea de măsurare

Deoarece fidelitatea nu exprimă valoarea preciziei măsurătorii în aceleaşi unităţi ca şi scorultotal la test (exprimat în note standard), uneori ea este mai greu de interpretat. Acesta este motivulpentru care precizia măsurătorii poate fi indicată şi sub forma unei erori de interpretare a scorului latest, care va fi cu atât mai mică cu cât eroarea de măsurare va fi şi ea mai mică.

Eroarea standard de măsurare (SEM), serveşte la determinarea intervalelor de încrederepentru scorurile reale ale subiecţilor.

Este dată de formula:Se = Sx

unde:Se = eroarea standard de măsurăSx = abaterea standard a scorurilor la testrxx = coeficientul de fidelitate

Când facem o apreciere ştiinţifică ne interesează care este intervalul în care se găseşte scorulreal. Acest interval se numeşte interval de încredere şi este definit de probabilitatea ca scorul real alpersoanei la un test să se găsească între anumite limite.

IC = X ± Z * Se

Scorul Z va fi ales în funcţie de precizia cu care dorim să lucrăm. Dacă alegem să lucrăm cuo probabilitate de a răspunde de 95%, Z = 1.96; pentru o precizie de 99%, Z = 2.58.

Este de reţinut că:· intervalul de încredere depinde de coeficientul de fidelitate al testului; dacă avem coeficienţi

de fidelitate mici, intervalul se măreşte, deci eroarea este mai mare;· intervalul de încredere depinde de abaterea standard a scorurilor la test.

Ca exemplu:

S-a aplicat un test la un număr de subiecţi. Conform rezultatelor obţinute, media scorurilorla test (x) a avut valoarea egală cu 18, abaterea standard egală cu 5 iar coeficientul de fidelitate egalcu 0.90. Ne interesează să aflăm în ce limite s-ar afla adevăratul parametru al populaţiei, tinând contde faptul că se decide la un nivel de încredere de 95%.

Deci:Z = 1.96X = 18Sx = 5rxx = 0.90

Aplicând formulaSe = 5Se = 1.58IC = ± EIC = 18 ± 3.10 deci [21.10; 14.90]

Deci putem afirma cu un risc de a greşi egal cu 5% că media scorurilor la testul aplicat înpopulaţie se va găsi în intervalul [21.10; 14.90].

Page 27: Suport Curs Psihodiagnostic

IV.2.2. Metode de calcul a coeficientului de fidelitateFidelitatea unui test psihologic se referă la două aspecte: consistenţa internă şi stabilitatea în

timp a rezultatelor testării.

Consistenţa internăO bună consistenţă internă a unui test presupune o corelaţie ridicată între itemii testului

respectiv şi exprimă faptul că toate întrebările testului evaluează aceeaşi trăsătură. Metoda careevaluează acest aspect poartă denumirea de metodă consistenţei interne.

Stabilitatea în timp a rezultatelor testăriiNe indică în ce măsură, la aplicări diferite în timp, un subiect obţine rezultate similare la un

test psihologic. Metoda care evaluează acest aspect al fidelităţii unui test se numeşte metodaformelor paralele.

În afara acestor metode care sunt obligatorii pentru evaluarea fidelităţii unui test, se mai potutiliza încă două metode: metoda formelor (testelor) paralele şi metoda fidelităţii interevaluări.

Metoda analizei consistenţei internePot fi calculaţi următorii coeficienţi:

· α Cronbach: pentru textele cu orice tip de itemi şi calculează media tuturor combinaţiilorposibile între itemi.

· Kuder – Richardson α0: este echivalent cu cel al lui Cronbach, însă se utilizează atunci cândîntrebările testului au fost punctate în mod binar, adică cu 1 dacă s-a răspuns corect şi cu 0dacă s-a răspuns greşit.

· Kuder – Richardson 21: se utilizează în loc de formula anterioară atunci când proporţia derăspunsuri corecte nu variaza mult de la un item la altul şi atunci este bine să se utilizezeproporţia medie.

· Guttman sau Spearman – Brown: se folosesc după aflarea corelaţiei între două jumătăţi aletestului cu ajutorul formulei lui Pearson, deoarece rezultatele se referă la un test cu olungime de două ori mai mică decât cea a testului original. Dar având în vedere că numărulde jumătăţi posibile ale unuia este foarte mare şi este foarte greu ca două jumătăţi să fieexact egale, este indicat să se calculeze unul din indicii de consistenţă internă prezentaţianterior.

Kaplan şi Saccuzzo (1993) sesizează foarte întemeiat că toate măsurile care evaluează consistenţainternă determină de fapt gradul în care fiecare item diferit măsoară aceeaşi trăsătură sau abilitate.Acest lucru presupune implicit că testul este omogen, în caz contrar acesta neavând consistenţăinternă. Pentru testele neomogene, procedeul cel mai indicat este analiza factorială, prin care se vorputea subîmpărţi itemii pe grupe omogene, subtestele ce rezultă având fiecare o consistenţă internăridicată, dar fiind relativ independente unul în raport cu celelalte, ca în cazul subscalelor testului deprsonalitate 16PF Cattell.

Aiken (1997) sesizează de asemenea că cele trei procedee de determinare a fidelităţii amintiteanterior supraestimează valoarea acesteia pentru testele în care este implicată viteza. În acest caz,procedurile de apreciere a fidelităţii trebuie modificate, recomandarea făcută fiind aceea de aadministra cele două jumătăţi ale testului în momente diferite, dar cu limită de timp egală, după carese calculează fidelitatea făcându-i-se corecţia cu formula Spearman – Brown.

Page 28: Suport Curs Psihodiagnostic

Metoda test – retestCoeficienţii de stabilitate obţinuţi prin aceeaşi metodă se calculează când testul

măsoară o caracteristică durabilă şi exprimă gradul în care scorurile aceluiaşi subiect la acelaşi testsunt constante de la o aplicare la alta.

Metoda presupune două aplicări identice ale aceluiaşi test cu un interval de timp recomandata fi cuprins între 3 şi 6 luni.

Factori care influenţează calculul fidelităţii test-retest· Intervalul de timp între test şi retest. Dacă timpul este prea scurt există o mare probabilitate

ca subiecţii să îşi reamintească răspunsurile date anterior, respectiv un timp prea lung întretest şi retest poate determina maturizarea eşantionului de subiecţi. Astfel dacă aplicăm untest de percepţie la 4 ani şi îl reaplicăm la un interval de 6 luni există o mare probabilitate săobţinem rezultate diferite la cele două administrări ale testului deoarece în intervalul de 6luni subiectii s-au maturizat. În acest caz, retestul va include în evaluare nivelul dematurizare al subiecţilor. Datorită acestor argumente este de multe ori dificil de stabilit cuexactitate un timp optim între test şi retest.

Întotdeauna când se calculează acest coeficient trebuie precizat intervalul scurs între test şi retest,vârstă subiecţilor precum şi condiţiile în care s-au administrat testele pentru a putea identificaeventualele surse de eroare de măsură.

· Gradul de dificultate al itemilor. Dacă itemii sunt fie prea uşori, fie prea dificili, se vorobţine coeficienţi de stabilitate ridicaţi deoarece itemii testului fie vor fi rezolvaţi demajoritatea subiecţilor (în primul caz) fie nu vor fi rezolvaţi nici la test, nici la retest (aldoilea caz).

· Schimbări ale subiectului determinate de prima aplicare. Pot exista o serie de situaţii în carese obţin performanţe diferite la retest deoarece subiectul fie a învăţat să răspundă la itemidupă prima administrare, fie această primă administrare a determinat schimbări de atitudinifaţă de o anumită problemă.

Metoda formelor paraleleExistă o serie de situaţii practice care necesită aplicări repetate ale unui test psihologic la un

interval foarte scurt de timp. În acest caz, aplicarea aceluiaşi test este improprie deoarece s-a văzutanterior că la un interval scurt de timp subiecţii pot să îşi reamintească răspunsurile date anterior. Înacest caz trebuie să se construiască forme echivalente sau paralele ale unui test. Două teste suntparalele dacă pentru un subiect erorile de măsură la cele două administrări sunt variabile aleatoareindependente. În acest caz itemii celor două teste trebuie sa fie logic izomorfi, adică să aibă acelaşinivel de dificultate.

Avantajul acestei metode este acela că nu mai permite reamintirea răspunsurilor şi niciposibilitatea căutării răspunsurilor la întrebările la care nu s-a ştiut răspunde.

Dezavantajele acestei metode sunt următoarele:- necesită consum de timp prin două administrări;- subiecţii se pot plictisi dacă testările sunt prea lungi;- este greu de realizat fiind dificilă şi costisitoare.

Fidelitatea interevaluatoriEste necesar a fi ca1culată în cazul testelor care nu au o cotare obiectivă aşa cum sunt testele

proiective de personalitate la care scorul este influenţat şi de interpretarea pe care o dă persoanacare face cotarea. Pentru a verifica în ce măsură scorul la test este influenţat de modalitatea în care

Page 29: Suport Curs Psihodiagnostic

se face cotarea de către diferite persoane se va cere la diferiţi evaluatori să ca1culeze scorurile latest, iar apoi se va realiza un coeficient de corelaţie interevaluatori. Acest coeficient va exprimamăsura în care testul este independent de erori datorate modalităţii de cotare a răspunsurilorsubiectului.

Coeficienţii de fidelitate transformaţi în coeficienţi de determinare (pătratul coeficientului defidelitate) relevă proporţia în care varianţa totală a rezultatelor psihometrice se datorează varianţei"reale" - diferenţelor individuale reale - sau din contră, varianţei "eroare", definită diferit, în funcţiede metoda particulară urmată în stabilirea tipului de fidelitate (Kulcsar, 1980). În consecinţă, deşisemnificaţia diferiţilor coeficienţi de fidelitate nu este aceeaşi, totuşi orice coeficient de fidelitate,ridicat la pătrat, poate fi interpretat în termeni de procentaj al varianţei randamentului la test. Astfelde exemplu, un coeficient de fidelitate de .80 înseamnă că .802=64% din varianţa totală arezultatelor psihometrice considerate se datorează varianţei reale a domeniului explorat, iar 36%varianţei eroare, generată de unele din sursele multiple ale deosebirilor în rezultatele psihometrice.

Interpretarea unui coeficient de fidelitateInterpretarea fidelităţii

Răspunsul la întrebarea “cât de mare trebuie să fie fidelitatea unui test?” depinde de utilitatea carese dă acestuia.

O fidelitate de 0,70 – 0,80 este suficient de bună când testul este folosit în scopuri de cercetare.

Se acceptă niveluri scăzute ale fidelităţii atunci când testele se utilizează pentru a lua deciziipreliminare (şi ridicate pentru decizii finale), sau când ele sunt folosite pentru împărţirea grupului însubcategorii, pe baza unor diferenţe interindividuale mari.

Dacă testul serveşte la compararea grupurilor de persoane între ele, coeficienţii de fidelitate de 0,60– 0,70 sunt suficienţi, dar când testul devine o bază de comparaţie între persoane individuale,fidelitatea lui trebuie să fie de la 0,85 în sus.

Când se iau decizii importante pe bază de teste care împart persoanele în categorii, în virtutea unordiferenţe mici (ca în selecţia profesională), fidelitatea acestora trebuie să fie de peste 0,90.

Când decizia priveşte destinul unei persoane individuale, fidelitatea testului trebuie să fie de celpuţin 0,95.

Testele cognitive, şi în special cele de inteligenţă, au o fidelitate foarte mare (peste 0,90), în timp cechestionarele de personalitate rareori depăşesc 0,80. Aplicate colectiv, chiar şi testele cognitivefurnizează coeficienţi de fidelitate mai scăzuţi (circa 0,80). Testele cotate subiectiv, ce măsoarăaptitudini şi testele de cunoştinţe (educaţionale) rareori depăşesc valori ale fidelităţii de 0,80 (Traub,1944). Testele cu alegere multiplă, utilizate colectiv, sunt considerate a avea o fidelitate bună cândaceasta atinge 0,75.

Murphy & Davidshopher (1998) prezinta următoarele repere în interpretarea coeficienţilorde fidelitate (tabelul 1):

Valori ale coeficienţilorde fidelitate Tipul testului Interpretare

0.950.900.850.80

Teste de inteligenţă de grupTeste de performanţă Fidelitate mare

Page 30: Suport Curs Psihodiagnostic

0.750.700.65

Teste cu răspunsuri multipleScalele comportamentale

Fidelitate moderată

0.600.550.50

Unele măsurători proiective Fidelitate scăzută

Scorul real şi eroarea au efectegal asupra scorurilor la test

Factorii care intervin în determinarea fidelităţii

Pentru ca estimarea fidelităţii să fie cât mai precisă, trebuie îndeplinite câteva condiţii(Traub, 1944, apud Albu, 1998):

· Eşantionul să fie cât mai mare, pentru a reduce eroarea standard a repartiţiei, care este inversproporţională cu rădăcina pătrată din numărul subiecţilor ce compun eşantionul.

· Eşantionul să fie reprezentativ pentru populaţia căreia îi este destinat testul, având acelaşi gradde eterogenitate (omogenitatea diminuează valoarea coeficientului de fidelitate).

· Măsurătorile să fie independente între ele, astfel încât măsurătoarea unui examinator să nu oinfluenţeze pe a altuia, iar dacă examenul este colectiv, să nu se poată trişa prin copiere.Independenţa cere ca persoanelor supuse la test – retest să nu li se dea informaţii desprerezultatele examinării precedente, iar itemii să nu se condiţioneze reciproc.

· Toate aspectele de procedură în test şi retest sau la formele paralele trebuie să fie identice.

Creşterea nivelului de fidelitate a unui test până la limita dorită sau cerută de situaţia de utilizareconcretă este posibilă prin creşterea numărului de itemi (care trebuie să fie de acelaşi format şi sămăsoare aceeaşi trăsătură sau acelaşi construct)1. Decizia aceasta angajează un proces lung şicostisitor, pentru că testul nou generat trebuie reevaluat de la început şi uneori se dovedeşte a fi subnivelul de fidelitate aşteptat. De asemenea, crescându-i lungimea, testul devine mai greu de aplicatşi de scorat. Manipulând formula de profeţie a lui Spearman – Brown se calculează un indice demultiplicare a numărului de itemi pentru a atinge fidelitatea dorită: un test de 20 de itemi trebuie săajungă la 56 de itemi pentru a-i creşte fidelitatea de la 0,87 la 0,95 (Kaplan şi Saccuzzo, op. cit., p.127).

Ca o concluzie a acestor consideraţii despre fidelitatea testelor, se relevă faptul că eaeste mai bună pentru teste unidimensionale şi cu număr mai mare de itemi, cât şi pentru testelecognitive şi că ea angajează un studiu analitic al itemilor (analiza de itemi) pentru a le determinaforţa de discriminare. În multe situaţii analiza factorială este metoda cea mai eficientă prin care sepot construi subteste omogene şi unidimensionale.“Fidelitatea este una din fundamentările de bazăale cercetărilor asupra comportamentului. Dacă un test nu este fidel, nu va fi posibil să demonstrămcă el are vreun înţeles”, spun Kaplan şi Saccuzzo (op. cit., p.131). Deci, deşi validitatea pare a fimai importantă, din punct de vedere tehnic studiul ei nu poate începe cu teste care nu îşi dovedesc ofidelitate minimă, acceptabilă, care depinde de scopul în care acestea vor fi utilizate.

IV.3. Validitatea

Page 31: Suport Curs Psihodiagnostic

IV.3.1. Definiţie

Validitatea este unul din conceptele cele mai importante în măsurarea psihologică. O bunăvaliditate reflectă faptul că aptitudinile sau caracteristicile psihologice măsurate de text corespunddomeniului de evaluare, cu alte cuvinte testul măsoară ceea ce şi-a propus.

Anastasi (1976) preciza că “validitatea unui test se referă la cât sunt de potriviteinterpretările descriptive, explicative sau predictive care dedau scorurilor sale.

Conform APA, “validitatea se referă la corectitudinea inferenţelor realizate pe baza unui testsau a unei forme de evaluare.

La analiza definiţiilor, se observă că accentul cade pe încrederea pe care o putem avea îndeducţiile făcute pornind de la scoruri şi luând în considerare întreg procesul prin care s-au obţinutaceste scoruri.

Validarea este procesul prin care se obţin informaţii legate de validitatea unui test.Validitatea este un concept general cu privire la puterea şi corectitudinea inferenţelor care

pot fi făcute pornind de la scorurile unui test şi de aceea nu se poate afirma despre nici un test căare, la modul abstract, o validitate “ridicată” sau “scăzută”. Validitatea acestuia trebuie stabilită înraport cu utilizarea particulară a ceea ce s-a cerut în test.

Clasificarea scolastică în validitatea de construct, validitatea de conţinut şi validitatea decriteriu creeaza unele confuzii şi este mai bine să se folosească sintagma de “tip analiză avalidităţii” propusă de Lawshe (Landy, 1986)

În normele APA se vorbeşte despre validitatea de aspect. Ea nu constituie un criteriuimportant pentru inferenţele făcute pe baza unui test. Este definită ca “ceea ce un test pare a măsura,mai degrabă decât ceea ce măsoară” şi este importantă doar măsura în care influenţează răspunsurilela test în funcţie de modul în care sunt percepuţi itemii.

IV.3.2. Tipuri de analiză a validităţii unui test psihologic

Validitatea de construct

Constructul este o idee “construită” de experţi dintr-un domeniu particular al ştiinţei.Exemple de constructe sunt: “inteligenţa”, “locus of control (poziţia controlului)”, “sociabilitate”,“maturitate şcolara”, etc.

Silva (1993) definea constructul ca “o eticheta pentru o grupare de comportamente carecovariaza”.

Fiecare construct psihologic are la bază o teorie (fiecare test psihologic porneşte de la oteorie) care permite descrierea şi predicţia comportamentelor în situaţii specifice.

Un construct psihologic se caracterizează prin faptul că este o abstractizare a unorregularităţi din natură care nu sunt observabile direct dar pot fi conectate cu evenimente concrete şiobservabile. Multe dintre testele de personalitate măsoară dimensiuni ale acesteia (anxietate, depresie,nevrotism, motivaţie, introversie-extraversie), mai slab definite iniţial şi din ce în ce mai binecircumscrise pe măsură ce teoriile în domeniu au avansat. Conceptualizările progresive ale acestora(dar şi ale inteligenţei, memoriei, creativităţii etc.) au dus la apariţia de constructe tot mai evoluate.

Unele teste sunt construite plecând de la date empirice (ca M.M.P.I. sau Inventarul dePersonalitate California al lui Gough), altele se originează în teorii anterior elaborate oricăreicercetări empirice (Chestionarele de personalitate Cattell sau Indicatorul Tipologic Myers-Briggs).Validitatea relativă la construct verifică, pe de o parte, dacă testul se referă realmente la constructulpe care vrea să-l măsoare, şi apoi dacă scorurile subiecţilor testaţi reflectă corect mărimea acestuiconstruct la persoanele în cauză. Strategia determinării acestui tip de validitate impune un algoritm(vezi Albu, 1998, pp. 165-166). De aceea, în teoria care stă la baza testului psihologic orice

Page 32: Suport Curs Psihodiagnostic

construct trebuie operaţionalizat, adică descris prin comportamente concrete şi observabile şiselecţionat cu alte variabile fiziologice şi psihologice cu care variază.

De exemplu, într-un test care evaluează aptitudinea verbală, conceptul de aptitudine verbalăeste operaţionalizabil prin următoarele comportamente sau acţiuni care se găsesc în itemii testului.

Referitor la relaţiile constructului “aptitudine verbală” cu alte variabile, se pot avea învedere următoarele aspecte:

- scorurile cresc odata cu vârsta- scorurile coreleaza pozitiv cu calificativele obţinute la limba şi literatura română- scorurile sunt predictive ale succesului şcolar

Variabilele la care se face referire sunt: “vârstă”, “calificativ obţinut”, “maturitateşcolară”.

Deoarece variabilele sunt construite pornind de la un şir de raţionamente bazate pe ipoteze şideducţii, acest tip de validitate se mai numeşte şi “validitate ipotetică deductivă”.

Validitatea relativă la construct este verificată şi prin raportarea testului respectiv la alteteste despre care se ştie că evaluează acelaşi construct sau constructe diferite. Verificarea practică aacestui lucru necesită aplicarea metodelor statistice, dintre care metodele corelaţionale sunt cele maiimportante. Poate fi precizată astfel validitatea convergentă şi validitatea discriminativă.

Validitatea convergentă este corelaţia pozitivă a testului validat cu alte teste care măsoarăaceleaşi concepte ca şi testul în cauză.

Validitatea discriminativă este corelaţia nulă cu alte teste despre care se ştie că măsoară alteconstructe decât testul care se validează.

Validitatea convergentă şi discriminativă poate fi examinată în mod simultan prin metodabazată pe matricea “multitrăsături – multimetode” (Multitrait-Multimethod Matrix) care conţinevalorile coeficienţilor de corelaţie liniară între diverse măsurări ale aceloraşi constructe obţinuteprin intermediul a două sau trei instrumente diferite. Procedeul descris aici a fost inventat încă din1959 de Campbell şi Fiske şi este o metodologie importantă pentru înţelegerea procesului devalidare. Se numeşte multidimensională pentru că ia în evaluare două sau mai multe trasături prindouă sau mai multe metode.

Metoda Trăsăturile Metoda 1 Metoda 2 Metoda 3A1 B1 C1 A2 B2 C2 A3 B3 .C3

Metoda 1

Metoda 2

Metoda 3

A1B1C1

A2B2C2

A3B3C3

(.89).51 (.89).38 .37 (.76)

.57 .22 .09 (.93)

.22 .57 .10 .68 (.94)

.11 .11 .46 .59 .58 (.84)

.56 .22 .11 .67 .42 .33 (.94)

.23 .58 .12 .43 .66 .34 .67 (.92)

.11 .11 .45 .34 .32 .58 .58 .60 (.85)

În exemplul dat de Gregory în figura de mai sus, 3 trăsături A, B şi C (Interesele,Creativitatea şi Dominanţa) sunt măsurate cu metodele 1, 2 şi 3 (inventar autoaplicat, evaluareacovârstnicilor şi un test proiectiv). Deoarece fiecare dintre cele 3 trăsături sunt măsurate prin toatecele 3 metode, rezultă de fapt 9 teste, exprimate prin coeficienţii de corelaţie din triunghiurile culinie continuă de pe diagonala mare. Când fiecare dintre aceste teste este administrat a doua oară

Page 33: Suport Curs Psihodiagnostic

aceluiaşi grup de subiecţi şi scorurile fiecărei perechi de teste rezultate prin test-retest sunt corelaterezultă matricea multitrăsătură multimetodă care devine o sursă extrem de bogată de informaţii, atâtpentru fidelitate cât şi pentru validitatea convergentă şi divergentă. Această metodologie este ocontribuţie importantă la înţelegerea procesului de validare, dar reclamă un efort de cercetare uriaş.De aceea cei mai mulţi creatori de teste preferă să culeagă informaţii separate, „pe bucăţi” desprefidelitate şi validitate, pe care să le reunească ulterior într-un tabel compozit, decât o matrice care săle integreze din capul locului pe toate deodată simultan. (Clinciu, A.I., 2005).

Un alt procedeu utilizat pentru evaluarea validităţii de construct este analiza factorială.Această metodă, numită validare factorială, se aplică în cazul testelor care măsoară constructemultidimensionale.

Prin analiza factorială se urmăreşte dacă structura scorului la test reflectă structuradomeniului constructului măsurat. Pentru aceasta se formează grupuri de itemi care corelează întreei, se calculează scorurile acestor grupuri de itemi (scoruri factoriale) şi se presupune că fiecareasemenea scor reprezintă măsura unei variabile.

Când ne propunem să realizăm o analiză factorială, trebuie mai întâi să distingem atributelede suprafaţă şi eroarea de măsură.Atributele interne sunt constructe ipotetice utilizate pentru a explica o serie de fenomene (deexemplu conceptul de ,,magnetism” în fizică). Existenţa lor este inferată pe baza fenomenelerobservabile. Analiza factorială postulează că există factori interni neobservabili care explică variaţiaşi covariaţia dintre o serie de atribute de suprafaţă. Atributele de suprafaţă sunt observabile şi se potmăsura direct.

Factorii interni pot fi specifici (când influenţează doar o singură variabilă de suprafaţă) şicomuni (când influenţează mai multe variabile de suprafaţă).

Factorul eroare de măsură asociat atributelor de suprafaţă constituie alt tip de influenţăasupra acestora. Sursele specifice de eroare în măsurarea psihologică au fost prezentate în capitolullegat de fidelitatea măsurării.

Variaţia observată la nivelul atributelor de suprafaţă rezultă în parte influenţei factorilorcomuni şi specifici care adesea se combină cu variaţia erorii de măsură.

Prin analiza factorială se măsoară şi variaţia variabilelor de suprafaţă. Această corelaţie sedatorează influenţei factorilor comuni.Creatorul analizei factoriale, Charles Spearman (1907) a creat o metodă capabilă să pună înevidenţă existenţa unui factor general al inteligenţei, prezent în orice tip de sarcină mintală (şi deaceea numit şi factor g), în combinaţii diferite cu un factor specific numit s. Procedeul dezvoltat deel, numită metoda componentelor principale, i-a permis să producă dovezi în favoarea ipotezeisale, numită modelul bifactorial al inteligenţei.

În 1928, un creator american în domeniul analizei factoriale, Thurstone, a utilizat aceeaşimetodă ortogonală (două axe aflate în unghi drept, adică independente între ele) dar cu un micamendament: în loc ca o axă să explice varianţa factorului major şi cealaltă varianţa reziduală(varianţa rămasă neexplicată de factorul major) el a propus rotirea celor două axe ortogonale până laobţinerea structurii celei mai simple, ameliorând astfel gradul de adaptare al datelor la structurafactorială. Metoda se mai numeşte şi Varimax deoarece ea caută ca pe fiecare dintre cele două axeortogonale varianţa explicată să fie una maximală. Aceasta face ca fiecare factor să explice un grupde rezultate şi doar atât, căci cu această metodă nu mai poate fi identificat factorul general, ceea cepune în discuţie modelul propus de Spearman.

Din punct de vedere matematic ambele metode sunt valide, dar fiecare are propriile salelimite: una ajută la identificarea factorului general pe care cealaltă îl neagă, dar cealaltă ajută la mai

Page 34: Suport Curs Psihodiagnostic

buna identificare, înţelegere şi numire a factorilor rezultaţi. De aceea utilizarea lor este corelativă.Analiza factorială permite doar verificarea faptului dacă datele sunt consistente cu structurafactorială postulată. Când datele sunt compatibile cu mai multe structuri latente, analiza factorialănu ne ajută să alegem una singură, această alegere fundamentându-se pe baza unei teorii. Într-undemers de validare, analiza factorială ne va aduce deci informaţiile necesare, dar nu şi suficienteluării unei decizii.

Analiza factorială se sprijină pe două postulate de bază:

· postulatul cauzalităţii factoriale: variabilele observate sunt combinaţii lineare de variabilecauzale subiacente;

· postulatul parcimoniei: dintre două soluţii factoriale trebuie să o alegem pe cea mai simplă. Deşilarg acceptată de majoritatea cercetătorilor, nu este posibil de demonstrat că acest postulat estebine fundamentat şi nici nu este valabil faptul că întotdeauna structura cea mai simplă să fie maiplauzibilă decât cea mai complexă.

Oricum, în funcţie de tipul de analiză ales ajungem la soluţii factoriale diferite, iar soluţia finală pecare o alegem nu este una de natură matematică, ci de natură teoretică.

Raportul dintre teorie şi măsurare este cel mai bine surprins prin conceptul de validitate deconstruct sau conceptuală, care este chiar inima operaţionalizării variabilelor. A operaţionalizaînseamnă de fapt a aduce un construct teoretic în situaţia de putea fi surprins şi evidenţiat prinmăsurare. În cazul în care operaţionalizarea unei teorii bune a fost făcută corect, printr-uninstrument corect, capabil să o surprindă, atunci putem formula predicţii sub forma ipotezelor cerezultă din teoria respectivă. Dacă ipotezele se verifică, atunci şi teoria şi operaţionalizarea ei subforma instrumentului de măsură respectiv sunt în regulă. Dacă însă ipotezele nu se verifică, suntposibile două explicaţii alternative:

- instrumentul este bun, dar deoarece teoria nu se verifică, aceasta trebuie schimbată;- teoria este una valabilă, dar instrumentul nu o operaţionalizează corespunzător şi atunci nu

putem dovedi ce ne-am propus şi deci trebuie schimbat chiar instrumentul de măsură.

Validitatea de conţinut

Pornind de la definiţia dată de Anastasi (1968) testului psihologic ca fiind o măsurăobiectivă şi standardizată a unui „eşantion de comportament”, trebuie făcută din start precizarea căacest „eşantion de comportament” trebuie să fie reprezentativ. Pentru a verifica acest lucru, estenecesară o analiză logică a conţinutului testului psihologic pentru a determina dacă acoperă uneşantion reprezentativ de comportamente pe care testul în cauză trebuie să îl măsoare. (Anastasi,1976). Aşa cum reprezentativitatea eşantionului de populaţie ales permite generalizări asuprapopulaţiei–ţintă pe care o reprezintă, itemii testului, prin maniera lor de construcţie şi de selecţie,pot acoperi într-o mai mare sau mai mică măsură domeniul sau universul trăsăturii sau al aptitudiniimăsurate. În felul acesta răspunsurile la un eşantion de itemi dintr-un test cu validitate de conţinutsunt reprezentative pentru răspunsurile pe care subiectul le-ar fi dat dacă întreg universul trăsăturiiar fi fost măsurat.

Analiza validităţii de conţinut vizează două aspecte:- un prim aspect care nu solicită metode statistice ci se bazează doar pe raţionamente, motiv

pentru care validitatea de conţinut se mai numeşte şi validitate logică sau raţională; acest tip devaliditate este decisiv în testele educaţionale şi de achiziţii, ridicând probleme specificeevaluatorului. Se va genera deci o bancă de itemi care să acopere bine întregul domeniu investigat

Page 35: Suport Curs Psihodiagnostic

(cunoştinţele la un obiect şcolar, gradul de elaborare al unor deprinderi, nivelul de cristalizare alunor atitudini), din care vor fi selecţionaţi şi agregaţi într-un test doar un număr limitat de itemi,reprezentativi pentru întregul domeniu.

- al doilea aspect se referă la analiza de itemi (calculul indicelui de dificultate şi a indicelui dediscriminare) şi implică câteva formule matematice.

După Gregory (1992), analiza validităţii de conţinut a unui test trebuie să cuprindă:1. Definirea şi descrierea domeniului de conţinut al testului. Se face în mod asemănător

definirii constructului, singura diferenţă constă doar în gradul de abstractizare şi de aceea cele douăse confundă. Definirea domeniului de conţinut al unui test se face după definirea constructului, careare un grad mai mare de abstractizare, şi presupune enumerarea tuturor comportamentelor concretecare pot fi utilizate pentru a măsura caracteristica la care se referă testul.

2. Analiza itemilor testului pentru a se elimina itemii care nu se referă la domeniul deconţinut al testului. Se formează un grup de experţi care trebuie să acorde o notă între 1 şi 4 pentrufiecare item după ce au citit descrierea domeniului de conţinut al testului. Semnificaţia notelor este:1 = irelevant, 2 = puţin relevant, 3 = destul de relevant, 4 = foarte relevant. Vor fi reţinuţi doaritemii pe care majoritatea experţilor i-a notat cu nota 3 sau 4.

3. Compararea structurii testului cu domeniul de conţinut pentru a decide dacă itemiiacoperă toate aspectele domeniului şi dacă sunt proporţionali ca număr cu mărimea şi importanţafiecărui aspect.

Deoarece analizează doar itemii din punctul de vedere al reprezentativităţii şi relevanţeiconţinutului lor, validitatea relativă la conţinut nu reprezintă o validare în sensul definiţiei date de,,corectitudinea inferenţelor pe care le putem face pornind de la scorurile testului”. Testul poate doarsă pară valid dar de fapt să măsoare altceva decât îşi propune.

Pentru a da validitate de conţinut unui test, constructorul se angajează într-un proces de durată,ce presupune o foarte bună cunoaştere a domeniului, raţionament logic, intuiţie şi perseverenţă, căciitemii trebuie continuu revizuiţi. De aceea putem spune că dintre formele fundamentale de validitate,cea de conţinut este singura care are o susţinere mai degrabă logică decât statistică.

Totuşi, al doilea aspect al validităţii relative la conţinut, analiza indicelui de dificultate şi acelui de discriminare a itemilor ne demonstrează matematic dacă un item este bun sau slab, dacăcunoştinţele subiectului au rămas la un nivel general sau dacă au coborât până la detalii undesubiectul poate să aprecieze diferenţele de nuanţă.

Validitatea de criteriu

Prin ,,criteriu” se înţelege o variabilă pe care încercăm să o prevedem în general cu ajutorultestelor. (Grand dictionnaire de la psychologie, 1994) (apud.Albu, 2000)

Validitatea relativă la criteriu indică măsura în care scorurile obţinute la un test sunt un bunpredictor pentru un eşantion de comportamente viitoare (performanţa şcolară, de exemplu).Coeficientul de validitate relativă la criteriu este egal cu coeficientul de corelaţie liniara întrescorurile testului şi rezultatele unei măsurători independente considerată variabilă criteriu.

În afară de coeficientul de corelaţie al lui Pearson, se poate folosi şi corelaţia rangurilor prinmetoda lui Spearman, în cazul unei evaluări prin ierarhizare.

De asemenea, validitatea unui test mai poate fi analizată şi prin metoda grupelorcontrastante. Grupele contrastante sunt două grupe formate din subiecţii cu performanţele cele maibune şi subiecţii cu performanţele cele mai slabe, având la bază un criteriu (calificativul la limbaromână, de exemplu). Se compară statistic mediile scorurilor obţinute la test (în cazul nostru, să

Page 36: Suport Curs Psihodiagnostic

presupunem un test pentru evaluarea aptitudinilor verbale) pentru subiecţii din cele două grupecontrastante stabilite înainte.

Dacă diferenţa dintre medii este statistic semnificativă, testul are valoare predictivă. Aceastămetodă se aplică mai ales când criteriul este o variabilă calitativă (nu se poate măsura) sau atuncicând criteriul este alcătuit din mai multe variabile care pot fi atât cantitative cât şi calitative (deexemplu, clasificarea facută într-o selecţie profesională în urma interviului, a rezultatelor la maimulte teste de aptitudini şi a referinţelor de la ultimul loc de muncă).

Au fost diferenţiate două tipuri de validitate relativă la criteriu: validitatea predictivă şivaliditatea concurentă.

Validitatea predictivă se referă la precizia cu care putem estima (prezice) că o anumităcaracteristică sau aptitudine a unei persoane reflectată în scorurile unui test se va manifesta în viitor.De exemplu, pe baza performanţei la un test de aptitudini pentru admitere la şcoala de şoferi, săfacem o predicţie asupra comportamentului ca viitor şofer.

Validitatea predictivă presupune trecerea unui interval de timp între aplicarea testului şimăsurarea criteriului.

Validarea concurentă presupune obţinerea scorurilor la criteriu în acelaşi timp cu scorurile latest. Diferenţa logică dintre ele este dată de scopul testului. Dacă în cazul validităţii predictiveîntrebarea care se pune în legătura cu testarea este: ,,Este posibil ca subiectul să devină ... ?”, încazul validităţii concurente întrebarea care evidenţiază scopul testului este: ,,Este în acest moment... ?”.

Câteva idei importante cu privire la validitate:- prin tipuri de validitate nu se întelege “categorii disjuncte”;- validitatea unui test nu se măsoara ci se deduce; ea nu poate fi estimată printr-un singur

coeficient şi se va face o analiză globală a dovezilor conceptuale şi statistice;- procedura de validare trebuie reluată periodic pe eşantioane diferite de subiecţi. Utilizatorul

de teste psihologice trebuie să revalideze testul cumpărat în funcţie de scopul pentru care îlutilizează (de exemplu avizarea unor persoane pentru un anumit loc de muncă).

Factori care influenţează valoarea coeficienţilor de validitate:

- Natura grupului care este testatTestul este validat pe un eşantion adică pe un grup semnificativ din populaţia căreia îi

este destinat testul. Nivelul de educaţie, vârsta, ocupaţia, pot acţiona ca şi variabile ascunse,modificând relaţia dintre criteriu şi scorurile la test şi se poate întâmpla ca un test să aibă validitatemai mare într-o populaţie şi mai mică în alta.

- “Contaminarea” criteriuluiDacă valorile variabilei criteriu sunt influenţate de scorurile testului, se spune că a

avut loc o “contaminare” a criteriului. Acest lucru are ca efect creşterea artificială a validităţiirelative la criteriu.

De asemenea, dacă criteriul este reprezentat de rezultatele la un alt test psihologic dar testulpsihologic respectiv a fost validat pentru un alt scop în utilizare, el mai reprezintă un criteriupotrivit.Interpretarea coeficienţilor de validitate

Pentru că strategiile de validare ale unui test sunt atât de diverse, nu există o interpretare uniformă aacestora. Un coeficient de validitate este semnificativ statistic când şansele de a-l obţine dinîntâmplare sunt sub 5 procente.

Precauţii legate de evaluarea coeficienţilor de validitate predictivă

Page 37: Suport Curs Psihodiagnostic

Standards for Educational and Psychological Testing din SUA atrag atenţia asupra câtorvaprobleme importante şi precauţii legate de interpretarea coeficienţilor de validitate:

1. Este necesară cercetarea schimbărilor apărute în sensul cauzalităţii test-criteriu: de regulăpresupunem implicit că relaţia dintre test şi criteriu este funcţională atunci când aplicăm testul, darcriteriul nostru poate fi diferit.

2.Coeficientul de validitate contra criteriu obţinut poate să nu însemne nimic dacă criteriul nu esteel însuşi valid şi fidel. A corela un test cu un altul despre care nu ştim prea multe lucruri subaspectul validităţii nu ne ajută prea mult în determinarea validităţii convergente a primului test.

3. Se ia întotdeauna în consideraţie populaţia pe care s-a obţinut o anume validitate: o validitateridicată pe o populaţie de albi se păstrează ea oare şi pe o populaţie de negri?

4. Validitatea se generalizează cu prudenţă o validitate găsită: cu alte cuvinte, trebuie demonstrat căvaliditatea descoperită într-un studiu nu este dependentă de situaţie.

De reţinut:

Validitatea nu se măsoară, ci se deduce. Deşi autorul testului trebuie să dea mai mulţi coeficienţi devaliditate, indicând procedura urmată, utilizarea lui pe alte grupuri sau în alte scopuri necesită şi altestudii de validare. Aceasta deoarece validitatea testului depinde simultan de scopul testării şi depopulaţia căreia i se administrează. Toate aceste determinări ale validităţii care vin din studiiulterioare, desfăşurate în scopuri specifice şi pe alte eşantioane de populaţie, vor fi considerate doardovezi ale unui anumit tip de validitate.

Studierea validităţii testelor angajează metode elaborate de analiză (analiza de itemi, calcululcorelaţiei, analiza factorială, regresia simplă şi multiplă) care combinate, dau strategii de validaremai bine definite. Utilizarea lor se face în funcţie de scopul şi de exigenţele beneficiarului.

Strategiile de validare se aplică odată cu construirea testului şi se repetă de câte ori este nevoiepentru a obţine un test bun ca lungime, mod de aplicare, forţă discriminativă, uşurinţă înadministrare, cotare şi interpretare, care alături de fidelitate şi validitate, dau o imagine maiadecvată despre valoarea sa.

Utilizarea testului impune procesul repetării periodice a cercetării validităţii, întrucât validarea unuitest nu se încheie niciodată, datele nou acumulate din diverse domenii conducând la ameliorarea şirafinarea ei, dar nu şi la o soluţie definitivă. Cu atât mai mult se pune problema reluării studiuluivalidităţii unui test când i se schimbă formatul (prin aplicarea pe calculator, de exemplu),conţinutul, instructajul sau modul de cotare.

Eroarea standard a estimării (SEE)

Un test sau un chestionar este construit pentru a estima nivelul unor cunoştinţe, aptitudini sautrăsături de personalitate ale unui individ. Variabila de care depinde performanţa la test nu estedirect măsurabilă. Printr-un test se obţine doar o estimare a valorii variabilei.

Când estimăm valoarea variabilei (pe baza scorului la test), comitem o anumită eroare numităeroarea standard a estimării (SEE) a cărei modalitate de calcul este:

Page 38: Suport Curs Psihodiagnostic

SEE = σσ = abaterea standard a scorurilor la criteriur2 = coeficientul de validitate de crietriu al testului

IV.4. Dificultatea şi sensibilitatea unui test psihologic

Dificultatea unui test

Aplicarea unui test psihologic sau educaţional ridică o problemă tehnică foarte importantă şianume dacă el este adecvat, ca şi grad de dificultate, populaţiei sau grupului respectiv. Dacă este preauşor, majoritatea scorurilor la test vor fi mari şi curba rezultată, în formă de “j”, va fi asimetrică spredreapta; dacă va fi prea greu, curba în formă de “i” va fi asimetrică la exterma stângă. Se apreciază cătestul este adecvat unei populaţii doar în cazul în care repartiţia scorurilor sale este simetrică, generândo curbă de tip gaussian.

Problema dificultăţii unui test se pune în funcţie şi de tipul acestuia. Dacă el este un test deaptitudini, capacităţi, deprinderi sau cunoştinţe, problema dificultăţii este mult mai relevantădecât pentru testele de personalitate sau chestionarele de opinii, atitudini, interese, valori, caz încare termenul de dificultate ar putea fi înlocuit cu cel de accesibilitate.

Dificultatea testului depinde simultan de conţinutul său şi de particularităţile subiecţilorinvestigaţi, ceea ce face ca în construirea unui test să existe o fază iniţială (definirea testului,crearea băncii de itemi şi construirea unei variante preliminare a acestuia), o fază intermediară(administrarea testului, analiza rezultatelor obţinute şi, prin analiza de itemi, depistarea erorilor,corectarea, selectarea şi ordonarea itemilor) şi o fază finală (elaborarea normelor, etaloanelor şielaborarea manualului testului, vezi Albu, 1998, p.199).

Dacă testele de aptitudini şi de cunoştinţe aplicate adulţilor iau în considerare un procesîncheiat, variabilitatea fiind dată mai ales de studii, profesie sau sex, cele mai multe teste deinteligenţă, memorie, aptitudini speciale şi cunoştinţe, aplicate copiilor sau adolescenţilor, au înfactorul vârstă cea mai importantă sursă de variabilitate. În acest sens, elementele de dificultate aletestului trebuie să evolueze paralel cu vârsta (să aibă indice genetic, după expresia lui Claparède), încadrul fiecărei vârste el trebuind să aibă o cât mai bună acoperire a spectrului domeniului investigat.Aceasta trimite la puterea de discriminare a testului, adică la sensibilitatea lui.

Un test este uşor sau greu în situaţia când unităţile lui, fiind foarte puternic corelate între ele(test omogen), creează posibilitatea ca majoritatea itemilor să fie rezolvaţi ori corect, ori greşit, ceeace va da curbe asimetrice spre dreapta sau spre stânga. Există şi posibilitatea ca populaţia săcuprindă două grupuri distincte, care vor da scoruri polarizate după o curbă bimodală (cu două„cocoaşe”), ca în cazul testelor dihotomice: masculinitate-feminitate, extraversiune-introversiune,stabilitate - instabilitate, admis - respins. Multe teste de selecţie profesională nu urmărescierarhizarea de fineţe a persoanelor, ci „ruperea grupului” în categorii extreme: apt-inapt, admis-respins, capabil-incapabil. Aici testele folosite vor fi mai mult centrate pe dificultate (mică, medie,mare) şi mai puţin pe sensibilitate, forţă de discriminare. Aplicate la începutul sau la sfârşitul unuiproces de formare, acelaşi test poate avea o curbă iniţială în formă de „i” (când deprinderea încă nuexistă), o formă de „j” (când în final ea s-a format pentru marea majoritate a subiecţilor), între carese interpune o repartiţie normală, simetrică, pentru perioada intermediară (vezi Albu, op. cit.,p.185).

Page 39: Suport Curs Psihodiagnostic

Sensibilitatea unui test

Asemenea lentilelor, a căror calitate depinde în principal de puterea lor de separaţie (numărulde linii independente discriminate pe o suprafaţă de un centimetru pătrat), sau a balanţelor de fineţe, cacele analitice, capabile să dea subdiviziuni din ce în ce mai fine şi continue până la a cincea zecimală,caz în care se spune că sunt foarte sensibile, testele psihologice au această caracteristică în funcţie denumărul claselor pe care le pot delimita în interiorul unui grup. Cu cât numărul valorilor de scor estemai mare, cu atât ele discriminează (diferenţiază) mai bine între indivizi. În afara acestei accepţiuni,Kline (1993) leagă sensibilitatea unui test de capacitatea sa de a produce scoruri diferite pentrusubiecţii care diferă între ei în ce priveşte caracteristica măsurată. Deoarece sensibilitatea conjugăcaracteristicile testului cu cele ale populaţiei măsurate, vom remarca faptul că testele mai lungi, cuitemi gradaţi ca dificultate (deci neomogeni) sunt mai sensibile, pentru că ele produc mai multe clase,valori ale scorurilor. Prin contrast, testele scurte sau cu itemi foarte omogeni generează mai degrabăcategorii dihotomice, foarte contrastante, deci sunt puţin discriminative.

Depinzând de forma repartiţiei pe care o dă scorurilor sale, testul cu curbe atipice (i, j saubimodală) sunt puţin sensibile în zonele de mare aglomerare a scorurilor şi sensibile în rest; curba luiGauss este tot mai discriminativă spre extreme, şi mai puţin sensibilă pe porţiunea centrală, undeaglomerarea rezultatelor dă un număr mai mic de scoruri.

Există o legătură foarte puternică între dificultatea unui test şi sensibilitatea sa. La fel cum înfotografie filmele foarte sensibile (care se impresionează la cantităţi mici de lumină) plătesc un preţ înceea ce priveşte calitatea imaginilor (mai puţin nete, deoarece imaginea este tradusă pe peliculă pringrupuri mai mari de puncte), sau la fel ca în metrologie, unde balanţa analitică îşi dovedeşte utilitateapentru greutăţile mici, iar nu pentru kilograme sau tone, testele psihologice trebuie să stabilească unraport corespunzător între dificultate şi sensibilitate.

Sensibilitatea presupune, pe de o parte, o cât mai bună acoperire a domeniului de conţinut alvariabilei, pentru care trebuie să aibă grade diferite ale dificultăţii, pe de altă parte discriminarea defineţe la nivelul fiecărui palier de dificultate ales. Pentru a exemplifica, testele de inteligenţă WISCsunt operaţionale de la 5-6 ani la 14-16 ani, pentru fiecare an dându-se etaloane din 4 în 4 luni. Dar întimp ce anumite subteste ale bateriei (Informaţii, Comprehensiune) dau un larg evantai de scoruri, încâtetaloanele nu au goluri, altele (Cifrele, Labirinturile), din cauza numărului mic de itemi care lecompun, discriminează foarte grosier pe anumite porţiuni ale scalei, la anumite vârste. SubtestulCuburilor, o foarte validă măsurătoare a inteligenţei concret-spaţiale, compus din 10 pattern-uri ce potda (în forma iniţială) 55 de puncte de scor, are un prag înalt de intrare în probă la vârstele mici (5-6ani), unde nu distinge fin coeficienţii sub 80, şi un prag jos la vârste mari (peste 13 ani), unde nu maidistinge supradotaţii (QI > 125-130). Combinarea optimă a celor două caracteristici (dificultatea cusensibilitatea) se face, pentru bateria WISC, pentru vârstele de 10-12 ani, unde ea are cea mai mareforţă discriminativă şi deci cele mai bune calităţi psihometrice (Zimmerman şi Woo-Sam, 1973). Înmod similar, testul PM 38 (Matricile Progresive Standard ale lui Raven) are un prag înalt la 5-7 ani şijos după 14 ani, deci nu distinge bine insuficienţa şi supradotarea mintală la vârstele mici, respectivmari.

Sensibilitatea testelor depinde de mulţi factori (care pot fi identificaţi şi prin analiza de itemi),dintre care amintim:· Numărul itemilor care, aşa cum am arătat, creează posibilitatea stabilirii numărului de clase de scor,

progresiv cu creşterea lui. Numărul maxim de clase este chiar numărul de itemi, atunci când ei nusunt echivalenţi sau intercorelaţi. Dacă luăm exemplul testelor de inteligenţă, acestea ar trebui sămăsoare QI-uri de la 40 la 160, având o lungime a liniei de bază (cea care trebuie să acopere întregspectrul de variaţie) de 120 de unităţi. Dacă subtestul are 40 de itemi, înseamnă că cea mai finărezoluţie ar fi de 3 unităţi de QI pentru un item; dacă am avea, ca la subtestul Cifre, 8 itemi înprezentarea directă şi 7 în prezentarea inversă, înseamnă că 120 /(8+7) = 8, adică fiecare itemacoperă 8 unităţi de QI, ceea ce înseamnă o discriminare mult mai grosieră, în care orice eroare de

Page 40: Suport Curs Psihodiagnostic

aplicare ar putea avea consecinţe însemnate asupra scorului la subtest. Pe de altă parte, a genera untest cu maximă sensibilitate (un punct de QI să fie dat de câte un item separat), este aproapeimposibil, nu numai din cauza lungimii liniei de bază de 120 de unităţi, dar şi din cauza număruluide vârste distincte pe care testul le acoperă (de la 5 la 16 ani sunt 12 vârste). Aceasta ar da subtesteneobişnuit de lungi şi de greu aplicabile (nemaniabile). De aceea, teste de inteligenţă cu o rezoluţiede până la 5 sunt încă acceptabile, deşi cele mai bune valori ar fi între 2 şi 3.

· Maniera de scorare a probelor este iarăşi o modalitate importantă de creştere a sensibilităţii testelor.La testele Domino (D 48 şi D 70), pentru fiecare problemă (alcătuită din desenele unor piese dedomino ce solicită stabilirea a două valori) se acordă doar un punct, performanţa maximă fiind de44 de puncte. Imaginând un alt sistem de scorare, prin care să nu se “piardă” puncte şi acordând unpunct dacă un element din căsuţa dublă este corect, încă unul pentru al doilea, plus un bonus de unpunct pentru simultaneitatea lor şi orientarea corectă pe verticală (neinversare), se obţin 44x3 = 132de puncte de scor, cu care se baleiază mult mai bine linia de bază şi vârstele succesive. Similar, lasubtestul Cuburilor din bateria WISC, se dau 4 puncte pentru pattern-ul rezolvat corect şi încămaximum 3 drept bonificaţie de timp, rezultând maximum 7 puncte pe item şi 55 de puncte în total.Deoarece rezolvările parţial corecte nu se iau în considerare, rezultă că o bună parte dinvariabilitatea scorurilor se pierde inutil. Îmbunătăţirea sistemului de scorare, prin acordarea unuipunct pentru fiecare cub cu o culoare omogenă (roşu sau alb), pus în locul potrivit, şi încă un punctpentru feţele bicolore (roşu şi alb) care respectă nu numai locul, ci şi poziţia relativă (înclinarea), arputea duce la dublarea ambitusului scorurilor posibile, deci la o forţă discriminativă dublă.Adăugarea a încă doi itemi (unul foarte uşor, pentru intrarea în probă şi unul foarte greu, pentru aridica pragul de ieşire din probă), reconsiderarea timpului de aplicare şi al manierei de acordare abonificaţiilor de timp ar fi încă două surse de mărire a sensibilităţii testului, cu menţiunea că toateaceste modificări reiau de la zero problemele de validitate şi de fidelitate ale probei, pentru că, defapt, ele înseamnă crearea unui test nou, ce trebuie studiat ca atare.

· Tipul de norme utilizate în etalonare este a treia caracteristică ce poate contribui la ameliorareasemnificativă a sensibilităţii unui test. Acestea depind de precizia dorită în utilizare. Dacă lanormele exprimate în centile se poate determina fiecare punct percentil (caz foarte rar, pentru cătestul ar trebui să fie foarte lung şi eşantionul foarte extins), sau măcar punctele decile, la care semai adaugă percentilele 3, 5, 25, 75, 95 şi 97, dezavantajul constă în inegalitatea unităţilor demăsură (mai mici pe porţiunea centrală a benzii şi mai lungi spre extreme). În consecinţă,rezultatele unei baterii de teste etalonate în centile nu pot fi adunate şi integrate, prin medie, într-unscor unic. Cvartilele dau o împărţire şi mai grosieră (4 clase), foarte largă, nepermiţânddiscriminările de fineţe. Testele moderne sunt etalonate în note z (standardizate), T, Hull, stanine,stens etc. Foarte utile sunt şi notele T (cu media 50 şi abaterea standard de 10) şi scalele de QI (cumedia 100 şi abaterea standard de 15). Ca o regulă vom menţiona că, cu cât o scală are mai puţineintervale (3, 5, 7, 9, 10, 11 etc.), cu atât mai mult se produce o pierdere de varianţă, deci desensibilitate a scorurilor la test. Dacă un test de memoria cuvintelor este etalonat în stanine şi clasa5, la 10 ani are, să zicem, scorurile 48-52, înseamnă că diferenţa de performanţă de 5 puncte dintresubiecţi este practic anulată: fie că scorul este 48 sau este 52, se obţine aceeaşi stanină 5, decisensibilitatea discriminării are de suferit. Aceasta nu înseamnă însă că scalele cu mai puţineintervale nu sunt foarte utile (şi utilizate) în practică: multe baterii au subteste foarte diferite caputere de discriminare şi atunci se alege o scală cu 9-11 trepte standardizate (stanine şi stens), careintegrează bine toate subtestele în baterie. Unii psihologi s-au acomodat mai bine cu proprietăţilematematice ale unei scale şi o preferă în virtutea obişnuinţei. Esenţialmente acordajul dintrescorurile la test şi gradul de extensie al scalei utilizate trebuie să ne conducă la alegerea de scalefoarte discriminative când testul are mai mulţi itemi (peste 40-50) eterogeni, nu din punctul devedere al conţinutului sau al performanţei măsurate, ci al gradului de dificultate. Testele ce acoperămulte vârste, diferenţiate între ele prin performanţe ce au ambitusul liniei de bază mare (între 40 şi

Page 41: Suport Curs Psihodiagnostic

160 la testele de inteligenţă, sau chiar mai mari) au nevoie de scale discriminative, celelalte putândopera, pentru scopuri practice şi de cercetare cu scale mai puţin extinse, chiar dacă aceastaînseamnă scăderea puterii discriminative a testului. Pentru testele sale, Wechsler a optat pentruscale standardizate de 19 trepte.

Cum dificultatea şi sensibilitatea unui test depind de mărimea şi caracteristicile lotului particularde subiecţi la care aplicăm testul, înseamnă că obligatoriu trebuie să determinăm valorile tendinţeicentrale pentru a vedea gradul de suprapunere al acestuia cu lotul de eşantionare indicat de manualultestului. Când media grupului nostru este semnificativ diferită de cea a populaţiei de etalonare dinmanual, înseamnă că testul este prea uşor sau prea greu în raport cu aceasta şi concluziile trase,aplicând etalonul standard, pot fi greşite. Dacă abaterea standard indică o valoare mult diferită (maimică sau mai mare), decât cea a lotului de etalonare, înseamnă că lotul nostru este fie prea omogen, fieprea eterogen în raport cu acesta. În prima situaţie forţa de discriminare a testului descreşte, în a douaea creşte, dar în ambele trebuie avut în vedere un alt etalon, mai adecvat.

,,Trebuie observat că nici un test nu poate fi atât de sensibil încât totdeauna, două persoanedeosebite în privinţa variabilei măsurate de test să obţină scoruri diferite”, afirmă Monica Albu (1998,p. 189). Aceasta pentru că, în timp ce trăsăturile psihice sunt variabile continue, scorurile la test suntvariabile discontinue (discrete) şi de aceea o corespondenţă biunivocă între variabilă şi scorul la testeste un fapt imposibil de realizat practic. Scorul fiind afectat de diverse erori (generate de testul însuşi,de subiect sau de situaţia de examinare), este posibil ca aceeaşi variabilă, măsurată la acelaşi individ, săaibă mai multe valori de scor. Întrucât performanţa la un test se raportează la un număr de intervale maimic decât numărul valorilor de scor pe care el le poate înregistra, înseamnă că indivizii plasaţi peacelaşi interval de scor nu sunt discriminaţi. Deci un test va fi cu atât mai discriminativ cu cât va separamai bine indivizii “care au valori ale variabilei măsurate de test plasate în acea zonă a axei sale în careexistă un număr suficient de intervale de lungimi mici”(Albu, op. cit., p.190).

Capitolul V

METODOLOGIA CONSTRUIRII TESTELOR PSIHOLOGICE

Algoritmul general în construirea unui test sau chestionar psihologic este (Albu, 1998):

Page 42: Suport Curs Psihodiagnostic

I. Definirea testului

II. Crearea băncii de itemi

III. Construirea unei prime variante a testului

IV. Administrarea testului unui eşantion

V. Analiza de itemi

Testul este corespunzator ?Nu Da

VI. Corectarea / Reformularea itemilor

VI. Verificarea suplimentară şianaliza caracteristicilor psihometrice

Testul este corespunzator?

Nu Da

VII. Depistarea erorilor /Reformularea itemilor

VII. Elaborarea normelor şiredactarea manualelor

I. Definirea testului

Există o multitudine de teorii plauzibile, iar atunci când se optează pentru o teoriecare stă la baza unui test, analiza acestor teorii aflate în competiţie, este întotdeauna foarte dificilă.Este de preferat însă să se aleagă o teorie care a fost validată experimental. Aceasta deoareceprocesul de validare al unui test începe de la nivelul constructelor teoretice derivate din aceastateorie.

Atunci când conceptualizam un test, trebuie să ştim de la bun început ce dorim să măsoaretestul, în ce scop va fi utilizat testul, de ce este nevoie de construcţia acestui test, cine va utilizatestul şi care este populaţia care va fi evaluată cu testul respectiv, ce tipuri de scale vom folosi, cumvor fi ordonaţi itemii (după gradul de dificultate sau aleator), ce lungime va avea testul şi cum va fiaplicat testul (cu sau fară limită de timp).

Referitor la tipurile de scale, cele mai utilizate în psihologie sunt scalele ordinale şi deinterval. Între acestea se diferenţiaza scalele de tip Likert sau Guttman.II. Crearea băncii de itemi

Se recomandă ca numărul itemilor propuşi iniţial să fie cu cel putin 20% mai mare

Page 43: Suport Curs Psihodiagnostic

decât lungimea testului (Aiken, 1994, apud.Albu, 1998) dar pentru că itemii buni nu pot fi generaţicu atâta uşurinţă, este bine să se pornească de la un număr mult mai mare de itemi (încă o datălungimea testului).

În majoritatea cazurilor itemii sunt propuşi de psihologi pornind de la constructele definite.De asemenea ei mai pot fi preluaţi din testele existente sau pot fi formulaţi de specialişti dindomeniul în care va fi aplicat testul (de exemplu în cazul testelor de cunoştinte sau pentru domeniiprofesionale unde sunt necesare aptitudini speciale).

După ce itemii sunt aranjaţi într-o anumită ordine, se redactează instrucţiunile deadministrare care trebuie să fie clare şi concise.

Autorul testului va utiliza grafica cea mai potrivită astfel încât rezolvarea testului sau achestionarului să nu ridice probleme din acest punct de vedere.

III. Administrarea testului

Se va face în aceleaşi condiţii care se vor respecta şi după punerea testului în circulaţie.

IV. Analiza de itemi

Pentru fiecare item în parte se calculează:- indicele de dificultate- indicele de discriminare- analiza răspunsurilor incorecte

Analiza dificultăţii unui itemIndicele de dificultate a unui item indică procentul subiecţilor care au răspuns corect la itemul

în chestiune. Această definiţie, care la început pare uşor de înţeles, în practică se complică în modconsiderabil, dat fiind faptul că luarea unei decizii cu privire la grupul de subiecţi de care se ţinecont în momentul aflării procentului se poate dovedi dificilă. La numărător se pot lua în considerarenumai subiecţii care au răspuns corect la item, adică cei care au ales opţiunea numită „cheie” sau,dimpotrivă, se poate ţine cont şi de cei care au comis greşeli, adică cei care au ales unul dintreelementele derutante. Numitorul comun poate face referire la toţi subiecţii care au răspuns la test,fără a ţine seama de ce au răspuns la itemul în cauză sau se pot exclude din acest total de subiecţiaceia care au „omis” itemul şi/sau care „nu au ajuns” la item. Un item este considerat omis atuncicând un subiect l-a lăsat gol, însă a răspuns la altele care sunt situate mai jos de el, în cadrul testului.Pe de altă parte, se consideră că nu s-a ajuns la un item atunci când un subiect l-a lăsat gol şi nu arăspuns la nici un alt item aflat mai jos de acesta; ca urmare, se poate spune că subiecţii evaluaţicare nu au răspuns la itemurile la care nu au ajuns, nici măcar nu au încercat să o facă.

Combinând toate posibilităţile comentate, diferitele formule care se utilizează pentru a afla„indicele de dificultate” ar fi următoarele:

a. Procentul de răspunsuri corecte din totalul de subiecţi care participă la test:

,100´=NnP

unde n este numărul de răspunsuri corecte, iar N este numărul de subiecţi.

b. Procentul de răspunsuri corecte excluzând subiecţii care au „omis” itemul, adică pe cei care nu aurăspuns la el, însă au răspuns la altele situate mai jos de acesta:

Page 44: Suport Curs Psihodiagnostic

,100´-

=ON

nP

unde O se referă la grupul de subiecţi care au omis testul.

c. Procentul de răspunsuri corecte excluzând subiecţii care nu au ajuns la item, adică pe ceicare nu au răspuns la el şi nu au răspuns nici la altele situate mai jos de acesta:

,100´-

=NAN

nP

unde NA este numărul de subiecţi care nu au ajuns la item.

d. Procentul de răspunsuri corecte, excluzând subiecţii care au omis itemul şi pe cei care nu auajuns la el:

100´--

=NAON

nP

e. Procentul de răspunsuri corecte penalizând greşelile:

,1001 ´--

=NK

EAP

unde A indică numărul de răspunsuri corecte, E numărul de greşeli, K numărul de opţiuni aleitemului şi N numărul de subiecţi.

f. Procentul de răspunsuri corecte penalizând greşelile şi excluzând subiecţii care au „omis”itemul:

1001 ´--

-=

ONK

EAP

g. Procentul de răspunsuri corecte penalizând greşelile şi excluzând subiecţii care „nu auajuns” la item:

1001 ´-

--

=NAN

KEA

P

h. Procentul de răspunsuri corecte penalizând greşelile şi excluzând subiecţii care au „omisitemul” şi pe cei care „nu au ajuns la el”:

1001 ´---

-=

NAONK

EAP

Referitor la valorile pe care trebuie să le aibă indicii de dificultate ai itemilor care se utilizeazătrebuie să spunem că, în principiu, din punct de vedere psihometric se recomandă ca acestea să fieîn jur de 0.50, deoarece astfel variaţia va fi mai mare. Atunci când punctajele sunt binare (1,0),

Page 45: Suport Curs Psihodiagnostic

variaţia este egală cu produsul dintre p şi q (S2 = pq), p fiind procentul de cazuri favorabile,răspunsuri corecte, iar q fiind egal cu 1 minus p (1-p); în ceea ce priveşte procentele: Q = 100-P.Cea mai mare valoare pq se obţine atunci când p este egal cu q (p=q), ceea ce se întâmplă numaiatunci când valoarea lui p şi q este egală cu 0,50 (exprimat în proporţii) sau 50 (exprimat înprocente). Dacă variaţia este mai mare, coeficientul de fidelitate a testului va fi mai mare, deoareceacest coeficient de fidelitate este corelaţia testului cu el însuşi. În principiu, dacă variaţia este maimare, şi corelaţia va fi mai mare. Pe de altă parte, o variaţie mică indică faptul că punctajele tuturorsubiecţilor se situează într-un mod foarte grupat faţă de trăsătura evaluată. Toţi obţin rezultatesimilare şi, în consecinţă, va fi foarte dificil ca puterea de discriminare a itemului sau a testului închestiune să fie ridicată. O variaţie mare nu garantează o putere de discriminare ridicată, însă estefoarte greu ca un item să aibă capacitatea de a discrimina între subiecţi care au o posesie redusă sauridicată a trăsăturii evaluate dacă variabilitatea punctajelor tuturor subiecţilor este mică. Pe scurt, ovariaţie mare garantează un coeficient de fidelitate ridicat şi un indice de discriminare ridicat, într-omăsură mai mare decât o variaţie redusă.

Totuşi, din motive de tip funcţional poate fi interesant ca toţi indicii de dificultate să fiesuperiori sau inferiori valorii de 0.50. De exemplu, în anumite circumstanţe va fi mai bine să seînceapă testul cu itemi uşori pentru ca subiectul să câştige încredere şi să poată avea un anumitrandament la proba respectivă în funcţie de nivelul personal al trăsăturii evaluate. Astfel, la unmoment dat ar fi interesant să se facă discriminări între subiecţi cu un nivel scăzut sau cu un nivelridicat al unei anumite trăsături, caz în care ar trebui să se utilizeze itemi uşori sau itemi dificili, cuo mare putere de discriminare la aceste niveluri. Ca urmare, se poate afirma că, deşi din punct devedere statistic este de dorit ca toti itemii să aibă un indice de dificultate apropiat de 50%, din punctde vedere funcţional poate fi recomandabil să existe un anumit număr de itemi uşori şi/sau unanumit număr de itemi dificili. Majoritatea manualelor recomandă următoarea distribuire înmomentul aplicării unei probe de randament sau de aptitudini la un număr reprezentativ de persoane„normale”: 25% itemi uşori, 25% itemi dificili şi 50% itemi de dificultate medie. Prin item uşor seînţelege acel item la care răspunde corect peste 75% din populaţie. Un item dificil ar fi acela la carerăspunde corect cel puţin 25% din populaţie.

Cu cât indicele de dificultate al itemului este mai mare, cu atât itemul este mai uşor. Valorilerecomandate pentru indicele de dificultate sunt cuprinse în intervalul [0.25;0.75]. (Alvaro, 1993)

Atunci când se calculează indicele de dificultate al unui item, se ia în calcul şi posibilitateaca subiectul să ghiceasca răspunsul. Mai întâi se calculează indicele optim de dificultate şi secompară cu indicele de dificultate obţinut la itemul în cauză. Se calculează mai întâi rata de răspunsla întâmplare împărţind valoarea 1 la numărul de variante de răspuns pe care le are itemul în cauză.

În cazul unui item cu 2 variante de răspuns, rata de răspuns la întâmplare este de 0.50 (1/2)iar în cazul unui item cu cinci variante de răspuns, rata de răspuns la întâmplare este de 0.20 (1/5).

Indicele optim de dificultate se află la mijlocul distanţei dintre 1 şi rata de răspuns laîntâmplare, deci în cazul itemului cu două variante de răspuns este egal cu 0.75 ( ) iar în cazul

itemului cu cinci variante de răspuns este 0.60 ( ).

Răspunsul la întrebarea „cât de dificili trebuie să fie itemii unui test?” depinde, pe de o parte, deutilizarea testului, pe de altă parte de tipurile de răspunsuri sau de lungimea scalei. Aşa cum am maiarătat şi anterior, un test în care itemii se scorează adevărat - fals sau 0 - 1, dă o probabilitate de 50% carăspunsul să se dea prin şansă (aleator), iar când variantele de răspuns sunt 4, această probabilitate estede 25%. Deci probabilitatea ip , care descrie dificultatea unui item, se plasează între 0 şi 1 (nici unsubiect, respectiv toţi subiecţii îl rezolvă).

Page 46: Suport Curs Psihodiagnostic

Alegerea dificultăţii optime a unui test trebuie să rezolve această problemă complicată: cu câtitemii au mai puţine variante de răspuns, cu atât mai mare este probabilitatea de a nimeri prin şansărăspunsul corect, ceea ce obligă la creşterea dificultăţii optime la un nivel foarte ridicat, de 0,75.Aceasta coboară progresiv cu mărirea numărului de variante de răspuns spre 0,50, dar cu cât acesteasunt mai multe, timpul de analiză pentru fiecare item creşte (sunt mai multe variante de luat înconsiderare) ceea ce obligă la reducerea din numărul de itemi. Această reducere afectează simultanfidelitatea şi validitatea testului în ansamblul său, ajungând astfel la alternativa variante mai multe derăspuns sau itemi mai mulţi. Dilema se rezolvă alegând între 4 şi 8 variante de răspuns, aceasta fiind ozonă de echilibru între cele două extreme.

În rezumat, precizăm încă o dată că pentru majoritatea testelor nu este deloc indicat să avemitemi de dificultate egală (eventual cu dificultatea optimă), pentru că urmărim să avem itemi pentru ovarietate a nivelurilor de dificultate, astfel încât testul să aibă o bună putere discriminativă în ansamblulsău. Pentru cele mai multe dintre teste itemii au o dificultate ce acoperă spectrul de la 0,20 la 0,80,pentru a maximiza astfel diferenţele dintre subiecţi. În funcţie de scopul testării, pot fi concentraţi itemipreponderent dificili (sub 0,20), ca în cazul selecţiei unor candidaţi pentru o facultate, post sau meseriefoarte pretenţioasă sau itemi foarte uşori (selecţie indulgentă). Pe de altă parte, cunoaşterea dificultăţiiitemilor este fundamentală în aranjarea lor în test într-o ordine ierarhică. Itemii foarte uşori de laînceputul testului ajută persoana să înţeleagă ce se cere de la ea şi, chiar dacă ei nu au valoarepsihometrică probată, ajută la ridicarea moralului, inspirând încrederea în resursele proprii. Itemiifoarte dificili sunt destinaţi extremei drepte a scalei, deci supradotaţilor sau celor de vârste mari, avândutilitate pentru un număr mai mic de cazuri, ce apar doar pe eşantioane extinse ca volum.

Analiza capacităţii de discriminare a unui itemIndicele de discriminare al unui item se referă la capacitatea sa de a distinge între subiecţii

care posedă trăsătura evaluată de test în proporţie ridicată şi cei care o posedă în proporţie redusă.Astfel, într-un item cu o mare putere de discriminare, subiecţii care posedă în mare măsură trăsăturaevaluată vor avea în mod sistematic punctaje mai mari decât cei care posedă această trăsătură într-omăsură mai mică.

Procedura tradiţională pentru stabilirea puterii de discriminare a unui item s-a bazat pediferenţele dintre procentele de răspunsuri corecte din grupul mai bun şi procentul de răspunsuricorecte din grupul mai slab, din întreg testul. După Kelley (apud.Stan A., 2002), grupul „puternic”este alcătuit din subiecţii care au un scor total care-i plasează valoric în primii 27% dintre subiecţi,iar grupul „slab” din subiecţii care au cele mai slabe 27% scoruri din ansamblul rezultatelor la test.

Ca exemplu, să presupunem că un test de cunoştinţe a fost aplicat unui număr de 170 deelevi. Mai întâi se ordonează scorurile totale la test de la cel mai mare la cel mai mic.

Se calculează apoi cât reprezintă primele 27% cele mai mari scoruri şi ultimele 27% celemai mici scoruri. Cele două valori trebuie să fie aproximativ apropiate. Ele sunt egale dacă înpractică două persoane nu obţin acelaşi scor.

Să presupunem că în cazul nostru n = 46( ).

Să luăm în calcul un item la care din primii 46 de subiecţi cu cele mai bune scoruri la test,36 au răspuns corect la item, iar din cei 46 de subiecţi cu cele mai mici scoruri la test. 12 au răspunscorect.

Page 47: Suport Curs Psihodiagnostic

S = numărul de răspunsuri corecte în grupa “bună”i = numărul de răspunsuri corecte în grupa “slabă”n = numărul de scoruri în grupa bună egal cu numărul de scoruri în grupa slabă

d1 = = 0.52

Ebel (Stan, 2002) a propus o scală pentru interpretarea indicelui de discriminare d:>0.40 – discriminare foarte bună[0.30 ; 0.39] – discriminare bună[0.20 ; 0.29] – discriminare slabă[0.10 ; 0.19] – discriminare de limită<0.10 – fără utilitate

În prezent, indicii de discriminare cei mai utilizaţi sunt coeficienţii de corelaţie biserial şipunct-biserial, depinzând dacă itemii se dihotomizează a posteriori sau au fost evaluaţi direct înmod dihotomic. Corelaţia biserială se utilizează cu itemi „dihotomizaţi” după ce au fost evaluaţi cuscale de interval sau ordinale. De exemplu, aceasta se întâmplă atunci când un profesor a corectat oîntrebare cu punctaje de la 0 la 10 şi o dată ce a notat răspunsurile tuturor elevilor la aceastăîntrebare decide să-i puncteze pe cei care se află sub 5 cu 0, iar pe cei care se află mai sus de 5, cu 1.Corelaţia biserială este considerată de asemenea un indice de omogenitate, deoarece evalueazăcorelaţia dintre item şi grupul de itemi care alcătuiesc testul, presupunând că punctajele fiecăruiitem oscilează într-un continuu care merge de la 0 la 1. Formula corelaţiei biseriale este următoarea:

yqp

SXXr ii

t

qipib ´

-= , care echivalează cu:

yp

SXXr i

t

tpib ´

-= , unde

piX este în cadrul testului media subiecţilor care răspund corect la itemul i, qiX este în cadrultestului media subiecţilor care nu răspund corect la itemul i, tS este variaţia punctajelor obţinute întest, pi este proporţia de subiecţi care răspund corect la itemul i, qi este proporţia de subiecţi care nurăspund corect la itemul i (qi=1-pi), iar valoarea ordonatei care separă într-o distribuire normalăproporţia subiecţilor care răspund corect la itemul i (pi) de proporţia celor care nu răspund corect(qi) şi tX este media testului, luând în considerare toţi subiecţii participanţi la test.

Atunci când itemii au fost evaluaţi direct în mod dihotomic, adică sunt dihotomici în loc să fiedihotomizaţi, se utilizează coeficientul de corelaţie punct-biserial.

iit

qipibp qp

SXXr ´

-= , sau:

i

i

t

tpibp q

pS

XXr ´-

=

În legătură cu valoarea de discriminare a unui item care este preferabil să se atingă, ar trebuisă ne gândim, în principiu, că idealul este să fie cât mai mare; cu cât se apropie mai mult de 1, careeste valoarea maximă a unei corelaţii, cu atât mai bine, deoarece aceasta ar indica faptul că itemul

Page 48: Suport Curs Psihodiagnostic

are o mare capacitate de discriminare între subiecţii buni şi cei slabi, în ceea ce priveşte trăsăturaevaluată. Cu toate acestea, ţinând cont de faptul că şi coeficienţii de corelaţie biseriali şi biserialipunctuali pot fi consideraţi un indice de omogenitate şi de faptul că dacă toţi itemii au o corelaţiefoarte ridicată cu testul (format din totalitatea tuturor itemilor) se indică faptul că toţi itemiievaluează acelaşi lucru, ceea ce ar fi în detrimentul validităţii de conţinut. Este recomandabil caindicii de discriminare obţinuţi cu aceste corelaţii să aibă valori apropiate de 0,50; un item cu unindice mai mic de 0,25 trebuie eliminat.

Curbele caracteristice itemilor sau teoria răspunsului la itemi

O reprezentare grafică a dificultăţii itemilor şi a gradului în care discriminează poate fi făcută printr-o curbă caracteristică itemului (CCI). Aşa cum se observă în figură, o astfel de curbă este un graficîn care aptitudinea măsurată este reprezentată pe axa orizontală, în timp ce probabilitatearăspunsului corect e reprezentată pe axa verticală. De remarcat este faptul că măsura în care un itemdiscriminează între subiecţii cu scoruri mari şi cei cu scoruri mici este dată de înclinaţia curbei. Cucât mai abruptă înclinaţia, cu atât mai mult discriminează itemul respectiv. De asemenea, dacăînclinaţia este pozitivă, atunci mai mulţi subiecţi cu scoruri mari răspund corect decât subiecţi cuscoruri mici, iar reciproca este şi ea valabilă. Itemul (a) nu poate fi considerat un item bun;probabilitatea unui subiect de a răspunde corect - răspuns corect înseamnă ceea ce e stabilit de celce a construit testul - este mare pentru subiecţi cu aptitudini scăzute şi mică pentru subiecţii cuaptitudini crescute. Itemul (b) nu este nici el un item bun deoarece curba ne spune că subiecţii cuaptitudini moderate vor avea cea mai mare probabilitate de a răspunde corect; subiecţii cu aptitudinicrescute, respectiv scăzute vor avea probabilitate mai mică de a răspunde corect. Itemul (c) este unitem bun; observăm că probabilitatea de a răspunde corect creşte odată cu aptitudinea subiectului.Ce putem zice despre itemul (d)? Curba caracteristică itemului discriminează pentru un singur punctal continuumului aptitudinii, probabilitatea de a răspunde corect este foarte mare pentru toţisubiecţii care se situează deasupra acestui punct de pe axa aptitudinii. Un item ca (d) este foarte bunpentru un test, de exemplu, pentru a selecta candidaţii în funcţie de un scor critic. Totuşi acest itemnu e foarte bun pentru a ne oferi informaţii despre aptitudinile subiectului, la toate nivelurile acesteiaptitudini - cum ar putea fi cazul unui diagnostic sau test de aptitudini matematice.

Mare

Prob

abili

tate

a de

a

răsp

unde

cor

ect

Page 49: Suport Curs Psihodiagnostic

Modelul trăsăturilor latente

Page 50: Suport Curs Psihodiagnostic

Un test sau chestionar este construit pentru a estima nivelul unor cunoştinţe sau aptitudini ori a unortrăsături de personalitate ale unui individ. Variabila de care depinde performanţa la test, fie ea decunoştinţe, aptitudini, trăsături de personalitate sau altceva, nu este direct măsurabilă. Printr-un testse obţine doar o estimare a valorii variabilei. Conform modelului trăsăturilor latente, aceastăvariabilă neobservabilă, care stă la baza oricărei măsurări psihometrice este considerată latentă. Eaeste una unidimensională. Se presupune că toţi itemii testului măsoară o anumită trăsătură depersonalitate, gradul în care fiecare item îndeplineşte acest obiectiv este dat de curba caracteristică aitemului. În contrast cu teoria clasică a “scorului adevărat” în care nu se fac presupuneri despredistribuţia de frecvenţă a scorurilor la test, teoria trăsăturilor latente avansează idei referitoare laprobabilitatea de apariţie a scorurilor observate obţinute de subiecţi şi scorurile adevărate. Teoriiletrăsăturilor latente propun modele care descriu cum această trăsătură latentă influenţeazăperformanţa aferentă fiecărui item al testului. Spre deosebire de scorurile la test sau scorurileadevărate, scorurile latente pot să ia valori de la +¥ la -¥.

Aplicabilitatea modelului trăsăturilor latente la testele psihologice a fost pusă la îndoială de câţivateoreticieni. S-a susţinut, de exemplu, că unidimensionalitatea testelor ar fi violată dacă avem învedere testele psihologice. S-a susţinut şi că acelaşi item al unui test psihologic poate să măsoareabilităţi sau aptitudini diferite ale subiecţilor, în funcţie de experienţele de viaţă ale acestora. Deşiare unele limite fireşti, modelul trăsăturilor latente pare să joace un rol din ce în ce mai important încrearea şi dezvoltarea noilor teste şi programe de testare.

Analiza răspunsurilor incorecte se face în cazul itemilor cu alegeri multiple pentru averifica dacă distractorii (răspunsurile greşite) îşi îndeplinesc rolul.

După Murphy şi Davidshofer (1987), pentru fiecare distractor se calculează frecvenţaobservată (f0) şi frecvenţa teoretică (ft) (toate răspunsurile greşite ale unui item au aceiaşi frecventăteoretică).

foi = si ft =

N = numărul de subiecţi care au răspuns la item (corect sau greşit)Nc = numărul de subiecţi care au răspuns corectNi = numărul de subiecţi care au ales distractoriiÎntrebarea este bine construită dacă pentru fiecare răspuns greşit, frecvenţa observată este

aproximativ egală cu frecvenţa teoretică.Variantele greşite pe care le aleg foarte puţine persoane trebuiesc înlocuite deoarece sunt

prea uşor identificate ca fiind greşite iar cele greşite care sunt alese de prea multe persoane impunverificarea formulării itemului şi a variantelor de răspuns deoarece pot conţine o formulareincorectă.

După analiza de itemi se elimină itemii necorespunzători, se reformulează unii itemi, seintroduc itemi noi din banca de itemi (dacă este cazul) şi eventual se reia algoritmul de la aplicareaprimei variante.

V. Verificarea suplimentară a testului şi analiza caracteristicilor psihometriceDacă testul are itemi corespunzători de la prima încercare (ceea ce rareori este

posibil), se trece la verificarea suplimentară a testului, cu alte cuvinte se aplică testul într-uneşantion nou de subiecţi.

Se verifică parametrii psihometrici ai unui item prin mai multe metode:- se calculează coeficienţii de corelaţie ai fiecărui item cu scorul total al testului şi se elimină

itemii cu corelaţie scazută;- se calculează indicele de discriminare pe baza metodei grupelor contrastante formate în

funcţie de scorurile grupului la test;

Page 51: Suport Curs Psihodiagnostic

- se grupează itemii pe baza analizei de clusteri şi se reţin itemii unei clase omogene, care sereferă la constructul măsurat de test;

- se corelează itemii cu diversele variabile care au legătură (sau nu) cu constructul, pe bazateoriei de la care s-a pornit în elaborarea testului.

Se verifică apoi calităţile psihometrice calculându-se coeficienţii de validitate şi defidelitate. Dacă aceştia nu sunt acceptabili, se caută erorile şi se reface testul.

VI. Elaborarea normelor şi redactarea manualelorÎn domeniul psihometriei, termenul de ,,normă” se foloseşte în strânsă legătură cu cel

de etalon.Etalonarea, sinonimă cu normarea, înseamnă ,,stabilirea, într-o probă psihologică, a unei

scale care permite a situa rezultatul obţinut de un subiect prin raportare la rezultatele care au fostobţinute anterior într-o populaţie de referinţă, suficient de numeroasă şi omogenă de subiecţicomparabili aceluia care a fost examinat”. (Grand dictionnaire de la psychologie, 1992; apud Stan,A., 2002)

Capitolul VI

Page 52: Suport Curs Psihodiagnostic

ETALONAREA UNEI PROBE PSIHOLOGICE

VI.1. Definirea termenilor

Conform DEX (1984), etalonul este o mărime acceptată oficial în ştiinţă, [...] şi care serveşteca unitate de bază într-un sistem de măsurare. Este un model perfect al unei măsuri tip,confecţionat cu mare precizie şi acceptat oficial a servi ca bază de comparaţie.

În psihologie, în urma aplicării unui test se obţin scoruri brute care nu spun nimic luateseparat. De exemplu, la un test de atenţie distributivă, o cotă brută egală cu 40 nu spune nimicdespre performanţa subiectului.

Etalonul (tabelul de norme) reprezintă o convenienţă între utilizatorii de măsuri şi este deciun cadru de referinţă. Etalonul este nivelul mediu al rezultatelor obţinute de un grup de referinţă(eşantion reprezentativ).

Raportarea la etalon constă în determinarea locului ocupat de rezultatele unui subiect faţă derezultatele unei populaţii de referinţă, suficient de numeroasă, comparabilă cu persoanaexaminată.

Etalonarea este procesul prin care se ajunge la stabilirea cadrului de referinţă, a tabelului denorme.

VI.2. Eşantionarea

Eşantionarea reprezintă selectarea unui grup reprezentativ de subiecţi din populaţia căreia îieste adresat testul pentru care urmează să se construiască etalonul.

Eşantionul trebuie să îndeplinească două condiţii:

1. Să fie suficient de mare2. Să fie reprezentativ, adică să facă posibilă tragerea aceloraşi concluzii din analiza

grupului ca şi din analiza populaţiei, admiţând un risc tolerabil de eroare.În psihologie, aceste două condiţii se îndeplinesc uneori cu greutate datorită

posibilităţilor de selectare pe care psihologul le are la îndemână ( de cele mai multe ori prinintermediul unor instituţii - şcoală, spital, laborator psihologic, etc.), iar această situaţieintroduce de la început distorsiuni.

Se practică tot mai mult testările plătite pentru că în acest fel psihologul cercetătorare o deschidere mai mare din partea subiecţilor care participă pe bază de voluntariat şi caresunt mai motivaţi să răspundă cu interes la itemii testului.

Un aspect direct legat de volumul eşantionului permite ca normele unui test să fieconsiderate norme locale sau norme naţionale.

Normele locale sunt foarte specifice. Ele sunt obţinute doar la nivelul unui oraş deexemplu, în general din raţiuni de ordin economic.

Page 53: Suport Curs Psihodiagnostic

Normele naţionale sunt obţinute pe un număr foarte mare de subiecţi care acoperăregional toată suprafaţa unei ţări. Firmele specializate în construirea şi comercializareatestelor psihologice elaborează norme naţionale.

Sunt prezentate mai frecvent patru tehnici de eşantionare şi anume: prin selecţiealeatoare simplă, prin selecţie stratificată, eşantionare multistadială si eşantionaremultifazică.

Eşantionarea prin selecţie aleatoare simplă se mai numeşte şi „metoda loteriei” sau a„tragerii la sorţi”.

Fiecare individ din populaţie primeşte un număr iar apoi numerele sunt trase la sorţi(de exemplu printr-un program de statistică) până se obţine un eşantion de o mărime stabilităîn prealabil.

În eşantionarea stratificată, populaţia este împărţită în clase, după unul sau mai multecriterii. Variabilele după care se face împărţirea trebuie să coreleze semnificativ cu scoruriletestului. Cel mai frecvent utilizate variabile sunt sexul, vârsta, nivelul educaţional, clasasocială, mediul de provenienţă, rasa, etc.

După ce se face clasificarea populaţiei în funcţie de variabila aleasă, fiecare clasă dinpopulaţie trebuie să fie reprezentată în eşantion, proporţional cu frecvenţa ei relativă.

De exemplu, se consideră că la un chestionar de atitudini faţă de şcoală rezultatelesunt influenţate de nivelul educaţional şi de mediul de provenienţă.

Variabila „nivel educaţional” are trei modalităţi:ciclul primar, ciclul gimnazial si ciclulliceal, iar variabila „mediu de provenienţă” are două modalităţi:urban şi rural.

Chestionarul se adresează elevilor şcolilor din judeţul Bihor (deci eşantionarea seface pentru elaborarea unor norme locale). Să considerăm fictiv că populaţia căreia i seadresează testul este formată din 200.000 de persoane, repartizată în funcţie de niveluleducaţional şi de mediul de provenienţă conform tabelului:

Clasa Nivel de

şcolarizare

Mediu de

provenienţă

Frecvenţa Frecvenţa

relativă

C1 Ciclu primar Urban 45.000 0.15

C2 Ciclu primar Rural 21.000 0.07

C3 Gimnaziu Urban 73.000 0.24

C4 Gimnaziu Rural 29.000 0.10

C5 Liceu Urban 94.000 0.31

C6 Liceu Rural 38.000 0.13

Page 54: Suport Curs Psihodiagnostic

Kline (1993) (apud Albu, 1998) precizează că volumul eşantionului se stabileşteastfel încât în fiecare clasă să se extragă cel puţin 300 de persoane. Se deduce de aici cănumărul de variabile ales în eşantionarea stratificată nu trebuie să fie foarte mare pentru căaltfel va fi necesară selectarea unui eşantion foarte numeros.

În exemplul dat, să considerăm că ar fi suficient un eşantion cu un volum minimrecomandat (1800 de persoane). Frecvenţa relativă din populaţie se respectă şi în eşantion,iar numărul de subiecţi cuprinşi în fiecare clasă din eşantion se regăseşte în tabelul următor:

Clasa Frecvenţa relativă Frecvenţa

C1 0.15 270

C2 0.07 126

C3 0.24 432

C4 0.10 180

C5 0.31 558

C6 0.13 234

1.00 1800

Eşantionarea multistadială se realizează prin selecţia indirectă a indivizilor careformează eşantionul prin intermediul selecţiei grupurilor la care aceştia aparţin, iar îneşantionarea multifazică se alege iniţial un eşantion de dimensiuni mari pe care se realizeazăunele faze ale cercetării extensive, apoi , din acesta se selectează un eşantion pentrurealizarea altor faze cu caracter mai intensiv.

Deoarece pe baza scorurilor eşantionului estimăm parametrii populaţiei şi având învedere că erorile de eşantionare sunt inevitabile, trebuie calculată eroarea de estimare aparametrilor.

Ceea ce interesează de fapt este să calculăm un interval de încredere în jurul medieieşantionului pentru a putea estima cu o anumită exactitate valoarea mediei populaţiei.

Eroarea standard a mediei SM este dată de formula:

SM = √ S2/n *(N-n)/N

unde: S2 = variaţia scorurilor esantionului

N = mărimea populaţiei

N = mărimea eşantionului

Page 55: Suport Curs Psihodiagnostic

Se decide apoi nivelul de precizie cu care vrem să lucrăm, de 1.96 σ sau de 2.58 σ.

VI.3. Metode de obţinere a normelor unui test psihologic

Normele testului descriu performanţa realizată de indivizii din eşantion şi sunt de fapt valoriale unei caracteristici în repartiţia scorurilor, adică valori ale frecvenţei mediei, medianei saurangului scorurilor.

Prin etalonare se fac de fapt transformări ale scorurilor brute, transformări care permitcompararea a două persoane diferite, testate cu acelaşi test sau a aceleiaşi persoane, testată cu testediferite.

Cele mai utilizate transformări (care definesc şi metodele de obţinere a normelor unui test )sunt:

· Transformări în clase echivalente· Transformări în vârste echivalente· Transformări în norme de vârstă mintală· Transformări în cote standard şi cote standardizate· Transformări în ranguri centile, decile şi cuartile· Transformări în clasele scalei normalizate

●Transformări în clase echivalente

Clasele echivalente se referă la clasele din diverse niveluri şcolare. Tabelele de claseechivalente conţin pentru fiecare clasă şi lună de şcoală mediana cotelor brute la test.

În continuare, este redat un astfel de tabel pentru un test de aritmetică (după Albu, 1998),destinat elevilor din clasa a II-a, a III-a şi a IV-a, cotele brute având valori între 0 şi 100, iar pentrucele două luni de vacanţă se consideră cotele nemodificate:

Clasa Cota brută Clasa Cota brută Clasa Cota brută

2.0 15 3.0 25 4.0 55

2.1 15 3.1 27 4.1 58

2.2 16 3.2 28 4.2 62

2.3 17 3.3 30 4.3 64

Page 56: Suport Curs Psihodiagnostic

2.4 17 3.4 32 4.4 66

2.5 18 3.5 36 4.5 67

2.6 19 3.6 39 4.6 68

2.7 20 3.7 44 4.7 69

2.8 22 3.8 47 4.8 69

2.9 23 3.9 51 4.9 70

Partea întreagă reprezintă clasa, iar partea zecimală reprezintă luna de şcoală. Interpretareaeste foarte simplă. Dacă un copil, în prima lună din clasa a IV-a a obţinut la testul de aritmetică ocotă brută egală cu 27, are clasa echivalentă 3.1, deci este rămas în urmă la aritmetică cu aproape unan.

●Transformări în vârste echivalente

Transformările în vârste echivalente urmează acelaşi principiu ca şi transformările în claseechivalente. La baza lor stă principiul că până la o vârstă (şcolară sau cronologică), dezvoltarea esteo variabilă continuă. Aceste tipuri de transformări sunt potrivite doar pentru testele care seadresează copiilor de nivel şcolar elementar.

Cotele transformate în niveluri de vârstă indică pentru fiecare vârstă cronologică exprimatăîn ani şi luni, mediana sau media cotelor brute la test.

Un exemplu de test în care se folosesc pentru construirea etaloanelor transformările în vârsteechivalente, este proba Frostig pentru evaluarea dezvoltării funcţiei perceptiv-motrice la copiii de 4-11 ani.

Un dezavantaj al transformărilor în clase echivalente sau vârste echivalente este dat de faptulla aceleaşi „distanţe” între clase corespund distanţe diferite între cotele brute ale testului, deciaprecierile calitative cu privire la performanţele subiecţilor nu au aceeaşi semnificaţie pentru doisubiecţi care au obţinut acelaşi scor, dar la vârste diferite.

●Transformări în norme de vârstă mintală

Conceptul de „vârstă mintală” introdus prin intermediul scalelor Binet-Simon, reprezintănivelul de vârstă pentru care toate răspunsurile specifice sunt corecte. Vârsta mintală este vârstacorespunzătoare performanţelor realizate de către copiii normali la anumite solicitări de naturăintelectuală. Este determinată prin nivelul probelor reuşite de un copil (Stan, 2002).

Un copil de 7 ani care a reuşit să rezolve toţi itemii pentru vârsta de 7 ani şi încă 5 pentru unnivel superior, va avea o vârstă mintală avansată în funcţie de reuşita suplimentară. Dar, la fel ca şiîn cazul transformărilor în clase echivalente sau în vârste echivalente, rezultatele subiecţilor (fie că

Page 57: Suport Curs Psihodiagnostic

sunt în avans, fie că sunt în întârziere), nu au aceeaşi semnificaţie la vârste diferite ( un an deîntârziere la vârsta cronologică de 4 ani nu are aceeaşi semnificaţie ca şi un an de întârziere la vârstacronologică de 11 ani). Explicaţia se datorează faptului că dezvoltarea intelectuală este foarte rapidăla vârstele mici dar îşi încetineşte ritmul o dată cu înaintarea în vârstă. Un an de întârziere în vârstamintală la vârsta cronologică de 3-4 ani înseamnă tot atât de mult ca o diferenţă de 3 ani deîntârziere la vârsta cronologică de 9-12 ani (Anastasi, 1954).

●Transformări în cote standard şi în cote standardizate

Cota standard z este o valoare care ne arată cât se distanţează în unităţi σ o cotă brută demedia distribuţiei respective.

Cota z este o variabilă standardizată, cu ajutorul căreia variabile diferite sunt aduse la unnumitor comun ( adică sunt exprimate în aceleaşi unităţi), pentru a putea fi comparate.

Trecerea de la variabila brută x la variabila standardizată z se face prin formula:

smxz -

=

Unde:

m – media în eşantion

σ - abaterea standard în eşantion

Reamintim că abaterea standard (σ) ne arată distanţa la care se află o cotă în raport cu mediagrupului de date. Formal, întinderea variaţiei datelor este de 6 unităţi σ ( deci σ este unitatea demăsură pentru variaţie).

Pentru utilizarea cotelor standard, condiţia este ca datele brute să se distribuie aproximativdupă o distribuţie normală. Transformarea în cote standard şi cote standardizate este o transformareliniară, care schimbă doar media şi abaterea standard a rezultatelor, păstrând nemodificată repartiţiacotelor, deci ordinea indivizilor în eşantion.

Cotele standard şi cotele standardizate indică poziţia relativă a subiectului într-o populaţie şipermit compararea performanţelor unui individ la două sau mai multe teste dacă mediile şidispersiile scorurilor acestora au fost calculate pe baza aceluiaşi eşantion de persoane ( Albu, 1998).

Astfel, dacă la un test de matematică, un subiect obţine scorul brut egal cu 31 ( media pe eşantionfiind egală cu 30, iar abaterea standard cu 2), iar la un test de citire obţine un scor brut egal cu 35(media în acelaşi eşantion fiind 32, iar abaterea standard 3), se poate aprecia că elevul este mai bunla citire unde cota z = 1 decât la matematică unde z = 0.5.

Conform proprietăţilor distribuţiei normale, 68.26 % din populaţie se află în intervalul ± 1 σ;95 % din populaţie în intervalul ±1.96 σ, iar 99% din populaţie în intervalul ± 2.58 σ. Cunoscând căo persoană se găseşte în intervalul ± 1 σ, se poate spune că aproximativ două treimi din populaţieare acelaşi scor. Dacă un subiect are o cotă standard z = 0.72, se poate afirma că a obţinut unrezultat „obişnuit”, în timp ce o persoană cu o cotă z = 3.6 are un scor „neobişnuit de mare” ( maipuţin de 0.13% din subiecţii participanţi la etalonare au realizat un asemenea scor) (Albu, 1998).

Uneori, utilizarea cotelor z prezintă inconvenientul că acestea se exprimă prin numere cusemn şi zecimale, fiind cuprinse în intervalul [ -3; +3].

Page 58: Suport Curs Psihodiagnostic

Efectuarea unei transformări liniare asupra cotelor z duce la obţinerea cotelor standardizate.

Cotele standardizate au aceleaşi proprietăţi ca şi cotele standard z, singura diferenţă fiindvaloarea mediei şi a abaterii standard.

Cota standard z se transformă în cotă standardizată z’ cu ajutorul formulei:

z’ = M+σz

unde

z’ = cota transformată a cotei standard z

M, σ = media şi abaterea standard a cotelor standardizate

Cele mai cunoscute scale standardizate sunt:

1.scalele T (introduse de Mc Call în 1922), care au M = 50 şi σ = 10,

2.scalele H (Hull) unde M= 50 şi σ = 14 sau

3.scalele Z unde M=100 şi σ = 10

SCALA

N C WP L T Z QI H

Media 3 5 10 10 50 100 100 50

Ab. sta. 1 2 3 5 10 10 15 14

Dacă am dori să standardizăm o cotă standard z = – 1.25 pe baza scalei T, am apela laformula:

z’ = 50 + 10. (-1.25)

z’ = 50 – 12.5

z’ = 37.5

●Transformări în ranguri centile, decile şi cuartile

Transformarea în ranguri centile, decile şi cuartile este o transformare neliniară sautransformare de arie, care schimbă repartiţia cotelor brute, făcând-o să semene cu repartiţiauniformă.

Rangul centil se obţine prin împărţirea ansamblului de date ordonate în 100 de clase, fiecarecuprinzând 1% din efectivul total. Dar în practică este suficientă de cele mai multe ori împărţirea îndecile sau cuartile.

Decilarea este operaţia prin care împărţim ansamblul de date în 10 clase, fiecare cuprinzând10% din efectivul total. Cuartilele se obţin prin împărţirea în 4 a ansamblului de date. Se numeşte

Page 59: Suport Curs Psihodiagnostic

cuartil superior acea cotă sau valoare care are înaintea sa 25% din ansamblul de cote brute şi cuartilinferior reperul care are înaintea sa 75% din totalul cotelor brute. Cele patru cuartile se numesc:superior, median superior, median inferior şi inferior.

Vom prezenta în continuare un exemplu fictiv de transformare în decile a scorurilor brute, înurma aplicării unui test de atenţie concentrată unui eşantion de 180 de subiecţi, în vederea alcătuiriietaloanelor pentru testul respectiv.

Cotele brute la test, simplu ordonate de la cea mai mare valoare la cea mai mică obţinută,sunt prezentate în tabelul Tabelul 1 (vom prezenta direct şi frecvenţele absolute fa precum şi pe celecumulate fc pentru economie de timp):

Tabelul 1: Frecvenţe absolute şi relative

x 287 286 285 284 283 282 281 280 279 278 277 276 275 274 273 272 271 270fa 2 1 0 1 2 6 5 10 3 11 7 19 13 8 13 13 7 3fc 2 3 3 4 6 12 17 27 30 41 48 67 80 88 101 114 121 124

269 268 267 266 265 264 263 262 261 260 259 258 257 256 255 254 253 252 25110 8 7 2 6 4 4 3 3 0 0 1 1 0 0 0 1 0 1134 142 149 151 157 161 165 168 171 171 171 172 173 173 173 173 174 174 175

250 249 248

1 2 2

176 178 180

Primul decil este dat de cota acelui obiect care are înaintea lui 10% dintre subiecţiiexaminaţi, deci 180 : 10 = 18. Se caută cota celui de-al 18-lea subiect. Întrucât nu se regăseşte întabel, alegem cota cea mai apropiată, deci cota celui de-al 17-lea subiect, egală cu 281.

Prima clasă cuprinde toţi subiecţii având o cotă mai mare sau egală cu 281. Se observă căproporţia de 10% nu este perfect respectată.

Pentru a stabili cea de-a doua clasă, vom căuta frecvenţa cumulată cea mai apropiată de 2 x18, deci frecvenţa 36. Aceasta este de 41 iar cota brută corespunzătoare este 278. Cea de-a douaclasă cuprinde cotele 280, 279, 278.

Locul celui de-al doilea reper este 3 x 18, deci 54 ( frecvenţa cumulată cea mai apropiată 54,cota corespunzătoare este 277).

Page 60: Suport Curs Psihodiagnostic

A patra clasă: 4 x 18 = 72 ( frecvenţa cumulată cea mai apropiată este 67, scorulcorespunzător este de 276)

A cincea clasă: 5 x 18 = 90 (frecvenţa cumulată cea mai apropiată este 88, scorulcorespunzător este 275, 274)

A şasea clasă : 6 x 18 = 108, cotele corespunzătoare 273, 272

A şaptea clasă: 7 x 18 = 126, cotele corespunzătoare 271, 270

A opta clasă: 8 x 18 = 144, cotele corespunzătoare 269, 268

A noua clasă: 9 x 18 = 162, cotele corespunzătoare 267, 266, 265, 264

A zecea clasă va cuprinde toate cotele ≤263.

Rezultatele pot fi reprezentate astfel:

COTE DECILE

≥ 281 I

280279

278

II

277 III

276 IV

275274

V

273272

VI

271270

VII

269268

VIII

267, 266, 265, 264 IX

≤ 263 X

Transformarea în decile determină o distorsionare a datelor brute când acestea se încadreazăîntr-o distribuţie normală; decilele sunt mai apropiate între ele în jurul mediei şi mai spaţiate laperiferie, deci constituie o eroare însumarea rangurilor sau a decilelor şi determinarea unei mediiasupra lor ( Radu, 1993).

Page 61: Suport Curs Psihodiagnostic

Aurel Stan (2002) propune o metodă statistică prin testul χ2 de ajustare, prin care putemverifica dacă distanţa dintre efectivele observate (pe care le-am obţinut prin aproximare) şi celeteoretice ( care sunt ideale), este semnificativă.

Formula de calcul este:

å -=

ftftfo 2)(2c

f0 desemnează efectivele observate, adică numărul de scoruri brute pentru fiecare decil

ft sunt efectivele teoretice care sunt aceleaşi pentru fiecare decil şi care se obţin împărţind N la 10 (pentru că avem 10 trepte).

Pentru exemplul dat anterior, desfăşurarea procedurii χ2 de ajustare pentru obţinerea distanţei dintreefectivele teoretice necesare calculării decilelor şi cele observate practic, este redată în tabelulurmător:

Tabelul 2: desfăşurarea procedurii χ2 de ajustare

f0 ft f0- ft (f0- ft)2 (f0- ft)2/ ft

17 18 -1 1 0.05

24 18 6 36 2.00

7 18 -11 12 6.72

19 18 1 1 0.05

21 18 3 9 0.50

26 18 8 64 3.55

10 18 -8 64 3.55

18 18 0 0 0.00

19 18 1 1 0.05

19 18 1 1 0.05

Total: 16.52

Unde:

T = 180 iar ft = 180 : 10

Page 62: Suport Curs Psihodiagnostic

Pentru valoarea lui χ2 = 16.52, p ≥ 0.10, ceea ce ne determină la suspendarea ipotezei. Diferenţadintre cele două efective dată de valoarea lui χ2 fiind nesemnificativă, ne arată că efectiveleobservate pot fi utilizate pentru etalonare.

●Transformări în clasele scalei normalizate

Împărţirea în clase normalizate presupune împărţirea scorurilor brute nu în tranşe succesivegale ci în clase având efectivele conform frecvenţei distribuţiei normale.

Este tot o transformare neliniară care urmăreşte obţinerea unei scale cu 5, 7 sau 9 trepte.Valorile exprimate procentual pentru fiecare scală sunt:

- pentru 5 clase: 6,7%; 24,2%; 38,2%; 24,2%; 6,7%- pentru 7 clase: 4,8%; 11,1%; 21,2%; 25,8%; 21,2%; 11,1%; 4,8%- pentru 9 clase: 4%; 6,6%; 12,1%; 17,5%; 19,6%; 17,5%; 12,1%; 6,6%; 4%

Dacă considerăm scara normalizată cu 5 clase, prima clasă va conţine primele 6.7% din scorurilecele mai mici, a doua clasă următoarele 24.2%, etc.

Prima clasă va avea limita inferioară egală cu cel mai mic scor posibil, ultima clasă va avea limitasuperioară egală cu cel mai mare scor posibil.

Paşii urmaţi pentru a realiza transformarea scorurilor în clase ale unei scale normalizate ( cu5, 7 sau 9 trepte) sunt:

1. se aranjează scorurile de la cel mai mare la cel mai mic2. se stabileşte frecvenţa pentru fiecare scor3. se stabileşte frecvenţa cumulată4. se calculează procentul fiecărei clase5. se face corespondenţa scor – procent din distribuţia de frecvenţă cumulatăSă presupunem că un test a fost aplicat la 265 de persoane. Scorul maxim al testului este 40, iar

scorul minim este 9. Tabelul următor prezintă frecvenţa fiecărui scor şi frecvenţa cumulată.

Dorim să obţinem etalonul testului prin transformarea în clasa normalizată cu 5 trepte.

Tabelul 3: frecvenţele scorurilor şi frecvenţa cumulată

Scor brut Frecvenţa fiecărui scor Frecvenţa cumulată

40 1 139 2 3

38 2 5

37 4 9

Page 63: Suport Curs Psihodiagnostic

36 6 15

35 4 19

34 9 28

33 12 40

32 15 55

31 11 66

30 18 84

29 19 103

28 16 11927 19 138

26 20 158

25 15 173

24 12 185

23 14 199

22 11 210

21 11 221

20 6 227

19 8 235

18 6 241

17 5 246

16 5 25115 4 255

14 3 258

13 2 260

12 2 262

11 1 263

10 1 264

9 1 265

Pentru prima clasă se calculează limita inferioară:

Page 64: Suport Curs Psihodiagnostic

265 corespunde la 100% x corespunde la 6,7%

Cu regula de 3 simplă avem:

x= 6,7 * 265/ 100 = 17,75

Căutăm în rândul frecvenţelor cumulate (fc) frecvenţa cea mai apropiată de 17,75. Aceasta este19 şi vom reţine ca reper al scării cota 35.

Pentru a localiza al doilea reper al scalei se calculează:

6,7 + 24,2 = 30,9 % şi se aplică din nou regula de trei simplă:

x = 30,9 * 265/ 100 = 81,88

Valoarea cea mai apropiată din frecvenţele cumulate este 84, cota brută corespunzătoare este30. Cea de-a doua clasă cuprinde cotele brute în intervalul [34;30].

Se calculează mai departe al treilea reper:

30,9 + 38,2 = 69,1

x= 69,1 * 265/100 = 183,

deci cea de a treia clasă cuprinde cotele din intervalul [29 ; 24].

Cea de a patra clasă va cuprinde cotele din intervalul [23; 17], iar a cincea clasă va fi formată dinscorurile mai mici sau egale cu 17.

Rezultă următorul tabel de norme care oferă criteriile necesare pentru situarea unui individîn raport cu grupul de etalonare:

Tabelul 4: Tabel de norme

Clasa Cote

Page 65: Suport Curs Psihodiagnostic

I ≥ 35

II 34-30

III 29-24

IV 23-17

V ≤ 17

Când facem interpretarea calitativă a rezultatelor unui test, performanţa subiectului trebuiedescrisă în termeni concreţi. Putem „eticheta” clasele şi astfel clasa I să reprezinte „performanţăfoarte bună”, clasa a II-a „performanţă bună”, clasa a III-a „performanţă medie”, clasa a IV-a„performanţă slabă”, iar clasa a V-a „performanţă foarte scăzută”.

Nu se poate spune că unele tipuri de transformări sunt mai bune ca altele, specificul testului,a trăsăturii măsurate, impun alegerea celei mai bune metode de obţinere a etaloanelor.

Pentru a fi cu adevărat utile, normele testului trebuie să fie descrise detaliat în manualultestului, indicând descrierea populaţiei pentru care au fost construite, modul de formare aeşantionului, caracteristicile eşantionului (numărul de persoane, indicii tendinţei centrale şi aidispersiei, reprezentativitatea criteriilor şi dacă acestea influenţează rezultatele, erori posibile deeşantionare, etc.), condiţiile în care a fost aplicat testul, data testării.

Tabelul de norme este relativ la populaţia avută în vedere, mai ales dacă etalonul are ovaloare locală. Cu atât mai mult, nu se pot utiliza etaloane întocmite în alte ţări.

La anumite intervale de timp, testele trebuiesc re-etalonate. Programele statistice actualepermit actualizarea continuă a etaloanelor, o dată cu introducerea scorurilor subiecţilor testaţi înbaza de date.

Tabel de frecvenţe absolute şi relative

Tabel

x 287 286 285 284 283 282 281 280 279 278 277 276 275 274 273 272 271 270

fa 2 1 0 1 2 6 5 10 3 11 7 19 13 8 13 13 7 3

fc 2 3 3 4 6 12 17 27 30 41 48 67 80 88 101 114 121 124

269 268 267 266 265 264 263 262 261 260 259 258 257 256 255 254 253 252 251

10 8 7 2 6 4 4 3 3 0 0 1 1 0 0 0 1 0 1

Page 66: Suport Curs Psihodiagnostic

134 142 149 151 157 161 165 168 171 171 171 172 173 173 173 173 174 174 175

250 249 248

1 2 2

176 178 180

Capitolul VII

ASPECTE ETICE ALE EVALUĂRII PSIHOLOGICE

Examenul psihologic şi utilizarea testelor psihologice, dar şi orice acţiune pe plan psihologic, aunumeroase implicaţii sociale şi etice. Să ne imaginăm o situaţie de examen de selecţie profesionalăcând un funcţionar se prezintă cu un test psihologic cules dintr-o revistă de modă şi pretinde că doreştesă testeze inteligenţa candidaţilor; după examinare afişează o listă care reproduce o ierarhizare în bazaunor scoruri realizate de subiecţi (imaginea este cât se poate de reală, o întâlnim frecvent în cele maivariate locuri pe piaţa muncii). Ne confruntăm în acest caz cu o serie de erori grosolane şi abateri de lacele mai elementare reguli etice. Este vorba în primul rând de lipsa de calificare a funcţionarului încauză care nu are nimic comun cu psihologia. Asistăm la o utilizare abuzivă a unui instrumentarpsihodiagnostic alături de omiterea unor norme elementare ale respectării drepturilor omului.

Psihologia este o ştiinţă tânără care trebuie protejată de neştiutori şi de impostori. Pentru aceastamulte ţări şi-au elaborat un sistem juridic de protecţie, totodată fiind redactate norme etice şistandarde de utilizare a testelor psihologice şi practicare a psihologiei. Astfel de standarde au fostpublicate şi la noi în ţară.

Atunci când discutam despre implicaţiile sociale şi etice ale utilizării testelor psihologice, referirease face cu precădere la respectarea câtorva principii: calificarea examinatorului; calitateainstrumentelor şi procedurilor de măsură ; protecţia intimităţii subiectului ; confidenţialitatearezultatelor ; comunicarea rezultatelor testării; respectarea drepturilor minorităţilor. (Anastasi,1976;Gregory, 1992; Murphy & Davidshofer, 1991).

Calificarea examinatorului

Una din cerinţele fundamentale ale psihodiagnozei este ca testele să fie mânuite numai de unpersonal calificat. Aceasta este una din măsurile luate pentru a proteja subiecţii de unele abuzuricare pot fi comise cu ocazia examinărilor psihologice.

Page 67: Suport Curs Psihodiagnostic

Exemplu

O companie profilată pe proiectarea de produse informatice a organizat un examen pentru selecţiacandidaţilor. Examenul consta dintr-un test de cunoştinţe şi unul psihologic. În astfel de situaţii, celcare se ocupă de problema personalului este directorul de resurse umane, care, în cazul nostru, eraun economist. Acesta a alcătuit un test de cunoştinţe compus din 5 întrebări, cu 3 răspunsuri laalegere şi s-a hotărât să administreze un test de personalitate cunoscut în literatura psihologică subdenumirea de Testul Lüscher. Testele de cunoştinţe sunt importante în selecţia personalului calificatpentru a practica o profesie sau alta, dar construcţia lor necesită cunoştinţe vaste de didactică,psihologie, statistică, cunoştinţe profesionale (ne referim la profesia pentru care se face selecţia) şide metodologia construcţiei testelor de cunoştinţe (Albu, 1999; Albu & Pitariu, 1992). Aplicarea şiinterpretarea unui test de personalitate este un lucru dificil. În toată lumea este un fapt cunoscut şirespectat acela că terminarea unei specializari în psihologie nu-ţi dă dreptul utilizăriiinstrumentarului psihodiagnostic. Pentru aceasta sunt necesare cursuri speciale. Apoi, alegerea unuitest pentru a fi utilizat într-o acţiune de selecţie profesională presupune cunoaşterea noţiunilor devaliditate, fidelitate, standardizare şi a normelor de interpretare. În dicţionarul de psihologie al luiSillamy (1980) se face o descriere succinta a probei Lüscher, dar se specifică faptul că este dificil deinterpretat şi că acest test proiectiv nu este încă suficient de bine studiat sub aspect statistic. A-lutiliza în selecţie este deci o mare eroare, aceasta ţinând seama şi de conţinutul sau/şi fidelitatea sascăzută (alegerea culorilor este în funcţie de dispoziţie şi nu de o calitate stabilă de personalitate).Organizatorul examenului de selecţie ilustrat poate fi acuzat de impostură, de abuz în practicareaunei profesii pentru care nu are pregătirea necesară şi de lezare a personalităţii candidaţilor. Astfelde exemple sunt numeroase. Unele selecţii de personal se fac după metode extrem de ,,originale”: odiscuţie la un restaurant cu candidatul, maniera în care un candidat deschide uşa, felul în carecandidatul priveşte spre cel care face selecţia, utilizarea datelor din horoscop, analiza scrisului ori aliniilor din palmă etc.

În orice examen psihologic nu trebuie uitat că se lucrează cu subiecţi care se aşteaptă la nişterezultate obiective. Utilizarea abuzivă de teste şi testarea psihologică condusă de nespecialişti esteextrem de dăunătoare atât pentru subiect cât si pentru companie, şi anume în sensul că se ajunge lautilizarea unor informaţii false. Lipsa de cunoştinţe despre testele psihologice, vulgarizarea lor,interpretările eronate şi iluzia că oricine posedă un test îl poate şi administra şi interpreta a dus lamulte neînţelegeri cu privire la natura testelor şi utilitatea lor. Totodată, aceste false concepţiidespre teste şi examenul psihologic au generat numeroase critici şi revolte antitest.

Psihologii trebuie să-şi apere şi respecte profesia. Normele interne de protejare sunt bine puse lapunct, dar sunt cunoscute numai într-un cadru prea restrâns. Se impune o comunicare mai vie cupublicul larg, o educare a sa în ceea ce priveşte investigarea ştiinţifică a personalităţii şi investigareape care o fac persoanele neavenite care au alte specializări decât aceea de psiholog. Insuficientacomunicare ştiinţifică cu publicul a lăsat câmp liber de acţiune ziariştilor, impostorilor şi diletanţilorsă popularizeze un domeniu al ştiinţei pentru care nu au nici o pregătire.

Soluţia care adesea a fost propusă şi din ce în ce mai mult acceptată de numeroase state este cadreptul de profesare al psihologiei să fie acordat pe baza unor standarde de competenta, a unor

Page 68: Suport Curs Psihodiagnostic

licenţe acordate de forurile legale de control a activităţii psihologilor. Astfel, o companie sau unsubiect supus unui examen prin teste psihologice trebuie să poată controla competenţaexaminatorului. Orice violare a normelor etice de utilizare a testelor trebuie să conducă la sancţiunica orice fals, mergând până la retragerea dreptului de practicare a profesiei sau la pedeapsa conformcodului penal. Dovezi ale competenţei pot fi titlul de doctor, cel de absolvent al unui curs de ştiinţeaprofundate sau a unor cursuri pe o anumită problemă atestate printr-o diplomă. Simpla absolvire aunei facultăţi de psihologie este insuficientă.

Calitatea instrumentelor şi procedurilor de măsură

În general, distribuţia testelor psihologice este restrânsă la persoanele care au cel puţin un master înpsihologie sau cursuri echivalente ori focalizate pe o anumită problemă de psihodiagnoză.Cataloagele care prezintă teste psihologice specifică şi nivelul de competenta necesar cumpărării şiutilizării unui test psihologic. Pentru studenţii care utilizează teste psihologice, în multe ţări sepretinde de către distribuitorii de teste semnătura persoanei responsabile de activitatea studentuluirespectiv.

Un aspect important legat de utilizarea testelor şi procedurilor de testare psihologică se referă lacalitatea intrinsecă a acestora. În această idee, un test nu este lansat pe piaţă fără ca anterior acestasă nu fi fost verificat. Se pretinde ca orice test să fie deci însoţit de un manual de utilizare. Acestmanual trebuie să conţină:

Baza conceptuală a testului;

Datele psihometrice aferente construcţiei testului;

Norme şi standarde de interpretare;

Valoarea şi limitele testului în cauză;

Studii de caz, anexe cu studii de validare, studii critice etc.

Referitor la procedurile de testare psihologică se au în vedere câteva aspecte pe care le putemdihotomiza în: cerinţe vizavi de prezentarea testului şi cerinţe care au în vedere examenul propriu-zis de testare.

Orice examen psihologic trebuie pregătit. Această pregătire începe cu verificarea testului care va fiutilizat, nu sub aspectul datelor psihometrice, ci al felului în care acesta este prezentat subiecţilor(este vorba mai mult de o extensie a validităţii de aspect). Un test redactat neîngrijit, cu greşeli deortografie, pătat, cu figuri desenate eronat etc. va face o impresie proastă subiecţilor care nu se vorimplica în sarcină aşa cum se cere. Fireşte, performanţele vor fi afectate, va creşte nivelul anxietăţiivizavi de examenul psihologic.

Page 69: Suport Curs Psihodiagnostic

Derularea şi organizarea examenului psihologic sunt variabile care pot afecta performanţelesubiecţilor. Examenele psihologice improvizate în săli lipsite de mese, cu o luminozitate improprie,gălăgioase etc. vor conduce la distorsionarea rezultatelor. Uneori subiecţii sunt examinaţi la ieşireadin schimb, atunci când sunt deci obosiţi sau după o altă activitate obositoare. Din acest motiv esteindicat ca examenul psihologic să fie anunţat din timp, cu specificarea unor condiţii minime deconfort pretinse subiectului (să nu se prezinte la examen obosit, să nu fi consumat alcool etc. Uneleinstituţii pretind chiar semnarea unei declaraţii de către subiect în acest sens.).

În ultimul timp s-a sugerat posibilitatea efectuării examenului psihologic prin poştă. Aceasta este ogreşeală care contravine oricăror principii ale examinării psihologice. Testul psihologic esteadministrat de psiholog care, pe parcursul testării, are obligaţia să urmărească reacţiile subiectului.Da, există posibilitatea unei ,,testări oarbe”. Ea este posibilă în contextul în care se însuşesc uneletehnici de evaluare psihologică, deci în scop didactic. Un examen psihologic pretinde prezenţapsihologului.

Protecţia intimităţii subiectului

Cu ocazia unui examen psihologic se doreşte cunoaşterea personalităţii subiectului, se,,investighează” viaţa sa privată. Testele de personalitate fac foarte bine acest lucru, acesta fiind şiobiectivul utilizării lor. Utilizarea unor teste cum sunt cele de personalitate impun psihologuluiasumarea unei mari responsabilităţi şi o mare discreţie.

Psihologul are obligaţia să explice subiectului motivul examenului psihologic şi să obţină acordulacestuia de a se supune la test. Acelaşi lucru priveşte şi divulgarea rezultatelor testării psihologice.Iată demersul secvenţial al unei examinări psihologice în scop de selecţie profesională:

Se explică subiecţilor obiectivul general al examenului psihologic.

Se procedează la examinarea psihologică propriu-zisă. (Psihologul trebuie să se asigure că toţicandidaţii au înţeles instrucţiunile de lucru şi sştiu ce au de făcut.)

Se interpretează datele testării psihologice.

Se discută cu fiecare candidat rezultatul obţinut şi se cere acordul de a introduce sau nu rezultatul înbaza de date a companiei. Dacă răspunsul este ,,NU”, atunci protocoalele se distrug, iar dacărăspunsul este ,,DA”, datele examinării se stochează şi acestea pot fi utilizate în scopuriexperimentale sau cu ocazia iniţierii altor decizii de personal.

În mod obişnuit, trebuie evitată afişarea rezultatelor examenului psihologic. Formula recomandatăeste de a afişa numai numele persoanelor selectate, fără alte date care ar putea constitui o violare aintimităţii. Cei nereuşiţi la un examen de selecţie nici nu trebuie amintiţi. Acest lucru se impune maiales când sunt utilizate teste de inteligenţă sau de personalitate, etichetele nefiind indicate în acestecazuri deoarece i-ar putea leza pe unii subiecţi.

Page 70: Suport Curs Psihodiagnostic

Discreţia şi păstrarea anonimatului pacienţilor/ clienţilor sunt elemente care trebuie să caracterizezeactivitatea psihologului.

Confidenţialitatea rezultatelor

Confidenţialitatea este o problemă delicată. Întrebarea fundamentală care se pune în acest caz estecine are acces la datele examenului psihologic şi ce date poate să ofere psihologul?

Am subliniat mai înainte că rezultatele examenului psihologic (ne referim la cele legate deproblematica organizaţională şi nu la aceea specifică diagnozei clinice sau educaţionale) secomunică în primul rând subiectului. El are dreptul să-şi cunoască rezultatele performanţelor latestele de aptitudini şi de cunoştinţe. Cu el se pot iniţia şi unele discuţii pe marginea concluziilor latestele de personalitate. Tot el decide dacă rezultatele testării se vor comunica mai departe sau nu.

De fapt, rezultatele examenului psihologic sunt sintetizate într-un raport. Acesta este întocmit înconformitate cu solicitarea beneficiarului. Raportul trebuie redactat în termeni inteligibili, clar, fărăambiguităţi sau într-un jargon tehnic mai dificil de înţeles de nespecialişti. Datele comunicatetrebuie să reflecte obiectiv situaţia, observaţiile subiective şi părerile personale fiind evitate.Problema care se pune nu este atât de comunicare a rezultatelor examenului psihologic, ci amanierei în care trebuie să se facă această comunicare.

Utilizarea băncilor de date computerizate facilitează păstrarea confidenţialităţii examinărilorpsihologice. Companiile apelează tot mai frecvent la astfel de soluţii, psihologul fiind uniculrăspunzător de păstrarea securităţii datelor. Băncile de date au multiple avantaje, în sensul că elepermit stocarea unui volum mare de informaţii pe un spaţiu relativ restrâns, apoi permit regăsireauşoară a informaţiei căutate şi, de asemenea, derularea unor programe de cercetare utile.

Comunicarea rezultatelor testării psihologice

Niciodată rezultatele unui examen psihologic nu pot fi transmise sub forma lor brută, ci prelucrate şiinterpretate. Formula obişnuită de prezentare a acestora este sub formă de raport, aşa cum a fostmenţionat anterior. Datele conţinute în raport trebuie înţelese de către cel căruia îi este acestaadresat. Psihologul trebuie să fie foarte prevăzător şi atent la ceea ce comunică deoarece modul săude exprimare poate da naştere la confuzii. Astfel, mulţi consideră că valoarea unui IQ indică ocaracteristică fixă a individului care poate predetermina nivelul realizării sale intelectuale. Să nuuităm că performanţele la un test pot influenţa viaţa unui individ. Cunoaşterea rezultatelor la un testde cunoştinţe poate descuraja un student sau îl poate mobiliza; totul depinde de cum îi este pusăproblema.

Respectarea drepturilor minorităţilor

Page 71: Suport Curs Psihodiagnostic

Chiar dacă această problemă nu se pune cu deosebită acuitate la contextul nostru socio-cultural,problema discriminarii de sex, naţionalitate, vârstă etc. va deveni în curând un aspect cu care se vorconfrunta şi psihologii. În ceea ce ne priveşte, termenul de minoritate este luat într-un sens foartelarg, el definind un anumit grup, nu exclusiv etnic.

Condiţiile culturale specifice unei ţări se extind şi la domeniul psihologiei. Ele au preocupat multpsihologii. Problematica discriminării a fost una din punctele de atac vizavi de aplicaţiilepsihologilor americani în armată în timpul primului război mondial. Fiecare psiholog ştie că testelemăsoară diferite eşantioane comportamentale, ori aceste comportamente sunt determinate cultural.Aceasta este explicaţia multor diferenţe în ceea ce priveşte performanţele la testele de atitudini,valori, motivaţionale, de inteligenţă etc. O grijă deosebită a psihologilor se îndreaptă spretranspunerea testelor dintr-o cultura în alta. Dacă unui european i se dau probleme legat demăsurarea temperaturii în scala Fahrenheit şi nu în Celsius, el va întâmpina mari dificultăţi înrezolvare. Procedurile de adaptare privesc utilizarea unor tehnici ca analiza de conţinut, utilizareagrupurilor de experţi sau retroversiunea. Alături de aceste tehnici de lucru calitative au fostdezvoltate şi o serie de proceduri statistice mai mult sau mai puţin sofisticate. Dar problema cea maiacută se referă la interpretarea scorurilor de test. De pildă, dacă psihologul observă că la un test decomprehensiune verbală un grup minoritar obţine un scor mai mic decât altul, este firesc să-şi punăîntrebarea de ce s-a produs această diferenţă de performanţă? Cauza ar putea fi o insuficientăcunoaştere a limbii, carenţe educaţionale, o motivaţie scăzută sau alte cauze. În aceste cazuri,psihologul trebuie să opereze cu norme diferenţiate pe grupuri minoritare.

Orice testare psihologică are şi o anumită doză de subiectivitate. Putem fi chiar aşa de siguri cărezultatul unei selecţii profesionale confirmă reuşita profesională 100%? Răspunsul este categoric,,NU”. Dar ceea ce se poate afirma este faptul că o selecţie profesională realizată cu ajutorul testelorpsihologice poate aduce un câştig unei companii mai mare decât dacă nu se apelează la acest mijloc.Vom vedea în capitolul despre validitate care este contribuţia acesteia la predicţia succesuluiprofesional sau la sporirea obiectivităţii selecţiei profesionale.

Consecinţele sociale şi etice ale utilizării testelor şi testării psihologice în organizaţii, aşa cum s-aputut vedea, sunt mari. Psihologul are responsabilităţi majore faţă de materialul uman cu carelucrează. Acesta este motivul pentru care psihologia aplicată se impune să fie protejată de legi caresă nu permită impostorilor să se desfăşoare. Amatorismul, diletantismul şi impostura trebuie stopateîn psihologie de norme clare şi o legislaţie severă.