obrada podataka prvo predavanje.pdf

37

Upload: misao-osecanje-postupak

Post on 04-Oct-2015

227 views

Category:

Documents


0 download

TRANSCRIPT

  • Podaci mogu biti diskretni ili kontinuirani. 1. Kod diskretnih varijabli postoji ogranien broj vrednosti na

    skali, obino su to celi brojevi. Npr. broj dece u porodicama je 0, , , itd; broj golova na fudbalskoj utakmici moe da bude , 1, 2 itd.

    2. Kod kontinuiranih moemo zamisliti bilo koju vrednost izmeu najvie i najnie. Telesna visina cm; .; .: . itd., ali i kolske ocene ili )Q. Takoe, podaci mogu biti kvalitativni (kada se ispitanik po

    nekom svojstvu svrstava u odreenu kategoriju i kvanitativni kada se ispitaniku pridruuje odreeni broj u odnosu na stepen prisustva nekog svojstva).

  • Stenli Smit Stivens je bio psihofiziar koji je i u svojoj oblasti prouavanja imao uspeha (Stivensov zakon).

    Meutim, verovatno je nauveniji po svojoj operacionalistikoj teoriji merenja koja razdvaja 4 nivoa merenja. Ova teorija je danas

    sastavni deo nauke o merenju i koriste je sve

    nauke.

    etiri nivoa merenja ps Stivensu su: nominalni, ordinalni, intervalni i racio nivo merenja.

  • Osnovna operacija nominalnog nivoa je klasifikacija. Ovom operacijom se lanovi nekog uzorka svrstavaju u

    kategorije. Pravila: a svaki lan uzorka mora da bude klasifikovan u

    neku od kategorija i b ni jedan lan ne moe biti klasifikovan u vie od jedne kategorije Kategorije se mogu kodirati brojevima, ali broj predstavlja

    samo oznaku za ime kategorije. Odnosno: dodeljivanje brojeva kategorijama je arbitrarno. Primeri: zanimanje, vrsta kole, brano stanje, pol, itd.

  • Podrazumeva da se saini niz od lanova uzorka koji raste ili opada po svojstvu koje posmatramo.

    U psiholokim istraivanjima esto se koriste dva metoda: metod rangovanja svi lanovi uzorka se reaju u niz u skladu sa stepenom prisustva nekog svojstva) i metod poreenja po parovima porede se uvek dva lana uzorka po ispitivanom svojstvu sve dok se ne uporedi

    svaka kombinacija parova).

    Primeri: Mosova skala tvrdoe minerala, rangiranje hotela pomou zvezdica, klasifikacija naselja prema selu, varoi i gradu.

  • Na intervalnom nivou se ispitanici ponovo svrstavaju u niz po prisutnosti svojstva koje

    merimo ali je rastojanje izmeu svakog lana niza jednako.

    Ovde je potrbno konstruisati skalu merenja i podeok na njoj koji e sluiti da obelei odsustvo svojstva (nulu) iako ona ne mora biti

    objektivna ve proizvoljna. Jedinica merenja je takoe proizvoljna. Primeri: temperatura u stepenima Celzijusa ili

    Fajrenhajta

    Na kojoj se skali nalazi mera kolskog uspeha izraena ocenama od do ? Kakva mera je )Q?

  • Nulta taka racio mera nije proizvoljna, ve zaista obeleava stanje objekta u kom mereno svojstvo fiziki ne postoji. Meutim, merna jedinica i dalje moe biti

    proizvoljna! Primer: duina. Posledica postojanja prirodne nule jeste da na

    racio skali vae odnosi multiplikativnosti mnoenja i delenja. Primer: temperatura u Kelvinima, brzina.

  • Skala na kojoj se mere dobijaju prebrojavanjem elemenata skupa. Primer: broj dece u porodici, broj izreenih sudskih mera. Kojoj skali od prethodne 4 pripada prebrojavanje? Poto ima apsolutnu nulu, ona se moe svrstati u racio skale. Meutim, ako brojimo tane odgovore na nekom testu

    inteligencije mi brojimo zajedno odgovore i na teke i na lake zadatke. )zmeu tih zadataka oito nisu jednaki intervali, to znai da skor ispitanika na jednom testu inteligencije dobijen prebrojavanjem pripada ordinalnoj skali. Zbog ovih protivurenosti se prebrojavanju objekata

    pridruila zasebna skala merenja: apsolutna.

  • Svaki nivo merenja opisuje razliite vrste podataka

    U skladu sa odreenim nivoom merenja mi moemo i vriti odreene statistike operacije na podacima

    Primer: ako imamo podatak nominalnog nivoa, mi moemo raunati frekvence ili procente. Ali ne moemo raunati prosek ili odstupanja mera od proseka!

  • Nacrt u kome postoje dve ili vie grupa Grupe moe formirati istraiva tako to ispitanike

    svojevoljno postavlja u njih i varira dejstvo

    nezavisne varijable: eksperimentalni nacrt

    Grupe mogu biti ve formirane, npr. kad istraiva ispituje grupu osoba sa nekim specifinim obelejem recimo uzorak selektovan iz klinike populacije) i poredi njihove rezultate sa kontrolnom

    grupom: kvazieksperimentalni nacrt

  • Nacrt u kome nema grupa ve se prouava zajedniko kovariranje varijabli kako bi se utvrdila njihova povezanost

    Cilj istraivanja esto jeste da se variranje jedne varijable predvidi kriterijum pomou jedne ili vie drugih varijabli (prediktori)

    Tipovi: 1) analiza povezanosti dve varijable: korelacija; 2) analiza povezanosti jedna variajble i

    skupa drugih varijabli: regresija; 3) analiza

    povezanosti dva skupa varijabli: kanonika korelaciona analiza ili strukturalno modeliranje

  • Kada prediktorsku i kriterijumsku varijablu merite preko istog metoda (recimo upitnikom

    samoprocene) imate unimetodski nacrt.

    Ako varijable merite pomou razliitih metoda (upitnici samoprocene, rejting mere,

    objektivna ponaanja, testovi imate multimetodski dizajn.

    Kad god moete merite varijable pomou vie metoda: to doprinosi validnosti studije i

    pozdanosti zakljuaka.

  • Veliina efekta je intenzitet delovanja nezavisne varijable na zavisnu ili intenzitet povezanosti dve

    varijable

    Veliina efekta zavisi od stvarnog uticaja ili povezanosti dve varijable

    Meutim, veliina efekta zavisi od metoda: da li se koriste dovoljno pouzdane mere (recimo

    upitnici) 2) da li je nacrt uni ili multimetodski.

    Ukoliko je nacrt unimetodski, dobijeni efekat je

    vei usled metodske kovarijanse.

  • Deskriptivna statistika predstavlja set procedura pomou kojis se dobijeni numeriki podaci sreuju i klasifikuju a potom jasno prikazuju kako bi se bolje

    razumeli. Osnovni parametri koje ona koristi su:

    frekvence, procenti, mere centralne tendencije

    (prosek, mod, medijana) i mere varijabilnosti

    (disperzija, standardna devijacija).

    Inferencijalna statistika predstavlja set procedura pomou kojih se preko mera dobijenih na jednoj grupi ispitanika (uzorku) zakljuuje o stanju koje postoji u populaciji.

  • Parametrijska statistika predstavlja set procedura koji se

    upotrebljava radi obrade onih

    podataka za koje se smatra da

    se normalno distribuiraju u

    populaciji (pa i u ispitivanom

    uzorku).

    Neparametrijska statistika predstavlja set procedura koji se

    upotrebljava radi obrade

    podataka koji se ne distribuiraju

    normalno u populaciji.

  • Statistike hipoteze: formalno iskazane pretpostavke o vrednosti odreenih parametara populacije Statistike hipoteze su veoma sline

    istraivakim hipotezama. Razlika je to su statistike hipoteze iskazane formalnim statistikim jezikom (npr: homogenost varijansi u dve grupe e biti razliita a istraivake se iskazuju pomou terminologije koja vai u nekoj disciplini (npr: individualne razlike u nacionalizmu e biti razliite u dve grupe.

  • Nulta hipoteza (H0): pretpostavka da je neki parametar od znaaja u populaciji jednak nuli. Alternativna hipoteza (HA): pretpostavka da

    se neki parametar od znaaja u populaciji razlikuje od nule.

    Ove dve hipoteze moraju biti meusobno iskljuive: ako se jedna od ovih hipoteza potvrdi onda je druga oborena.

  • . Razlike u inteligenciji izmeu mukaraca i ena: H0 razlika izmeu grupa je nulta ne postoji; (A

    razlika izmeu grupa je razliita od nule. )li jo preciznije: AS je znaajno vea u odreenoj grupi.

    2. Obrazovanje i uspeh na testu inteligencije: H0 povezanost izmeu obrazovanja i uspeha na testu

    inteligencije ne postoji (jednaka je nuli); HA postoji znaajna povezanost izmeu obrazovanja i uspeha na testu inteligencije. )li jo preciznije: postoji pozitivna povezanost izmeu obrazovanja i uspeha na testu inteligencije to je vee obrazovanje, vei je uspeh na testu).

  • Koliko mora da bude mala verovatnoa da testni statistik uzme odreenu vrednost pri kojoj mi moemo da odbacimo nultu hipotezu? Najee se uzima da verovatnoa od p=.

    predstavlja dovoljno nisku verovatnou vrednosti test statistika. Ako se dobije ova ili nia verovatnoa (p

  • Prvi tip greke greka: odbacivanje tane nulte hipoteze. Verovatnoa ove greke zavisi od a priori

    verovatnoe koja je odabrana za odbacivanje nulte hipoteze. Najee se koriste tri verovatnoe: p=.;

    p=0.01 i p=0.001. Ove verovatnoe se nazivaju intervali poverenja

    ili nivoi znaajnosti. to je dobijeni nivo znaajnosti nii, nia je i

    verovatnoa prvog tipa greke.

  • Drugi tip greke greka: neodbacivanje nulte hipoteze a da je ona ipak pogrena. Npr. ta da radite ako dobijete verovatnou test

    statistika od p=.. Verovatnoa je niska ali ipak ne prelazi prvi nivo znaajnosti od p

  • Statistika snaga testa znaajnosti je dugorona verovatnoa - kada su date populacijska veliina efekta, nivo alfa greke i broj ispitanika - odbacivanja pogrene (0.

  • broj entiteta (npr. ljudi) u studiji

    mera distance izmeu (0 i H1 verovatnoa da je opservirani

    efekat sluajan verovatnoa registrovanja

    postojeeg efekta

    Veliina uzorka Veliina efekta

    Alfa greka

    Snaga

  • n = f(veliina efekta, alfa, snaga) Veliina efekta = f(n, alfa, snaga) alfa = f(n, veliina efekta, snaga) snaga = f(n, veliina efekta, alfa)

  • . Poveati broj ispitanika u uzorku/uzorcima . Poveati oekivanu razliku pojaavajui

    eksperimentalnu manipulaciju, ili pravei snaniji kontrast izmeu eskperimentalnih uslova

    . Korititi pretest/ponovljena merenja, to smanjuje greku u formuli za izraunavanje veliine efekta

    ES=(m1-m2)/s - neponovljeno merenje

    ES=(m1-m2)/s((1-r2)1/2) - ponovljeno merenje

  • . Varirati alfa greku ukoliko logika studije to dozvoljava: a) Ukoliko klasifikacija ljudi u grupe nije sasvim precizna b) Merni instrumenti nemaju dovoljno dobre metrijske

    karakteristike c) Ukoliko se oekuju slabi efekti/razlike d) U zavisnosti od konsekvenci naih odluka korist, eliminacija

    patnje, sporednih efekata)

    . Koristiti jednosmerne testove znaajnosti . Smanjiti varijabilitet greku u studiji koliko je to mogue

    (npr. smanjenjem heterogenosti procedura u tretmanu, ili smanjenjem heterogenosti grupa u tretmanu)

  • Uraditi deskriptivnu statistiku: a) za nominalne varijable frekvence, procenti i mod kao

    mera centralne tendencije i mogue raspon kao mera varijabiliteta;

    b za ordinalne varijable mogue raunati medijanu c za intervalne varijable i vie nivoe merenja mogue

    je raunati sve statistike: mod, medijana, aritmetika sredina, standardna devijacija, raspon, minimum, maksimum, skjunis i kutrozis

    Grafiki predstaviti rezultate ukoliko je potrebno

  • Utvrditi da li postoje autlajeri u podacima i kakve su oni prirode da li su u pitanju greke ili stvarne ekstremne vrednosti)

    Utvrditi normalnost raspodele intervalnih varijabli pomou Kolmogorov-Smirnov testa Ukoliko neka od varijabli nije normalno

    raspodeljena moe se normalizovati Blom i Rankit algoritmi)

  • Ukoliko je potrebno utvrditi znaajnost razlike frekvenci izmeu dve ili vie kategorija nominalne varijable radi se test. Ako varijabla ima vie od kategorije moraju se raditi dodatni testovi za utvrivanje razlika izmeu svake od njih. Ukoliko je potrebno utvrditi povezanost

    izmeu dve nominalne varijable rauna se Koeficijent kontigencije.

  • Ukoliko je potrebno utvrditi znaajnost razlike na intervalnoj varijabli izmeu dve grupe radi se t-test. Prvo gledati Leveneov

    statistik i u odnosu na njega posmatrati

    odgovarajuu vrednost t-testa.

  • Ukoliko kategorika varijabla ima vie od dva nivoa sprovesti ANOVU. Podesiti izraunavanje deskriptivne statistike,

    homogenosti varijansi izmeu grupa Leveneov test i Welchov statistik (robusni procenitelj efekta faktora). Welcha gledati samo na varijablama na kojima je Leveneov statistik znaajan. Podesiti post-hoc testove. Sidak i LSD za manje

    uzorke i slabije efekte faktora; Scheffe i Bonferoni za stroije testiranje. Podesiti testove za sluaj da na varijabli ne postoji homogenost varijansi (Tamhane-T2).

  • Ukoliko je barem jedna varijabla ordinalne prirode raunati Spirmanov koeficijent korelacije

    Ukoliko su obe varijable intervalne prirode raunati Pirsonov koeficijent korelacije

  • Ukoliko je potrebno predvideti vrednost jedne varijable na osnovu nekoliko drugih

    varijabli uraditi linearnu regresiju.

    Gledati R za interpretaciju procenta objanjene varijanse kriterijuma a koeficijenta i njihovu znaajnost za evaluaciju nezavisnih doprinosa svake varijable

    predikciji.