aðferðafræði ii 17-10-2013

54
Aðferðafræði II 17-10-2013 Upptaka 6 Kafli 8 Stefán Hrafn Jónsson 11

Upload: trent

Post on 24-Feb-2016

107 views

Category:

Documents


2 download

DESCRIPTION

Aðferðafræði II 17-10-2013. Upptaka 6 Kafli 8 Stefán Hrafn Jónsson. Dagskráin í dag og næstu daga. 16.10 Kafli 8 Stefán Hrafn 17.10 Kafli 8. Aníta 23.10 Upphaf kafla 9. Stefán Og t æknileg atriði við próftöku 24.10 Próf í kennslustofu í tíma í stofu HT 105. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Aðferðafræði II 17-10-2013

Aðferðafræði II17-10-2013

Upptaka 6Kafli 8

Stefán Hrafn Jónsson

11

Page 2: Aðferðafræði II 17-10-2013

Dagskráin í dag og næstu daga

• 16.10 Kafli 8 Stefán Hrafn• 17.10 Kafli 8. Aníta• 23.10 Upphaf kafla 9. Stefán– Og tæknileg atriði við próftöku

• 24.10 Próf í kennslustofu í tíma í stofu HT 105. – Þröngt verða sáttir að sitja

2

Page 3: Aðferðafræði II 17-10-2013

Kafli 8 í dag• Um upptökur o.fl.• Tilgátuprófun– Dæmi bls 183 (mean, one sample)– Fimm skref tilgátuprófunar– Dæmi bls 205 (proportion, one sample) (ekki í

upptöku)Lykilatriði að vita hvort við erum með eitt eða fleiri úrtök– Dæmi á töflu og í Socrative– Spurningar og svör (QA)

3

Page 4: Aðferðafræði II 17-10-2013

Á morgun

• Aníka– T dreifingin– Að velja alpha mörk• Type I error• Type II error

– Annað

4

Page 5: Aðferðafræði II 17-10-2013

Höfundaréttur

• Þessar glærur og þessi upptaka er aðeins ætlaðar til notkunar í kennslu og námi í Félags og mannvísindadeild Háskóla Íslands í námskeiðinu:

• Allur réttur áskilinn, Stefán Hrafn Jónsson• Notkun fyrir önnur námskeið eru háð skriflegu

leyfi kennara

Page 6: Aðferðafræði II 17-10-2013

GefiðMeðaltal í þýði 140 krStaðalfrávik í þýði 30 krÚrtak N = 100Einfalt tilviljunarúrtak

Samkvæmt central limit theorem þá er meðaltal úrtakadreifingarinnar 140, sama og í þýði . Staðalfrávik úrtakadreifingar er 3 og er reiknað frá staðalfráviki þýðis deilt með kvaðratrót af úrtaksstærð eða 30/10 (kvaðrat rót af 100 er 10)

143 er eitt staðalfrávik (úrtakadreifingar) fyrir ofan meðaltal 137 er einu staðalfrávíki fyri neðan meðaltal.

Eitt staðalfravik er oft birt sem eitt Z gildiGefiðMeðaltal í þýði 140 krStaðalfrávik í þýði 30 krÚrtak N = 100

Spurt er: Hverjar eru líkurnar á að eitt úrtak af stærð 100 úr þessu þýði gefi meðaltal sem er á bilinu 134 til 146?

Lykill hér að vita að 134 er tveimur staðalfrávíkum undir meðaltali. Hér erum við að tala um er staðalfrávikum úrtakadreifingar. Tvö staðalfrávik undir meðaltali jafngildir -2 (tveimur) Z gildum

Við þurfum oft að reikna þetta Z gildi með formúlu (sjá síðar)

6

Page 7: Aðferðafræði II 17-10-2013

• H0 : Núlltilgáta– Segir að enginn munur sé á meðaltölum í þessum

2 þýðum– Munur sem fram kemur er tilkominn vegna

tilviljunarúrtaks

• H1 : Rannsóknartilgáta– Segir að munur sem kemur fram sé tilkominn

vegna þess að það sé raunverulegur munur á meðaltölum í þessum tveimur þýðum.

7

Page 8: Aðferðafræði II 17-10-2013

Svör dæmi 8.1• Alpha Form Z(critical)

• .05 Einhliða Rétt svar er 1,65

• .10 Tvíhliða Rétt svar er 1,65

• .06 Tvíhliða Rétt svar er 1,88

• .01 Einhliða Rétt svar er 2,33

• .02 Tvíhliða Rétt svar er 2,33

•SP8.1b

•Alpha Form N (fjöldi í þýði) t(critical)

• .10 Tvíhliða 31 Rétt svar er 1,697

• .02 Tvíhliða 24 Rétt svar er 2,492

• .01 Tvíhliða 121 Rétt svar er 2,617

• .01 Einhliða 31 Rétt svar er 2,457

• .05 Einhliða 61 Rétt svar er 1,671

8

Page 9: Aðferðafræði II 17-10-2013

• Einhliða og tvíhliða próf

9

Page 10: Aðferðafræði II 17-10-2013

Kafli 8

• Ýmist notast við Z próf eða t-próf– Z próf er einfaldara og því reiknað þegar það á við

sérstaklega í höndunum. – Notum t-próf (one sample t-test) þegar við vitum

ekki sigma (staðalfrávik þýðis) og þegar N < 100

– Í SPSS notum við nánast alltaf t-próf því Z og t-próf renna saman þegar N > 100 (sumir miða við 120)

10

Page 11: Aðferðafræði II 17-10-2013

Klára 8. kafla með formúlu á tússtöflu

• Z obtained for proportions• Ef við vitum hlutfall í þýði og viljum vita hvort hópur (annað þýði,

undirhópur) er með annað hlutfall þá er þessi formúla notuð (teikna á tússtöflu):

• Zreiknað=Ps-Pu /(SQR(Pu(1-Pu)/N)

• Dæmi bls. 205

• Z er reiknað þegar N er stórt. Bókin glímir ekki við próf fyrir hlutföll með smáu N þess vegna sleppum við því líka.

11

Page 12: Aðferðafræði II 17-10-2013

8. kafli• Öll grunnatriði í marktektarprófum kynnt í kafla 8.

• Núlltilgátan segir að ekki sé munur. Hvort heldur sem um er að ræða hlutföll eða meðaltöl

• Flest tölfræðipróf felast í að finna líkurnar á niðurstöðu úrtaks komi fram ef núlltilgátan er rétt.

• Fimm skrefa ferlið er grunnur af tölfræðiprófum í námskeiðinu og bókinni. – Breytilegt frá einu próf til annars hvað fer í hvert skref.

• Ef við getum spáð fyrir um stefnu sambandsins (a er hærri en b) frekar er bara að það sé munur (a er ekki jafnt og b) þá erum við með einhliða próf (one tail test).

12

Page 13: Aðferðafræði II 17-10-2013

8. kafli

• Rannsakandi getur gert tvennskonar villur (í viðbót við klaufavillur) í tilgátuprófum– Alpha (tegund 1) villu þegar við höfnum núlltilgátu

þegar hún er rétt . Höfnunarvilla– Beta (tegund 2) villu þegar við höfnum ekki

núlltilgátu þegar hún er röng. Fastheldnisvilla

13

Page 14: Aðferðafræði II 17-10-2013

• Fjalla almennara um tilgátuprófun• Fimm skref tilgátuprófunar• Z(vendi) og Z(reiknað)• Einhliðapróf og tvíhliðapróf• Type 1 (alfa) og Type 2 (beta) error – Höfnunarmistök og fastheldnimistök

14

Page 15: Aðferðafræði II 17-10-2013

Upprifjun

• Við notum kenninguna um úrtakadreifingu sem grunn til að meta líkur á að úrtak komi úr tilteknu þýði eða ekki.

• Eða hvort tveir hópar (tvö úrtök) komi úr sama þýði

• Við notum það til að meta hvort tölfræðilega marktækur munur sé á milli hópa

15

Page 16: Aðferðafræði II 17-10-2013

Við byrjum á því að reikna

• Tölfræðipróf fyrir einn hóp. One sample • Meðaltal eins úrtaks borið saman við meðaltal

þýðis þegar það er vitað. • Afar sjaldgæft að við vitum meðaltal þýðis • Gagnlegt að byrja á einföldu prófi sem fyrsta

skref inn í heim tilgátuprófunar

16

Page 17: Aðferðafræði II 17-10-2013

Tilgátuprófun

• Tilgátuprófun hjálpar okkur að að álykta um mælanlegan mun milli hópa

• Nokkur dæmi:• Gengur stúlkum betur í námi en piltum?• Líður börnum einstæðra forledra verr í skóla

en börnum þar sem tveir forledrar eru í heimili?

• Eru karlar með hærri laun en konur?– Eða er þetta bara flökt í úrtaki?

17

Page 18: Aðferðafræði II 17-10-2013

• Eru börn unglingsmæðra líklegri til að eignast börn á unglingsárum en aðrir?

• Er sálfræðiaðtoð árangursríkari en læknisaðstoð sem meðferð við depurð?

• Er dánartíðni hærri í löndum þar sem ríkir ójöfnuður?

18

Page 19: Aðferðafræði II 17-10-2013

Úrtakadreifing, Z gildi og krónur

19

Page 20: Aðferðafræði II 17-10-2013

• Ef við tökum eitt úrtak N=100, hverjar eru líkurnar á því að þetta eina úrtak sé með meðaltal: – Lægra en 134 kr?– Hærra en 146 kr?– Annað hvort lægra en 134 kr eða hærra en 146kr. – Hærra en 149 kr?– Lægra en 128 kr?

20

Page 21: Aðferðafræði II 17-10-2013

Tilvísun í úrtak björgunarsveitarfólksog aldur Íslendinga frá í síðasta tíma.

Ef við vitum meðaltal og staðalfrávik í þýði þá getum við metið líkur þess að eitt tiltekið úrtak sem við tökum komi úr þessu tiltekna þýði. Við setjum fram tvær tilgátur sem skýringu þess að meðaltal úrtaks (úrtak björgunarsveitar-manna) er annað en meðaltal þessa tiltekna þýðis (allra Íslendinga).

21

Page 22: Aðferðafræði II 17-10-2013

H1 og H0

• Fyrri tilgátan, rannsóknartilgátan, H1, er að það sé raunverulegur aldursmunur á félögum í björgunarsveit og fullorðnum Íslendingum.

• Seinni tilgátan, núlltilgátan, H0 er að það sé enginn raunverulegur munur heldur sé sá munur sem mælist hafi tilkomið vegna tilviljunar.

22

Page 23: Aðferðafræði II 17-10-2013

Tilgátuprófun

• Gengur út á að reyna að hafna H0

• Ýmist hafnar rannsakandi H0 eða tekst ekki að hafna H0

• Ef að það eru litlar líkur á að H0 sé sönn (minni líkur en alfamörkin. Alfa er oft 0,05) – Ef það eru minni en 5% líkur á að eitt úrtak úr

þessu þýði sé með svo hátt eða látt meðaltal• þá höfnum við núlltilgátunni.

23

Page 24: Aðferðafræði II 17-10-2013

Fimm stig tilgátuprófunar

• 1. Setjum fram forsendur okkar. Könnum hvort kröfum tölfræðiprófs séu fullnægt.

• 2. Setjum núlltilgátu fram með formlegum hætti

• 3. Veljum úrtakadreifingu og finnum critical region, höfnunarsvæði. Sem dæmi, þá er höfnunarsvæði það svæði úrtakadreifingar sem er handan (beoynd) 1,96 eða -1,96

24

Page 25: Aðferðafræði II 17-10-2013

• 4. Reikna prófið• 5. Taka ákvörðun og túlka niðurstöður prófsins

25

Page 26: Aðferðafræði II 17-10-2013

1. Forsendur og kröfur prófsins

Er t.d. meðaltal við hæfi fyrir þessa breytu.Er úrtakið tilviljunarúrtak? (random)Er N nægilega stórt fyrir þetta tiltekna próf? Vitum við meðaltal þýðis og staðalfrávik þýðis?

26

Page 27: Aðferðafræði II 17-10-2013

Setjum fram tilgátur

Dæmi í bók: H0 : μ = 7.2H1 : μ ≠ 7.2

Dæmi úr síðasta tíma:H0 : μ = 45,47H1 : μ ≠ 45,47

27

Page 28: Aðferðafræði II 17-10-2013

Veljum úrtakadreifingu og finnum höfnunarsvæði

• Ef við styðjumst við normaldreifinguna þá er svokallað Z-próf við hæfi

• Stærð höfnunarsvæðis er jöfn alfa. • Z critical = er það Z gildi sem afmarkar

höfnunarsvæði. • Z critical er nefnt Z (vendi) á íslensku• Z (vendi) er 1,96 ef við erum með alfa mörk =

0,05 og tvíliða próf

28

Page 29: Aðferðafræði II 17-10-2013

Einhliða eða tvíhliðapróf?

Dæmi um tvíhlíðapróf H1 : μ ≠ 7,2 (þ.e. μ er annað hvort hærra eða lægra en 7,2, tvær áttir)

Dæmi um einhliðaprófH1 : μ 〉 7.2

Annað dæmi:H1 : μ 〈 7.2

29

Page 30: Aðferðafræði II 17-10-2013

Reiknum prófið

• Í þessum kafla reiknum Z gildi og berum saman við Z(vendi).

• (formúla 8.1 í kennslubók, bls 186)

• Z (reiknað)=

• Berum Z(reiknað) saman við Z(vendi)

30

Page 31: Aðferðafræði II 17-10-2013

• Ef Z (reiknað)er handan Z (vendi) (beyond) – Það er lægri ef við erum með Z (vendi) sem er mínus

tala [t.d. Z (vendi) = -1,65]– Hærri ef við erum með Z (vendi) sem er plústala

• Ef Z (reiknað)er handan Z (vendi), þá er H0 hafnað og ályktað að úrtakið sé tekið úr öðru þýði en það sem borið er saman við

• Þá er um tölfræðilega marktækan mun að ræða. • Marktækur munur á meðaltali þýðis og meðaltali

úrtaks. 31

Page 32: Aðferðafræði II 17-10-2013

Tökum ákvörðun

• Ef Z (reiknað)er handan (beyond) Z (vendi) þá– lendir prófgildi á höfnunarsvæði– höfnum við núlltilgátu

Túlkun felur í sér tilvísun í hvort það sé tölfræðilega marktækur munur á hópum og að úrtakið sé þar með ekki tekið úr sama þýði

32

Page 33: Aðferðafræði II 17-10-2013

Table 8.1

• Ef gildi prófsins (test statistics) er í höfnunarsvæðinu, (handan Z (vendi)) þá höfnum við H0, núlltilgátu, munurinn er tölfræðilega marktækur

• Ef gildi prófsins (test statistics) er ekki í höfnunarsvæðinu, (ekki handan Z (vendi)) þá höfnum við ekki H0, núlltilgátu, munurinn er ekki tölfræðilega marktækur

33

Page 34: Aðferðafræði II 17-10-2013

Einhliða eða tvíhliða próf

• Alfa segir til um stærð critical region• Höfnunarsvæði er = alfa.– T.d. Ef alfa er = 0.05 þá er höfnunarsvæðið 5% af

flatarmáli undir kúrfunni• Staðsetning höfnunarsvæðis (critical region)

ræðst af því hvort við erum með einhliða eða tvíhliða próf.

• Við munum að tvíhliðapróf með alfa = 0.05 afmarkast af tveimur Z gilduM [Z (vendi)], þ.e. 1,96 og -1,96

34

Page 35: Aðferðafræði II 17-10-2013

Hér er höfnunarsvæðinu, 0,05 skipt á 2 hliðar kúrfunnar, því tvíhliðapróf

• Þá er Z (vendi), -1,96 og +1,96

35

Page 36: Aðferðafræði II 17-10-2013

36

Page 37: Aðferðafræði II 17-10-2013

Þegar við erum með einliðapróf

• Þá er allt höfnunarsvæði sömu megin, á einni hlið normalkúrfunnar.

Þá erum við bara með Z (vendi) Öðru megin, og því miðum við líka við annað gildi. Það er það Z gildi sem gefur area beyond Z = 0,05

37

Page 38: Aðferðafræði II 17-10-2013

Bls 193 tafla 8.2

H1 : μ ≠ Tvíhliða H1 : μ 〉 EinhliðaH1 : μ 〈 EinhliðaEf alfa = 0.05H1 : μ ≠ þá er Z (vendi) = +/- 1,96H1 : μ 〉 þá er Z (vendi) = + 1,65H1 : μ 〈 þá er Z (vendi) = - 1,65

38

Page 39: Aðferðafræði II 17-10-2013

Tafla 8.3 bls 193 sýnir Z(vendi)

• Fyrir önnur alfa mörk. T.d. 0,1 0,01 0,001

39

Page 40: Aðferðafræði II 17-10-2013

Dæmi úr bók bls 193

• Meðaltal allra nemenda í tilteknum skóla er 17,3 og staðalfrávik (þýðis) er 7,4.

• Meðaltal 100 félagsfræðinemenda mælist 19,2

• Mæling á sophistication (líklega tilbúið dæmi)

40

Page 41: Aðferðafræði II 17-10-2013

Fimm skrefa tilgátuprófun

• 1. Forsendur: Það er búið að reikna meðaltal þannig við gerum ráð fyrir að um sé að ræða jafnbila-hlutfallskvarða

• Úrtakið er 100 því getum við gert ráð fyrir að úrtakadreifing sé normaldreifð samkvæmt central limit theorem. (Úrtakið nægilega stórt)

41

Page 42: Aðferðafræði II 17-10-2013

2. Setja fram 0 tilgátu

• H0 : μfélagsfr = 17,3• H1 : μfélagsfr 〉 17,3

• Það er í raun skylda að setja fram tilgátu áður en meðaltal hóps er reiknað.

42

Page 43: Aðferðafræði II 17-10-2013

3. Velja úrtakadreifingu og skilgreina höfnunarsvæði

• Við lögðum af stað með alfa = 0,05• Áður samþykktum við að úrtakadreifing væri

normaldreifð• Prófið er einhliða (H1 er með stefnu í eina átt)• Þá er Z (vendi) = 1,65 (sjá töflu 8,2)

43

Page 44: Aðferðafræði II 17-10-2013

4, reiknum prófið (z próf)

• Reiknuð (reiknað)• Z obtained

• (19,2-17,3) / (7,4 * 10) = 2,57• 10 er kvaðrat rót af 100

• Er Z (reiknað) stærra eða minna en Z (vendi)?

44

Page 45: Aðferðafræði II 17-10-2013

Tökum ákvörðun

• Z (reiknað)er stærra en Z (vendi)– Félagsfræðinemar í þessu dæmi eru því marktækt

hærri á þessum ágæta kvarða en nemendur skólans. Þeir eru hærri að meðaltali.

45

Page 46: Aðferðafræði II 17-10-2013

Að velja alfa mörk

• Þegar við höfnum núlltilgátu þá erum við að segja að niðurstaða (t.d. meðaltal úrtaks) sé mjög ólíklega komið úr tilgreindu þýði

• Með því að velja alfamörk þá erum við að segja hvað við eigum við með óliklegt

• Við gætum í 5% tilfella verið að hafna H0 tilgátu þegar tilgátan er í raun og veru sönn.

46

Page 47: Aðferðafræði II 17-10-2013

• Af hverju ekki að lækka alfamörk og minnka líkur á að við gerum þessi mistök?

• Því þetta eru ekki einu mistökin sem við getum gert í tilgátuprófun

• Tafla 8,5

47

Page 48: Aðferðafræði II 17-10-2013

Ákvörðun prófs Ef núlltilgáta er í raun og veru

Hafna Hafna ekki (fail to reject)

Sönn Type 1, alfa error OK Röng OK Type II eða beta error

Við getum ekki samtímis minnkað líkur á að Villa af gerð 1 komi fram og líka minnkað líkur á að villa 2 komi fram

48

Page 49: Aðferðafræði II 17-10-2013

Normaldreifingin er ekki eina dreifingin

• Dreifingin sem lýsir úrtakadreifingu. • t-dreifing ef N er lægra en 100. • t-dreifing tekur breytingum eftir því hversu

úrtakið er stórt. • Þegar úrtak er stórt eru t-dreifing og Z-dreifing

nánast eins • Þess vegna er oft reiknað t-próf sama hvað

úrtakið er stórt

49

Page 50: Aðferðafræði II 17-10-2013

t-dreifing

• Er breytileg eftir úrtaksstærð

• t-taflan er sett fram á allt annan hátt en Z taflan.

• Í raun eru gefin upp t-vendi fyrir ýmis alfa mörk.

• Bæði einhliðapróf og tvíhliðapróf. 50

Page 51: Aðferðafræði II 17-10-2013

t-próf

• t-próf er oft til að mæla hvort tölfræðilega marktækur munur sé á meðaltali tveggja hópa

• t-próf er til í nokkrum útgáfum– Algengt að nota 2 óháð úrtök (independent

sample t-test)– Parað t-próf er notað ef stök í hópunum eru tengd.

Dæmi ef við erum að skoða launamun karla og kvenna og við spyrjum hjón (karl og konu)

– One sample. Ef meðaltal þýðis er þekkt.

51

Page 52: Aðferðafræði II 17-10-2013

Dæmi um t-próf í SPSS

Ef einhliða próf þá taka þetta p gildiog deila með 2.

52

t-próf er til í nokkrum útgáfum og undirtegunduim. Þetta er t-próftveggja óskyldra úrtaka. Fyrsti hluti prófsins metur hvort dreifingin sé eins I báðum hópum. Um það bil jöfn dreifing í hópunum er forsenda þess að nota efri línuna í því sem eftir fer

Page 53: Aðferðafræði II 17-10-2013

Ef t reiknað er handan t vendi þá er p gildi lægra en 0,05 og munurinn

marktækur

53

Ef þetta fyrra próf er marktækt. Þá lesum við úr neðrí línunni af því sem á eftir fer. Það er marktækt ef p gildi er lægra en alfa mörk (0,05)

Ef einhliða próf þá taka þetta p gildiog deila með 2.

Page 54: Aðferðafræði II 17-10-2013

Ef tími er til sýna formúlu fyrir

• One sample test for proportion. Bls 207. Formúla 8.3

54