indholdsfortegnelse: simple øvelser i...
TRANSCRIPT
Workshop i hypotesetest
Indholdsfortegnelse: Simple øvelser i chi2-test: Chi2-test I: Goodness-of-fit test side 1 Chi2-test II: Uafhængighedstest side 3
Vejledende eksamensopgaver i chi2-test mm. side 8
Projekter til hypotesetest side 14
Bjørn Felsager rev. 2011
Velkommen til TI-Nspire CAS version 3.2
337
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
1
Simple øvelser i chi2-test: Chi2-test I: Goodness-of-fit test Bemærkning: Øvelsesopgaverne kan løses eksperimentelt ud fra en simulering af nulhypotesen eller teoretisk ud fra et kanonisk test indbygget i dit værktøjs-program. I begge tilfælde bør man indlede med en deskriptiv analyse af data, hvor man inddrager grafiske fremstillinger og kommenterer, hvorvidt graferne synes at understøtte nulhypotesen eller den alternative hypotese. Opgave 1: Der fødes erfaringsmæssigt lidt flere kvinder end mænd. I Danmark synes der således i gennemsnit at fødes 51 kvinder for hver gang der fødes 49 mænd. I forbindelse med en statistik undersøgelse over en bestemt periode, hvor der blev født 186 børn på en bestemt fødeafdeling viste det sig at de 107 var piger og der resterende 79 var mænd. Er fødslerne på denne fødeafdeling i statistik overensstemmelse med den generelle danske befolkning? Opgave 2: Du har en mistanke om, at én af dine venner har en ”falsk” terning. Derfor har du i al hemmelighed noteret udfaldet af alle vedkommendes kast med terningen gennem en hel aftens spil. Dine optegnelser viser, at terningen er endt på ”1” i alt 5 gange, ”2” i alt 4 gange, ”3” i alt 5 gange, ”4” i alt 6 gange, ”5” i alt 5 gange og ”6” i alt 13 gange.
Giver dine observationer anledning til at din mistanke bestyrkes? Du forventes at argumentere ud fra statistiske hypoteser og test, med berøring af begreber som signifikans og/eller p-værdi. Desuden forventes du at kommentere, hvilke konsekvenser du vil lade den statistiske analyse få i den konkrete problemstil-ling. Opgave 3: En mindre restaurant med et menukort bestående af 5 forskellige, men faste menuer plejer at have følgende ordrefordeling på disse:
menu 1: 30 %, menu 2: 25 %, menu 3: 20 %, menu 4: 15 % og menu 5: 10 %.
Restauranten foretager sine indkøb for at imødegå en efterspørgsel, der følger dette mønster. Imidlertid er man flere gange i den seneste tid løbet tør for me-nu 5, og man ønsker at afgøre, om det er en tilfældighed, eller om man skal revidere indkøbsplanerne. I den seneste uge har man haft 543 gæster. Af disse bestilte 152 menu 1, 101 bestilte menu 2, 110 bestilte menu 3, 91 bestilte me-nu 4 og 89 bestilte menu 5. Skal man revidere indkøbsplanerne?
Velkommen til TI-Nspire CAS version 3.2
338
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
2
Opgave 4: Når man fremstiller almindelige M&M-slikpiller, blander man de forskellige farver tilfældigt efter det følgende skema:
Farve Rød gul grøn orange brun blå Generel andel 20% 20% 10% 10% 30% 10%
For at undersøge om den samme fordeling holder for peanut-M&M-piller blev der udtaget en tilfældig stikprøve på 75 peanut-piller, der fordelte sig således efter farve:
Farve Rød gul grøn orange brun blå Observeret antal 11 16 8 5 17 18
Fremstil en passende graf, der sammenligner frekvenserne for almindeligt M&M og peanut-M&M. Kommenter grafen med brug af begrebet stikprøve.
Formuler hypoteserne for et statistisk test hørende til den ovenstående under-søgelse. Udregn de forventede antal under antagelse af nulhypotesen H0:
Farve Rød gul Grøn orange brun blå Forventet antal
Udregn χ2-teststørrelsen og find p-værdien. Er forskellen mellem de observere-de og forventede antal signifikant på 5%-niveau? På 1%-niveau? Konklusion? Opgave 5 (tillempet efter vejledende eksamensopgave 11) Ved folketingsvalget i 2007 fordelte stemmerne sig således
Parti S Rad Kons SF DF V EL Lib. All. Kr. Dem.
Stemmer i % 25,5 5,1 10,4 13,0 13,8 26,3 2,2 2,8 0,9
Ved en meningsmåling med 968 respondenter foretaget af Greens Analyseinsti-tut 1/2 – 3/2 fordelte stemmerne sig således
Parti S Rad Kons SF DF V EL Lib. All. Kr. Dem.
Stemmer i % 26,3 5,4 9,6 16,9 14,2 24,0 2,1 1,1 0,5
Vi vil anvende meningsmålingen til at undersøge følgende nulhypotese: stem-mefordelingen er uændret in forhold til valget.
a) Hvad er populationen og hvad er stikprøven. Lav en tabel over de observe-rede antal stemmer og de forventede antal stemmer under nulhypotesen.
b) Bestem teststørrelsen, der tester om hypotesen skal accepteres eller forka-stes, og afgør på et 5% signifikansniveau om man kan sige, at stemmefor-delingen har ændret sig.
c) Det ser ud som om, partiet SF har haft betydelig fremgang. Opstil en tabel inddelt efter SF og øvrige partier for såvel observerede som forventede vær-dier og afgør med statistiske metoder om SF’s fremgang er signifikant på 5% niveau.
Velkommen til TI-Nspire CAS version 3.2
339
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
3
Chi2-test II: Uafhængighedstest Bemærkning: Øvelsesopgaverne kan løses eksperimentelt ud fra en simulering af nulhypotesen eller teoretisk ud fra et kanonisk test indbygget i dit værktøjs-program. I begge tilfælde bør man indlede med en deskriptiv analyse af data, hvor man inddrager grafiske fremstillinger og kommenterer, hvorvidt graferne synes at understøtte nulhypotesen eller den alternative hypotese. Opgave 6: I dagens politik spiller skattenedsættelser en stor rolle. Et stort an-tal lønarbejdere udspørges via et telefoninterview om deres holdning til en løn-nedgang, der kompenseres med en skattenedsættelse: ”Vil du acceptere en lønnedsættelse, hvis den kompenseres med en skattenedsættelse, således at reallønnen (købekraften) er uændret?” Svarene fordeler sig således på køn:
Observeret Køn
Kvinde Mand
Hol
d-ni
ng Ja 187 159
Nej 105 56
Fremstil tabellen grafisk i et passende diagram og kommentér fordelingen for holdningen som funktion af kønnet.
Færdigudfyld den følgende tabel:
Observeret Køn
Kvinde Mand I alt
Hol
d-ni
ng Ja 187 159
Nej 105 56
I alt
Udregn tabellen for de forventede antal:
Forventet Køn
Kvinde Mand I alt
Hol
d-ni
ng Ja
Nej
I alt
Udregn χ2-teststørrelsen og find p-værdien. Er forskellen mellem de observere-de og forventede svar signifikant på 5% niveau? På 1% niveau?
Velkommen til TI-Nspire CAS version 3.2
340
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
4
Opgave 7: I en Gallupundersøgelse blev 234 kvinder og 257 mænd spurgt om de var tilfredse med deres udseende, i den forstand, at de anså sig selv som fysisk tiltrækkende for det modsatte køn. Hertil svarede (i afrundede procent-tal) 71% af kvinderne, at de var tilfredse med deres udseende, mens 81% af mændene svarede, at de var tilfredse med deres udseende.
Færdigudfyld det følgende skema
Køn
Kvinde Mand I alt
Selv
opfa
t-te
lse
Tilfreds
Utilfreds
I alt 234 257
Fremstil tabellen grafisk i et passende diagram og kommentér fordelingen af selvopfattelsen som funktion af kønnet.
Hvor stor en andel af samtlige adspurgte er tilfredse? Utilfredse?
Udregn χ2-teststørrelsen og p-værdien. Er forskellen mellem de observerede og forventede svar signifikant på 5% niveau? På 1% niveau? Opgave 8: Det er en velkendt opfattelse at psykologiske og sociale forhold har indflydelse på overlevelseschancen efter en alvorlig sygdom. En undersøgelse fra 1980 handlede om en eventuel sammenhæng mellem kæledyr og chancen for at overleve i mindst et år efter en hjerteoperation. I undersøgelsen, der om-fattede 53 patienter med kæledyr og 39 patienter uden kæledyr, var 78 af pati-enterne i live efter et år. Af de 78 patienter, der overlevede havde de 50 kæle-dyr.
Er der belæg i undersøgelsen for en statistisk sammenhæng mellem at overleve i mindst et år og at have kæledyr? Opgave 9: I en undersøgelse af danske mænds og kvinders tv forbrug svarer 60% af kvinderne i stikprøven, at de ser mere end 20 timer tv om ugen, mens det tilsvarende tal for mændene er 53%. Stikprøven indeholder lige mange per-soner af hver køn, og hypotesen ”lige mange mænd og kvinder ser mere end 20 timer tv om ugen” forkastes på 5% signifikansniveau, men accepteres på 1% signifikansniveau. Bestem en mulig størrelse af stikprøven.
Velkommen til TI-Nspire CAS version 3.2
341
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
5
Opgave 10: En amerikansk undersøgelse af bilisters brug af sikkerhedsseler resulterede i følgende stikprøve:
Køn
Mand Kvinde
Bru
g af
si
kker
heds
-se
le
Altid 37 39
Som regel 60 58
Af og til 54 49
Aldrig 64 39
Opstil den relevante nulhypotese for at undersøge, om der er uafhængighed mellem køn og brug af sikkerhedssele?
Fremstil tabellen i et passende diagram, der viser fordelingen af brugen af sik-kerhedsselen som funktion af kønnet og kommentér diagrammet.
Udregn tabellen med de forventede værdier og χ2-teststørrelsen
Giver stikprøven grundlag for at sige, at der er forskel på de to køns brug af sikkerhedsseler? Opgave 11: Antag at en dyrlæge har fået en mistanke om, at hunde af racen labrador har en større tendens til at udvikle allergi end andre hunderacer. Gennem det sidste år er der i klinikken blevet registret følgende undersøgelser og resultater af allergi hos hunde (Bemærk: Tallene er fiktive!):
Race
Labrador Schæfer Puddel Andet
Alle
rgi Ingen allergi 25 32 28 64
Mild allergi 2 0 3 7
Allergi 10 7 4 8
Opstil den relevante nulhypotese for at undersøge, om der er uafhængighed mellem hunderace og udvikling af allergi.
Udregn tabellen med de forventede værdier.
Vil det være rimeligt at bruge en χ2-fordeling til at vurdere teststørrelsen her? Hvis ikke, hvordan kan man så komme videre med undersøgelsen?
Giver stikprøven grundlag for at sige, at der er forskel på risiko for at udvikle allergi for forskellige hunderacer?
Velkommen til TI-Nspire CAS version 3.2
342
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
6
Opgave 12 (Tillempet fra Susanne Christensens elevtekst) En hjerneforsker forsker i forskellige måder at operere for en bestemt type hjernetumor. Der er tre forskellige operationstyper: Type A, hvor man kun fjer-ner selve tumoren; Type B, hvor man også tager lidt af det nærmeste omkring-liggende væv bort, og Type C, hvor der fjernes en større del af det omkringlig-gende væv.
Lægen ønsker at vide, hvordan operationstypen indvirker på chancen for at overleve et halvt år efter operationen. Over en årrække har lægen indsamlet følgende data over resultaterne af operationerne (Bemærk: data er fiktive, pro-blemstillingen er autentisk)
Observeret Operation
Operation A
Operation B
Operation C
I alt
Stat
us I live 40 10 9 59
Død 14 6 16 36
I alt 54 16 25 95
Fremstil tabellen grafisk i et passende diagram, der viser fordelingen af status efter et halvt år som funktion af operationstypen og kommentér diagrammet.
Udregn tabellen for de forventede antal
Forventet Operation
Operation A
Operation B
Operation C
I alt
Stat
us I live 59
Død 36
I alt 54 16 25 95
Udregn χ2-teststørrelsen og find p-værdien.
Er forskellen mellem de observerede og forventede resultater signifikant på 5% niveau? På 1% niveau?
Udregn tabellen for de enkelte cellers bidrag til �2-teststørrelsen
Forventet Operation
Operation A
Operation B
Operation C
I alt
Stat
us I live
Død
I alt
Konklusion: Hvad bør lægen anbefale vedrørende de fremtidige operationsty-per?
Velkommen til TI-Nspire CAS version 3.2
343
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
7
Da lægen sender sine konklusioner ind til et tidsskrift spørger en referee (dvs. en anden læge, der kommenterer artiklen før den offentliggøres) vores læge, om han har styr på eventuelt skjulte variable: Er det helt tilfældigt hvilke patienter, der tilbydes hvilke operationer? Lægen opdager da, at hospitalet faktisk tager hensyn til patientens alder, når de anbefaler hvilken operation de skal under-kastes. For patienter med en alder på over 50 år (gamle patienter) fandt lægen nu de følgende (fiktive!) hyppigheder:
Operation
Operation A
Operation B
Operation C
I alt
Stat
us I live 13 8 8 29
Død 13 6 16 35
I alt 26 14 24 64
Gentag nu undersøgelsen og diskutér i lyset af din nye undersøgelse lægens konklusion fra før. Opgave 13 (Tillempet efter vejledende eksamensopgave 7) En klasse vil undersøge, om drikkevaner er uafhængige af køn. Drikkevanerne inddeles i tre grupper: Drikker ofte, drikke en gang i mellem, drikker aldrig. Resultatet af elevernes undersøgelser fremgår af følgende tabel:
335 elevers fordeling på drikkevaner Drikker ofte Drikker af og til Drikker ikke
Pige 22 39 10 71 Dreng 43 180 41 264
66 218 51 335
a) Giver resultatet belæg for at antage, at drikkevaner er uafhængige af køn, når der vælges et signifikans-niveau på 5 %?
b) Undersøgelsen kritiseres for, at inddelingen mellem ’drikker ofte’ og ’drikker af og til’ er uklar. Optil selv ud fra tallene en ny tabel over de 335 elever hvor du kun anvender to inddelingskriterier, og undersøg om man når til samme konklusion nu som man gjorde i spørgsmål a.
Velkommen til TI-Nspire CAS version 3.2
344
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
8
Vejledende eksamensopgaver i chi2-test mm. Bemærkning: De vejledende eksamensopgaver kan løses teoretisk ud fra et ka-nonisk test indbygget i dit værktøjsprogram eller ved hjælp af de indbyggede fordelingsfunktioner for chi2-fordelingen, dvs. punktfordelingen, den kumule-rede fordeling og den inverse fordeling. Opgave 1 (vejledende eksamensopgave 8) For en bestemt storproducent af legetøjsbolde gælder at diameteren af legetøjs-boldene opfylder
Mindre end 20cm Mellem 20cm og 22cm Over 22 cm 10% 85% 5%
En forsendelse på 200 legetøjsbolde stoppes i tolden. Fordelingen af diameteren af disse legetøjsbolde er
Mindre end 20cm Mellem 20cm og 22cm Over 22 cm 28 stk. 160 stk. 12 stk.
a) Benyt statistiske metoder til at undersøge om forsendelsen kan stamme fra storproducenten. Opgave 2 (vejledende eksamensopgave 9) I et eksperiment krydser en studerende lyserøde blomster med hinanden. Ifølge arvelighedslovene skulle det forventede resultat være 25 % røde, 50 % lyserøde og 25 % hvide. Resultatet af eksperimentet blev 236 blomster, der fordelte sig på farverne som vist i tabellen:
Eksperimentets fordeling af 236 blomster på tre farver Farve rød lyserød hvid
hyppighed 66 115 55
a) Beregn ud fra arvelighedsloven de forventede hyppigheder for de tre farver.
b) Bestem χ2-teststørrelsen. Skriv et forslag til hvilken konklusion, den stude-rende kan skrive i sin rapport, når der anvendes et signifikansniveau på 5 %?
Velkommen til TI-Nspire CAS version 3.2
345
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
9
Opgave 3 (vejledende eksamensopgave 10) I klageafdelingen i et firma modtager man klager pr. telefon. Firmaet har erfa-ring for, at klagebehandlingstiden pr. klage fordeler sig som angivet i nedenstå-ende tabel.
Antal minutter 0-5 5-10 10-15 >15 I alt Andel af det samlede antal klager 30% 40% 20% 10% 100%
Ved en kontroloptælling i en bestemt måned, viste det sig, at klagebehandlings-tiden pr. klage fordelte sig som vist i tabellen nedenfor.
Klagebehandlingstid 0-5 5-10 10-15 >15 I alt Observeret 37 53 25 5 120
a) Hjælp firmaet med at opstille en nulhypotese, der kan testes. Undersøg der-næst om man på et 5% signifikansniveau kan sige, at mønstret i klagebehand-lingstiden har ændret sig.
Kilde: http://www.business.aau.dk/hd/Statistik/Dokumenter%20Rie/Hold%20A3_09/lektion%207/Kap%20H%20Goodness%20of%20fit%20test.doc Opgave 4 (Vejledende eksamensopgave 1) I nedenstående tabel ses resultaterne af samtlige hjerteklapoperationer i 2007-08 ved Odense Universitetshospital (OUH) sammenlignet med resultaterne ved landets øvrige hjertecentre.
Død indenfor 30 dage efter operation Overlevet de første 30 dage
OUH 11 206
De øvrige hjertecentre 32 1374
a) Undersøg på 5%-signifikansniveau, om dødelighed indenfor 30 dage efter en hjerteklapoperation er ens ved OUH og de øvrige hjertecentre.
b) Hvad ville resultatet være blevet, hvis vi havde valgt et signifikansniveau på 1%? Inddrag det statistiske begreb skjulte variable i din kommentar til re-sultatet.
Kilde: http://www.si-folkesundhed.dk/upload/dhr2008.pdf
Velkommen til TI-Nspire CAS version 3.2
346
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
10
Opgave 5 (Vejledende eksamensopgave 4) I en klinisk afprøvning af en bestemt type medicin på en bestemt alvorlig syg-dom, har man opdelt de lige behandlingskrævende patienter i to grupper A og B. Gruppe A får medicinen, mens gruppe B er kontrolgruppe, som derfor får placebo (fx kalktabletter). Ingen af grupperne ved, hvilken type behandling de får. Efter 6 måneders behandling undersøger man virkningen af behandlingen i hver af de to grupper, og resultatet af denne undersøgelse ses i tabellen neden-for.
Status efter 6 mdr. Gruppe A Gruppe B I alt Død 8 17 25
Overlevende 75 48 123 I alt 83 65 148
I det følgende antages, at der ikke er nogen sammenhæng mellem medicinerin-gen og patienternes overlevelseschancer.
a) Opstil en tabel over de forventede værdier for ”Død” og ”Overlevende” i de to grupper A og B.
b) Undersøg om medicineringen kan siges at have betydning for patienternes overlevelseschancer når signifikansniveauet fastlægges til 5%?
Opgave 6 (Vejledende eksamensopgave 5) Hjerte- og lungeoperationer kan medføre forstoppelse (postoperativ obstipati-on). På et hospital er man interesseret i at undersøge, om problemet har sam-me omfang ved de to operationstyper. De opstiller dette som en hypotese, de vil teste, og beder alle hjemsendte hjerte- og lungepatienter svare på følgende spørgsmål:
”Har du efter operationen haft forstoppelse i en grad, der har påvirket dine dag-lige gøremål?”
Patienternes svar fremgår af tabellen nedenfor, hvor tallene i parentes angiver de forventede værdier for patienternes svar.
Operationstype \ Problemer Ja Nej Total Hjerteoperation 9 (12,97) 51(47,03) 60 Lungeoperation 15(11,03) 36 (39,97) 51
Total 24 87 111
a) Gør rede for, hvordan de forventede værdier er beregnet.
b) Bestem χ2-teststørrelsen, og den tilsvarende p-værdi og kommenter resulta-tet.
Kilde: http://www.nhv.se/upload/dokument/forskning/Publikationer/MPH/2008/MPH2008-8_L%20S%20Rasmussen.pdf
Velkommen til TI-Nspire CAS version 3.2
347
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
11
Opgave 7 (Vejledende eksamensopgave 6) I en undersøgelse på en skole har en gruppe elever bedt 179 elever om at angi-ve køn og rygevaner. En optælling viser, at der 36 rygere og 143 ikke-rygere blandt de adspurgte. Endvidere viser optællingen, at der ud af de 179 var 78 piger og 101 drenge. Det antages, at det er uafhængigt af køn, hvorvidt en elev ryger eller ej.
a) Bestem under denne antagelse det forventede antal rygere blandt drenge, og udfyld de tomme pladser i skema 1 over den forventede fordeling af ele-verne på rygevaner og køn:
Skema 1: Den forventede fordeling af elever på rygevaner og køn
Ryger Ikke-ryger
Hunkøn 78
Hankøn 101
Sum 36 143 179
I skema 2 ses stikprøvens faktiske fordeling af eleverne på køn og rygevaner:
Skema 2: Stikprøvens fordeling af elever på rygevaner og køn
Ryger Ikke-ryger
Hunkøn 21 57 78
Hankøn 15 86 101
Sum 36 143 179
b) Bestem χ2-teststørrelsen og den tilsvarende p-værdi.
I en lignende undersøgelse kommer man frem til, at χ2-teststørrelsen er lig med 6,34.
c) Giver denne undersøgelse belæg for at hævde, at rygevaner er uafhængige af køn, når der benyttes et signifikansniveau på 5 %?
Opgave 8 (Vejledende eksamensopgave 2) I en opinionsundersøgelse i X-købing er 500 personer blevet spurgt, om man er for eller imod de ændrede åbningstider i svømmehallen.
For Imod Ved ikke Sum Kvinder 151 79 34 264 Mænd 115 70 51 236 Sum 266 149 85 500
Det oplyses, at man har en hypotese om, at de to køn har samme indstilling.
a) Udfyld, under antagelse af at hypotesen er sand, nedenstående tabel over den forventede fordeling.
Velkommen til TI-Nspire CAS version 3.2
348
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
12
For Imod Ved ikke Sum Kvinder 264 Mænd 236 Sum 266 149 85 500
b) Bestem χ2-teststørrelsen, og den tilsvarende p-værdi, og kommenter resul-tatet.
Opgave 9 (Vejledende terminsprøve 2010 A-niveau Netadgangsforsøget i matematik)
Den danske landsholdsmålmand i håndbold Kasper Hvidt havde ved EM i Norge i 2008 en redningsprocent på 40 %. Dvs. han reddede 40 % af de skud, som modstanderne skød på hans mål.
Ved EM i Østrig 2010 reddede Kasper Hvidt i en bestemt kamp 11 skud ud af 36.
a) Opstil en nulhypotese, og undersøg på et 5 % signifikansniveau, om Kasper Hvidts redningsprocent har ændret sig.
Opgave 10 (Eksamensopgave 2010 A-niveau Netadgangsforsøget i matematik)
På en skole undersøger elevrådet hvert år, hvor mange af skolens ele-ver, der køber mad i kantinen. Sidste skoleår købte 45 % af eleverne mad i kantinen.
Da skolen har mere end 1000 elever, vælger elevrådet at spørge 100 elever, om de køber mad i kantinen eller ej. Her viser det sig, at 56 ud af de 100 svarer ja til, at de køber mad i kantinen.
a) Opstil en nulhypotese, og undersøg på et 5 % signifikansniveau om andelen af elever, der køber mad i kantinen, har ændret sig.
Opgave 11 (udkast til fremtidige eksamensopgaver B-niveau fra Mathit-bogen) Pressede bakelitforme kan kasseres på grund af porøsitet eller på grund af di-mensionsfejl. Ved sortering af 6805 pressede bakelitformstykker kasseredes 473 stykker på grund af dimensionsfejl. En nærmere undersøgelse af disse 473 stykker viste, at de 142 var porøse. Ved gennemgang af de resterende stykker kasseredes yderligere 1233 stykker på grund af porøsitet jf. tabellen nedenfor.
Porøse Ikke-porøse I alt Med dimensionsfejl 142 331 473 Uden dimensionsfejl 1233 5099 6332
I alt 1375 5430 6805
Velkommen til TI-Nspire CAS version 3.2
349
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
13
Hvis vi antager, at porøsiteten er uafhængig af dimensionsfejlen, så får vi føl-gende tabel over de forventede værdier.
Porøse Ikke-porøse I alt Med dimensionsfejl 95.57 377.43 473 Uden dimensionsfejl 1279.43 5052.57 6332
I alt 1375 5430 6805
• Gør rede for, hvordan de forventede værdier er beregnet.
• Undersøg med en χ2-test, om der på signifikansniveauet 5% er belæg for at antage, at porøsiteten er uafhængig af dimensionsfejlen. Undersøgelsen skal inddrage χ2-værdien og p-værdien.
Opgave 12: (udkast til fremtidige eksamensopgaver A-niveau fra Mathit-bogen) I en spørgeskemaundersøgelse stilles en repræsentativ stikprøve på 75 gymna-sieelever to spørgsmål, spørgsmål A og spørgsmål B, hvortil de svarer enten JA eller NEJ. Der deltager 24 drenge i undersøgelsen, hvoraf de 10 svarer JA til spørgsmål A. I alt er der 24 gymnasieelever, der svarer JA til spørgsmål A.
• Undersøg med en χ2-test om der på signifikansniveauet 5 % er belæg for at antage, at holdningen til spørgsmål A er uafhængig af gymnasieelevens køn. Undersøgelsen skal inddrage χ2-værdien og p-værdien.
• Hvor stor skal χ2-værdien være i den tilsvarende undersøgelse af spørgsmål B, hvis man på signifikansniveauet 5 % skal kunne forkaste nulhypotesen om, at holdningen til spørgsmål B er uafhængig af gymnasieelevens køn?
Velkommen til TI-Nspire CAS version 3.2
350
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
14
Projekter til hypotesetest Projekt 1 (tillempet efter vejledende terminsprøve i netadgangsforsøget) Ved en konditionstest har man målt konditallet for 77 personer. I bilag 2 (Bi-lag2_Kondital_M_K.htm) findes testresultaterne opdelt efter køn. a) Tegn to boksplot, der viser fordelingen af kondital for henholdsvis mænd og kvinder. b) Beskriv forskellen på kvindernes og mændenes testresultater ud fra de to boksplot, idet kvartilsættene inddrages. c) Gennemfør en t-test for at vurdere om der er forskel på niveauerne i kondital for de to køn.
Resultater fra konditionstest 77 personer fordelt efter køn
NR Kondital Køn
1 61.7 mand
2 47 mand
3 41.6 mand
4 49.2 mand
5 47.9 mand
6 48.5 mand
7 53.5 mand
8 47.4 mand
9 52 mand
10 54.9 mand
11 38.9 mand
12 37.5 mand
13 44.2 mand
14 40.6 mand
15 54.9 mand
16 47 mand
17 43.9 mand
18 41.1 mand
19 30.9 mand
20 50.9 mand
21 56 mand
22 35.2 mand
23 50.9 mand
24 50.9 mand
25 52.3 mand
26 58.1 mand
Velkommen til TI-Nspire CAS version 3.2
351
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
15
27 55.5 mand
28 49.9 mand
29 55.5 mand
30 53.7 mand
31 52 mand
32 43.8 mand
33 50.9 mand
34 49.9 mand
35 53.7 mand
36 49.2 mand
37 50 mand
38 57.1 mand
39 41.1 mand
40 49.2 mand
41 40.3 mand
42 43.1 kvinde
43 34 kvinde
44 32.7 kvinde
45 33.2 kvinde
46 32.2 kvinde
47 27.1 kvinde
48 51.4 kvinde
49 49.2 kvinde
50 40.5 kvinde
51 36.7 kvinde
52 47 kvinde
53 46.3 kvinde
54 33.2 kvinde
55 41.6 kvinde
56 33.5 kvinde
57 33.2 kvinde
58 33.9 kvinde
59 31 kvinde
60 39.7 kvinde
61 34.6 kvinde
62 41.1 kvinde
63 42.4 kvinde
Velkommen til TI-Nspire CAS version 3.2
352
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
16
64 49.2 kvinde
65 34.3 kvinde
66 52.6 kvinde
67 50.9 kvinde
68 43 kvinde
69 34.3 kvinde
70 29.9 kvinde
71 43.9 kvinde
72 35.8 kvinde
73 41.6 kvinde
74 41 kvinde
75 34.6 kvinde
76 35.9 kvinde
77 27.1 kvinde
Projekt 2: (tillempet efter vejledende eksamensopgave i samfundsfag)
Bemærkning: I diskussionen inddrages passende diagrammer og udregninger af de viste tal i skemaet!
Velkommen til TI-Nspire CAS version 3.2
353
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
17
Projekt 3: Tillempet efter vejledende eksamensopgave i samfundsfag
De viste tal stammer fra den følgende tabel:
Uddannelse og timeløn
I alt
10 GRUNDSKOLE
20 ALMENGYM-NASIAL UDDAN-NELSER
25 ERHVERVS-GYMNASIAL UDDANNELSER
35 ER-HVERVSUD-DANNELSER
40 KORTE VIDE-REGÅENDE UDDANNELSER
50 MELLEMLANGE VIDEREGÅENDE UDDANNELSER
60 BA-CHE-LOR
65 LANGE VIDE-REGÅENDE UDDANNELSER
70 FOR-SKERUD-DANNELSER
Antal år i uddannelse 9 12 12 10 14 16 14 18 21
Fortjeneste i kr. pr. time. Privat sektor
2007 197.87 239.11 225.25 242.91 267.42 334.61 283.75 376.21 418.71
Mænd
10 GRUNDSKOLE
20 ALMENGYM-NASIAL UDDAN-NELSER
25 ERHVERVS-GYMNASIAL UDDANNELSER
35 ER-HVERVSUD-DANNELSER
40 KORTE VIDE-REGÅENDE UDDANNELSER
50 MELLEMLANGE VIDEREGÅENDE UDDANNELSER
60 BA-CHE-LOR
65 LANGE VIDE-REGÅENDE UDDANNELSER
70 FOR-SKERUD-DANNELSER
Antal år i uddannelse 9 12 12 10 14 16 14 18 21
Fortjeneste i kr. pr. time. Privat sektor
2007 203.46 262.61 240.21 252.5 282.28 361.38 318.65 401.97 430.18
Kvinder
10 GRUNDSKOLE
20 ALMENGYM-NASIAL UDDAN-NELSER
25 ERHVERVS-GYMNASIAL UDDANNELSER
35 ER-HVERVSUD-DANNELSER
40 KORTE VIDE-REGÅENDE UDDANNELSER
50 MELLEMLANGE VIDEREGÅENDE UDDANNELSER
60 BA-CHE-LOR
65 LANGE VIDE-REGÅENDE UDDANNELSER
70 FOR-SKERUD-DANNELSER
Antal år i uddannelse 9 12 12 10 14 16 14 18 21
Fortjeneste i kr. pr. time. Privat sektor
2007 185.96 206.97 206.06 221.46 244.07 274.47 247.17 326.82 384.59
Kilde: www.statistikbanken.dk
Bemærkning: I diskussionen inddrages såvel passende diagrammer og udreg-ninger af de viste tal i skemaet som en lineær regressions-t-test for at vurdere statistisk signifikans!
Velkommen til TI-Nspire CAS version 3.2
354
Workshop i hypotesetest: T3-Kursus TI-Nspire CAS september 2012
18
Projekt 4: Her vil vi tage udgangspunkt i et eksempel, hvor man folder en tre-kant med et stykke A4-papir med henblik på at finde den størst mulige trekant:
Ved en konkret opmåling af grundlinjer og højder for den skraverede trekant fås følgende mål:
grundlinje højde 1 cm 10.5 cm 2 cm 10.4 cm 3 cm 10.35 cm 4 cm 10.1 cm 5 cm 9.95 cm 6 cm 9.7 cm 7 cm 9.3 cm 8 cm 9 cm 9 cm 8.6 cm 10 cm 8.2 cm 11 cm 7.7 cm 12 cm 7.1 cm 13 cm 6.6 cm 14 cm 5.9 cm 15 cm 5.2 cm 16 cm 4.5 cm 17 cm 3.6 cm 18 cm 2.9 cm 19 cm 2.0 cm 20 cm 1.0 cm
• Udvid tabellen så den også omfatter trekantens areal. Afbild et diagram, der viser arealets afhængighed af grundlinjen.
• Opstil en passende regressionsmodel for arealet som funktion af grund-linjen, idet du inddrager residualplot og forklaringsgrad i analysen.
• Gennemfør en regressions-t-test for arealet som funktion af grundlinjen, idet du inddrager passende potenser af grundlinjen som uafhængige va-riable i regressionsmodellen. Kommenter p-værdien for regressionsmo-dellen såvel som p-værdierne for koefficienterne i modellen.
g
h
Velkommen til TI-Nspire CAS version 3.2
355