10/06/2015dr andy brooks1 tfv0103 tölfræði og fræðileg vinnubrögð fyrirlestrar 13 og 14...

27
06/13/22 Dr Andy Brooks 1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

Post on 19-Dec-2015

237 views

Category:

Documents


8 download

TRANSCRIPT

Page 1: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks 1

TFV0103 Tölfræði og fræðileg

vinnubrögð Fyrirlestrar 13 og 14

Yfirlit og Spurningar (tölfræði)

Page 2: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks 2

Leiðbeiningar í lokaprófinu TFV0103 Tölfræði

1. Svarið öllum spurningum. 2. Setjið hring við einn valmöguleika, a), b, c) eða d). 3. Leyfilegt er að nota reiknivél. 4. Það er ekki leyfilegt að nota kennslubókina eða glósur. 5. Prófið er bæði á ensku og á íslensku. Vinsamlegast svaraðu bara íslensk spurningar.

1. Answer all the questions. 2. Answer by circling one of a), b, c) or d). 3. You have permission to use a calculator. 4. You do not have permission to use textbooks or notes. 5. The exam is given in both english and icelandic. Please only answer the icelandic questions.

Page 3: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks 3

Reiknivél• Ertu búin(n) að velja?

• Kannt þú vel að nota?

• Komdu með rafhlaða til viðbótar

Page 4: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks 4

Lokapróf

• Krossaspurningar eins og heimapróf

• Ekki alveg eins – tölur breytast til dæmis.

• 30 spurningar

• Kafli 1,2,3 – 4 spurningar

• Kafli 4,5,6,7,8,9 – 3 spurningar

• BOOKTABLE 3 og 6 eru með prófblöðin

• Formúlublað er með prófblöðin

Page 5: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F2 5

Tvær tegundir af tölfræði

• Lýsandi tölfræði: safna, lýsa, og sýna úrtaksgögn.– t.d. safna aldra, svo koma tíðni, meðaltal, staðalfrávik, stöplarit,...

• Ályktunartölfræð: álykta um þýði á grunni úrtaks – tölfræðipróf

• Þýði er safn af einstaklingum eða af hlutum eða af atburðum. Oftast er ekki raunhæft að athuga allt þýðið.

• Úrtak er tiltölulega lítill hópur sem er valin úr þýði. – hlutmengi af þýðinu

300.000 eru til á Íslandi en hve margir tóku þátt í könnuninni um 5 kr. pening?

10 eða 100 eða 10.000 eða 100.000?

Alltaf, þu verður að vita af úrtaksstærð.

lýsandi tölfræði/descriptive statisticsályktunartölfræði/inferential statistics

þýði/populationúrtak/sample

Page 6: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F2 6

Tegundir breyta

VariableQuantitative

Qualitative

Discrete

Continuous

Nominal

Ordinal

red, blonde,brown,black

hot, warm, cold

weight, height

age, number of modules

hot>warm>coldekki hægt að reikna út meðaltal

megindleg

eigindleg

rofin

samfelld

nafnbreyta

raðbreyta

breytaþyngd, hæð

aldur, hve mörg námskeiðar

rautt, ljóshærð, brúnt, svart

heitur>hlýr>kaldurí röð

tegundir breyta/types of variables

þyngd

Page 7: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F3 7

Teikna myndrit af eigindlegum gögnum Tegundir af 498 aðgerðum

Graphing Qualitative Data

Ta02-01

Pie Chart/SkífuritBar Graph/SúluritHvaða graf er best?

rúm er til á milli dálka Neurosurgery/Taugaskurðlækningar

Page 8: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F3 8

2ss

Sample Variance (s2) & Standard Deviation (s)

sn

x x2 21

1

( ) n = úrtakstærð

1

22

2

n

n

xx

s

dreifni staðalfrávik

skilgreiningarformúla

reikniformúla

Page 9: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F4 9

Positive and negative correlationsr = +0,71positive correlation/

r = -0,74negative correlationneikvæð fylgnijákvæð fylgni

\misc\movies\JK_31Interactivity 3A

Page 10: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F4 10

Að reikna út Pearson´s rPearson fylgnistuðull

yxssn

yyxxr

1

))((

)()(

)(

ySSxSS

xySSr

n

xxxSS

2

2)(

n

yyySS

2

2)(

n

yxxyxySS )(

SSsum of squares/summa fervika

x

y

Page 11: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F5 11

Regression line/Jafna bestu línuy = 3,5714+0,6429x

0

5

10

15

0 5 10 15

x

yx y

3 5

4 8

5 6

6 7

7 9

8 6

9 10

10 11

n=8

xy 6429,05714,3

(x,y)

yy

3,5714

skekkja/leif

gögnin

skurðpunktur

Page 12: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 12

Að reikna út b1 og b0

x y x2 xy

3 5 9 15

4 8 16 32

5 6 25 30

6 7 36 42

7 9 49 63

8 6 64 48

9 10 81 90

10 11 100 110

∑x ∑ y ∑x2 ∑ xy

52 62 380 430

n

xxxSS

2

2)(

428

52380)(

2

xSS

n

yxxyxySS )(

278

62*52430)( xySS

n=8

6429,042

27

)(

)(1

xSS

xySSb

)( 10 xbyb

2571,3)5,6*6429,0(75,70 b

ekki 100% rétt - ekki nógir aukastafir að reikna með F5

Page 13: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 (c) Thomson Learning Inc. 13

Number of Relative CumulativeTrial Heads Observed Frequency Relative Frequency

1 5 5/10 5/10 = 0.50002 4 4/10 9/20 = 0.45003 4 4/10 13/30 = 0.43334 5 5/10 18/40 = 0.45005 6 6/10 24/50 = 0.48006 7 7/10 28/60 = 0.46677 6 6/10 34/70 = 0.48578 4 4/10 38/80 = 0.47509 7 7/10 45/90 = 0.5000

10 3 3/10 48/100 = 0.480011 4 4/10 52/110 = 0.472712 6 6/10 58/120 = 0.483813 7 7/10 65/130 = 0.500014 4 4/10 69/140 = 0.492915 3 3/10 72/150 = 0.480016 7 7/10 79/160 = 0.493817 6 6/10 85/170 = 0.500018 3 3/10 88/180 = 0.488919 6 6/10 94/190 = 0.494720 4 4/10 98/200 = 0.4900

• Árangur tilraunar, að kasta peningi tíu sinnum aftur of aftur…

relative frequency/hlutfallsleg tíðnicumulative relative frequency/safn hlutfallsleg tíðni

10x10x10x....

F6

Page 14: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F6 14

DæmiAð kasta peningi fimm sinnum

• Líkur á A = {exactly one head/nákvæmlega einn fiskur}?• Líkur á B = {exactly five heads/nákvæmlega fimm fiskar}?

• The sample space comprises of 32 outcomes.Úrtaksrúmið samanstendur af 32 útkomum.2 x 2 x 2 x 2 x 2 = 32 = n(S)

• A = {HTTTT,THTTT,TTHTT,TTTHT,TTTTH}• B = {HHHHH}

T THHH

32

5

)(

)()(

Sn

AnAP

32

1

)(

)()(

Sn

BnBP

5 úrtakspunktar

1 úrtakspunktur

Page 15: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Andy Brooks 15

P P P P( ) ( ) ( ) ( )A or B A B A and B

A B

If two events A and B are “mutually exclusive”: P(A and B) = 0.

Ef tveir atburðir A og B eru “ósamrýmanlegir atburðir”:

sniðmengi er ekki til

Intersection – we don´t intend to count twice.Sniðmengi - við ætlum ekki að telja tvisvar.

General Addition Rule for probabilityAlmenn samlagningarregla um líkindi

A and B are two events in a sample space S. A og B eru tveir atburður í úrtsaksrúmi S.

Venn-mynd

F7

Page 16: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F7 16

The space shuttle Challenger blew up in 1986.Geimskutlan Challenger sprakk í loft upp í 1986.

• Reliability of a joint was 0,9777.Áreiðanleiki samskeytis var 0,9777.

• So the reliability of six joints was:Svo áreiðlanleiki sex samskeyta var:0.9777 x 0.9777 x 0.9777 x 0.9777 x 0,9777 x 0.9777eða 0.869, u.þ.b. 87%

Video: Chapter 4 and 5 probability

Special Multiplication RuleSérstak margföldunarregla

independent events/óháðir atburðir

Page 17: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F8 17

Binomial Distribution/Tvíkostadreifing• p eru líkur á “jákvæðri” niðurstöðu í hverri tilraun

– t.d. “líkur á framhlið” P(H) = 0,5 svo p = 0,5

• q eru líkur á “neikvæðri” niðurstöðu í hverri tilraun– t.d. “líkur á bakhlið” P(T) = 0,5, svo q =0,5

• P(x), líkurnar á að fá nákvæmlega x “jákvæðar” niðurstöður í n tilraunum, er:

!( ) fyrir x=0,1,2,...,n

!( )!x n xn

P x p qx n x

binomial coefficient/tvíliðustuðull

n xC reiknivél?

Page 18: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F8 18

{HHH,HHT,HTH,HTT,THH,THT,TTH,TTT}

• n = 3 (independent trials/ óháðar tilraunir)• “success” = H og “fail” = T• p = P(H) = 0,5 og q = P(T) = 0,5• p + q = 1• slembibreyta x = 0, 1, 2 eða 3

33!( ) 0,5 0,5 fyrir x=0,1,2, eða 3

!(3 )!x xP x

x x

random variable x/slembibreyta x

Page 19: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 19

Interactivity 6A 1,0 0,5

≈ 0,95 (2σ) ≈ 0,68 (1σ)

Area under the normal curve.Flatarmál undir normalkúrfinni.

x-ás: hours of sleep/tímar af svefni F9

Page 20: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 (c) Thomson Learning, Inc. 20

Dæmi

0 45,1 z

Hvert er flatarmálið milli z-gildanna 0 og 1,45?What is the area between the z-scores 0 and 1.45?

BOOKTABLE 3 Bókartafla 3

0,4265 1,45)zP(0

z-gildiHow many standard deviations from the mean.Hve mörg staðalfrávik frá meðaltalinu.The distribution of z is a standard normal distribution.Dreifing z er stöðluð normalderifing.

the area under the curve/flatarmálið undir kúrfinnihvert er flatarmálið milli z = ? og ?

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

F9

Page 21: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

21

RVLS Sampling Distributions

525 125

5

σ=5,00þýðisstaðalfrávik

S=1,02staðalfravík úrtakadreifingar

F10

Page 22: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F10 22

Standard error of the meanStaðalvilla meðaltala

• The standard deviation of the sampling distribution of the sample mean is called the standard error of the mean.Staðalfrávik úrtakadreifingar úrtaksmeðaltals kallast staðalvilla meðaltal.

nx

The standard error of the mean gets less with a bigger sample.Staðalvilla meðaltala minnkar með stærra úrtaki.

Page 23: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F11 23

Confidence Interval (CI)/Öryggisbil• Oftast, við höfum bara eitt úrtak.

Often, we have just one sample.• The sample mean is a point estimate for the population mean

μ. Úrtaksmeðaltal er punktspá fyrir þýðismeðaltal μ.• 95% öryggisbil fyrir μ (alfastig=0,05) er:

• 99% öryggisbil fyrir μ (alfastig=0,01) er:

n1,96 x til

n1,96 - x

n2,575 x til

n2,575 - x

If σ is known.Ef σ sé þekkt.

Page 24: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F11 24

Dæmi• The consumer group take a random sample of 40 pills

(sample size n = 40) and find:Neytandahópurinn tekur slembiúrtak 40 pillna (úrtakstærð n=40) og finnur :

• The test statistic z* is:Prófmælitalan z* er:

• Líkur á að z<z*, P(z<-1,58), er 0,5 - 0,4429 = 0,0571

mg 95,23 x

1,5811-

400,2

24-23,95

x z*

n

aðeins minna en 24 mg

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

0 z*z

Page 25: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks F12 25

“Student´s t”• Because s is an estimate, instead of the test statistic z* and

BOOKTABLE3, we use Student´s t:Af því að s sé spátala, í staðinn fyrir prófmælitöluna z* og bókartöflu 3, við notum “Student´s t”:

• The t-distribution is not normally distributed for small sample sizes n.t-dreifing er ekki normaldreift fyrir litlar úrtaksstærðir n.

• Students´s t-distributions are distinguished by how many degrees of freedom (df) they contain.Student's t dreifingarnar eru aðgreindar með því hversu margar frígráður (df) þær innihalda.

• df = n-1 (Kafli 9,1)

nsx

t

Page 26: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 26

Dæmi: Heights of women/Hæðir kvenna

• s er punktspá fyrir σ • 95% öryggisbil fyrir þýðismeðaltal μ er:

1,707] til[1,653

0,06s 1,68x 22n

1,705] til[1,655

meðaltal 1,68miðtala 1,675kryppugilidi 1,64

22

06,02,08 x til

22

06,02,08 - x

var 1,96≈ +4mmaðeinsbreiðari

var

F12

Page 27: 10/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestrar 13 og 14 Yfirlit og Spurningar (tölfræði)

04/18/23 Dr Andy Brooks 27

Dæmi 3Viltu hætta að reykja? (www.reyklaus.is)

Reiknaðu nákvæmt próf Fisher að nota reiknavél í GraphPad á netinu.http://www.graphpad.com/quickcalcs/contingency1.cfmHvað er p-gildi? __________

Er munir til á milli reykingamanna og manna sem reykja ekki? JÁ NEIVið vitum að maður er reykingamaður. Hverjar eru líkur á því að hann er með krabbamein?Svarið (p1) __________Við vitum að maður reykir ekki. Hverjar eru líkur á því að hann er með krabbamein?Svarið (p2) __________Reiknaðu “relative risk” (afstæð áhætta) sem er p1 deilt með p2.Svarið __________

Smokers Non-smokers Cancer 230 78 No cancer 465 652 695 730

Tölvutími 5