10/06/2015dr andy brooks1 tfv0103 tölfræði og fræðileg vinnubrögð fyrirlestur 13 yfirlit og...
Post on 19-Dec-2015
226 views
TRANSCRIPT
04/18/23 Dr Andy Brooks 1
TFV0103 Tölfræði og fræðileg
vinnubrögð Fyrirlestur 13
Yfirlit og Spurningar (tölfræði)
04/18/23 Dr Andy Brooks 2
Leiðbeiningar í lokaprófinu TFV0103 Tölfræði
1. Svarið öllum spurningum. 2. Setjið hring við einn valmöguleika, a), b, c) eða d). 3. Leyfilegt er að nota reiknivél. 4. Leyfilegt að nota formúlu blaðið úr kennslubókinni með (i) handskrifaða þýðingu á enska textanum og (ii) handskrifað formulas. 5. Það er ekki leyfilegt að nota kennslubókina eða glósur. 6. Prófið er bæði á ensku og á íslensku. Vinsamlegast svaraðu bara íslensk spurningar.
1. Answer all the questions. 2. Answer by circling one of a), b, c) or d). 3. You have permission to use a calculator. 4. You have permission to use the formula sheet from the textbook on which may appear (i) handwritten icelandic translations of the english text and (ii) handwritten formulae. 5. You do not have permission to use textbooks or notes. 6. The exam is given in both english and icelandic. Please only answer the icelandic questions.
04/18/23 Dr Andy Brooks 3
Reiknivél• Ertu búin(n) að velja?
• Kannt þú vel að nota?
• Komdu með rafhlaða til viðbótar
04/18/23 Dr Andy Brooks 4
Lokapróf
• Krossaspurningar eins og heimapróf
• Ekki alveg eins – tölur breytast til dæmis.
• 30 spurningar
• Kafli 1,2,3 – 4 spurningar
• Kafli 4,5,6,7,8,9 – 3 spurningar
• BOOKTABLE 3 og 6 eru með prófblöðin
• Þú verður að koma með formúlu blaðið
04/18/23 Dr Andy Brooks 5
Two kinds of statistics
• Descriptive statistics: collecting, describing and presenting sample data. (tíðni, meðaltal, staðalfrávik,...)
• Inferential statistics: drawing conclusions about populations. (álykta um þýði á grunni úrtaks, tölfræðipróf,...)
• A population/þýði is a collection of individuals or objects or events whose properties are to be analyzed.
• A sample/úrtak is a subset/hlutmengi of the population.
Iceland has a population of 300,000 but how many Icelanders responded to the question about the 5 kr. coin?
10 eða 100 eða 10.000?Alltaf, þu verður að vita af úrtaksstærð.
lýsandi tölfræði ályktunartölfræðiF2
04/18/23 Dr Andy Brooks 6
Tegundir breyta/Types of variables
VariableQuantitative
Qualitative
Discrete
Continuous
Nominal
Ordinal
red, blonde,brown,black
hot, warm, cold
weight, height
age, number of modules
hot>warm>coldekki hægt að reikna út meðaltal
megindleg
eigindleg
rofin
samfelld
nafnbreyta
raðbreyta
breytaþyngd, hæð
aldur, hve mörg námskeiðar
rautt, ljóshærð, brúnt, svart
heitur>hlýr>kaldurí röð
F2
04/18/23 Dr Andy Brooks 7
Graphing Qualitative DataTypes of 498 hospital operations/aðgerðir
eigindarleg gögn
Ta02-01
Pie Chart/SkífuritBar Graph/SúluritHvaða graf er best?
space/rúm between bars
F3
04/18/23 Dr Andy Brooks 8
2ss
The sample variance, s2, is the mean of the squared deviations, calculated using n 1 as the divisor:
Sample Variance (s2) & Standard Deviation (s)
sn
x x2 21
1
( ) n er úrtakstærð
1
22
2
n
n
xx
s
Andy segir: reyna að muna.
dreifni staðalfrávik
Formula Card?
F3
04/18/23 Dr Andy Brooks 9
Positive and negative correlationsr = 0,71positive correlation/
r = -0,74negative correlationneikvæð fylgnijákvæð fylgni
\misc\movies\JK_31Interactivity 3A
F4
04/18/23 Dr Andy Brooks 10
Að reikna út Pearson´s rPearson fylgnistuðull
yxssn
yyxxr
1
))((
x
y
)()(
)(
ySSxSS
xySSr
n
xxxSS
2
2)(
n
yyySS
2
2)(
n
yxxyxySS )(
SSsum of squares/summa fervika
Formula Card
F4
04/18/23 Dr Andy Brooks 11
Regression line/Jafna bestu línuy = 3,5714+0,6429x
0
5
10
15
0 5 10 15
x
yx y
3 5
4 8
5 6
6 7
7 9
8 6
9 10
10 11
n=8
xy 6429,05714,3
(x,y)
yy
3,5714
F5
04/18/23
Að reikna út b1 og b0
x y x2 xy
3 5 9 15
4 8 16 32
5 6 25 30
6 7 36 42
7 9 49 63
8 6 64 48
9 10 81 90
10 11 100 110
∑x ∑ y ∑x2 ∑ xy
52 62 380 430
n
xxxSS
2
2)(
428
52380)(
2
xSS
n
yxxyxySS )(
278
62*52430)( xySS
n=8
6429,042
27
)(
)(1
xSS
xySSb
)( 10 xbyb
2571,3)5,6*6429,0(75,70 b
ekki 100% rétt - ekki nógir aukastafir að reikna með
F5
04/18/23 (c) Thomson Learning Inc. 13
Number of Relative CumulativeTrial Heads Observed Frequency Relative Frequency
1 5 5/10 5/10 = 0.50002 4 4/10 9/20 = 0.45003 4 4/10 13/30 = 0.43334 5 5/10 18/40 = 0.45005 6 6/10 24/50 = 0.48006 7 7/10 28/60 = 0.46677 6 6/10 34/70 = 0.48578 4 4/10 38/80 = 0.47509 7 7/10 45/90 = 0.5000
10 3 3/10 48/100 = 0.480011 4 4/10 52/110 = 0.472712 6 6/10 58/120 = 0.483813 7 7/10 65/130 = 0.500014 4 4/10 69/140 = 0.492915 3 3/10 72/150 = 0.480016 7 7/10 79/160 = 0.493817 6 6/10 85/170 = 0.500018 3 3/10 88/180 = 0.488919 6 6/10 94/190 = 0.494720 4 4/10 98/200 = 0.4900
• Árangur tilraunar, að kasta pening tíu sinnum aftur of aftur
relative frequency/hlutfallsleg tíðni cumulative relative frequency/safn hlutfallsleg tíðni
F6
04/18/23 Dr Andy Brooks 14
DæmiAð kasta pening fimm sinnum
• Probability/Líkindi:
A = {exactly one head/nákvæmlega einn fiskur}?
B = {exactly five heads/nákvæmlega fimm fiskar}?
• 32 possible outcomes/32 möguleikir úrtaksrúmið
2 x 2 x 2 x 2 x 2• A={HTTTT,THTTT,TTHTT,TTTHT,TTTTH}• B={HHHHH}
T THHH
32
5
)(
)()(
Sn
AnAP
32
1
)(
)()(
Sn
BnBP
úrtakspunktar
úrtakspunktur
F6
04/18/23 Dr Andy Brooks 15
P P P P( ) ( ) ( ) ( )A or B A B A and B
General Addition RuleLet A and B be two events defined in a sample space/úrtsaksrúm S:
A B
If two events A and B are “mutually exclusive”: P(A and B) = 0.sniðmengi er ekki til
Intersection/Sniðmengi - við ætlum ekki að telja tvisvar.
general addition rule for probability/almenn samlagningarregla fyrir líkindi
“ósamrýmanlegir atburðir”
Formula Card
F7
04/18/23 Dr Andy Brooks 16
Space shuttle Challenger disaster
• Reliability of a single joint was 0.9777.• But the reliability of six joints was:
0.9777 x 0.9777 x 0.9777 x 0.9777 x 0,9777 x 0.9777eða 0.869 u.þ.b. 87%
Video: Chapter 4 and 5 probability
reliability/áreiðanleiki
Special Multiplication Rule
independent/óháðurF7
04/18/23 Dr Andy Brooks 17
Binomial Distribution/Tvíkostadreifing• p is the probability of “success” on a single trial
– t.d. “probability of heads” P(H) = 0,5 so p = 0,5
• q is the probability of “failure” on a single trial– t.d. “probability of tails” P(T) = 0,5, so q =0,5
• P(x), the probability there will be exactly x successes in n trials, is:
!( ) for x = 0,1,2,...,n
!( )!x n xn
P x p qx n x
binomial coefficient/stuðull
factorialn xC
success/velgengni failure/bilun
Formula Card
F8
04/18/23 Dr Andy Brooks 18
{HHH,HHT,HTH,HTT,THH,THT,TTH,TTT}
• n = 3 (independent trials)• “success” = H og “fail” = T• p = P(H) = 0,5 og q = P(T) = 0,5• p + q = 1• slembibreyta x = 0, 1, 2 eða 3
independent/óháðurrandom variable/slembibreyta
33!( ) 0,5 0,5 for x = 0,1,2, eða 3
!(3 )!x xP x
x x
F8
04/18/23 Dr Andy Brooks 19
Interactivity 6A 1,0 0,5
≈ 0,95 (2σ) ≈ 0,68 (1σ)
Flatarmálið undir feril líkindaþéttleikafallsinsF9
04/18/23 (c) Thomson Learning, Inc. 20
Dæmi
0 145. z
Hvert er flatarmálið milli z-gildanna 0 og 1,45?What is the area between z-scores 0 and 1.45?
Bókartafla 3
4265.0)45.10( zP
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06
1.4 0.4265
...
...
z-gildiNumber of standard deviations from the mean.Hve mörg staðalfrávik frá meðaltalinu.z has a standard normal distribution.
USA .
the area under the curve/flatarmálið undir ferlinumhvert er flatarmálið milli z = ? og ?F9
04/18/23 Dr Andy Brooks 21
RVLS Sampling Distributions
525 125
5
σ=5,00
S=1,02
F10
04/18/23 Dr Andy Brooks 22
Standard error of the meanStaðalvilla meðaltala
• The standard deviation of the sampling distribution of sample means is called the standard error of the mean.
nx
The standared error of the mean gets less with a bigger sample.Staðalvilla meðaltala minnkar með stærra úrtaki.
F10
04/18/23 Dr Andy Brooks 23
Confidence Interval (CI)/Öryggisbil• Oftast, við erum með einu úrtaki og að reikna út meðaltal
úrtaks. • Úrtaksmeðaltal er punktspá fyrir þýðismeðaltal.• 95% öryggisbil fyrir μ (α=0,05) er:
• 99% öryggisbil fyrir μ (α=0,01) er:
n1,96 x til
n1,96 - x
n2,575 x til
n2,575 - x
Ef σ er þekkt.
point estimate/punktspá
Formula Card
F11
04/18/23 Dr Andy Brooks 24
Dæmi
• Neytandahópurinn tekur úrtak 40 pillna (úrtakstærð n=40) og finnur :
• The test statistic/prófmælitalan z* is:
• The probability z<z*, P(z<-1,58), from BOOKTABLE3 is 0,5 - 0,4429 = 0,0571
mg 95,23 x
1,5811-
400,2
24-23,95
x z*
n
Formula Card
F11
04/18/23 Dr Andy Brooks 25
Student´s t statistic• Because s is an estimate, instead of the test
statistic z* and BOOKTABLE3, we use the Student´s t statistic:
• The t-distribution is not normally distributed for small sample sizes n.
• The t-distribution depends on the “degrees of freedom” df = n-1 (for the examples in Chapter 9).
nsx
t
degrees of freedom/frígráður t-distribution/t-dreifing
Formula Card
F12
04/18/23 Dr Andy Brooks 26
Heights of women/Hæðir kvenna
• s er punktspá fyrir σ • 95% öryggisbil er:
0,06s 1,68x 22n
22
06,02,08 x to
22
06,02,08 - x
0
1
2
3
4
5
1,5
51
,56
1,5
71
,58
1,5
91
,61
,61
1,6
21
,63
1,6
41
,65
1,6
61
,67
1,6
81
,69
1,7
1,7
11
,72
1,7
31
,74
1,7
51
,76
1,7
71
,78
1,7
91
,81
,81
1,8
21
,83
1,8
4M
ore
1,705 1,655
Áður, notuðum við 1,96
1,707 1,653
áður
≈ +4mm
F12