statistik ved bachelor-uddannelsen i...
TRANSCRIPT
Statistik ved Bachelor-uddannelsen
i folkesundhedsvidenskab
Grænseværdisætninger
1
“Alt er normalfordelt”
2
3
4
Normalfordelingen
Karakteriseret ved middelværdi og spredning
5
Standardiseret normalfordeling
Middelværdi 0 og spredning 1
6
7
Eksempel
Ud fra et stort materiale har vi fundet en
gennemsnitlig højde p̊a 67.5 inches og en
empirisk spredning p 2.5 inches
Hvis højden er normalfordelt med middelvrdi
67.5 inches og en spredning p̊a 2.5 hvad er s̊a
sandsynligheden for at en tilfældigt udvalgt
person er højere end 71 inches?
Hvor mange standardafvigelser er 71 fra 67.5?
71 − 67.5
2.5= 1.4
Tabelopslag i standardnormalfordeling (B1)
eller computer: P = 0.08%
8
Er udfald nogensinde normalfordelte?
9
Fordeling af svarene p̊a spørgsm̊alet om den
generelle tilfredshed med livet.
Kurven svarer til en normalfordeling med
samme middelværdi og spredning som i
fordelingen af tilfredsheden
10
Fordeling af den gennemsnitlige tilfredshed
med livet i 220 tilfældigt udvalgte grupper p̊a
10 personer.
Kurven svarer til en normalfordeling med
samme middelværdi og spredning som i
fordelingen af tilfredsheden
11
Gennemsnit af 10 personer:
12
Gennemsnit af 25 personer:
Gennemsnit af 50 personer:
13
14
15
De store tals lov
Antag, at X1, .., Xn er n uafhængige og identisk
Bernoullifordelte variable med sandsynlighed,
p, for et positivt udfald.
Lad endvidere hx være den relative hyppighed
af positive udfald, mens ǫ er et vilk̊arlig
positivt tal. N̊ar antallet af observationer
forøges vil sandsynligheden for at forskellen p̊a
sandsynligheden og den relative hyppighed er
mindre end ǫ nærme sig 1.
P (| p − hx |< ǫ) → 1
16
Den centrale grænseværdisætning
Antag, at X1, .., Xn er n uafhængige og identisk
fordelte variable med middelværdi, E(X), og
varians, V(X), og at X̄ er den empiriske
middelværdi (gennemsnittet).
S̊a vil den empiriske middelværdi, , altid være
approksimativt normalt fordelt med
middelværdi, E(X), og varians, V(X)/n.
Approksimationen vil blive bedre og bedre, jo
flere observationer, der indsamles.
17
“Alt er normalfordelt”
• Højde
• Intelligens
• ...
18
Central grænseværdisætning → inferens
Binomialfordelingen B(n, p):
P (X = k) =
n
k
pk(1 − p)n−k
med E{X} = np og {X} = np(1 − p)
Derfor
E{X
n} = p
V {X
n} =
p(1 − p)
n
Estimation og inferens
p̂ =X
n
p̂ ∼ N(p,p(1 − p)
n)
19
20