kapitel 4 sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret...

48
Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011

Upload: others

Post on 29-Jan-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Kapitel 4Sandsynlighed og statistiske modeller

Peter Tibert [email protected]

Elementær statistikF2011

Page 2: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

1 Indledning

2 Sandsynlighed i binomialfordelingen

3 Normalfordelingen

4 Modelkontrol med normalfordelingen

5 Normalfordeling med Excel

6 Opsamling

Page 3: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

1 Indledning

2 Sandsynlighed i binomialfordelingen

3 Normalfordelingen

4 Modelkontrol med normalfordelingen

5 Normalfordeling med Excel

6 Opsamling

Page 4: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Generalisering fra stikprøve til population

Ide: Opstil en model for populationen og estimer modellensparametre pa baggrund af stikprøven

Kontroller at stikprøven ikke er i modstrid med modellen

Eksempel: 95% konfidensinterval for middelværdien i ennormalfordeling

Page 5: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Generalisering fra stikprøve til population

Ide: Opstil en model for populationen og estimer modellensparametre pa baggrund af stikprøven

Kontroller at stikprøven ikke er i modstrid med modellen

Eksempel: 95% konfidensinterval for middelværdien i ennormalfordeling

Page 6: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

1 Indledning

2 Sandsynlighed i binomialfordelingen

3 Normalfordelingen

4 Modelkontrol med normalfordelingen

5 Normalfordeling med Excel

6 Opsamling

Page 7: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Binomialfordelingen - uformelt

Lyttetest: En person har i tre ud af tre sætninger korrekt hørtforskel pa bas og pas - kan det være tilfældigt?

Vi gentager et eksperiment tre gange, hvor der hver gang er50% sandsynlighed for at fa succes ved en tilfældighed (fx. fakrone)

Hvad er sandsynligheden for at fa krone tre gange i træk?

Og hvorfor er det interessant?

Page 8: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Uformelt. . . fortsat

Der er otte mulige udfald ved tre kast: KKK, KKP, KPK,PKK, KPP, PKP, PPK, PPP

Alle otte udfald er lige sandsynlige og netop et udfald svarertil tre gange krone

Laplaces lov: Sandsynlighed er antal gunstige divideret medantal mulige

Sandsynligheden for netop tre gange krone er saledes 1/8 =0,125 = 12,5%

Page 9: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Uformelt. . . fortsat

Tilbage til lyttetest: Der er altsa en sandsynlighed (risiko) pa12,5% for, at personen ikke kan høre forskel pa bas og passelvom der blev svaret rigtigt i 3 ud af 3 tilfælde.

Er dette acceptabelt og hvis ikke: Hvordan kan man sa laveeksperimentet bedre?

Page 10: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Binomialfordelingen — formelt

n Bernoulli-forsøg med sandsynligheden p for sandt (ogfølgeligt sandsynligheden 1− p for falsk)

Punktsandsynligheder er givet ved

f (x) =

(n

x

)pn(1− p)n−1 , x = 0, 1, . . . , n

hvor K(n,x) er binomialkoefficienten(n

x

)=

n · (n − 1) · . . . · (n − x + 1)

x · (x − 1) · . . . · 1=

n!

x!(n − x)!

Page 11: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Binomialfordelingen — formelt og grafisk

0 1 2 3

0.0

0.1

0.2

0.3

0.4

X ~ Bin(3,0.5)

x

f(x)

= P

(X=

x)

Page 12: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Opgave 3

Page 13: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

1 Indledning

2 Sandsynlighed i binomialfordelingen

3 Normalfordelingen

4 Modelkontrol med normalfordelingen

5 Normalfordeling med Excel

6 Opsamling

Page 14: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Normalfordelingen

Normalfordelingen er en kontinuert fordeling mensbinomialfordelingen er en diskret fordeling

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Tæthedsfunktion

x

ϕϕ((x))

Histogrammet for en binomialfordeling med p = 0, 5 og megethøjt n ligner tæthedsfunktionen for en normalfordeling

Page 15: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Normalfordelingen

Normalfordelingen er en kontinuert fordeling mensbinomialfordelingen er en diskret fordeling

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Tæthedsfunktion

x

ϕϕ((x))

Histogrammet for en binomialfordeling med p = 0, 5 og megethøjt n ligner tæthedsfunktionen for en normalfordeling

Page 16: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Normalfordelingen som grænsefordeling forbinomialfordelingen med p = 0, 5

0 1 2 3 4 5

0.05

0.15

0.25

n=5

x

P(x

)

0 2 4 6 8 10

0.00

0.10

0.20

n=10

x

P(x

)

0 5 10 15 20

0.00

0.05

0.10

0.15

n=20

x

P(x

)

0 10 20 30 40 50

0.00

0.04

0.08

n=50

x

P(x

)

Page 17: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Normalfordelingen

Der findes uendeligt mange normalfordelinger, der hver især erkarakteriseret ved deres middelværdi µ og deres spredning σ

Middelværdi µ og spredning σ er parametre inormalfordelingen, og vi skriver N(µ, σ2)

Tæthedsfunktionen er en klokkeformet kurve:

f (x ;µ, σ) =1

σ√

2πexp

(−(x − µ)2

2σ2

)(vi bruger heldigvis næsten altid tabeller)

Kurven har toppunkt for x = µ

Større spredning giver fladere tæthedsfunktion

Page 18: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Tæthedsfunktion for 3 forskellige normalfordelinger

−10 0 10 20 30

0.00

0.05

0.10

0.15

0.20

x

f(x)

N((10,, 22))N((10,, 42))N((20,, 22))

Page 19: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Fordelingsfunktion og standardnormalfordeling

Ved bestemt integration af tæthedsfunktionen kommer vi fremtil fordelingsfunktionen, der er en slags kummuleretfrekvensfordeling

Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

50% af eleverne kan forventes at score mellem 22 og 87 i denforelagte prøve5% af eleverne forventes at score mindre end 12

Fordelingsfunktionen gar gennem (µ, 0.5)

Lavere spredning giver stejlere fordelingsfunktion

Page 20: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Fordelingsfunktion for 3 forskellige normalfordelinger

−10 0 10 20 30

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x

)

N((10,, 22))N((10,, 42))N((20,, 22))

Page 21: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Standardnormalfordelingen

Der findes uendeligt mange normalfordelinger, men vi kan ipraksis klare os med en, nemlig standardnormalfordelingenN(0, 1)

Fordelingsfunktionen Φ(x) fremkommer ved integration aftæthedsfunktionen ϕ(x)

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Tæthedsfunktion

x

ϕϕ((x))

−3 −2 −1 0 1 2 3

0.0

0.2

0.4

0.6

0.8

1.0

Fordelingsfunktion

x

ΦΦ((x

))

Page 22: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Eksempel pa brug af Φ

Antag at vi har lavet en undersøgelse, hvor gennemsnittet afscorene er 17 og standardafvigelsen er 3. Vi antager desuden,at scorene følger en normalfordeling.

Vi vil nu gerne kende sandsynligheden for, at en tilfældig scoreer mindre end 14.

Vi normaliserer ved at beregne den sakaldte z-værdi:

z =x − X

s=

14− 17

3= −1

Ved opslag i Tabel A kan vi nu se at

p = P(x ≤ 14) = Φ(−1) = 0, 159

Sandsynligheden for at en tilfældig score er mindre en 14 eraltsa cirka 16%

Page 23: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Eksempel pa brug af Φ

Antag at vi har lavet en undersøgelse, hvor gennemsnittet afscorene er 17 og standardafvigelsen er 3. Vi antager desuden,at scorene følger en normalfordeling.

Vi vil nu gerne kende sandsynligheden for, at en tilfældig scoreer mindre end 14.

Vi normaliserer ved at beregne den sakaldte z-værdi:

z =x − X

s=

14− 17

3= −1

Ved opslag i Tabel A kan vi nu se at

p = P(x ≤ 14) = Φ(−1) = 0, 159

Sandsynligheden for at en tilfældig score er mindre en 14 eraltsa cirka 16%

Page 24: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Eksempel pa brug af Φ

Antag at vi har lavet en undersøgelse, hvor gennemsnittet afscorene er 17 og standardafvigelsen er 3. Vi antager desuden,at scorene følger en normalfordeling.

Vi vil nu gerne kende sandsynligheden for, at en tilfældig scoreer mindre end 14.

Vi normaliserer ved at beregne den sakaldte z-værdi:

z =x − X

s=

14− 17

3= −1

Ved opslag i Tabel A kan vi nu se at

p = P(x ≤ 14) = Φ(−1) = 0, 159

Sandsynligheden for at en tilfældig score er mindre en 14 eraltsa cirka 16%

Page 25: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Eksempel pa brug af Φ

Antag at vi har lavet en undersøgelse, hvor gennemsnittet afscorene er 17 og standardafvigelsen er 3. Vi antager desuden,at scorene følger en normalfordeling.

Vi vil nu gerne kende sandsynligheden for, at en tilfældig scoreer mindre end 14.

Vi normaliserer ved at beregne den sakaldte z-værdi:

z =x − X

s=

14− 17

3= −1

Ved opslag i Tabel A kan vi nu se at

p = P(x ≤ 14) = Φ(−1) = 0, 159

Sandsynligheden for at en tilfældig score er mindre en 14 eraltsa cirka 16%

Page 26: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Eksempel pa brug af Φ

Antag at vi har lavet en undersøgelse, hvor gennemsnittet afscorene er 17 og standardafvigelsen er 3. Vi antager desuden,at scorene følger en normalfordeling.

Vi vil nu gerne kende sandsynligheden for, at en tilfældig scoreer mindre end 14.

Vi normaliserer ved at beregne den sakaldte z-værdi:

z =x − X

s=

14− 17

3= −1

Ved opslag i Tabel A kan vi nu se at

p = P(x ≤ 14) = Φ(−1) = 0, 159

Sandsynligheden for at en tilfældig score er mindre en 14 eraltsa cirka 16%

Page 27: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

1 Indledning

2 Sandsynlighed i binomialfordelingen

3 Normalfordelingen

4 Modelkontrol med normalfordelingen

5 Normalfordeling med Excel

6 Opsamling

Page 28: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Modelkontrol

Vi er ofte interesserede i at se, hvor godt vores stikprøveegentlig stemmer overens med normalfordelingsantagelsen

For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventedeantal observationer i et bestemt interval under antagelsen omnormalitet og sammenligner med det observerede

Vi beregner x = 208, 9 og s = 9, 79

For klassen afgrænset ved (204, 5; 209, 5] beregnes toz-værdier til -0,45 og 0,06

Via Tabel A findes tilhørende sandsynligheder p som 0,326 og0,524

Sandsynligheden for at være i intervallet er derfor 0,524 -0,326 = 0,198

Da stikprøven omfatter 40 enheder forventer vi at finde40 · 0, 198 = 7, 92 enheder i intervallet

Der var faktisk 9. . .

Page 29: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Modelkontrol

Vi er ofte interesserede i at se, hvor godt vores stikprøveegentlig stemmer overens med normalfordelingsantagelsen

For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventedeantal observationer i et bestemt interval under antagelsen omnormalitet og sammenligner med det observerede

Vi beregner x = 208, 9 og s = 9, 79

For klassen afgrænset ved (204, 5; 209, 5] beregnes toz-værdier til -0,45 og 0,06

Via Tabel A findes tilhørende sandsynligheder p som 0,326 og0,524

Sandsynligheden for at være i intervallet er derfor 0,524 -0,326 = 0,198

Da stikprøven omfatter 40 enheder forventer vi at finde40 · 0, 198 = 7, 92 enheder i intervallet

Der var faktisk 9. . .

Page 30: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Modelkontrol

Vi er ofte interesserede i at se, hvor godt vores stikprøveegentlig stemmer overens med normalfordelingsantagelsen

For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventedeantal observationer i et bestemt interval under antagelsen omnormalitet og sammenligner med det observerede

Vi beregner x = 208, 9 og s = 9, 79

For klassen afgrænset ved (204, 5; 209, 5] beregnes toz-værdier til -0,45 og 0,06

Via Tabel A findes tilhørende sandsynligheder p som 0,326 og0,524

Sandsynligheden for at være i intervallet er derfor 0,524 -0,326 = 0,198

Da stikprøven omfatter 40 enheder forventer vi at finde40 · 0, 198 = 7, 92 enheder i intervallet

Der var faktisk 9. . .

Page 31: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Modelkontrol

Vi er ofte interesserede i at se, hvor godt vores stikprøveegentlig stemmer overens med normalfordelingsantagelsen

For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventedeantal observationer i et bestemt interval under antagelsen omnormalitet og sammenligner med det observerede

Vi beregner x = 208, 9 og s = 9, 79

For klassen afgrænset ved (204, 5; 209, 5] beregnes toz-værdier til -0,45 og 0,06

Via Tabel A findes tilhørende sandsynligheder p som 0,326 og0,524

Sandsynligheden for at være i intervallet er derfor 0,524 -0,326 = 0,198

Da stikprøven omfatter 40 enheder forventer vi at finde40 · 0, 198 = 7, 92 enheder i intervallet

Der var faktisk 9. . .

Page 32: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Modelkontrol

Vi er ofte interesserede i at se, hvor godt vores stikprøveegentlig stemmer overens med normalfordelingsantagelsen

For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventedeantal observationer i et bestemt interval under antagelsen omnormalitet og sammenligner med det observerede

Vi beregner x = 208, 9 og s = 9, 79

For klassen afgrænset ved (204, 5; 209, 5] beregnes toz-værdier til -0,45 og 0,06

Via Tabel A findes tilhørende sandsynligheder p som 0,326 og0,524

Sandsynligheden for at være i intervallet er derfor 0,524 -0,326 = 0,198

Da stikprøven omfatter 40 enheder forventer vi at finde40 · 0, 198 = 7, 92 enheder i intervallet

Der var faktisk 9. . .

Page 33: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Modelkontrol

Vi er ofte interesserede i at se, hvor godt vores stikprøveegentlig stemmer overens med normalfordelingsantagelsen

For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventedeantal observationer i et bestemt interval under antagelsen omnormalitet og sammenligner med det observerede

Vi beregner x = 208, 9 og s = 9, 79

For klassen afgrænset ved (204, 5; 209, 5] beregnes toz-værdier til -0,45 og 0,06

Via Tabel A findes tilhørende sandsynligheder p som 0,326 og0,524

Sandsynligheden for at være i intervallet er derfor 0,524 -0,326 = 0,198

Da stikprøven omfatter 40 enheder forventer vi at finde40 · 0, 198 = 7, 92 enheder i intervallet

Der var faktisk 9. . .

Page 34: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Modelkontrol

Vi er ofte interesserede i at se, hvor godt vores stikprøveegentlig stemmer overens med normalfordelingsantagelsen

For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventedeantal observationer i et bestemt interval under antagelsen omnormalitet og sammenligner med det observerede

Vi beregner x = 208, 9 og s = 9, 79

For klassen afgrænset ved (204, 5; 209, 5] beregnes toz-værdier til -0,45 og 0,06

Via Tabel A findes tilhørende sandsynligheder p som 0,326 og0,524

Sandsynligheden for at være i intervallet er derfor 0,524 -0,326 = 0,198

Da stikprøven omfatter 40 enheder forventer vi at finde40 · 0, 198 = 7, 92 enheder i intervallet

Der var faktisk 9. . .

Page 35: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Modelkontrol

Vi er ofte interesserede i at se, hvor godt vores stikprøveegentlig stemmer overens med normalfordelingsantagelsen

For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventedeantal observationer i et bestemt interval under antagelsen omnormalitet og sammenligner med det observerede

Vi beregner x = 208, 9 og s = 9, 79

For klassen afgrænset ved (204, 5; 209, 5] beregnes toz-værdier til -0,45 og 0,06

Via Tabel A findes tilhørende sandsynligheder p som 0,326 og0,524

Sandsynligheden for at være i intervallet er derfor 0,524 -0,326 = 0,198

Da stikprøven omfatter 40 enheder forventer vi at finde40 · 0, 198 = 7, 92 enheder i intervallet

Der var faktisk 9. . .

Page 36: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Grafisk modelkontrol

(184.5; 189.5]

(189.5; 194.5]

(194.5; 199.5]

(199.5; 204.5]

(204.5; 209.5]

(209.5; 214.5]

(214.5; 219.5]

(219.5; 224.5]

(224.5; 229.5]

(229.5; 234.5]

Vokalvarighed [ms]

Vokalvarighed [ms]

Ant

al

02

46

810

ObserveretForventet

Page 37: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Grafisk modelkontrol

Observeret Forventet

Vokalvarighed [ms]

Ant

al

02

46

810

(184.5; 189.5](189.5; 194.5](194.5; 199.5](199.5; 204.5](204.5; 209.5](209.5; 214.5](214.5; 219.5](219.5; 224.5](224.5; 229.5](229.5; 234.5]

Page 38: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

1 Indledning

2 Sandsynlighed i binomialfordelingen

3 Normalfordelingen

4 Modelkontrol med normalfordelingen

5 Normalfordeling med Excel

6 Opsamling

Page 39: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Normalfordeling i Excel

Der kan beregnes værdier for bade f (x) og F (x) for vilkarligenormalfordelinger med funktionen normfordeling(...), dertager fire argumenter:

værdi af xmiddelværdi µspredning σkumulativ: 0 betyder nej (der regnes med f ) og 1 betyder ja(der regnes med F )

Der kan findes fraktiler for vilkarlige normalfordelinger medfunktionen norminv(...), der tager tre argumenter:

sandsynlighed pmiddelværdi µspredning σ

Dette svarer til at finde xp i ligningenF (xp) = p ⇒ xp = F−1(p)

Page 40: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Normalfordeling i Excel

Der kan beregnes værdier for bade f (x) og F (x) for vilkarligenormalfordelinger med funktionen normfordeling(...), dertager fire argumenter:

værdi af xmiddelværdi µspredning σkumulativ: 0 betyder nej (der regnes med f ) og 1 betyder ja(der regnes med F )

Der kan findes fraktiler for vilkarlige normalfordelinger medfunktionen norminv(...), der tager tre argumenter:

sandsynlighed pmiddelværdi µspredning σ

Dette svarer til at finde xp i ligningenF (xp) = p ⇒ xp = F−1(p)

Page 41: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Normalfordeling i Excel

Ønsker man at finde værdier i standardnormalfordelingen kanman benytte funtionerne standardnormfordeling(...) ogstandardnorminv(...), der tager et argument hver

. . . men det er nok lige sa nemt at angive µ = 0 og σ = 1 i degenerelle funktioner

I praksis bruger vi stort set kun tæthedsfunktionen nar vi skaltegne pæne klokkeformede kurver — det er næsten altidfordelingsfunktionen, der er den interessante

Page 42: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Normalfordeling i Excel

Ønsker man at finde værdier i standardnormalfordelingen kanman benytte funtionerne standardnormfordeling(...) ogstandardnorminv(...), der tager et argument hver

. . . men det er nok lige sa nemt at angive µ = 0 og σ = 1 i degenerelle funktioner

I praksis bruger vi stort set kun tæthedsfunktionen nar vi skaltegne pæne klokkeformede kurver — det er næsten altidfordelingsfunktionen, der er den interessante

Page 43: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Normalfordeling i Excel

Ønsker man at finde værdier i standardnormalfordelingen kanman benytte funtionerne standardnormfordeling(...) ogstandardnorminv(...), der tager et argument hver

. . . men det er nok lige sa nemt at angive µ = 0 og σ = 1 i degenerelle funktioner

I praksis bruger vi stort set kun tæthedsfunktionen nar vi skaltegne pæne klokkeformede kurver — det er næsten altidfordelingsfunktionen, der er den interessante

Page 44: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

1 Indledning

2 Sandsynlighed i binomialfordelingen

3 Normalfordelingen

4 Modelkontrol med normalfordelingen

5 Normalfordeling med Excel

6 Opsamling

Page 45: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Opsamling

Normalfordelingen er en ofte benyttet model for delvistobserverede populationer, idet fordelingens parametre kanestimeres fra en stikprøve

Normalfordelingen har to parametre, middelværdi µ ogspredning σ, og vi skriver N(µ, σ2)

Standardnormalfordelingen N(0, 1) kan benyttes tilberegninger i andre normalfordelinger via en z-værdi

z =x − µσ

Saledes beregnes sandsynligheden P(X < x), hvorX ∼ N(µ0, σ

20) ved

p = Φ

(x − µ0σ0

)hvor Φ er fordelingsfunktionen for standardnormalfordelingen.

Page 46: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Opsamling

Normalfordelingen er en ofte benyttet model for delvistobserverede populationer, idet fordelingens parametre kanestimeres fra en stikprøve

Normalfordelingen har to parametre, middelværdi µ ogspredning σ, og vi skriver N(µ, σ2)

Standardnormalfordelingen N(0, 1) kan benyttes tilberegninger i andre normalfordelinger via en z-værdi

z =x − µσ

Saledes beregnes sandsynligheden P(X < x), hvorX ∼ N(µ0, σ

20) ved

p = Φ

(x − µ0σ0

)hvor Φ er fordelingsfunktionen for standardnormalfordelingen.

Page 47: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Opsamling

Normalfordelingen er en ofte benyttet model for delvistobserverede populationer, idet fordelingens parametre kanestimeres fra en stikprøve

Normalfordelingen har to parametre, middelværdi µ ogspredning σ, og vi skriver N(µ, σ2)

Standardnormalfordelingen N(0, 1) kan benyttes tilberegninger i andre normalfordelinger via en z-værdi

z =x − µσ

Saledes beregnes sandsynligheden P(X < x), hvorX ∼ N(µ0, σ

20) ved

p = Φ

(x − µ0σ0

)hvor Φ er fordelingsfunktionen for standardnormalfordelingen.

Page 48: Kapitel 4 Sandsynlighed og statistiske modellertil fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen:

Indledning Binomialfordelingen Normalfordelingen Modelkontrol Excel Opsamling

Opsamling

Normalfordelingen er en ofte benyttet model for delvistobserverede populationer, idet fordelingens parametre kanestimeres fra en stikprøve

Normalfordelingen har to parametre, middelværdi µ ogspredning σ, og vi skriver N(µ, σ2)

Standardnormalfordelingen N(0, 1) kan benyttes tilberegninger i andre normalfordelinger via en z-værdi

z =x − µσ

Saledes beregnes sandsynligheden P(X < x), hvorX ∼ N(µ0, σ

20) ved

p = Φ

(x − µ0σ0

)hvor Φ er fordelingsfunktionen for standardnormalfordelingen.