wykład 4. rozkłady teoretyczne
Post on 04-Jan-2016
102 Views
Preview:
DESCRIPTION
TRANSCRIPT
Wykład 4. Rozkłady teoretyczne
Zmienna losowa jest to taka zmienna, która w wyniku doświadczenia przyjmuje wartość z pewnego zbioru liczb rzeczywistych z określonym prawdopodobieństwem.
Rozkład normalnyPodstawowym rozkładem zmiennej losowej ciągłej jest rozkład normalny
(Gaussa-Laplace’a). Zmienna losowa X ma rozkład normalny, jeśli jej funkcja gęstości - określona dla wszystkich rzeczywistych wartości x - da się przedstawić za pomocą wzoru (4.1):
,2
)(exp
2
1=)(
2
2
mx
xf
Wykład 4. Rozkłady teoretyczne
Realizacje zmiennej losowej o rozkładzie normalnym są określone w przedziale - < x < +
Funkcja gęstości rozkładu normalnego, dana wzorem 4.1. ma następujące własności:
1) jest symetryczna względem prostej x = m (własność symetryczności),
2) osiąga maksimum dla x = m (własność jednomodalności),
3) jej ramiona mają dwa punkty przegięcia dla x1 m- σ;
4) oraz x2 m + σ ,
4) jest całkowicie określona przez dwa parametry: parametr m decyduje o przesunięciu krzywej, natomiast parametr σ decyduje o smukłości krzywej; własność określoności wyróżniamy zapisem N(m; σ) .
Wykład 4. Rozkłady teoretyczne; rozkład normalny
Rys. 4.1 Gêstoœæ rozk³adu normalnego
0,000
0,005
0,010
0,015
0,020
0,025
0,030
0,035
0,040
-3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0
Kwantyle
Punkty przegiêcia
Wykład 4. Rozkłady teoretyczne; rozkład normalny
Rozkład normalny N (0,1) nazywa się standardowym rozkładem normalnym. Jego dystrybuanta wyraża się wzorem (4.2):
gdzie (4.3)
xu duexF ,
2
1=)( 2/
mx
u
Wykład 4. Rozkłady teoretyczne; dystrybuanta rozkładu normalnego
Rys. 4.2. Dystrybuanta rozkładu normalnego standaryzowanego N(0;1)
0,00
0,01
0,02
0,03
0,04
-3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5
Kwantyle rozkładu normalnego
Pra
wdo
podo
bień
stw
o
Tablica 4.1. Dystrybuanta rozkładu normalnego standaryzowanego N(0;1), I rodzaj tablic (pole pod krzywą od minus nieskończoność do x) u 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,10 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,20 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,30 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,40 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,50 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,60 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,70 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,80 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,90 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,00 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,10 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,20 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,30 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,40 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,50 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,60 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,70 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,80 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,90 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,00 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,10 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,20 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
Wykład 4. Rozkłady teoretyczne; rozkład normalny
Funkcje związane z rozkładem normalnym w Excelu:
A. Dowolny rozkład normalny:
a) dane są: średnia, odchylenie standardowe, wartość empiryczna x - poszukujemy pole czyli „lewy ogonek”:
- [fx]=>statystyczne=>rozkład.normalny ==>dane: m, s, x oraz jako „skumulowany” wpisać jako wartość logiczną „1”
b) dane jest prawdopodobieństwo, średnia, odchylenie standardowe - poszukujemy kwantyl empiryczny x,
- [fx]=>statystyczne=>rozkład.normalny ==>dane
Wykład 4. Rozkłady teoretyczne; rozkład normalny
B. Rozkład normalny standaryzowany
a) dany jest kwantyl - poszukujemy pole „lewy ogonek”:
- [fx]=>statystyczne=>rozkład.normalny.S==> kwantyl
b) dane jest pole - poszukujemy kwantyl rozkładu normalnego:
- [fx]=>statystyczne=>rozkład.normalny.S.odw==> pole pod krzywą rozkładu normalnego od - do szukanego x.
Obliczanie prawdopodobieństw P(a<X<b) dla zmiennej losowej o rozkładzie normalnym można przedstawić przy pomocy zmiennej standaryzowanej U(0,1) w sposób następujący:
Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego
)()(mbmXma
PbXaP
)())
()(ma
Fmb
Fmb
Uma
P
)()( ab uFuF
Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego
Przykład 1:
Temperatura ciała ludzkiego jest zmienną losową o rozkładzie normalnym ze średnią wynoszącą 36,6oC oraz odchyleniem standardowym . Oblicz prawdopodobieństwo zdarzenia, że losowo wybrany pacjent pewnego szpitala będzie miał temperaturę ciała:
a) mniejszą niż 36,3oC,
b) większą niż 37,6 oC,
c) większą niż 37,9 oC ale mniejszą niż 38,2oC.
ad. a)
)3,36( Xp
6,05,0
3,0
5,0
6,363,36
u
Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego
ad. b)
P(X>37,6) P(X>37,6)=P(u>2)=1-F(2)=1-0,97725=0,02275, patrz rys. 4.3.
Wykład 4. Rozkłady teoretyczne; wyznaczanie pola pod krzywą rozkładu normalnego
ad. c)
004,09953,09993,0
)6,2()2,3()2,36,2()2,389,37(
FFUPXP
Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego
1) Rozkład normalny standaryzowany N(0;1) ma E(u) = 0 oraz S2 = 1;
2) Pole pod krzywą rozkładu normalnego standaryzowanego N(0;1) jest
równe jedności;
3) Punkty przegięcia: u1 = -1 oraz u2 = +1;
4) Współczynnik asymetrii alfa 3 = 0;
5) Współczynnik koncentracji alfa 4 = 3;
6) Mo = Me = E(u)
7) Q1 = - 0,6745; Q3 = +0,6745
Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego
8) W przedziale od – 1 do + 1 znajduje się ponad 68% zbiorowości,
od – 2 do + 2 około 95%,
od – 3 do + 3 ponad 99% całej zbiorowości;
9) Rozkład normalny jako rozkład błędów w teorii pomiarów;
10) Występowanie rozkładu normalnego w świecie przyrody: mity i
rzeczywistość;
11) Rzadkość występowania rozkładu normalnego w zjawiskach społeczno-
ekonomicznych;
Wykład 4. Rozkłady teoretyczne; własności i zastosowania rozkładu normalnego standaryzowanego
12)Miejsce rozkładu normalnego w teorii statystyki:
a. aproksymacja statystyczna,
b. przybliżenie krzywą Gaussa – Laplace’a innych rozkładów teoretycznych
ciągłych (Studenta, , Fishera – Snedecora) i dyskretnych (dwumianowy,
Poissona)
c. estymacja statystyczna,
d. weryfikacja hipotez statystycznych,
e. ocena niezbędnej wielkości próby w badaniach reprezentacyjnych..
Wykład 4. Rozkłady teoretyczne; Rozkład Studenta
Rozkład t-Studenta według liczby stopni swobody
0,000
0,005
0,010
0,015
0,020
0,025
-4 -3 -2 -1 0 1 2 3 4
Kwantyle rozkładu Studenta
Funk
cja
gęst
ości
1
10
30
70
100
Wykład 4. Tablice rozkładu Studenta „dwuogonowe”
Tablica 4.2. Kwantyle rozkładu Studenta z dwoma obszaramikrytycznymi ("dwugoniaste") dla małej liczby stopni swobody.
Liczba stopni
0,50 0,40 0,30 0,20 0,10 0,04 0,02 0,01 0,002
swobody1 1,00 1,38 1,96 3,08 6,31 15,89 31,82 63,66 318,292 0,82 1,06 1,39 1,89 2,92 4,85 6,96 9,92 22,333 0,76 0,98 1,25 1,64 2,35 3,48 4,54 5,84 10,214 0,74 0,94 1,19 1,53 2,13 3,00 3,75 4,60 7,175 0,73 0,92 1,16 1,48 2,02 2,76 3,36 4,03 5,896 0,72 0,91 1,13 1,44 1,94 2,61 3,14 3,71 5,217 0,71 0,90 1,12 1,41 1,89 2,52 3,00 3,50 4,798 0,71 0,89 1,11 1,40 1,86 2,45 2,90 3,36 4,509 0,70 0,88 1,10 1,38 1,83 2,40 2,82 3,25 4,30
10 0,70 0,88 1,09 1,37 1,81 2,36 2,76 3,17 4,1411 0,70 0,88 1,09 1,36 1,80 2,33 2,72 3,11 4,0212 0,70 0,87 1,08 1,36 1,78 2,30 2,68 3,05 3,9313 0,69 0,87 1,08 1,35 1,77 2,28 2,65 3,01 3,8514 0,69 0,87 1,08 1,35 1,76 2,26 2,62 2,98 3,7915 0,69 0,87 1,07 1,34 1,75 2,25 2,60 2,95 3,73
Wykład 5 Analiza współzależności.
1. Analiza wariancji
a) analiza jednoczynnikowa (podział wg 1 kryterium)
- Porównanie średnich w dowolnej liczbie subpopulacji (prób) o
rozkładzie normalnym lub zbliżonym do normalnego oraz o
jednakowych wariancjach.
H0: M1 = M2 = M3 = . . . (5.1)
H1: M1 M2 M3 . . . (5.2)
Wykład 5 Analiza współzależności. Analiza wariancji
Do weryfikacji hipotezy (5.1) wykorzystuje się test Fishera-Snedecora o
postaci:
F = MSB/MSE, gdy MSB > MSE, (5.3)
lub
F = MSE/MSB, gdy MSB < MSE, (5.4)
gdzie: MSB – średni kwadrat odchyleń od średniej między grupami
(próbami),
MSE – średni kwadrat odchyleń od średniej wewnątrz grup
Wykład 5 Analiza współzależności. Analiza wariancji
Tablica 5.1. Analiza wariancji z uwzględnieniem liczby zmiennych (grup) oraz liczby obserwacji:
Źródło zmienności Suma kwadratów odchyleń
Stopnie swobody
Średni kwadrat odchyleń
1. Czynnik (podpróbka, klasyfikacja) r - 1
- zróżnicowanie międzygrupowe r-liczba grup
2. Błąd losowy n – r- zróżnicowanie wewnątrzgrupowe n-liczba
wszystkich jednostek
3. Ogółem dla całej próby SST r-1+n-r=n-1 MSB+MSE
SSB MSB
SSE MSE
Wykład 5 Analiza współzależności. Analiza wariancji
Ogólna suma kwadratów odchyłek (5.5):
2
1 1
2
2
1 1
1 1
2 xnxn
xxSST
r
i
n
kki
r
i
n
kkir
i
n
kki
i
i
i
Wykład 5 Analiza współzależności. Analiza wariancji
Ważona suma kwadratów odchyłek między średnimi grupowymi a średnią ogólną (5.6):
n
x
n
xSSB
r
i
n
kkir
i i
n
kki
ii
2
1 1
1
2
1
Wykład 5 Analiza współzależności. Analiza wariancji
Suma kwadratów odchyłek między realizacjami zmiennej X a poszczególnymi średnimi wewnątrz grup (podpróbek) (5.7) :
SSE = SST – SSB
Wariancja między grupami (5.8):
11
2
1
r
xxn
r
SSBMSB
r
iii
Wykład 5 Analiza współzależności. Analiza wariancji
gdzie w nawiasie okrągłym w liczniku (5.8) mamy odchyłki między średnimi grupowymi (lub przeciętnymi z poszczególnych podpróbek) a średnią ogólną dla całej próby.
Wariancja wewnątrz grup (wewnątrz podpróbek) (5.9):
rnnn
xxxxxx
rn
SSEMSE
r
n
k
n
krk
n
kkk
r
...
...
21
1 1
21
1
221
211
1 2
Przykład 5.1. Ceny wędlin w wylosowanych sklepach detalicznych Poznania. Czy ceny mięsa pochodzącego od różnych rzeźników różnią się istotnie?
Boucher Butcher Fleischer Henryk Suma cen
16 15,8 14,6 15,1 61,516,1 16,4 15,5 15,2 63,216,5 16,4 16 15,3 64,216,8 17 16,2 15,7 65,7
17 17,5 16,4 16 66,917,2 16,6 16,8 50,6
18 17,4 35,418,2 18,2
Suma cen od producenta (i) 117,6 83,1 130,9 94,1 425,7Liczby wędlin od (i) 7 5 8 6 26Średnie (i) 16,8 16,62 16,36 15,68 16,37
Uwaga: ceny wylosowanych wędlin zostały uporządkowane rosnąco. Porządek losowania nie
ma tu znaczenia.
Producent (grupa i)
Przykład 5.1. c.d.
0,64 0,6724 3,10641 0,34028Kwadraty odchyleń 0,49 0,0484 0,74391 0,23361pomiędzy konkretną 0,09 0,0484 0,13141 0,14694ceną a ich średnią 0 0,1444 0,02641 0,00028u danego rzeźnika 0,04 0,7744 0,00141 0,10028[grupy] 0,16 0,05641 1,24694
1,44 1,076413,37641
Suma kwadratów odchyłek 2,86 1,69 8,52 2,07 15,140,68796
a średnią ogólną 1,27584 0,30486 0,00089 2,85448 4,441,47869Wariancja między grupami (MSB) według wzoru 8.8
Wariancja wewnątrz grup (MSE) według wzoru 8.9Ważona suma kwadratów odchyłek między średnimi grupowymi
Wykład 5 Analiza współzależności. Analiza wariancji
F = 1,47869/0,68796 =2,1494. Na poziomie istotności α = 0,05 i
liczbach stopni swobody: k-1=4-1 = 3 (licznik) oraz n-k=26-
4=22 (mianownik) w rozkładzie Fishera-Snedecora
odczytujemy: F0,05;3;22 = 3,05 > F = 2,1494
Nie można więc odrzucić H0, że średnie w populacji
generalnej są sobie równe. Brak zatem podstaw do
stwierdzenia, że mięso pochodzące od poszczególnych
rzeźników różni się pod względem cen.
Wykład 6 Analiza współzależności. Korelacja cech jakościowych i ilościowych
1. Rodzaje zależnościa) Kryterium 1 - przyczynowo-skutkowe,
- korelacyjne,
- symptomatyczne,
- bilansowe
b) Kryterium 2- zależność funkcyjna,
· zależność stochastyczna,
· zależność korelacyjna.
c) Kryterium 3
- liniowe,
- krzywoliniowe,
- wg formalnej postaci równań
Wykład 6 Rodzaje zależności (kryterium 3).
Rodzaje zależności (brak korelacji)
0
10
20
30
40
50
60
70
80
90
100
0 10 20 30 40 50 60 70 80 90 100
Zmienna X
Zm
ienn
a Y
Wykład 6 Rodzaje zależności (kryterium 3).
Rodzaje zależności (bardzo silna korelacja dodatnia - rxy = 0,94)
y = 0,5392x + 19,999
R2 = 0,8839
0
10
20
30
40
50
60
70
80
0 10 20 30 40 50 60 70 80 90 100
Zmienna X
Zmie
nna
Y
Wykład 6 Rodzaje zależności (kryterium 3).
Rodzaje zależności (wyraźna korelacja dodatnia - rxy = 0,5)
y = 0,24x + 35,65
R2 = 0,25
0
10
20
30
40
50
60
70
80
0 10 20 30 40 50 60 70 80 90 100
Zmienna X
Zm
ienn
a Y
Wykład 6 Rodzaje zależności (kryterium 3).
Rodzaje zależności (słaba korelacja dodatnia - rxy = 0,3)
y = 0,19x + 38,07
R2 = 0,09
0
10
20
30
40
50
60
70
80
90
0 10 20 30 40 50 60 70 80 90 100
Zmienna X
Zm
ienn
a Y
Wykład 6 Rodzaje zależności (kryterium 3).
Rodzaje zależności (bardzo silna korelacja ujemna- rxy = - 0,9)
y = -0,51x + 69,45
R2 = 0,81
0
10
20
30
40
50
60
70
0 10 20 30 40 50 60 70 80 90 100
Zmienna X
Zm
ienn
a Y
Wykład 6 Rodzaje zależności (kryterium 3).
Rodzaje zależności (wyraźna korelacja ujemna- rxy = - 0,6)
y = -0,33x + 61,56
R2 = 0,36
0
10
20
30
40
50
60
70
0 10 20 30 40 50 60 70 80 90 100
Zmienna X
Zm
ienn
a Y
Wykład 6 Rodzaje zależności (kryterium 3).
Rodzaje zależności (brak zależności liniowej - rxy = 0,00; bardzo silna korelacja krzywoliniowa, wielomian drugiego stopnia)
zależność linioway = -0,00x + 37,29
R2 = 0,00
Zależność paraboliczna
y = -0,0189x2 + 1,8314x + 3,6244
R2 = 0,9067
0
10
20
30
40
50
60
0 10 20 30 40 50 60 70 80 90 100
Zmienna X
Zm
ienn
a Y
Wykład 6 Rodzaje zależności (kryterium 3).
top related