이 산 확 률 분 포
DESCRIPTION
4. 이 산 확 률 분 포. 1. 이산균등분포. 2. 초기하분포. 3. 이항분포. 4. 기하분포와 음이항분포. 5. 포아송분포. 6. 다항분포. 1. 이산균등분포 ( discrete uniform distribution ). 이산균등분포의 확률질량함수와 평균 , 분산에 대하여 알아본다. f(x) = , x = 1, 2, …, n. 1. 1. 1. 1. 1. n. n. n. n. n. n+1. n(n+1). =. =. 2. 2. n. n. - PowerPoint PPT PresentationTRANSCRIPT
이 산 확 률 분 포이 산 확 률 분 포44
11
22
33
초기하분포초기하분포이산균등분포이산균등분포
이항분포이항분포
44 기하분포와 음이항분포기하분포와 음이항분포
55 포아송분포포아송분포
66 다항분포다항분포
11 이산균등분포 (discrete uniform distribution)이산균등분포 (discrete uniform distribution)
이산균등분포의 확률질량함수와 평균 , 분산에 대하여 알아본다 .이산균등분포의 확률질량함수와 평균 , 분산에 대하여 알아본다 .
1) 확률질량함수1) 확률질량함수☞
f(x) = , x = 1, 2, …, n
1n
2) 평균 2) 평균 ☞
E(X2) = x2 f(x) = x2
x=1 x=1
nn
= 1n
=n(n+1)(2n+1)6
(n+1)(2n+1)6
1n
E(X) = x f(x) = x
x=1 x=1
nn
= 1n
n(n+1)2
=n+1
2
1n
X ~ DU(n)
3) 분산 3) 분산 ☞
=(n+1)(2n+1)6
n+12
2 = Var(X) = E(X2) – E(X)2
2- =n2 -112
X : 1 에서 45 까지의 번호를 적은 동일한 모양의 공이 들어 있는 주머니에서
임의로 하나를 꺼내어 나온 공의 번호
(1) X 의 확률질량함수
(2) X 의 평균과 분산
(3) 40 번 이상의 번호가 적힌 공이 나올 확률
그림출처 : www.lotto.co.kr
f(x) = , x = 1, 2, …, 45
145
E(X) = = 23 ,
45+12
2 = Var(X) = = 168.67
452 -112
P(X≥ 40) = f(40)+f(41)+f(42)+f(43)+f(44)+f(45) = = 0.1333
645
(1)
(2)
(3)
초기하분포의 확률질량함수와 평균 , 분산을 비롯한 특성과 다변량 초기하분포에 대하여 알아본다 .초기하분포의 확률질량함수와 평균 , 분산을 비롯한 특성과 다변량 초기하분포에 대하여 알아본다 .
22 초기하분포 (hypergeometric distribution)초기하분포 (hypergeometric distribution)
흰색 바둑돌 r 개와 검은색 바둑돌 N-r 개로 구성된 용기 A 에서 임의로 바둑돌 n개를 꺼내어 다른 용기 B 안에 넣을 때 , 임의로 꺼낸 바둑돌 n 개 안에 포함된 흰색 바둑돌의 개수에 관한 확률분포
어떤 특정 품목 r 개를 포함하여 서로 상반되는 두 종목의 품목 N 개로 구성된 집단에서 임의로 n 개를 추출하여 , n 개 안에 포함된 특정 품목의 개수 (X) 에 관한 확률분포를 모수 N, r, n 인 초기하분포라 한다 .
N(N-1)(N-2)•••(N-n+1)n(n-1)(n-2) ••• 3•2•1
Nn
N!n!(N-n)!
==조합의 수 :
1) 확률질량함수1) 확률질량함수☞ X ~ H(N, r, n)
f(x) = , max(0, n+r-N) ≤ x ≤ min(n, r) N
n
rx
N-rn-x
모수에 따른 확률히스토그램의 개형
2) 평균 2) 평균 ☞ = E(X) = x f(x) = x
x=0 x=0
nn
Nn
rx
N-rn-x
= x=0
n
x•r!x!(r-x)!
(N-r)!(n-x)! [(N-r)-(n-
x)]!N!n! (N-
n)!
= x=1
n
r (r-1)!(x-1)! [(r-1)-(x-
1)]!
[(N-1)-(r-1)]![(n-1)-(x-1)]! [(N-r)-(n-x)]!N(N-1)!
n(n-1)! (N-n)!t = x-1 이라
하면 ,
= n t=0
n-1rN (N-1)!
(n-1)! (N-n)!
[(N-1)-(r-1)]![(n-1)-t]! [{(N-1)-(r-1)}-{(n-
1)-t}]!
(r-1)!t! [(r-1)-
t]!
= n t=0
n-1rN N-1
n-1
r-1t
(N-1)-(r-1)(n-1)-t
= n rN
모수 N-1, r-1, n-1 인 초기하분포 확률함수
=1
동일한 방법에 의하여r (r-1)
N(N-1)E[X(X-1)] = n(n-1)
E(X2) = E[X(X-1)] + E(X) =
nr N – n2r – nr2 +(nr)2
N(N-1)
3) 분산 3) 분산 ☞ 2 = Var(X) = E(X2) – E(X)2
N-nN-1
= n rN
rN
1 -
= nr N – n2r – nr2 +
(nr)2N(N-1)
n
rN
2-
50 개의 마이크로 칩이 들어 있는 상자 안에 4 개의 불량품이 섞여 있다고 한다 .
이 상자에서 임의로 칩 5 개를 선정할 때 ,
(1) 5 개 안에 포함될 불량품의 수 (X) 에 대한 확률질량함수
(2) 불량품이 한 개 또는 두 개 나올 확률
(3) X 의 평균과 분산
P(X=1 or X=2) = f(1)+f(2) = 0.30808 + 0.04299 = 0.35107
(1)
(2)
(3)
f(x) = , x = 0, 1, 2, 3, 4 50
5
4x
465-x
E(X) = 5• = 0.4,
2 = Var(X) = 5• = 0.33796
X 0 1 2 3 4
f(x) 0.64696
0.30808
0.04299
0.00195
0.00002
450
450
450
1 - 4549
다변량 초기하분포다변량 초기하분포
서로 다른 특성 A1, A2, …, Ak 를 갖는 품목이 각각 r1, r2, …, rk 개씩 들어 있는 용기에서 n 개를 추출할 때 , 각 특성을 가진 품목이 각각 X1, X2, …, Xk 인 확률분포
예다음 그림과 같이 추출된 10 개의 구슬 안에 포함된 노란색 , 빨간색 , 파란색 구슬의 개수에 대한 확률분포
확률질량함수확률질량함수☞
P(X1=x1, X2=x2, …, Xk=xk) =
Nn
r1
x1
r2
x2
rk
xk
…x1+x2+…+xk
= n,0≤xi≤ri , i=1,2,…,k
k=2 이면 , 초기하분포이다 .
주 의주 의
앞의 예 그림과 같이 빨간 공 8 개 , 파란 공 10 개 , 노란 공 10 개씩 들어 있는
주머니에서 임의로 공 10 개를 꺼내는 경우 ,
(1) X, Y, Z : 10 개 안에 포함된 빨간 공 , 파란 공 , 노란 공의 수
X, Y, Z 의 결합질량함수
(2) 빨간 공 3 개 , 파란 공 2 개 , 노란 공 5 개가 포함될 확률
(3) 10 개 중에 포함될 노란 공의 평균
P(X=x, Y=y, Z=z) = 28
10
8x
10y
10z x+y+z = 10,
x=0,1,…,8, y, z=0,1,…,10
(1) r1=8, r2=10, r3=10 이고 n=10 이므로 결합확률질량함수 :
P(X=3, Y=2, Z=5) = = 0.0484 28
10
83
102
105
(2)
(3) 노란 공의 수 : Z~H(28, 10, 10) 이므로 E(Z)= 10• = 3.57
1028
Bernoulli 분포 , 이항분포의 확률질량함수와 평균 , 분산 그리고 이항확률 구하는 방법을 비롯한 특성 , 초기하분포와 이항분포 사이의 관계에 대하여 알아본다 .
Bernoulli 분포 , 이항분포의 확률질량함수와 평균 , 분산 그리고 이항확률 구하는 방법을 비롯한 특성 , 초기하분포와 이항분포 사이의 관계에 대하여 알아본다 .
33 이항분포 (binomial distribution)이항분포 (binomial distribution)
1) 확률질량함수1) 확률질량함수☞ X ~ B(1, p)
Bernoulli 분포Bernoulli 분포
동전 던지기의 앞면과 뒷면 , 전기회로 스위치의 ON 과 OFF, 설문조사에서 YES 와 NO, 상품의 불량품과 양품 등과 같이 , 서로 상반되는 두 가지뿐인 실험 결과에 관한 확률분포
관심을 갖는 결과가 나오면 성공 ( 성공률 p) 그렇지 않으면 실패 (q=1-p)라 하고 , 성공이면 1 실패이면 0 으로 대응시키는 확률변수 (X) 의 확률분포를 모수 p 인 베르누이분포라 한다 .
1-p , x=0
f(x) = p , x=1 =
0 , 다른 곳에서
pxq1-x , x=0, 10 , 다른 곳에서
베르누이 시행 : 베르누이분포에 따르는 통계실험을 독립적으로 반복하여 시행하는 것
2) 평균2) 평균☞
3) 분산3) 분산☞
E(X) =x f(x) = 0•(1-p) + 1•p = p
E(X2) = x2 f(x) = 02•(1-p) +
12•p = p
2 =Var(X) = E(X2) – E(X)2 = p – p2 = p(1-p)
주사위를 한 번 던져서 “ 1” 또는 “ 6” 의 눈이 나오면 성공이라 하자 .
이때 , “1” 또는 “ 6” 의 눈이 나오는 사건에 대한 확률분포 = ?
평균 = ? 분산 = ?
“1” 또는 “ 6” 의 눈이 나올 확률 1/3, 이 경우 확률변수 X=1
X ~ B(1, 1/3)
X 의 확률질량함수 :
2/3 , x=0
f(x) = 1/3 , x=1
0 , 다른 곳에서E(X) =
1/3
2 = •
=
13
23
29
X 의 평균 :
X 의 분산 :
예제 1 의 실험을 독립적으로 3 번 반복시행
예제 1 의 실험을 독립적으로 3 번 반복시행
X1, X2, X3 : 첫 번째 , 두 번째 , 세 번째 실험 결과
(x1, x2, x3) : (0,0,0), (1,0,0), (0,1,0), (0,0,1), (1,1,0), (1,0,1), (0,1,1), (1,1,1)
나타날 수 있는 모든 경우 :
P(Xi = 0) = , P(Xi = 1) = , i = 1, 2, 3
13
23
각 경우의 확률 :
X = X1 + X2 + X3 이라 하면 , X 의 상태공간 :
SX = { 0, 1, 2, 3 }X 의 의미 :
독립적으로 주사위를 3 번 반복하여 던져서 “1” 또는 “6” 의 눈이 나온 횟수
{X1 =0, X2 = 0, X3 = 0 }
{X1 =1, X2 = 0, X3 = 0 } ∪ {X1 =0, X2 = 1, X3 = 0 } ∪ {X1 =0, X2 = 0, X3 = 1 }
{X1 =1, X2 = 1, X3 = 0 } ∪ {X1 =1, X2 = 0, X3 = 1 } ∪ {X1 =0, X2 = 1, X3 = 1 }
{X1 =1, X2 = 1, X3 = 1 }
X = 0
X = 1
X = 2
X = 3
X 의 확률질량함수 :
P(X=0) = P(X1 =0, X2 = 0, X3 = 0 ) = P(X1 =0) P(X2 = 0) P(X3 = 0 )
= = 13
13
13
13
3· ·
{X1 =1, X2 = 0, X3 = 0 }, {X1 =0, X2 = 1, X3 = 0 }, {X1 =0, X2 = 0, X3 = 1 } : 배반사건
P(X=1) = P({X1 = 1,X2 = 0,X3 = 0 } or {X1 = 0,X2 = 1,X3 = 0 } or {X1 = 0,X2 = 0,X3 = 1 })
= P(X1 = 1,X2 = 0,X3 = 0) +P(X1 = 0,X2 = 1,X3 = 0) + P(X1 = 0,X2
= 0,X3 = 1)
= P(X1 = 1) P(X2 = 0) P(X3 = 0) +P(X1 = 0) P(X2 = 1) P(X3 = 0)
+ P(X1 = 0) P(X2 = 0) P(X3 = 1)
= + + = 3•
23
13
2 23
13
2 23
13
2 23
13
2
{X1 =1, X2 = 1, X3 = 0 }, {X1 =1, X2 = 0, X3 = 1 }, {X1 =0, X2 = 1, X3 = 1 } : 배반사건
P(X=2) = P({X1 = 1,X2 = 1,X3 = 0 } or {X1 = 1,X2 = 0,X3 = 1 } or {X1 = 0,X2 = 1,X3 = 1 })
= P(X1 = 1,X2 = 1,X3 = 0) +P(X1 = 1,X2 = 0,X3 = 0) + P(X1 = 0,X2
= 0,X3 = 1)
= P(X1 = 1) P(X2 = 0) P(X3 = 0) +P(X1 = 0) P(X2 = 1) P(X3 = 0)
+ P(X1 = 0) P(X2 = 0) P(X3 = 1)
= + + = 3•
23
13
2 23
13
2 23
13
2 23
13
2
P(X=3) = P(X1 = 1, X2 = 1, X3 = 1 ) = P(X1 = 1) P(X2 = 1) P(X3 = 1 )
= = 32
323
23
23
· ·
· · · ·
X 의 확률질량함수 :
P(X=0) = 13
3 P(X=1) = 3•
23
13
2 P(X=2) = 3•23
13
2P(X=3) =
323
13
3
3•23
13
2
3•23
13
2
323
, x = 0
, x = 1
, x = 2
, x = 3
f(x) =
23
13
x( )
3x
3-x
f(x) = 0 , 다른 곳에서
, x = 0, 1, 2, 3
( )
30 =
1 ,( )
31 =
3 ,( )
32 =
3 ,( )
33 = 1
조합의 수를 이용
X 에 대한 다른 관찰X 에 대한 다른 관찰
표본점 FFF SFF, FSF, FFS SSF, SFS, FSS SSSX 의 값 0 1 2 3
경우의 수
각 경우의 확률
X 의 분포
( )
30 =
1( )
31 =
3( )
32 =
3( )
33 =
1
23
13
0( )
30
3 23
13
1( )
31
2 23
13
2( )
32
1 23
13
3( )
33
0
23
13
0 3 23
13
1 2 23
13
2 1 23
13
3 0
확률 히스토그램
예제 1 에 대하여 X = X1 + X2 + X3 이라 할 때 ,
X 의 평균 = ? 분산 = ?
“1” 또는 “ 6” 의 눈이 나올 확률 1/3, 이 경우 확률변수 Xi=1 , i = 1, 2, 3
Xi ~ B(1, 1/3)
13
E(Xi) =Xi 의 평균 :
Xi 의 분산 :2 =
29i
E(X) = E(X1 + X2 + X3)
= E(X1)+ E(X2) + E(X3)
= + + = 1
13
13
13
X 의 평균 :
X 의 분산 : X1 , X2 , X3 이 독립이므로
23
29
2 = Var(X1 + X2 + X3 ) = Var(X1) + Var(X2) + Var(X3 )
= + + =
29
29
1) 확률질량함수1) 확률질량함수☞
이항분포이항분포
매 회 성공률이 p 인 Bernoulli 실험을 n 번 독립적으로 반복 시행하여 성공한 횟수 (X) 에 관한 확률분포를 모수 n, p 인 이항분포라 하고 , X~B(n, p) 로 나타낸다 .
( )
nx
f(x) = 0 , 다른 곳에서
px (1-p)n-x , x = 0, 1, …, n
2) 평균2) 평균☞Xk ~ B(1, p), k=1,2,…,n 이고 독립이라 하면 ,
X = X1 + X2 +… + Xn 은 성공률이 p 인 Bernoulli 실험을 n 번 독립적으로 반복 시행하여 성공한 횟수이므로
3) 분산3) 분산☞
E(X) = E(X1 + X2 +… + Xn ) = E(X1) + E(X2) + … + E(Xn)
= p + p + … + p = np
n 번
2 =Var(X) = Var(X1 + X2 +… + Xn )
= Var(X1) + Var(X2) + … + Var(Xn)
= p(1-p) + p(1-p) + … + p(1-p) = np(1-p) =npq (q=1-p)
n 번
이항확률변수에 대한 확률의 성질이항확률변수에 대한 확률의 성질☞
(1) P(X ≥ a) = f(x)
(2) P(X = a) = P(X ≤ a) – P(X ≤ a-1)
(3) P(a ≤ X ≤ b) = P(X ≤ b) - P(X ≤ a-1)
(4) P(X ≤ a) = 1- P(X ≥ a+1),
P(X ≥ a) = 1- P(X ≤ a-1)
n
x=a
X~B(n, p) 이고 a, b = 0, 1, 2, … , n 일 때 ,
공정한 동전을 8 번 던질 때 , (1) 꼭 1 번 앞면이 나올 확률(2) 많아야 4 번 앞면이 나올 확률 (3) 적어도 5 번 이상 앞면이 나올 확률(4) 평균 = ? 분산 = ?
(1) X 의 확률질량함수 :
X : 앞면이 나온 횟수 X~B(8, 0.5)
( )
8x
f(x) = 0 , 다른 곳에서
0.5x (1-0.5)8-x , x = 0, 1, …, 8
P(X = 1) = f(1) =( )
81 0.51 (1-0.5)7 =
0.03125
(2)
P(X ≤ 4) = f(0) + f(1) + f(2) + f(3) + f(4)
X 의 분산 :
( )
81 0.51 (0.5)7(
)
80 0.50 (0.5)8 (
)
82 0.52 (0.5)6
( )
83 0.53 (0.5)5 (
)
84 0.54 (0.5)4
= + +
+ +
= 0.00391 + 0.03125 + 0.10938 + 0.21875 + 0.27344 = 0.63673
(3)
P(X ≥ 5) = 1 - P(X ≤ 4) = 1 – 0.63673 = 0.36327
(4) X 의 평균 :
= np = 8 • (0.5) = 4
2 = npq = 8 • (0.5) • (0.5) = 2
이항확률표 사용방법이항확률표 사용방법☞앞의 예제 3 에 대하여 확률 P(X ≤ 4) 을 구하는 방법
P(X = 1) = P(X ≤ 1) - P(X = 0) = 0.0352 – 0.0039 = 0.0313
5 지선다형으로 주어진 10 문제에서 임의로 답안을 선정
(1) 정답을 선택한 문제 수에 대한 확률질량함수
(2) 평균과 분산
(3) 꼭 2 문제에서 정답을 선택할 확률
(4) 적어도 4 문제 이상 정답을 선택할 확률
(1) X : 정답을 선택한 문제 수 X ~ B(10, 0.2)
X 의 확률질량함수 :
( )10xf(x) =
0 , 다른 곳에서
0.2x 0.810-x , x = 0, 1, …, 10
X 의 분산 : 2 = npq = 10 • (0.2) • (0.8) = 1.6
(2) X 의 평균 : = np = 10 • (0.2) = 2
(3) 이항확률표로부터 ,
P(X ≤ 1) = 0.3758, P(X ≤ 2) = 0.6778
P(X = 1) = P(X ≤ 2) - P(X ≤ 1) = 0.6778 - 0.3758 = 0.3020
(4) P(X ≤ 3) = 0.8791
P(X ≥ 4) = 1 - P(X ≤ 3) = 1 - 0.8791 = 0.1209
두 이항분포의 합성두 이항분포의 합성☞X ~ B(m, p), Y ~ B(n, p)
X , Y : 독립
X + Y ~ B(m+n, p)
P(X + Y = k) = P(X = x, x + Y = k)
= P(X = x) P(x + Y = k)
= P(X = x) P(Y = k - x)
= px (1-p)m-x pk-x (1-p)n-(k-x)
= pk (1-p)(m+n)-k
= pk (1-p)(m+n)-k ~ B(m+n, p)
mx
nk-x( ) ( )
mx
nk-x( )( )
m+nk( )
x=0
x=0
x=0
m
m
m
x=0
m
x=0
m
생산라인 A 와 B 에서 생산되는 TV 의 불량률 : 동일한 5%
A 에서 생산된 제품 “ 7” 대와 B 에서 생산된 제품 “ 13” 대가 섞여 있을 때 ,
(1) 불량품이 꼭 하나 있을 확률
(2) 적어도 하나 이상 있을 확률
X, Y : 각각 A 와 B 에서 생산된 불량품의 수
X ~ B(7, 0.05), Y ~ B(13, 0.05)
Z = X + Y ~ B(20, 0.05)
P(Z = 1) = P(Z≤ 1) – P(Z =0) = 0.7358 – 0.3585 = 0.3773
P(Z ≥ 1) = 1 – P(Z = 0) = 1 – 0.3585 = 0.6415
5,000 개의 장난감 가운데 250 개가 불량품
10 개를 임의로 선정하여 수입하기로 계약을 맺었다 .
(1) 불량품이 2 개 미만일 확률 ( 계산기 또는 관련 프로그램 사용 ),
(2) 불량품이 2 개 미만일 이항분포에 의한 근사확률
(1) X : 불량품의 수
X 의 확률질량함수 :
f(x) = , x = 0, 1, …, 10
250x
475010-x(
)( )
500010( )
P(X < 2) = f(0) + f(1) = 0.59845 + 0.31557 = 0.91402
(2) p=250/5000=0.05 이므로 X ~ B(10, 0.05) 이고 , 이항확률표에 의하여
.
.
P(X < 2) = P(X≤ 1) = 0.9139
(mathematica 를 사용 )
기하분포 , 음이항분포의 확률질량함수와 평균 , 분산을 비롯하여 비기억성 성질에 대하여 알아본다 .기하분포 , 음이항분포의 확률질량함수와 평균 , 분산을 비롯하여 비기억성 성질에 대하여 알아본다 .
44 기하분포 (geometric distribution)음이항분포 (negative binomial distribution)기하분포 (geometric distribution)음이항분포 (negative binomial distribution)
1) 확률질량함수1) 확률질량함수☞f(x) = pqx-1 , x = 1, 2, 3, …, q=1-p
X ~ G(p)
매 시행에서 성공률이 p 인 베르누이 실험을 처음 성공할 때까지 독립적으로 반복 시행한 횟수 (X) 에 관한 확률분포를 모수 p 인 기하분포라 하고 , X ~ G(p)로 나타낸다 .
기하분포기하분포
3) 분산 3) 분산 ☞E[X(X-1)] =
2qp2
2) 평균 2) 평균 ☞ = E(X) = x f(x) = x pqx-1 = p xqx-1 x=0 x=0
∞∞
x=0
∞
= p (qx ) = p
( qx )ddq
x=1
∞ ddq
x=1
∞
= p ( )ddq
q1-q
p
(1-p)2=
=1p
동일한 방법에 의하여
= + -
2 = Var(X) = E(X2) – E(X)2 = E[X(X-1)] + E(X) – E(X)2
22qp2
1p
1p
=qp2
예앞면이 나올 때까지 공정한 동전을 던지는 실험에서 던진 횟수(X) 의 확률분포
X 1 2 3 4 5 6 7 …
P(X=x) 1/2 1/4 1/8 1/16 1/32 1/64 1/128 …
P(X≤x) 1/2 3/4 7/8 15/16 31/32 63/64127/1
28…
“1” 의 눈이 나올 때까지 반복해서 던지는 실험
X : 처음 “1” 의 눈이 나올 때까지 시행한 횟수
(1) X 의 확률질량함수
(2) X 의 평균과 분산
(3) 세 번째에서 처음으로 “ 1” 의 눈이 나올 확률
(1) 주사위 1 개를 던져서 “1” 의 눈이 나올 확률은 1/6 이므로 X ~ G(1/6)
X 의 확률질량함수 :f(x) = , x = 1, 2, 3, …
16
56
x-1.
(2) X 의 평균 : = 1/p = = 6
1
1/6
X 의 분산 : 2 = q/p2 = = 30
5/6
(1/6)2
(3) P(X = 3) = f(3) = = = 0.1157
16
56
3-1. 25
216
X ~ G(p) 에 대하여 다음이 성립한다 . P(X > n+m | X > n) = P(X > m)
정리 1 비기억성 성질 (memorylessness property)정리 1 비기억성 성질 (memorylessness property)
증명증명
증명 끝증명 끝
P(X > n+m | X > n) =P(X > n)
P(X > n+m)
P(X > n)
P(X > n+m, X > n)=
P(X > n+m) = P(X ≥ n+m+1) = pqx-1
x=n+m+1
∞
= p • = qn+m 1-q
qn+m
P(X > n) = P(X ≥ n+1) = pqx-1
x=n+1
∞
= p • = qn
1-q
qn
P(X > m) = P(X ≥ m+1) = pqx-
1x=m+1
∞
= p • = qm 1-q
qm
P(X > n+m | X > n)
P(X > n)
P(X > n+m)
qn
qn+m
= qm==
= P(X > m)
X ~ G(0.35) 에 대하여
확률 P(X > 5|X > 2) = ? P(X > 3) = ?
X ~ G(0.35) 이므로 X 의 확률질량함수 :
f(x) = (0.35)•(0.65)x-1 , x = 1,2,3,…
P(X > 5| X > 2) =P(X > 2)
P(X > 5)
P(X > 2)
P(X > 5, X > 2)=
한편 ,
P(X > k) = (0.35)•(0.65)x-1 = (0.35)• = (0.65)k
(0.65)k
1 – (0.65)
x=k+1
∞
이므로 P(X > 5) = (0.65)5 , P(X > 2) = (0.65)2 , P(X > 3) = (0.65)3
P(X > 5| X > 2) =P(X > 2)
P(X > 5) (0.65)5
(0.65)2= (0.65)3 = P(X > 3)
=
조건부확률의 정의로부터
매 시행에서 성공률이 p 인 베르누이 실험을 r 번째 성공이 있기까지 독립적으로 반복 시행한 횟수 (X) 에 관한 확률분포를 모수 r, p 인 음이항분포라 하고 , X ~ NB(r, p) 로 나타낸다 . 특히 r =1 이면 X ~ G(p) 이다 .
음이항분포음이항분포
예매 시행에서 성공률이 p 인 베르누이 실험을 3 번째 성공이 있기까지 독립적으로 반복 시행한 횟수 (X) 의 확률분포
P(X =3) = p3
P(X =4) = 3qp3 = qp3
32( )
경우의 수 : 1 가지
각 경우의 확률 : p3
경우의 수 : 3 가지
각 경우의 확률 : qp3
P(X =5) = 6q2 p3 = q2 p3
42( )
P(X =x) = qx-3 p3
x-12( )
경우의 수 : 6 가지
각 경우의 확률 : q2 p3
경우의 수 : 가지
각 경우의 확률 : qx-3 p3
x-12( )
x-1 번 중에 r-1 번 성공하고 , x 번째에서 r 번째 성공이 있을 확률 :
P(X = x) = P(x-1 번 중에 r-1 번 성공 )• P(x 번째에서 r 번째 성공 )
= pr-1 q(x-1)-(r-1) •
p
x-1r-1( )x-1r-1( )= pr qx-r
1) 확률질량함수1) 확률질량함수☞ X ~ NB(r, p)
f(x) = , x = r, r+1, r+2, …
x-1r-1( )pr qx-r
처음 성공이 있기까지 반복 시행한 횟수 : X1
처음 성공 이후 두 번째 성공이 있기까지 반복 시행한 횟수 : X2
r-1 번째 성공 이후 처음 성공할 때까지 반복 시행한 횟수 : Xr
X = X1 + X2 + … + Xr : r 번 성공할 때까지 독립적으로 반복 시행한 횟수
X1 X2 Xr-1 Xr
비기억성 성질에 의하여
E(Xi) = , Var(Xi) = , i = 1, 2, 3, …, r
3) 분산 3) 분산 ☞
1p
2) 평균 2) 평균 ☞ = E(X) = E(X1) + E(X2) + … + E(Xr )
2 = Var(X) = Var(X1) + Var(X2) + … + Var(Xr )
qp2
1p
1p
1p
rp= + + … +
=
= + + … + =
qp2
qp2
qp2
rqp2
신용카드 한 장을 판매할 확률이 0.1 인 카드 외판원이 하루 동안 3 장의 카드를
판매할 때까지 예상 구매자를 방문
X : 외판원이 만난 예상 구매자 수
(1) X 의 확률질량함수 : f(x)
(2) X 의 평균 = ? 분산 = ?
(3) 3 번째에서 처음으로 구매자를 만날 확률
(4) 10 번째에서 3 장의 카드를 모두 판매할 확률
(5) 8 번째부터 10 번째에 걸쳐 3 장의 카드를 모두 판매할 확률
(1) X 의 확률질량함수 :
신용카드 한 장을 판매할 확률이 0.1 이고 3 장의 카드를 판매할 때까지 예상 구매자를 방문하므로 , 그 사람이 방문한 예상 구매자의 수 X 는 모수
r =3, p = 0.1 인 음이항분포를 이룬다 .
f(x) = , x = 3, 4, 5, …
x-12( )(0.1)3 (0.9)x-
3
(2) X 의 평균 :
X 의 분산 :
= = = 30
rp
30.1
2 = = = 270
rqp2
3•(0.9)(0.1)2
(3) 3 번째에서 처음으로 구매자를 만날 확률은 모수 p=0.1 인 기하분포이므로
구하고자 하는 확률 :(0.1)•(0.9)2 = 0.081
f(10) =
10-12( )
(0.1)3 (0.9)10-3
92( ) (0.1)3
(0.9)7
= 0.0172
=(4)
(5) 8 번째에 처음 카드를 판매할 확률 : (0.1)•(0.9)7 = 0.0478
곧바로 두 번째 카드를 판매 (9 번째에서 2 번째 구매자 ) 할 확률 :
비기억성 성질에 의하여 0.1
9번째에 이어서 10 번째도 판매할 확률 0.1
카드 판매는 독립적으로 반복 시행되므로
구하고자 하는 확률 : (0.1)3•(0.9)7 = 0.000478
포아송분포의 확률질량함수 , 평균 그리고 분산 및 포아송분포의 특성 , 확률표 사용방법 및 이항분포와의 관계를 비롯하여 포아송과정에 대한 개념 등에 대하여 알아본다 .
포아송분포의 확률질량함수 , 평균 그리고 분산 및 포아송분포의 특성 , 확률표 사용방법 및 이항분포와의 관계를 비롯하여 포아송과정에 대한 개념 등에 대하여 알아본다 .
55 포아송분포포아송분포
컨테이너 박스 안의 수입 물품에 포함된 불량품의 수 , 어떤 물질에 의하여 방출된 방사능 입자의 수 , 어떤 주어진 시간 안에 걸려온 전화의 수 또는 소설책의 한 면 당 오자의 수 등과 같이 한정된 단위 시간이나 공간에서 발생하는 사건의 수에 관련되는 확률
ez 에 대한 Maclaurin 급수식 :
z2
2!z3
3!zk
k!ez = 1 + z + + + … + + …
= zk
k!k=0
∞
확률질량함수 조건을 만족
z = m, k = x 라 하면 ,
e-
m = 1
mx
x!x=0
∞
mx
x!e-m f(x)
= , x = 0, 1,
2, …: 확률질량함수
1 = e-z = e-z
zk
k!k=0
∞ zk
k!k=0
∞
1) 확률질량함수1) 확률질량함수☞ X ~ P(m)
mx
x!e-m f(x)
= , x = 0, 1,
2, …
2) 평균 2) 평균 ☞ = E(X) = x f(x) = x• =
m x=0 x=0
∞∞
x=1
∞mx
x!e-m
mx-1
(x-1)!
e-m
= m t=0
∞ mt
t!e-m
= m
x-1 = t 라 하면
3) 분산 3) 분산 ☞E[X(X-1)] = m2
동일한 방법에 의하여
2 = Var(X) = E(X2) – E(X)2 = E[X(X-1)] + E(X) – E(X)2
= m2 + m – m2
= m
포아송분포의 모수 m 이 평균 , 분산과 일치한다 .
참고
10 개들이 CD 1묶음에 평균 0.15 개의 결함이 있으며 , 결함이 있는 CD 의 수는
포아송분포에 따른다 . CD 10 묶음에 대하여
(1) 결함이 있는 CD 가 2 개일 확률
(2) 적어도 2 개 이상의 CD 에 결함이 있을 확률
(1) CD 1묶음에 평균 0.15 개의 결함이 있으므로 , 10묶음에는 평균 1.5 개
결함있는 CD 의 수 : X ~ P(1.5)
1.522!
P(X = 2) = e-1.5 = 0.251
1.5x
x!e-1.5 , x = 0, 1, 2, …
f(x) =
X 의 확률질량함수 :
구하고자 하는 확률 :
P(X ≥ 2) = 1 – P(X ≤ 1) = 1- f(0) – f(1)
= 1 - - 1.500!
e-1.5 1.511!
e-1.5
= 1- (0.223 + 0.335) = 0.442
(2)
포아송확률표 사용방법포아송확률표 사용방법☞X ~ P(1.5) 에 대하여 P(X ≤ 2) = ?
P(X = 2) = P(X ≤ 2) - P(X ≤ 1) = 0.809 – 0.558 = 0.251
P(X ≥ 2) = 1 – P(X ≤ 1) = 1 – 0.558 = 0.442
어떤 기계에서 생산된 제품은 0.1 의 확률을 가지고 불량품이 독립적으로 나온다고 한다 . 이 기계에서 생산된 제품 20 개를 임의로 선정했을 때 ,(1) 1 개 이하의 불량품이 나올 확률 (2) 포아송분포에 의한 근사확률
(1) 불량품의 수 : X ~ B(20, 0.1)
이항확률표에 의하여 P(X ≤ 1) = 0.3917
(2) n = 20, p = 0.1 이므로 X ~ P(2)
.
.
포아송분포에 의한 근사확률 : P(X ≤ 1) = 0.406..
재학생 수가 300 명인 어느 학교에 신종 플루 바이러스에 걸린 학생이 3 명일 때 .임의로 선정된 1 명이 바이러스에 걸렸을 확률
(1) 바이러스에 걸린 학생 수 : X ~ B(300, 0.01)
n = 300, p = 0.01 이므로 X ~ P(3)
.
.
포아송분포에 의한 근사확률 :
P(X = 1) = P(X ≤ 1) – P(X = 0) = 0.199 – 0.05 = 0.149
.
.
▶ 포아송과정 (Poisson process) : 단위 구간에서 의 비율로특별한 사건이 관찰될 때 , 길이가 t 인 구간에서 이 사건이 관찰된수 X(t) 가 포아송분포에 따를 때 , 이 사건이 관찰되는 과정 {X(t) : t > 0} 을 모수 인 포아송과정이라 한다 .
포아송과정 (Poisson process) : 단위 구간에서 의 비율로특별한 사건이 관찰될 때 , 길이가 t 인 구간에서 이 사건이 관찰된수 X(t) 가 포아송분포에 따를 때 , 이 사건이 관찰되는 과정 {X(t) : t > 0} 을 모수 인 포아송과정이라 한다 .
P[X(t) = x] = e-t , x = 0, 1, 2, …
(t)xx!
(1) 임의의 양수 t 와 s에 대하여 , X(t+s) - X(t) 는 {X(u) : u ≤ t} 에 독립이다 . 즉 , 시구간 (t, t+s) 사이에 관찰된 횟수는 t 이전에 관찰된 횟수에 독립
(2) 임의의 양수 t 와 s에 대하여 , X(t+s) - X(t) 는 s에만 의존한다 . 즉 , 동일한 크기의 시구간 안에서 관찰된 횟수는 동일한 분포를 이룬다 .
포아송과정의 특성포아송과정의 특성☞
처음 2.5 시간 동안 어떤 사건이 17 건 관찰되고 , 처음 3.7 시간 동안 22 건 그리고 처음 4.3 시간 동안 36 건이 관찰됨을 의미
{X(2.5)=17, X(3.7)=22, X(4.3)=36}
{X(2.5) = 17, X(3.7) – X(2.5) = 5, X(4.3) – X(3.7) = 14}
동치관계
X(t) 가 = 8 인 포아송과정에 따를 때 , P[X(2.5)=17, X(3.7)=22, X(4.3)=36] = ?
특성 (2) 에 의하여
= 8, X(t)~P(t) 이므로
구하고자 하는 확률 :
P[X(3.7) – X(2.5) = 5] = P[X(1.2) = 5]
P[X(4.3) – X(3.7) = 14] = P[X(0.6) = 14]
X(2.5) ~ P(20), X(1.2) ~ P(9.6), X(0.6) ~ P(4.8)
(20)17
17!e-20
(9.6)5
5!e-9.6
(4.8)14
14!e-4.8• •=
P[X(2.5) = 17] P[X(3.7) – X(2.5) = 5] P[X(4.3) – X(3.7) = 14]
= (0.07595)•(0.04602)•(0.00033) = (1.15)•(10) -6
특성 (1) 에 의하여
P[X(2.5)=17, X(3.7)=22, X(4.3)=36]
= P[X(2.5) = 17, X(3.7) – X(2.5) = 5, X(4.3) – X(3.7) = 14]
= P[X(2.5) = 17] P[X(3.7) – X(2.5) = 5] P[X(4.3) – X(3.7) = 14]
매회 실험 결과가 k 개의 서로 배반인 사건 A1 , A2 , … , Ak 로 구성되고 , 각각의 사건이 매회 발생할 가능성이 pi =P(Ai), i = 1,2,…,k인 통계실험에서 사건 Ai 들의 발생 횟수 Xi 의 결합확률분포
결합확률질량함수결합확률질량함수☞ (X1 , X2 , … , Xk) ~ Mult(n, p1 , p2 , … , pk)
f(x1 , x2 , … , xk) = p1 p2 … pk ,
x2x1 xkn!
x1! x2! … xk!
0 ≤ xi ≤ n , i = 1, 2, …, k
x1 + x2 + …+ xk = n ,
p1 + p2 + …+ pk = 1
(1) k = 2 이면 이항분포이고 , 각 확률변수들은 독립이 아니다 .
(2) Xi ∼ B(n, pi ) E(Xi ) = n pi , Var(Xi ) = n pi(1-pi )
다항분포와 이항분포다항분포와 이항분포☞
공정한 주사위를 36 번 던져서 각각의 눈이 동일하게 6 번씩 나올 확률
Xi : 주사위를 던져서 나온 눈이 “i” 인 횟수
f(x1 , x2 , … , x6) = 36!x1! x2! … x6!
, x1 + x2 + …+ xk = 36
x116
x216
x616
…
(X1 , X2 , … , X6) ~ Mult(36, 1/6 , 1/6, … , 1/6)
P(X1 =6, X2 =6, … , X6 =6) = f(6, 6, 6, 6, 6, 6) 36
!x1! x2! … x6!
616
616
616
…=
= 0.00026
구하고자 하는 확률 :