슬라이드 1 - 동서대학교kowon.dongseo.ac.kr/~lbg/web_lecture/ps… · ppt file · web...
TRANSCRIPT
결 합 확 률 분 포3
1
2
3
조건부확률분포
결합확률분포
결합분포에 대한 기대값
1 결합확률분포
결합확률분포 , 주변확률분포 및 결합확률분포함수의 개념과 2 변량 확률 계산 방법을 알아본다 .
A 와 B 두 회사에 대한 투자액 ( 단위 ; 백만 원 ) X 와 Y 의 비율
A 와 B 두 회사에 각각 1 백만 원씩 투자할 비율 : 0.02A 회사에 3 백만 원 그리고 B 회사에 2 백만 원을 투자할 비율 : 0.06회사에 동시에 4 백만 원씩 투자할 비율 : 0.00
P(X=1, Y=1) = 0.02, P(X=3, Y=2) = 0.06, P(X=4, Y=4) = 0.00
투자자들이 회사 A 와 회사 B 에 투자한 투자액에 대한 확률 :
X Y
1 2 3 4
1 0.02 0.04 0.08 0.152 0.04 0.05 0.06 0.103 0.08 0.06 0.05 0.014 0.15 0.10 0.01 0.00
▶
▶
결합확률분포 (joint probability distribution) : 두 개 이상의확률변수에 의하여 결합된 확률분포
결합확률질량함수 (joint p.m.f.) : 이산확률변수 X 와 Y 에 대하여 , 상태공간 안의 (x, y) 에서 확률 P(X=x, Y=y) 에 대응하고 , 상태공간 밖의 (x, y) 에서 0 으로 대응하는 함수
SX = { x1, x2, … , xn } , SY = {y1, y2, …, ym } 에 대하여
P(X=x, Y=y) , x ∈ SX , y ∈ SY
0 , 다른 곳에서
f(x, y) =
X 와 Y 의 결합상태공간S = { (x, y) : x = x1, x2, … , xn , y = y1, y2, … , ym }에 대하여
결합확률질량함수의 성질☞
(1) 모든 x, y 에 대하여 0 ≤ f(x, y) ≤ 1 이다 .
(2) f(x, y) = 1
(3) P(a< X≤ b, c< Y ≤ d ) = f(x, y) a<x≤ bc< y ≤ d
동전 3 번 던지는 게임
X : 관찰된 H 의 수
Y : 관찰된 T 의 수
S HHH HHT HTH THH HTT THT TTH TTTX 3 2 2 2 1 1 1 0Y 0 1 1 1 2 2 2 3
동전 3 번 던지는 게임 X 와 Y 의 결합질량함수 f(x, y)
앞면의 수 : X , 뒷면의 수 : Y 확률 P(X ≥ 1 , Y ≥ 2)
X 와 Y 의 상태공간 : SX = { 0, 1, 2, 3 }, SY = { 0, 1, 2, 3 }
X 와 Y 의 결합확률표 : X Y
0 1 2 3
0 0 0 0 1/81 0 0 3/8 02 0 3/8 0 03 1/8 0 0 0
1/8 , (x, y) = (0,3), (3,0)
3/8 , (x, y) = (1,2), (2,1)
0 , 다른 곳에서
f(x, y) =
P(X ≥ 1 , Y ≥ 2) = f(1,2) + f(2,2) + f(3,2) + f(1,3) + f(2,3) + f(3 3)
= + 0 + 0 + 0 + 0 + 0 =
38
38
결합확률질량함수 :
구하고자 하는 확률 :
결합상태공간의 분할
예제 1 에서
(3,3)
(3,2)
(3,1)
(3,0)
(2,3)
(2,2)
(2,1)
(2,0)
(1,3)
(1,2)
(1,1)
(1,0)
(0,3)
(0,2)
(0,1)
(0,0)
(3,3)
(3,2)
(3,1)
(3,0)
(2,3)
(2,2)
(2,1)
(2,0)
(1,3)
(1,2)
(1,1)
(1,0)
(0,3)
(0,2)
(0,1)
(0,0)
X=0
(0,0)
(0,1)
(0,2)
(0,3)
X=1
(1,0)
(1,1)
(1,2)
(1,3)
X=3
(3,0)
(3,1)
(3,2)
(3,3)
S
X=2
(2,0)
(2,1)
(2,2)
(2,3)(3,3)
(3,2)
(3,1)
(3,0)
(2,3)
(2,2)
(2,1)
(2,0)
(1,3)
(1,2)
(1,1)
(1,0)
(0,3)
(0,2)
(0,1)
(0,0)
Y=0(0,0)(1,0)(2,0)(3,0)
Y=1(0,1)(1,1)(2,1)(3,1)
Y=2(0,2)(1,2)(2,2)(3,2)
Y=3(0,3)(1,3)(2,3)(3,3)
Y 0 1 2 3 합
X=0 0 0 0 1/8 1/8
Y 0 1 2 3 합
X=1 0 0 3/8 0 3/8
Y 0 1 2 3 합
X=2 0 3/8 0 0 3/8
Y 0 1 2 3 합
X=3 1/8 0 0 0 1/8
사건 [X=0] 일 확률
동전을 세 번 던져서 나온 앞면의 수에 대한 확률분포
X 0 1 2 3fX(x) 1/8 3/8 3/8 1/8
사건 [X=1] 일 확률
사건 [X=2] 일 확률
사건 [X=3] 일 확률
▶ 주변확률질량함수 (marginal p.m.f.) : 이산확률변수 X, Y 와 결합확률질량함수 f(x, y) 에 대하여
X 의 주변확률질량함수 : fX(x) = P(X=x) = f(x, y), x=x1,…,xn
Y 의 주변확률질량함수 : fY(y) = P(Y=y) = f(x, y), y=y1,…,ymx
y
0001/83
003/802
03/8001
1/800003210
뒷면의 수 Y
앞면의
수 X
합
1/83/83/81/8
합 1/8
3/8
3/8
3/8
Y 의 주변확률질량함수
X
의
주변확률질량함수
X, Y 의 결합확률표
(1) X 와 Y 의 주변확률질량함수
(2) P(X≤ 2) = ?
X, Y 의 결합확률질량함수의 그림(1)
P(X=1) = f(1,1) + f(1,2) + f(1,3) + f(1,4) = 0.02 + 0.04 + 0.08 + 0.15 = 0.29
P(X=2) = f(2,1) + f(2,2) + f(2,3) + f(2,4) = 0.04 + 0.05 + 0.06 + 0.10 = 0.25
P(X=3) = f(3,1) + f(3,2) + f(3,3) + f(3,4) = 0.08 + 0.06 + 0.05 + 0.01 = 0.20
P(X=4) = f(4,1) + f(4,2) + f(4,3) + f(4,4) = 0.15 + 0.10 + 0.01 + 0.00 = 0.26
X 의 주변확률 :
P(Y=1) = f(1,1) + f(2,1) + f(3,1) + f(4,1) = 0.02 + 0.04 + 0.08 + 0.15 = 0.29
P(Y=2) = f(1,2) + f(2,2) + f(3,2) + f(4,2) = 0.04 + 0.05 + 0.06 + 0.10 = 0.25
P(Y=3) = f(1,3) + f(2,3) + f(3,3) + f(4,3) = 0.08 + 0.06 + 0.05 + 0.01 = 0.20
P(Y=4) = f(1,4) + f(2,4) + f(3,4) + f(4,4) = 0.15 + 0.10 + 0.01 + 0.00 = 0.26
Y 의 주변확률 :
0.29 , x=1
0.25 , x=2
0.20 , x=3
0.26 , x=4
fX(x) = P(X=x) =
0.29 , y=1
0.25 , y=2
0.20 , y=3
0.26 , y=4
fY(y) = P(Y=y) =
X 의 주변확률질량함수 : Y 의 주변확률질량함수 :
P(X≤ 2) = f(1,1) + f(1,2) + f(1,3) + f( 1,4) + f(2,1) + f(2,2) + f(2,3) + f( 2,4) = 0.02 + 0.04 + 0.08 + 0.15 + 0.04 + 0.05 + 0.06 + 0.10 = 0.54
P(X≤ 2) = fX(1) + fX(2) = 0.29 + 0.25 = 0.54
(2) 구하고자 하는 확률 :
또는
▶ 결합확률밀도함수 (joint p.d.f.) : 연속확률변수 X 와 Y 에 대하여 , 다음 조건을 만족하는 함수 f(x, y)
결합밀도함수의
개형
f(x, y) ≥ 0 for all x, y
-∞∞
f(x, y) dxdy = 1-∞
∞
연속형 결합확률 구하는 방법☞A={ (x, y)|a ≤ X ≤ b , c ≤ Y ≤ d } 에 대하여
확률 P[(X, Y) ∈ A] 의 기하학적 의미
영역 A 와 결합밀도함수 f(x, y) 로 둘러싸인 입체의 부피
abc
dP[(X,Y) ∈ A] = f(x, y) dydx = f(x, y) dydx
A
▶ 주변확률밀도함수 (margina p.d.f.) : 연속확률변수 X, Y 와 결합밀도질량함수 f(x, y) 에 대하여
X 의 주변확률밀도함수 : fX(x) = f(x, y) dy
Y 의 주변확률밀도함수 : fY(y) = f(x, y) dx
-∞∞
-∞∞
결합확률밀도함수 : (1) X 와 Y 의 주변확률밀도함수(2) P(0≤ X ≤ ½, ½ ≤ Y ≤ 1) , P(0≤ X ≤ ½) , P(½ ≤ Y ≤ 1) ,
(1)
x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
0 , 다른 곳에서
f(x, y) =
X 의 주변확률밀도함수 : fX(x) = f(x, y) dy = (x + y) dy
-∞∞
01
= xy + y2 = x + , 0 ≤ x ≤ 1
12 y=
0
1[ ]
12
= x2 + xy = y + , 0 ≤ y ≤ 1
12 x=
0
1[ ]
12
Y 의 주변확률밀도함수 : fY(y) = f(x, y) dx = (x + y) dx
0
1-∞
∞
(2) 구하고자 하는 확률 :1/2
P(1/2 ≤ Y ≤ 1) = y + dy = y2 + y =
1/2
1 12( ) 1
212[ ]1
1/2
58
P(0 ≤ X ≤ 1/2) = x + dx = x2 + x =
01/2 1
2( ) 12
12[ ]1/2
0
38
P(0 ≤ X ≤ 1/2, 1/2 ≤ Y ≤ 1) = (x + y) dydx
0 1/2
1
= xy + y2 dx = dx =0
1/2 12 y=1/
2
1[ ]
0
1/2 x2
38+(
)14
▶ 결합분포함수 (joint d.f.) : 임의의 실수 x, y 에 대하여
F(x, y) = P(X ≤ x, Y ≤ y )
X 의 주변분포함수 : FX(x) = P(X ≤ x )
Y 의 주변분포함수 : FY(y) = P(Y ≤ y )
FX(x) =t≤x
fX(t)
-∞
xfX(t)dt
모든
y
f(t, y)t≤x
-∞∞
-∞
xf(t,
y)dydt
=
, X : 연속확률변수인 경우
, X : 이산확률변수인 경우
결합분포함수의 성질☞(1) FX(x) = lim F(x, y) , FY(y) = lim F(x, y)
x→∞y→∞
(2) A={ (x, y)|a < X ≤ b , c < Y ≤ d } 에 대하여 확률 P[(X, Y) ∈ A]
P(a < X ≤ b , c < Y ≤ d ) = F(b,d) – F(a,d) - F(b,c) + F(a,c)
∂2
∂x∂y F(x, y)f(x, y) = (3)
연속확률변수 X 와 Y 에 대하여
fX(x) = ddxFX(x) , fY(y) = ddy
FY(y)(4)
결합분포함수 : F(x, y) = (1-e-x ) (1- e-y ) , 0 < x < ∞ , 0 < y < ∞
(1) X 와 Y 의 결합확률밀도함수 : f(x, y) = ?
(2) X 와 Y 의 주변확률밀도함수 : fX(x) = ? , fY(y) = ?
(3) P(1 < X ≤ 2 , 1 < Y ≤ 2) = ?
X 와 Y 의 주변분포함수 :
(1) X 와 Y 의 결합확률밀도함수 : ∂2
∂x∂y
FX(x) = lim F(x, y) = lim (1 – e-x ) (1 – e-2y ) = 1 – e-x , 0 < x < ∞
FY(y) = lim F(x, y) = lim (1 – e-x ) (1 – e-2y ) = 1 – e-2y , 0 < y < ∞
y→∞ y→∞
x→∞ x→∞
f(x, y) = F(x, y)
∂2
∂x∂y= (1 – e-x ) (1 – e-2y )= (e-x) (2e-2y) = 2e-(x+2y) , 0 < x < ∞ , 0 < y < ∞
(2) X 와 Y 의 주변확률밀도함수 :
(3) P(1 < X ≤ 2, 1 < Y ≤ 2) = F(2, 2) – F(1, 2) – F(2, 1) + F(1, 1)
= (1 - e-2) (1 - e-4) - (1 - e-1) (1 - e-4) - (1 - e-2)2 - (1 - e-1) (1 - e-2)
= 0.0272
fX(x) = FX(x) = (1 – e-x) = e-x , 0 < x < ∞
ddx
ddx
fY(y) = FY(y) = (1 – e-2y) = 2e-2y , 0 < y < ∞
ddy
ddy
결합확률질량함수 :
결합분포함수 : F(x, y)0.100.100.150.0420.300.050.050.1010.010.040.050.010
3210 Y X
F(x, y) = P(X ≤ x, Y ≤ y ) 이므로
Y X
0 1 2 3
0 0.01 0.06 0.10 0.111 0.11 0.21 0.30 0.612 0.15 0.40 0.59 1.00
조건부 확률분포 , 확률변수의 독립성과 종속성 및 항등분포에 대하여 알아본다 .
2 조건부 확률분포
조건부 확률 Review
f(x, y) : 이산확률변수 X 와 Y 의 결합확률질량함수 f(x, y) = P(X = x, Y = y)
fX(x) : 이산확률변수 X 의 주변확률질량함수 fX(x) = P(X = x)
fY(y) : 이산확률변수 Y 의 주변확률질량함수 fY(y) = P(Y = y)
A = { X=x }, B = { Y=y } A∩B = { X = x, Y = y }
P(A) = P(X=x) = fX(x)
P(B) = P(Y=y) = fY(y)
P(A∩B) = P(X=x, Y=y) = f(x, y)
P(A∩B) f(x, y) P(B) fY(y)
P(A|B)=P(X=x|Y=y) =
=
P(A|B) = P(A∩B)P(B)
, P(B) > 0
▶
f(y|x)=f(x, y)fX(x)X=x 일 때 Y 의 조건부확률질량함수 :
▶
조건부확률질량함수 (conditional p.m.f.) : 이산확률변수X 와 Y 에 대하여 , P(Y = y) > 0 일 때
를 Y=y 일 때 X 의 조건부확률질량함수라 하고 , f(x|y) 로 나타낸다 .
P(X=x|Y=y) = f(x, y)
fY(y)
조건부확률밀도함수 (conditional p.d.f.) : 연속확률변수X 와 Y 에 대하여 , fY(y) > 0 일 때
f(x|y) = f(x, y)
fY(y)
조건부 확률분포의 의미☞P(X=x, Y=y)P(X=
x)
P(X=x,Y=y)P(Y=y
)y
x
X 와 Y 의 결합확률질량함수 :
(1) Y 의 주변확률질량함수 : fY(y) = ?
(2) Y=y 인 X 의 조건부확률질량함수 : f(x|y) = ?
(3) Y=2 인 X 의 조건부확률질량함수 : f(x|y=2) = ?
(4) 조건부 확률 : P(X=3|Y=2) = ?
(1)(2)(3)(4)
0 , 다른 곳에서
f (x, y) =
, x = 1, 2, 3, y = 1, 2, 3x + y36
fY(y) =x=1
3f(x, y) =
x=1
3 x + y36
= y + 212
, y = 1, 2, 3
f(x|y) =f(x, y)fY(y)
(x + y) /36(y + 2) /
12
x + y3(y +
2)
= = , x = 1, 2, 3
f(x|y = 2) = x + 212
, x = 1, 2, 3
P(X=3|Y=2) = f(3|2) =
3 + 212
512
=
조건부 확률 구하는 방법☞
P(Y ∈ B|X = x) = y ∈ B
f(y|x)=P(X = x, Y ∈ B)P(X = x)
P(X ∈ A|Y = y) = x ∈ A
f(x|y)=P(X ∈ A, Y = y)P(Y = y)
P(Y ∈ B|X = x) = =P(X = x, Y ∈ B)fX(x)
P(X ∈ A|Y = y) =P(X ∈ A, Y = y)fY(y)
f(y|x)dyc
d
= f(x|y)dxa
b
X, Y 의 결합확률 :(1) X 와 Y 의 주변확률질량함수
(2) Y=2 인 X 의 조건부 확률질량함수
(3) Y=2 인 조건 아래서 X=1 또는 X=3
일 확률
Y X
1 2 3 4
1 0.12 0.08 0.07 0.052 0.08 0.15 0.21 0.133 0.01 0.01 0.02 0.07
Y X
1 2 3 4 fX(x)
1 0.12 0.08 0.07 0.05 0.32
2 0.08 0.15 0.21 0.13 0.57
3 0.01 0.01 0.02 0.07 0.11
fY(y) 0.21 0.24 0.30 0.25 1.0
0
(1) X 와 Y 의 주변확률질량함수 :
fY(y) =
0.21 , y = 10.24 , y = 20.30 , y = 30.25 , y = 4
fX(x) =0.32 , x = 10.57 , x = 20.11 , x = 3
(2) Y=2 인 X 의 조건부 확률질량함수 :조건부 확률질량함수의 정의로부터
(3) 구하고자 하는 확률 :
X 의 조건부 확률질량함수 :
f(x|y = 2) =
f(x, 2)
fY(2)
f(x, 2)
0.24
= , x = 1, 2, 3
f(1|y = 2) = = 0.333
0.080.24
f(2|y = 2) = = 0.625
0.150.24
f(3|y = 2) = = 0.042
0.010.24
f(x|y) =
0.333 , x = 00.625 , x = 10.042 , x = 2 0 , 다른 곳에서
P(X = 1 또는 X = 3|Y = 2) = f(1|y = 2) + f(3|y = 2)
= 0.333 + 0.042 = 0.375
f(x|y) = fX(x) ?
독립 사건 Review
이산확률변수 X 와 Y 에 대하여
A = { X = x }, B = { Y = y }
P(A) = P(X = x) = fX(x)
P(A|B)=P(X = x|Y = y) = f(x|y)
P(A) = P(A|B) , P(B) > 0
▶ 독립 (independent) : 임의의 실수 x 와 y 에 대하여 , fX(x) > 0, fY(y) > 0 일 때 fX(x) = f(x|y) 또는 fY(y) = f(y|x)이면 , 두 확률변수 X 와 Y 를 독립이라 하고 , 독립이 아닌경우에 종속 (dependent) 이라 한다 .
독립 확률변수의 성질☞확률변수 X 와 Y 가 독립이면 ,
f(x, y) = fX(x) fY(y)
결합확률밀도함수 : f(x, y)=6xy2 , 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1
(1) X 의 주변확률밀도함수 : fX(x) = ?
(2) Y=1/2 인 조건 아래서 X 의 조건부 확률밀도함수 : f (x|y=1/2) = ?
(3) Y=1/2 인 조건 아래서 확률 : P(1/2 ≤ X ≤ 1) = ?
(4) X 와 Y 의 독립성
(1) X 의 주변확률밀도함수 :
(2) Y 의 주변확률밀도함수 :
fY(y) = f(x, y) dx = 6xy2 dx = (3y2)x2 = 3y2 , 0 ≤ y ≤ 1
-∞
∞
x=0
1[ ]0
1
fX(x) = f(x, y) dy = 6xy2 dy = (2x)y3 = 2x , 0 ≤ x ≤ 1
-∞∞
y=0
1[ ]0
1
(4) 모든 0 ≤ x ≤ 1 에 대하여
fX(x) = 2x = f(x|y = 1/2)
X 와 Y 는 독립
(3)
fY(1/2)=3/4 이므로 Y=1/2 인 조건 아래서 X 의 조건부 확률밀도함수 :
f(x|y = ½) =
f(x, ½)fY(½) = = 2x , 0 ≤ x
≤ 1
(3/2)x
3/4
P ≤ X ≤ 1|Y = =
12
12(
)P ≤ X ≤ 1 , Y
=
fY(1/2)
12
12(
)1/2
1= 2x dx = x2 =
1/2
1 34
다음 결합분포에 대한 X 와 Y 의 독립성
(1) f(x, y) = x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 (2) f(x, y) = 2e-(x+2y) , x > 0, y > 0
(3)1/8, (x, y) = (0, 3), (3, 0)
3/8, (x, y) = (1, 2), (2, 1)
0 , 다른 곳에서f(x, y) =
(1) X 와 Y 의 주변확률밀도함수 :모든 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 에 대하여
X 와 Y 는 종속
12
f(x, y) = x + y
≠ fX(x) fY(y) = x + y +
12(
)( )
•
∞
12
12
fX(x) = f(x, y) dy = (x + y) dy
= xy + y2 = x + , 0 ≤ x ≤ 1
-∞
y=0[ ]
0
1
1
12
fY(y) = f(x, y) dx = (x + y) dx
= x2 + xy = y + , 0 ≤ y ≤ 1
-∞
∞
x=0[ ]
0
1
112
(2) X 와 Y 의 주변확률밀도함수 :
X 와 Y 는 독립
(3) X 와 Y 의 주변확률질량함수 :
X 와 Y 는 종속
f(x, y) =2e-(x+2y) = fX(x) fY(y) , x > 0, y > 0
fX(x) = 2e-(x+2y) dy = e-x e-2y = e-x , x > 0
0
∞
y=0[ ]∞
fY(y) = 2e-(x+2y) dx = 2e-2y e-x = 2e-
2y , y > 00
∞
x=0[ ]∞
1/8, x = 0, 33/8, x = 1, 2 0 , 다른 곳에서
fX(x) =1/8, y = 0, 33/8, y = 1, 2 0 , 다른 곳에서
fY(y) =
f(1, 1) = 0 ≠ fX(x) fY(y) =
18
18
164
• =
▶ 쌍마다 독립 (pairwisely independent) : 임의의 실수 x, y,z 에
대하여 , fX(x) > 0, fY(y) > 0, fZ(z) 일 때
f(x, y) = fX(x) fY(y),
f(y, z) = fY(y) fZ(z) ,
f(x, z) = fX(x) fZ(z)
이면 , 확률변수 X, Y 와 Z 를 쌍마다 독립이라 하고 , f(x, y, z) = fX(x) fY(y) fZ(z)
이면 독립이라 한다 .
예
fX(x) = e-x , x > 0
fY(y) = 2e-2y , y > 0
fZ(z) = 3e-3z , z > 0
f(x, y) = fX(x) fY(y),
f(y, z) = fY(y) fZ(z) ,
f(x, z) = fX(x) fZ(z)
X, Y 와 Z : 쌍마다 독립
f(x, y, z) = fX(x) fY(y) fZ(z)
X, Y 와 Z : 독립
f(x, y, z) = 6e-(x+2y+3z) , x > 0, y > 0, z >0 에 대하여 , 확률변수 X, Y, Z 의 독립성 조사
f(x, y) = 2e-(x+2y) , x > 0, y > 0
f(y, z) = 6e-(2y+3z) , y > 0, z > 0
f(x, z) = 3e-(x+3z) , x > 0, z > 0
X, Y, Z 의 m.p.d.f. :(X, Y), (Y, Z), (X, Z) 의
j.p.d.f. :
임의의 두 확률변수 X 와 Y 에 대하여 다음은 동치이다 .(1) X, Y : 독립(2) 모든 x, y 에 대하여 F(x, y) = FX(x) FY(y)(3) P(a < X ≤ b, c < Y ≤ d ) = P(a < X ≤ b ) P(c < Y ≤ d )
정리 1
증명 X 와 Y 가 연속확률변수인 경우 (1) (2)
(2) (1)
-∞y
-∞
xF(x, y) = f(u, v)dvdu = fX(u)fY(v)dvdu
= fX(u) fY(v)dv du = fX(u) FY(y)du -∞
x
-∞y(
)-∞
x
= FY(y) fX(u)du = FX(x)FY(y) -∞
x
∂2
∂x ∂y∂2
∂x ∂yf(x, y) = F(x, y) = FX(x)FY(y)
= FX(x) FY(y) = FX(x)fY(y) ∂∂x
∂∂y(
)∂∂x
= fY(y) FX(x) = fX(x)fY(y) ∂∂x(
)
-∞y
-∞
x
(1) X, Y : 독립 식 (3) 이 성립
P(a < X ≤ b, c < Y ≤ d ) = F(b, d) – F(a, d) – F(b, c) + F(a, c)
이고 , X, Y 가 독립이면 , F(x, y) = FX(x) FY(y)이므로
P(a < X ≤ b, c < Y ≤ d ) = FX(b)FY(d) – FX(a)FY(d) – FX(b)FY(c) + FX(a)FY(c)
= (FX(b) - FX(a)) (FY(d) - FY(c)) = P(a < X ≤ b ) P(c < Y ≤ d )
식 (3) 이 성립 X, Y : 독립
a, b, c, d 가 임의의 수이므로 a = -∞ , c = -∞ , b = x, d = y라 하면 ,
F(x, y) = P(a < X ≤ b, c < Y ≤ d ) = P(a < X ≤ b ) P(c < Y ≤ d ) = FX(x) FY(y)
이고 , 따라서 X 와 Y 는 독립이다 .
두 도시의 교통사고 건수 X 와 Y 의 결합확률함수 :
(1) X 와 Y 의 주변확률함수 : (2) X 와 Y 의 독립성 : (3) 두 도시의 교통사고 건수가 각각 1 을 초과하지 못할 확률 :
2x3y e-
5(x!)(y!)
, x = 0, 1, 2, …, y = 0, 1, 2, …
f(x, y) =
(1) X 와 Y 의 주변확률질량함수 :
( )
x=0
∞fY(y) = f(x, y) =
x=0
∞ 2x3y
(x!) (y!)e-5 = 3y
y!e-5
x=0
∞ 2x
x!
3y
y!= e-5 (e2) = e-3, y = 0, 1, 2, …
3y
y!
( )
y=0
∞fX(x) = f(x, y) =
y=0
∞ 2x3y
(x!) (y!)e-5 = 2x
x!e-5
y=0
∞ 3y
y!
2x
x!= e-5 (e3) = e-2, x = 0, 1, 2, …
2x
x!
(2) X 와 Y 의 독립성 :
모든 x = 0, 1, 2, …, y = 0, 1, 2, … 에 대하여
2x3y e-
5(x!)(y!)
f (x, y) =
= fX(x, y) fY(x, y) =2x e-2
x!3y e-3
y!•
X, Y : 독립
(3) X 와 Y 가 독립이므로 P(X≤ 1, Y≤ 1)= P(X≤ 1) P(Y≤ 1)이고 ,
P(X≤ 1, Y≤ 1) =(0.406)•(0.1991)
= 0.08080
P(X ≤ 1) = e-2 + e-2 = 0.4060
20
0!21
1!
P(Y ≤ 1) = e-3 + e-3 = 0.1991
30
0!31
1!
▶ 항등분포 (identical distribution) : 임의의 실수 x 에 대하여
fX(x) = fY(x)
일 때 , 확률변수 X 와 Y 는 항등분포를 이룬다 하고 , 항등적으로
독립인 분포를 이루는 확률변수를 간단히 i.i.d(independently, identically distributed) 로 나타낸다 .
예
fX(x) = e-x , x > 0
fY(y) = e-y , y > 0
fZ(z) = e-z , z > 0
fX(x) = fY(x) = fZ(x) = e-x
X, Y, Z : i.i.d
f(x, y, z) = e-(x+y+z) , x > 0, y > 0, z >0 에 대하여 , 확률변수 X, Y, Z 의
항등적인 독립성 조사
X 와 Y 의 결합분포함수 :
F(x, y) = (1-e-2x)(1-e-3y) , x >0 , y >0
X 와 Y 는 i.i.d. ?
X 와 Y 의 결합밀도함수와 주변밀도함수 :
X, Y : i.i.d.가 아니다 .
모든 x >0 , y >0 에 대하여f(x, y) = fX(x) fY(y) X, Y :
독립
모든 x >0 에 대하여fX(x) = 2e-2x≠ fY (x) = 3e-3x X, Y : 항등분포가 아니
다 .
fX(x) = 6e-(2x+3y) dy = 2e-2x , 0 < x < ∞ 0∞
fY(y) = 6e-(2x+3y) dx = 3e-3y , 0 < y < ∞ 0
∞
f(x, y) = F(x, y) = 6e-(2x+3y) , 0 < x < ∞, 0 < y < ∞
∂2
∂x ∂y
X 와 Y 의 결합확률함수 :
X 와 Y : i.i.d. ?
X 와 Y 의 주변확률질량함수 :
1/8, (x, y) = (0, 3), (3, 0)
3/8, (x, y) = (1, 2), (2, 1)
0 , 다른 곳에서f(x, y) =
1/8, x = 0, 3
3/8, x = 1, 2
0 , 다른 곳에서
fX(x) =
1/8, y = 0, 3
3/8, y = 1, 2
0 , 다른 곳에서
fY(y) =
모든 x =0, 1, 2, 3 에 대하여fX(x) = fY (x) X, Y :
항등분포
예제 4 에서 X, Y : 종속 X, Y : i.i.d. 가
아니다 .
결합분포의 기대값과 공분산 , 상관관계 등에 대하여 알아본다 .
3 결합분포에 대한 기대값
f(x, y) : X 와 Y 의 결합확률함수
u(x, y) : X 와 Y 의 함수
확률변수의 함수 Y = g(X) 의 기대값 :
확률변수의 함수에 대한 기대값 Review
☞ 2 변량 확률변수의 함수 u(X, Y) 의 기대값
E(Y) = E[g(X)] =
x
g(x) f(x)
-∞
∞g(x)
f(x)dx
모든
y
u(x, y) f(x, y)
-∞
∞-∞
∞u(x, y) f(x,
y)dydx
E[u(X, Y)] =
모든
x
, (X, Y) : 이산확률변수인 경우
, (X, Y) : 연속확률변수인 경우
2 변량 기대값의 성질
☞E[au(X, Y ) + bv(X, Y )] = aE[u(X, Y )] + bE[v(X,
Y)]X 의 기대값 :
X 의 분산 :
모든
y
X = E(X) = x f(x, y)
모든
x
= x f(x, y) = x fX(x) [
]모든
x
모든
x모든
y
-∞∞
-∞
∞X = x f(x, y)dydx = x fX(x)dx
-∞
∞
모든
y모든
x
= (x - X)2 f(x, y) = (x - X)2 fX(x)
[ ]
모든
x
X = E[(X - X)2] = (x - X)2 f(x, y)
모든
x모든
y
2
-∞∞
X = (x - X)2 f(x, y)dydx = (x - X)2 fX(x)dx
-∞∞
-∞
∞2
결합확률질량함수 :(1) E(X) = ?
(2) E(Y) = ?
(3) E(X + Y) = ?
(4) E(X Y) = ? 0.090.070.050.0420.100.090.070.0510.150.110.100.080
3210 Y X
X = E(X) = x f(x, y)
x=0
2
y=0
3
= 0•(0.08) + 0•(0.10) + 0•(0.11) + 0•(0.15) + 1•(0.05) + 1•(0.07)
+ 1•(0.09) + 1•(0.10) + 2•(0.04) + 2•(0.05) + 2•(0.07) + 2•(0.09) = 0.81
Y = E(Y) = y f(x, y)
x=0
2
y=0
3
= 0•(0.08) + 0•(0.05) + 0•(0.04) + 1•(0.10) + 1•(0.07) + 1•(0.05)
+ 2•(0.11) + 2•(0.09) + 2•(0.07) + 3•(0.15) + 3•(0.10) + 3•(0.09) = 1.78
E(X + Y) = (x + y) f(x, y)
x=0
2
y=0
3
= 0•(0.08) + 1•(0.10) + 2•(0.11) + 3•(0.15) + 1•(0.05) + 2•(0.07)
+ 3•(0.09) + 4•(0.10) + 2•(0.04) + 3•(0.05) + 4•(0.07) + 5•(0.09) = 2.59
E(X Y) = xy f(x, y)
x=0
2
y=0
3
= 0•(0.08) + 0•(0.10) + 0•(0.11) + 0•(0.15) + 0•(0.05) + 1•(0.07)
+ 2•(0.09) + 3•(0.10) + 0•(0.04) + 2•(0.05) + 4•(0.07) + 6•(0.09) = 1.47
임의의 두 확률변수 X 와 Y 가 독립이면 . 다음이 성립한다 . E(X Y ) = E(X ) E(Y )
정리 2
증명
정리 2 의 역은 성립하지 않는다 .
주 의
모든
y
E(X Y) = xy f(x, y) = xy fX(x)fY(y)
모든
x
= x fX(x) y fY(y) = E(X)E(Y)
[ ]
모든
x모든
y모든
x모든
y
[ ]X 와 Y 가 연속확률변수인 경우 :
X 와 Y 가 이산확률변수인 경우 :
E(X Y) = xy f(x, y)dydx = xy fX(x)fY(y)dydx
= xfX(x)dx yfY(y)dy = E(X)E(Y)( )
( )
-∞∞
-∞
∞-∞
∞-∞
∞
-∞∞
-∞
∞
결합확률밀도함수 : f(x, y) = 6xy2 , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
E(X), E(Y ), E(X Y ) = ? E(X Y ) = E(X)E(Y ) = ?
X, Y 의 주변확률밀도함수 :
E(X Y ) = E(X)E(Y) 가 성립한다 .
fX(x) = 2x , 0 ≤ x ≤ 1 , fY(y) = 3y2 , 0 ≤ y ≤ 1
X = xfX(x)dx = 2x2dx = x3 =
23 0
1 23
Y = yfY(y)dy = 3y3dy = y4 =
34 0
1 34
E(X Y) = xyf(x, y)dydx = 6x2y3dydx
= 6x2 y4 dx = x2 dx = x3 =
14 0
1( )
32
12 0
1 12
01
01
01
01
01
01
010
1
01
01
결합밀도함수 :E(X), E(Y ), E(X Y ) = ?
X, Y 의 독립성 ?
1+xy(x2 – y2 ) 4
f(x, y) = , -1 ≤ x ≤ 1, -1 ≤ y ≤ 1
X, Y 의 주변확률밀도함수 :
E(XY ) = E(X) E(Y )
X, Y 는 독립이 아니다 .
fX(x) = dy = , -1 ≤ x ≤ 1
12
1 + xy(x2 – y2)4
fY(y) = dx = , -1 ≤ y ≤ 1
12
1 + xy(x2 – y2)4
f(x, y) = ≠ fX(x) fX(x) =
14
1 + xy(x2 – y2)4
-11
-11
Y = dy = 0
y2X = dx
= 0 ;
y2
E(XY) = dydx = 0
1 + xy(x2 – y2)4
-11
-11
-11
-11
▶ 공분산 (covariance) : X=E(X),Y=E(Y) 에 대하여 E[(X – X ) (Y – Y )]을 공분산이라 하고 , Cov(X, Y) 로 나타낸다 .
공분산의 간편 계산 방법☞Cov(X, Y) = E[(X – X) (Y - Y)] = E(X Y - XY - YX + X Y)
= E(X Y) - XE(Y) - YE(X) + Y Y
= E(X Y) - Y Y
Cov(X, Y) = E[(X – X ) (Y – Y )](x – X ) (y – Y ) f(x, y) , (X, Y) : 이산형인 경우
(x – X ) (y – Y ) f(x, y)dxdy , (X, Y) : 연속형인 경우
=모든
x모든
y
-∞∞
-∞
∞
공분산의 성질☞(1) Cov(X, Y ) = E(X Y ) - X Y
(2) X, Y 가 독립이면 , Cov(X, Y ) = 0 ( 역은 성립하지 않는다 )
(3) Cov(X, X ) = Var(X)
(4) Cov(aX + b, cY + d ) = ac Cov(X, Y )
(5) Var(X + Y ) = Var(X) + Var(Y ) +2 Cov(X, Y )
(6) Var(X - Y ) = Var(X) + Var(Y ) -2 Cov(X, Y )
(7) X, Y 가 독립이면 , Var(X + Y ) = Var(X) + Var(Y )
Var(X - Y ) = Var(X) + Var(Y )Var(X + Y) = E[{(X + Y) – (X + Y)}2] = E[(X - X)2 + 2(X - X)(Y - Y) + (Y - Y)2 ] = E[(X - X)2 ] + 2E[(X - X)(Y - Y) ] + E[(Y - Y)2] = Var(X) + Var(Y) + 2Cov(X, Y)
결합밀도함수 : f(x, y) = x+y, 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1
(1) X 와 Y 의 공분산
(2) E(X+Y ), Var(X+Y )
(1) X 와 Y 의 주변확률밀도함수 :fX(x) = x + , 0 ≤ x ≤ 1 ; fY(y) = y + , 0 ≤ y ≤ 1
12
12
Cov(X, Y) = E(XY) - X Y = - • = -
13
712
712
1144
( )
0
1E(X) = x x + dx = x2+ dx = x3 + x2 =
12
x2
13
14(
)( )
712
( )
0
1E(Y) = y y + dy = y2+ dy = y3 + y2 =
12
y2
13
14(
)( )
712
y=0
1( )
E(XY) = xy(x + y)dydx = x xy2 + y3 dx
12
13
( )
= x x + dx =12
13
13
01
01
01
01
01
01
01
01
(2)
X 와 Y 의 분산 :
X+Y 의 분산 :
( )
Var(X) = E(X2) – E(X)2 = - =712
11144
512
2
( )
Var(Y) = E(Y2) – E(Y)2 = - =712
11144
512
2
536
Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y)
= + - =
11144
11144
2144
712
712
E(X + Y) = E(X) + E(Y) = + =
76
( )
0
1E(X2) = x2 x + dx = x3+ dx = x4 + x3 =
12
x2
2
14
16(
)( )
512
( )
0
1E(Y2) = y2 y + dy = y3+ dy = y4 + y3 =
12
y2
214
16(
)( )
512
01
01
01
01
▶ 상관계수 (correlation coefficient) : 두 확률변수 사이의상호 종속관계를 나타내는 계수
Cov(X, Y )X Y
Corr(X, Y ) =
> 0 인 경우 < 0 인 경우 = 0 인 경우
상관계수의 특징☞-1 ≤ ≤ 1
= 1 인 경우 = -1 인 경우
상관계수의 성질☞(1) E(X Y) = X Y + XY X Y
(2) Corr(aX+b, cY+d ) = Corr(X, Y )
-Corr(X, Y )
, ac > 0 인 경우
, ac < 0 인 경우
공정한 동전을 3 번 던지는 실험X : 처음 두 번에서 앞면이 나오는 개수Y : 세 번째에서 앞면이 나오는 개수(1) Cov(X, Y) = ?(2) XY = ?(3) E(X+Y ) = ?, Var(X+Y ) = ?
표본공간 HHH HHT HTH THH HTT THT TTH TTTX 2 2 1 1 1 1 0 0Y 1 0 1 1 0 0 1 0
확 률 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8
X 와 Y 의 결합질량함수 :
f(x, y) =1/8 , (x, y) = (0, 0), (0, 1), (2, 0), (2, 1)
2/8 , (x, y) = (1, 0), (1, 1)
0 , 다른 곳에서
X 와 Y 의 주변질량함수 :
(1) Cov(X, Y) :
Cov(X, Y) = E(XY ) – E(X)E(Y ) = 0
fX(x) =1/4 , x = 0, 2
1/2 , x = 1
0 , 다른 곳에서
fY(y) =1/2 , y = 0, 1
0 , 다른 곳에서
모든
(x,y)
E(XY) = xyf(x, y) = 2•1• + 1•1• =
18
28
12
모든 x
E(X) = xfX(x) = 1• + 2• = 1
12
14
모든 y
E(Y) = yfY(y) = 1• =12
12
(2) XY :
Cov(X, Y )X Y
XY = = 0
(3) E(X+Y ) = E(X) + E(Y) =
Var(X) = E(X2) - E(X)2 = - 1 =32
34
12
Var(Y) = E(Y2) - E(Y)2 = - =
12
14
14
X = 1 /
Y = 1/2
2
모든 x
E(X2) = x2fX(x) = 1• + 4• =
12
14
모든 y
E(Y2) = y2fY(y) = 1• =12
12
32X2, Y2 의 기대값
:
X, Y 의 분산 :
Var(X+Y ) = Var(X) + Var(Y) + 2Cov(X, Y) =
32
제 3 장