슬라이드 1 - iptime

48

Upload: others

Post on 09-Dec-2021

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 슬라이드 1 - ipTIME
Page 2: 슬라이드 1 - ipTIME

2

1. 균등분포(uniform distribution)

연속형 분포에서 가장 단순한 분포형태로 특정구간 내의 값들이 나타날 가능성이균등한 분포를 말한다. 연속형 확률변수 X가 실수구간 [a, b] 에서 나타날 가능성이 균등할 때, X는 균등분포를 따른다고 하며 X~U(a, b)로 표현한다. X 의 확률밀도함수는 다음과 같다.

1

0

, a X bf(x) b a

,

다른 곳에서

Page 3: 슬라이드 1 - ipTIME

3

Page 4: 슬라이드 1 - ipTIME

4

2. 균등분포의 평균과 분산

확률변수 X가 X~U(a,b) 라고 할 때, X의 평균과 분산은 다음과 같다.

① 평균 :

② 분산 :2)(

12

1)(

2)(

abXVar

abXE

3. 균등분포의 확률계산

구간 에서의 확률은 다음과 같다.α X β

Prβ α

( α X β) , a α, β bb a

Page 5: 슬라이드 1 - ipTIME

5

예 A교수가 학교에 출근하는 시간이 오전 9시에서 10시 사이이며 그 시간 안에서특정시간에 출근할 가능성이 동일하다고 할 때, 확률변수 X를 A교수의출근시간이라고 정의하면 X는 9시에서 10시 사이에 균등한 확률분포를 가진다.

균등분포인 경우, 확률밀도함수 f(x) 가 1이어야 하므로 확률분포형태가직사각형으로 나타난다. 가로 길이의 단위를 분으로 하면 가로 길이가60이 되므로 세로 길이인 f(x)도 1/60 이 되며, 이 경우의 확률밀도함수와분포의 그림은 다음과 같다.

Page 6: 슬라이드 1 - ipTIME

6

한편, 가로 길이의 단위를 시간으로 하면 가로 길이가 1 이 되므로 세로 길이인f(x)도 1 이 되며, 이 경우의 확률밀도함수와 분포의 그림은 다음과 같다.

① 확률밀도함수 ② 균등분포의 그림

1, 0 1( )

0,

xf x

다른 곳에서

Y

)(yf

1

1

Page 7: 슬라이드 1 - ipTIME

7

확률변수 Y가 구간 [5,10]에서 균등한 분포를 가질 때 의확률을 계산하라

풀이

76 Y

Y의 확률밀도함수가 이므로 이다.105,5

1

510

1)(

Yyf

5

11

5

1)76( YPr

Y

)(yf

5

1

5 6 7 10

Page 8: 슬라이드 1 - ipTIME

8

그림 정규분포

정규분포

정규분포는 가능한 값이 사이의 모든 실수 값이며,

분포의 형태가 그림과 같이 종모양인 분포를 말한다.

)x (

Page 9: 슬라이드 1 - ipTIME

9

정규분포

정규분포란 분포의 형태가 종을 엎어 놓은 모양인 분포를 말하며, 분포의 형태는평균 와 분산 에 의해 결정된다. 확률변수 X가 평균 와 분산 을갖는 정규분포를 따른다면

μ 2σ μ 2σ

2X ~ N μ, σ ( ) 이라고 표현하며, X의 확률밀도함수는

2

2

1( )

21

2

x μσf(x) e , x

π

여기에서 e는 자연대수의 밑수로 이다.2 71828 e .

Page 10: 슬라이드 1 - ipTIME

10

확률변수 X가 정규분포를 따를 때 X의 일차함수로 표시되는새로운 변수 Y=aX+b역시 정규분포를 한다.

𝐸 𝑌 = 𝐸 𝑎𝑋 + 𝑏 = 𝑎𝜇 + 𝑏

𝑉𝑎𝑟 𝑌 = 𝑉𝑎𝑟 𝑎𝑋 + 𝑏 = 𝑎2𝜎2

즉, 𝑋~𝑁(𝜇, 𝜎2)일 때, 𝑌~𝑁(𝑎𝜇 + 𝑏, 𝑎2𝜎2)

Page 11: 슬라이드 1 - ipTIME

11

① 정규분포의 일반적 형태 ② 평균이 다르고 분산이 같은 정규분포

③ 평균은 같으나 분산이 다른 정규분포 ④ 평균과 분산이 각각 다른 경우의 정규분포

분산의 값이 클수록 분포가 평균을 중심으로 넓게 흩어지며, 분산의 값이작을수록 분포의 형태가 평균에 집중되어 있음을 알 수 있다.

Page 12: 슬라이드 1 - ipTIME
Page 13: 슬라이드 1 - ipTIME

13

정규분포의 표준화(표준정규분포)

확률변수 Z가 평균이 0이고 분산이 1인 정규분포를 따를 때 Z는

표준정규분포를 따른다고 하며, 으로 표현한다.

Z의 확률밀도함수는

이다.

0 1Z ~ N ,( )

21

21

2

z

f(z) e , zπ

Page 14: 슬라이드 1 - ipTIME

14

표준정규분포

평균이 0이고 분산이 1인 정규확률변수는 Z로 나타내며 다음과 같이 표현한다.

이때 Z는 표준정규분포를 따른다고 한다.

𝐸 𝑧 = 𝐸𝑋 − 𝜇

𝜎=

1

𝜎𝐸 𝑋 − 𝜇 =

1

𝜎𝜇 − 𝜇 = 0

𝑉𝑎𝑟 𝑧 = 𝐸[𝑧 − 𝐸 𝑧 ]2 = 𝐸(𝑋 − 𝜇

𝜎)2 =

1

𝜎2𝐸(𝑋 − 𝜇)2= 1

Page 15: 슬라이드 1 - ipTIME

15

표준정규분포의 형태는 그림과 같으며, 중심 0에서부터 양의 값 Z까지의 확률은색칠한 부분의 넓이와 같다.

그림 표준정규분포

Page 16: 슬라이드 1 - ipTIME

16

표준정규분포의 확률계산

그림 표준정규분포의 a와 b구간확률

Page 17: 슬라이드 1 - ipTIME

17

그림 z가 0.70보다 작을 확률

Page 18: 슬라이드 1 - ipTIME

18

그림 z의 확률밀도 함수 : F (- )과 1-F )zz 0 z (z0

Page 19: 슬라이드 1 - ipTIME

19

Z가 표준정규확률변수라면 Z값이 -1과 0.5사이에 놓일 확률을 구하라.예

풀이

이 확률은 표준정규분포표를 이용하여 다음과 같이 계산할 수 있다.

Page 20: 슬라이드 1 - ipTIME

20

그림 F ( )=0.8289가 되는 값zz 0 z0

Page 21: 슬라이드 1 - ipTIME

21

표준정규확률변수 Z가 어떤 구간에 속할 확률이 0.90이고이 구간이 0을 기준으로 대칭을 이룰 때 이 구간을 구하라.

풀이

0을 기준으로 대칭을 이루며 Z가 놓일 확률이 0.9인 구간은

가 되며, 이를 만족하는 을 구하면 된다. 2•

z0

z zz0zFz(- )=1-0.9와 F ( )=0.9+F ( - )를 이용하면0 z0

Fz ( ) = 0.9+0.05 = 0.95가 되므로 누적분포의 값이 0.95가 되는 를표준정규분포표로부터 구하면 그 값은 1.645이다.따라서 구하고자 하는 구간은 -1.645부터 1.645까지가 된다.

z0 z0

Page 22: 슬라이드 1 - ipTIME

22

Page 23: 슬라이드 1 - ipTIME

23

정규분포의 표준화와 확률계산

정규분포의 표준화

Page 24: 슬라이드 1 - ipTIME

24

정규분포의 확률계산

Page 25: 슬라이드 1 - ipTIME

25

Page 26: 슬라이드 1 - ipTIME

26

그림 X와 Z의 확률밀도함수

Page 27: 슬라이드 1 - ipTIME

27

어느 투자가 A씨는 1천만원을 증권에 투자하려고 한다. 증권회사에서 추천한 두 개의증권에 대한 수익률 분포를 조사해보니 두 증권은 다음과 같은 정규분포를 한다.(단위 : %)

A씨는 두 개의 증권 중에서 하나에만 투자하려고 한다. 증권 2는 높은 평균수익률을갖는 대신에 수익률의 분산이 커서 투자에 대한 위험성은 증권 1보다 크다.

𝑋1~𝑁(10, 42)

𝑋2~𝑁(14, 62)

Page 28: 슬라이드 1 - ipTIME

28

① A씨는 수익률이 0%보다 작게 되는 확률이 작은 증권을 택하려고 한다면어느 증권을 택하게 되는가?

따라서, A씨는 증권 1을 택한다.

𝑃(𝑋1 < 0) = 𝑃 𝑧 <0 − 10

4= 𝑃 𝑧 < −2.5 = 0.0062

𝑃(𝑋2 < 0) = 𝑃 𝑧 <0 − 14

6= 𝑃 𝑧 < −2.333 = 0.0098

Page 29: 슬라이드 1 - ipTIME

29

② A씨는 수익률이 10%보다 크게 되는 확률이 큰 증권을 택하려고 한다면어느 증권을 택하게 되는가?

따라서, A씨는 증권 2를 선택한다.

𝑃(𝑋1 > 10) = 𝑃 𝑧 <10 − 10

4= 𝑃 𝑧 > 0 = 0.5

𝑃(𝑋2 > 10) = 𝑃 𝑧 <10−14

6= 𝑃 𝑧 > −0.67 = 0.7486

Page 30: 슬라이드 1 - ipTIME
Page 31: 슬라이드 1 - ipTIME

31

2

2 -분포

확률변수 Z1, Z2, … , Zn이 서로 독립적으로 표준정규분포 을 따를 때,

Z1, Z2, … , Zn의 제곱합 은 자유도가 n인 분포를 따른다.

자유도가 n인 분포의 평균과 분산은 다음과 같다.

즉, 일 때

이다.

E(X) n

2Var(X) n

0 1N ,( )2

1

n

i

i

Z

2χ2χ

2 2

( )nX ~ χ

Page 32: 슬라이드 1 - ipTIME

32

그림2χ 분포

2χ 2χ

분포는 자유도가 모수이며 ,

따라서 자유도의 크기에 따라 분포의

형태가 달라진다. 그림은 몇 개의

자유도에 따르는 분포의 그림이

주어져 있는데 , 자유도가 클수록

정규분포와 근사한 분포 형태를

갖는다.

Page 33: 슬라이드 1 - ipTIME

33

Page 34: 슬라이드 1 - ipTIME

34

또한 분산이 인 정규분포를 이루는 모집단으로부터 표본크기가 n인선택 가능한 모든 임의표본이 추출되었을 때, 각 표본의 분산을 이라고 하면2S

은 자유도가 n-1인 - 분포를 따른다. 2

Page 35: 슬라이드 1 - ipTIME

35

Page 36: 슬라이드 1 - ipTIME

36

카이제곱은 자유도 n-1에 따라 분포의 형태가 다르므로 각각의 자유도 및 확률에따른 카이제곱의 값이 다음과 같이 주어져 있다.

236.91.02 1.0)236.9Pr( 2 예 자유도가 5일 때 인데 이는 을 의미한다.

자유도 P=0.99 0.98 0.95 0.90 0.80 0.20 0.10 0.05 0.02 0.01

1 0.000157 0.000628 0.00393 0.0158 0.0642 1.642 2.706 3.841 5.412 6.635

2 0.0201 0.0404 0.103 0.211 0.446 3.219 4.605 5.991 7.824 9.210

3 0.115 0.185 0.352 0.584 1.005 4.642 6.251 7.815 9.837 11.341

4 0.297 0.429 0.711 1.064 1.649 5.989 7.779 9.488 11.668 13.277

5 0.554 0.752 1.145 1.610 2.343 7.289 9.236 11.070 13.388 15.086

6 0.872 1.134 1.635 2.204 3.070 8.558 10.645 12.592 15.033 16.812

7 1.239 1.564 2.167 2.833 3.822 9.803 12.017 14.067 16.622 18.475

8 1.646 2.032 2.733 3.490 4.594 11.030 13.362 15.507 18.168 20.090

9 2.088 2.532 3.325 4.168 5.380 12.242 14.684 16.919 19.679 21.666

10 2.558 3.059 3.940 4.865 6.179 13.442 15.987 18.307 21.161 23.209

Page 37: 슬라이드 1 - ipTIME

37

Page 38: 슬라이드 1 - ipTIME

38

t-분포

자유도가 무한히 커지면 t-분포는 표준정규분포에 접근한다.

𝑡 = 𝑋 − 𝜇𝑠𝑛

~𝑡𝑛−1

Page 39: 슬라이드 1 - ipTIME

39

( 1)T ~ t n

(X1, X2, … , Xn)을 으로부터의 확률표본이라고 할 때 확률변수 T를

여기에서 으로 정의하면,

T는 자유도(d.f.)가 n-1인 t 분포를 따르며 로 표현한다.

2( )N μ, σ

X μT

S/ n

2 2

1 1

1 1

1

n n

i i

i i

X X S (X X)N n

,

Page 40: 슬라이드 1 - ipTIME

40

그림

표준정규분포와 t분포를 비교한 그림으로 t분포가 표준정규분포보다꼬리부분의 확률이조금더큰것을 알 수 있다.

Page 41: 슬라이드 1 - ipTIME

41

Page 42: 슬라이드 1 - ipTIME

42

Page 43: 슬라이드 1 - ipTIME

43

t-분포는 자유도 n-1에 따라 분포의 형태가다르므로 각각의 자유도 및 확률에 따른t- 분포의 값이 다음과 같이 주어져 있다

예 자유도가 5일 때 인데이는 을의미한다.

015.205.0 t05.0)015.2Pr( T

p v

0.1 0.05 0.025 0.01 0.005

1 3.078 6.314 12.706 31.821 63.657

2 1.886 2.920 4.303 6.965 9.923

3 0.1638 2.353 3.182 4.541 5.841

4 1.533 2.132 2.776 3.747 4.604

5 1.476 2.015 2.571 3.365 4.032

6 1.440 1.943 2.447 3.143 3.707

7 1.415 1.895 2.365 2.998 3.499

8 1.397 1.860 2.306 2.896 3.355

9 1.383 1.833 2.262 2.821 3.250

10 1.372 1.812 2.228 2.764 3.169

26 1.315 1.706 2.056 2.479 2.779

27 1.314 1.703 2.052 2.473 2.771

28 1.313 1.701 2.048 2.467 2.763

29 1.311 1.699 2.045 2.462 2.756

30 1.310 1.697 2.042 2.457 2.750

∞ 1.282 1.645 1.960 2.326 2.576

Page 44: 슬라이드 1 - ipTIME

44

F-분포

E(F) = v2/(v2-2)이고, 자유도가 같아질수록 정규분포와 비슷하게 된다.

Page 45: 슬라이드 1 - ipTIME

45

Page 46: 슬라이드 1 - ipTIME

46

Page 47: 슬라이드 1 - ipTIME

47

F-분포는 분자의 자유도(v1) 및 분모의 자유도(v2)에 따라 분포의 형태가 다르므로각각의 자유도에 따른 에 대한 F값이 다음과 같이 주어져 있다

예 분자의 자유도가 7이고 분모의 자유도가 9인 경우 이다.

05.0

29.305.0 F

v2 v1 1 2 3 4 5 6 7 8 9 10 ∞

1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88 254.31

2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.50

3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.76 8.53

4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.63

5 6.61 5.79 5.41 5.19 5.05 4.95 4.48 4.82 4.77 4.74 4.37

6 5.99 4.74 7.35 4.12 3.94 3.87 3.79 3.73 3.68 3.64 3.23

7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.23

8 5.32 4346 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 2.93

9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 2.71

10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.54

∞ 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.75 1.00

Page 48: 슬라이드 1 - ipTIME

48