확률 - cs.dsu.ac.kr

22
통계학입문 제4장 확률

Upload: others

Post on 03-Oct-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 확률 - cs.dsu.ac.kr

통계학입문

제4장 확률

Page 2: 확률 - cs.dsu.ac.kr

통계학입문 2

확률 (Probability)

우리가 얻는 임의의 표본은 모두 확률에 의한 사건임

사건(event) – 발생 가능한 결과들의 집합

단순사건(simple event) – 발생 가능한 결과들 중 하나만 발생한 사건

표본공간(sample space)

: 일어날 수 있는 모든 가능한 단순사건을 모아 집합으로 표시한 것

모든 원소를 포함(exhaustive)

상호배반(mutually exclusive)

Page 3: 확률 - cs.dsu.ac.kr

통계학입문 3

확률 (Probability)

표본공간(sample space)

예) 주사위 던지는 실험에 대한 표본공간

⇒ { 1 , 2 , 3 , 4 , 5 , 6 }

예) 동전 던지는 실험에 대한 표본공간

⇒ { 앞면 , 뒷면 }

예) 동전과 주사위를 동시에 던지는 실험에 대한 표본공간

⇒ { 앞1, 앞2, 앞3, 앞4, 앞5, 앞6, 뒤1, 뒤2, 뒤3, 뒤4, 뒤5, 뒤6}

T

Page 4: 확률 - cs.dsu.ac.kr

통계학입문 4

확률의 정의

전통적 접근 (classic approach)

: 똑같은 가능성의 사건을 똑같은 확률값을 갖도록 정의

: 주사위 확률, 동전의 확률

상대적 비율 접근(relative frequency approach)

: 무수히 많이 시행하였을 때 그 사건이 일어난 비율이 수렴해가는 값

: 주사위를 무수히 던졌을때 ‘5’가 나올 비율

주관적 접근(subjective approach)

: 각자 생각하고 있는 어떤 사건이 일어날 가능성에 대한 믿음의 정도

Page 5: 확률 - cs.dsu.ac.kr

통계학입문 5

확률의 정의

상대적 비율 접근(relative frequency approach)

0.4

0.45

0.5

0.55

0.6

동전의 앞면이 나올 확률 = 1/2

50 100 200 150 250

Page 6: 확률 - cs.dsu.ac.kr

통계학입문 6

확률의 규칙

표본공간의 사건을 이라 할 때,

각각의 사건의 확률은 0과 1사이에 존재

표본공간의 모든 사건의 확률을 전부 더하면 1

1 2, , , nE E E

0 1, for all iP E i

1 2 1nP E P E P E

확률 할당의 기본 필요조건

1. 2.

Page 7: 확률 - cs.dsu.ac.kr

통계학입문 7

확률의 규칙

여집합 규칙 (complement rule)

합규칙 (addition rule)

상호배반 사건의 합 규칙

1 CP A P A

P A B P A P B P A B

P A B P A P B

Page 8: 확률 - cs.dsu.ac.kr

통계학입문 8

확률의 규칙

결합확률 (Joint probability)

: 교집합(intersection)의 확률

P(A1 ∩ B2) P(A1)

Total 사건

P(A2 ∩ B1)

P(A1 ∩ B1)

사건

Total 1

결합확률 주변확률

A1

A2

B1 B2

P(B1) P(B2)

P(A2 ∩ B2) P(A2)

Page 9: 확률 - cs.dsu.ac.kr

통계학입문 9

확률의 규칙

주변확률 (Marginal probability)

: 두 개 변수를 동시에 고려하는 상황에서 어느 한 쪽만을 생각할 때의 확률

: 주사위와 동전을 동시에 던질 때의 예

1 2 3 4 5 6 합계

앞면

뒷면

합계

1

12

1

12

1

12

1

12

1

12

1

12

1

12

1

12

1

12

1

12

1

12

1

12

1

6

1

6

1

6

1

6

1

6

1

2

1

2

1

6

Page 10: 확률 - cs.dsu.ac.kr

통계학입문 10

확률의 규칙

조건확률 (conditional probability)

: 학점이 좋은 학생의 취업확률 (조건=‘학점이 좋다’)

: 학점이 낮은 학생의 취업확률 (조건=‘학점이 낮다’)

: 예) 카드놀이에서 빨강색 카드를 뽑았을 때 그 카드가 에이스일 확률은?

| or |

P A B P A BP A B P B A

P B P A

Page 11: 확률 - cs.dsu.ac.kr

통계학입문 11

확률의 규칙

검정

색깔

빨강 총계

에이스 2 2 4

비 에이스 24 24 48

총계 26 26 52

조건부 표본공간

(Ace and Red) 2 / 52 2(Ace | Red)

(Red) 26 / 52 26

PP

P

Page 12: 확률 - cs.dsu.ac.kr

통계학입문 12

확률의 규칙

독립사건(Independence events) : 어느 사건이 다른 사건과 일어날 확률이 서로 무관할 때

: 동전의 앞뒤와 주사위의 숫자는 서로 무관함

: 조건이 확률에 미치는 영향이 없음

| or |P A B P A P B A P B

Page 13: 확률 - cs.dsu.ac.kr

통계학입문 13

확률의 규칙

독립사건(Independence events)

: 승진여부는 남성과 여성이 차이를 보이고 있는가?

: 남성과 승진은 독립. 성별이 승진여부와 무관함.

승진 미승진 Total 남성 46 184 230 여성 16 64 80

total 248 310 62

사건의 정의

A: 남성 B: 승진함

46 230| , ( )

62 310

|

이므로두사건은독립사건

P A B P A

P A B P A

Page 14: 확률 - cs.dsu.ac.kr

통계학입문 14

확률의 규칙

곱셈규칙

: 독립여부에 관계없이 항상 성립

독립사건의 곱셈규칙

: 독립일 때만 성립

| or |P A B P B P A B P A B P A P B A

P A B P A P B

Page 15: 확률 - cs.dsu.ac.kr

통계학입문 15

베이즈 정리(Bayes’ theorem)

베이즈정리 : 조건확률을 구할 때, 조건 상황이 역으로 되어 있는 확률을 이용하는 것

사건이 두가지 일 때의 베이즈 정리

사전확률: 사건이 일어나기 전 일어날 확률

사후확률: 사건이 일어난 후의 확률

1 1

11 1 2 2

||

| |

P A P B AP A B

P A P B A P A P B A

2 2

21 1 2 2

||

| |

P A P B AP A B

P A P B A P A P B A

1 2( ), ( )P A P A

1 2( | ), ( | )P A B P A B

Page 16: 확률 - cs.dsu.ac.kr

통계학입문 16

베이즈 정리(Bayes’ theorem)

어느 대학을 응시한 남학생과 여학생의 비율이 각각 0.7과 0.3

여학생의 합격률은 0.6이고 남학생의 합격율은 0.2

합격한 신입생 중 남학생의 비율은?

사전정보

A1=남학생, A2=여학생(=A1c)

B=합격, Bc=불합격

P(A1)=0.7, P(A2)=0.3, P(B|A1)=0.2, P(B|A2)=0.6

베이즈정리 적용

1 1

11 1 2 2

||

| |

0.6 0.5 5

0.6 0.5 0.4 0.6 9

P A P B AP A B

P A P B A P A P B A

Page 17: 확률 - cs.dsu.ac.kr

통계학입문 17

베이즈 정리(Bayes’ theorem)

베이즈 정리의 확장

1 1 2 2

||

| | |

i ii

n n

P A P B AP A B

P A P B A P A P B A P A P B A

1 2 ( ) 표본공간nA A A

Page 18: 확률 - cs.dsu.ac.kr

통계학입문 18

베이즈 정리(Bayes’ theorem)

Monty Hall Puzzle

1950년대와 60년대에 미국 TV에서 인기 프로그램이었던 호스트 Monty Hall이 진행하는 Price is Right 이라는 게임쇼가 있었다. 일반인 출연자들 중에서 물건 값을 제일 잘 맞추는 최종 출연자 한 사람이 남는다. 이 출연자는 세 문 중 하나를 고를 수 있다. 문을 열면 상품이 있어 그 상품을 타가게 된다. 문 하나에는 자동차나 여행 상품 등 좋은 상품이 숨어 있고 다른 두 문 뒤에는 별로 좋지 않은 상품이 숨어 있다.

출연자가 문을 하나 고르면 그 문을 바로 열지 않고 쇼의 진행자인 Monty Hall이 다른 두 문 중에 하나를 열어 보여 준다. 쇼 진행자가 열어 보여 주는 문에는 항상 좋지 않은 상품이 있다. 이 때 쑈 진행자는 출연자에게 자기가 골랐던 문을 버리고 다른 열리지 않은 문으로 바꿀 수 있는 기회를 준다. 이 때 출연자는 자기가 골랐던 문을 그대로 유지 하는 것과 다른 문으로 바꾸는 것 중 어느 것이 유리한가? 또는 그대로 유지하는 것과 바꾸는 것이 확률적으로 차이가 없는가?

Page 19: 확률 - cs.dsu.ac.kr

통계학입문 19

베이즈 정리(Bayes’ theorem)

Monty Hall Puzzle

A, B, C 세 문 중 상품이 있을 확률은 각 1/3이고 출연자가 A를 골랐다고 하자. 그러면 진행자가 B를 열 확률을 다음과 같이 구할 수 있다.

상품이 A에 있을 때 진행자가 B를 열 확률은

상품이 B에 있을 때 진행자가 B를 열 확률은

상품이 C에 있을 때 진행자가 B를 열 확률은

따라서 B를 열 확률은

| |P B P A P B A P B P B B 를연다 를연다 를연다

|P C P B C 를연다

1 1 1 1 1 1 10 1 0

3 2 3 3 6 3 2

| 1/ 2P B A 를연다

| 0P B B 를연다

| 1P B C 를연다

Page 20: 확률 - cs.dsu.ac.kr

통계학입문 20

베이즈 정리(Bayes’ theorem)

Monty Hall Puzzle

진행자가 B를 열어 보였을 때 A에 상품이 있을 확률은 베이즈정리에 의해

진행자가 B를 열어 보였을 때 C에 상품이 있을 확률은

즉 출연자가 A를 고르고 진행자가 B를 열어 보였다면 문을 바꾸어야 상품을 탈 확률이 높은 것이다.

1 1 | 13 2|

1 3

2

P A P B AP A B

P B

를연다를연다

를연다

11 | 23|

1 3

2

P C P B CP C B

P B

를연다를연다

를연다

Page 21: 확률 - cs.dsu.ac.kr

통계학입문 21

수형도 (tree diagram)

수형도 (tree diagram) – 복잡한 문제를 도표로 그려 이해하기 쉽게 한 것

: 예) 레지던트들이 전체적으로 얼마나 마약을 하고 있는지 조사하고자

한다. 이 때 응답한 사람의 프라이버시를 보장하기 위해 아무도 모르게 동전을 던지게 하여 앞면이 나오면 마약을 하고 있는지에 대한 대답을 하게 하고 뒷면이 나오면 본인의 생일이 홀수 날인지에 대한 대답을 하게 한다. 이를 수형도로 그리면 다음과 같다.

마약 한다 ‘예’

동전 앞

하지 않는다 ‘아니오’

홀수 생일날 ‘예’

동전 뒤

짝수 생일날 ‘아니오’

1

2

1

2

P

1 P

1

2

1

2

Page 22: 확률 - cs.dsu.ac.kr

통계학입문 22

수형도 (tree diagram)

만일 ‘예’의 비율이 0.28이라면 레지던트 의사 중 마약을 하는 비율이 얼마인가? ‘예’의 비율은 동전 앞이 나와 마약을 하는 비율과 동전 뒤가 나와 홀수 생일일 때 ‘예’로 답한 비율의 합이다.

이므로 레지던트 의사 중 마약을 하는 비율은

1 1 10.28

2 2 2p

(0.28 0.25) 2 0.06p