mỘt sỐ kiẾn thỨc vỀ xÁc suẤt thỐng kÊ · 17/05/2017 1 bài giảngtoán cao cấp1...

41
17/05/2017 1 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ CHƯƠNG 5c Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến XÁC SUẤT CỦA BC Con số đặc trưng cho khả năng xuất hiện của biến cố trong phép thử gọi là xác suất của biến cố đó. Kí hiệu xác suất của bc A: P(A) Xác suất không có đơn vị Điều kiện: 2 ) 0 1 ) 0, 1 ) i PA ii P P iii PA B PA PB khi AB Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Quan điểm tần suất Thực hành 3 bước: Thực hiện phép thử với số lần n, rất lớn Đếm số lần biến cố A xuất hiện, giả sử n(A) Xác suất của bc A là: 3 lim n nA PA n

Upload: others

Post on 31-Aug-2019

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

1

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

MỘT SỐ KIẾN THỨC VỀXÁC SUẤT THỐNG KÊ

CHƯƠNG 5c

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

XÁC SUẤT CỦA BC• Con số đặc trưng cho khả năng xuất hiện của

biến cố trong phép thử gọi là xác suất của biếncố đó.

• Kí hiệu xác suất của bc A: P(A)

• Xác suất không có đơn vị

• Điều kiện:

2

) 0 1

) 0, 1

)

i P A

ii P P

iii P A B P A P B khi AB

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Quan điểm tần suất

• Thực hành 3 bước:

• Thực hiện phép thử với số lần n, rất lớn

• Đếm số lần biến cố A xuất hiện, giả sử n(A)

• Xác suất của bc A là:

3

limn

n AP A

n

Page 2: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

2

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 1

Người

tung

Số lần

tung

Số lần

sấp

Tần

suất

Buyffon 4040 2048 0,5069

Pearson 12000 6019 0,5016

Pearson 24000 12012 0,5005

4

• Nghiên cứu khả năng xuất hiện mặt sấp khi gieođồng xu cân đối, đồng chất.

• Tần suất dần tới 0.5

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Quan điểm tần suất

5

• Vậy:

• Trên thực tế ta lấy với n đủ lớn.

lim lim nn n

n AP A f A

n

nP A f A

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Quan điểm cổ điển

• Được sử dụng nhiều nhất (trên lớp)

• Nếu các bcsc là đồng khả năng, và hữu hạn bcscthì:

6

𝑃 𝐴 =n(A)

n(Ω)=

Số bcsc thuận lợi cho A

Số bcsc có thể xảy ra

Page 3: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

3

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 2

• Một khách hàng chọn mua một hộp gồm 12 sảnphẩm. Ông ta chọn ngẫu nhiên 3 sản phẩm củahộp để kiểm tra, nếu không có phế phẩm thì sẽmua hộp sản phẩm đó.

• Tính xác suất người đó mua hộp sản phẩm biếtrằng trong hộp có 4 phế phẩm.

7

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 3

• Có 3 khách hàng đi vào ngân hàng có 6 quầyphục vụ. Tính xác suất để:

• A) Cả 3 khách cùng đến một quầy

• B) Mỗi người đến một quầy khác nhau

• C) Hai trong 3 người đến 1 quầy

• D) Chỉ có một khách đến quầy số 1

Xác suất

Thống kê 2016

8

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Nguyên lý xác suất nhỏ - lớn

• Nguyên lý xác suất nhỏ (nguyên lý biến cố hiếm):Nếu một biến cố có xác suất rất nhỏ thì thực tếcó thể xem rằng trong một phép thử biến cố đósẽ không xảy ra.

• Nguyên lý xác suất lớn: Nếu một biến cố có xácsuất rất gần 1 thì thực tế có thể xem rằng biến cốđó sẽ xảy ra trong một phép thử.

9

Page 4: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

4

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Nguyên lý xác suất nhỏ - lớn

• Trong một lớp có 50 sinh viên nhất định có 2 bạncó sinh nhật trùng nhau. Vì biến cố “có ít nhất 2người có cùng sinh nhật” có xác suất rất lớnP(A)= 0,970374.

• Chú ý:

• Việc qui định một mức xác suất đủ nhỏ hay đủlớn tùy thuộc vào từng bài toán cụ thể.

• Thông thường: 0,05 được coi là đủ nhỏ

• Đủ lớn:≥ 0,95.

10

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

BIẾN NGẪU NHIÊN 1 CHIỀU

• Khái niệm

• Hàm khối xác suất

• Bảng phân phối xác suất

• Hàm mật độ xác suất

• Tham số đặc trưng

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Biến ngẫu nhiên

• Biến ngẫu nhiên X là đại lượng nhận giá trị nàođó phụ thuộc vào các yếu tố ngẫu nhiên.

• Ký hiệu: chữ hoa X, Y, Z …

• Giá trị của bnn: chữ thường x, y, z, …

• Với mọi số thực x ta có {X≤x} là một biến cốngẫu nhiên.

12

Page 5: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

5

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 4

• X: Lượng khách vào một cửa hàng trong ngày

• Y: Tuổi thọ của một chiếc điện thoại

• Trả ngẫu nhiên 3 mũ bảo hiểm cho 3 người. GọiZ: số mũ bảo hiểm được trả đúng người

• T: Số sản phẩm hỏng trong 100 sản phẩm mớinhập về

• U: Chiều cao của một sinh viên gọi ngẫu nhiêntrong lớp này

13

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phân loại biến ngẫu nhiên

• Gọi 𝑋 Ω là tập giá trị của bnn X

• Ta phân loại bnn dựa vào 𝑋 Ω

• Bnn rời rạc nếu 𝑋 Ω hữu hạn hoặc vô hạn đếmđược

• Bnn liên tục nếu 𝑋 Ω là một khoảng, một sốkhoảng hay toàn bộ trục số R.

14

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phân loại bnn

15

Rời rạc

Có hữu hạn giá trị

Có vô hạn đếmđược giá trị

Bnn X

Liên tục

Giá trị lấp đầy một hay vài khoảng hữu hạn

hoặc vô hạn

P(X=a)=0 với mọi a

Page 6: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

6

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hai biến ngẫu nhiên độc lập

• Hai biến ngẫu nhiên X, Y độc lập nếu hai biếncố:

• Độc lập nhau với mọi giá trị của x, y.

• Nói cách khác mọi biến cố liên quan đến haibiến ngẫu nhiên X, Y luôn độc lập nhau.

16

X x Y y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Bnn Rời rạc - Hàm khối xác suất

• Probability mass function (PMF)

• Tính chất:

17

Xp x P X x

) 0

) 1

)

X

X

x

X

x A

i p x

ii p x

iii P A p x

• Dạng bảng

• Dạng đồ thị

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Bnn Rời rạc - Bảng ppxs

• Bảng phân phối xác suất của X.

• xi : giá trị có thể có của bnn X

• pi : xác suất tương ứng;

• Chú ý:

18

X x1 …. x2 …. xn

P p1 …. p2 …. pn

1

1n

i

i

p

( ) ( )i X i ip p x P X x

Page 7: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

7

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Bnn Rời rạc - Hàm phân phối xác suất

• Hàm phân phối xác suất được xác định như sau:

19

1

1 1 2

1 2 2 3

1 1 1

0 ,

,

,

............................................

... ,

X

k k k

x x

p x x x

F x p p x x x

p p x x x

k

X X k

x x

F x P X x p x

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 5

Xét phép thử tung hai đồng xu phân biệt.

Không gian mẫu là: Ω = {𝑆𝑆; 𝑆𝑁;𝑁𝑆;𝑁𝑁}

Gọi X là số lần mặt sấp xuất hiện, X là bnn rời rạc.

Hàm khối xác suất:

20

1/ 4 ; 0 2

1/ 2 ; 1

0 ; 0; 1; 2

X

x x

p x x

x

hay

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 5

• Hàm phân phối xác suất:

21

X 0 1 2

P 1/4 1/2 1/4

0 , 0

1/ 4 ,0 1

3 / 4 ,1 2

1 ,2

X

x

xF x

x

x

Page 8: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

8

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 6

• Một hộp có 10 sản phẩm trong đó có 6 sảnphẩm đạt loại A. Lấy ngẫu nhiên 2 sản phẩm.

• Lập bảng phân phối xác suất của số sản phẩmloại A lấy ra?

• Xác định PMF, CDF?

22

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Biến ngẫu nhiên liên tục

• Cho X là bnn liên tục

• Chú ý:

• Để thể hiện xác suất ta sử dụng mật độ xác suất

23

0)

)

( ) ,X a a

ii P a X b P a X b P X b P a X b

i P

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tính chất

iv) Tại những điểm mà f(x) liên tục ta có:

24

) 0

) 1

)

b

a

i f x x R

ii f x dx

iii P a X b f x dx P a X b

'F x f x

Page 9: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

9

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hàm mật độ xác suất

25

) 0 ,

) 1

i f x x R

ii f x dx

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 10

• Cho lợi nhuận của một công ty (%/ngày) là mộtbnn X liên tục có đồ thị của hàm mật độ y=f(x)đối xứng qua trục tung như hình bên.

26

10 100

y

y f x

x

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 10

a) Cho =5%. Hãy tính giá trịtới hạn x và nêu ý nghĩacủa giá trị tới hạn này (cónghĩa P(X x)= )

27

10 100

y

y f x

x

b) VaR1- là một giá trị được định nghĩa là mứcchịu đựng lỗ của công ty. Có nghĩa là xác suấtcông ty sẽ lỗ một khoảng lớn hơn hay bằng

VaR1- là . Hãy tính VaR95%?

Page 10: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

10

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

CÁC THAM SỐ ĐẶC TRƯNG

• Kỳ vọng (Expected Value) E(X)

• Phương sai (Variance) V(X), Var(X)

• Độ lệch chuẩn (Standard Error)

• Hệ số biến thiên (Coefficient of Variation) CV

28

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tham số đặc trưng

29

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Kỳ vọng (Expected Value)

• Ký hiệu: E(X), mean, M(X)

• Định nghĩa:

• E(X) là trung bình theo xác suất của X

• Có cùng đơn vị với X

30

i ii

x p x

E X

x f x dx

-

,vôùi X rôøi raïc

. ( ) ,vôùi X lieân tuïc

Page 11: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

11

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

• Tung một cục xúc sắc nhiều lần. Về lâu dài (in along run) giá trị trung bình của những lần tunglà bao nhiêu?

• Giả sử ta có các kết quả tung như sau:

• Thì giá trị trung bình là bao nhiêu.

Ví dụ 14

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Chú ý

• Trong quá trình lâu dài thì mỗi mặt có tỷ lệ xuấthiện là 1/6.

• Giá trị trung bình ở đây là trung bình số học cótrọng số của X (trọng số là tỷ lệ, khả năng xuấthiện)

• Giá trị trung bình của X, ghi là E(X), hay viết tắtlà (đọc là muy)

32

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ý nghĩa kỳ vọng

• Là giá trị trung bình của bnn (trong một quátrình lâu dài); phản ánh giá trị trung tâm củappxs của bnn

• Trong thực tế sản xuất hay kinh doanh, nếu cầnchọn phương án cho năng suất cao ta chọnphương án cho năng suất kì vọng cao

33

Page 12: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

12

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 15

• Một nhân viên bán hàng có 2 cuộc hẹn trong 1ngày. Với cuộc hẹn thứ nhất, khả năng thànhcông (ký được hợp đồng) là 0,7 và lợi nhuận dựkiến là 1000$. Với cuộc hẹn thứ 2, khả năngthành công là 0,4 và lợi nhuận là 1500$. Giả sửkết quả các cuộc hẹn độc lập nhau. Lợi nhuậnkỳ vọng của nhân viên bán hàng là bao nhiêu?

34

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tính chất

35

1)Tính chaát 1: E(C)=C vôùi C laø haèng soá

2)Tính chaát 2: E(C+X)=C+E(X)

3)Tính chaát 3: E(C.X)=C.E(X)

4)Tính chaát 4: E(X Y)=E(X) E(Y)

5)Tính chaát 5: E(X.Y)=E(X).E(Y) neáu X vaø Y ñoäc laäp

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phương sai (Variance)

• Ký hiệu: V(X); Var(X); VX

• Định nghĩa:

• Rút gọn:

36

2

2 2V X E X E X E X

2

2

2

i ii

x p

V X E X E X

x f x dx

,neáu X rôøi raïc.

,neáu X lieân tuïc.

Page 13: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

13

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phương sai (Variance)

• Công thức rút gọn:

• Đơn vị của phương sai trùng với đơn vị của X2

37

22

22

i ii

x p E X

V X

x f x dx E X

,neáu X rôøi raïc.

,neáu X lieân tuïc.

2

2 2V X E X E X E X

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ý nghĩa của phương sai

• Đặc trưng cho độ phân tán của bnn quanh giátrị trung bình

• Đặc trưng cho sai số của thiết bị (trong kỹthuật)

• Đặc trưng cho độ rủi ro của các quyết định(trong kinh tế, kinh doanh)

38

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tính chất của phương sai

39

2

1 1i

1)Tính chaát 1: V(C)=0 vôùi C laø haèng soá

2)Tính chaát 2: V(C+X)=V(X)

3)Tính chaát 3: V(C.X)=C .V(X)

4) neáu X vaø Y ñoäc laäp

neáu caùc X ñoäc laäp toa

V(X Y)=V(X) V(Y)

V = øn phaàn

n n

i ii i

X V X

Page 14: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

14

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 23

• Tiền lãi khi đầu tư 1 tỷ đồng vào các ngành A, B làcác bnn độc lập X, Y:

• Muốn lãi trung bình cao hơn thì đầu tư vào ngànhnào?

• Muốn rủi ro thấp hơn thì đầu tư vào ngành nào?

• Muốn rủi ro thấp nhất thì chia vốn đầu tư theo tỷlệ nào?

40

X 0 15 30

P 0,3 0,5 0,2

Y -2 15 35

P 0,2 0,45 0,35

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Độ lệch chuẩn

• V(X) đo độ dao động, phân tán, đồng đều, tậptrung của X.

• V(X) có đơn vị là bình phương đơn vị của X

• Đặt:

• (X) có đơn vị là đơn vị của X và gọi là độ lệchchuẩn của bnn X.

41

X V X

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

BIẾN NGẪU NHIÊN 2 CHIỀU

• Bảng phân phối xác suất đồng thời

• Các tham số đặc trưng

• Hàm hồi quy

Page 15: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

15

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hàm khối xs đồng thời của (X,Y)

• Ký hiệu: pX,Y(x,y)

• Tính chất:

43

, , ,X Yp x y P X x Y y

,

,

) , 0, ,

) , 1

X Y

X Y

x y

i p x y x y

ii p x y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Bảng ppxs đồng thời của (X,Y)

44

y1 y2 … yj … ym ∑

x1 p11 p12 … p1j … p1m p1●

x2 p21 p22 … p2j … p2m p2●

… … … … … … … …

xi pi1 pi2 … pij … pim pi●

… … … … … … … …

xn pn1 pn2 … pnj … pnm pn●

∑ p●1 p●2 … p●j … p●m 1

YX

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Bảng ppxs đồng thời của (X,Y)

• Trong đó:

45

,

1 1

1 1

) , ,

) 1

) ;

ij X Y i j i j

n m

ij

i j

m n

i ij j ij

j i

i p p x y P X x Y y

ii p

iii p p p p

Page 16: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

16

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 2• Cho biến ngẫu nhiên (X,Y) có bảng phân phối

xác suất:

• Tìm giá trị a

• Tìm luật ppxs của các biến X và Y.

46

1 2 3

1 0,10 a 0,10

2 0,15 0,05 0,35

XY

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ppxs thành phần (phân phối lề)

• Bảng phân phối xác suất của X:

• Bảng phân phối xác suất của Y:

47

X x1 x2 … xn

P p1● p2● … pn●

Y y1 y2 … ym

P p●1 p●2 … p●m

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hai bnn độc lập• Từ định nghĩa, hai biến rời rạc X và Y gọi là độc

lập nếu:

• Dấu hiệu:

• Hai hàng bất kỳ tỷ lệ.

• Hai cột bất kỳ tỷ lệ.

48

,i j i j

ij i j

P X x Y y P X x P Y y

hay p p p

Page 17: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

17

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 4• Phân phối xác suất đồng thời của biến ngẫu

nhiên (X,Y) cho bởi bảng sau:

• Tính P(X=6) và P(X ≥ 7, Y ≥2)

• Lập bảng ppxs thành phần và tính E(X), E(Y).49

1 2 3

6 0,10 0,05 0,15

7 0,05 0,15 0,10

8 0,10 0,20 0,10

XY

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ppxs có điều kiện

• Giả sử bnn 2 chiều (X,Y) có hàm khối xác suất đồngthời và các hàm khối xác suất thành phần:

• PPXS điều kiện của X khi cho Y=y là:

• PPXS điều kiện của Y khi cho X=x là:

50

, , ; ;X Y X Yp x y p x p y

, ,

|X Y

X

Y

p x yp x y

p y

, ,

y | xX Y

Y

X

p x yp

p x

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Kỳ vọng có điều kiện (hồi quy)

• Kỳ vọng có điều kiện của Y khi cho X=x (còn gọi làhồi quy của Y theo X khi X=x)

• Kỳ vọng có điều kiện của X khi cho Y=y (còn gọi làhồi quy của X theo Y khi Y=y)

51

| . |Y

y

E Y X x y p y x

| . |X

x

E X Y y x p x y

Page 18: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

18

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 5• Phân phối xác suất đồng thời của biến ngẫu

nhiên (X,Y) cho bởi bảng sau:

• Lập bảng ppxs của X với đk Y=2. Tính E(X|Y=2)?

• Lập bảng ppxs của Y với đk X=8. Tính E(Y|X=8)?52

1 2 3

6 0,10 0,05 0,15

7 0,05 0,15 0,10

8 0,10 0,20 0,10

XY

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 6a• Lãi suất cổ phiếu tính trên 100 USD khi đầu tư vào hai

ngân hàng A và B trong 1 năm tương ứng X, Y )(đơn vị %)có ppxs đồng thời như sau:

• A) Lập bảng phân phối biên của X, Y. Tính lãi trung bìnhcủa từng ngân hàng.

53

-2 5 10

- 1 0,10 0,05 0

4 0,15 0,20 0,05

8 0,05 0,05 0,35

XY

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 6a

• B) Khi Y=5% tính lãi cổ phần trung bình của X?

• C) X và Y có độc lập nhau không

• D) Lập bảng ppxs của T=X+Y. Tìm E(T), V(T)

54

-2 5 10

- 1 0,10 0,05 0

4 0,15 0,20 0,05

8 0,05 0,05 0,35

XY

Page 19: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

19

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Các tham số đặc trưng của bnn

• Kỳ vọng

• Phương sai

• Hệ số tương quan

• Hiệp phương sai

55

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Kỳ vọng của hàm theo X,Y

• Cho X,Y có phân phối đã biết. Đặt Z=h(X,Y) làbiến mới.

• Ta có:

56

, , ,i j i j

i j

E h X Y h x y P X x Y y

,, , ,X Y

x y

E h X Y h x y p x y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 7• Cho bnn rời rạc X, Y có phân phối xác suất đồng

thời như sau:

• Tìm kỳ vọng của h(X,Y)=X.Y2

57

1 2 3

4 0,10 0,15 0,1

5 0,25 0,20 0,2

X

Y

Page 20: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

20

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 8

• Cho Z=X+Y và bảng ppxs đồng thời sau:

58

(X,Y) (0;0) (0;1) (0;2) (1;0) (1;1) (1;2)

pij 0,1 0,2 0,3 0,05 0,15 0,2

0 0 .0,1 0 1 .0, 2

0 2 .0,3 1 0 .0,05 1 1 .0,15

1 2 .0, 2 1,75

E Z E X Y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hiệp phương sai (Covariance)

• Hiệp phương sai của hai biến ngẫu nhiên X và Y,ký hiệu cov(X,Y), là kỳ vọng toán của tích các sailệch của các bnn đó và kỳ vọng toán của chúng.

59

cov , X YX Y E X Y

cov , X YX Y E XY

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tính chất Covariance 1

60

1) cov , cov ,

2)cov ,

3) cov ', cov , cov ',

4)cov , cov ,

5)cov , cov ,

X Y Y X

X X V X

X X Y X Y X Y

kX Y k X Y

aX c bY d ab X Y

Page 21: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

21

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ 9

61

-2 5 10

- 1 0,10 0,05 0

4 0,15 0,20 0,05

8 0,05 0,05 0,35

XY

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tính chất Covariance 2

62

2

2

2

6) cov , 0,

7) 2cov ,

8)

9) co

2 co

v

,

,

v

.

Neáu X vaø Y ñoäc laäp thì

ngöôïc laïi khoâng chaéc ñuùng.

X Y

V X Y V X

V aX bY a V X b V Y ab X Y

X Y

V Y X

V X V Y

Y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hệ số tương quan

• Hệ số tương quan của hai biến ngẫu nhiên X, Yký hiệu và định nghĩa bởi công thức:

• Hệ số tương quan còn ký hiệu là:

63

,

cov ,X Y

X Y

X Y

, ; ,X Y r X Y

Page 22: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

22

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tính chất

64

,

,

,

,

,

,

) 1 1

) 0.

)

) , 0

1

1

vôùi moïi X, Y.

Neáu X vaø Y ñoäc laäp thì

neáu ab>0

neáu ab<0

khi vaø chæ khi:

neáu a>0

neáu a<0

X Y

X Y

X Y

aX c bY d

X Y

X Y

i

ii

iii

iv Y aX b a

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ý nghĩa

• Hệ số tương quan đo mức độ phụ thuộc tuyếntính giữa X và Y.

• Khi |ρX,Y| càng gần 1 thì mức độ quan hệ tuyếntính càng chặt.

• Khi |ρX,Y| càng gần 0 thì mức độ quan hệ tuyếntính càng yếu.

• Khi ρX,Y = 0 ta nói X và Y không tương quan.

65

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hàm hồi qui của X đối với Y

• Kỳ vọng có điều kiện:

là một hàm theo y, được gọi là hàm hồi quy của Xđối với Y. Đồ thị hàm số trên mặt phẳng tọa độDecartes gọi là đường hồi quy.

Chú ý:

66

E X Y y

1 2, ,..., my y y y

Page 23: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

23

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hàm hồi qui của Y đối với X• Kỳ vọng có điều kiện:

là một hàm theo x, được gọi là hàm hồi quy của Yđối với X.

Đồ thị hàm số gọi là đường hồi quy.

Chú ý:

67

E Y X x

1 2, ,..., nx x x x

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Luật phân phối xác suất

• Chuẩn

• Student

• Khi bình phương

• Fisher

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Lý thuyết mẫu

• Tổng thể và mẫu

• Các tham số và ký hiệu

• Các thống kê và ký hiệu

• Phân phối mẫu

Page 24: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

24

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ước lượng và kiểm định

• Bài toán tổng quát

• Phương pháp ước lượng

• Phương pháp kiểm định giá trị tới hạn

• P value

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

HỒI QUI VÀ TƯƠNG QUAN

CHƯƠNG 5c

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

PHÂN TÍCH TƯƠNG QUAN

• Correlation Analysis

• Dùng để đo độ mạnh của mối quan hệ tuyếntính giữa hai biến ngẫu nhiên

Page 25: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

25

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hiệp phương sai (Covariance)

• Cho hai biến ngẫu nhiên X và Y. Hiệp phương saicủa X và Y, ký hiệu cov(X,Y), là kỳ vọng toán củatích các sai lệch của các bnn đó và kỳ vọng toáncủa chúng.

73

cov , X YX Y E X Y

cov , X YX Y E XY

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hệ số tương quan

• Hệ số tương quan của hai biến ngẫu nhiên X, Yký hiệu và định nghĩa bởi công thức:

• Với hai biến ngẫu nhiên bất kỳ:

74

,

cov ,X Y

X Y

X Y

,1 1X Y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hệ số tương quan mẫu

• Với mẫu ngẫu nhiên cỡ n: (Xi, Yi) i=1,2,…,n. Hệsố tương quan mẫu ký hiệu là rX,Y được xác địnhnhư sau:

1,

2 2

1 1

1,

2 22 2

1 1

.

. .

.

n

i i

iX Y

n n

i i

i i

n

i i

iX Y

n n

i i

i i

x x y y

r

x x y y

x y n x y

r

x nx y ny

Page 26: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

26

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ

• Số liệu về thời gian quảng cáo trên truyền hìnhvà lượng sản phẩm tiêu thụ ở một công ty sảnxuất đồ chơi trẻ em như sau:

• Thời gian: phút/tuần

• Lượng tiêu thụ: 1000sp/tuần

• Hãy tính hệ số tương quan mẫu và cho kết luận

Thời gian 28 37 44 36 47 35 26 29 33 32 31 28

Lượng tiêu thụ 41 32 49 42 38 33 27 24 35 30 34 25

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ

• Đáp số: r=0,63882

• Kết luận: mối liên hệ tương quan giữa thời gianquảng cáo và số sản phẩm tiêu thụ được làtương quan thuận, ở mức trung bình.

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Đánh giá hiệp phương sai

• Cov(X,Y)>0: X và Y có xu hướng thay đổi cùngchiều

• Cov(X,Y)<0: X và Y có xu hướng thay đổi ngượcchiều

• Cov(X,Y)=0: X và Y độc lập (tuyến tính)

Page 27: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

27

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Đánh giá hệ số tương quan

• Miền giá trị:

• Nếu thì tương quan âm. rXY cànggần -1 thì mối liên hệ tuyến tính nghịch giữa X,Y càng mạnh

• Nếu thì tương quan dương. rXY cànggần -1 thì mối liên hệ tuyến tính thuận giữa X, Ycàng mạnh

• rXY càng gần 0 thì quan hệ tuyến tính càng yếu.

,1 1X Yr

,1 0X Yr

,0 1X Yr

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Đánh giá hệ số tương quan

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Kiểm định giả thuyết cho hệ số tương quan

• Ta cần kiểm định giả thuyết H0: không có mốiquan hệ tuyến tính giữa X và Y

• Ta có:

• Tiêu chuẩn kiểm định:

• T có phân phối Student (n-2) bậc tự do

0 : 0H

2

2~ 2

1

nT r t n

r

Page 28: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

28

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Kiểm định hệ số tương quan

• Ta có các bài toán:

• Với mức ý nghĩa 𝛼 cho trước.

0 0 0

1 1 1

: 0 : 0 : 0

: 0 : 0 : 0

H H Ha b c

H H H

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Các bước kiểm định

• Phát biểu giả thuyết H0 và đối thuyết H1

• Xác định mức ý nghĩa 𝛼

• Tính giá trị kiểm định

• So sánh với miền bác bỏ

• Kết luận bác bỏ/không bác bỏ H0

2

2

1qs

nT r

r

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Miền bác bỏ

Đối thuyết Miền bác bỏ P_value

𝐻1: 𝜌 ≠ 0

𝐻1: 𝜌 > 0

𝐻1: 𝜌 < 0

1

/2

nT t

1nT t

1nT t

2 qsp P T T

qsp P T T

qsp P T T

Page 29: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

29

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phân tích hồi quy

• Phân tích hồi quy là tìm quan hệ phụ thuộc của mộtbiến, được gọi là biến phụ thuộc vào một hoặc nhiềubiến khác, được gọi là biến độc lập nhằm mục đíchước lượng hoặc tiên đoán giá trị kỳ vọng của biến phụthuộc khi biết trước giá trị của biến độc lập.

• Một số tên gọi khác của biến phụ thuộc và biến độclập như sau:

• Biến phụ thuộc: biến được giải thích, biến được dựbáo, biến được hồi quy, biến phản ứng, biến nội sinh.

• Biến độc lập: biến giải thích, biến dự báo, biến hồiquy, biến tác nhân hay biến kiểm soát, biến ngoại sinh.

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ

• Ngân hàng XYZ muốn tăng lượng tiền huy động.Ngân hàng này muốn biết mối quan hệ giữalượng tiền gửi và lãi suất tiền gửi, cụ thể hơnhọ muốn biết khi tăng lãi suất thêm 0,1% thìlượng tiền gửi sẽ tăng trung bình là bao nhiêu.

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ

• Công ty dầu ăn Tường An đang xem xét việc giảmgiá bán sản phẩm (bình 5 lít) để tăng lượng hàngbán ra đồng thời quảng bá sản phẩm của mình đếnkhách hàng. Người quản lý của công ty muốn tínhtoán xem nếu sản phẩm này được giảm giá 1000đ/l thì lượng hàng bán ra trung bình sẽ thay đổinhư thế nào.

• Nếu như giảm giá 1000 đ mà lượng hàng bán thêmđược nhiều hơn 50.000 sản phẩm thì công ty sẽtiến hành một chiến dịch khuyến mại trong mộttháng với mức giảm giá 10.000 đ/l

Page 30: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

30

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ

• Để tiến hành nghiên cứu này, phòng marketing củacông ty đã dựa vào số liệu bán hàng trong 15 thángqua (n=15 quan sát) để thu thập số liệu về giá bán P vàlượng bán Q.

• Sau khi tiến hành thống kê mô tả, nghiên cứu viên đãquyết định dùng hàm cầu dạng tuyến tính để xem xétảnh hưởng của giá đến lượng bán.

• Dùng số liệu của mẫu ta được hàm hồi qui mẫu dạng:0 1i i i

Q P

6227 30, 43i iQ P

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Câu hỏi

• Khi giá giảm 1 đơn vị thì lượng bán hàng thayđổi như thế nào?

• Khi giá giảm 1000 đ/l thì lượng bán ra có lớnhơn được 50.000 sản phẩm như công ty mongmuốn không

• Giá bán quyết định bao nhiêu % trong thay đổilượng bán

• Nếu giá bán là 150.000 đồng/bình thì lượngbán dự báo là bao nhiêu

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phân tích hồi quy

• Phân tích hồi quy được sử dụng để xác địnhmối liên hệ giữa:

– Một biến phụ thuộc Y (biến được giải thích)

– Một hay nhiều biến độc lập X1, X2, …,Xn (còn đượcgọi là biến giải thích)

• Biến phụ thuộc Y phải là biến liên tục

• Các biến độc lập X1, X2, …, Xn có thể là biến liêntục, rời rạc hay phân loại.

Page 31: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

31

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hàm hồi quy tổng thể• Hàm hồi quy tổng thể

• Đối với một quan sát cụ thể ta có:

• Mô hình chỉ có một biến phụ thuộc Y và một biến giảithích X.

• 𝛽1 và 𝛽2 gọi là hệ số chặn (intercept) và hệ số góc(slope) của đường thẳng hồi quy.

1 2

1 2

|i

E Y X X X

Y X

1 2i i iY X

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Đường hồi quy tổng thể

Hàm hồi quy tổng thể

Y= Xi

0

100

200

300

400

500

600

700

0 100 200 300 400 500 600 700 800 900

Thu nhập khả dụng, X (XD)

Tiê

u d

ùn

g,

Y (

XD

)

Xi

E(Y/Xi)= 1 + 2Xi

Yi= 1 + 2Xi + i

i

Y = E(Y/Xi)

Yi

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hàm hồi quy mẫu SRF

• Ta ít khi có số liệu của cả tổng thể mà chỉ có sốliệu của mẫu (số liệu quan sát được)

• Ta dùng số liệu mẫu để ước lượng tổng thể

• Hàm hồi quy mẫu:

• Đối với quan sát thứ i:

1 2i iY X

1 2i i iY X e

Page 32: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

32

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Y

X

94

1

2

1

PRF2

SRF

Hệ số hồi quy trong hàm hồi quy PRF và SRF

PRF và SRF

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

PRF và SRF

Trong đó

• 𝛽1 là ước lượng cho 1.

• 𝛽2 là ước lượng cho 2.

• 𝑌𝑖 là ước lượng cho Y hay E(Y|Xi)

• Ta sử dụng phương pháp bình phương nhỏnhất thông thường (OLS) để tìm 𝛽1; 𝛽2

95

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phương pháp OLS• Từ hàm hồi quy mẫu ta có:

• Tổng bình phương sai số (Sum of squares for Errors– SSE) hay tổng bình phương thặng dư cho n điểmdữ liệu :

• Nội dung của phương pháp bình phương bé nhất làtìm các ước lượng sao cho SSE đạt giá trị bé nhất.

1 2ii i i ie y y y x

2

21 2

1 1

n n

i i ii i

SSE e y x

Page 33: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

33

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phương pháp OLS

• Ta lấy đạo hàm theo biến 𝛽1 ; 𝛽2ta có:

1 211

1 212

2 0

2 0

n

i ii

n

i i ii

SSEy x

SSEy x x

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phương pháp OLS

• Ta được hệ phương trình sau:

1 2 1 21 1 1

21 2 1 2

1 1 1 1

2

1

1 2 1 2

2 21 2 1 2

0 0

0 0

. .

0

. 0

n n n

i i i ii i in n n n

i i i i i i ii i i i

y x y n x

y x x x y x x

x y x xy

ny n n x x y

n xy n x n x x x xy

22

2 22

.

x x

xy x y

x x

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Phương pháp OLS

• Để thuận tiện ta ký hiệu như sau:

• Ta có:

2

12

1 1

1 1

1 1

n

in ni

xx i ii i

n n

i in ni i

xy i i i ii i

x

S x x xn

x y

S x x y y x yn

2 1 2xy

xx

Sy x

S

Page 34: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

34

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ

• Quan sát sự biến động của nhu cầu gạo Y(tấn/tháng) vào đơn giá X (ngàn đồng/kg) tađược các số liệu cho ở bảng. Hãy lập mô hìnhhôi quy mẫu biễu diễn mối phụ thuộc về nhucầu vào đơn giá gạo

Xi 1 4 2 5 5 7

Yi 10 6 9 5 4 2

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ

• Ta lập bảng sau:

• Ta có:

Stt Xi Yi XiYi X 2

1 1 10 10 1

2 4 6 24 16

3 2 9 18 4

4 5 5 25 25

5 5 4 20 25

6 7 2 14 49

sum 24 36 111 120

24 364 6

6 6X Y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ• Ta có:

12 2

2 2

1

. .111 6.4.6ˆ 1,375120 6.(4)

.( )

n

i i

i

n

i

i

Y X n X Y

X n X

1 2ˆ ˆ 6 ( 1,375).4 11,5Y X

ii XY .375,15,11ˆ

Page 35: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

35

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ví dụ

• Nhận xét:

• X và Y có quan hệ nghịch biến

• 𝛽1 = 11,5 nên nhu cầu tối đa là 11,5 tấn/tháng

• 𝛽2 = −1,375 nên khi giá tăng 1000 đồng/kg thì

nhu cầu trung bình sẽ giảm 1,375 tấn/tháng với

các yếu tố khác trên thị trường không đổi.

ii XY .375,15,11ˆ

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 104

Giải hồi quy bằng máy tính

1. Bật tần số: Shift+Mode+↓ +4+1 (Freq On2. Chọn Mode Regression: Mode+3+2(chọn

A+Bx)3. Nhập dữ liệu theo cột4. Kiểm tra và nhấn AC thoát5. Xem kết quả: Shift +1+ 3,4,5 (tùy theo Sum,

Var hay Reg)

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 105

Bài tập 1

Thu thập số liệu về điểm học tập của học sinh vàmức thu nhập hàng năm của bố mẹ ta có bảng sốliệu sau:

Hãy tìm hàm hồi quy mẫu và tính các đặc trưngcủa nóXi: thu nhập (triệu/năm)Yi: điểm trung bình

Xi 45 60 30 90 75 45 105 60

Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5

Page 36: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

36

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ước lượng OLS

• Các ước lượng 𝛽1 ; 𝛽2 tìm được gọi là các ướclượng bình phương tối thiểu

• Đường thẳng 𝑦 = 𝛽1 + 𝛽2𝑥 gọi là các ướclượng bình phương tối thiểu.

• Gọi giá trị quan sát trung bình của y và trungbình của x là:

• Ứng với xi ta gọi yi là giá trị quan sát thực tế và

• 𝑦𝑖 là giá trị ước lượng theo đường hồi quy mẫu

,y x

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ước lượng OLS

• Từ hàm hồi quy mẫu:

• Đặt:

Ta có:

ei là sự khác biệt giữa giá trị thực tế yi

và giá trị dự đoán 𝒚𝒊 theo phương trình hồi quytuyến tính SRF

1 2ii i i ie y y y x

1 2i i iY X e

1 2i iY X

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ước lượng OLS

• Một số tính chất:

• A) Tổng bình phương sai số đạt giá trị nhỏ nhất

• B) Tổng các giá trị thặng dư triệt tiêu.

• SE: Sum of Errors

2

1

n

iii

SSE y y

1 1

0n n

ii ii i

SE y y e

Page 37: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

37

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tính chất đường hồi quy mẫu SRF

• Ứng với một mẫu cho trước thì các hệ số 𝛽1 ; 𝛽2 được xác định duy nhất

• Đường hồi quy mẫu SRF đi qua điểm có tọa độgiá trị trung bình

• Giá trị trung bình của các ước lượng 𝑌𝑖 bằng giátrị trung bình các quan sát 𝑌i

;x y

1 1

1 1n n

i ii i

Y Yn n

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tính chất đường hồi quy mẫu SRF

• Giá trị trung bình của các phần dư ei bằng 0

• Các phần dư ei và 𝑌𝑖 không tương quan

• Các phần dư ei và Xi không tương quan

1

0n

ii

e

1

. 0n

i ii

e X

1

. 0n

i ii

e Y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Các tổng bình phương độ lệch• Ta có:

• Mà

• Nên ta có:

222

1 1 1 1

2

ii i i

n n n n

i ii i i i ii i i i

y y y y y y

y y y y y y y y y y

1

0n

i i ii

y y y y

222

1 1 1

n n n

ii i ii i i

y y y y y y

Page 38: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

38

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Đo sự biến thiên của dữ liệu a• Tổng bình phương toàn phần (Total Sum of Squares)

• Tổng bình phương hồi quy (Regression Sum ofSquares)

• Tổng bình phương sai số (Error Sum of Squares)2

1

n

iii

ESS y y

2

1

n

iii

TSS y y

2

1

n

i ii

RSS y y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Đo sự biến thiên của dữ liệu b• Tổng bình phương toàn phần (Total Sum of Squares)

• Explained Sum of Squares - Bình phương sai số đượcgiải thích

• Tổng bình phương sai số (Residual Sum of Squares)

2

1

n

iii

SSE y y

2

1

n

iii

SST y y

2

1

n

i ii

SSR y y

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Ý nghĩa các độ đo

• SST: đo sự biến thiên của các giá trị 𝑦𝑖 xungquanh giá trị trung tâm của dữ liệu 𝑦𝑖

• SSR: giải thích sự biến thiên liên quan đến mốiquan hệ tuyến tính của X và Y

• SSE: giải thích sự biến thiên của các nhân tốkhác (không liên quan đến mối quan hệ tuyếntính của X và Y)

Page 39: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

39

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

ESS Tổng

chênh lệch

115

RSS

SRF

TSS

Y

X

Yi

Xi

iY

Ý nghĩa hình học của TSS, RSS và ESS

Các tổng bình phương độ lệch

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hệ số xác định• Coefficient of determination

• Là tỷ lệ của tổng sự biến thiên trong biến phụthuộc gây ra bởi sự biến thiên của các biến độclập (biến giải thích) so với tổng sự biến thiêntoàn phần.

• Tên gọi: R_bình phương (R squared)

• Ký hiệu:

• Dễ thấy:

2 SSRR

SST

20 1R

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hệ số xác định

• Hệ số xác định của một mô hình hồi quy chophép ta đánh giá mô hình tìm được có giải thíchtốt cho mối liên hệ giữa biến phụ thuộc Y vàbiến độc lập X hay không

Page 40: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

40

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Tính chất của hệ số xác định R2

118

• 0≤ R2≤1

• Cho biết % sự biến động của Y được giải thích bởicác biến số X trong mô hình.

• R2 =1: đường hồi quy phù hợp hoàn hảo

• R2 =0: X và Y không có quan hệ

• Nhược điểm: R2 tăng khi số biến X đưa vào mô hìnhtăng, dù biến đưa vào không có ý nghĩa.

• => Sử dụng R2 điều chỉnh (adjusted R2 -R2) để quyếtđịnh đưa thêm biến vào mô hình.

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hệ số xác định điều chỉnhR2

kn

n)R(R

111 2

2

• Khi k > 1, R2 < R2.

• Do vậy, khi số biến X tăng,R2 sẽ tăng ít hơn R2.

• Khi đưa thêm biến vào mô hình mà làm choR2

tăng thì nên đưa biến vào và ngược lại.

119

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hệ số xác định

Page 41: MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ · 17/05/2017 1 Bài giảngToán Cao cấp1 NguyễnVănTiến MỘT SỐ KIẾN THỨC VỀ XÁC SUẤT THỐNG KÊ HƯƠNG5c

17/05/2017

41

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hệ số xác định

Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến

Hệ số xác định