xác suất và thống kê (tóm tắt)

12

Click here to load reader

Upload: kinh-nguyen

Post on 24-Jun-2015

714 views

Category:

Education


3 download

DESCRIPTION

Update 19/01 (Hypergeometric và so sánh phương sai)

TRANSCRIPT

Page 1: Xác suất và thống kê (tóm tắt)

Tóm tắt xác suất và thống kê cơ bản

Kinh [email protected]

Sửa một số lỗi đánh máy (Hypergeometric, t-test)

Ngày 20 tháng 1 năm 2013

Mục lục

Chương 1. Các phép toán liên quan 1

Chương 2. Thống kê mô tả 3

Chương 3. Xác suất 3

Chương 4. Phân phối đơn biến 3

Chương 5. Phân phối đa biến 7

Chương 6. Khoảng tin cậy 9

Chương 7. Kiểm định giả thuyết 10

Chương 1. Các phép toán liên quan

Đạo hàm

• (u+ v)′ = u′ + v′ (uv)′ = u′v + v′u (uv ) = u′v−v′uv2

• (ku)′ = ku′ ( ku )′ = −k( u′

u2 )

• (xa)′ = axa−1 (ua)′ = aua−1u′

• (√x)′ = 1

2√x

(√u)′ = u′

2√u

• ( 1x )′ = − 1

x2 ( 1u )′ = − u′

u2

• (ex)′ = ex (eu)′ = u′eu (ax)′ = axlna (au)′ = u′aulna

• (lnx)′ = 1x (lnu)′ = u′

u (logax)′ = 1xlna (logau)′ = u′

ulna

•(ax+ b

cx+ d

)′=

ad− bc(cx+ d)2

(ax2 + bx+ c

ex+ f

)′=aex2 + 2afx+ (bf − ce)

(ex+ f)2

•(a1x

2 + b1x+ c1a2x2 + b2x+ c2

)′=

∣∣∣∣a1 b1a2 b2

∣∣∣∣x2 + 2

∣∣∣∣a1 c1a2 c2

∣∣∣∣x+

∣∣∣∣b1 c1b2 c2

∣∣∣∣(a2x2 + b2x+ c2)2

1

Page 2: Xác suất và thống kê (tóm tắt)

Đạo hàm cấp cao

• (xm)n = m(m− 1)(m− 2)(m− n+ 1)xm−n nếu m ≥ n

• (xm)n = 0 nếu m < n

• (ekx)n = knekx (ax)n = (lna)nax

• (logax)n = (−1)n−1 (n−1)!lna

1xn (lnx)n = (−1)n−1(n− 1)!x−n

•(

1

ax+ b

)n= (−1)nann!

1

(ax+ b)n+1

Tích phân

•∫kdx = kx

∫xndx =

xn+1

n+ 1

•∫

1x2 = − 1

x

∫1xdx = ln|x|

•∫

1(ax+b)x dx = − 1

a(n−1)(ax+b)n−1

∫1

(ax+b)dx = 1a ln|ax+ b|

•∫exdx = ex

∫e−xdx = −e−x

•∫eax+bdx = 1

aeax+b

∫(ax+ b)ndx = 1

a(ax+b)n+1

n+1

•∫axdx = ax

lna

∫1

x2−1dx = 12 ln

∣∣∣x−1x+1

∣∣∣Cực trị

• Qui tắc 1

1. Tìm TXĐ hàm số

2. Tính f’(x), tìm các điểm f’(x)=0 hoặc KXĐ

3. Lập bảng biến thiên

4. Tìm cực trị

• Qui tắc 2

1. Tìm TXĐ hàm số

2. Giải f’(x)=0, có các nghiệm xi

3. Tính f”(x) và f"(xi)

4. Dựa vào dấu f"(xi) tìm cực trịf"(xi) <0 f(x) cực đại tại xif"(xi) >0 f(x) cực tiểu tại xi

Dãy Taylor’s

• ex =∑+∞

0xn

n! =[1 + x+ x2

2! + x3

3! + ...]

• e−x =∑+∞

0−xnn! =

[1− x+ x2

2! −x3

3! + ...]

• 11−x =

∑+∞0 xn =

[1 + x2 + x3 + ...

]• 1

(1−x)2 =∑+∞

0 nxn−1 =[1 + 2x+ 3x2 + 4x3 + ...

]• ln(1− x) = −

∑+∞n=1

xn

n ln(1 + x) = (−1)n+1∑+∞n=1

xn

n

2

Page 3: Xác suất và thống kê (tóm tắt)

• 1−xm+1

1−x =∑mn=0 x

n xm

1−x =∑+∞n=m x

n

•√

1 + x =∑+∞n=0

(−1)n(2n)!(1−2n)n!24nx

n (1 + x)α =∑+∞α=0

n

)xn

Chương 2. Thống kê mô tả

Chebyshev’s: cho mọi phân phối.

• 3/4 trong y ± 2s

• 8/9 trong y ± 3s

• Ít nhất 1− 1k2 nằm trong y ± ks

Khoảng tứ vị

• phương pháp làm tròn l với l = 34 (n+ 1)→ QU = y(l)

• phương pháp Phân tích l = m+ p với p ∈ (0 : 1)→ QU = ym + p(ym+1 − ym)

Chương 3. Xác suất

Cơ bản

P (A ∪B) = P (A) + P (B) nếu riêng rẽP (A ∪B) = P (A) + P (B)− P (A ∩B) nếu liên quanP (Ac) = (1− P (A))

Có điều kiện P (A|B) =P (A ∩B)

P (B)

Tổng xác suất P (E) =∑ki=1 P (E|Ai)P (Ai)

Bayes P (E|Ai) =P (E ∩Ai)P (E)

=P (E|Ai)P (Ai)∑ki=1 P (E|Ai)P (Ai)

• Ứng dụng BayesGiá trị tiên đoán dương P (D+|T+) =P (T+|D+)P (D+)

P (T+|D+)P (D+) + (1− P (T−|D−))(1− P (D+))

Xác xuất độc lập khi P (A|B) = P (A) hay P (A1 ∩ ... ∩Ai) = P (A1)...P (Ai)

Luật đếm

• Luật nhân Chọn mẫu k đối tượng từ nhiều tập hợp=n1...nk

• Chỉnh hợp Pnk = N !(N−k)!

• Parition có N đối tượng, chia thành k tập hợp, số cách= N !n1!..nk! với n1 + ...+ nk = N

• Tổ hợp(N

k

)=

N !

k!(N − k)!

Chương 4. Phân phối đơn biến

Cơ bản

• Phân phối xác suất biến rời rạc

p(y) = P (Y = y) với p(y) ∈ [0; 1]∀y và∑∀y p(y) = 1

3

Page 4: Xác suất và thống kê (tóm tắt)

• Hàm mật độ xác suất biến liên tục f(y) ≥ 0 và∫ +∞−∞ f(t)dt = 1

• Hàm phân phối tích lũy-CDF F (y0) = P (Y ≤ y0),−∞ < y0 < +∞F (−∞) = limx→−∞ = 0, F (+∞) = limx→+∞ = 1

P (a < Y ≤ b) = F (b)− F (a) =∫ baf(y)dy

• Vọng trị E[Y ] = µ

với biến rời rạc E[Y ] =∑ally yp(y)

với biến liên tục E[Y ] =∫ +∞−∞ yf(y)dy

E[c]=C

E[cY]=cE[Y]

E[g1(y) + g2(y)...] = E[g1(y)] + E[g2y] + ...

k-th moment

g(y) = yk → µ′

k = E[Y k], k = 1, 2, 3... với k = 1, E[Y 1] = µ= trung bình dân số

g(y) = (y − µ)k → µk = E[(Y − µ)k], k = 1, 2, 3...với k = 2, E[(Y − µ)2] = E[Y 2]− E[Y ]2= phương sai dân số

Hàm tạo moment với g(y) = ety ta có hàm tạo moment m(t) = E[etY ]Dùng khai triển Taylor và đạo hàm 1 bậc cho t=0 ta có d

dtm(t)|t=0 = µ′

1

⇒nếu m(t) tồn tại ta có moment thứ k = µ′

k = dk

dtkm(t)|t=0

Phân phối biến rời rạc

• Suy biến degenerate p(y) =

{1 y=x0

0 else

µ = E[X] = x0

σ2 = E[X2]− E[X]2 = 0

• Discrete Uniform p(y) = 1n , y = xi, i = 1, 2, 3..., n

µ = (n+1)2

σ2 = (n2−1)2

• Bernoulli p(y) = pyq1−y, y = 0, 1.

µ = p

σ2 = pq

• Binomial trong n lần thử Bernoulli, bao nhiêu lần thành công X ∼ B(n, p); p(y) =(ny

)pyqn−y, y =

0, 1, .., n

µ = np

σ2 = npq

Tổng các biến ∼ B(ni, p) ∼ B(∑ni, p)

• Multinomial với n lần thử độc lập, mỗi lần có thể có k kết cuộc, xác suất p1, p2..., pk là khôngđổi mỗi lần thử và tổng là 100%, với y1, y2, ..., yk là tần số kết cuộc xảy ra của mỗi nhóm, ta có

p(y1, y2...yk) =n!

y1!y2!...yk!py11 p

y22 ...p

ykk , y1 + y2 + ...+ yk = n

µ = npi

σ2 = npi(1− pi)

4

Page 5: Xác suất và thống kê (tóm tắt)

• Negative Binomial số lần thử để có thành công thứ r p(y) =(y−1r−1

)prqy−r y = r, r + 1, ...

µ = rp

σ2 = rqp2

• Geometric số lần thử để có thành công thứ I, hay -Binomial với r=1 p(y) = pqy−1 y = 1, 2, ...

µ = 1p

σ2 = qp2

• Hypergeometric Y ∼ H(N, r, n) p(y) =

(ry

)(N−rn−y

)(Nn

) với N dân số, n mẫu, r thành công dân số,

y thành công mẫu.

µ = nrN

σ2 = N−nN−1n

rN (1− r

N )

H(N, r, n) ≈ B(n, rN ) nếu nN ≤ 0.05

• Poisson X ∼ Po(λ) p(y) = e−λλy

y!y = 1, 2, 3..

µ = λ

σ2 = λ

Tổng các biến Poisson ∼ p(∑λ)

Nếu Xt là số sự kiện xảy ra trong thời khoảng [0, t] t > 0 ta có Xt ∼ Po(λt)Xem thêm Taylor series

X ∼ B(n, p) ≈ Po(np) nếu np ≤ 7

Công ty bảo hiểm, xác suất cháy năm tới

Phân phối biến liên tục

• Uniform Y ∼ U [a, b] nếu f(y) =

{1b−a a ≤ y ≤ b0 elsewhere

µ = a+b2

σ2 = (b−a)2

12

average waiting time Bus stop

• Normal Y ∼ N(µ, σ2) f(y) = 1σ√

2πe−

(y−µ)2

2σ2

µ = µ

σ2 = σ2

N(0,1) = φ(x) với Φ(−x) = 1− Φ(x)

P (X ≤ x) = Φ(x−µσ )

Nếu X ∼ N(µ, σ2) thì Z = X−µσ ∼ N(0, 1)

IQR/s ≈ 1.3

• Gamma f(y) =

yα−1e−yβ

βαΓ(α)y > 0

0 else

Γ(α) =∫ +∞

0e−uuα−1du

µ = αβ

σ2 = αβ2

5

Page 6: Xác suất và thống kê (tóm tắt)

• Chi-square Y ∼ χ2(ν) nếu f(y) =

1

Γ(ν2 )2ν2 y

ν2−1e−

y2

y > 0

0 else

µ = ν

σ2 = 2ν

là Gamma với α = ν2 và β = 2

Tổng bình phương n biến phân phối chuẩn ∼ χ2(n)

Tổng các biến ∼ χ2(ni) ∼ χ2(∑ni)

• Exponential Y ∼ Exp(λ) nếu f(y) =

{λe−λy y > 00 else

µ = 1λ

σ2 = 1λ2

Lưu ý có thể viết dạng λ = 1β

Là Gamma với α = 1, β = 1λ

No memory P (X > x0 + x|X > x0) = P (X > x)

Liên hệ với Poisson nếu X là số sự kiện trong [0,t] thì X ∼ Po(θt), nếu Y là thời gian chođến khi sự kiện đầu tiên xảy ra thì Y ∼ Exp(θ) vì P (Y > t) = P (X = 0)

• Weibull f(y) =

{αβ y

α−1e−yα

β y > 0

0 else

µ = β1αΓ(α+1

α )

σ2 = β2α [Γ(α+2

α )− Γ2(α+1α )]

là Exponential nếu α = 1

• Beta f(y) =

{yα−1(1−y)β−1

B(α,β) y > 0

0 elsevới B(α, β) =

∫ 1

0yα−1(1− y)β−1dy = Γ(α)Γ(β)

Γ(α+β)

µ = αα+β

σ2 = αβ(α+β)2(α+β+1)

• Student’s T Y ∼ t(ν) nếu f(y) =Γ( ν+1

2 )

Γ( ν2 )1√νπ

(1 + y2

ν )−ν+12

µ = 0

σ2 = νν−2 , ν > 2

*nếu X1 ∼ N(0, 1) và X2 ∼ χ2(ν) thì Y = X1√X2ν

∼ t(ν)

nếu X ∼ t(ν)→ φ(x) = 1√2πe−

x2

2

• F Y ∼ F (ν1, ν2) khi f(y) =

{Γ(ν1+ν2

2 )

Γ(ν12 )Γ(

ν22 )

(ν1ν2 )ν12 y

ν12 −1(1 + ν1

ν2y)−

ν1+ν22 y > 0

0 else

µ = ν2ν2−2 , ν2 > 2

σ2 =2ν2

2 (ν1+ν2−2)ν1(ν2−4)(ν2−2)2 , ν2 > 4

Nếu X1 ∼ χ2(ν1), X2 ∼ χ2(ν2) thì Y =X1ν1X2ν2

∼ F (ν1, ν2)

với Y1 ∼ F (ν1, ν2), Y2 ∼ F (ν2, ν1) ta có FY1 = P (Y1 ≤ y) = 1− P (Y2 ≤ 1y ) = 1− FY2( 1

y )

6

Page 7: Xác suất và thống kê (tóm tắt)

Chương 5. Phân phối đa biến

Đúng cho trường hợp nhiều hơn 2 biến, các nội dung sau lấy điển hình 2 biến X, Y Joint distributionfunction

• p(x, y) = P (X = x, Y = y)

• 0 ≤ p(x, y) ≤ 1

•∑x

∑y p(x, y) = 1

Joint probability density function

• f(x, y) ≥ 0

•∫ +∞−∞

∫ +∞−∞ f(x, y)dxdy = 1

• P (a ≤ X ≤ b, c ≤ Y ≤ d) =∫ dc

∫ baf(x, y)dxdy

Marginal distribution một tập con của joint distribution, tìm JDF của 1 hoặc nhóm các biến ta thaytất cả các biến không thuộc tập này với +∞

• với 2 biến x,y với hàm liên kết là p(x, y) = P (X = x, Y = y), xác suất biên của X làp1(x) = P (X = x) =

∑y p(x, y) =

∑y P (X = x, Y = y) =

∑y P (X = x|Y = y)P (Y = y), tương

tự cho P2(y)

• f1(x) =∫ +∞−∞ f(x, y)dy, tương tự cho f2(y)

Phân phối có điều kiện

• p1(x|y) = P (X = x|Y = y) = P (X=x,Y=y)P (Y=y) = p(x,y)

p2(y)

p2(y|x) = P (Y = y|X = x) = P (X=x,Y=y)P (X=x) = p(x,y)

p1(x)

⇒ p(x, y) = p1(x|y)p2(y) = p2(y|x)p1(x)

• f1(x|y) = f(x,y)f2(y) f2(y|x) = f(x,y)

f1(x)

Độc lập

khi

• p(x, y) = p1(x)p2(y)

• f(x, y) = f1(x)f2(y)

Vọng trị

• E[g(x, y)] =

{ ∑x

∑y g(x, y)p(x, y)∫ +∞

−∞∫ +∞−∞ g(x, y)f(x, y)dxdy

• E[c]=c; E[cg(x,y)]=cE[g(x,y)], Vọng trị của tổng = tổng các vọng trị

• Nếu g(X,Y)=g1(X) thì E[g(X,Y )] = E[g1(X)]

• E[g(X1, X2, ..., Xn)] = E[g1(X1)]E[g2(X2)]...E[gn(Xn)] nếu X1, .., Xn độc lập

7

Page 8: Xác suất và thống kê (tóm tắt)

Tương quan và hiệp phương sai

• Với X, Y là 2 biến ngẫu nhiên với g(x, y) = (x− E[X])(y − E[Y ]) ta cóE[g(X,Y)]= E[XY]-E[X]E[Y] =Cov(X,Y)

• |Cov(X,Y )| ≤√V ar(X)V ar(Y ), = khi Y=cX

• X,Y độc lập thì Cov(X,Y)=0, không áp dụng chiều ngược lại

• −1 ≤ ρ = Cov(X,Y )√V ar(X)V ar(Y )

≤ 1

Hàm phân phối đa biến

• biết X,Y,...tìm W=f(X,Y,...) bằng CDF, vd: có f(y) tìm g(w) khi W=Y 2, ta cóG(w) = P (W ≤ w) = P (Y 2 ≤ w) chuyền về f(y) để tính rồi lấy đạo hàm để có g(w). ...

Hàm tuyến tính

• Với X1, ..., Xn ngẫu nhiên và a1, ..., an hằng số thì a1X1 + ...+ anXn là hàm tuyến tính

• E[∑ni=1 aiXi] = aiE[

∑ni=1Xi]

• Var (∑ni=1 aiXi) =

∑ni=1 a

2iV ar(Xi) + 2

∑∑1≤i<j≤n aiajCov(Xi, Xj) nếu Xi độc lập thì Cov=0.

Phân phối chọn mẫu

• SE = sd√n

• Phân phối chọn mẫu của trung bình mẫu Y = 1n

∑ni=1 Yi, hàm tuyến tính nên

E[Y ] = 1n

∑ni=1E[Yi] = nµ

n = µ và

V ar(Y ) = 1n2

∑ni=1 V ar[Yi] = nσ2

n2 = σ2

n

•∑ni=1 aiXi ∼ N(

∑ni=1 aiµi,

∑ni=1 a

2iσ

2)

• Xi ∼ N(µ, σ1) và độc lập ta có

X ∼ N(µ, σ2

n )

(n−1)S2

σ2 ∼ χ2(n− 1)

Thuyết giới hạn trung tâm

Với X1, .., Xn độc lập từ dân số có E[X]=µ và phương sai V ar(X) = σ2, khi n→ +∞ ta có

• X−µ√σ2/n

→ N(0, 1)

• Với n ≥ 25 thì X ≈ N(µ, σ2

n )

Với Xi, ..., Xn độc lập và ∼ Bernoulli ta có

• E[X] = p và V ar(X) = p(1−p)n

• X−p√p(1−p)n

→ N(0, 1) =∑ni=1Xi−np√np(1−p)

(nhân tử và mẫu cho n*), nếu n lớn ta có

•∑ni=1Xi ≈ N(np, np(1− p)) mà

∑ni=1Xi ∼ B(n, p)

• X ∼ B(n, p) ≈ N(np, np(1− p)) np&n(1− p) ≥ 4 xấp xỉ rời rạc bằng liên tục

• Hiệu chỉnh tính liên tục (Continuity correction) nếu X ∼ B(n, p);Y ∼ N(np, np(1− p))⇒ P (X = x) ≈ P (x− 1

2 ≤ Y ≤ x+ 12 )

8

Page 9: Xác suất và thống kê (tóm tắt)

Chương 6. Khoảng tin cậy

Unbiased estimator E[θ] = θ, vd Y = E[Y ] = µ

Bias b(θ) = E[θ]− θMVUE -minimum variance unbiased estimator, Y là MVUE cho µ với V ar(Y ) = σ2

n

Mean squared error E[(θ − θ)2] = V (θ) + b2(θ)

Các phương pháp ước lượng

• Phương pháp moment tính các ước lượng tố moment θ1, ...θk của phân phối bằng

E[Y ] = 1n

∑ni=1 y

1i vd=λ = y với Poisson

E[Y k] = 1n

∑ni=1 y

ki

• Phương pháp tối đa xác suất với y1, ..., yn là mẫu của biến Y với hàm p(y, θ)

p(y1, ..., yn, θ) = p(y1, θ)...p(yn, θ) là likelihood function L

Rời rạc với y1, ..., yn có hàm xác suất phụ thuộc vào các tham số θ1, ..., θk thì likelihoodfuntion của mẫu là L(θ1, ..., θk) = p(y1)p(y2)...p(yn)

Liên tục với y1, ..., yn có hàm mật độ phụ thuộc vào các tham số θ1, ..., θk thì likelihoodfuntion của mẫu là L(θ1, ..., θk) = f(y1)f(y2)...f(yn)

maximum likelihood estimator θ1, ..., θk là giá trị θ1, ..., θk sao cho hàm L đạt cực đại.

tìm cực trị xem chương 1 Lấy ln(L) và tính đạo hàm của ln(L)=0, tính đạo hàm bậc 2 xétdấu.

• Phương pháp bình phương tối thiểu không cần biết phân phối

least squared estimator θ của tham số θ là giá trị mà MSE[(θ − θ)2]

• Jackknife, Robust, Bayes,...

Khoảng tin cậy cho trung bình

• X phân phối bình thường, biết phương sai, trung bình không biết

ta có X−µ√σ2/n

, với a>0 ta có P (−a ≤ X−µ√σ2/n

≤ a) = Φ(a)− Φ(−a),

Φ(a)− Φ(−a) = 1− α→ a = Zα/2

100(1-α)% = X ± zα/2√σ2/n

• X phân phối bình thường, không biết phương sai và trung bình

Ta có

X−µ√σ2

n√(n−1)S2

σ2

n−1

=X − µ√

S2

n

∼ t(n− 1) xem phân phối chọn mẫu

với b>0 và chọn G(b)-G(-b)=1-α⇔ b = tn−1,α2

100(1-α)% = X ± tn−1,α/2

√S2/n

• Không biết phân phối X, cỡ mẫu lớn

Giả định n≥30 ta tính xấp xỉ phân phối chuẩn, theo định lý giới hạn trung tâm

100(1-α)% = X ± zα/2√σ2/n nếu biết phương sai

100(1-α)% = X ± zα/2√S2/n nếu không biết phương sai

9

Page 10: Xác suất và thống kê (tóm tắt)

Khoảng tin cậy cho tỷ lệ

• theo định lý giới hạn trung tâm, với np và n(1-p) ≥ 4 thì P−p√p(1−p)n

≈ N(0, 1)

• 100(1-α)% p= P ± zα/2√

P (1−P )n

Khoảng tin cậy phương sai

• X phân phối bình thường, biết trung bình

ta có Xi−µσ ∼ N(0, 1), i = 1, .., n và

∑ni=1

(Xi−µ)2

σ2 ∼ χ2(n)

Chọn a,b (a<b) sao cho P(a ≤∑ni=1

(Xi−µ)2

σ2 ≤ b) = Gn(b)−Gn(a)

Chọn Gn(a) = 1−Gn(b) = α2

100(1-α)% =

[∑ni=1(Xi − µ)2

χ2n,α/2

;

∑ni=1(Xi − µ)2

χ2n,1−α/2

]• X phân phối bình thường, không biết trung bình

ta có (n−1)S2

σ2 ∼ χ2(n− 1)

100(1-α)% =

[(n− 1)S2

χ2n−1,α/2

;(n− 1)S2

χ2n−1,1−α/2

]

Bootstrap interval

Với y1, ..., yn là mẫu của Y

1. Chọn số lần lấy mẫu lại j

2. Chọn mẫu có hoàn lại n giá trị trong y1, ..., yn

3. Lập lại bước 2 j lần

4. Mỗi lần tính giá trị θ

5. tìm α/2, 1− α/2 của phân phối chọn mẫu

Chương 7. Kiểm định giả thuyết

Trung bình 1 mẫu

• Phân phối bình thường, biết phương sai tương tự như khoảng tin cậy ta chọn thống kê

T = X−µσ√n∼ N(0, 1)

và so với ±zα nếu 1 bên hoặc với ±zα/2 nếu 2 bên.

• Phân phối bình thường, không biết phương sai tương tự như khoảng tin cậy ta chọn thốngkê

T = X−µ√S2

n

∼ t(n− 1)

và so với ±tα nếu 1 bên hoặc với ±tα/2 nếu 2 bên.

• Không biết phân phối, cỡ mẫu lớn tương tự như khoảng tin cậy ta chọn thống kê

T = X−µσ√n≈ N(0, 1) nếu biết phương sai hoặc

T = X−µ√S2

n

≈ N(0, 1) nếu không biết phương sai.

Tương tự, so với ±zα nếu 1 bên hoặc với ±zα/2 nếu 2 bên.

10

Page 11: Xác suất và thống kê (tóm tắt)

Mức độ thống kê quan sát hay p-value

• nếu Ha : µ > µ0 thì p-value=P(T>t)

• nếu Ha : µ < µ0 thì p-value=P(T<t)

• nếu Ha : µ 6= µ0 thì

p-value=2P(T>t) nếu t>0

p-value=2P(T<t) nếu t<0

Tỷ lệ 1 mẫu

Tương tự như khoảng tin cậy, nếu np0 ≥ 4 và n(1− p0) ≥ 4 ta chọn thống kê

• T = P−p0√p0(1−p0)

n

≈ N(0, 1)

Phương sai 1 mẫu

Tương tự như khoảng tin cậy, ta chọn thống kê

• T = (n−1)S2

σ20∼ χ2(n− 1)

Nếu Ha : σ2 6= σ20 vùng bác bỏ là [0, χ2

1−α/2] ∪ [χ2α/2,+∞]

Nếu Ha : σ2 < σ20 vùng bác bỏ là [0, χ2

1−α]

Nếu Ha : σ2 > σ20 vùng bác bỏ là [χ2

α,+∞]

So sánh 2 trung bình

• Bắt cặp trừ 2 nhóm ⇒ µDifferrent=0

CIµD = D ± tα2

√S2D

n

• Độc lập Với mẫu Xi và Yi ta có X ∼ N(µ1;σ21

n1) và Y ∼ N(µ2;

σ22

n2) nên Y −X ∼ N(µ2−µ1;

σ21

n1+σ22

n2)

1. σ21 = σ2

2 = không biết ⇒ T1 =Y − X − |µ2 − µ1|√

S2P ( 1

n1+ 1

n2)∼ t(n1 + n2 − 2)

với Pooled variance= S2P =

(n1 − 1)S21 + (n2 − 1)S2

2

n1 + n2 − 2=∑n1

i=1(Xi − X)2 +∑n2

i=1(Yi − Y )2

n1 + n2 − 2

ta cũng tính được CIµ2−µ1 = Y − X ± tn1+n2−2,

α

2

√S2P ( 1

n1+ 1

n2)

2. σ21 6= σ2

2 và n1, n2 ≥ 30⇒ T2 =Y − X − |µ2 − µ1|√

S21

n1+

S22

n2

∼ N(0, 1)

3. σ21 6= σ2

2 ⇒ T3 = T2 ∼ t(ν) với ν =(S21

n1+

S22

n2)2

(S21n1

)2

n1−1 +(S22n2

)2

n2−1

So sánh 2 tỷ lệ

Xem thêm CI cho P chương 6 và Phân phối Bernoulli và Binomial, nếu (n1, n2)p ≥ 4 và (n1, n2)p ≥ 4thì

T =P2 − P2√

P (1− P )( 1n1

+ 1n2

)' N(0, 1) với Pool Proprtion P =

n1P1 + n2P2

n1 + n2=S1 + S2

n1 + n2

11

Page 12: Xác suất và thống kê (tóm tắt)

So sánh 2 phương sai

Hai chi bình phương chia nhau là F xem phân phối F T =S2

1

S22

=

(n1 − 1)S21

σ21(n1 − 1)

(n2 − 1)S22

σ22(n2 − 1)

∼ F (n1 − 1, n2 − 1) Với

khoảng bác bỏ là [−∞,−Fα2

] ∪ [Fα2,+∞]

12