xác suất và thống kê (tóm tắt)
DESCRIPTION
Update 19/01 (Hypergeometric và so sánh phương sai)TRANSCRIPT
Tóm tắt xác suất và thống kê cơ bản
Kinh [email protected]
Sửa một số lỗi đánh máy (Hypergeometric, t-test)
Ngày 20 tháng 1 năm 2013
Mục lục
Chương 1. Các phép toán liên quan 1
Chương 2. Thống kê mô tả 3
Chương 3. Xác suất 3
Chương 4. Phân phối đơn biến 3
Chương 5. Phân phối đa biến 7
Chương 6. Khoảng tin cậy 9
Chương 7. Kiểm định giả thuyết 10
Chương 1. Các phép toán liên quan
Đạo hàm
• (u+ v)′ = u′ + v′ (uv)′ = u′v + v′u (uv ) = u′v−v′uv2
• (ku)′ = ku′ ( ku )′ = −k( u′
u2 )
• (xa)′ = axa−1 (ua)′ = aua−1u′
• (√x)′ = 1
2√x
(√u)′ = u′
2√u
• ( 1x )′ = − 1
x2 ( 1u )′ = − u′
u2
• (ex)′ = ex (eu)′ = u′eu (ax)′ = axlna (au)′ = u′aulna
• (lnx)′ = 1x (lnu)′ = u′
u (logax)′ = 1xlna (logau)′ = u′
ulna
•(ax+ b
cx+ d
)′=
ad− bc(cx+ d)2
(ax2 + bx+ c
ex+ f
)′=aex2 + 2afx+ (bf − ce)
(ex+ f)2
•(a1x
2 + b1x+ c1a2x2 + b2x+ c2
)′=
∣∣∣∣a1 b1a2 b2
∣∣∣∣x2 + 2
∣∣∣∣a1 c1a2 c2
∣∣∣∣x+
∣∣∣∣b1 c1b2 c2
∣∣∣∣(a2x2 + b2x+ c2)2
1
Đạo hàm cấp cao
• (xm)n = m(m− 1)(m− 2)(m− n+ 1)xm−n nếu m ≥ n
• (xm)n = 0 nếu m < n
• (ekx)n = knekx (ax)n = (lna)nax
• (logax)n = (−1)n−1 (n−1)!lna
1xn (lnx)n = (−1)n−1(n− 1)!x−n
•(
1
ax+ b
)n= (−1)nann!
1
(ax+ b)n+1
Tích phân
•∫kdx = kx
∫xndx =
xn+1
n+ 1
•∫
1x2 = − 1
x
∫1xdx = ln|x|
•∫
1(ax+b)x dx = − 1
a(n−1)(ax+b)n−1
∫1
(ax+b)dx = 1a ln|ax+ b|
•∫exdx = ex
∫e−xdx = −e−x
•∫eax+bdx = 1
aeax+b
∫(ax+ b)ndx = 1
a(ax+b)n+1
n+1
•∫axdx = ax
lna
∫1
x2−1dx = 12 ln
∣∣∣x−1x+1
∣∣∣Cực trị
• Qui tắc 1
1. Tìm TXĐ hàm số
2. Tính f’(x), tìm các điểm f’(x)=0 hoặc KXĐ
3. Lập bảng biến thiên
4. Tìm cực trị
• Qui tắc 2
1. Tìm TXĐ hàm số
2. Giải f’(x)=0, có các nghiệm xi
3. Tính f”(x) và f"(xi)
4. Dựa vào dấu f"(xi) tìm cực trịf"(xi) <0 f(x) cực đại tại xif"(xi) >0 f(x) cực tiểu tại xi
Dãy Taylor’s
• ex =∑+∞
0xn
n! =[1 + x+ x2
2! + x3
3! + ...]
• e−x =∑+∞
0−xnn! =
[1− x+ x2
2! −x3
3! + ...]
• 11−x =
∑+∞0 xn =
[1 + x2 + x3 + ...
]• 1
(1−x)2 =∑+∞
0 nxn−1 =[1 + 2x+ 3x2 + 4x3 + ...
]• ln(1− x) = −
∑+∞n=1
xn
n ln(1 + x) = (−1)n+1∑+∞n=1
xn
n
2
• 1−xm+1
1−x =∑mn=0 x
n xm
1−x =∑+∞n=m x
n
•√
1 + x =∑+∞n=0
(−1)n(2n)!(1−2n)n!24nx
n (1 + x)α =∑+∞α=0
(α
n
)xn
Chương 2. Thống kê mô tả
Chebyshev’s: cho mọi phân phối.
• 3/4 trong y ± 2s
• 8/9 trong y ± 3s
• Ít nhất 1− 1k2 nằm trong y ± ks
Khoảng tứ vị
• phương pháp làm tròn l với l = 34 (n+ 1)→ QU = y(l)
• phương pháp Phân tích l = m+ p với p ∈ (0 : 1)→ QU = ym + p(ym+1 − ym)
Chương 3. Xác suất
Cơ bản
P (A ∪B) = P (A) + P (B) nếu riêng rẽP (A ∪B) = P (A) + P (B)− P (A ∩B) nếu liên quanP (Ac) = (1− P (A))
Có điều kiện P (A|B) =P (A ∩B)
P (B)
Tổng xác suất P (E) =∑ki=1 P (E|Ai)P (Ai)
Bayes P (E|Ai) =P (E ∩Ai)P (E)
=P (E|Ai)P (Ai)∑ki=1 P (E|Ai)P (Ai)
• Ứng dụng BayesGiá trị tiên đoán dương P (D+|T+) =P (T+|D+)P (D+)
P (T+|D+)P (D+) + (1− P (T−|D−))(1− P (D+))
Xác xuất độc lập khi P (A|B) = P (A) hay P (A1 ∩ ... ∩Ai) = P (A1)...P (Ai)
Luật đếm
• Luật nhân Chọn mẫu k đối tượng từ nhiều tập hợp=n1...nk
• Chỉnh hợp Pnk = N !(N−k)!
• Parition có N đối tượng, chia thành k tập hợp, số cách= N !n1!..nk! với n1 + ...+ nk = N
• Tổ hợp(N
k
)=
N !
k!(N − k)!
Chương 4. Phân phối đơn biến
Cơ bản
• Phân phối xác suất biến rời rạc
p(y) = P (Y = y) với p(y) ∈ [0; 1]∀y và∑∀y p(y) = 1
3
• Hàm mật độ xác suất biến liên tục f(y) ≥ 0 và∫ +∞−∞ f(t)dt = 1
• Hàm phân phối tích lũy-CDF F (y0) = P (Y ≤ y0),−∞ < y0 < +∞F (−∞) = limx→−∞ = 0, F (+∞) = limx→+∞ = 1
P (a < Y ≤ b) = F (b)− F (a) =∫ baf(y)dy
• Vọng trị E[Y ] = µ
với biến rời rạc E[Y ] =∑ally yp(y)
với biến liên tục E[Y ] =∫ +∞−∞ yf(y)dy
E[c]=C
E[cY]=cE[Y]
E[g1(y) + g2(y)...] = E[g1(y)] + E[g2y] + ...
k-th moment
g(y) = yk → µ′
k = E[Y k], k = 1, 2, 3... với k = 1, E[Y 1] = µ= trung bình dân số
g(y) = (y − µ)k → µk = E[(Y − µ)k], k = 1, 2, 3...với k = 2, E[(Y − µ)2] = E[Y 2]− E[Y ]2= phương sai dân số
Hàm tạo moment với g(y) = ety ta có hàm tạo moment m(t) = E[etY ]Dùng khai triển Taylor và đạo hàm 1 bậc cho t=0 ta có d
dtm(t)|t=0 = µ′
1
⇒nếu m(t) tồn tại ta có moment thứ k = µ′
k = dk
dtkm(t)|t=0
Phân phối biến rời rạc
• Suy biến degenerate p(y) =
{1 y=x0
0 else
µ = E[X] = x0
σ2 = E[X2]− E[X]2 = 0
• Discrete Uniform p(y) = 1n , y = xi, i = 1, 2, 3..., n
µ = (n+1)2
σ2 = (n2−1)2
• Bernoulli p(y) = pyq1−y, y = 0, 1.
µ = p
σ2 = pq
• Binomial trong n lần thử Bernoulli, bao nhiêu lần thành công X ∼ B(n, p); p(y) =(ny
)pyqn−y, y =
0, 1, .., n
µ = np
σ2 = npq
Tổng các biến ∼ B(ni, p) ∼ B(∑ni, p)
• Multinomial với n lần thử độc lập, mỗi lần có thể có k kết cuộc, xác suất p1, p2..., pk là khôngđổi mỗi lần thử và tổng là 100%, với y1, y2, ..., yk là tần số kết cuộc xảy ra của mỗi nhóm, ta có
p(y1, y2...yk) =n!
y1!y2!...yk!py11 p
y22 ...p
ykk , y1 + y2 + ...+ yk = n
µ = npi
σ2 = npi(1− pi)
4
• Negative Binomial số lần thử để có thành công thứ r p(y) =(y−1r−1
)prqy−r y = r, r + 1, ...
µ = rp
σ2 = rqp2
• Geometric số lần thử để có thành công thứ I, hay -Binomial với r=1 p(y) = pqy−1 y = 1, 2, ...
µ = 1p
σ2 = qp2
• Hypergeometric Y ∼ H(N, r, n) p(y) =
(ry
)(N−rn−y
)(Nn
) với N dân số, n mẫu, r thành công dân số,
y thành công mẫu.
µ = nrN
σ2 = N−nN−1n
rN (1− r
N )
H(N, r, n) ≈ B(n, rN ) nếu nN ≤ 0.05
• Poisson X ∼ Po(λ) p(y) = e−λλy
y!y = 1, 2, 3..
µ = λ
σ2 = λ
Tổng các biến Poisson ∼ p(∑λ)
Nếu Xt là số sự kiện xảy ra trong thời khoảng [0, t] t > 0 ta có Xt ∼ Po(λt)Xem thêm Taylor series
X ∼ B(n, p) ≈ Po(np) nếu np ≤ 7
Công ty bảo hiểm, xác suất cháy năm tới
Phân phối biến liên tục
• Uniform Y ∼ U [a, b] nếu f(y) =
{1b−a a ≤ y ≤ b0 elsewhere
µ = a+b2
σ2 = (b−a)2
12
average waiting time Bus stop
• Normal Y ∼ N(µ, σ2) f(y) = 1σ√
2πe−
(y−µ)2
2σ2
µ = µ
σ2 = σ2
N(0,1) = φ(x) với Φ(−x) = 1− Φ(x)
P (X ≤ x) = Φ(x−µσ )
Nếu X ∼ N(µ, σ2) thì Z = X−µσ ∼ N(0, 1)
IQR/s ≈ 1.3
• Gamma f(y) =
yα−1e−yβ
βαΓ(α)y > 0
0 else
Γ(α) =∫ +∞
0e−uuα−1du
µ = αβ
σ2 = αβ2
5
• Chi-square Y ∼ χ2(ν) nếu f(y) =
1
Γ(ν2 )2ν2 y
ν2−1e−
y2
y > 0
0 else
µ = ν
σ2 = 2ν
là Gamma với α = ν2 và β = 2
Tổng bình phương n biến phân phối chuẩn ∼ χ2(n)
Tổng các biến ∼ χ2(ni) ∼ χ2(∑ni)
• Exponential Y ∼ Exp(λ) nếu f(y) =
{λe−λy y > 00 else
µ = 1λ
σ2 = 1λ2
Lưu ý có thể viết dạng λ = 1β
Là Gamma với α = 1, β = 1λ
No memory P (X > x0 + x|X > x0) = P (X > x)
Liên hệ với Poisson nếu X là số sự kiện trong [0,t] thì X ∼ Po(θt), nếu Y là thời gian chođến khi sự kiện đầu tiên xảy ra thì Y ∼ Exp(θ) vì P (Y > t) = P (X = 0)
• Weibull f(y) =
{αβ y
α−1e−yα
β y > 0
0 else
µ = β1αΓ(α+1
α )
σ2 = β2α [Γ(α+2
α )− Γ2(α+1α )]
là Exponential nếu α = 1
• Beta f(y) =
{yα−1(1−y)β−1
B(α,β) y > 0
0 elsevới B(α, β) =
∫ 1
0yα−1(1− y)β−1dy = Γ(α)Γ(β)
Γ(α+β)
µ = αα+β
σ2 = αβ(α+β)2(α+β+1)
• Student’s T Y ∼ t(ν) nếu f(y) =Γ( ν+1
2 )
Γ( ν2 )1√νπ
(1 + y2
ν )−ν+12
µ = 0
σ2 = νν−2 , ν > 2
*nếu X1 ∼ N(0, 1) và X2 ∼ χ2(ν) thì Y = X1√X2ν
∼ t(ν)
nếu X ∼ t(ν)→ φ(x) = 1√2πe−
x2
2
• F Y ∼ F (ν1, ν2) khi f(y) =
{Γ(ν1+ν2
2 )
Γ(ν12 )Γ(
ν22 )
(ν1ν2 )ν12 y
ν12 −1(1 + ν1
ν2y)−
ν1+ν22 y > 0
0 else
µ = ν2ν2−2 , ν2 > 2
σ2 =2ν2
2 (ν1+ν2−2)ν1(ν2−4)(ν2−2)2 , ν2 > 4
Nếu X1 ∼ χ2(ν1), X2 ∼ χ2(ν2) thì Y =X1ν1X2ν2
∼ F (ν1, ν2)
với Y1 ∼ F (ν1, ν2), Y2 ∼ F (ν2, ν1) ta có FY1 = P (Y1 ≤ y) = 1− P (Y2 ≤ 1y ) = 1− FY2( 1
y )
6
Chương 5. Phân phối đa biến
Đúng cho trường hợp nhiều hơn 2 biến, các nội dung sau lấy điển hình 2 biến X, Y Joint distributionfunction
• p(x, y) = P (X = x, Y = y)
• 0 ≤ p(x, y) ≤ 1
•∑x
∑y p(x, y) = 1
Joint probability density function
• f(x, y) ≥ 0
•∫ +∞−∞
∫ +∞−∞ f(x, y)dxdy = 1
• P (a ≤ X ≤ b, c ≤ Y ≤ d) =∫ dc
∫ baf(x, y)dxdy
Marginal distribution một tập con của joint distribution, tìm JDF của 1 hoặc nhóm các biến ta thaytất cả các biến không thuộc tập này với +∞
• với 2 biến x,y với hàm liên kết là p(x, y) = P (X = x, Y = y), xác suất biên của X làp1(x) = P (X = x) =
∑y p(x, y) =
∑y P (X = x, Y = y) =
∑y P (X = x|Y = y)P (Y = y), tương
tự cho P2(y)
• f1(x) =∫ +∞−∞ f(x, y)dy, tương tự cho f2(y)
Phân phối có điều kiện
• p1(x|y) = P (X = x|Y = y) = P (X=x,Y=y)P (Y=y) = p(x,y)
p2(y)
p2(y|x) = P (Y = y|X = x) = P (X=x,Y=y)P (X=x) = p(x,y)
p1(x)
⇒ p(x, y) = p1(x|y)p2(y) = p2(y|x)p1(x)
• f1(x|y) = f(x,y)f2(y) f2(y|x) = f(x,y)
f1(x)
Độc lập
khi
• p(x, y) = p1(x)p2(y)
• f(x, y) = f1(x)f2(y)
Vọng trị
• E[g(x, y)] =
{ ∑x
∑y g(x, y)p(x, y)∫ +∞
−∞∫ +∞−∞ g(x, y)f(x, y)dxdy
• E[c]=c; E[cg(x,y)]=cE[g(x,y)], Vọng trị của tổng = tổng các vọng trị
• Nếu g(X,Y)=g1(X) thì E[g(X,Y )] = E[g1(X)]
• E[g(X1, X2, ..., Xn)] = E[g1(X1)]E[g2(X2)]...E[gn(Xn)] nếu X1, .., Xn độc lập
7
Tương quan và hiệp phương sai
• Với X, Y là 2 biến ngẫu nhiên với g(x, y) = (x− E[X])(y − E[Y ]) ta cóE[g(X,Y)]= E[XY]-E[X]E[Y] =Cov(X,Y)
• |Cov(X,Y )| ≤√V ar(X)V ar(Y ), = khi Y=cX
• X,Y độc lập thì Cov(X,Y)=0, không áp dụng chiều ngược lại
• −1 ≤ ρ = Cov(X,Y )√V ar(X)V ar(Y )
≤ 1
Hàm phân phối đa biến
• biết X,Y,...tìm W=f(X,Y,...) bằng CDF, vd: có f(y) tìm g(w) khi W=Y 2, ta cóG(w) = P (W ≤ w) = P (Y 2 ≤ w) chuyền về f(y) để tính rồi lấy đạo hàm để có g(w). ...
Hàm tuyến tính
• Với X1, ..., Xn ngẫu nhiên và a1, ..., an hằng số thì a1X1 + ...+ anXn là hàm tuyến tính
• E[∑ni=1 aiXi] = aiE[
∑ni=1Xi]
• Var (∑ni=1 aiXi) =
∑ni=1 a
2iV ar(Xi) + 2
∑∑1≤i<j≤n aiajCov(Xi, Xj) nếu Xi độc lập thì Cov=0.
Phân phối chọn mẫu
• SE = sd√n
• Phân phối chọn mẫu của trung bình mẫu Y = 1n
∑ni=1 Yi, hàm tuyến tính nên
E[Y ] = 1n
∑ni=1E[Yi] = nµ
n = µ và
V ar(Y ) = 1n2
∑ni=1 V ar[Yi] = nσ2
n2 = σ2
n
•∑ni=1 aiXi ∼ N(
∑ni=1 aiµi,
∑ni=1 a
2iσ
2)
• Xi ∼ N(µ, σ1) và độc lập ta có
X ∼ N(µ, σ2
n )
(n−1)S2
σ2 ∼ χ2(n− 1)
Thuyết giới hạn trung tâm
Với X1, .., Xn độc lập từ dân số có E[X]=µ và phương sai V ar(X) = σ2, khi n→ +∞ ta có
• X−µ√σ2/n
→ N(0, 1)
• Với n ≥ 25 thì X ≈ N(µ, σ2
n )
Với Xi, ..., Xn độc lập và ∼ Bernoulli ta có
• E[X] = p và V ar(X) = p(1−p)n
• X−p√p(1−p)n
→ N(0, 1) =∑ni=1Xi−np√np(1−p)
(nhân tử và mẫu cho n*), nếu n lớn ta có
•∑ni=1Xi ≈ N(np, np(1− p)) mà
∑ni=1Xi ∼ B(n, p)
• X ∼ B(n, p) ≈ N(np, np(1− p)) np&n(1− p) ≥ 4 xấp xỉ rời rạc bằng liên tục
• Hiệu chỉnh tính liên tục (Continuity correction) nếu X ∼ B(n, p);Y ∼ N(np, np(1− p))⇒ P (X = x) ≈ P (x− 1
2 ≤ Y ≤ x+ 12 )
8
Chương 6. Khoảng tin cậy
Unbiased estimator E[θ] = θ, vd Y = E[Y ] = µ
Bias b(θ) = E[θ]− θMVUE -minimum variance unbiased estimator, Y là MVUE cho µ với V ar(Y ) = σ2
n
Mean squared error E[(θ − θ)2] = V (θ) + b2(θ)
Các phương pháp ước lượng
• Phương pháp moment tính các ước lượng tố moment θ1, ...θk của phân phối bằng
E[Y ] = 1n
∑ni=1 y
1i vd=λ = y với Poisson
E[Y k] = 1n
∑ni=1 y
ki
• Phương pháp tối đa xác suất với y1, ..., yn là mẫu của biến Y với hàm p(y, θ)
p(y1, ..., yn, θ) = p(y1, θ)...p(yn, θ) là likelihood function L
Rời rạc với y1, ..., yn có hàm xác suất phụ thuộc vào các tham số θ1, ..., θk thì likelihoodfuntion của mẫu là L(θ1, ..., θk) = p(y1)p(y2)...p(yn)
Liên tục với y1, ..., yn có hàm mật độ phụ thuộc vào các tham số θ1, ..., θk thì likelihoodfuntion của mẫu là L(θ1, ..., θk) = f(y1)f(y2)...f(yn)
maximum likelihood estimator θ1, ..., θk là giá trị θ1, ..., θk sao cho hàm L đạt cực đại.
tìm cực trị xem chương 1 Lấy ln(L) và tính đạo hàm của ln(L)=0, tính đạo hàm bậc 2 xétdấu.
• Phương pháp bình phương tối thiểu không cần biết phân phối
least squared estimator θ của tham số θ là giá trị mà MSE[(θ − θ)2]
• Jackknife, Robust, Bayes,...
Khoảng tin cậy cho trung bình
• X phân phối bình thường, biết phương sai, trung bình không biết
ta có X−µ√σ2/n
, với a>0 ta có P (−a ≤ X−µ√σ2/n
≤ a) = Φ(a)− Φ(−a),
Φ(a)− Φ(−a) = 1− α→ a = Zα/2
100(1-α)% = X ± zα/2√σ2/n
• X phân phối bình thường, không biết phương sai và trung bình
Ta có
X−µ√σ2
n√(n−1)S2
σ2
n−1
=X − µ√
S2
n
∼ t(n− 1) xem phân phối chọn mẫu
với b>0 và chọn G(b)-G(-b)=1-α⇔ b = tn−1,α2
100(1-α)% = X ± tn−1,α/2
√S2/n
• Không biết phân phối X, cỡ mẫu lớn
Giả định n≥30 ta tính xấp xỉ phân phối chuẩn, theo định lý giới hạn trung tâm
100(1-α)% = X ± zα/2√σ2/n nếu biết phương sai
100(1-α)% = X ± zα/2√S2/n nếu không biết phương sai
9
Khoảng tin cậy cho tỷ lệ
• theo định lý giới hạn trung tâm, với np và n(1-p) ≥ 4 thì P−p√p(1−p)n
≈ N(0, 1)
• 100(1-α)% p= P ± zα/2√
P (1−P )n
Khoảng tin cậy phương sai
• X phân phối bình thường, biết trung bình
ta có Xi−µσ ∼ N(0, 1), i = 1, .., n và
∑ni=1
(Xi−µ)2
σ2 ∼ χ2(n)
Chọn a,b (a<b) sao cho P(a ≤∑ni=1
(Xi−µ)2
σ2 ≤ b) = Gn(b)−Gn(a)
Chọn Gn(a) = 1−Gn(b) = α2
100(1-α)% =
[∑ni=1(Xi − µ)2
χ2n,α/2
;
∑ni=1(Xi − µ)2
χ2n,1−α/2
]• X phân phối bình thường, không biết trung bình
ta có (n−1)S2
σ2 ∼ χ2(n− 1)
100(1-α)% =
[(n− 1)S2
χ2n−1,α/2
;(n− 1)S2
χ2n−1,1−α/2
]
Bootstrap interval
Với y1, ..., yn là mẫu của Y
1. Chọn số lần lấy mẫu lại j
2. Chọn mẫu có hoàn lại n giá trị trong y1, ..., yn
3. Lập lại bước 2 j lần
4. Mỗi lần tính giá trị θ
5. tìm α/2, 1− α/2 của phân phối chọn mẫu
Chương 7. Kiểm định giả thuyết
Trung bình 1 mẫu
• Phân phối bình thường, biết phương sai tương tự như khoảng tin cậy ta chọn thống kê
T = X−µσ√n∼ N(0, 1)
và so với ±zα nếu 1 bên hoặc với ±zα/2 nếu 2 bên.
• Phân phối bình thường, không biết phương sai tương tự như khoảng tin cậy ta chọn thốngkê
T = X−µ√S2
n
∼ t(n− 1)
và so với ±tα nếu 1 bên hoặc với ±tα/2 nếu 2 bên.
• Không biết phân phối, cỡ mẫu lớn tương tự như khoảng tin cậy ta chọn thống kê
T = X−µσ√n≈ N(0, 1) nếu biết phương sai hoặc
T = X−µ√S2
n
≈ N(0, 1) nếu không biết phương sai.
Tương tự, so với ±zα nếu 1 bên hoặc với ±zα/2 nếu 2 bên.
10
Mức độ thống kê quan sát hay p-value
• nếu Ha : µ > µ0 thì p-value=P(T>t)
• nếu Ha : µ < µ0 thì p-value=P(T<t)
• nếu Ha : µ 6= µ0 thì
p-value=2P(T>t) nếu t>0
p-value=2P(T<t) nếu t<0
Tỷ lệ 1 mẫu
Tương tự như khoảng tin cậy, nếu np0 ≥ 4 và n(1− p0) ≥ 4 ta chọn thống kê
• T = P−p0√p0(1−p0)
n
≈ N(0, 1)
Phương sai 1 mẫu
Tương tự như khoảng tin cậy, ta chọn thống kê
• T = (n−1)S2
σ20∼ χ2(n− 1)
Nếu Ha : σ2 6= σ20 vùng bác bỏ là [0, χ2
1−α/2] ∪ [χ2α/2,+∞]
Nếu Ha : σ2 < σ20 vùng bác bỏ là [0, χ2
1−α]
Nếu Ha : σ2 > σ20 vùng bác bỏ là [χ2
α,+∞]
So sánh 2 trung bình
• Bắt cặp trừ 2 nhóm ⇒ µDifferrent=0
CIµD = D ± tα2
√S2D
n
• Độc lập Với mẫu Xi và Yi ta có X ∼ N(µ1;σ21
n1) và Y ∼ N(µ2;
σ22
n2) nên Y −X ∼ N(µ2−µ1;
σ21
n1+σ22
n2)
1. σ21 = σ2
2 = không biết ⇒ T1 =Y − X − |µ2 − µ1|√
S2P ( 1
n1+ 1
n2)∼ t(n1 + n2 − 2)
với Pooled variance= S2P =
(n1 − 1)S21 + (n2 − 1)S2
2
n1 + n2 − 2=∑n1
i=1(Xi − X)2 +∑n2
i=1(Yi − Y )2
n1 + n2 − 2
ta cũng tính được CIµ2−µ1 = Y − X ± tn1+n2−2,
α
2
√S2P ( 1
n1+ 1
n2)
2. σ21 6= σ2
2 và n1, n2 ≥ 30⇒ T2 =Y − X − |µ2 − µ1|√
S21
n1+
S22
n2
∼ N(0, 1)
3. σ21 6= σ2
2 ⇒ T3 = T2 ∼ t(ν) với ν =(S21
n1+
S22
n2)2
(S21n1
)2
n1−1 +(S22n2
)2
n2−1
So sánh 2 tỷ lệ
Xem thêm CI cho P chương 6 và Phân phối Bernoulli và Binomial, nếu (n1, n2)p ≥ 4 và (n1, n2)p ≥ 4thì
T =P2 − P2√
P (1− P )( 1n1
+ 1n2
)' N(0, 1) với Pool Proprtion P =
n1P1 + n2P2
n1 + n2=S1 + S2
n1 + n2
11
So sánh 2 phương sai
Hai chi bình phương chia nhau là F xem phân phối F T =S2
1
S22
=
(n1 − 1)S21
σ21(n1 − 1)
(n2 − 1)S22
σ22(n2 − 1)
∼ F (n1 − 1, n2 − 1) Với
khoảng bác bỏ là [−∞,−Fα2
] ∪ [Fα2,+∞]
12