ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ...

37
36 Phn 3 Ước lượng và kim ñịnh githiết vi phn mm SAS 3.1. Githiết và ñối thiết Khi kho sát mt tng th(hoc nhiu tng th) và xem xét mt (hoc nhiu) biến ngu nhiên có thñưa ra mt githiết nào ñó liên quan ñến phân phi ca biến ngu nhiên hoc nếu biết phân phi ri thì ñưa ra githiết vtham sca tng th. ðể thñưa ra mt kết lun thng kê nào ñó ñối vi githiết thì phi chn mu ngu nhiên, tính tham smu, chn mc ý nghĩa α sau ñó ñưa ra kết lun. Bài toán kim ñịnh tham sΘ ca phân phi có dng H 0 : Θ = Θ o vi Θ o là mt sñã cho nào ñó. Kết lun thng kê có dng: “chp nhn H 0 ” hay “bác bH 0 ”. Nhưng nếu ñặt vn ñề như vy thì cách gii quyết hết sc khó, vì nếu không chp nhn H 0 : Θ = Θ o thì ñiu ñó có nghĩa là có thchp nhn mt trong vô sΘ khác Θ o , do ñó thường ñưa ra bài toán dưới dng cthhơn na: cho githiết H 0 ñối thiết H 1 , khi kết lun thì hoc chp nhn H 0 hoc bác bH 0, và trong trường hp này, tuy không hoàn toàn tương ñương, nhưng coi như chp nhn ñối thiết H 1 . Nếu chp nhn H 0 trong lúc githiết ñúng là H 1 thì mc sai lm loi II và xác sut mc sai lm này ñược gi là ri ro loi hai β. Ngược li nếu bác bH 0 trong lúc githiết ñúng chính là H 0 thì mc sai lm loi I và xác sut mc sai lm ñó gi là ri ro loi mt α. Quyết ñịnh Githiết Bác bH 0 Chp nhn H 0 H 0 ñúng Sai lm loi I (α) Quyết ñịnh ñúng H 0 sai Quyết ñịnh ñúng Sai lm loi II (β) Như vy trong bài toán kim ñịnh githiết luôn luôn có hai loi ri ro, loi I và loi II, tuvn ñề mà nhn mnh loi ri ro nào. Thông thường người ta hay tp trung chú ý vào sai lm loi I và khi kim ñịnh phi khng chế sao cho ri ro loi I không vượt quá mt mc α gi là mc ý nghĩa. Trước hết xem xét cthbài toán kim ñịnh githiết H 0 : Θ = Θ o , ñối thiết H 1 : Θ = Θ 1 vi Θ 1 là mt giá trkhác Θ o . ðây là bài toán kim ñịnh githiết ñơn. Quy tc kim ñịnh căn cvào hai giá trcthΘ 1 Θ o , vào mc ý nghĩa α và còn căn cvào csai lm loi hai. Vic này vlý thuyết thng kê không gp khó khăn gì. Sau ñó mrng quy tc sang cho bài toán kim ñịnh githiết kép. H 1 : Θ≠Θ o ; Θ > Θ o hoc Θ < Θ o , vic mrng này có khó khăn nhưng các nhà nghiên cu lý thuyết xác sut thng kê ñã gii quyết ñược, do ñó vsau khi kim ñịnh githiết H 0 : Θ = Θ o có thchn mt trong 3 ñối thiết H 1 sau:

Upload: others

Post on 14-Sep-2019

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

36

Phần 3

Ước lượng và kiểm ñịnh giả thiết với phần mềm SAS

3.1. Giả thiết và ñối thi ết

Khi khảo sát một tổng thể (hoặc nhiều tổng thể) và xem xét một (hoặc nhiều) biến ngẫu nhiên có thể ñưa ra một giả thiết nào ñó liên quan ñến phân phối của biến ngẫu nhiên hoặc nếu biết phân phối rồi thì ñưa ra giả thiết về tham số của tổng thể. ðể có thể ñưa ra một kết luận thống kê nào ñó ñối với giả thiết thì phải chọn mẫu ngẫu nhiên, tính tham số mẫu, chọn mức ý nghĩa α sau ñó ñưa ra kết luận. Bài toán kiểm ñịnh tham số Θ của phân phối có dạng H0 : Θ = Θo với Θo là một số ñã cho nào ñó. Kết luận thống kê có dạng: “chấp nhận H0” hay “bác bỏ H0”. Nhưng nếu ñặt vấn ñề như vậy thì cách giải quyết hết sức khó, vì nếu không chấp nhận H0

: Θ = Θo thì ñiều ñó có nghĩa là có thể chấp nhận một trong vô số Θ khác Θo, do ñó thường ñưa ra bài toán dưới dạng cụ thể hơn nữa: cho giả thiết H0 và ñối thiết H1, khi kết luận thì hoặc chấp nhận H0 hoặc bác bỏ H0, và trong trường hợp này, tuy không hoàn toàn tương ñương, nhưng coi như chấp nhận ñối thiết H1.

Nếu chấp nhận H0 trong lúc giả thiết ñúng là H1 thì mắc sai lầm loại II và xác suất mắc sai lầm này ñược gọi là rủi ro loại hai ββββ. Ngược lại nếu bác bỏ H0 trong lúc giả thiết ñúng chính là H0 thì mắc sai lầm loại I và xác suất mắc sai lầm ñó gọi là rủi ro loại một α.

Quyết ñịnh

Giả thiết Bác bỏ H0 Chấp nhận H0

H0 ñúng Sai lầm loại I ( αααα) Quyết ñịnh ñúng

H0 sai Quyết ñịnh ñúng Sai lầm loại II ( ββββ)

Như vậy trong bài toán kiểm ñịnh giả thiết luôn luôn có hai loại rủi ro, loại I và loại II, tuỳ vấn ñề mà nhấn mạnh loại rủi ro nào. Thông thường người ta hay tập trung chú ý vào sai lầm loại I và khi kiểm ñịnh phải khống chế sao cho rủi ro loại I không vượt quá một mức α gọi là mức ý nghĩa.

Trước hết xem xét cụ thể bài toán kiểm ñịnh giả thiết H0: Θ = Θo, ñối thiết H1: Θ = Θ1 với Θ1 là một giá trị khác Θo. ðây là bài toán kiểm ñịnh giả thiết ñơn. Quy tắc kiểm ñịnh căn cứ vào hai giá trị cụ thể Θ1 và Θo, vào mức ý nghĩa α và còn căn cứ vào cả sai lầm loại hai. Việc này về lý thuyết thống kê không gặp khó khăn gì.

Sau ñó mở rộng quy tắc sang cho bài toán kiểm ñịnh giả thiết kép. H1: Θ≠Θo; Θ > Θo hoặc Θ < Θo, việc mở rộng này có khó khăn nhưng các nhà nghiên cứu lý thuyết xác suất thống kê ñã giải quyết ñược, do ñó về sau khi kiểm ñịnh giả thiết H0 : Θ = Θo có thể chọn một trong 3 ñối thiết H1 sau:

Page 2: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

37

H1 : Θ ≠ Θo gọi là ñối thiết hai phía

H1 : Θ > Θo gọi là ñối thiết phải

H1 : Θ < Θo gọi là ñối thiết trái

Hai ñối thiết sau gọi là ñối thiết một phía. Việc chọn ñối thiết nào tuỳ thuộc vấn ñề khảo sát cụ thể.

Nếu P ≥ α, chấp nhận giả thiết H0

Nếu P < α, Bác bỏ giả thiết H0 chấp nhận ñối thiết H1.

3.2. Ki ểm ñịnh phân phối chuẩn

ðối với tất cả các phép thử ñối với biến ñịnh lượng, ñều giả thiết rằng số liệu thu thập ñược (số liệu thô) ñều tuân theo phân phối chuẩn. Nếu số liệu không tuân theo phân phối chuẩn thì các phép thử dưới ñây sẽ không có hiệu lực. Trong trường hợp này cần biến ñổi số liệu về phân phối chuẩn hoặc sử dụng kiểm ñịnh phi tham số. Giả thiết của phép thử: H0: Số liệu có phân bố chuẩn và H1: Số liệu không có phân bố chuẩn

Ví dụ 2: Tăng trọng trung bình (gram/ngày) của 36 lợn nuôi vỗ béo giống Landrace ñược rút ngẫu nhiên từ một trại chăn nuôi. Số liệu thu ñược như sau:

577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586 621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589

Cán bộ kỹ thuật trại cho rằng tăng trọng trung bình của toàn ñàn lợn trong trại là 607 gram/ngày. Theo anh chị kết luận ñó ñúng hay sai, vì sao?

SAS CODE DATA SAS2; INPUT KL; CARDS; 577 596 594 . . 589 ; PROC UNIVARIATE NORMAL PLOT; VAR KL; RUN; Kết quả từ SAS The UNIVARIATE Procedure Variable: KL Moments N 36 Sum Weights 36 Mean 599.194444 Sum Observations 21571 Std Deviation 18.6560131 Variance 348.046825 Skewness -0.1258564 Kurtosis -0.4077877 Uncorrected SS 12937405 Corrected SS 12181.6389 Coeff Variation 3.1135157 Std Error Mean 3.10933552

Page 3: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

38

Basic Statistical Measures Location Variability Mean 599.1944 Std Deviation 18.65601 Median 600.0000 Variance 348.04683 Mode 596.0000 Range 77.00000 Interquartile Range 26.50000 NOTE: The mode displayed is the smallest of 2 modes with a count of 2. Tests for Location: Mu0=0 Test -Statistic- -----p Value------ Student's t t 192.7082 Pr > |t| <.0001 Sign M 18 Pr >= |M| <.0001 Signed Rank S 333 Pr >= |S| <.0001 Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.99129 Pr < W 0.9918 Kolmogorov-Smirnov D 0.057007 Pr > D >0.1500 Cramer-von Mises W-Sq 0.01366 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.094344 Pr > A-Sq >0.2500 Quantiles (Definition 5) Quantile Estimate 100% Max 636.0 99% 636.0 95% 631.0 90% 623.0 75% Q3 613.5 50% Median 600.0 25% Q1 587.0 10% 574.0 5% 565.0

Page 4: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

39

BAI 1 THONG KE MO TA 09:32 Saturday, June 24, 2000 28 HO VA TEN The UNIVARIATE Procedure Variable: KL Quantiles (Definition 5) Quantile Estimate 1% 559.0 0% Min 559.0 Extreme Observations ----Lowest---- ----Highest--- Value Obs Value Obs 559 12 621 19 565 17 623 20 570 25 627 8 574 30 631 24 577 1 636 35 Stem Leaf # Boxplot 63 6 1 | 63 1 1 | 62 7 1 | 62 13 2 | 61 5689 4 | 61 2 1 +-----+ 60 5678 4 | | 60 00123 5 *-----* 59 5668 4 | + | 59 14 2 | | 58 689 3 +-----+ 58 14 2 | 57 78 2 | 57 04 2 | 56 5 1 | 56 | 55 9 1 | ----+----+----+----+ Multiply Stem.Leaf by 10**+1

Page 5: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

40

BAI 1 THONG KE MO TA 09:32 Saturday, June 24, 2000 29 HO VA TEN The UNIVARIATE Procedure Variable: KL Normal Probability Plot 637.5+ +* | *++ | +*+ | *+* | ****+ | *++ | *** | ***+ 597.5+ ***+ | **+ | *** | +** | +** | *+* | +*+ | +++ 557.5+ ++* +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2

Giá trị P-Value = 0,9918 lớn hơn 0,05 (α), như vậy H0 ñược chấp nhận. Kết luận số liệu tuân theo phân phối chuẩn.

3.3. Ki ểm ñịnh một giá tr ị trung bình bằng phép thử T

Trong thực tế ta không có thông tin về ñộ lệch chuẩn của quần thể (σ), phép thử T ñược sử dụng ñể kiểm ñịnh giá trị trung bình và ñộ lệch chuẩn của mẫu (s) ñược sử dụng thay thế ñộ lệch chuẩn quần thể. Giả thiết của phép thử là số liệu tuân theo phân bố chuẩn.

SAS CODE DATA SAS2; INPUT KL; CARDS; 577 596 594 . . 589 ; PROC TTEST H0 = 607 ALPHA = .05; VAR KL; RUN;

Page 6: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

41

Kết quả từ SAS The TTEST Procedure Statistics Lower CL Upper CL Lower CL Upper CL Variable N Mean Mean Mean Std Dev Std Dev Std Dev Std Err KL 36 592.88 599.19 605.51 15.132 18.656 24.336 3.1093 T-Tests Variable DF t Value Pr > |t|

KL 35 -2.51 0.0168

Với xác suất của phép thử P = 0,0168 < 0,05 (α), bác bỏ H0 và chấp nhận ñối thiết H1. Kết luận: Tăng trọng của lợn Landrace ở trại nêu trên không bằng 607 gram/ ngày (P < 0,05). Khoảng tin cậy 95% là 592,88 – 605,51 gram/ ngày.

3.4. Ki ểm ñịnh 2 giá trị trung bình

Khi tiến hành thí nghiệm ñể so sánh 2 sự khác nhau giữa 2 công thức thí nghiệm, có 2 trường hợp chọn mẫu có thể xảy ra: 1) Chọn mẫu ñộc lập và 2) chọn mẫu theo cặp (xem 2.4, tr.23, Giáo trình Thiết kế thí nghiệm 2007). Tuỳ thuộc vào cách chọn mẫu bố trí thí nghiệm mà ta có thể sử dụng phép thử T hay T cặp ñôi cho phù hợp.

3.4.1. Phép thử T cặp ñôi

ðối với các thí nghiệm chọn mẫu theo cặp, ñiều kiện duy nhất của bài toán là kiểm tra phân bố chuẩn của phần chênh lệch (d) số liệu giữa 2 công thức thí nghiệm.

Với kiểm ñịnh 2 phía ta có giả thiết H0: µd = 0 ñối thiết H1: µd ≠ 0 (µd là trung bình của sự chênh lệch giữa 2 trung bình µ1 và µ2).

Ví dụ 3: Tăng trọng (pound) của 10 cặp bê sinh ñôi giống hệt nhau dưới hai chế ñộ chăm sóc khác nhau (A và B). Bê trong từng cặp ñược bắt thăm ngẫu nhiên về một trong hai cách chăm sóc.

Hãy kiểm ñịnh giả thiết H0: Tăng trọng trung bình ở hai cách chăm sóc như nhau, ñối thiết H1: Tăng trọng trung bình khác nhau ở hai cách chăm sóc với mức ý nghĩa α = 0,05. Số liệu thu ñược như sau:

Cặp sinh ñôi 1 2 3 4 5 6 7 8 9 10

Tăng trọng ở cách A 43 39 39 42 46 43 38 44 51 43

Tăng trọng ở cách B 37 35 34 41 39 37 35 40 48 36

Chênh lệch (d) 6 4 5 1 7 6 3 4 3 7

Page 7: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

42

Thay vì kiểm ñịnh hai mẫu bằng phép thử T cặp ñôi, bài toán sẽ tiến hành kiểm ñịnh phần chênh lệch giữa các cặp (D) với giá trị 0. ðể tạo biến mới trong cơ sở dữ liệu của SAS ta có thể sử dụng câu lệnh logic. Ví dụ ta tao ra cột hiệu số của từng cặp theo lệnh D = A – B.

SAS CODE OPTIONS PAGESIZE = 60 LINESIZE = 80; DATA SAS3; INPUT A B; D = A -B; CARDS; 43 37 39 35 39 34 42 41 46 39 43 37 38 35 44 40 51 48 43 36 ; TITLE 'BAI 3 SO SANH CAP DOI' ; title2 'HO VA TEN' ; PROC TTEST H0 = 0 ALPHA=.05; VAR D; RUN;

Kết quả từ SAS: BAI 3 SO SANH CAP DOI 5 HO VA TEN 20:38 Friday, June 23, 2000 The TTEST Procedure Statistics Lower CL Upper CL Lower CL Upper CL Variable N Mean Mean Mean Std Dev Std Dev Std Dev D 10 3.2014 4.6 5.9986 1.3448 1.9551 3.5692 Statistics Variable Std Err Minimum Maximum D 0.6182 1 7 T-Tests Variable DF t Value Pr > |t| D 9 7.44 <.0001

Xác suất P < 0,0001 vì vậy H0 bị bác bỏ và H1 ñược chấp nhận. Kết luận rằng Tăng trọng trung bình ở hai cách chăm sóc có sự sai khác.

Page 8: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

43

3.4.2. Ki ểm ñịnh sự ñồng nhất của phương sai

ðối với kiểm ñịnh 2 giá trị trung bình, ngoài giả thiết là số liệu tuân theo phân phối chuẩn cong một vấn ñề thứ 2 ñặt ra là Hai phương sai có ñồng nhất hay không?

ðối với kiểm ñịnh hai phía ta có giả thiết H0: Hai phương sai ñồng nhất (σ²1 = σ²2) và H1: Hai phương sai không ñồng nhất (σ²1 ≠ σ²2) . Khi chấp nhận giả thiết H0, phương sai chung (σ)sẽ ñược sử dụng ñể tiến hành kiểm ñịnh trong phép thử T; ngược lại (bác bỏ H0) thì phép thử T gần chính xác sẽ ñược thực hiện.

Ví dụ 3: ðể so sánh khối lượng của 2 giống bò, tiến hành chọn ngẫu nhiên và cân 12 con ñối với giống thứ nhất và 15 con ñối với giống thứ 2. Khối lượng (kg) thu ñược như sau:

Giống bò thứ nhất 187,6 180,3 198,6 190,7 196,3 203,8 190,2 201,0

194,7 221,1 186,7 203,1

Giống bò thứ hai 148,1 146,2 152,8 135,3 151,2 146,3 163,5 146,6

162,4 140,2 159,4 181,8 165,1 165,0 141,6

Theo anh (chị), khối lượng của 2 giống bò có sự sai khác không?

3.4.3. Phép thử T

Sử dụng phép thử T ñể kiểm ñịnh 2 giá trị trung bình khi không biết ñộ lệch chuẩn của quần thể (σσσσ). Minitab sẽ tính khoảng tin cậy (CI 95%) sự chênh lệch giữa 2 giá trị trung bình quần thể và thực hiện phép kiểm ñịnh. ðối với kiểm ñịnh 2 phía ta có giả thiết: H0: µ1 = µ2 với ñối thiết H1: µ1 ≠ µ2; trong ñó µ1 và µ2 là giá trị trung bình của quần thể thứ nhất và thứ 2.

SAS CODE DATA SAS3; INPUT P GIONG; CARDS; 187.6 1 180.3 1 . . 141.6 2 ; TITLE 'SO SANH 2 GIA TRI TRUNG BINH MAU DOC LAP' ; TITLE2 'HO VA TEN' ; PROC TTEST; CLASS GIONG; VAR P; RUN; SO SANH 2 GIA TRI TRUNG BINH MAU DOC LAP 2 HO VA TEN 16:48 Sunday, June 25, 2000 The TTEST Procedure Statistics Lower CL Upper CL Lower CL Upper CL Variable GIONG N Mean Mean Mean Std Dev Std Dev Std Dev P 1 12 189.43 196.18 202.92 7.5203 10.616 18.025 P 2 15 146.89 153.7 160.51 9.0062 12.301 19.401 P Diff (1-2) 33.23 42.475 51.72 9.0896 11.59 15.999

Page 9: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

44

Statistics Variable GIONG Std Err Minimum Maximum P 1 3.0646 180.3 221.1 P 2 3.1762 135.3 181.8 P Diff (1-2) 4.4888 T-Tests Variable Method Variances DF t Value Pr > |t| P Pooled Equal 25 9.46 <.0001 P Satterthwaite Unequal 24.8 9.62 <.0001 Equality of Variances Variable Method Num DF Den DF F Value Pr > F

P Folded F 14 11 1.34 0.6312

Xác suất p-value = 0,000 < 0,05 (α) vì vậy H0 bị bác bỏ và H1 ñược chấp nhận. Kết luận rằng Khối lượng của hai giống bò có sự sai khác (P < 0,001).

Page 10: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

45

3.5. Phân tích phương sai

Phân tích phương sai (Analysis of Variance - ANOVA ) là công cụ hữu ích ñể so sánh nhiều giá trị trung bình. ðiều kiện của bài toán phân tích phương sai là 1) số liệu tuân theo phân bố chuẩn và 2) phương sai ñồng nhất. Trong khuôn khổ giáo trình này chúng tôi chỉ ñề cập ñến việc kiểm tra ñiều kiện của bài toán ñối với các mô hình thiết kế thí nghiệm ñơn giản (Thí nghiệm một yếu tố hoàn toàn ngẫu nhiên).

Với kiểm ñịnh 2 phía ta có giả thiết H0: µ1 = µ2 = ... = µa ñối thiết H1: µ1 ≠ µ2 ≠ ...≠ µa (µ là trung bình của quần thể ở công thức thí nghiệm thứ 1, 2, ...a).

3.5.1. Thí nghiệm một yếu tố hoàn toàn ngẫu nhiên

Xét trường hợp ñơn giản nhất ñối với bài toán phân tích phương sai. Chỉ có một yếu tố duy nhất trong thí nghiệm, các yếu tố phi thí nghiệm còn lại ñược coi là có tác ñộng như nhau ñến ñối tượng thí nghiệm.

Ví dụ 4: Theo dõi tăng trọng của cá (kg) trong thí nghiệm với 5 công thức nuôi (A, B, C, D và E). Hãy cho biết tăng trọng của cá ở các công thức nuôi. Nếu có sự khác nhau, tiến hành so sánh sự sai khác của từng cặp giá trị trung bình có thể bằng các chữ cái.

A B C D E 0,95 0,43 0,70 1,00 0,90 0,85 0,45 0,90 0,95 1,00 0,85 0,40 0,75 0,90 0,95 0,90 0,42 0,70 0,90 0,95

Mô hình phân tích

yi j = µ + ai + εi j

yij = quan sát thứ j ở công thức i, µ = trung bình chung, ai = ảnh hưởng của công thức i và εij = sai số ngẫu nhiên; các εij ñộc lập, phân phối chuẩn N∼(0,σ2).

SAS CODE DATA SAS4; INPUT KL KP $; CARDS; 0.95 A 0.85 A 0.85 A 0.90 A 0.43 B . . 1.00 E 0.95 E 0.95 E ; TITLE 'PHAN TICH PHUONG SAI 1 YEU TO' ; TITLE2 'HO VA TEN' ; PROC ANOVA; CLASS KP; MODEL KL = KP; RUN;

Page 11: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

46

The ANOVA Procedure Dependent Variable: KL Sum of Source DF Squares Mean Square F Value Pr > F Model 4 0.76325000 0.19081250 60.99 <.0001 Error 15 0.04692500 0.00312833 Corrected Total 19 0.81017500 R-Square Coeff Var Root MSE KL Mean 0.942080 7.057603 0.055932 0.792500 Source DF Anova SS Mean Square F Value Pr > F KP 4 0.76325000 0.19081250 60.99 <.0001

Xác suất p-value = 0,000 < 0,05 (α) vì vậy H0 bị bác bỏ và H1 ñược chấp nhận. Kết luận rằng Tăng trọng trung bình của cá ở các công thức thức ăn có sự sai khác (P < 0,001).

So sánh cặp khi bác bỏ giả thiết H0 chấp nhận giả thiết H1 PROC ANOVA; CLASS KP; MODEL KL = KP; MEANS KP / DUNCAN; RUN;

Kết quả từ SAS The ANOVA Procedure Duncan's Multiple Range Test for KL NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 15 Error Mean Square 0.003128 Number of Means 2 3 4 5 Critical Range .08430 .08837 .09090 .09262 Means with the same letter are not significantly different. Duncan Grouping Mean N KP A 0.95000 4 E A A 0.93750 4 D A A 0.88750 4 A B 0.76250 4 C

C 0.42500 4 B

Sự sai khác có ý nghĩa (P < 0,05) giữa các nghiệm thức của từng cặp. Không có sự sai khác giữa các nghiệm thức nếu có chung chữ cái và ngược lại có sự sai khác nếu không có chung chữ cái. ðể có thể trình bày kết quả so sánh cặp ñôi bạn ñọc có thể tham khảo trang 57 chương 4 Giáo trình Thiết kế thí nghiêm (2007).

Page 12: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

47

3.5.2. Thí nghiệm một yếu tố khối ngẫu nhiên ñầy ñủ

Xem xét một thí nghiệm mà ñối tượng thí nghiệm chịu tác ñộng ñồng thời của một yếu tố chính (yếu tố thí nghịêm) và yếu tố phụ (khối).

Ví dụ 5: Nghiên cứu số lượng tế bào lymphô ở chuột (×1000 tế bào mm-3 máu) ñược sử dụng 4 loại thuốc khác nhau (A, B, C và D; thuốc D là placebo) qua 5 lứa; số liệu thu ñược trình bày ở bảng dưới. Cho biết ảnh hưởng của thuốc ñến tế bào lymphô?

Lứa 1 Lứa 2 Lứa 3 Lứa 4 Lứa 5 Thuốc A 7,1 6,1 6,9 5,6 6,4 Thuốc B 6,7 5,1 5,9 5,1 5,8 Thuốc C 7,1 5,8 6,2 5,0 6,2 Thuốc D 6,7 5,4 5,7 5,2 5,3

Mô hình phân tích

yi j = µ + αi + βj + εi j i = 1,…,a; j = 1,…,b

yij = quan sát thứ i của nhân tố ở khối thứ j, µ là trung bình chung. αi = ảnh hưởng của mức i của nhân tố, βj = ảnh hưởng của khối j , εij là sai số ngẫu nhiên; các εij ñộc lập, phân phối chuẩn N(0,σ2)

SAS CODE DATA SAS5; INPUT TEBAO THUOC $ LUA; CARDS; 7.1 A 1 6.7 B 1 7.1 C 1 6.7 D 1 . . 6.2 C 5 5.3 D 5 ; TITLE 'KHOI NGAU NHIEN DAY DU' ; TITLE2 'HO VA TEN' ; PROC ANOVA; CLASS THUOC LUA; MODEL TEBAO = THUOC LUA; MEANS THUOC / DUNCAN;

RUN;

Kết quả từ SAS KHOI NGAU NHIEN DAY DU 10:29 Monday, June 26, 2000 4 HO VA TEN The ANOVA Procedure Class Level Information Class Levels Values THUOC 4 A B C D LUA 5 1 2 3 4 5

Number of observations 20

Page 13: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

48

The ANOVA Procedure Dependent Variable: TEBAO Sum of Source DF Squares Mean Square F Value Pr > F Model 7 8.24850000 1.17835714 22.20 <.0001 Error 12 0.63700000 0.05308333 Corrected Total 19 8.88550000 R-Square Coeff Var Root MSE TEBAO Mean 0.928310 3.862501 0.230398 5.965000 Source DF Anova SS Mean Square F Value Pr > F THUOC 3 1.84550000 0.61516667 11.59 0.0007

LUA 4 6.40300000 1.60075000 30.16 <.0001

KHOI NGAU NHIEN DAY DU 10:29 Monday, June 26, 2000 6 HO VA TEN The ANOVA Procedure Duncan's Multiple Range Test for TEBAO NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 0.053083 Number of Means 2 3 4 Critical Range .3175 .3323 .3413 Means with the same letter are not significantly different. Duncan Grouping Mean N THUOC A 6.4200 5 A B 6.0600 5 C C 5.7200 5 B C

C 5.6600 5 D

Xác suất của phép thử ñối với Thuốc P < 0,0001 , bác bỏ giả thiết H0 và chấp nhận ñối thiết H1. Kết luận thuốc có ảnh hưởng khác nhau lên tế bào lymphô của chuột (P < 0,001).

Page 14: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

49

Ví dụ 6: Một thí nghiệm ñược tiến hành ñể xác ñịnh ảnh hưởng của 3 công thức thức ăn (A1, A2 và A3) ñến tăng trọng trung bình trên ngày (gram / ngày) của bê ñực. Bê ñực ñược cân và chia thành 4 khối dựa theo khối lượng bắt ñầu thí nghiệm. Trong mỗi khối có 6 ñộng vật thí nghiệm ñược chọn ra và ñược phân ngẫu nhiên về với các nghiệm thức. Số liệu thu thập sau khi kết thúc thí nghiệm như sau:

Khối

I II III IV A1 826

806 864 834

795 810

850 845

A2 827 800

871 881

729 709

860 840

A3 753 773

801 821

736 740

820 835

Nếu trong một công thức - một khối có nhiều quan sát thì ngoài việc ñánh giá mức ñộ ảnh hưởng của từng yếu tố riêng biệt ta còn có thể xác ñịnh mối tương tác theo mô hình phân tích sau:

yi jk = µ + αi + βj + α×βij + εi j

yi jk là quan sát thứ k của khối thứ j và nghiệm thức thứ i, µ trung bình chung, αi chênh lệch do ảnh hưởng của mức i của nhân tố, βj chênh lệch do ảnh hưởng của khối j, α×βij chênh lệch do tương tác giữa nghiệm thức và khối, εijk sai số ngẫu nhiên; các εijk ñộc lập, phân phối chuẩn N(0,σ2), SAS CODE DATA SAS6; INPUT KL CT $ KHOI $; CARDS; 826 A1 I 806 A1 I . . 820 A3 IV 835 A3 IV ; TITLE 'KHOI NGAU NHIEN DAY DU TUONG TAC' ; TITLE2 'HO VA TEN' ; PROC ANOVA; CLASS CT KHOI; MODEL KL = CT KHOI CT*KHOI; MEANS CT / DUNCAN;

RUN;

Kết quả từ SAS The ANOVA Procedure Class Level Information Class Levels Values CT 3 A1 A2 A3 KHOI 4 I II III IV Number of observations 24

Page 15: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

50

KHOI NGAU NHIEN DAY DU TUONG TAC 11 HO VA TEN 10:29 Monday, June 26, 2000 The ANOVA Procedure Dependent Variable: KL Sum of Source DF Squares Mean Square F Value Pr > F Model 11 49929.83333 4539.07576 25.81 <.0001 Error 12 2110.00000 175.83333 Corrected Total 23 52039.83333 R-Square Coeff Var Root MSE KL Mean 0.959454 1.638244 13.26022 809.4167 Source DF Anova SS Mean Square F Value Pr > F CT 2 8025.58333 4012.79167 22.82 <.0001 KHOI 3 33816.83333 11272.27778 64.11 <.0001 CT*KHOI 6 8087.41667 1347.90278 7.67 0.0015 KHOI NGAU NHIEN DAY DU TUONG TAC 12 HO VA TEN 10:29 Monday, June 26, 2000 The ANOVA Procedure Duncan's Multiple Range Test for KL NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 175.8333 Number of Means 2 3 Critical Range 14.45 15.12 Means with the same letter are not significantly different. Duncan Grouping Mean N CT A 828.750 8 A1 A A 814.625 8 A2

B 784.875 8 A3

Xác suất của phép thử ñối với yếu tố Thức ăn P = 0,000 và tương tác (CT*KHOI) P = 0,001 < 0,05 (α), bác bỏ giả thiết H0 và chấp nhận ñối thiết H1. Kết luận công thức ăn có ảnh ñến tăng trọng của bê và có tương tác giữa công thức thức ăn và khối lượng bê vỗ béo (P < 0,05).

Page 16: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

51

3.5.3. Thí nghiệm kiểu Ô vuông latinh

ðối với mô hình thí nghiệm Ô vuông latinh, ngoài ô yếu tố thí nghiệm ta còn 2 yếu tố khác (yếu tố hàng và cột) tác ñộng lên ñối tượng thí nghiệm.

Ví dụ 7A: Một thí nghiệm ñược tiến hành nhằm xác ñịnh ảnh hưởng của các loại thức ăn bổ sung khác nhau (A, B, C và D) ñến lượng cỏ khô mà bê nuôi vỗ béo thu nhận ñược (kg/ngày). Thí nghiệm ñược thiết kế theo mô hình ô vuông la tinh với 4 ñộng vật trong 4 giai ñoạn, mỗi giai ñoạn 20 ngày. Trong mỗi giai ñoạn 10 ngày ñầu ñược coi là giai ñoạn thích nghi, 10 ngày tiếp theo là giai ñoạn thí nghiệm ñể thu thập số liệu. Số liệu thu ñược là khối lượng cỏ khô trung bình bê thu nhận ñược ở 10 ngày thí nghiệm. Hãy rút ra kết luận từ thí nghiệm nêu trên.

Bê Giai ñoạn 1 2 3 4

1 10,0 (B)

9,0 (D)

11,1 (C)

10,8 (A)

2 10,2 (C)

11,3 (A)

9,5 (D)

11,4 (B)

3 8,5 (D)

11,2 (B)

12,8 (A)

11 (C)

4 11,1 (A)

11,4 (C)

11,7 (B)

9,9 (D)

Mô hình phân tích

yi j k = µ + hi + cj + ak + ei j k

yi j k = quan sát ở hàng thứ i, cột thứ j và ở nghiệm thức k µ = trung bình chung, hi = chênh lệch do ảnh hưởng của hàng i, cj = chênh lệch do ảnh hưởng của cột j, ak = chênh lệch do ảnh hưởng của mức k của nhân tố, ei j k = sai số ngẫu nhiên; giả sử các ei j k ñộc lập, phân phối chuẩn N(0,σ²)

SAS CODE DATA SAS7; INPUT GD BE TA $ KLCO; CARDS; 1 1 B 10.0 2 1 C 10.2 3 1 D 8.5 4 1 A 11.1 1 2 D 9.0 2 2 A 11.3 3 2 B 11.2 4 2 C 11.4 1 3 C 11.1 2 3 D 9.5 3 3 A 12.8 4 3 B 11.7 1 4 A 10.8 2 4 B 11.4 3 4 C 11.0 4 4 D 9.9 ; PROC ANOVA; CLASS GD BE TA; MODEL KLCO = GD BE TA; MEANS TA / DUNCAN;

RUN;

Page 17: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

52

Kết quả từ SAS The ANOVA Procedure Class Level Information Class Levels Values GD 4 1 2 3 4 BE 4 1 2 3 4 TA 4 A B C D Number of observations 16 The ANOVA Procedure Dependent Variable: KLCO Sum of Source DF Squares Mean Square F Value Pr > F Model 9 17.09562500 1.89951389 13.12 0.0027 Error 6 0.86875000 0.14479167 Corrected Total 15 17.96437500 R-Square Coeff Var Root MSE KLCO Mean 0.951640 3.562458 0.380515 10.68125 Source DF Anova SS Mean Square F Value Pr > F GD 3 1.48187500 0.49395833 3.41 0.0938 BE 3 3.59187500 1.19729167 8.27 0.0149 TA 3 12.02187500 4.00729167 27.68 0.0007 The ANOVA Procedure Duncan's Multiple Range Test for KLCO NOTE:This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 6 Error Mean Square 0.144792 Number of Means 2 3 4 Critical Range .6584 .6823 .6942 Means with the same letter are not significantly different. Duncan Grouping Mean N TA A 11.5000 4 A A A 11.0750 4 B A A 10.9250 4 C

B 9.2250 4 D

Kết quả phân tích cho thấy xác suất của phép thử ñối với yếu tố thí nghiệm (TA) P = 0,0007, vì vậy giả thiết H0 bị bác bỏ kết luận Có ảnh hưởng của thức bổ sung ñến lượng cỏ khô mà bê thu nhận ñược (P < 0,05).

Page 18: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

53

Nếu thí nghiệm ñược tiến hành trên nhiều ô vuông latinh khác nhau việc phân tích số liệu sẽ bao gồm ảnh hưởng ảnh hưởng của 3 yếu tố trong một ô vuông (hàng, cột, yếu tố thí nghiệm) và ảnh hưởng của các ô. Ví dụ 7B: Giả sử, một thí nghiệm ñược thiết kế tương tự như ở ví dụ M-1.9a, nhưng có có 2 ô vuông la tinh ñược thiết kế ñồng thời và mỗi ô ñều có 4 ñộng vật thí nghiệm và 4 công thức thí nghiệm khác nhau. Số liệu ở ô vuông la tinh thứ nhất như trong ví dụ 7A, ô vuông la tinh thứ 2 như trong bảng bên. Hãy tiến hành phân tích ñể ñưa ra kết luận và ñưa ra nhận xét về mô hình thiết kế trong ví dụ 7A và 7B.

Bê Giai ñoạn 1 2 3 4

1 10,9 (C)

11,2 (A)

9,4 (D)

11,2 (B)

2 10,5 (B)

9,6 (D)

11,4 (C)

10,9 (A)

3 11,1 (A)

11,4 (C)

11,7 (B)

9,8 (D)

4 8,8 (D)

12,9 (B)

11,4 (A)

11,2 (C)

Mô hình phân tích

yi j km = µ + om + h(o)im + c(o)jm + ak + ei j km

yi j km = quan sát ở hàng thứ i, cột thứ j và ở nghiệm thức k µ = trung bình chung, h(o)im = chênh lệch do ảnh hưởng của hàng i, c(o)jm = chênh lệch do ảnh hưởng của cột j, ak = chênh lệch do ảnh hưởng của mức k của nhân tố, ei j k m = sai số ngẫu nhiên; giả sử các ei j k ñộc lập, phân phối chuẩn N(0,σ²)

SAS CODE DATA SAS7B; INPUT OV GD BE TA $ KLCO; CARDS; OV GD BE TA KLCO 1 1 1 B 10.0 1 2 1 C 10.2 1 3 1 D 8.5 1 4 1 A 11.1 1 1 2 D 9.0 . . 2 2 3 C 11.4 2 3 3 B 11.7 2 4 3 A 11.4 2 1 4 B 11.2 2 2 4 A 10.9 2 3 4 D 9.8 2 4 4 C 11.2 ; TITLE 'HAI O VUONG LA TINH' ; TITLE2 'HO VA TEN' ; PROC ANOVA; CLASS OV GD BE TA; MODEL KLCO = OV GD(OV) BE(OV) TA; MEANS TA / DUNCAN; RUN;

Page 19: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

54

Kết quả từ SAS HAI O VUONG LA TINH 10:29 Monday, June 26, 2000 16 HO VA TEN The ANOVA Procedure Class Level Information Class Levels Values OV 2 1 2 GD 4 1 2 3 4 BE 4 1 2 3 4 TA 4 A B C D Number of observations 33 NOTE: Due to missing values, only 32 observations can be used in this analysis. HAI O VUONG LA TINH 10:29 Monday, June 26, 2000 17 HO VA TEN The ANOVA Procedure Dependent Variable: KLCO Sum of Source DF Squares Mean Square F Value Pr > F Model 16 30.50250000 1.90640625 9.49 <.0001 Error 15 3.01468750 0.20097917 Corrected Total 31 33.51718750 R-Square Coeff Var Root MSE KLCO Mean 0.910055 4.166664 0.448307 10.75938 Source DF Anova SS Mean Square F Value Pr > F OV 1 0.19531250 0.19531250 0.97 0.3399 GD(OV) 6 2.14437500 0.35739583 1.78 0.1712 BE(OV) 6 5.49937500 0.91656250 4.56 0.0079 TA 3 22.66343750 7.55447917 37.59 <.0001

Page 20: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

55

HAI O VUONG LA TINH 10:29 Monday, June 26, 2000 18 HO VA TEN The ANOVA Procedure Duncan's Multiple Range Test for KLCO NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 15 Error Mean Square 0.200979 Number of Means 2 3 4 Critical Range .4778 .5008 .5152 Means with the same letter are not significantly different. Duncan Grouping Mean N TA A 11.3250 8 A A A 11.3250 8 B A A 11.0750 8 C

B 9.3125 8 D Kết quả phân tích cho thấy xác suất của phép thử ñối với yếu tố thí nghiệm (TA) P = 0,0007, vì vậy giả thiết H0 bị bác bỏ kết luận Có ảnh hưởng của thức bổ sung ñến lượng cỏ khô mà bê thu nhận ñược (P < 0,05).

3.5.4. Thí nghiệm 2 nhân tố chéo nhau

Với mô hình thí nghiệm 2 nhân tố chéo nhau, ngoài nghiên cứu tác ñộng của từng yếu tố thí nghiệm ta còn nghiên cứu mối tương tác giữa 2 yếu tố.

Ví dụ 8: Một nghiên cứu ñược tiến hành ñể xác ñịnh ảnh hưởng của việc bổ sung 2 loại vitamin (A và B) vào thức ăn ñến tăng trọng (kg/ngày) của lợn. Hai mức ñối với vitamin A (0 và 4 mg) và 2 mức ñối với vitamin B (0 và 5 mg) ñược sử dụng trong thí nghiệm này. Tổng số 20 lợn thí nghiệm ñược phân về 4 tổ hợp (công thức thí nghiệm) một cách ngẫu nhiên. Số liệu thu ñược khi kết thúc thí nghiệm ñược trình bày như sau:

A 0 mg 4 mg

B 0 mg 5 mg 0 mg 5 mg

0,585 0,567 0,473 0,684

0,536 0,545 0,450 0,702

0,458 0,589 0,869 0,900

0,486 0,536 0,473 0,698

0,536 0,549 0,464 0,693

Page 21: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

56

Mô hình phân tích yi j k = µ + αi + βj + (αβ)i j + ei j k

yi j k = quan sát thứ k ở mức i của nhân tố A và mức j của nhân tố B µ = là trung bình chung αi = ảnh hưởng mức i của nhân tố A, βj = ảnh hưởng mức j của nhân tố B, (ab)i j = tương tác giữa mức i của nhân tố A và mức j của nhân tố B ei j k = sai số ngẫu nhiên, giả sử các sai số ei j k ñộc lập, phân phối chuẩn N(0,σ2)

SAS CODE DATA SAS8; INPUT VITA VITB TT; CARDS; 0 0 0.585 0 0 0.536 0 0 0.458 0 0 0.486 0 0 0.536 0 5 0.567 0 5 0.545 0 5 0.589 0 5 0.536 0 5 0.549 4 0 0.473 4 0 0.450 4 0 0.869 4 0 0.473 4 0 0.464 4 5 0.684 4 5 0.702 4 5 0.900 4 5 0.698 4 5 0.693 ; TITLE 'HAI NHAN TO CHEO NHAU' ; TITLE2 'HO VA TEN' ; PROC ANOVA; CLASS VITA VITB; MODEL TT = VITA VITB VITA*VITB; MEANS VITA VITB / DUNCAN;

RUN; Kết quả từ SAS HAI NHAN TO CHEO NHAU 10:29 Monday, June 26, 2000 24 HO VA TEN The ANOVA Procedure Class Level Information Class Levels Values VITA 2 0 4 VITB 2 0 5 Number of observations 20

Page 22: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

57

The ANOVA Procedure Dependent Variable: TT Sum of Source DF Squares Mean Square F Value Pr > F Model 3 0.14521095 0.04840365 4.39 0.0196 Error 16 0.17648360 0.01103023 Corrected Total 19 0.32169455 R-Square Coeff Var Root MSE TT Mean 0.451394 17.81139 0.105025 0.589650 Source DF Anova SS Mean Square F Value Pr > F VITA 1 0.05191805 0.05191805 4.71 0.0454 VITB 1 0.06418445 0.06418445 5.82 0.0282 VITA*VITB 1 0.02910845 0.02910845 2.64 0.1238 The ANOVA Procedure Duncan's Multiple Range Test for TT NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 16 Error Mean Square 0.01103 Number of Means 2 Critical Range .09957 Means with the same letter are not significantly different. Duncan Grouping Mean N VITA A 0.64060 10 4 B 0.53870 10 0 The ANOVA Procedure Duncan's Multiple Range Test for TT NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 16 Error Mean Square 0.01103 Number of Means 2 Critical Range .09957 Means with the same letter are not significantly different. Duncan Grouping Mean N VITB A 0.64630 10 5

B 0.53300 10 0

Các giá trị xác suất 0,0454; 0,0282 và 0,1238 ñều ñược xem xét ñể ñưa ra quyết ñịnh với từng yếu tố (Vitamin A và Vitamin B) và tương tác giữa (Vitamin A × Vitamin B). Với xác suất 0,045 và 0,028 < 0,05 có thể kết luận Vitamin A và B có ảnh hưởng ñến tăng trọng của lợn nhưng không có sự tương tác (P = 0,14 > 0,05).

Page 23: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

58

3.5.5. Thí nghiệm hai nhân tố phân cấp

Với mô hình phân cấp, nhân tố cấp trên (A) là cố ñịnh và cấp dưới (B) là ngẫu nhiên. Như vậy B sẽ làm ổ (nested) trong A.

Ví dụ 9: Mục ñích của thí nghiệm là xác ñịnh ảnh hưởng của lợn ñực giống và lợn nái ñến khối lượng sơ sinh của thế hệ con. Mô hình phân cấp 2 yếu tố ñược sử dụng. Bốn lợn ñực giống ñược chọn ngẫu nhiên (a = 4), mỗi ñực phối với 3 lợn nái (b = 3) và mỗi nái sinh ñược 2 lợn con (r = 2). Khối lượng (kg) sơ sinh của từng lợn con thu ñược như sau:

Mô hình phân tích

yijk = µ + ai + bj (i) + eijk yijk = quan sát thứ k của mức j của yếu tố B trong mức i của yếu A; µ = là trung bình chung; ai = ảnh hưởng mức thứ i của nhân tố A; bj (i) = ảnh hưởng mức j của yếu tố B trong mức i của yếu tố A; ei jk = là sai số ngẫu nhiên; giả sử các ei jk ñộc lập phân phối chuẩn N(0,σ2)

SAS CODE OPTIONS PAGESIZE = 60 LINESIZE = 80; DATA SAS9; INPUT D N KL; CARDS; 1 1 1.2 1 2 1.2 1 3 1.1 2 4 1.2 2 5 1.1 2 6 1.2 3 7 1.2 3 8 1.3 3 9 1.2 4 10 1.3 4 11 1.4 4 12 1.3 1 1 1.2 1 2 1.3 1 3 1.2 2 4 1.2 2 5 1.2 2 6 1.1 3 7 1.2 3 8 1.3 3 9 1.2 4 10 1.3 4 11 1.4 4 12 1.3 ;

ðực 1 2 3 4

Nái 1 2 3 4 5 6 7 8 9 10 11 12

1,2 1,2 1,1 1,2 1,1 1,2 1,2 1,3 1,2 1,3 1,4 1,3

1,2 1,3 1,2 1,2 1,2 1,1 1,2 1,3 1,2 1,3 1,4 1,3

Page 24: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

59

TITLE 'HAI NHAN PHAN CAP NESTED' ; TITLE2 'HO VA TEN' ; PROC SORT; BY D N; RUN; PROC NESTED; CLASS D N; VAR KL; RUN; PROC MIXED DATA = SAS9; CLASS D N; MODEL KL = D; RANDOM N(D) ; RUN;

Sử dụng PROC NESTED nếu cả 2 yếu tố ñều là ngẫu nhiên và yếu tố ñứng sau trong câu lệnh CLASS ñược mạc ñịnh là Nested (làm tổ) trong yếu tố ñứng trước. Nếu trong mô hình có cả yếu tố ngẫu nhiên và cố ñịnh, PROC MIXED là một giải pháp phù hợp

Kết quả từ SAS: The NESTED Procedure Coefficients of Expected Mean Squares Source D N Error D 6 2 1 N 0 2 1 Error 0 0 1 Nested Random Effects Analysis of Variance for Variable KL Variance Sum of Error Source DF Squares F Value Pr > F Term Total 23 0.153333 D 3 0.093333 6.22 0.0174 N N 8 0.040000 3.00 0.0424 Error Error 12 0.020000 Nested Random Effects Analysis of Variance for Variable KL Variance Variance Percent Source Mean Square Component of Total Total 0.006667 0.007685 100.0000 D 0.031111 0.004352 56.6265 N 0.005000 0.001667 21.6867 Error 0.001667 0.001667 21.6867 KL Mean 1.23333333

Standard Error of KL Mean 0.03600411

Page 25: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

60

3.5.6. Thí nghiệm 2 nhân tố phân lô

Ví dụ 10A: Một thí nghiệm ñược tiến hành ñể nghiên cứu ảnh hưởng của bãi chăn thả A (1, 2,3 và 4) và lượng khoáng bổ sung B (1 và 2) ñến năng suất sữa. Có tất cả 24 bò tham gia thí nghiệm. Thí nghiệm ñược thiết kế theo mô hình hai nhân tố kiểu chia ô với yếu tố A ñược bố trí trên ô lớn và yếu tố B trên ô nhỏ trên 3 khối. Năng suất sữa trung bình ñược ghi lại như sau (kg /ngày):

Khối 1 Khối 2 Khối 3

A4 A1 A2 A3 A2 A1 A4 A3 A1 A2 A4 A3

B2

30 B2 27

B1

26 B2

26 B1

32 B2

30 B1

34 B1

33 B2

34 B1

30 B2

36 B1

33

B1 29

B1

25 B2

28 B1

24 B2

37 B1

31 B2

37 B2

32 B1

31 B2

31 B1

38 B2

32

Mô hình phân tích yijl = µ + ai + k l + (ak)il + bj + (ab)ij + eijl

Trong ñó: µ = trung bình chung ai = ảnh hưởng của mức i của nhân tố A (trên ô lớn); bj = ảnh hưởng của mức j của nhân tố B (trên ô nhỏ); kl = ảnh hưởng của khối l; (ak)il = tương tác giữa nhân tố A và khối và ñược dùng làm sai số ô lớn se2L (ab)ij = tương tác của hai nhân tố A và B ei jk = sai số ngẫu nhiên.

Lưu ý: Trong mô hình này khối coi như nhân tố ngẫu nhiên, không tương tác với B. Hai nhân tố A và B coi như nhân tố cố ñịnh

SAS CODE: DATA ANCOVA; INPUT KHOI A B SLS; CARDS; 1 4 2 30 1 4 1 29 1 1 2 27 1 1 1 25 1 2 1 26 1 2 2 28 1 3 2 26 1 3 1 24 2 2 1 32 2 2 2 37 2 1 2 30 2 1 1 31 2 4 1 34 2 4 2 37 2 3 1 33 2 3 2 32 3 1 2 34 3 1 1 31 3 2 1 30

Page 26: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

61

3 2 2 31 3 4 2 36 3 4 1 38 3 3 1 33 3 3 2 32 ; PROC MIXED; CLASS KHOI A B; MODEL SLS = A B A*B; RANDOM KHOI KHOI*A; LSMEANS A B/ PDIFF; RUN; PROC GLM; CLASS KHOI A B; MODEL SLS = KHOI A KHOI*A B A*B; RANDOM KHOI KHOI*A; LSMEANS A B / PDIFF; RUN;

Kết quả từ SAS: The Mixed Procedure Model Information Data Set WORK.SAS10 Dependent Variable SLS Covariance Structure Variance Components Estimation Method REML Residual Variance Method Profile Fixed Effects SE Method Model-Based Degrees of Freedom Method Containment Class Level Information Class Levels Values KHOI 3 1 2 3 A 4 1 2 3 4 B 2 1 2 Dimensions Covariance Parameters 3 Columns in X 15 Columns in Z 15 Subjects 1 Max Obs Per Subject 24 Observations Used 24 Observations Not Used 0 Total Observations 24 Iteration History Iteration Evaluations -2 Res Log Like Criterion 0 1 98.59796343 1 1 78.83196931 0.00000000 Convergence criteria met.

Page 27: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

62

Covariance Parameter Estimates Cov Parm Estimate KHOI 12.7431 KHOI*A 1.0486 Residual 2.2500 The Mixed Procedure Fit Statistics -2 Res Log Likelihood 78.8 AIC (smaller is better) 84.8 AICC (smaller is better) 86.8 BIC (smaller is better) 82.1 Type 3 Tests of Fixed Effects Num Den Effect DF DF F Value Pr > F A 3 6 5.46 0.0377 B 1 8 3.63 0.0932 A*B 3 8 0.86 0.4981 Least Squares Means Standard Effect A B Estimate Error DF t Value Pr > |t| A 1 29.6667 2.2298 6 13.30 <.0001 A 2 30.6667 2.2298 6 13.75 <.0001 A 3 30.0000 2.2298 6 13.45 <.0001 A 4 34.0000 2.2298 6 15.25 <.0001 B 1 30.5000 2.1266 8 14.34 <.0001 B 2 31.6667 2.1266 8 14.89 <.0001 Differences of Least Squares Means Standard Effect A B _A _B Estimate Error DF t Value Pr > |t| A 1 2 -1.0000 1.2038 6 -0.83 0.4379 A 1 3 -0.3333 1.2038 6 -0.28 0.7911 A 1 4 -4.3333 1.2038 6 -3.60 0.0114 A 2 3 0.6667 1.2038 6 0.55 0.5997 A 2 4 -3.3333 1.2038 6 -2.77 0.0325 A 3 4 -4.0000 1.2038 6 -3.32 0.0159

B 1 2 -1.1667 0.6124 8 -1.91 0.0932

Trong kết quả phân tích ta chỉ quan tâm ñến xác suất ñối với yếu tố A, B và tương tác A*B. Các giá trị này lần lượt là 0,0377; 0,0932 và 0,4981. Với các giá trị này ta có thể kết luận năng suất sữa có sự khác nhau giữa các bãi chăn thả (P < 0,05), tuy nhiên việc bổ sung các khoáng chất không làm ảnh hưởng ñến năng suất sữa và cũng không có ảnh hưởng tương tác giữa bãi chăn thả và việc bổ sung khoáng (P > 0,05).

Page 28: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

63

Ví dụ 10B: Xem xét ví dụ 10A, giả sử rằng thí nghiệm ñược thực hiện không có khối và chỉ có yếu tố A và B ñược thiết kê trên 12 ô lớn. Năng suất sữa trung bình ñược ghi lại như sau (kg /ngày): 1 2 3 4 5 6 7 8 9 10 11 12

A4 A1 A2 A3 A2 A1 A4 A3 A1 A2 A4 A3

B2

30 B2

27 B1

26 B2

26 B1

32 B2

30 B1

34 B1

33 B2

34 B1

30 B2

36 B1

33

B1 29

B1

25 B2

28 B1

24 B2

37 B1

31 B2

37 B2

32 B1

31 B2

31 B1

38 B2

32

Chọn OK ñể có kết quả yijkl = µ + ai + o(a)ik + bj + (ab)ij + eijkl ;

Trong ñó: µ = trung bình chung ai = ảnh hưởng của mức i của nhân tố A (trên ô lớn); bj = ảnh hưởng của mức j của nhân tố B (trên ô nhỏ); o(a)ik = sai số của ô lớn; (ab)ij = tương tác của hai nhân tố A và B ei jkl = sai số ngẫu nhiên.

SAS CODE: The SAS System 09:09 Tuesday, June 27, 2000 49 The Mixed Procedure Model Information Data Set WORK.SAS10A Dependent Variable SLS Covariance Structure Variance Components Estimation Method REML Residual Variance Method Profile Fixed Effects SE Method Model-Based Degrees of Freedom Method Containment Class Level Information Class Levels Values O 12 1 2 3 4 5 6 7 8 9 10 11 12 A 4 1 2 3 4 B 2 1 2 Dimensions Covariance Parameters 2 Columns in X 15 Columns in Z 12 Subjects 1 Max Obs Per Subject 24 Observations Used 24 Observations Not Used 0 Total Observations 24

Page 29: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

64

Iteration History Iteration Evaluations -2 Res Log Like Criterion 0 1 98.59796343 1 1 87.84738379 0.00000000 Convergence criteria met. Covariance Parameter Estimates Cov Parm Estimate O(A) 13.7917 Residual 2.2500 The SAS System 09:09 Tuesday, June 27, 2000 50 The Mixed Procedure Fit Statistics -2 Res Log Likelihood 87.8 AIC (smaller is better) 91.8 AICC (smaller is better) 92.8 BIC (smaller is better) 92.8 Type 3 Tests of Fixed Effects Num Den Effect DF DF F Value Pr > F A 3 8 0.80 0.5302 B 1 8 3.63 0.0932

A*B 3 8 0.86 0.4981

Trong ví dụ này, yếu tố ô (O) ñược coi là ngẫu nhiên và Ô nested trong yếu tố A. Sai số ô lớn chính là O(A). Chính vì vậy mà giá trị F của yếu tố A ñược tính 23,722/ 29,833 = 0,80. Ba giá trị xác suất quan tâm ñến bao gồm 0,5302; 0,0932 và 0,4981 tương ứng với yếu tố A, B và tương tác A*B. Với cách thiết kế thí nghiệm theo mô hình thứ 2 (10B) ta ñã không tìm thấy ảnh hưởng của bất kỳ một yếu tố nào (P > 0,05).

3.5.7. Phép ño lặp lại

Trong các thí nghiệm này, phép ño lặp lại trên cùng một ñơn vị thí nghiệm trong một khoảng thời gian nhất ñịnh. Ví dụ năng suất trong một chu kỳ tiết sữa, sinh trưởng tích luỹ của vật nuôi qua các thời ñiểm khác nhau; giá trị pH, màu sắc của một sản phẩm ño tại các thời ñiểm khác nhau.

Page 30: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

65

Khi tiến hành các phép ño trên cùng một ñơn vị thí nghiệm, có thể tồn tại mối tương quan giữa các lần ño trên cùng một cá thể. Ví dụ sản lượng sữa bò của một cá thể cao ở tháng thứ 3 thì xu hướng ở tháng thứ 4 cũng sẽ cao mặc dù ñó là công thức thí nghiệm nào

Ví dụ 11: Tiến hành ño pH cơ thăn trên 13 bò vàng, 14 bò LaiSind tại các thời ñiểm 1, 12, 36, 48 giờ, 6 và 8 ngày. Số liệu thu ñược như sau:

STT THOIDIEM SOTAI GIONG pH STT THOIDIEM SOTAI GIONG pH

1 01H 1 BV 6.72 26 01H 32 LS 6.71

2 01H 2 BV 6.42 27 01H 33 LS 6.81

3 01H 3 BV 6.51 28 01H 34 LS 6.62

4 01H 4 BV 6.92 29 01H 38 LS 6.81

5 01H 5 BV 6.63 30 01H 39 LS 6.82

6 12H 1 BV 5.39 31 12H 32 LS 5.99

7 12H 2 BV 6.25 32 12H 33 LS 5.98

8 12H 3 BV 5.88 33 12H 34 LS 5.9

9 12H 4 BV 6.92 34 12H 38 LS 5.57

10 12H 5 BV 5.93 35 12H 39 LS 5.54

11 36H 1 BV 5.39 36 36H 32 LS 5.47

12 36H 2 BV 5.47 37 36H 33 LS 5.68

13 36H 3 BV 5.47 38 36H 34 LS 5.46

14 36H 4 BV 5.42 39 36H 38 LS 5.55

15 36H 5 BV 5.43 40 36H 39 LS 5.62

16 48H 1 BV 5.42 41 48H 32 LS 5.45

17 48H 2 BV 5.48 42 48H 33 LS 5.74

18 48H 3 BV 5.48 43 48H 34 LS 5.52

19 48H 4 BV 5.37 44 48H 38 LS 5.56

20 48H 5 BV 5.44 45 48H 39 LS 5.48

21 8D 1 BV 5.43 46 8D 32 LS 5.42

22 8D 2 BV 5.49 47 8D 33 LS 5.77

23 8D 3 BV 5.47 48 8D 34 LS 5.49

24 8D 4 BV 5.4 49 8D 38 LS 5.13

25 8D 5 BV 5.43 50 8D 39 LS 5.55

Xác ñịnh mức ñộ ảnh hưởng của các yếu tố ñến các chỉ tiêu chất lượng thịt theo mô hình thống kê sau:

yijk = µ + αi+ δj(αi) + τk+ (α∗τ)ik + εijk

Trong ñó, yijk: giá trị quan sát ở thời ñiểm bảo quản thứ k ñối với ñộng vật thứ j của giống i,

µ : trung bình của chỉ tiêu nghiên cứu,

Page 31: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

66

αi : ảnh hưởng cố ñịnh của giống thứ i,

δj(αi): ảnh hưởng ngẫu nhiên của ñộng vật thứ j ở giống thứ i,

τk : ảnh hưởng của thời ñiểm sau giết thịt thứ k,

(α∗τ)ik: tương tác của giống thứ i với thời ñiểm sau giết thịt thứ k,

εij : sai số ngẫu nhiên ở thời ñiểm bảo quản thứ k ñối với ñộng vật thứ j ở giống thứ i.

SAS CODE:

PROC GLM; CLASS GIONG SOTAI THOIDIEM; MODEL pH = GIONG SOTAI(GIONG) THOIDIEM GIONG*THOIDIEM / SS4; RANDOM SOTAI(GIONG)/ TEST; LSMEANS THOIDIEM/ STDERR PDIFF ADJUST = TUKEY; RUN;

Kết quả từ SAS: The GLM Procedure Class Level Information Class Levels Values GIONG 2 BV LS SOTAI 10 1 2 3 4 5 32 33 34 38 39 THOIDIEM 5 01H 12H 36H 48H 8D Number of observations 50 The GLM Procedure Dependent Variable: pH Sum of Source DF Squares Mean Square F Value Pr > F Model 17 12.05487200 0.70911012 15.55 <.0001 Error 32 1.45972800 0.04561650 Corrected Total 49 13.51460000 R-Square Coeff Var Root MSE pH Mean 0.891989 3.672287 0.213580 5.816000 Source DF Type IV SS Mean Square F Value Pr > F GIONG 1 0.00460800 0.00460800 0.10 0.7527 SOTAI(GIONG) 8 0.51415200 0.06426900 1.41 0.2306 THOIDIEM 4 11.24570000 2.81142500 61.63 <.0001 GIONG*THOIDIEM 4 0.29041200 0.07260300 1.59 0.2005

Page 32: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

67

The GLM Procedure Source Type IV Expected Mean Square GIONG Var(Error) + 5 Var(SOTAI(GIONG)) + Q(GIONG,GIONG*THOIDIEM) SOTAI(GIONG) Var(Error) + 5 Var(SOTAI(GIONG)) THOIDIEM Var(Error) + Q(THOIDIEM,GIONG*THOIDIEM) GIONG*THOIDIEM Var(Error) + Q(GIONG*THOIDIEM) The GLM Procedure Tests of Hypotheses for Mixed Model Analysis of Variance Dependent Variable: pH Source DF Type IV SS Mean Square F Value Pr > F * GIONG 1 0.004608 0.004608 0.07 0.7957 Error 8 0.514152 0.064269 Error: MS(SOTAI(GIONG)) * This test assumes one or more other fixed effects are zero. Source DF Type IV SS Mean Square F Value Pr > F SOTAI(GIONG) 8 0.514152 0.064269 1.41 0.2306 * THOIDIEM 4 11.245700 2.811425 61.63 <.0001 GIONG*THOIDIEM 4 0.290412 0.072603 1.59 0.2005 Error: MS(Error) 32 1.459728 0.045616 * This test assumes one or more other fixed effects are zero. Least Squares Means Adjustment for Multiple Comparisons: Tukey Standard LSMEAN THOIDIEM pH LSMEAN Error Pr > |t| Number 01H 6.69700000 0.06753999 <.0001 1 12H 5.93500000 0.06753999 <.0001 2 36H 5.49600000 0.06753999 <.0001 3 48H 5.49400000 0.06753999 <.0001 4 8D 5.45800000 0.06753999 <.0001 5 Least Squares Means for effect THOIDIEM Pr > |t| for H0: LSMean(i)=LSMean(j) Dependent Variable: pH i/j 1 2 3 4 5 1 <.0001 <.0001 <.0001 <.0001 2 <.0001 0.0006 0.0005 0.0002 3 <.0001 0.0006 1.0000 0.9944 4 <.0001 0.0005 1.0000 0.9955 5 <.0001 0.0002 0.9944 0.9955

Page 33: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

68

3.5.8. Phân tích hiệp phương sai

Trong phân tích hiệp phương sai (ANCOVA), biến phụ thuộc ñược giải thích bằng biến ñộc lập thứ hạng và biến ñộc lập liên tục. Hiệp phương sai ñược sử dụng ñể hiệu chỉnh sự biến ñộng bằng có thể do biến ñộc lập liên tục tạo nên. Ví dụ: Tiến hành nuôi vỗ béo lợn ở 3 công thức thức ăn (A, B và C) trong 90 ngày. Khối lượng (kg) của từng ñộng vật thí nghiệm tại thời ñiểm bắt ñầu và kết thúc nuôi vỗ béo ñược trình bày ở bảng sau:

KP A A A A A B B B B B C C C C C

P0 35 40 36 35 34 39 34 41 43 39 40 32 33 39 42

P1 122 130 124 123 121 128 120 129 132 127 129 116 117 129 132

TT 967 1000 978 978 967 989 956 978 989 978 989 933 933 1000 1000

Ta có thể phân tích số liệu như mô hình thiết kế thí nghiệm một yếu tố hoàn toàn ngẫu nhiên như ñã nêu ở mục 3.5.1 với biến phụ thuộc là tăng trọng và một biến ñộc lập (yếu tố thí nghiệm) là công thức thức ăn.

SAS CODE: DATA ANCOVA; INPUT KP $ P0 P1 TT; CARDS; A 35 122 967

A 40 130 1000

A 36 124 978

A 35 123 978

A 34 121 967

B 39 128 989

B 34 120 956

B 41 129 978

B 43 132 989

B 39 127 978

C 40 129 989

C 32 116 933

C 33 117 933

C 39 129 1000

C 42 132 1000

; PROC GLM; CLASS KP; MODEL TT = KP; RUN;

Page 34: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

69

Kết quả từ SAS: The GLM Procedure Class Level Information Class Levels Values KP 3 A B C Number of observations 15 The GLM Procedure Dependent Variable: TT Sum of Source DF Squares Mean Square F Value Pr > F Model 2 163.333333 81.666667 0.15 0.8586 Error 12 6346.000000 528.833333 Corrected Total 14 6509.333333 R-Square Coeff Var Root MSE TT Mean 0.025092 2.356991 22.99638 975.6667 Source DF Type I SS Mean Square F Value Pr > F KP 2 163.3333333 81.6666667 0.15 0.8586 Source DF Type III SS Mean Square F Value Pr > F KP 2 163.3333333 81.6666667 0.15 0.8586

Nếu phân tích số liệu theo mô hình này ta có thể ñã bỏ qua một thông tin quan trọng ñó là, những cá thể có khối lượng ban ñầu lớn hơn cho tăng trọng trung bình sẽ cao hơn. ðể khắc phục hạn chế này ta sẽ sử dụng phép phân tích hiệp phương sai.

Mô hình phân tích yi j = µ + αi + βxi j + ei j

yi j = quan sát thứ j ở công thức i µ = là trung bình chung αi = ảnh hưởng ở mức i của yếu tố cố ñịnh thí nghiệm, βxi j = ảnh hưởng của biến ñộc lập liên tục, ei j = sai số ngẫu nhiên, giả sử các sai số ei j k ñộc lập, phân phối chuẩn N(0,σ2)

SAS CODE: PROC GLM; CLASS KP; MODEL TT = P0 KP; RUN;

Page 35: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

70

Kết quả từ SAS: The GLM Procedure Class Level Information Class Levels Values KP 3 A B C Number of observations 15 The GLM Procedure Dependent Variable: TT Sum of Source DF Squares Mean Square F Value Pr > F Model 3 5409.734432 1803.244811 18.04 0.0001 Error 11 1099.598901 99.963536 Corrected Total 14 6509.333333 R-Square Coeff Var Root MSE TT Mean 0.831073 1.024753 9.998177 975.6667 Source DF Type I SS Mean Square F Value Pr > F P0 1 4543.542961 4543.542961 45.45 <.0001 KP 2 866.191472 433.095736 4.33 0.0410 Source DF Type III SS Mean Square F Value Pr > F P0 1 5246.401099 5246.401099 52.48 <.0001

KP 2 866.191472 433.095736 4.33 0.0410

Việc áp dụng ANCOVA ñã cho ta kết quả hoàn toàn khác với phân tích ANOVA một yếu tố hoàn toàn ngẫu nhiên.

Trong bảng phân tích phương sai trên ta thấy, khối lượng ban ñầu ảnh hưởng một cách rõ rệt ñến tăng trọng của ñộng vật thí nghiêm (P<0,0001) và cũng tồn tại ảnh hưởng của các công thức thức ăn ñến tăng trọng của lợn (P = 0,0410 < 0,05).

Page 36: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

71

3.5.9. Bảng tương liên

Khi so sánh các tỷ lệ hoặc nghiên cứu mối liên hệ giữa các yếu tố ñối với biến ñịnh tính ta luôn ñặt giả thiết H0: Không có sự sai khác có ý nghĩa thống kê giữa các tỷ lệ hoặc Không có mối liên hệ giữa các yếu tố (tuỳ theo mục tiêu của bài toán ñặt ra)

Ví dụ 11: Một thí nghiệm ñược tiến hành nhằm ñánh giá sự liên hệ giữa tỷ lệ viêm nội mạc tử cung và giống. Trong tổng số 700 bò sữa trong nghiên cứu thuần tập (cohort studies), có 500 con giống Holstein Friesian và 200 con giống Jersey. Kết quả nghiên cứu thu ñược như sau:

Giống Viêm nội mạc tử cung Tổng số

Có Không

Holstein 100 400 500

Jersey 10 190 200

Tổng số 110 590 700

SAS CODE: DATA SAS11; INPUT GIONG $ BENH $ SOLUONG; CARDS; H C 100 H K 400 J C 10 J K 190 ; PROC FREQ; WEIGHT SOLUONG; TABLE GIONG*BENH / CHISQ;

RUN;

Kết quả từ SAS: The FREQ Procedure Table of GIONG by BENH GIONG BENH Frequency‚ Percent ‚ Row Pct ‚ Col Pct ‚C ‚K ‚ Total ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ H ‚ 100 ‚ 400 ‚ 500 ‚ 14.29 ‚ 57.14 ‚ 71.43 ‚ 20.00 ‚ 80.00 ‚ ‚ 90.91 ‚ 67.80 ‚ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ J ‚ 10 ‚ 190 ‚ 200 ‚ 1.43 ‚ 27.14 ‚ 28.57 ‚ 5.00 ‚ 95.00 ‚ ‚ 9.09 ‚ 32.20 ‚ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ Total 110 590 700 15.71 84.29 100.00

Page 37: Ph ần 3 - vetvn.files.wordpress.com · ðây là bài toán ki ểm ñịnh gi ả thi ết ñơ n. Quy t ắc ki ểm ñịnh c ăn c ứ vào hai giá tr ị c ụ th ể Θ1

73

Statistics for Table of GIONG by BENH Statistic DF Value Prob ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Chi-Square 1 24.2681 <.0001 Likelihood Ratio Chi-Square 1 29.0537 <.0001 Continuity Adj. Chi-Square 1 23.1488 <.0001 Mantel-Haenszel Chi-Square 1 24.2334 <.0001 Phi Coefficient 0.1862 Contingency Coefficient 0.1830 Cramer's V 0.1862 Fisher's Exact Test ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Cell (1,1) Frequency (F) 100 Left-sided Pr <= F 1.0000 Right-sided Pr >= F 8.496E-08 Table Probability (P) 6.784E-08 Two-sided Pr <= P 1.371E-07

Sample Size = 700

Trong phần kết quả ñối với từng ô ta có 3 giá trị. Ví dụ ñối với ô thứ nhất lần lượt là: 1) Tần suất quan sát (400), 2) Phần trăm theo hàng (80%) và 3) tần suất ước tính (421,4).

Giá trị Chi-Square χ² = 24,268, bậc tự do DF = 1 và xác suất P < 0,0001. Với xác suất này giả thiết H0 bị bác bỏ và kết luận Có mối liên hệ giữa bệnh viêm nội mạc tử và giống bò (P< 0,001).

Lưu ý: ðối với trường hợp mẫu bé (Ei < 5), có thể thay thế phép thử c² bằng phép thử Fisher Exact Test: PROC FREQ; WEIGHT SOLUONG; TABLE GIONG*BENH / EXACT; RUN;