Download - 第六章 卡平方 ( χ 2 ) 测验
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 1
第六章第六章卡平方卡平方 ((χχ22)) 测验测验
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 2
6.16.1 卡平方卡平方 (χ(χ22)) 的定义与分布 的定义与分布
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 3
χ2的定义一:22222
221
2 )(
i
iiini
yuuuuu
若所研究的对象来自同一总体,则μi=μ , σi=σ, 从而
22 )(
iy
χχ22 分布图形为一组具有不同自由度分布图形为一组具有不同自由度 νν 值的曲线。 值的曲线。 χχ22 值最小值最小为为 00 ,最大为,最大为 +∞+∞ ,因而在坐标轴的右边。附表,因而在坐标轴的右边。附表 66 为为 χχ2≥ 2≥
时的右尾概率表。时的右尾概率表。
2p
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 4
若所研究的总体 μ不知,而以样本 代替,则
y
2
2
2
2
22
22
)1(
)(1
)(
ssn
yyyy
ii
χχ22 的定义二:的定义二:用于次数资料用于次数资料 (( 计数资料计数资料 )) 分析的分析的 χχ22 公式:公式:
E
EO 22 )(
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 5
6.2 6.2 χχ22 在方差的同质性测验中的应用 在方差的同质性测验中的应用
6.2.1 6.2.1 一个样本方差与给定总体方差一个样本方差与给定总体方差比较的假设测验 比较的假设测验
6.2.2 6.2.2 几个样本方差的同质性测验几个样本方差的同质性测验
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 6
6.2.1 一个样本方差与给定总体方差比较的假设测验
2
22
s 可用来测验单个样本方差 s2 所代表的总体方差和
给定的方差值 C 是否有显著差异,简称为一个样本与给定总体方差的比较。
在作两尾测验时有 H0 :σ2=C ,对 HA :σ2≠C。其显著
时时 H0 将被否定。将被否定。2
),21(
2
,2 大于 和小于和小于
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 7
[例 6.1P131] 硫酸铵施于水田表层试验,得 4 个小区的稻谷产量为 517 、 492 、 514 、 522(kg) ,计得样本方差为 175.6(kg)2 。现要测验 H0 :σ2=50 (kg)2 对 HA :σ2≠ 50 (kg)2 ,α取 0.05 。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 8
查附表 6,在 ν=n-1=3 时, χ2的临界值为:
54.1050
6.175)14()1(2
22
sn
22.0,35.9 2975.0
2025.0
现 χχ22=10.54> ,=10.54> , 在在 0.220.22 ~~ 9.359.35 的范围之的范围之外,外, HH00 被否定。被否定。
35.92025.0
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 9
总体方差 σ2 的置信区间
[例 6.3 ]求列 6.1 资料总体 σ2的 95% 的置信限。
12
,22
22
,21
sP
2
,21
22
2
,2
2
ss
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 10
于是 95% 的置信限为: 56.3≤ σ2 ≤2394.5
5.239422.0
6.17532
,21
2
2
sL
3.5635.9
6.17532
,2
2
1
sL
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 11
6.2.2 几个样本方差的同质性测验
假定有 3个或 3个以上样本,每一样本均可估计同一方差,则由 χ2可测验各样本方差是否来自相同方差总体的假设,这称为方差的同质性测验 (test for homogeneity among variances) 。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 12
不全相等。 、 、 、 对2 2
221
2 22
21 0: , :k A kH H
这一测验由 Bartlett(1937) 提出,故又称为 Bartlett 测验 (Bartlett test)
假如有 k个独立的方差估计值:
22
222
2
22
211
1
21
)(1
;;)(1
;)(1
kkk
k yys
yysyys
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 13
Bartlett χ2值为:
合并的方差为:
k
iii
k
iip ss
1
2
1
2 /
k
i
k
iiipiC ss
C 1 1
222 lglg)(3026.2
k
i iik
c1
1
)1(3
11
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 14
2,
2 C如果算得的
,便否定 H0 ,表明这些样本所属总体方差
是不同质的。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 15
6.3 6.3 适合性测验适合性测验
6.3.1 6.3.1 适合性适合性 χχ22 测验的方法 测验的方法
6.3.2 6.3.2 次数分布的适合性测验次数分布的适合性测验
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 16
6.3.1 适合性 χ2 测验的方法
适合性测验 (test for goodness-of-fit): 比较实验数据与理论假设是否符合的假设测验。现以玉米花粉粒碘染反应为例,予以说明:
碘反应 观察次数 (O) 理论次数 (E) O-E (O-E)2/E
蓝色 3437(O1) 3459.5(E1) -22.5 0.1463
非蓝色 3482(O2) 3459.5(E2) +22.5 0.1463
总数 6919 6919 0 0.2926
玉米花粉粒碘反应观察次数与理论次数
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 17
1 、设立无效假设,即假设观察次数与理论次数的差异由抽样误差所引起。本例 H0 :花粉粒碘反应比例为 1:1 与 HA :花粉粒碘反应比例不成 1:1 。2、确定显著水平 α=0.05 。3、在无效假设为正确的假设下,计算超过观察 χ2 值的概率。试验观察的 χ2 值愈大,观察次数与理论次数之间相差程度也愈大,两者相符的概率就愈小。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 18
4 、依所得概率值的大小,接受或否定无效假设。若实 2
,2
得 ,否定 H0 ;若实得2
,2
时,则 H0 被接受。
χ2 分布是连续的,而次数资料则是间断的。由间断性资料算得的 χ2 值有偏大的趋势(尤其是在 ν=1 时 ),需作连续性矫正。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 19
E
EOC
22 )21|(|
本例
2798.05.3459
)21|5.22(|
5.3459
)21|5.22(| 222
C
与理论次数相符,接受玉米与理论次数相符,接受玉米 FF11 代花粉粒碘反应比代花粉粒碘反应比率为率为 1:11:1 的假设。 的假设。
84.321,05.0 查附表 6,当 νν==kk-1=2-1=1-1=2-1=1 时,时, ,实得,实得
21,05.0χχ22=0.2798 =0.2798 小于小于 ,所以接受,所以接受 HH00 。即认为观察次数。即认为观察次数
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 20
6.3.2 次数分布的适合性测验
适合性测验还经常用来测验试验数据的次数分布是否和某种理论分布相符,以推断实际的次数分布究竟属于哪一种分布类型。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 21
[例 6.7P137 ]在大豆品种 Richland 田间考察单株粒重的变异是否符合正态分布。考查数据归成次数分布表 (如下 ),组距为 5g ,该分布的次数 n、平均数、标准差均列于表基部。
假设 H0:观察分布符合理论分布,对 HA:观察分布不符合理论分布。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 22
计算各组的理论次数: 理论次数 =理论频率 (p) ×总观察次数(n)第 1 组
0195.0)065.2(
)80.12
93.315.5()5.5(
uPs
yyuPyP
理论次数 =0.0195×229=4.5
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 23
理论次数 =0.0276×229=6.3
0276.00195.00471.0
)674.1065.2()5.105.5(
uPyP
余类推,将计算结果列入表中:
第 2 组
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 24
单 株 产 量 次数(O)
p 理论次数(E)
χ2
组限 (y) 组中点
0.5~5.5 3 7 -26.43 -2.065 0.0195 4.5 1.39
5.5~10.5 8 5 -21.43 -1.674 0.0277 6.3 0.27
10.5~15.5 13 7 -16.43 -1.284 0.0525 12.0 2.08
15.5~20.5 18 18 -11.43 -0.893 0.0863 19.8 0.16
20.5~25.5 23 32 -6.43 -0.502 0.1219 27.9 0.60
25.5~30.5 28 41 -1.43 -0.112 0.1477 33.8 1.53
30.5~35.5 33 37 3.57 0.279 0.1545 35.4 0.07
35.5~40.5 38 25 8.57 0.670 0.1386 31.7 1.42
40.5~45.5 43 22 13.57 1.060 0.1068 24.5 0.26
45.5~50.5 48 19 18.57 1.451 0.0712 16.3 0.45
50.5~55.5 53 6 23.57 1.841 0.0405 9.3 1.17
55.5~60.5 58 6 28.57 2.232 0.0201 4.6 0.43
60.5~65.5 63 3 33.57 2.623 0.0084 1.9 0.64
65.5~70.5 68 1 38.57 3.013 0.0014 1.0 0.00
n=229 =31.93 s=12.80 ν=14-3=11 Χ2=10.47
s
yy yy
大豆单株粒重观察分布与理论正态分布的适合性测验
y
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 25
查附表 6,自由度为 11 时, χ2=10.47 的概率 P在 0.25-0.50范围内,观察分布与理论分布无显著差异,接受 H0,说明大豆单株粒重的分布符合正态分布。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 26
注意:注意:11 、总观察次数、总观察次数 nn 应较大,一般不小于应较大,一般不小于 5050 。。22 、分组数最好在、分组数最好在 55 组以上。组以上。33 、每组理论次数不宜太少,至少为、每组理论次数不宜太少,至少为 55 ,尤,尤其首尾各组。若组理论次数少于其首尾各组。若组理论次数少于 55 ,最好,最好将相邻组的次数合并为一组。将相邻组的次数合并为一组。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 27
6.4 6.4 独立性测验独立性测验
6.4.1 2×26.4.1 2×2 表的独立性测验 表的独立性测验
6.4.2 2×c6.4.2 2×c 表的独立性测验 表的独立性测验
6.4.3 r×c6.4.3 r×c 表的独立性测验 表的独立性测验
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 28
χχ22 应用于独立性测验应用于独立性测验 (test for independence)(test for independence) ,,主要为探求两个变数间是否独立。这是次数资料主要为探求两个变数间是否独立。这是次数资料的一种相关性研究。的一种相关性研究。
假设假设 HH00 :两个变数相互独立,对:两个变数相互独立,对 HHAA :两个变数:两个变数
彼此相关。彼此相关。
2,当观察的当观察的 χχ22<< 时,接受时,接受 HH00 ,即两个变数相互独立;,即两个变数相互独立;2
,当观察的当观察的 χχ22≥≥ 时,否定时,否定 HH00 ,接受,接受 HHAA ,即两个变数相关。,即两个变数相关。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 29
6.4.1 2×2 表的独立性测验
2×2 相依表是指横行和纵行皆分为两组的资料。其 ν=(2-1)(2-1)=1 ,计算的 χ2值需作连续性矫正。[例 6.8P139 ]调查经过种子灭菌处理与未经种子灭菌处理的小麦发生散黑穗病的穗数,得相依表如下,试分析种子灭菌与否和散黑穗病穗多少是否有关。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 30
处理项目 发病穗数 未发病穗数 总数种子灭菌 26(34.7) 50(41.3) 76
种子未灭菌 184(175.3) 200(208.7) 384
总数 210 250 460
H0 :种子灭菌与否和散黑穗病病穗多少无关;HA :种子灭菌与否和散黑穗病病穗多少有关。
显著水平α=0.05 。测验计算
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 31
在 H0为正确的假设下,对于 11细格,由于它是属于种子灭菌的,故种子作灭菌处理的概率为 76/460 ;它又是属于发病穗数的,发病穗数的概率为 210/460 。因此,任一经种子作灭菌处理而又发病的麦穗的概率为 p11=(76/460) ×(210/460) ,
因此格子 11 的理论次数为:E11=p11×n= (76/460) ×(210/460) ×460=34.7
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 32
用同样的方法算出其余格子的理论次数,并将其写入上表的括号中。
267.47.208
)5.0|7.208200(|
3.175
)5.0|3.175184(|
3.41
)5.0|3.4150(|
7.34
)5.0|7.3426(|
22
222
C
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 33
查附表 6, 现实得 故 P<0.05 ,否定 H0 。即种子灭菌与否和散黑穗病发病高低有关,种子灭散黑穗病发病高低有关,种子灭菌对防治小麦散黑穗病有一定效果。菌对防治小麦散黑穗病有一定效果。
84.321,05.0 2
1,05.02 267.4 C
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 34
6.4.2 2×c 表的独立性测验
2×c表是指横行分为两组,纵行分为c≥3组的相依表资料。其ν=(2-1)(c-1)>1,故无需作连续性矫正。
[例[例 6.96.9 ]进行大豆等位酶]进行大豆等位酶 AphAph 的电泳分析,的电泳分析, 191933份野生大豆、份野生大豆、 223223份栽培大豆等位基因型的次份栽培大豆等位基因型的次数列于下表,试分析大豆数列于下表,试分析大豆 AphAph等位酶的等位基因等位酶的等位基因频率是否因物种而不同。频率是否因物种而不同。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 35
假设 H0:等位基因频率与物种无关;对 HA:不同物种等位基因频率不同。显著水平α=0.05
物种 等位基因 总计1 2 3
野生大豆 29(23.66) 68(123.87) 96(45.47) 193
栽培大豆 22(27.34) 199(143.13) 2(52.53) 223
总计 51 267 98 416
02.15453.52
)53.522(
87.123
)87.12368(
66.23
)66.2329( 2222
05.0;02.154;99.5 22,05.0
222,05.0 P 现实得
否定 H0,接受 HA。即不同物种 Aph等位基因频率有显著相关。
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 36
6.4.3 r×c 表的独立性测验
若横行分 r组,纵行分 c组,且 r≥3, c≥3,则为 r×c 相依表,其 ν=(r-1)(c-1)
[例 6.10P141] 下表为不同灌溉方式下水稻叶片衰老情况的调查资料。试测验稻叶衰老情况是否与灌溉方式有关。灌溉方式 绿叶数 黄叶数 枯叶数 总计
深水 146(140.69) 7(8.78) 7(10.53) 160
浅水 183(180.26) 8(11.24) 13(13.49) 205
湿润 152(160.04) 14(9.98) 16(11.98) 182
总计 481 30 36 547
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作 37
假设 H0:稻叶衰老情况与灌溉方式无关;对 HA:稻叶衰老情况与灌溉方式无关。取α=0.05 。
62.598.11
)98.1116(
78.8
)78.87(
69.140
)69.140146( 2222
0.05 62.5 ,49.9 24,05.0
224,05.0 P 现
接受 H0 :不同的灌溉方式对水稻叶片的衰老情况没有显著影响。