内容正文:
§2 独立性检验
●趣味导入[来源:Zxxk.Com]
饮用水的质量是人类普遍关心的问题,据统计,饮用优质水的518人中,身体状况优秀的有466人;饮用水质一般的312人中,身体状况优秀的有218人.
问:人的身体健康状况与饮用水的质量有关系吗?
●学案导引
知识点
独立性检验的有关概念
理解
1.2×2列联表
设A,B为两个变量,每一个变量都可以取两个值,变量A:A1和A2,A2=1;变量B:B1和B2,B2=1,用如下列联表表示抽样数据:
B
A
B1
B2
总计
A1
a
b
a+b
A2
c
d
c+d
总计
a+c
b+d
n=a+b+c+d
并将形如此表的表格称为2×2列联表.根据2×2列联表中的数据判断两个变量A,B是否独立的问题叫2×2列联表的独立性检验.当-·大时,变量之间不独立.
2.统计量(χ2)的计算公式
χ2=.
3.独立性判断的方法
当χ2≤2.706时,可以认为变量A,B没有关联;
当χ2>2.706时,有90%的把握判定变量A,B有关联;
当χ2>3.841时,有95%的把握判定变量A,B有关联;
当χ2>6.635时,有99%的把握判定变量A,B有关联.
●思考探究
1.利用独立性检验来考察两个变量是否有关系的具体做法是怎样的?
提示 (1)根据实际问题需要的可信程度确定临界值k0;
(2)利用公式χ2=,由观测数据计算得到随机变量χ2的观测值k;
(3)如果k>k0,就以(1-P(χ2≥k0))×100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据.
2.若设H0为两变量X与Y没有关系,P(χ2≥k)是H0成立的情况下该事件发生的概率,则P(χ2≥k)≈0.01表示的意义是什么?
提示 P(χ2≥k)≈0.01说明在“两个分类变量没有关系”的前提下,出现χ2≥k这个情况的概率只有0.01.因此我们有99%的把握认为H0不成立,即有99%的把握认为“两个分类变量有关系”.
类型一 利用χ2的值进行无关独立性检验
[例1] 甲、乙两个班级进行同一项考试,按照学生的考试成绩做优秀和不优秀统计后,得到如下列联表:
考试[来源:学科网]
成绩
班级
优秀
不优秀
总计
甲班
10
35
45
乙班
7
38
45
总计
17
73
90
利用列联表进行独立性检验,判断考试成绩与班级是否有关?
[思路点拨] 独立性检验的关键是准确地计算χ2,要充分利用2×2列联表.
[自主解答] 根据列联表有a=10,b=35,c=7,d=38,a+b=45,c+d=45,a+c=17,b+d=73,n=90.
χ2==
≈0.653,由于χ2≈0.653<2.706,所以没有充分证据判定成绩与班级有关系,故可以认为考试成绩与班级是无关的.
[方法探究]
从本题可知,学习成绩主要取决于个人努力的结果,与所在班级的关系不大.所以同学们要从自身找原因,不要强调外界环境.利用公式计算χ2的值时,一定要计算准确.
●变式训练
1.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?
解析 根据题目所给的数据得到如下列联表:
理科
文科
总计
有兴趣
138
73
211
无兴趣
98
52
150
总计
236
125
361
根据列联表中数据由公式计算得
χ2=≈1.871×10-4.
因为1.871×10-4<2.706,
所以,在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、理科与对外语的兴趣有关”.
类型二 利用χ2的值进行有关独立性检验
[例2] 某地震观测站对地下水位的变化和发生地震的情况进行了n=1 700次观测,列联表如下:
有地震
无地震
水位有变化
98
902
水位无变化
82
618
观测结果是否说明地下水位的变化与地震的发生有关系?
[思路点拨] 判断两个分类变量是否相关,只需计算χ2的值,然后与临界值比较即可.
[自主解答] 列联表:
有地震
无地震
总计
水位有变化
98
902
1 000
水位无变化
82
618
700
总计
180
1 520
1 700
χ2=≈1.59<2.706.
所以没有充分的证据显示地下水位的变化与地震的发生相关.
[方法探究]
(1)这类问题的解决方法为先确定a,b,c,d,n的值并求出χ2的值,并与临界值相比较,注意正确运用公式,准确