内容正文:
浙江良品图书有限公司
精彩三年课程探究与巩固数学选择性必修第三册
第八章 成对数据的统计分析
8.3 列联表与独立性检验
8.3.1 分类变量与列联表
8.3.2 独立性检验
单击此处编辑母版文本样式
1
[课程目标] 1.了解分类变量的意义,了解2×2列联表的意义.2.会用等高堆积条形图与2×2列联表反映两个分类变量之间是否有关系.3.会用独立性检验的基本思想和方法解决简单问题.
单击此处编辑母版文本样式
知识点一 分类变量和列联表
(1)为了表述方便,我们经常会使用一种特殊的__________,以区别不同的现象或性质,这类随机变量称为__________.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等.
随机变量
分类变量
单击此处编辑母版文本样式
(2)在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,以频数表的形式加以保存,这样的统计表称为_________________.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.
2×2列联表
单击此处编辑母版文本样式
X Y 合计
y1 y2
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
单击此处编辑母版文本样式
[研读]对2×2列联表的理解
(1)2×2列联表用于研究两类变量之间是否相互独立,它适用于分析两类变量之间的关系,是对两类变量进行独立性检验的基础.
(2)表中|ad-bc|越小,两个变量之间的关系越弱;|ad-bc|越大,两个变量之间的关系越强.
单击此处编辑母版文本样式
相互影响
频率特征
有关系
单击此处编辑母版文本样式
单击此处编辑母版文本样式
[研读]独立性检验的基本思想与反证法思想的相似之处
反证法 独立性检验
要证明结论A 要确认“两个分类变量有关系”
在A不成立的前提下进行推理 假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下计算χ2
单击此处编辑母版文本样式
√
√
单击此处编辑母版文本样式
例1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
类型一
等高堆积条形图的应用
组别 结果 合计
阳性数 阴性数
铅中毒病人 29 7 36
对照组 9 28 37
合计 38 35 73
单击此处编辑母版文本样式
试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解: 等高堆积条形图如下:
单击此处编辑母版文本样式
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
单击此处编辑母版文本样式
活学活用
当某矿石粉厂生产一种矿石粉时,在数天内就有部分工人患职业性皮肤炎.在生产季节期间,随机抽取车间工人抽血化验,75名穿新防护服的车间工人中5例阳性,70例阴性,28名穿旧防护服的车间工人中10例阳性,18例阴性,请用等高堆积条形图判定这种新防护服对预防工人职业性皮肤炎是否有效.(注:显阴性即未患皮肤炎)
单击此处编辑母版文本样式
解: 由题目所给的数据得2×2列联表:
相应的等高堆积条形图如下.
阳性例数 阴性例数 合计
穿新防护服 5 70 75
穿旧防护服 10 18 28
合计 15 88 103
单击此处编辑母版文本样式
图中两个深色的高分别表示穿新、旧防护服样本中呈阳性的频率,从图中可以看出,穿旧防护服呈阳性的频率高于穿新防护服呈阳性的频率.因此,可以认为新防护服比旧防护服对预防这种皮肤炎有效.
单击此处编辑母版文本样式
类型二
例2 为进一步保护环境,加强治理空气污染,某市环保监测部门对市区空气质量进行调研,随机抽查了市区100天的空气质量等级与当天空气中SO2的浓度(单位:μg/m3),整理数据得到下表:
独立性检验
SO2的浓度
空气质量等级 [0,50] (50,50] (150,75]
1(优) 28 6 2
2(良) 5 7 8
3(轻度污染) 3 8 9
4(中度污染) 1 12 11
单击此处编辑母版文本样式
若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”,根据上述数据,回答以下问题.
(1)估计事件“该市一天的空气质量好,且SO2的浓度不超过150”的概率.
单击此处编辑母版文本样式
(2)完成下面的2×2列联表: