内容正文:
9.2 独立性检验
课程标准
学习目标
(1)能用自己的语言解释列联表的构成,并能利用列联表进行简单的统计分析.
(2)能举例说明独立性检验的基本步骤,并能用独立性检验方法解决简单的实际问题.
(1)掌握分类变量和列联表的概念,并会依据列联表判断两个分类变量是否独立.
(2)理解统计量χ2的意义和独立性检验的基本思想.
知识点01 独立性检验
1、分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
2、2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
合计
a
b
c
d
合计
3、等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
4、临界值
统计量也可以用来作相关性的度量.越小说明变量之间越独立,越大说明变量之间越相关
.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立.我们称为的临界值,这个临界值就可作为判断大小的标准.
5、独立性检验
基于小概率值的检验规则是:
当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(test of independence).
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
6、应用独立性检验解决实际问题的大致步骤
(1)提出零假设:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
【即学即练1】(2024·高二·福建福州·期末)为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
药物
疾病
合计
未患病
患病
服用
a
50
未服用
50
合计
80
20
100
若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为 .(其中且)(参考数据:,)
附:,
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
题型一:用2×2列联表分析两分类变量间的关系
【典例1-1】(2024·高三·四川成都·期末)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
50
未注射疫苗
30
50
合计
30
100
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )
附:,.
A.0.001 B.0.05 C.0.01 D.0.005
【典例1-2】(2024·高二·全国·课后作业)下面是列联表:
总计
总计
则 .
【变式1-1】(2024·高二·江苏·课时练习)下面是一个2×2列联表:
合计
21
合计
则 , .(保留小数点后位)
【变式1-2】(2024·高二·江苏·课时练习)某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行一次检测,试验班与对照班成绩统计如2×2列联表所示(单位