内容正文:
学利科购
李科网原创,让李司更客易!
JP.ZXXK.COM
学科网精品频道全力推荐
9.2
独立性检验
【题型归纳目录】
题型一:用2×2列联表分析两分类变量间的关系
题型二:用等高堆积条形图分析两分类变量间的关系
题型三:有关“相关的检验
题型四:有关“无关的检验
题型五:独立性检验的综合应用
【知识点梳理】
1、分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类
变量的取值可以用实数表示
2、2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表
格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.
一般地,假设有两个分类变量X和Y,它们的取值分别为,2}和,2},其2×2列联表为
片
合计
a
b
atb
5
d
c+d
合计
a+c
b+d
a+b+c+d
3、等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联
表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果
4、临界值
x统计量也可以用来作相关性的度量,x越小说明变量之间越独立,x越大说明变量之间越相关
n(ad-be)2
·忽略x的实际分布与该近似分布的误差后,对于任何小概率值α,可
(a+b)(c+d)(a+c)(b+d)
以找到相应的正实数x,使得P(x2≥x)=a成立.我们称x,为a的临界值,这个临界值就可作为判断x2
大小的标准,
5、独立性检验
基于小概率值α的检验规则是:
当x2≥x,时,我们就推断Ho不成立,即认为X和Y不独立,该推断犯错误的概率不超过α:
原创精品资源学科网独家享有版权,侵权必究!
令学利四
学科网原创,让李司更多易!
JP.ZXXK.COM
学科网精品频道全力推荐
当x<x时,我们没有充分证据推新H不成立,可以认为X和了独立.
这种利用x的取值推断分类变量X和Y是否独立的方法称为x独立性检验,读作“卡方独立性检验”,
简称独立性检验(test of independence).
下表给出了X独立性检验中几个常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
Xa
2.706
3.841
6.635
7.879
10.828
6、应用独立性检验解决实际问题的大致步骤
(1)提出零假设H。:X和Y相互独立,并给出在问题中的解释:
(2)根据抽样数据整理出2×2列联表,计算x的值,并与临界值x比较:
(3)根据检验规则得出推断结论:
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和了间的影响规律。
【典型例题】
题型一:用2×2列联表分析两分类变量间的关系
【方法技巧与总结】
(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误。
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据
领半特征,即将与Cb与d
的值相比,直观地反映出两个分类变量间是否相互影响,但
a+b c+dla+b c+d
方法较粗劣。
例1.(2023全国高二单元测试)假设有两个分类变量x与y的2×2列联表如下表:
片
a
6
X2
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为()
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5
D.a=2,b=3,c=5,d=4
【答案】D
【解析】
对于两个分类变量x与y而言,ad-bc的值越大,说明x与y有关系的可能性最大,
对于A选项,ad-bc-5×2-4x3-2,
对于B选项,ad-bc=5×2-3×4=2,
2
原创精品资源学科网独家享有版权,侵权必究!
令学利四
李科网原创,让学司更客品!
JP.ZXXK.COM
学科网精品频道全力推荐
对于C选项,ad-bc=2x5-3×4-2,
对于D选项,lad-bc=2×4-3×5=7,
显然D中ad-bc最大,
故选:D
例2,(2023福建厦门双十中学高二阶段练习(理))在一次独立性检验中,得出列联表如图:且最后
发现,两个分类变量A和B没有任何关系,则a的可能值是()
A
合计
小
200
800
1000
B
180
a
180+a
合
380
800+a
1180+a
计
A,200
B.720
C.100
D.180
【答案】B
【解析】
解:因为两个分类变量A和B没有任何关系,
所以K?=
(1180+a(200a-800-180
<2.702,
380.(800+a1000(180+a】
代入