内容正文:
学习目的
8.3列联表与独立性检验
1了解分类变量与列表
2.理解独立性检验
3.掌握独立性检验的常用步骤基础知识
一、分类变量与列联表
1.分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示
2.2X2列联表
在实践中,由于保存原始数据的成本较高,人们经常技研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2X2列联表,2X2 列联表给出了成对分类变量数心的交叉分类频数.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2X2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
3.等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量问是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果
二、独立性检验
1.临界值
统计量也可以用来作相关性的度量,越小说明变量之间越独立,越大说明变量之间越相关
.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,这个临界值就可作为判断大小的标准.
2.独立性检验
基于小概丰值的检验规则是:
当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断H0不成立,可以认为X和Y独立
这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验
下表给出了产独立性检验中几个常用的小概车值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
3.应用独立性检验解决实际问题的大致步骤
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2X2列联表,计算的值,并与临界值比较:
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的顿率,分析X和Y间影响规律问题探究
示例1
1.2021年