内容正文:
8.3 列联表与独立性检验
8.3.1 分类变量与列联表
8.3.2 独立性检验
数学
学习目标
1.通过典型案例的探究,了解独立性检验的基本思想.
2.会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题.
数学
知识梳理·自主探究
师生互动·合作探究
数学
知识梳理·自主探究
知识探究
1.分类变量与列联表
(1)分类变量:使用一种特殊的随机变量,以区别不同的现象或性质,分类变量的取值可以用 表示.
(2)2×2列联表
①定义:列出的两个分类变量的频数表,称为列联表.
实数
数学
②一般地,假设有两个分类变量X和Y,它们的取值分别为{0,1},其样本频数列联表为
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数.最后一列的前两个数是事件{X=0}和{X=1}中样本点的个数.右下角格中的数是样本容量.
数学
2.等高堆积条形图
(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征.
数学
(2)临界值:对于任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)= α.称xα为α的临界值.临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大.
(3)基于小概率值α的检验规则:
当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α.
当χ2<xα时,没有充分证据推断H0不成立,可以认为X和Y独立.
利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
数学
(4)χ2独立性检验中几个常用的小概率值和相应的临界值如下.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
数学
师生互动·合作探究
探究点一
用2×2列联表分析两变量间的关系
数学
数学
X Y 合计
Y=0 Y=1
X=0 43 21 64
X=1 27 33 60
合计 70 54 124
数学
方法总结
(1)作2×2列联表时,关键是对涉及的变量分清类别.要对Ω中的对象定义分类变量X和Y,计算时要准确无误.
数学
[针对训练] 假设有两个分类变量X与Y,它们的可能取值分别为{0,1},其2×2列联表为
X Y 合计
Y=0 Y=1
X=0 10 18 28
X=1 m 26 m+26
合计 10+m 44 54+m
当m取下面何值时,X与Y的关系最弱( )
A.8 B.9 C.14 D.19
数学
探究点二
利用等高堆积条形图判断两个分类变量是否相关
[例2] 某学校对高三学生做了一项调查,发现在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用图形判断考前心情紧张与性格类型是否有关系.
解:列出列联表如下:
考前心情 性格 合计
内向 外向
紧张 332 213 545
不紧张 94 381 475
合计 426 594 1 020
数学
相应的等高堆积条形图如图所示.
图中阴影部分表示考前心情紧张与考前心情不紧张的学生中性格内向的学生的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与性格类型有关.
数学
方法总结
利用等高堆积条形图判断两个分类变量是否相关的步骤
(1)收集数据,统计结果.
(2)列出2×2列联表,计算频率、粗略估计.
(3)画等高堆积条形图,直观分析.
数学
探究点三
独立性检验
[例3] (2022·辽宁辽阳高二期末)某大学生社团组织社会调查活动,随机调查了某市区某个路口100个工作日中每天的天气情况和当天早高峰(7点至9点)时段经过该路口的机动车车次,整理数据得到下表:
天气 机动车车次
[0,800) [800,1 600) [1 600,2 400)
晴天 10 52 13
阴天 2 9 8
雨天 0 2 4
(1)分别估计该市一天的天气为晴天和雨天的概率;
数学
数学
(2)若晴天记为“天气好”,阴天或雨天记为“天气不好”,若当天早高峰时段经过该路口的机动车车次小于1 600,则视为交通顺畅,否则视为交通拥堵.根据所给数据,完成下面的2×2列联表,根据小概率值α=0.005的独立性检验,可否认为两种交通路况和“天气情况”有关?
天气 交通 合计
顺畅 拥堵
好
不