内容正文:
4.3.2 独立性检验
第四章 概率与统计
栏目导航
第四章 概率与统计
1
栏目导航
课前案•自主学习
01
课堂案•互动探究
02
课后案•学业评价
03
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
课前案•自主学习
栏目导航
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
课堂案•互动探究
栏目导航
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
栏目导航
第四章 概率与统计
1
课后案•学业评价
栏目导航
点击进入Word
栏目导航
第四章 概率与统计
1
谢谢观看
栏目导航
第四章 概率与统计
1
学业标准
素养目标
1.了解独立性检验的基本思想和方法.(重点)
2.能根据条件列出联表并会由公式求x.(重点)
3.了解独立性检验的初步应用.(难点)
1.通过了解独立性检验的基本思想和方法,培养数学抽象核心素养.
2.通过独立性检验的应用,提升数据分析、数学运算等核心素养.
导学 独立性检验
任意抽取某市的一名学生,记A:喜欢长跑,B:是女生.
(1)你能得出P(A),P(B),P(AB)这三者的准确值吗?
(2)能判断A与B是否独立吗?
[提示] (1)比较困难,甚至不可能.
(2)能.
◎结论形成
2×2列联表及相关事件的概率
1.如果随机事件A与B的样本数据的2×2列联表如下
A
总计
B
a
b
a+b
c
d
c+d
总计
a+c
b+d
a+b+c+d
记n=a+b+c+d,则由表可知:
(1)事件A发生的概率估计值为P(A)=________.
(2)事件B发生的概率的估计值为P(B)=________.
(3)事件AB发生的概率的估计值为P(AB)=________.
2.独立性检验的基本思想
(1)在2×2列联表中,令χ2=,任意给定一个α(称为显著性水平,通常取0.05,0.01等)可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数).χ2是一个随机变量,其分布能够求出,上面的概率是可以计算的.
(2)如果根据样本数据算出χ2的值后,发现χ2≥k成立,就称在犯错的概率不超过α的前提下,可以认为A与B不独立(也称A与B有关);或说有1-α的把握认为A与B有关.若χ2<k成立,不能得到前述结论.
(3)统计学中,常用的显著性水平α以及对应的分位数k如下表所示:
α=P(χ2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
1.判断正误(正确的打“√”,错误的打“×”)
(1)在独立性检验中,若χ2越大,则两个分类变量有关系的可能性越大.( )
(2)2×2列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系.( )
(3)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的.( )
(4)样本不同,独立性检验的结论可能有差异.( )
答案 (1)√ (2)√ (3)× (4)√
2.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
解析 判断两个分类变量是否有关的最有效方法是进行独立性检验,
故选C.
答案 C
3.在一个2×2列联表中,通过数据计算χ2=8.325,则这两个变量间有关系的可能性为________.
解析 因为χ2=8.325>7.879所以两个变量之间有关系的可能性就有99.5%.
答案 99.5%
4.下面是2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
100
则a+b=________.
解析 a=73-21=52,b=100-46=54.故a+b=106.
答案 106
题型一 2×2列联表
某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练的天数
不大于2天
3天或4天
不少于5天
人数
30
130
40
若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.
(1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数;
(2)根据上表的数据,填写下列2×2列联表.
热烈参与者
非热烈参与者
总计
男
140
女
55
总计
[解析] (1)以200人中“热烈参与者”的频率作为概率,
可得该市“热烈参与者”的人数约为20 000×=4000.
(2)由题意可得2×2列联表如下:
热烈参与者
非热烈参与者
总计
男
35
105
140
女
5
55
60
总计
40
160
200
1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.
2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,求出事件发生的概率的估计值.
[触类旁通]
1.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人则以肉类为主.
(1)请根据以上数据作出饮食习惯与年龄的列联表;
(2)求年龄在六十岁以上且饮食以肉类为主的人群的概率.
解析 (1)饮食习惯与年龄的2×2列联表如下:
年龄在六十岁以上
年龄在六十岁以下
总计
饮食以蔬菜为主
43
21
64
饮食以肉类为主
27
33
60
总计
70
54
124
(2)由列联表得,年龄在六十岁以上且饮食以肉类为主的人群的概率为.
题型二 独立性检验的简单应用
(2025·全国一卷)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:
组别
超声波检查结果
合计
正常
不正常
患该疾病
20
180
200
未患该疾病
780
20
800
合计
800
200
1000
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.
附χ2=,
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
[解析] (1)由题表可知,检查结果不正常者有200人,检查结果不正常者中患有该疾病的有180人,所以由样本估计总体得p==0.9.
(2)零假设H0:超声波检查结果与是否患该疾病无关.
χ2==765.625>10.828,
所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为超声波检查结果与是否患该疾病有关.
独立性检验的方法和步骤
(1)利用求χ2的值,把所求值与常用的显著性水平α以及对应的分位数k比较,而得出相应结论.
(2)具体步骤
①利用所给已知条件求得χ2的值;
②查表可得P(χ2≥k)的值;
③下结论:得到随机事件A与B在犯错误不超过显著水平α的前提下有关系.
[触类旁通]
2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?
解析 根据题目所给的数据得到如下列联表:
理科
文科
总计
有兴趣
138
73
211
无兴趣
98
52
150
总计
236
125
361
根据列联表中数据由公式计算得
χ2=≈1.871×10-4.
∵1.871×10-4<2.706.
∴不能在犯错误的概率不超过0.1的前提下认为“学生选报文、理科与对外语的兴趣有关”.
题型三 独立性检验的综合应用
某高校共有学生15 000人,其中男生10 500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层随机抽样的方法,收集300位学生每周平均体育运动时间(单位:时)的样本数据.
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图).其中样本数据的分组区间为[0,2),(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
附:
P(χ2≥k)
0.100
0.050
0.010
0.005
k
2.706
3.841
6.635
7.879
χ2=.
[解析] (1)由分层随机抽样可得300×=90,所以应收集90位女生的样本数据.
(2)由频率分布直方图得学生每周平均体育运动超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.
(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.样本数据中有210份是关于男生的,90份是关于女生的,可得每周平均体育运动时间与性别列联表如下:
男生
女生
总计
每周平均体育运动时间不超过4小时
45
30
75
每周平均体育运动时间超过4小时
165
60
225
总计
210
90
300
结合列联表可算得χ2=≈4.762>3.841.
所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”(或者说,在犯错误的概率不超过5%的前提下,认为“该校学生的每周平均体育运动时间与性别有关”).
1.利用统计图表提取相关的数据信息是概率问题的解决基础,需要掌握各类图表中数据的提取方法,常见有频率分布直方图、频率分布表、扇形图、条形图等.
2.独立性检验可以判断两个变量是否有关,并能较为准确地给出这种判断的可信度,χ2越大,说明两个变量有关的可能性越大.
[触类旁通]
3.(2024·上海卷)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29 000名学生中随机抽取580人,得到日均体育锻炼时长(单位:小时)与学业成绩的数据如表所示:
学业成绩
日均体育锻炼时长/小时
[0,0.5)
[0.5,1)
[1,1.5)
[1.5,2)
[2,2.5]
优秀
5
44
42
3
1
不优秀
134
147
137
40
27
(1)该地区29 000名学生中日均体育锻炼时长不小于1小时的人数约为多少?
(2)估计该地区初中学生日均体育锻炼时长(精确到0.1小时);
(3)是否有95%的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?
附:χ2=,n=a+b+c+d.P(χ2≥3.841)≈0.05.
解析 (1)抽取的样本中日均体育锻炼时长不小于1小时的人数为42+3+1+137+40+27=250.
设该地区29 000名学生中有x人的日均体育锻炼时长不小于1小时,则=,解得x=12 500.
故该地区29 000名学生中日均体育锻炼时长不小于1小时的人数约为12 500.
(2)依题意得,该地区初中学生日均体育锻炼时长为(0.25×139+0.75×191+1.25×179+1.75×43+2.25×28)÷580=540÷580≈0.9.
所以该地区初中学生日均体育锻炼时长约为0.9小时.
(3)对数据重新组合,得到2×2列联表
学业成绩
日均体育锻炼时长/小时
[1,2)
其他
总计
优秀
45
50
95
不优秀
177
308
485
总计
222
358
580
提出原假设H0:学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时无关.
确定显著性水平α=0.05,P(χ2≥3.841)≈0.05,
χ2=≈3.976>3.841,
原假设不成立,所以有95%的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关.
[缜密思维提能区] 规范答题
独立性检验的应用
(13分)气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示.问它们的疗效有无差异?(犯错误的概率不超过0.001)
有效
无效
总计
复方江剪刀草
184
61
245
胆黄片
91
9
100
总计
275
70
345
[规范解答] 提出假设H0:两种中草药的治疗效果没有差异,即病人使用这两种药物中的任何一种药物对疗效没有明显差异.
由列联表中的数据,求得
χ2=
≈11.098. ①(9分)
当H0成立时,
χ2大于10.828的概率约为0.001,
由于11.098>10.828. ②(11分)
所以可以在犯错误的概率不超过0.001的前提下认为:两种药物的疗效有差异.(13分)
知识落实
技法强化
1.2×2列联表及相关事件的概率.
2.独立性检验的基本思想.
1.对于同一个问题,2×2列联表的列法并不是唯一的,2×2列联表是独立性检验的基础,列表的正确与否直接关系到结论是否正确.
2.独立性检验多与统计图表、概率等知识综合考查,对数据分析、数学运算等素养要求较高.
$$