内容正文:
第11讲 列联表与独立性检验
目录
题型归纳 1
题型01 完善列联表 3
题型02 列联表分析 5
题型03 等高条形图 8
题型04 独立性检验的概念及辨析 9
题型05 卡方的计算 10
题型06 独立性检验的基本思想 14
题型07 独立性检验解决实际问题 17
分层练习 20
夯实基础 20
能力提升 27
知识点01 分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为
分类变量.分类变量的取值可以用实数表示.
知识点02 2×2列联表
假设两个分类变量X和Y,它们的可能取值分别为{,}和{,},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
知识点03 等高堆积条形图
常用等高堆积条形图展示列联表数据的频率特征(如图),由此反映出两个分类变量间是否相互影响.
(1)等高堆积条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,
观察下方颜色区域的高度,如果两个高度相差比较明显(即和相差很大),就判定两个分类
变量之间有关系.
(2)利用等高堆积条形图虽可以比较各个部分之间的差异,明确展现两个分类变量的关系,但不能知道
两个分类变量有关系的概率大小.
知识点04 独立性检验
(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
则.
(2)利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简
称独立性检验.
(3)独立性检验中几个常用的小概率值和相应的临界值.
知识点05 独立性检验的应用问题的解题策略
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
题型01完善列联表
【例1】(20-21高二下·天津河西·期中)如表是列联表,则表中的、的值分别为( )
合计
8
35
11
34
45
合计
42
80
A.27、38 B.28、38 C.27、37 D.28、37
【变式1】(22-23高二下·宁夏固原·期中)下面是一个列联表,则表中处的值分别为( )
总计
25
73
21
总计
49
A.98,28 B.28,98 C.48,45 D.45,48
【变式2】(22-23高二下·广东深圳·期中)下面是一个2×2列联表:
合计
合计
则表中a,b处的值分别为 ; .
【变式3】(21-22高二下·北京·期中)在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”
(1)根据所给数据完成下列表格;
效果一般
效果较好
合计
男
25
45
女
40
合计
(2) 用(1)中表格的数据估计全校线上教学的效果,用频率估计概率.从该校学生中任意抽取3人,记所抽取的3人中认为线上教学“效果一般”的人数为X,求X的分布列和数学期望及方差.
题型02 列联表分析
【例2】(20-21高二下·山西朔州·期中)下表是一个列联表,则表中,的值分别为( )
总计
21
25
33
总计
100
A.46,54 B.54,46 C.52,54 D.50,52
【变式1】(21-22高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【变式2】(21-22高二下·河南·期中)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:
了解
不了解
总计
年龄不小于60岁
a
b
a+b
年龄小于60岁
c
d
c+d
总计
a+c
b+d
a+b+c+d
给出下列4组数据:
① ;② ;
③ ;④ .
则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是 .(填序号)
【变式3】(20-21高二下·山东青岛·期中)随着电商事业的发展和工作生活节奏的加快,人们的生活方式和生活理念正在发生巨大的改变.通过外卖App下单订餐叫外卖,正受到越来越多的市民尤其是青年上班族的喜爱.为了解市民是否经常利用外卖平台点餐,调查机构借助网络进行了问卷调查,并从参与调查的网友中抽取了人进行抽样分析,其中经常用外卖平台点餐的人数是基本不用外卖平台点餐的人数的倍;岁以上经常用外卖平台点餐的人数和基本不用外卖平台点餐的人数相等;岁及以下有人基本不用外卖平台点餐.
(1)请完善下面列联表(单位:人),并依据的独立性检验,分析经常利用外卖平台点餐是否与年龄有关?
经常用外卖平台点餐
基本不用外卖平台点餐
总计
岁及以下
岁以上
总计
(2)利用分层抽样方法在经常用外卖平台点餐的市民中随机抽取人,再从以上人中随机抽取人.记被抽取的人中“岁以上”的人数为,求随机变量的分布列和均值.
附:,其中.
临界值表:
题型03 等高条形图
【例3】(21-22高二下·山西太原·期中)在统计中,研究两个分类变量是否存在关联性时,常用的图表有( )
A.散点图和残差图 B.残差图和列联表
C.散点图和等高堆积条形图 D.等高堆积条形图和列联表
【变式1】(23-24高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【变式2】(21-22高二下·山东临沂·期中)某校为研究该校学生性别与体育锻炼的经常性之间的联系,随机抽取100名学生(其中男生60名,女生40名),并绘制得到如图所示的等高堆积条形图,则这100名学生中经常锻炼的人数为 .
【变式3】(23-24高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是 .
题型04 独立性检验的概念及辨析
【例4】(23-24高二下·上海·期中)为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算,根据这一数据分析,下列说法正确的是( )
(附:)
A.有的人认为该电视栏目优秀
B.有的人认为该电视栏目是否优秀与改革有关系
C.在犯错误的概率不超过的前提下,认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
【变式1】(21-22高二下·山东烟台·期中)下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病
D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大
【变式2】(20-21高二下·陕西咸阳·期中)若由一个列联表中的数据计算得的观测值,那么有 的把握认为两个变量有关系.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【变式3】(20-21高二下·广西玉林·期末)利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用列联表,由计算可得,参照下表
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
至少有 以上的把握认为“爱好该项运动与性别有关”.
题型05 卡方的计算
【例5】(24-25高二上·辽宁·期末)针对2025年第九届亚冬会在哈尔滨举办,校团委对“是否喜欢冰雪运动与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢冰雪运动的人数占男生人数的,女生中喜欢冰雪运动的人数占女生人数的,若有的把握认为是否喜欢冰雪运动与学生性别有关,则被调查的学生中男生的人数不可能为( )
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.54 B.48 C.42 D.36
【变式1】(23-24高二下·全国·期中)以“智联世界,生成未来”为主题的2023世界人工智能大会在中国上海举行,人工智能的发展为许多领域带来了巨大的便利,但同时也伴随着一些潜在的安全隐患.为了调查人们对人工智能所持的态度,某机构从所在地区随机调查100人,所得结果统计如下:
年龄在50岁以上(含50岁)
年龄在50岁以下
性别
男
女
男
女
持支持态度
15
10
30
15
不持支持态度
10
10
5
5
(填“有”或“没有”)的把握认为所持态度与年龄有关.
附:,.
0.10
0.05
0.01
k
2.706
3.841
6.635
【变式2】(24-25高二上·四川眉山·期中)随着互联网的高速发展和新媒体形式的不断丰富,微短剧作为一种新兴的文化载体,正逐渐成为拓展文化消费空间的重要途径.某媒体为了了解微短剧消费者的年龄分布,随机调查了200名消费者,得到如下列联表:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
45
不是微短剧消费者
合计
100
200
(1)根据小概率值的独立性检验,能否认为“是微短剧消费者”与“年龄不超过40岁”有关联?
(2)记2020~2024年的年份代码x依次为1,2,3,4,5,下表为2020~2023年中国微短剧市场规模及2024年中国微短剧预测的市场规模y(单位:亿元)与x的统计数据:
年份代码x
1
2
3
4
5
市场规模y
9.4
36.8
101.7
373.9
m
根据上表数据求得y关于x的经验回归方程为,求相关系数r,并判断该经验回归方程是否有价值.
参考公式:,其中,.
,相关系数..
若,则认为经验回归方程有价值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式3】(23-24高二下·云南昆明·期中)为了解某一地区电动汽车销售情况,某部门根据统计数据,用最小二乘法得到电动汽车销量y(单位:万台)关于x(年份)的线性回归方程为,且销量y的方差,年份x的方差.
(1)求y与x的相关系数r,并据此判断电动汽车销量y与年份x的相关性强弱;
(2)该部门还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
性别
购买非电动汽车
购买电动汽车
总计
男性
39
45
女性
15
总计
请完成调查数据表,并回答能否依据小概率值的独立性检验判断购买电动车与车主性别有关?
参考公式:(ⅰ)线性回归方程:,其中,;
(ⅱ)相关系数:,若,则可认为y与x线性相关较强.
(ⅲ),.附表:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
题型06 独立性检验的基本思想
【例6】(23-24高二下·山东青岛·期中)根据分类变量与的成对样本数据,计算得到.已知,依据小概率值的独立性检验,则( )
A.与不独立
B.与不独立,这个结论犯错误的概率不超过0.05
C.与独立
D.与独立,这个结论犯错误的概率不超过0.05
【变式1】(23-24高二下·辽宁葫芦岛·期末)一部年代创业剧《乘风踏浪》,让辽宁葫芦岛成为许多人心驰神往的旅游度假目的地.为了更好地了解游客需求,优化自身服务,提高游客满意度,随机对1200位游客进行了满意度调查,结果如下表:
男性
女性
合计
满意
560
540
1100
不满意
40
60
100
合计
600
600
1200
根据列联表中的数据,经计算得到 (精确到0.001);依据数据可作出的判断是 .
附:.
0.1
0.05
0.01
2.706
3.841
6.635
【变式2】(22-23高二下·河南省直辖县级单位·期中)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别
是否需要志愿者
男
女
需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
参考公式:
【变式3】(23-24高二下·河南驻马店·期中)随着新高考改革,高中阶段学生选修分为物理方向和历史方向,为了判断学生选修物理方向和历史方向是否与性别有关,现随机抽取50名学生,得到如下列联表:
物理方向
历史方向
总计
男生
13
a
23
女生
7
20
27
总计
b
c
50
(1)计算a,b,c的值;
(2)问是否有95%的把握认为选修物理方向和历史方向与性别有关?
附:,.
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
题型07 独立性检验解决实际问题
【例7】(23-24高二下·山西长治·期中)某课外兴趣小组为研究数学成绩优秀是否与性别有关,通过随机抽样调查,得到成对样本观测数据的分类统计结果,并计算得出,经查阅独立性检验的小概率值和相应的临界值,知,则下列判断正确的是( )
A.若某人数学成绩优秀,那么他为男生的概率是
B.每100个数学成绩优秀的人中就会有1名是女生
C.数学成绩优秀与性别有关,此推断犯错误的概率不大于
D.在犯错误的概率不超过的前提下认为数学成绩优秀与性别无关
【变式1】(23-24高二下·湖南长沙·期中)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据(,)
支持
不支持
男生
女生
若通过计算得,根据小概率值的独立性检验,认为支持增加中学生体育锻炼时间的政策与性别有关,则在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为 .
附:,其中.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【变式2】(23-24高二下·山西长治·期中)直播带货逐渐成为乡村振兴的新动力,为了解甲、乙两个推销农产品的直播间的销售情况,统计了一段时间内观众下单的相关数据,得到如下的列联表:
下单的观众数(单位:百人)
未下单的观众数(单位:百人)
合计
甲直播间
6
乙直播间
1
合计
10
20
(1)请补全列联表;
(2)依据小概率值的独立性检验,分析两个直播间观众的下单意愿是否有差异.
附:.
0.10
0.05
0.01
2.706
3.841
6.635
【变式3】(23-24高二下·山西大同·期中)2023年12月25日,由科技日报社主办,部分两院院士和媒体人共同评选出的2023年国内十大科技新闻揭晓.某高校一学生社团随机调查了本校100名学生对这十大科技的了解情况,按照性别和了解情况分组,得到如下列联表:
不太了解
比较了解
合计
男生
15
45
60
女生
25
15
40
合计
40
60
100
(1)判断是否有的把握认为对这十大科技的了解存在性别差异;
(2)将上述调查所得到的频率视为概率.现在从该地大量学生中,采用随机抽样方法每次抽取1名学生,抽取3次,若每次抽取的结果是相互独立的,记“被抽取的3名学生中恰有1名学生是属于比较了解的”为事件,求发生的概率.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【夯实基础】
一、单选题
1.(23-24高二上·江西九江·期末)某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算得.根据独立性检验的相关知识,对照下表,可以认为有( )把握喜欢篮球与性别有关.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A. B. C. D.
2.(23-24高二下·陕西·期中)为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过( )
0.15
0.10
0.05
0.025
0.010
k
2.072
2.706
3.841
5.024
6.635
A. B. C. D.
3.(20-21高三上·福建厦门·期末)某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高条形图,则这80名学生中喜欢国画的人数为( )
A.24 B.32 C.48 D.58
4.(20-21高二下·天津河北·期末)为比较甲、乙两所学校学生的数学学习水平,经过抽样并测试得到如下关于和的列联表:
学校
数学成绩
合计
不优秀
优秀()
甲校()
乙校()
合计
根据上表得到乙校数学成绩优秀的频数和样本容量数分别是( )
A.和 B.和 C.和 D.和
二、多选题
5.(22-23高二下·江苏常州·期中)已知两个分类变量、,由它们的样本数据计算得到的观测值,的部分临界值表如下:
以下判断正确的是( )
A.在犯错误的概率不超过的前提下认为变量、有关系
B.在犯错误的概率不超过的前提下认为变量、没有关系
C.有的把握说变量、有关系
D.有的把握说变量、没有关系
6.(22-23高二下·福建泉州·期中)如图是调查某地区男、女中学生喜欢数学的等高堆积条形图,阴影部分表示喜欢数学的百分比,从图可以看出( )
A.性别与喜欢数学无关 B.女生中喜欢数学的百分比为
C.男生比女生喜欢数学的可能性大些 D.男生不喜欢数学的百分比为
三、填空题
7.(23-24高二下·云南昆明·期中)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为是否购买该款盲盒与性别有关出错的可能性为 .
附:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
,其中.
8.(23-24高二下·福建南平·期中)为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
四、解答题
9.(22-23高二上·辽宁·期末)为了有针对性地提高学生体育锻炼的积极性,某校需要了解学生是否经常进行体育锻炼与性别因素的相关性,为此随机对该校100名学生进行问卷调查,得到如下列联表.
经常锻炼
不经常锻炼
总计
男
35
女
25
总计
100
已知从这100名学生中任选1人,经常进行体育锻炼的学生被选中的概率为.
(1)完成上面的列联表;
(2)根据列联表中的数据,判断能否有95%的把握认为该校学生是否经常进行体育锻炼与性别因素有关.
附:,其中.
0.1
0.05
0.01
0.001
k
2.706
3.841
6.635
10.828
10.(23-24高二下·天津河西·期中)某班主任对班级22名学生进行了作业量多少的调查,数据如下:在喜欢玩电脑游戏的12人中,有9人认为作业多,3人认为作业不多;在不喜欢玩电脑游戏的10人中,有4人认为作业多,6人认为作业不多.
(1)根据以上数据填写2×2列联表;
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
不喜欢玩电脑游戏
总计
(2)依据小概率的独立性检验,分析喜欢玩电脑游戏与认为作业多少是否有关系?
参考公式:,
参考数据:,
.
11.(22-23高二下·浙江·期中)浙江省实行新高考改革方案以来,英语每年安排两次考试,第一次在1月与选考科目同期进行,称为“首考”,第二次在6月与语文、数学同期进行,称为“老高考”,考生可选用其中一次较好的成绩计入高考总分.英语在“首考”中“一考两用”,成绩既用于评定学业水平等级又可用于高考,学考合格后的考生,英语第二次考试成绩仅用于高考,不计算学考等第.2023年1月“首考”中,英语成绩达到122分及以上的学生,学考等第为A.某校为了解英语考试情况,随机抽取了该校男女各100名学生在“首考”中的英语考试成绩,情况如下表.
男生
女生
A等
40
70
非A等
60
30
(1)估计事件“从200名学生中随机选择1人,选到的学生英语学考等第为A”的概率;
(2)依据小概率值的独立性检验,判断学生英语学考等第与学生性别是否有关?
附:参考公式:,其中.
独立性检验临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【能力提升】
一、单选题
1.(22-23高二下·河北张家口·期末)某校团委对“学生喜欢体育和性别是否有关”作了一次调查,其中被调查的男、女生人数相同,男生喜欢体育的人数占男生人数的,女生喜欢体育的人数占女生人数的,若有95%以上的把握认为是否喜欢体育和性别有关,则调查人数中男生人数可能是( )
0.050
0.010
3.841
6.635
【附:,其中】
A.35 B.39 C.40 D.50
2.(21-22高二下·河南·期中)随着“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报就“支持增加中学生体育锻炼时间的政策是否与性别有关”对某校高二年级部分学生做了专题调查,被调查的男、女生人数相同,其中男生支持的人数占调查男生人数的,女生支持的人数占调查女生人数的.若有99%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则参加调查的男生可能有( )
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.135人 B.140人 C.145人 D.150人
3.(23-24高二下·吉林长春·期中)2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,在犯错误的概率大于0.001且不超过0.01的前提下认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
A.130 B.190 C.240 D.250
4.(23-24高二下·福建漳州·期中)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:附:,其中.
体育课不及格
体育课及格
合计
文化课及格
57
221
278
文化课不及格
16
43
59
合计
73
264
337
在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到的值为( )
A.38.214 B.1.255 C.0.0037 D.2.058
二、多选题
5.(23-24高二下·广东广州·期末)下列说法中,正确的是( )
A.设随机变量服从正态分布,若,则
B.某人在10次答题中,答对题数为,,则答对7题的概率最大
C.基于小概率值的检验规则是:当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断不成立,可以认为和独立
D.将4名老师分派到两个学校支教,每个学校至少派1人,则共有14种不同的分派方法
6.(23-24高二下·黑龙江大庆·期末)以下几种说法正确的是( )
A.对于相关系数,越接近1,相关程度越大,越接近0,相关程度越小
B.若随机变量满足,则
C.根据分类变量与的成对样本数据,计算得到.依据的独立性检验,可判断与有关且犯错误的概率不超过0.05
D.某人在次射击中,击中目标的次数为,射击中靶的概率为,若,则
三、填空题
7.(23-24高二下·辽宁大连·期中)某校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有的把握认为喜欢短视频和性别相关联,则的最小值为 .附,
0.05
0.01
3.841
6.635
8.(23-24高二下·江西宜春·期中)为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为,则 .
附:.临界值表:
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
四、解答题
9.(24-25高二上·江西·期末)对于样本空间中的随机事件A和随机事件B,定义:表示在事件A发生的条件下事件B的发生强度,表示在事件发生的条件下事件B的发生强度.某著名生物科研所为研究上班族患有肥胖症与经常喝“肥宅快乐水”的关系,随机调查了某地区100位上班族,统计数据如下表所示.
患有肥胖症
不患有肥胖症
合计
经常喝
16
不经常喝
18
52
合计
100
(1)完善上述列联表并判断是否有99.5%的把握认为该地区上班族患有肥胖症与经常喝“肥宅快乐水”之间有关联;
(2)证明;
(3)从该地区的上班族中任取一位,记事件A为“此人患有肥胖症”,B为“此人经常喝肥宅快乐水”,利用调查的样本数据,估计的值.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
10.(23-24高二下·安徽安庆·期中)随着全民运动健康意识的提高,马拉松运动在全国各大城市逐渐兴起,参与马拉松训练与比赛的人数逐年增加,为此某市对人们参加马拉松运动的情况进行了统计调查,其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练天数
不大于2天
3天或4天
不少于5天
人数
30
130
40
若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.
附:(为样本容量)
a
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
(1)经调查,该市约有3万人参与马拉松运动,估计其中“热烈参与者”的人数;
(2)根据上表的数据,填写下列:列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下,认为“热烈参与马拉松”与性别有关?
性别
热烈参与者
非热烈参与者
合计
男
140
女
55
合计
11.(23-24高二下·浙江台州·期中)某观影平台为了解观众对最近上映的某部影片的评价情况(评价结果仅有“好评”、“差评”),从平台所有参与评价的观众中随机抽取216人进行调查,部分数据如下表所示(单位:人):
好评
差评
合计
男性
40
68
108
女性
60
48
108
合计
100
116
216
(1)判断是否有的把握认为“对该部影片的评价与性别有关”?
(2)若将频率视为概率,从观影平台的所有给出“好评”的观众中随机抽取3人,用随机变量表示被抽到的男性观众的人数,求的分布列;
(3)在抽出的216人中,从给出“好评”的观众中利用分层抽样的方法抽取10人,从给出“差评”的观众中抽取人.现从这人中,随机抽出2人,用随机变量表示被抽到的给出“好评”的女性观众的人数.若随机变量的数学期望不小于1,求的最大值.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司6
学科网(北京)股份有限公司
$$
第11讲 列联表与独立性检验
目录
题型归纳 1
题型01 完善列联表 3
题型02 列联表分析 7
题型03 等高条形图 12
题型04 独立性检验的概念及辨析 15
题型05 卡方的计算 17
题型06 独立性检验的基本思想 24
题型07 独立性检验解决实际问题 29
分层练习 33
夯实基础 33
能力提升 44
知识点01 分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为
分类变量.分类变量的取值可以用实数表示.
知识点02 2×2列联表
假设两个分类变量X和Y,它们的可能取值分别为{,}和{,},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
知识点03 等高堆积条形图
常用等高堆积条形图展示列联表数据的频率特征(如图),由此反映出两个分类变量间是否相互影响.
(1)等高堆积条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,
观察下方颜色区域的高度,如果两个高度相差比较明显(即和相差很大),就判定两个分类
变量之间有关系.
(2)利用等高堆积条形图虽可以比较各个部分之间的差异,明确展现两个分类变量的关系,但不能知道
两个分类变量有关系的概率大小.
知识点04 独立性检验
(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
则.
(2)利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简
称独立性检验.
(3)独立性检验中几个常用的小概率值和相应的临界值.
知识点05 独立性检验的应用问题的解题策略
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
题型01完善列联表
【例1】(20-21高二下·天津河西·期中)如表是列联表,则表中的、的值分别为( )
合计
8
35
11
34
45
合计
42
80
A.27、38 B.28、38 C.27、37 D.28、37
【答案】A
【知识点】完善列联表
【分析】根据列联表的数据,补全表格,即可判断选项.
【详解】解:,.
故选:A.
【变式1】(22-23高二下·宁夏固原·期中)下面是一个列联表,则表中处的值分别为( )
总计
25
73
21
总计
49
A.98,28 B.28,98 C.48,45 D.45,48
【答案】C
【知识点】完善列联表
【分析】根据列联表求解.
【详解】解:由个列联表知:
,
解得,
故选:C
【变式2】(22-23高二下·广东深圳·期中)下面是一个2×2列联表:
合计
合计
则表中a,b处的值分别为 ; .
【答案】 52 60
【知识点】完善列联表
【分析】第一空利用直接求出即可;第二空利用,结合的值求得即可.
【详解】根据已知条件,结合列联表之间的数据关系,由表中数据可知,
,所以;
.
故答案为:
【变式3】(21-22高二下·北京·期中)在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”
(1)根据所给数据完成下列表格;
效果一般
效果较好
合计
男
25
45
女
40
合计
(2)用(1)中表格的数据估计全校线上教学的效果,用频率估计概率.从该校学生中任意抽取3人,记所抽取的3人中认为线上教学“效果一般”的人数为X,求X的分布列和数学期望及方差.
【答案】(1)表格见解析;
(2)分布列见解析,,.
【知识点】完善列联表、利用二项分布求分布列、二项分布的均值、二项分布的方差
【分析】(1)根据题设完善数据表即可;
(2)由题设知,应用二项分布概率公式求对应概率并写出分布列,再由二项分布期望、方差公式求期望及方差.
【详解】(1)由题设,表格如下:
效果一般
效果较好
合计
男
25
20
45
女
15
40
55
合计
40
60
100
(2)由(1)知:抽到认为效果一般的学生为,则,
所以,,
,,
的分布列为
0
1
2
3
,
题型02 列联表分析
【例2】(20-21高二下·山西朔州·期中)下表是一个列联表,则表中,的值分别为( )
总计
21
25
33
总计
100
A.46,54 B.54,46 C.52,54 D.50,52
【答案】B
【知识点】列联表分析
【分析】根据列联表的数据特征求解.
【详解】由表格中的数据可得,,
所以,.
故选:B.
【变式1】(21-22高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】B
【知识点】列联表分析
【分析】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.
【详解】对于A, ,
对于B,,
对于C,,
对于D,
显然B中最大,该组数据能说明x与y有关系的可能性最大,
故选:B.
【变式2】(21-22高二下·河南·期中)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:
了解
不了解
总计
年龄不小于60岁
a
b
a+b
年龄小于60岁
c
d
c+d
总计
a+c
b+d
a+b+c+d
给出下列4组数据:
① ;② ;
③ ;④ .
则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是 .(填序号)
【答案】③
【知识点】列联表分析
【分析】根据当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,计算每组的值,比较大小可得答案。
【详解】当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,
在①中,,在②中,,在③中,,在④中,,
故居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是③,
故答案为:③
【变式3】(20-21高二下·山东青岛·期中)随着电商事业的发展和工作生活节奏的加快,人们的生活方式和生活理念正在发生巨大的改变.通过外卖App下单订餐叫外卖,正受到越来越多的市民尤其是青年上班族的喜爱.为了解市民是否经常利用外卖平台点餐,调查机构借助网络进行了问卷调查,并从参与调查的网友中抽取了人进行抽样分析,其中经常用外卖平台点餐的人数是基本不用外卖平台点餐的人数的倍;岁以上经常用外卖平台点餐的人数和基本不用外卖平台点餐的人数相等;岁及以下有人基本不用外卖平台点餐.
(1)请完善下面列联表(单位:人),并依据的独立性检验,分析经常利用外卖平台点餐是否与年龄有关?
经常用外卖平台点餐
基本不用外卖平台点餐
总计
岁及以下
岁以上
总计
(2)利用分层抽样方法在经常用外卖平台点餐的市民中随机抽取人,再从以上人中随机抽取人.记被抽取的人中“岁以上”的人数为,求随机变量的分布列和均值.
附:,其中.
临界值表:
【答案】(1)列联表见解析,认为经常利用外卖平台点餐与年龄有关联,此推断犯错误的概率不大于;(2)分布列见解析,均值.
【知识点】完善列联表、列联表分析、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)根据题中的数据完善列联表,再运用公式分析列联表;
(2)根据题意及公式求解随机变量的分布列并计算期望得出结果.
【详解】解:(1)设基本不用外卖平台点餐人数为,
得
所以基本不用外卖平台点餐人数为人
因为岁及以下有15人基本不用外卖平台点餐
所以岁以上有10人基本不用外卖平台点餐,岁以上有10人经常用外卖平台点餐岁及以下有40人经常用外卖平台点餐
列联表如下:
经常用外卖平台点餐
基本不用外卖平台点餐
总计
岁及以下
岁以上
总计
由列联表可知
因为
所以依据小概率值的独立性检验,认为经常利用外卖平台点餐与年龄有关联,此推断犯错误的概率不大于;
(2)由题意可知,抽取的10人中“40岁以上”的市民有2人,
的所有可能取值为
所以的分布列为
0
1
2
所以
题型03 等高条形图
【例3】(21-22高二下·山西太原·期中)在统计中,研究两个分类变量是否存在关联性时,常用的图表有( )
A.散点图和残差图 B.残差图和列联表
C.散点图和等高堆积条形图 D.等高堆积条形图和列联表
【答案】D
【知识点】等高条形图、列联表分析
【分析】根据这些统计量的定义逐个分析判断
【详解】散点图是研究两个变量间的关系,
列联表是研究两个分类变量的,
残差图是体现预报变量与实际值间的差距,
等高堆积条形图能直观的反映两个分类变量的关系,
故选:D
【变式1】(23-24高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【答案】A
【知识点】等高条形图
【分析】分析等高堆积条形图可直接得到答案.
【详解】原图是学校高二1、2班本期中期考试数学成绩优秀率的等高堆积条形图,
从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,BC错误;
两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误;
故选:A.
【变式2】(21-22高二下·山东临沂·期中)某校为研究该校学生性别与体育锻炼的经常性之间的联系,随机抽取100名学生(其中男生60名,女生40名),并绘制得到如图所示的等高堆积条形图,则这100名学生中经常锻炼的人数为 .
【答案】68
【知识点】等高条形图
【分析】根据等高堆积条形图进行数据分析,即可得到答案.
【详解】由等高堆积条形图进行数据分析,这100名学生中经常锻炼的人数为:.
故答案为:68
【变式3】(23-24高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是 .
【答案】乙
【知识点】等高条形图
【分析】根据选项中的图形,即可直接求解.
【详解】等高条形图中有两个高度相同的矩形,每个矩形都有两个颜色,观察下方颜色区域的高度,如果高度差越大,则两个分类变量关系越强,观察四个选项可知,B选项中带颜色区域的高度差最大,两个分类变量、相关关系最强;
故答案为:乙
题型04 独立性检验的概念及辨析
【例4】(23-24高二下·上海·期中)为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算,根据这一数据分析,下列说法正确的是( )
(附:)
A.有的人认为该电视栏目优秀
B.有的人认为该电视栏目是否优秀与改革有关系
C.在犯错误的概率不超过的前提下,认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
【答案】D
【知识点】独立性检验的概念及辨析
【分析】根据卡方表示的意义结合临界值表分析判断即可
【详解】只有时才能在犯错误的概率不超过的前提下认为该电视栏目是否优秀与改革有关系,
而即使也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的推论,与是否有的人等无关.故A,B不正确.
由于,故C错误,D正确.
故选:D.
【变式1】(21-22高二下·山东烟台·期中)下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病
D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大
【答案】D
【知识点】独立性检验的概念及辨析
【分析】根据独立性检验的意义分别判断各选项.
【详解】对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故错误;
对于B,独立性检验并不能确定两个变量相关,故错误;
对于C,是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;
对于D,根据卡方计算的定义可知该选项正确;
故选:D.
【变式2】(20-21高二下·陕西咸阳·期中)若由一个列联表中的数据计算得的观测值,那么有 的把握认为两个变量有关系.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】
【知识点】独立性检验的概念及辨析
【分析】利用独立性检验的观测值对应临界表可得答案.
【详解】解:由一个列联表中的数据计算得,
因为,
所以有的把握认为两个变量有关系.
故答案为:.
【变式3】(20-21高二下·广西玉林·期末)利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用列联表,由计算可得,参照下表
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
至少有 以上的把握认为“爱好该项运动与性别有关”.
【答案】
【知识点】独立性检验的概念及辨析
【分析】根据卡方的值与参考数据比较即可判断;
【详解】解:因为,,所以
故至少有以上的把握认为“爱好该项运动与性别有关”,
故答案为:
题型05 卡方的计算
【例5】(24-25高二上·辽宁·期末)针对2025年第九届亚冬会在哈尔滨举办,校团委对“是否喜欢冰雪运动与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢冰雪运动的人数占男生人数的,女生中喜欢冰雪运动的人数占女生人数的,若有的把握认为是否喜欢冰雪运动与学生性别有关,则被调查的学生中男生的人数不可能为( )
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.54 B.48 C.42 D.36
【答案】D
【知识点】卡方的计算
【分析】设男生人数为,结合卡方计算可得,即,进而可判断.
【详解】设男生人数为,因为被调查的男、女生人数相同,所以女生人数也为,根据题意列出列联表:
男生
女生
合计
喜欢冰雪运动
不喜欢冰雪运动
合计
则,因为有的把握认为是否喜欢冰雪运动与学生性别有关,所以,即,解得,又,所以A,B,C项正确,D项错误.
故选:D
【变式1】(23-24高二下·全国·期中)以“智联世界,生成未来”为主题的2023世界人工智能大会在中国上海举行,人工智能的发展为许多领域带来了巨大的便利,但同时也伴随着一些潜在的安全隐患.为了调查人们对人工智能所持的态度,某机构从所在地区随机调查100人,所得结果统计如下:
年龄在50岁以上(含50岁)
年龄在50岁以下
性别
男
女
男
女
持支持态度
15
10
30
15
不持支持态度
10
10
5
5
(填“有”或“没有”)的把握认为所持态度与年龄有关.
附:,.
0.10
0.05
0.01
k
2.706
3.841
6.635
【答案】有
【知识点】完善列联表、卡方的计算
【分析】依题意完善列联表,计算出卡方,与比较即可得.
【详解】由题可得如下列联表:
年龄在50岁以上(含50岁)
年龄在50岁以下
总计
持支持态度
25
45
70
不持支持态度
20
10
30
总计
45
55
100
根据列联表中的数据,经计算得到,
所以有的把握认为所持态度与年龄有关.
故答案为:有.
【变式2】(24-25高二上·四川眉山·期中)随着互联网的高速发展和新媒体形式的不断丰富,微短剧作为一种新兴的文化载体,正逐渐成为拓展文化消费空间的重要途径.某媒体为了了解微短剧消费者的年龄分布,随机调查了200名消费者,得到如下列联表:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
45
不是微短剧消费者
合计
100
200
(1)根据小概率值的独立性检验,能否认为“是微短剧消费者”与“年龄不超过40岁”有关联?
(2)记2020~2024年的年份代码x依次为1,2,3,4,5,下表为2020~2023年中国微短剧市场规模及2024年中国微短剧预测的市场规模y(单位:亿元)与x的统计数据:
年份代码x
1
2
3
4
5
市场规模y
9.4
36.8
101.7
373.9
m
根据上表数据求得y关于x的经验回归方程为,求相关系数r,并判断该经验回归方程是否有价值.
参考公式:,其中,.
,相关系数..
若,则认为经验回归方程有价值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关联
(2),该经验回归方程有价值.
【知识点】相关系数的计算、卡方的计算、完善列联表
【分析】(1)先补全列联表,再计算卡方,根据独立性检验原则即可判断;
(2)通过给出的经验回归方程公式求相关系数,再判断.
【详解】(1)2×2列联表如下:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
15
45
不是微短剧消费者
70
85
155
合计
100
100
200
零假设“是微短剧消费者”与“年龄不超过40岁”无关联,
因为,
根据小概率值的独立性检验,我们推断不成立,即认为“是微短剧消费者”与“年龄不超过40岁”有关联,此推断犯错误的概率不超过0.05.
(2)由x的取值依次为1,2,3,4,5,得,,
因为经验回归方程为,
所以,
所以,
所以.
因为,所以该经验回归方程有价值.
【变式3】(23-24高二下·云南昆明·期中)为了解某一地区电动汽车销售情况,某部门根据统计数据,用最小二乘法得到电动汽车销量y(单位:万台)关于x(年份)的线性回归方程为,且销量y的方差,年份x的方差.
(1)求y与x的相关系数r,并据此判断电动汽车销量y与年份x的相关性强弱;
(2)该部门还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
性别
购买非电动汽车
购买电动汽车
总计
男性
39
45
女性
15
总计
请完成调查数据表,并回答能否依据小概率值的独立性检验判断购买电动车与车主性别有关?
参考公式:(ⅰ)线性回归方程:,其中,;
(ⅱ)相关系数:,若,则可认为y与x线性相关较强.
(ⅲ),.附表:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1),与相关性较强
(2)能有小概率值的独立性检验判断购买电动车与车主性别有关.
【知识点】完善列联表、卡方的计算、相关系数的计算
【分析】(1)将相关系数公式适当变形成,代入相关值计算即可判断;
(2)根据题意完成列联表,计算的值,并与对应的小概率值比较即得.
【详解】(1)相关系数为
,
(由关于的线性回归方程为可知:,且, ),
故关于线性相关较强.
(2)由题意:
性别
购买非电动汽车
购买电动汽车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
,
由表可得能有小概率值的独立性检验判断购买电动车与车主性别有关.
题型06 独立性检验的基本思想
【例6】(23-24高二下·山东青岛·期中)根据分类变量与的成对样本数据,计算得到.已知,依据小概率值的独立性检验,则( )
A.与不独立
B.与不独立,这个结论犯错误的概率不超过0.05
C.与独立
D.与独立,这个结论犯错误的概率不超过0.05
【答案】C
【知识点】独立性检验的基本思想、独立性检验的概念及辨析
【分析】根据独立性检验的知识判断即可.
【详解】因为
根据,根据小概率值的独立性检验知:与独立,C正确.
故选:C.
【变式1】(23-24高二下·辽宁葫芦岛·期末)一部年代创业剧《乘风踏浪》,让辽宁葫芦岛成为许多人心驰神往的旅游度假目的地.为了更好地了解游客需求,优化自身服务,提高游客满意度,随机对1200位游客进行了满意度调查,结果如下表:
男性
女性
合计
满意
560
540
1100
不满意
40
60
100
合计
600
600
1200
根据列联表中的数据,经计算得到 (精确到0.001);依据数据可作出的判断是 .
附:.
0.1
0.05
0.01
2.706
3.841
6.635
【答案】 满意度与性别有关联,推断犯错误的概率不大于0.05(或:有的把握认为满意度与性别有关).
【知识点】独立性检验的基本思想、卡方的计算
【分析】代入的计算公式,再和临界值比较,得到结论.
【详解】,
所以满意度与性别有关联,推断犯错误的概率不大于(或:有的把握认为满意度与性别有关)
故答案为:;满意度与性别有关联,推断犯错误的概率不大于(或:有的把握认为满意度与性别有关)
【变式2】(22-23高二下·河南省直辖县级单位·期中)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别
是否需要志愿者
男
女
需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
参考公式:
【答案】(1)
(2)有的把握认为该地区的老年人是否需要帮助与性别有关
【知识点】简单随机抽样估计总体、卡方的计算、独立性检验的基本思想
【分析】(1)根据样本中数据求解比例即可;
(2)根据表格所给数据,代入随机变量的观测值公式,根据观测值结果即可判断.
【详解】(1)由题意调查的500位老年人中有70位需要志愿者提供帮助,
因此该地区老年人中,需要帮助的老年人的比例的估计值为.
(2)由列联表数据可计算,
由于,所以有的把握认为该地区的老年人是否需要帮助与性别有关.
【变式3】(23-24高二下·河南驻马店·期中)随着新高考改革,高中阶段学生选修分为物理方向和历史方向,为了判断学生选修物理方向和历史方向是否与性别有关,现随机抽取50名学生,得到如下列联表:
物理方向
历史方向
总计
男生
13
a
23
女生
7
20
27
总计
b
c
50
(1)计算a,b,c的值;
(2)问是否有95%的把握认为选修物理方向和历史方向与性别有关?
附:,.
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1),,
(2)有95%的把握认为选修物理方向和历史方向是否与性别有关
【知识点】独立性检验的基本思想、卡方的计算、完善列联表
【分析】(1)借助列联表数据计算即可得;
(2)计算卡方,与3.841比较大小即可得.
【详解】(1)由,得,
由,得,
由,得;
(2),
因为,
故有95%的把握认为选修物理方向和历史方向是否与性别有关.
题型07 独立性检验解决实际问题
【例7】(23-24高二下·山西长治·期中)某课外兴趣小组为研究数学成绩优秀是否与性别有关,通过随机抽样调查,得到成对样本观测数据的分类统计结果,并计算得出,经查阅独立性检验的小概率值和相应的临界值,知,则下列判断正确的是( )
A.若某人数学成绩优秀,那么他为男生的概率是
B.每100个数学成绩优秀的人中就会有1名是女生
C.数学成绩优秀与性别有关,此推断犯错误的概率不大于
D.在犯错误的概率不超过的前提下认为数学成绩优秀与性别无关
【答案】C
【知识点】独立性检验的基本思想、独立性检验解决实际问题
【分析】根据独立性检验的定义判断即可.
【详解】因为,
所以数学成绩优秀与性别有关,此推断犯错误的概率不大于,
即在犯错误率不超过的前提下认为“数学成绩优秀与性别有关”,故C正确,D错误;
若某人数学成绩优秀,由已知数据不能判断他为男生的概率,故A错误;
每个数学成绩优秀的人中可能没有女生,也有可能有多名女生,由已知数据不能确定结论,故B错误;
故选:C.
【变式1】(23-24高二下·湖南长沙·期中)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据(,)
支持
不支持
男生
女生
若通过计算得,根据小概率值的独立性检验,认为支持增加中学生体育锻炼时间的政策与性别有关,则在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为 .
附:,其中.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【答案】66
【知识点】独立性检验解决实际问题
【分析】根据独立性检验公式列出不等式,进而求解即可.
【详解】因为有95%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,
所以,
即,
因为函数在时单调递增,
且,,,
所以的最小值为16,
所以在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为.
故答案为:66.
【变式2】(23-24高二下·山西长治·期中)直播带货逐渐成为乡村振兴的新动力,为了解甲、乙两个推销农产品的直播间的销售情况,统计了一段时间内观众下单的相关数据,得到如下的列联表:
下单的观众数(单位:百人)
未下单的观众数(单位:百人)
合计
甲直播间
6
乙直播间
1
合计
10
20
(1)请补全列联表;
(2)依据小概率值的独立性检验,分析两个直播间观众的下单意愿是否有差异.
附:.
0.10
0.05
0.01
2.706
3.841
6.635
【答案】(1)列联表见解析
(2)两个直播间观众的下单意愿无差异
【知识点】独立性检验解决实际问题、卡方的计算、完善列联表
【分析】(1)根据题目所给的数据填写列联表即可;
(2)计算出卡方,即可判断.
【详解】(1)补全列联表如下:
下单的观众数(单位:百人)
未下单的观众数(单位:百人)
合计
甲直播间
6
9
15
乙直播间
4
1
5
合计
10
10
20
(2)因为,
所以依据小概率值的独立性检验,两个直播间观众的下单意愿无差异.
【变式3】(23-24高二下·山西大同·期中)2023年12月25日,由科技日报社主办,部分两院院士和媒体人共同评选出的2023年国内十大科技新闻揭晓.某高校一学生社团随机调查了本校100名学生对这十大科技的了解情况,按照性别和了解情况分组,得到如下列联表:
不太了解
比较了解
合计
男生
15
45
60
女生
25
15
40
合计
40
60
100
(1)判断是否有的把握认为对这十大科技的了解存在性别差异;
(2)将上述调查所得到的频率视为概率.现在从该地大量学生中,采用随机抽样方法每次抽取1名学生,抽取3次,若每次抽取的结果是相互独立的,记“被抽取的3名学生中恰有1名学生是属于比较了解的”为事件,求发生的概率.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有的把握
(2)
【知识点】建立二项分布模型解决实际问题、独立性检验解决实际问题、卡方的计算
【分析】(1)根据题意,利用公式求得,结合附表即可得到结论;
(2)根据题意,利用二项分布的概率公式可求解.
【详解】(1)根据列联表中的数据,得,
所以有的把握认为对这十大科技的了解存在性别差异.
(2)任抽取一名学生属于比较了解的概率为,
则事件A中学生人数服从二项分布,故.
【夯实基础】
一、单选题
1.(23-24高二上·江西九江·期末)某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算得.根据独立性检验的相关知识,对照下表,可以认为有( )把握喜欢篮球与性别有关.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A. B. C. D.
【答案】B
【分析】根据的值以及表格可得答案.
【详解】,
有把握认为喜欢篮球与性别有关,
故选:B.
2.(23-24高二下·陕西·期中)为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过( )
0.15
0.10
0.05
0.025
0.010
k
2.072
2.706
3.841
5.024
6.635
A. B. C. D.
【答案】B
【分析】根据与临界值的大小关系确定犯错误的概率的范围.
【详解】因为,结合表格可知,
所以认为“性别与喜欢数学有关”犯错误的概率不超过0.010.
故选:B
3.(20-21高三上·福建厦门·期末)某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高条形图,则这80名学生中喜欢国画的人数为( )
A.24 B.32 C.48 D.58
【答案】D
【分析】根据等高条形图计算直接得出结果.
【详解】由等高条形图可知,
这80名学生中喜欢国画的人数为:
.
故选:D
4.(20-21高二下·天津河北·期末)为比较甲、乙两所学校学生的数学学习水平,经过抽样并测试得到如下关于和的列联表:
学校
数学成绩
合计
不优秀
优秀()
甲校()
乙校()
合计
根据上表得到乙校数学成绩优秀的频数和样本容量数分别是( )
A.和 B.和 C.和 D.和
【答案】C
【分析】根据列联表中的数据分析即可得答案.
【详解】解:由列联表中的数据可知,乙校共抽的样本人,其中优秀的有人.
故选:C
二、多选题
5.(22-23高二下·江苏常州·期中)已知两个分类变量、,由它们的样本数据计算得到的观测值,的部分临界值表如下:
以下判断正确的是( )
A.在犯错误的概率不超过的前提下认为变量、有关系
B.在犯错误的概率不超过的前提下认为变量、没有关系
C.有的把握说变量、有关系
D.有的把握说变量、没有关系
【答案】AC
【分析】利用独立性检验的基本思想可得出结论.
【详解】因为,因此,在犯错误的概率不超过的前提下认为变量、有关系,
或者说有的把握说变量、有关系,
故选:AC.
6.(22-23高二下·福建泉州·期中)如图是调查某地区男、女中学生喜欢数学的等高堆积条形图,阴影部分表示喜欢数学的百分比,从图可以看出( )
A.性别与喜欢数学无关 B.女生中喜欢数学的百分比为
C.男生比女生喜欢数学的可能性大些 D.男生不喜欢数学的百分比为
【答案】CD
【分析】根据等高堆积条形图即可结合选项求解.
【详解】由图可知,女生喜欢数学的占,男生喜欢数学的占,男生不喜欢数学的百分比为,故B错误,D正确;
显然性别与喜欢数学有关,故A错误;男生比女生喜欢数学的可能性大些,故C正确.
故选:CD.
三、填空题
7.(23-24高二下·云南昆明·期中)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为是否购买该款盲盒与性别有关出错的可能性为 .
附:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
,其中.
【答案】
【分析】根据列联表中的数据,代入卡方公式计算,再与对应的小概率值比较,选择比结果小的最接近的值对应的概率即可.
【详解】因,
故认为是否购买该款盲盒与性别有关出错的可能性为.
故答案为:.
8.(23-24高二下·福建南平·期中)为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】0.01
【分析】根据与临界值的大小关系确定犯错误的概率的范围.
【详解】因为,结合表格可知,所以认为“性别与喜欢数学有关”犯错误的概率不超过.
故答案为:.
四、解答题
9.(22-23高二上·辽宁·期末)为了有针对性地提高学生体育锻炼的积极性,某校需要了解学生是否经常进行体育锻炼与性别因素的相关性,为此随机对该校100名学生进行问卷调查,得到如下列联表.
经常锻炼
不经常锻炼
总计
男
35
女
25
总计
100
已知从这100名学生中任选1人,经常进行体育锻炼的学生被选中的概率为.
(1)完成上面的列联表;
(2)根据列联表中的数据,判断能否有95%的把握认为该校学生是否经常进行体育锻炼与性别因素有关.
附:,其中.
0.1
0.05
0.01
0.001
k
2.706
3.841
6.635
10.828
【答案】(1)列联表见解析
(2)有95%的把握认为该校学生是否经常进行体育锻炼与性别因素有关
【分析】(1)设这100名学生中经常进行体育锻炼的学生有x人,则,解得.,即可完成列联表;
(2)求出,与3.841比较大小即可得结论.
【详解】(1)设这100名学生中经常进行体育锻炼的学生有x人,则,解得.
列联表完成如下:
经常锻炼
不经常锻炼
总计
男
35
25
60
女
15
25
40
总计
50
50
100
(2)由(1)可知,,
∴有95%的把握认为该校学生是否经常进行体育锻炼与性别因素有关.
10.(23-24高二下·天津河西·期中)某班主任对班级22名学生进行了作业量多少的调查,数据如下:在喜欢玩电脑游戏的12人中,有9人认为作业多,3人认为作业不多;在不喜欢玩电脑游戏的10人中,有4人认为作业多,6人认为作业不多.
(1)根据以上数据填写2×2列联表;
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
不喜欢玩电脑游戏
总计
(2)依据小概率的独立性检验,分析喜欢玩电脑游戏与认为作业多少是否有关系?
参考公式:,
参考数据:,
.
【答案】(1)答案见解析
(2)有关系
【分析】(1)根据题意,结合题设中的数据,得出的列联表;
(2)根据列表中的数据,求得,结合附表,得出结论.
【详解】(1)解:(1)根据题中所给数据,得到如下列联表:
认为作业多
认为作业不多
总 计
喜欢玩电脑游戏
9
3
12
不喜欢玩电脑游戏
4
6
10
总 计
13
9
22
(2)解:零假设H0:喜欢玩电脑游戏与认为作业多少没有关系,
由(1)中的的列联表,可得,
所以有充分的理由认为假设不成立,即认为喜欢玩电脑游戏与认为作业多少有关,这种判断出错误的概率不超过0.10.
11.(22-23高二下·浙江·期中)浙江省实行新高考改革方案以来,英语每年安排两次考试,第一次在1月与选考科目同期进行,称为“首考”,第二次在6月与语文、数学同期进行,称为“老高考”,考生可选用其中一次较好的成绩计入高考总分.英语在“首考”中“一考两用”,成绩既用于评定学业水平等级又可用于高考,学考合格后的考生,英语第二次考试成绩仅用于高考,不计算学考等第.2023年1月“首考”中,英语成绩达到122分及以上的学生,学考等第为A.某校为了解英语考试情况,随机抽取了该校男女各100名学生在“首考”中的英语考试成绩,情况如下表.
男生
女生
A等
40
70
非A等
60
30
(1)估计事件“从200名学生中随机选择1人,选到的学生英语学考等第为A”的概率;
(2)依据小概率值的独立性检验,判断学生英语学考等第与学生性别是否有关?
附:参考公式:,其中.
独立性检验临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
(2)与学生性别有关
【分析】(1)利用古典概型的概率公式求解;
(2)求出的值,与临界值比较即可.
【详解】(1)记事件“从200名学生中随机选择1人,选到的学生英语学考等第为”,
则.
(2)2×2列联表为
男生
女生
合计
A等
40
70
110
非A等
60
30
90
合计
100
100
200
零假设:学生英语学考等第与学生性别无关,
所以
依据小概率值的独立性检验,我们推断不成立,
所以学生英语学考等第与学生性别有关,且判断出错的概率不超过0.001.
【能力提升】
一、单选题
1.(22-23高二下·河北张家口·期末)某校团委对“学生喜欢体育和性别是否有关”作了一次调查,其中被调查的男、女生人数相同,男生喜欢体育的人数占男生人数的,女生喜欢体育的人数占女生人数的,若有95%以上的把握认为是否喜欢体育和性别有关,则调查人数中男生人数可能是( )
0.050
0.010
3.841
6.635
【附:,其中】
A.35 B.39 C.40 D.50
【答案】D
【分析】设男生女生人数均为,根据卡方公式得,根据表格得到不等式,解出即可.
【详解】设男生女生人数均为,则在列联表中,,
若有以上的把握认为学生是否喜欢体育和性别有关,
可知,解得,
又是5的整数倍,可得男生人数可取50,
故选:D.
2.(21-22高二下·河南·期中)随着“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报就“支持增加中学生体育锻炼时间的政策是否与性别有关”对某校高二年级部分学生做了专题调查,被调查的男、女生人数相同,其中男生支持的人数占调查男生人数的,女生支持的人数占调查女生人数的.若有99%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则参加调查的男生可能有( )
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.135人 B.140人 C.145人 D.150人
【答案】D
【分析】设参加调查的男生可能有人,则女生也为人,然后列出列联表,计算,由题意可得,从而可求出的范围,进而可求得答案
【详解】设参加调查的男生可能有人,则女生也为人,
由题意得列联表如下:
支持
不支持
总计
男生
女生
总计
则,
因为有99%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,
所以,
得,
因为是15的倍数,
所以选项D符合题意,
故选:D
3.(23-24高二下·吉林长春·期中)2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,在犯错误的概率大于0.001且不超过0.01的前提下认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
A.130 B.190 C.240 D.250
【答案】B
【分析】设男、女学生的人数都为,可得列联表,由独立性检验算出,结合观测值和选项可得答案.
【详解】依题意,设男、女学生的人数都为,则男、女学生的总人数为,可得列联表如下,
喜欢网络课程
不喜欢网络课程
总计
男生
女生
总计
故,
由题意可得,
所以,结合选项可知,只有B符合题意.
故选:B.
4.(23-24高二下·福建漳州·期中)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:附:,其中.
体育课不及格
体育课及格
合计
文化课及格
57
221
278
文化课不及格
16
43
59
合计
73
264
337
在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到的值为( )
A.38.214 B.1.255 C.0.0037 D.2.058
【答案】B
【分析】由卡方公式计算即可.
【详解】,
故选:B
二、多选题
5.(23-24高二下·广东广州·期末)下列说法中,正确的是( )
A.设随机变量服从正态分布,若,则
B.某人在10次答题中,答对题数为,,则答对7题的概率最大
C.基于小概率值的检验规则是:当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断不成立,可以认为和独立
D.将4名老师分派到两个学校支教,每个学校至少派1人,则共有14种不同的分派方法
【答案】BCD
【分析】根据正态分布的对称性即可求解A,根据二项分布的概率公式,列不等式即可求解B,由独立性检验的思想即可求解C,根据分组分配问题,即可求解D
【详解】对于A,,,故A错误
对于B,,,
令,解得,
又,,即答对7题的概率最大,故B正确;
对于C,根据独立性检验可知C正确,
对于D, 将4名老师分派到两个学校支教,每个学校至少派1人,则共有种不同的分派方案,故D正确,
故选:BCD
6.(23-24高二下·黑龙江大庆·期末)以下几种说法正确的是( )
A.对于相关系数,越接近1,相关程度越大,越接近0,相关程度越小
B.若随机变量满足,则
C.根据分类变量与的成对样本数据,计算得到.依据的独立性检验,可判断与有关且犯错误的概率不超过0.05
D.某人在次射击中,击中目标的次数为,射击中靶的概率为,若,则
【答案】AC
【分析】由相关系数性质可得A;由方差性质计算可得B;由独立性检验定义可得C;由二项分布的期望与方差公式可得D.
【详解】对A:在回归分析中,相关系数的绝对值越接近于1,相关程度就越大,故A正确;
对B:,故B错误;
对C:观测值越大,有关系把握程度越大,故C正确;
对D:由,则有,,
故,即,故D错误.
故选:AC.
三、填空题
7.(23-24高二下·辽宁大连·期中)某校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有的把握认为喜欢短视频和性别相关联,则的最小值为 .附,
0.05
0.01
3.841
6.635
【答案】20
【分析】根据题意先列出列联表计算值,再根据计算出的最小值.
【详解】根据题意,列联表如下:
喜欢
不喜欢
合计
男
3m
3m
6m
女
4m
2m
6m
合计
7m
5m
12m
,
有的把握认为喜欢短视频和性别相关联,即,
,解得,又,
所以的最小值为.
故答案为:20.
8.(23-24高二下·江西宜春·期中)为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为,则 .
附:.临界值表:
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【答案】5或6/6或5
【分析】由题意,写出列联表,根据独立性检验的公式,结合题意列出不等式,可得答案.
【详解】设男、女学生的总人数为,则,并把列联表的数据补充完整:
喜欢
不喜欢
合计
男生
0.8n
0.2n
n
女生
0.6n
0.4n
n
合计
1.4n
0.6n
2n
所以,
又因为有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,
所以,
又,所以,
所以或,
故答案为:5或6.
四、解答题
9.(24-25高二上·江西·期末)对于样本空间中的随机事件A和随机事件B,定义:表示在事件A发生的条件下事件B的发生强度,表示在事件发生的条件下事件B的发生强度.某著名生物科研所为研究上班族患有肥胖症与经常喝“肥宅快乐水”的关系,随机调查了某地区100位上班族,统计数据如下表所示.
患有肥胖症
不患有肥胖症
合计
经常喝
16
不经常喝
18
52
合计
100
(1)完善上述列联表并判断是否有99.5%的把握认为该地区上班族患有肥胖症与经常喝“肥宅快乐水”之间有关联;
(2)证明;
(3)从该地区的上班族中任取一位,记事件A为“此人患有肥胖症”,B为“此人经常喝肥宅快乐水”,利用调查的样本数据,估计的值.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,有的把握
(2)证明见解析
(3)
【分析】(1)求出与临界值比较即可判断;
(2)由条件概率计算公式即可求证;
(3)由样本数据得到,再由条件概率公式代入计算即可;
【详解】(1)解:完善列联表如下.
患有肥胖症
不患有肥胖症
合计
经常喝
16
32
48
不经常喝
34
18
52
合计
50
50
100
根据列联表数据可得
所以有的把握认为该地区上班族患有肥胖症与经常喝"肥宅快乐水"有关联.
(2)证明:由,
,
左,右两边展开相同,故得证.
(3)由样本数据可得,又,
故.
10.(23-24高二下·安徽安庆·期中)随着全民运动健康意识的提高,马拉松运动在全国各大城市逐渐兴起,参与马拉松训练与比赛的人数逐年增加,为此某市对人们参加马拉松运动的情况进行了统计调查,其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练天数
不大于2天
3天或4天
不少于5天
人数
30
130
40
若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.
附:(为样本容量)
a
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
(1)经调查,该市约有3万人参与马拉松运动,估计其中“热烈参与者”的人数;
(2)根据上表的数据,填写下列:列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下,认为“热烈参与马拉松”与性别有关?
性别
热烈参与者
非热烈参与者
合计
男
140
女
55
合计
【答案】(1)6000人
(2)在犯错误概率不超过0.01的前提下,认为“热烈参与马拉松”与性别有关.
【分析】(1)先求出参与马拉松运动的‘热烈参与者’的概率即可求出该市参与马拉松运动的“热烈参与者”的人数.
(2)根据题中所给数据即可填写列联表,再结合独立性检验的思想方法直接计算求解即可得解.
【详解】(1)记事件“参与马拉松运动的‘热烈参与者’”,
则由题意可得,
所以该市参与马拉松运动的“热烈参与者”的人数估计为人.
(2)列联表如下:
性别
热烈参与者
非热烈参与者
合计
男
35
105
140
女
5
55
60
合计
40
160
200
零假设为:“热烈参与马拉松”与性别无关,
根据列联表中的数据得,
所以根据小概率值的独立性检验推断不成立,
所以在犯错误概率不超过0.01的前提下,认为“热烈参与马拉松”与性别有关.
11.(23-24高二下·浙江台州·期中)某观影平台为了解观众对最近上映的某部影片的评价情况(评价结果仅有“好评”、“差评”),从平台所有参与评价的观众中随机抽取216人进行调查,部分数据如下表所示(单位:人):
好评
差评
合计
男性
40
68
108
女性
60
48
108
合计
100
116
216
(1)判断是否有的把握认为“对该部影片的评价与性别有关”?
(2)若将频率视为概率,从观影平台的所有给出“好评”的观众中随机抽取3人,用随机变量表示被抽到的男性观众的人数,求的分布列;
(3)在抽出的216人中,从给出“好评”的观众中利用分层抽样的方法抽取10人,从给出“差评”的观众中抽取人.现从这人中,随机抽出2人,用随机变量表示被抽到的给出“好评”的女性观众的人数.若随机变量的数学期望不小于1,求的最大值.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)有
(2)答案见解析
(3)2
【分析】(1)根据列联表,求出,再根据参考数据可判断;
(2)先求出随机抽取1人为男性的概率,由题意,由二项分布可得答案;
(3)Y的可能取值为0,1,2,求出概率,求出期望,建立不等式,可得答案.
【详解】(1)
,
所以有的把握认为“观影评价与性别有关”.
(2)从观影平台的所有给出“好评”的观众中随机抽取1人为男性的概率为,且各次抽取之间相互独立,所以,
所以,
,
故的分布列为
0
1
2
3
(3)从给出“好评”的观众中利用分层抽样的方法抽取10人,则男性4人,女性6人.则的可能取值为0,1,2,
所以.
所以,即
即,解得,又,所以的最大值为2.
【点睛】关键点点睛:本题第2小问的解决关键是,将问题转化为二项分布问题,即根据条件得出,从而得解.
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司6
学科网(北京)股份有限公司
$$