内容正文:
第15讲 独立性检验
【人教A版2019】
模块一
分类变量与列联表
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为
分类变量.分类变量的取值可以用实数表示.
2.2×2列联表
假设两个分类变量X和Y,它们的可能取值分别为{,}和{,},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
3.等高堆积条形图
常用等高堆积条形图展示列联表数据的频率特征(如图),由此反映出两个分类变量间是否相互影响.
(1)等高堆积条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,
观察下方颜色区域的高度,如果两个高度相差比较明显(即和相差很大),就判定两个分类
变量之间有关系.
(2)利用等高堆积条形图虽可以比较各个部分之间的差异,明确展现两个分类变量的关系,但不能知道
两个分类变量有关系的概率大小.
【题型1 完善列联表】
【例1.1】(2025高三·全国·专题练习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【例1.2】(24-25高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
【变式1.1】(23-24高二下·宁夏固原·期中)下面是一个列联表,则表中处的值分别为( )
总计
25
73
21
总计
49
A.98,28 B.28,98 C.48,45 D.45,48
【变式1.2】(2025高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
【题型2 列联表分析】
【例2.1】(24-25高二·全国·单元测试)假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【例2.2】(24-25高二下·河南·阶段练习)假设两个分类变量和,他们的取值分别为和,其样本频数列联表如下:
总计
总计
对于以下数据,对同一样本说明与有关的可能性最大的一组是( )
A.,,, B.,,,
C.,,, D.,,,
【变式2.1】(23-24高二上·上海·课后作业)下表是两所中学的学生对报考某类大学的意愿的列联表:
愿意报考某类大学
不愿意报考某类大学
总计
中学
中学
总计
根据表中的数据回答:两所中学的学生对报考某类大学的态度是否有显著差异?
【变式2.2】(24-25高二下·全国·课前预习)某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病.根据这些数据能否断定:患呼吸道疾病与吸烟有关?
【题型3 等高条形图及其应用】
【例3.1】(24-25高二下·河北张家口·阶段练习)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
【例3.2】(2024高三·北京·专题练习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
【变式3.1】(2025·四川达州·一模)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
【变式3.2】(24-25高二下·吉林·阶段练习)为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
模块二
独立性检验
1.独立性检验
(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
则.
(2)利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简
称独立性检验.
(3)独立性检验中几个常用的小概率值和相应的临界值.
2.独立性检验的应用问题的解题策略
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
【题型4 独立性检验的概念及辨析】
【例4.1】(2024·江苏苏州·模拟预测)设研究某两个属性变量时,作出零假设并得到2×2列联表,计算得,则下列说法正确的是( )
A.有99.5%的把握认为不成立 B.有5%的把握认为的反面正确
C.有95%的把握判断正确 D.有95%的把握能反驳
【例4.2】(23-24高二下·天津滨海新·阶段练习)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是(参考数据:)( )
①若的观测值满足,我们有99%的把握认为吸烟与患肺病有关系;
②若的观测值满足,那么在100个吸烟的人中约有99人患有肺病;
③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病;
④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误.
A.②③ B.②③④ C.①②④ D.①④
【变式4.1】(23-24高二下·福建宁德·期末)根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把握认为 X 和Y 有关,则的值不可能为( )
2.072
2.706
3.841
6.635
7.879
0.150
0.100
0.050
0.010
0.005
A.2.819 B.5.512 C.6.635 D.8.243
【变式4.2】(23-24高二下·河南信阳·期末)某医疗机构通过抽样调查(样本容量),利用列联表和统计量研究患肺癌是否与吸烟有关.计算得,经查对临界值表知,现给出四个结论,其中正确的是( )
A.根据小概率值的独立性检验,认为“患肺癌与吸烟无关”
B.在100个吸烟的人中约有99个人患肺癌
C.若老张吸烟,那么他有99%的可能性患肺癌
D.有99%的把握认为“患肺癌与吸烟有关”
【题型5 卡方的计算】
【例5.1】(23-24高二下·天津滨海新·期末)现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵严重的A城市和交通拥堵不严重的B城市分别随机调查了20名市民,得到了一个市民是否认可的样本,具体数据如下列联表:
A
B
总计
认可
15
8
23
不认可
5
12
17
总计
20
20
40
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
附:.
根据表中的数据,下列说法中,正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
【例5.2】(23-24高二下·黑龙江哈尔滨·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
【变式5.1】(23-24高二下·浙江·期中)为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.05的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
5.635
7.879
10.828
A.35 B.36 C.37 D.38
【变式5.2】(23-24高二下·全国·期中)某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有的把握认为喜欢短视频和性别相关联,则的最小值为( )
附:.
临界值表:
0.050
0.010
3.841
6.635
A.18 B.20 C.22 D.24
【题型6 独立性检验的实际应用】
【例6.1】(24-25高二下·江西赣州·期中)为了解观看这两部影片的观众中男、女观众的占比情况,某机构采用简单随机抽样的方法,调查了200人,得到如下数据.
观众
性别
合计
男
女
观看A影片
50
50
100
观看B影片
40
60
100
合计
90
110
200
(1)试问观看这两部影片的观众的男女比例是否有差异?
(2)若将表中所有数据都扩大为原来的倍,在相同的检验标准下,再用独立性检验推断观看这两部影片的观众的男女比例是否有差异,若要使得有99%的把握判断观看这两部影片的观众的男女比例有差异,求k的最小值.
附: .
在统计中,用以下结果对变量的独立性进行判断:
当 时,没有充分的证据判断变量有关联,可以认为变量A,B是没有关联的;
当 时,有90%的把握判断变量A,B有关联;
当 时,有95%的把握判断变量A,B有关联;
当 时,有99%的把握判断变量A,B有关联.
【例6.2】(2025·陕西·模拟预测)某生产工厂生产优质钢索,现需要通过不同场次进行钢索检索抽查.现从机器内随机选取了40组(各20组),记录了他们不同米数,并将数据整理如下表:
米数组别
0~20
21~50
51~80
81~100
A
1
2
3
8
6
B
0
3
7
8
2
米数超过被系统评定为“优质”,否则被系统评定为“备选”.
(1)利用样本估计总体的思想,试估计工厂中米数超过的概率;
(2)根据题意完成下面的列联表,并据此判断能否有的把握认为“评定类型”与“组别”有关?
优质
备选
总计
A
B
总计
附:,其中.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式6.1】(24-25高二下·河南南阳·期中)某科技公司2025年计划推出量子加密通信设备,该设备可实时保护数据传输,目标用户为学校、企业和自由开发者.该公司调查了不同用户对该设备的需求情况,得到数据如下(单位:个):
学校
企业
自由开发者
有需求
170
无需求
120
已知调查了400个学校和150个自由开发者.
(1)求和的值;
(2)估计目标用户对该设备有需求的概率;
(3)是否有的把握认为学校用户与非学校用户对该设备的需求情况有差异?
附:.
0.1
0.01
0.001
2.706
6.635
10.828
【变式6.2】(2025·甘肃·一模)为了解高一学生整理数学错题与提高数学成绩的相关性,某小组通过随机抽样,获得了每天整理错题和未每天整理错题的各20名学生3次数学考试成绩的平均分,绘制了如图1,2的频率分布直方图,并且已知高一学生3次数学考试成绩的总体均分为115分.
(1)依据频率分布直方图,完成以下列联表:
成绩不低于总体均分
成绩低于总体均分
合计
每天整理错题
未每天整理错题
合计
(2)依据小概率值的独立性检验,分析数学成绩不低于总体均分是否与每天整理数学错题有关.
附
0.10
0.01
0.001
2.706
6.635
10.828
【题型7 独立性检验与其他知识交汇】
【例7.1】(24-25高二下·江苏无锡·期中)甲、乙两家公司到某大学进行招聘,通过对毕业生进行笔试、面试、模拟演练这三项程序后直接签约一批毕业生.已知三项程序分别由三个部门独立依次考核,且互不影响,当三项程序全部通过即可签约.假设该大学100名毕业生参加甲公司招聘的具体情况如下表(不存在通过三项程序考核后放弃签约的现象).
性别
参加考核但未能签约的人数
参加考核并能签约的人数
合计
男生
20
女生
50
合计
30
100
该校的小张准备参加两家公司的招聘,小张通过甲公司的每项程序的概率均为,通过乙公司的每项程序的概率依次为,,,其中.
(1)完成列联表,根据小概率值的独立性检验,判断这100名毕业生参加甲公司的招聘能否签约与性别是否有关;
(2)若小张通过甲、乙两公司程序的项数分别记为,.当时,求小张参加乙公司招聘并能成功签约的概率.
附:,其中.
0.100
0.050
0.025
0.001
2.706
3.841
5.024
10.828
【例7.2】(24-25高二下·辽宁沈阳·阶段练习)2024年9月16日,沈阳市举行马拉松比赛,全球马拉松爱好者积极参与本场比赛,某服务部门为提升服务质量,随机采访了120名参赛人员,得到下表:
满意度
性别
合计
女性
男性
比较满意
50
非常满意
40
70
合计
60
120
(1)求的值;
(2)能否有的把握认为不同性别的参赛人员对该部门服务质量的评价有差异?
(3)用频率估计概率,现随机采访本场比赛的1名女性参赛人员与2名男性参赛人员,已知3人中恰有一人对该部门服务非常满意,求该人为女性的概率.
附:.
0.1
0.01
0.001
2.706
6.635
10.828
【变式7.1】(24-25高二下·黑龙江哈尔滨·阶段练习)推进垃圾分类处理,是落实绿色发展理念的必然选择.为加强社区居民的垃圾分类意识,某社区在健身广场举办了“垃圾分类,从我做起”生活垃圾分类大型宣传活动,号召社区居民用实际行动为建设绿色家园贡献一份力量,为此需要征集一部分垃圾分类志愿者.
(1)为调查社区居民喜欢担任垃圾分类志愿者是否与性别有关,现随机选取了一部分社区居民进行调查,其中被调查的男性居民30人,女性居民20人,男性居民中不喜欢担任垃圾分类志愿者占男性居民的,女性居民中不喜欢担任垃圾分类志愿者占女性居民的.根据所给数据,得到成对样本数据的分类统计结果,完成下面列联表,并依据小概率值的独立性检验,能否认为居民喜欢担任垃圾分类志愿者与性别有关?
性别
合计
男性
女性
喜欢担任
不喜欢担任
合计
附:,
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
(2)若某垃圾站的日垃圾分拣量y(千克)与垃圾分类志愿者人数x(人)之间具有较强的线性相关性,求回归直线方程,并预测志愿者人数为10人时,该垃圾站的日垃圾分拣量.
数据统计如表:
志愿者人数x(人)
2
3
4
5
6
日垃圾分拣量y(千克)
24
29
41
46
60
参考数据,附:,
【变式7.2】(24-25高二下·辽宁丹东·期中)某社区为推进智慧社区建设,给居民提供了一款手机构建智能化社区管理服务模式.为了解居民对该的满意度,从管辖范围内的某小区居民中随机抽查了200人,其中男女各占一半,得到如下表格:单位:人
使用
不使用
总计
女性
60
男性
70
总计
(1)请补全题表,并判断是否有的把握认为居民是否使用该与性别有关;
(2)从以上使用该的居民中按性别进行分层抽样抽取6人,再从这6人中随机抽取3人了解居民对该的满意度,记抽取的3人中男性用户的人数为,求的分布列与数学期望.
附:(其中).
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
一、单选题
1.(24-25高二下·河南南阳·期中)下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
2.(24-25高二下·全国·课后作业)假设有两个分类变量和,它们的可能取值分别为和,其列联表如下:
总计
总计
对于以下数据,对同一样本能说明与有关的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
3.(23-24高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
4.(24-25高二下·山东德州·阶段练习)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
5.(23-24高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
6.(24-25高二下·辽宁本溪·阶段练习)某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下列联表:
去年体检人数
去年末体检人数
合计
高中教师
70
30
100
初中教师
100
合计
200
若根据列表得,则这200名教师中,去年末体检的人数为( )(附:,)
A.20 B.30 C.40 D.50
7.(24-25高二下·全国·课后作业)为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:
情况
性别
总计
男
女
正常
442
514
956
色盲
38
6
44
总计
480
520
1000
根据上述数据,试问色盲与性别关系是( )
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A.相互独立 B.不相互独立
C.有的把握认为色盲与性别无关 D.只有的把握认为色盲与性别有关
8.(24-25高二下·全国·课后作业)为了更好地开展多媒体化教学,杭州市某小学对“文理学科教师与喜欢用平板教学”是否有关做了一次研究调查,其中被调查的文科、理科教师人数相同,理科教师喜欢用平板教学的人数占理科教师总人数的80%,文科教师喜欢用平板教学的人数占文科教师总人数的40%,若有95%的把握认为是否喜欢用平板教学和文理学科有关,则调查人数中理科教师人数最少可能是( )
附:,其中.
0.05
0.010
3.841
6.635
A.8 B.12 C.15 D.20
二、多选题
9.(23-24高二下·黑龙江哈尔滨·期末)某校为了解学生对2024欧洲杯的关注度(关注或不关注),对本校学生随机做了一次调查,结果显示被调查的男、女生人数相同,其中有的男生“关注”,有的女生“关注”,若依据小率值的独立性检验,认为学生对欧洲杯的关注度与性别有关联,则调查的总人数可能为( )
参考公式:,.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A.276 B.288 C.300 D.312
10.(23-24高二下·吉林白山·期末)暑假结束后,为了解假期中学生锻炼身体情况,学生处对所有在校学生做问卷调查,并随机抽取了180人的调查问卷,其中男生比女生少20人,并将调查结果绘制得到等高堆积条形图.已知,其中,,在被调查者中,下列说法正确的是( )
A.男生中不经常锻炼的人数比女生中经常锻炼的人数多
B.男生中经常锻炼的人数比女生中经常锻炼的人多8人
C.经常锻炼者中男生的频率是不经常锻炼者中男生的频率的1.6倍左右
D.在犯错误的概率不大于0.01的条件下,可以认为假期是否经常锻炼与性别有关
11.(23-24高二下·河南漯河·期中)为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40 名学生进行调查,按照性别和体育锻炼情况整理出如下的22列联表:
性别
锻炼情况
合计
不经常
经常
女生/人
14
7
21
男生/人
8
11
19
合计/人
22
18
40
临界值表如下:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
根据这些数据,给出下列四个结论中正确的是( )
A.依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响
B.依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响
C.根据小概率值α=0.05的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05
D.根据小概率值α=0.05的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响
三、填空题
12.(23-24高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是 .
13.(24-25高二下·全国·课后作业)欲知作家性别对读者的性别影响,某出版社派工作人员到各书店随机调查了500位买书的顾客,结果如下表所示.
读者
作家
总计
男作家
女作家
男读者
142
122
264
女读者
103
133
236
总计
245
255
500
则在差错不超过0.05的前提下作者的性别与读者的性别 (填“有关”或“无关”).
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
14.(24-25高二下·河南南阳·阶段练习)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有 人.
附:
0.100
0.050
0.010
2.706
3.841
6.635
四、解答题
15.(24-25高二下·全国·课后作业)某电视台对年龄高于40岁和不高于40岁的人是否对打乒乓球感兴趣进行调查,随机调查了高于40岁的60人,不高于40岁的40人,根据样本数据绘制等高堆积条形图如图所示,写出2×2列联表.
16.(24-25高二下·江西赣州·开学考试)截至2025年2月13日晚,电影《哪吒之魔童闹海》(《哪吒2》)总票房(含预售)已突破100亿元,观影人次破2亿,成为中国影史首部票房破100亿且观影人次破2亿的电影,登顶全球影史单一市场票房榜,暂列全球票房榜第17名.按照猫眼专业版AI预测,其最终票房将达到153.38亿,若达成则有望超越电影《星球大战:原力觉醒》的150.19亿票房,排名全球前五.银河影院为了解观众是否喜欢电影与性别有关,调查了400名学生(男女各一半)的选择,发现喜欢该电影的人数是300,喜欢该电影的女生比男生少60人.
(1)完成下面的列联表;
喜欢电影
不喜欢电影
总计
女生
男生
总计
(2)根据调查数据回答:有的把握认为是否喜欢电影与性别有关吗?
附:.
临界值表如下:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
17.(24-25高二下·江苏镇江·期中)某学校举行了一次数学有奖竞赛,对考试成绩优秀(成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)用每个区间的组中值作为相应学生的成绩,估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,且女生的获奖率为,问:能否有的把握认为获奖与性别有关?
附:.
18.(2025·河南开封·二模)某物业公司为提高对某小区的服务质量,随机调查了该小区50名男业主和50名女业主,每位业主对该物业公司的服务给出满意或不满意的评价,得到如下列联表:
满意
不满意
男业主
40
10
女业主
30
20
(1)依据的独立性检验,能否认为该小区男、女业主对该物业公司服务的评价有差异?
(2)从该小区的业主中任选一人,表示事件“选到的人对该物业公司的服务不满意”,表示事件“选到的人为女业主”,利用该调查数据,给出,的估计值.
附:.
0.05
0.01
0.005
3.841
6.635
7.879
19.(24-25高二下·湖南长沙·期中)某车企为考察选购新能源汽车的款式与性别的关联性,调查200人购买情况,得到如下列表:
新能源汽车款
新能源汽车款
总计
男性
100
20
女性
50
30
80
总计
50
200
(1)求;
(2)根据小概率值的独立性检验,能否认为选购该新能源汽车的款式与性别有关联?
(3)假设用样本估计总体,用频率估计概率,所有人选购汽车的款式情况相互独立.若从购买者中随机抽取4人,设被抽取的4人中购买了款车的人数为,求的数学期望.
附:.
0.10
0.05
0.010
0.005
2.706
3.841
6.635
7.879
第 1 页 共 28 页
学科网(北京)股份有限公司
$$
第15讲 独立性检验
【人教A版2019】
模块一
分类变量与列联表
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为
分类变量.分类变量的取值可以用实数表示.
2.2×2列联表
假设两个分类变量X和Y,它们的可能取值分别为{,}和{,},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
3.等高堆积条形图
常用等高堆积条形图展示列联表数据的频率特征(如图),由此反映出两个分类变量间是否相互影响.
(1)等高堆积条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,
观察下方颜色区域的高度,如果两个高度相差比较明显(即和相差很大),就判定两个分类
变量之间有关系.
(2)利用等高堆积条形图虽可以比较各个部分之间的差异,明确展现两个分类变量的关系,但不能知道
两个分类变量有关系的概率大小.
【题型1 完善列联表】
【例1.1】(2025高三·全国·专题练习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【分析】根据联表计算求参即可.
【详解】因为.所以.又,所以.
故选:C.
【例1.2】(24-25高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
【分析】根据题意先得出的值,进而再得的值,进而可知的值.
【详解】因为抽取的村民中,老年人有25名,年轻人有25名,所以,
所以,A、B对;
所以,则对;
则错.
故选:D.
【变式1.1】(23-24高二下·宁夏固原·期中)下面是一个列联表,则表中处的值分别为( )
总计
25
73
21
总计
49
A.98,28 B.28,98 C.48,45 D.45,48
【分析】根据列联表求解.
【详解】解:由个列联表知:
,
解得,
故选:C.
【变式1.2】(2025高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
【分析】已知抽取的老年人、年轻人各有25名,计算各个变量的值,进而得到答案.
【详解】因为,,
,,,,
所以,,,,.
故选:D.
【题型2 列联表分析】
【例2.1】(24-25高二·全国·单元测试)假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【分析】计算每个选项中的,比较大小后可得出结论.
【详解】对于两个分类变量与而言,的值越大,说明与有关系的可能性最大,
对于A选项,,
对于B选项,,
对于C选项,,
对于D选项,,
显然D中最大,
故选:D.
【例2.2】(24-25高二下·河南·阶段练习)假设两个分类变量和,他们的取值分别为和,其样本频数列联表如下:
总计
总计
对于以下数据,对同一样本说明与有关的可能性最大的一组是( )
A.,,, B.,,,
C.,,, D.,,,
【分析】依据越大,说明与有关的可能性越大,即可判定.
【详解】一般地,越大,说明与有关的可能性越大.
选项A中,;
选项B中,;
选项C中,;
选项D中,.
故选:B.
【变式2.1】(23-24高二上·上海·课后作业)下表是两所中学的学生对报考某类大学的意愿的列联表:
愿意报考某类大学
不愿意报考某类大学
总计
中学
中学
总计
根据表中的数据回答:两所中学的学生对报考某类大学的态度是否有显著差异?
【分析】分别计算中学报考某类大学的比例,对比即可得到结论.
【详解】中学愿意报考某类大学的比率为;
中学愿意报考某类大学的比例为;
,即中学愿意报考某类大学的比例比中学高了,
两所中学的学生对报考某类大学的态度有显著差异,且中学更愿意报考.
【变式2.2】(24-25高二下·全国·课前预习)某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病.根据这些数据能否断定:患呼吸道疾病与吸烟有关?
【分析】根据题意列出列联表,再算出在吸烟中和不吸烟中患病的频率,通过比较之间是否存在差异即可判断是否有关.
【详解】为了研究这个问题,我们将上述数据用表格表示如下:
患病
未患病
合计
吸烟
37
183
220
不吸烟
21
274
295
合计
58
457
515
由此表可以粗略地估计出在吸烟的人中,有的人患病;
在不吸烟的人中,有的人患病.
因此,从直观上可以得到结论:吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,
故可以认为患呼吸道疾病与吸烟有关.
【题型3 等高条形图及其应用】
【例3.1】(24-25高二下·河北张家口·阶段练习)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
【分析】根据题意,由等高条形图的意义分析可得答案.
【详解】根据题意,在等高的条形图中,当,所占比例相差越大时,越有把握认为两个分类变量,之间有关系,
由选项可得:B选项中,,所占比例相差无几,所以最有把握认为两个分类变量,之间没有关系,
故选:B.
【例3.2】(2024高三·北京·专题练习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
【分析】通过对等高堆积条形图的分析,结合所列列联表及不等式性质,逐一对每个选项进行推理判断即可.
【详解】设等高条形图对应列联表如下:
岁及以上
岁以下
总计
男性
女性
总计
根据第个等高条形图可知,岁及以上男性比岁及以上女性多,即;
岁以下男性比岁以下女性多,即.
根据第个等高条形图可知,男性中岁及以上的比岁以下的多,即;
女性中岁及以上的比岁以下的多,即,
对于A,男性人数为,女性人数为,
因为,所以,所以A正确;
对于B,岁及以上女性人数为,岁以下女性人数为,
因为,所以B正确;
对于C,岁以下男性人数为,岁及以上女性人数为,
无法从图中直接判断与的大小关系,所以C不一定正确;
对于D,岁及以上的人数为,岁以下的人数为,
因为,所以,所以D正确.
故选:C.
【变式3.1】(2025·四川达州·一模)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
【分析】根据等高条形图的概念结合条件逐项分析即得.
【详解】根据等高条形图图1可知样本中选择物理学科的人数较多,故C正确;
根据等高条形图图2可知样本中男生人数多于女生人数,故D错误;
样本中选择物理学科的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低,
所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;
样本中女生选择历史意愿的人数不一定多于男生选择历史意愿的人数,故B错误.
故选:C.
【变式3.2】(24-25高二下·吉林·阶段练习)为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
【分析】结合所给比例图,依次分析判断4个选项即可.
【详解】对于A,城镇户籍中选择生育二胎,农村户籍中选择生育二胎,相差较大,则是否倾向选择生育二胎与户籍有关,A错误;
对于B,男性和女性中均有选择生育二胎,则是否倾向选择生育二胎与性别无关,B错误;
对于C,由于男性和女性中均有选择生育二胎,但样本中男性40人,女性60人,则倾向选择生育二胎的人员中,男性人数与女性人数不同,C错误;
对于D,倾向选择不生育二胎的人员中,农村户籍有人,城镇户籍有人,农村户籍人数少于城镇户籍人数,D正确.
故选:D.
模块二
独立性检验
1.独立性检验
(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
则.
(2)利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简
称独立性检验.
(3)独立性检验中几个常用的小概率值和相应的临界值.
2.独立性检验的应用问题的解题策略
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
【题型4 独立性检验的概念及辨析】
【例4.1】(2024·江苏苏州·模拟预测)设研究某两个属性变量时,作出零假设并得到2×2列联表,计算得,则下列说法正确的是( )
A.有99.5%的把握认为不成立 B.有5%的把握认为的反面正确
C.有95%的把握判断正确 D.有95%的把握能反驳
【分析】根据独立性检验的概念以及计算步骤,可得答案.
【详解】依题意,,因此有95%的把握反驳,
故选:D.
【例4.2】(23-24高二下·天津滨海新·阶段练习)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是(参考数据:)( )
①若的观测值满足,我们有99%的把握认为吸烟与患肺病有关系;
②若的观测值满足,那么在100个吸烟的人中约有99人患有肺病;
③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病;
④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误.
A.②③ B.②③④ C.①②④ D.①④
【分析】由给出的数据,结合观测值的意义判定即可.
【详解】若的观测值满足,则我们有的把握认为吸烟与患肺病有关系,
而得知有的把握认为吸烟与患肺病有关系时,仍有的可能性使推断出现错误,
但不能说明个吸烟的人中约有人患有肺病,
也不能说明每个吸烟的人有的可能性会患肺病.
故①④正确、②③错误.
故选:D.
【变式4.1】(23-24高二下·福建宁德·期末)根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把握认为 X 和Y 有关,则的值不可能为( )
2.072
2.706
3.841
6.635
7.879
0.150
0.100
0.050
0.010
0.005
A.2.819 B.5.512 C.6.635 D.8.243
【分析】利用独立性检验的观测值对应临界表可得答案.
【详解】因为有不少于95%的把握认为 X 和Y 有关,
所以,只有A不满足要求.
故选:A.
【变式4.2】(23-24高二下·河南信阳·期末)某医疗机构通过抽样调查(样本容量),利用列联表和统计量研究患肺癌是否与吸烟有关.计算得,经查对临界值表知,现给出四个结论,其中正确的是( )
A.根据小概率值的独立性检验,认为“患肺癌与吸烟无关”
B.在100个吸烟的人中约有99个人患肺癌
C.若老张吸烟,那么他有99%的可能性患肺癌
D.有99%的把握认为“患肺癌与吸烟有关”
【分析】根据独立性检验可得正确选项.
【详解】依已知数据,得有的把握认为“患肺癌与吸烟有关”,
则选项D正确,其余都是错误的.
故选:D.
【题型5 卡方的计算】
【例5.1】(23-24高二下·天津滨海新·期末)现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵严重的A城市和交通拥堵不严重的B城市分别随机调查了20名市民,得到了一个市民是否认可的样本,具体数据如下列联表:
A
B
总计
认可
15
8
23
不认可
5
12
17
总计
20
20
40
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
附:.
根据表中的数据,下列说法中,正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
【分析】先计算出卡方值,再分别与各选项中的相应的小概率值比较,根据独立性检验的原理,即可作出判断
【详解】由
对于A,因,故有95%以上的把握认为“是否认可与城市的拥堵情况有关”,即A错误;
对于B,因,故没有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”,即B错误;
对于C,因,故可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”,即C正确;
对于D,因,故在犯错误的概率不超过0.01的前提下不能认为“是否认可与城市的拥堵情况有关”,即D错误.
故选:C.
【例5.2】(23-24高二下·黑龙江哈尔滨·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
【分析】根据所给数据完善列联表,计算出卡方,即可判断.
【详解】依题意可得列联表如下:
男生
女生
合计
篮球迷
30
15
45
非篮球迷
45
10
55
合计
75
25
100
所以,
所以在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关,
即有的把握认为是否是篮球迷与性别有关,
又,所以没有的把握认为是否是篮球迷与性别有关.
故选:B.
【变式5.1】(23-24高二下·浙江·期中)为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.05的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
5.635
7.879
10.828
A.35 B.36 C.37 D.38
【分析】根据题意列出二联表,即可由卡方公式求解即可.
【详解】设没接种只数为k,依题意,得2×2列联表如下:
发病
没发病
合计
接种
2k
没接种
k
合计
3k
则的观测值为:,因为本次调查得出“在犯错误的概率不超过0.05的前提下认为喜爱足球与性别有关的结论,
于是,即,即
∴,∴
故选:B.
【变式5.2】(23-24高二下·全国·期中)某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有的把握认为喜欢短视频和性别相关联,则的最小值为( )
附:.
临界值表:
0.050
0.010
3.841
6.635
A.18 B.20 C.22 D.24
【分析】根据题意先列出列联表计算值,再根据计算出的最小值.
【详解】根据题意,列联表如下:
喜欢
不喜欢
合计
男
女
合计
;
∵有的把握认为喜欢短视频和性别相关联,即,
,,又,
则的最小值为.
故选:B.
【题型6 独立性检验的实际应用】
【例6.1】(24-25高二下·江西赣州·期中)为了解观看这两部影片的观众中男、女观众的占比情况,某机构采用简单随机抽样的方法,调查了200人,得到如下数据.
观众
性别
合计
男
女
观看A影片
50
50
100
观看B影片
40
60
100
合计
90
110
200
(1)试问观看这两部影片的观众的男女比例是否有差异?
(2)若将表中所有数据都扩大为原来的倍,在相同的检验标准下,再用独立性检验推断观看这两部影片的观众的男女比例是否有差异,若要使得有99%的把握判断观看这两部影片的观众的男女比例有差异,求k的最小值.
附: .
在统计中,用以下结果对变量的独立性进行判断:
当 时,没有充分的证据判断变量有关联,可以认为变量A,B是没有关联的;
当 时,有90%的把握判断变量A,B有关联;
当 时,有95%的把握判断变量A,B有关联;
当 时,有99%的把握判断变量A,B有关联.
【分析】(1)有列联表中的数据计算即可得出判断;
(2)计算,令,结合即可求解.
【详解】(1)根据列联表中的数据,经计算得到,
因为,所以观看这两部影片的观众的男女比例没有差异.
(2),
令,即,
取,则,
因为,所以的最小值为4.
【例6.2】(2025·陕西·模拟预测)某生产工厂生产优质钢索,现需要通过不同场次进行钢索检索抽查.现从机器内随机选取了40组(各20组),记录了他们不同米数,并将数据整理如下表:
米数组别
0~20
21~50
51~80
81~100
A
1
2
3
8
6
B
0
3
7
8
2
米数超过被系统评定为“优质”,否则被系统评定为“备选”.
(1)利用样本估计总体的思想,试估计工厂中米数超过的概率;
(2)根据题意完成下面的列联表,并据此判断能否有的把握认为“评定类型”与“组别”有关?
优质
备选
总计
A
B
总计
附:,其中.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【分析】(1)根据样本估计总体即可;
(2)利用独立性检验思想求解.
【详解】(1)由题可得,样本米数超过的频率为,
根据样本估计总体的思想,估计工厂中米数超过的概率为.
(2)根据题意,列联表完成如下,
优质
备选
总计
A
14
6
20
B
10
10
20
总计
24
16
40
零假设:“评定类型”与“组别”无关,
则,
所以零假设成立,即“评定类型”与“组别”无关,
所以没有的把握认为“评定类型”与“组别”有关.
【变式6.1】(24-25高二下·河南南阳·期中)某科技公司2025年计划推出量子加密通信设备,该设备可实时保护数据传输,目标用户为学校、企业和自由开发者.该公司调查了不同用户对该设备的需求情况,得到数据如下(单位:个):
学校
企业
自由开发者
有需求
170
无需求
120
已知调查了400个学校和150个自由开发者.
(1)求和的值;
(2)估计目标用户对该设备有需求的概率;
(3)是否有的把握认为学校用户与非学校用户对该设备的需求情况有差异?
附:.
0.1
0.01
0.001
2.706
6.635
10.828
【分析】(1)根据题意列出关于m,n的等量关系式即可求解;
(2)由题设数据结合古典概型直接计算即可得解;
(3)列出列联表,计算出卡方值即可判断得解.
【详解】(1)由题得;
(2)由题可得估计目标用户对该设备有需求的概率为;
(3)列出列联表:
学校用户
非学校用户
总计
有需求
300
270
570
无需求
100
170
270
总计
400
440
840
零假设学校用户与非学校用户对该设备的需求情况无差异.
由表格得,
根据小概率值的独立性检验,推断不成立,
所以有的把握认为学校用户与非学校用户对该设备的需求情况有差异.
【变式6.2】(2025·甘肃·一模)为了解高一学生整理数学错题与提高数学成绩的相关性,某小组通过随机抽样,获得了每天整理错题和未每天整理错题的各20名学生3次数学考试成绩的平均分,绘制了如图1,2的频率分布直方图,并且已知高一学生3次数学考试成绩的总体均分为115分.
(1)依据频率分布直方图,完成以下列联表:
成绩不低于总体均分
成绩低于总体均分
合计
每天整理错题
未每天整理错题
合计
(2)依据小概率值的独立性检验,分析数学成绩不低于总体均分是否与每天整理数学错题有关.
附
0.10
0.01
0.001
2.706
6.635
10.828
【分析】(1)根据数表分析计算即可完善列联表;
(2)利用卡方计算公式,及独立性检验思想分析即可;
【详解】(1)根据频率分布直方图,可得
成绩不低于总体均分
成绩低于总体均分
合计
每天整理错题
14
6
20
未每天整理错题
5
15
20
合计
19
21
40
(2)假设:数学成绩不低于总体均分与每天整理数学错题无关.
计算可得
根据小概率值的独立性检验,可推断不成立,
即认为数学成绩不低于总体均分与每天整理错题有关.
【题型7 独立性检验与其他知识交汇】
【例7.1】(24-25高二下·江苏无锡·期中)甲、乙两家公司到某大学进行招聘,通过对毕业生进行笔试、面试、模拟演练这三项程序后直接签约一批毕业生.已知三项程序分别由三个部门独立依次考核,且互不影响,当三项程序全部通过即可签约.假设该大学100名毕业生参加甲公司招聘的具体情况如下表(不存在通过三项程序考核后放弃签约的现象).
性别
参加考核但未能签约的人数
参加考核并能签约的人数
合计
男生
20
女生
50
合计
30
100
该校的小张准备参加两家公司的招聘,小张通过甲公司的每项程序的概率均为,通过乙公司的每项程序的概率依次为,,,其中.
(1)完成列联表,根据小概率值的独立性检验,判断这100名毕业生参加甲公司的招聘能否签约与性别是否有关;
(2)若小张通过甲、乙两公司程序的项数分别记为,.当时,求小张参加乙公司招聘并能成功签约的概率.
附:,其中.
0.100
0.050
0.025
0.001
2.706
3.841
5.024
10.828
【分析】(1)完善列联表,计算出卡方,即可判断;
(2)依题意,即可求出,再由的可能取值为0,1,2,3,求出相应的概率,即可求出,通过即可求出的值,从而求出结果.
【详解】(1)依题意可得列联表如下
性别
参加考核但未能签约的人数
参加考核并能签约的人数
合计
男生
20
20
40
女生
50
10
60
合计
70
30
100
所以,
所以根据小概率值的独立性检验,这100名毕业生参加甲公司的招聘能否签约与性别有关;
(2)因为小张通过甲公司各程序的结果相互不影响,
所以,则,
依题意的可能取值为0,1,2,3.
所以,
,
,
,
所以随机变量Y的分布列:
0
1
2
3
所以,
因为,所以,即,
所以小张参加乙公司招聘并能成功签约的概率.
【例7.2】(24-25高二下·辽宁沈阳·阶段练习)2024年9月16日,沈阳市举行马拉松比赛,全球马拉松爱好者积极参与本场比赛,某服务部门为提升服务质量,随机采访了120名参赛人员,得到下表:
满意度
性别
合计
女性
男性
比较满意
50
非常满意
40
70
合计
60
120
(1)求的值;
(2)能否有的把握认为不同性别的参赛人员对该部门服务质量的评价有差异?
(3)用频率估计概率,现随机采访本场比赛的1名女性参赛人员与2名男性参赛人员,已知3人中恰有一人对该部门服务非常满意,求该人为女性的概率.
附:.
0.1
0.01
0.001
2.706
6.635
10.828
【分析】(1)根据列联表即可求解,,,得解;
(2)计算卡方,即可与临界值比较作答;
(3)根据相互独立乘法事件的概率公式及条件概率公式即可求解.
【详解】(1)解:完善列联表为:
满意度
性别
合计
女性
男性
比较满意
30
20
50
非常满意
30
40
70
合计
60
60
120
故,,,,故;
(2)假设:依据小概率值的独立性检验,认为不同性别的参赛人员对该部门服务质量的评价没有差异,根据题目所给公式:.
,
故依据小概率值的独立性检验,有的把握认为不同性别的参赛人员对该部门服务质量的评价有差异.
(3)女性对服务满意的概率为,女性对服务不满意的概率为,男性对服务满意的概率为,男性对服务不满意的概率为;
设事件为“采访1名女性参赛人员与2名男性参赛人员中,3人中恰有一人对该部门服务非常满意”,事件为“该人为女性”;
;
,
由条件概率.
【变式7.1】(24-25高二下·黑龙江哈尔滨·阶段练习)推进垃圾分类处理,是落实绿色发展理念的必然选择.为加强社区居民的垃圾分类意识,某社区在健身广场举办了“垃圾分类,从我做起”生活垃圾分类大型宣传活动,号召社区居民用实际行动为建设绿色家园贡献一份力量,为此需要征集一部分垃圾分类志愿者.
(1)为调查社区居民喜欢担任垃圾分类志愿者是否与性别有关,现随机选取了一部分社区居民进行调查,其中被调查的男性居民30人,女性居民20人,男性居民中不喜欢担任垃圾分类志愿者占男性居民的,女性居民中不喜欢担任垃圾分类志愿者占女性居民的.根据所给数据,得到成对样本数据的分类统计结果,完成下面列联表,并依据小概率值的独立性检验,能否认为居民喜欢担任垃圾分类志愿者与性别有关?
性别
合计
男性
女性
喜欢担任
不喜欢担任
合计
附:,
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
(2)若某垃圾站的日垃圾分拣量y(千克)与垃圾分类志愿者人数x(人)之间具有较强的线性相关性,求回归直线方程,并预测志愿者人数为10人时,该垃圾站的日垃圾分拣量.
数据统计如表:
志愿者人数x(人)
2
3
4
5
6
日垃圾分拣量y(千克)
24
29
41
46
60
参考数据,附:,
【分析】(1)根据题意,列出列联表,再根据公式计算,对照临界表中的数据,比较即可得到答案;
(2)由表中数据和参考数据,根据参考公式求得回归直线方程为,再将代入,即可求出结果.
【详解】(1)零假设:居民喜欢担任垃圾分类志愿者与性别无关根据题意,列出的2×2列联表如下:
性别
合计
男性
女性
喜欢担任
10
15
25
不喜欢担任
20
5
25
合计
30
20
50
则,
依据小概率值的独立性检验,不成立,
因此认为居民喜欢担任垃圾分类志愿者与性别有关,此推断犯错误的概率不超过0.005.
(2)由表中数据可知,,,
,又,
则,,
∴回归直线方程为.
当时,,
所以当志愿者为10人时,垃圾分拣量大约为93.4千克.
【变式7.2】(24-25高二下·辽宁丹东·期中)某社区为推进智慧社区建设,给居民提供了一款手机构建智能化社区管理服务模式.为了解居民对该的满意度,从管辖范围内的某小区居民中随机抽查了200人,其中男女各占一半,得到如下表格:单位:人
使用
不使用
总计
女性
60
男性
70
总计
(1)请补全题表,并判断是否有的把握认为居民是否使用该与性别有关;
(2)从以上使用该的居民中按性别进行分层抽样抽取6人,再从这6人中随机抽取3人了解居民对该的满意度,记抽取的3人中男性用户的人数为,求的分布列与数学期望.
附:(其中).
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【分析】(1)填写列联表,进行独立性检验即可;
(2)求出概率再列出分布列,最后计算数学期望即可.
【详解】(1)表格如下:单位:人
使用APP
不使用APP
总计
女性
60
40
100
男性
30
70
100
总计
90
110
200
因为,
所以有的把握认为居民是否使用该APP与性别有关.
(2)从使用该APP的居民中按性别进行分层抽样抽取的6人中,女性有4人,男性有2人,
所以可能取.
因为,
所以的分布列为
0
1
2
所以.
一、单选题
1.(24-25高二下·河南南阳·期中)下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
【分析】根据独立性检验的基本思想,即可判断选项.
【详解】独立性检验是通过统计学方法来检验两个分类变量之间是否存在关联性,
ACD满足独立性检验的基本思想,B选项只是公司的营业额这一个变量在过去5年的变化情况,不满足独立性检验的基本思想.
故选:B.
2.(24-25高二下·全国·课后作业)假设有两个分类变量和,它们的可能取值分别为和,其列联表如下:
总计
总计
对于以下数据,对同一样本能说明与有关的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【分析】对于同一样本,越大,说明与之间的关系越强.
【详解】根据(其中),
值越大,说明“与有关系”的可能性越大,
对于同一样本,越大,说明与之间的关系越强
对于A,当,,,时,;
对于B,当,,,时,;
对于C,当,,,时,;
对于D,当,,,时,;
因为,所以B中的值最大,即B对应的值最大,说明与之间的关系越强.
故选:B.
3.(23-24高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【分析】分析等高堆积条形图可直接得到答案.
【详解】原图是学校高二1、2班本期中期考试数学成绩优秀率的等高堆积条形图,
从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,BC错误;
两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误;
故选:A.
4.(24-25高二下·山东德州·阶段练习)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
【分析】列出列联表,计算即可得解.
【详解】列出列联表:
男生
女生
篮球迷
90
20
110
非篮球迷
60
30
90
150
50
200
,
故在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关.
故选:D.
5.(23-24高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【分析】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.
【详解】对于A, ,
对于B,,
对于C,,
对于D,
显然B中最大,该组数据能说明x与y有关系的可能性最大,
故选:B.
6.(24-25高二下·辽宁本溪·阶段练习)某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下列联表:
去年体检人数
去年末体检人数
合计
高中教师
70
30
100
初中教师
100
合计
200
若根据列表得,则这200名教师中,去年末体检的人数为( )(附:,)
A.20 B.30 C.40 D.50
【分析】据独立性检验的原理与知识,列式计算即可得结论.
【详解】由于(*),
又,
则可得,代入(*)式可得:
,解得或(舍).
故选:D.
7.(24-25高二下·全国·课后作业)为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:
情况
性别
总计
男
女
正常
442
514
956
色盲
38
6
44
总计
480
520
1000
根据上述数据,试问色盲与性别关系是( )
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A.相互独立 B.不相互独立
C.有的把握认为色盲与性别无关 D.只有的把握认为色盲与性别有关
【分析】根据卡方公式计算数值,对比临界值即可求得结果.
【详解】零假设为:色盲与性别相互独立,即它们之间无关.
因为,
所以,
所以依据小概率值的独立性检验,可以推断出不成立,
即色盲与性别之间不相互独立,有的把握认为色盲与性别有关.
故选:B.
8.(24-25高二下·全国·课后作业)为了更好地开展多媒体化教学,杭州市某小学对“文理学科教师与喜欢用平板教学”是否有关做了一次研究调查,其中被调查的文科、理科教师人数相同,理科教师喜欢用平板教学的人数占理科教师总人数的80%,文科教师喜欢用平板教学的人数占文科教师总人数的40%,若有95%的把握认为是否喜欢用平板教学和文理学科有关,则调查人数中理科教师人数最少可能是( )
附:,其中.
0.05
0.010
3.841
6.635
A.8 B.12 C.15 D.20
【分析】利用独立性检验列联表及观测值可解得答案.
【详解】由题意被调查的文理科教师人数相同,设理科教师的人数为,由题意可列出列联表:
理科教师
文科教师
合计
喜欢用平板教学
不喜欢用平板教学
合计
.
由于有的把握认为是否喜欢用平板教学和文理学科有关,
所以,
解得,因为,
故的可能取值为:12,13,14,15,16,17,18,19,
即理科教师的人数可以是:12,13,14,15,16,17,18,19,且考虑到喜欢用平板的人数占理科教师总人数的,故人数为15人时,有实际意义.
故选:C.
二、多选题
9.(23-24高二下·黑龙江哈尔滨·期末)某校为了解学生对2024欧洲杯的关注度(关注或不关注),对本校学生随机做了一次调查,结果显示被调查的男、女生人数相同,其中有的男生“关注”,有的女生“关注”,若依据小率值的独立性检验,认为学生对欧洲杯的关注度与性别有关联,则调查的总人数可能为( )
参考公式:,.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A.276 B.288 C.300 D.312
【分析】首先根据男、女生人数相等,结合比例,列出列联表,再计算,列不等式即可求解.
【详解】设男、女生人数均为,可得如下列联表:
对欧洲杯关注
对欧洲杯不关注
合计
男生
女生
合计
由题意可得,所以,所以,
则,因为为6的倍数,则为12的倍数,则CD满足题意.
故选:CD.
10.(23-24高二下·吉林白山·期末)暑假结束后,为了解假期中学生锻炼身体情况,学生处对所有在校学生做问卷调查,并随机抽取了180人的调查问卷,其中男生比女生少20人,并将调查结果绘制得到等高堆积条形图.已知,其中,,在被调查者中,下列说法正确的是( )
A.男生中不经常锻炼的人数比女生中经常锻炼的人数多
B.男生中经常锻炼的人数比女生中经常锻炼的人多8人
C.经常锻炼者中男生的频率是不经常锻炼者中男生的频率的1.6倍左右
D.在犯错误的概率不大于0.01的条件下,可以认为假期是否经常锻炼与性别有关
【分析】根据男生比女生少20人,建立等式求出男生、女生的人数,建立列联表,利用列联表中的信息解决ABC,利用独立性检验来解决D选项.
【详解】解:设男生人数为,则女生人数为,
由题得,
解得,即在被调查者中,男、女生人数为80,100,可得到如下列联表,
性别
锻炼情况
合计
经常锻炼
不经常锻炼
男
48
32
80
女
40
60
100
合计
88
92
180
由表可知,A显然错误,
男生中经常锻炼的人数比女生中经常锻炼的人数多B正确;
在经常锻炼者中是男生的频率为,在不经常锻炼者中是男生的频率为C正确;
零假设:假期是否经常锻炼与性别无关,
则,根据小概率值的独立性检验,我们推断不成立,
即认为假期是否经常锻炼与性别有关,此推断犯错误概率不大于0.01,D正确,
故选:BCD.
11.(23-24高二下·河南漯河·期中)为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40 名学生进行调查,按照性别和体育锻炼情况整理出如下的22列联表:
性别
锻炼情况
合计
不经常
经常
女生/人
14
7
21
男生/人
8
11
19
合计/人
22
18
40
临界值表如下:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
根据这些数据,给出下列四个结论中正确的是( )
A.依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响
B.依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响
C.根据小概率值α=0.05的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05
D.根据小概率值α=0.05的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响
【分析】分别求出男生和女生经常锻炼的频率即可依据频率稳定于概率的原理判断,求出卡方值,和3.841比较即可根据小概率值的独立性检验判断.
【详解】由表可知,女生有21人,其中经常锻炼的有7人,频率为,
男生有19人,其中经常锻炼的有11人,频率为,
因为,依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响,故A正确,B错误;
,所以根据小概率值的独立性检验,
没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响,故D正确,C错误.
故选:AD.
三、填空题
12.(23-24高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是 乙 .
【分析】根据选项中的图形,即可直接求解.
【详解】等高条形图中有两个高度相同的矩形,每个矩形都有两个颜色,观察下方颜色区域的高度,如果高度差越大,则两个分类变量关系越强,观察四个选项可知,B选项中带颜色区域的高度差最大,两个分类变量、相关关系最强;
故答案为:乙.
13.(24-25高二下·全国·课后作业)欲知作家性别对读者的性别影响,某出版社派工作人员到各书店随机调查了500位买书的顾客,结果如下表所示.
读者
作家
总计
男作家
女作家
男读者
142
122
264
女读者
103
133
236
总计
245
255
500
则在差错不超过0.05的前提下作者的性别与读者的性别 有关 (填“有关”或“无关”).
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【分析】计算卡方值,判断跟临界值的关系,即可求得结果.
【详解】零假设:作者的性别与读者的性别无关,
,其中,
由公式得,
所以在犯错误的概率不超过0.05的前提下作者的性别与读者的性别有关.
故答案为:有关.
14.(24-25高二下·河南南阳·阶段练习)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有 (答案不唯一) 人.
附:
0.100
0.050
0.010
2.706
3.841
6.635
【分析】设被调查的男女生为人,写出列联表,应用卡方公式求卡方值,结合求参数范围,进而确定被调查的男生为,即可答案.
【详解】由题意,设被调查的男女生为人,则男生喜欢抖音有人,女生喜欢抖音有人,
所以列联表如下:
喜欢抖音
不喜欢抖音
总计
男生
女生
总计
所以,则,
所以被调查的男生为,
又,则人数是5的整数倍,
所以大于等于45的5的整数倍都符合题意,即可能有人.
故答案为:(答案不唯一).
四、解答题
15.(24-25高二下·全国·课后作业)某电视台对年龄高于40岁和不高于40岁的人是否对打乒乓球感兴趣进行调查,随机调查了高于40岁的60人,不高于40岁的40人,根据样本数据绘制等高堆积条形图如图所示,写出2×2列联表.
【分析】根据等高堆积条形图计算出各部分的人数,画出表格即可.
【详解】根据题意,高于40岁的60人中,感兴趣的人占了,为人.不感兴趣的也是30人. 不高于40岁的40人中,感兴趣的占了,为28人.不感兴趣的为12人.
则作出列联表如下:
感兴趣
不感兴趣
合计
高于40岁
30
30
60
不高于40岁
28
12
40
合计
58
42
100
16.(24-25高二下·江西赣州·开学考试)截至2025年2月13日晚,电影《哪吒之魔童闹海》(《哪吒2》)总票房(含预售)已突破100亿元,观影人次破2亿,成为中国影史首部票房破100亿且观影人次破2亿的电影,登顶全球影史单一市场票房榜,暂列全球票房榜第17名.按照猫眼专业版AI预测,其最终票房将达到153.38亿,若达成则有望超越电影《星球大战:原力觉醒》的150.19亿票房,排名全球前五.银河影院为了解观众是否喜欢电影与性别有关,调查了400名学生(男女各一半)的选择,发现喜欢该电影的人数是300,喜欢该电影的女生比男生少60人.
(1)完成下面的列联表;
喜欢电影
不喜欢电影
总计
女生
男生
总计
(2)根据调查数据回答:有的把握认为是否喜欢电影与性别有关吗?
附:.
临界值表如下:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【分析】小问1,可设喜欢电影的男生人数为,喜欢电影的女生人数为,根据题意求出和的值完成列表即可,小问2,先假设对电影的喜好与否与性别没有关系,然后选取,代入公式计算,通过比较与表中给出的临界值可得假设错误,即对电影的喜好与否与性别有关.
【详解】(1)设喜欢电影的男生人数为,喜欢电影的女生人数为,有,解得.
计算得到不喜欢该电影的男生人数为,不喜欢该电影的女生人数为.填表如下:
喜欢电影
不喜电影
总计
女生
120
80
200
男生
180
20
200
总计
300
100
400
(2)先假设是否喜欢哪吒电影与性别无关.
在表格中选取,根据公式计算:
说明是否喜欢哪吒电影与性别有关的可能性在以上.
17.(24-25高二下·江苏镇江·期中)某学校举行了一次数学有奖竞赛,对考试成绩优秀(成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)用每个区间的组中值作为相应学生的成绩,估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,且女生的获奖率为,问:能否有的把握认为获奖与性别有关?
附:.
【分析】(1)利用频率分布直方图中所有矩形面积之和为可求得的值,利用样本容量、频数与频率之间的关系可求出样本容量;
(2)将每个矩形底边的中点值乘以对应矩形的面积,再将所得结果全部相加,可得出所有参赛学生的平均成绩;
(3)列出列联表,计算出的观测值,结合临界值表可得出结论.
【详解】(1)在频率分布直方图中,所有矩形的面积之和为,
则,解得,
因为第一小组的频数为,则样本容量为.
(2)由频率分布直方图可知,所有参赛学生的平均成绩为
分.
(3)提出零假设获奖与性别无关,
由题意可知,抽取的样本中,男生人数为人,女生人数为,且女生的获奖人数为人,
成绩优秀的学生人数为人,则男生获奖人数为人,
可得出如下列联表:
获奖
不获奖
合计
男生
女生
合计
所以,,
所以,没有的把握认为获奖与性别有关.
18.(2025·河南开封·二模)某物业公司为提高对某小区的服务质量,随机调查了该小区50名男业主和50名女业主,每位业主对该物业公司的服务给出满意或不满意的评价,得到如下列联表:
满意
不满意
男业主
40
10
女业主
30
20
(1)依据的独立性检验,能否认为该小区男、女业主对该物业公司服务的评价有差异?
(2)从该小区的业主中任选一人,表示事件“选到的人对该物业公司的服务不满意”,表示事件“选到的人为女业主”,利用该调查数据,给出,的估计值.
附:.
0.05
0.01
0.005
3.841
6.635
7.879
【分析】(1)根据公式求出,再对照临界值点,即可得出结论;
(2)根据条件概率公式求解即可.
【详解】(1)因为,
所以依据的独立性检验,能认为有差异;
(2)由题意,
所以.
19.(24-25高二下·湖南长沙·期中)某车企为考察选购新能源汽车的款式与性别的关联性,调查200人购买情况,得到如下列表:
新能源汽车款
新能源汽车款
总计
男性
100
20
女性
50
30
80
总计
50
200
(1)求;
(2)根据小概率值的独立性检验,能否认为选购该新能源汽车的款式与性别有关联?
(3)假设用样本估计总体,用频率估计概率,所有人选购汽车的款式情况相互独立.若从购买者中随机抽取4人,设被抽取的4人中购买了款车的人数为,求的数学期望.
附:.
0.10
0.05
0.010
0.005
2.706
3.841
6.635
7.879
【分析】(1)根据列联表的数据直接求解即可;
(2)先零假设,然后计算,再进行独立性检验即可;
(3)先判断服从二项分布,再利用二项分布的期望公式求解即可.
【详解】(1),;
(2)零假设为:选购新能源汽车的款式与性别无关联,
根据列联表中的数据,可得,
根据小概率值的独立性检验,推断不成立,
可以认为选购车的款式与性别有关,此推断犯错误的概率不大于;
(3)随机抽取1人购买款车的概率为:,
的可能取值有0,1,2,3,4,依题意服从,,
因此,.
第 1 页 共 28 页
学科网(北京)股份有限公司
$$