内容正文:
第17讲 列联表与独立性检验
【人教A版】
模块一
分类变量与列联表
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.2×2列联表
假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
3.等高堆积条形图
常用等高堆积条形图展示列联表数据的频率特征(如图),由此反映出两个分类变量间是否相互影响.
(1)等高堆积条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显(即和相差很大),就判定两个分类变量之间有关系.
(2)利用等高堆积条形图虽可以比较各个部分之间的差异,明确展现两个分类变量的关系,但不能知道两个分类变量有关系的概率大小.
【题型1 完善列联表】
【例1】(24-25高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
【变式1.1】(24-25高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
【变式1.2】(2025高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
【变式1.3】(24-25高二下·江苏·课后作业)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【题型2 列联表的分析及应用】
【例2】(24-25高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【变式2.1】(2025·云南昆明·一模)考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【变式2.2】(25-26高二·全国·单元测试)假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【变式2.3】(24-25高二下·河南·月考)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【题型3 等高条形图】
【例3】(24-25高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【变式3.1】(24-25高二下·吉林·月考)为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
【变式3.2】(25-26高二·全国·课后作业)为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
父母吸烟
父母不吸烟
总计
子女吸烟
237
83
320
子女不吸烟
678
522
1 200
总计
915
605
1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
【变式3.3】(2026高二下·全国·专题练习)为考察某种药物预防疾病的效果,进行动物试验,得到2×2列联表如表所示.
患病
未患病
合计
服用药
10
45
55
没有服用药
20
30
50
合计
30
75
105
试用等高堆积条形图判断服用药与患病之间是否有关联.
模块二
独立性检验
1.独立性检验
(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
则.
(2)利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.
(3)独立性检验中几个常用的小概率值和相应的临界值,如下表所示.
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
2.独立性检验的应用问题的解题策略
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
【注】
1.独立性检验是基于成对样本观测数据进行估计或推断,得出的结论可能犯错误.
【题型4 独立性检验的概念及辨析】
【例4】(25-26高三上·湖北恩施·开学考试)根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
【变式4.1】(25-26高二上·全国·单元测试)给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
【变式4.2】(24-25高二下·河南信阳·期末)某医疗机构通过抽样调查(样本容量),利用列联表和统计量研究患肺癌是否与吸烟有关.计算得,经查对临界值表知,现给出四个结论,其中正确的是( )
A.根据小概率值的独立性检验,认为“患肺癌与吸烟无关”
B.在100个吸烟的人中约有99个人患肺癌
C.若老张吸烟,那么他有99%的可能性患肺癌
D.有99%的把握认为“患肺癌与吸烟有关”
【变式4.3】(24-25高二下·上海·期中)为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算,根据这一数据分析,下列说法正确的是( )
(附:)
A.有的人认为该电视栏目优秀
B.有的人认为该电视栏目是否优秀与改革有关系
C.在犯错误的概率不超过的前提下,认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
【题型5 卡方的计算】
【例5】(25-26高二上·全国·单元测试)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线上有自东向西依次编号为1,2,…,21的21个车站.为调查编号为10和11两个站点的乘客对调图的满意度是否有差异,在这两个站点多次乘坐列车的旅客中,随机抽取100名旅客,并得出如下列联表,则的值约为( )
车站编号
满意度
满意
不满意
总计
10
28
12
40
11
57
3
60
总计
85
15
100
A.6.923 B.7.851 C.10.635 D.11.765
【变式5.1】(24-25高二下·山东潍坊·期中)某学校计划开设某门特色课程,现对男女生参加该课程的意愿程度进行调查,得到以下列联表:
愿意参加
不愿意参加
合计
男生
20
女生
20
合计
50
100
则的值为( )
(附:,)
A.4 B. C.5 D.
【变式5.2】(24-25高三上·湖北襄阳·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
【变式5.3】(24-25高二下·山东潍坊·期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.没有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
【题型6 独立性检验的基本思想】
【例6】(24-25高二下·甘肃酒泉·期末)利用来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.利用独立性检验不仅可以考察两个分类变量是否有关系,而且( )
A.能较精确的给出这种判断的可靠程度
B.得出的结论完全正确,不会出错
C.的观测值很大时(比如大于20),则得出的零假设完全正确,不会出错
D.的观测值很小时(比如小于2),则得出的零假设肯定错误
【变式6.2】(24-25高二下·河南信阳·期末)调查某医院一段时间内婴儿出生的时间(白天与晚上)和性别(男与女)的关联性,对样本数据分析统计,计算得到,依据小概率值的独立性检验,下列说法正确的是( )(附:)
A.婴儿90%在白天出生
B.婴儿性别与出生时间无关联
C.有0.1的把握认为婴儿性别与出生时间有关联
D.婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1
【变式6.2】(24-25高二下·天津·期中)通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
【变式6.3】(24-25高二下·山西长治·期中)某课外兴趣小组为研究数学成绩优秀是否与性别有关,通过随机抽样调查,得到成对样本观测数据的分类统计结果,并计算得出,经查阅独立性检验的小概率值和相应的临界值,知,则下列判断正确的是( )
A.若某人数学成绩优秀,那么他为男生的概率是
B.每100个数学成绩优秀的人中就会有1名是女生
C.数学成绩优秀与性别有关,此推断犯错误的概率不大于
D.在犯错误的概率不超过的前提下认为数学成绩优秀与性别无关
【题型7 独立性检验解决实际问题】
【例7】(25-26高三上·吉林白城·开学考试)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若在犯错误的概率不超过5%的前提下认为是否追星和性别有关,则调查样本中男生至少有( )
参考数据及公式如下:,
0.050
0.010
0.001
3.841
6.635
10.828
A.12人 B.11人 C.10人 D.18人
【变式7.1】(24-25高二下·广东韶关·期末)为了检测某种药物对预防疾病的效果,进行了小动物试验,得到如下列联表:
药物
疾病
合计
未患病
患病
服用
18
7
25
未服用
12
8
20
合计
30
15
45
已知,.根据小概率值的独立性检验,则下列结论正确的是( )
A.药物对预防疾病有效果
B.药物对预防疾病有效果,这个结论犯错误的概率不超过0.05
C.药物对预防疾病无效果
D.药物对预防疾病无效果,这个结论犯错误的概率不超过0.05
【变式7.2】(25-26高三上·四川·月考)炎炎夏日,空调已经成为越来越多家庭的必备电器之一.为研究不同性别对空调“最佳舒适温度”是否要超过的认同差异,某家电公司随机对280名空调用户进行了调查,其中女性用户占调查总人数的一半,该调查数据中只有的女性用户认为空调“最佳舒适温度”低于,且女性用户中认为空调“最佳舒适温度”低于的人数恰与男性用户中认为空调“最佳舒适温度”不低于的人数相等.
性别
最佳舒适温度
合计
男
女
合计
280
(1)在答题卡中完成列联表;
(2)根据小概率值的独立性检验,分析空调“最佳舒适温度”是否超过与性别有关.
附:
【变式7.3】(24-25高二下·西藏林芝·期末)为了推动智慧课堂的普及和应用,市现对全市中小学智慧课堂的应用情况进行抽样调查,统计数据如下表:
经常应用
偶尔应用或者不应用
总计
农村学校
40
城市学校
80
总计
100
160
(1)补全上面的列联表;
(2)依据小概率的独立性检验,能否判断学校所在区域对智慧课堂的应用有影响?
附:,其中.
0.100
0.050
0.005
2.706
3.841
7.879
【题型8 独立性检验与其他知识交汇】
【例8】(25-26高三下·陕西渭南·开学考试)人工智能技术(简称技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,并迅速在各行各业中得到应用和推广,教育行业也不例外.某市教体局为调查本市中学教师使用技术辅助教学的情况,随机抽取了该市120名中学教师,统计了他们一周内使用技术帮助制作课件的情况,并将一周内使用技术帮助制作课件的节次不少于4次的认定为喜欢使用技术,否则认定为不喜欢使用技术,经统计得到如下列联表.
年龄
是否喜欢使用技术
合计
是
否
不超过45岁
46
14
60
超过45岁
32
28
60
合计
78
42
120
(1)依据小概率值的独立性检验,能否认为该市中学教师是否喜欢使用技术与年龄有关;
(2)将频率视为概率,现从所抽取的120名中学教师中随机抽取一人,在抽中喜欢使用技术的教师的条件下,求此人年龄超过45岁的概率.
附:,其中.
0.1
0.01
0.001
2.706
6.635
10.828
【变式8.1】(25-26高三上·贵州·开学考试)某组织对男、女青年是否喜爱古典音乐进行了一个调查,调查组随机调查了200名青年,整理得到如下列联表:
单位:人
性别
喜爱古典音乐情况
合计
喜爱
不喜爱
女
90
20
110
男
60
30
90
合计
150
50
200
(1)依据小概率值的独立性检验,判断能否认为是否喜爱古典音乐与青年的性别有关?
(2)现从样本喜爱古典音乐的青年中利用分层(按性别分层)随机抽样的方法抽取5名青年进行合影留念,并从这被抽取的5名青年中随机邀请3名青年参加某古典艺术歌曲音乐会,记被邀请参加某古典艺术歌曲音乐会的女青年人数为,求的分布列和数学期望.
附:
0.05
0.01
0.005
3.841
6.635
7.879
,其中.
【变式8.2】(25-26高三上·湖北·月考)某中学对学生钻研奥数课程的情况进行调查,将每周独立钻研奥数课程超过6小时的学生称为“奥数迷”,否则称为“非奥数迷”,从调查结果中随机抽取100人进行分析,得到数据如表所示:
奥数迷
非奥数迷
总计
男
24
36
60
女
12
28
40
总计
36
64
100
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
(1)对照列联表,根据小概率的独立性检验,是否为“奥数迷”与性别有关?
(2)现从抽取的“奥数迷”中,按性别采用分层抽样的方法抽取3人参加奥数闯关比赛,已知其中男、女学生独立闯关成功的概率分别为,在恰有两人闯关成功的条件下,求两人性别相同的概率.
参考数据与公式:,其中.
【变式8.3】(24-25高三下·山东德州·开学考试)一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车
倾向于购买新能源车
合计
女性居民
150
250
400
男性居民
350
250
600
合计
500
500
1000
(1)能否在犯错误不超过1%的前提下认为对新能源车与燃油车的购买倾向存在性别差异?
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率.
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
一、单选题
1.(24-25高二下·辽宁大连·期中)下列说法中,正确的个数是( )
(1)两个随机变量的线性相关程度越强,相关系数的绝对值越接近于1
(2)两个变量的列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成立的可能性就越大
(3)从独立性检验可知:有的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过的前提下认为吸烟与患肺癌有关
A.0个 B.1个 C.2个 D.3个
2.(24-25高三·全国·一轮复习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
3.(25-26高二上·全国·单元测试)为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,得到的结论是有99%的把握认为性别与喜欢乡村音乐有关系,则的值可以为( )
A.2.853 B.3.841 C.6.758 D.6.451
4.(24-25高二下·辽宁·期末)为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则( )
性别
羽毛球
喜欢
不喜欢
女生
男生
50
100
附:,其中.
A.4 B.2 C.1 D.
5.(24-25高三·北京·一轮复习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
6.(24-25高二下·甘肃白银·期末)假设有两个分类变量X,Y,它们的可能取值分别为和,其列联表为
合计
合计
以下各组数据中,对于同一样本能说明与有关系的可能性最大的一组为( )
A. B.
C. D.
7.(24-25高二下·四川绵阳·期末)通过随机询问某中学110名中学生是否爱好跳绳,得到列联表如表所示:
跳绳
性别
合计
男
女
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
附:,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
则以下结论正确的是( )
A.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
C.根据小概率值α=0.01的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过0.01的前提下,我们认为爱好跳绳与性别无关
8.(24-25高二下·福建厦门·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
二、多选题
9.(2026·贵州·一模)2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高堆积条形图.
根据图中的信息,下列结论中一定正确的是( ).
A.样本中男性比女性更关注地铁1号线全线开通
B.样本中多数女性是35岁及以上
C.样本中35岁以下的男性人数比35岁及以上的女性人数多
D.样本中35岁及以上的人对地铁1号线的开通关注度更高
10.(2025高三·全国·专题练习)某中学为更好地开展素质教育,现对选修外出研学课程是否和性别有关进行调查,其中被调查的男生和女生人数相同,且男生中选修外出研学课程的人数占男生总人数的,女生中选修外出研学课程的人数占女生总人数的.若依据的独立性检验认为选修外出研学课程与性别有关,依据的独立性检验认为选修外出研学课程与性别无关,则调查的男生可能有( )
附:
0.05
0.01
3.841
6.635
,其中.
A.150人 B.220人 C.300人 D.350人
11.(25-26高二上·全国·单元测试)在某款盲盒内可能装有某一套玩偶的三种样式,且每个盲盒只装一个玩偶.某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.经统计,有的人购买了该款盲盒,在这些购买者当中,女生占;而在未购买者当中,男生、女生各占.则下列说法中正确的是( )
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
A.若每个盲盒装有三种样式玩偶的概率相同.某同学已经有了A样式的玩偶,若他再购买两个这款盲盒,恰好能收集齐这三种样式的概率是
B.此次调查中未购买过该盲盒的女生人数为60
C.有的把握认为“购买该款盲盒与性别有关”
D.有的把握认为“购买该款盲盒与性别有关”
三、填空题
12.(24-25高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
13.(25-26高二·全国·寒假作业)为考察喜欢黑色的人是否患抑郁症,对200名大学生进行调查,得到如下2×2列联表:
患抑郁症
未患抑郁症
总计
喜欢黑色
70
30
100
不喜欢黑色
35
65
100
总计
105
95
200
则有__________的把握认为喜欢黑色与患抑郁症有关系.
附表
0.025
0.010
0.001
5.024
6.635
10.828
由
14.(24-25高二下·河南南阳·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有__________人.
附:
0.100
0.050
0.010
2.706
3.841
6.635
四、解答题
15.(24-25高二下·全国·课后作业)某电视台对年龄高于40岁和不高于40岁的人是否对打乒乓球感兴趣进行调查,随机调查了高于40岁的60人,不高于40岁的40人,根据样本数据绘制等高堆积条形图如图所示,写出2×2列联表.
16.(24-25高二下·全国·课前预习)某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病.根据这些数据能否断定:患呼吸道疾病与吸烟有关?
17.(25-26高二下·河南南阳·月考)国民体质是国家和社会发展的重要基础.为贯彻落实《“健康中国2030”规划纲要》《体育强国建设纲要》,2025年国家体育总局开展了第六次全国国民体质监测工作,旨在提高国民体质和健康水平,促进国家经济建设和社会发展.《国民体质测定标准(2023年修订)》将体质情况综合评级为优秀、良好、合格和不合格四个等级.某地区为了解国民体质情况是否与爱好运动有关,从该地区体质达到“合格”及以上的人群中随机抽取了人进行问卷调查,得到如下列联表:
体质情况组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
(1)求的值
(2)依据小概率值的独立性检验,分析体质情况是否与爱好运动有关
附:,其中.
18.(2026·陕西宝鸡·模拟预测)随着科技的进步,人工智能(AI)工具在职场中的应用日益广泛,像豆包、DeepSeek等常见的AI工具,已被证明能有效提升员工的工作效率和准确率.某公司为了解员工使用这类AI工具的熟练度,进行了一次内部统计,统计结果如下表:
能够熟练使用AI工具
不能够熟练使用AI工具
男员工
30
15
女员工
16
9
(1)根据的独立性检验,能否认为性别与使用AI工具的熟练度具有相关性?
(2)现按熟练度采用分层抽样的方法从该公司的男员工中随机抽取12人,再从这12人中随机抽取3人,记其中不能够熟练使用AI工具的人数为,求的分布列以及数学期望.
附:,其中.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
19.(24-25高二下·重庆渝中·月考)某医院用a,b两种疗法治疗某种疾病,采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:
未治愈
治愈
合计
疗法a
15
52
67
疗法b
6
63
69
合计
21
115
136
(1)根据小概率值的独立性检验,分析b种疗法的效果是否比a种疗法效果好;
(2)为提高临床医疗安全性,提高疾病的治愈率及好转率,同时降低医疗费用,降低患者医疗负担.该医院对于a,b两种疗法进行联合改进,研究了甲、乙两种联合治疗方案,现有6位症状相同的确诊患者,平均分成A,B两组,A组用甲方案,B组用乙方案.一个疗程后,A组中每人康复的概率都为,B组3人康复的概率分别为,,.若一个疗程后,每康复1人积2分,假设认定:积分期望值越高疗法越好,请问甲、乙哪种联合治疗方案更好?
参考公式及数据:
0.05
0.025
0.010
0.005
0.001
3.841
5.024
6.635
7.879
10.828
,,.
第 1 页 共 23 页
学科网(北京)股份有限公司
$
第17讲 列联表与独立性检验
【人教A版】
模块一
分类变量与列联表
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.2×2列联表
假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
3.等高堆积条形图
常用等高堆积条形图展示列联表数据的频率特征(如图),由此反映出两个分类变量间是否相互影响.
(1)等高堆积条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显(即和相差很大),就判定两个分类变量之间有关系.
(2)利用等高堆积条形图虽可以比较各个部分之间的差异,明确展现两个分类变量的关系,但不能知道两个分类变量有关系的概率大小.
【题型1 完善列联表】
【例1】(24-25高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
【答案】B
【解题思路】由列联表数据,列出等式即可求解;
【解答过程】由,得.
由,得.
由,得.
由,得.
故选:B.
【变式1.1】(24-25高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
【答案】D
【解题思路】根据题意先得出的值,进而再得的值,进而可知的值.
【解答过程】因为抽取的村民中,老年人有25名,年轻人有25名,所以,
所以,A、B对;
所以,则对;
则错.
故选:D.
【变式1.2】(2025高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
【答案】D
【解题思路】已知抽取的老年人、年轻人各有25名,计算各个变量的值,进而得到答案.
【解答过程】因为,,
,,,,
所以,,,,.
故选:D.
【变式1.3】(24-25高二下·江苏·课后作业)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【答案】D
【解题思路】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【解答过程】依题意,解得,由解得.
补全列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D.
【题型2 列联表的分析及应用】
【例2】(24-25高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】B
【解题思路】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.
【解答过程】对于A, ,
对于B,,
对于C,,
对于D,
显然B中最大,该组数据能说明x与y有关系的可能性最大,
故选:B.
【变式2.1】(2025·云南昆明·一模)考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【答案】C
【解题思路】根据表格提供的数据作出判断.
【解答过程】由列联表中的数据可知,
种子经过处理,得病的比例明显降低,
种子未经过处理,得病的比例要高些,
所以可得结论:种子是否经过处理跟是否生病有关.
故选:C.
【变式2.2】(25-26高二·全国·单元测试)假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】D
【解题思路】计算每个选项中的,比较大小后可得出结论.
【解答过程】对于两个分类变量与而言,的值越大,说明与有关系的可能性最大,
对于A选项,,
对于B选项,,
对于C选项,,
对于D选项,,
显然D中最大,
故选:D.
【变式2.3】(24-25高二下·河南·月考)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【解题思路】根据题意,得到如下两个列联表,再一一分析即可.
【解答过程】根据题意,得到如下两个列联表.
35岁以上
35岁及以下
总计
男性
女性
总计
35岁以上
35岁及以下
总计
男性
女性
总计
根据第1个列联表可知,样本中男性市民人数为,
女性市民人数为,又,即样本中男性比女性多,故A正确;
根据第2个列联表可知,样本中35岁以上女性市民人数为,
35岁及以下女性市民人数为,又,即样本中多数女性是35岁以上,故B正确;
由题意,,所以,故C不正确;
根据第2个列联表可知,样本中35岁以上市民人数为,
35岁及以下市民人数为,又,
即样本中35岁以上的市民比35岁及以下的多,故D正确.
故选:C.
【题型3 等高条形图】
【例3】(24-25高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【答案】A
【解题思路】分析等高堆积条形图可直接得到答案.
【解答过程】原图是学校高二1、2班本期中期考试数学成绩优秀率的等高堆积条形图,
从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,BC错误;
两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误;
故选:A.
【变式3.1】(24-25高二下·吉林·月考)为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
【答案】D
【解题思路】结合所给比例图,依次分析判断4个选项即可.
【解答过程】对于A,城镇户籍中选择生育二胎,农村户籍中选择生育二胎,相差较大,则是否倾向选择生育二胎与户籍有关,A错误;
对于B,男性和女性中均有选择生育二胎,则是否倾向选择生育二胎与性别无关,B错误;
对于C,由于男性和女性中均有选择生育二胎,但样本中男性40人,女性60人,则倾向选择生育二胎的人员中,男性人数与女性人数不同,C错误;
对于D,倾向选择不生育二胎的人员中,农村户籍有人,城镇户籍有人,农村户籍人数少于城镇户籍人数,D正确.
故选:D.
【变式3.2】(25-26高二·全国·课后作业)为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
父母吸烟
父母不吸烟
总计
子女吸烟
237
83
320
子女不吸烟
678
522
1 200
总计
915
605
1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
【答案】等高条形图见详解,有影响
【解题思路】由表格中的数据画出等高条形图,根据等高条形图的定义和性质判断即可
【解答过程】等高条形图如下:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.
【变式3.3】(2026高二下·全国·专题练习)为考察某种药物预防疾病的效果,进行动物试验,得到2×2列联表如表所示.
患病
未患病
合计
服用药
10
45
55
没有服用药
20
30
50
合计
30
75
105
试用等高堆积条形图判断服用药与患病之间是否有关联.
【答案】有关联.
【解题思路】作出相应的等高堆积条形图,从图形分析出判断服用药与患病之间是否有关联.
【解答过程】相应的等高堆积条形图如图所示.
从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为服用药与患病之间有关联.
模块二
独立性检验
1.独立性检验
(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
则.
(2)利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.
(3)独立性检验中几个常用的小概率值和相应的临界值,如下表所示.
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
2.独立性检验的应用问题的解题策略
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
【注】
1.独立性检验是基于成对样本观测数据进行估计或推断,得出的结论可能犯错误.
【题型4 独立性检验的概念及辨析】
【例4】(25-26高三上·湖北恩施·开学考试)根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
【答案】B
【解题思路】根据独立性检验的概念可得正确的选项.
【解答过程】因为,所以在显著性水平下,
没有充分证据拒绝原假设,因此我们认为变量与是独立的,
故选:B.
【变式4.1】(25-26高二上·全国·单元测试)给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
【答案】B
【解题思路】根据独立性检验是对两个分类变量是否有关进行检验,逐个分析判断即可.
【解答过程】独立性检验主要是对两个分类变量是否有关进行检验,
对于A,喜欢参加体育锻炼有喜欢和不喜欢,性别有男和女,是对两个分类变量是否进行检验,
对于B,一个未被识别的甲骨文文字一年内被识别出来,只涉及一个变量,不可以用独立性检验解决,
对于C,购买食品有看生产日期和不看生产日期,性别有男和女,是对两个分类变量是否进行检验,
对于D,看新闻时政有喜欢和不喜欢,年龄有大有小,是对两个分类变量是否进行检验.
故不可以用独立性检验解决的问题是B.
故选:B.
【变式4.2】(24-25高二下·河南信阳·期末)某医疗机构通过抽样调查(样本容量),利用列联表和统计量研究患肺癌是否与吸烟有关.计算得,经查对临界值表知,现给出四个结论,其中正确的是( )
A.根据小概率值的独立性检验,认为“患肺癌与吸烟无关”
B.在100个吸烟的人中约有99个人患肺癌
C.若老张吸烟,那么他有99%的可能性患肺癌
D.有99%的把握认为“患肺癌与吸烟有关”
【答案】D
【解题思路】根据独立性检验可得正确选项.
【解答过程】依已知数据,得有的把握认为“患肺癌与吸烟有关”,
则选项D正确,其余都是错误的.
故选:D.
【变式4.3】(24-25高二下·上海·期中)为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算,根据这一数据分析,下列说法正确的是( )
(附:)
A.有的人认为该电视栏目优秀
B.有的人认为该电视栏目是否优秀与改革有关系
C.在犯错误的概率不超过的前提下,认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
【答案】D
【解题思路】根据卡方表示的意义结合临界值表分析判断即可
【解答过程】只有时才能在犯错误的概率不超过的前提下认为该电视栏目是否优秀与改革有关系,
而即使也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的推论,与是否有的人等无关.故A,B不正确.
由于,故C错误,D正确.
故选:D.
【题型5 卡方的计算】
【例5】(25-26高二上·全国·单元测试)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线上有自东向西依次编号为1,2,…,21的21个车站.为调查编号为10和11两个站点的乘客对调图的满意度是否有差异,在这两个站点多次乘坐列车的旅客中,随机抽取100名旅客,并得出如下列联表,则的值约为( )
车站编号
满意度
满意
不满意
总计
10
28
12
40
11
57
3
60
总计
85
15
100
A.6.923 B.7.851 C.10.635 D.11.765
【答案】D
【解题思路】由卡方计算公式计算即可求解.
【解答过程】.
故选:D.
【变式5.1】(24-25高二下·山东潍坊·期中)某学校计划开设某门特色课程,现对男女生参加该课程的意愿程度进行调查,得到以下列联表:
愿意参加
不愿意参加
合计
男生
20
女生
20
合计
50
100
则的值为( )
(附:,)
A.4 B. C.5 D.
【答案】A
【解题思路】完成下列联表,根据 公式代入求值即可.
【解答过程】根据表中数据完成下列联表,如下:
愿意参加
不愿意参加
合计
男生
30
20
50
女生
20
30
50
合计
30
50
100
则.
故选:A.
【变式5.2】(24-25高三上·湖北襄阳·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
【答案】D
【解题思路】列出列联表,计算即可得解.
【解答过程】列出列联表:
男生
女生
篮球迷
90
20
110
非篮球迷
60
30
90
150
50
200
,
故在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关.
故选:D.
【变式5.3】(24-25高二下·山东潍坊·期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.没有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
【答案】A
【解题思路】根据所给数据完善列联表,计算出卡方,即可判断.
【解答过程】依题意可得列联表如下:
男生
女生
合计
篮球迷
30
15
45
非篮球迷
45
10
55
合计
75
25
100
所以,
所以在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关,
又,所以没有的把握认为是否是篮球迷与性别有关.
故选:A.
【题型6 独立性检验的基本思想】
【例6】(24-25高二下·甘肃酒泉·期末)利用来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.利用独立性检验不仅可以考察两个分类变量是否有关系,而且( )
A.能较精确的给出这种判断的可靠程度
B.得出的结论完全正确,不会出错
C.的观测值很大时(比如大于20),则得出的零假设完全正确,不会出错
D.的观测值很小时(比如小于2),则得出的零假设肯定错误
【答案】A
【解题思路】运用独立性检验的思想逐项判断即可得结论.
【解答过程】对于A ,独立性检验不仅可以判断两个分类变量是否有关联,
还能通过计算卡方统计量()和对应的概率值,
给出这种判断的可靠程度(即显著性水平),故A正确;
对于B,独立性检验是基于概率统计的推断方法,不能保证结论完全正确,
仍有犯拒真或取伪的可能。故B错误;
对于C,的观测值很大时,仅表示拒绝零假设(变量独立)的可信度很高,
但不能保证结论“完全正确”,统计检验总有误差,故C错误;
对于D:的观测值很小时,表明没有足够证据拒绝零假设(变量独立),
但不能说明结论“肯定错误”,可能存在样本不足或变量实际关系较弱的情况,故D错误.
故选:A.
【变式6.2】(24-25高二下·河南信阳·期末)调查某医院一段时间内婴儿出生的时间(白天与晚上)和性别(男与女)的关联性,对样本数据分析统计,计算得到,依据小概率值的独立性检验,下列说法正确的是( )(附:)
A.婴儿90%在白天出生
B.婴儿性别与出生时间无关联
C.有0.1的把握认为婴儿性别与出生时间有关联
D.婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1
【答案】D
【解题思路】求出并与比较即可求解.
【解答过程】因为,
依据小概率值的独立性检验,
所以婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1.
故选:D.
【变式6.2】(24-25高二下·天津·期中)通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
【答案】A
【解题思路】根据独立性检验的原理逐项判断可得答案.
【解答过程】零假设为:爱好跳绳与性别无关.
A.∵,
∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关.选项A正确.
B. ∵,
∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关,但无法判断这个结论犯错误的概率是否超过.选项B错误.
C.∵,
∴根据小概率值的独立性检验,我们认为爱好跳绳与性别有关.选项C错误.
D. ∵,
∴在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别有关.选项D错误.
故选:A.
【变式6.3】(24-25高二下·山西长治·期中)某课外兴趣小组为研究数学成绩优秀是否与性别有关,通过随机抽样调查,得到成对样本观测数据的分类统计结果,并计算得出,经查阅独立性检验的小概率值和相应的临界值,知,则下列判断正确的是( )
A.若某人数学成绩优秀,那么他为男生的概率是
B.每100个数学成绩优秀的人中就会有1名是女生
C.数学成绩优秀与性别有关,此推断犯错误的概率不大于
D.在犯错误的概率不超过的前提下认为数学成绩优秀与性别无关
【答案】C
【解题思路】根据独立性检验的定义判断即可.
【解答过程】因为,
所以数学成绩优秀与性别有关,此推断犯错误的概率不大于,
即在犯错误率不超过的前提下认为“数学成绩优秀与性别有关”,故C正确,D错误;
若某人数学成绩优秀,由已知数据不能判断他为男生的概率,故A错误;
每个数学成绩优秀的人中可能没有女生,也有可能有多名女生,由已知数据不能确定结论,故B错误;
故选:C.
【题型7 独立性检验解决实际问题】
【例7】(25-26高三上·吉林白城·开学考试)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若在犯错误的概率不超过5%的前提下认为是否追星和性别有关,则调查样本中男生至少有( )
参考数据及公式如下:,
0.050
0.010
0.001
3.841
6.635
10.828
A.12人 B.11人 C.10人 D.18人
【答案】A
【解题思路】设男生人数为,根据独立性检验的原理,列出不等式,求出x的范围,结合题意确定其值,即可求得答案.
【解答过程】设男生人数为,则女生人数为,依题意可得列联表如下:
性别
追星
合计
喜欢追星
不喜欢追星
男生
女生
合计
若在犯错误的概率不超过5%的前提下认为是否喜欢追星和性别有关,则,
由,解得,
因为,为整数,所以若在犯错误的概率不超过5%的前提下认为是否喜欢追星和性别有关,
则x至少为12,即男生至少有12人.
故选:A.
【变式7.1】(24-25高二下·广东韶关·期末)为了检测某种药物对预防疾病的效果,进行了小动物试验,得到如下列联表:
药物
疾病
合计
未患病
患病
服用
18
7
25
未服用
12
8
20
合计
30
15
45
已知,.根据小概率值的独立性检验,则下列结论正确的是( )
A.药物对预防疾病有效果
B.药物对预防疾病有效果,这个结论犯错误的概率不超过0.05
C.药物对预防疾病无效果
D.药物对预防疾病无效果,这个结论犯错误的概率不超过0.05
【答案】C
【解题思路】通过计算列联表的统计量,与给定的临界值比较,来判断药物对预防疾病是否有效果.
【解答过程】零假设:药物对预防疾病无效果,
根据列联表数据,,
根据,将数据代入可得:
,
,根据小概率值的独立性检验,,
所以我们没有充分证据拒绝原假设,即认为药物对预防疾病无效果.
故选:C.
【变式7.2】(25-26高三上·四川·月考)炎炎夏日,空调已经成为越来越多家庭的必备电器之一.为研究不同性别对空调“最佳舒适温度”是否要超过的认同差异,某家电公司随机对280名空调用户进行了调查,其中女性用户占调查总人数的一半,该调查数据中只有的女性用户认为空调“最佳舒适温度”低于,且女性用户中认为空调“最佳舒适温度”低于的人数恰与男性用户中认为空调“最佳舒适温度”不低于的人数相等.
性别
最佳舒适温度
合计
男
女
合计
280
(1)在答题卡中完成列联表;
(2)根据小概率值的独立性检验,分析空调“最佳舒适温度”是否超过与性别有关.
附:
【答案】(1)列联表见解析
(2)空调“最佳舒适温度”是否超过与性别有关
【解题思路】(1)依题意,算出被调查的用户中女性用户人数,再分别算出其它数据;
(2)根据列联表中数据,计算,对照临界值表得出结论.
【解答过程】(1)依题意可知,被调查的用户中女性用户共有人,认为空调“最佳舒适温度”低于的女性用户有人,
所以男性用户中认为空调“最佳舒适温度”不低于的人数为60.
列联表如下:
性别
最佳舒适温度
合计
男
60
80
140
女
80
60
140
合计
140
140
280
(2)零假设为:分类变量与相互独立,即空调“最佳舒适温度”是否超过与性别无关.
根据表中的数据,计算得到.
因为,
所以根据小概率值的独立性检验,有充分证据推断不成立,
因此可以认为空调“最佳舒适温度”是否超过与性别有关.
【变式7.3】(24-25高二下·西藏林芝·期末)为了推动智慧课堂的普及和应用,市现对全市中小学智慧课堂的应用情况进行抽样调查,统计数据如下表:
经常应用
偶尔应用或者不应用
总计
农村学校
40
城市学校
80
总计
100
160
(1)补全上面的列联表;
(2)依据小概率的独立性检验,能否判断学校所在区域对智慧课堂的应用有影响?
附:,其中.
0.100
0.050
0.005
2.706
3.841
7.879
【答案】(1)答案见解析
(2)学校所在区域对智慧课堂的应用有影响.
【解题思路】(1)根据表格数据直接计算即可;
(2)利用卡方公式计算出卡方值,再对比表格数据即可.
【解答过程】(1)补全的列联表如下:
经常应用
偶尔应用或者不应用
总计
农村学校
40
40
80
城市学校
60
20
80
总计
100
60
160
(2)零假设:学校所在区域对智慧课堂的应用无影响.
根据列联表中的数据,经计算得到
根据小概率的独立性检验,我们推断不成立,因此能判断学校所在区域对智慧课堂的应用有影响.
【题型8 独立性检验与其他知识交汇】
【例8】(25-26高三下·陕西渭南·开学考试)人工智能技术(简称技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,并迅速在各行各业中得到应用和推广,教育行业也不例外.某市教体局为调查本市中学教师使用技术辅助教学的情况,随机抽取了该市120名中学教师,统计了他们一周内使用技术帮助制作课件的情况,并将一周内使用技术帮助制作课件的节次不少于4次的认定为喜欢使用技术,否则认定为不喜欢使用技术,经统计得到如下列联表.
年龄
是否喜欢使用技术
合计
是
否
不超过45岁
46
14
60
超过45岁
32
28
60
合计
78
42
120
(1)依据小概率值的独立性检验,能否认为该市中学教师是否喜欢使用技术与年龄有关;
(2)将频率视为概率,现从所抽取的120名中学教师中随机抽取一人,在抽中喜欢使用技术的教师的条件下,求此人年龄超过45岁的概率.
附:,其中.
0.1
0.01
0.001
2.706
6.635
10.828
【答案】(1)有关
(2)
【解题思路】(1)根据列联表中数据,计算,对照临界值表得出结论;
(2)根据题意,利用条件概率的计算公式求解.
【解答过程】(1)零假设该市中学教师是否喜欢使用技术与年龄无关,
而,
依据小概率值的独立性检验,推断不成立,
即认为该市中学教师是否喜欢使用技术与年龄有关.
(2)设事件为从所抽取的120名中学教师中随机抽取一人,抽中喜欢使用技术的教师,
事件为从所抽取的120名中学教师中随机抽取一人,此人年龄超过45岁,
由题意,,
则.
【变式8.1】(25-26高三上·贵州·开学考试)某组织对男、女青年是否喜爱古典音乐进行了一个调查,调查组随机调查了200名青年,整理得到如下列联表:
单位:人
性别
喜爱古典音乐情况
合计
喜爱
不喜爱
女
90
20
110
男
60
30
90
合计
150
50
200
(1)依据小概率值的独立性检验,判断能否认为是否喜爱古典音乐与青年的性别有关?
(2)现从样本喜爱古典音乐的青年中利用分层(按性别分层)随机抽样的方法抽取5名青年进行合影留念,并从这被抽取的5名青年中随机邀请3名青年参加某古典艺术歌曲音乐会,记被邀请参加某古典艺术歌曲音乐会的女青年人数为,求的分布列和数学期望.
附:
0.05
0.01
0.005
3.841
6.635
7.879
,其中.
【答案】(1)不能认为是否喜爱古典音乐与青年的性别有关
(2)分布列见解析;数学期望为.
【解题思路】(1)利用数表中数据求出,再与临界值比对得解.
(2)求出的可能值及对应的概率,列出分布列并求出期望.
【解答过程】(1)零假设:喜爱古典音乐与青年的性别无关,
由数表中数据经计算得,
依据小概率值的独立性检验,没有充分证据拒绝零假设,
即不能认为是否喜爱古典音乐与青年的性别有关.
(2)抽取的5人中,喜爱古典音乐的男青年有人,喜爱古典音乐的女青年有人,
故的所有可能值为,
,
所以的分布列为:
1
2
3
数学期望.
【变式8.2】(25-26高三上·湖北·月考)某中学对学生钻研奥数课程的情况进行调查,将每周独立钻研奥数课程超过6小时的学生称为“奥数迷”,否则称为“非奥数迷”,从调查结果中随机抽取100人进行分析,得到数据如表所示:
奥数迷
非奥数迷
总计
男
24
36
60
女
12
28
40
总计
36
64
100
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
(1)对照列联表,根据小概率的独立性检验,是否为“奥数迷”与性别有关?
(2)现从抽取的“奥数迷”中,按性别采用分层抽样的方法抽取3人参加奥数闯关比赛,已知其中男、女学生独立闯关成功的概率分别为,在恰有两人闯关成功的条件下,求两人性别相同的概率.
参考数据与公式:,其中.
【答案】(1)没有90%的把握认为是否为“奥数迷”与性别有关.
(2)
【解题思路】(1)作零假设,根据表中数据计算得并与作比较,然后得到结论;
(2)由分层抽样得到抽取的男生和女生的人数,记“恰有两人闯关成功”为事件,“没有女生闯关成功”为事件,分别求出则,,由条件概率公式求得. .
【解答过程】(1)零假设:“奥数迷”与性别无关
根据表中数据计算得
根据小概率的独立性检验,没有充分的证据推断不成立,因此可以认为“奥数迷”与性别无关.
没有90%的把握认为是否为“奥数迷”与性别有关.
(2)根据分层抽样,抽取的男生人数为2人,女生人数为1人,
记“恰有两人闯关成功”为事件,“没有女生闯关成功”为事件,
则,
.
由条件概率的公式得,
故在恰有两人闯关成功的条件下,两人性别相同的概率为.
【变式8.3】(24-25高三下·山东德州·开学考试)一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车
倾向于购买新能源车
合计
女性居民
150
250
400
男性居民
350
250
600
合计
500
500
1000
(1)能否在犯错误不超过1%的前提下认为对新能源车与燃油车的购买倾向存在性别差异?
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率.
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
【答案】(1)能
(2)
(3)分布列见解析,
【解题思路】(1)由独立性检验知识可完成判断;
(2)由题可得抽取的10人中男性7人,女性3人,然后由排列组合与条件概率知识可得答案;
(3)由题可得12人中,倾向于购买新能源车的居民人数为5人,据此可得可取0,1,2,3,然后可得分布列及期望.
【解答过程】(1)因为,
所以在犯错误不超过1%的前提下认为对新能源车与燃油车的购买倾向存在性别差异.
(2)由表格可得倾向于购买燃油车的居民中男、女性别比为7:3,
所以抽取男性7人,女性3人,再从中抽取4人进行座谈,有女性居民记为事件,则,恰有2名男性居民记为事件,则,
所以在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率为.
(3)在所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽
12人,抽样比为50:1,可得抽取结果如下表:
倾向于购买燃油车
倾向于购买新能源车
男性居民
7
5
再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,
可取0,1,2,3,可求出,,
,,
的分布列如下:
0
1
2
3
数学期望.
一、单选题
1.(24-25高二下·辽宁大连·期中)下列说法中,正确的个数是( )
(1)两个随机变量的线性相关程度越强,相关系数的绝对值越接近于1
(2)两个变量的列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成立的可能性就越大
(3)从独立性检验可知:有的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过的前提下认为吸烟与患肺癌有关
A.0个 B.1个 C.2个 D.3个
【答案】D
【解题思路】根据相关系数的概念,可知(1)正确;观测值越大,两个变量有关系的可能性越大,所以(2)正确;根据独立性检验的解释,可得(3)正确.
【解答过程】对于(1),根据相关系数的概念,可知两个随机变量的线性相关程度越强,
相关系数的绝对值越接近于1,故(1)正确;
对于(2),两个变量的列联表中,对角线上数据的乘积相差越大,
则观测值越大,两个变量有关系的可能性越大,所以(2)正确;
对于(3),从独立性检验可知:有的把握认为吸烟与患肺癌有关,
是指在犯错误的概率不超过的前提下认为吸烟与患肺癌有关,是独立性检验的解释,所以(3)正确.
故选:D.
2.(24-25高三·全国·一轮复习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【答案】C
【解题思路】根据联表计算求参即可.
【解答过程】因为.所以.又,所以.
故选:C.
3.(25-26高二上·全国·单元测试)为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,得到的结论是有99%的把握认为性别与喜欢乡村音乐有关系,则的值可以为( )
A.2.853 B.3.841 C.6.758 D.6.451
【答案】C
【解题思路】由题意,对比选项即可得解.
【解答过程】有的把握认为性别与喜欢乡村音乐有关系,则.
故选:C.
4.(24-25高二下·辽宁·期末)为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则( )
性别
羽毛球
喜欢
不喜欢
女生
男生
50
100
附:,其中.
A.4 B.2 C.1 D.
【答案】D
【解题思路】结合,只需,即可求得答案.
【解答过程】要使是否喜欢羽毛球运动与性别无关的可能性最大,则,所以,
所以.
故选:D.
5.(24-25高三·北京·一轮复习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
【答案】C
【解题思路】通过对等高堆积条形图的分析,结合所列列联表及不等式性质,逐一对每个选项进行推理判断即可.
【解答过程】设等高条形图对应列联表如下:
岁及以上
岁以下
总计
男性
女性
总计
根据第个等高条形图可知,岁及以上男性比岁及以上女性多,即;
岁以下男性比岁以下女性多,即.
根据第个等高条形图可知,男性中岁及以上的比岁以下的多,即;
女性中岁及以上的比岁以下的多,即,
对于A,男性人数为,女性人数为,
因为,所以,所以A正确;
对于B,岁及以上女性人数为,岁以下女性人数为,
因为,所以B正确;
对于C,岁以下男性人数为,岁及以上女性人数为,
无法从图中直接判断与的大小关系,所以C不一定正确;
对于D,岁及以上的人数为,岁以下的人数为,
因为,所以,所以D正确.
故选:C.
6.(24-25高二下·甘肃白银·期末)假设有两个分类变量X,Y,它们的可能取值分别为和,其列联表为
合计
合计
以下各组数据中,对于同一样本能说明与有关系的可能性最大的一组为( )
A. B.
C. D.
【答案】C
【解题思路】计算各选项中的值,比较大小,即可得答案.
【解答过程】计算各选项中的值,值越大,说明相应的两个分类变量有关系的可能性越大;
对于A,,
对于B,,
对于C,,
对于D,,
由于,
故选:C.
7.(24-25高二下·四川绵阳·期末)通过随机询问某中学110名中学生是否爱好跳绳,得到列联表如表所示:
跳绳
性别
合计
男
女
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
附:,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
则以下结论正确的是( )
A.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
C.根据小概率值α=0.01的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过0.01的前提下,我们认为爱好跳绳与性别无关
【答案】A
【解题思路】先做出零假设,再计算出,让去和,比较,然后根据独立性检验的理论判断即可.
【解答过程】零假设:我们认为爱好跳绳与性别无关,
因为,,
所以我们的假设成立,即根据小概率值α=0.001的独立性检验,
我们认为爱好跳绳与性别无关,故A正确;
在犯错误的概率不超过0.001前提下,我们认为爱好跳绳与性别无关,故B错误;
又因为,所以我们的假设不成立,
即根据小概率值α=0.01的独立性检验,我们认为爱好跳绳与性别有关,故C错误;
在犯错误的概率不超过0.01的前提下,我们认为爱好跳绳与性别有关,故D错误.
故选:A.
8.(24-25高二下·福建厦门·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
【答案】A
【解题思路】设总人数为,根据给定条件,求出的观测值并建立不等式,进而求出的最小整数值得解.
【解答过程】设总人数为,则男生选学生物学的人数为,女生选学生物学的人数为,
则列联表为:
男生
女生
合计
选生物学
不选生物学
合计
m
m
2m
因此,
即,又为的倍数,所以男生最少有人.
故选:A.
二、多选题
9.(2026·贵州·一模)2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高堆积条形图.
根据图中的信息,下列结论中一定正确的是( ).
A.样本中男性比女性更关注地铁1号线全线开通
B.样本中多数女性是35岁及以上
C.样本中35岁以下的男性人数比35岁及以上的女性人数多
D.样本中35岁及以上的人对地铁1号线的开通关注度更高
【答案】ABD
【解题思路】通过等高堆积条形图构建列联表,根据条形图所呈现的信息得出列联表中各部分数量的大小关系,再依据这些关系对各个选项进行分析.
【解答过程】设等高堆积条形图对应的列联表如下:
项目
35岁及以上
35岁以下
合计
男性
a
c
女性
b
d
合计
根据第1个等高堆积条形图可知,35岁及以上的男性比女性多,即;
35岁以下的男性也比女性多,即,
根据第2个等高堆积条形图可知,男性中35岁及以上的比35岁以下的多,即;
女性中35岁及以上的也比35岁以下的多,即,
对于选项A,男性人数为,女性人数为,,,故A正确,
对于选项B,35岁及以上女性人数为,35岁以下女性人数为d,,故B正确,
对于选项C,35岁以下男性人数为c,35岁及以上女性人数为b,由,无法直接判断b与c的大小关系,故C不一定正确,
对于选项D,35岁及以上的人数为,35岁以下的人数为,, ,故D正确,
故选:ABD.
10.(2025高三·全国·专题练习)某中学为更好地开展素质教育,现对选修外出研学课程是否和性别有关进行调查,其中被调查的男生和女生人数相同,且男生中选修外出研学课程的人数占男生总人数的,女生中选修外出研学课程的人数占女生总人数的.若依据的独立性检验认为选修外出研学课程与性别有关,依据的独立性检验认为选修外出研学课程与性别无关,则调查的男生可能有( )
附:
0.05
0.01
3.841
6.635
,其中.
A.150人 B.220人 C.300人 D.350人
【答案】BC
【解题思路】为方便计算,可设男生和女生人数均为,列出列联表,求出,根据题意可知,据此可求出范围,从而得到答案.
【解答过程】设男生和女生人数均为,根据题意可得列联表如下:
男生
女生
合计
选修外出研学课程
不选修外出研学课程
合计
零假设为:选修外出研学课程与性别无关,
则,
∵依据的独立性检验认为选修外出研学课程与性别有关,依据的独立性检验认为选修外出研学课程与性别无关,
∴,解得,
则.
故选:BC.
11.(25-26高二上·全国·单元测试)在某款盲盒内可能装有某一套玩偶的三种样式,且每个盲盒只装一个玩偶.某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.经统计,有的人购买了该款盲盒,在这些购买者当中,女生占;而在未购买者当中,男生、女生各占.则下列说法中正确的是( )
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
A.若每个盲盒装有三种样式玩偶的概率相同.某同学已经有了A样式的玩偶,若他再购买两个这款盲盒,恰好能收集齐这三种样式的概率是
B.此次调查中未购买过该盲盒的女生人数为60
C.有的把握认为“购买该款盲盒与性别有关”
D.有的把握认为“购买该款盲盒与性别有关”
【答案】AC
【解题思路】对于A,由列举法结合题意可判断选项正误;对于B,由题意可得未购买过该盲盒的女生人数;对于CD,由独立性检验知识可判断选项正误.
【解答过程】对于A,方法1, 该同学再购买两个这款盲盒,基本事件有:
,
能收集齐这三种样式的基本事件有,所以恰好能收集齐这三种样式的概率是.故A正确;
对于B,购买了该款盲盒的人有,所以有140人没有购买,
其中男生70人,女生70人,所以未购买过该盲盒的女生人数为70.故B错误;
对于CD,在这些购买者当中,女生占,所以购买了该款盲盒的人中男生20人,
女生40人,结合B选项可知,列联表如下:
购买情况
性别
男生
女生
总计
未购买过该款盲盒
70
70
140
购买过该款盲盒
20
40
60
总计
90
110
200
,因为,
所以有90%的把握认为“购买该款盲盒与性别有关”,
没有的把握认为“购买该款盲盒与性别有关”,故C正确,D错误.
故选:AC.
三、填空题
12.(24-25高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
【答案】74
【解题思路】根据联表性质计算求解.
【解答过程】由题意知,所以.
故答案为:.
13.(25-26高二·全国·寒假作业)为考察喜欢黑色的人是否患抑郁症,对200名大学生进行调查,得到如下2×2列联表:
患抑郁症
未患抑郁症
总计
喜欢黑色
70
30
100
不喜欢黑色
35
65
100
总计
105
95
200
则有__________的把握认为喜欢黑色与患抑郁症有关系.
附表
0.025
0.010
0.001
5.024
6.635
10.828
由
【答案】
【解题思路】利用独立性检验的卡方公式计算统计量,再与临界值比较,确定“喜欢黑色与患抑郁症有关系”的把握程度.
【解答过程】根据卡方检验公式,其中,,,,.
计算得, .
因为,所以有的把握认为喜欢黑色与患抑郁症有关系.
故答案为:.
14.(24-25高二下·河南南阳·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有__________人.
附:
0.100
0.050
0.010
2.706
3.841
6.635
【答案】(答案不唯一)
【解题思路】设被调查的男女生为人,写出列联表,应用卡方公式求卡方值,结合求参数范围,进而确定被调查的男生为,即可答案.
【解答过程】由题意,设被调查的男女生为人,则男生喜欢抖音有人,女生喜欢抖音有人,
所以列联表如下:
喜欢抖音
不喜欢抖音
总计
男生
女生
总计
所以,则,
所以被调查的男生为,
又,则人数是5的整数倍,
所以大于等于45的5的整数倍都符合题意,即可能有人.
故答案为:(答案不唯一).
四、解答题
15.(24-25高二下·全国·课后作业)某电视台对年龄高于40岁和不高于40岁的人是否对打乒乓球感兴趣进行调查,随机调查了高于40岁的60人,不高于40岁的40人,根据样本数据绘制等高堆积条形图如图所示,写出2×2列联表.
【答案】答案见解析
【解题思路】根据等高堆积条形图计算出各部分的人数,画出表格即可.
【解答过程】根据题意,高于40岁的60人中,感兴趣的人占了,为人.不感兴趣的也是30人. 不高于40岁的40人中,感兴趣的占了,为28人.不感兴趣的为12人.
则作出列联表如下:
感兴趣
不感兴趣
合计
高于40岁
30
30
60
不高于40岁
28
12
40
合计
58
42
100
16.(24-25高二下·全国·课前预习)某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病.根据这些数据能否断定:患呼吸道疾病与吸烟有关?
【答案】可以认为患呼吸道疾病与吸烟有关.
【解题思路】根据题意列出列联表,再算出在吸烟中和不吸烟中患病的频率,通过比较之间是否存在差异即可判断是否有关.
【解答过程】为了研究这个问题,我们将上述数据用表格表示如下:
患病
未患病
合计
吸烟
37
183
220
不吸烟
21
274
295
合计
58
457
515
由此表可以粗略地估计出在吸烟的人中,有的人患病;
在不吸烟的人中,有的人患病.
因此,从直观上可以得到结论:吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,
故可以认为患呼吸道疾病与吸烟有关.
17.(25-26高二下·河南南阳·月考)国民体质是国家和社会发展的重要基础.为贯彻落实《“健康中国2030”规划纲要》《体育强国建设纲要》,2025年国家体育总局开展了第六次全国国民体质监测工作,旨在提高国民体质和健康水平,促进国家经济建设和社会发展.《国民体质测定标准(2023年修订)》将体质情况综合评级为优秀、良好、合格和不合格四个等级.某地区为了解国民体质情况是否与爱好运动有关,从该地区体质达到“合格”及以上的人群中随机抽取了人进行问卷调查,得到如下列联表:
体质情况组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
(1)求的值
(2)依据小概率值的独立性检验,分析体质情况是否与爱好运动有关
附:,其中.
【答案】(1)
(2)认为体质情况与爱好运动有关
【解题思路】(1)根据表中数据计算即可;
(2)完善列联表,然后计算卡方,与临界值比较即可判断.
【解答过程】(1)由表中数据可得.
(2)完善列联表
体质情况组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
提出零假设为:体质情况与爱好运动无关,根据表中数据可得,
则,
根据小概率值的独立性检验,我们推断不成立,
即认为体质情况与爱好运动有关,该推断犯错误的概率不超过.
18.(2026·陕西宝鸡·模拟预测)随着科技的进步,人工智能(AI)工具在职场中的应用日益广泛,像豆包、DeepSeek等常见的AI工具,已被证明能有效提升员工的工作效率和准确率.某公司为了解员工使用这类AI工具的熟练度,进行了一次内部统计,统计结果如下表:
能够熟练使用AI工具
不能够熟练使用AI工具
男员工
30
15
女员工
16
9
(1)根据的独立性检验,能否认为性别与使用AI工具的熟练度具有相关性?
(2)现按熟练度采用分层抽样的方法从该公司的男员工中随机抽取12人,再从这12人中随机抽取3人,记其中不能够熟练使用AI工具的人数为,求的分布列以及数学期望.
附:,其中.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)性别与使用AI工具的熟练度无关;
(2)
0
1
2
3
数学期望为1.
【解题思路】(1)根据给定条件,求出的观测值,再与临界值比对即可得解.
(2)求出12名男员工中能够熟练与不能够熟练使用AI的人数,进而求出的可能值及各个值对应的概率,列出分布列并求出数学期望.
【解答过程】(1)设零假设:性别与使用AI工具的熟练度无关,
由统计表得,
则,
根据小概率值的独立性检验,没有充分证据推断不成立,
所以可以认为成立,即认为性别与使用AI工具的熟练度无关.
(2)男员工中能够熟练与不能够熟练使用AI的人数比为,
按分层抽样抽12人,抽取的能够熟练使用的人数为,抽取的不能够熟练使用的人数为4,
因此的可能取值为,
,
,
所以的分布列为:
0
1
2
3
数学期望.
19.(24-25高二下·重庆渝中·月考)某医院用a,b两种疗法治疗某种疾病,采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:
未治愈
治愈
合计
疗法a
15
52
67
疗法b
6
63
69
合计
21
115
136
(1)根据小概率值的独立性检验,分析b种疗法的效果是否比a种疗法效果好;
(2)为提高临床医疗安全性,提高疾病的治愈率及好转率,同时降低医疗费用,降低患者医疗负担.该医院对于a,b两种疗法进行联合改进,研究了甲、乙两种联合治疗方案,现有6位症状相同的确诊患者,平均分成A,B两组,A组用甲方案,B组用乙方案.一个疗程后,A组中每人康复的概率都为,B组3人康复的概率分别为,,.若一个疗程后,每康复1人积2分,假设认定:积分期望值越高疗法越好,请问甲、乙哪种联合治疗方案更好?
参考公式及数据:
0.05
0.025
0.010
0.005
0.001
3.841
5.024
6.635
7.879
10.828
,,.
【答案】(1)认为两种疗法效果没有差异
(2)乙种联合治疗方案更好.
【解题思路】(1)零假设为:a疗法与b疗法独立,即两种疗法效果没有差异,求出,对比临界值表即可;
(2)设用甲方案治疗组中康复的人数为,积分为,则,设用乙方案治疗B组中康复的人数为,积分为,分别求出与的均值,再根据均值的性质求与的均值,比较即可.
【解答过程】(1)零假设为:a疗法与b疗法独立,即两种疗法效果没有差异,
根据列联表中数据,经过计算得到,
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为两种疗法效果没有差异.
(2)设A组中用甲方案治疗康复的人数为,则,
所以,
设A组的积分为,则,
所以.
设B组中用乙方案治疗康复的人数为,
则的可能取值为:0,1,2,3,
,
,
,
,
故的分布列为:
0
1
2
3
P
所以,
设B组的积分为,则,所以.
因为5.5>4,所以乙种联合治疗方案更好.
第 1 页 共 23 页
学科网(北京)股份有限公司
$