内容正文:
4.3.2 独立性检验
题型一 完善列联表
1.(20-21高二下·西藏日喀则·期末)假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
2.(20-21高二下·山西朔州·期中)下表是一个列联表,则表中,的值分别为( )
总计
21
25
33
总计
100
A.46,54 B.54,46 C.52,54 D.50,52
3.(20-21高二·全国·单元测试)假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
4.(24-25高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得 .
5.(24-25高二下·广西钦州·期末)如下是一个列联表,则 .
yx
总计
总计
6.(21-22高二上·全国·课后作业)两个分类变量X,Y,它们的取值分别为和,其列联表为:
YX
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
若两个分类变量X,Y没有关系,则下列结论正确的是 (填序号).
①;②;③;④;⑤.
题型二 列联表分析
1.(2023·云南昆明·一模)考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
2.(24-25高二下·河南·阶段练习)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
3.(多选)(24-25高二下·江西上饶·阶段练习)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则( )
合计
合计
A.若,则可以认为与独立
B.若变量与独立,则
C.若很大,则变量与不独立
D.若变量与不独立,则很大
题型三 等高条形图及应用
1.(24-25高二下·宁夏银川·阶段练习)为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
2.(2024高三·北京·专题练习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
3.(24-25高三上·江西新余·阶段练习)如图为对某高中学生是否对父母说过“我爱你”这样的话的统计结果,则下列统计分析中不正确的是:( ).
A.男性被调查者没有对父母说过“我爱你”这样的话的人数比例高于女性
B.无论男女对母亲说“我爱你”这类话的比例都高于对父亲所说
C.大部分调查者没有对父母说过“我爱你”这样的话
D.经常对父母说“我爱你”这样的话的人数总计比例较女生比例有所下降,说明这张统计图的结果可能存在错误
4.(23-24高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
题型四 独立性检验的概念及辨析
1.(25-26高三上·江苏镇江·开学考试)某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用列联表计算得的观测值.
附表:
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )
A. B. C. D.
2.(25-26高三上·湖北恩施·开学考试)根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
3.(2025高二·全国·专题练习)在性别与吃零食这两个分类变量的计算中,下列说法正确的是( )
①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误.
A.①② B.①③ C.②③ D.③
4.(24-25高二下·广东广州·期末)根据分类变量X与Y的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量X与Y独立
B.变量X与Y独立,这个结论犯错误的概率不超过0.005
C.变量X与Y不独立
D.变量X与Y不独立,这个结论犯错误的概率不超过0.005
5.(25-26高二上·全国·单元测试)给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
6.(多选)(2025高二下·山东青岛·竞赛)在检验分类变量X与Y是否有关的过程中,计算得到实验数据的统计量,已知,,则( )
A.在犯错误的概率不超过10%的前提下,可以认为X与Y没有关系
B.在犯错误的概率不超过10%的前提下,可以认为X与Y有关系
C.依据的独立性检验,可以认为X与Y不独立
D.依据的独立性检验,可以认为X与Y独立
题型五 卡方计算及应用
1.(25-26高二上·全国·单元测试)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线上有自东向西依次编号为1,2,…,21的21个车站.为调查编号为10和11两个站点的乘客对调图的满意度是否有差异,在这两个站点多次乘坐列车的旅客中,随机抽取100名旅客,并得出如下列联表,则的值约为( )
车站编号
满意度
满意
不满意
总计
10
28
12
40
11
57
3
60
总计
85
15
100
A.6.923 B.7.851 C.10.635 D.11.765
2.(24-25高三上·上海·单元测试)某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表,则根据列联表可知:
年轻人
非年轻人
总计
经常用流行用语
125
25
150
不常用流行用语
35
15
50
总计
160
40
200
有 的把握认为经常用流行用语与年轻人有关系.
3.(24-25高二下·全国·课后作业)抛投一枚硬币100次,结果正面朝上45次,反面朝上55次,该枚硬币质地是否均匀?
4.(25-26高三上·青海西宁·期中)为了解某校学生每天进行体育运动的时间,从中抽取男、女生共100人进行问卷调查.将样本中的“男生”和“女生”按每天体育运动的时间(单位:分钟)各分为5组:,,经统计得下表:
男生
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
人数
4
5
27
21
3
女生
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
人数
3
13
16
6
2
若体育运动的时间不少于一小时,则被认定为“喜欢体育运动”,否则被认定为“不喜欢体育运动”.
(1)根据以上数据完成列联表;
喜欢体育运动
不喜欢体育运动
合计
男
女
合计
(2)依据小概率值的独立性检验,能否认为是否喜欢体育运动与性别有关联?
参考公式:,其中.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
题型一 独立性检验解决实际问题
1.(25-26高三上·湖南邵阳·期中)为研究高中生数学成绩优秀与平时认真完成作业的关系,从某校的学生中随机抽了500人,得到如下列联表:
是否认真完成作业组别
认真完成作业
不认真完成作业
合计
数学成绩优秀
180
20
200
数学成绩不优秀
80
220
300
合计
260
240
500
(1)记该校平时认真完成作业的学生的数学成绩优秀的概率为P.求P的估计值(保留三位小数).
(2)根据小概率值的独立性检验,分析高中生平时是否认真完成作业与数学成绩优秀有关.
附:.
0.050
0.010
0.001
k
3.841
6.635
10.828
2.(25-26高三上·云南·阶段练习)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区随机抽取200人进行调查,得到如下列联表:
学业成绩
日均体育锻炼时长(单位:小时)
其它
合计
优秀
40
60
100
不优秀
25
75
100
合计
65
135
200
(1)记学业成绩优秀的学生中日均体育锻炼时长为1至2小时的概率为,给出的估计值;
(2)是否有95%的把握认为学业成绩优秀与日均体育锻炼时长为1至2小时有关?
附:.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
3.(25-26高三上·安徽·阶段练习)为了研究某新型病毒与快速检测试剂结果的关系,研究人员随机调查了200名接受过该试剂检测的人群,得到如下列联表:
快速检测结果组别
阳性
阴性
合计
感染该病毒
30
10
40
未感染该病毒
20
140
160
合计
50
150
200
(1)记快速检测结果为阳性者感染该病毒的概率为P,求P的估计值;
(2)根据小概率值的独立性检验,分析快速检测结果是否与感染该病毒有关.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
4.(25-26高三上·安徽浙江·阶段练习)为了研究高三年级学生的性别和身高是否大于的关系,调查了某高三年级学生,整理得到如下列联表:
身高
性别
低于
不低于
合计
男
9
91
100
女
90
10
100
合计
99
101
200
(1)在这200名学生中随机选两名学生身高均不低于的概率是多少?
(2)根据小概率值的独立性检验,能否认为该中学高三年级学生的性别与身高有关联,解释所得结论的实际含义.
附
0.05
0.010
0.001
3.841
6.635
10.828
题型二 独立性检验与概率的综合问题
1.(25-26高三上·江苏徐州·期中)为了解学生对某项运动的喜欢程度,某校随机调查了200名学生,得到如下列联表:
喜欢程度
性别
喜欢
感觉一般
合计
男
30
70
100
女
50
50
100
合计
80
120
200
(1)根据小概率值的独立性检验,分析学生对该运动的喜欢程度是否与性别有关;
(2)从这200人中随机选出了5名男生和3名女生作为代表,其中有2名男生和2名女生喜欢该运动.现从这8名代表中任选3名男生和2名女生进一步交流,求这5人中恰有2人喜欢该运动的概率.
附:
0.05
0.01
0.005
3.841
6.635
7.879
2.(25-26高三上·吉林长春·阶段练习)我国探月工程亦称“嫦娥工程”,2024年6月3日,嫦娥六号完成了人类首次月球背面智能采样工作,并在6月下旬携带月球样品返回地球,为人类进一步研究和利用月球资源提供了保证.为了解不同性别的学生对探月工程的关注程度(“十分关注”与“比较关注”),学校随机抽取男生和女生各50名进行调查,数据表明:男生中有90%的同学“十分关注”,女生中有70%的同学“十分关注”,其他学生都是“比较关注”.
(1)根据条件,列出列联表,通过独立性检验,能否在犯错误概率不超过0.010前提下,认为探月工程的关注程度与性别有关;
(2)学校为提升同学们对探月工程的关注度,在以上“比较关注”的学生中运用分层抽样的方法抽取8人进行科普类培训,再从这8人中随机抽取3人进行重点培训,求这3人中至少有1名男生的概率.
附:,其中.
0.100
0.050
0.010
2.706
3.841
6.635
3.(2026高三·全国·专题练习)某市自从启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频繁发生,带来了较大的交通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到如下列联表:
30岁及以下
30岁以上
总计
闯红灯
60
未闯红灯
80
总计
200
近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济处罚,了研究不同处罚金额的效果,交警部门在试行四种不同处罚金额(5元、10元、15元、20元)的情形下,每种情形均随机抽取200人进行调查,统计了闯红灯的人数,汇总如下表:
处罚金额(单位:元)
5
10
15
20
闯红灯的人数
50
40
20
0
将统计数据所得频率作为概率,完成下列问题.
(1)将列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚前,是否有的把握认为闯红灯与年龄有关?
(2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少?
(3)结合调查结果,谈谈如何治理行人闯红灯现象.
题型三 独立性检验与回归分析的综合问题
1.(25-26高三上·湖北武汉·阶段练习)近几年,新能源汽车的更新换代越来越引起人们的关注.某新能源车企想了解年轻司机与中老年司机对新能源车和燃油车的喜好程度,随机抽取了1000名司机,得到的列联表如下:
偏好新能源车
偏好燃油车
总计
年轻司机
300
200
500
中老年司机
200
300
500
总计
500
500
1000
(1)依据小概率值的独立性检验,能否认为司机对两种汽车的偏好与年龄有关联?
(2)该新能源车企生产的一款汽车在2025年上半年每个月的销量(千辆)与月份线性相关,数据如下:
月份
1
2
3
4
5
6
销量(千辆)
0.8
0.9
1.1
1.1
1.3
1.4
求关于的线性回归方程.
参考公式及数据:.
,其中.
0.01
0.005
0.001
6.635
7.879
10.828
2.(25-26高三上·黑龙江哈尔滨·阶段练习)近年来,我国高度重视扶贫开发工作,各级政府坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效.某贫困县为了响应国家精准扶贫的号召,组织村民集体承包了一块土地若干年,已知土地的使用面积以及相应的管理时间的关系如下表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
10
13
25
24
并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:
参与管理
合计
愿意
不愿意
男性村民
150
50
女性村民
50
合计
(1)若管理时间与土地使用面积之间具有较强的线性相关性,且回归直线方程,求,并预测土地使用面积为6亩时,管理时间为多少月?
(2)在答题卡中补全列联表,并依据小概率值的独立性检验,判断村民的性别与参与管理的意愿是否具有相关性?
参考公式:,
其中.临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
1.(21-22高二·全国·课后作业)某单位主管对50名员工进行了工作量的调查,了解男、女职工对工作量大小的看法是否存在差异,得到的数据如下:
性别
工作量
合计
认为工作量大
认为工作量小
男
18
9
27
女
8
15
23
合计
26
24
50
请判断认为工作量的大小与性别是否有关.
2.(2024高二下·全国·专题练习)为考察某种药物预防疾病的效果,进行动物试验,得到2×2列联表如表所示.
患病
未患病
合计
服用药
10
45
55
没有服用药
20
30
50
合计
30
75
105
试用等高堆积条形图判断服用药与患病之间是否有关联.
3.(24-25高二下·全国·课后作业)随机抽取50名学生,询问他们是否赞成“幸福与占有多大的财富没有关系”这一看法.其中,赞成的有38名,反对的有12名.那么,这些学生对于这一看法的意见是否具有显著差异?为什么?
4.(25-26高三上·广东·阶段练习)某咖啡店想了解顾客性别与喜欢的咖啡口味是否有关,随机调查了名顾客,得到如下的列联表:
喜欢拿铁
喜欢美式
男性顾客
70
80
女性顾客
90
60
(1)根据的独立性检验,分析顾客性别与喜欢的咖啡口味是否有关;
(2)从这名顾客中随机选择名,已知其中至少有名女性顾客,求这名顾客都喜欢拿铁的概率.
附:,
5.(25-26高三上·黑龙江·开学考试)在2025年春晚《秧》节目中,宇树科技的“福兮”机器人采用人工智能()驱动全身运动控制技术,能根据音乐旋律调整舞步,其最大关节扭矩高达360牛顿·米,节目播出后引发公众对机器人技术的兴趣和热情,为了了解不同性别的学生对的关注情况,某校随机抽取了90名学生,调查结果如表:
性别
关注
不关注
合计
男
55
60
女
合计
75
(1)完成上述列联表,根据小概率值的独立性检验,能否认为学生对的关注与性别有关?
(2)在这90名学生中随机抽取一位,若事件表示“该生关注”,事件表示“该生为女生”,求及的值.
附:,其中.
0.1
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
6.(25-26高三上·江苏南京·开学考试)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了若干人,得到如下列联表:
超声波检查结果组别
正常
不正常
合计
患该疾病
未患该疾病
合计
(1)记超声波检查结果不正常者患该疾病的概率为,求关系;
(2)在(1)的条件下,根据小概率值的独立性检验,分析得出超声波检查结果与患该疾病有关.求的最小值.(保留整数)
附,
0.050
0.010
0.001
3.841
6.635
10.828
7.(24-25高二下·重庆沙坪坝·期末)部分胎儿在B超检查时会检测出鼻骨缺失,其中有的胎儿是孤立性鼻骨缺失(不合并其他超声异常),有的胎儿是鼻骨缺失的同时合并了其他超声异常.某儿科医院统计了100名鼻骨缺失胎儿的染色体检测结果,得到如下列联表:
是否合并其他超声异常染色体是否异常
不合并
合并
合计
正常
72
6
78
异常
3
19
22
合计
75
25
100
(1)根据小概率值的独立性检验,分析鼻骨缺失的胎儿是否合并其他超声异常与胎儿染色体是否异常有没有关系;
(2)现有3例鼻骨缺失胎儿,以频率估计概率,记为这3例鼻骨缺失胎儿中合并其他超声异常的人数,求的分布列和数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
8.(2025·陕西西安·一模)鄂尔多斯某地一景区为了吸引游客,进行了马术实景剧的展演.景区为了解游客对其开展的“马术实景剧”活动的满意度,随机抽取400人进行调查,得到如下2×2列联表:
调查结果组别
不满意
满意
合计
本地游客
80
120
200
外地游客
60
140
200
合计
140
260
400
(1)根据小概率值的独立性检验,分析满意情况是否与游客的来源有关;
(2)在本地游客的样本中用分层抽样的方法选出5人,再从这5人中随机抽取3人做进一步的访谈,求这3人中满意人数X的概率分布列和数学期望.
附:
0.050
0.010
0.001
3.841
6.635
10.828
9.(25-26高三上·湖北武汉·阶段练习)某种疾病分为甲、乙两种类型,为研究该疾病的类型与患者性别是否有关,随机抽取了名患者进行调查,得到如下列联表:
性别
疾病类型
合计
甲型病
乙型病
男
女
合计
(1)根据小概率值的独立性检验,得出了“所患疾病的类型与性别有关”的结论,求的最小值;
(2)现对部分人群接种预防甲型疾病的疫苗,要求每人至多安排2个周期接种疫苗,每人每周期必须接种3次,每次接种后,产生抗体的概率为0.8.如果一个周期内至少2次产生抗体,那么该周期结束后终止接种,否则进入第二个周期.已知每人每周期接种费用为30元,试估计1000人接种疫苗总费用的期望.附,
0.01
0.005
0.001
6.635
7.879
10.828
10.(25-26高三上·宁夏吴忠·阶段练习)某景区为测试并推广一款预约游览APP,上线的第1、2两天在APP上预约可获得免费游览资格,第3天开始恢复为原票价,下表是该景区在该APP上前7天的预约情况
第天
1
2
3
4
5
6
7
预约量(万张)
9.03
9
8.58
8.7
8.76
8.74
8.79
经计算得:.
(1)求关于的线性回归方程及第5天的残差:(精确到0.001)
(2)为了调查该APP在不同年龄的人群中的推广情况,从第7天成人游客中随机抽取200人进行分析,所得的部分数据见下表:
50岁以下
50岁(含50)以上
合计
通过APP预约人数
70
其它方式购票人数
80
合计
100
①完成以上列联表:
②如果有95%的把握认定游客通过APP预约游览与其年龄有关,就要进行针对性宣传,请你判断是否需要针对年龄超过50岁(含50)以上的人群进行宣传.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:
11.(25-26高三上·辽宁锦州·阶段练习)某县承包了一块土地,已知土地的使用面积与相应的管理时间的关系如下表所示:
土地使用面积亩
1
2
3
4
5
管理时间月
8
10
13
25
24
并调查了某村300位村民参与管理的意愿,得到的部分数据如下表所示:
单位:人
愿意参与管理
不愿意参与管理
合计
男性村民
150
50
女性村民
50
合计
(1)求出样本相关系数的大小,(精确到0.01)并判断管理时间与土地使用面积是否线性相关(当时,即可认为线性相关);
(2)依据的独立性检验,分析村民的性别与参与管理的意愿是否有关;
(3)以该村村民的性别与参与管理意愿的情况估计该县的情况,从该县中任取3人,记取到不愿意参与管理的男性村民的人数为,求的数学期望.
参考公式:,其中.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考数据:.
1 / 10
学科网(北京)股份有限公司
$
4.3.2 独立性检验
题型一 完善列联表
1.(20-21高二下·西藏日喀则·期末)假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
【答案】D
【分析】根据列联表直接计算.
【详解】根据列联表知,,又,所以,
故选:
2.(20-21高二下·山西朔州·期中)下表是一个列联表,则表中,的值分别为( )
总计
21
25
33
总计
100
A.46,54 B.54,46 C.52,54 D.50,52
【答案】B
【分析】根据列联表的数据特征求解.
【详解】由表格中的数据可得,,
所以,.
故选:B.
3.(20-21高二·全国·单元测试)假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】D
【分析】计算每个选项中的,比较大小后可得出结论.
【详解】对于两个分类变量与而言,的值越大,说明与有关系的可能性最大,
对于A选项,,
对于B选项,,
对于C选项,,
对于D选项,,
显然D中最大,
故选:D.
4.(24-25高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得 .
【答案】74
【分析】根据联表性质计算求解.
【详解】由题意知,所以.
故答案为:.
5.(24-25高二下·广西钦州·期末)如下是一个列联表,则 .
yx
总计
总计
【答案】
【分析】根据列联表的概念,可得答案.
【详解】由题意可得,则,可得,所以.
故答案为:.
6.(21-22高二上·全国·课后作业)两个分类变量X,Y,它们的取值分别为和,其列联表为:
YX
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
若两个分类变量X,Y没有关系,则下列结论正确的是 (填序号).
①;②;③;④;⑤.
【答案】①②⑤
【分析】根据独立性检验结合列联表逐项分析判断.
【详解】因为分类变量X,Y没有关系,则,整理得,即,
所以①②⑤正确;
又因为与,以及与与上述比例式没有关系,其大小关系无法判断,
故③④不正确.
故答案为:①②⑤.
题型二 列联表分析
1.(2023·云南昆明·一模)考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【答案】C
【分析】根据表格提供的数据作出判断.
【详解】由列联表中的数据可知,
种子经过处理,得病的比例明显降低,
种子未经过处理,得病的比例要高些,
所以可得结论:种子是否经过处理跟是否生病有关.
故选:C
2.(24-25高二下·河南·阶段练习)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【分析】根据题意,得到如下两个列联表,再一一分析即可.
【详解】根据题意,得到如下两个列联表.
35岁以上
35岁及以下
总计
男性
女性
总计
35岁以上
35岁及以下
总计
男性
女性
总计
根据第1个列联表可知,样本中男性市民人数为,
女性市民人数为,又,即样本中男性比女性多,故A正确;
根据第2个列联表可知,样本中35岁以上女性市民人数为,
35岁及以下女性市民人数为,又,即样本中多数女性是35岁以上,故B正确;
由题意,,所以,故C不正确;
根据第2个列联表可知,样本中35岁以上市民人数为,
35岁及以下市民人数为,又,
即样本中35岁以上的市民比35岁及以下的多,故D正确.
故选:C.
3.(多选)(24-25高二下·江西上饶·阶段练习)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则( )
合计
合计
A.若,则可以认为与独立
B.若变量与独立,则
C.若很大,则变量与不独立
D.若变量与不独立,则很大
【答案】AC
【分析】运用独立性检验的步骤原理推理判断即可.
【详解】用频率可以估计,用频率可以估计,用频率可以估计,若,则,可以认为与独立,故正确;
由于,,表示的是频率,是抽取的样本数据,故即使变量与独立,也不一定成立,故错误;
若很大,可以说明与不独立,故正确;
若变量与不独立,,但并不一定很大,故错误.
故选:AC.
题型三 等高条形图及应用
1.(24-25高二下·宁夏银川·阶段练习)为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
【答案】B
【分析】根据等高条形图中的数据即可得出选项.
【详解】根据两个表中的等高条形图知,药物实验显示不服药与服药时患病差异较药物实验显示明显大,
所以药物的预防效果优于药物的预防效果,
故选:B.
2.(2024高三·北京·专题练习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
【答案】C
【分析】通过对等高堆积条形图的分析,结合所列列联表及不等式性质,逐一对每个选项进行推理判断即可.
【详解】设等高条形图对应列联表如下:
岁及以上
岁以下
总计
男性
女性
总计
根据第个等高条形图可知,岁及以上男性比岁及以上女性多,即;
岁以下男性比岁以下女性多,即.
根据第个等高条形图可知,男性中岁及以上的比岁以下的多,即;
女性中岁及以上的比岁以下的多,即,
对于A,男性人数为,女性人数为,
因为,所以,所以A正确;
对于B,岁及以上女性人数为,岁以下女性人数为,
因为,所以B正确;
对于C,岁以下男性人数为,岁及以上女性人数为,
无法从图中直接判断与的大小关系,所以C不一定正确;
对于D,岁及以上的人数为,岁以下的人数为,
因为,所以,所以D正确.
故选:C.
3.(24-25高三上·江西新余·阶段练习)如图为对某高中学生是否对父母说过“我爱你”这样的话的统计结果,则下列统计分析中不正确的是:( ).
A.男性被调查者没有对父母说过“我爱你”这样的话的人数比例高于女性
B.无论男女对母亲说“我爱你”这类话的比例都高于对父亲所说
C.大部分调查者没有对父母说过“我爱你”这样的话
D.经常对父母说“我爱你”这样的话的人数总计比例较女生比例有所下降,说明这张统计图的结果可能存在错误
【答案】D
【分析】根据统计图中的数据进行分析,判断每个选项的正确性.
【详解】对于A选项,观察统计图,比较男性和女性未对父母说过“我爱你”的比例,
发现男性未说的比例高于女性,所以A选项正确.
对于B选项,分别对比男女对母亲和对父亲说“我爱你”的比例,
能看出无论男女对母亲说的比例都高于对父亲说的比例,所以B选项正确.
对于C选项,从统计图整体来看,未说过“我爱你”的人数比例较大,
所以大部分调查者没有对父母说过“我爱你”这样的话,C选项正确.
对于D选项,经常对父母说“我爱你”的人数总计比例较女生比例有所下降,
并不能直接说明统计图结果存在错误,有可能是实际调查结果就是如此,所以D选项错误.
故选:D
4.(23-24高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【答案】A
【分析】分析等高堆积条形图可直接得到答案.
【详解】原图是学校高二1、2班本期中期考试数学成绩优秀率的等高堆积条形图,
从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,BC错误;
两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误;
故选:A.
题型四 独立性检验的概念及辨析
1.(25-26高三上·江苏镇江·开学考试)某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用列联表计算得的观测值.
附表:
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )
A. B. C. D.
【答案】B
【分析】由独立性检验的原理的理解辨析可判断.
【详解】由题意知观测值,所以对照题中的附表可作出“这种血清能起到预防感冒的作用”出错的可能性不超过的结论.
故选:B
2.(25-26高三上·湖北恩施·开学考试)根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
【答案】B
【分析】根据独立性检验的概念可得正确的选项.
【详解】因为,所以在显著性水平下,
没有充分证据拒绝原假设,因此我们认为变量与是独立的,
故选:B
3.(2025高二·全国·专题练习)在性别与吃零食这两个分类变量的计算中,下列说法正确的是( )
①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误.
A.①② B.①③ C.②③ D.③
【答案】D
【分析】由独立性检验相关概念可得答案.
【详解】①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性,故①不正确;
②独立性检验是用来考察两个分类变量是否具有关联性,并且能较精确地给出这种判断的可靠程度,
而不是给出事件的概率,故②不正确;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误,③正确。
故选:D
4.(24-25高二下·广东广州·期末)根据分类变量X与Y的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量X与Y独立
B.变量X与Y独立,这个结论犯错误的概率不超过0.005
C.变量X与Y不独立
D.变量X与Y不独立,这个结论犯错误的概率不超过0.005
【答案】A
【分析】利用独立性检验规则来进行判断即可。
【详解】因为,所以没有充分的证据推断变量X与Y不相互独立,即认为变量X与Y独立,故BCD错误,A正确;
故选:A.
5.(25-26高二上·全国·单元测试)给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
【答案】B
【分析】根据独立性检验是对两个分类变量是否有关进行检验,逐个分析判断即可.
【详解】独立性检验主要是对两个分类变量是否有关进行检验,
对于A,喜欢参加体育锻炼有喜欢和不喜欢,性别有男和女,是对两个分类变量是否进行检验,
对于B,一个未被识别的甲骨文文字一年内被识别出来,只涉及一个变量,不可以用独立性检验解决,
对于C,购买食品有看生产日期和不看生产日期,性别有男和女,是对两个分类变量是否进行检验,
对于D,看新闻时政有喜欢和不喜欢,年龄有大有小,是对两个分类变量是否进行检验.
故不可以用独立性检验解决的问题是B.
故选:B.
6.(多选)(2025高二下·山东青岛·竞赛)在检验分类变量X与Y是否有关的过程中,计算得到实验数据的统计量,已知,,则( )
A.在犯错误的概率不超过10%的前提下,可以认为X与Y没有关系
B.在犯错误的概率不超过10%的前提下,可以认为X与Y有关系
C.依据的独立性检验,可以认为X与Y不独立
D.依据的独立性检验,可以认为X与Y独立
【答案】BD
【分析】根据,利用独立性检验的原理即可解题.
【详解】,所以在犯错误的概率不超过10%的前提下,
可以认为X与Y有关系,故A错误,B正确;
又,所以依据的独立性检验,可以认为X与Y独立,故C错误,D正确;
故选:BD.
题型五 卡方计算及应用
1.(25-26高二上·全国·单元测试)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线上有自东向西依次编号为1,2,…,21的21个车站.为调查编号为10和11两个站点的乘客对调图的满意度是否有差异,在这两个站点多次乘坐列车的旅客中,随机抽取100名旅客,并得出如下列联表,则的值约为( )
车站编号
满意度
满意
不满意
总计
10
28
12
40
11
57
3
60
总计
85
15
100
A.6.923 B.7.851 C.10.635 D.11.765
【答案】D
【分析】由卡方计算公式计算即可求解.
【详解】.
故选:D.
2.(24-25高三上·上海·单元测试)某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表,则根据列联表可知:
年轻人
非年轻人
总计
经常用流行用语
125
25
150
不常用流行用语
35
15
50
总计
160
40
200
有 的把握认为经常用流行用语与年轻人有关系.
【答案】95%
【分析】根据列联表求出观测值,对照临界值表,利用独立性检验的基本思想即可求解.
【详解】零假设为:经常用流行用语与是否为年轻人没有关系,
,
所以拒绝零假设,故有95%的把握认为经常用流行用语与是否为年轻人有关系.
故答案为:95%.
3.(24-25高二下·全国·课后作业)抛投一枚硬币100次,结果正面朝上45次,反面朝上55次,该枚硬币质地是否均匀?
【答案】是
【分析】根据独立性检验计算判断即可.
【详解】(1)提出零假设:硬币的质地是均匀的.
(2)确定显著性水平.
(3)计算统计量.
正面朝上的观测值为45,预期值为50次;同样的,反面朝上的观测值为55.则.
(4)统计决断:因为,而,卡方值属于接受区间,因此接受零假设,
即硬币的质地是均匀的.
4.(25-26高三上·青海西宁·期中)为了解某校学生每天进行体育运动的时间,从中抽取男、女生共100人进行问卷调查.将样本中的“男生”和“女生”按每天体育运动的时间(单位:分钟)各分为5组:,,经统计得下表:
男生
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
人数
4
5
27
21
3
女生
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
人数
3
13
16
6
2
若体育运动的时间不少于一小时,则被认定为“喜欢体育运动”,否则被认定为“不喜欢体育运动”.
(1)根据以上数据完成列联表;
喜欢体育运动
不喜欢体育运动
合计
男
女
合计
(2)依据小概率值的独立性检验,能否认为是否喜欢体育运动与性别有关联?
参考公式:,其中.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)答案见解析
(2)认为是否喜欢体育运动与性别有关联.
【分析】(1)根据题意列联表;(2)计算的值,作出判断.
【详解】(1)2×2列联表如下:
喜欢体育运动
不喜欢体育运动
合计
男
24
36
60
女
8
32
40
合计
32
68
100
(2)零假设为:是否喜欢体育运动与性别无关联.
根据列联表可得
根据小概率值的独立性检验,我们推断不成立,即认为是否喜欢体育运动与性别有关联.
题型一 独立性检验解决实际问题
1.(25-26高三上·湖南邵阳·期中)为研究高中生数学成绩优秀与平时认真完成作业的关系,从某校的学生中随机抽了500人,得到如下列联表:
是否认真完成作业组别
认真完成作业
不认真完成作业
合计
数学成绩优秀
180
20
200
数学成绩不优秀
80
220
300
合计
260
240
500
(1)记该校平时认真完成作业的学生的数学成绩优秀的概率为P.求P的估计值(保留三位小数).
(2)根据小概率值的独立性检验,分析高中生平时是否认真完成作业与数学成绩优秀有关.
附:.
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)0.692
(2)有关
【分析】(1)由列联表数据及古典概型的概率求法求概率;
(2)由卡方公式求卡方值,再根据独立性检验基本思想即可得结论.
【详解】(1)由列联表可知,认真完成作业的260人中有180人成绩优秀,所以P的估计值为;
(2)零假设:数学成绩优秀与是否认真完成作业无关,
根据表中数据可得,
根据小概率值的独立性检验,我们推断不成立,
即认为数学成绩优秀与是否认真完成作业有关,该推断犯错误的概率不超过0.001.
2.(25-26高三上·云南·阶段练习)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区随机抽取200人进行调查,得到如下列联表:
学业成绩
日均体育锻炼时长(单位:小时)
其它
合计
优秀
40
60
100
不优秀
25
75
100
合计
65
135
200
(1)记学业成绩优秀的学生中日均体育锻炼时长为1至2小时的概率为,给出的估计值;
(2)是否有95%的把握认为学业成绩优秀与日均体育锻炼时长为1至2小时有关?
附:.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)
(2)有的把握认为学业成绩优秀与日均体育锻炼时长为1至2小时有关
【分析】(1)根据列联表中的数据,结合古典摡型的概率计算公式,即可求解;
(2)根据列联表中的数据,利用公式求得,结合附表,即可得到答案.
【详解】(1)解:由列联表知,学业成绩优秀的学生共有100人,
其中日均体育锻炼时长为1至2小时的有40人,
根据古典摡型的概率计算公式,可得概率为,
所以的估计值为.
(2)解:零假设,学业成绩优秀与日均体育锻炼时长为1至2小时无关,
由的列联表中的数据,可得:,
因为,
所以零假设不成立,故有的把握认为学业成绩优秀与日均体育锻炼时长为1至2小时有关.
3.(25-26高三上·安徽·阶段练习)为了研究某新型病毒与快速检测试剂结果的关系,研究人员随机调查了200名接受过该试剂检测的人群,得到如下列联表:
快速检测结果组别
阳性
阴性
合计
感染该病毒
30
10
40
未感染该病毒
20
140
160
合计
50
150
200
(1)记快速检测结果为阳性者感染该病毒的概率为P,求P的估计值;
(2)根据小概率值的独立性检验,分析快速检测结果是否与感染该病毒有关.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)
(2)有关,理由见解析.
【分析】(1)由古典概率计算可得;
(2)由卡方的计算结合独立性检验可得.
【详解】(1)由题意可得快速检测结果为阳性者共50人,其中为阳性者感染该病毒的人数为30人,
所以.
(2)有关,理由如下:
由表中的数据可知,
则,
又小概率时,,
因为,所以根据小概率值的独立性检验,快速检测结果与感染该病毒有关.
4.(25-26高三上·安徽浙江·阶段练习)为了研究高三年级学生的性别和身高是否大于的关系,调查了某高三年级学生,整理得到如下列联表:
身高
性别
低于
不低于
合计
男
9
91
100
女
90
10
100
合计
99
101
200
(1)在这200名学生中随机选两名学生身高均不低于的概率是多少?
(2)根据小概率值的独立性检验,能否认为该中学高三年级学生的性别与身高有关联,解释所得结论的实际含义.
附
0.05
0.010
0.001
3.841
6.635
10.828
【答案】(1)
(2)认为该中学高三年级学生的性别与身高有关联.实际意义见解析
【分析】(1)根据古典概型的概率公式求解,即得答案;
(2)计算的值,根据独立性检验的原理,即可得结论.
【详解】(1)设两名学生身高均不低于的事件为,
由古典概率计算公式得
(2)零假设为:该中学高三年级学生的性别与身高无关联,
则,
根据的独立性检验,我们推断不成立,
即认为该中学高三年级学生的性别与身高有关联.
所得结论的实际含义是:在犯错误的概率不超过0.001的前提下,
认为该中学高三年级学生的性别与身高有关联,
即男生身高不低于170cm的比例远高于女生,女生身高低于170cm的比例远高于男生.
题型二 独立性检验与概率的综合问题
1.(25-26高三上·江苏徐州·期中)为了解学生对某项运动的喜欢程度,某校随机调查了200名学生,得到如下列联表:
喜欢程度
性别
喜欢
感觉一般
合计
男
30
70
100
女
50
50
100
合计
80
120
200
(1)根据小概率值的独立性检验,分析学生对该运动的喜欢程度是否与性别有关;
(2)从这200人中随机选出了5名男生和3名女生作为代表,其中有2名男生和2名女生喜欢该运动.现从这8名代表中任选3名男生和2名女生进一步交流,求这5人中恰有2人喜欢该运动的概率.
附:
0.05
0.01
0.005
3.841
6.635
7.879
【答案】(1)有关
(2)
【分析】(1)计算的值,根据独立性检验的原理,即可得结论;
(2)根据古典概型的概率公式求解,即可求得答案.
【详解】(1)零假设:学生对该运动的喜欢程度与性别无关,
则,
故根据小概率值的独立性检验,可知零假设不成立,
则学生对该运动的喜欢程度与性别有关;
(2)设进一步交流的男生喜欢该运动的人数为X,女生中喜欢该运动的人数为Y,
从这8名代表中任选3名男生和2名女生的选法有种,
则
,
即这5人中恰有2人喜欢该运动的概率为.
2.(25-26高三上·吉林长春·阶段练习)我国探月工程亦称“嫦娥工程”,2024年6月3日,嫦娥六号完成了人类首次月球背面智能采样工作,并在6月下旬携带月球样品返回地球,为人类进一步研究和利用月球资源提供了保证.为了解不同性别的学生对探月工程的关注程度(“十分关注”与“比较关注”),学校随机抽取男生和女生各50名进行调查,数据表明:男生中有90%的同学“十分关注”,女生中有70%的同学“十分关注”,其他学生都是“比较关注”.
(1)根据条件,列出列联表,通过独立性检验,能否在犯错误概率不超过0.010前提下,认为探月工程的关注程度与性别有关;
(2)学校为提升同学们对探月工程的关注度,在以上“比较关注”的学生中运用分层抽样的方法抽取8人进行科普类培训,再从这8人中随机抽取3人进行重点培训,求这3人中至少有1名男生的概率.
附:,其中.
0.100
0.050
0.010
2.706
3.841
6.635
【答案】(1)列联表见解析,没有把握认为对探月工程的关注程度与性别有关;
(2)
【分析】(1)根据题意列出列联表,并根据卡方公式计算卡方,由独立性检验的基本思想判定即可;
(2)先利用分层抽样原理计算抽取男女生人数,再利用古典概型计算概率即可.
【详解】(1)由题意可得列联表:
男
女
合计
十分关注
45
35
80
比较关注
5
15
20
合计
50
50
100
,
在犯错误概率不超过0.010前提下,没有把握认为对探月工程的关注程度与性别有关.
(2)由题意知,8人中男生人,女生人.
记“人中至少有1名男生”为事件,
则.
3.(2026高三·全国·专题练习)某市自从启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频繁发生,带来了较大的交通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到如下列联表:
30岁及以下
30岁以上
总计
闯红灯
60
未闯红灯
80
总计
200
近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济处罚,了研究不同处罚金额的效果,交警部门在试行四种不同处罚金额(5元、10元、15元、20元)的情形下,每种情形均随机抽取200人进行调查,统计了闯红灯的人数,汇总如下表:
处罚金额(单位:元)
5
10
15
20
闯红灯的人数
50
40
20
0
将统计数据所得频率作为概率,完成下列问题.
(1)将列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚前,是否有的把握认为闯红灯与年龄有关?
(2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少?
(3)结合调查结果,谈谈如何治理行人闯红灯现象.
【答案】(1)列联表见解析;有的把握认为闯红灯与年龄有关
(2)0.2
(3)答案见解析
【分析】(1)完成列联表,由表中数据计算,根据独立性检验的思想判断即可;
(2)当处罚金额为10元时,求出行人闯红灯的概率,和0.4去比较即可得解;
(3)由表中数据得到,行人闯红灯与年龄有明显关系,试行经济处罚可以明显降低行人闯红灯的概率,所以从这两方面作答即可.
【详解】(1)列联表如下:
30岁及以下
30岁以上
总计
闯红灯
20
60
80
未闯红灯
80
40
120
总计
100
100
200
零假设:假设闯红灯与年龄无关,
由表中数据可得.
,假设不成立,即有的把握认为闯红灯与年龄有关;
(2)未进行处罚前,行人闯红灯的概率约为0.4,
当处罚金额为10元时,行人闯红灯的概率约为,
所以当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低0.2;
(3)①根据调查数据显示,行人闯红灯与年龄有明显关系,
所以可以针对30岁以上人群开展“道路安全”宣传教育;
②由于试行经济处罚可以明显降低行人闯红灯的概率,
所以可以进行适当经济处罚来降低行人闯红灯的概率.
题型三 独立性检验与回归分析的综合问题
1.(25-26高三上·湖北武汉·阶段练习)近几年,新能源汽车的更新换代越来越引起人们的关注.某新能源车企想了解年轻司机与中老年司机对新能源车和燃油车的喜好程度,随机抽取了1000名司机,得到的列联表如下:
偏好新能源车
偏好燃油车
总计
年轻司机
300
200
500
中老年司机
200
300
500
总计
500
500
1000
(1)依据小概率值的独立性检验,能否认为司机对两种汽车的偏好与年龄有关联?
(2)该新能源车企生产的一款汽车在2025年上半年每个月的销量(千辆)与月份线性相关,数据如下:
月份
1
2
3
4
5
6
销量(千辆)
0.8
0.9
1.1
1.1
1.3
1.4
求关于的线性回归方程.
参考公式及数据:.
,其中.
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1)依据小概率值的独立性检验,认为司机对两种汽车的偏好与年龄有关联,此推断犯错误的概率不超过0.001.
(2)
【分析】(1)结合已知有列联表,根据公式计算出,与临界值比较后作出判断即可;
(2)结合数据,根据公式计算出,即可得到关于的线性回归方程.
【详解】(1)零假设为
:司机的年龄与偏好相互独立,即司机对两种汽车的偏好与年龄无关.
由已知列联表,计算可得:
,
依据小概率值的独立性检验,我们推断不成立,即认为司机对两种汽车的偏好与年龄有关联,此推断犯错的概率不超过0.001.
(2)由题可知:,.
.
.
所以,.
关于的线性回归方程为:.
2.(25-26高三上·黑龙江哈尔滨·阶段练习)近年来,我国高度重视扶贫开发工作,各级政府坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效.某贫困县为了响应国家精准扶贫的号召,组织村民集体承包了一块土地若干年,已知土地的使用面积以及相应的管理时间的关系如下表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
10
13
25
24
并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:
参与管理
合计
愿意
不愿意
男性村民
150
50
女性村民
50
合计
(1)若管理时间与土地使用面积之间具有较强的线性相关性,且回归直线方程,求,并预测土地使用面积为6亩时,管理时间为多少月?
(2)在答题卡中补全列联表,并依据小概率值的独立性检验,判断村民的性别与参与管理的意愿是否具有相关性?
参考公式:,
其中.临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1),30.1;
(2)列联表见解析,具有相关性.
【分析】(1)先求出样本中心点,再代入求出,再根据回归直线代入预测即可;
(2)先根据已知条件补充列联表,再计算,最后与临界值比较即可求解判断.
【详解】(1)依题意:,,
又,则有,且,
当时,,
故预测管理时间为30.1个月.
(2)依题意,完善表格如下:
愿意参与管理
不愿意参与管理
总计
男性村民
150
50
200
女性村民
50
50
100
总计
200
100
300
零假设:村民的性别与参与管理的意愿无关,
计算得的观测值为
,
依据小概率值的独立性检验,我们推断不成立,认为村民的性别与参与管理的意愿具有相关性,此推断犯错误的概率不超过0.001.
1.(21-22高二·全国·课后作业)某单位主管对50名员工进行了工作量的调查,了解男、女职工对工作量大小的看法是否存在差异,得到的数据如下:
性别
工作量
合计
认为工作量大
认为工作量小
男
18
9
27
女
8
15
23
合计
26
24
50
请判断认为工作量的大小与性别是否有关.
【答案】工作量的大小与性别有关系,男职工更加认为工作量大.
【分析】分别计算,,比较大小,若差距较大即可认为工作量的大小与性别有关系.
【详解】.
,
所以认为工作量的大小与性别有关系,男职工更加认为工作量大.
2.(2024高二下·全国·专题练习)为考察某种药物预防疾病的效果,进行动物试验,得到2×2列联表如表所示.
患病
未患病
合计
服用药
10
45
55
没有服用药
20
30
50
合计
30
75
105
试用等高堆积条形图判断服用药与患病之间是否有关联.
【答案】有关联.
【分析】作出相应的等高堆积条形图,从图形分析出判断服用药与患病之间是否有关联.
【详解】相应的等高堆积条形图如图所示.
从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为服用药与患病之间有关联.
3.(24-25高二下·全国·课后作业)随机抽取50名学生,询问他们是否赞成“幸福与占有多大的财富没有关系”这一看法.其中,赞成的有38名,反对的有12名.那么,这些学生对于这一看法的意见是否具有显著差异?为什么?
【答案】有显著差异,理由见解析
【分析】通过频率估计概率及零假设判断得出.
【详解】零假设两者无显著差异,即总体赞成比例(意味着赞成和反对各占一半).
赞成比例为,反对比例为,学生意见有显著差异,就显著性水平为0.05而言,故两者有显著差异.
4.(25-26高三上·广东·阶段练习)某咖啡店想了解顾客性别与喜欢的咖啡口味是否有关,随机调查了名顾客,得到如下的列联表:
喜欢拿铁
喜欢美式
男性顾客
70
80
女性顾客
90
60
(1)根据的独立性检验,分析顾客性别与喜欢的咖啡口味是否有关;
(2)从这名顾客中随机选择名,已知其中至少有名女性顾客,求这名顾客都喜欢拿铁的概率.
附:,
【答案】(1)认为顾客性别与喜欢的咖啡无关
(2)
【分析】(1)计算卡方值并与临界值比较,即可得出结论;
(2)根据条件概率的公式计算得解.
【详解】(1)零假设:顾客性别与喜欢的咖啡口味无关.
因为,
故依据的独立性检验,没有足够的证据说明不成立,即认为顾客性别与喜欢的咖啡无关.
(2)设事件“所选的2名顾客至少有1名女性顾客”,事件“所选的2名顾客都喜欢拿铁”.
由列联表知;
,
所以.
5.(25-26高三上·黑龙江·开学考试)在2025年春晚《秧》节目中,宇树科技的“福兮”机器人采用人工智能()驱动全身运动控制技术,能根据音乐旋律调整舞步,其最大关节扭矩高达360牛顿·米,节目播出后引发公众对机器人技术的兴趣和热情,为了了解不同性别的学生对的关注情况,某校随机抽取了90名学生,调查结果如表:
性别
关注
不关注
合计
男
55
60
女
合计
75
(1)完成上述列联表,根据小概率值的独立性检验,能否认为学生对的关注与性别有关?
(2)在这90名学生中随机抽取一位,若事件表示“该生关注”,事件表示“该生为女生”,求及的值.
附:,其中.
0.1
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1)列联表见解析,有关
(2),,,
【分析】(1)由题意完善列联表,再计算,得出结论;
(2)根据古典概型及和事件概率公式、条件概率公式求解.
【详解】(1)根据题意,完成列联表如下:
性别
关注
不关注
合计
男
55
5
60
女
20
10
30
合计
75
15
90
零假设:学生对的关注与性别无关,
则,
根据小概率值的独立性检验,我们推断不成立,
所以能认为学生对的关注与性别有关;
(2),
,
∴,
∴,
∴.
6.(25-26高三上·江苏南京·开学考试)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了若干人,得到如下列联表:
超声波检查结果组别
正常
不正常
合计
患该疾病
未患该疾病
合计
(1)记超声波检查结果不正常者患该疾病的概率为,求关系;
(2)在(1)的条件下,根据小概率值的独立性检验,分析得出超声波检查结果与患该疾病有关.求的最小值.(保留整数)
附,
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)
(2)
【分析】(1)根据古典概型公式,代入数据,即可得答案;
(2)将代入列联表,计算,根据题意,可得,即可得n的范围,进而可得答案.
【详解】(1)因为超声波检查结果不正常者患该疾病的概率为,
所以,解得;
(2)将代入列联表可得:
超声波检查结果组别
正常
不正常
合计
患该疾病
未患该疾病
合计
则,
因为根据小概率值的独立性检验,
所以,解得,
因为,所以n的最小值为45,
所以,
所以m的最小值为180
7.(24-25高二下·重庆沙坪坝·期末)部分胎儿在B超检查时会检测出鼻骨缺失,其中有的胎儿是孤立性鼻骨缺失(不合并其他超声异常),有的胎儿是鼻骨缺失的同时合并了其他超声异常.某儿科医院统计了100名鼻骨缺失胎儿的染色体检测结果,得到如下列联表:
是否合并其他超声异常染色体是否异常
不合并
合并
合计
正常
72
6
78
异常
3
19
22
合计
75
25
100
(1)根据小概率值的独立性检验,分析鼻骨缺失的胎儿是否合并其他超声异常与胎儿染色体是否异常有没有关系;
(2)现有3例鼻骨缺失胎儿,以频率估计概率,记为这3例鼻骨缺失胎儿中合并其他超声异常的人数,求的分布列和数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关
(2)分布列见解析,
【分析】(1)根据列联表及所给公式计算出,对照附表做出相应判断.
(2)用列联表中所给的频数,算出相应频率,并以此估计概率.显然,服从二项分布,据此可写出其分布列,并求出其数学期望.
【详解】(1)解:设零假设:鼻骨缺失的胎儿是否合并其他超声异常与胎儿染色体异常无关.
由题知.
根据小概率值的独立性检验,我们推断不成立,
即认为胎儿鼻骨缺失合并其他超声异常与胎儿染色体异常有关,此推断犯错误概率不大于.
(2)由列联表所给频数可得鼻骨缺失的胎儿中合并其他超声异常的频率为,
以此估计鼻骨缺失的胎儿的中合并其他超声异常的概率为,
即一例鼻骨缺失胎儿合并其他超声异常的概率为
为3例鼻骨缺失胎儿中合并其他超声异常的人数,所以的所有可能取值为,
且,故.
则的分布列如下
0
1
2
3
故的数学期望.
8.(2025·陕西西安·一模)鄂尔多斯某地一景区为了吸引游客,进行了马术实景剧的展演.景区为了解游客对其开展的“马术实景剧”活动的满意度,随机抽取400人进行调查,得到如下2×2列联表:
调查结果组别
不满意
满意
合计
本地游客
80
120
200
外地游客
60
140
200
合计
140
260
400
(1)根据小概率值的独立性检验,分析满意情况是否与游客的来源有关;
(2)在本地游客的样本中用分层抽样的方法选出5人,再从这5人中随机抽取3人做进一步的访谈,求这3人中满意人数X的概率分布列和数学期望.
附:
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)无关;
(2)分布列见解析,数学期望为.
【分析】(1)根据给定数表,求出的观测值,再与临界值比对即可得解.
(2)根据分层抽样的性质,结合古典概型公式、数学期望公式求解即可.
【详解】(1)零假设为:满意情况与游客的来源无关,
因为,
根据小概率值的独立性检验,没有充分证据推断不成立,
可以认为成立,所以满意情况与游客的来源无关.
(2)由分层抽样的性质,得选出5人中,满意人数为,不满意人数为,
依题意,的可能值为,
,,,
所以这3人中满意人数X的概率分布列为:
数学期望.
9.(25-26高三上·湖北武汉·阶段练习)某种疾病分为甲、乙两种类型,为研究该疾病的类型与患者性别是否有关,随机抽取了名患者进行调查,得到如下列联表:
性别
疾病类型
合计
甲型病
乙型病
男
女
合计
(1)根据小概率值的独立性检验,得出了“所患疾病的类型与性别有关”的结论,求的最小值;
(2)现对部分人群接种预防甲型疾病的疫苗,要求每人至多安排2个周期接种疫苗,每人每周期必须接种3次,每次接种后,产生抗体的概率为0.8.如果一个周期内至少2次产生抗体,那么该周期结束后终止接种,否则进入第二个周期.已知每人每周期接种费用为30元,试估计1000人接种疫苗总费用的期望.附,
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1)18;
(2)33120.
【分析】(1)根据列联表中的数据求得的值,根据小概率值的独立性检验可得,求解得答案;
(2)设每人接种疫苗的费用为,其可能的取值为,求出取值对应的概率,分布列,得到每人接种疫苗的费用的均值,进而求得1000人接种疫苗总费用的期望.
【详解】(1)根据列联表中的数据,得到,
因为根据小概率值的独立性检验,认为“所患疾病的类型与性别”有关,
所以,解得,
因为,结合列联表中各式均为整数,
所以的最小整数值为18.
(2)设每人接种疫苗的费用为,其可能的取值为,
所以,,
所以的分布列为
30
60
所以的期望,
估计1000人接种疫苗总费用的期望为元.
10.(25-26高三上·宁夏吴忠·阶段练习)某景区为测试并推广一款预约游览APP,上线的第1、2两天在APP上预约可获得免费游览资格,第3天开始恢复为原票价,下表是该景区在该APP上前7天的预约情况
第天
1
2
3
4
5
6
7
预约量(万张)
9.03
9
8.58
8.7
8.76
8.74
8.79
经计算得:.
(1)求关于的线性回归方程及第5天的残差:(精确到0.001)
(2)为了调查该APP在不同年龄的人群中的推广情况,从第7天成人游客中随机抽取200人进行分析,所得的部分数据见下表:
50岁以下
50岁(含50)以上
合计
通过APP预约人数
70
其它方式购票人数
80
合计
100
①完成以上列联表:
②如果有95%的把握认定游客通过APP预约游览与其年龄有关,就要进行针对性宣传,请你判断是否需要针对年龄超过50岁(含50)以上的人群进行宣传.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:
【答案】(1),残差为
(2)①列联表见解析;②需要,理由见解析
【分析】(1)根据表中数据和公式求出的值,进而得到线性回归方程,从而可求出第5天的残差.
(2)①根据数据的和差进行填表即可.②作出零假设,根据公式求出卡方值,进而可判断零假设是否成立.
【详解】(1),
故,
,
故关于的线性回归方程为.
所以第5天的残差为
(2)①列联表如下:
50岁以下
50岁(含50)以上
合计
通过APP预约人数
70
50
120
其它方式购票人数
30
50
80
合计
100
100
200
②需要针对年龄超过50岁(含50)以上的人群进行宣传,理由如下:
零假设认定游客通过APP预约游览与其年龄无关,
则,
根据小概率事件原理,可知零假设不成立,故认定游客通过APP预约游览与其年龄有关,
需要针对年龄超过50岁(含50)以上的人群进行宣传.
11.(25-26高三上·辽宁锦州·阶段练习)某县承包了一块土地,已知土地的使用面积与相应的管理时间的关系如下表所示:
土地使用面积亩
1
2
3
4
5
管理时间月
8
10
13
25
24
并调查了某村300位村民参与管理的意愿,得到的部分数据如下表所示:
单位:人
愿意参与管理
不愿意参与管理
合计
男性村民
150
50
女性村民
50
合计
(1)求出样本相关系数的大小,(精确到0.01)并判断管理时间与土地使用面积是否线性相关(当时,即可认为线性相关);
(2)依据的独立性检验,分析村民的性别与参与管理的意愿是否有关;
(3)以该村村民的性别与参与管理意愿的情况估计该县的情况,从该县中任取3人,记取到不愿意参与管理的男性村民的人数为,求的数学期望.
参考公式:,其中.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考数据:.
【答案】(1)0.93,管理时间与土地使用面积线性相关.
(2)有关
(3)
【分析】(1)根据条件,直接利用公式即可求解;
(2)根据条件,计算出值,即可求解;
(3)法一、由题知的可能取值为,再求出相应的概率,利用期望的计算公式,即可求解;法二、根据条件,可得,再利用二项分布的期望计算公式,即可求解.
【详解】(1)由题知,,,
,
,,
则
故管理时间与土地使用面积线性相关.
(2)依题意,列联表如下:
单位:人
愿意参与管理
不愿意参与管理
合计
男性村民
150
50
200
女性村民
50
50
100
合计
200
100
300
零假设为:村民的性别与参与管理的意愿无关.
计算可得.
依据的独立性检验,推断不成立,即认为村民的性别与参与管理的意愿有关.
(3)法一:依题意,的可能取值为,从该县中随机抽取一位村民,
取到不愿意参与管理的男性村民的概率为,
故,
故的分布列为
0
1
2
3
则数学期望.
法二:依题意,从该县中随机抽取一位村民,取到不愿意参与管理的男性村民的概率为,
由题易知,故.
1 / 10
学科网(北京)股份有限公司
$