内容正文:
第11讲 列联表与独立性检验
知识清单
知识点01:分类变量与列联表
知识点02:独立性检验
题型讲解
(举三反三)
题型1:分类变量与列联表的
题型2:独立性检验的概念及辨折
题型3:卡方的计算
题型4:独立性检验的基本思想
题型5:独立性检验解决实际问题
强化训练
一、单选题(8)
二、多选题(3)
三、填空题(3)
四、解答题(5)
知识点1.分类变量与列联表
一、分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
二、2×2列联表
1.2×2列联表给出了成对分类变量数据的交叉分类频数.
2.定义一对分类变量X和Y,我们整理数据如下表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
像这种形式的数据统计表称为2×2列联表.
知识点2.独立性检验
1.定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.
2.χ2=,其中n=a+b+c+d.
3.独立性检验解决实际问题的主要环节
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
思考 独立性检验与反证法的思想类似,那么独立性检验是反证法吗?
答案 不是.因为反证法不会出错,而独立性检验依据的是小概率事件几乎不发生.
题型1:分类变量与列联表的
【例1-1】(24-25高二下·山西·期末)在统计中,研究两个分类变量之间的关联性时常用的图是( )
A.散点图 B.残差图 C.频率分布直方图 D.等高堆积条形图
【例1-2】(24-25高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
【例1-3】(25-26高二下·全国)某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.
(1)根据以上数据,作出考前心情与性格的列联表,并求性格外向的学生中考前心情紧张的概率.
(2)作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.
【变式1-1】(24-25高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【变式1-2】(24-25高二下·广西钦州·期末)如下是一个列联表,则________.
yx
总计
总计
【变式1-3】(2024高二下·全国·专题练习)为考察某种药物预防疾病的效果,进行动物试验,得到2×2列联表如表所示.
患病
未患病
合计
服用药
10
45
55
没有服用药
20
30
50
合计
30
75
105
试用等高堆积条形图判断服用药与患病之间是否有关联.
题型2:独立性检验的概念及辨折
【例2-1】(25-26高二下·黑龙江大庆·期中)独立性检验中,若小于临界值,则下列结论正确的是( )
A.两个变量一定相互独立 B.两个变量一定不独立
C.没有充分证据表明两个变量有关 D.两个变量有关联的可能性为
【例2-2】(25-26高二上·全国·单元测试)给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
【例2-3】有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?
【变式2-1】(24-25高二下·辽宁·期末)为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则( )
性别
羽毛球
喜欢
不喜欢
女生
男生
50
100
附:,其中.
A.4 B.2 C.1 D.
【变式2-2】(24-25高二下·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
【变式2-3】根据的值,如何查表确定有多大的把握判断两个分类变量有关系?
题型3:卡方的计算
【例3-1】(25-26高二上·全国·单元测试)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线上有自东向西依次编号为1,2,…,21的21个车站.为调查编号为10和11两个站点的乘客对调图的满意度是否有差异,在这两个站点多次乘坐列车的旅客中,随机抽取100名旅客,并得出如下列联表,则的值约为( )
车站编号
满意度
满意
不满意
总计
10
28
12
40
11
57
3
60
总计
85
15
100
A.6.923 B.7.851 C.10.635 D.11.765
【例3-2】(25-26高二下·内蒙古呼和浩特·月考)某校调查学生参加体育锻炼与性别的关系,得到如下列联表(单位:人):
经常锻炼
不经常锻炼
合计
男生
35
55
90
女生
65
45
110
合计
100
100
200
参照公式(其中),计算得______.(保留两位小数)
【例3-3】(24-25高二下·吉林长春·期末)某高校为了了解大学生对篮球运动的喜好是否与性别有关联,随机在该校调查了100名大学生,得到的数据如表所示:
性别
篮球运动
合计
喜欢
不喜欢
男
40
10
50
女
25
25
50
合计
65
35
100
(1)求该校喜欢篮球运动的大学生中性别为男的频率;
(2)根据小概率值的独立性检验,能否认为该校大学生是否喜欢篮球运动与性别有关联?
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式3-1】(25-26高二上·黑龙江齐齐哈尔·期末)某校对“学生性别和喜欢刷视频是否有关”作了一次调查,得到如下列联表:
不喜欢刷视频
喜欢刷视频
总计
男生
女生
总计
若通过计算,可得根据小概率值的独立性检验,认为学生是否喜欢刷视频与性别有关联,则正整数的最小值为( )
附:,.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A.80 B.100 C.120 D.150
【变式3-2】(24-25高二下·广东·月考)小明为了了解不同性别的观众对蛇年春晚小品类节目的喜欢情况,随机选取了200名观看蛇年春晚的观众,得到如下列联表:
喜欢
不喜欢
合计
男性
45
45
90
女性
110
合计
80
200
根据小概率值的独立性检验,其中________,(精确到小数点后3位)可以判断出性别因素与喜欢有关联.
附:,.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【变式3-3】(24-25高二下·甘肃白银·期末)研究者发现多看电视易使人变冷漠,下表数据(单位:人)是一个调查机构在某社区对此现象的调查结果:
冷漠
不冷漠
合计
多看电视
70
30
100
少看电视
20
60
80
合计
90
90
180
(1)试问能否有99.9%的把握认为多看电视与人变冷漠有关系?
(2)若从被调查的多看电视的100人中任选2人,求这2人中至少有1人不冷漠的概率.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
题型4:独立性检验的基本思想
【例4-1】(24-25高二下·甘肃白银·期末)假设有两个分类变量X,Y,它们的可能取值分别为和,其列联表为
合计
合计
以下各组数据中,对于同一样本能说明与有关系的可能性最大的一组为( )
A. B.
C. D.
【例4-2】(24-25高二下·全国·课后作业)若两个分类变量与的列联表为:
合计
10
15
25
40
16
56
合计
50
31
81
则“与之间有关系”这个结论出错的概率为______.
【例4-3】(2025高二·全国·专题练习)随机询问80名不同职业的人在购买食品时是否看营养说明,得到如下调查结果:
职业
买食品时是否看营养说明
合计
不看营养说明
看营养说明
从事与医疗相关行业
12
28
40
从事与医疗无关行业
18
22
40
合计
30
50
80
依据小概率的独立性检验,能否推断两个群体在购买食品时是否看营养说明存在差异?
参考公式:
独立性检验中常用小概率值和相应临界值:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式4-1】(24-25高二下·全国·单元测试)想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( )
A.提出统计假设:男性喜欢参加体育活动
B.提出统计假设:女性不喜欢参加体育活动
C.提出统计假设:喜欢参加体育活动与性别有关
D.提出统计假设:喜欢参加体育活动与性别无关
【变式4-2】(25-26高二下·全国·单元测试)若两个分类变量和的列联表为:
合计
5
15
20
40
10
50
合计
45
25
70
则有________的把握认为与之间有关系.
附:
【变式4-3】为了研究学生的性别与是否喜欢运动的关联性,随机调查了某中学的100名学生,整理得到如下表格:
男学生
女学生
合计
喜欢运动
40
20
60
不喜欢运动
20
20
40
合计
60
40
100
(1)依据的独立性检验,能否认为学生的性别与是否喜欢运动有关联?
(2)按学生的性别以及是否喜欢运动用分层随机抽样的方法从这100名学生中选取10人,再从这10人中任选2人,喜欢运动的男学生被选中的人数为,求的分布列与期望.
附:,其中.
0.1
0.05
0.01
2.706
3.841
6.635
题型5:独立性检验解决实际问题
【例5-1】(25-26高二下·全国·单元测试)根据下面的列联表判断患肝病与嗜酒有关系的把握有( )
肝病
酒性
合计
嗜酒
不嗜酒
患肝病
7775
42
7817
未患肝病
2099
49
2148
合计
9874
91
9965
A. B. C. D.
【例5-2】(25-26高二下·全国·单元测试)在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算,根据这一数据分析,有________的把握认为打鼾与患心脏病是________(填“有关”或“无关”)的.
【例5-3】(25-26高二下·内蒙古呼和浩特·月考)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解20-30岁年轻人的体质健康是否与性别有关,在4月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到如列联表.
性别
健康状况
感冒
不感冒
男
8
14
女
4
24
(1)在上述感冒的年轻人中按照性别采用分层抽样的方法抽取6人,再从这6人中随机选取3人访谈,记参与访谈的男性人数为,求的分布和期望;
(2)依上表,在犯错误的概率不超过0.05的前提下,20-30岁年轻人的体质健康与性别是否有关?
参考数据:参考公式:,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【变式5-1】(24-25高二下·福建厦门·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
【变式5-2】(25-26高二上·全国·单元测试)随着冬天的临近,哈尔滨这座冰雪之城将再次成为旅游的热门目的地.为更好地提升旅游品质,该市文旅局随机选择100名青年游客对哈尔滨出行体验进行满意度评分(满分100分),80分及以上为良好等级,根据评分,制成如图所示的频率分布直方图.为进一步了解不同年龄段游客对哈尔滨出行体验的反馈,该市文旅局再次随机选择100名中老年游客进行满意度评分,发现两次调查中评分为良好等级的人数为120,则中老年游客评分等级良好的有________人.根据独立性检验,游客的评分等级是否良好与年龄段(青年或中老年)________(填“有关”或“无关”).
【变式5-3】(25-26高二下·内蒙古呼和浩特·月考)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解20-30岁年轻人的体质健康是否与性别有关,在4月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到如列联表.
性别
健康状况
感冒
不感冒
男
8
14
女
4
24
(1)在上述感冒的年轻人中按照性别采用分层抽样的方法抽取6人,再从这6人中随机选取3人访谈,记参与访谈的男性人数为,求的分布和期望;
(2)依上表,在犯错误的概率不超过0.05的前提下,20-30岁年轻人的体质健康与性别是否有关?
参考数据:参考公式:,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
一、单选题
1.(25-26高二上·全国·单元测试)为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,得到的结论是有99%的把握认为性别与喜欢乡村音乐有关系,则的值可以为( )
A.2.853 B.3.841 C.6.758 D.6.451
2.(24-25高二下·河南信阳·期末)调查某医院一段时间内婴儿出生的时间(白天与晚上)和性别(男与女)的关联性,对样本数据分析统计,计算得到,依据小概率值的独立性检验,下列说法正确的是( )(附:)
A.婴儿90%在白天出生
B.婴儿性别与出生时间无关联
C.有0.1的把握认为婴儿性别与出生时间有关联
D.婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1
3.(2023高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
4.(2025高二·全国·专题练习)在性别与吃零食这两个分类变量的计算中,下列说法正确的是( )
①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误.
A.①② B.①③ C.②③ D.③
5.(25-26高二上·全国·单元测试)某校团委对“喜欢吃水果和学生性别是否有关”进行了一次调查,其中被调查的女生人数是男生人数的,男生喜欢吃水果的人数占被调查的男生人数的,女生喜欢吃水果的人数占被调查的女生人数的,若有的把握认为喜欢吃水果和学生性别有关,则被调查的男生至少有( )(参考数据:)
A.30人 B.24人 C.18人 D.12人
6.针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若我们推断不成立,此推断犯错误率不超过,则的最小值为( )
附:,附表:
0.05
0.01
3.841
6.635
A.7 B.8 C.9 D.10
7.(25-26高二上·安徽淮北·期末)读万卷书,行万里路.随着我国教育模式由“应试教育”向“素质教育”转变,研学旅行作为一种传统而现代的素质教育手段被广泛关注.某校对“是否喜欢参加暑期研学旅行与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢参加暑期研学旅行的人数占男生人数的,女生中喜欢参加暑期研学旅行的人数占女生人数的.若有95%的把握认为是否喜欢参加暑期研学旅行与学生性别有关,则被调查的学生中,男生的人数不可能为( )
A.25 B.45 C.60 D.75
8.(25-26高二下·全国·单元测试)一款短视频手机应用最近在某校学生中流行起来,某校团委对“学生性别和喜欢该手机应用是否有关”做了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该手机应用的人数占男生人数的,女生喜欢该手机应用的人数占女生人数的,若有的把握认为是否喜欢该手机应用和性别有关,则被调查的男生人数至少为( )
0.05
0.01
3.841
6.635
A.12 B.6 C.10 D.18
二、多选题
9.(24-25高二下·山西·期中)可用于推断两个分类变量之间是否有关联的是( )
A.散点图 B.等高堆积条形图
C.列联表 D.独立性检验
10.(25-26高二下·湖南长沙·月考)下列说法正确的是( )
A.样本相关系数r越大,则线性相关性越强
B.用决定系数刻画回归效果,越接近1,说明回归模型的拟合效果越好
C.在回归分析中,残差图中残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
D.在独立性检验中,零假设必须是“分类变量X与Y独立”,不能是“分类变量X与Y有关”
11.(24-25高二下·福建泉州·期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的.女生喜欢抖音的人数占女生人数的,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人
附表:
0.050
0.010
3.841
6.635
附:,
A.40 B.45 C.63 D.70
三、填空题
12.(24-25高二下·新疆乌鲁木齐·期末)下面是一个2×2列联表:
X
Y
合计
10
30
70
80
合计
20
110
附:,其中
则______(保留小数点后3位)
13.(23-24高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是___________.
14.(25-26高二上·全国·单元测试)为落实五育并举,同时增强高中生的综合素质,某校领导计划利用课间时间开展足球社团活动,为了使该活动顺利开展,了解学生是否对足球感兴趣与性别的关系,现从某年级的学生中随机抽取了男、女同学各50名,整理得到下列列联表:
性别
兴趣爱好
感兴趣
不感兴趣
总计
男
50
女
50
总计
80
20
100
使得“有但没有的把握认为男、女同学对足球感兴趣有差异”的的一个值为______.
四、解答题
15.(2025高三·全国·专题练习)随着网络App的普及与发展,刷“抖音”成为了人们日常生活的一部分.某地区随机抽取了部分20~40岁的“抖音”用户,调查他们日均刷“抖音”的时间情况,所得数据统计如下表:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
男性
48
72
女性
24
56
依据小概率值的独立性检验,能否认为日均刷“抖音”时间的长短与性别有关?
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
16.(24-25高二下·西藏林芝·期末)为了推动智慧课堂的普及和应用,市现对全市中小学智慧课堂的应用情况进行抽样调查,统计数据如下表:
经常应用
偶尔应用或者不应用
总计
农村学校
40
城市学校
80
总计
100
160
(1)补全上面的列联表;
(2)依据小概率的独立性检验,能否判断学校所在区域对智慧课堂的应用有影响?
附:,其中.
0.100
0.050
0.005
2.706
3.841
7.879
17.(25-26高二下·安徽合肥·月考)某市环境监测部门为研究该市空气质量与风向的关联,连续记录了该市天的气象与空气质量数据,其中空气质量分为“优良”与“污染”两类,风向分为“西北风”与“东南风”两类,得到如下列联表:
优良
污染
总计
西北风
东南风
总计
(1)能否有的把握认为该市空气质量与风向有关?
(2)已知在污染天气中有的概率伴随重度超标,在优良天气中有的概率伴随重度超标,若从这天中随机抽取天,求该天重度超标的概率.
附:.
18.(25-26高二上·江西宜春·期末)近期,流感病毒阳性率正快速上升,其中99%以上为甲流,流行株以甲型H3N2亚型为主.为考察某新药A预防甲流的效果,随机调查了400名居民进行了个体(单位:例)试验,(其中,患病表示患甲流)得到如下列联表:
(1)完成2×2列联表;
服用新药情况
患病情况
未患病
患病
合计
未服用新药
100
服用新药
70
合计
250
(2)根据小概率值的独立性检验,能否认为新药对预防甲流有效?
(3)若用表中的频率估计概率,流感病毒来临之前,某同学等可能的选择服用和不服用药物A,求该同学患甲流的概率.
附:,.
0.050
0.010
0.001
k
3.841
6.635
10.828
19.(24-25高二下·浙江·期中)乒乓球比赛一般有两种赛制:“5局3胜制”和“7局4胜制”.“5局3胜制”指5局中胜3局的一方取得胜利,“7局4胜制”指7局中胜4局的一方取得胜利.
(1)甲、乙两人进行乒乓球比赛,经统计在某个赛季的所有比赛中,在不同赛制下甲、乙两人的胜负情况如下表.请先将下面的列联表补充完整,然后根据小概率值的独立性检验,分析不同赛制是否对甲获胜的场数有影响.
甲获胜场数
乙获胜场数
5局3胜
8
10
7局4胜
1
合计
20
(2)若甲、乙两人采用5局3胜制比赛,设甲每局比赛的胜率均为,没有平局.记事件为“甲只要取得3局比赛的胜利,比赛结束且甲获胜”,事件为“两人赛满5局,甲至少取得3局比赛胜利且甲获胜”,试证明:.
(3)甲、乙两人进行乒乓球比赛,每局比赛甲的胜率都是,没有平局.若采用“赛满局,胜方至少取得局胜利”的赛制,甲获胜的概率记为.若采用“赛满局,胜方至少取得局胜利”的赛制,甲获胜的概率记为,试比较与的大小.
参考公式:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
1
学科网(北京)股份有限公司
$
第11讲 列联表与独立性检验
知识清单
知识点01:分类变量与列联表
知识点02:独立性检验
题型讲解
(举三反三)
题型1:分类变量与列联表的
题型2:独立性检验的概念及辨折
题型3:卡方的计算
题型4:独立性检验的基本思想
题型5:独立性检验解决实际问题
强化训练
一、单选题(8)
二、多选题(3)
三、填空题(3)
四、解答题(5)
知识点1.分类变量与列联表
一、分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
二、2×2列联表
1.2×2列联表给出了成对分类变量数据的交叉分类频数.
2.定义一对分类变量X和Y,我们整理数据如下表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
像这种形式的数据统计表称为2×2列联表.
知识点2.独立性检验
1.定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.
2.χ2=,其中n=a+b+c+d.
3.独立性检验解决实际问题的主要环节
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
思考 独立性检验与反证法的思想类似,那么独立性检验是反证法吗?
答案 不是.因为反证法不会出错,而独立性检验依据的是小概率事件几乎不发生.
题型1:分类变量与列联表的
【例1-1】(24-25高二下·山西·期末)在统计中,研究两个分类变量之间的关联性时常用的图是( )
A.散点图 B.残差图 C.频率分布直方图 D.等高堆积条形图
【答案】D
【分析】根据统计图的适用对象即可求解.
【详解】在统计中,研究两个分类变量之间的关联性时常用的图是等高堆积条形图,
散点图是研究两个变量之间相关关系时用,残差是研究拟合效果时用到的,频率分布直方图是研究频率分布时用到的,
故选:D
【例1-2】(24-25高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
【答案】74
【分析】根据联表性质计算求解.
【详解】由题意知,所以.
故答案为:.
【例1-3】(25-26高二下·全国)某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.
(1)根据以上数据,作出考前心情与性格的列联表,并求性格外向的学生中考前心情紧张的概率.
(2)作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.
【答案】(1)答案见解析,
(2)答案见解析,有关
【分析】(1)古典概型即可求解;
(2)由图即可求解.
【详解】(1)作列联表如下:
心情
性格
合计
性格内向
性格外向
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1020
由列联表中数据可得,性格外向的学生中考前心情紧张的概率为
(2)相应的等高条形图如图所示.
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数所占的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.
【变式1-1】(24-25高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【答案】A
【分析】分析等高堆积条形图可直接得到答案.
【详解】原图是学校高二1、2班本期中期考试数学成绩优秀率的等高堆积条形图,
从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,BC错误;
两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误;
故选:A.
【变式1-2】(24-25高二下·广西钦州·期末)如下是一个列联表,则________.
yx
总计
总计
【答案】
【分析】根据列联表的概念,可得答案.
【详解】由题意可得,则,可得,所以.
故答案为:.
【变式1-3】(2024高二下·全国·专题练习)为考察某种药物预防疾病的效果,进行动物试验,得到2×2列联表如表所示.
患病
未患病
合计
服用药
10
45
55
没有服用药
20
30
50
合计
30
75
105
试用等高堆积条形图判断服用药与患病之间是否有关联.
【答案】有关联.
【分析】作出相应的等高堆积条形图,从图形分析出判断服用药与患病之间是否有关联.
【详解】相应的等高堆积条形图如图所示.
从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为服用药与患病之间有关联.
题型2:独立性检验的概念及辨折
【例2-1】(25-26高二下·黑龙江大庆·期中)独立性检验中,若小于临界值,则下列结论正确的是( )
A.两个变量一定相互独立 B.两个变量一定不独立
C.没有充分证据表明两个变量有关 D.两个变量有关联的可能性为
【答案】C
【分析】根据独立性检验的基本逻辑即可求解.
【详解】对于A,小于临界值,并不意味着“一定相互独立”,只是无足够证据反对独立,故A错误;
对于B,小于临界值,并不意味着“一定不独立”,只是无足够证据反对独立,故B错误;
对于C,这是独立性检验的基本逻辑:当时,无充分证据支持变量相关,即不能认为有关联,故C正确;
对于D,对应的把握认为两个变量有关联,而实际上,故D错误.
【例2-2】(25-26高二上·全国·单元测试)给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
【答案】B
【分析】根据独立性检验是对两个分类变量是否有关进行检验,逐个分析判断即可.
【详解】独立性检验主要是对两个分类变量是否有关进行检验,
对于A,喜欢参加体育锻炼有喜欢和不喜欢,性别有男和女,是对两个分类变量是否进行检验,
对于B,一个未被识别的甲骨文文字一年内被识别出来,只涉及一个变量,不可以用独立性检验解决,
对于C,购买食品有看生产日期和不看生产日期,性别有男和女,是对两个分类变量是否进行检验,
对于D,看新闻时政有喜欢和不喜欢,年龄有大有小,是对两个分类变量是否进行检验.
故不可以用独立性检验解决的问题是B.
故选:B.
【例2-3】有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?
【答案】答案见解析
【详解】观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.
【变式2-1】(24-25高二下·辽宁·期末)为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则( )
性别
羽毛球
喜欢
不喜欢
女生
男生
50
100
附:,其中.
A.4 B.2 C.1 D.
【答案】D
【分析】结合,只需,即可求得答案.
【详解】要使是否喜欢羽毛球运动与性别无关的可能性最大,则,所以,
所以.
故选:D
【变式2-2】(24-25高二下·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
【答案】A
【分析】根据卡方独立性检验规则,比较与临界值即可得出结论.
【详解】因为,所以牛的毛色与角无关.
故选:A.
【变式2-3】根据的值,如何查表确定有多大的把握判断两个分类变量有关系?
【答案】答案见解析
【详解】
0.10
0.05
0.010
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
表中第一行数据表示常用的小概率值α,第二行表示小概率值α对应的临界值k,所以如果根据样本数据算出的值后,发现成立,则我们有的把握认为这两个分类变量有关系,这一判断出错的概率不超过.例如,我们有99.9%的把握认为这两个分类变量有关系,该判断出错的概率不超过0.1%.
题型3:卡方的计算
【例3-1】(25-26高二上·全国·单元测试)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线上有自东向西依次编号为1,2,…,21的21个车站.为调查编号为10和11两个站点的乘客对调图的满意度是否有差异,在这两个站点多次乘坐列车的旅客中,随机抽取100名旅客,并得出如下列联表,则的值约为( )
车站编号
满意度
满意
不满意
总计
10
28
12
40
11
57
3
60
总计
85
15
100
A.6.923 B.7.851 C.10.635 D.11.765
【答案】D
【分析】由卡方计算公式计算即可求解.
【详解】.
故选:D.
【例3-2】(25-26高二下·内蒙古呼和浩特·月考)某校调查学生参加体育锻炼与性别的关系,得到如下列联表(单位:人):
经常锻炼
不经常锻炼
合计
男生
35
55
90
女生
65
45
110
合计
100
100
200
参照公式(其中),计算得______.(保留两位小数)
【答案】
【详解】根据题意有:.
【例3-3】(24-25高二下·吉林长春·期末)某高校为了了解大学生对篮球运动的喜好是否与性别有关联,随机在该校调查了100名大学生,得到的数据如表所示:
性别
篮球运动
合计
喜欢
不喜欢
男
40
10
50
女
25
25
50
合计
65
35
100
(1)求该校喜欢篮球运动的大学生中性别为男的频率;
(2)根据小概率值的独立性检验,能否认为该校大学生是否喜欢篮球运动与性别有关联?
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1);
(2)答案见解析.
【分析】(1)由古典概型概率公式计算;
(2)计算出,与临界值比较可得.
【详解】(1)由题意所求频率为
(2),
根据小概率值的独立性检验,有的把握认为该校大学生是否喜欢篮球运动与性别有关联.
【变式3-1】(25-26高二上·黑龙江齐齐哈尔·期末)某校对“学生性别和喜欢刷视频是否有关”作了一次调查,得到如下列联表:
不喜欢刷视频
喜欢刷视频
总计
男生
女生
总计
若通过计算,可得根据小概率值的独立性检验,认为学生是否喜欢刷视频与性别有关联,则正整数的最小值为( )
附:,.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A.80 B.100 C.120 D.150
【答案】B
【分析】完成列联表,计算,即可求出正整数的最小值.
【详解】完成列联表如下:
不喜欢刷视频
喜欢刷视频
总计
男生
女生
总计
则,解得.
又为正整数,且是5的倍数,可得的最小值为100.
故选:B.
【变式3-2】(24-25高二下·广东·月考)小明为了了解不同性别的观众对蛇年春晚小品类节目的喜欢情况,随机选取了200名观看蛇年春晚的观众,得到如下列联表:
喜欢
不喜欢
合计
男性
45
45
90
女性
110
合计
80
200
根据小概率值的独立性检验,其中________,(精确到小数点后3位)可以判断出性别因素与喜欢有关联.
附:,.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【答案】6.818
【分析】先根据列联表中的合计信息求出缺失的数据,再代入统计量的公式进行计算.
【详解】已知合计人数为200,不喜欢的人数合计为80,那么喜欢的人数合计.
因为男性喜欢的人数是45,喜欢的人数合计是120,所以女性喜欢的人数为.
又因为女性合计人数为110,所以.此时完整的列联表为:
喜欢
不喜欢
合计
男性
45
45
90
女性
75
35
110
合计
120
80
200
在中,(这里),(男性喜欢的人数),(男性不喜欢的人数),(女性喜欢的人数),(女性不喜欢的人数).
将这些值代入公式可得: .
故答案为:6.818.
【变式3-3】(24-25高二下·甘肃白银·期末)研究者发现多看电视易使人变冷漠,下表数据(单位:人)是一个调查机构在某社区对此现象的调查结果:
冷漠
不冷漠
合计
多看电视
70
30
100
少看电视
20
60
80
合计
90
90
180
(1)试问能否有99.9%的把握认为多看电视与人变冷漠有关系?
(2)若从被调查的多看电视的100人中任选2人,求这2人中至少有1人不冷漠的概率.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有99.9%的把握认为多看电视与人变冷漠有关系
(2)
【分析】(1)计算卡方判断;
(2)利用古典概型计算.
【详解】(1)提出统计假设:多看电视与人变冷漠没有关系.
根据列联表中的数据,可以求得.
因为,
所以有99.9%的把握认为可以推断假设不成立,
即有99.9%的把握认为多看电视与人变冷漠有关系.
(2)这2人中至少有1人不冷漠的概率为.
题型4:独立性检验的基本思想
【例4-1】(24-25高二下·甘肃白银·期末)假设有两个分类变量X,Y,它们的可能取值分别为和,其列联表为
合计
合计
以下各组数据中,对于同一样本能说明与有关系的可能性最大的一组为( )
A. B.
C. D.
【答案】C
【分析】计算各选项中的值,比较大小,即可得答案.
【详解】计算各选项中的值,值越大,说明相应的两个分类变量有关系的可能性越大;
对于A,,
对于B,,
对于C,,
对于D,,
由于,
故选:C
【例4-2】(24-25高二下·全国·课后作业)若两个分类变量与的列联表为:
合计
10
15
25
40
16
56
合计
50
31
81
则“与之间有关系”这个结论出错的概率为______.
【答案】0.01
【分析】根据列联表,代入计算公式,得结论.
【详解】由列联表数据,可求得
,
所以“与之间有关系”出错的概率为0.01.
故答案为:0.01
【例4-3】(2025高二·全国·专题练习)随机询问80名不同职业的人在购买食品时是否看营养说明,得到如下调查结果:
职业
买食品时是否看营养说明
合计
不看营养说明
看营养说明
从事与医疗相关行业
12
28
40
从事与医疗无关行业
18
22
40
合计
30
50
80
依据小概率的独立性检验,能否推断两个群体在购买食品时是否看营养说明存在差异?
参考公式:
独立性检验中常用小概率值和相应临界值:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】不能推断两个群体在购买食品时是否看营养说明存在差异
【分析】代入公式计算的值,结合临界值判断即可.
【详解】由题意,零假设为:职业与看营养说明相互独立,即两个群体在购买食品时是否看营养说明无差异,
根据表中数据,计算得到,
根据小概率值的独立性检验,没有充分证据推断不成立,
∴可以认为成立,
即不能认为两个群体在购买食品时是否看营养说明有差异.
【变式4-1】(24-25高二下·全国·单元测试)想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( )
A.提出统计假设:男性喜欢参加体育活动
B.提出统计假设:女性不喜欢参加体育活动
C.提出统计假设:喜欢参加体育活动与性别有关
D.提出统计假设:喜欢参加体育活动与性别无关
【答案】D
【分析】根据独立性检验的思想分析判断.
【详解】独立性检验是一种假设性检验,假设有反证法的意味,应假设两类变量无关,在该假设下构造的随机变量应该很小,如果很小,则不能肯定或否定假设,反之,则在一定程度上说明假设不合理,即认为两个变量在一定程度上有关,
所以想要检验是否喜欢参加体育活动是不是与性别有关,应该检验
提出统计假设:喜欢参加体育活动与性别无关,
故选:D
【变式4-2】(25-26高二下·全国·单元测试)若两个分类变量和的列联表为:
合计
5
15
20
40
10
50
合计
45
25
70
则有________的把握认为与之间有关系.
附:
【答案】/
【分析】根据列联表,求得观测值,对照临界值表即可解答.
【详解】零假设为:与独立,
由题可知,.
因为,
所以有的把握认为与之间有关系.
故答案为:.
【变式4-3】为了研究学生的性别与是否喜欢运动的关联性,随机调查了某中学的100名学生,整理得到如下表格:
男学生
女学生
合计
喜欢运动
40
20
60
不喜欢运动
20
20
40
合计
60
40
100
(1)依据的独立性检验,能否认为学生的性别与是否喜欢运动有关联?
(2)按学生的性别以及是否喜欢运动用分层随机抽样的方法从这100名学生中选取10人,再从这10人中任选2人,喜欢运动的男学生被选中的人数为,求的分布列与期望.
附:,其中.
0.1
0.05
0.01
2.706
3.841
6.635
【答案】(1)认为学生的性别与是否喜欢运动有关联
(2)分布列见解析;期望为
【分析】(1)首先假设,再计算,并和参考数据比较,即可作出判断;
(2)利用超几何分布求解分布列,再计算期望.
【详解】(1)假设零事件认为学生的性别与是否喜欢运动无关联,
,
所以根据的独立性检验,认为不成立,即认为学生的性别与是否喜欢运动有关联;
(2)喜欢运动的男生有人,其他有6人,
由题意可知,,
,,,
所以的分布列为:
0
1
2
.
题型5:独立性检验解决实际问题
【例5-1】(25-26高二下·全国·单元测试)根据下面的列联表判断患肝病与嗜酒有关系的把握有( )
肝病
酒性
合计
嗜酒
不嗜酒
患肝病
7775
42
7817
未患肝病
2099
49
2148
合计
9874
91
9965
A. B. C. D.
【答案】D
【分析】由列联表中的数据,求得,即可得到答案.
【详解】由列联表中的数据,计算得,
故有的把握认为患肝病与嗜酒有关系.
故选:D.
【例5-2】(25-26高二下·全国·单元测试)在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算,根据这一数据分析,有________的把握认为打鼾与患心脏病是________(填“有关”或“无关”)的.
【答案】 有关
【分析】根据题意,结合独立性检验的数据,即可得到答案.
【详解】由题意知,经过计算,可得,
所以有的把握认为打鼾与患心脏病是有关的.
故答案为:;有关.
【例5-3】(25-26高二下·内蒙古呼和浩特·月考)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解20-30岁年轻人的体质健康是否与性别有关,在4月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到如列联表.
性别
健康状况
感冒
不感冒
男
8
14
女
4
24
(1)在上述感冒的年轻人中按照性别采用分层抽样的方法抽取6人,再从这6人中随机选取3人访谈,记参与访谈的男性人数为,求的分布和期望;
(2)依上表,在犯错误的概率不超过0.05的前提下,20-30岁年轻人的体质健康与性别是否有关?
参考数据:参考公式:,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)分布列见解析,
(2)答案见解析
【分析】(1)利用分层抽样的方法抽取人,则抽取男性人,女性人,随机变量的所有取值为,2,,求出对应概率,即可列出分布列,求出期望;
(2)根据列联表中的数据,经计算得到,再和参考数据表中对应的数据比较,即可得到结论.
【详解】(1)解:在上述感冒的年轻人中按照性别采用分层抽样的方法抽取人,再从这人中随机选取人访谈,记参与访谈的男性人数为,样本中感冒的男性有人,女性有人,比例为,按照性别采用分层抽样的方法抽取人,则抽取男性人,女性人,随机变量的所有取值为,2,,
,
,
,
所以的分布列为:
所以.
(2)解:提出零假设:岁年轻人的体质健康与性别无关,
根据列联表中的数据,得到,
因为,不能拒绝零假设,
所以没有的把握认为岁年轻人的体质健康与性别有关.
【变式5-1】(24-25高二下·福建厦门·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
【答案】A
【分析】设总人数为,根据给定条件,求出的观测值并建立不等式,进而求出的最小整数值得解.
【详解】设总人数为,则男生选学生物学的人数为,女生选学生物学的人数为,
则列联表为:
男生
女生
合计
选生物学
不选生物学
合计
m
m
2m
因此,
即,又为的倍数,所以男生最少有人.
故选:A
【变式5-2】(25-26高二上·全国·单元测试)随着冬天的临近,哈尔滨这座冰雪之城将再次成为旅游的热门目的地.为更好地提升旅游品质,该市文旅局随机选择100名青年游客对哈尔滨出行体验进行满意度评分(满分100分),80分及以上为良好等级,根据评分,制成如图所示的频率分布直方图.为进一步了解不同年龄段游客对哈尔滨出行体验的反馈,该市文旅局再次随机选择100名中老年游客进行满意度评分,发现两次调查中评分为良好等级的人数为120,则中老年游客评分等级良好的有________人.根据独立性检验,游客的评分等级是否良好与年龄段(青年或中老年)________(填“有关”或“无关”).
【答案】 50 有关
【分析】由频率分布直方图求得值,然后写出列联表,计算出后与临界值比较可得.
【详解】由频率分布直方图可知,,解得,
则青年游客评分等级良好的有(人),所以中老年游客评分等级良好的有(人).由上可得如下列联表,
评分等级是否良好
年龄段
青年游客
中老年游客
总计
评分等级良好
70
50
120
评分等级非良好
30
50
80
总计
100
100
200
可得,则认为游客的评分等级是否良好与年龄段有关.
故答案为:50;有关.
【变式5-3】(25-26高二下·内蒙古呼和浩特·月考)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解20-30岁年轻人的体质健康是否与性别有关,在4月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到如列联表.
性别
健康状况
感冒
不感冒
男
8
14
女
4
24
(1)在上述感冒的年轻人中按照性别采用分层抽样的方法抽取6人,再从这6人中随机选取3人访谈,记参与访谈的男性人数为,求的分布和期望;
(2)依上表,在犯错误的概率不超过0.05的前提下,20-30岁年轻人的体质健康与性别是否有关?
参考数据:参考公式:,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)分布列见解析,
(2)答案见解析
【分析】(1)利用分层抽样的方法抽取人,则抽取男性人,女性人,随机变量的所有取值为,2,,求出对应概率,即可列出分布列,求出期望;
(2)根据列联表中的数据,经计算得到,再和参考数据表中对应的数据比较,即可得到结论.
【详解】(1)解:在上述感冒的年轻人中按照性别采用分层抽样的方法抽取人,再从这人中随机选取人访谈,记参与访谈的男性人数为,样本中感冒的男性有人,女性有人,比例为,按照性别采用分层抽样的方法抽取人,则抽取男性人,女性人,随机变量的所有取值为,2,,
,
,
,
所以的分布列为:
所以.
(2)解:提出零假设:岁年轻人的体质健康与性别无关,
根据列联表中的数据,得到,
因为,不能拒绝零假设,
所以没有的把握认为岁年轻人的体质健康与性别有关.
一、单选题
1.(25-26高二上·全国·单元测试)为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,得到的结论是有99%的把握认为性别与喜欢乡村音乐有关系,则的值可以为( )
A.2.853 B.3.841 C.6.758 D.6.451
【答案】C
【分析】由题意,对比选项即可得解.
【详解】有的把握认为性别与喜欢乡村音乐有关系,则.
故选:C.
2.(24-25高二下·河南信阳·期末)调查某医院一段时间内婴儿出生的时间(白天与晚上)和性别(男与女)的关联性,对样本数据分析统计,计算得到,依据小概率值的独立性检验,下列说法正确的是( )(附:)
A.婴儿90%在白天出生
B.婴儿性别与出生时间无关联
C.有0.1的把握认为婴儿性别与出生时间有关联
D.婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1
【答案】D
【分析】求出并与比较即可求解.
【详解】因为,
依据小概率值的独立性检验,
所以婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1.
故选:D.
3.(2023高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
【答案】D
【分析】已知抽取的老年人、年轻人各有25名,计算各个变量的值,进而得到答案.
【详解】因为,,
,,,,
所以,,,,.
故选:D.
4.(2025高二·全国·专题练习)在性别与吃零食这两个分类变量的计算中,下列说法正确的是( )
①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误.
A.①② B.①③ C.②③ D.③
【答案】D
【分析】由独立性检验相关概念可得答案.
【详解】①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性,故①不正确;
②独立性检验是用来考察两个分类变量是否具有关联性,并且能较精确地给出这种判断的可靠程度,
而不是给出事件的概率,故②不正确;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误,③正确。
故选:D
5.(25-26高二上·全国·单元测试)某校团委对“喜欢吃水果和学生性别是否有关”进行了一次调查,其中被调查的女生人数是男生人数的,男生喜欢吃水果的人数占被调查的男生人数的,女生喜欢吃水果的人数占被调查的女生人数的,若有的把握认为喜欢吃水果和学生性别有关,则被调查的男生至少有( )(参考数据:)
A.30人 B.24人 C.18人 D.12人
【答案】C
【分析】设被调查的男生人数为,根据题意可得列联表,由卡方的计算公式以及独立性检验的原理可得,运算求解即可.
【详解】设被调查的男生人数为,则被调查的女生人数为,得到列联表如下:
学生性别
喜欢吃水果情况
喜欢
不喜欢
总计
男生
女生
总计
则,解得,
又因为男、女生人数均为整数,所以被调查的男生至少有18人.
故选:C
6.针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若我们推断不成立,此推断犯错误率不超过,则的最小值为( )
附:,附表:
0.05
0.01
3.841
6.635
A.7 B.8 C.9 D.10
【答案】C
【分析】根据题意可得列联表,由已知数据计算,根据独立性检验的结论,列不等式求的取值范围,得最小值.
【详解】根据题意,不妨设男生中喜欢短视频的人数为人,男生中不喜欢短视频的人数为人,女生中喜欢短视频的人数为人,女生中不喜欢短视频的人数为人.
所以可得列联表如下:
喜欢短视频人数
不喜欢短视频人数
合计
男生人数
女生人数
合计
于是,
由于推断不成立,此推断犯错误率不超过,
所以依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,且,于是最小值为.
故选:C
7.(25-26高二上·安徽淮北·期末)读万卷书,行万里路.随着我国教育模式由“应试教育”向“素质教育”转变,研学旅行作为一种传统而现代的素质教育手段被广泛关注.某校对“是否喜欢参加暑期研学旅行与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢参加暑期研学旅行的人数占男生人数的,女生中喜欢参加暑期研学旅行的人数占女生人数的.若有95%的把握认为是否喜欢参加暑期研学旅行与学生性别有关,则被调查的学生中,男生的人数不可能为( )
A.25 B.45 C.60 D.75
【答案】A
【分析】根据条件设男生人数为,再根据条件列出列联表,计算,解不等式.
【详解】依题意,设男生的人数为,可列出2×2列联表如下所示:
是否喜欢参加暑期研学旅行
性别
总计
男生
女生
喜欢
不喜欢
总计
则=.
由题意知,即,得,所以.
又,所以结合选项知B,C,D项都可以.
8.(25-26高二下·全国·单元测试)一款短视频手机应用最近在某校学生中流行起来,某校团委对“学生性别和喜欢该手机应用是否有关”做了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该手机应用的人数占男生人数的,女生喜欢该手机应用的人数占女生人数的,若有的把握认为是否喜欢该手机应用和性别有关,则被调查的男生人数至少为( )
0.05
0.01
3.841
6.635
A.12 B.6 C.10 D.18
【答案】A
【分析】设被调查的男生人数为,则女生人数为,根据题意得到列联表,由计算公式,及独立性检验思想,得到关于的不等式,求解可得.
【详解】设被调查的男生人数为,则女生人数为,可得列联表如下:
喜欢
不喜欢
合计
男生
女生
合计
由公式算得,因为有的把握认为是否喜欢该手机应用和性别有关,所以,
则.而都是整数,所以的值至少为12.
故选:A.
二、多选题
9.(24-25高二下·山西·期中)可用于推断两个分类变量之间是否有关联的是( )
A.散点图 B.等高堆积条形图
C.列联表 D.独立性检验
【答案】BCD
【分析】根据散点图,等高堆积条形图,列联表和独立性检验的概念,即可得到答案.
【详解】散点图适用于推断两个定量变量之间是否有相关关系,
其中等高堆积条形图,列联表,独立性检验适用于推断两个分类变量之间是否有关联.
故选:BCD.
10.(25-26高二下·湖南长沙·月考)下列说法正确的是( )
A.样本相关系数r越大,则线性相关性越强
B.用决定系数刻画回归效果,越接近1,说明回归模型的拟合效果越好
C.在回归分析中,残差图中残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
D.在独立性检验中,零假设必须是“分类变量X与Y独立”,不能是“分类变量X与Y有关”
【答案】BCD
【详解】对于A,两个变量的样本相关系数为r,则越大,线性相关程度越强,故A错误;
对于B,决定系数越接近1,值越大,残差平方和越接近0,值越小,则该回归模型的拟合效果越好,故B正确;
对于C,因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,模型的拟合效果越好,故C正确;
对于D,在独立性检验中,将“分类变量X与Y独立”作为零假设,是因为在此假设下可以计算出期望频数,从而构造检验统计量进行检验,故D正确.
11.(24-25高二下·福建泉州·期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的.女生喜欢抖音的人数占女生人数的,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )人
附表:
0.050
0.010
3.841
6.635
附:,
A.40 B.45 C.63 D.70
【答案】BD
【分析】根据题意结合卡方分布的计算公式得到方程进而求解出,从而得到结果.
【详解】设男生人数为n,则男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,所以,,
由题意知,,且n是5的整数倍.
故选:BD.
三、填空题
12.(24-25高二下·新疆乌鲁木齐·期末)下面是一个2×2列联表:
X
Y
合计
10
30
70
80
合计
20
110
附:,其中
则______(保留小数点后3位)
【答案】
【分析】根据题意完成列联表,再代入计算并取近似值即得.
【详解】先完成2×2列联表如下:
X
Y
合计
10
20
30
10
70
80
合计
20
90
110
则.
故答案为:.
13.(23-24高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是___________.
【答案】乙
【分析】根据选项中的图形,即可直接求解.
【详解】等高条形图中有两个高度相同的矩形,每个矩形都有两个颜色,观察下方颜色区域的高度,如果高度差越大,则两个分类变量关系越强,观察四个选项可知,B选项中带颜色区域的高度差最大,两个分类变量、相关关系最强;
故答案为:乙
14.(25-26高二上·全国·单元测试)为落实五育并举,同时增强高中生的综合素质,某校领导计划利用课间时间开展足球社团活动,为了使该活动顺利开展,了解学生是否对足球感兴趣与性别的关系,现从某年级的学生中随机抽取了男、女同学各50名,整理得到下列列联表:
性别
兴趣爱好
感兴趣
不感兴趣
总计
男
50
女
50
总计
80
20
100
使得“有但没有的把握认为男、女同学对足球感兴趣有差异”的的一个值为______.
【答案】35(或36或44或45,答案不唯一)
【分析】由独立性检验公式可得,据此可得答案.
【详解】易知,依题意可知,
解得或,
又,,,
则,.
得或,故的可能取值为35,36,44,45.
故答案为:35(或36或44或45,答案不唯一)
四、解答题
15.(2025高三·全国·专题练习)随着网络App的普及与发展,刷“抖音”成为了人们日常生活的一部分.某地区随机抽取了部分20~40岁的“抖音”用户,调查他们日均刷“抖音”的时间情况,所得数据统计如下表:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
男性
48
72
女性
24
56
依据小概率值的独立性检验,能否认为日均刷“抖音”时间的长短与性别有关?
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】日均刷“抖音”时间的长短与性别无关
【分析】由题意可得列联表,再计算,对比临界值表即可得解
【详解】由题意,列联表如下:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
合计
男性
48
72
120
女性
24
56
80
合计
72
128
200
零假设为:日均刷“抖音”时间的长短与性别无关,
则,
故依据小概率值的独立性检验,我们推断零假设成立,
即日均刷“抖音”时间的长短与性别无关.
16.(24-25高二下·西藏林芝·期末)为了推动智慧课堂的普及和应用,市现对全市中小学智慧课堂的应用情况进行抽样调查,统计数据如下表:
经常应用
偶尔应用或者不应用
总计
农村学校
40
城市学校
80
总计
100
160
(1)补全上面的列联表;
(2)依据小概率的独立性检验,能否判断学校所在区域对智慧课堂的应用有影响?
附:,其中.
0.100
0.050
0.005
2.706
3.841
7.879
【答案】(1)答案见解析
(2)学校所在区域对智慧课堂的应用有影响.
【分析】(1)根据表格数据直接计算即可;
(2)利用卡方公式计算出卡方值,再对比表格数据即可.
【详解】(1)补全的列联表如下:
经常应用
偶尔应用或者不应用
总计
农村学校
40
40
80
城市学校
60
20
80
总计
100
60
160
(2)零假设:学校所在区域对智慧课堂的应用无影响.
根据列联表中的数据,经计算得到
根据小概率的独立性检验,我们推断不成立,因此能判断学校所在区域对智慧课堂的应用有影响.
17.(25-26高二下·安徽合肥·月考)某市环境监测部门为研究该市空气质量与风向的关联,连续记录了该市天的气象与空气质量数据,其中空气质量分为“优良”与“污染”两类,风向分为“西北风”与“东南风”两类,得到如下列联表:
优良
污染
总计
西北风
东南风
总计
(1)能否有的把握认为该市空气质量与风向有关?
(2)已知在污染天气中有的概率伴随重度超标,在优良天气中有的概率伴随重度超标,若从这天中随机抽取天,求该天重度超标的概率.
附:.
【答案】(1)有的把握认为该市空气质量与风向有关
(2)
【详解】(1)根据表中数据得,
所以有的把握认为该市空气质量与风向有关.
(2)从这天中随机抽取天,记该天空气优良为事件,
则该天空气污染为,该天重度超标为事件.
由已知得,,,,
所以.
18.(25-26高二上·江西宜春·期末)近期,流感病毒阳性率正快速上升,其中99%以上为甲流,流行株以甲型H3N2亚型为主.为考察某新药A预防甲流的效果,随机调查了400名居民进行了个体(单位:例)试验,(其中,患病表示患甲流)得到如下列联表:
(1)完成2×2列联表;
服用新药情况
患病情况
未患病
患病
合计
未服用新药
100
服用新药
70
合计
250
(2)根据小概率值的独立性检验,能否认为新药对预防甲流有效?
(3)若用表中的频率估计概率,流感病毒来临之前,某同学等可能的选择服用和不服用药物A,求该同学患甲流的概率.
附:,.
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)表格见解析
(2)能认为药物A对预防甲流有效.
(3).
【分析】(1)根据表格的数据进行加减计算即可.
(2)根据公式计算,然后根据独立性检验判断即可.
(3)根据全概率公式计算即可.
【详解】(1)由题意可得列联表,
服用新药情况
患病情况
未患病
患病
合计
未服用新药
100
80
180
服用新药
150
70
220
合计
250
150
400
(2)提出假设:药物A对预防甲流无效,
由列联表得到,
根据小概率值的独立性检验,推断不成立,
即认为药物A对预防甲流有效,该推断犯错误的概率不超过0.01,
所以根据小概率值的独立性检验,能认为药物A对预防甲流有效.
(3)用频率估计概率得未服用药物A的个体患甲流的概率的估计值为;
服用药物A的个体患甲流的概率的估计值为;
设事件B表示“该同学服用新药A”,事件C表示“该同学患甲流”
所以.所以该同学患甲流的概率为.
19.(24-25高二下·浙江·期中)乒乓球比赛一般有两种赛制:“5局3胜制”和“7局4胜制”.“5局3胜制”指5局中胜3局的一方取得胜利,“7局4胜制”指7局中胜4局的一方取得胜利.
(1)甲、乙两人进行乒乓球比赛,经统计在某个赛季的所有比赛中,在不同赛制下甲、乙两人的胜负情况如下表.请先将下面的列联表补充完整,然后根据小概率值的独立性检验,分析不同赛制是否对甲获胜的场数有影响.
甲获胜场数
乙获胜场数
5局3胜
8
10
7局4胜
1
合计
20
(2)若甲、乙两人采用5局3胜制比赛,设甲每局比赛的胜率均为,没有平局.记事件为“甲只要取得3局比赛的胜利,比赛结束且甲获胜”,事件为“两人赛满5局,甲至少取得3局比赛胜利且甲获胜”,试证明:.
(3)甲、乙两人进行乒乓球比赛,每局比赛甲的胜率都是,没有平局.若采用“赛满局,胜方至少取得局胜利”的赛制,甲获胜的概率记为.若采用“赛满局,胜方至少取得局胜利”的赛制,甲获胜的概率记为,试比较与的大小.
参考公式:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)表格见解析,赛制对甲获胜的场数没有影响.
(2)证明见解析
(3)
【分析】(1)根据题设,列出列联表,利用公式,求得,结合附表,即可得到结论;
(2)根据独立重复试验的概率公式,得到和,化简运算,即可证得;
(3)记事件为“第一阶段甲获胜”,事件为“第一阶段乙获胜,且甲恰好胜了局”,事件为“赛满局甲获胜”,根据,结合独立重复试验的概率计算公式,求得与,作差比较,即可得到答案.
【详解】(1)解:零假设为:赛制与甲获胜场数独立,即两者无关联.
由题设,赛制与甲获胜情况列联表如下:
甲获胜场数
乙获胜场数
5局3胜
8
2
10
7局4胜
9
1
10
合计
17
3
20
可得.
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即赛制对甲获胜的场数没有影响.
(2)解:由事件为“甲只要取得3局比赛的胜利,比赛结束且甲获胜”, 事件为“两人赛满5局,甲至少取得3局比赛胜利且甲获胜”且甲每局比赛的胜率均为,没有平局,
可得,
,
综上可得:.
(3)解:考虑赛满局的情况,以赛完局为第一阶段,第二阶段为最后2局,
记事件为“第一阶段甲获胜”,事件为“第一阶段乙获胜,且甲恰好胜了局”,
事件为“赛满局甲获胜”,
则,
因为,,
所以,
则
,
由,所以,所以.
1
学科网(北京)股份有限公司
$