8.3 列联表与独立性检验【4大题型】讲义-2025-2026学年高二下学期数学人教A版选择性必修第三册
2026-04-29
|
2份
|
54页
|
412人阅读
|
12人下载
普通
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 8.3 列联表与独立性检验 |
| 类型 | 教案-讲义 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 1.62 MB |
| 发布时间 | 2026-04-29 |
| 更新时间 | 2026-04-29 |
| 作者 | 热爱数学者 |
| 品牌系列 | - |
| 审核时间 | 2026-04-29 |
| 下载链接 | https://m.zxxk.com/soft/57624465.html |
| 价格 | 1.50储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
8.3 列联表与独立性检验
题型预览
题型一 列联表的完善与分析
题型二 独立性检验的概念及辨析
题型三 卡方的计算
题型四 独立性检验解决实际问题
知识清单
数值变量与分类变量
数值变量:数值变量的取值为实数,其大小和运算都有实际含义.
分类变量:这里所说的变量和值不一定是具体的数值,例如,性别变量,其取值为男和女两种.我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
【注意】分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的
列联表
定义一对分类变量X和Y,我们整理数据如表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
上表是关于分类变量X和Y的抽样数据的2×2列联表,最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数n是样本空间中样本点的总数.
独立性检验的理解
(1)零假设:设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互为对立事件,故要判断事件{X=1}和{Y=1}之间是否有关联,需要判断假定关系H0:P(Y=1|X=0)=P(Y=1|X=1)是否成立.
(2)独立性检验的公式
χ2=,其中n=a+b+c+d,用随机变量χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.
(3)临界值:对任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)=α.称xα为α的临界值.临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大.
(4)基于小概率值α的检验规则:当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,没有充分证据推断H0不成立,可以认为X和Y独立.利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
(5)χ2独立性检验中几个常用的小概率值和相应的临界值.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【注意】χ2越小,独立性越强,相关性越弱;χ2越大,独立性越弱,相关性越强
题型突破
题型一 列联表的完善与分析
1.(25-26高二下·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
【答案】8
【分析】根据列联表的性质,求出a,b,d的值,即可得答案.
【详解】由列联表的性质,可得:,可得,
所以.
故答案为:8
2.(24-25高二下·全国·课后作业)下表是、两班关于选择“物理”作为“加三学科”的意愿的列联表,请根据已有数据完善表格.
单位:人
类别
愿意选择“物理”
不愿意选择“物理”
总计
班
20
42
班
16
总计
44
【答案】
【分析】根据已知条件补全联表即可.
【详解】根据已知条件得出,
又因为,所以,所以,
所以.
所以.
3.(24-25高二下·河南·月考)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【分析】根据题意,得到如下两个列联表,再一一分析即可.
【详解】根据题意,得到如下两个列联表.
35岁以上
35岁及以下
总计
男性
女性
总计
35岁以上
35岁及以下
总计
男性
女性
总计
根据第1个列联表可知,样本中男性市民人数为,
女性市民人数为,又,即样本中男性比女性多,故A正确;
根据第2个列联表可知,样本中35岁以上女性市民人数为,
35岁及以下女性市民人数为,又,即样本中多数女性是35岁以上,故B正确;
由题意,,所以,故C不正确;
根据第2个列联表可知,样本中35岁以上市民人数为,
35岁及以下市民人数为,又,
即样本中35岁以上的市民比35岁及以下的多,故D正确.
故选:C.
4.(25-26高二下·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
【答案】
【分析】根据古典概型概率公式和条件概率公式进行计算即可.
【详解】;
;
;
故答案为:;;;.
5.(24-25高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
【答案】74
【分析】根据联表性质计算求解.
【详解】由题意知,所以.
故答案为:.
题型二 独立性检验的概念及辨析
6.(25-26高二下·江西萍乡·期中)某医疗研究机构为检验某种新研发的药物对特定疾病治疗是否有效,随机选取了200名患者进行双盲实验.其中100人服用新药,100人服用旧药,统计结果如下表
治愈
未治愈
合计
服用新药
67
33
100
服用旧药
48
52
100
合计
115
85
200
附:统计量临界值表
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中.
则下列说法正确的是( )
A.有的把握认为新研发的药物对特定疾病治疗有效
B.有的把握认为新研发的药物对特定疾病治疗无效
C.有的把握认为新研发的药物对特定疾病治疗无效
D.有的把握认为新研发的药物对特定疾病治疗有效
【答案】D
【分析】求出的值,即可得答案。
【详解】因为,
又因为当时,对应的犯错的概率为,
所以有的把握认为新研发的药物对特定疾病治疗有效.
7.(25-26高二下·浙江温州·期中)(多选)某实验室为了研究荧光抗体法与常规培养法在沙门氏菌检验结果中是否存在差异,用以上两种检验方法对某种食品做了沙门氏菌检验,结果得到列联表如下:
阳性
阴性
合计
荧光抗体法
150
200
常规培养法
80
200
合计
270
130
400
参考公式:,其中.
附:
0.050
0.010
0.001
3.841
6.635
10.828
下列表述正确的是( )
A.
B.零假设:在沙门氏菌检验中荧光抗体法与常规培养法有差异
C.依据小概率值的独立性检验,认为荧光抗体法与常规培养法在沙门氏菌检验中有差异
D.常规培养法检测沙门氏菌阳性的频率为
【答案】ACD
【详解】A,根据表格数据可知,,A正确;
B,为了研究荧光抗体法与常规培养法在沙门氏菌检验结果中是否存在差异,
零假设:在沙门氏菌检验中荧光抗体法与常规培养法无差异,B错误;
C,由题意得,
零假设不成立,依据小概率值的独立性检验,认为荧光抗体法与常规培养法在沙门氏菌检验中有差异,C正确;
D,由表格数据知,常规培养法检测沙门氏菌阳性的频率为,D正确.
8.(2026·天津·一模)近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌汽车商随机调查了甲、乙两地各200名消费者,并用等高堆积条形图直观地展示调查结果如下图所示,经计算得到.
车型与地区
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
下列说法正确的是( )
A.在所调查的甲地购车者中,若按比例分层随机抽样抽取20人,则新能源车主有8人
B.在所调查的乙地购车者中,购买燃油车的人数比新能源车的多20人
C.依据的独立性检验,即消费者的购车类型与地域有关联,此推断犯错误的概率不大于0.001
D.依据的独立性检验,即消费者的购车类型与地域无关联,此推断犯错误的概率不大于0.001
【答案】C
【分析】借助分层随机抽样定义计算可得A;分别计算出购买燃油车的人数与购买新能源车的人数可得B;利用独立性检验定义可得C、D.
【详解】对A:,故新能源车主有人,故A错误;
对B:购买燃油车的人数为,
购买新能源车的人数为,
则购买燃油车的人数比新能源车的多人,故B错误;
对C、D:依据的独立性检验,即消费者的购车类型与地域有关联,
由,故此推断犯错误的概率不大于,故C正确、D错误.
9.(2026·天津河北·一模)以下结论错误的是( )
A.根据列联表中的数据计算得出,而,则根据小概率值的独立性检验,认为两个分类变量有关系
B.在回归直线中,变量时,变量y的值一定是15
C.的值越大,两个事件的相关性的可能性就越大
D.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
【答案】B
【分析】对于AC,根据独立性检验的定义和性质进行求解;对于BD,根据回归直线的概念和性质进行求解.
【详解】对于选项A:,故根据小概率值的独立性检验,认为两个分类变量有关系,即A正确:
对于选项B,回归直线方程中,当变量等于200时,的值平均是15,不能说一定是15,故B错误;
对于选项C:越大,“与有关系”可信程度越大,即相关性的可能性就越大,即C正确;
对于选项D:在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好,即D正确.
10.(25-26高二下·湖南长沙·月考)(多选)下列说法正确的是( )
A.样本相关系数r越大,则线性相关性越强
B.用决定系数刻画回归效果,越接近1,说明回归模型的拟合效果越好
C.在回归分析中,残差图中残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
D.在独立性检验中,零假设必须是“分类变量X与Y独立”,不能是“分类变量X与Y有关”
【答案】BCD
【详解】对于A,两个变量的样本相关系数为r,则越大,线性相关程度越强,故A错误;
对于B,决定系数越接近1,值越大,残差平方和越接近0,值越小,则该回归模型的拟合效果越好,故B正确;
对于C,因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,模型的拟合效果越好,故C正确;
对于D,在独立性检验中,将“分类变量X与Y独立”作为零假设,是因为在此假设下可以计算出期望频数,从而构造检验统计量进行检验,故D正确.
题型三 卡方的计算
11.(河南安阳市部分学校2025-2026学年高三下学期4月月考数学试题)某校为了解学生对食堂新推出的套餐是否满意,食堂主管部门在就餐的学生中随机调查了100人,得到如下2×2列联表:
满意
不满意
总计
男生
35
15
50
女生
20
30
50
总计
55
45
100
(1)依据小概率值的独立性检验,能否认为该校学生对该套餐满意与性别有关?
(2)该校有东、西两个食堂,若学生甲当天去了东食堂就餐,则接下来的一天去东食堂就餐的概率为;若当天没有去东食堂就餐,则接下来的一天去东食堂就餐的概率为.已知学生甲第一天去东食堂就餐的概率为,求他第三天去东食堂就餐的概率.
附:.
0.100
0.050
0.010
2.706
3.841
6.635
【答案】(1)与性别有关
(2)
【分析】(1)由卡方的计算公式求解即可.
(2)由条件概率与全概率公式求解即可.
【详解】(1)零假设:该校学生对该套餐满意与性别无关,
由题意得,
根据小概率值的独立性检验,不成立,
可以认为该校学生对该套餐满意与性别有关.
(2)设“学生甲第天去东食堂就餐”,则“学生甲第天没有去东食堂就餐”,.
由题意知,,,,
,
则,
,
∴学生甲第三天去东食堂就餐的概率为.
12.(2026·山东聊城·二模)(多选)某医学研究团队为探究新型降压药的疗效与患者年龄的关联,将120名高血压患者按年龄分为“中青年组(<60岁)”和“老年组(岁)”,记录用药后的疗效(“有效”“无效”),得到如下列联表:
患者
疗效
总计
有效
无效
中青年组
10
40
50
老年组
40
30
70
总计
50
70
120
附:,其中.
0.10
0.05
0.025
0.01
2.706
3.841
5.024
6.635
则下列说法中正确的有( )
A.若在“老年组”中按疗效分层抽样抽取7人,再从这7人中随机抽取2人,则至少抽到1名“无效”患者的概率为
B.从所有患者中随机抽取1人,设事件“该人在中青年组”,事件“该药对此人有效”,则事件A与B相互独立
C.根据小概率值的独立性检验,认为“降压药疗效与患者年龄有关”,且该推断犯错误的概率不超过
D.若将列联表中“中青年组有效”的人数改为15,“中青年组无效”的人数改为35,则所得值比原值大
【答案】AC
【分析】选项A,用分层抽样先确定抽出的“有效”和“无效”人数,再做组合概率;选项B,用独立事件定义检验是否等于;选项C,计算列联表的值,与临界值比较;选项D分别计算修改前后的值大小.
【详解】选项A,老年组中有效与无效的人数比为
按疗效分层抽样抽取7人,则应抽到:4人有效,3人无效,
再从这 7 人中随机抽取 2 人,至少抽到 1 名无效患者的概率为所以 A 正确;
选项B,设事件:表示“该人在中青年组”,事件:表示“该药对此人有效”,
则而
若相互独立,则应有
显然所以事件与不相互独立,B 错误;
选项C,由题中列联表,
所以
即
因为所以根据小概率值的独立性检验,
可以认为“降压药疗效与患者年龄有关”,且该推断犯错误的概率不超过,所以C正确;
选项D,若将“中青年组有效”改为 15,“中青年组无效”改为 35,
则新列联表中
此时
即,而原来的
所以修改后的值比原来的小,D 错误.
13.(2026·湖南·三模)在脑机接口技术实验中,研究人员为验证不同思维任务下,两个大脑的信号同步性是否独立,研究人员选取了200组观测数据,聚焦于“逻辑推理”与“创造性想象”两类任务,记录了两位受试者脑电信号的同步情况,得到了如下列联表:
思维任务类型
信号同步性
合计
信号同步
信号不同步
逻辑推理
42
58
100
创造性想象
28
72
100
合计
70
130
200
(1)分别计算两类任务中信号同步的频率,根据频率,你认为思维任务类型与信号同步性有关吗?简述理由.
(2)根据小概率值的独立性检验,分析思维任务类型与信号同步性有关吗?
附:,
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)有关,理由见解析
(2)无关
【详解】(1)逻辑推理任务中信号同步的频率,创造性想象任务中信号同步的频率,
思维任务类型与信号同步性有关,因为两类任务的同步频率存在明显差异,即;
(2)零假设:思维任务类型与信号同步性无关,
根据表中数据可得,
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即思维任务类型与信号同步性无关.
14.(25-26高二下·河南南阳·月考)高中推行“双休”以来,学生周六周日在家使用手机的时间增加,为了研究学生“双休日”在家使用手机时间长短与学习成绩的关系,特从全校学生中随机抽取200名学生进行问卷调查;将学生成绩分为“优秀”和“不优秀”两类,使用手机时间“长”(大于等于3小时/天)和“短”(小于3小时/天)两类,调查结果如下:
成绩优秀
成绩不优秀
总计
使用手机时间长
70
使用手机时间短
60
100
总计
90
完成上表,并根据完成的表格解决下面问题:
(1)现从这200名学生中随机选取一名学生,用频率估计概率,求该生“使用手机时间短”且“成绩优秀”的概率;
(2)在“使用手机时间长”的学生中,求该生“成绩不优秀”的概率;
(3)是否有99%的把握认为学生使用手机时间长短与学生成绩有关.
(参考公式:)
附:当时,有99%的把握判断变量A,B有关联.
【答案】(1)
(2)
(3)有的把握认为学生使用手机时间长短与学习成绩有关
【分析】(1)根据表格,利用频率直接计算即可;
(2)根据表格,利用频率直接计算即可;
(3)计算,与比较,得出结论即可.
【详解】(1)根据题意,完成表格如下:
成绩优秀
成绩不优秀
总计
使用手机时间长
30
70
100
使用手机时间短
60
40
100
总计
90
110
200
由上表知,“使用手机时间短”且“成绩优秀”的人数为,
所以随机抽取一名学生,该生“使用手机时间短”且“成绩优秀”的概率.
(2)因为使用手机时间长的学生共有人,其中成绩不优秀的有人,
所以在“使用手机时间长”的学生中抽取一名学生,该生“成绩不优秀”的概率.
(3)因为,
所以有的把握认为学生使用手机时间长短与学习成绩有关.
15.(2026·上海徐汇·二模)为落实《全民健身条例》,某区体育局对本区居民的健身场所选择偏好进行调研.数据显示,居民主要选择商业健身场馆(如健身房、体育中心)和社区公共运动场(如小区健身点、街心公园)两类场所.为了解年龄因素是否影响健身场所的选择,研究人员将成年居民分为青壮年组(岁且岁)和中老年组(岁),从该区随机抽取170名成年居民进行调查,得到如下不完整的列联表:
青壮年
中老年
合计
商业健身场馆
60
社区公共运动场
50
合计
80
170
(1)请补充列联表,并根据表中数据判断能否有的把握认为年龄与居民健身场所的选择有关;
(2)用分层抽样的方式从选择社区公共运动场的居民中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望.
参考公式及数据:,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,有95%的把握认为年龄与健身场所选择有关
(2)的分布见解析,数学期望为(或约)
【分析】(1)先补全 2×2 列联表,再代入卡方独立性检验公式计算统计量,与 95% 置信度临界值比较,判断年龄与健身场所选择是否有关联;
(2)先按分层抽样确定抽取的青壮、中老年人数,再用超几何分布计算随机变量 X 的各取值概率,列出分布列并代入期望公式求数学期望.
【详解】(1)根据已知数据计算空缺值,得到完整列联表如下:
青壮年
中老年
合计
商业健身场馆
60
40
100
社区公共运动场
20
50
70
合计
80
90
170
因为,
因此有95%的把握认为年龄与居民健身场所的选择有关.
(2)选择社区公共运动场的居民共70人,其中青壮年20人、中老年50人,抽样比为,
因此抽取的样本中青壮年人数:,中老年人数:.
设抽取的7人中中老年人数为,则青壮年人数为,.
因为青壮年共4人,故,解得,又,
因此,对应的可能取值为.
总情况数为,
(对应或)时,,
(对应)时,,
(对应)时,,
(对应)时,,
因此,的分布列为:
1
3
5
7
所以
题型四 独立性检验解决实际问题
16.(25-26高三下·陕西商洛·月考)为了解观看某场“苏超”联赛与性别是否有关系,某机构随机抽取了部分市民,调查他们对赛事的关注情况,得到如下表格:
性别
不关注赛事
关注赛事
合计
男性
25
150
175
女性
50
75
125
合计
75
225
300
(1)对照列联表,能否有的把握认为关注“苏超”赛事与性别有关?
(2)现从被调查的关注赛事的市民中,按照性别比例采用分层抽样的方法随机抽取6名市民参加“苏超”赛事知识问答,再从这6名市民中抽取3人参加抽奖活动,记这3人中女性人数为,求的分布列和期望.
附:,.
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1)有的把握认为关注“苏超”赛事与性别有关
(2)
【分析】(1)运用独立性检验判断赛事与性别关系;(2)先进行分层抽样,求概率后列分布列,利用期望公式求期望.
【详解】(1)假设:关注“苏超”赛事与性别无关,
依题意,
则假设不成立,即有的把握认为关注“苏超”赛事与性别有关.
(2)由题意可得,关注赛事的市民中男女比例为,
所以6人中抽取男性市民人,女性市民人,
则的取值为,
,
,
,
分布列如下表所示:
所以.
17.(2026·山东泰安·模拟预测)为响应“书香校园”建设,某校图书馆引入了一套智慧自助借还系统M,该系统内置个智能识别模块.每个模块在日常使用环境下正常工作的概率为,各模块工作状态相互独立.
(1)该图书馆从某批次智能识别模块中随机抽取了100个,在“日常校园环境”和“高温潮湿仓库环境”下测试其工作状态,得到如下列联表:
正常工作
故障
合计
日常校园环境
50
5
55
高温潮湿仓库环境
35
10
45
合计
85
15
100
请根据小概率值独立性检验,能否认为模块工作状态与测试环境有关联?
附:,.
0.05
0.01
0.001
k
3.841
6.635
10.828
(2)当时,系统M中正常工作的模块个数为随机变量X,回答以下问题:
(i)求X的分布列及数学期望;
(ii)若有超过一半的模块正常工作,则系统正常工作,系统正常工作的概率称为系统的可靠性.为改善时系统M的可靠性,能否通过增加一个智能识别模块(即)提高系统M的可靠性?请给出你的结论并证明.
【答案】(1)不能认为有关联
(2)(i)分布列见解析,3(ii)能,证明见解析
【分析】(1)计算出的观测值,结合临界值表可得出结论.
(2)①由题可得,利用二项分布可得出随机变量的分布列,进而可得出的值;②计算出时系统的可靠性为,时系统的可靠性为,作差比较大小后可得出结论.
【详解】(1)零假设为:模块工作状态与测试环境无关联.
根据列联表中数据,得,
所以依据小概率值的独立性检验,我们推断成立,可以认为模块工作状态与测试环境无关联.
(2)①由题意可知,
(法一)的分布列为,
.
(法二),
,
,
,
,
则的分布列如下:
0
1
2
3
4
.
②当时记系统中正常工作的模块数为随机变量,则,
记时系统的可靠性为,记时系统的可靠性为.
故,
,
故,
故增加一个模块即,能提高系统的可靠性.
18.(2025·上海青浦·模拟预测)某工厂生产某款电池,在满电状态下能够持续放电时间不低于小时的为合格品,工程师选择某台生产电池的机器进行参数调试,在调试前后,分别在其产品中随机抽取样本数据进行统计,制作了如下的列联表:
产品
合格
不合格
合计
调试前
45
15
60
调试后
35
5
40
合计
80
20
100
(1)根据表中数据,依据显著性水平的独立性检验,能否认为参数调试与产品质量有关联;
(2)现从调试前的样本中按合格和不合格,用分层随机抽样法抽取8件产品重新做参数调试,再从这8件产品中随机抽取3件做对比分析.记抽取的3件中合格的件数为X,求 X的分布列和期望;
(3)用样本分布的频率估计总体分布的概率,若现在随机抽取调试后的产品1000件,记其中合格的件数为Y, 求使事件“”的概率最大时k的取值.参考公式及数据: 其中.
0.05
0.025
0.01
0.005
0.001
3.841
5.024
6.635
7.879
10.828
【答案】(1)无关联
(2)分布列见解析,
(3)875
【分析】(1)计算的值,将其与对应的小概率值比较即得;
(2)先算出抽取的8件产品中的合格品与不合格品的数目,再从中抽取3件,根据合格品件数的可能值运用超几何分布概率计算出概率,列出分布列计算数学期望即得;
(3)分析得出,利用二项分布概率公式得出再利用作商法分析得时,事件“”的概率最大.
【详解】(1)零假设为:假设依据的独立性检验,认为参数调试与产品质量无关联;
则,
故依据的独立性检验,没有充分证据说明零假设不成立,
因此可认为成立,即认为参数调试与产品质量无关联;
(2)依题意,用分层随机抽样法抽取的8件产品中,
合格产品有件,不合格产品有2件,
而从这8件产品中随机抽取3件,其中的合格品件数的可能值有1,2,3.
则,,,
故的分布为:
1
2
3
则;
(3)依题意,因随机抽取调试后的产品的合格率为,
故,则,
由,
故由可解得,
因,故当时,;
故由可解得,
即当时,;
故当事件“”的概率最大时,.
19.(25-26高二下·湖南长沙·月考)为研究高中生每周自主整理错题时长与数学学科成绩的关联性,某高中数学教研组从本校高二年级随机抽取了100名学生进行调查,统计其每周整理错题时长(单位:小时)及期末数学成绩,按照“整理错题时长小时”和“整理错题时长小时”将学生分为时长充足组和时长不足组,再按照数学成绩是否不低于120分(满分150分)分为成绩优秀和成绩一般,得到如下列联表:
成绩优秀
成绩一般
合计
时长充足组
30
10
40
时长不足组
20
40
60
合计
50
50
100
同时,从样本中随机选取6名学生,记录其每周整理错题时长(记为变量x,单位:小时)与对应数学成绩(记为变量y,单位:分),得到如下数据:
学生编号
1
2
3
4
5
6
x
0
1
2
2
3
4
y
91
105
116
119
125
140
(1)根据表中数据,依据的独立性检验,能否认为高中生数学成绩与每周整理错题时长充足与否有关联?并解释所得结论的实际含义;
(2)请你结合第(1)问得出的独立性检验结论,根据选取的6组数据,建立y关于x的经验回归方程,并预测某名学生每周整理错题时长为4.5小时,其数学成绩大约为多少分?该结果是否一定与实际情况相符合,原因是什么?
参考数据与公式:,.
0.050
0.010
0.001
3.841
6.635
10.828
经验回归方程中斜率和截距的最小二乘估计公式分别为:,.
【答案】(1)认为高中生数学成绩与每周自主整理错题时长有关,答案见解析
(2),145.5分,该结果与实际得分不一定相符合,原因见解析
【分析】(1)根据独立性检验的概念,求出,判断假设是否成立即可;
(2)根据最小二乘估计公式求出经验回归方程,进而计算估计结果,判断其是否符合事实即可.
【详解】(1)零假设为:高中生数学成绩与每周自主整理错题时长无关,
根据表中数据可得,,
根据小概率值的独立性检验,我们推断不成立,
即认为高中生数学成绩与每周自主整理错题时长有关,该推断犯错误的概率不超过0.001.
(2)由数据得,,,
,
,
得,,
所以y关于x的经验回归方程为.
将代入经验回归方程得,
所以预测某名学生每周整理错题时长为4.5小时,其数学成绩大约为145.5分.
该结果与实际得分不一定相符合,原因是把每周整理错题时长为4.5小时的学生数学成绩作为一个子总体,数学成绩为145.5分是这个子总体的均值的估计值,影响数学成绩还有其他的因素(言之合理即可).
20.(2026·河北邯郸·二模)2026年马年春晚是大模型与节目结合最多的一场春晚,其中大模型“豆包”贯穿整场晚会.为了了解人们对大模型“豆包”应用的关注程度,现随机抽取不同年龄段的1000人进行调查统计,得到如下列联表:
年龄
“豆包”应用
合计
不关注
关注
不超过50岁
400
600
超过50岁
300
合计
1000
(1)完成列联表,并依据小概率值的独立性检验,判断人们对大模型“豆包”应用的关注程度是否与年龄有关联;
(2)从不超过50岁的调查者中按比例分配的分层随机抽样抽取6人,从这6人中随机抽取2人做进一步的访谈,记抽到的2人中关注“豆包”应用的人数为X,求X的分布列和数学期望.
附:,其中.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,依据小概率值的独立性检验,可判断人们对大模型“豆包”应用的关注程度与年龄有关联.
(2)分布列见解析;
【分析】(1)补全列联表,进行零假设,求出,根据附表进行判断;
(2)根据超几何分布的特征,写出变量的分布列,根据分布列求出变量的数学期望.
【详解】(1)(1)补全的列联表如下:
年龄
“豆包”应用
合计
不关注
关注
不超过50岁
200
400
600
超过50岁
300
100
400
合计
500
500
1000
零假设为:人们对大模型“豆包”应用的关注程度与年龄无关.
根据表中数据,计算得到.
根据小概率值的独立性检验,没有充分证据推断成立,
即认为人们对大模型“豆包”应用的关注程度与年龄有关,该推断犯错误的概率不超过0.001.
(2)从不超过50岁的调查者中按比例分配的分层随机抽样抽取6人,
则关注“豆包”应用的有人,不关注“豆包”应用的有人,
则的所有可能取值为0,1,2,
的分布列为
0
1
2
的数学期望.
强化训练
1.(25-26高二下·上海·期中)为研究蔬菜植株感染红叶螨能否引起植株形成某种抗体,使用列联表独立性检验.随机抽取一定量植株,获得观察数据,制作列联表.提出原假设:感染与形成抗体__________;确定显著性水平;若计算得;依据,从而__________原假设,即得统计决断.( )
A.有关;拒绝 B.有关;接受 C.无关;拒绝 D.无关;接受
【答案】D
【详解】在独立性检验中,提出原假设:感染与形成抗体无关,当计算得到的统计量小于临界值时,就接受原假设.
2.(25-26高二下·黑龙江大庆·期中)独立性检验中,若小于临界值,则下列结论正确的是( )
A.两个变量一定相互独立 B.两个变量一定不独立
C.没有充分证据表明两个变量有关 D.两个变量有关联的可能性为
【答案】C
【分析】根据独立性检验的基本逻辑即可求解.
【详解】对于A,小于临界值,并不意味着“一定相互独立”,只是无足够证据反对独立,故A错误;
对于B,小于临界值,并不意味着“一定不独立”,只是无足够证据反对独立,故B错误;
对于C,这是独立性检验的基本逻辑:当时,无充分证据支持变量相关,即不能认为有关联,故C正确;
对于D,对应的把握认为两个变量有关联,而实际上,故D错误.
3.(2026·天津河西·一模)下列说法中错误的有( )
①回归直线恒过点,且至少过一个样本点;
②根据列联表中的数据计算得出,而,则“两个分类变量有关联”此推断犯错误的概率不大于0.01;
③回归分析时,可以用决定系数刻画模型的回归效果,越大,则拟合的效果越好;
④若随机变量服从正态分布,若则实数
A.1个 B.2个 C.3个 D.4个
【答案】A
【分析】利用回归直线的特点可判断①;利用独立性检验可判断②;利用决定系数与模型拟合效果的关系可判断③;利用正态分布对称性和性质可判断④.
【详解】对于①,回归直线恒过点,不一定过样本点,故①错误;
对于②,根据列联表中的数据计算得出,而,
则有的把握认为两个分类变量有关系,则“两个分类变量有关联”此推断犯错误的概率不大于0.01,故②正确;
对于③,在做回归分析时,可以用决定系数刻画模型的回归效果,若越大,则说明模型拟合的效果越好,故③正确;
对于④,由随机变量,其正态曲线关于直线对称,
由,若,则,即得,
所以,故④正确.
综上,错误的只有①.
4.(25-26高二下·辽宁·开学考试)统计学中,常用的显著性水平以及对应的分位数如下表所示.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.在犯错误的概率不超过1的前提下,可以认为与有关
B.在犯错误的概率不超过的前提下,可以认为与有关
C.有的把握认为与有关
D.有的把握认为与有关
【答案】C
【分析】根据独立性检验的应用判断选项.
【详解】因为,所以,
所以在犯错误的概率不超过的前提下,
可以认为与有关或有的把握认为与有关.
5.(25-26高三·天津·二轮复习)下列说法正确的是( )
的部分临界值如表:
0.1
0.05
0.025
0.01
2.706
3.841
5.024
6.635
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量,由它们的样本数据计算得到的观测值,则在犯错误的概率不超过0.025的前提下认为变量没有关系
【答案】A
【分析】根据标准差定义可判断A项;通过取反例可排除B项;利用相关系数的概念易排除C项;利用独立性检验的规定,可判断D结论不成立.
【详解】对于A,根据标准差定义,一组数据的标准差时,
显然有,故A正确;
对于B,两组数据的标准差相等,这两组数据的平均数未必相等,
如都为1和都为2的两组数据,它们的标准差均为0,但它们的平均数分别为1和,故B错误;
对于C,两个变量的相关系数越接近于0,两个变量的相关性越弱,故C错误;
对于D,,根据独立性检验原理,
在犯错误的概率不超过0.025的前提下认为变量有关系,故D错误.
故选:A
6.(25-26高二下·辽宁大连·月考)(多选)下列说法正确的是( )
A.两点分布中,时,方差最大
B.设10件产品中有3件次品,从中抽取2件进行检查,则查得次品的均值为0.6
C.用独立性检验推断两个分类变量之间的关联性,如果把的列联表中所有的数据都扩大为原来的10倍,在相同的检验标准下,结论不受任何影响
D.由两个分类变量的成对样本数据计算得到,依据的独立性检验(),可判断与独立
【答案】ABD
【详解】对于A:两点分布的方差公式为(其中为成功概率),
将其视为关于的二次函数,开口向下,顶点在处,
此时方差最大值为,故A正确;
对于B:设查得次品数为,则服从超几何分布,
其中(产品总数),(次品数),(抽取的产品数),
根据超几何分布的均值公式,可得,故B正确;
对于C:根据独立性检验的统计量的计算公式为(其中为样本量),若所有数据扩大10倍,
则新数据为,
代入公式得:,
所以统计量的值变为原来的10倍,结论会改变,故C错误;
对于D:已知,,因为,
所以依据的独立性检验,可判断与独立,故D正确.
7.(25-26高二下·河南南阳·期中)(多选)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得到如下列联表:(单位:人),则( )
性别
晕机
合计
晕机者
未晕机者
男
女
合计
附:,其中.
A.
B.
C.依据小概率值的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别有关
D.依据小概率值的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别无关
【答案】AC
【分析】根据题中信息完善列联表,可判断AB选项;利用独立性检验的基本思想可判断CD选项.
【详解】由题中列联表数据,知,解得,
所以得到如下列联表:
性别
晕机
合计
晕机者
未晕机者
男
女
合计
所以,即A正确;
在恶劣天气的飞行航程中,是否晕机与性别无关,
由列联表中的数据,得,
依据小概率值的独立性检验,可以推断不成立,
即在恶劣天气的飞行航程中,是否晕机与性别有关,所以B、D错误,A、C正确.
8.(2026·浙江宁波·二模)(多选)下列说法中正确的是( )
A.一组数据1,1,2,3,5,8,,的第百分位数为4
B.两个随机变量的线性相关程度越强,则样本相关系数的绝对值越接近于1
C.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验:,可判断与有关联,此推断犯错误的概率不超过
D.若随机变量服从正态分布,且,则
【答案】BD
【详解】选项A:第百分位数位置为,故取5,
第百分位数是第5个数5,故A错误;
选项B:样本相关系数的绝对值越接近1,代表两个随机变量的线性相关程度越强,故B正确;
选项C:独立性检验中,在的显著水平下,
无法判断与有关联,故C错误;
选项D:正态分布关于均值对称,,
已知,则,
由对称性可知,
,故D正确.
9.(25-26高二下·上海·期中)学校对社团展演活动满意度进行调研,随机抽取高一高二学生各50名,每位同学给出满意或不满意的评价,得到列联表.依据,若没有95%的把握认为年级会对满意度评价有差异,则的最小值为__________.附:,
满意
不满意
高一
高二
【答案】21
【分析】根据定义算出的表达式,由题意得,可得出的最小值.
【详解】由题意得,并令,即,近似解得,即,注意到,故的最小值为.
10.(25-26高二下·江西·月考)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人.
参考数据及公式:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】48
【分析】设男生人数为,由题可得列联表,然后由题设可得关于不等式,据此可得答案.
【详解】设男生人数为,则女生人数为,男生追星人数为,不追星人数为,
女生追星人数为,不追星人数为,据此可得列联表如下:
追星
不追星
总计
男生
女生
总计
则由独立性检验相关计算公式结合题设,可得:
.
又为保证所有人数为正整数,需为的倍数,则.
11.(25-26高二下·河南驻马店·月考)为研究不同性别对取暖器“最佳舒适温度”是否不低于的认同差异,某公司随机对400名用户(男女用户各占一半)进行了调查,其中,认为“最佳舒适温度”不低于的女性用户数量占女性用户总数的,认为“最佳舒适温度”不低于的男性用户数量占总用户数的.
性别
最佳舒适温度
合计
男
女
合计
400
(1)完成列联表,并根据小概率值的独立性检验,分析认同取暖器“最佳舒适温度”是否不低于是否与性别有关;
(2)从样本中认为取暖器“最佳舒适温度”低于的用户中随机抽取2人,求这2人中至少有1名女性的概率.
附:.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)表格见解析,有关.
(2)
【详解】(1)依题意可知,女性用户共有200人,认为“最佳舒适温度”不低于的女性用户有人,
男性用户中认为“最佳舒适温度”不低于的人数为,
列联表如下:
性别
最佳舒适温度
合计
男
100
100
200
女
150
50
200
合计
250
150
400
零假设为:修改为“认同取暖器‘最佳舒适温度’不低于与性别无关.
根据表中的数据,计算得到,
因为,所以根据小概率值的独立性检验,有充分证据推断不成立,
故此可以认为认同取暖器“最佳舒适温度”是否不低于与性别有关;
(2)由第1问得,认为取暖器“最佳舒适温度”低于的用户中男性有100人,女性有50人,
故抽取2人至少有1名女性的概率为.
12.(2026·陕西宝鸡·三模)为考察某种国产芯片和进口芯片的质量,随机抽取了500颗同规格芯片,对两种芯片的良品、次品进行对比,得到如下不完整的列联表:
项目
良品
次品
合计
国产芯片
10
250
进口芯片
230
合计
470
30
500
(1)完成上面的表格中的空缺部分填空,以频率估计概率,估计国产芯片的次品率;
(2)根据小概率值的独立性检验,能否判断国产芯片与进口芯片质量有差异?
0.05
0.01
0.001
3.841
6.635
10.828
附:,其中为样本容量.
【答案】(1)
项目
良品
次品
合计
国产芯片
240
10
250
进口芯片
230
20
250
合计
470
30
500
,
(2)没有充分证据表明国产芯片与进口芯片质量有差异
【分析】(1)完善列联表,计数频率即可求解;
(2)计算出的观测值,结合临界值表可得出结论.
【详解】(1)表格中的空缺部分填空如下表,
项目
良品
次品
合计
国产芯片
240
10
250
进口芯片
230
20
250
合计
470
30
500
样本中国产芯片次品的频率为 ,
由此估计国产芯片的次品率为 ;
(2)假设:国产芯片与进口芯片质量无差异,
因为 ,
由,
所以没有充分证据表明国产芯片与进口芯片质量有差异.
13.(2026·陕西宝鸡·模拟预测)随着科技的进步,人工智能(AI)工具在职场中的应用日益广泛,像豆包、DeepSeek等常见的AI工具,已被证明能有效提升员工的工作效率和准确率.某公司为了解员工使用这类AI工具的熟练度,进行了一次内部统计,统计结果如下表:
能够熟练使用AI工具
不能够熟练使用AI工具
男员工
30
15
女员工
16
9
(1)根据的独立性检验,能否认为性别与使用AI工具的熟练度具有相关性?
(2)现按熟练度采用分层抽样的方法从该公司的男员工中随机抽取12人,再从这12人中随机抽取3人,记其中不能够熟练使用AI工具的人数为,求的分布列以及数学期望.
附:,其中.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)性别与使用AI工具的熟练度无关;
(2)
0
1
2
3
数学期望为1.
【分析】(1)根据给定条件,求出的观测值,再与临界值比对即可得解.
(2)求出12名男员工中能够熟练与不能够熟练使用AI的人数,进而求出的可能值及各个值对应的概率,列出分布列并求出数学期望.
【详解】(1)设零假设:性别与使用AI工具的熟练度无关,
由统计表得,
则,
根据小概率值的独立性检验,没有充分证据推断不成立,
所以可以认为成立,即认为性别与使用AI工具的熟练度无关.
(2)男员工中能够熟练与不能够熟练使用AI的人数比为,
按分层抽样抽12人,抽取的能够熟练使用的人数为,抽取的不能够熟练使用的人数为4,
因此的可能取值为,
,
,
所以的分布列为:
0
1
2
3
数学期望.
14.(25-26高二下·河南南阳·期中)为研究不同性别对取暖器“最佳舒适温度”是否不低于的认同差异,某公司随机对400名用户(男女用户各占一半)进行了调查,其中,认为“最佳舒适温度”不低于的女性用户数量占女性用户总数的,认为“最佳舒适温度”不低于的男性用户数量占总用户数的.
性别
最佳舒适温度
合计
男
女
合计
400
(1)完成列联表,并根据小概率值的独立性检验,分析认同取暖器“最佳舒适温度”是否不低于是否与性别有关;
(2)从样本中的认为取暖器“最佳舒适温度”低于的用户中随机抽取2人,求这2人中至少有1名女性的概率.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,可以认为认同取暖器“最佳舒适温度”是否不低于与性别有关;
(2)
【分析】(1)根据题意填充列联表,再计算的观测值,与临界值比较后得出结论;
(2)利用(1)中列联表的数据,根据古典概型概率公式求解.
【详解】(1)依题意可知,女性用户共有200人,
认为“最佳舒适温度”不低于的女性用户有人,
男性用户中认为“最佳舒适温度”不低于的人数为.
列联表如下:
性别
最佳舒适温度
合计
男
100
100
200
女
150
50
200
合计
250
150
400
零假设为:认同取暖器“最佳舒适温度”是否不低于与性别无关.
根据表中的数据,计算得到,
因为,所以根据小概率值的独立性检验,有充分证据推断不成立,
因此可以认为认同取暖器“最佳舒适温度”是否不低于与性别有关;
(2)由(1)得,认为取暖器“最佳舒适温度”低于的用户中男性有100人,女性有50人,
故抽取2人至少有1名女性的概率为.
1 / 1
学科网(北京)股份有限公司
$
8.3 列联表与独立性检验
题型预览
题型一 列联表的完善与分析
题型二 独立性检验的概念及辨析
题型三 卡方的计算
题型四 独立性检验解决实际问题
知识清单
数值变量与分类变量
数值变量:数值变量的取值为实数,其大小和运算都有实际含义.
分类变量:这里所说的变量和值不一定是具体的数值,例如,性别变量,其取值为男和女两种.我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
【注意】分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的
列联表
定义一对分类变量X和Y,我们整理数据如表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
上表是关于分类变量X和Y的抽样数据的2×2列联表,最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数n是样本空间中样本点的总数.
独立性检验的理解
(1)零假设:设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互为对立事件,故要判断事件{X=1}和{Y=1}之间是否有关联,需要判断假定关系H0:P(Y=1|X=0)=P(Y=1|X=1)是否成立.
(2)独立性检验的公式
χ2=,其中n=a+b+c+d,用随机变量χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.
(3)临界值:对任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)=α.称xα为α的临界值.临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大.
(4)基于小概率值α的检验规则:当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,没有充分证据推断H0不成立,可以认为X和Y独立.利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
(5)χ2独立性检验中几个常用的小概率值和相应的临界值.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【注意】χ2越小,独立性越强,相关性越弱;χ2越大,独立性越弱,相关性越强
题型突破
题型一 列联表的完善与分析
1.(25-26高二下·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
2.(24-25高二下·全国·课后作业)下表是、两班关于选择“物理”作为“加三学科”的意愿的列联表,请根据已有数据完善表格.
单位:人
类别
愿意选择“物理”
不愿意选择“物理”
总计
班
20
42
班
16
总计
44
3.(24-25高二下·河南·月考)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
4.(25-26高二下·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
5.(24-25高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
题型二 独立性检验的概念及辨析
6.(25-26高二下·江西萍乡·期中)某医疗研究机构为检验某种新研发的药物对特定疾病治疗是否有效,随机选取了200名患者进行双盲实验.其中100人服用新药,100人服用旧药,统计结果如下表
治愈
未治愈
合计
服用新药
67
33
100
服用旧药
48
52
100
合计
115
85
200
附:统计量临界值表
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中.
则下列说法正确的是( )
A.有的把握认为新研发的药物对特定疾病治疗有效
B.有的把握认为新研发的药物对特定疾病治疗无效
C.有的把握认为新研发的药物对特定疾病治疗无效
D.有的把握认为新研发的药物对特定疾病治疗有效
7.(25-26高二下·浙江温州·期中)(多选)某实验室为了研究荧光抗体法与常规培养法在沙门氏菌检验结果中是否存在差异,用以上两种检验方法对某种食品做了沙门氏菌检验,结果得到列联表如下:
阳性
阴性
合计
荧光抗体法
150
200
常规培养法
80
200
合计
270
130
400
参考公式:,其中.
附:
0.050
0.010
0.001
3.841
6.635
10.828
下列表述正确的是( )
A.
B.零假设:在沙门氏菌检验中荧光抗体法与常规培养法有差异
C.依据小概率值的独立性检验,认为荧光抗体法与常规培养法在沙门氏菌检验中有差异
D.常规培养法检测沙门氏菌阳性的频率为
8.(2026·天津·一模)近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌汽车商随机调查了甲、乙两地各200名消费者,并用等高堆积条形图直观地展示调查结果如下图所示,经计算得到.
车型与地区
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
下列说法正确的是( )
A.在所调查的甲地购车者中,若按比例分层随机抽样抽取20人,则新能源车主有8人
B.在所调查的乙地购车者中,购买燃油车的人数比新能源车的多20人
C.依据的独立性检验,即消费者的购车类型与地域有关联,此推断犯错误的概率不大于0.001
D.依据的独立性检验,即消费者的购车类型与地域无关联,此推断犯错误的概率不大于0.001
9.(2026·天津河北·一模)以下结论错误的是( )
A.根据列联表中的数据计算得出,而,则根据小概率值的独立性检验,认为两个分类变量有关系
B.在回归直线中,变量时,变量y的值一定是15
C.的值越大,两个事件的相关性的可能性就越大
D.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
10.(25-26高二下·湖南长沙·月考)(多选)下列说法正确的是( )
A.样本相关系数r越大,则线性相关性越强
B.用决定系数刻画回归效果,越接近1,说明回归模型的拟合效果越好
C.在回归分析中,残差图中残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
D.在独立性检验中,零假设必须是“分类变量X与Y独立”,不能是“分类变量X与Y有关”
题型三 卡方的计算
11.(河南安阳市部分学校2025-2026学年高三下学期4月月考数学试题)某校为了解学生对食堂新推出的套餐是否满意,食堂主管部门在就餐的学生中随机调查了100人,得到如下2×2列联表:
满意
不满意
总计
男生
35
15
50
女生
20
30
50
总计
55
45
100
(1)依据小概率值的独立性检验,能否认为该校学生对该套餐满意与性别有关?
(2)该校有东、西两个食堂,若学生甲当天去了东食堂就餐,则接下来的一天去东食堂就餐的概率为;若当天没有去东食堂就餐,则接下来的一天去东食堂就餐的概率为.已知学生甲第一天去东食堂就餐的概率为,求他第三天去东食堂就餐的概率.
附:.
0.100
0.050
0.010
2.706
3.841
6.635
12.(2026·山东聊城·二模)(多选)某医学研究团队为探究新型降压药的疗效与患者年龄的关联,将120名高血压患者按年龄分为“中青年组(<60岁)”和“老年组(岁)”,记录用药后的疗效(“有效”“无效”),得到如下列联表:
患者
疗效
总计
有效
无效
中青年组
10
40
50
老年组
40
30
70
总计
50
70
120
附:,其中.
0.10
0.05
0.025
0.01
2.706
3.841
5.024
6.635
则下列说法中正确的有( )
A.若在“老年组”中按疗效分层抽样抽取7人,再从这7人中随机抽取2人,则至少抽到1名“无效”患者的概率为
B.从所有患者中随机抽取1人,设事件“该人在中青年组”,事件“该药对此人有效”,则事件A与B相互独立
C.根据小概率值的独立性检验,认为“降压药疗效与患者年龄有关”,且该推断犯错误的概率不超过
D.若将列联表中“中青年组有效”的人数改为15,“中青年组无效”的人数改为35,则所得值比原值大
13.(2026·湖南·三模)在脑机接口技术实验中,研究人员为验证不同思维任务下,两个大脑的信号同步性是否独立,研究人员选取了200组观测数据,聚焦于“逻辑推理”与“创造性想象”两类任务,记录了两位受试者脑电信号的同步情况,得到了如下列联表:
思维任务类型
信号同步性
合计
信号同步
信号不同步
逻辑推理
42
58
100
创造性想象
28
72
100
合计
70
130
200
(1)分别计算两类任务中信号同步的频率,根据频率,你认为思维任务类型与信号同步性有关吗?简述理由.
(2)根据小概率值的独立性检验,分析思维任务类型与信号同步性有关吗?
附:,
0.050
0.010
0.001
3.841
6.635
10.828
14.(25-26高二下·河南南阳·月考)高中推行“双休”以来,学生周六周日在家使用手机的时间增加,为了研究学生“双休日”在家使用手机时间长短与学习成绩的关系,特从全校学生中随机抽取200名学生进行问卷调查;将学生成绩分为“优秀”和“不优秀”两类,使用手机时间“长”(大于等于3小时/天)和“短”(小于3小时/天)两类,调查结果如下:
成绩优秀
成绩不优秀
总计
使用手机时间长
70
使用手机时间短
60
100
总计
90
完成上表,并根据完成的表格解决下面问题:
(1)现从这200名学生中随机选取一名学生,用频率估计概率,求该生“使用手机时间短”且“成绩优秀”的概率;
(2)在“使用手机时间长”的学生中,求该生“成绩不优秀”的概率;
(3)是否有99%的把握认为学生使用手机时间长短与学生成绩有关.
(参考公式:)
附:当时,有99%的把握判断变量A,B有关联.
15.(2026·上海徐汇·二模)为落实《全民健身条例》,某区体育局对本区居民的健身场所选择偏好进行调研.数据显示,居民主要选择商业健身场馆(如健身房、体育中心)和社区公共运动场(如小区健身点、街心公园)两类场所.为了解年龄因素是否影响健身场所的选择,研究人员将成年居民分为青壮年组(岁且岁)和中老年组(岁),从该区随机抽取170名成年居民进行调查,得到如下不完整的列联表:
青壮年
中老年
合计
商业健身场馆
60
社区公共运动场
50
合计
80
170
(1)请补充列联表,并根据表中数据判断能否有的把握认为年龄与居民健身场所的选择有关;
(2)用分层抽样的方式从选择社区公共运动场的居民中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望.
参考公式及数据:,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
题型四 独立性检验解决实际问题
16.(25-26高三下·陕西商洛·月考)为了解观看某场“苏超”联赛与性别是否有关系,某机构随机抽取了部分市民,调查他们对赛事的关注情况,得到如下表格:
性别
不关注赛事
关注赛事
合计
男性
25
150
175
女性
50
75
125
合计
75
225
300
(1)对照列联表,能否有的把握认为关注“苏超”赛事与性别有关?
(2)现从被调查的关注赛事的市民中,按照性别比例采用分层抽样的方法随机抽取6名市民参加“苏超”赛事知识问答,再从这6名市民中抽取3人参加抽奖活动,记这3人中女性人数为,求的分布列和期望.
附:,.
0.01
0.005
0.001
6.635
7.879
10.828
17.(2026·山东泰安·模拟预测)为响应“书香校园”建设,某校图书馆引入了一套智慧自助借还系统M,该系统内置个智能识别模块.每个模块在日常使用环境下正常工作的概率为,各模块工作状态相互独立.
(1)该图书馆从某批次智能识别模块中随机抽取了100个,在“日常校园环境”和“高温潮湿仓库环境”下测试其工作状态,得到如下列联表:
正常工作
故障
合计
日常校园环境
50
5
55
高温潮湿仓库环境
35
10
45
合计
85
15
100
请根据小概率值独立性检验,能否认为模块工作状态与测试环境有关联?
附:,.
0.05
0.01
0.001
k
3.841
6.635
10.828
(2)当时,系统M中正常工作的模块个数为随机变量X,回答以下问题:
(i)求X的分布列及数学期望;
(ii)若有超过一半的模块正常工作,则系统正常工作,系统正常工作的概率称为系统的可靠性.为改善时系统M的可靠性,能否通过增加一个智能识别模块(即)提高系统M的可靠性?请给出你的结论并证明.
18.(2025·上海青浦·模拟预测)某工厂生产某款电池,在满电状态下能够持续放电时间不低于小时的为合格品,工程师选择某台生产电池的机器进行参数调试,在调试前后,分别在其产品中随机抽取样本数据进行统计,制作了如下的列联表:
产品
合格
不合格
合计
调试前
45
15
60
调试后
35
5
40
合计
80
20
100
(1)根据表中数据,依据显著性水平的独立性检验,能否认为参数调试与产品质量有关联;
(2)现从调试前的样本中按合格和不合格,用分层随机抽样法抽取8件产品重新做参数调试,再从这8件产品中随机抽取3件做对比分析.记抽取的3件中合格的件数为X,求 X的分布列和期望;
(3)用样本分布的频率估计总体分布的概率,若现在随机抽取调试后的产品1000件,记其中合格的件数为Y, 求使事件“”的概率最大时k的取值.参考公式及数据: 其中.
0.05
0.025
0.01
0.005
0.001
3.841
5.024
6.635
7.879
10.828
19.(25-26高二下·湖南长沙·月考)为研究高中生每周自主整理错题时长与数学学科成绩的关联性,某高中数学教研组从本校高二年级随机抽取了100名学生进行调查,统计其每周整理错题时长(单位:小时)及期末数学成绩,按照“整理错题时长小时”和“整理错题时长小时”将学生分为时长充足组和时长不足组,再按照数学成绩是否不低于120分(满分150分)分为成绩优秀和成绩一般,得到如下列联表:
成绩优秀
成绩一般
合计
时长充足组
30
10
40
时长不足组
20
40
60
合计
50
50
100
同时,从样本中随机选取6名学生,记录其每周整理错题时长(记为变量x,单位:小时)与对应数学成绩(记为变量y,单位:分),得到如下数据:
学生编号
1
2
3
4
5
6
x
0
1
2
2
3
4
y
91
105
116
119
125
140
(1)根据表中数据,依据的独立性检验,能否认为高中生数学成绩与每周整理错题时长充足与否有关联?并解释所得结论的实际含义;
(2)请你结合第(1)问得出的独立性检验结论,根据选取的6组数据,建立y关于x的经验回归方程,并预测某名学生每周整理错题时长为4.5小时,其数学成绩大约为多少分?该结果是否一定与实际情况相符合,原因是什么?
参考数据与公式:,.
0.050
0.010
0.001
3.841
6.635
10.828
经验回归方程中斜率和截距的最小二乘估计公式分别为:,.
20.(2026·河北邯郸·二模)2026年马年春晚是大模型与节目结合最多的一场春晚,其中大模型“豆包”贯穿整场晚会.为了了解人们对大模型“豆包”应用的关注程度,现随机抽取不同年龄段的1000人进行调查统计,得到如下列联表:
年龄
“豆包”应用
合计
不关注
关注
不超过50岁
400
600
超过50岁
300
合计
1000
(1)完成列联表,并依据小概率值的独立性检验,判断人们对大模型“豆包”应用的关注程度是否与年龄有关联;
(2)从不超过50岁的调查者中按比例分配的分层随机抽样抽取6人,从这6人中随机抽取2人做进一步的访谈,记抽到的2人中关注“豆包”应用的人数为X,求X的分布列和数学期望.
附:,其中.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
强化训练
1.(25-26高二下·上海·期中)为研究蔬菜植株感染红叶螨能否引起植株形成某种抗体,使用列联表独立性检验.随机抽取一定量植株,获得观察数据,制作列联表.提出原假设:感染与形成抗体__________;确定显著性水平;若计算得;依据,从而__________原假设,即得统计决断.( )
A.有关;拒绝 B.有关;接受 C.无关;拒绝 D.无关;接受
2.(25-26高二下·黑龙江大庆·期中)独立性检验中,若小于临界值,则下列结论正确的是( )
A.两个变量一定相互独立 B.两个变量一定不独立
C.没有充分证据表明两个变量有关 D.两个变量有关联的可能性为
3.(2026·天津河西·一模)下列说法中错误的有( )
①回归直线恒过点,且至少过一个样本点;
②根据列联表中的数据计算得出,而,则“两个分类变量有关联”此推断犯错误的概率不大于0.01;
③回归分析时,可以用决定系数刻画模型的回归效果,越大,则拟合的效果越好;
④若随机变量服从正态分布,若则实数
A.1个 B.2个 C.3个 D.4个
4.(25-26高二下·辽宁·开学考试)统计学中,常用的显著性水平以及对应的分位数如下表所示.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.在犯错误的概率不超过1的前提下,可以认为与有关
B.在犯错误的概率不超过的前提下,可以认为与有关
C.有的把握认为与有关
D.有的把握认为与有关
5.(25-26高三·天津·二轮复习)下列说法正确的是( )
的部分临界值如表:
0.1
0.05
0.025
0.01
2.706
3.841
5.024
6.635
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量,由它们的样本数据计算得到的观测值,则在犯错误的概率不超过0.025的前提下认为变量没有关系
6.(25-26高二下·辽宁大连·月考)(多选)下列说法正确的是( )
A.两点分布中,时,方差最大
B.设10件产品中有3件次品,从中抽取2件进行检查,则查得次品的均值为0.6
C.用独立性检验推断两个分类变量之间的关联性,如果把的列联表中所有的数据都扩大为原来的10倍,在相同的检验标准下,结论不受任何影响
D.由两个分类变量的成对样本数据计算得到,依据的独立性检验(),可判断与独立
7.(25-26高二下·河南南阳·期中)(多选)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得到如下列联表:(单位:人),则( )
性别
晕机
合计
晕机者
未晕机者
男
女
合计
附:,其中.
A.
B.
C.依据小概率值的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别有关
D.依据小概率值的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别无关
8.(2026·浙江宁波·二模)(多选)下列说法中正确的是( )
A.一组数据1,1,2,3,5,8,,的第百分位数为4
B.两个随机变量的线性相关程度越强,则样本相关系数的绝对值越接近于1
C.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验:,可判断与有关联,此推断犯错误的概率不超过
D.若随机变量服从正态分布,且,则
9.(25-26高二下·上海·期中)学校对社团展演活动满意度进行调研,随机抽取高一高二学生各50名,每位同学给出满意或不满意的评价,得到列联表.依据,若没有95%的把握认为年级会对满意度评价有差异,则的最小值为__________.附:,
满意
不满意
高一
高二
10.(25-26高二下·江西·月考)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人.
参考数据及公式:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
11.(25-26高二下·河南驻马店·月考)为研究不同性别对取暖器“最佳舒适温度”是否不低于的认同差异,某公司随机对400名用户(男女用户各占一半)进行了调查,其中,认为“最佳舒适温度”不低于的女性用户数量占女性用户总数的,认为“最佳舒适温度”不低于的男性用户数量占总用户数的.
性别
最佳舒适温度
合计
男
女
合计
400
(1)完成列联表,并根据小概率值的独立性检验,分析认同取暖器“最佳舒适温度”是否不低于是否与性别有关;
(2)从样本中认为取暖器“最佳舒适温度”低于的用户中随机抽取2人,求这2人中至少有1名女性的概率.
附:.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
12.(2026·陕西宝鸡·三模)为考察某种国产芯片和进口芯片的质量,随机抽取了500颗同规格芯片,对两种芯片的良品、次品进行对比,得到如下不完整的列联表:
项目
良品
次品
合计
国产芯片
10
250
进口芯片
230
合计
470
30
500
(1)完成上面的表格中的空缺部分填空,以频率估计概率,估计国产芯片的次品率;
(2)根据小概率值的独立性检验,能否判断国产芯片与进口芯片质量有差异?
0.05
0.01
0.001
3.841
6.635
10.828
附:,其中为样本容量.
13.(2026·陕西宝鸡·模拟预测)随着科技的进步,人工智能(AI)工具在职场中的应用日益广泛,像豆包、DeepSeek等常见的AI工具,已被证明能有效提升员工的工作效率和准确率.某公司为了解员工使用这类AI工具的熟练度,进行了一次内部统计,统计结果如下表:
能够熟练使用AI工具
不能够熟练使用AI工具
男员工
30
15
女员工
16
9
(1)根据的独立性检验,能否认为性别与使用AI工具的熟练度具有相关性?
(2)现按熟练度采用分层抽样的方法从该公司的男员工中随机抽取12人,再从这12人中随机抽取3人,记其中不能够熟练使用AI工具的人数为,求的分布列以及数学期望.
附:,其中.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
14.(25-26高二下·河南南阳·期中)为研究不同性别对取暖器“最佳舒适温度”是否不低于的认同差异,某公司随机对400名用户(男女用户各占一半)进行了调查,其中,认为“最佳舒适温度”不低于的女性用户数量占女性用户总数的,认为“最佳舒适温度”不低于的男性用户数量占总用户数的.
性别
最佳舒适温度
合计
男
女
合计
400
(1)完成列联表,并根据小概率值的独立性检验,分析认同取暖器“最佳舒适温度”是否不低于是否与性别有关;
(2)从样本中的认为取暖器“最佳舒适温度”低于的用户中随机抽取2人,求这2人中至少有1名女性的概率.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
1 / 1
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。