内容正文:
【考点通关】2025-2026学年高二数学高频考点与解题策略(人教A版2019选择性必修第三册)
专题15 列联表与独立性检验6种常见考法归类(53题)
学科网(北京)股份有限公司1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
考点一 等高堆积条形图的应用
考点二 列联表
考点三 独立性检验的概念及辨析
考点四 根据独立性检验求参数
考点五 卡方的计算
考点六 独立性检验的综合应用
知识点1 数值变量和分类变量
1、数值变量:数值变量的取值为实数,其大小和运算都有实际含义.
2、分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
注:分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.
变量的不同“值”表示个体所属的不同类别,像这样的变量才是分类变量.
知识点2 2×2列联表
1.2×2列联表给出了成对分类变量数据的交叉分类频数.
2.定义一对分类变量X和Y,我们整理数据如下表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
像这种形式的数据统计表称为2×2列联表.
最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是样本容量.
注:分类变量与列联表的实际应用
利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
知识点3 等高堆积条形图
等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误
知识点4 独立性检验
1.定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.
2.χ2=,其中n=a+b+c+d.
注:(1)卡方越小,独立性越强,相关性越弱;卡方越大,独立性越弱,相关性越强.
(2)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
根据所给的观测值,与所给的临界值表中的数据进行比较,即可得出结论.
3.有关“相关的检验”
用χ2进行“相关的检验”步骤
(1)零假设:即先假设两变量间没关系.
(2)计算χ2:套用χ2的公式求得χ2值.
(3)查临界值:结合所给小概率值α查得相应的临界值xα.
(4)下结论:比较χ2与xα的大小,并作出结论.
4.有关“无关的检验”
运用独立性检验的方法
(1)列出2×2列联表,根据公式计算χ2.
(2)比较χ2与xα的大小作出结论.
5.独立性检验解决实际问题的主要环节
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
注:独立性检验和反证法:反证法不会出错,而独立性检验依据的是小概率事件几乎不发生.
6.下表给出了产独立性检验中几个常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
7. 临界值
统计量也可以用来作相关性的度量,越小说明变量之间越独立,越大说明变量之间越相关
.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,这个临界值就可作为判断大小的标准.
策略方法
一、分类变量与数值变量的辨析
1.核心定义
(1)数值变量:取值为实数,大小与运算有实际意义,如身高、成绩、产量;
(2)分类变量:取值表示类别归属,无大小与运算意义,如性别、是否患病、是否喜欢。
2.区分方法
(1)看取值含义:表示“多少”→数值变量;表示“属于哪类”→分类变量;
(2)看运算意义:加减乘除有意义→数值变量;无意义→分类变量。
3.高频考点
(1)独立性检验只适用于分类变量;
(2)回归分析适用于数值变量。
二、2×2列联表的构造与读取
1.标准结构
(1)行:分类变量(如性别:男、女);
(2)列:分类变量(如是否患病:是、否);
(3)表格形式:
合计
合计
2.构造步骤
(1)明确两个分类变量及各自类别;
(2)统计每类组合的频数;
(3)计算行合计、列合计、总频数。
3.易错提醒
(1)行列位置不可随意颠倒;
(2)必须保证频数为非负整数;
(3)总频数必须正确。
三、等高堆积条形图的应用
1.作图原理
(1)以频率(比例)表示高度;
(2)同一类别高度和为1;
(3)直观展示两组频率差异。
2.读图判断相关性
(1)两段高度差越大,相关性越强;
(2)高度差越小,越倾向独立。
3.优缺点
(1)优点:直观、易懂、快速判断;
(2)缺点:不能给出犯错误概率,只能粗略判断。
四、卡方统计量的计算
(1);
(2)为总样本量。
五、独立性检验的完整步骤
1.提出零假设
(1):两个分类变量相互独立(无关);
(2)文字表述:如“患病与性别无关”。
2.计算卡方统计量
(1)列出2×2列联表;
(2)代入公式求。
3.确定临界值
(1)根据题目给定小概率值;
(2)查表得临界值。
4.比较与决策
(1)→推断不成立;
(2)结论:认为两个变量有关,犯错误概率不超过;
(3)→无充分证据推断不成立,认为独立。
六、独立性检验的结论规范表述
1.拒绝时
(1)在犯错误的概率不超过的前提下,认为两变量有关联;
(2)有的把握认为两变量有关。
2.不拒绝时
(1)没有充分证据推断两变量有关联;
(2)不能认为两变量有关。
3.易错提醒
(1)不能说“证明有关/无关”,只能说推断、认为;
(2)不能将概率解释为因果关系。
七、高频易错点
1.混淆分类变量与数值变量,误用独立性检验;
2.列联表位置填错,导致符号错误;
3.计算时忘记平方,或分子分母颠倒;
4.临界值记错,尤其3.841、6.635、10.828;
5.结论表述不规范,出现“证明”“确定”等绝对化词语;
6.求参数时忽略频数为非负整数的限制;
7.误认为越大,因果关系越强。
考点一 等高堆积条形图的应用
1.(2026高二·山西·期末)在统计中,研究两个分类变量之间的关联性时常用的图是( )
A.散点图 B.残差图 C.频率分布直方图 D.等高堆积条形图
2.(2026高二·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是___________.
3.(2026高三·广西南宁·期末)为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
4.(2026高三·北京·一轮复习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
5.(2026高三·江西新余·月考)如图为对某高中学生是否对父母说过“我爱你”这样的话的统计结果,则下列统计分析中不正确的是:( ).
A.男性被调查者没有对父母说过“我爱你”这样的话的人数比例高于女性
B.无论男女对母亲说“我爱你”这类话的比例都高于对父亲所说
C.大部分调查者没有对父母说过“我爱你”这样的话
D.经常对父母说“我爱你”这样的话的人数总计比例较女生比例有所下降,说明这张统计图的结果可能存在错误
6.(2026高二·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
7.【多选】(2026高二·吉林白山·期末)暑假结束后,为了解假期中学生锻炼身体情况,学生处对所有在校学生做问卷调查,并随机抽取了180人的调查问卷,其中男生比女生少20人,并将调查结果绘制得到等高堆积条形图.已知,其中,,在被调查者中,下列说法正确的是( )
A.男生中不经常锻炼的人数比女生中经常锻炼的人数多
B.男生中经常锻炼的人数比女生中经常锻炼的人多8人
C.经常锻炼者中男生的频率是不经常锻炼者中男生的频率的1.6倍左右
D.在犯错误的概率不大于0.01的条件下,可以认为假期是否经常锻炼与性别有关
考点二 列联表
8.(2026高三·全国·一轮复习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
9.(2026高二·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
10.(2026高二·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
11.(2026高二·广西钦州·期末)如下是一个列联表,则________.
yx
总计
总计
12.(2026高二·全国·课后作业)下表是、两班关于选择“物理”作为“加三学科”的意愿的列联表,请根据已有数据完善表格.
单位:人
类别
愿意选择“物理”
不愿意选择“物理”
总计
班
20
42
班
16
总计
44
考点三 独立性检验的概念及辨析
13.(2026高二·河南南阳·期中)下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
14.(2026高二·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
15.(2026高三·湖北恩施·开学考试)根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
16.(2026高三·江苏镇江·开学考试)某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用列联表计算得的观测值.
附表:
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )
A. B. C. D.
17.(2026高二·河南信阳·期末)调查某医院一段时间内婴儿出生的时间(白天与晚上)和性别(男与女)的关联性,对样本数据分析统计,计算得到,依据小概率值的独立性检验,下列说法正确的是( )(附:)
A.婴儿90%在白天出生
B.婴儿性别与出生时间无关联
C.有0.1的把握认为婴儿性别与出生时间有关联
D.婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1
18.(2026高二·天津和平·期末)某单位对员工是否愿意被外派与年龄的关系进行了一次谓查,根据独立性检验原理,处理所得数据之后发现,得到“是否愿意被外派与年龄有关”这个结论犯错误的概率大于0.001,而不大于0.01,则的值可能为( )
附表:
0.05
0.01
0.001
3.841
6.635
10.828
A.3.206 B.6.561 C.7.879 D.11.028
19.(2026高二·山东烟台·期中)根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
20.(2026·江苏苏州·模拟预测)设研究某两个属性变量时,作出零假设并得到2×2列联表,计算得,则下列说法正确的是( )
A.有99.5%的把握认为不成立 B.有5%的把握认为的反面正确
C.有95%的把握判断正确 D.有95%的把握能反驳
21.(2026高二·福建宁德·期末)根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把握认为 X 和Y 有关,则的值不可能为( )
2.072
2.706
3.841
6.635
7.879
0.150
0.100
0.050
0.010
0.005
A.2.819 B.5.512 C.6.635 D.8.243
22.(2026高二·天津滨海新区·月考)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是(参考数据:)( )
①若的观测值满足,我们有99%的把握认为吸烟与患肺病有关系;
②若的观测值满足,那么在100个吸烟的人中约有99人患有肺病;
③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病;
④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误.
A.②③ B.②③④ C.①②④ D.①④
23.(2026高二·陕西·期中)为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过( )
0.15
0.10
0.05
0.025
0.010
k
2.072
2.706
3.841
5.024
6.635
A. B. C. D.
24.【多选】(辽宁大连育明高中、丹东二中、本溪高中四校联考2026届高三学期教学质量调研数学试题)在独立性检验中,显著水平以及对应的分位数如下:
0.1
0.01
2.706
6.635
某社团就喜欢长跑与学生性别的关系进行了一个随机调查,根据男女生人数以及男女生是否喜欢长跑的人数,计算得,则( )
A.有的把握认为喜欢长跑与性别有关
B.“喜欢长跑”与“是女生”独立的概率不小于
C.在犯错误的概率不超过的前提下,可以认为是否喜欢长跑与性别无关
D.在犯错误的概率不超过的前提下,可以认为“喜欢长跑”与“是女生”不独立
25.【多选】(2026高二·山东青岛·竞赛)在检验分类变量X与Y是否有关的过程中,计算得到实验数据的统计量,已知,,则( )
A.在犯错误的概率不超过10%的前提下,可以认为X与Y没有关系
B.在犯错误的概率不超过10%的前提下,可以认为X与Y有关系
C.依据的独立性检验,可以认为X与Y不独立
D.依据的独立性检验,可以认为X与Y独立
26.【多选】(2026高二·安徽合肥·期末)某医疗机构通过抽样调查(样本容量),利用2×2列联表和统计量研究患肺癌是否与吸烟有关计算得,由小概率临界值表知,现给出四个结论,其中错误的是( )
A.根据小概率值的独立性检验,认为“患肺癌与吸烟无关”
B.在100个吸烟的人中约有99个人患肺癌
C.若老张吸烟,那么他有99%的可能性患肺癌
D.有99%的把握认为“患肺癌与吸烟有关”
考点四 根据独立性检验求参数
27.(2026高二·福建厦门·期中)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若我们推断不成立,此推断犯错误率不超过,则的最小值为( )
附:,附表:
0.05
0.01
3.841
6.635
A.7 B.8 C.9 D.10
喜欢短视频人数
不喜欢短视频人数
合计
男生人数
女生人数
合计
28.(2026高三·上海·单元测试)某校对“学生性别和喜欢某热门软件是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该软件的人数占男生人数的,女生喜欢该软件的人数占女生人数.若有95%的把握认为是否喜欢该软件和性别有关,则男生至少有__________人.
0.050
0.010
3.841
6.635
29.(2026高三·上海·课后作业)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生最少有多少人?
考点五 卡方的计算
30.(2026高三·全国·专题练习)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解岁年轻人的体质健康是否与性别有关,在月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到列联表.
性别
感冒
不感冒
总计
男
女
总计
依据表中数据,能否有的把握认为岁年轻人的体质健康与性别有关?若把表中所有数据都扩大到原来的倍,此时结论还一样吗?请解释其中原因,并简要说明如何调整调查可使此研究更严谨.
参考数据:
31.(2026高三·全国·专题练习)随着网络App的普及与发展,刷“抖音”成为了人们日常生活的一部分.某地区随机抽取了部分20~40岁的“抖音”用户,调查他们日均刷“抖音”的时间情况,所得数据统计如下表:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
男性
48
72
女性
24
56
依据小概率值的独立性检验,能否认为日均刷“抖音”时间的长短与性别有关?
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
32.(2026·四川绵阳·模拟预测)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床生产了件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值的独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.05
0.010
0.001
3.841
6.635
10.828
33.(2026高三·上海·课堂例题)为了调查商户每天销售额与每天线上销售时间之间的相关关系,随机选取45家商户进行跟踪调查,其中每日线上销售时间不少于6小时的商户有19家,余下的商户中,每天的销售额不足3万元的占,统计后得到如下列联表:
销售额不少于3万元(户)
销售额不足3万元(户)
合计
线上销售时间不少于6小时
4
19
线上销售时间不足6小时
合计
45
请完成上面的列联表,并判断是否有的把握认为“商户每天销售额与商户每天线上销售时间有关.”
参考公式:,其中.
0.50
0.40
0.25
0.15
0.010
0.05
0.025
0.010
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
34.(2026高三·全国·专题练习)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
附,
0.050
0.010
0.001
k
3.841
6.635
10.828
35.(2026高三·上海·随堂练习)2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如下表所示:
表一
表二
了解情况
Y
N
男
女
合计
人数
140
60
Y
80
N
40
合计
附:临界值参考表的参考公式
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
,其中
(1)请根据所提供的数据,完成上面的列联表(表二);
(2)判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系.
36.(2026高三·四川宜宾·开学考试)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).
测得40只小鼠体重如下(单位:):(已按从小到大排好)
对照组:17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.4 26.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5 27.6 28.3
实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.2 14.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0
附:,其中.
0.10
0.05
0.010
2.706
3.841
6.635
(1)求40只小鼠体重的中位数,并完成下面列联表:
合计
对照组
实验组
合计
(2)根据列联表,能否有的把握认为药物对小鼠生长有抑制作用.
37.(2026高二·辽宁·期末)某机构为了解学生是否喜欢绘画与性别有关,调查了400名学生(男女各一半)的选择,发现喜欢绘画的人数是300,喜欢绘画的男生比女生少60人.
(1)完成下面的列联表;
喜欢绘画
不喜欢绘画
总计
男生
女生
总计
(2)根据调查数据回答:有的把握认为是否喜欢绘画与性别有关吗?
附:.临界值表如下:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
38.(2026高二·辽宁·期末)某市为了了解学生体育运动的时间长度是否与性别因素有关,从某几所学校中随机调查了男、女生各100名的平均每天体育运动时间,得到如下数据:
分钟性别
女生
10
30
50
10
男生
5
20
50
25
根据学生课余体育运动要求,平均每天体育运动时间在内认定为“合格”,否则被认定为“不合格”.根据已知条件完成下面的列联表,并回答能否有的把握认为“学生体育运动时间与学生性别因素有关联”
不合格
合格
合计
女生
男生
合计
附:,
(其中.
0.15
0.10
0.05
0.025
0.010
0.001
2.072
2.706
3.841
5.024
6.635
7.879
39.(2026高二·西藏拉萨·期末)随着互联网的发展,网络已成为人们日常学习、工作和生活不可或缺的部分,互联网在带给人们生活便捷与高效工作的同时,网络犯罪也日益增多.为了防范网络犯罪与网络诈骗,某学校举办“网络安全宣传倡议”活动.该学校从全体学生中随机抽取了100名男生和100名女生对“网络安全宣传倡议”的了解情况进行问卷调查.下面是问卷调查得分的频率分布表:
成绩(分)
频率
将得分不低于70分的学生视作了解,已知有50名男生问卷调查得分不低于70分.
(1)根据已知条件完成下面列联表;
男
女
合计
了解
不了解
合计
(2)判断是否有的把握认为对“网络安全宣传倡议”的了解情况与性别有关?
参考公式:,其中.
参考数据:
0.10
0.05
0.010
0.005
2.706
3.841
6.635
7.879
40.(2026高二·青海西宁·期末)为进一步保护环境,加强治理空气污染,某市环保监测部门对市区空气质量进行调研,随机抽查了市区300天的空气质量等级与当天空气中的浓度(单位:),整理数据得到下表:
的浓度
空气质量等级
1(优)
84
18
6
2(良)
15
21
24
3(轻度污染)
9
24
27
4(中度污染)
3
36
33
若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.
(1)完成下面的列联表:
的浓度
空气质量
合计
空气质量好
空气质量不好
合计
(2)根据(1)中的列联表,判断是否有的把握认为该市一天的空气质量与当天的浓度有关?
附:;
0.050
0.010
0.001
3.841
6.635
10.828
考点六 独立性检验的综合应用
41.(2026高二·上海奉贤·期末)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断是否有99%的把握认为我市市民网购与性别有关?
(2)现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
42.(2026·重庆北碚·模拟预测) 某高校为调查人们对 AI 知识掌握的熟悉程度与学历是否有关,组织了相关的答题活动, 满分 100 分. 答题完成后, 工作人员从中随机抽取 200 人作为样本,得到如下数据.
人数分数 学历
本科及以下
37
33
12
10
5
3
本科以上
20
20
10
10
30
10
(1)若得分不小于 60 分,则认为对 AI 知识掌握的程度为熟悉,否则为不熟悉;
熟悉程度
学历
合计
本科及以下
本科以上
熟悉
不熟悉
合计
根据样本数据补全上面的 列联表,并依据小概率值 的独立性检验,能否认为熟悉AI程度与参与人员学历有关系.
(2)从样本里学历为本科以上的人群中,采用按比例分层随机抽样的方法抽取 10 个人,再从这 10 人中随机抽出 3 人进行访谈,记这 3 人中分数在 的人数为 ,求 的分布列及数学期望.
附:, .
0.05
0.01
0.001
3.841
6.635
10.828
43.(2026·河南·模拟预测)新能源汽车越来越受到年轻人的青睐.某品牌新能源汽车有限公司为了了解新能源汽车爱好者对本公司生产的新能源汽车款和款的满意度进行了市场调研,在社会上随机调查了200名新能源爱好者,得到如下列联表:
满意
不满意
合计
新能源汽车A款
80
新能源汽车B款
30
合计
150
200
(1)请完善上述列联表,并判断能否有90%的把握认为新能源汽车的款型对满意度有影响;
(2)从这200位新能源爱好者中任选两人,在被调查的两人选择新能源汽车款型一致的条件下,试求他们对该新能源汽车款型均满意的概率.
附:,其中.
0.15
0.10
0.05
0.025
2.07
2.71
3.84
5.024
44.(2026·河北保定·模拟预测)某市体育局为调研市民体育锻炼情况与健康水平的关联性,随机抽取了120名18岁~60岁市民进行调查.将每周锻炼不少于3次的市民归为“高频锻炼组”,不足3次的归为“低频锻炼组”;体质检测达到《国民体质测定标准》优秀和良好等级的定为“体质达标”,否则为“体质不达标”.调查结果整理为如下不完整的列联表.
体质达标
体质不达标
合计
高频锻炼组
m
15
60
低频锻炼组
25
v
u
合计
s
t
120
附:,其中.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
(1)请根据列联表中的数据,写出m,v,s,t,u的值;
(2)依据小概率值的独立性检验,分析该市市民体育锻炼频次是否与体质达标有关联;
(3)该市计划从抽到的120人中体质不达标市民中抽取部分人员开展“科学健身指导”活动,现按高频锻炼组和低频锻炼组分层,通过分层抽样抽取10人展开指导活动,再从这10人中随机抽取3人进行专项访谈,求抽取的3人中至多有1人来自高频锻炼组的概率.
45.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
46.(2026·陕西咸阳·模拟预测)咸阳文旅部门统计了某景点在2025年2月至6月的旅游收入(单位:万元),得到以下数据:
月份
2
3
4
5
6
旅游收入
10
12
11
12
20
(1)根据表中所给数据,用相关系数判断,是否可用线性回归模型拟合与的关系?(当时,认为线性相关性较强),若可以,求出关于之间的线性回归方程;若不可以,请说明理由;
(2)为调查游客对该景点的评价情况,随机抽查了100名游客,得到如下列联表,请填写下面的列联表,依据的独立性检验,能否认为“游客是否喜欢该景点与性别有关联”.
喜欢
不喜欢
总计
男
50
女
30
总计
60
参考公式:相关系数,参考数据:.
线性回归方程:,其中
,其中.
临界值表:
0.010
0.005
0.001
6.635
7.879
10.828
47.(2026·江苏·模拟预测)人工智能技术(简称技术)已成为引领世界新一轮科技革命和产业革命的战略性技术,并迅速在各行各业中得到应用和推广,教育行业也不例外.某市教体局为调查本市中学教师使用技术辅助教学的情况,随机抽取了该市名中学教师,统计了他们使用技术帮助制作课件的情况,并将一周内使用技术帮助制作课件的节次不少于次的认定为喜欢使用技术,否则认定为不喜欢使用技术,制作得到如下列联表(部分数据缺失).
年龄
是否喜欢使用技术
合计
是
否
不超过岁
超过岁
合计
(1)已知从这名年龄超过岁的教师中随机抽取人,人都喜欢使用技术的概率为.据此完善上面的列联表,并依据小概率值的独立性检验,判断该市教师是否喜欢使用技术与年龄有关;
(2)在(1)的条件下,将频率视为概率计算,从该市全部中学教师中随机抽取人,求其中至少人喜欢使用技术的条件下,人年龄均不超过岁的概率.
附:,其中.
48.(2026·山东泰安·模拟预测)为深入落实“健康第一”的教育理念,某高中为了解高三学生每天运动时间,从2000名学生中随机抽取了100名学生进行调查,得到的数据如表所示
日均运动时间(小时)
男生人数
5
20
20
10
女生人数
15
20
6
4
(1)该校高三2000名学生中,日均运动时间不足1小时的学生约为多少人?
(2)估计该校高三学生日均运动时间的平均数;
(3)根据小概率值的独立性检验,能否认为“该校高三学生日均运动时间不小于1.5小时”与“性别”有关联?
附,其中.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
49.(2026高二·安徽六安·期末)某工厂生产某款电池,在满电状态下能够持续放电时间不低于小时的为合格品,工程师选择某台生产电池的机器进行参数调试,在调试前后,分别在其产品中随机抽取样本数据进行统计,制作了如下的列联表:
产品
合格
不合格
合计
调试前
45
15
60
调试后
35
5
40
合计
80
20
100
(1)根据表中数据,依据显著性水平的独立性检验,能否认为参数调试与产品质量有关联;
(2)现从调试前的样本中按合格和不合格,用分层随机抽样法抽取8件产品重新做参数调试,再从这8件产品中随机抽取3件做对比分析.记抽取的3件中合格的件数为X,求 X的分布列和期望;
(3)用样本分布的频率估计总体分布的概率,若现在随机抽取调试后的产品1000件,记其中合格的件数为Y, 求使事件“”的概率最大时k的取值.参考公式及数据: 其中.
0.05
0.025
0.01
0.005
0.001
3.841
5.024
6.635
7.879
10.828
50.(2026·河北邯郸·模拟预测)2026年马年春晚是大模型与节目结合最多的一场春晚,其中大模型“豆包”贯穿整场晚会.为了了解人们对大模型“豆包”应用的关注程度,现随机抽取不同年龄段的1000人进行调查统计,得到如下列联表:
年龄
“豆包”应用
合计
不关注
关注
不超过50岁
400
600
超过50岁
300
合计
1000
(1)完成列联表,并依据小概率值的独立性检验,判断人们对大模型“豆包”应用的关注程度是否与年龄有关联;
(2)从不超过50岁的调查者中按比例分配的分层随机抽样抽取6人,从这6人中随机抽取2人做进一步的访谈,记抽到的2人中关注“豆包”应用的人数为X,求X的分布列和数学期望.
附:,其中.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
51.(2026·上海徐汇·模拟预测)为落实《全民健身条例》,某区体育局对本区居民的健身场所选择偏好进行调研.数据显示,居民主要选择商业健身场馆(如健身房、体育中心)和社区公共运动场(如小区健身点、街心公园)两类场所.为了解年龄因素是否影响健身场所的选择,研究人员将成年居民分为青壮年组(岁且岁)和中老年组(岁),从该区随机抽取170名成年居民进行调查,得到如下不完整的列联表:
青壮年
中老年
合计
商业健身场馆
60
社区公共运动场
50
合计
80
170
(1)请补充列联表,并根据表中数据判断能否有的把握认为年龄与居民健身场所的选择有关;
(2)用分层抽样的方式从选择社区公共运动场的居民中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望.
参考公式及数据:,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
青壮年
中老年
合计
商业健身场馆
60
40
100
社区公共运动场
20
50
70
合计
80
90
170
因为,
因此有95%的把握认为年龄与居民健身场所的选择有关.
52.(2026·重庆沙坪坝·模拟预测)重庆城市足球超级联赛(简称 “渝超”)引发了广泛关注. 某地区随机抽取了部分市民,调查他们对赛事的关注情况, 得到如下表格:
性别
不关注赛事
关注赛事
男性
女性
(1)根据小概率值 的独立性检验,能否认为关注 “渝超” 赛事与性别有关?
(2)现从被调查的关注赛事的市民中,按照性别比例采用分层抽样的方法随机抽取 3 名市民参加 “渝超” 赛事知识问答. 已知男性、女性市民顺利完成知识问答的概率分别为 , 每个人是否顺利完成相互独立.求3人中顺利完成知识问答的总人数的分布列及其期望.
附:.
53.(2026·山东济宁·模拟预测)随着量子计算技术的突破,传统密码的安全性受到挑战.某实验室为研究“量子算力等级”与“密码破译成功率”的关系,进行了模拟测试,统计数据如下:
量子算力等级
密码破译成功
密码破译失败
合计
高算力量子机
64
16
80
低算力量子机
36
24
60
合计
100
40
140
(1)依据小概率值的独立性检验,即认为密码破译成功率是否与量子算力等级有关;
(2)该实验室使用两台不同算力的量子机(记高算力量子机为A机、低算力量子机为B机)对同一套传统密码进行破译测试,已知A机单次破译成功的概率为,失败的概率为;B机单次破译成功的概率为,失败的概率为;两台机器的破译过程相互独立.测试方案:先随机选择一台机器进行第一次破译,选中A机的概率为,选中B机的概率为;若第一次破译成功则停止测试;若第一次破译失败,则换用另一台机器进行第二次破译,无论第二次破译是否成功都停止测试,求破译成功的概率.
附:,
0.050
0.010
0.001
3.841
6.635
10.828
$【考点通关】2025-2026学年高二数学高频考点与解题策略(人教A版2019选择性必修第三册)
专题15 列联表与独立性检验6种常见考法归类(53题)
学科网(北京)股份有限公司1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
考点一 等高堆积条形图的应用
考点二 列联表
考点三 独立性检验的概念及辨析
考点四 根据独立性检验求参数
考点五 卡方的计算
考点六 独立性检验的综合应用
知识点1 数值变量和分类变量
1、数值变量:数值变量的取值为实数,其大小和运算都有实际含义.
2、分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
注:分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.
变量的不同“值”表示个体所属的不同类别,像这样的变量才是分类变量.
知识点2 2×2列联表
1.2×2列联表给出了成对分类变量数据的交叉分类频数.
2.定义一对分类变量X和Y,我们整理数据如下表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
像这种形式的数据统计表称为2×2列联表.
最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是样本容量.
注:分类变量与列联表的实际应用
利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
知识点3 等高堆积条形图
等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误
知识点4 独立性检验
1.定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.
2.χ2=,其中n=a+b+c+d.
注:(1)卡方越小,独立性越强,相关性越弱;卡方越大,独立性越弱,相关性越强.
(2)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
根据所给的观测值,与所给的临界值表中的数据进行比较,即可得出结论.
3.有关“相关的检验”
用χ2进行“相关的检验”步骤
(1)零假设:即先假设两变量间没关系.
(2)计算χ2:套用χ2的公式求得χ2值.
(3)查临界值:结合所给小概率值α查得相应的临界值xα.
(4)下结论:比较χ2与xα的大小,并作出结论.
4.有关“无关的检验”
运用独立性检验的方法
(1)列出2×2列联表,根据公式计算χ2.
(2)比较χ2与xα的大小作出结论.
5.独立性检验解决实际问题的主要环节
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
注:独立性检验和反证法:反证法不会出错,而独立性检验依据的是小概率事件几乎不发生.
6.下表给出了产独立性检验中几个常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
7. 临界值
统计量也可以用来作相关性的度量,越小说明变量之间越独立,越大说明变量之间越相关
.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,这个临界值就可作为判断大小的标准.
策略方法
一、分类变量与数值变量的辨析
1.核心定义
(1)数值变量:取值为实数,大小与运算有实际意义,如身高、成绩、产量;
(2)分类变量:取值表示类别归属,无大小与运算意义,如性别、是否患病、是否喜欢。
2.区分方法
(1)看取值含义:表示“多少”→数值变量;表示“属于哪类”→分类变量;
(2)看运算意义:加减乘除有意义→数值变量;无意义→分类变量。
3.高频考点
(1)独立性检验只适用于分类变量;
(2)回归分析适用于数值变量。
二、2×2列联表的构造与读取
1.标准结构
(1)行:分类变量(如性别:男、女);
(2)列:分类变量(如是否患病:是、否);
(3)表格形式:
合计
合计
2.构造步骤
(1)明确两个分类变量及各自类别;
(2)统计每类组合的频数;
(3)计算行合计、列合计、总频数。
3.易错提醒
(1)行列位置不可随意颠倒;
(2)必须保证频数为非负整数;
(3)总频数必须正确。
三、等高堆积条形图的应用
1.作图原理
(1)以频率(比例)表示高度;
(2)同一类别高度和为1;
(3)直观展示两组频率差异。
2.读图判断相关性
(1)两段高度差越大,相关性越强;
(2)高度差越小,越倾向独立。
3.优缺点
(1)优点:直观、易懂、快速判断;
(2)缺点:不能给出犯错误概率,只能粗略判断。
四、卡方统计量的计算
(1);
(2)为总样本量。
五、独立性检验的完整步骤
1.提出零假设
(1):两个分类变量相互独立(无关);
(2)文字表述:如“患病与性别无关”。
2.计算卡方统计量
(1)列出2×2列联表;
(2)代入公式求。
3.确定临界值
(1)根据题目给定小概率值;
(2)查表得临界值。
4.比较与决策
(1)→推断不成立;
(2)结论:认为两个变量有关,犯错误概率不超过;
(3)→无充分证据推断不成立,认为独立。
六、独立性检验的结论规范表述
1.拒绝时
(1)在犯错误的概率不超过的前提下,认为两变量有关联;
(2)有的把握认为两变量有关。
2.不拒绝时
(1)没有充分证据推断两变量有关联;
(2)不能认为两变量有关。
3.易错提醒
(1)不能说“证明有关/无关”,只能说推断、认为;
(2)不能将概率解释为因果关系。
七、高频易错点
1.混淆分类变量与数值变量,误用独立性检验;
2.列联表位置填错,导致符号错误;
3.计算时忘记平方,或分子分母颠倒;
4.临界值记错,尤其3.841、6.635、10.828;
5.结论表述不规范,出现“证明”“确定”等绝对化词语;
6.求参数时忽略频数为非负整数的限制;
7.误认为越大,因果关系越强。
考点一 等高堆积条形图的应用
1.(2026高二·山西·期末)在统计中,研究两个分类变量之间的关联性时常用的图是( )
A.散点图 B.残差图 C.频率分布直方图 D.等高堆积条形图
【答案】D
【分析】根据统计图的适用对象即可求解.
【详解】在统计中,研究两个分类变量之间的关联性时常用的图是等高堆积条形图,
散点图是研究两个变量之间相关关系时用,残差是研究拟合效果时用到的,频率分布直方图是研究频率分布时用到的,
故选:D
2.(2026高二·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是___________.
【答案】乙
【分析】根据选项中的图形,即可直接求解.
【详解】等高条形图中有两个高度相同的矩形,每个矩形都有两个颜色,观察下方颜色区域的高度,如果高度差越大,则两个分类变量关系越强,观察四个选项可知,B选项中带颜色区域的高度差最大,两个分类变量、相关关系最强;
故答案为:乙
3.(2026高三·广西南宁·期末)为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
【答案】B
【分析】根据等高条形图中的数据即可得出选项.
【详解】根据两个表中的等高条形图知,药物实验显示不服药与服药时患病差异较药物实验显示明显大,
所以药物的预防效果优于药物的预防效果,
故选:B.
4.(2026高三·北京·一轮复习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
【答案】C
【分析】通过对等高堆积条形图的分析,结合所列列联表及不等式性质,逐一对每个选项进行推理判断即可.
【详解】设等高条形图对应列联表如下:
岁及以上
岁以下
总计
男性
女性
总计
根据第个等高条形图可知,岁及以上男性比岁及以上女性多,即;
岁以下男性比岁以下女性多,即.
根据第个等高条形图可知,男性中岁及以上的比岁以下的多,即;
女性中岁及以上的比岁以下的多,即,
对于A,男性人数为,女性人数为,
因为,所以,所以A正确;
对于B,岁及以上女性人数为,岁以下女性人数为,
因为,所以B正确;
对于C,岁以下男性人数为,岁及以上女性人数为,
无法从图中直接判断与的大小关系,所以C不一定正确;
对于D,岁及以上的人数为,岁以下的人数为,
因为,所以,所以D正确.
故选:C.
5.(2026高三·江西新余·月考)如图为对某高中学生是否对父母说过“我爱你”这样的话的统计结果,则下列统计分析中不正确的是:( ).
A.男性被调查者没有对父母说过“我爱你”这样的话的人数比例高于女性
B.无论男女对母亲说“我爱你”这类话的比例都高于对父亲所说
C.大部分调查者没有对父母说过“我爱你”这样的话
D.经常对父母说“我爱你”这样的话的人数总计比例较女生比例有所下降,说明这张统计图的结果可能存在错误
【答案】D
【分析】根据统计图中的数据进行分析,判断每个选项的正确性.
【详解】对于A选项,观察统计图,比较男性和女性未对父母说过“我爱你”的比例,
发现男性未说的比例高于女性,所以A选项正确.
对于B选项,分别对比男女对母亲和对父亲说“我爱你”的比例,
能看出无论男女对母亲说的比例都高于对父亲说的比例,所以B选项正确.
对于C选项,从统计图整体来看,未说过“我爱你”的人数比例较大,
所以大部分调查者没有对父母说过“我爱你”这样的话,C选项正确.
对于D选项,经常对父母说“我爱你”的人数总计比例较女生比例有所下降,
并不能直接说明统计图结果存在错误,有可能是实际调查结果就是如此,所以D选项错误.
故选:D
6.(2026高二·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【答案】A
【分析】分析等高堆积条形图可直接得到答案.
【详解】原图是学校高二1、2班本期中期考试数学成绩优秀率的等高堆积条形图,
从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,BC错误;
两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误;
故选:A.
7.【多选】(2026高二·吉林白山·期末)暑假结束后,为了解假期中学生锻炼身体情况,学生处对所有在校学生做问卷调查,并随机抽取了180人的调查问卷,其中男生比女生少20人,并将调查结果绘制得到等高堆积条形图.已知,其中,,在被调查者中,下列说法正确的是( )
A.男生中不经常锻炼的人数比女生中经常锻炼的人数多
B.男生中经常锻炼的人数比女生中经常锻炼的人多8人
C.经常锻炼者中男生的频率是不经常锻炼者中男生的频率的1.6倍左右
D.在犯错误的概率不大于0.01的条件下,可以认为假期是否经常锻炼与性别有关
【答案】BCD
【分析】根据男生比女生少20人,建立等式求出男生、女生的人数,建立列联表,利用列联表中的信息解决ABC,利用独立性检验来解决D选项.
【详解】解:设男生人数为,则女生人数为,
由题得,
解得,即在被调查者中,男、女生人数为80,100,可得到如下列联表,
性别
锻炼情况
合计
经常锻炼
不经常锻炼
男
48
32
80
女
40
60
100
合计
88
92
180
由表可知,A显然错误,
男生中经常锻炼的人数比女生中经常锻炼的人数多B正确;
在经常锻炼者中是男生的频率为,在不经常锻炼者中是男生的频率为C正确;
零假设:假期是否经常锻炼与性别无关,
则,根据小概率值的独立性检验,我们推断不成立,
即认为假期是否经常锻炼与性别有关,此推断犯错误概率不大于0.01,D正确,
故选:BCD.
考点二 列联表
8.(2026高三·全国·一轮复习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【答案】C
【分析】根据联表计算求参即可.
【详解】因为.所以.又,所以.
故选:C.
9.(2026高二·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
【答案】8
【分析】根据列联表的性质,求出a,b,d的值,即可得答案.
【详解】由列联表的性质,可得:,可得,
所以.
故答案为:8
10.(2026高二·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
【答案】74
【分析】根据联表性质计算求解.
【详解】由题意知,所以.
故答案为:.
11.(2026高二·广西钦州·期末)如下是一个列联表,则________.
yx
总计
总计
【答案】
【分析】根据列联表的概念,可得答案.
【详解】由题意可得,则,可得,所以.
故答案为:.
12.(2026高二·全国·课后作业)下表是、两班关于选择“物理”作为“加三学科”的意愿的列联表,请根据已有数据完善表格.
单位:人
类别
愿意选择“物理”
不愿意选择“物理”
总计
班
20
42
班
16
总计
44
【答案】
【分析】根据已知条件补全联表即可.
【详解】根据已知条件得出,
又因为,所以,所以,
所以.
所以.
考点三 独立性检验的概念及辨析
13.(2026高二·河南南阳·期中)下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
【答案】B
【分析】根据独立性检验的基本思想,即可判断选项.
【详解】独立性检验是通过统计学方法来检验两个分类变量之间是否存在关联性,
ACD满足独立性检验的基本思想,B选项只是公司的营业额这一个变量在过去5年的变化情况,不满足独立性检验的基本思想.
故选:B
14.(2026高二·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
【答案】A
【分析】根据卡方独立性检验规则,比较与临界值即可得出结论.
【详解】因为,所以牛的毛色与角无关.
故选:A.
15.(2026高三·湖北恩施·开学考试)根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
【答案】B
【分析】根据独立性检验的概念可得正确的选项.
【详解】因为,所以在显著性水平下,
没有充分证据拒绝原假设,因此我们认为变量与是独立的,
故选:B
16.(2026高三·江苏镇江·开学考试)某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用列联表计算得的观测值.
附表:
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )
A. B. C. D.
【答案】B
【分析】由独立性检验的原理的理解辨析可判断.
【详解】由题意知观测值,所以对照题中的附表可作出“这种血清能起到预防感冒的作用”出错的可能性不超过的结论.
故选:B
17.(2026高二·河南信阳·期末)调查某医院一段时间内婴儿出生的时间(白天与晚上)和性别(男与女)的关联性,对样本数据分析统计,计算得到,依据小概率值的独立性检验,下列说法正确的是( )(附:)
A.婴儿90%在白天出生
B.婴儿性别与出生时间无关联
C.有0.1的把握认为婴儿性别与出生时间有关联
D.婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1
【答案】D
【分析】求出并与比较即可求解.
【详解】因为,
依据小概率值的独立性检验,
所以婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1.
故选:D.
18.(2026高二·天津和平·期末)某单位对员工是否愿意被外派与年龄的关系进行了一次谓查,根据独立性检验原理,处理所得数据之后发现,得到“是否愿意被外派与年龄有关”这个结论犯错误的概率大于0.001,而不大于0.01,则的值可能为( )
附表:
0.05
0.01
0.001
3.841
6.635
10.828
A.3.206 B.6.561 C.7.879 D.11.028
【答案】C
【分析】由题意,结合小概率表,可判断的值应位于与之间,得到答案.
【详解】由题意得的值应位于与之间,故C正确,ABD错误.
故选:C
19.(2026高二·山东烟台·期中)根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
【答案】D
【分析】根据给定条件,利用独立性检验的意义逐项判断即得.
【详解】由,得吸烟与患肺癌有关联,此推断犯错误的概率不大于1%,D正确;
卡方检验仅说明吸烟与患肺癌两个变量间的关联性,无法量化个体情况,这两个变量间也无因果关系,ABC错误.
故选:D
20.(2026·江苏苏州·模拟预测)设研究某两个属性变量时,作出零假设并得到2×2列联表,计算得,则下列说法正确的是( )
A.有99.5%的把握认为不成立 B.有5%的把握认为的反面正确
C.有95%的把握判断正确 D.有95%的把握能反驳
【答案】D
【分析】根据独立性检验的概念以及计算步骤,可得答案.
【详解】依题意,,因此有95%的把握反驳,
故选:D.
21.(2026高二·福建宁德·期末)根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把握认为 X 和Y 有关,则的值不可能为( )
2.072
2.706
3.841
6.635
7.879
0.150
0.100
0.050
0.010
0.005
A.2.819 B.5.512 C.6.635 D.8.243
【答案】A
【分析】利用独立性检验的观测值对应临界表可得答案.
【详解】因为有不少于95%的把握认为 X 和Y 有关,
所以,只有A不满足要求.
故选:A
22.(2026高二·天津滨海新区·月考)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是(参考数据:)( )
①若的观测值满足,我们有99%的把握认为吸烟与患肺病有关系;
②若的观测值满足,那么在100个吸烟的人中约有99人患有肺病;
③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病;
④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误.
A.②③ B.②③④ C.①②④ D.①④
【答案】D
【分析】由给出的数据,结合观测值的意义判定即可.
【详解】若的观测值满足,则我们有的把握认为吸烟与患肺病有关系,
而得知有的把握认为吸烟与患肺病有关系时,仍有的可能性使推断出现错误,
但不能说明个吸烟的人中约有人患有肺病,
也不能说明每个吸烟的人有的可能性会患肺病.
故①④正确、②③错误.
故选:D
23.(2026高二·陕西·期中)为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过( )
0.15
0.10
0.05
0.025
0.010
k
2.072
2.706
3.841
5.024
6.635
A. B. C. D.
【答案】B
【分析】根据与临界值的大小关系确定犯错误的概率的范围.
【详解】因为,结合表格可知,
所以认为“性别与喜欢数学有关”犯错误的概率不超过0.010.
故选:B
24.【多选】(辽宁大连育明高中、丹东二中、本溪高中四校联考2026届高三学期教学质量调研数学试题)在独立性检验中,显著水平以及对应的分位数如下:
0.1
0.01
2.706
6.635
某社团就喜欢长跑与学生性别的关系进行了一个随机调查,根据男女生人数以及男女生是否喜欢长跑的人数,计算得,则( )
A.有的把握认为喜欢长跑与性别有关
B.“喜欢长跑”与“是女生”独立的概率不小于
C.在犯错误的概率不超过的前提下,可以认为是否喜欢长跑与性别无关
D.在犯错误的概率不超过的前提下,可以认为“喜欢长跑”与“是女生”不独立
【答案】AD
【详解】假设“喜欢长跑”与“是女生”独立,则我们就观察到了一个概率不超过的事件:
亦即在犯错误的概率不超过的前提下,可以认为“喜欢长跑”与“是女生”不独立
(也称为是否喜欢长跑与性别有关);或说有的把握认为是否喜欢长跑与性别有关,BC错误,AD正确.
25.【多选】(2026高二·山东青岛·竞赛)在检验分类变量X与Y是否有关的过程中,计算得到实验数据的统计量,已知,,则( )
A.在犯错误的概率不超过10%的前提下,可以认为X与Y没有关系
B.在犯错误的概率不超过10%的前提下,可以认为X与Y有关系
C.依据的独立性检验,可以认为X与Y不独立
D.依据的独立性检验,可以认为X与Y独立
【答案】BD
【分析】根据,利用独立性检验的原理即可解题.
【详解】,所以在犯错误的概率不超过10%的前提下,
可以认为X与Y有关系,故A错误,B正确;
又,所以依据的独立性检验,可以认为X与Y独立,故C错误,D正确;
故选:BD.
26.【多选】(2026高二·安徽合肥·期末)某医疗机构通过抽样调查(样本容量),利用2×2列联表和统计量研究患肺癌是否与吸烟有关计算得,由小概率临界值表知,现给出四个结论,其中错误的是( )
A.根据小概率值的独立性检验,认为“患肺癌与吸烟无关”
B.在100个吸烟的人中约有99个人患肺癌
C.若老张吸烟,那么他有99%的可能性患肺癌
D.有99%的把握认为“患肺癌与吸烟有关”
【答案】ABC
【分析】依据卡方值结合小概率值的独立性检验思想即可得解.
【详解】由题,所以根据小概率值的独立性检验,认为“患肺癌与吸烟有关”,
即有的把握认为“患肺癌与吸烟有关”,故选项D正确,其余都是错误的.
故选:ABC.
考点四 根据独立性检验求参数
27.(2026高二·福建厦门·期中)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若我们推断不成立,此推断犯错误率不超过,则的最小值为( )
附:,附表:
0.05
0.01
3.841
6.635
A.7 B.8 C.9 D.10
【答案】C
【分析】根据题意可得列联表,由已知数据计算,根据独立性检验的结论,列不等式求的取值范围,得最小值.
【详解】根据题意,不妨设男生中喜欢短视频的人数为人,男生中不喜欢短视频的人数为人,女生中喜欢短视频的人数为人,女生中不喜欢短视频的人数为人.
所以可得列联表如下:
喜欢短视频人数
不喜欢短视频人数
合计
男生人数
女生人数
合计
于是,
由于推断不成立,此推断犯错误率不超过,
所以依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,且,于是最小值为.
故选:C
28.(2026高三·上海·单元测试)某校对“学生性别和喜欢某热门软件是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该软件的人数占男生人数的,女生喜欢该软件的人数占女生人数.若有95%的把握认为是否喜欢该软件和性别有关,则男生至少有__________人.
0.050
0.010
3.841
6.635
【答案】12
【分析】由有的把握认为是否喜欢该软件和性别有关可得,列方程求男生人数的范围,结合条件确定男生的人数的最小值.
【详解】设男生人数为,则女生人数为,则列联表如下:
喜欢该软件
不喜欢该软件
合计
男生
女生
合计
若有的把握认为是否喜欢该软件和性别有关,则,
即,解得.
又因为,,,为整数,所以男生至少有人.
故答案为:12.
29.(2026高三·上海·课后作业)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生最少有多少人?
【答案】45
【分析】先根据题意列出列联表,然后计算出,即可求解.
【详解】解:设男生的人数为,
根据题意列出列联表如下表所示:
男生
女生
合计
喜欢抖音
不喜欢抖音
合计
则,
由于有95%的把握认为是否喜欢抖音和性别有关,则,即,得,
∵,∴的最小值为9,
因此,调查人数中男生最少有45人.
考点五 卡方的计算
30.(2026高三·全国·专题练习)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解岁年轻人的体质健康是否与性别有关,在月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到列联表.
性别
感冒
不感冒
总计
男
女
总计
依据表中数据,能否有的把握认为岁年轻人的体质健康与性别有关?若把表中所有数据都扩大到原来的倍,此时结论还一样吗?请解释其中原因,并简要说明如何调整调查可使此研究更严谨.
参考数据:
【答案】答案见解析
【分析】根据独立性检验公式直接计算并判断即可.
【详解】零假设:岁年轻人的体质健康与性别无关.
根据列联表中的数据,经计算得到,
所以零假设成立,即没有的把握认为岁年轻人的体质健康与性别有关.
如果把所有数据都扩大倍后, ,
即有的把握认为岁年轻人的体质健康与性别有关.
所以扩大倍后,结论发生变化.为使此研究更严谨,可以扩大调查的样本容量.
31.(2026高三·全国·专题练习)随着网络App的普及与发展,刷“抖音”成为了人们日常生活的一部分.某地区随机抽取了部分20~40岁的“抖音”用户,调查他们日均刷“抖音”的时间情况,所得数据统计如下表:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
男性
48
72
女性
24
56
依据小概率值的独立性检验,能否认为日均刷“抖音”时间的长短与性别有关?
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】日均刷“抖音”时间的长短与性别无关
【分析】由题意可得列联表,再计算,对比临界值表即可得解
【详解】由题意,列联表如下:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
合计
男性
48
72
120
女性
24
56
80
合计
72
128
200
零假设为:日均刷“抖音”时间的长短与性别无关,
则,
故依据小概率值的独立性检验,我们推断零假设成立,
即日均刷“抖音”时间的长短与性别无关.
32.(2026·四川绵阳·模拟预测)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床生产了件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值的独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.05
0.010
0.001
3.841
6.635
10.828
【答案】(1)甲机床生产的产品中一级品的频率为:.
乙机床生产的产品中一级品的频率为:.
(2)依据小概率值的独立性检验,可认为甲机床的产品质量与乙机床的产品质量有差异.
【分析】(1)直接计算频率即可.
(2)先计算,再与给出的数据进行比较,即可得出结论.
【详解】(1)甲机床生产的产品中一级品的频率为:.
乙机床生产的产品中一级品的频率为:.
(2)由题意:.
因为,所以依据小概率值的独立性检验,可认为甲机床的产品质量与乙机床的产品质量有差异.
33.(2026高三·上海·课堂例题)为了调查商户每天销售额与每天线上销售时间之间的相关关系,随机选取45家商户进行跟踪调查,其中每日线上销售时间不少于6小时的商户有19家,余下的商户中,每天的销售额不足3万元的占,统计后得到如下列联表:
销售额不少于3万元(户)
销售额不足3万元(户)
合计
线上销售时间不少于6小时
4
19
线上销售时间不足6小时
合计
45
请完成上面的列联表,并判断是否有的把握认为“商户每天销售额与商户每天线上销售时间有关.”
参考公式:,其中.
0.50
0.40
0.25
0.15
0.010
0.05
0.025
0.010
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
【答案】表格见解析,有的把握认为“商户每天销售额与商户每天线上销售时间有关”.
【分析】完善列联表结合卡方公式计算,结合独立检验的基本思想得结论即可.
【详解】
销售额不少于3万元
销售额不足3万元
合计
线上销售时间不少于6小时
15
4
19
线上销售时间不足6小时
10
16
26
合计
25
20
45
因为,
所以有的把握认为“商户每天销售额与商户每天线上销售时间有关”.
34.(2026高三·全国·专题练习)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
附,
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】答案见解析
【分析】由所给数据结合公式求出的值,将其与临界值比较大小可得答案.
【详解】由已知,,
又,,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
35.(2026高三·上海·随堂练习)2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如下表所示:
表一
表二
了解情况
Y
N
男
女
合计
人数
140
60
Y
80
N
40
合计
附:临界值参考表的参考公式
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
,其中
(1)请根据所提供的数据,完成上面的列联表(表二);
(2)判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系.
【答案】(1)答案见解析
(2)有99%的把握认为对“云课堂”倡议了解情况与性别有关系
【分析】(1)由已知表格的数据完成列表即可;
(2)由(1)种表格的数据代入计算出观测值,对比之后即可得出结论.
【详解】(1)
男
女
合计
Y
80
60
140
N
20
40
60
合计
100
100
200
(2).
对照临界值表知,有99%的把握认为对“云课堂”倡议了解情况与性别有关系.
36.(2026高三·四川宜宾·开学考试)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).
测得40只小鼠体重如下(单位:):(已按从小到大排好)
对照组:17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.4 26.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5 27.6 28.3
实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.2 14.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0
附:,其中.
0.10
0.05
0.010
2.706
3.841
6.635
(1)求40只小鼠体重的中位数,并完成下面列联表:
合计
对照组
实验组
合计
(2)根据列联表,能否有的把握认为药物对小鼠生长有抑制作用.
【答案】(1)23.4,列联表见解析
(2)有的把握认为药物对小鼠生长有抑制作用.
【分析】(1)由中位数定义求出中位数,列出列联表;
(2)计算,与临界值比较得出结论.
【详解】(1)由所给数据从小到大排序:
,
所以40只小鼠体重的中位数为,
列联表如下:
合计
对照组
6
14
20
实验组
14
6
20
合计
20
20
40
(2)由公式可知,
所以有的把握认为药物对小鼠生长有抑制作用.
37.(2026高二·辽宁·期末)某机构为了解学生是否喜欢绘画与性别有关,调查了400名学生(男女各一半)的选择,发现喜欢绘画的人数是300,喜欢绘画的男生比女生少60人.
(1)完成下面的列联表;
喜欢绘画
不喜欢绘画
总计
男生
女生
总计
(2)根据调查数据回答:有的把握认为是否喜欢绘画与性别有关吗?
附:.临界值表如下:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析
(2)有的把握可以认为喜欢绘画与性别有关
【分析】(1)根据题意,很容易得到喜欢绘画的男生为120人,女生为180人,即可填表;(2)将列联表中的数据代入计算公式算出结果,再与小概率0.001对应的临界值10.828比较即可判断结果.
【详解】(1)列联表为:
喜欢绘画
不喜欢绘画
总计
男生
120
80
200
女生
180
20
200
总计
300
100
400
(2)由(1)中列联表得:
所以有的把握认为是否喜欢绘画与性别有关.
38.(2026高二·辽宁·期末)某市为了了解学生体育运动的时间长度是否与性别因素有关,从某几所学校中随机调查了男、女生各100名的平均每天体育运动时间,得到如下数据:
分钟性别
女生
10
30
50
10
男生
5
20
50
25
根据学生课余体育运动要求,平均每天体育运动时间在内认定为“合格”,否则被认定为“不合格”.根据已知条件完成下面的列联表,并回答能否有的把握认为“学生体育运动时间与学生性别因素有关联”
不合格
合格
合计
女生
男生
合计
附:,
(其中.
0.15
0.10
0.05
0.025
0.010
0.001
2.072
2.706
3.841
5.024
6.635
7.879
【答案】表格见解析,有的把握认为学生体育运动时间与学生性别因素有关联
【分析】根据卡方的计算,与临界值比较即可求解.
【详解】列联表:
不合格
合格
合计
女生
40
60
100
男生
25
75
100
合计
65
135
200
因为,
所以有的把握认为学生体育运动时间与学生性别因素有关联.
39.(2026高二·西藏拉萨·期末)随着互联网的发展,网络已成为人们日常学习、工作和生活不可或缺的部分,互联网在带给人们生活便捷与高效工作的同时,网络犯罪也日益增多.为了防范网络犯罪与网络诈骗,某学校举办“网络安全宣传倡议”活动.该学校从全体学生中随机抽取了100名男生和100名女生对“网络安全宣传倡议”的了解情况进行问卷调查.下面是问卷调查得分的频率分布表:
成绩(分)
频率
将得分不低于70分的学生视作了解,已知有50名男生问卷调查得分不低于70分.
(1)根据已知条件完成下面列联表;
男
女
合计
了解
不了解
合计
(2)判断是否有的把握认为对“网络安全宣传倡议”的了解情况与性别有关?
参考公式:,其中.
参考数据:
0.10
0.05
0.010
0.005
2.706
3.841
6.635
7.879
【答案】(1)列联表见解析
(2)有的把握认为对“网络安全宣传倡议”的了解情况与性别有关
【分析】(1)根据频率分布表求出问卷调查结果为“了解”的学生人数,从而求出其中女生的人数,即可得到列联表;
(2)计算出卡方,即可判断.
【详解】(1)问卷调查结果为“了解”的学生人数为,
又因为其中男生有人,所以其中女生有人,
所以列联表如下:
男
女
合计
了解
50
35
85
不了解
50
65
115
合计
100
100
200
(2)零假设:对“网络安全宣传倡议”的了解情况与性别无关,
由(1)可得,
根据小概率的独立性检验,我们推断不成立,
即认为对“网络安全宣传倡议”的了解情况与性别有关,此推断犯错误的概率不大于,
即有的把握认为对“网络安全宣传倡议”的了解情况与性别有关.
40.(2026高二·青海西宁·期末)为进一步保护环境,加强治理空气污染,某市环保监测部门对市区空气质量进行调研,随机抽查了市区300天的空气质量等级与当天空气中的浓度(单位:),整理数据得到下表:
的浓度
空气质量等级
1(优)
84
18
6
2(良)
15
21
24
3(轻度污染)
9
24
27
4(中度污染)
3
36
33
若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.
(1)完成下面的列联表:
的浓度
空气质量
合计
空气质量好
空气质量不好
合计
(2)根据(1)中的列联表,判断是否有的把握认为该市一天的空气质量与当天的浓度有关?
附:;
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)表格见解析
(2)有的把握认为该市一天的空气质量与当天的浓度有关.
【分析】(1)根据表中数据即可得出列联表;
(2)求出卡方值和临界值比较即可判断.
【详解】(1)由表格数据可得列联表如下:
的浓度
空气质量
合计
空气质量好
138
30
168
空气质量不好
72
60
132
合计
210
90
300
(2)由(1)知,
所以有的把握认为该市一天的空气质量与当天的浓度有关.
考点六 独立性检验的综合应用
41.(2026高二·上海奉贤·期末)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断是否有99%的把握认为我市市民网购与性别有关?
(2)现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)表格见解析;有
(2)
【分析】(1)完成列联表,由列联表,得,然后根据独立性检验判断即可;
(2)由题知抽取10人中,经常网购的有人,偶尔或不用网购的有人,由可计算选取的3人中至少有2人经常网购的概率.
【详解】(1)完成列联表:
经常网购
偶尔或不用网购
合计
男性
50
50
100
女性
70
30
100
合计
120
80
200
由列联表得,,
有99%的把握认为我市市民网购与性别有关.
(2)由题知女市民中利用分层抽样的方法抽取10人中,
经常网购的有人,偶尔或不用网购的有人,
选取的3人中至少有2人经常网购的概率,
所以所求概率为.
42.(2026·重庆北碚·模拟预测) 某高校为调查人们对 AI 知识掌握的熟悉程度与学历是否有关,组织了相关的答题活动, 满分 100 分. 答题完成后, 工作人员从中随机抽取 200 人作为样本,得到如下数据.
人数分数 学历
本科及以下
37
33
12
10
5
3
本科以上
20
20
10
10
30
10
(1)若得分不小于 60 分,则认为对 AI 知识掌握的程度为熟悉,否则为不熟悉;
熟悉程度
学历
合计
本科及以下
本科以上
熟悉
不熟悉
合计
根据样本数据补全上面的 列联表,并依据小概率值 的独立性检验,能否认为熟悉AI程度与参与人员学历有关系.
(2)从样本里学历为本科以上的人群中,采用按比例分层随机抽样的方法抽取 10 个人,再从这 10 人中随机抽出 3 人进行访谈,记这 3 人中分数在 的人数为 ,求 的分布列及数学期望.
附:, .
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)列联表见解析;熟悉AI程度与参与人员学历有关联;
(2)分布列见解析;.
【分析】(1)先根据题意列出列联表,再计算,并判断;
(2)先确定的可能取值,再分别求概率,列出分布列,最后求期望.
【详解】(1)
熟悉程度
学历
合计
本科及以下
本科以上
熟悉
30
60
90
不熟悉
70
40
110
合计
100
100
200
零假设为:熟悉AI程度与参与人员学历互相独立,即熟悉AI程度与参与人员学历无关联.
根据列联表中的数据,经计算得
根据小概率值的独立性检验,我们推断不成立,即认为熟悉AI程度与参与人员学历有关联,此推断犯错误的概率不大于0.001.
根据表中数据,熟悉AI的参与人员中,本科及以下和本科以上的频率分别为和,
不熟悉AI的参与人员中,本科及以下和本科以上的频率分别为和,
由可见,在被调查者中,熟悉AI的人中,本科以上学历是本科及以下学历的频率的将近2倍,于是,根据频率稳定于概率的原理,我们可以认为本科以上学历熟悉AI的概率明显大于本科及以下学历熟悉AI的概率,即本科以上学历更容易熟悉AI.
(2)从样本里学历为本科以上的人群中,采用按比例分层随机抽样的方法抽取10个人,这10人中,分数在的人数为3,则可取0,1,2,3;
,
,
,
,
的分布列为
0
1
2
3
.
43.(2026·河南·模拟预测)新能源汽车越来越受到年轻人的青睐.某品牌新能源汽车有限公司为了了解新能源汽车爱好者对本公司生产的新能源汽车款和款的满意度进行了市场调研,在社会上随机调查了200名新能源爱好者,得到如下列联表:
满意
不满意
合计
新能源汽车A款
80
新能源汽车B款
30
合计
150
200
(1)请完善上述列联表,并判断能否有90%的把握认为新能源汽车的款型对满意度有影响;
(2)从这200位新能源爱好者中任选两人,在被调查的两人选择新能源汽车款型一致的条件下,试求他们对该新能源汽车款型均满意的概率.
附:,其中.
0.15
0.10
0.05
0.025
2.07
2.71
3.84
5.024
【答案】(1)列联表见解析,没有
(2)
【分析】(1)根据题设数据完善表格,然后根据公式计算卡方统计量即可;
(2)根据条件概率公式计算即可.
【详解】(1)完善列联表如下:
满意
不满意
合计
新能源汽车A款
新能源汽车B款
合计
零假设:新能源汽车的款型对满意度没有影响,
,
根据小概率值的独立性检验,推断成立,
所以没有的把握认为新能源汽车的款型对满意度有影响;
(2)记事件为“被调查的两人选择新能源汽车款型一致”,事件为“他们对该新能源汽车款型均满意”,则
,,
所以,
所以在被调查的两人选择新能源汽车款型一致的条件下,他们对该新能源汽车款型均满意的概率为.
44.(2026·河北保定·模拟预测)某市体育局为调研市民体育锻炼情况与健康水平的关联性,随机抽取了120名18岁~60岁市民进行调查.将每周锻炼不少于3次的市民归为“高频锻炼组”,不足3次的归为“低频锻炼组”;体质检测达到《国民体质测定标准》优秀和良好等级的定为“体质达标”,否则为“体质不达标”.调查结果整理为如下不完整的列联表.
体质达标
体质不达标
合计
高频锻炼组
m
15
60
低频锻炼组
25
v
u
合计
s
t
120
附:,其中.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
(1)请根据列联表中的数据,写出m,v,s,t,u的值;
(2)依据小概率值的独立性检验,分析该市市民体育锻炼频次是否与体质达标有关联;
(3)该市计划从抽到的120人中体质不达标市民中抽取部分人员开展“科学健身指导”活动,现按高频锻炼组和低频锻炼组分层,通过分层抽样抽取10人展开指导活动,再从这10人中随机抽取3人进行专项访谈,求抽取的3人中至多有1人来自高频锻炼组的概率.
【答案】(1),,,,.
(2)认为该市市民体育锻炼频次与体质达标有关联
(3).
【分析】(1)利用列联表中行和、列和与总数之间的关系,通过简单的加减法运算求出的值.
(2)根据第(1)问求出的数据,代入卡方公式计算的观测值,并与给定的临界值进行比较,从而判断两个分类变量是否有关联.
(3)先求出高频锻炼组和低频锻炼组人数,然后根据分层抽样求出每组应抽取的人数,然后计算抽取的3人中至多有1人来自高频锻炼组的概率.
【详解】(1)由列联表数据关系可知,,,,,,综上,,,,,.
(2)零假设:市民体育锻炼频次与体质达标无关联.
根据列联表数据,计算
由于,根据小概率值的独立性检验,判断不成立,
因此,认为该市市民体育锻炼频次与体质达标有关联.
(3)体质不达标者,高频锻炼组15人,低频锻炼组35人,按分层抽样抽取10人,则高频锻炼组抽取人数为3人,低频锻炼组抽取人数为7人.
从这10人中随机抽取3人进行专项访谈,事件总数有种,
设“抽取的3人中至多有1人来自高频锻炼组”为事件A,则事件A包含“0人来自高频组”和“一人来自高频组”两种情况.
则.
所以抽取的3人中至多有1人来自高频锻炼组的概率为.
45.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)更适合,
(2)不能
【分析】(1)根据图形,即可作出判断,再将非线性回归方程转化成线性回归方程,再结合条件,求出,即可求解;
(2)根据条件,求出的值,结合条件,即可求解.
【详解】(1)由图可以判断,更适合作为未佩戴头盔人数与天数的回归方程类型,
由,得到,因为,则,
则,所以,则.
(2)零假设:市民佩戴头盔与性别无关联.
根据列联表中的数据,经计算得到:
,
根据小概率值的独立性检验,我们没有理由认为不成立,即认为市民佩戴头盔与性别没有关联.
46.(2026·陕西咸阳·模拟预测)咸阳文旅部门统计了某景点在2025年2月至6月的旅游收入(单位:万元),得到以下数据:
月份
2
3
4
5
6
旅游收入
10
12
11
12
20
(1)根据表中所给数据,用相关系数判断,是否可用线性回归模型拟合与的关系?(当时,认为线性相关性较强),若可以,求出关于之间的线性回归方程;若不可以,请说明理由;
(2)为调查游客对该景点的评价情况,随机抽查了100名游客,得到如下列联表,请填写下面的列联表,依据的独立性检验,能否认为“游客是否喜欢该景点与性别有关联”.
喜欢
不喜欢
总计
男
50
女
30
总计
60
参考公式:相关系数,参考数据:.
线性回归方程:,其中
,其中.
临界值表:
0.010
0.005
0.001
6.635
7.879
10.828
【答案】(1)可用,线性回归方程为;
(2)
喜欢
不喜欢
总计
男
40
10
50
女
20
30
50
总计
60
40
100
能认为“游客是否喜欢该景点与性别有关联”.
【分析】(1)利用表格中数据求出并判断,再利用最小二乘法求出回归直线方程.
(2)完善列联表,求出的观测值,与临界值比对作答.
【详解】(1)由表格中数据,得,
,
,
因此相关系数,
所以与的线性相关性较强,可用线性回归模型拟合与的关系;
,
所以关于之间的线性回归方程为.
(2)依题意,列联表为:
喜欢
不喜欢
总计
男
40
10
50
女
20
30
50
总计
60
40
100
零假设:认为“游客是否喜欢该景点与性别无关联”,
由表格中数据经计算,
依据小概率的独立性检验,推断不成立,
即能认为“游客是否喜欢该景点与性别有关联”,此推断犯错误的概率不大于0.001.
47.(2026·江苏·模拟预测)人工智能技术(简称技术)已成为引领世界新一轮科技革命和产业革命的战略性技术,并迅速在各行各业中得到应用和推广,教育行业也不例外.某市教体局为调查本市中学教师使用技术辅助教学的情况,随机抽取了该市名中学教师,统计了他们使用技术帮助制作课件的情况,并将一周内使用技术帮助制作课件的节次不少于次的认定为喜欢使用技术,否则认定为不喜欢使用技术,制作得到如下列联表(部分数据缺失).
年龄
是否喜欢使用技术
合计
是
否
不超过岁
超过岁
合计
(1)已知从这名年龄超过岁的教师中随机抽取人,人都喜欢使用技术的概率为.据此完善上面的列联表,并依据小概率值的独立性检验,判断该市教师是否喜欢使用技术与年龄有关;
(2)在(1)的条件下,将频率视为概率计算,从该市全部中学教师中随机抽取人,求其中至少人喜欢使用技术的条件下,人年龄均不超过岁的概率.
附:,其中.
【答案】(1)
年龄
是否喜欢使用技术
合计
是
否
不超过岁
超过岁
合计
有关
(2)
【分析】(1)根据组合计数原理以及古典概型的概率公式可得出关于的方程,解出的值,可完善列联表,利用独立性检验可得结论;
(2)记事件为至少人喜欢使用技术,事件为人年龄均不超过岁,求出、的值,利用条件概率公式可求得结果.
【详解】(1)设超过岁的教师中喜欢使用技术的有人,
由题意可得,即,整理可得,
因为,解得.
补充列联表如下
年龄
是否喜欢使用技术
合计
是
否
不超过岁
超过岁
合计
零假设该市教师喜欢使用技术与年龄无关,
.
依据小概率值的独立性检验,判断该校教师是否喜欢使用技术与年龄有关.
(2)记事件为至少人喜欢使用技术,事件为人年龄均不超过岁.
全市某名中学教师喜欢使用技术的概率,
不超过岁且喜欢使用的概率,
所以,
,
由条件概率公式可得.
48.(2026·山东泰安·模拟预测)为深入落实“健康第一”的教育理念,某高中为了解高三学生每天运动时间,从2000名学生中随机抽取了100名学生进行调查,得到的数据如表所示
日均运动时间(小时)
男生人数
5
20
20
10
女生人数
15
20
6
4
(1)该校高三2000名学生中,日均运动时间不足1小时的学生约为多少人?
(2)估计该校高三学生日均运动时间的平均数;
(3)根据小概率值的独立性检验,能否认为“该校高三学生日均运动时间不小于1.5小时”与“性别”有关联?
附,其中.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)人
(2)小时
(3)根据小概率值的独立性检验,能认为“日均运动时间不小于1.5小时”与“性别”有关联
【分析】(1)应用已知比例关系计算求解;
(2)应用已知数据计算100名学生日均运动时间的平均数,即可求解;
(3)先列表格计算,再与临界值比较判断求解.
【详解】(1)因为抽取的100人中日均运动时间不足1小时的人数占比为,
所以该校2000名学生中日均运动时间不足1小时人数约为人;
(2)该校名学生日均运动时间的平均数约为
,
所以该校高三学生日均运动时间的平均数为小时;
(3)作出列联表如表所示
日均运动时间
合计
男
25
30
55
女
35
10
45
合计
60
40
100
零假设:“日均运动时间不小于1.5小时”与“性别”无关联,
,
根据小概率值的独立性检验,推断不成立,即认为“日均运动时间不小于1.5小时”与“性别”有关联,此推断犯错误的概率不大于0.005.
49.(2026高二·安徽六安·期末)某工厂生产某款电池,在满电状态下能够持续放电时间不低于小时的为合格品,工程师选择某台生产电池的机器进行参数调试,在调试前后,分别在其产品中随机抽取样本数据进行统计,制作了如下的列联表:
产品
合格
不合格
合计
调试前
45
15
60
调试后
35
5
40
合计
80
20
100
(1)根据表中数据,依据显著性水平的独立性检验,能否认为参数调试与产品质量有关联;
(2)现从调试前的样本中按合格和不合格,用分层随机抽样法抽取8件产品重新做参数调试,再从这8件产品中随机抽取3件做对比分析.记抽取的3件中合格的件数为X,求 X的分布列和期望;
(3)用样本分布的频率估计总体分布的概率,若现在随机抽取调试后的产品1000件,记其中合格的件数为Y, 求使事件“”的概率最大时k的取值.参考公式及数据: 其中.
0.05
0.025
0.01
0.005
0.001
3.841
5.024
6.635
7.879
10.828
【答案】(1)无关联
(2)分布列见解析,
(3)875
【分析】(1)计算的值,将其与对应的小概率值比较即得;
(2)先算出抽取的8件产品中的合格品与不合格品的数目,再从中抽取3件,根据合格品件数的可能值运用超几何分布概率计算出概率,列出分布列计算数学期望即得;
(3)分析得出,利用二项分布概率公式得出再利用作商法分析得时,事件“”的概率最大.
【详解】(1)零假设为:假设依据的独立性检验,认为参数调试与产品质量无关联;
则,
故依据的独立性检验,没有充分证据说明零假设不成立,
因此可认为成立,即认为参数调试与产品质量无关联;
(2)依题意,用分层随机抽样法抽取的8件产品中,
合格产品有件,不合格产品有2件,
而从这8件产品中随机抽取3件,其中的合格品件数的可能值有1,2,3.
则,,,
故的分布为:
1
2
3
则;
(3)依题意,因随机抽取调试后的产品的合格率为,
故,则,
由,
故由可解得,
因,故当时,;
故由可解得,
即当时,;
故当事件“”的概率最大时,.
50.(2026·河北邯郸·模拟预测)2026年马年春晚是大模型与节目结合最多的一场春晚,其中大模型“豆包”贯穿整场晚会.为了了解人们对大模型“豆包”应用的关注程度,现随机抽取不同年龄段的1000人进行调查统计,得到如下列联表:
年龄
“豆包”应用
合计
不关注
关注
不超过50岁
400
600
超过50岁
300
合计
1000
(1)完成列联表,并依据小概率值的独立性检验,判断人们对大模型“豆包”应用的关注程度是否与年龄有关联;
(2)从不超过50岁的调查者中按比例分配的分层随机抽样抽取6人,从这6人中随机抽取2人做进一步的访谈,记抽到的2人中关注“豆包”应用的人数为X,求X的分布列和数学期望.
附:,其中.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,依据小概率值的独立性检验,可判断人们对大模型“豆包”应用的关注程度与年龄有关联.
(2)分布列见解析;
【分析】(1)补全列联表,进行零假设,求出,根据附表进行判断;
(2)根据超几何分布的特征,写出变量的分布列,根据分布列求出变量的数学期望.
【详解】(1)(1)补全的列联表如下:
年龄
“豆包”应用
合计
不关注
关注
不超过50岁
200
400
600
超过50岁
300
100
400
合计
500
500
1000
零假设为:人们对大模型“豆包”应用的关注程度与年龄无关.
根据表中数据,计算得到.
根据小概率值的独立性检验,没有充分证据推断成立,
即认为人们对大模型“豆包”应用的关注程度与年龄有关,该推断犯错误的概率不超过0.001.
(2)从不超过50岁的调查者中按比例分配的分层随机抽样抽取6人,
则关注“豆包”应用的有人,不关注“豆包”应用的有人,
则的所有可能取值为0,1,2,
的分布列为
0
1
2
的数学期望.
51.(2026·上海徐汇·模拟预测)为落实《全民健身条例》,某区体育局对本区居民的健身场所选择偏好进行调研.数据显示,居民主要选择商业健身场馆(如健身房、体育中心)和社区公共运动场(如小区健身点、街心公园)两类场所.为了解年龄因素是否影响健身场所的选择,研究人员将成年居民分为青壮年组(岁且岁)和中老年组(岁),从该区随机抽取170名成年居民进行调查,得到如下不完整的列联表:
青壮年
中老年
合计
商业健身场馆
60
社区公共运动场
50
合计
80
170
(1)请补充列联表,并根据表中数据判断能否有的把握认为年龄与居民健身场所的选择有关;
(2)用分层抽样的方式从选择社区公共运动场的居民中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望.
参考公式及数据:,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,有95%的把握认为年龄与健身场所选择有关
(2)的分布见解析,数学期望为(或约)
【分析】(1)先补全 2×2 列联表,再代入卡方独立性检验公式计算统计量,与 95% 置信度临界值比较,判断年龄与健身场所选择是否有关联;
(2)先按分层抽样确定抽取的青壮、中老年人数,再用超几何分布计算随机变量 X 的各取值概率,列出分布列并代入期望公式求数学期望.
【详解】(1)根据已知数据计算空缺值,得到完整列联表如下:
青壮年
中老年
合计
商业健身场馆
60
40
100
社区公共运动场
20
50
70
合计
80
90
170
因为,
因此有95%的把握认为年龄与居民健身场所的选择有关.
(2)选择社区公共运动场的居民共70人,其中青壮年20人、中老年50人,抽样比为,
因此抽取的样本中青壮年人数:,中老年人数:.
设抽取的7人中中老年人数为,则青壮年人数为,.
因为青壮年共4人,故,解得,又,
因此,对应的可能取值为.
总情况数为,
(对应或)时,,
(对应)时,,
(对应)时,,
(对应)时,,
因此,的分布列为:
1
3
5
7
所以
52.(2026·重庆沙坪坝·模拟预测)重庆城市足球超级联赛(简称 “渝超”)引发了广泛关注. 某地区随机抽取了部分市民,调查他们对赛事的关注情况, 得到如下表格:
性别
不关注赛事
关注赛事
男性
女性
(1)根据小概率值 的独立性检验,能否认为关注 “渝超” 赛事与性别有关?
(2)现从被调查的关注赛事的市民中,按照性别比例采用分层抽样的方法随机抽取 3 名市民参加 “渝超” 赛事知识问答. 已知男性、女性市民顺利完成知识问答的概率分别为 , 每个人是否顺利完成相互独立.求3人中顺利完成知识问答的总人数的分布列及其期望.
附:.
【答案】(1)认为关注 “渝超” 赛事与性别有关
(2)
0
1
2
3
【分析】(1)整理列联表数据代入卡方统计量公式计算,对比临界值得出结论;
(2)确定分层抽样人数,确定随机变量取值,分情况计算概率,列出分布列并求期望.
【详解】(1)整理列联表数据如下:
性别
不关注赛事
关注赛事
合计
男性
女性
合计
根据卡方公式:
,
已知小概率值,对应临界值,
,
根据的独立性检验,认为关注 “渝超” 赛事与性别有关.
(2)关注赛事的市民中,男性人,女性人,性别比例,则抽取3人时,男性2人,女性1人;
表示顺利完成问答总人数,取值为:,
已知男性完成概率,未完成概率,女性完成概率,未完成概率,且相互独立;
则;
;
;
;
0
1
2
3
数学期望为:
.
53.(2026·山东济宁·模拟预测)随着量子计算技术的突破,传统密码的安全性受到挑战.某实验室为研究“量子算力等级”与“密码破译成功率”的关系,进行了模拟测试,统计数据如下:
量子算力等级
密码破译成功
密码破译失败
合计
高算力量子机
64
16
80
低算力量子机
36
24
60
合计
100
40
140
(1)依据小概率值的独立性检验,即认为密码破译成功率是否与量子算力等级有关;
(2)该实验室使用两台不同算力的量子机(记高算力量子机为A机、低算力量子机为B机)对同一套传统密码进行破译测试,已知A机单次破译成功的概率为,失败的概率为;B机单次破译成功的概率为,失败的概率为;两台机器的破译过程相互独立.测试方案:先随机选择一台机器进行第一次破译,选中A机的概率为,选中B机的概率为;若第一次破译成功则停止测试;若第一次破译失败,则换用另一台机器进行第二次破译,无论第二次破译是否成功都停止测试,求破译成功的概率.
附:,
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)见解析
(2)
【分析】(1)根据独立性检验判断即可;
(2)根据独立事件乘法公式计算.
【详解】(1)零假设密码破译成功率与量子算力等级无关,
,
所以,依据小概率值的独立性检验,推断不成立,
即认为分析密码破译成功率与量子算力等级有关;
(2)记“破译成功”为事件,A机单次破译成功为事件,A机单次未破译成功为事件,
B机单次破译成功为事件,B机单次未破译成功为事件,
选中A机为事件,选中B机为事件,
则
,
故破译成功的概率为.
$