内容正文:
2025-2026学年高二数学同步知识·题型解题秘籍精讲精练讲义(人教A版2019选择性必修第三册)
8.3列联表与独立性检验6题型分类
一、分类变量
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
二、2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
三、等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
四、临界值
1.相关性的度量:χ2=.
2.χ2越小说明变量之间越独立,χ2越大说明变量之间越相关.
3.存在正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.
五、独立性检验
1.基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
2.独立性检验:这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
3.χ2临界值表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
六、应用独立性检验解决实际问题的大致步骤
1.提出零假设H0:X和Y相互独立,并给出在问题中的解释.
2.根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
3.根据检验规则得出推断结论.
4.在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
(一)
由2×2列联表分析变量间关系
(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与 的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
(3)独立性检验的关注点:在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.
题型1:完成列联表
1.(2026高二·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
【答案】8
【分析】根据列联表的性质,求出a,b,d的值,即可得答案.
【详解】由列联表的性质,可得:,可得,
所以.
故答案为:8
2.(2026高二·全国·课后作业)下表是、两班关于选择“物理”作为“加三学科”的意愿的列联表,请根据已有数据完善表格.
单位:人
类别
愿意选择“物理”
不愿意选择“物理”
总计
班
20
42
班
16
总计
44
【答案】
【分析】根据已知条件补全联表即可.
【详解】根据已知条件得出,
又因为,所以,所以,
所以.
所以.
3.(2026高二·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
【答案】74
【分析】根据联表性质计算求解.
【详解】由题意知,所以.
故答案为:.
4.(2026高二·广西钦州·期末)如下是一个列联表,则________.
yx
总计
总计
【答案】
【分析】根据列联表的概念,可得答案.
【详解】由题意可得,则,可得,所以.
故答案为:.
5.(2026高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
【答案】B
【分析】由列联表数据,列出等式即可求解;
【详解】由,得.
由,得.
由,得.
由,得.
故选:B
6.(2026高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
【答案】D
【分析】根据题意先得出的值,进而再得的值,进而可知的值.
【详解】因为抽取的村民中,老年人有25名,年轻人有25名,所以,
所以,A、B对;
所以,则对;
则错.
故选:.
题型2:由2×2列联表分析变量间关系
7.(2026·云南昆明·模拟预测)考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【答案】C
【分析】根据表格提供的数据作出判断.
【详解】由列联表中的数据可知,
种子经过处理,得病的比例明显降低,
种子未经过处理,得病的比例要高些,
所以可得结论:种子是否经过处理跟是否生病有关.
故选:C
8.(2026高二·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
【答案】
【分析】根据古典概型概率公式和条件概率公式进行计算即可.
【详解】;
;
;
故答案为:;;;.
9.(2026高二·河南·月考)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【分析】根据题意,得到如下两个列联表,再一一分析即可.
【详解】根据题意,得到如下两个列联表.
35岁以上
35岁及以下
总计
男性
女性
总计
35岁以上
35岁及以下
总计
男性
女性
总计
根据第1个列联表可知,样本中男性市民人数为,
女性市民人数为,又,即样本中男性比女性多,故A正确;
根据第2个列联表可知,样本中35岁以上女性市民人数为,
35岁及以下女性市民人数为,又,即样本中多数女性是35岁以上,故B正确;
由题意,,所以,故C不正确;
根据第2个列联表可知,样本中35岁以上市民人数为,
35岁及以下市民人数为,又,
即样本中35岁以上的市民比35岁及以下的多,故D正确.
故选:C.
10.(2026高二·河南·期中)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:
了解
不了解
总计
年龄不小于60岁
a
b
a+b
年龄小于60岁
c
d
c+d
总计
a+c
b+d
a+b+c+d
给出下列4组数据:
① ;② ;
③ ;④ .
则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是______.(填序号)
【答案】③
【分析】根据当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,计算每组的值,比较大小可得答案。
【详解】当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,
在①中,,在②中,,在③中,,在④中,,
故居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是③,
故答案为:③
11.(2026高二·全国·课后作业)在对人们的休闲方式的一次调查中,共调查了110人,其中女性50人,男性60人.女性中有30人主要的休闲方式是看电视,另外20人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外40人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)由列联表判断性别与休闲方式是否有关系.
【答案】(1)列联表答案见解析;(2)性别与休闲方式有关系.
【分析】(1)根据2×2的列联表要求列表.
(2)根据列联表中的数据,分别算出女性、男性中休息方式为看电视的频率即可判断.
【详解】(1)2×2的列联表:
看电视
运动
合计
女
30
20
50
男
20
40
60
合计
50
60
110
(2)根据列联表中的数据,可得女性中休息方式为看电视的频率为,男性中休息方式为看电视的频率为,二者差别较大,可知性别与休闲方式有关系.
(二)
由等高堆积条形图分析变量间关系
等高堆积条形图:等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
题型3:由等高堆积条形图分析变量间关系
12.(2026高三·广西南宁·期末)为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
【答案】B
【分析】根据等高条形图中的数据即可得出选项.
【详解】根据两个表中的等高条形图知,药物实验显示不服药与服药时患病差异较药物实验显示明显大,
所以药物的预防效果优于药物的预防效果,
故选:B.
13.(2026高二·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是___________.
【答案】乙
【分析】根据选项中的图形,即可直接求解.
【详解】等高条形图中有两个高度相同的矩形,每个矩形都有两个颜色,观察下方颜色区域的高度,如果高度差越大,则两个分类变量关系越强,观察四个选项可知,B选项中带颜色区域的高度差最大,两个分类变量、相关关系最强;
故答案为:乙
14.(2026高三·北京·一轮复习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
【答案】C
【分析】通过对等高堆积条形图的分析,结合所列列联表及不等式性质,逐一对每个选项进行推理判断即可.
【详解】设等高条形图对应列联表如下:
岁及以上
岁以下
总计
男性
女性
总计
根据第个等高条形图可知,岁及以上男性比岁及以上女性多,即;
岁以下男性比岁以下女性多,即.
根据第个等高条形图可知,男性中岁及以上的比岁以下的多,即;
女性中岁及以上的比岁以下的多,即,
对于A,男性人数为,女性人数为,
因为,所以,所以A正确;
对于B,岁及以上女性人数为,岁以下女性人数为,
因为,所以B正确;
对于C,岁以下男性人数为,岁及以上女性人数为,
无法从图中直接判断与的大小关系,所以C不一定正确;
对于D,岁及以上的人数为,岁以下的人数为,
因为,所以,所以D正确.
故选:C.
15.(2026高二·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【答案】A
【分析】分析等高堆积条形图可直接得到答案.
【详解】原图是学校高二1、2班本期中期考试数学成绩优秀率的等高堆积条形图,
从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,BC错误;
两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误;
故选:A.
16.【多选】(2026高二·福建泉州·期中)如图是调查某地区男、女中学生喜欢数学的等高堆积条形图,阴影部分表示喜欢数学的百分比,从图可以看出( )
A.性别与喜欢数学无关 B.女生中喜欢数学的百分比为
C.男生比女生喜欢数学的可能性大些 D.男生不喜欢数学的百分比为
【答案】CD
【分析】根据等高堆积条形图即可结合选项求解.
【详解】由图可知,女生喜欢数学的占,男生喜欢数学的占,男生不喜欢数学的百分比为,故B错误,D正确;
显然性别与喜欢数学有关,故A错误;男生比女生喜欢数学的可能性大些,故C正确.
故选:CD.
17.(2026高二·河北张家口·阶段检测)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
【答案】B
【分析】根据题意,由等高条形图的意义分析可得答案.
【详解】根据题意,在等高的条形图中,当,所占比例相差越大时,越有把握认为两个分类变量,之间有关系,
由选项可得:B选项中,,所占比例相差无几,所以最有把握认为两个分类变量,之间没有关系,
故选:B
18.(2026高二·吉林·月考)为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
【答案】D
【分析】结合所给比例图,依次分析判断4个选项即可.
【详解】对于A,城镇户籍中选择生育二胎,农村户籍中选择生育二胎,相差较大,则是否倾向选择生育二胎与户籍有关,A错误;
对于B,男性和女性中均有选择生育二胎,则是否倾向选择生育二胎与性别无关,B错误;
对于C,由于男性和女性中均有选择生育二胎,但样本中男性40人,女性60人,则倾向选择生育二胎的人员中,男性人数与女性人数不同,C错误;
对于D,倾向选择不生育二胎的人员中,农村户籍有人,城镇户籍有人,农村户籍人数少于城镇户籍人数,D正确.
故选:D.
(三)
独立性检验
独立性检验
基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
独立性检验的具体做法
①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值xα.
②利用公式χ2=计算χ2.
③如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”。
题型4:独立性检验的概念及辨析
19.(2026高二·河南南阳·期中)下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
【答案】B
【分析】根据独立性检验的基本思想,即可判断选项.
【详解】独立性检验是通过统计学方法来检验两个分类变量之间是否存在关联性,
ACD满足独立性检验的基本思想,B选项只是公司的营业额这一个变量在过去5年的变化情况,不满足独立性检验的基本思想.
故选:B
20.(2026高二·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
【答案】A
【分析】根据卡方独立性检验规则,比较与临界值即可得出结论.
【详解】因为,所以牛的毛色与角无关.
故选:A.
21.(2026高三·湖北恩施·开学考试)根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
【答案】B
【分析】根据独立性检验的概念可得正确的选项.
【详解】因为,所以在显著性水平下,
没有充分证据拒绝原假设,因此我们认为变量与是独立的,
故选:B
22.(2026·江苏南通·模拟预测)为研究课后整理错题习惯与数学成绩达标之间的关联性,经独立性检验计算得,临界值,.记事件为“学生成绩达标”,事件为“学生坚持整理错题”;已知,,,则有________的把握认为二者存在关联;随机抽取一名学生,其成绩达标的概率为________.
【答案】 /
【详解】由,且,即有的把握认为二者存在关联,
由题设,则,
所以随机抽取一名学生,其成绩达标的概率为.
23.(2026·天津·模拟预测)近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌汽车商随机调查了甲、乙两地各200名消费者,并用等高堆积条形图直观地展示调查结果如下图所示,经计算得到.
车型与地区
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
下列说法正确的是( )
A.在所调查的甲地购车者中,若按比例分层随机抽样抽取20人,则新能源车主有8人
B.在所调查的乙地购车者中,购买燃油车的人数比新能源车的多20人
C.依据的独立性检验,即消费者的购车类型与地域有关联,此推断犯错误的概率不大于0.001
D.依据的独立性检验,即消费者的购车类型与地域无关联,此推断犯错误的概率不大于0.001
【答案】C
【分析】借助分层随机抽样定义计算可得A;分别计算出购买燃油车的人数与购买新能源车的人数可得B;利用独立性检验定义可得C、D.
【详解】对A:,故新能源车主有人,故A错误;
对B:购买燃油车的人数为,
购买新能源车的人数为,
则购买燃油车的人数比新能源车的多人,故B错误;
对C、D:依据的独立性检验,即消费者的购车类型与地域有关联,
由,故此推断犯错误的概率不大于,故C正确、D错误.
题型5:卡方的计算
24.(2026·山东德州·模拟预测)秦腔是陕西最具代表性的戏曲艺术,2006年被列入第一批国家级非物质文化遗产名录.为研究是否喜爱秦腔与年龄之间的关系,并为传统文化保护提供数据支持,某文化调研队在西安市随机抽取了200名当地居民进行调查,得到如下列联表:
单位:人
秦腔
年龄
合计
40岁以下
40岁及以上
喜爱
45
45
90
不喜爱
75
35
110
合计
120
80
200
(1)年龄在40岁及以上的当地居民中,喜爱秦腔的概率为,求的估计值;
(2)根据小概率值的独立性检验,能否认为是否喜爱秦腔与年龄有关?
0.050
0.010
0.001
3.841
6.635
10.828
附:.
【答案】(1).
(2)可以认为是否喜爱秦腔与年龄有关.
【分析】(1)用样本中 40 岁及以上居民喜爱秦腔的频率,作为总体概率的估计值;
(2)通过列联表数据计算卡方统计量,与显著性水平对应的临界值比较,完成独立性检验,判断两个变量是否有关.
【详解】(1)用样本频率估计总体概率,因为年龄在40岁及以上的当地居民喜爱秦腔的频率为,
所以的估计值为.
(2)假设 :是否喜爱秦腔与年龄无关,
题意可知,
因为,所以假设不成立,
即在犯错误的概率不超过的条件下,可以认为是否喜爱秦腔与年龄有关.
25.(2026·河南·模拟预测)新能源汽车越来越受到年轻人的青睐.某品牌新能源汽车有限公司为了了解新能源汽车爱好者对本公司生产的新能源汽车款和款的满意度进行了市场调研,在社会上随机调查了200名新能源爱好者,得到如下列联表:
满意
不满意
合计
新能源汽车A款
80
新能源汽车B款
30
合计
150
200
(1)请完善上述列联表,并判断能否有90%的把握认为新能源汽车的款型对满意度有影响;
(2)从这200位新能源爱好者中任选两人,在被调查的两人选择新能源汽车款型一致的条件下,试求他们对该新能源汽车款型均满意的概率.
附:,其中.
0.15
0.10
0.05
0.025
2.07
2.71
3.84
5.024
【答案】(1)列联表见解析,没有
(2)
【分析】(1)根据题设数据完善表格,然后根据公式计算卡方统计量即可;
(2)根据条件概率公式计算即可.
【详解】(1)完善列联表如下:
满意
不满意
合计
新能源汽车A款
新能源汽车B款
合计
零假设:新能源汽车的款型对满意度没有影响,
,
根据小概率值的独立性检验,推断成立,
所以没有的把握认为新能源汽车的款型对满意度有影响;
(2)记事件为“被调查的两人选择新能源汽车款型一致”,事件为“他们对该新能源汽车款型均满意”,则
,,
所以,
所以在被调查的两人选择新能源汽车款型一致的条件下,他们对该新能源汽车款型均满意的概率为.
26.(2026高二·辽宁铁岭·期中)某校对学生的艺术特长进行调查,得到如下数据.
有艺术特长
无艺术特长
男
250
100
女
350
150
(1)用频率估计概率,从本校的男生中任选两名,求他们均有艺术特长的概率;
(2)在犯错误的概率不超过0.1的前提下,是否可以认为学生性别与有无艺术特长有关.
附:,.
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
【答案】(1)
(2)可以认为学生性别与有无艺术特长无关
【分析】(1)利用二项分布的概率公式求解即可;
(2)根据卡方公式求出的值,与临界值进行比较即可判断.
【详解】(1)因为该校男生有艺术特长的概率为,
记有艺术特长的男生人数为,显然,
于是.
(2)因为 ,
故在犯错误的概率不超过0.1的前提下,可以认为学生性别与有无艺术特长无关
27.(2026高三·全国·专题练习)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解岁年轻人的体质健康是否与性别有关,在月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到列联表.
性别
感冒
不感冒
总计
男
女
总计
依据表中数据,能否有的把握认为岁年轻人的体质健康与性别有关?若把表中所有数据都扩大到原来的倍,此时结论还一样吗?请解释其中原因,并简要说明如何调整调查可使此研究更严谨.
参考数据:
【答案】答案见解析
【分析】根据独立性检验公式直接计算并判断即可.
【详解】零假设:岁年轻人的体质健康与性别无关.
根据列联表中的数据,经计算得到,
所以零假设成立,即没有的把握认为岁年轻人的体质健康与性别有关.
如果把所有数据都扩大倍后, ,
即有的把握认为岁年轻人的体质健康与性别有关.
所以扩大倍后,结论发生变化.为使此研究更严谨,可以扩大调查的样本容量.
28.(2026高三·全国·专题练习)随着网络App的普及与发展,刷“抖音”成为了人们日常生活的一部分.某地区随机抽取了部分20~40岁的“抖音”用户,调查他们日均刷“抖音”的时间情况,所得数据统计如下表:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
男性
48
72
女性
24
56
依据小概率值的独立性检验,能否认为日均刷“抖音”时间的长短与性别有关?
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】日均刷“抖音”时间的长短与性别无关
【分析】由题意可得列联表,再计算,对比临界值表即可得解
【详解】由题意,列联表如下:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
合计
男性
48
72
120
女性
24
56
80
合计
72
128
200
零假设为:日均刷“抖音”时间的长短与性别无关,
则,
故依据小概率值的独立性检验,我们推断零假设成立,
即日均刷“抖音”时间的长短与性别无关.
29.(2026·四川绵阳·模拟预测)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床生产了件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值的独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.05
0.010
0.001
3.841
6.635
10.828
【答案】(1)甲机床生产的产品中一级品的频率为:.
乙机床生产的产品中一级品的频率为:.
(2)依据小概率值的独立性检验,可认为甲机床的产品质量与乙机床的产品质量有差异.
【分析】(1)直接计算频率即可.
(2)先计算,再与给出的数据进行比较,即可得出结论.
【详解】(1)甲机床生产的产品中一级品的频率为:.
乙机床生产的产品中一级品的频率为:.
(2)由题意:.
因为,所以依据小概率值的独立性检验,可认为甲机床的产品质量与乙机床的产品质量有差异.
30.(2026高三·上海·课堂例题)为了调查商户每天销售额与每天线上销售时间之间的相关关系,随机选取45家商户进行跟踪调查,其中每日线上销售时间不少于6小时的商户有19家,余下的商户中,每天的销售额不足3万元的占,统计后得到如下列联表:
销售额不少于3万元(户)
销售额不足3万元(户)
合计
线上销售时间不少于6小时
4
19
线上销售时间不足6小时
合计
45
请完成上面的列联表,并判断是否有的把握认为“商户每天销售额与商户每天线上销售时间有关.”
参考公式:,其中.
0.50
0.40
0.25
0.15
0.010
0.05
0.025
0.010
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
【答案】表格见解析,有的把握认为“商户每天销售额与商户每天线上销售时间有关”.
【分析】完善列联表结合卡方公式计算,结合独立检验的基本思想得结论即可.
【详解】
销售额不少于3万元
销售额不足3万元
合计
线上销售时间不少于6小时
15
4
19
线上销售时间不足6小时
10
16
26
合计
25
20
45
因为,
所以有的把握认为“商户每天销售额与商户每天线上销售时间有关”.
31.(2026高三·上海·随堂练习)2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如下表所示:
表一
表二
了解情况
Y
N
男
女
合计
人数
140
60
Y
80
N
40
合计
附:临界值参考表的参考公式
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
,其中
(1)请根据所提供的数据,完成上面的列联表(表二);
(2)判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系.
【答案】(1)答案见解析
(2)有99%的把握认为对“云课堂”倡议了解情况与性别有关系
【分析】(1)由已知表格的数据完成列表即可;
(2)由(1)种表格的数据代入计算出观测值,对比之后即可得出结论.
【详解】(1)
男
女
合计
Y
80
60
140
N
20
40
60
合计
100
100
200
(2).
对照临界值表知,有99%的把握认为对“云课堂”倡议了解情况与性别有关系.
32.(2026高三·四川宜宾·开学考试)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).
测得40只小鼠体重如下(单位:):(已按从小到大排好)
对照组:17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.4 26.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5 27.6 28.3
实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.2 14.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0
附:,其中.
0.10
0.05
0.010
2.706
3.841
6.635
(1)求40只小鼠体重的中位数,并完成下面列联表:
合计
对照组
实验组
合计
(2)根据列联表,能否有的把握认为药物对小鼠生长有抑制作用.
【答案】(1)23.4,列联表见解析
(2)有的把握认为药物对小鼠生长有抑制作用.
【分析】(1)由中位数定义求出中位数,列出列联表;
(2)计算,与临界值比较得出结论.
【详解】(1)由所给数据从小到大排序:
,
所以40只小鼠体重的中位数为,
列联表如下:
合计
对照组
6
14
20
实验组
14
6
20
合计
20
20
40
(2)由公式可知,
所以有的把握认为药物对小鼠生长有抑制作用.
(四)
独立性检验的综合应用
独立性检验:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
(1)解答此类题目的关键在于正确利用χ2=计算χ2的值,再用它与临界值xα的大小作比较来判断假设检验是否成立,从而使问题得到解决.
(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.
题型6:独立性检验的综合应用
33.(2026高二·上海奉贤·期末)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断是否有99%的把握认为我市市民网购与性别有关?
(2)现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)表格见解析;有
(2)
【分析】(1)完成列联表,由列联表,得,然后根据独立性检验判断即可;
(2)由题知抽取10人中,经常网购的有人,偶尔或不用网购的有人,由可计算选取的3人中至少有2人经常网购的概率.
【详解】(1)完成列联表:
经常网购
偶尔或不用网购
合计
男性
50
50
100
女性
70
30
100
合计
120
80
200
由列联表得,,
有99%的把握认为我市市民网购与性别有关.
(2)由题知女市民中利用分层抽样的方法抽取10人中,
经常网购的有人,偶尔或不用网购的有人,
选取的3人中至少有2人经常网购的概率,
所以所求概率为.
34.(2026·重庆北碚·模拟预测) 某高校为调查人们对 AI 知识掌握的熟悉程度与学历是否有关,组织了相关的答题活动, 满分 100 分. 答题完成后, 工作人员从中随机抽取 200 人作为样本,得到如下数据.
人数分数 学历
本科及以下
37
33
12
10
5
3
本科以上
20
20
10
10
30
10
(1)若得分不小于 60 分,则认为对 AI 知识掌握的程度为熟悉,否则为不熟悉;
熟悉程度
学历
合计
本科及以下
本科以上
熟悉
不熟悉
合计
根据样本数据补全上面的 列联表,并依据小概率值 的独立性检验,能否认为熟悉AI程度与参与人员学历有关系.
(2)从样本里学历为本科以上的人群中,采用按比例分层随机抽样的方法抽取 10 个人,再从这 10 人中随机抽出 3 人进行访谈,记这 3 人中分数在 的人数为 ,求 的分布列及数学期望.
附:, .
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)列联表见解析;熟悉AI程度与参与人员学历有关联;
(2)分布列见解析;.
【分析】(1)先根据题意列出列联表,再计算,并判断;
(2)先确定的可能取值,再分别求概率,列出分布列,最后求期望.
【详解】(1)
熟悉程度
学历
合计
本科及以下
本科以上
熟悉
30
60
90
不熟悉
70
40
110
合计
100
100
200
零假设为:熟悉AI程度与参与人员学历互相独立,即熟悉AI程度与参与人员学历无关联.
根据列联表中的数据,经计算得
根据小概率值的独立性检验,我们推断不成立,即认为熟悉AI程度与参与人员学历有关联,此推断犯错误的概率不大于0.001.
根据表中数据,熟悉AI的参与人员中,本科及以下和本科以上的频率分别为和,
不熟悉AI的参与人员中,本科及以下和本科以上的频率分别为和,
由可见,在被调查者中,熟悉AI的人中,本科以上学历是本科及以下学历的频率的将近2倍,于是,根据频率稳定于概率的原理,我们可以认为本科以上学历熟悉AI的概率明显大于本科及以下学历熟悉AI的概率,即本科以上学历更容易熟悉AI.
(2)从样本里学历为本科以上的人群中,采用按比例分层随机抽样的方法抽取10个人,这10人中,分数在的人数为3,则可取0,1,2,3;
,
,
,
,
的分布列为
0
1
2
3
.
35.(2026·河北保定·模拟预测)某市体育局为调研市民体育锻炼情况与健康水平的关联性,随机抽取了120名18岁~60岁市民进行调查.将每周锻炼不少于3次的市民归为“高频锻炼组”,不足3次的归为“低频锻炼组”;体质检测达到《国民体质测定标准》优秀和良好等级的定为“体质达标”,否则为“体质不达标”.调查结果整理为如下不完整的列联表.
体质达标
体质不达标
合计
高频锻炼组
m
15
60
低频锻炼组
25
v
u
合计
s
t
120
附:,其中.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
(1)请根据列联表中的数据,写出m,v,s,t,u的值;
(2)依据小概率值的独立性检验,分析该市市民体育锻炼频次是否与体质达标有关联;
(3)该市计划从抽到的120人中体质不达标市民中抽取部分人员开展“科学健身指导”活动,现按高频锻炼组和低频锻炼组分层,通过分层抽样抽取10人展开指导活动,再从这10人中随机抽取3人进行专项访谈,求抽取的3人中至多有1人来自高频锻炼组的概率.
【答案】(1),,,,.
(2)认为该市市民体育锻炼频次与体质达标有关联
(3).
【分析】(1)利用列联表中行和、列和与总数之间的关系,通过简单的加减法运算求出的值.
(2)根据第(1)问求出的数据,代入卡方公式计算的观测值,并与给定的临界值进行比较,从而判断两个分类变量是否有关联.
(3)先求出高频锻炼组和低频锻炼组人数,然后根据分层抽样求出每组应抽取的人数,然后计算抽取的3人中至多有1人来自高频锻炼组的概率.
【详解】(1)由列联表数据关系可知,,,,,,综上,,,,,.
(2)零假设:市民体育锻炼频次与体质达标无关联.
根据列联表数据,计算
由于,根据小概率值的独立性检验,判断不成立,
因此,认为该市市民体育锻炼频次与体质达标有关联.
(3)体质不达标者,高频锻炼组15人,低频锻炼组35人,按分层抽样抽取10人,则高频锻炼组抽取人数为3人,低频锻炼组抽取人数为7人.
从这10人中随机抽取3人进行专项访谈,事件总数有种,
设“抽取的3人中至多有1人来自高频锻炼组”为事件A,则事件A包含“0人来自高频组”和“一人来自高频组”两种情况.
则.
所以抽取的3人中至多有1人来自高频锻炼组的概率为.
36.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)更适合,
(2)不能
【分析】(1)根据图形,即可作出判断,再将非线性回归方程转化成线性回归方程,再结合条件,求出,即可求解;
(2)根据条件,求出的值,结合条件,即可求解.
【详解】(1)由图可以判断,更适合作为未佩戴头盔人数与天数的回归方程类型,
由,得到,因为,则,
则,所以,则.
(2)零假设:市民佩戴头盔与性别无关联.
根据列联表中的数据,经计算得到:
,
根据小概率值的独立性检验,我们没有理由认为不成立,即认为市民佩戴头盔与性别没有关联.
37.(2026·陕西咸阳·模拟预测)咸阳文旅部门统计了某景点在2025年2月至6月的旅游收入(单位:万元),得到以下数据:
月份
2
3
4
5
6
旅游收入
10
12
11
12
20
(1)根据表中所给数据,用相关系数判断,是否可用线性回归模型拟合与的关系?(当时,认为线性相关性较强),若可以,求出关于之间的线性回归方程;若不可以,请说明理由;
(2)为调查游客对该景点的评价情况,随机抽查了100名游客,得到如下列联表,请填写下面的列联表,依据的独立性检验,能否认为“游客是否喜欢该景点与性别有关联”.
喜欢
不喜欢
总计
男
50
女
30
总计
60
参考公式:相关系数,参考数据:.
线性回归方程:,其中
,其中.
临界值表:
0.010
0.005
0.001
6.635
7.879
10.828
【答案】(1)可用,线性回归方程为;
(2)
喜欢
不喜欢
总计
男
40
10
50
女
20
30
50
总计
60
40
100
能认为“游客是否喜欢该景点与性别有关联”.
【分析】(1)利用表格中数据求出并判断,再利用最小二乘法求出回归直线方程.
(2)完善列联表,求出的观测值,与临界值比对作答.
【详解】(1)由表格中数据,得,
,
,
因此相关系数,
所以与的线性相关性较强,可用线性回归模型拟合与的关系;
,
所以关于之间的线性回归方程为.
(2)依题意,列联表为:
喜欢
不喜欢
总计
男
40
10
50
女
20
30
50
总计
60
40
100
零假设:认为“游客是否喜欢该景点与性别无关联”,
由表格中数据经计算,
依据小概率的独立性检验,推断不成立,
即能认为“游客是否喜欢该景点与性别有关联”,此推断犯错误的概率不大于0.001.
1.(2026高二·全国·课后作业)用等高堆积条形图粗略估计两个分类变量是否相关.观察下列各图,其中两个分类变量相关关系最强的是( )
A. B.
C. D.
【答案】D
【分析】根据等高堆积条形图高度差判断.
【详解】在等高堆积条形图中,深色条的高度相差越大,相关性越强.
故选:D
2.(2026高二·全国·课后作业)以下关于独立性检验的说法中,错误的是( )
A.独立性检验依据小概率原理 B.独立性检验得到的结论一定正确
C.样本不同,独立性检验的结论可能有差异 D.独立性检验不是判定两分类变量是否相关的唯一方法.
【答案】B
【详解】根据独立性检验的原理可知得到的结论是错误的情况是小概率事件,但并不一定是准确的.
故选B.
3.(2026高二·全国·课后作业)高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到如表:
班组与成绩统计表
优秀
不优秀
总计
甲班
11
34
45
乙班
8
37
45
总计
19
71
90
则随机变量K2的观测值约为( )
A.0.600 B.0.828 C.2.712 D.6.004
【答案】A
【详解】试题分析:本题考查的知识点是独立性检验公式,我们由列联表易得:a=11,b=34,c=8,d=37,代入K2的计算公式:K2=即可得到结果.
解:由列联表我们易得:
a=11,b=34,c=8,d=37
则K2=
=
=0.6004≈0.60
故选A
点评:若要推断的论述为H:“X与Y有关系”,可以利用独立性检验来考查两个变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体的做法是,由表中的数据算出随机变量K2的值,K2=.K2的值越大,说明“X与Y有关系”成立的可能性越大.
4.(2026高二·全国·课后作业)为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别
阳性数
阴性数
总计
铅中毒病人
29
7
36
对照组
9
28
37
总计
38
35
73
试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
【答案】答案见解析
【分析】分别计算铅中毒组和对照组的阳性、阴性比例,根据所得数据画出等高堆积条形图,考察铅中毒病人与对照组的阳性与阴性的比值是否差异明显即可得到结论.
【详解】解:铅中毒组的阳性比例为,阴性比例为;
对照组的阳性比例为,阴性比例为,
由此画出等高堆积条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.
【点睛】本题考查登高堆积条形图的绘制和应用,用等高条形图可以粗略地判断两个分类变量是否有关.
5.(2026高二·全国·课后作业)为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
父母吸烟
父母不吸烟
总计
子女吸烟
237
83
320
子女不吸烟
678
522
1 200
总计
915
605
1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
【答案】等高条形图见详解,有影响
【分析】由表格中的数据画出等高条形图,根据等高条形图的定义和性质判断即可
【详解】等高条形图如下:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.
6.(2026高二·全国·课堂例题) 某出租汽车公司决定更换一批小汽车以代替原来报废的出租车,现有,车型的使用寿命(单位:年)频数表如下:
使用寿命/年
5
6
7
8
合计
型出租车/辆
10
20
45
25
100
型出租车/辆
15
35
40
10
100
(1)填写下表,并依据小概率值的独立性检验,分析出租车的使用寿命与汽车车型是否有关联;
车型
使用寿命
合计
不高于6年
不低于7年
型
型
合计
(2)司机师傅小李准备在一辆开了4年的型车和一辆开了4年的型车中选择,为了尽最大可能实现3年内(含3年)不换车,试通过计算说明他应如何选择.
【答案】(1)答案见解析,有关联
(2)小李应选择型车.
【分析】(1)由条件数据即可补全列联表,再计算卡方值,比较临界值即可判断;
(2)由条件数据分别计算对应事件概率,即可判断;
【详解】(1)零假设为:出租车的使用寿命与汽车车型之间无关联.
根据题目所给数据得到如下列联表:
车型
使用寿命
合计
不高于6年
不低于7年
型
30
70
100
型
50
50
100
合计
80
120
200
所以.
依据小概率值的独立性检验,我们推断不成立,
即认为出租车的使用寿命与汽车车型有关联,此推断犯错误的概率不大于0.01.
(2)记事件为“小李选择型车,3年内(含3年)不换车”,
事件为“小李选择型车,3年内(含3年)不换车”,
由数据可得:.
因为,
所以小李应选择型车.
7.(2026高二·全国·课堂例题)某教育机构为了研究成年人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:
学历
对教育改革态度
合计
积极支持
不太赞成
大学专科以上
39
157
196
大学专科以下
29
167
196
合计
68
324
392
对于教育机构的研究项目,依据小概率值的独立性检验,根据上述数据能得出什么结论?
【答案】答案见解析
【分析】由列联表,计算卡方值,比较临界值,即可判断;
【详解】零假设为:成年人具有大学专科以上学历(包括大学专科)和对待教育改革态度无关.
根据表中数据,计算得.
因为,根据小概率值的独立性检验,没有充分证据推断不成立,
所以我们没有理由说成年人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.
8.(2026·全国III卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)该市一天的空气质量等级分别为、、、的概率分别为、、、;(2);(3)有,理由见解析.
【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为、、、的概率;
(2)利用每组的中点值乘以频数,相加后除以可得结果;
(3)根据表格中的数据完善列联表,计算出的观测值,再结合临界值表可得结论.
【详解】(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
(3)列联表如下:
人次
人次
空气质量好
空气质量不好
,
因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.
9.(2026·上海)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:
时间范围学业成绩
优秀
5
44
42
3
1
不优秀
134
147
137
40
27
(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?
(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)
(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?
(附:其中,.)
【答案】(1)
(2)
(3)有
【分析】(1)求出相关占比,乘以总人数即可;
(2)根据平均数的计算公式即可得到答案;
(3)作出列联表,再提出零假设,计算卡方值和临界值比较大小即可得到结论.
【详解】(1)由表可知锻炼时长不少于1小时的人数为占比,
则估计该地区29000名学生中体育锻炼时长不少于1小时的人数为.
(2)估计该地区初中生的日均体育锻炼时长约为
.
则估计该地区初中学生日均体育锻炼的时长为0.9小时.
(3)由题列联表如下:
其他
合计
优秀
45
50
95
不优秀
177
308
485
合计
222
358
580
提出零假设:该地区成绩优秀与日均锻炼时长不少于1小时但少于2小时无关.
其中.
.
则零假设不成立,
即有的把握认为学业成绩优秀与日均锻炼时长不小于1小时且小于2小时有关.
10.(2026高二·全国·课堂例题)为了检验两种不同的课堂教学模式对学生的成绩是否有影响,现从高二年级的甲(实行“问题—探究式”模式),乙(实行“自学—指导式”模式)两个班中每班任意抽取20名学生进行测试,他们的成绩(总分150分)如下.
甲班:88 92 95 98 103 108 110 112 118 118 120 121 126 132 134 135 140 142 146 148
乙班:96 97 104 107 108 108 114 117 119 121 124 124 125 127 132 135 135 137 138 147
记成绩在120分以上(包括120分)为优秀,其他的成绩为一般,试根据小概率值的独立性检验,分析这两种课堂教学模式对学生的成绩是否有影响.
【答案】认为这两种课堂教学模式对学生的成绩没有影响.
【分析】由题意得到列联表,求得卡方值,比较临界值,即可判断;
【详解】零假设为:课堂教学模式对学生的成绩没有影响,
根据题中所给数据得到如下列联表:
班级
成绩
合计
优秀
一般
甲班
10
10
20
乙班
11
9
20
合计
21
19
40
所以.
依据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为这两种课堂教学模式对学生的成绩没有影响.
11.(2026高二·全国·课后作业)网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.请利用等高堆积条形图判断学生学习成绩与经常上网是否有关.
【答案】可以认为学习成绩与经常上网有关.
【分析】根据已知条件列出列联表,计算经常上网和不经常上网的学生的期末考试不及格和及格的频率,画出等高堆积条形图,从图观察看发现经常上网学生的成绩不及格的频率明显高于不经常上网学生的成绩不及格的频率,即得结论.
【详解】根据题目所给的数据得到如下列联表:
学习成绩
上网
合计
经常
不经常
不及格
80
120
200
及格
120
680
800
合计
200
800
1000
经常上网的学生中期末考试不及格和及格的频率分别为和;
不经常上网的学生中期末考试不及格和及格的频率分别为和.
得出等高堆积条形图如图所示:
比较图中阴影部分的高度可以发现经常上网学生的成绩不及格的频率明显高于不经常上网学生的成绩不及格的频率,因此可以认为学习成绩与经常上网有关.
12.(2026·云南楚雄·模拟预测)全国“村BA”篮球赛点燃了全民的运动激情,深受广大球迷的喜爱.每支球队都有一个或几个主力队员,现有一支“村BA”球队,其中甲球员是其主力队员,经统计该球队在某个赛季的所有比赛中,甲球员是否上场时该球队的胜负情况如表.
甲球员是否上场
球队的胜负情况
合计
胜
负
上场
40
45
未上场
3
合计
42
(1)完成列联表,并判断依据小概率值的独立性检验,能否认为球队的胜负与甲球员是否上场有关;
(2)由于队员的不同,甲球员主打的位置会进行调整,根据以往的数据统计,甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.
(i)当甲球员上场参加比赛时,求球队赢球的概率;
(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,求甲球员打中锋的概率.(精确到0.01)
附:,.
0.15
0.10
0.05
0.025
0.010
0.001
2.072
2.706
3.841
5.024
6.635
10.828
【答案】(1)列联表见解析;有99%的把握认为球队的胜负与甲球员是否上场有关.
(2)(i);(ii)
【分析】(1)根据题意,得出的列联表,求得,结合附表,即可求解;
(2)设事件:甲球员上场打前锋,事件:甲球员上场打中锋,事件:甲球员上场打后卫,事件:球队赢球,结合全概率公式,即可求解;
(ii)根据题意,利用条件概率的计算公式和贝叶斯公式,即可求解.
【详解】(1)解:根据题意,可得的列联表:
甲球员是否上场
球队的胜负情况
合计
胜
负
上场
40
5
45
未上场
2
3
5
合计
42
8
50
零假设:球队的胜负与甲球员是否上场无关
此时,
所以,有99%的把握认为球队的胜负与甲球员是否上场有关.
(2)解:由甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.
(i)设事件:甲球员上场打前锋,事件:甲球员上场打中锋,事件:甲球员上场打后卫,事件:球队赢球,
则,
所以,当甲球员上场参加比赛时,球队赢球的概率:
.
(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,
甲球员打中锋的概率为.
13.(2026高二·浙江杭州·期末)为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取80名学生.通过测验得到了如表数据:
学校
数学成绩
合计
不优秀
优秀
甲校
30
10
40
乙校
20
20
40
合计
50
30
80
(1)依据小概率值的独立性检验,分析两校学生中数学成绩优秀率之间是否存在差异;如果表中所有数据都扩大为原来的10倍.在相同的检验标准下,再用独立性检验推断学校和数学成绩之间的关联性,结论还一样吗?请你试着解释其中的原因.
(2)据调查,丙校学生数学成绩的优秀率为30%,且将频率视为概率、现根据甲、乙、丙三所学校总人数比例依次抽取了24人,30人,30人进行调查访谈.如果已知从中抽到了一名优秀学生,求该名学生来自丙校的概率.
附:临界值表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【答案】(1)答案见解析
(2)
【分析】(1)由卡方公式进行求解即可;
(2)利用全概率公式、条件概率公式进行求解即可.
【详解】(1)因为,
所以两校学生中数学成绩优秀率之间没有关系,
所有数据都扩大10倍后:
这时两校学生中数学成绩优秀率之间有关系,
所以相同的检验标准下,再用独立性检验推断学校和数学成绩之间的关联性,结论不一样,
主要是因为样本容量的不同,只有当样本容量越大时,用样本估计总体的准确性会越高.
(2)抽取甲、乙、丙三所学校优秀学生人数分别为:
,
记分别为事件“抽到的学生来自甲、乙、丙学校”,为事件“抽到一名优秀学生”,
则,
,
所以
,
所以从中抽到了一名优秀学生,该名学生来自丙校的概率为:
.
14.(2026高三·辽宁朝阳·月考)2023年9月23日第19届亚运会在杭州开幕,本届亚运会共设40个竞赛大项,包括31个奥运项目和9个非奥运项目.为研究不同性别学生对杭州亚运会项目的了解情况,某学校进行了一次抽样调查,分别抽取男生和女生各50名作为样本,设事件 “了解亚运会项目”, “学生为女生”,据统计,.
附:,.
0.050
0.010
0.001
3.841
6.635
10.828
(1)根据已知条件,填写下列2×2列联表,并依据的独立性检验,能否认为该校学生对亚运会项目的了解情况与性别有关?
了解
不了解
合计
男生
女生
合计
(2)现从该校了解亚运会项目的学生中,采用分层随机抽样的方法随机抽取9名学生,再从这9名学生中随机抽取4人,设抽取的4人中男生的人数为,求的分布列和数学期望.
【答案】(1)列联表见解析,该校学生对杭州亚运会项目的了解情况与性别无关
(2)分布列见解析,数学期望为
【分析】(1)根据题中所给条件填写表格,写出零假设,根据列联表中数据计算出值,与比较,得出结论即可.
(2)根据题意知其服从超几何分布,列出分布列,求出数学期望即可.
【详解】(1)因为,,
所以对杭州亚运会项目了解的女生为,了解亚运会项目的学生为,
结合男生和女生各50名,填写2×2列联表为:
了解
不了解
合计
男生
15
35
50
女生
30
20
50
合计
45
55
100
零假设:该校学生对杭州亚运会项目的了解情况与性别无关,
根据列联表中的数据,
依据的独立性检验,可以推断成立,
即该校学生对杭州亚运会项目的了解情况与性别无关.
(2)由(1)知,采用分层随机抽样的方法随机抽取9名学生,
其中男生人数为(人);
女生人数为(人),
由题意可得,随机变量的所有可能取值为0,1,2,3.
,,
,.
随机变量的分布列如下:
0
1
2
3
则.
15.(2026高三·湖南·阶段检测)2023年实行新课标新高考改革的省市共有29个,选科分类是高级中学在校学生生涯规划的重要课题,某高级中学为了解学生选科分类是否与性别有关,在该校随机抽取100名学生进行调查.统计整理数据得到如下的列联表:
选物理类
选历史类
合计
男生
35
15
女生
25
25
合计
100
(1)依据小概率值的独立性检验,能否据此推断选科分类与性别有关联?
(2)在以上随机抽取的女生中,按不同选择类别同比例分层抽样,共抽取6名女生进行问卷调查,然后在被抽取的6名女生中再随机抽取4名女生进行面对面访谈.设面对面访谈的女生中选择历史类的人数为随机变量,求随机变量的分布列和数学期望.
附:,其中.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)选科分类与性别有关联
(2)分布列见解析,2
【分析】(1)计算卡方即可由独立性检验求解,
(2)根据超几何分布的概率公式求解概率,即可求解分布列以及期望.
【详解】(1)列联表补充如下:
选物理类
选历史类
合计
男生
35
15
50
女生
25
25
50
合计
60
40
100
零假设为:选科分类与性别无关联,
因为,
根据小概率值的独立性检验,推断不成立,
即认为选科分类与性别有关联,此推断犯错误的概率不大于0.05.
(2)由已知,50名女学生中选择物理类和选择历史类的比例为,
因此抽取6名女生中,选择物理类和选择历史类的人数均为3名.
所以随机变量的取值为.
,
所以随机变量的分布列如下表:
1
2
3
所以.
16.(2026高三·河北廊坊·期末)为学习贯彻中央农村工作会议精神“强国必先强农,农强方能国强”,某市在某村积极开展香菇种植,助力乡村振兴.香菇的生产可能受场地、基料、水分、菌种等因素的影响,现已知香菇有菌种甲和菌种乙两个品种供挑选,菌种甲在温度时产量为28吨/亩,在温度30℃时产量为20吨/亩;菌种乙在温度20℃时产量为22吨/亩,在气温时产量为30吨/亩.
(1)请补充完整2×2列联表,根据2×2列联表和小概率值的独立性检验,判断菌种甲、乙的产量与温度是否有关?
合计
菌种甲
菌种乙
合计
(2)某村选择菌种甲种植,已知菌种甲在气温为时的发芽率为,从菌种甲中任选3个,若设为菌种甲发芽的个数,求的分布列及数学期望.
附:参考公式:,其中.
临界值表:
0.10
0.05
0.01
2.706
3.841
6.635
【答案】(1)表格见解析,无关
(2)分布列见解析,
【分析】(1)由题中数据先完善列联表,然后根据卡方计算公式进行独立性检验即可.
(2)由二项分布的概率计算公式即可得相应的概率,从而得分布列,根据期望公式计算即可求解.
【详解】(1)
合计
菌种甲
28
20
48
菌种乙
22
30
52
合计
50
50
100
零假设:菌种甲、乙的产量与温度没有关系,根据表中数据,计算得,
根据小概率值的独立性检验,我们没有充分的证据推断不成立,
因此可以认为成立,即认为菌种甲、乙的产量与温度无关.
(2)由题意可知,的可能取值有,
由公式可得,
,
所以的分布列为
0
1
2
3
所以.
17.(2026·辽宁·模拟预测)某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:
天数
[0,5]
(5,10]
(10,15]
(15,20]
(20,25]
(25,30]
人数
4
15
33
31
11
6
(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布,其中μ近似为样本的平均数(每组数据取区间的中间值),且,若全校有3000名学生,求参加“每天锻炼1小时”活动超过21天的人数(精确到1);
(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号.请填写下面列联表:
性别
活动天数
合计
[0,15]
(15,30]
男生
女生
合计
并依据小概率值的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响.
附:参考数据:;;.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)476人
(2)答案见解析
【分析】(1)利用频数分布表,求得样本的平均数,从而写出X近似服从正态分布,利用参考数据求得参加“每天锻炼1小时”活动超过21天的人数;
(2)根据频数分布表和已知条件,完善列联表,根据独立性检验的公式,求出学生性别与获得“运动达人”称号是否有关联和它们之间如何相互影响.
【详解】(1)由频数分布表知
,则,,
,
,
参加“每天锻炼1小时”活动超过21天的人数约为476人.
(2)由频数分布表知,锻炼活动的天数在的人数为:,
参加“每天锻炼1小时”活动的天数在[0,15]的学生中有20名男生,
参加“每天锻炼1小时”活动的天数在[0,15]的学生中有女生人数:
由频数分布表知,锻炼活动的天数在的人数为,
参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,
参加“每天锻炼1小时”活动的天数在[0,15]的学生中有女生人数:
列联表如下:
性别
活动天数
合计
男生
20
30
50
女生
32
18
50
合计
52
48
100
零假设为:学生性别与获得“运动达人”称号无关
依据的独立性检验,我们推断不成立,即:可以认为学生性别与获得“运动达人”称号有关;
而且此推断犯错误的概率不大于,根据列联表中的数据得到,男生、女生中活动天数超过15天的频率分别为:和,可见男生中获得“运动达人”称号的频率是女生中获得“运动达人”的称号频率的倍,于是依据频率稳定与概率的原理,我们可以认为男生获得“运动达人”的概率大于女生,即男生更容易获得运动达人称号.
18.(2026·全国甲卷)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)答案见详解
(2)答案见详解
【分析】(1)根据题中数据完善列联表,计算,并与临界值对比分析;
(2)用频率估计概率可得,根据题意计算,结合题意分析判断.
【详解】(1)根据题意可得列联表:
优级品
非优级品
甲车间
26
24
乙车间
70
30
可得,
因为,
所以有的把握认为甲、乙两车间产品的优级品率存在差异,没有的把握认为甲,乙两车间产品的优级品率存在差异.
(2)由题意可知:生产线智能化升级改造后,该工厂产品的优级品的频率为,
用频率估计概率可得,
又因为升级改造前该工厂产品的优级品率,
则,
可知,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$2025-2026学年高二数学同步知识·题型解题秘籍精讲精练讲义(人教A版2019选择性必修第三册)
8.3列联表与独立性检验6题型分类
一、分类变量
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
二、2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
三、等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
四、临界值
1.相关性的度量:χ2=.
2.χ2越小说明变量之间越独立,χ2越大说明变量之间越相关.
3.存在正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.
五、独立性检验
1.基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
2.独立性检验:这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
3.χ2临界值表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
六、应用独立性检验解决实际问题的大致步骤
1.提出零假设H0:X和Y相互独立,并给出在问题中的解释.
2.根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
3.根据检验规则得出推断结论.
4.在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
(一)
由2×2列联表分析变量间关系
(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与 的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
(3)独立性检验的关注点:在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.
题型1:完成列联表
1.(2026高二·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
2.(2026高二·全国·课后作业)下表是、两班关于选择“物理”作为“加三学科”的意愿的列联表,请根据已有数据完善表格.
单位:人
类别
愿意选择“物理”
不愿意选择“物理”
总计
班
20
42
班
16
总计
44
3.(2026高二·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
4.(2026高二·广西钦州·期末)如下是一个列联表,则________.
yx
总计
总计
5.(2026高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
6.(2026高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
题型2:由2×2列联表分析变量间关系
7.(2026·云南昆明·模拟预测)考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
8.(2026高二·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
9.(2026高二·河南·月考)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
10.(2026高二·河南·期中)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:
了解
不了解
总计
年龄不小于60岁
a
b
a+b
年龄小于60岁
c
d
c+d
总计
a+c
b+d
a+b+c+d
给出下列4组数据:
① ;② ;
③ ;④ .
则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是______.(填序号)
11.(2026高二·全国·课后作业)在对人们的休闲方式的一次调查中,共调查了110人,其中女性50人,男性60人.女性中有30人主要的休闲方式是看电视,另外20人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外40人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)由列联表判断性别与休闲方式是否有关系.
(二)
由等高堆积条形图分析变量间关系
等高堆积条形图:等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
题型3:由等高堆积条形图分析变量间关系
12.(2026高三·广西南宁·期末)为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
13.(2026高二·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是___________.
14.(2026高三·北京·一轮复习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
15.(2026高二·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
16.【多选】(2026高二·福建泉州·期中)如图是调查某地区男、女中学生喜欢数学的等高堆积条形图,阴影部分表示喜欢数学的百分比,从图可以看出( )
A.性别与喜欢数学无关 B.女生中喜欢数学的百分比为
C.男生比女生喜欢数学的可能性大些 D.男生不喜欢数学的百分比为
17.(2026高二·河北张家口·阶段检测)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
18.(2026高二·吉林·月考)为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
(三)
独立性检验
独立性检验
基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
独立性检验的具体做法
①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值xα.
②利用公式χ2=计算χ2.
③如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”。
题型4:独立性检验的概念及辨析
19.(2026高二·河南南阳·期中)下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
20.(2026高二·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
21.(2026高三·湖北恩施·开学考试)根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
22.(2026·江苏南通·模拟预测)为研究课后整理错题习惯与数学成绩达标之间的关联性,经独立性检验计算得,临界值,.记事件为“学生成绩达标”,事件为“学生坚持整理错题”;已知,,,则有________的把握认为二者存在关联;随机抽取一名学生,其成绩达标的概率为________.
23.(2026·天津·模拟预测)近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌汽车商随机调查了甲、乙两地各200名消费者,并用等高堆积条形图直观地展示调查结果如下图所示,经计算得到.
车型与地区
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
下列说法正确的是( )
A.在所调查的甲地购车者中,若按比例分层随机抽样抽取20人,则新能源车主有8人
B.在所调查的乙地购车者中,购买燃油车的人数比新能源车的多20人
C.依据的独立性检验,即消费者的购车类型与地域有关联,此推断犯错误的概率不大于0.001
D.依据的独立性检验,即消费者的购车类型与地域无关联,此推断犯错误的概率不大于0.001
题型5:卡方的计算
24.(2026·山东德州·模拟预测)秦腔是陕西最具代表性的戏曲艺术,2006年被列入第一批国家级非物质文化遗产名录.为研究是否喜爱秦腔与年龄之间的关系,并为传统文化保护提供数据支持,某文化调研队在西安市随机抽取了200名当地居民进行调查,得到如下列联表:
单位:人
秦腔
年龄
合计
40岁以下
40岁及以上
喜爱
45
45
90
不喜爱
75
35
110
合计
120
80
200
(1)年龄在40岁及以上的当地居民中,喜爱秦腔的概率为,求的估计值;
(2)根据小概率值的独立性检验,能否认为是否喜爱秦腔与年龄有关?
0.050
0.010
0.001
3.841
6.635
10.828
附:.
25.(2026·河南·模拟预测)新能源汽车越来越受到年轻人的青睐.某品牌新能源汽车有限公司为了了解新能源汽车爱好者对本公司生产的新能源汽车款和款的满意度进行了市场调研,在社会上随机调查了200名新能源爱好者,得到如下列联表:
满意
不满意
合计
新能源汽车A款
80
新能源汽车B款
30
合计
150
200
(1)请完善上述列联表,并判断能否有90%的把握认为新能源汽车的款型对满意度有影响;
(2)从这200位新能源爱好者中任选两人,在被调查的两人选择新能源汽车款型一致的条件下,试求他们对该新能源汽车款型均满意的概率.
附:,其中.
0.15
0.10
0.05
0.025
2.07
2.71
3.84
5.024
26.(2026高二·辽宁铁岭·期中)某校对学生的艺术特长进行调查,得到如下数据.
有艺术特长
无艺术特长
男
250
100
女
350
150
(1)用频率估计概率,从本校的男生中任选两名,求他们均有艺术特长的概率;
(2)在犯错误的概率不超过0.1的前提下,是否可以认为学生性别与有无艺术特长有关.
附:,.
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
27.(2026高三·全国·专题练习)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解岁年轻人的体质健康是否与性别有关,在月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到列联表.
性别
感冒
不感冒
总计
男
女
总计
依据表中数据,能否有的把握认为岁年轻人的体质健康与性别有关?若把表中所有数据都扩大到原来的倍,此时结论还一样吗?请解释其中原因,并简要说明如何调整调查可使此研究更严谨.
参考数据:
28.(2026高三·全国·专题练习)随着网络App的普及与发展,刷“抖音”成为了人们日常生活的一部分.某地区随机抽取了部分20~40岁的“抖音”用户,调查他们日均刷“抖音”的时间情况,所得数据统计如下表:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
男性
48
72
女性
24
56
依据小概率值的独立性检验,能否认为日均刷“抖音”时间的长短与性别有关?
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
29.(2026·四川绵阳·模拟预测)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床生产了件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值的独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.05
0.010
0.001
3.841
6.635
10.828
30.(2026高三·上海·课堂例题)为了调查商户每天销售额与每天线上销售时间之间的相关关系,随机选取45家商户进行跟踪调查,其中每日线上销售时间不少于6小时的商户有19家,余下的商户中,每天的销售额不足3万元的占,统计后得到如下列联表:
销售额不少于3万元(户)
销售额不足3万元(户)
合计
线上销售时间不少于6小时
4
19
线上销售时间不足6小时
合计
45
请完成上面的列联表,并判断是否有的把握认为“商户每天销售额与商户每天线上销售时间有关.”
参考公式:,其中.
0.50
0.40
0.25
0.15
0.010
0.05
0.025
0.010
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
31.(2026高三·上海·随堂练习)2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如下表所示:
表一
表二
了解情况
Y
N
男
女
合计
人数
140
60
Y
80
N
40
合计
附:临界值参考表的参考公式
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
,其中
(1)请根据所提供的数据,完成上面的列联表(表二);
(2)判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系.
32.(2026高三·四川宜宾·开学考试)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).
测得40只小鼠体重如下(单位:):(已按从小到大排好)
对照组:17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.4 26.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5 27.6 28.3
实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.2 14.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0
附:,其中.
0.10
0.05
0.010
2.706
3.841
6.635
(1)求40只小鼠体重的中位数,并完成下面列联表:
合计
对照组
实验组
合计
(2)根据列联表,能否有的把握认为药物对小鼠生长有抑制作用.
(四)
独立性检验的综合应用
独立性检验:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
(1)解答此类题目的关键在于正确利用χ2=计算χ2的值,再用它与临界值xα的大小作比较来判断假设检验是否成立,从而使问题得到解决.
(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.
题型6:独立性检验的综合应用
33.(2026高二·上海奉贤·期末)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断是否有99%的把握认为我市市民网购与性别有关?
(2)现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
34.(2026·重庆北碚·模拟预测) 某高校为调查人们对 AI 知识掌握的熟悉程度与学历是否有关,组织了相关的答题活动, 满分 100 分. 答题完成后, 工作人员从中随机抽取 200 人作为样本,得到如下数据.
人数分数 学历
本科及以下
37
33
12
10
5
3
本科以上
20
20
10
10
30
10
(1)若得分不小于 60 分,则认为对 AI 知识掌握的程度为熟悉,否则为不熟悉;
熟悉程度
学历
合计
本科及以下
本科以上
熟悉
不熟悉
合计
根据样本数据补全上面的 列联表,并依据小概率值 的独立性检验,能否认为熟悉AI程度与参与人员学历有关系.
(2)从样本里学历为本科以上的人群中,采用按比例分层随机抽样的方法抽取 10 个人,再从这 10 人中随机抽出 3 人进行访谈,记这 3 人中分数在 的人数为 ,求 的分布列及数学期望.
附:, .
0.05
0.01
0.001
3.841
6.635
10.828
35.(2026·河北保定·模拟预测)某市体育局为调研市民体育锻炼情况与健康水平的关联性,随机抽取了120名18岁~60岁市民进行调查.将每周锻炼不少于3次的市民归为“高频锻炼组”,不足3次的归为“低频锻炼组”;体质检测达到《国民体质测定标准》优秀和良好等级的定为“体质达标”,否则为“体质不达标”.调查结果整理为如下不完整的列联表.
体质达标
体质不达标
合计
高频锻炼组
m
15
60
低频锻炼组
25
v
u
合计
s
t
120
附:,其中.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
(1)请根据列联表中的数据,写出m,v,s,t,u的值;
(2)依据小概率值的独立性检验,分析该市市民体育锻炼频次是否与体质达标有关联;
(3)该市计划从抽到的120人中体质不达标市民中抽取部分人员开展“科学健身指导”活动,现按高频锻炼组和低频锻炼组分层,通过分层抽样抽取10人展开指导活动,再从这10人中随机抽取3人进行专项访谈,求抽取的3人中至多有1人来自高频锻炼组的概率.
36.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
37.(2026·陕西咸阳·模拟预测)咸阳文旅部门统计了某景点在2025年2月至6月的旅游收入(单位:万元),得到以下数据:
月份
2
3
4
5
6
旅游收入
10
12
11
12
20
(1)根据表中所给数据,用相关系数判断,是否可用线性回归模型拟合与的关系?(当时,认为线性相关性较强),若可以,求出关于之间的线性回归方程;若不可以,请说明理由;
(2)为调查游客对该景点的评价情况,随机抽查了100名游客,得到如下列联表,请填写下面的列联表,依据的独立性检验,能否认为“游客是否喜欢该景点与性别有关联”.
喜欢
不喜欢
总计
男
50
女
30
总计
60
参考公式:相关系数,参考数据:.
线性回归方程:,其中
,其中.
临界值表:
0.010
0.005
0.001
6.635
7.879
10.828
1.(2026高二·全国·课后作业)用等高堆积条形图粗略估计两个分类变量是否相关.观察下列各图,其中两个分类变量相关关系最强的是( )
A. B.
C. D.
2.(2026高二·全国·课后作业)以下关于独立性检验的说法中,错误的是( )
A.独立性检验依据小概率原理 B.独立性检验得到的结论一定正确
C.样本不同,独立性检验的结论可能有差异 D.独立性检验不是判定两分类变量是否相关的唯一方法.
3.(2026高二·全国·课后作业)高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到如表:
班组与成绩统计表
优秀
不优秀
总计
甲班
11
34
45
乙班
8
37
45
总计
19
71
90
则随机变量K2的观测值约为( )
A.0.600 B.0.828 C.2.712 D.6.004
4.(2026高二·全国·课后作业)为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别
阳性数
阴性数
总计
铅中毒病人
29
7
36
对照组
9
28
37
总计
38
35
73
试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
5.(2026高二·全国·课后作业)为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
父母吸烟
父母不吸烟
总计
子女吸烟
237
83
320
子女不吸烟
678
522
1 200
总计
915
605
1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
6.(2026高二·全国·课堂例题) 某出租汽车公司决定更换一批小汽车以代替原来报废的出租车,现有,车型的使用寿命(单位:年)频数表如下:
使用寿命/年
5
6
7
8
合计
型出租车/辆
10
20
45
25
100
型出租车/辆
15
35
40
10
100
(1)填写下表,并依据小概率值的独立性检验,分析出租车的使用寿命与汽车车型是否有关联;
车型
使用寿命
合计
不高于6年
不低于7年
型
型
合计
(2)司机师傅小李准备在一辆开了4年的型车和一辆开了4年的型车中选择,为了尽最大可能实现3年内(含3年)不换车,试通过计算说明他应如何选择.
7.(2026高二·全国·课堂例题)某教育机构为了研究成年人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:
学历
对教育改革态度
合计
积极支持
不太赞成
大学专科以上
39
157
196
大学专科以下
29
167
196
合计
68
324
392
对于教育机构的研究项目,依据小概率值的独立性检验,根据上述数据能得出什么结论?
8.(2026·全国)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
9.(2026·上海)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:
时间范围学业成绩
优秀
5
44
42
3
1
不优秀
134
147
137
40
27
(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?
(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)
(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?
(附:其中,.)
10.(2026高二·全国·课堂例题)为了检验两种不同的课堂教学模式对学生的成绩是否有影响,现从高二年级的甲(实行“问题—探究式”模式),乙(实行“自学—指导式”模式)两个班中每班任意抽取20名学生进行测试,他们的成绩(总分150分)如下.
甲班:88 92 95 98 103 108 110 112 118 118 120 121 126 132 134 135 140 142 146 148
乙班:96 97 104 107 108 108 114 117 119 121 124 124 125 127 132 135 135 137 138 147
记成绩在120分以上(包括120分)为优秀,其他的成绩为一般,试根据小概率值的独立性检验,分析这两种课堂教学模式对学生的成绩是否有影响.
11.(2026高二·全国·课后作业)网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.请利用等高堆积条形图判断学生学习成绩与经常上网是否有关.
12.(2026·云南楚雄·模拟预测)全国“村BA”篮球赛点燃了全民的运动激情,深受广大球迷的喜爱.每支球队都有一个或几个主力队员,现有一支“村BA”球队,其中甲球员是其主力队员,经统计该球队在某个赛季的所有比赛中,甲球员是否上场时该球队的胜负情况如表.
甲球员是否上场
球队的胜负情况
合计
胜
负
上场
40
45
未上场
3
合计
42
(1)完成列联表,并判断依据小概率值的独立性检验,能否认为球队的胜负与甲球员是否上场有关;
(2)由于队员的不同,甲球员主打的位置会进行调整,根据以往的数据统计,甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.
(i)当甲球员上场参加比赛时,求球队赢球的概率;
(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,求甲球员打中锋的概率.(精确到0.01)
附:,.
0.15
0.10
0.05
0.025
0.010
0.001
2.072
2.706
3.841
5.024
6.635
10.828
13.(2026高二·浙江杭州·期末)为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取80名学生.通过测验得到了如表数据:
学校
数学成绩
合计
不优秀
优秀
甲校
30
10
40
乙校
20
20
40
合计
50
30
80
(1)依据小概率值的独立性检验,分析两校学生中数学成绩优秀率之间是否存在差异;如果表中所有数据都扩大为原来的10倍.在相同的检验标准下,再用独立性检验推断学校和数学成绩之间的关联性,结论还一样吗?请你试着解释其中的原因.
(2)据调查,丙校学生数学成绩的优秀率为30%,且将频率视为概率、现根据甲、乙、丙三所学校总人数比例依次抽取了24人,30人,30人进行调查访谈.如果已知从中抽到了一名优秀学生,求该名学生来自丙校的概率.
附:临界值表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
14.(2026高三·辽宁朝阳·月考)2023年9月23日第19届亚运会在杭州开幕,本届亚运会共设40个竞赛大项,包括31个奥运项目和9个非奥运项目.为研究不同性别学生对杭州亚运会项目的了解情况,某学校进行了一次抽样调查,分别抽取男生和女生各50名作为样本,设事件 “了解亚运会项目”, “学生为女生”,据统计,.
附:,.
0.050
0.010
0.001
3.841
6.635
10.828
(1)根据已知条件,填写下列2×2列联表,并依据的独立性检验,能否认为该校学生对亚运会项目的了解情况与性别有关?
了解
不了解
合计
男生
女生
合计
(2)现从该校了解亚运会项目的学生中,采用分层随机抽样的方法随机抽取9名学生,再从这9名学生中随机抽取4人,设抽取的4人中男生的人数为,求的分布列和数学期望.
15.(2026高三·湖南·阶段检测)2023年实行新课标新高考改革的省市共有29个,选科分类是高级中学在校学生生涯规划的重要课题,某高级中学为了解学生选科分类是否与性别有关,在该校随机抽取100名学生进行调查.统计整理数据得到如下的列联表:
选物理类
选历史类
合计
男生
35
15
女生
25
25
合计
100
(1)依据小概率值的独立性检验,能否据此推断选科分类与性别有关联?
(2)在以上随机抽取的女生中,按不同选择类别同比例分层抽样,共抽取6名女生进行问卷调查,然后在被抽取的6名女生中再随机抽取4名女生进行面对面访谈.设面对面访谈的女生中选择历史类的人数为随机变量,求随机变量的分布列和数学期望.
附:,其中.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
16.(2026高三·河北廊坊·期末)为学习贯彻中央农村工作会议精神“强国必先强农,农强方能国强”,某市在某村积极开展香菇种植,助力乡村振兴.香菇的生产可能受场地、基料、水分、菌种等因素的影响,现已知香菇有菌种甲和菌种乙两个品种供挑选,菌种甲在温度时产量为28吨/亩,在温度30℃时产量为20吨/亩;菌种乙在温度20℃时产量为22吨/亩,在气温时产量为30吨/亩.
(1)请补充完整2×2列联表,根据2×2列联表和小概率值的独立性检验,判断菌种甲、乙的产量与温度是否有关?
合计
菌种甲
菌种乙
合计
(2)某村选择菌种甲种植,已知菌种甲在气温为时的发芽率为,从菌种甲中任选3个,若设为菌种甲发芽的个数,求的分布列及数学期望.
附:参考公式:,其中.
临界值表:
0.10
0.05
0.01
2.706
3.841
6.635
17.(2026·辽宁·模拟预测)某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:
天数
[0,5]
(5,10]
(10,15]
(15,20]
(20,25]
(25,30]
人数
4
15
33
31
11
6
(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布,其中μ近似为样本的平均数(每组数据取区间的中间值),且,若全校有3000名学生,求参加“每天锻炼1小时”活动超过21天的人数(精确到1);
(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号.请填写下面列联表:
性别
活动天数
合计
[0,15]
(15,30]
男生
女生
合计
并依据小概率值的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响.
附:参考数据:;;.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
18.(2026·全国)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$