内容正文:
2024-2025学年《解题秘籍》高二数学同步知识·题型精讲精练讲义(人教A版2019选择性必修第三册)
8.3列联表与独立性检验6题型分类
一、分类变量
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
二、2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
三、等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
四、临界值
1.相关性的度量:χ2=.
2.χ2越小说明变量之间越独立,χ2越大说明变量之间越相关.
3.存在正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.
五、独立性检验
1.基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
2.独立性检验:这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
3.χ2临界值表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
六、应用独立性检验解决实际问题的大致步骤
1.提出零假设H0:X和Y相互独立,并给出在问题中的解释.
2.根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
3.根据检验规则得出推断结论.
4.在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
(一)
由2×2列联表分析变量间关系
(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与 的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
(3)独立性检验的关注点:在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.
题型1:完成列联表
1.(2024高二·全国月考)在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:
分数段
29~40
41~50
51~60
61~70
71~80
81~90
91~100
午休考生人数
23
47
30
21
14
31
14
不午休
考生人数
17
51
67
15
30
17
3
根据上述表格完成列联表:
及格人数
不及格人数
总计
午休
不午休
总计
【答案】答案见解析
【分析】根据统计数据以及列联表的求法即可求解.
【解析】
及格人数
不及格人数
总计
午休
80
100
180
不午休
65
135
200
总计
145
235
380
2.(2024高二·西藏日喀则·期末)假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
【答案】D
【分析】根据列联表直接计算.
【解析】根据列联表知,,又,所以,
故选:
3.(2025高三·全国月考)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【答案】C
【分析】根据联表计算求参即可.
【解析】因为.所以.又,所以.
故选:C.
4.(2024高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
【答案】D
【分析】根据题意先得出的值,进而再得的值,进而可知的值.
【解析】因为抽取的村民中,老年人有25名,年轻人有25名,所以,
所以,A、B对;
所以,则对;
则错.
故选:.
题型2:由2×2列联表分析变量间关系
5.(2024高二·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】B
【分析】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.
【解析】对于A, ,
对于B,,
对于C,,
对于D,
显然B中最大,该组数据能说明x与y有关系的可能性最大,
故选:B.
6.(2024高二·全国·课堂例题)假设有两个分类变量和的列联表如下:注:的观测值.对于同一样本,以下数据能说明和有关系的可能性最大的一组是( )
总计
a
10
a+10
c
30
总计
A. B.
C. D.
【答案】A
【分析】当一定时,相差越大,与相差越大,的观测值就越大,得出分类变量和有关系的可能性越大.
【解析】根据独立性检验的方法和列联表可得,当与相差越大,则分类变量和有关系的可能性越大,
即相差越大,与相差越大.
由各选项可得A满足条件,
故选:A.
7.(2024·云南昆明·模拟预测)考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【答案】C
【分析】根据表格提供的数据作出判断.
【解析】由列联表中的数据可知,
种子经过处理,得病的比例明显降低,
种子未经过处理,得病的比例要高些,
所以可得结论:种子是否经过处理跟是否生病有关.
故选:C
8.(2024高二·全国月考)假设有两个分类变量与,它们的可能取值分别为和,其列联表为
则当整数取______时,与的关系最弱( )
A.8 B.9 C.14 D.19
【答案】C
【分析】根据列联表分析运算.
【解析】在两个分类变量的列联表中,当的值越小时,认为两个分类变量有关的可能性越小.
令,得,解得,
又为整数,所以当时,与的关系最弱.
故选:C.
(二)
由等高堆积条形图分析变量间关系
等高堆积条形图:等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
题型3:由等高堆积条形图分析变量间关系
9.(2024高二·全国月考)在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )
A.与 B.与
C.与 D.与
【答案】C
【分析】由等高条形图的定义和性质,即可判断
【解析】由等高条形图可知与的值相差越大,|ad-bc|就越大,相关性就越强.
故选:C
10.(2024·吉林长春·模拟预测)观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
【答案】D
【分析】由等高条形图的定义和性质依次分析,即得解
【解析】观察等高条形图发现与相差很大,就判断两个分类变量之量关系最强.
故选:D
11.(2024·四川达州·模拟预测)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
【答案】C
【分析】根据等高条形图的概念结合条件逐项分析即得.
【解析】根据等高条形图图1可知样本中选择物理学科的人数较多,故C正确;
根据等高条形图图2可知样本中男生人数多于女生人数,故D错误;
样本中选择物理学科的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低,
所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;
样本中女生选择历史意愿的人数不一定多于男生选择历史意愿的人数,故B错误.
故选:C.
12.(2024·广东佛山·模拟预测)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:
根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
【答案】D
【解析】由等高堆积条形图逐项判断即可.
【解析】解:由条形图知女生数量多于男生数量,故A正确;
有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B正确;
男生偏爱两理一文,故C正确;
女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D错误.
故选:D.
13.(2024高二·山东青岛·期中)为了了解某高校学生喜欢使用手机支付是否与性别有关,抽取了部分学生作为样本,统计后作出如图所示的等高条形图,则下列说法正确的是( )
A.喜欢使用手机支付与性别无关
B.样本中男生喜欢使用手机支付的约
C.样本中女生喜欢使用手机支付的人数比男生多
D.女生比男生喜欢使用手机支付的可能性大些
【答案】D
【分析】根据等高条形图可得喜欢使用手机支付与性别有关,样本中男生喜欢使用手机支付的约为40%,女生比男生喜欢使用手机支付的可能性大些,由于不知道男女生人数,所以不能认定女生喜欢使用手机支付的人数是否比男生多.
【解析】A错误,根据等高条形图,喜欢和不喜欢使用手机支付的比例因性别差距很明显,所以喜欢使用手机支付与性别有关;
B错误,样本中男生喜欢使用手机支付的约为40%;
女生比男生喜欢使用手机支付的可能性大些,由于不知道男女生人数,所以不能认定女生喜欢使用手机支付的人数是否比男生多.所以C错误,D正确.
故选:D
【点睛】此题考查等高条形图的辨析,根据条形图认识喜欢使用手机支付与性别的关系,关键在于准确识图正确辨析.
(三)
独立性检验
独立性检验
基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
独立性检验的具体做法
①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值xα.
②利用公式χ2=计算χ2.
③如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”。
题型4:独立性检验的概念及辨析
14.(2024高三·广东东莞月考)根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为( )
A.变量与不独立,这个结论犯错误的概率不超过
B.变量与不独立,这个结论犯错误的概率不超过
C.变量与独立,这个结论犯错误的概率不超过
D.变量与独立,这个结论犯错误的概率不超过
【答案】B
【分析】根据找出对应的的值,并比较与卡方值得大小,进而由卡法的定义推出相应结论即可.
【解析】因为时,所以,
所以变量与不独立,且这个结论犯错误的概率不超过.
故选:B.
15.(2024高二·山东滨州·期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )
附:,附表:
0.05
0.01
3.841
6.635
A.7 B.8 C.9 D.10
【答案】C
【分析】由已知数据计算,根据独立性检验的结论,列不等式求的取值范围,得最小值.
【解析】根据题意,不妨设,
于是,
由于依据的独立性检验认为喜欢短视频和性别不独立,
根据表格可知,解得,于是最小值为.
故选:C
16.(2024高二·河南焦作·期中)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为( )
参考公式:,其中.
参考数据:
A. B. C. D.
【答案】C
【分析】设男生人数为,则女生人数为,且,写出列联表并根据卡方计算公式,结合题意确定卡方值的范围,即可确定的取值范围,进而确定男生可能人数.
【解析】设男生人数为,则女生人数为,且,
可得列联表如下:
男生
女生
合计
喜欢滑冰
不喜欢滑冰
合计
所以,
因为有的把握认为是否喜欢滑冰和性别有关,
所以,解得,
所以,结合选项只有,
故选:C.
题型5:卡方的计算
17.(2024高三·湖南长沙月考)为检验预防某种疾病的两种疫苗的免疫效果,随机抽取接种疫苗的志愿者各100名,化验其血液中某项医学指标(该医学指标范围为,统计如下:
该项医学指标
接种疫苗人数
10
50
接种疫苗人数
30
40
个别数据模糊不清,用含字母的代数式表示.
(1)为检验该项医学指标在内的是否需要接种加强针,先从医学指标在的志愿者中,按接种疫苗分层抽取8人,再次抽血化验进行判断.从这8人中随机抽取4人调研医学指标低的原因,记这4人中接种疫苗的人数为,求的分布列与数学期望;
(2)根据(1)化验研判结果,医学认为该项医学指标低于50,产生抗体较弱,需接种加强针,该项医学指标不低于50,产生抗体较强,不需接种加强针.请先完成下面的列联表,若根据小概率的独立性检验,认为接种疫苗与志愿者产生抗体的强弱有关联,求的最大值.
疫苗
抗体
合计
抗体弱
抗体强
疫苗
疫苗
合计
附:,其中.
0.25
0.025
0.005
1.323
5.024
7.879
【答案】(1)分布列见解析,
(2)列联表见解析,2
【分析】(1)由抽样调查性质可得抽取接种疫苗人数,计算出的所有可能取值的对应概率可得分布列,由分布列可计算期望;
(2)结合的计算公式计算出对应的范围即可得.
【解析】(1)从医学指标在的志愿者中,按接种疫苗分层抽取8人中,
接种疫苗有2人,接种疫苗有6人,
由题意可知,可能取值为,
,
的分布列为:
2
3
4
则;
(2)列联表如下:
疫苗
抗体
合计
抗体弱
抗体强
疫苗
100
疫苗
100
合计
60
140
200
则,
由题意可知,,
整理得,,
解得或,
又,则,
所以,
故的最大值为2.
18.(2024·云南楚雄·模拟预测)全国“村BA”篮球赛点燃了全民的运动激情,深受广大球迷的喜爱.每支球队都有一个或几个主力队员,现有一支“村BA”球队,其中甲球员是其主力队员,经统计该球队在某个赛季的所有比赛中,甲球员是否上场时该球队的胜负情况如表.
甲球员是否上场
球队的胜负情况
合计
胜
负
上场
40
45
未上场
3
合计
42
(1)完成列联表,并判断依据小概率值的独立性检验,能否认为球队的胜负与甲球员是否上场有关;
(2)由于队员的不同,甲球员主打的位置会进行调整,根据以往的数据统计,甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.
(i)当甲球员上场参加比赛时,求球队赢球的概率;
(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,求甲球员打中锋的概率.(精确到0.01)
附:,.
0.15
0.10
0.05
0.025
0.010
0.001
2.072
2.706
3.841
5.024
6.635
10.828
【答案】(1)列联表见解析;有99%的把握认为球队的胜负与甲球员是否上场有关.
(2)(i);(ii)
【分析】(1)根据题意,得出的列联表,求得,结合附表,即可求解;
(2)设事件:甲球员上场打前锋,事件:甲球员上场打中锋,事件:甲球员上场打后卫,事件:球队赢球,结合全概率公式,即可求解;
(ii)根据题意,利用条件概率的计算公式和贝叶斯公式,即可求解.
【解析】(1)解:根据题意,可得的列联表:
甲球员是否上场
球队的胜负情况
合计
胜
负
上场
40
5
45
未上场
2
3
5
合计
42
8
50
零假设:球队的胜负与甲球员是否上场无关
此时,
所以,有99%的把握认为球队的胜负与甲球员是否上场有关.
(2)解:由甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.
(i)设事件:甲球员上场打前锋,事件:甲球员上场打中锋,事件:甲球员上场打后卫,事件:球队赢球,
则,
所以,当甲球员上场参加比赛时,球队赢球的概率:
.
(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,
甲球员打中锋的概率为.
19.(2024高二·广西北海·期末)在对人们休闲方式的一次调查中,共调查了120人,其中女性70人,男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.
(1)根据以上数据完成以下列联表;
休闲方式性别
看电视
运动
合计
女
男
合计
(2)能否有把握认为性别与休闲方式有关系?
附:,其中.
0.15
0.1
0.05
0.025
0.01
0.001
2.072
2.706
3.841
5.024
6.635
10.828
【答案】(1)列联表见解析;
(2)没有的把握认为性别与休闲方式有关.
【分析】(1)直接根据数据填表即可;
(2)利用卡方公式对照表格计算即可.
【解析】(1)
休闲方式性别
看电视
运动
合计
女
40
30
70
男
20
30
50
合计
60
60
120
(2)易知,
由卡方公式可知:,
故没有的把握认为性别与休闲方式有关.
20.(2024高三·四川成都·期末)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
50
未注射疫苗
30
50
合计
30
100
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )
附:,.
A.0.001 B.0.05 C.0.01 D.0.005
【答案】B
【分析】计算卡方,再根据独立性检验的概念判断即可.
【解析】完善列联表如下:
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
40
50
未注射疫苗
20
30
50
合计
30
70
100
假设:“给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果”.
因为:,而,
所以根据小概率值的独立性检验,推断不成立.
即认为“给基因编辑小鼠注射该疫苗能起到预防该病毒感染的效果”.
故选:B
21.(2024高二·江西鹰潭·期末)积化和差的重要应用在于求解傅里叶级数.为了解学生掌握该组公式的情况,在高一、高三两个年级中随机抽取了100名学生进行考查,其中高三年级的学生占,其他相关数据如下表:
合格
不合格
总计
高三年级学生
54
高一年级学生
16
总计
100
(1)请完成2×2列联表,依据小概率值1的独立性检验,分析“对公式的掌握情况”与“学生所在年级”是否有关?
(2)以频率估计概率,从该校高一年级学生中抽取3名学生,记合格的人数为X,求X的分布列和数学期望.
附表及公式:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中
【答案】(1)填表见解析;认为“对公式的掌握情况”与“学生所在年级”有关;
(2)分布列见解析;期望为.
【分析】(1)根据题意求得名学生中高三年级人数,补充列联表;再求,结合参考数据,即可判断;
(2),写出分布列,结合二项分布数学期望计算公式,即可求得结果.
【解析】(1)由100名学生中高三年级的学生占,可知高三年级的学生有60人,高一年级的学生有40人.
补充完整的列联表,如下:
合格
不合格
合计
高三年级的学生
54
6
60
高一年级的学生
24
16
40
合计
78
22
100
提出零假设:“对公式的掌握情况”与“学生所在年级”无关.
根据列联表中的数据,得.
根据小概率值的独立性检验,我们推断H₀不成立,
即认为“对公式的掌握情况”与“学生所在年级”有关,此推断犯错误的概率不大于0.001.
(2)由(1)得,高一年级的学生对公式的掌握情况合格的频率为.
依题意,得
则,,
,.
所以的分布列为
0
1
2
3
.
22.(2024高二·江西·期中)某校为普及安全知识,随机抽取了400名学生开展一次校园安全知识答题活动.满分100分,计分分为两类:60分及以上为合格,60分以下为不合格.统计结果如下:
合格
不合格
男生
40%
15%
女生
25%
20%
(1)判断能否有的把握认为“校园安全知识答题合格与性别有关”;
(2)现从答题不合格的学生中按性别分层抽样抽取7人,再从7人中任选4人进行安全知识学习,求恰好抽到一名女生的概率.
附:列联表参考公式:,其中.
临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1)有的把握认为“校园安全知识答题合格与性别有关”
(2)
【分析】(1)列出校园安全知识答题合格与否与性别列联表,计算卡方,根据独立性检验判断即可;(2)根据分层抽样比可得男生抽取人,女生抽取人,然后利用古典概型公式计算恰好抽到一名女生的概率.
【解析】(1)依题意有列联表
合格
不合格
合计
男生
女生
合计
故有的把握认为“校园安全知识答题合格与性别有关”.
(2)由分层抽样比得男生抽取人,女生抽取人,
人中任选人恰好抽到一名女生的概率为.
23.(2024·湖南长沙·模拟预测)某厂为了考察设备更新后的产品优质率,质检部门根据有放回简单随机抽样得到的样本测试数据,制作了如下列联表:
产品
优质品
非优质品
更新前
24
16
更新后
48
12
(1)依据小概率值的独立性检验,分析设备更新后能否提高产品优质率?
(2)如果以这次测试中设备更新后的优质品频率作为更新后产品的优质率.质检部门再次从设备更新后的生产线中抽出5件产品进行核查,核查方案为:若这5件产品中至少有3件是优质品,则认为设备更新成功,提高了优质率;否则认为设备更新失败.
①求经核查认定设备更新失败的概率;
②根据的大小解释核查方案是否合理.
附:
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)可以认为设备更新后能够提高产品优质率
(2)①0.05792;②合理
【分析】(1)先计算出的值,根据独立性检验的思想对照临界值得结论;
(2)根据二项分布的有关计算公式,求出对应的概率,并根据对应概率的大小,作出正确的判断.
【解析】(1)零假设为:设备更新与产品的优质率独立,即设备更新前与更新后的产品优质率没有差异.
由列联表可计算,
依据小概率值的独立性检验,
我们可以推断不成立,因此可以认为设备更新后能够提高产品优质率.
(2)根据题意,设备更新后的优质率为0.8.可以认为从生产线中抽出的5件产品是否优质是相互独立的.
①设表示这5件产品中优质品的件数,则,可得
②实际上设备更新后提高了优质率.
当这5件产品中的优质品件数不超过2件时,认为更新失败,此时作出了错误的判断,
由于作出错误判断的概率很小,则核查方案是合理的.
(四)
独立性检验的综合应用
独立性检验:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
(1)解答此类题目的关键在于正确利用χ2=计算χ2的值,再用它与临界值xα的大小作比较来判断假设检验是否成立,从而使问题得到解决.
(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.
题型6:独立性检验的综合应用
24.(2024高二·吉林·期末)李连贵熏肉大饼是吉林省四平市极具传统特色的美味小吃,有着悠久的历史,创始于1908年,距今已经有着一百多年的历史了.李连贵熏肉大饼的制作方法十分考究,选用猪肉和面粉为主要原料,将猪肉制作成熏肉,在加上公丁香,肉䓕,沙仁等几十种配料謷煮,最后加入调料抹在饼内,夹肉而食,吃起来外酥里软,美味可口,是一道集美味和药膳于一体的美味佳肴,很多外地游客慕名前往四平品尝.某调查机构从年龄在岁的游客中随机抽取100人,对是否有意向购买熏肉大饼进行调查,结果如下表:
年龄/岁
抽取人数
有意向购买熏肉大饼的人数
(1)若以年龄40岁为分界线,由以上统计数据完成下面的列联表,并依据小概率值的独立性检验,能否认为购买熏肉大饼与人的年龄有关?
年龄低于岁的人数
年龄不低于岁的人数
总计
有意向购买熏肉大饼的人数
无意向购买熏肉大饼的人数
总计
(2)用样本估计总体,用频率估计概率,从年龄在的所有游客中随机抽取3人,设这3人中打算购买熏肉大饼的人数为,求的分布列和数学期望.
【参考数据及公式】,其中.
【答案】(1)列联表见解析,购买熏肉大饼与人的年龄有关
(2)分布列见解析,
【分析】(1)根据所给列表,写出列联表,计算,利用独立性检验的基本思想,判断即购买熏肉大饼与人的年龄是否有关;
(2)根据二项分布的计算公式,写出它的分布列,计算期望值(可直接用二项分布的期望值公式计算).
【解析】(1)列联表如下:
年龄低于
岁的人数
年龄不低于
岁的人数
总计
有意向购买熏肉大饼的人数
无意向购买熏肉大饼的人数
总计
零假设为购买熏肉大饼与人的年龄无关.
根据表中数据计算得:,
所以依据小概率值的独立性检验,我们推断不成立,
即购买熏肉大饼与人的年龄有关,该推断犯错误的概率不超过.
(2)由已知得,,,
,,
,.
所以随机变量的分布列为:
所以.
25.(2024高三·甘肃月考)第18届亚洲杯将于2024年1月12日在卡塔尔举行,该比赛预计会吸引亿万球迷观看.为了了解某校大学生喜爱观看足球比赛是否与性别有关,该大学记者站随机抽取了100名学生进行统计,其中女生喜爱观看足球比赛的占女生人数的,男生有10人表示不喜欢看足球比赛.
(1)完成下面列联表,试根据小概率值的独立性检验,判断能否认为喜爱观看足球比赛与性别有关联?
男
女
合计
喜爱看足球比赛
不喜爱看足球比赛
合计
60
(2)在不喜爱观看足球比赛的观众中,按性别用分层随机抽样的方式抽取8人,再从这8人中随机抽取2人参加校记者站的访谈节目,设抽到的男生人数为,求的分布列和期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,认为喜爱观看足球比赛与性别有关联.
(2)分布列见解析,
【分析】(1)根据题意即可完善列联表,代入计算可得,可知喜爱观看足球比赛与性别有关联;
(2)可确定抽取的8人中男生2人,女生6人,即可得的可能取值为,分别求出其概率列出分布列可得期望值.
【解析】(1)根据表格数据可知抽取的女生共40人,喜欢观看足球比赛的女生为人,
可得得列联表如下:
男
女
合计
喜爱看足球比赛
50
10
60
不喜爱看足球比赛
10
30
40
合计
60
40
100
根据列联表中的数据计算得
,
根据小概率值的独立性检验,即认为喜爱观看足球比赛与性别有关联.
(2)按照分层随机抽样的方式抽取8人,根据抽样比可知其中男生2人,女生6人,
则的可能取值为,
,
,
所以的分布列为
0
1
2
期望值.
一、单选题
1.(2024高三·四川绵阳月考)为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过( )
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A. B. C. D.
【答案】B
【分析】根据与临界值的大小关系确定犯错误的概率的范围.
【解析】因为,结合表格可知,所以认为“性别与喜欢数学有关”犯错误的概率不超过0.010.
故选:B.
2.(2024高二·山东烟台·期中)下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病
D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大
【答案】D
【分析】根据独立性检验的意义分别判断各选项.
【解析】对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故错误;
对于B,独立性检验并不能确定两个变量相关,故错误;
对于C,是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;
对于D,根据卡方计算的定义可知该选项正确;
故选:D.
3.(2024高二·全国月考)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
【答案】D
【分析】已知抽取的老年人、年轻人各有25名,计算各个变量的值,进而得到答案.
【解析】因为,,
,,,,
所以,,,,.
故选:D.
4.(2024高二·河北张家口月考)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
【答案】B
【分析】根据题意,由等高条形图的意义分析可得答案.
【解析】根据题意,在等高的条形图中,当,所占比例相差越大时,越有把握认为两个分类变量,之间有关系,
由选项可得:B选项中,,所占比例相差无几,所以最有把握认为两个分类变量,之间没有关系,
故选:B
5.(2024高二·天津河北·期末)为比较甲、乙两所学校学生的数学学习水平,经过抽样并测试得到如下关于和的列联表:
学校
数学成绩
合计
不优秀
优秀()
甲校()
乙校()
合计
根据上表得到乙校数学成绩优秀的频数和样本容量数分别是( )
A.和 B.和 C.和 D.和
【答案】C
【分析】根据列联表中的数据分析即可得答案.
【解析】解:由列联表中的数据可知,乙校共抽的样本人,其中优秀的有人.
故选:C
6.(2024·湖北武汉·模拟预测)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:
跳绳
性别
合计
男
女
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
已知,
0.05
0.01
0.001
3.841
6.635
10.828
则以下结论正确的是( )
A.根据小概率值的独立性检验,爱好跳绳与性别无关
B.根据小概率值的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
C.根据小概率值的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”
D.根据小概率值的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”
【答案】A
【分析】由题计算出,与观测值比较即可求解.
【解析】由题知
因为,所以爱好跳绳与性别无关且这个结论犯错误的概率超过0.001,故A正确,B错误,又因为,所以有99%以上的把握认为“爱好跳绳与性别有关,或在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别有关.故C和D错误.
故选:A.
7.(2024高二·全国月考)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到,下列小波对地区A天气的判断不正确的是( )
日落云里走
夜晚天气
下雨
未下雨
出现
25
5
未出现
25
45
参考公式:
临界值参照表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.夜晚下雨的概率约为
B.未出现“日落云里走”,夜晚下雨的概率约为
C.据小概率值的独立性检验,认为“日落云里走”是否出现与夜晚天气有关
D.出现“日落云里走”, 据小概率值的独立性检验,可以认为夜晚会下雨
【答案】D
【分析】应用古典概型的概率求法求概率判断A、B,应用卡方计算公式求卡方值,与临界值比较,应用独立检验的基本思想得到结论,判断C、D.
【解析】由列联表知:100天中有50天下雨,50天未下雨,因此夜晚下雨的概率约为,A正确;
未出现“日落云里走”,夜晚下雨的概率约为,B正确;
,因此据小概率值的独立性检验,认为“日落云里走”是否出现与夜晚天气有关,C正确,D错误.
故选:D
8.(2024高二·江苏月考)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【答案】D
【分析】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【解析】依题意,解得,由解得.
补全列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D
9.(2024高三·浙江温州月考)在新高考改革中,浙江省新高考实行的是7选3的模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术(含信息技术和通用技术)7门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单位:人)
选物理
不选物理
总计
男生
340
110
450
女生
140
210
350
总计
480
320
800
表一
选生物
不选生物
总计
男生
150
300
450
女生
150
200
350
总计
300
500
800
表二
试根据小概率值的独立性检验,分析物理和生物选课与性别是否有关( )
附:
A.选物理与性别有关,选生物与性别有关
B.选物理与性别无关,选生物与性别有关
C.选物理与性别有关,选生物与性别无关
D.选物理与性别无关,选生物与性别无关
【答案】C
【分析】结合题干数据,以及公式,分别计算物理和生物学科的值,与比较,分析即得解
【解析】由题意,先分析物理课是否与性别有关:
根据表格数据,
结合题干表格数据,,
因此,有充分证据推断选择物理学科与性别有关
再分析生物课是否与性别有关:
根据表格数据,
结合题干表格数据,,
因此,没有充分证据推断选择生物学科与性别有关
故选:C
10.(2024高二·重庆九龙坡月考)在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:
优秀
非优秀
合计
甲班人数
50
乙班人数
20
合计
30
110
附:,其中.
根据独立性检验,可以认为数学考试成绩与班级有关系的把握为( )
A. B. C. D.
【答案】D
【分析】先完成列联表,再计算,与临界值进行比较,最后下结论
【解析】
优秀
非优秀
合计
甲班人数
50
乙班人数
20
合计
30
110
由题表中的数据可得: ,
因为,
所以可以认为数学考试成绩与班级有失系的把握为.
故选:D
二、多选题
11.(2024·全国·模拟预测)某校有在校学生900人,其中男生400人,女生500人,为了解该校学生对学校课后延时服务的满意度,随机调查了40名男生和50名女生.每位被调查的学生都对学校的课后延时服务给出了满意或不满意的评价,统计过程中发现随机从这90人中抽取一人,此人评价为满意的概率为.在制定列联表时,由于某些因素缺失了部分数据,而获得如下列联表,下列结论正确的是( )
满意
不满意
合计
男
10
女
合计
90
参考公式与临界值表,其中.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A.满意度的调查过程采用了分层抽样的抽样方法
B.50名女生中对课后延时服务满意的人数为20
C.的观测值为9
D.根据小概率的独立性检验,不可以认为“对课后延时服务的满意度与性别有关系”
【答案】AD
【分析】根据题意计算男女比例,即可判断A选项;计算满意的总人数人数,根据男生满意人数即可得女生满意人数判断B选项;由列联表中数据计算的值即可判断C、D选项.
【解析】A选项,因为在校学生中有400名男生,500名女生,随机调查了40名男生和50名女生,
男女比例始终是4:5,所以采用了分层抽样的方法,故A正确;
B选项,调查的90人中,对学校课后延时服务满意的人数为,
其中男生满意的人数为,所以女生满意的人数为30,女生不满意的人数为20,故B错误;
C选项,由B选项的分析,补全列联表如下:
满意
不满意
合计
男
30
10
40
女
30
20
50
合计
60
30
90
由列联表可得,故C错误;
D选项,:对课后延时服务的满意度与性别无关,由,
根据小概率的独立性检验,没有充足的证据推断不成立,
即不能认为“对课后延时服务的满意度与性别有关系”,故D正确.
故选:AD.
12.(2024高三·贵州月考)某学校高三年级于2023年5月初进行了一次高三数学备考前测考试.按照分数大于或等于120的同学评价为“优秀生”,其它分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,成绩优秀的概率为,根据表(2)的数据可断定下列说法正确的是( )
班级
战绩
合计
优秀生
潜力生
甲班
10
b
乙班
c
30
合计
105
表(1)
0.05
0.01
0.001
3.841
6.635
10.828
表(2)
A.列联表中c的值为30,b的值为35
B.列联表中c的值为20,b的值为45
C.根据列联表中的数据,有95%的把握认为成绩与班级有关
D.根据列联表中的数据,没有95%的把握认为成绩与班级有关
【答案】BC
【分析】根据题目条件计算判断AB,再由卡方的计算判断CD.
【解析】因为在这105人中随机抽取1人,成绩优秀的概率为,
所以“优秀生”的人数为,“潜力生”的人数为,
所以,,故A错B对;
因为,所以有95%的把握认为成绩与班级有关,故C对D错.
故选:BC.
三、填空题
13.(2024高二·广东深圳·期中)下面是一个2×2列联表:
合计
合计
则表中a,b处的值分别为 ; .
【答案】 52 60
【分析】第一空利用直接求出即可;第二空利用,结合的值求得即可.
【解析】根据已知条件,结合列联表之间的数据关系,由表中数据可知,
,所以;
.
故答案为:
14.(2024·四川绵阳·模拟预测)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的,若有95%的把握认为是否追星和性别有关,则调查样本中男生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
【答案】12
【分析】设男生人数为,得到列联表,根据题意得到,列出不等式,求得的取值范围,结合,为整数,即可求解.
【解析】设男生人数为,依题 意可得列联表如下:
喜欢追星
不喜欢追星
总计
男生
女生
总计
若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则,
由,解得,因为,为整数,
所以若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,
则男生至少有12人.
故答案为:.
15.(2024高二·福建福州·期末)为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
药物
疾病
合计
未患病
患病
服用
a
50
未服用
50
合计
80
20
100
若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为 .(其中且)(参考数据:,)
附:,
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【答案】46
【分析】根据公式列不等式求解.
【解析】由题意可得,
整理得,
所以或,
解得或,
又因为且,
所以,
所以a的最小值为46.
故答案为:46.
四、解答题
16.(2024高二·河南焦作·期末)近年来,直播带货逐渐兴起,成为乡村振兴的新动力,为了解甲、乙两个推销农产品的直播间的销售情况,统计了两个直播间一段时间内观众下单的相关数据,得到如下的表格:
下单的观众数
未下单的观众数
甲直播间
120
80
乙直播间
60
80
(1)分别估计甲、乙直播间的观众下单的概率;
(2)是否有的把握认为两个直播间观众的下单意愿有差异?
附.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)甲乙直播间观众下单概率分别为,;
(2)有的把握认为两个直播间观众的下单意愿有差异.
【分析】(1)根据表格中的数据,结合古典概型的概率计算公式,即可求解;
(2)根据题意,得出的列联表,求得,结合附表,即可得到结论.
【解析】(1)解:根据表格中的数据得,估计甲直播间观众下单的概率为,
估计乙直播间观众下单的概率为.
(2)解:根据题意,得到的列联表:
下单的观众数
未下单的观众数
合计
甲直播间
120
80
200
乙直播间
60
80
140
合计
180
160
340
可得,
因为,所以有的把握认为两个直播间观众的下单意愿有差异.
17.(2024高三·山东日照·期末)某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙方法培育该品种花苗,为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80及以上的花苗为优质花苗.
(1)求图中a的值,并求综合评分的中位数;
(2)填写下面的列联表,并根据小概率值的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.
优质花苗
非优质花苗
合计
甲培育法
20
乙培育法
10
合计
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1),82.5
(2)表格见解析,有关
【分析】(1)根据题意,由频率分布直方图的性质可得,再由中位数的计算公式,代入计算,即可得到结果;
(2)根据题意,由的计算公式,代入计算,即可得到结果.
【解析】(1)由直方图的性质可知,,
解得,因为,所以中位数位于内,
设中位数为,则有,解得.
故综合评分的中位数为82.5.
(2)由(1)得优质花苗的频率为0.6,所以样本中优质花苗的数量为60,
得如下列联表:
优质花苗
非优质花苗
合计
甲培育法
20
30
50
乙培育法
40
10
50
合计
60
40
100
零假设为:优质花苗与培育方法无关,
,
所以根据小概率值的独立性检验,推断不成立,即认为优质花苗与培育方法有关.
18.(2024·全国·模拟预测)《开学第一课》是一年一度面向全国中小学生的大型公益节目,从2008年起于每年9月1日播出.2023年《开学第一课》以“强国复兴有我”为主题.为了了解观众对节目的喜爱程度,随机调查了,两个地区的100名观众,得到如下的2×2列联表.
非常喜欢
喜欢
合计
35
10
合计
已知在被调查的100名观众中随机抽取1名,该观众来自地区且喜爱程度为“非常喜欢”的概率为0.45.
(1)完成上述表格.现从100名观众中根据喜爱程度及地区的不同用分层抽样的方法抽取20名进行问卷调查,则应抽取喜爱程度为“非常喜欢”的,地区的人数各是多少?
(2)若以抽样调查的频率为概率,从地区随机抽取2人,设抽到喜爱程度为“非常喜欢”的观众的人数为,求的分布列和期望.
【答案】(1)表格见详解,7名,9名
(2)分布列见详解,
【分析】(1)先补全2×2列联表,再根据分层抽样的知识即可求解;
(2)由题意得随机变量服从二项分布,进而根据二项分布求解即可.
【解析】(1)由题意,得,解得,
补充完整的列联表,如下:
非常喜欢
喜欢
合计
35
10
45
45
10
55
合计
80
20
100
因为(名),(名),(名),
所以抽取的喜爱程度为“非常喜欢”的地区观众有7名,B地区观众有9名.
(2)从地区随机抽取1人,抽到的观众的喜爱程度为“非常喜欢”的概率.
随机变量服从二项分布,
随机变量的所有可能取值为0,1,2,
则,
,
,
所以的分布列为
0
1
2
所以(或).
19.(2024高三·广东·期末)学校为了让学生的学习与活动两不误,在延时课开设篮球、书法两项活动,为了了解学生的选择意向,随机调查了部分同学,得到如下列联表.
性别
选择篮球
选择书法
男生
40
10
女生
25
25
(1)根据上表,分别估计该校男、女生选择篮球的概率;
(2)试根据小概率值的独立性检验,分析性别与选择意向是否有关联.
附:,其中.
0.05
0.025
0.01
0.005
0.001
3.841
5.024
6.635
7.879
10.828
【答案】(1);;
(2)性别与选择意向有关联.
【分析】(1)以频率估计概率计算即可;
(2)根据题意,计算并与比较,完成独立性检验.
【解析】(1)以频率估计概率,
所以该校男生选择篮球的概率为,
所以该校女生选择篮球的概率为.
(2)结合题意:,
整理计算得:,
故能在犯错误的概率不超过0.01的条件下认为性别与选择意向有关.
20.(2024高三·河北唐山·期末)目前,国际上常用身体质量指数(Body Mass Index,缩写BMI)来测量人体胖瘦程度以及是否健康,其计算公式是.中国成人的BMI数值标准如下表所示:
BMI
<18.5
≥28
体重情况
过轻
正常
超重
肥胖
为了解某单位职工的身体情况,研究人员从单位职工体检数据中,采用分层随机抽样方法抽取了90名男职工、50名女职工的身高和体重数据,计算得到他们的BMI值,并进行分类统计,如右表所示:
性别
BMI
合计
过轻
正常
超重
肥胖
男
10
60
11
9
90
女
15
25
5
5
50
合计
25
85
16
14
140
(1)参照附表,对小概率值a逐一进行独立性检验,依据检验,指出能认为职工体重是否正常与性别有关联的a的一个值;
(2)在该单位随机抽取一位职工的BMI值,发现其BMI值不低于28.由上表可知男女职工的肥胖率都为0.1,视频率为概率,能否认为该职工的性别是男还是女的可能性相同?若认为相同则说明理由,若认为不相同,则需要比较可能性的大小.
a
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:
【答案】(1)0.1
(2)不能;是男性的可能性大于女性
【分析】(1)列出体重是否正常与性别的关系的列联表,根据列联表计算出卡方,结合附表即可判断;
(2)分别计算出该职工的性别是男还是女的概率即可得.
【解析】(1)由表可得到与体重是否正常与性别之间的列联表:
正常
不正常
合计
男
60
30
90
女
25
25
50
合计
85
55
140
则,
由,
故能认为职工体重是否正常与性别有关联的a的值为0.1;
(2)设事件为“抽到的员工为男员工”、设事件为“抽到的员工BMI值不低于28”,
则,,
即不能认为该职工的性别是男还是女的可能性相同,且是男性的可能性大于女性.
21.(2024高三·广东汕头·期末)《国家学生体质健康标准》是我国对学生体质健康方面的基本要求,是综合评价学生综合素质的重要依据.为促进学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水平,某学校从全校学生中随机抽取200名学生进行“是否喜欢体育锻炼”的问卷调查.获得如下信息:
①男生所占比例为;
②不喜欢体育锻炼的学生所占比例为;
③喜欢体育锻炼的男生比喜欢体育锻炼的女生多50人.
(1)完成列联表,依据小概率值的独立性检验,分析喜欢体育锻炼与性别是否有关联?
性别
体育锻炼
合计
喜欢
不喜欢
男
女
合计
(2)(ⅰ)从这200名学生中采用按比例分配的分层随机抽样方法抽取20人,再从这20人中随机抽取3人.记事件“至少有2名男生”、“至少有2名喜欢体育锻炼的男生”、“至多有1名喜欢体育锻炼的女生”.请计算和的值.
(ⅱ)对于随机事件,,,试分析与的大小关系,并给予证明
参考公式及数据:,.
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)列联表见解析;有关联
(2)(ⅰ),;(ii),证明见解析
【分析】(1)依题意完善列联表,求得,从而利用独立性检验即可得解;
(2)(i)分析分层抽样所得的样本情况,再分析事件与的意义,利用组合数结合古典概型的概率公式即可得解;;(ii)利用条件概率公式即可得证明.
【解析】(1)因为男生所占比例为,所以男生有人,
因为不喜欢体育锻炼的学生所占比例为,
所以不喜欢体育锻炼的学生有人,
则喜欢体育锻炼的学生有人,
又喜欢体育锻炼的男生比喜欢体育锻炼的女生多50人,
所以喜欢体育锻炼的男生有80人,喜欢体育锻炼的女生有30人,
所以列联表如下:
性别
体育锻炼
合计
喜欢
不喜欢
男
80
40
120
女
30
50
80
合计
110
90
200
假设:是否喜欢体育锻炼与性别无关联.
根据表中数据,计算得到,
依据小概率值的独立性检验,我们推断不成立.
即认为是否喜欢体育锻炼与性别有关联.
(2)(ⅰ)依题意,随机抽取的20名学生中,喜欢体育锻炼的男生有人,不喜欢体育锻炼的男生有人,
喜欢体育锻炼的女生有人,不喜欢体育锻炼的女生有人,
事件表示:“在至少有2名男生的条件下,至少有2名男生喜欢体育锻炼”,
事件表示:“2男生1女生都喜欢体育锻炼”和“3男生中至少两人喜欢体育锻炼”,
所以,
;
(ⅰⅰ)对于随机事件,,,
有,证明如下:
.
1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$2024-2025学年《解题秘籍》高二数学同步知识·题型精讲精练讲义(人教A版2019选择性必修第三册)
8.3列联表与独立性检验6题型分类
一、分类变量
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
二、2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
三、等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
四、临界值
1.相关性的度量:χ2=.
2.χ2越小说明变量之间越独立,χ2越大说明变量之间越相关.
3.存在正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.
五、独立性检验
1.基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
2.独立性检验:这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
3.χ2临界值表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
六、应用独立性检验解决实际问题的大致步骤
1.提出零假设H0:X和Y相互独立,并给出在问题中的解释.
2.根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
3.根据检验规则得出推断结论.
4.在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
(一)
由2×2列联表分析变量间关系
(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与 的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
(3)独立性检验的关注点:在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.
题型1:完成列联表
1.(2024高二·全国月考)在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:
分数段
29~40
41~50
51~60
61~70
71~80
81~90
91~100
午休考生人数
23
47
30
21
14
31
14
不午休
考生人数
17
51
67
15
30
17
3
根据上述表格完成列联表:
及格人数
不及格人数
总计
午休
不午休
总计
2.(2024高二·西藏日喀则·期末)假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
3.(2025高三·全国月考)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
4.(2024高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
题型2:由2×2列联表分析变量间关系
5.(2024高二·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
6.(2024高二·全国·课堂例题)假设有两个分类变量和的列联表如下:注:的观测值.对于同一样本,以下数据能说明和有关系的可能性最大的一组是( )
总计
a
10
a+10
c
30
总计
A. B.
C. D.
7.(2024·云南昆明·模拟预测)考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
8.(2024高二·全国月考)假设有两个分类变量与,它们的可能取值分别为和,其列联表为
则当整数取______时,与的关系最弱( )
A.8 B.9 C.14 D.19
(二)
由等高堆积条形图分析变量间关系
等高堆积条形图:等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
题型3:由等高堆积条形图分析变量间关系
9.(2024高二·全国月考)在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )
A.与 B.与
C.与 D.与
10.(2024·吉林长春·模拟预测)观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
11.(2024·四川达州·模拟预测)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
12.(2024·广东佛山·模拟预测)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:
根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
13.(2024高二·山东青岛·期中)为了了解某高校学生喜欢使用手机支付是否与性别有关,抽取了部分学生作为样本,统计后作出如图所示的等高条形图,则下列说法正确的是( )
A.喜欢使用手机支付与性别无关
B.样本中男生喜欢使用手机支付的约
C.样本中女生喜欢使用手机支付的人数比男生多
D.女生比男生喜欢使用手机支付的可能性大些
(三)
独立性检验
独立性检验
基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
独立性检验的具体做法
①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值xα.
②利用公式χ2=计算χ2.
③如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”。
题型4:独立性检验的概念及辨析
14.(2024高三·广东东莞月考)根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为( )
A.变量与不独立,这个结论犯错误的概率不超过
B.变量与不独立,这个结论犯错误的概率不超过
C.变量与独立,这个结论犯错误的概率不超过
D.变量与独立,这个结论犯错误的概率不超过
15.(2024高二·山东滨州·期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )
附:,附表:
0.05
0.01
3.841
6.635
A.7 B.8 C.9 D.10
16.(2024高二·河南焦作·期中)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为( )
参考公式:,其中.
参考数据:
A. B. C. D.
题型5:卡方的计算
17.(2024高三·湖南长沙月考)为检验预防某种疾病的两种疫苗的免疫效果,随机抽取接种疫苗的志愿者各100名,化验其血液中某项医学指标(该医学指标范围为,统计如下:
该项医学指标
接种疫苗人数
10
50
接种疫苗人数
30
40
个别数据模糊不清,用含字母的代数式表示.
(1)为检验该项医学指标在内的是否需要接种加强针,先从医学指标在的志愿者中,按接种疫苗分层抽取8人,再次抽血化验进行判断.从这8人中随机抽取4人调研医学指标低的原因,记这4人中接种疫苗的人数为,求的分布列与数学期望;
(2)根据(1)化验研判结果,医学认为该项医学指标低于50,产生抗体较弱,需接种加强针,该项医学指标不低于50,产生抗体较强,不需接种加强针.请先完成下面的列联表,若根据小概率的独立性检验,认为接种疫苗与志愿者产生抗体的强弱有关联,求的最大值.
疫苗
抗体
合计
抗体弱
抗体强
疫苗
疫苗
合计
附:,其中.
0.25
0.025
0.005
1.323
5.024
7.879
18.(2024·云南楚雄·模拟预测)全国“村BA”篮球赛点燃了全民的运动激情,深受广大球迷的喜爱.每支球队都有一个或几个主力队员,现有一支“村BA”球队,其中甲球员是其主力队员,经统计该球队在某个赛季的所有比赛中,甲球员是否上场时该球队的胜负情况如表.
甲球员是否上场
球队的胜负情况
合计
胜
负
上场
40
45
未上场
3
合计
42
(1)完成列联表,并判断依据小概率值的独立性检验,能否认为球队的胜负与甲球员是否上场有关;
(2)由于队员的不同,甲球员主打的位置会进行调整,根据以往的数据统计,甲球员上场时,打前锋、中锋、后卫的概率分别为0.3,0.5,0.2,相应球队赢球的概率分别为0.7,0.8,0.6.
(i)当甲球员上场参加比赛时,求球队赢球的概率;
(ii)当甲球员上场参加比赛时,在球队赢了某场比赛的条件下,求甲球员打中锋的概率.(精确到0.01)
附:,.
0.15
0.10
0.05
0.025
0.010
0.001
2.072
2.706
3.841
5.024
6.635
10.828
19.(2024高二·广西北海·期末)在对人们休闲方式的一次调查中,共调查了120人,其中女性70人,男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.
(1)根据以上数据完成以下列联表;
休闲方式性别
看电视
运动
合计
女
男
合计
(2)能否有把握认为性别与休闲方式有关系?
附:,其中.
0.15
0.1
0.05
0.025
0.01
0.001
2.072
2.706
3.841
5.024
6.635
10.828
20.(2024高三·四川成都·期末)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
50
未注射疫苗
30
50
合计
30
100
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )
附:,.
A.0.001 B.0.05 C.0.01 D.0.005
21.(2024高二·江西鹰潭·期末)积化和差的重要应用在于求解傅里叶级数.为了解学生掌握该组公式的情况,在高一、高三两个年级中随机抽取了100名学生进行考查,其中高三年级的学生占,其他相关数据如下表:
合格
不合格
总计
高三年级学生
54
高一年级学生
16
总计
100
(1)请完成2×2列联表,依据小概率值1的独立性检验,分析“对公式的掌握情况”与“学生所在年级”是否有关?
(2)以频率估计概率,从该校高一年级学生中抽取3名学生,记合格的人数为X,求X的分布列和数学期望.
附表及公式:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中
22.(2024高二·江西·期中)某校为普及安全知识,随机抽取了400名学生开展一次校园安全知识答题活动.满分100分,计分分为两类:60分及以上为合格,60分以下为不合格.统计结果如下:
合格
不合格
男生
40%
15%
女生
25%
20%
(1)判断能否有的把握认为“校园安全知识答题合格与性别有关”;
(2)现从答题不合格的学生中按性别分层抽样抽取7人,再从7人中任选4人进行安全知识学习,求恰好抽到一名女生的概率.
附:列联表参考公式:,其中.
临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
23.(2024·湖南长沙·模拟预测)某厂为了考察设备更新后的产品优质率,质检部门根据有放回简单随机抽样得到的样本测试数据,制作了如下列联表:
产品
优质品
非优质品
更新前
24
16
更新后
48
12
(1)依据小概率值的独立性检验,分析设备更新后能否提高产品优质率?
(2)如果以这次测试中设备更新后的优质品频率作为更新后产品的优质率.质检部门再次从设备更新后的生产线中抽出5件产品进行核查,核查方案为:若这5件产品中至少有3件是优质品,则认为设备更新成功,提高了优质率;否则认为设备更新失败.
①求经核查认定设备更新失败的概率;
②根据的大小解释核查方案是否合理.
附:
0.050
0.010
0.001
3.841
6.635
10.828
(四)
独立性检验的综合应用
独立性检验:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
(1)解答此类题目的关键在于正确利用χ2=计算χ2的值,再用它与临界值xα的大小作比较来判断假设检验是否成立,从而使问题得到解决.
(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.
题型6:独立性检验的综合应用
24.(2024高二·吉林·期末)李连贵熏肉大饼是吉林省四平市极具传统特色的美味小吃,有着悠久的历史,创始于1908年,距今已经有着一百多年的历史了.李连贵熏肉大饼的制作方法十分考究,选用猪肉和面粉为主要原料,将猪肉制作成熏肉,在加上公丁香,肉䓕,沙仁等几十种配料謷煮,最后加入调料抹在饼内,夹肉而食,吃起来外酥里软,美味可口,是一道集美味和药膳于一体的美味佳肴,很多外地游客慕名前往四平品尝.某调查机构从年龄在岁的游客中随机抽取100人,对是否有意向购买熏肉大饼进行调查,结果如下表:
年龄/岁
抽取人数
有意向购买熏肉大饼的人数
(1)若以年龄40岁为分界线,由以上统计数据完成下面的列联表,并依据小概率值的独立性检验,能否认为购买熏肉大饼与人的年龄有关?
年龄低于岁的人数
年龄不低于岁的人数
总计
有意向购买熏肉大饼的人数
无意向购买熏肉大饼的人数
总计
(2)用样本估计总体,用频率估计概率,从年龄在的所有游客中随机抽取3人,设这3人中打算购买熏肉大饼的人数为,求的分布列和数学期望.
【参考数据及公式】,其中.
25.(2024高三·甘肃月考)第18届亚洲杯将于2024年1月12日在卡塔尔举行,该比赛预计会吸引亿万球迷观看.为了了解某校大学生喜爱观看足球比赛是否与性别有关,该大学记者站随机抽取了100名学生进行统计,其中女生喜爱观看足球比赛的占女生人数的,男生有10人表示不喜欢看足球比赛.
(1)完成下面列联表,试根据小概率值的独立性检验,判断能否认为喜爱观看足球比赛与性别有关联?
男
女
合计
喜爱看足球比赛
不喜爱看足球比赛
合计
60
(2)在不喜爱观看足球比赛的观众中,按性别用分层随机抽样的方式抽取8人,再从这8人中随机抽取2人参加校记者站的访谈节目,设抽到的男生人数为,求的分布列和期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
一、单选题
1.(2024高三·四川绵阳月考)为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过( )
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A. B. C. D.
2.(2024高二·山东烟台·期中)下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病
D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大
3.(2024高二·全国月考)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
4.(2024高二·河北张家口月考)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
5.(2024高二·天津河北·期末)为比较甲、乙两所学校学生的数学学习水平,经过抽样并测试得到如下关于和的列联表:
学校
数学成绩
合计
不优秀
优秀()
甲校()
乙校()
合计
根据上表得到乙校数学成绩优秀的频数和样本容量数分别是( )
A.和 B.和 C.和 D.和
6.(2024·湖北武汉·模拟预测)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:
跳绳
性别
合计
男
女
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
已知,
0.05
0.01
0.001
3.841
6.635
10.828
则以下结论正确的是( )
A.根据小概率值的独立性检验,爱好跳绳与性别无关
B.根据小概率值的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
C.根据小概率值的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”
D.根据小概率值的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”
7.(2024高二·全国月考)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了地区A的100天日落和夜晚天气,得到如下2×2列联表(单位:天),并计算得到,下列小波对地区A天气的判断不正确的是( )
日落云里走
夜晚天气
下雨
未下雨
出现
25
5
未出现
25
45
参考公式:
临界值参照表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.夜晚下雨的概率约为
B.未出现“日落云里走”,夜晚下雨的概率约为
C.据小概率值的独立性检验,认为“日落云里走”是否出现与夜晚天气有关
D.出现“日落云里走”, 据小概率值的独立性检验,可以认为夜晚会下雨
8.(2024高二·江苏月考)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
9.(2024高三·浙江温州月考)在新高考改革中,浙江省新高考实行的是7选3的模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术(含信息技术和通用技术)7门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单位:人)
选物理
不选物理
总计
男生
340
110
450
女生
140
210
350
总计
480
320
800
表一
选生物
不选生物
总计
男生
150
300
450
女生
150
200
350
总计
300
500
800
表二
试根据小概率值的独立性检验,分析物理和生物选课与性别是否有关( )
附:
A.选物理与性别有关,选生物与性别有关
B.选物理与性别无关,选生物与性别有关
C.选物理与性别有关,选生物与性别无关
D.选物理与性别无关,选生物与性别无关
10.(2024高二·重庆九龙坡月考)在一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下2×2列联表:
优秀
非优秀
合计
甲班人数
50
乙班人数
20
合计
30
110
附:,其中.
根据独立性检验,可以认为数学考试成绩与班级有关系的把握为( )
A. B. C. D.
二、多选题
11.(2024·全国·模拟预测)某校有在校学生900人,其中男生400人,女生500人,为了解该校学生对学校课后延时服务的满意度,随机调查了40名男生和50名女生.每位被调查的学生都对学校的课后延时服务给出了满意或不满意的评价,统计过程中发现随机从这90人中抽取一人,此人评价为满意的概率为.在制定列联表时,由于某些因素缺失了部分数据,而获得如下列联表,下列结论正确的是( )
满意
不满意
合计
男
10
女
合计
90
参考公式与临界值表,其中.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A.满意度的调查过程采用了分层抽样的抽样方法
B.50名女生中对课后延时服务满意的人数为20
C.的观测值为9
D.根据小概率的独立性检验,不可以认为“对课后延时服务的满意度与性别有关系”
12.(2024高三·贵州月考)某学校高三年级于2023年5月初进行了一次高三数学备考前测考试.按照分数大于或等于120的同学评价为“优秀生”,其它分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,成绩优秀的概率为,根据表(2)的数据可断定下列说法正确的是( )
班级
战绩
合计
优秀生
潜力生
甲班
10
b
乙班
c
30
合计
105
表(1)
0.05
0.01
0.001
3.841
6.635
10.828
表(2)
A.列联表中c的值为30,b的值为35
B.列联表中c的值为20,b的值为45
C.根据列联表中的数据,有95%的把握认为成绩与班级有关
D.根据列联表中的数据,没有95%的把握认为成绩与班级有关
三、填空题
13.(2024高二·广东深圳·期中)下面是一个2×2列联表:
合计
合计
则表中a,b处的值分别为 ; .
14.(2024·四川绵阳·模拟预测)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的,若有95%的把握认为是否追星和性别有关,则调查样本中男生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
15.(2024高二·福建福州·期末)为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:
药物
疾病
合计
未患病
患病
服用
a
50
未服用
50
合计
80
20
100
若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为 .(其中且)(参考数据:,)
附:,
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
四、解答题
16.(2024高二·河南焦作·期末)近年来,直播带货逐渐兴起,成为乡村振兴的新动力,为了解甲、乙两个推销农产品的直播间的销售情况,统计了两个直播间一段时间内观众下单的相关数据,得到如下的表格:
下单的观众数
未下单的观众数
甲直播间
120
80
乙直播间
60
80
(1)分别估计甲、乙直播间的观众下单的概率;
(2)是否有的把握认为两个直播间观众的下单意愿有差异?
附.
0.05
0.01
0.001
3.841
6.635
10.828
17.(2024高三·山东日照·期末)某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙方法培育该品种花苗,为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80及以上的花苗为优质花苗.
(1)求图中a的值,并求综合评分的中位数;
(2)填写下面的列联表,并根据小概率值的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.
优质花苗
非优质花苗
合计
甲培育法
20
乙培育法
10
合计
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
18.(2024·全国·模拟预测)《开学第一课》是一年一度面向全国中小学生的大型公益节目,从2008年起于每年9月1日播出.2023年《开学第一课》以“强国复兴有我”为主题.为了了解观众对节目的喜爱程度,随机调查了,两个地区的100名观众,得到如下的2×2列联表.
非常喜欢
喜欢
合计
35
10
合计
已知在被调查的100名观众中随机抽取1名,该观众来自地区且喜爱程度为“非常喜欢”的概率为0.45.
(1)完成上述表格.现从100名观众中根据喜爱程度及地区的不同用分层抽样的方法抽取20名进行问卷调查,则应抽取喜爱程度为“非常喜欢”的,地区的人数各是多少?
(2)若以抽样调查的频率为概率,从地区随机抽取2人,设抽到喜爱程度为“非常喜欢”的观众的人数为,求的分布列和期望.
19.(2024高三·广东·期末)学校为了让学生的学习与活动两不误,在延时课开设篮球、书法两项活动,为了了解学生的选择意向,随机调查了部分同学,得到如下列联表.
性别
选择篮球
选择书法
男生
40
10
女生
25
25
(1)根据上表,分别估计该校男、女生选择篮球的概率;
(2)试根据小概率值的独立性检验,分析性别与选择意向是否有关联.
附:,其中.
0.05
0.025
0.01
0.005
0.001
3.841
5.024
6.635
7.879
10.828
20.(2024高三·河北唐山·期末)目前,国际上常用身体质量指数(Body Mass Index,缩写BMI)来测量人体胖瘦程度以及是否健康,其计算公式是.中国成人的BMI数值标准如下表所示:
BMI
<18.5
≥28
体重情况
过轻
正常
超重
肥胖
为了解某单位职工的身体情况,研究人员从单位职工体检数据中,采用分层随机抽样方法抽取了90名男职工、50名女职工的身高和体重数据,计算得到他们的BMI值,并进行分类统计,如右表所示:
性别
BMI
合计
过轻
正常
超重
肥胖
男
10
60
11
9
90
女
15
25
5
5
50
合计
25
85
16
14
140
(1)参照附表,对小概率值a逐一进行独立性检验,依据检验,指出能认为职工体重是否正常与性别有关联的a的一个值;
(2)在该单位随机抽取一位职工的BMI值,发现其BMI值不低于28.由上表可知男女职工的肥胖率都为0.1,视频率为概率,能否认为该职工的性别是男还是女的可能性相同?若认为相同则说明理由,若认为不相同,则需要比较可能性的大小.
a
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:
21.(2024高三·广东汕头·期末)《国家学生体质健康标准》是我国对学生体质健康方面的基本要求,是综合评价学生综合素质的重要依据.为促进学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水平,某学校从全校学生中随机抽取200名学生进行“是否喜欢体育锻炼”的问卷调查.获得如下信息:
①男生所占比例为;
②不喜欢体育锻炼的学生所占比例为;
③喜欢体育锻炼的男生比喜欢体育锻炼的女生多50人.
(1)完成列联表,依据小概率值的独立性检验,分析喜欢体育锻炼与性别是否有关联?
性别
体育锻炼
合计
喜欢
不喜欢
男
女
合计
(2)(ⅰ)从这200名学生中采用按比例分配的分层随机抽样方法抽取20人,再从这20人中随机抽取3人.记事件“至少有2名男生”、“至少有2名喜欢体育锻炼的男生”、“至多有1名喜欢体育锻炼的女生”.请计算和的值.
(ⅱ)对于随机事件,,,试分析与的大小关系,并给予证明
参考公式及数据:,.
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$