内容正文:
8.3 列联表与独立性检验
同步练习题
2025-2026学年第二学期高二数学人教A版选择性必修第三册
【学习目标】
1.理解独立性检验的基本思想及其实施步骤.
2.能利用等高堆积条形图、2×2列联表探讨两个分类变量的关联.
3.了解随机变量χ2的含义及作用.
4.通过对数据的处理,提高解决实际问题的能力.
【例题精练】
【例1】为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
【例2】为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了50人,得到如下列联表:
正常
不正常
合计
患该疾病
7
18
25
未患该疾病
19
6
25
合计
26
24
50
(1)记超声波检查结果不正常者患该疾病的概率为,求的估计值;
(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.
附:.
【例3】2025年11月,教育部等五部门联合印发《关于实施学生体质强健计划的意见》,明确要求“中小学生每天综合体育活动时间不少于2小时”.某学校为了解政策落实情况及其对学生视力的影响,随机抽取了100名学生进行每周累计体育活动时长的调查,得到如下频率分布表:
每周活动总时长(单位:时)
频率
0.15
0.25
0.35
0.15
0.1
同时,对这100名学生的视力进行了检查,将视力达到5.0及以上定为“视力良好”,低于5.0定为“视力一般”,得到如下2×2列联表(部分数据缺失):
视力良好
视力一般
合计
活动时间达标(不少于14小时)
40
活动时间未达标(低于14小时)
30
合计
100
(1)从活动时长在和的学生中,按比例分层随机抽样抽取5人进行座谈.若从这5人中随机抽取2人,设为抽取的2人中活动时长在的人数,求的分布列和数学期望;
(2)依据的独立性检验,判断是否有95%的把握认为“视力情况”与“体育活动时长是否达标”有关.
参考公式及数据:
①,其中.
②,,,.
【A组基础达标】
一、单选题
1.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
2.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:
根据图中的信息,下列结论中不正确的是( )
A.样本中多数男生喜欢手机支付
B.样本中的女生数量少于男生数量
C.样本中多数女生喜欢现金支付
D.样本中喜欢现金支付的数量少于喜欢手机支付的数量
3.某课外兴趣小组通过随机调查,利用列联表和统计量研究数学成绩优秀是否与性别有关.计算得,经查阅临界值表知,则下列判断正确的是( )
A.每100个数学成绩优秀的人中就会有1名是女生
B.若某人数学成绩优秀,那么他为男生的概率是0.010
C.有99%的把握认为“数学成绩优秀与性别有关
D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别无关”
4.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下列联表:
夜晚天气
日落云里走
下雨
未下雨
出现
25
5
未出现
25
45
临界值表
P()
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
并计算得到,下列小波对地区A天气判断不正确的是( )
A.夜晚下雨的概率约为
B.未出现“日落云里走”夜晚下雨的概率约为
C.有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
D.出现“日落云里走”,有的把握认为夜晚会下雨
5.某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有的把握认为喜欢短视频和性别相关联,则的最小值为( )
附:.
临界值表:
0.050
0.010
3.841
6.635
A.18 B.20 C.22 D.24
6.近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌汽车商随机调查了甲、乙两地各200名消费者,并用等高堆积条形图直观地展示调查结果如下图所示,经计算得到.
车型与地区
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
下列说法正确的是( )
A.在所调查的甲地购车者中,若按比例分层随机抽样抽取20人,则新能源车主有8人
B.在所调查的乙地购车者中,购买燃油车的人数比新能源车的多20人
C.依据的独立性检验,即消费者的购车类型与地域有关联,此推断犯错误的概率不大于0.001
D.依据的独立性检验,即消费者的购车类型与地域无关联,此推断犯错误的概率不大于0.001
二、多选题
7.某实验室为了研究荧光抗体法与常规培养法在沙门氏菌检验结果中是否存在差异,用以上两种检验方法对某种食品做了沙门氏菌检验,结果得到列联表如下:
阳性
阴性
合计
荧光抗体法
常规培养法
合计
参考公式:,其中.
附:下列表述正确的是( )
A.,
B.零假设:在沙门氏菌检验中荧光抗体法与常规培养法有差异
C.依据小概率值的独立性检验,认为荧光抗体法与常规培养法在沙门氏菌检验中有差异
D.常规培养法检测沙门氏菌阳性的频率为
8.某农科所发明了一种防治玉米病虫害的新药,为了解该药的效果,选用了100粒玉米种子进行试验栽种,栽种后发现这批玉米种子抗病虫害的概率为0.8.在制作列联表时,由于某些因素,缺失了部分数据,得到如下列联表,下列结论正确的有( )
抗病虫害
不抗病虫害
合计
种子经过该药处理
60
种子没有经过该药处理
14
合计
100
参考公式与临界值表,.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A.这100粒玉米种子没有经过该药处理且抗病虫害的有20粒
B.这100粒玉米种子中抗病虫害的有84粒
C.的观测值
D.按的可靠性要求,可以认为“治疗玉米病虫害的新药有效”
三、填空题
9.为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设:患慢性气管炎与吸烟没有关系,并通过计算得到统计量,则可推断_________原假设.(填“拒绝”或“接受”,规定显著性水平.)
10.为了判断高三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下列联表:
理科
文科
男
13
10
女
7
20
0.05
0.025
3.841
5.024
根据表中数据,得到.则认为选修文科与性别有关系出错的可能性不大于______.
四、解答题
11.中考体育成绩关系到考生最终的中考分数,广西多地将1000米跑(男)、800米跑(女)作为必考项目.某校体育老师对自己所带一个班的学生进行1000米跑(男)、800米跑(女)测试,通过统计,整理数据得到如下列联表:
男生
女生
合计
达标
24
18
42
不达标
11
7
18
合计
35
25
60
(1)试估计该班的达标率;
(2)根据小概率值的独立性检验,分析成绩是否达标与学生性别有关.
参考公式:,.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【B组能力提升】
1.飞机与高铁是人们远距离出行的两种方式,交通大学某班学生为了调查人们选择的远距离出行方式是否与年龄相关,随机抽取该市1000名市民进行调查,得到如下列联表:
低于40岁
不低于40岁
总计
选择飞机出行
100
选择高铁出行
300
总计
500
1000
(1)补全表中数据,依据小概率值的独立性检验,是否能够认为市民选择的远距离出行方式与年龄有关联?
(2)调查小组统计高铁站某处今天的客流量,从7:00开始,每小时作为一个时间段(为第1个时间段,为第2个时间段,……),得到如下数据:
时间段
1
2
3
4
5
客流量(千人)
1
1.5
2.5
3
3.5
若与线性相关,建立每个时间段客流量与时间段的经验回归方程,并预测的客流量.
附:,其中.
0.010
0.001
6.635
10.828
对于一组数据,,…,,其经验回归方程的斜率,.
2.为响应“书香校园”建设,某校图书馆引入了一套智慧自助借还系统M,该系统内置个智能识别模块.每个模块在日常使用环境下正常工作的概率为,各模块工作状态相互独立.
(1)该图书馆从某批次智能识别模块中随机抽取了100个,在“日常校园环境”和“高温潮湿仓库环境”下测试其工作状态,得到如下列联表:
正常工作
故障
合计
日常校园环境
50
5
55
高温潮湿仓库环境
35
10
45
合计
85
15
100
请根据小概率值独立性检验,能否认为模块工作状态与测试环境有关联?
附:,.
0.05
0.01
0.001
k
3.841
6.635
10.828
(2)当时,系统M中正常工作的模块个数为随机变量X,回答以下问题:
(i)求X的分布列及数学期望;
(ii)若有超过一半的模块正常工作,则系统正常工作,系统正常工作的概率称为系统的可靠性.为改善时系统M的可靠性,能否通过增加一个智能识别模块(即)提高系统M的可靠性?请给出你的结论并证明.
3.在某次草地音乐节上,为了解音乐节的体验情况,从观众中随机选取了100人进行问卷调查.
(1)根据观众的性别以及是否购买乐队官方周边,得到如下数据:
男性
女性
总计
购买周边
21
49
70
不购买周边
15
15
30
总计
36
64
100
根据以上信息,是否有的把握认为观众购买乐队官方周边与观众的性别有关?
参考公式:,其中;参考数据:.
(2)根据调查数据,该音乐节观众的排队安检时间(单位:分钟)服从正态分布.从观众中随机抽取1人,若其排队安检时间超过10分钟,求其排队安检时间超过12分钟的概率.(结果精确到)
参考数据:,其中为标准正态分布函数.
4.为迎接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取100名学生,将他们的竞赛成绩(满分为100分)分为6组:,,,,,,得到如图所示的频率分布直方图.
(1)估计这100名学生的平均成绩(同一组中的数据用该组区间的中点值为代表),并估计这100名学生成绩的中位数(精确到0.01);
(2)在抽取的100名学生中,规定:竞赛成绩不低于80分为“优秀”,竞赛成绩低于80分为“非优秀”.
①请将下面的列联表补充完整,并判断是否有99%的把握认为“竞赛成绩是否优秀与性别有关”?
②求出等高条形图需要的数据,并画出等高条形图(按图中“优秀”和“非优秀”所对应阴影线画),利用条形图判断竞赛成绩优秀与性别是否有关系?
列联表
优秀
非优秀
合计
男生
10
女生
50
合计
100
参考公式及数据:,,
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$
8.3 列联表与独立性检验
同步练习题
2025-2026学年第二学期高二数学人教A版选择性必修第三册
【学习目标】
1.理解独立性检验的基本思想及其实施步骤.
2.能利用等高堆积条形图、2×2列联表探讨两个分类变量的关联.
3.了解随机变量χ2的含义及作用.
4.通过对数据的处理,提高解决实际问题的能力.
【例题精练】
【例1】为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
【答案】B
【分析】根据等高条形图中的数据即可得出选项.
【详解】根据两个表中的等高条形图知,药物实验显示不服药与服药时患病差异较药物实验显示明显大,
所以药物的预防效果优于药物的预防效果,
故选:B.
【例2】为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了50人,得到如下列联表:
正常
不正常
合计
患该疾病
7
18
25
未患该疾病
19
6
25
合计
26
24
50
(1)记超声波检查结果不正常者患该疾病的概率为,求的估计值;
(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.
附:.
【详解】(1).
(2):假设超声波检查结果与患该疾病有关没有关联.
根据小概率值的独立性检验,认为超声波检查结果与患该疾病有关联.
【例3】2025年11月,教育部等五部门联合印发《关于实施学生体质强健计划的意见》,明确要求“中小学生每天综合体育活动时间不少于2小时”.某学校为了解政策落实情况及其对学生视力的影响,随机抽取了100名学生进行每周累计体育活动时长的调查,得到如下频率分布表:
每周活动总时长(单位:时)
频率
0.15
0.25
0.35
0.15
0.1
同时,对这100名学生的视力进行了检查,将视力达到5.0及以上定为“视力良好”,低于5.0定为“视力一般”,得到如下2×2列联表(部分数据缺失):
视力良好
视力一般
合计
活动时间达标(不少于14小时)
40
活动时间未达标(低于14小时)
30
合计
100
(1)从活动时长在和的学生中,按比例分层随机抽样抽取5人进行座谈.若从这5人中随机抽取2人,设为抽取的2人中活动时长在的人数,求的分布列和数学期望;
(2)依据的独立性检验,判断是否有95%的把握认为“视力情况”与“体育活动时长是否达标”有关.
参考公式及数据:
①,其中.
②,,,.
【答案】(1)
0
1
2
(2)有95%的把握认为“视力情况”与“体育活动时长是否达标”有关.
【分析】(1)通过按比例分层随机抽样确定5人各有几人来自和,再确定的可能取值,求得相应概率即可求解;
(2)先补全列联表,求得相应,再对比数据即可求解.
【详解】(1)由于和频率分别为,,
则按比例分层随机抽样,抽取5人进行座谈,有3人来自,2人来自,
由题意的可能取值为0,1,2,
,
,
,
所以的分布列是:
0
1
2
.
(2)由题意活动时间达标人数为,
活动时间未达标人数为,
故列联表如下:
视力良好
视力一般
合计
活动时间达标(不少于14小时)
40
20
60
活动时间未达标(低于14小时)
10
30
40
合计
50
50
100
零假设:“视力情况”与“体育活动时长是否达标”无关.
根据列联表数据,计算,
根据小概率值的独立性检验,判断不成立,
所以有95%的把握认为“视力情况”与“体育活动时长是否达标”有关.
【A组基础达标】
一、单选题
1.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【答案】D
【分析】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【详解】依题意,解得,由解得.
补全列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D
2.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:
根据图中的信息,下列结论中不正确的是( )
A.样本中多数男生喜欢手机支付
B.样本中的女生数量少于男生数量
C.样本中多数女生喜欢现金支付
D.样本中喜欢现金支付的数量少于喜欢手机支付的数量
【答案】C
【分析】根据两等号条形图的信息,逐个分析判断即可.
【详解】对于A,由右图可知,样本中多数男生喜欢手机支付,A对;
对于B,由左图可知,样本中的男生数量多于女生数量,B对;
对于C,由右图可知,样本中多数女生喜欢手机支付,C错;
对于D,由右图可知,样本中喜欢现金支付的数量少于喜欢手机支付的数量,D对.
故选:C.
3.某课外兴趣小组通过随机调查,利用列联表和统计量研究数学成绩优秀是否与性别有关.计算得,经查阅临界值表知,则下列判断正确的是( )
A.每100个数学成绩优秀的人中就会有1名是女生
B.若某人数学成绩优秀,那么他为男生的概率是0.010
C.有99%的把握认为“数学成绩优秀与性别有关
D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别无关”
【答案】C
【分析】根据的值与临界值的大小关系进行判断.
【详解】每100个数学成绩优秀的人中可能没有女生,也可能有多名女生,已知数据不能确定结论,A选项错误;
若某人数学成绩优秀,已知数据不能判断他为男生的概率,B选项错误;
∵,∴有99%的把握认为“数学成绩优秀与性别有关”,即在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”,C选项正确,D选项错误.
故选:C
4.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下列联表:
夜晚天气
日落云里走
下雨
未下雨
出现
25
5
未出现
25
45
临界值表
P()
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
并计算得到,下列小波对地区A天气判断不正确的是( )
A.夜晚下雨的概率约为
B.未出现“日落云里走”夜晚下雨的概率约为
C.有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
D.出现“日落云里走”,有的把握认为夜晚会下雨
【答案】D
【分析】把频率看作概率,即可判断的正误;根据独立性检验可判断的正误,即得答案.
【详解】由题意,把频率看作概率可得:
夜晚下雨的概率约为,故正确;
未出现“日落云里走”夜晚下雨的概率约为,故正确;
由,根据临界值表,可得有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故正确;
故错误.
故选:.
【点睛】本题考查独立性检验,属于基础题.
5.某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.若有的把握认为喜欢短视频和性别相关联,则的最小值为( )
附:.
临界值表:
0.050
0.010
3.841
6.635
A.18 B.20 C.22 D.24
【答案】B
【分析】根据题意先列出列联表计算值,再根据计算出的最小值.
【详解】根据题意,列联表如下:
喜欢
不喜欢
合计
男
女
合计
;
∵有的把握认为喜欢短视频和性别相关联,即,
,,又,
则的最小值为.
故选:B.
6.近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌汽车商随机调查了甲、乙两地各200名消费者,并用等高堆积条形图直观地展示调查结果如下图所示,经计算得到.
车型与地区
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
下列说法正确的是( )
A.在所调查的甲地购车者中,若按比例分层随机抽样抽取20人,则新能源车主有8人
B.在所调查的乙地购车者中,购买燃油车的人数比新能源车的多20人
C.依据的独立性检验,即消费者的购车类型与地域有关联,此推断犯错误的概率不大于0.001
D.依据的独立性检验,即消费者的购车类型与地域无关联,此推断犯错误的概率不大于0.001
【答案】C
【分析】借助分层随机抽样定义计算可得A;分别计算出购买燃油车的人数与购买新能源车的人数可得B;利用独立性检验定义可得C、D.
【详解】对A:,故新能源车主有人,故A错误;
对B:购买燃油车的人数为,
购买新能源车的人数为,
则购买燃油车的人数比新能源车的多人,故B错误;
对C、D:依据的独立性检验,即消费者的购车类型与地域有关联,
由,故此推断犯错误的概率不大于,故C正确、D错误.
二、多选题
7.某实验室为了研究荧光抗体法与常规培养法在沙门氏菌检验结果中是否存在差异,用以上两种检验方法对某种食品做了沙门氏菌检验,结果得到列联表如下:
阳性
阴性
合计
荧光抗体法
常规培养法
合计
参考公式:,其中.
附:下列表述正确的是( )
A.,
B.零假设:在沙门氏菌检验中荧光抗体法与常规培养法有差异
C.依据小概率值的独立性检验,认为荧光抗体法与常规培养法在沙门氏菌检验中有差异
D.常规培养法检测沙门氏菌阳性的频率为
【答案】AC
【详解】对于A,根据表格数据可知:,,A正确;
对于B,为了研究荧光抗体法与常规培养法在沙门氏菌检验结果中是否存在差异,零假设:在沙门氏菌检验中荧光抗体法与常规培养法无差异,B错误;
对于C,由题意得,
零假设不成立,依据小概率值的独立性检验,认为荧光抗体法与常规培养法在沙门氏菌检验中有差异,C正确;
对于D,由表格数据知,常规培养法检测沙门氏菌阳性的频率为,D错误.
8.某农科所发明了一种防治玉米病虫害的新药,为了解该药的效果,选用了100粒玉米种子进行试验栽种,栽种后发现这批玉米种子抗病虫害的概率为0.8.在制作列联表时,由于某些因素,缺失了部分数据,得到如下列联表,下列结论正确的有( )
抗病虫害
不抗病虫害
合计
种子经过该药处理
60
种子没有经过该药处理
14
合计
100
参考公式与临界值表,.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A.这100粒玉米种子没有经过该药处理且抗病虫害的有20粒
B.这100粒玉米种子中抗病虫害的有84粒
C.的观测值
D.按的可靠性要求,可以认为“治疗玉米病虫害的新药有效”
【答案】AD
【分析】由这批玉米种子抗病虫害的概率为0.8,可求得抗病虫害的有粒,从而可得二阶列联表,并可求出卡方值来作出各选项判断.
【详解】这100粒玉米种子中抗病虫害的有(粒),可得列联表如下:
抗病虫害
不抗病虫害
合计
种子经过该药处理
60
6
66
种子没有经过该药处理
20
14
34
合计
80
20
100
由以上列联表可知,A正确,B错误;
根据列联表中的数据,得到,
因此按的可靠性要求,可以认为“治疗玉米病虫害的新药有效”,故C错误,D正确.
故选:AD.
三、填空题
9.为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设:患慢性气管炎与吸烟没有关系,并通过计算得到统计量,则可推断_________原假设.(填“拒绝”或“接受”,规定显著性水平.)
【答案】拒绝
【分析】在独立性检验中,当计算得到的统计量大于临界值时,就拒绝原假设,即可求解.
【详解】已知显著性水平,,即临界值为,
因为,所以可推断拒绝原假设.
故答案为:拒绝.
10.为了判断高三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下列联表:
理科
文科
男
13
10
女
7
20
0.05
0.025
3.841
5.024
根据表中数据,得到.则认为选修文科与性别有关系出错的可能性不大于______.
【答案】0.05
【分析】根据观测值以及独立性检验的基本思想即可得出结果.
【详解】因为,这表明小概率事件发生.
根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,
并且这种判断出错的可能性不大于0.05.
故答案为:0.05.
四、解答题
11.中考体育成绩关系到考生最终的中考分数,广西多地将1000米跑(男)、800米跑(女)作为必考项目.某校体育老师对自己所带一个班的学生进行1000米跑(男)、800米跑(女)测试,通过统计,整理数据得到如下列联表:
男生
女生
合计
达标
24
18
42
不达标
11
7
18
合计
35
25
60
(1)试估计该班的达标率;
(2)根据小概率值的独立性检验,分析成绩是否达标与学生性别有关.
参考公式:,.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)
(2)无关
【分析】(1)根据表中数据进行计算即可;
(2)应用卡方公式求卡方值,结合独立性检验基本思想得结论.
【详解】(1)该班的达标率为
(2)零假设:成绩是否达标与学生性别无关,
,
根据“显著性水平的独立性检验,我们推断没有充分证据拒绝原假设,即认为成绩是否达标与学生性别无关.
【B组能力提升】
1.飞机与高铁是人们远距离出行的两种方式,交通大学某班学生为了调查人们选择的远距离出行方式是否与年龄相关,随机抽取该市1000名市民进行调查,得到如下列联表:
低于40岁
不低于40岁
总计
选择飞机出行
100
选择高铁出行
300
总计
500
1000
(1)补全表中数据,依据小概率值的独立性检验,是否能够认为市民选择的远距离出行方式与年龄有关联?
(2)调查小组统计高铁站某处今天的客流量,从7:00开始,每小时作为一个时间段(为第1个时间段,为第2个时间段,……),得到如下数据:
时间段
1
2
3
4
5
客流量(千人)
1
1.5
2.5
3
3.5
若与线性相关,建立每个时间段客流量与时间段的经验回归方程,并预测的客流量.
附:,其中.
0.010
0.001
6.635
10.828
对于一组数据,,…,,其经验回归方程的斜率,.
【答案】(1)表格见解析,与年龄有关联
(2),客流量约为4.25千人
【分析】(1)根据数据完成表格,求出的值即可判断;
(2)根据数据求出回归方程,再代入,即可得答案.
【详解】(1)列联表如下:
低于40岁
不低于40岁
总计
选择飞机出行
100
200
300
选择高铁出行
400
300
700
总计
500
500
1000
零假设为:市民选择的远距离出行方式与年龄没有关联.
由列联表中的数据,
得.
依据小概率值的独立性检验,我们推断不成立,
所以能够认为市民选择的远距离出行方式与年龄有关联.
(2),,
所以,
,
所以每个时间段客流量与时间段的经验回归方程为.
当时,,
所以预测12:00~13:00的客流量约为4.25千人.
2.为响应“书香校园”建设,某校图书馆引入了一套智慧自助借还系统M,该系统内置个智能识别模块.每个模块在日常使用环境下正常工作的概率为,各模块工作状态相互独立.
(1)该图书馆从某批次智能识别模块中随机抽取了100个,在“日常校园环境”和“高温潮湿仓库环境”下测试其工作状态,得到如下列联表:
正常工作
故障
合计
日常校园环境
50
5
55
高温潮湿仓库环境
35
10
45
合计
85
15
100
请根据小概率值独立性检验,能否认为模块工作状态与测试环境有关联?
附:,.
0.05
0.01
0.001
k
3.841
6.635
10.828
(2)当时,系统M中正常工作的模块个数为随机变量X,回答以下问题:
(i)求X的分布列及数学期望;
(ii)若有超过一半的模块正常工作,则系统正常工作,系统正常工作的概率称为系统的可靠性.为改善时系统M的可靠性,能否通过增加一个智能识别模块(即)提高系统M的可靠性?请给出你的结论并证明.
【答案】(1)不能认为有关联
(2)(i)分布列见解析,3(ii)能,证明见解析
【分析】(1)计算出的观测值,结合临界值表可得出结论.
(2)①由题可得,利用二项分布可得出随机变量的分布列,进而可得出的值;②计算出时系统的可靠性为,时系统的可靠性为,作差比较大小后可得出结论.
【详解】(1)零假设为:模块工作状态与测试环境无关联.
根据列联表中数据,得,
所以依据小概率值的独立性检验,我们推断成立,可以认为模块工作状态与测试环境无关联.
(2)①由题意可知,
(法一)的分布列为,
.
(法二),
,
,
,
,
则的分布列如下:
0
1
2
3
4
.
②当时记系统中正常工作的模块数为随机变量,则,
记时系统的可靠性为,记时系统的可靠性为.
故,
,
故,
故增加一个模块即,能提高系统的可靠性.
3.在某次草地音乐节上,为了解音乐节的体验情况,从观众中随机选取了100人进行问卷调查.
(1)根据观众的性别以及是否购买乐队官方周边,得到如下数据:
男性
女性
总计
购买周边
21
49
70
不购买周边
15
15
30
总计
36
64
100
根据以上信息,是否有的把握认为观众购买乐队官方周边与观众的性别有关?
参考公式:,其中;参考数据:.
(2)根据调查数据,该音乐节观众的排队安检时间(单位:分钟)服从正态分布.从观众中随机抽取1人,若其排队安检时间超过10分钟,求其排队安检时间超过12分钟的概率.(结果精确到)参考数据:,其中为标准正态分布函数.
【答案】(1)没有
(2)
【分析】(1)由卡方公式计算出卡方值,利用临界值进行比较即可.
(2)先利用正态分布的特殊区间概率求得和,再由条件概率公式求解即可.
【详解】(1)假设:观众购买乐队官方周边与观众的性别无关.
根据公式,
因为,所以不拒绝原假设,
即没有的把握认为观众购买乐队官方周边与观众的性别有关.
(2)因为(单位:分钟)服从正态分布,
所以.
.
所以所求的概率为.
4.为迎接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取100名学生,将他们的竞赛成绩(满分为100分)分为6组:,,,,,,得到如图所示的频率分布直方图.
(1)估计这100名学生的平均成绩(同一组中的数据用该组区间的中点值为代表),并估计这100名学生成绩的中位数(精确到0.01);
(2)在抽取的100名学生中,规定:竞赛成绩不低于80分为“优秀”,竞赛成绩低于80分为“非优秀”.
①请将下面的列联表补充完整,并判断是否有99%的把握认为“竞赛成绩是否优秀与性别有关”?
②求出等高条形图需要的数据,并画出等高条形图(按图中“优秀”和“非优秀”所对应阴影线画),利用条形图判断竞赛成绩优秀与性别是否有关系?
列联表
优秀
非优秀
合计
男生
10
女生
50
合计
100
参考公式及数据:,,
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)平均成绩73,中位数73.33;
(2)①表格见解析,没有;②答案见解析,有.
【分析】(1)根据频率直方图,结合平均数和中位数的性质进行求解即可;
(2)①根据频率直方图完成列联表,结合题中所给的公式进行求解即可;
②根据列联表画出等高条形图,再做出判断即可.
【详解】(1)这100名学生的平均成绩:
,
设成绩的中位数为,则根据频率分布直方图可知,有,
解得;
(2)①根据表中已知数据和频率分布直方图得下表
优秀
非优秀
合计
男生
10
40
50
女生
20
30
50
合计
30
70
100
根据表中数据可得,
因为4.762<6.635,所以没有99%的把握认为“竞赛成绩是否优秀与性别有关”.
②根据列联表中数据可知,样本中男生优秀的频率为,男生非优秀的频率为;女生优秀的频率,女生非优秀的频率为.
所画等高条形图如图所示:
根据等高条形图,比较图中两个用斜纹实线所画条的高可以发现,女生样本中成绩优秀的频率明显高于男生样本中成绩优秀的频率,因此可以认为竞赛成绩优秀与性别有关.
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$