内容正文:
第14讲 2×2列联表
课程标准
学习目标
①2×2列联表 ②独立性检验定义
1.通过实例,理解2×2列联表的统计意义.
2.通过对典型案例分析,了解独立性检验的基本思想和方法.
知识点01 2×2列联表
①2×2列联表给出了两个分类变量数据的交叉分类频数.
②定义一对分类变量和,我们整理数据如下表所示:
合计
合计
【即学即练1】(24-25高三·上海·课堂例题)下面是一个列联表:
总计
35
70
15
15
30
总计
50
100
其中、处填的值分别为 .
【答案】35,50
【分析】根据总计的计算公式进行求解即可.
【详解】在第二行中,,
在第三列中,,
故答案为:35,50
知识点02 独立性检验定义
利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”.简称独立性检验.
【即学即练2】(23-24高二下·上海·期中)为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算,根据这一数据分析,下列说法正确的是( )
(附:)
A.有的人认为该电视栏目优秀
B.有的人认为该电视栏目是否优秀与改革有关系
C.在犯错误的概率不超过的前提下,认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
【答案】D
【分析】根据卡方表示的意义结合临界值表分析判断即可
【详解】只有时才能在犯错误的概率不超过的前提下认为该电视栏目是否优秀与改革有关系,
而即使也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的推论,与是否有的人等无关.故A,B不正确.
由于,故C错误,D正确.
故选:D.
知识点03 独立性检验公式
其中(注意使用公式时分子的平方不要忽略了)
【即学即练3】(24-25高三下·上海·阶段练习)已知某独立性检验中,由,计算出,若将列联表中的数据分别变成,计算出的,则是的多少倍 .
【答案】4
【分析】分别将和代入公式求解即可.
【详解】因为,
所以.
故答案为:4.
题型一:完善列联表
1.(24-25高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
【答案】D
【分析】根据题意先得出的值,进而再得的值,进而可知的值.
【详解】因为抽取的村民中,老年人有25名,年轻人有25名,所以,
所以,A、B对;
所以,则对;
则错.
故选:.
2.(21-22高二下·上海浦东新·期末)下列是关于出生男婴与女婴调查的列联表
晚上
白天
总计
男婴
45
A
B
女婴
E
35
C
总计
98
D
180
那么 .
【答案】82
【分析】根据列联表,可得方程,解之即可得到结论.
【详解】解:由题意,,,,,
,,,,
故答案为: 82.
题型二:列联表分析
1.(23-24高二上·上海·课后作业)下表是两所中学的学生对报考某类大学的意愿的列联表:
愿意报考某类大学
不愿意报考某类大学
总计
中学
中学
总计
根据表中的数据回答:两所中学的学生对报考某类大学的态度是否有显著差异?
【答案】有显著差异,且中学更愿意报考
【分析】分别计算中学报考某类大学的比例,对比即可得到结论.
【详解】中学愿意报考某类大学的比率为;
中学愿意报考某类大学的比例为;
,即中学愿意报考某类大学的比例比中学高了,
两所中学的学生对报考某类大学的态度有显著差异,且中学更愿意报考.
题型三:独立性检验的概念及辨析
1.(24-25高三·上海·课堂例题)如果有95%的把握说事件和有关,那么具体算出的数据满足 .
【答案】
【分析】根据给定条件,借助独立性检验的临界值表即可得出结果.
【详解】依题意,算出的数据满足.
故答案为:
2.(2024·上海长宁·二模)收集数据,利用列联表,分析学习成绩好与上课注意力集中是否有关时,提出的零假设为:学习成绩好与上课注意力集中 (填:有关或无关)
【答案】无关
【分析】根据题意,由零假设的定义,即可得到结果.
【详解】零假设等价于两个变量相互独立,
所以此题中的零假设为:学习成绩好与上课注意力集中无关.
故答案为:无关
题型四:卡方的计算
1.(24-25高三·上海·随堂练习)研究两个事件A、B之间的关系时,根据数据信息列出如下的列联表,则以下计算公式中正确的是( )
B
B
总计
A
A
总计
n
A. B.
C. D.
【答案】A
【分析】根据独立性检验计算公式代入即可得到答案;
【详解】根据独立性检验计算,
故选:A.
2.(24-25高三·上海·课堂例题)下表是甲、乙两个班级进行数学考试,按学生考试及格与不及格统计成绩后的列联表,则的值为 .(精确到0.001)
不及格(人)
及格(人)
合计(人)
甲班
12
33
45
乙班
9
36
45
合计
21
69
90
【答案】0.559
【分析】利用卡方的计算公式计算即可得到答案.
【详解】
故答案为:.
3.(25-26高三上·上海·单元测试)根据下表计算:
不看电视
看电视
男
37
85
女
35
143
.(结果保留3位小数)
【答案】4.514
【分析】完善列联表,直接根据卡方计算公式计算卡方即可得解.
【详解】由题意
性别
是否看电视
合计
不看电视
看电视
男
37
85
122
女
35
143
178
合计
72
228
300
故答案为:4.514.
4.(24-25高三·上海·随堂练习)随着工业化以及城市车辆的增加,城市的空气污染越来越严重,空气质量指数API一直居高不下,对人体的呼吸系统造成了的严重的影响.现调查了某市500名居民的工作场所和呼吸系统健康状况,得到列联表如下,则 .(结果精确到0.001)
室外工作
室内工作
总计
有呼吸系统疾病
150
无呼吸系统疾病
100
总计
200
【答案】3.968
【分析】由题意,根据列联表中所给数据补全列表,将数据代入公式得,计算即可得到答案.
【详解】补全列联表
室外工作
室内工作
总计
有呼吸系统疾病
150
200
350
无呼吸系统疾病
50
100
150
总计
200
300
500
.
故答案为:3.968.
5.(23-24高二上·上海·课后作业)为了调查髋关节保护器在减少老年人髋部骨折中的作用,随机选择一些老年人,其中一部分佩戴髋关节保护器,而另一部分不佩戴,作为对照组.得到如下列联表:
佩戴髋关节保护器
对照组
总计
髋部骨折
13
67
80
无髋部骨折
640
1081
1721
总计
653
1148
1801
根据表中的数据回答:髋关节保护器是否可以降低老年人髋部骨折的可能性?
【答案】髋关节保护器可以降低老年人髋部骨折的可能性
【分析】计算出卡方,即可判断.
【详解】由列联表可得,
所以有的把握认为髋关节保护器可以降低老年人髋部骨折.
6.(24-25高三上·上海·单元测试)某企业有甲、乙两条生产线,其产量之比为4:1.现从两条生产线上按分层抽样的方法得到一个样本,其部分统计数据如表(单位:件),且每件产品都有各自生产线的标记.
产品件数
一等品
二等品
总计
甲生产线
2
乙生产线
7
总计
50
(1)请将列联表补充完整,并根据独立性检验估计:是否有97.5%的把握认为产品的等级差异与生产线有关?
(2)从样本的所有二等品中随机抽取2件,求至少有1件为甲生产线产品的概率.
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
【答案】(1)表格见解析,有97.5%的把握认为产品的等级差异与生产线有关
(2).
【分析】(1)首先根据分层抽样,求列联表中的数据,并计算,并和独立性检验参考数据比较大小,即可判断;
(2)首先将甲和乙生产的二等品编号,利用列举的方法,结合古典概型概率公式,即可求解.
【详解】(1)设甲生产线一等品有x件,乙生产线二等品有y件,
则满足,解得:,
则列联表如下:
产品件数
一等品
二等品
总计
甲生产线
38
2
40
乙生产线
7
3
10
总计
45
5
50
所以,因为,
所以有97.5%的把握认为产品的等级差异与生产线有关.
(2)依题意,记甲生产线的2个二等品为A,B,乙生产线的3个二等品为a,b,c;
则从中随机抽取2件,所有可能结果有:AB,Aa,Ab,Ac,Ba,Bb,Bc,ab,ac,bc共10个,
至少有1件为甲生产线产品的有AB,Aa,Ab,Ac,Ba,Bb,Bc共7个,
所以至少有1件为甲生产线产品的概率.
题型五:独立性检验的基本思想
1.(2023·上海崇明·模拟预测)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是( )
(参考数据:)
① 若的观测值满足,我们有的把握认为吸烟与患肺病有关系;
② 若的观测值满足,那么在个吸烟的人中约有人患有肺病;
③ 从独立性检验可知,如果有的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有的可能性会患肺病;
④ 从统计量中得知有的把握认为吸烟与患肺病有关系时,是指有的可能性使推断出现错误.
A.① B.①④ C.②③ D.①②③④
【答案】B
【分析】由给出的数据,结合观测值的意义判定即可.
【详解】若的观测值满足,则我们有的把握认为吸烟与患肺病有关系,而得知有的把握认为吸烟与患肺病有关系时,仍有的可能性使推断出现错误,但不能说明个吸烟的人中约有人患有肺病,及每个吸烟的人有的可能性会患肺病.
故①④正确、②③错误.
故选:B
2.(24-25高三·上海·课堂例题)在独立性检验中,为了调查变量与变量的关系,经过计算得到,表示的意义是 (填序号).
①有的把握认为变量与变量没有关系;
②有的把握认为变量与变量有关系;
③有的把握认为变量与变量有关系;
④有的把握认为变量与变量没有关系.
【答案】③④
【分析】由独立性检验中观测值和临界值的意义,即可得出正确的答案.
【详解】在独立性检验中,由
表示的意义是:有的把握认为变量与变量没有关系,所以④正确;
即有的把握认为变量与变量有关系,所以③正确.
故答案为:③④
3.(21-22高二下·上海黄浦·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则女生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
,.
【答案】20
【分析】设男生人数为x,可得列联表,由此计算的表达式,根据有的把握认为中学生追星与性别有关,可得不等式,结合,可求得答案.
【详解】设男生人数为x,则可得列联表如下:
喜欢追星
不喜欢追星
合计
男生
女生
合计
则计算 ,
若有的把握认为中学生追星与性别有关,则需,
解得,
又,故x至少为60,则女生至少有20人,
即有 的把握认为中学生追星与性别有关时,女生至少有20人,
故答案为︰20.
题型六:独立性检验解决实际问题
1.(21-22高二下·上海黄浦·期末)某地政府调查育龄妇女生育意愿与家庭年收入高低的关系时,随机调查了当地3000名育龄妇女,用独立性检验的方法处理数据,并计算得,则根据这一数据以及临界值表,判断育龄妇女生育意愿与家庭年收入高低有关系的可信度( )
参考数据如下:,.
A.低于 B.低于 C.高于 D.高于
【答案】C
【分析】根据临界值表求得正确答案.
【详解】由于,
而,
所以可信度高于.
故选:C
2.(2025·上海·模拟预测)在研究“温度是否影响庄稼生长”时,对实验数据利用2×2列联表进行独立性检验,计算得实验数据的统计量的值为.已知,则( )
A.的值小于3.841,就有95%的把握认为“温度会影响庄稼生长”
B.的值大于3.841,就有95%的把握认为“温度会影响庄稼生长”
C.的值越大,说明实验数据的观测值与预测值的总体偏差越小
D.的值越小,说明实验数据的观测值与预测值的总体偏差越大
【答案】B
【分析】根据独立性检验判断各个选项即可.
【详解】因为,则的值大于3.841,
就有95%的把握认为“温度会影响庄稼生长”,A选项错误,B选项正确;
的值的大小不能说明实验数据的观测值与预测值的总体偏差,C,D选项错误.
故选:B.
3.(24-25高三·上海·随堂练习)某市政府调查市民收入与旅游愿望时,采用独立检验法抽取3000人,计算发现,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是 .
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】99%
【分析】根据所给的这组数据的观测值,把观测值同临界值进行比较,得到市政府断言市民收入增减与旅游愿望有关系的可信程度.
【详解】因为做出,,
所以市民收入培养与旅游欲望有关系的可信程度是.
4.(22-23高三下·上海·阶段练习)一项研究同年龄段的男、女生的注意力差别的脑功能实验,实验数据如下表:
注意力稳定
注意力不稳定
男生
29
7
女生
33
5
依据,该 实验该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持),
参考公式:
【答案】支持
【分析】根据卡方公式计算即可做出判断.
【详解】由表中数据:,
所以没有足够把握认为学生在注意力的稳定性上与性别有关,
即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.
故答案为:支持
5.(24-25高三·上海·课堂例题)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为:能否一次考试通过与是否集中培训 .(选填“有关”或“无关”)
【答案】有关
【分析】列出列联表,根据数据求得并判断.
【详解】依题意,列联表如下:
集中培训
分散培训
合计
一次考试通过
45
30
75
一次考试未通过
10
20
30
合计
55
50
105
则,
因此认为“能否一次考试通过与是否集中培训有关”的把握为97.5%,
所以能否一次考试通过与是否集中培训有关.
故答案为:有关
6.(24-25高三·上海·随堂练习)某校为考察高中生数学成绩和语文成绩的关系,抽取55名学生进行一次测试,并按照测试成绩优秀(进入年级前30%)和不优秀(没有进入年级前30%)统计人数,得到如下列联表:
优秀
不优秀
总计
数学成绩
21
34
55
语文成绩
13
42
55
总计
34
76
110
根据表中的数据回答,该校高中生数学成绩和语文成绩之间是否有关系?
【答案】校高中生数学成绩与语文成绩之间没有关系,理由见解析.
【分析】先提出假设,再计算出卡方,与比较后得到结论.
【详解】提出原假设:该校高中生数学成绩与语文成绩之间没有关系;
确定显著性水平;
计算;
统计决断:由于,而,
根据统计决断,该校高中生数学成绩与语文成绩之间没有关系.
一、单选题
1.(24-25高三上·上海·单元测试)对于独立性检验,下列说法中错误的是( )
A.的值越大,说明两事件相关程度越大
B.的值越小,说明两事件相关程度越小
C.时,则在犯错误的概率不超过0.05的前提下认为事件与有关
D.时,则可以大概率认为事件与有关
【答案】C
【分析】结合观测值计算公式,因越大,的值就越大,从而两事件关系越强,否则越弱;理解观测值的意义可知,当时,零假设不成立,即认为事件与有关,否则当时,没有充分理由说明零假设不成立,即认为事件与无关.
【详解】对于A,B,因观测值,的值越大,越大,事件A与事件B关系越强;反之,事件A与事件B关系越弱,故A,B项均正确;
对于C,D,因只有时,说明在犯错误的概率不超过0.05的前提下认为事件与有关,而,故C错误;D正确.
故选:C.
2.(23-24高三下·上海浦东新·阶段练习)为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了50人,得到如下结果(单位:人)
不患肺癌
患肺癌
合计
不吸烟
24
6
30
吸烟
6
14
20
合计
30
20
50
附:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
根据表中数据,以下叙述正确的是( )
A.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
B.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
C.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
D.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
【答案】C
【分析】根据题意求出的值,再与临界值比较即可得出结论.
【详解】由题意可知,,
所以有的把握认为“吸烟与患肺癌有关”.
故选:C.
3.(21-22高二下·上海浦东新·期末)为了考查某种病毒疫苗的效果,现随机抽取100只小白鼠进行试验,得到如下2×2列联表:
感染
未感染
总计
服用
10
40
50
未服用
20
30
50
总计
30
70
100
附:,其中.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
根据以上数据,得到的结论正确的是( )
A.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗有关”
B.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗无关”
C.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗有关”
D.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗无关”
【答案】C
【分析】根据给定的列联表,计算出的观测值,再与临界值比对作答.
【详解】依题意,,
显然有,
所以有95%的把握认为“小白鼠是否被感染与有没有服用疫苗有关”,选项A,B,D不正确,C正确.
故选:C
4.(24-25高三·上海·课堂例题)为了调查各参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为;②在犯错误的概率不超过的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有的把握认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )
男性运动员(人)
女性运动员(人)
对主办方表示满意
200
220
对主办方表示不满意
50
30
注:
0.600
0.050
0.010
0.001
2.706
3.841
6.635
10.828
A.0 B.1 C.2 D.3
【答案】B
【分析】命题①,根据条件,利用古典概率公式,求出概率,即可判断命题①的正误;根据表中数据,求出,即可判断出命题②和③的正误,即可求解.
【详解】因为对主办方表示满意的男性运动员的人数为,
所以在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为,所以命题①错误,
又因为,所以命题②错误,命题③正确,
故选:B.
二、填空题
5.(23-24高二下·上海·期末)某研究小组为了研究中学生的身体发育情况,在某学校随机抽取30名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,取显著性水平为,我们可以认为该学校15至16周岁的30名男生的身高是否偏高与体重是否超重 .(填入有关或无关)
身高
体重
超重
不超重
总计
偏高
12
3
15
不偏高
5
10
15
总计
17
13
30
附表:
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中
【答案】有关
【分析】根据列联表,计算的值并与比较即得结论.
【详解】零假设为假设该学校15至16周岁的30名男生的身高是否偏高与体重是否超重无关,
由,
由小概率值的独立性检验,零假设不成立,
即认为该学校15至16周岁的30名男生的身高是否偏高与体重是否超重有关,这个判断犯错误的概率不超过0.05.
故答案为:有关.
6.(24-25高三上·上海·单元测试)某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了5000人,计算发现,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是 %.参考数据:
P
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】97.5
【分析】根据独立性检验知识,对照表格中的数据分析即可.
【详解】由,
可知市政府断言市民收入增减与旅游需求有关的可信度是97.5%,
故答案为:97.5
7.(24-25高三·上海·课堂例题)某高校统计课程的教师随机调查了选择该课的学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到,所以有 的把握判定主修统计专业与性别有关系.
性别
非统计专业(人)
统计专业(人)
男
13
10
女
7
20
【答案】
【分析】根据卡方的运算结果,结合独立性检验中相应的临界值进行求解即可
【详解】小概率值0.05对应的临界值为,
因为,
所以有的把握判定主修统计专业与性别有关系.
故答案为:
8.(25-26高三上·上海·单元测试)某校对“学生性别和喜欢某热门软件是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该软件的人数占男生人数的,女生喜欢该软件的人数占女生人数.若有95%的把握认为是否喜欢该软件和性别有关,则男生至少有 人.
0.050
0.010
3.841
6.635
【答案】12
【分析】由有的把握认为是否喜欢该软件和性别有关可得,列方程求男生人数的范围,结合条件确定男生的人数的最小值.
【详解】设男生人数为,则女生人数为,则列联表如下:
喜欢该软件
不喜欢该软件
合计
男生
女生
合计
若有的把握认为是否喜欢该软件和性别有关,则,
即,解得.
又因为,,,为整数,所以男生至少有人.
故答案为:12.
9.(24-25高三·上海·课堂例题)在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算得,根据这一数据分析,打鼾与患心脏病是 的.(选填“有关”或“无关”)
【答案】有关
【分析】由卡方值结合独立性检验中相应的临界值即可判断求解.
【详解】因为,
所以有的把握认为打鼾与患心脏病是有关的.
故答案为:有关.
10.(22-23高二上·上海虹口·期末)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
则有 %的把握认为男、女顾客对该商场服务的评价 (有或无)差异
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】 95 有
【分析】完善列联表,利用公式求得观测值并与临界值比较分析.
【详解】由题意可得:
满意
不满意
总计
男顾客
40
10
50
女顾客
30
20
50
总计
70
30
100
则,
∵,
∴能有%的把握认为男、女顾客对该商场服务的评价有差异.
故答案为:95;有.
11.(23-24高二下·上海·期末)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为 (填有或没有)的把握认为改款盲盒与性别有关.()
【答案】有
【分析】根据列联表数据和的计算公式求出即可根据小概率值的独立性检验得到结论.
【详解】零假设为改款盲盒与性别无关联.
由列联表数据计算得,
所以根据小概率值的独立性检验,推断不成立,故有的把握认为改款盲盒与性别有关.
故答案为:有.
12.(24-25高三上·上海·单元测试)某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表,则根据列联表可知:
年轻人
非年轻人
总计
经常用流行用语
125
25
150
不常用流行用语
35
15
50
总计
160
40
200
有 的把握认为经常用流行用语与年轻人有关系.
【答案】95%
【分析】根据列联表求出观测值,对照临界值表,利用独立性检验的基本思想即可求解.
【详解】零假设为:经常用流行用语与是否为年轻人没有关系,
,
所以拒绝零假设,故有95%的把握认为经常用流行用语与是否为年轻人有关系.
故答案为:95%.
13.(24-25高三上·上海·课后作业)2021年7月,中共中央办公厅、国务院办公厅印发了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,并发出通知,要求各地区各部门结合实际认真贯彻落实.该文件被称为“双减”,“双减”提出要全面压减作业总量和时长,减轻学生过重作业负担,同时坚持从严治理,全面规范校外培训行为.在“双减”颁布前,某地教育局为了解当地中学生参加校外培训的情况,随机调查了当地100名学生,得到的数据如下表:
参加校外培训
未参加校外培训
总计
初中生
30
20
50
高中生
40
10
50
总计
70
30
100
根据该表格,在“双减”颁布前, 95%的把握认为学生是否参加校外培训与年级段有关.(填“有”或“没有”)
【答案】有
【分析】根据给定数表,求出的观测值即可得结果.
【详解】由数表知,,而,
所以有95%的把握认为学生是否参加校外培训与年级段有关.
故答案为:有
14.(24-25高三·上海·随堂练习)为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校学生中随机地抽取50名学生,得到如下列联表,则 .(结果精确到0.001)
喜欢数学
不喜欢数学
总计
男
13
10
23
女
7
20
27
总计
20
30
50
【答案】
【分析】根据图表,利用的计算公式,即可求出结果.
【详解】因为,
所以,
故答案为:.
15.(25-26高三上·上海·单元测试)某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
喜欢甜品(人)
不喜欢甜品(人)
总计(人)
南方学生
60
20
80
北方学生
10
10
20
总计
70
30
100
根据表中数据, (选填“有”或“没有”)95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
【答案】有
【分析】由卡方公式计算求解.
【详解】,
对照临界值知,有的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
故答案为:有
16.(2024·上海金山·二模)为了考察某种药物预防疾病的效果,进行动物试验,得到如下图所示列联表:
药物
疾病
合计
未患病
患病
服用
50
未服用
50
合计
80
20
100
取显著性水平,若本次考察结果支持“药物对疾病预防有显著效果”,则()的最小值为 .
(参考公式:;参考值:)
【答案】
【分析】由题意列出不等式,结合近似计算求出m的取值范围,即可得答案.
【详解】由题意可知,
则,
解得或,而,
故m的最小值为44.
故答案为:44.
三、解答题
17.(24-25高三上·上海·阶段练习)为了了解广大消费者购买新能源汽车意向与年龄是否具有相关性,某汽车APP采用问卷调查形式对400名消费者进行调查,数据显示这400人中中老年人共有150人,且愿意购买新能源车的人数是愿意购买燃油车的2倍;青年中愿意购买新能源车的人数是愿意购买燃油车的4倍.
年龄段
购车意向
合计
愿意购买新能源车
愿意购买燃油车
青年
中老年
合计
(1)完善2×2列联表,请根据小概率值的独立性检验,分析消费者对新能源车和燃油车的意向购买与年龄是否有关;
(2)采用分层随机抽样从愿意购买新能源车的消费者中抽取9人,再从这9人中随机抽取5人,求这5人中青年人数的分布和期望.
附:,.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)列联表见解析,有关
(2)分布列见解析,
【分析】(1)根据题意分别求出愿意购买新能源车的中年人数和青年人数以及愿意购买燃油车中年人数和青年人数,即可补全列联表,再根据公式计算出,根据表格即可判断;
(2)先求出抽取9人中青年人数和中年人数,求出青年人数的可能取值及其对应的概率,即可求出分布列,再由数学期望公式即可求解.
【详解】(1)中老年共有150人,且愿意购买新能源车的人数是愿意购买燃油车的2倍,
所以愿意购买新能源车的中老年人数为100人,愿意购买燃油车的中老年人数为50人,
青年共有250人,愿意购买新能源车是愿意购买燃油车的4倍,
所以青年中愿意购买新能源车为200人,愿意购买燃油车为50人,
故2×2列联表如下:
年龄段
购车意向
合计
愿意购买新能源车
愿意购买燃油车
青年
200
50
250
中老年
100
50
150
合计
300
100
400
零假设:消费者购买新能源车和燃油车的意向与年龄无关,
根据小概率值的独立性检验,我们推断不成立,
即认为消费者购买新能源车和燃油车的意向与年龄有关;
(2)愿意购买新能源车的共有300人,青年人与中老年人的比例为,
所以分层随机抽样抽取的9人中6人是青年人,3人是中老年人,记这5人中,
青年的人数为,则的可能取值为,
,
.
所以的分布列如下:
X
2
3
4
5
P
则,
所以这5人中青年人数的期望为.
18.(24-25高三上·上海·期末)某区体育老师为了了解初中学生的性别和喜欢篮球是否有关,随机调查了该区1000名初中学生,得到成对样本数据的分类统计结果,如下表所示:
性别
是否喜欢篮球
合计
喜欢
不喜欢
男生
350
250
600
女生
250
150
400
合计
600
400
1000
(1)依据的独立性检验,能否认为该区初中学生的性别与喜欢篮球有关联;
(2)用按性别比例分配的分层随机抽样的方法从参与调查的,喜欢篮球的600名初中学生中抽取12名学生做进一步调查,将这12名学生作为一个样本,从中随机抽取3人,用X 表示随机抽取的3人中女生的人数,求X 的分布列和数学期望.
附:参考数据
其中
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【答案】(1)不能
(2)分布列见解析,
【分析】(1)计算,与对应的临界值比较,根据独立性检验的基本思想即可得结论;
(2)先根据喜欢篮球的男、女比例求出抽取的的12名学生中男生、女生人数,再根据超几何分布的概率公式计算可得分布列,进而求得数学期望.
【详解】(1)零假设:该区初中学生的性别与喜欢篮球无关,
则,
依据的独立性检验,没有理由认为假设不成立,
即不能认为该区初中学生的性别与喜欢篮球有关联;
(2)由题意,按性别比例分配的分层随机抽样的方法抽取的12名学生中,男生有7名,女生有5名,
则X的取值可能为:0,1,2,3,且服从超几何分布,,
则,
,
故X 的分布列为
X
0
1
2
3
P
数学期望.
19.(23-24高二下·上海奉贤·期末)某疾病预防中心随机调查了340名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如表所示.
不吸烟者
吸烟者
总计
不患慢性气管炎者
120
160
280
患慢性气管炎者
15
45
60
总计
135
205
340
(1)是否有95%的把握认为患慢性气管炎与吸烟有关?
(2)现从不患慢性气管炎者的样本中,按分层抽样的方法选出7人,从这7人里再随机选取3人,求这3人中,不吸烟者的人数X的数学期望.
附:,.
【答案】(1)有的把握认为患慢性气管炎与吸烟有关
(2)
【分析】(1)利用表格中的数据计算的观测值,再与临界值比对得解.
(2)求出的可能值及对应的概率,进而求出数学期望.
【详解】(1)零假设:患慢性气管炎与吸烟无关,
,
由,而,从而否定原假设,
即有的把握认为患慢性气管炎与吸烟有关.
(2)按分层抽样,不吸烟者3人,吸烟者4人,
的可能值为0,1,2,3,
,,,,
所以.
20.(24-25高三下·上海·阶段练习)向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展以人工智能的应用为例,人工智能中的文生视频模型Sora(以下简称Sora),能够根据用户的文本提示创建最长60秒的逼真视频.为调查Sora的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
Sora的应用情况
视频从业人员
合计
减少
未减少
应用
54
18
72
没有应用
36
42
78
合计
90
60
150
0.010
0.005
0.001
6.635
7.879
10.828
(1)根据所给数据,判断是否有的把握认为Sora的应用与视频从业人员的减少有关?
(附:,其中.)
(2)某公司视频部拟开展Sora培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用Sora.
(i)求员工经过培训能应用Sora的概率;
(ii)已知开展Sora培训前,员工每人每年平均为公司创造利润6万元;开展Sora培训后,能应用Sora的员工每人每年平均为公司创造利润10万元;Sora培训平均每人每年成本为1万元.视频部现有员工100人,根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展Sora培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
【答案】(1)有的把握认为Sora的应用与视频从业人员的减少有关,理由见解析;
(2)(i);(ii)人.
【分析】(1)先零假设,然后计算,根据小概率值的独立性检验即可判断;
(2)(i)设“员工经过培训能应用Sora”,结合互斥事件概率加法公式,独立事件概率乘法公式即可求解;
(ii)设视频部调人至其他部门,为培训后视频部能应用Sora的人数,则,由条件列不等式可求结论.
【详解】(1)零假设:Sora的应用与视频从业人员的减少无关,
,
根据小概率值的独立性检验,可以推断出不成立,
所以有的把握认为Sora的应用与视频从业人员的减少有关;
(2)(i)设“员工经过培训能应用Sora”,
所以,
所以员工经过培训能应用Sora的概率为;
(ii)设视频部调人至其他部门,,为培训后视频部能应用Sora的人数,
则,因此,
调整后视频部的期望年利润为:(万元),
令,解得,又,所以,
因此视频部最多可以调人到其他部门.
21.(24-25高三下·上海·阶段练习)第二十二届卡塔尔世界杯足球决赛中,阿根廷队通过扣人心弦的点球大战战胜了法国队,某校为了丰富学生课余生活,组建了足球社团,足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各名进行调查,部分数据如下表所示.
喜欢足球
不喜欢足球
合计
男生
女生
合计
(1)根据所给数据求出、、、的值,并判断是否有95%的把握认为该校学生喜欢足球与性别有关?(附)
(2)社团指导老师从喜欢足球的学生中抽取了名男生和名女生示范点球射门.已知男生进球的概率为,女生进球的概率为,每人射门一次,假设各人射门相互独立,求人进球总次数的分布和数学期望.
【答案】(1),,、,有关
(2)分布列见解析,期望
【分析】(1)根据列联表可得出、、、的值,计算出的观测值,结合临界值表可得出结论;
(2)由题意可知,人进球总次数的所有可能取值为、、、,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求得的值.
【详解】(1)由列联表中的数据可得,,
,,
所以,,
故有的把握认为该校学生喜欢足球与性别有关.
(2)人进球总次数的所有可能取值为、、、,
,,
,,
所以,随机变量的分布列如下表所示:
数学期望.
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$$
第14讲 2×2列联表
课程标准
学习目标
①2×2列联表 ②独立性检验定义
1.通过实例,理解2×2列联表的统计意义.
2.通过对典型案例分析,了解独立性检验的基本思想和方法.
知识点01 2×2列联表
①2×2列联表给出了两个分类变量数据的交叉分类频数.
②定义一对分类变量和,我们整理数据如下表所示:
合计
合计
【即学即练1】(24-25高三·上海·课堂例题)下面是一个列联表:
总计
35
70
15
15
30
总计
50
100
其中、处填的值分别为 .
知识点02 独立性检验定义
利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”.简称独立性检验.
【即学即练2】(23-24高二下·上海·期中)为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算,根据这一数据分析,下列说法正确的是( )
(附:)
A.有的人认为该电视栏目优秀
B.有的人认为该电视栏目是否优秀与改革有关系
C.在犯错误的概率不超过的前提下,认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
知识点03 独立性检验公式
其中(注意使用公式时分子的平方不要忽略了)
【即学即练3】(24-25高三下·上海·阶段练习)已知某独立性检验中,由,计算出,若将列联表中的数据分别变成,计算出的,则是的多少倍 .
题型一:完善列联表
1.(24-25高三·上海·课堂例题)某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
2.(21-22高二下·上海浦东新·期末)下列是关于出生男婴与女婴调查的列联表
晚上
白天
总计
男婴
45
A
B
女婴
E
35
C
总计
98
D
180
那么 .
题型二:列联表分析
1.(23-24高二上·上海·课后作业)下表是两所中学的学生对报考某类大学的意愿的列联表:
愿意报考某类大学
不愿意报考某类大学
总计
中学
中学
总计
根据表中的数据回答:两所中学的学生对报考某类大学的态度是否有显著差异?
题型三:独立性检验的概念及辨析
1.(24-25高三·上海·课堂例题)如果有95%的把握说事件和有关,那么具体算出的数据满足 .
2.(2024·上海长宁·二模)收集数据,利用列联表,分析学习成绩好与上课注意力集中是否有关时,提出的零假设为:学习成绩好与上课注意力集中 (填:有关或无关)
题型四:卡方的计算
1.(24-25高三·上海·随堂练习)研究两个事件A、B之间的关系时,根据数据信息列出如下的列联表,则以下计算公式中正确的是( )
B
B
总计
A
A
总计
n
A. B.
C. D.
2.(24-25高三·上海·课堂例题)下表是甲、乙两个班级进行数学考试,按学生考试及格与不及格统计成绩后的列联表,则的值为 .(精确到0.001)
不及格(人)
及格(人)
合计(人)
甲班
12
33
45
乙班
9
36
45
合计
21
69
90
3.(25-26高三上·上海·单元测试)根据下表计算:
不看电视
看电视
男
37
85
女
35
143
.(结果保留3位小数)
4.(24-25高三·上海·随堂练习)随着工业化以及城市车辆的增加,城市的空气污染越来越严重,空气质量指数API一直居高不下,对人体的呼吸系统造成了的严重的影响.现调查了某市500名居民的工作场所和呼吸系统健康状况,得到列联表如下,则 .(结果精确到0.001)
室外工作
室内工作
总计
有呼吸系统疾病
150
无呼吸系统疾病
100
总计
200
5.(23-24高二上·上海·课后作业)为了调查髋关节保护器在减少老年人髋部骨折中的作用,随机选择一些老年人,其中一部分佩戴髋关节保护器,而另一部分不佩戴,作为对照组.得到如下列联表:
佩戴髋关节保护器
对照组
总计
髋部骨折
13
67
80
无髋部骨折
640
1081
1721
总计
653
1148
1801
根据表中的数据回答:髋关节保护器是否可以降低老年人髋部骨折的可能性?
6.(24-25高三上·上海·单元测试)某企业有甲、乙两条生产线,其产量之比为4:1.现从两条生产线上按分层抽样的方法得到一个样本,其部分统计数据如表(单位:件),且每件产品都有各自生产线的标记.
产品件数
一等品
二等品
总计
甲生产线
2
乙生产线
7
总计
50
(1)请将列联表补充完整,并根据独立性检验估计:是否有97.5%的把握认为产品的等级差异与生产线有关?
(2)从样本的所有二等品中随机抽取2件,求至少有1件为甲生产线产品的概率.
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
题型五:独立性检验的基本思想
1.(2023·上海崇明·模拟预测)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是( )
(参考数据:)
① 若的观测值满足,我们有的把握认为吸烟与患肺病有关系;
② 若的观测值满足,那么在个吸烟的人中约有人患有肺病;
③ 从独立性检验可知,如果有的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有的可能性会患肺病;
④ 从统计量中得知有的把握认为吸烟与患肺病有关系时,是指有的可能性使推断出现错误.
A.① B.①④ C.②③ D.①②③④
2.(24-25高三·上海·课堂例题)在独立性检验中,为了调查变量与变量的关系,经过计算得到,表示的意义是 (填序号).
①有的把握认为变量与变量没有关系;
②有的把握认为变量与变量有关系;
③有的把握认为变量与变量有关系;
④有的把握认为变量与变量没有关系.
3.(21-22高二下·上海黄浦·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则女生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
,.
题型六:独立性检验解决实际问题
1.(21-22高二下·上海黄浦·期末)某地政府调查育龄妇女生育意愿与家庭年收入高低的关系时,随机调查了当地3000名育龄妇女,用独立性检验的方法处理数据,并计算得,则根据这一数据以及临界值表,判断育龄妇女生育意愿与家庭年收入高低有关系的可信度( )
参考数据如下:,.
A.低于 B.低于 C.高于 D.高于
2.(2025·上海·模拟预测)在研究“温度是否影响庄稼生长”时,对实验数据利用2×2列联表进行独立性检验,计算得实验数据的统计量的值为.已知,则( )
A.的值小于3.841,就有95%的把握认为“温度会影响庄稼生长”
B.的值大于3.841,就有95%的把握认为“温度会影响庄稼生长”
C.的值越大,说明实验数据的观测值与预测值的总体偏差越小
D.的值越小,说明实验数据的观测值与预测值的总体偏差越大
3.(24-25高三·上海·随堂练习)某市政府调查市民收入与旅游愿望时,采用独立检验法抽取3000人,计算发现,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是 .
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
4.(22-23高三下·上海·阶段练习)一项研究同年龄段的男、女生的注意力差别的脑功能实验,实验数据如下表:
注意力稳定
注意力不稳定
男生
29
7
女生
33
5
依据,该 实验该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持),
参考公式:
5.(24-25高三·上海·课堂例题)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为:能否一次考试通过与是否集中培训 .(选填“有关”或“无关”)
6.(24-25高三·上海·随堂练习)某校为考察高中生数学成绩和语文成绩的关系,抽取55名学生进行一次测试,并按照测试成绩优秀(进入年级前30%)和不优秀(没有进入年级前30%)统计人数,得到如下列联表:
优秀
不优秀
总计
数学成绩
21
34
55
语文成绩
13
42
55
总计
34
76
110
根据表中的数据回答,该校高中生数学成绩和语文成绩之间是否有关系?
一、单选题
1.(24-25高三上·上海·单元测试)对于独立性检验,下列说法中错误的是( )
A.的值越大,说明两事件相关程度越大
B.的值越小,说明两事件相关程度越小
C.时,则在犯错误的概率不超过0.05的前提下认为事件与有关
D.时,则可以大概率认为事件与有关
2.(23-24高三下·上海浦东新·阶段练习)为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了50人,得到如下结果(单位:人)
不患肺癌
患肺癌
合计
不吸烟
24
6
30
吸烟
6
14
20
合计
30
20
50
附:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
根据表中数据,以下叙述正确的是( )
A.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
B.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
C.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
D.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
3.(21-22高二下·上海浦东新·期末)为了考查某种病毒疫苗的效果,现随机抽取100只小白鼠进行试验,得到如下2×2列联表:
感染
未感染
总计
服用
10
40
50
未服用
20
30
50
总计
30
70
100
附:,其中.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
根据以上数据,得到的结论正确的是( )
A.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗有关”
B.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗无关”
C.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗有关”
D.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗无关”
4.(24-25高三·上海·课堂例题)为了调查各参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为;②在犯错误的概率不超过的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有的把握认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )
男性运动员(人)
女性运动员(人)
对主办方表示满意
200
220
对主办方表示不满意
50
30
注:
0.600
0.050
0.010
0.001
2.706
3.841
6.635
10.828
A.0 B.1 C.2 D.3
二、填空题
5.(23-24高二下·上海·期末)某研究小组为了研究中学生的身体发育情况,在某学校随机抽取30名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,取显著性水平为,我们可以认为该学校15至16周岁的30名男生的身高是否偏高与体重是否超重 .(填入有关或无关)
身高
体重
超重
不超重
总计
偏高
12
3
15
不偏高
5
10
15
总计
17
13
30
附表:
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中
6.(24-25高三上·上海·单元测试)某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了5000人,计算发现,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是 %.参考数据:
P
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
7.(24-25高三·上海·课堂例题)某高校统计课程的教师随机调查了选择该课的学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到,所以有 的把握判定主修统计专业与性别有关系.
性别
非统计专业(人)
统计专业(人)
男
13
10
女
7
20
8.(25-26高三上·上海·单元测试)某校对“学生性别和喜欢某热门软件是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该软件的人数占男生人数的,女生喜欢该软件的人数占女生人数.若有95%的把握认为是否喜欢该软件和性别有关,则男生至少有 人.
0.050
0.010
3.841
6.635
9.(24-25高三·上海·课堂例题)在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算得,根据这一数据分析,打鼾与患心脏病是 的.(选填“有关”或“无关”)
10.(22-23高二上·上海虹口·期末)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
则有 %的把握认为男、女顾客对该商场服务的评价 (有或无)差异
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
11.(23-24高二下·上海·期末)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为 (填有或没有)的把握认为改款盲盒与性别有关.()
12.(24-25高三上·上海·单元测试)某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表,则根据列联表可知:
年轻人
非年轻人
总计
经常用流行用语
125
25
150
不常用流行用语
35
15
50
总计
160
40
200
有 的把握认为经常用流行用语与年轻人有关系.
13.(24-25高三上·上海·课后作业)2021年7月,中共中央办公厅、国务院办公厅印发了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,并发出通知,要求各地区各部门结合实际认真贯彻落实.该文件被称为“双减”,“双减”提出要全面压减作业总量和时长,减轻学生过重作业负担,同时坚持从严治理,全面规范校外培训行为.在“双减”颁布前,某地教育局为了解当地中学生参加校外培训的情况,随机调查了当地100名学生,得到的数据如下表:
参加校外培训
未参加校外培训
总计
初中生
30
20
50
高中生
40
10
50
总计
70
30
100
根据该表格,在“双减”颁布前, 95%的把握认为学生是否参加校外培训与年级段有关.(填“有”或“没有”)
14.(24-25高三·上海·随堂练习)为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校学生中随机地抽取50名学生,得到如下列联表,则 .(结果精确到0.001)
喜欢数学
不喜欢数学
总计
男
13
10
23
女
7
20
27
总计
20
30
50
15.(25-26高三上·上海·单元测试)某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
喜欢甜品(人)
不喜欢甜品(人)
总计(人)
南方学生
60
20
80
北方学生
10
10
20
总计
70
30
100
根据表中数据, (选填“有”或“没有”)95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
16.(2024·上海金山·二模)为了考察某种药物预防疾病的效果,进行动物试验,得到如下图所示列联表:
药物
疾病
合计
未患病
患病
服用
50
未服用
50
合计
80
20
100
取显著性水平,若本次考察结果支持“药物对疾病预防有显著效果”,则()的最小值为 .
(参考公式:;参考值:)
三、解答题
17.(24-25高三上·上海·阶段练习)为了了解广大消费者购买新能源汽车意向与年龄是否具有相关性,某汽车APP采用问卷调查形式对400名消费者进行调查,数据显示这400人中中老年人共有150人,且愿意购买新能源车的人数是愿意购买燃油车的2倍;青年中愿意购买新能源车的人数是愿意购买燃油车的4倍.
年龄段
购车意向
合计
愿意购买新能源车
愿意购买燃油车
青年
中老年
合计
(1)完善2×2列联表,请根据小概率值的独立性检验,分析消费者对新能源车和燃油车的意向购买与年龄是否有关;
(2)采用分层随机抽样从愿意购买新能源车的消费者中抽取9人,再从这9人中随机抽取5人,求这5人中青年人数的分布和期望.
附:,.
0.05
0.01
0.001
3.841
6.635
10.828
18.(24-25高三上·上海·期末)某区体育老师为了了解初中学生的性别和喜欢篮球是否有关,随机调查了该区1000名初中学生,得到成对样本数据的分类统计结果,如下表所示:
性别
是否喜欢篮球
合计
喜欢
不喜欢
男生
350
250
600
女生
250
150
400
合计
600
400
1000
(1)依据的独立性检验,能否认为该区初中学生的性别与喜欢篮球有关联;
(2)用按性别比例分配的分层随机抽样的方法从参与调查的,喜欢篮球的600名初中学生中抽取12名学生做进一步调查,将这12名学生作为一个样本,从中随机抽取3人,用X 表示随机抽取的3人中女生的人数,求X 的分布列和数学期望.
附:参考数据
其中
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
19.(23-24高二下·上海奉贤·期末)某疾病预防中心随机调查了340名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如表所示.
不吸烟者
吸烟者
总计
不患慢性气管炎者
120
160
280
患慢性气管炎者
15
45
60
总计
135
205
340
(1)是否有95%的把握认为患慢性气管炎与吸烟有关?
(2)现从不患慢性气管炎者的样本中,按分层抽样的方法选出7人,从这7人里再随机选取3人,求这3人中,不吸烟者的人数X的数学期望.
附:,.
20.(24-25高三下·上海·阶段练习)向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展以人工智能的应用为例,人工智能中的文生视频模型Sora(以下简称Sora),能够根据用户的文本提示创建最长60秒的逼真视频.为调查Sora的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
Sora的应用情况
视频从业人员
合计
减少
未减少
应用
54
18
72
没有应用
36
42
78
合计
90
60
150
0.010
0.005
0.001
6.635
7.879
10.828
(1)根据所给数据,判断是否有的把握认为Sora的应用与视频从业人员的减少有关?
(附:,其中.)
(2)某公司视频部拟开展Sora培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用Sora.
(i)求员工经过培训能应用Sora的概率;
(ii)已知开展Sora培训前,员工每人每年平均为公司创造利润6万元;开展Sora培训后,能应用Sora的员工每人每年平均为公司创造利润10万元;Sora培训平均每人每年成本为1万元.视频部现有员工100人,根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展Sora培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
21.(24-25高三下·上海·阶段练习)第二十二届卡塔尔世界杯足球决赛中,阿根廷队通过扣人心弦的点球大战战胜了法国队,某校为了丰富学生课余生活,组建了足球社团,足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各名进行调查,部分数据如下表所示.
喜欢足球
不喜欢足球
合计
男生
女生
合计
(1)根据所给数据求出、、、的值,并判断是否有95%的把握认为该校学生喜欢足球与性别有关?(附)
(2)社团指导老师从喜欢足球的学生中抽取了名男生和名女生示范点球射门.已知男生进球的概率为,女生进球的概率为,每人射门一次,假设各人射门相互独立,求人进球总次数的分布和数学期望.
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$$