内容正文:
专题9.3 独立性检验
教学目标
1.通过实例,理解2×2列联表的统计意义,掌握2×2列联表、χ2统计量公式,并能解决实际问题
2.通过实例,掌握2×2列联表独立性检验的基本思想、方法及初步应用.
3.经历由实际问题建立数学模型的过程,发展数学建模和数学运算素养;在运用独立性检验的思想作出合理推断的过程中,发展数学运算和逻辑推理素养.
教学重难点
1.重点
独立性检验的基本方法.
2.难点
独立性检验的基本思想.
知识点01 分类变量与列联表
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.2×2列联表
假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
【即学即练】
1.下面是一个列联表,其中a、b处填的值分别为( )
总计
a
21
73
2
25
27
总计
b
46
100
A.52、54 B.54、52 C.94、146 D.146、94
【答案】A
【分析】根据列联表运算求解即可.
【解析】由题意可得,解得,
所以a、b值分别为52、54.
故选:A.
2.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100 名电视观众,相关的数据如下表(单位:人)所示:
收看文艺节目
收看新闻节目
总计
20至40岁
40
18
58
大于40岁
15
27
42
总计
55
45
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关: .(填“是”或“否”)
【答案】是
【分析】分析表格可得
【解析】由表格可得,收看新闻节目的观众20至40岁的观众所占比例较小,大于40岁的观众所占比例较大.所以收看新闻节目的观众与年龄有关,
故答案为:是
知识点02 独立性检验
1.独立性检验
(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
则.
(2)利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.
(3)独立性检验中几个常用的小概率值和相应的临界值.
【即学即练】
1.为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
【答案】A
【分析】根据卡方独立性检验规则,比较与临界值即可得出结论.
【解析】因为,所以牛的毛色与角无关.
故选:A.
2.为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则( )
性别
羽毛球
喜欢
不喜欢
女生
男生
50
100
附:,其中.
A.4 B.2 C.1 D.
【答案】D
【分析】结合,只需,即可求得答案.
【解析】要使是否喜欢羽毛球运动与性别无关的可能性最大,则,所以,
所以.
故选:D.
3.交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线上有自东向西依次编号为1,2,…,21的21个车站.为调查编号为10和11两个站点的乘客对调图的满意度是否有差异,在这两个站点多次乘坐列车的旅客中,随机抽取100名旅客,并得出如下列联表,则的值约为( )
车站编号
满意度
满意
不满意
总计
10
28
12
40
11
57
3
60
总计
85
15
100
A.6.923 B.7.851 C.10.635 D.11.765
【答案】D
【分析】由卡方计算公式计算即可求解.
【解析】.
故选:D.
题型01 完善列联表
【典例1】下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【答案】C
【分析】根据联表计算求参即可.
【解析】因为.所以.又,
所以.
故选:C.
【变式1】有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35 B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50 D.由列联表可看出成绩与班级有关系
【答案】D
【分析】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【解析】依题意,解得,由解得.
补全列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D.
【变式2】假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】D
【分析】计算每个选项中的,比较大小后可得出结论.
【解析】对于两个分类变量与而言,的值越大,说明与有关系的可能性最大,
对于A选项,,
对于B选项,,
对于C选项,,
对于D选项,,
显然D中最大,
故选:D.
【变式3】(多选)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据正确的是( )
A. B.
C. D.
【答案】ABC
【分析】已知抽取的老年人、年轻人各有25名,计算各个变量的值,进而得到答案.
【解析】因为,,
,,,,
所以,,,,.
故选:ABC.
【变式4】如下是一个列联表,则 .
yx
总计
总计
【答案】
【分析】根据列联表的概念,可得答案.
【解析】由题意可得,则,可得,所以.
故答案为:.
题型02 列联表的分析及应用
【典例1】考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【答案】C
【分析】根据表格提供的数据作出判断.
【解析】由列联表中的数据可知,
种子经过处理,得病的比例明显降低,
种子未经过处理,得病的比例要高些,
所以可得结论:种子是否经过处理跟是否生病有关.
故选:C
假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
【变式1】地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【分析】根据题意,得到如下两个列联表,再一一分析即可.
【解析】根据题意,得到如下两个列联表.
35岁以上
35岁及以下
总计
男性
女性
总计
35岁以上
35岁及以下
总计
男性
女性
总计
根据第1个列联表可知,样本中男性市民人数为,
女性市民人数为,又,即样本中男性比女性多,故A正确;
根据第2个列联表可知,样本中35岁以上女性市民人数为,
35岁及以下女性市民人数为,又,即样本中多数女性是35岁以上,故B正确;
由题意,,所以,故C不正确;
根据第2个列联表可知,样本中35岁以上市民人数为,
35岁及以下市民人数为,又,
即样本中35岁以上的市民比35岁及以下的多,故D正确.
故选:C.
【变式2】假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】D
【分析】计算每个选项中的,比较大小后可得出结论.
【解析】对于两个分类变量与而言,的值越大,说明与有关系的可能性最大,
对于A选项,,
对于B选项,,
对于C选项,,
对于D选项,,
显然D中最大,
故选:D.
【变式3】(多选)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则( )
合计
合计
A.若,则可以认为与独立
B.若变量与独立,则
C.若很大,则变量与不独立
D.若变量与不独立,则很大
【答案】AC
【分析】运用独立性检验的步骤原理推理判断即可.
【解析】用频率可以估计,用频率可以估计,用频率可以估计,若,则,可以认为与独立,故正确;
由于,,表示的是频率,是抽取的样本数据,故即使变量与独立,也不一定成立,故错误;
若很大,可以说明与不独立,故正确;
若变量与不独立,,但并不一定很大,故错误.
故选:AC.
题型03 独立性检验的概念及辨析
【典例1】某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用列联表计算得的观测值.
附表:
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )
A. B. C. D.
【答案】B
【分析】由独立性检验的原理的理解辨析可判断.
【解析】由题意知观测值,所以对照题中的附表可作出“这种血清能起到预防感冒的作用”出错的可能性不超过的结论.
故选:B
【变式1】根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
【答案】D
【分析】根据给定条件,利用独立性检验的意义逐项判断即得.
【解析】由,得吸烟与患肺癌有关联,此推断犯错误的概率不大于1%,D正确;
卡方检验仅说明吸烟与患肺癌两个变量间的关联性,无法量化个体情况,这两个变量间也无因果关系,ABC错误.
故选:D.
【变式2】根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
【答案】B
【分析】根据独立性检验的概念可得正确的选项.
【解析】因为,所以在显著性水平下,
没有充分证据拒绝原假设,因此我们认为变量与是独立的,
故选:B
【变式3】根据分类变量X与Y的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量X与Y独立
B.变量X与Y独立,这个结论犯错误的概率不超过0.005
C.变量X与Y不独立
D.变量X与Y不独立,这个结论犯错误的概率不超过0.005
【答案】A
【分析】利用独立性检验规则来进行判断即可。
【解析】因为,所以没有充分的证据推断变量X与Y不相互独立,即认为变量X与Y独立,故BCD错误,A正确;
故选:A.
【变式4】(多选)在检验分类变量X与Y是否有关的过程中,计算得到实验数据的统计量,已知,,则( )
A.在犯错误的概率不超过10%的前提下,可以认为X与Y没有关系
B.在犯错误的概率不超过10%的前提下,可以认为X与Y有关系
C.依据的独立性检验,可以认为X与Y不独立
D.依据的独立性检验,可以认为X与Y独立
【答案】BD
【分析】根据,利用独立性检验的原理即可解题.
【解析】,所以在犯错误的概率不超过10%的前提下,
可以认为X与Y有关系,故A错误,B正确;
又,所以依据的独立性检验,可以认为X与Y独立,故C错误,D正确;
故选:BD.
题型04 卡方的计算
【典例1】春节期间,“厉行节约,反对浪费”之风悄然兴起,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
性别
“光盘”行动
合计
做不到“光盘”
能做到“光盘”
男
45
10
55
女
30
15
45
合计
75
25
100
附:
0.10
0.05
0.025
2.706
3.841
5.024
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有以上的把握认为”该市居民能否做到‘光盘’与性别无关”
【答案】C
【分析】根据统计表格中的数据,求得,结合附表,即可得到答案.
【解析】由统计表格中的数据,可得,
所以有以上的把握认为“该市居民能否做到‘光盘’与性别有关”.
故选:C.
1.根据问题数据构建2×2列联表,明确观测频数a、b、c、d(如a为甲类且阳性数,b为甲类且阴性数等),计算总样本数n=a+b+c+d。确认列联表各行各列合计值:行合计a+b、c+d;列合计a+c、b+d,为代入公式提供完整数据。
2.代入卡方统计量公式:χ²=n(ad-bc)²/[(a+b)(c+d)(a+c)(b+d)],分步计算分子分母避免出错。计算后验证结果:χ²≥0,若为负数则检查数据或计算错误。根据需求对比临界值(如3.841、6.635),初步判断分类变量关联程度。
【变式1】AI模型正在改变着我们的工作和生活方法,某机构为了了解对DeepSeek的使用情况与性别的关系,随机调查了人,得到如下列联表(单位:人):
性别
使用情况
合计
经常使用
不经常使用
男性
女性
合计
依据小概率值的独立性检验认为对DeepSeek的使用情况与性别有关系,则的最小值为( )
(附:,,)
A.48 B.49 C.50 D.51
【答案】D
【分析】根据卡方的计算式计算出卡方的结果,和去比较,计算即可得出结果.
【解析】将列联表中的数据代入公式计算得:,
解得 48.726,又,
所以的最小值为51 .
故选:D.
【变式2】通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
运动
性别
总计
男
女
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
下列结论正确的是( )
A.认为“爱好该项运用与性别有关”,犯错误的概率不超过0.01
B.认为“爱好该项运用与性别无关”,犯错误的概率不超过0.01
C.认为“爱好该项运动与性别有关”,犯错误的概率不超过0.001
D.认为“爱好该项运动与性别无关”,犯错误的概率不超过0.001
【答案】A
【分析】由独立性检验卡方计算卡方后,结合独立性检验相关概念可得答案.
【解析】由公式,
由可知,认为“爱好该项运动与性别有关”,
犯错误的概率不超过0.01.
故选:A.
【变式3】某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表,则根据列联表可知:
年轻人
非年轻人
总计
经常用流行用语
125
25
150
不常用流行用语
35
15
50
总计
160
40
200
有 的把握认为经常用流行用语与年轻人有关系.
【答案】95%
【分析】根据列联表求出观测值,对照临界值表,利用独立性检验的基本思想即可求解.
【解析】零假设为:经常用流行用语与是否为年轻人没有关系,
,
所以拒绝零假设,故有95%的把握认为经常用流行用语与是否为年轻人有关系.
故答案为:95%.
【变式4】某研究性学习小组针对“使用大绿书的用户是否存在性别差异”,向个人进行调查.用表示所有调查对象构成的集合.以为样本空间建立古典概型,并定义一对分类变量和如下:对于中的每一名学生,,现得到下表:
是大绿书的用户
不是大绿书的用户
男性
女性
若根据的独立性检验认为(其中),则的最小值为__________.(参考公式:,其中)
【答案】3
【分析】根据题意,由的公式代入计算,列出不等式,即可得到结果.
【解析】因为用大绿书APP的用户存在性别差异,
所以,
即,所以的最小值为3.
故答案为:
题型05 独立性检验的基本思想
【典例1】根据分类变量X与Y的成对样本数据,计算得到,依据小概率值的独立性检验(),可推断( )
A.变量X与Y不独立
B.变量X与Y不独立,此推断犯错误的概率不超过0.01
C.无法判断变量X与Y是否独立
D.变量X与Y独立
【答案】D
【分析】由独立性检验的意义判断可得.
【解析】零假设为:变量X与Y独立.
因为,所以依据小概率值的独立性检验,
没有充分证据推断不成立,因此可以认为成立,即认为变量X与Y独立.
故选:D.
【变式1】利用来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.利用独立性检验不仅可以考察两个分类变量是否有关系,而且( )
A.能较精确的给出这种判断的可靠程度
B.得出的结论完全正确,不会出错
C.的观测值很大时(比如大于20),则得出的零假设完全正确,不会出错
D.的观测值很小时(比如小于2),则得出的零假设肯定错误
【答案】A
【分析】运用独立性检验的思想逐项判断即可得结论.
【解析】对于A ,独立性检验不仅可以判断两个分类变量是否有关联,
还能通过计算卡方统计量()和对应的概率值,
给出这种判断的可靠程度(即显著性水平),故A正确;
对于B,独立性检验是基于概率统计的推断方法,不能保证结论完全正确,
仍有犯拒真或取伪的可能。故B错误;
对于C,的观测值很大时,仅表示拒绝零假设(变量独立)的可信度很高,
但不能保证结论“完全正确”,统计检验总有误差,故C错误;
对于D:的观测值很小时,表明没有足够证据拒绝零假设(变量独立),
但不能说明结论“肯定错误”,可能存在样本不足或变量实际关系较弱的情况,故D错误.
故选:A.
【变式2】通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
【答案】A
【分析】根据独立性检验的原理逐项判断可得答案.
【解析】零假设为:爱好跳绳与性别无关.
A.∵,
∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关.选项A正确.
B. ∵,
∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关,但无法判断这个结论犯错误的概率是否超过.选项B错误.
C.∵,
∴根据小概率值的独立性检验,我们认为爱好跳绳与性别有关.选项C错误.
D. ∵,
∴在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别有关.选项D错误.
故选:A.
【变式3】2025年7月22日是二十四节气中的第十二个节气——大暑.受今年气候等多因素的影响,全国各地高温天气持续不断.某校以“预防中暑,防止脱水”为主题举行活动.为了解男女同学对该活动的兴趣程度,对多位该校同学进行了调查,并将结果整理成如下列联表.
性别
兴趣程度
合计
感兴趣
不感兴趣
男生
女生
合计
(1)当m足够大时,估计从该校任选一名对该活动不感兴趣的学生是男生的概率;
(2)若根据小概率值的独立性检验,认为对该活动是否感兴趣与性别有关,求正整数m的最小值.
附:,其中.
0.1
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1);(2)10
【分析】(1)根据频率估计概率,结合古典概型公式,即可得答案.
(2)先求得,由题意可得,分析计算,即可得答案.
【解析】(1)由调查数据可知当m足够大时,以频率估计概率可知,
从该校任选一名对该活动不感兴趣的学生是男生的概率为.
(2)由题意可得,
若根据小概率值的独立性检验,认为对该活动是否感兴趣与性别有关,
则,解得
因为m为正整数,
所以m的最小值为10.
题型06 独立性检验解决实际问题
【典例1】为了研究高三年级学生的性别和身高是否大于的关系,调查了某高三年级学生,整理得到如下列联表:
身高
性别
低于
不低于
合计
男
9
91
100
女
90
10
100
合计
99
101
200
(1)在这200名学生中随机选两名学生身高均不低于的概率是多少?
(2)根据小概率值的独立性检验,能否认为该中学高三年级学生的性别与身高有关联,解释所得结论的实际含义.
附
0.05
0.010
0.001
3.841
6.635
10.828
【答案】(1)
(2)认为该中学高三年级学生的性别与身高有关联.实际意义见解析
【分析】(1)根据古典概型的概率公式求解,即得答案;
(2)计算的值,根据独立性检验的原理,即可得结论.
【解析】(1)设两名学生身高均不低于的事件为,
由古典概率计算公式得
(2)零假设为:该中学高三年级学生的性别与身高无关联,
则,
根据的独立性检验,我们推断不成立,
即认为该中学高三年级学生的性别与身高有关联.
所得结论的实际含义是:在犯错误的概率不超过0.001的前提下,
认为该中学高三年级学生的性别与身高有关联,
即男生身高不低于170cm的比例远高于女生,女生身高低于170cm的比例远高于男生.
独立性检验的应用问题的解题策略:
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
【变式1】为考察药物A对预防疾病B的效果,在两个不同规模的动物种群中分别进行了试验,根据种群一的试验结果得到如下列联表:
药物A
疾病B
合计
未患病
患病
未服用
28
22
50
服用
34
16
50
合计
62
38
100
计算得到.假设种群二试验结果对应的列联表中,每个单元格的数据都为上表对应单元格数据的5倍,则根据小概率值的独立性检验,( )
附:,
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
A.当时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过5%
B.当时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过10%
C.当时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过1%
D.当时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过0.5%
【答案】C
【分析】设各项数据变为原来的5倍后,根据题意计算对应出的值,参考数据逐项分析即可得出答案.
【解析】对于A,B,因为,
所以当时,无法推断种群一中药物A对预防疾病B有效,故A,B错误;
对于C,由,将各项数据变为原来的5倍,
则 ,
所以当时,则种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过.故C正确;
对于D,因为,
所以当时,无法推断种群二中药物A对预防疾病B有效,故D错误.
故选:C.
【变式2】为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.01的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.59 B.60
C.61 D.62
【答案】D
【分析】根据题意列出2×2列联表,即可由卡方公式求解即可.
【解析】设没接种只数为k,依题意,得2×2列联表如下:
发病
没发病
合计
接种
2k
没接种
k
合计
3k
则的观测值为:,
因为本次调查得出“在犯错误的概率不超过0.01的前提下认为接种该疫苗与预防某X疾病有关,
于是,即,即,
∴,∴.
故选:D.
【变式3】为了研究某新型病毒与快速检测试剂结果的关系,研究人员随机调查了200名接受过该试剂检测的人群,得到如下列联表:
快速检测结果组别
阳性
阴性
合计
感染该病毒
30
10
40
未感染该病毒
20
140
160
合计
50
150
200
(1)记快速检测结果为阳性者感染该病毒的概率为P,求P的估计值;
(2)根据小概率值的独立性检验,分析快速检测结果是否与感染该病毒有关.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1); (2)有关,理由见解析.
【分析】(1)由古典概率计算可得;
(2)由卡方的计算结合独立性检验可得.
【解析】(1)由题意可得快速检测结果为阳性者共50人,其中为阳性者感染该病毒的人数为30人,
所以.
(2)有关,理由如下:
由表中的数据可知,
则,
又小概率时,,
因为,所以根据小概率值的独立性检验,快速检测结果与感染该病毒有关.
【变式4】为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了若干人,得到如下列联表:
超声波检查结果组别
正常
不正常
合计
患该疾病
未患该疾病
合计
(1)记超声波检查结果不正常者患该疾病的概率为,求关系;
(2)在(1)的条件下,根据小概率值的独立性检验,分析得出超声波检查结果与患该疾病有关.求的最小值.(保留整数)
附,
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1); (2)
【分析】(1)根据古典概型公式,代入数据,即可得答案;
(2)将代入列联表,计算,根据题意,可得,即可得n的范围,进而可得答案.
【解析】(1)因为超声波检查结果不正常者患该疾病的概率为,
所以,解得;
(2)将代入列联表可得:
超声波检查结果组别
正常
不正常
合计
患该疾病
未患该疾病
合计
则,
因为根据小概率值的独立性检验,
所以,解得,
因为,所以n的最小值为45,
所以,
所以m的最小值为180
题型07 独立性检验与其他章节的融合
【典例1】为了解学生对某项运动的喜欢程度,某校随机调查了200名学生,得到如下列联表:
喜欢程度
性别
喜欢
感觉一般
合计
男
30
70
100
女
50
50
100
合计
80
120
200
(1)根据小概率值的独立性检验,分析学生对该运动的喜欢程度是否与性别有关;
(2)从这200人中随机选出了5名男生和3名女生作为代表,其中有2名男生和2名女生喜欢该运动.现从这8名代表中任选3名男生和2名女生进一步交流,求这5人中恰有2人喜欢该运动的概率.
附:
0.05
0.01
0.005
3.841
6.635
7.879
【答案】(1)有关; (2)
【分析】(1)计算的值,根据独立性检验的原理,即可得结论;
(2)根据古典概型的概率公式求解,即可求得答案.
【解析】(1)零假设:学生对该运动的喜欢程度与性别无关,
则,
故根据小概率值的独立性检验,可知零假设不成立,
则学生对该运动的喜欢程度与性别有关;
(2)设进一步交流的男生喜欢该运动的人数为X,女生中喜欢该运动的人数为Y,
从这8名代表中任选3名男生和2名女生的选法有种,
则
,
即这5人中恰有2人喜欢该运动的概率为.
【变式1】(多选)下列说法正确的是( )
A.若越接近1时,成对样本数据的线性相关程度越强
B.回归分析中,残差图中残差比较均匀分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
C.在列联表中,若每个数据a,b,c,d均变成原来的2倍,则也变成原来的2倍(附:,其中)
D.决定系数用以比较两个模型拟合效果,若越小,则模型的拟合效果越好
【答案】ABC
【分析】利用回归分析的相关定义和独立性检验公式对各个选项逐一分析判断即可得到结果.
【解析】对于A,根据相关系数的定义,越接近1时,成对样本数据的线性相关程度越强,故A正确;
对于B,因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,模型的拟合效果越好,故选项B正确;
对于C,根据,故C正确;
对于D,决定系数用以比较两个模型拟合效果,若越大,则模型的拟合效果越好,故D错误.
故选:ABC.
【变式2】为了调查抖音平台某直播间带货服务的满意程度,现随机调查了年龄在20岁至70岁的100人,他们年龄的频数分布和“满意”的人数如下表:
年龄/岁
频数
15
25
30
20
10
满意
13
20
27
16
4
根据上述统计数据填下面的列联表
年龄低于50岁的人数
年龄不低于50岁的人数
合计
满意
不满意
合计
(2)若以频率估计概率,以100人的样本数据来估计全国玩抖音的市民(假设年龄均在20岁至70岁)的总体数据,若从在全国范围内任选5人,记表示抽到“满意”的人数,求的分布列与数学期望.
【答案】(1)表格见解析,(2)分布列见解析,4
【分析】(1)根据年龄的频数分布和“满意”的人数表完成列联表;
(2)由题意服从求解.
【解析】(1)解:(1)列联表
年龄低于50岁的人数
年龄不低于50岁的人数
合计
满意
60
20
80
不满意
10
10
20
合计
70
30
100
(2)100人中满意有80人,从100人随机抽取一人是“满意”的概率为,
易知,,
的分布列为,,即
0
1
2
3
4
5
∴的数学期望.
【变式3】随着视频传输和移动通信技术的日益成熟、以及新冠疫情的推动,直播+电商的模式正在全球范围内掀起热潮.目前,国际上Amazon、Rakuten等电商平台和以Facebook为代表的社交类平台都纷纷上线了直播电商业务;在国内,淘宝、京东、抖音、拼多多、苏宁等众多平台都已成为该赛道内的玩家.根据中研产业研究院《2020-2025年中国直播电商行业市场深度分析及投资战略咨询研究报告》显示,2020年上半年,“直播经济”业态主要岗位的人才达到2019年同期的2.4倍;2020年“6·18”期间,带货主播和直播运营两大岗位高达去年同期的11.6倍.针对这一市场现象,为了加强监管,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.
(1)请完成关于商品和服务评价的列联表,
对服务好评
对服务不满意
合计
对商品好评
80
对商品不满意
10
合计
200
(2)若将频率视为概率,某人在该购物平台上进行的3次购物中,设对商品和服务全为好评的次数为随机变量X,求对商品和服务全为好评的次数X的分布列和数学期望.
【答案】(1)表格见解析;(2)分布列见解析,.
【分析】(1)由题意完成表格;(2)计算出的取值及概率,写出分布列并计算出期望即可.
【解析】(1)由题意可得关于商品和服务评价的列联表如下:
对服务好评
对服务不满意
合计
对商品好评
80
40
120
对商品不满意
70
10
80
合计
150
50
200
(2)每次购物中,对商品和服务全为好评的概率为,且的取值可以是其中,
,
,
,
X的分布列为:
X
0
1
2
3
P
由于,则X的数学期望.
【变式4】中国的航天事业历经数十年的发展,已经形成了完整的航天技术体系,涵盖运载火箭、载人航天、深空探测等多个领域.某学校为了解学生对航天工程的关注情况,随机从该校学生中抽取男生和女生各100人进行调查,调查结果如下表:
关注
不关注
合计
男生
75
25
100
女生
55
45
100
合计
130
70
200
(1)根据小概率值的独立性检验,能否认为该校学生对航天工程的关注情况与性别有关?
(2)从这200人中随机选出了3名男生和5名女生作为代表,其中有2名男生和2名女生关注航天工程.现从这8名代表中任选2名男生和3名女生进一步交流,求这5人中恰有2人关注航天工程的概率.
参考公式及参考数据:
.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)认为该校学生对航天工程的关注情况与性别有关; (2)
【分析】(1)根据卡方计算公式,结合独立性检验的思想即可求解;
(2)利用超几何分布求出对应的概率,即可求解.
【解析】(1)零假设:该校学生对航天工程的关注与性别无关,
根据列联表可得:
,
根据小概率值的独立性检验,我们推断不成立,即认为该校学生对航天工程的关注与性别有关,该推断犯错误的概率不超过0.005.
(2)设进一步交流的男生中关注航天工程的人数为,女生中关注航天工程的人数为,
从这8名代表中任选2名男生和3名女生的选法有种,
则
,
即这5人中恰有2人关注航天工程的概率为.
【变式5】我国探月工程亦称“嫦娥工程”,2024年6月3日,嫦娥六号完成了人类首次月球背面智能采样工作,并在6月下旬携带月球样品返回地球,为人类进一步研究和利用月球资源提供了保证.为了解不同性别的学生对探月工程的关注程度(“十分关注”与“比较关注”),学校随机抽取男生和女生各50名进行调查,数据表明:男生中有90%的同学“十分关注”,女生中有70%的同学“十分关注”,其他学生都是“比较关注”.
(1)根据条件,列出列联表,通过独立性检验,能否在犯错误概率不超过0.010前提下,认为探月工程的关注程度与性别有关;
(2)学校为提升同学们对探月工程的关注度,在以上“比较关注”的学生中运用分层抽样的方法抽取8人进行科普类培训,再从这8人中随机抽取3人进行重点培训,求这3人中至少有1名男生的概率.
附:,其中.
0.100
0.050
0.010
2.706
3.841
6.635
【答案】(1)列联表见解析,没有把握认为对探月工程的关注程度与性别有关;(2)
【分析】(1)根据题意列出列联表,并根据卡方公式计算卡方,由独立性检验的基本思想判定即可;
(2)先利用分层抽样原理计算抽取男女生人数,再利用古典概型计算概率即可.
【解析】(1)由题意可得列联表:
男
女
合计
十分关注
45
35
80
比较关注
5
15
20
合计
50
50
100
,
在犯错误概率不超过0.010前提下,没有把握认为对探月工程的关注程度与性别有关.
(2)由题意知,8人中男生人,女生人.
记“人中至少有1名男生”为事件,
则.
【变式6】近几年,新能源汽车的更新换代越来越引起人们的关注.某新能源车企想了解年轻司机与中老年司机对新能源车和燃油车的喜好程度,随机抽取了1000名司机,得到的列联表如下:
偏好新能源车
偏好燃油车
总计
年轻司机
300
200
500
中老年司机
200
300
500
总计
500
500
1000
(1)依据小概率值的独立性检验,能否认为司机对两种汽车的偏好与年龄有关联?
(2)该新能源车企生产的一款汽车在2025年上半年每个月的销量(千辆)与月份线性相关,数据如下:
月份
1
2
3
4
5
6
销量(千辆)
0.8
0.9
1.1
1.1
1.3
1.4
求关于的线性回归方程.
参考公式及数据:.
,其中.
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1)依据小概率值的独立性检验,认为司机对两种汽车的偏好与年龄有关联,此推断犯错误的概率不超过0.001. (2)
【分析】(1)结合已知有列联表,根据公式计算出,与临界值比较后作出判断即可;
(2)结合数据,根据公式计算出,即可得到关于的线性回归方程.
【解析】(1)零假设为
:司机的年龄与偏好相互独立,即司机对两种汽车的偏好与年龄无关.
由已知列联表,计算可得:
,
依据小概率值的独立性检验,我们推断不成立,即认为司机对两种汽车的偏好与年龄有关联,此推断犯错的概率不超过0.001.
(2)由题可知:,.
.
.
所以,.
关于的线性回归方程为:.
1.假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
【答案】D
【分析】根据列联表直接计算.
【解析】根据列联表知,,又,所以,
故选:
2.下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
【答案】B
【分析】根据独立性检验的基本思想,即可判断选项.
【解析】独立性检验是通过统计学方法来检验两个分类变量之间是否存在关联性,
ACD满足独立性检验的基本思想,B选项只是公司的营业额这一个变量在过去5年的变化情况,不满足独立性检验的基本思想.
故选:B.
3.在性别与吃零食这两个分类变量的计算中,下列说法正确的是( )
①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误.
A.①② B.①③ C.②③ D.③
【答案】D
【分析】由独立性检验相关概念可得答案.
【解析】①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性,故①不正确;
②独立性检验是用来考察两个分类变量是否具有关联性,并且能较精确地给出这种判断的可靠程度,
而不是给出事件的概率,故②不正确;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误,③正确。
故选:D
4.某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20,则下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.根据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
【答案】B
【分析】求得卡方值,比对临界值,逐个判断即可.
【解析】由题意,列出列联表:
接受
不接受
合计
男
40
60
100
女
20
80
100
合计
60
140
200
零假设为:是否接受去外地长时间出差与性别相互独立,即是否接受去外地长时间出差与性别无关,
所以,
根据小概率值的独立性检验,我们推断不成立,
即认为是否接受去外地长时间出差与性别有关,此推断犯错误的概率不大于0.005.
故选:B.
5.现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵严重的城市和交通拥堵不严重的城市分别随机调查了20名市民,得到了一个市民是否认可的样本,依据独立性检验,经计算得到,参照下表,得到的正确结论是:( )
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
【答案】C
【分析】根据独立检验基本思想给出结论,即可判断各项的正误.
【解析】由,
故有95%以上的把握认为“是否认可与城市的拥堵情况有关”,即可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”;
但没有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”,也不可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”.
故选:C.
6.某公司对100名员工进行了工作量的调查,数据如表:
认为工作量大
认为工作量不大
合计
男士
40
20
60
女士
20
20
40
合计
60
40
100
若推断“员工的性别与认为工作量大有关”,则这种推断犯错误的概率不超过( )
附:
0.15
0.1
0.05
0.025
0.01
0.001
2.072
2.706
3.841
5.024
6.635
10.828
A.0.1 B.0.05 C.0.025 D.0.01
【答案】A
【分析】首先根据列联表计算,再和参考数据比较,即可求解.
【解析】,因为,
所以这种推断犯错误的概率不超过.
故选:A.
7.(多选)给出下列实际问题,其中可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
【答案】ACD
【分析】根据独立性检验是对两个分类变量是否有关进行检验,逐个分析判断即可.
【解析】独立性检验主要是对两个分类变量是否有关进行检验,
对于A,喜欢参加体育锻炼有喜欢和不喜欢,性别有男和女,是对两个分类变量是否进行检验,
对于B,一个未被识别的甲骨文文字一年内被识别出来,只涉及一个变量,不可以用独立性检验解决,
对于C,购买食品有看生产日期和不看生产日期,性别有男和女,是对两个分类变量是否进行检验,
对于D,看新闻时政有喜欢和不喜欢,年龄有大有小,是对两个分类变量是否进行检验.
故不可以用独立性检验解决的问题是B.
故选:ACD.
8.(多选)分类变量X和Y的列联表如下:
合计
a
b
c
d
合计
则下列说法不正确的是( )
A.越小,说明X与Y关系越弱
B.越大,说明X与Y关系越强
C.越大,说明X与Y关系越强
D.越接近于0,说明X与Y关系越强
【答案】ABD
【分析】根据卡方公式可知越小,X与Y关系越弱,越大,X与Y关系越强,得到答案.
【解析】越小,即越小,说明X与Y关系越弱,越大,即越大,说明X与Y关系越强,
故C正确,ABD错误.
故选:ABD
9.(多选)某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的 若有的把握认为喜欢短视频和性别相关联,则的取值可以为( )
(附,其中.)
A. B. C. D.
【答案】BCD
【分析】根据题意先列出列联表计算值,再根据计算出的最小值.
【解析】根据题意,列联表如下:
喜欢
不喜欢
合计
男
女
合计
;
∵有的把握认为喜欢短视频和性别相关联,即,
,,又,
故选:BCD.
10.下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得 .
【答案】74
【分析】根据联表性质计算求解.
【解析】由题意知,所以.
故答案为:.
11.针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若我们推断不成立,此推断犯错误率不超过,则的最小值为_________
附:,附表:
0.05
0.01
3.841
6.635
【答案】9
【分析】根据题意可得列联表,由已知数据计算,根据独立性检验的结论,列不等式求的取值范围,得最小值.
【解析】根据题意,不妨设男生中喜欢短视频的人数为人,男生中不喜欢短视频的人数为人,女生中喜欢短视频的人数为人,女生中不喜欢短视频的人数为人.
所以可得列联表如下:
喜欢短视频人数
不喜欢短视频人数
合计
男生人数
女生人数
合计
于是,
由于推断不成立,此推断犯错误率不超过,
所以依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,且,于是最小值为.
故答案为:9
12.近年来,我国高度重视扶贫开发工作,各级政府坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效.某贫困县为了响应国家精准扶贫的号召,组织村民集体承包了一块土地若干年,已知土地的使用面积以及相应的管理时间的关系如下表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
10
13
25
24
并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:
参与管理
合计
愿意
不愿意
男性村民
150
50
女性村民
50
合计
(1)若管理时间与土地使用面积之间具有较强的线性相关性,且回归直线方程,求,并预测土地使用面积为6亩时,管理时间为多少月?
(2)在答题卡中补全列联表,并依据小概率值的独立性检验,判断村民的性别与参与管理的意愿是否具有相关性?
参考公式:,
其中.临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1),30.1;(2)列联表见解析,具有相关性.
【分析】(1)先求出样本中心点,再代入求出,再根据回归直线代入预测即可;
(2)先根据已知条件补充列联表,再计算,最后与临界值比较即可求解判断.
【解析】(1)依题意:,,
又,则有,且,
当时,,
故预测管理时间为30.1个月.
(2)依题意,完善表格如下:
愿意参与管理
不愿意参与管理
总计
男性村民
150
50
200
女性村民
50
50
100
总计
200
100
300
零假设:村民的性别与参与管理的意愿无关,
计算得的观测值为
,
依据小概率值的独立性检验,我们推断不成立,认为村民的性别与参与管理的意愿具有相关性,此推断犯错误的概率不超过0.001.
13.为了解某校学生每天进行体育运动的时间,从中抽取男、女生共100人进行问卷调查.将样本中的“男生”和“女生”按每天体育运动的时间(单位:分钟)各分为5组:,,经统计得下表:
男生
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
人数
4
5
27
21
3
女生
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
人数
3
13
16
6
2
若体育运动的时间不少于一小时,则被认定为“喜欢体育运动”,否则被认定为“不喜欢体育运动”.
(1)根据以上数据完成列联表;
喜欢体育运动
不喜欢体育运动
合计
男
女
合计
(2)依据小概率值的独立性检验,能否认为是否喜欢体育运动与性别有关联?
参考公式:,其中.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)答案见解析
(2)认为是否喜欢体育运动与性别有关联.
【分析】(1)根据题意列联表;(2)计算的值,作出判断.
【解析】(1)2×2列联表如下:
喜欢体育运动
不喜欢体育运动
合计
男
24
36
60
女
8
32
40
合计
32
68
100
(2)零假设为:是否喜欢体育运动与性别无关联.
根据列联表可得
根据小概率值的独立性检验,我们推断不成立,即认为是否喜欢体育运动与性别有关联.
14.某市自从启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频繁发生,带来了较大的交通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到如下列联表:
30岁及以下
30岁以上
总计
闯红灯
60
未闯红灯
80
总计
200
近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济处罚,了研究不同处罚金额的效果,交警部门在试行四种不同处罚金额(5元、10元、15元、20元)的情形下,每种情形均随机抽取200人进行调查,统计了闯红灯的人数,汇总如下表:
处罚金额(单位:元)
5
10
15
20
闯红灯的人数
50
40
20
0
将统计数据所得频率作为概率,完成下列问题.
(1)将列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚前,是否有的把握认为闯红灯与年龄有关?
(2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少?
(3)结合调查结果,谈谈如何治理行人闯红灯现象.
【答案】(1)列联表见解析;有的把握认为闯红灯与年龄有关; (2)0.2; (3)答案见解析
【分析】(1)完成列联表,由表中数据计算,根据独立性检验的思想判断即可;
(2)当处罚金额为10元时,求出行人闯红灯的概率,和0.4去比较即可得解;
(3)由表中数据得到,行人闯红灯与年龄有明显关系,试行经济处罚可以明显降低行人闯红灯的概率,所以从这两方面作答即可.
【解析】(1)列联表如下:
30岁及以下
30岁以上
总计
闯红灯
20
60
80
未闯红灯
80
40
120
总计
100
100
200
零假设:假设闯红灯与年龄无关,
由表中数据可得.
,假设不成立,即有的把握认为闯红灯与年龄有关;
(2)未进行处罚前,行人闯红灯的概率约为0.4,
当处罚金额为10元时,行人闯红灯的概率约为,
所以当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低0.2;
(3)①根据调查数据显示,行人闯红灯与年龄有明显关系,
所以可以针对30岁以上人群开展“道路安全”宣传教育;
②由于试行经济处罚可以明显降低行人闯红灯的概率,
所以可以进行适当经济处罚来降低行人闯红灯的概率.
2 / 19
学科网(北京)股份有限公司
$
专题9.3 独立性检验
教学目标
1.通过实例,理解2×2列联表的统计意义,掌握2×2列联表、χ2统计量公式,并能解决实际问题
2.通过实例,掌握2×2列联表独立性检验的基本思想、方法及初步应用.
3.经历由实际问题建立数学模型的过程,发展数学建模和数学运算素养;在运用独立性检验的思想作出合理推断的过程中,发展数学运算和逻辑推理素养.
教学重难点
1.重点
独立性检验的基本方法.
2.难点
独立性检验的基本思想.
知识点01 分类变量与列联表
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.2×2列联表
假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
【即学即练】
1.下面是一个列联表,其中a、b处填的值分别为( )
总计
a
21
73
2
25
27
总计
b
46
100
A.52、54 B.54、52 C.94、146 D.146、94
2.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100 名电视观众,相关的数据如下表(单位:人)所示:
收看文艺节目
收看新闻节目
总计
20至40岁
40
18
58
大于40岁
15
27
42
总计
55
45
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关: .(填“是”或“否”)
知识点02 独立性检验
1.独立性检验
(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
则.
(2)利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.
(3)独立性检验中几个常用的小概率值和相应的临界值.
【即学即练】
1.为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
2.为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则( )
性别
羽毛球
喜欢
不喜欢
女生
男生
50
100
附:,其中.
A.4 B.2 C.1 D.
3.交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线上有自东向西依次编号为1,2,…,21的21个车站.为调查编号为10和11两个站点的乘客对调图的满意度是否有差异,在这两个站点多次乘坐列车的旅客中,随机抽取100名旅客,并得出如下列联表,则的值约为( )
车站编号
满意度
满意
不满意
总计
10
28
12
40
11
57
3
60
总计
85
15
100
A.6.923 B.7.851 C.10.635 D.11.765
题型01 完善列联表
【典例1】下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【变式1】有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35 B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50 D.由列联表可看出成绩与班级有关系
【变式2】假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【变式3】(多选)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据正确的是( )
A. B.
C. D.
【变式4】如下是一个列联表,则 .
yx
总计
总计
题型02 列联表的分析及应用
【典例1】考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2×2列联表给出了成对分类变量数据的交叉分类频数.
【变式1】地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【变式2】假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【变式3】(多选)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则( )
合计
合计
A.若,则可以认为与独立
B.若变量与独立,则
C.若很大,则变量与不独立
D.若变量与不独立,则很大
题型03 独立性检验的概念及辨析
【典例1】某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用列联表计算得的观测值.
附表:
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )
A. B. C. D.
【变式1】根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
【变式2】根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
【变式3】根据分类变量X与Y的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量X与Y独立
B.变量X与Y独立,这个结论犯错误的概率不超过0.005
C.变量X与Y不独立
D.变量X与Y不独立,这个结论犯错误的概率不超过0.005
【变式4】(多选)在检验分类变量X与Y是否有关的过程中,计算得到实验数据的统计量,已知,,则( )
A.在犯错误的概率不超过10%的前提下,可以认为X与Y没有关系
B.在犯错误的概率不超过10%的前提下,可以认为X与Y有关系
C.依据的独立性检验,可以认为X与Y不独立
D.依据的独立性检验,可以认为X与Y独立
题型04 卡方的计算
【典例1】春节期间,“厉行节约,反对浪费”之风悄然兴起,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
性别
“光盘”行动
合计
做不到“光盘”
能做到“光盘”
男
45
10
55
女
30
15
45
合计
75
25
100
附:
0.10
0.05
0.025
2.706
3.841
5.024
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有以上的把握认为”该市居民能否做到‘光盘’与性别无关”
1.根据问题数据构建2×2列联表,明确观测频数a、b、c、d(如a为甲类且阳性数,b为甲类且阴性数等),计算总样本数n=a+b+c+d。确认列联表各行各列合计值:行合计a+b、c+d;列合计a+c、b+d,为代入公式提供完整数据。
2.代入卡方统计量公式:χ²=n(ad-bc)²/[(a+b)(c+d)(a+c)(b+d)],分步计算分子分母避免出错。计算后验证结果:χ²≥0,若为负数则检查数据或计算错误。根据需求对比临界值(如3.841、6.635),初步判断分类变量关联程度。
【变式1】AI模型正在改变着我们的工作和生活方法,某机构为了了解对DeepSeek的使用情况与性别的关系,随机调查了人,得到如下列联表(单位:人):
性别
使用情况
合计
经常使用
不经常使用
男性
女性
合计
依据小概率值的独立性检验认为对DeepSeek的使用情况与性别有关系,则的最小值为( )
(附:,,)
A.48 B.49 C.50 D.51
【变式2】通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
运动
性别
总计
男
女
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
下列结论正确的是( )
A.认为“爱好该项运用与性别有关”,犯错误的概率不超过0.01
B.认为“爱好该项运用与性别无关”,犯错误的概率不超过0.01
C.认为“爱好该项运动与性别有关”,犯错误的概率不超过0.001
D.认为“爱好该项运动与性别无关”,犯错误的概率不超过0.001
【变式3】某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表,则根据列联表可知:
年轻人
非年轻人
总计
经常用流行用语
125
25
150
不常用流行用语
35
15
50
总计
160
40
200
有 的把握认为经常用流行用语与年轻人有关系.
【变式4】某研究性学习小组针对“使用大绿书的用户是否存在性别差异”,向个人进行调查.用表示所有调查对象构成的集合.以为样本空间建立古典概型,并定义一对分类变量和如下:对于中的每一名学生,,现得到下表:
是大绿书的用户
不是大绿书的用户
男性
女性
若根据的独立性检验认为(其中),则的最小值为__________.(参考公式:,其中)
题型05 独立性检验的基本思想
【典例1】根据分类变量X与Y的成对样本数据,计算得到,依据小概率值的独立性检验(),可推断( )
A.变量X与Y不独立
B.变量X与Y不独立,此推断犯错误的概率不超过0.01
C.无法判断变量X与Y是否独立
D.变量X与Y独立
【变式1】利用来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.利用独立性检验不仅可以考察两个分类变量是否有关系,而且( )
A.能较精确的给出这种判断的可靠程度
B.得出的结论完全正确,不会出错
C.的观测值很大时(比如大于20),则得出的零假设完全正确,不会出错
D.的观测值很小时(比如小于2),则得出的零假设肯定错误
【变式2】通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
【变式3】2025年7月22日是二十四节气中的第十二个节气——大暑.受今年气候等多因素的影响,全国各地高温天气持续不断.某校以“预防中暑,防止脱水”为主题举行活动.为了解男女同学对该活动的兴趣程度,对多位该校同学进行了调查,并将结果整理成如下列联表.
性别
兴趣程度
合计
感兴趣
不感兴趣
男生
女生
合计
(1)当m足够大时,估计从该校任选一名对该活动不感兴趣的学生是男生的概率;
(2)若根据小概率值的独立性检验,认为对该活动是否感兴趣与性别有关,求正整数m的最小值.
附:,其中.
0.1
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
题型06 独立性检验解决实际问题
【典例1】为了研究高三年级学生的性别和身高是否大于的关系,调查了某高三年级学生,整理得到如下列联表:
身高
性别
低于
不低于
合计
男
9
91
100
女
90
10
100
合计
99
101
200
(1)在这200名学生中随机选两名学生身高均不低于的概率是多少?
(2)根据小概率值的独立性检验,能否认为该中学高三年级学生的性别与身高有关联,解释所得结论的实际含义.
附
0.05
0.010
0.001
3.841
6.635
10.828
独立性检验的应用问题的解题策略:
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
【变式1】为考察药物A对预防疾病B的效果,在两个不同规模的动物种群中分别进行了试验,根据种群一的试验结果得到如下列联表:
药物A
疾病B
合计
未患病
患病
未服用
28
22
50
服用
34
16
50
合计
62
38
100
计算得到.假设种群二试验结果对应的列联表中,每个单元格的数据都为上表对应单元格数据的5倍,则根据小概率值的独立性检验,( )
附:,
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
A.当时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过5%
B.当时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过10%
C.当时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过1%
D.当时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过0.5%
【变式2】为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.01的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.59 B.60
C.61 D.62
【变式3】为了研究某新型病毒与快速检测试剂结果的关系,研究人员随机调查了200名接受过该试剂检测的人群,得到如下列联表:
快速检测结果组别
阳性
阴性
合计
感染该病毒
30
10
40
未感染该病毒
20
140
160
合计
50
150
200
(1)记快速检测结果为阳性者感染该病毒的概率为P,求P的估计值;
(2)根据小概率值的独立性检验,分析快速检测结果是否与感染该病毒有关.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【变式4】为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了若干人,得到如下列联表:
超声波检查结果组别
正常
不正常
合计
患该疾病
未患该疾病
合计
(1)记超声波检查结果不正常者患该疾病的概率为,求关系;
(2)在(1)的条件下,根据小概率值的独立性检验,分析得出超声波检查结果与患该疾病有关.求的最小值.(保留整数)
附,
0.050
0.010
0.001
3.841
6.635
10.828
题型07 独立性检验与其他章节的融合
【典例1】为了解学生对某项运动的喜欢程度,某校随机调查了200名学生,得到如下列联表:
喜欢程度
性别
喜欢
感觉一般
合计
男
30
70
100
女
50
50
100
合计
80
120
200
(1)根据小概率值的独立性检验,分析学生对该运动的喜欢程度是否与性别有关;
(2)从这200人中随机选出了5名男生和3名女生作为代表,其中有2名男生和2名女生喜欢该运动.现从这8名代表中任选3名男生和2名女生进一步交流,求这5人中恰有2人喜欢该运动的概率.
附:
0.05
0.01
0.005
3.841
6.635
7.879
【变式1】(多选)下列说法正确的是( )
A.若越接近1时,成对样本数据的线性相关程度越强
B.回归分析中,残差图中残差比较均匀分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
C.在列联表中,若每个数据a,b,c,d均变成原来的2倍,则也变成原来的2倍(附:,其中)
D.决定系数用以比较两个模型拟合效果,若越小,则模型的拟合效果越好
【变式2】为了调查抖音平台某直播间带货服务的满意程度,现随机调查了年龄在20岁至70岁的100人,他们年龄的频数分布和“满意”的人数如下表:
年龄/岁
频数
15
25
30
20
10
满意
13
20
27
16
4
根据上述统计数据填下面的列联表
年龄低于50岁的人数
年龄不低于50岁的人数
合计
满意
不满意
合计
(2)若以频率估计概率,以100人的样本数据来估计全国玩抖音的市民(假设年龄均在20岁至70岁)的总体数据,若从在全国范围内任选5人,记表示抽到“满意”的人数,求的分布列与数学期望.
【变式3】随着视频传输和移动通信技术的日益成熟、以及新冠疫情的推动,直播+电商的模式正在全球范围内掀起热潮.目前,国际上Amazon、Rakuten等电商平台和以Facebook为代表的社交类平台都纷纷上线了直播电商业务;在国内,淘宝、京东、抖音、拼多多、苏宁等众多平台都已成为该赛道内的玩家.根据中研产业研究院《2020-2025年中国直播电商行业市场深度分析及投资战略咨询研究报告》显示,2020年上半年,“直播经济”业态主要岗位的人才达到2019年同期的2.4倍;2020年“6·18”期间,带货主播和直播运营两大岗位高达去年同期的11.6倍.针对这一市场现象,为了加强监管,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.
(1)请完成关于商品和服务评价的列联表,
对服务好评
对服务不满意
合计
对商品好评
80
对商品不满意
10
合计
200
(2)若将频率视为概率,某人在该购物平台上进行的3次购物中,设对商品和服务全为好评的次数为随机变量X,求对商品和服务全为好评的次数X的分布列和数学期望.
【变式4】中国的航天事业历经数十年的发展,已经形成了完整的航天技术体系,涵盖运载火箭、载人航天、深空探测等多个领域.某学校为了解学生对航天工程的关注情况,随机从该校学生中抽取男生和女生各100人进行调查,调查结果如下表:
关注
不关注
合计
男生
75
25
100
女生
55
45
100
合计
130
70
200
(1)根据小概率值的独立性检验,能否认为该校学生对航天工程的关注情况与性别有关?
(2)从这200人中随机选出了3名男生和5名女生作为代表,其中有2名男生和2名女生关注航天工程.现从这8名代表中任选2名男生和3名女生进一步交流,求这5人中恰有2人关注航天工程的概率.
参考公式及参考数据:
.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【变式5】我国探月工程亦称“嫦娥工程”,2024年6月3日,嫦娥六号完成了人类首次月球背面智能采样工作,并在6月下旬携带月球样品返回地球,为人类进一步研究和利用月球资源提供了保证.为了解不同性别的学生对探月工程的关注程度(“十分关注”与“比较关注”),学校随机抽取男生和女生各50名进行调查,数据表明:男生中有90%的同学“十分关注”,女生中有70%的同学“十分关注”,其他学生都是“比较关注”.
(1)根据条件,列出列联表,通过独立性检验,能否在犯错误概率不超过0.010前提下,认为探月工程的关注程度与性别有关;
(2)学校为提升同学们对探月工程的关注度,在以上“比较关注”的学生中运用分层抽样的方法抽取8人进行科普类培训,再从这8人中随机抽取3人进行重点培训,求这3人中至少有1名男生的概率.
附:,其中.
0.100
0.050
0.010
2.706
3.841
6.635
【变式6】近几年,新能源汽车的更新换代越来越引起人们的关注.某新能源车企想了解年轻司机与中老年司机对新能源车和燃油车的喜好程度,随机抽取了1000名司机,得到的列联表如下:
偏好新能源车
偏好燃油车
总计
年轻司机
300
200
500
中老年司机
200
300
500
总计
500
500
1000
(1)依据小概率值的独立性检验,能否认为司机对两种汽车的偏好与年龄有关联?
(2)该新能源车企生产的一款汽车在2025年上半年每个月的销量(千辆)与月份线性相关,数据如下:
月份
1
2
3
4
5
6
销量(千辆)
0.8
0.9
1.1
1.1
1.3
1.4
求关于的线性回归方程.
参考公式及数据:.
,其中.
0.01
0.005
0.001
6.635
7.879
10.828
1.假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
2.下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
3.在性别与吃零食这两个分类变量的计算中,下列说法正确的是( )
①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误.
A.①② B.①③ C.②③ D.③
4.某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20,则下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.根据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
5.现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵严重的城市和交通拥堵不严重的城市分别随机调查了20名市民,得到了一个市民是否认可的样本,依据独立性检验,经计算得到,参照下表,得到的正确结论是:( )
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
6.某公司对100名员工进行了工作量的调查,数据如表:
认为工作量大
认为工作量不大
合计
男士
40
20
60
女士
20
20
40
合计
60
40
100
若推断“员工的性别与认为工作量大有关”,则这种推断犯错误的概率不超过( )
附:
0.15
0.1
0.05
0.025
0.01
0.001
2.072
2.706
3.841
5.024
6.635
10.828
A.0.1 B.0.05 C.0.025 D.0.01
7.(多选)给出下列实际问题,其中可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
8.(多选)分类变量X和Y的列联表如下:
合计
a
b
c
d
合计
则下列说法不正确的是( )
A.越小,说明X与Y关系越弱
B.越大,说明X与Y关系越强
C.越大,说明X与Y关系越强
D.越接近于0,说明X与Y关系越强
9.(多选)某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的 若有的把握认为喜欢短视频和性别相关联,则的取值可以为( )
(附,其中.)
A. B. C. D.
10.下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得 .
11.针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若我们推断不成立,此推断犯错误率不超过,则的最小值为_________
附:,附表:
0.05
0.01
3.841
6.635
12.近年来,我国高度重视扶贫开发工作,各级政府坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效.某贫困县为了响应国家精准扶贫的号召,组织村民集体承包了一块土地若干年,已知土地的使用面积以及相应的管理时间的关系如下表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
10
13
25
24
并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:
参与管理
合计
愿意
不愿意
男性村民
150
50
女性村民
50
合计
(1)若管理时间与土地使用面积之间具有较强的线性相关性,且回归直线方程,求,并预测土地使用面积为6亩时,管理时间为多少月?
(2)在答题卡中补全列联表,并依据小概率值的独立性检验,判断村民的性别与参与管理的意愿是否具有相关性?
参考公式:,
其中.临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
13.为了解某校学生每天进行体育运动的时间,从中抽取男、女生共100人进行问卷调查.将样本中的“男生”和“女生”按每天体育运动的时间(单位:分钟)各分为5组:,,经统计得下表:
男生
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
人数
4
5
27
21
3
女生
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
人数
3
13
16
6
2
若体育运动的时间不少于一小时,则被认定为“喜欢体育运动”,否则被认定为“不喜欢体育运动”.
(1)根据以上数据完成列联表;
喜欢体育运动
不喜欢体育运动
合计
男
女
合计
(2)依据小概率值的独立性检验,能否认为是否喜欢体育运动与性别有关联?
参考公式:,其中.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
14.某市自从启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频繁发生,带来了较大的交通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到如下列联表:
30岁及以下
30岁以上
总计
闯红灯
60
未闯红灯
80
总计
200
近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济处罚,了研究不同处罚金额的效果,交警部门在试行四种不同处罚金额(5元、10元、15元、20元)的情形下,每种情形均随机抽取200人进行调查,统计了闯红灯的人数,汇总如下表:
处罚金额(单位:元)
5
10
15
20
闯红灯的人数
50
40
20
0
将统计数据所得频率作为概率,完成下列问题.
(1)将列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚前,是否有的把握认为闯红灯与年龄有关?
(2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少?
(3)结合调查结果,谈谈如何治理行人闯红灯现象.
2 / 19
学科网(北京)股份有限公司
$