内容正文:
专题02 列联表与独立性检验四大题型
题型一:列联表完善与分析
题型二:独立性检验的概念及辨析
题型三:卡方的计算与判断
题型四:独立性检验与其他问题综合
题型一:列联表完善与分析
1.假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
【答案】D
【分析】根据列联表直接计算.
【详解】根据列联表知,,又,所以,
故选:
2.假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】D
【分析】计算每个选项中的,比较大小后可得出结论.
【详解】对于两个分类变量与而言,的值越大,说明与有关系的可能性最大,
对于A选项,,
对于B选项,,
对于C选项,,
对于D选项,,
显然D中最大,
故选:D.
3.目前中国的新能源汽车技术日新月异,老百姓购买时参考的参数有所不同,一部分人更看重汽车动力、扭矩、悬挂、底盘等技术参数,可以称为“技术流”;另一部分人更看重电池续航、内饰材料、智能化程度等,可以称为“体验流”.现随机抽取100名车主,针对他们对汽车的偏好进行问卷调查,得到下表:
性别
对汽车的偏好
体验流
技术流
总计
男
30
50
女
40
总计
100
小组成员甲用该列联表中的数据进行独立性检验,小组成员乙将该列联表中的所有数据都缩小为原来的后再进行独立性检验,则下列说法正确的是( )
A.若在样本中的女性中按分层随机抽样的方法再抽取10人,则应从“体验流”中抽取6人
B.小组成员甲认为对汽车的偏好与性别无关
C.小组成员甲、乙计算出的值相同,他们得出的结论也相同
D.小组成员甲、乙计算出的值不同,他们得出的结论也不同
【答案】D
【分析】对于A,由题可完善列联表,据此可判断选项正误;对于BCD,由题意及独立性检验知识可判断选项正误.
【详解】对于A,由题意,补充完整的列联表如下:
性别
对汽车的偏好
体验流
技术流
总计
男
20
30
50
女
40
10
50
总计
60
40
100
则在样本中的女性中,按分层随机抽样的方法再抽取10人,应从“体验流”中抽取(人).故A错误;
对于BCD,对于成员甲有,
故小组成员甲有99%的把握认为对汽车的偏好与性别有关;
对于成员乙有,
故小组成员乙认为对汽车的偏好与性别无关.
综上,小组成员甲、乙计算出的值不同,他们得出的结论也不同.故B错误,C错误,D正确.
故选:D
4.下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得 .
【答案】74
【分析】根据联表性质计算求解.
【详解】由题意知,所以.
故答案为:.
5.如下是一个列联表,则 .
yx
总计
总计
【答案】
【分析】根据列联表的概念,可得答案.
【详解】由题意可得,则,可得,所以.
故答案为:.
题型二:独立性检验的概念及辨析
6.如图的列联表中,定义,易知越大越有利于结论“与有关系”.若当值大于常数时,有的把握认为与有关系,那么的值为( )
(已知,其中,)
总计
总计
A. B.
C. D.
【答案】A
【分析】根据以及即可求解.
【详解】当有的把握认为与有关系,则,故,
此时临界条件为,此时对应的刚好为,
即此时,即,
故,则,
故,
故选:A
7.运用列联表进行独立性检验时,统计量的意义是( ).
A. B.
C. D.
【答案】C
【分析】由卡方的意义即可得解.
【详解】统计量的意义是.
故选:C.
8.调查某医院一段时间内婴儿出生的时间(白天与晚上)和性别(男与女)的关联性,对样本数据分析统计,计算得到,依据小概率值的独立性检验,下列说法正确的是( )(附:)
A.婴儿90%在白天出生
B.婴儿性别与出生时间无关联
C.有0.1的把握认为婴儿性别与出生时间有关联
D.婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1
【答案】D
【分析】求出并与比较即可求解.
【详解】因为,
依据小概率值的独立性检验,
所以婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1.
故选:D.
9.根据分类变量X与Y的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量X与Y独立
B.变量X与Y独立,这个结论犯错误的概率不超过0.005
C.变量X与Y不独立
D.变量X与Y不独立,这个结论犯错误的概率不超过0.005
【答案】A
【分析】利用独立性检验规则来进行判断即可。
【详解】因为,所以没有充分的证据推断变量X与Y不相互独立,即认为变量X与Y独立,故BCD错误,A正确;
故选:A.
10.为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则( )
性别
羽毛球
喜欢
不喜欢
女生
男生
50
100
附:,其中.
A.4 B.2 C.1 D.
【答案】D
【分析】结合,只需,即可求得答案.
【详解】要使是否喜欢羽毛球运动与性别无关的可能性最大,则,所以,
所以.
故选:D
11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
手术
心脏病
合计
又发作过
未发作过
心脏搭桥
39
157
196
血管清障
29
167
196
合计
68
324
392
试根据上述数据计算 ,能否根据小概率值的独立性检验作出这两种手术对病人又发作心脏病的影响有差别的结论 (填“能”或“不能”).
【答案】 1.779 不能
【分析】第一空,由独立性检验卡方计算公式可得答案;第二空,由独立性检验知识可得答案.
【详解】零假设为:这两种手术对病人又发作心脏病的影响无差别.
根据列联表中的数据,可以求得
,
根据小概率值的独立性检验,我们没有充分的证据推断不成立,
即认为这两种手术对病人又发作心脏病的影响无差别.
故答案为:1.779;不能
12.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是 (填序号).
①若,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;
③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.
【答案】③
【分析】由独立性检验相关概念可得答案.
【详解】的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.
故答案为:③
13.下列说法中,正确的有 (填序号).
①回归直线恒过点,且至少过一个样本点;
②根据列联表中的数据计算得出,而,则在犯错误的概率不超过0.01的前提下认为两个分类变量有关系;
③是用来判断两个分类变量是否相关的随机变量,当的值很小时可以推断两类变量不相关;
④某项测量结果服从正态分布,则,则.
【答案】②④
【分析】根据回归直线恒过点,但不一定过样本点得到判断①,根据独立性检验判断②和③,由正态分布概率的计算判断④.
【详解】对于①,回归直线恒过点,但不一定过样本点,故①错误;
对于②,因独立性检验是选取一个零假设条件下的小概率事件,故②正确;
对于③,当的值很小时推断两类变量相关的把握小,但不能说无关,故③错误;
对于④,因为服从正态分布,且,所以与关于直线对称,
由可得,,则,故④正确. 故答案为:②④.
题型三:卡方的计算与判断
14.针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若我们推断不成立,此推断犯错误率不超过,则的最小值为( )
附:,附表:
0.05
0.01
3.841
6.635
A.7 B.8 C.9 D.10
【答案】C
【分析】根据题意可得列联表,由已知数据计算,根据独立性检验的结论,列不等式求的取值范围,得最小值.
【详解】根据题意,不妨设男生中喜欢短视频的人数为人,男生中不喜欢短视频的人数为人,女生中喜欢短视频的人数为人,女生中不喜欢短视频的人数为人.
所以可得列联表如下:
喜欢短视频人数
不喜欢短视频人数
合计
男生人数
女生人数
合计
于是,
由于推断不成立,此推断犯错误率不超过,
所以依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,且,于是最小值为.
故选:C
15.通过随机询问某中学110名中学生是否爱好跳绳,得到列联表如表所示:
跳绳
性别
合计
男
女
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
附:,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
则以下结论正确的是( )
A.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
C.根据小概率值α=0.01的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过0.01的前提下,我们认为爱好跳绳与性别无关
【答案】A
【分析】先做出零假设,再计算出,让去和,比较,然后根据独立性检验的理论判断即可.
【详解】零假设:我们认为爱好跳绳与性别无关,
因为,,
所以我们的假设成立,即根据小概率值α=0.001的独立性检验,
我们认为爱好跳绳与性别无关,故A正确;
在犯错误的概率不超过0.001前提下,我们认为爱好跳绳与性别无关,故B错误;
又因为,所以我们的假设不成立,
即根据小概率值α=0.01的独立性检验,我们认为爱好跳绳与性别有关,故C错误;
在犯错误的概率不超过0.01的前提下,我们认为爱好跳绳与性别有关,故D错误.
故选:A
16.健康的饮食和科学的运动能够有效减少低密度脂蛋白浓度.为了调查某地青年人的低密度脂蛋白浓度是否与肥胖有关,随机调查该地100名青年人,得到列联表如下:
肥胖
不肥胖
总计
低密度脂蛋白不高于
10
65
75
低密度脂蛋白高于
10
15
25
总计
20
80
100
附:,其中.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
由此得出的正确结论是( )
A.在犯错误概率不超过的前提下,认为“该地青年人的低密度脂蛋白浓度与肥胖有关”
B.在犯错误概率不超过的前提下,认为“该地青年人的低密度脂蛋白浓度与肥胖无关”
C.肥胖的青年人中低密度脂蛋白高于的百分比为
D.低密度脂蛋白高于的青年人中肥胖的百分比为
【答案】A
【分析】先计算出卡方的值,和比较,根据独立性检验的理论,即可判断A和B;计算出肥胖的青年人中低密度脂蛋白高于的百分比,即可判断C;计算出低密度脂蛋白高于的青年人中肥胖的百分比,即可判断D.
【详解】因为,
这意味着在犯错误概率不超过的前提下,
认为“该地青年人的低密度脂蛋白浓度与肥胖有关”,故A正确,B错误;
肥胖的青年人中低密度脂蛋白高于的百分比为,故C错误;
低密度脂蛋白高于的青年人中肥胖的百分比为,故D错误.
故选:A
17.下面是一个2×2列联表:
X
Y
合计
10
30
70
80
合计
20
110
附:,其中
则 (保留小数点后3位)
【答案】
【分析】根据题意完成列联表,再代入计算并取近似值即得.
【详解】先完成2×2列联表如下:
X
Y
合计
10
20
30
10
70
80
合计
20
90
110
则.
故答案为:.
18.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
【答案】
【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.
【详解】因为抽取个学生,女生人数是男生人数的,
所以抽取个男生,个女生,为了便于计算,我们令,
设男生人数为,依题意可得列联表如下:
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,由,解得,
由题知应为6的整数倍,
而根据小概率值的独立性检验,判断中学生追星与性别有关,
则男生至少有30人,
故答案为:30.
19.小明为了了解不同性别的观众对蛇年春晚小品类节目的喜欢情况,随机选取了200名观看蛇年春晚的观众,得到如下列联表:
喜欢
不喜欢
合计
男性
45
45
90
女性
110
合计
80
200
根据小概率值的独立性检验,其中 ,(精确到小数点后3位)可以判断出性别因素与喜欢有关联.
附:,.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【答案】6.818
【分析】先根据列联表中的合计信息求出缺失的数据,再代入统计量的公式进行计算.
【详解】已知合计人数为200,不喜欢的人数合计为80,那么喜欢的人数合计.
因为男性喜欢的人数是45,喜欢的人数合计是120,所以女性喜欢的人数为.
又因为女性合计人数为110,所以.此时完整的列联表为:
喜欢
不喜欢
合计
男性
45
45
90
女性
75
35
110
合计
120
80
200
在中,(这里),(男性喜欢的人数),(男性不喜欢的人数),(女性喜欢的人数),(女性不喜欢的人数).
将这些值代入公式可得: .
故答案为:6.818.
20.某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生至少有 人.
参考数据:,
【答案】45
【分析】设被调查的男女生为人,写出列联表,应用卡方公式求卡方值,结合求参数范围,进而确定被调查的男生为,即可答案.
【详解】设被调查的男女生为人,则男生喜欢抖音有人,女生喜欢抖音有人,
所以列联表如下:
喜欢抖音
不喜欢抖音
总计
男生
女生
总计
则,解得,
因此被调查的男生为,又,则人数是5的正整数倍,
所以大于等于45的5的整数倍都符合题意,调查人数中男生至少有人.
故答案为:
21.某航天材料实验室要对比两种新型高温合金材料的性能稳定性,现有合金部件样本900件,合金部件样本500件,采用分层抽样抽取140件做耐热疲劳测试,以部件能承受1000次热循环不失效为合格标准,得到以下部分列联表:
单位:件
材料配方类型
耐热疲劳性能
合计
测试合格
测试不合格
配方材料试样
75
配方材料试样
20
合计
140
(1)请完成上述列联表;
(2)依据的独立性检验,能否认为不同的材料配方与耐热疲劳性能有关联?
附:,其中.
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析
(2)有关联
【分析】(1)根据题干表格,完善列联表即可;
(2)计算出卡方,即可判断.
【详解】(1)由已知合金部件应抽取件,合金部件应抽取件,
由此可得列联表如下:
材料配方类型
耐热疲劳性能
合计
测试合格
测试不合格
配方材料试样
75
15
90
配方材料试样
30
20
50
合计
105
35
140
(2)零假设为:材料配方与耐热疲劳性能无关联,
根据列联表数据,经计算得,
根据小概率值的独立性检验,我们推断不成立,
即认为材料配方与耐热疲劳性能有关联,此推断犯错误的概率不大于.
题型四:独立性检验与其他问题综合
22.某科研团体为了研究猪油是否比某些植物油更有助于控制体重,在小鼠身上模拟了人类少吃油的健康饮食模式,将40只小鼠随机分成两组,一组吃猪油,另一组吃植物油,持续一段时间后,得到如下数据.
小鼠
体脂率
合计
低于15%
高于15%
吃猪油
18
2
20
吃植物油
10
10
20
合计
28
12
40
(1)试问小鼠体脂率的差异是否与吃猪油有关?
(2)若将表中所有数据都扩大为原来的倍,在相同的检验标准下,再用独立性检验推断小鼠体脂率的差异是否与吃猪油有关,若要使得有的把握判断小鼠体脂率的差异与吃猪油有关,求的最小值.
附:.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【答案】(1)有的把握判断小鼠体脂率的差异与吃猪油有关
(2)2
【分析】(1)由独立性检验进行求解;
(2)由进行求解.
【详解】(1):假设小鼠体脂率的差异与吃猪油无关,
则.
因为,所以有的把握判断小鼠体脂率的差异与吃猪油有关.
(2).
令,解得.
因为,所以的最小值为2.
23.随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解乡村居民对新能源汽车的接受程度,某乡村汽车协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取80名村民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了以下统计数据:
选择新能源汽车
选择传统汽车
总计
40岁以下
56
80
40岁及以上
36
80
总计
160
完成列联表,并判断是否有的把握认为选择新能源汽车与年龄有关;
(2)为了了解某一地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量(单位:万台)关于年份的线性回归方程,且销售量的方差为,年份的方差为.求与间的样本相关系数,并据此判断该地区新能源汽车销售量与年份的线性相关性强弱.
附:(i)在线性回归方程中,;
(ii)样本相关系数,若,则可判断与线性相关性较强;
(iii),其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)表格见解析,没有的把握认为选择新能源汽车与年龄有关;
(2)0.84,与线性相关性较强.
【分析】(1)根据题中数据补全列联表即可:再由表中数据以及公式进行计算求解即可;
(2)根据样本相关系数公式计算可得答案.
【详解】(1)补全列联表如下:
选择新能源汽车
选择传统汽车
总计
40岁以下
56
24
80
40岁及以上
44
36
80
总计
100
60
160
提出零假设为:选择新能源汽车与年龄无关.
则,
故认为选择新能源汽车与年龄无关;
(2)因为,
所以,又,
所以,故与线性相关性较强.
24.年总台春晚无锡分会场《无锡景·家国情》节目的惊艳亮相,让无锡非遗大放异彩,火爆出圈.惠山泥人是无锡国家级非遗项目,“阿福”“阿喜”是它的代表作品.某文创工作室在春节后推出“惠山泥人非遗盲盒”系列,每个盲盒装有“阿福”“阿喜”“普通泥人”三种款式之一.随机抽取了名购买者,调查其性别与抽中“阿福”的情况,得到如下列联表:
抽中“阿福”
未抽中“阿福”
合计
男游客
女游客
合计
(1)依据小概率值的独立性检验,判断“抽中‘阿福’”与“游客性别”是否有关;
(2)若盲盒中是“阿福”“阿喜”“普通泥人”的比例为,某游客决定采用以下规则购买:若第一次抽中“阿福”或“阿喜”,则立即停止购买;若第一次抽中“普通泥人”,则继续购买第二个盲盒;此时:若第二次抽中“阿喜”,则停止购买,若第二次仍未抽中“阿喜”,则继续购买第三个盲盒,且无论结果如何都停止.记最终抽中“阿福”的个数为随机变量,求的分布列及数学期望.
附:,
【答案】(1)无充分证据认为抽中‘阿福’”与“游客性别”有关
(2)答案见解析
【分析】(1)采用小概率值的独立性检验,提取已知数据代入卡方公式计算,再将计算结果与临界值比较得出相关性;
(2)先确定单次抽中概率,分析购买规则与取值并计算相关概率,列出分布列并求期望.
【详解】(1)由代入已知数据得:
,
临界值,故没有充分证据认为抽中‘阿福’”与“游客性别”有关.
(2)盲盒中是“阿福”“阿喜”“普通泥人”的比例为,
则“阿福”的概率,“阿喜”的概率,“普通泥人”的概率,
由购买规则可知,抽中“阿福”的可能取值为,
当时情况为:
第一次抽中“阿喜”、 第一次抽中“普通泥人”且第二次抽中“阿喜”、
第一次抽中“普通泥人”且第二次抽中“普通泥人”且第三次非“阿福”,
则;
当时情况为:第一次抽中“阿福”、
第一次抽中“普通泥人”且第二次抽中“阿福”且第三次未抽中“阿福”、
第一次抽中“普通泥人”且第二次抽中“普通泥人”且第三次“阿福”,
则;
当时情况为: 第一次抽中“普通泥人”且第二次抽中“阿福”且第三次抽中“阿福”,
则;
分布列为:
0
1
2
数学期望为:
.
25.某校高中学生课后每天整理数学错题(单位:道)和他们的数学成绩(单位:分)之间存在近似的线性关系,数据如下表:
整理错题道
数学成绩分
(1)试用最小二乘法求出关于的线性回归方程,并预测每天整理数学错题道时的数学成绩;
(2)基于上述数据整理,该校提倡学生课后进行数学错题整理,经过一段时间后,在本校学生中采用随机抽样的方法抽取了名学生,调查他们的数学成绩和整理数学错题的情况,统计数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
不是每天都整理数学错题人数
合计
试问:数学成绩总评优秀与每天都整理数学错题有关吗?
附:,;
,.
【答案】(1)回归方程为,分
(2)有,理由见解析
【分析】(1)求出、的值,利用最小二乘法可求出关于的线性回归方程,将代入回归方程,求出的值,可得出结论;
(2)零假设数学成绩总评优秀与每天都整理数学错题无关,计算出的观测值,结合临界值表可得出结论.
【详解】(1)由表格中的数据可得,,
所以,
,
故关于的线性回归方程为,
当时,,
预测每天整理数学错题道时的数学成绩约为分.
(2)零假设数学成绩总评优秀与每天都整理数学错题无关,
,
所以,我们认为数学成绩总评优秀与每天都整理数学错题有关.
26.为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.
次数
年龄
每周次
每周次
每周次及以上
(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过次的称为体育锻炼频率低,不低于次的称为体育锻炼频率高,请完成以下列联表,并判断在犯错误概率不超过的前提下,能否认为体育锻炼频率的高低与年龄有关联;
青年
中年
合计
体育锻炼频率低
体育锻炼频率高
合计
(2)从每周体育锻炼次及以上的样本锻炼者中,按照表中年龄段采用分层随机抽样的方法抽取人,再从这人中随机抽取人,记这人中年龄在与的人数分别为、,记,求的分布列与期望.
参考公式:,.
附:
【答案】(1)列联表见解析,有关,理由见解析
(2)分布列答案见解析,
【分析】(1)求出卡方值并与临界值比较即可得到结论;
(2)分析可知随机变量的可能取值有、、,求出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求得的值.
【详解】(1)零假设体育锻炼频率的高低与年龄无关,
由题意得如下列联表:
青年
中年
合计
体育锻炼频率低
体育锻炼频率高
合计
,
根据小概率值的独立性检验推断不成立,
即认为体育锻炼频率的高低与年龄有关,此推断犯错误的概率不大于.
(2)由表格中的数据可知,四个年龄段的人比为,
利用分层抽样的方法抽取的人中,年龄分别在、的人数为、,
由题意可知,随机变量的可能取值有、、,
则,,
,
所以随机变量的分布列如下表所示:
所以.
27.某高校拟与某网络平台合作组织学生参加与知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,在全体学生中抽取人调查,得到如下列联表:
活动 性别
男生
女生
合计
未报名参加答题活动
40
70
110
报名参加答题活动
60
30
90
合计
100
100
200
(1)根据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关联?
(2)网络答题规则:答题活动不限时间,不限轮次,答多少轮由选手自行确定:每轮均设置道试题,选手参与该轮答题,一旦答对一题,则其本轮答题结束,答错则继续答题,直到第道试题答完,本轮答题结束已知甲同学报名参加答题活动,假设甲每道试题回答是否正确相互独立,且每次答对的概率均为.
(i)当时,求甲同学在一轮答题过程中答题数量的数学期望;
(ii)假设甲同学每轮答题至少答对前两题中的一道,本轮答题得分,否则得分记甲答题累计得分为的概率为,求数列的通项公式.
附:,其中.
【答案】(1)该校学生报名参加答题活动与性别有关联;
(2)(i);(ii).
【分析】(1)根据题设给出的列联表,计算的值并与临界值比较即可,
(2)(i)首先列出的概率表达式,然后用数学期望公式将它的数学期望表达式列出来,即可求解;
(ii)根据题意可得,,时,,再利用构造法求出.
【详解】(1)零假设为:学生报名参加答题活动与性别无关,
则,
依据小概率值的独立性检验,我们推断不成立,
即认为学生报名参加答题活动与性别有关联,此推断犯错误的概率不大于0.001.
(2)(i)设甲完成一轮答题,答题数量为随机变量,则的所有可能取值为,
其中,,
因此.
(ii)每轮比赛甲得1分的概率为,得2分的概率为,
依题意,,,当时,则,
显然,且,
则数列是首项为,公比为的等比数列,,
又,则数列是常数列,即,
因此,解得,
所以数列的通项公式是.
28.贵州“村超”以及江苏“苏超”的成功充分说明了足球是一项大众喜爱的运动.
(1)为了解喜爱足球运动是否与性别有关,现随机抽取了男性和女性各100名观众进行调查,得到列联表如下:
喜爱足球运动
不喜爱足球运动
合计
男性
60
40
100
女性
20
80
100
合计
80
120
200
依据小概率值的独立性检验,能否认为喜爱足球运动与性别有关?
(2)某足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时、传球者都等可能地将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第n次触球者是甲的概率记为,即.
①求,;
②证明:数列为等比数列,并判断第19次与第20次触球者是甲的概率的大小.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
附:,.
【答案】(1)能认为喜爱足球运动与性别有关
(2)①, ②证明见解析;第19次触球者是甲的概率大于第20次触球者是甲的概率.
【分析】(1)计算,依据小概率值的独立性检验作出判断;
(2)①根据古典概型公式计算即可;②根据等比数列的定义证明数列为等比数列,并求得数列的通项公式,进而求得,比较与的大小即可.
【详解】(1)零假设:
:喜爱足球运动与性别独立,即喜爱足球运动与性别无关.
,
根据小概率值的独立性检验,我们推断不成立,即认为喜爱足球运动与性别有关,此推断犯错误的概率不超过0.001.
(2) ①由题意得:第二次触球者为乙,丙,丁中的一个,所以第二次触球者是甲的概率记为;
第二次触球者必不是甲,第三次传给包括甲的三人中的一人,故传给甲的概率为,故.
②因为第n次触球者是甲的概率记为,
所以当时,第次触球者是甲的概率为,则第次触球者不是甲的概率为.
所以,所以,
因为,所以数列为首项是,公比是的等比数列。
所以,所以.
所以,,
所以,即第19次触球者是甲的概率大于第20次触球者是甲的概率.
29.为了解学生对某项运动的喜欢情况,学校进行了一次抽样调查,得到如下数据:
男生
女生
合计
喜欢
65
35
100
不喜欢
50
50
100
合计
115
85
200
(1)能否有99%的把握认为是否喜欢该项运动与性别有关?
(2)若学校有甲,乙两队进行此项运动比赛,每场比赛采用“5局3胜制”(有一队先胜3局即获胜,比赛结束),甲队每局获胜的概率为().
①若比赛打满5局的概率为,求的最大值;
②若,在甲队赢得该场比赛的条件下,求比赛的局数的概率分布及数学期望.
附:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
【答案】(1)没有99%的把握认为是否喜欢该项运动与性别有关
(2)①;②分布列见解析,
【分析】(1)计算卡方,进行独立性检验即可;
(2)①求得,结合基本不等式即可得解;②,计算出对应的概率可得分布列,进一步根据期望公式计算期望即可.
【详解】(1)提出假设:学生对该项运动的喜欢情况与性别无关,
根据列联表中的数据,得,
所以没有99%的把握认为是否喜欢该项运动与性别有关.
(2)①比赛打满5局的概率.
因为,
当且仅当,即时,取得最大值.
②设甲队赢得该场比赛为事件,该场比赛结束时,进行了局为事件(),
且,,
,
则.
在甲队赢得该场比赛的条件下,比赛的局数为(),
则,
,
所以的分布列为
3
4
5
.
30.2024年至2026年是我国“体重管理年”三年计划.为了解某区域市民参与减肥的情况,从该区域随机抽取了150人进行调查,其中参与减肥的人数是不参与减肥人数的2倍;50岁以上的人中,参与减肥的人数与不参与减肥的人数相等;50岁以下的人中,有30人不参与减肥.
(1)完成下表(单位:人),并依据的独立性检验,能否认为年龄与参与减肥有关联?
年龄
参与减肥
合计
否
是
50岁以上
50岁以下
合计
(2)假设用频率估计概率,从该区域所有市民中随机抽取10人,用表示这10人中恰有人参与减肥的概率,求为何值时,取得最大值.
附:,其中.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,认为年龄与参与减肥有关联
(2)
【分析】(1)完善列联表,由独立性检验的原理计算判断即可;
(2)由题意得:,建立关于的不等式组求解即可.
【详解】(1)由题意得列联表:
年龄
参与减肥
合计
否
是
50岁以上
20
20
40
50岁以下
30
80
110
合计
50
100
150
零假设为:年龄与参与减肥无关联.
所以
依据小概率值的独立性检验,我们推断不成立,即认为年龄与参与减肥有关联,此推断犯错误的概率不大于0.01.
(2)由题意得:,
所以,
则,解得:,
所以时,取得最大值.
31.某研究小组为了探究性别与商场购物意愿之间是否存在关联,随机调查200名市民,得到如下数据:
单位:人
性别
商场购物意愿
合计
喜欢在商场购物
不喜欢商场购物
男性
60
30
90
女性
90
20
110
合计
150
50
200
(1)根据小概率值的独立性检验,分析性别与商场购物意愿是否有关联.
(2)采用分层随机抽样,从调查中喜欢商场购物的市民抽取5人,再从这5人中随机抽取2人,求这2人中男性人数X的分布列和期望.
(3)某商场推出购物抽奖促销活动,抽奖是从一个装有1个红球、1个白球、4个黄球的不透明盒子中,依次有放回随机地摸取1个球.规则如下:每摸中1次红球,奖励10元购物券;当消费者摸中红球的个数比黄球个数多1时,抽奖结束,否则抽奖继续.记甲在n次摸球后抽奖结束且获奖30元购物券的概率为,求当取最大值时n的值.
附:,.
临界值表:
α
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)性别与商场购物意愿有关
(2)分布列见解析,
(3)5
【分析】(1)计算卡方,与临界值比较,根据独立性检验思想得解;
(2)根据分层抽样,这5人中2人是男性,3人是女性,X的可能取值为0,1,2,依次求出X每个取值对应的概率,列出分布列得解;
(3)根据题意,甲在抽奖的过程中共抽中3次红球,第n次摸到红球,前次中有抽到2次黄球、2次红球,是“黄红黄红”或“黄黄红红”的顺序,其余均抽到白球,共有种,求出的表达式,判断的单调性,得解.
【详解】(1)零假设为:性别与商场购物意愿无关,,
根据小概率值的独立性检验,推断不成立,即性别与商场购物意愿有关.
(2)调查中喜欢商场购物的市民共有150人,男性人数:女性人数,
所以分层随机抽样抽取的5人中2人是男性,3人是女性,
则X的可能取值为0,1,2,
,,,
所以X的分布列如下:
X
0
1
2
P
所以2人中男性人数的数学期望.
(3)因为n局获奖励30元,说明甲在抽奖的过程中共抽中3次红球,
由于红球的个数比黄球个数多1时结束抽奖,说明第n次摸到红球,前次中有抽到2次黄球、2次红球,
且是“黄红黄红”或“黄黄红红”的顺序,其余均抽到白球,共有种,
则“n次摸球后抽奖结束且甲获奖30元购物券”的概率,,
于是,
因为,所以上式小于0,故,
即单调递减,则当时,取最大值.
另解:,
因为,所以上式小于1,所以.
32.某医学研究团队经过研究发现某良性肿瘤与恶性肿瘤的一项医学指标有明显差异,利用该指标可制定一个检测标准,需要确定临界值,将该指标大于的人判定为患恶性肿瘤,小于或等于的人判定为患良性肿瘤.此检测标准的漏诊率是将恶性肿瘤判定为良性肿瘤的概率,记为;误诊率是将良性肿瘤判定为恶性肿瘤的概率,记为.
(1)若利用临界值进行判定时,随机抽取男女患者各200名进行检验,发现共有11名男性患者出现诊断问题(漏诊或误诊),请完成如下的列联表,并依据小概率值的独立性检验,推断出现诊断问题是否与性别有关?
出现诊断问题人数
未出现诊断问题人数
总计
男性人数
11
200
女性人数
总计
36
400
(2)经过大量调查,得到良性肿瘤和恶性肿瘤患者该指标的频率分布直方图如下:
假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.设函数,求的解析式,并解释取得最小值时临界值的实际意义.
附:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)表格见解析,无关;
(2),答案见解析
【分析】(1)根据二阶列联表计算卡方,再根据独立性检验规则进行判断即可;
(2)根据题中条件进行计算,再利用分段函数求最值即可.
【详解】(1)依题意,列出列联表为:
出现诊断问题人数
未出现诊断问题人数
总计
男性人数
11
189
200
女性人数
25
175
200
总计
36
364
400
零假设:出现诊断问题与性别无关,则
,
故可以认为,依据小概率值的独立性检验,没有充分的证据证明零假设不成立,即认为出现诊断问题与性别无关;
(2)当时,
,
当时,
.
所以.
所以在上单调递减,在上单调递增,
故当时,有0.08.
在实际中,以取得最小值时的临界值为标准,可以使漏诊率与误诊率的和最小,是检测效果最好的临界值.
2 / 11
学科网(北京)股份有限公司
$
专题02 列联表与独立性检验四大题型
题型一:列联表完善与分析
题型二:独立性检验的概念及辨析
题型三:卡方的计算与判断
题型四:独立性检验与其他问题综合
题型一:列联表完善与分析
1.假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
2.假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
3.目前中国的新能源汽车技术日新月异,老百姓购买时参考的参数有所不同,一部分人更看重汽车动力、扭矩、悬挂、底盘等技术参数,可以称为“技术流”;另一部分人更看重电池续航、内饰材料、智能化程度等,可以称为“体验流”.现随机抽取100名车主,针对他们对汽车的偏好进行问卷调查,得到下表:
性别
对汽车的偏好
体验流
技术流
总计
男
30
50
女
40
总计
100
小组成员甲用该列联表中的数据进行独立性检验,小组成员乙将该列联表中的所有数据都缩小为原来的后再进行独立性检验,则下列说法正确的是( )
A.若在样本中的女性中按分层随机抽样的方法再抽取10人,则应从“体验流”中抽取6人
B.小组成员甲认为对汽车的偏好与性别无关
C.小组成员甲、乙计算出的值相同,他们得出的结论也相同
D.小组成员甲、乙计算出的值不同,他们得出的结论也不同
4.下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得 .
5.如下是一个列联表,则 .
yx
总计
总计
题型二:独立性检验的概念及辨析
6.如图的列联表中,定义,易知越大越有利于结论“与有关系”.若当值大于常数时,有的把握认为与有关系,那么的值为( )
(已知,其中,)
总计
总计
A. B.
C. D.
7.运用列联表进行独立性检验时,统计量的意义是( ).
A. B.
C. D.
8.调查某医院一段时间内婴儿出生的时间(白天与晚上)和性别(男与女)的关联性,对样本数据分析统计,计算得到,依据小概率值的独立性检验,下列说法正确的是( )(附:)
A.婴儿90%在白天出生
B.婴儿性别与出生时间无关联
C.有0.1的把握认为婴儿性别与出生时间有关联
D.婴儿性别与出生时间有关联,此推断犯错误的概率不大于0.1
9.根据分类变量X与Y的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量X与Y独立
B.变量X与Y独立,这个结论犯错误的概率不超过0.005
C.变量X与Y不独立
D.变量X与Y不独立,这个结论犯错误的概率不超过0.005
10.为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则( )
性别
羽毛球
喜欢
不喜欢
女生
男生
50
100
附:,其中.
A.4 B.2 C.1 D.
11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
手术
心脏病
合计
又发作过
未发作过
心脏搭桥
39
157
196
血管清障
29
167
196
合计
68
324
392
试根据上述数据计算 ,能否根据小概率值的独立性检验作出这两种手术对病人又发作心脏病的影响有差别的结论 (填“能”或“不能”).
12.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是 (填序号).
①若,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;
③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.
13.下列说法中,正确的有 (填序号).
①回归直线恒过点,且至少过一个样本点;
②根据列联表中的数据计算得出,而,则在犯错误的概率不超过0.01的前提下认为两个分类变量有关系;
③是用来判断两个分类变量是否相关的随机变量,当的值很小时可以推断两类变量不相关;
④某项测量结果服从正态分布,则,则.
题型三:卡方的计算与判断
14.针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若我们推断不成立,此推断犯错误率不超过,则的最小值为( )
附:,附表:
0.05
0.01
3.841
6.635
A.7 B.8 C.9 D.10
15.通过随机询问某中学110名中学生是否爱好跳绳,得到列联表如表所示:
跳绳
性别
合计
男
女
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
附:,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
则以下结论正确的是( )
A.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
C.根据小概率值α=0.01的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过0.01的前提下,我们认为爱好跳绳与性别无关
16.健康的饮食和科学的运动能够有效减少低密度脂蛋白浓度.为了调查某地青年人的低密度脂蛋白浓度是否与肥胖有关,随机调查该地100名青年人,得到列联表如下:
肥胖
不肥胖
总计
低密度脂蛋白不高于
10
65
75
低密度脂蛋白高于
10
15
25
总计
20
80
100
附:,其中.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
由此得出的正确结论是( )
A.在犯错误概率不超过的前提下,认为“该地青年人的低密度脂蛋白浓度与肥胖有关”
B.在犯错误概率不超过的前提下,认为“该地青年人的低密度脂蛋白浓度与肥胖无关”
C.肥胖的青年人中低密度脂蛋白高于的百分比为
D.低密度脂蛋白高于的青年人中肥胖的百分比为
17.下面是一个2×2列联表:
X
Y
合计
10
30
70
80
合计
20
110
附:,其中
则 (保留小数点后3位)
18.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
19.小明为了了解不同性别的观众对蛇年春晚小品类节目的喜欢情况,随机选取了200名观看蛇年春晚的观众,得到如下列联表:
喜欢
不喜欢
合计
男性
45
45
90
女性
110
合计
80
200
根据小概率值的独立性检验,其中 ,(精确到小数点后3位)可以判断出性别因素与喜欢有关联.
附:,.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
20.某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生至少有 人.
参考数据:,
21.某航天材料实验室要对比两种新型高温合金材料的性能稳定性,现有合金部件样本900件,合金部件样本500件,采用分层抽样抽取140件做耐热疲劳测试,以部件能承受1000次热循环不失效为合格标准,得到以下部分列联表:
单位:件
材料配方类型
耐热疲劳性能
合计
测试合格
测试不合格
配方材料试样
75
配方材料试样
20
合计
140
(1)请完成上述列联表;
(2)依据的独立性检验,能否认为不同的材料配方与耐热疲劳性能有关联?
附:,其中.
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
题型四:独立性检验与其他问题综合
22.某科研团体为了研究猪油是否比某些植物油更有助于控制体重,在小鼠身上模拟了人类少吃油的健康饮食模式,将40只小鼠随机分成两组,一组吃猪油,另一组吃植物油,持续一段时间后,得到如下数据.
小鼠
体脂率
合计
低于15%
高于15%
吃猪油
18
2
20
吃植物油
10
10
20
合计
28
12
40
(1)试问小鼠体脂率的差异是否与吃猪油有关?
(2)若将表中所有数据都扩大为原来的倍,在相同的检验标准下,再用独立性检验推断小鼠体脂率的差异是否与吃猪油有关,若要使得有的把握判断小鼠体脂率的差异与吃猪油有关,求的最小值.
附:.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
23.随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解乡村居民对新能源汽车的接受程度,某乡村汽车协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取80名村民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了以下统计数据:
选择新能源汽车
选择传统汽车
总计
40岁以下
56
80
40岁及以上
36
80
总计
160
完成列联表,并判断是否有的把握认为选择新能源汽车与年龄有关;
(2)为了了解某一地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量(单位:万台)关于年份的线性回归方程,且销售量的方差为,年份的方差为.求与间的样本相关系数,并据此判断该地区新能源汽车销售量与年份的线性相关性强弱.
附:(i)在线性回归方程中,;
(ii)样本相关系数,若,则可判断与线性相关性较强;
(iii),其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
24.年总台春晚无锡分会场《无锡景·家国情》节目的惊艳亮相,让无锡非遗大放异彩,火爆出圈.惠山泥人是无锡国家级非遗项目,“阿福”“阿喜”是它的代表作品.某文创工作室在春节后推出“惠山泥人非遗盲盒”系列,每个盲盒装有“阿福”“阿喜”“普通泥人”三种款式之一.随机抽取了名购买者,调查其性别与抽中“阿福”的情况,得到如下列联表:
抽中“阿福”
未抽中“阿福”
合计
男游客
女游客
合计
(1)依据小概率值的独立性检验,判断“抽中‘阿福’”与“游客性别”是否有关;
(2)若盲盒中是“阿福”“阿喜”“普通泥人”的比例为,某游客决定采用以下规则购买:若第一次抽中“阿福”或“阿喜”,则立即停止购买;若第一次抽中“普通泥人”,则继续购买第二个盲盒;此时:若第二次抽中“阿喜”,则停止购买,若第二次仍未抽中“阿喜”,则继续购买第三个盲盒,且无论结果如何都停止.记最终抽中“阿福”的个数为随机变量,求的分布列及数学期望.
附:,
25.某校高中学生课后每天整理数学错题(单位:道)和他们的数学成绩(单位:分)之间存在近似的线性关系,数据如下表:
整理错题道
数学成绩分
(1)试用最小二乘法求出关于的线性回归方程,并预测每天整理数学错题道时的数学成绩;
(2)基于上述数据整理,该校提倡学生课后进行数学错题整理,经过一段时间后,在本校学生中采用随机抽样的方法抽取了名学生,调查他们的数学成绩和整理数学错题的情况,统计数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
不是每天都整理数学错题人数
合计
试问:数学成绩总评优秀与每天都整理数学错题有关吗?
附:,;
,.
26.为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.
次数
年龄
每周次
每周次
每周次及以上
(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过次的称为体育锻炼频率低,不低于次的称为体育锻炼频率高,请完成以下列联表,并判断在犯错误概率不超过的前提下,能否认为体育锻炼频率的高低与年龄有关联;
青年
中年
合计
体育锻炼频率低
体育锻炼频率高
合计
(2)从每周体育锻炼次及以上的样本锻炼者中,按照表中年龄段采用分层随机抽样的方法抽取人,再从这人中随机抽取人,记这人中年龄在与的人数分别为、,记,求的分布列与期望.
参考公式:,.
附:
27.某高校拟与某网络平台合作组织学生参加与知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,在全体学生中抽取人调查,得到如下列联表:
活动 性别
男生
女生
合计
未报名参加答题活动
40
70
110
报名参加答题活动
60
30
90
合计
100
100
200
(1)根据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关联?
(2)网络答题规则:答题活动不限时间,不限轮次,答多少轮由选手自行确定:每轮均设置道试题,选手参与该轮答题,一旦答对一题,则其本轮答题结束,答错则继续答题,直到第道试题答完,本轮答题结束已知甲同学报名参加答题活动,假设甲每道试题回答是否正确相互独立,且每次答对的概率均为.
(i)当时,求甲同学在一轮答题过程中答题数量的数学期望;
(ii)假设甲同学每轮答题至少答对前两题中的一道,本轮答题得分,否则得分记甲答题累计得分为的概率为,求数列的通项公式.
附:,其中.
28.贵州“村超”以及江苏“苏超”的成功充分说明了足球是一项大众喜爱的运动.
(1)为了解喜爱足球运动是否与性别有关,现随机抽取了男性和女性各100名观众进行调查,得到列联表如下:
喜爱足球运动
不喜爱足球运动
合计
男性
60
40
100
女性
20
80
100
合计
80
120
200
依据小概率值的独立性检验,能否认为喜爱足球运动与性别有关?
(2)某足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时、传球者都等可能地将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第n次触球者是甲的概率记为,即.
①求,;
②证明:数列为等比数列,并判断第19次与第20次触球者是甲的概率的大小.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
附:,.
29.为了解学生对某项运动的喜欢情况,学校进行了一次抽样调查,得到如下数据:
男生
女生
合计
喜欢
65
35
100
不喜欢
50
50
100
合计
115
85
200
(1)能否有99%的把握认为是否喜欢该项运动与性别有关?
(2)若学校有甲,乙两队进行此项运动比赛,每场比赛采用“5局3胜制”(有一队先胜3局即获胜,比赛结束),甲队每局获胜的概率为().
①若比赛打满5局的概率为,求的最大值;
②若,在甲队赢得该场比赛的条件下,求比赛的局数的概率分布及数学期望.
附:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
30.2024年至2026年是我国“体重管理年”三年计划.为了解某区域市民参与减肥的情况,从该区域随机抽取了150人进行调查,其中参与减肥的人数是不参与减肥人数的2倍;50岁以上的人中,参与减肥的人数与不参与减肥的人数相等;50岁以下的人中,有30人不参与减肥.
(1)完成下表(单位:人),并依据的独立性检验,能否认为年龄与参与减肥有关联?
年龄
参与减肥
合计
否
是
50岁以上
50岁以下
合计
(2)假设用频率估计概率,从该区域所有市民中随机抽取10人,用表示这10人中恰有人参与减肥的概率,求为何值时,取得最大值.
附:,其中.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
31.某研究小组为了探究性别与商场购物意愿之间是否存在关联,随机调查200名市民,得到如下数据:
单位:人
性别
商场购物意愿
合计
喜欢在商场购物
不喜欢商场购物
男性
60
30
90
女性
90
20
110
合计
150
50
200
(1)根据小概率值的独立性检验,分析性别与商场购物意愿是否有关联.
(2)采用分层随机抽样,从调查中喜欢商场购物的市民抽取5人,再从这5人中随机抽取2人,求这2人中男性人数X的分布列和期望.
(3)某商场推出购物抽奖促销活动,抽奖是从一个装有1个红球、1个白球、4个黄球的不透明盒子中,依次有放回随机地摸取1个球.规则如下:每摸中1次红球,奖励10元购物券;当消费者摸中红球的个数比黄球个数多1时,抽奖结束,否则抽奖继续.记甲在n次摸球后抽奖结束且获奖30元购物券的概率为,求当取最大值时n的值.
附:,.
临界值表:
α
0.050
0.010
0.001
3.841
6.635
10.828
32.某医学研究团队经过研究发现某良性肿瘤与恶性肿瘤的一项医学指标有明显差异,利用该指标可制定一个检测标准,需要确定临界值,将该指标大于的人判定为患恶性肿瘤,小于或等于的人判定为患良性肿瘤.此检测标准的漏诊率是将恶性肿瘤判定为良性肿瘤的概率,记为;误诊率是将良性肿瘤判定为恶性肿瘤的概率,记为.
(1)若利用临界值进行判定时,随机抽取男女患者各200名进行检验,发现共有11名男性患者出现诊断问题(漏诊或误诊),请完成如下的列联表,并依据小概率值的独立性检验,推断出现诊断问题是否与性别有关?
出现诊断问题人数
未出现诊断问题人数
总计
男性人数
11
200
女性人数
总计
36
400
(2)经过大量调查,得到良性肿瘤和恶性肿瘤患者该指标的频率分布直方图如下:
假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.设函数,求的解析式,并解释取得最小值时临界值的实际意义.
附:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
2 / 11
学科网(北京)股份有限公司
$