内容正文:
第12讲 独立性检验
知识清单
知识点01:列联表
题型讲解
(举三反三)
题型1:完善列联表
题型2:列联表分析
题型3:独立性检验的概念及辨析
题型4:卡方的计算
题型5:独立性检验的基本思想
题型6:独立性检验解决实际问题
强化训练
一、单选题(8)
二、多选题(3)
三、填空题(3)
四、解答题(5)
知识点01列联表
列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
K2=(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“X与Y的关系”.
[易错提醒]
(1)独立性检验的关键是正确列出2×2列联表,并计算出K2的值.
(2)独立性检验是对两个变量有关系的可信程度的判断,而不是对它们是否有关系的判断.
题型1:完善列联表
【例1-1】2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏.核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为列联表.
高度辐射
轻微辐射
合计
身体健康
30
A
50
身体不健康
B
10
60
合计
C
D
E
则A,B,C,D的值依次为( )
A.20,80,30,50 B.20,50,80,30
C.20,50,80,110 D.20,80,110,50
【答案】B
【分析】根据2×2 列联表分别计算A,B,C,D即可.
【详解】
故选:B.
【例1-2】下面是列联表:
总计
总计
则________.
【答案】
【分析】根据列联表中的数据求得,进而求得.
【详解】,
所以.
故答案为:
【例1-3】(24-25高二下·江苏·课后作业)在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,试作出性别与色盲的列联表.
【答案】列联表见解析
【分析】求出每一类变量的两个不同取值的数据,列表即可.
【详解】根据题目所给的数据作出如下的列联表.
色盲
性别
患色盲
不患色盲
合计
男
38
442
480
女
6
514
520
合计
44
956
1000
【变式1-1】有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【答案】D
【分析】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【详解】依题意,解得,由解得.
补全列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D
【变式1-2】某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中 ________,________.
80分及80分以上
80分以下
合计
试验班
对照班
合计
【答案】
【分析】根据列联表求得.
【详解】依题意,,解得.
故答案为:;
【变式1-3】在一项有关医疗保健的社会调查中,发现调查的男性有530人,女性有670人,其中男性中喜欢吃甜食的有117人,女性中喜欢吃甜食的有492人,请作出性别与是否喜欢吃甜食的2×2列联表.
【答案】列联表见解析
【分析】根据题意列出联表即可.
【详解】2×2列联表如下:
喜欢吃甜食
不喜欢吃甜食
合计
男
117
413
530
女
492
178
670
合计
609
591
1 200
题型2:列联表分析
【例2-1】地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【分析】根据题意,得到如下两个列联表,再一一分析即可.
【详解】根据题意,得到如下两个列联表.
35岁以上
35岁及以下
总计
男性
女性
总计
35岁以上
35岁及以下
总计
男性
女性
总计
根据第1个列联表可知,样本中男性市民人数为,
女性市民人数为,又,即样本中男性比女性多,故A正确;
根据第2个列联表可知,样本中35岁以上女性市民人数为,
35岁及以下女性市民人数为,又,即样本中多数女性是35岁以上,故B正确;
由题意,,所以,故C不正确;
根据第2个列联表可知,样本中35岁以上市民人数为,
35岁及以下市民人数为,又,
即样本中35岁以上的市民比35岁及以下的多,故D正确.
故选:C.
【例2-2】博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
【答案】8
【分析】根据列联表的性质,求出a,b,d的值,即可得答案.
【详解】由列联表的性质,可得:,可得,
所以.
故答案为:8
【例2-3】某单位主管对50名员工进行了工作量的调查,了解男、女职工对工作量大小的看法是否存在差异,得到的数据如下:
性别
工作量
合计
认为工作量大
认为工作量小
男
18
9
27
女
8
15
23
合计
26
24
50
请判断认为工作量的大小与性别是否有关.
【答案】工作量的大小与性别有关系,男职工更加认为工作量大.
【分析】分别计算,,比较大小,若差距较大即可认为工作量的大小与性别有关系.
【详解】.
,
所以认为工作量的大小与性别有关系,男职工更加认为工作量大.
【变式2-1】假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】B
【分析】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.
【详解】对于A, ,
对于B,,
对于C,,
对于D,
显然B中最大,该组数据能说明x与y有关系的可能性最大,
故选:B.
【变式2-2】第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中,_______________.
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
【答案】
【分析】根据题意,利用志愿者的总人数为100,列出方程,即可求解.
【详解】根据表格中的数据,因为志愿者的总人数为100,所以,
解得.
故答案为:.
【变式2-3】为了研究高三年级学生的性别和身高是否大于170cm的问题,得到某中学高三年级学生的性别和身高的所有观测数据所对应的列联表如下:
单位:人
性别
身高
合计
低于170cm
不低于170cm
女
81
16
97
男
28
75
103
合计
109
91
200
(1)请画出列联表的等高堆积条形图,判断该中学高三年级学生的性别和身高是否有关联.如果结论是性别与身高有关联,请解释它们之间如何相互影响.
(2)身高变量是数值型变量还是分类变量?为什么?
【答案】(1)答案见解析;(1)数值型变量,原因见解析.
【分析】(1)根据题意作出列联表的等高堆积条形图,然后根据图形分析即可;
(2)根据数值型变量与分类变量的概念即可得出结果.
【详解】(1)女学生身高低于170cm,不低于170cm得频率分别为
,
男学生身高低于170cm,不低于170cm得频率分别为
,
则列联表的等高堆积条形图为
身高低于170cm 身高不低于170cm
女生 男生
通过比较发现,如果从女生男生中各随机选取一名学生,女生中身高低于170cm的概率大于男生中身高低于170cm的概率,故该中学高三年级学生的性别和身高有关联,
又,故女生中身高低于170cm的频率是男生中身高低于170cm的频率的3倍以上;
(2)身高变量是数值型变量,因为身高可以取不同的数值.
题型3:独立性检验的概念及辨析
【例3-1】下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病
D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大
【答案】D
【分析】根据独立性检验的意义分别判断各选项.
【详解】对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故错误;
对于B,独立性检验并不能确定两个变量相关,故错误;
对于C,是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;
对于D,根据卡方计算的定义可知该选项正确;
故选:D.
【例3-2】某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用2×2列联表进行独立性检验,经计算,则认为“学生性别与支持某项活动有关系”的犯错误的概率不超过( )
A.0.1% B.1%
C.99% D.99.9%
【答案】B
【分析】根据,即可判断结果.
【详解】,认为“学生性别与支持某项活动有关系”的犯错误的概率不超过1%.
故选:B
【例3-3】在2×2列联表中,两个比值与______相差越大,两个分类变量有关系的可能性越大.
【答案】
【分析】结合二联表特征,直接分析填写即可.
【详解】根据2×2列联表可知,比值与相差越大,则就越大,那么两个分类变量有关系的可能性就越大.
故答案为:
【变式3-1】为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,经计算,则所得到的统计学结论是认为性别与喜欢乡村音乐有关系的把握约为( )
附表:
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A. B.
C. D.
【答案】C
【分析】根据观测值,对照临界值表即可得出结论.
【详解】根据观测值,
所以在犯错误的概率不超过0.005的前提下认为喜欢乡村音乐与性别有关,
即有的把握认为喜欢乡村音乐与性别有关.
故选:C.
【变式3-2】利用独立性检验来考察两个分类变量和是否有关系时,通过查列联表计算得,那么认为与有关系,这个结论错误的可能性不超过( )
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.0.001 B.0.005 C.0.01 D.0.05
【答案】D
【分析】根据的观测值,与临界值表对照求解即可.
【详解】由,所以在犯错误的概率不超过0.05的前提下,认为与有关系.
故选:D.
【变式3-3】为了考察某种药物预防疾病的效果,进行动物试验后得到如下数据.经过计算得,根据临界值表,可以认为该种药物对预防疾病有效果的把握为______.
患病
未患病
合计
服用药
10
46
56
未服用药
22
32
54
合计
32
78
110
【答案】/0.99
【分析】根据卡方临界值表,结合题设的计算值,判断药物对预防疾病有效果的把握程度即可.
【详解】∵,
∴有的把握认为该种药物对预防疾病有效果.
故答案为:.
题型4:卡方的计算
【例4-1】(24-25高二下·江苏连云港·期末)为了鉴定新疫苗的效力,将60只小白鼠随机地分为两组,在其中一组接种疫苗后,两组都注射了病源菌,其结果如下面的列联表.根据此列联表中的数据可以求得________.
发病
未发病
合计
接种
3
27
30
未接种
17
13
30
合计
20
40
60
参考公式:,其中.
【答案】14.7
【分析】根据公式计算得解.
【详解】,
故答案为:14.7
【例4-2】(24-25高二·江苏·假期作业)为考查某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:
感染
未感染
注射
10
40
未注射
20
30
0.05
0.025
0.010
3.841
5.024
6.635
则在犯错误的概率最多不超过 __的前提下,可认为“注射疫苗”与“感染流感”有关系.
参考公式:.
【答案】0.05/
【分析】补充列联表,计算可得,即可得出答案.
【详解】补充列联表可得,
感染
未感染
合计
注射
10
40
50
未注册
20
30
50
合计
30
70
100
所以.
所以在犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染流感”有关系.
故答案为:0.05.
【例4-3】为了解学生参加公益劳动的情况,随机抽取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)等数据,并绘制成如图所示的频率分布直方图.
(1)求a;
(2)现认为大于10小时的公益劳动时间为长,小于10小时的公益劳动时间为短,填写下列2×2列联表,并判断是否有95%把握认为公益劳动时间与学生性别有关;
公益劳动时间长
公益劳动时间短
合计
男
100
女
120
合计
(3)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在,,三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参加公益劳动时间在内的学生人数为X,求X的分布列和期望.
附:,,.
【答案】(1)
(2)完整2×2列联表见解析,有95%把握认为公益劳动时间与学生性别有关
(3)X的分布列见解析,
【分析】(1)根据频率直方图中,所有小矩形面积之和为1进行求解即可;
(2)根据公益劳动时间的长短定义,结合频率直方图、卡方的计算公式进行求解即可;
(3)根据分层抽样比的公式,结合古典概型运算公式、数学期望的公式进行求解即可.
【详解】(1)因为在频率直方图中,所有小矩形面积之和为1,
所以有,
解得;
(2)由题意可知公益劳动时间长的学生人数为:,
因此公益劳动时间短的学生人数为,于是完整2×2列联表如下:
公益劳动时间长
公益劳动时间短
合计
男
100
180
280
女
100
120
220
合计
200
300
500
因为
所以有95%把握认为公益劳动时间与学生性别有关;
(3)由频率直方图可知,
在,,三组内的学生人数之比为,
采用分层抽样的方法抽取了10人,
这10人来自这组内的学生人数分别为,
于是有,
因此有,,,,
因此X的分布列如下:
0
1
2
3
因此.
【变式4-1】考察棉花种子是否经过处理跟得病之间的关系,得如表所示的数据:
种子处理
种子未处理
合计
得病
不得病
合计
根据以上数据得χ2的值是________(精确到).
【答案】
【分析】根据列联表提供数据计算出.
【详解】依题意
.
故答案为:
【变式4-2】下面是一个2×2列联表:
合计
21
合计
则________,________.(保留小数点后位)
【答案】
【分析】先补全列联表,然后计算的值.
【详解】补全列联表:
合计
21
合计
所以,
且.
故答案为:;
【变式4-3】民航招飞是指普通高校飞行技术专业(本科)通过高考招收飞行学生,报名的学生需参与预选初检、体检鉴定、飞行职业心理学检测、背景调查、高考选拔共5项流程,其中前4项流程选拔均通过,则被确认为有效招飞申请,然后参加高考,由招飞院校择优录取.据统计,某校高三在校学生有1000人,其中男生600人,女生400人,各有100名学生有民航招飞意向.
(1)完成以下列联表,并根据小概率值的独立性检验,能否认为该校高三学生是否有民航招飞意向与学生性别有关?
对民航招飞有意向
对民航招飞没有意向
合计
男生
女生
合计
(2)若每名报名学生通过前3项流程的概率依次为,假设学生能否通过每项流程相互独立,以这600名男生对民航招飞有意向的频率作为甲地高三男生对民航招飞有意向的概率,以这400名女生对民航招飞有意向的频率作为甲地高三女生对民航招飞有意向的概率.从甲地任选一名高三学生(男、女学生的比例为),求这名学生对民航招飞有意向且通过前3项流程的概率.
附:.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)表格见解析,有关
(2)
【分析】(1)根据题意中的数据分析,完成列联表,利用卡方的计算公式求出,结合独立性检验的思想即可下结论;
(2)先求出通过前3项流程的概率,再分别求出男、女生对招飞有意向的概率,结合全概率公式计算即可求解.
【详解】(1)高三在校学生有1000人,其中男生600人,女生400人,各有100名学生有民航招飞意向.
所以高三男生对招飞有意向的有100人,没有意向的有500人,
高三女生对招飞有意向的有100人,没有意向的有300人,
则列联表如下:
对民航招飞有意向
对民航招飞没有意向
合计
男生
100
500
600
女生
100
300
400
合计
200
800
1000
零假设为:该校高三学生是否有民航招飞意向与学生性别无关联,
因为,
所以根据小概率值的独立性检验,推断不成立,
即认为该校高三学生是否有民航招飞意向与学生性别有关;
(2)因为每名报名学生通过前3项流程的概率依次为,
所以每名报名学生通过前3项流程的概率为,
依题意得甲地高三男生对招飞有意向的概率为,
甲地高三女生对招飞有意向的概率为,
由全概率公式得所求概率为.
题型5:独立性检验的基本思想
【例5-1】(24-25高二·江苏·假期作业)某医疗研究机构为了解打鼾与患心脏病的关系,运用列联表进行独立性检验,经计算,则所得到的统计学结论是认为打鼾与患心脏病有关系的把握约为( )
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A. B. C. D.
【答案】B
【分析】根据的值与临界值比较即可得出结论.
【详解】因为,
所以有的把握认为打鼾与患心脏病有关系.
故选:B.
【例5-2】根据分类变量Ⅰ与Ⅱ的统计数据,计算得到,则( )
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.变量Ⅰ与Ⅱ相关
B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.05
C.变量Ⅰ与Ⅱ不相关
D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.05
【答案】B
【分析】根据题意可知:,根据独立性检验思想分析判断.
【详解】由题意可知:,
根据独立性检验思想可知:变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.05.
故选:B.
【例5-3】为了考查某流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:
疫苗使
用情况
感染情况
感染
未感染
总计
注射
10
40
50
未注射
20
30
50
总计
30
70
100
参照附表,在犯错误的概率最多不超过________的前提下,可认为“注射疫苗”与“感染某流感”有关系.
参考公式:.
【答案】0.05
【分析】根据给定的数表,求出的观测值,再与临界值表比对作答.
【详解】由列联表中数据,计算得,
所以在犯错误的概率最多不超过0.05的前提下,认为“注射疫苗”与“感染某流感”有关系.
故答案为:0.05
【变式5-1】假设有两个分类变量与,它们的可能取值分别为和,其列联表为:则当取下面何值时,与的关系最弱( )
10
18
26
A.8 B.9 C.14 D.19
【答案】C
【分析】利用分类变量的相关性进行计算求解.
【详解】在两个分类变量的列联表中,当的值越小时,认为两个分类变量有关的可能性越小.
令,得,解得,
所以当时,与的关系最弱,故A,B,D均不符合题意.
故选:C.
【变式5-2】假设有两个分类变量与,它们的可能取值分别为和,其列联表为:
10
18
26
则当取下面何值时,与的关系最弱( )
A.8 B.9
C.14 D.19
【答案】C
【分析】利用分类变量的相关性进行计算求解.
【详解】在两个分类变量的列联表中,当的值越小时,认为两个分类变量有关的可能性越小.
令,得,解得,
所以当时,与的关系最弱,故A,B,D错误.
故选:C.
【变式5-3】幸福感是个体的一种主观情感体验,生活中的多种因素都会影响人的幸福感受.为研究男生与女生的幸福感是否有差异,一位老师在某大学进行了随机抽样调查,得到如下数据:
幸福
不幸福
总计
男生
638
128
766
女生
372
46
418
总计
1010
174
1184
由此计算得到,已知,.
根据小概率值的独立性检验,________(填“可以”或“不能”)认为男生与女生的幸福感有差异;根据小概率值的独立性检验,________(填“可以”或“不能”)认为男生与女生的幸福感有差异.
【答案】 可以 不能
【分析】根据假设性检验中的值对比小概率值进行判断即可.
【详解】由于,则根据小概率值的独立性检验,可以认为男生与女生的幸福感有差异
由于,根据小概率值的独立性检验,不能认为男生与女生的幸福感有差异.
故答案为:可以;不能.
题型6:独立性检验解决实际问题
【例6-1】(24-25高二下·江苏徐州·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有_____人.
0.100
0.050
0.010
2.706
3.841
6.635
附:
【答案】45(大于等于45的5的整数倍都符合题意)
【分析】根据已知条件写出列联表,计算符合条件的结果.
【详解】设调查了位男生,已知被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,
根据题意列出表格
男生
女生
总计
喜欢抖音
不喜欢抖音
总计
则,
解得,因为男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,所以男生人数是5的倍数,所以男生人数.
故答案为:45.(大于等于45的整倍数都符合题意)
【例6-2】(24-25高二下·江苏南通·期末)为了解高中生的体育成绩(优秀与非优秀)和性别是否有关,对某高中在校学生进行了抽样调查,调查结果如下表所示:
优秀
非优秀
合计
男
s
30
50
女
5
t
50
合计
25
75
100
(1)求的值;
(2)依据小概率值的独立性检验,能否认为体育成绩与性别有关?
附:,其中.
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)
(2)成绩与性别有关
【分析】(1)根据表格数据分别求出,即可得解;
(2)利用表格数据求出,与临界值比较即可判断结论.
【详解】(1)由表格数据可知,,
所以.
(2)提出零假设:成绩与性别无关.
根据列联表中的数据可以求得
.
根据小概率值的独立性检验,我们推断不成立,即认为成绩与性别有关.
【例6-3】(24-25高二下·江苏扬州·期末)为了解某小区居民的周末休闲方式是否与性别有关,随机抽取了该小区居民100 人进行了调查,其中女性60人,男性40人,女性中有40人休闲方式是看电视,另外20人休闲方式是运动;男性中有10人休闲方式是看电视,另外30人休闲方式是运动.
(1)根据以上数据将如下2×2列联表补充完整;
合计
40
合计
(2)请根据小概率值的独立性检验,判断休闲方式与性别是否有关.
附:,
【答案】(1)列联表见解析
(2)答案见解析
【分析】(1)根据题意,完善列联表;
(2)计算卡方值并与犯错概率0.001对应的临界值比较,即可得出结论.
【详解】(1)
看电视
运动
合计
男性
10
30
40
女性
40
20
60
合计
50
50
100
(2)提出零假设:该小区居民的周末休闲方式和性别无关,
根据列联表中的数据,可得:
,
根据小概率值的独立性检验,我们推断不成立,
即认为该小区居民的周末休闲方式和性别有关,此推断犯错误的概率不大于.
【变式6-1】某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中,且,若有的把握可以认为性别与对工作的满意程度具有相关性,则的值是______.
对工作满意
对工作不满意
男
女
附:,其中.
【答案】5
【分析】根据独立性检验思想,利用可解.
【详解】根据独立性检验思想可得,
,
得,
因为且,所以;
故答案为:5.
【变式6-2】(24-25高二下·江苏泰州·期末)某中学对50名学生的学习兴趣和主动预习情况进行了长期的调查,得到的统计数据如下表所示.
主动预习
不太主动预习
合计
学习兴趣高
18
学习兴趣一般
19
合计
24
50
(1)补全该表;
(2)试运用独立性检验的思想方法判断:是否有以上的把握认为,学生的学习兴趣与主动预习有关.
附:独立性检验临界值表
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中).
【答案】(1)答案见解析
(2)有以上的把握认为学生的学习兴趣与主动预习有关
【分析】(1)根据列联表性质计算即可补全;
(2)计算的值,由此作出判断.
【详解】(1)
主动预习
不太主动预习
合 计
学习兴趣高
18
7
25
学习兴趣一般
6
19
25
合计
24
26
50
(2),
所以有以上的把握认为学生的学习兴趣与主动预习有关.
【变式6-3】(24-25高二下·江苏·期末)随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析社区的市民是否喜欢网上买菜与年龄是否有关;
(2)社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜,如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选择平台买菜,那么周二选择平台买菜的概率为,求小张周二选择平台买菜的概率.
参考公式及数据:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关
(2)
【分析】(1)利用给出公式计算,得大于,即可认为有关;
(2)利用全概率公式计算.
【详解】(1)零假设:是否喜欢网上买菜与年龄无关(即独立).
,
因此拒绝,认为两者相关.
(2)
.
一、单选题
1.在2×2列联表中,若每个数据变为原来的2倍,则的值变为原来的倍数为( )
A.8倍 B.4倍
C.2倍 D.不变
【答案】C
【分析】根据公式分析判断即可
【详解】由公式中所有值变为原来的2倍,
得
故也变为原来的2倍.
故选:C.
2.如果有95%的把握判断事件A与B有关系,那么具体计算出的数据( )
A. B.
C. D.
【答案】A
【分析】结合临界值表,将的值与临界值比较,从而可确定A与B有关的可信程度,由此可得答案.
【详解】结合临界值表可知当时,有99%的把握认为A与B有关系.
当时,有95%的把握认为A与B有关系,
故选:A.
3.在对某小学的学生进行吃零食的调查中,得到如表数据:
吃零食
不吃零食
合计
男学生
27
34
61
女学生
12
29
41
合计
39
63
102
根据上述数据分析,我们得出的χ2约为( )
A.2.072 B.2.334
C.3.957 D.4.514
【答案】B
【分析】根据独立性检验中的卡方公式计算即可.
【详解】由公式得.
故选:B
4.在某次独立性检验中,得到如下列联表:
合计
30
90
120
24
合计
54
最后发现,两个分类变量和没有任何关系,则的值可能是( )
A.72 B.30
C.24 D.20
【答案】A
【分析】根据已知条件,结合独立性检验公式即可求解.
【详解】因为两个分类变量和没有任何关系,
所以,则,解得,
验证可知满足题意.
故选:A
5.某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.没有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
【答案】A
【分析】根据所给数据完善列联表,计算出卡方,即可判断.
【详解】依题意可得列联表如下:
男生
女生
合计
篮球迷
30
15
45
非篮球迷
45
10
55
合计
75
25
100
所以,
所以在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关,
又,所以没有的把握认为是否是篮球迷与性别有关.
故选:A
6.在吸烟与患肺癌是否相关的研究中,下列说法正确的是( )
A.若,我们有99%的把握认为吸烟与患肺癌有关,则在100个吸烟的人中必有99个人患肺癌
B.由独立性检验可知,当有99%的把握认为吸烟与患肺癌有关时,若某人吸烟,则他有99%的可能患有肺癌
C.通过计算得到,是指有95%的把握认为吸烟与患肺癌有关系
D.以上三种说法都不正确
【答案】C
【分析】根据独立性检验的思想即可求解.
【详解】若,我们有99%的把握认为吸烟与患肺癌有关,而不是在100个吸烟的人中必有99个人患肺癌,故A不正确;
99%是指吸烟与患肺癌有关的概率,而不是吸烟的人有99%的可能患有肺癌,故B不正确,C正确,D不正确.
故选:C
7.某校团委对“喜欢吃水果和学生性别是否有关”进行了一次调查,其中被调查的女生人数是男生人数的,男生喜欢吃水果的人数占被调查的男生人数的,女生喜欢吃水果的人数占被调查的女生人数的,若有99%的把握认为喜欢吃水果和学生性别有关,则被调查的男生至少有( )
0.10
0.05
0.010
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
A.12人 B.18人
C.24人 D.30人
【答案】B
【分析】设被调查的男生人数为x,根据题意可得列联表,进而可得,运算求解即可.
【详解】设被调查的男生人数为x,被调查的女生人数为,则得到2×2列联表如下:
喜欢吃水果情况
总计
喜欢
不喜欢
学生
性别
男生
女生
总计
则,解得,
又因为男、女人数为整数,所以被调查的男生至少有18人.
故选:B.
8.(24-25高二下·江苏连云港·月考)为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.01的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.59 B.60
C.61 D.62
【答案】D
【分析】根据题意列出2×2列联表,即可由卡方公式求解即可.
【详解】设没接种只数为k,依题意,得2×2列联表如下:
发病
没发病
合计
接种
2k
没接种
k
合计
3k
则的观测值为:,
因为本次调查得出“在犯错误的概率不超过0.01的前提下认为接种该疫苗与预防某X疾病有关,
于是,即,即,
∴,∴.
故选:D.
二、多选题
9.(24-25高二上·江苏常州·期末)为了探究某次数学测试中成绩达到优秀等级是否与性别存在关联,小华进行了深入的调查,并绘制了下侧所示的列联表(个别数据暂用字母表示):
数学成绩
性别
合计
男
女
优秀
27
70
非优秀
58
110
合计
180
经计算得:,参照下表:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
则下列选项正确的为( )
A.
B.
C.可以在犯错误的概率不超过5%的前提下认为“数学达到优秀等级与性别有关”
D.没有充分的证据显示“数学达到优秀等级与性别有关”
【答案】ABD
【分析】利用列联表中数据计算判断AB;结合的观测值及临界值表判断CD.
【详解】对于AB,由列联表知,,AB正确;
对于CD,由知,C错误,D正确.
故选:ABD.
10.(2024高二下·江苏·专题练习)为考察某种药物预防疾病的效果,进行动物试验,得到如下药物效果与动物试验列联表:
患病
未患病
合计
服用药
10
45
55
没服用药
20
30
50
合计
30
75
105
由上述数据给出下列结论,其中正确的是( )
附:;
0.05
0.025
0.010
0.005
3.841
5.024
6.635
7.879
A.能在犯错误的概率不超过0.05的前提下认为药物有效
B.不能在犯错误的概率不超过0.025的前提下认为药物有效
C.能在犯错误的概率不超过0.010的前提下认为药物有效
D.不能在犯错误的概率不超过0.005的前提下认为药物有效
【答案】AD
【分析】根据题意计算出的值,逐项分析即可.
【详解】根据列联表,计算,
所以能在犯错误的概率不超过0.05的前提下认为药物有效,A正确;
能在犯错误的概率不超过0.025的前提下认为药物有效,B错误;
不能在犯错误的概率不超过0.010的前提下认为药物有效,C错误;
不能在犯错误的概率不超过0.005的前提下认为药物有效,D正确,
故选:AD.
11.(24-25高二上·江苏常州·期末)下列关于回归分析与独立性检验的说法正确的有( )
A.回归直线就是散点图中经过样本数据点最多的那条直线
B.相关变量的线性回归方程为,若样本点中心为,则
C.在独立性检验中,随机变量的观测值越小,“认为两个变量有关”这种判断犯错误的概率越大
D.以拟合一组数据时,经代换后的线性回归方程为,则
【答案】BCD
【分析】根据回归直线的概念可得选项A错误;根据回归直线经过样本点中心可得选项B正确;根据独立性检验思想可得选项C正确;利用变形可得选项D正确.
【详解】A.回归直线可能不过散点图中的任何一点,选项A错误.
B.根据回归直线经过样本点中心得,,解得,选项B正确.
C.根据独立性检验思想,随机变量的观测值越小,
“认为两个变量无关”这种判断正确的概率越大,
即“认为两个变量有关”这种判断犯错误的概率越大,选项C正确.
D.由得,,
∴,即,
∴,选项D正确.
故选:BCD.
三、填空题
12.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:
患慢性气管炎
未患慢性气管炎
合计
吸烟
20
m
40
不吸烟
n
55
60
合计
25
75
100
根据列联表数据,求得χ2=________(保留3位有效数字),根据下表,有________的把握认为患慢性气管炎与吸烟有关.
附:
P(χ2≥x0)
0.050
0.010
0.001
x0
3.841
6.635
10.828
χ2=.
【答案】 22.2 99.9%
【分析】根据题中所给的公式进行运算判断即可.
【详解】由20+m=40,得m=20.
由20+n=25,得n=5. 故χ2=≈22.2>10.828.
所以有99.9%的把握认为患慢性气管炎与吸烟有关.
故答案为:22.2;99.9%
13.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:
电离辐
射剂量
存活情况
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
由表中数据算得:χ2=________,说明两种电离辐射剂量对小白鼠的致死作用________.(填“相同”或“不相同”)
【答案】 5.333 不相同
【分析】根据给定的数表,求出的观测值,再与临界值表比对作答.
【详解】由列联表中数据,计算得,
所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关,
即两种电离辐射剂量对小白鼠的致死作用不相同.
故答案为:5.333;不相同
14.若两个分类变量X与Y的2×2列联表为:
y1
y2
合计
x1
10
15
25
x2
40
16
56
合计
50
31
81
则有________的把握认为“X与Y之间有关系”.
附:
0.050
0.010
0.001
3.841
6.635
10.828
【答案】
【分析】由已知数据求得,对照临界值表下结论.
【详解】由列联表数据,可求得,
所以有的把握认为“x与y之间有关系.
故答案为:
四、解答题
15.(24-25高二下·江苏宿迁·期末)某景区为测试并推广一款预约游览APP,上线的第1、2两天在APP上预约可获得费游览资格,第3天开始恢复为原票价,下表是该景区在该APP上前7天的预约情况
第t天
1
2
3
4
5
6
7
预约量y(万张)
9.03
9
8.58
8.7
8.76
8.74
8.79
经计算得:,,.
(1)由于前两天预约游览免费,所以剔除第1、2两天数据,求y关于t的线性回归方程及第5天的残差:
(2)为了调查该APP在不同年龄的人群中的推广情况,从第7天成人游客中随机抽取200人进行分析,所得的部分数据见下表:
50岁以下
50岁(含50)以上
合计
通过APP预约人数
70
其它方式购票人数
80
合计
100
①完成以上2×2列联表:
②如果有95%的把握认定游客通过APP预约游览与其年龄有关,就要进行针对性宣传,请你判断是否需要针对年龄超过50岁(含50)以上的人群进行宣传.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:,,
【答案】(1),残差为0.046
(2)①列联表见解析;②需要针对年龄超过50岁(含50)以上的人群进行宣传,理由见解析
【分析】(1)计算出剔除第1、2两天数据后的相关量,代入公式计算出线性回归方程,并计算出第5天的残差;
(2)完善列联表,代入公式,计算出卡方,与3.841比较后得到结论.
【详解】(1)剔除掉第1、2两天数据后,,
,,
,
故,
,
故y关于t的线性回归方程为,
第5天的残差为;
(2)①列联表如下:
50岁以下
50岁(含50)以上
合计
通过APP预约人数
70
50
120
其它方式购票人数
30
50
80
合计
100
100
200
②需要针对年龄超过50岁(含50)以上的人群进行宣传,理由如下:
零假设认定游客通过APP预约游览与其年龄无关,
则,
根据小概率事件原理,可知零假设不成立,故认定游客通过APP预约游览与其年龄有关,
需要针对年龄超过50岁(含50)以上的人群进行宣传.
16.(25-26高二上·江苏常州·期末)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解乡村居民对新能源汽车的接受程度,某乡村汽车协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取80名村民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了以下统计数据:
选择新能源汽车
选择传统汽车
总计
40岁以下
56
80
40岁及以上
36
80
总计
160
完成列联表,并判断是否有的把握认为选择新能源汽车与年龄有关;
(2)为了了解某一地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量(单位:万台)关于年份的线性回归方程,且销售量的方差为,年份的方差为.求与间的样本相关系数,并据此判断该地区新能源汽车销售量与年份的线性相关性强弱.
附:(i)在线性回归方程中,;
(ii)样本相关系数,若,则可判断与线性相关性较强;
(iii),其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)表格见解析,没有的把握认为选择新能源汽车与年龄有关;
(2)0.84,与线性相关性较强.
【分析】(1)根据题中数据补全列联表即可:再由表中数据以及公式进行计算求解即可;
(2)根据样本相关系数公式计算可得答案.
【详解】(1)补全列联表如下:
选择新能源汽车
选择传统汽车
总计
40岁以下
56
24
80
40岁及以上
44
36
80
总计
100
60
160
提出零假设为:选择新能源汽车与年龄无关.
则,
故认为选择新能源汽车与年龄无关;
(2)因为,
所以,又,
所以,故与线性相关性较强.
17.(24-25高二下·江苏·期末)为调查学生喜欢在食堂就餐是否和性别有关,学校随机调研了男女生各100人,经统计得到如下列联表:
男
女
喜欢
80
40
不喜欢
20
60
(1)依据的独立性检验,判断学生喜欢在食堂就餐是否与性别有关?
(2)为听取学生对食堂的建议,从学生中抽取9人召开座谈会,并给其中3名同学赠送礼品,每人1份(其余人员仅赠送餐券).已知参加座谈会的学生中有且只有4名学生来自高一,求高一这4名学生中得到礼品的人数的分布列和数学期望.
0.010
0.005
0.001
6.635
7.879
10.828
附:,其中
【答案】(1)有的把握认为喜欢食堂就餐与性别有关.
(2)分布列见解析,数学期望为.
【分析】(1)由卡方的计算可判断;
(2)列出的可能取值,由古典概型和组合数计算相应的概率,列出分布列,计算期望可得.
【详解】(1)提出假设:喜欢食堂就餐与性别无关.
,
所以有的把握认为喜欢食堂就餐与性别有关.
(2)高一4名学生中得到礼品的人数的可能取值为,,,,
,,,,
所以的分布列为:
0
1
2
3
所以.
18.(24-25高二下·江苏徐州·期末)为了解学生对某项运动的喜欢情况,学校进行了一次抽样调查,得到如下数据:
男生
女生
合计
喜欢
65
35
100
不喜欢
50
50
100
合计
115
85
200
(1)能否有99%的把握认为是否喜欢该项运动与性别有关?
(2)若学校有甲,乙两队进行此项运动比赛,每场比赛采用“5局3胜制”(有一队先胜3局即获胜,比赛结束),甲队每局获胜的概率为().
①若比赛打满5局的概率为,求的最大值;
②若,在甲队赢得该场比赛的条件下,求比赛的局数的概率分布及数学期望.
附:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
【答案】(1)没有99%的把握认为是否喜欢该项运动与性别有关
(2)①;②分布列见解析,
【分析】(1)计算卡方,进行独立性检验即可;
(2)①求得,结合基本不等式即可得解;②,计算出对应的概率可得分布列,进一步根据期望公式计算期望即可.
【详解】(1)提出假设:学生对该项运动的喜欢情况与性别无关,
根据列联表中的数据,得,
所以没有99%的把握认为是否喜欢该项运动与性别有关.
(2)①比赛打满5局的概率.
因为,
当且仅当,即时,取得最大值.
②设甲队赢得该场比赛为事件,该场比赛结束时,进行了局为事件(),
且,,
,
则.
在甲队赢得该场比赛的条件下,比赛的局数为(),
则,
,
所以的分布列为
3
4
5
.
19.某学校有甲、乙、丙三家餐厅,分布在生活区的南北两个区域,其中甲、乙餐厅在南区,丙餐厅在北区,各餐厅菜品丰富多样,可以满足学生的不同口味和需求.
性别
就餐区域
合计
南区
北区
男
女
合计
(1)现在对学生性别与在南北两个区域就餐的相关性进行分析,得到下表所示的抽样数据,依据的独立性检验,能否认为在不同区域就餐与学生性别有关联?
(2)张同学选择餐厅就餐时,如果前一天在甲餐厅,那么后一天去甲,乙餐厅的概率均为;如果前一天在乙餐厅,那么后一天去甲,丙餐厅的概率分别为;如果前一天在丙餐厅,那么后一天去甲,乙餐厅的概率均为.张同学第1天就餐时选择甲,乙,丙餐厅的概率分别为.
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
(i)求第2天他去乙餐厅用餐的概率;
(ii)求第天他去甲餐厅用餐的概率.
附:;
【答案】(1)没有关联;
(2)(i);(ii).
【分析】(1)根据卡方的公式代入计算,与临界值比较,即可求解;
(2)(ⅰ)根据相互独立事件的概率,结合全概率公式即可求解;(ⅱ)根据递推关系,结合等比数列的定义即可求解.
【详解】(1)零假设:在不同区域就餐与学生性别没有关联,
根据表中的数据可得,,
依据的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为在不同区域就餐与学生性别没有关联.
(2)设“第天去甲餐厅用餐”, “第天去乙餐厅用餐”,“第天去丙餐厅用餐”,
则两两独立,,
依题意,,,,
,,,,,
(i)由,结合全概率公式可得,
,
所以张同学第2天去乙餐厅用餐的概率为.
(ii)记第天他去甲,乙,丙餐厅用餐的概率分别为,则,
由全概率公式可得
故①,同理可得②,
③,④,
由①②得,由④可得,
代入②中可得,即,且,
因此数列是首项为,公比为的等比数列,
则,,
于是,当时,,
综上所述,.
【点睛】关键点点睛:本题主要考查了独立性检验问题以及相互独立事件概率与数列结合问题,难度较大,解答本题的关键在于结合递推关系与等比数列的定义求解.
1
学科网(北京)股份有限公司
$
第12讲 独立性检验
知识清单
知识点01:列联表
题型讲解
(举三反三)
题型1:完善列联表
题型2:列联表分析
题型3:独立性检验的概念及辨析
题型4:卡方的计算
题型5:独立性检验的基本思想
题型6:独立性检验解决实际问题
强化训练
一、单选题(8)
二、多选题(3)
三、填空题(3)
四、解答题(5)
知识点01列联表
列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
K2=(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“X与Y的关系”.
[易错提醒]
(1)独立性检验的关键是正确列出2×2列联表,并计算出K2的值.
(2)独立性检验是对两个变量有关系的可信程度的判断,而不是对它们是否有关系的判断.
题型1:完善列联表
【例1-1】日本发生了9.0级地震,地震引发了海啸及核泄漏.核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为列联表.
高度辐射
轻微辐射
合计
身体健康
30
A
50
身体不健康
B
10
60
合计
C
D
E
则A,B,C,D的值依次为( )
A.20,80,30,50 B.20,50,80,30
C.20,50,80,110 D.20,80,110,50
【例1-2】下面是列联表:
总计
总计
则________.
【例1-3】(24-25高二下·江苏·课后作业)在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,试作出性别与色盲的列联表.
【变式1-1】有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【变式1-2】某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中 ________,________.
80分及80分以上
80分以下
合计
试验班
对照班
合计
【变式1-3】在一项有关医疗保健的社会调查中,发现调查的男性有530人,女性有670人,其中男性中喜欢吃甜食的有117人,女性中喜欢吃甜食的有492人,请作出性别与是否喜欢吃甜食的2×2列联表.
题型2:列联表分析
【例2-1】地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【例2-2】博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
【例2-3】某单位主管对50名员工进行了工作量的调查,了解男、女职工对工作量大小的看法是否存在差异,得到的数据如下:
性别
工作量
合计
认为工作量大
认为工作量小
男
18
9
27
女
8
15
23
合计
26
24
50
请判断认为工作量的大小与性别是否有关.
【变式2-1】假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【变式2-2】第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中,_______________.
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
【变式2-3】为了研究高三年级学生的性别和身高是否大于170cm的问题,得到某中学高三年级学生的性别和身高的所有观测数据所对应的列联表如下:
单位:人
性别
身高
合计
低于170cm
不低于170cm
女
81
16
97
男
28
75
103
合计
109
91
200
(1)请画出列联表的等高堆积条形图,判断该中学高三年级学生的性别和身高是否有关联.如果结论是性别与身高有关联,请解释它们之间如何相互影响.
(2)身高变量是数值型变量还是分类变量?为什么?
题型3:独立性检验的概念及辨析
【例3-1】下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病
D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大
【例3-2】某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用2×2列联表进行独立性检验,经计算,则认为“学生性别与支持某项活动有关系”的犯错误的概率不超过( )
A.0.1% B.1%
C.99% D.99.9%
【例3-3】在2×2列联表中,两个比值与______相差越大,两个分类变量有关系的可能性越大.
【变式3-1】为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,经计算,则所得到的统计学结论是认为性别与喜欢乡村音乐有关系的把握约为( )
附表:
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A. B.
C. D.
【变式3-2】利用独立性检验来考察两个分类变量和是否有关系时,通过查列联表计算得,那么认为与有关系,这个结论错误的可能性不超过( )
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.0.001 B.0.005 C.0.01 D.0.05
【变式3-3】为了考察某种药物预防疾病的效果,进行动物试验后得到如下数据.经过计算得,根据临界值表,可以认为该种药物对预防疾病有效果的把握为______.
患病
未患病
合计
服用药
10
46
56
未服用药
22
32
54
合计
32
78
110
题型4:卡方的计算
【例4-1】(24-25高二下·江苏连云港·期末)为了鉴定新疫苗的效力,将60只小白鼠随机地分为两组,在其中一组接种疫苗后,两组都注射了病源菌,其结果如下面的列联表.根据此列联表中的数据可以求得________.
发病
未发病
合计
接种
3
27
30
未接种
17
13
30
合计
20
40
60
参考公式:,其中.
【例4-2】(24-25高二·江苏·假期作业)为考查某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:
感染
未感染
注射
10
40
未注射
20
30
0.05
0.025
0.010
3.841
5.024
6.635
则在犯错误的概率最多不超过 __的前提下,可认为“注射疫苗”与“感染流感”有关系.
参考公式:.
【例4-3】为了解学生参加公益劳动的情况,随机抽取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)等数据,并绘制成如图所示的频率分布直方图.
(1)求a;
(2)现认为大于10小时的公益劳动时间为长,小于10小时的公益劳动时间为短,填写下列2×2列联表,并判断是否有95%把握认为公益劳动时间与学生性别有关;
公益劳动时间长
公益劳动时间短
合计
男
100
女
120
合计
(3)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在,,三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参加公益劳动时间在内的学生人数为X,求X的分布列和期望.
附:,,.
【变式4-1】考察棉花种子是否经过处理跟得病之间的关系,得如表所示的数据:
种子处理
种子未处理
合计
得病
不得病
合计
根据以上数据得χ2的值是________(精确到).
【变式4-2】下面是一个2×2列联表:
合计
21
合计
则________,________.(保留小数点后位)
【变式4-3】民航招飞是指普通高校飞行技术专业(本科)通过高考招收飞行学生,报名的学生需参与预选初检、体检鉴定、飞行职业心理学检测、背景调查、高考选拔共5项流程,其中前4项流程选拔均通过,则被确认为有效招飞申请,然后参加高考,由招飞院校择优录取.据统计,某校高三在校学生有1000人,其中男生600人,女生400人,各有100名学生有民航招飞意向.
(1)完成以下列联表,并根据小概率值的独立性检验,能否认为该校高三学生是否有民航招飞意向与学生性别有关?
对民航招飞有意向
对民航招飞没有意向
合计
男生
女生
合计
(2)若每名报名学生通过前3项流程的概率依次为,假设学生能否通过每项流程相互独立,以这600名男生对民航招飞有意向的频率作为甲地高三男生对民航招飞有意向的概率,以这400名女生对民航招飞有意向的频率作为甲地高三女生对民航招飞有意向的概率.从甲地任选一名高三学生(男、女学生的比例为),求这名学生对民航招飞有意向且通过前3项流程的概率.
附:.
0.05
0.01
0.001
3.841
6.635
10.828
题型5:独立性检验的基本思想
【例5-1】(24-25高二·江苏·假期作业)某医疗研究机构为了解打鼾与患心脏病的关系,运用列联表进行独立性检验,经计算,则所得到的统计学结论是认为打鼾与患心脏病有关系的把握约为( )
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A. B. C. D.
【例5-2】根据分类变量Ⅰ与Ⅱ的统计数据,计算得到,则( )
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.变量Ⅰ与Ⅱ相关
B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.05
C.变量Ⅰ与Ⅱ不相关
D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.05
【例5-3】为了考查某流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:
疫苗使
用情况
感染情况
感染
未感染
总计
注射
10
40
50
未注射
20
30
50
总计
30
70
100
参照附表,在犯错误的概率最多不超过________的前提下,可认为“注射疫苗”与“感染某流感”有关系.
参考公式:.
【变式5-1】假设有两个分类变量与,它们的可能取值分别为和,其列联表为:则当取下面何值时,与的关系最弱( )
10
18
26
A.8 B.9 C.14 D.19
【变式5-2】假设有两个分类变量与,它们的可能取值分别为和,其列联表为:
10
18
26
则当取下面何值时,与的关系最弱( )
A.8 B.9
C.14 D.19
【变式5-3】幸福感是个体的一种主观情感体验,生活中的多种因素都会影响人的幸福感受.为研究男生与女生的幸福感是否有差异,一位老师在某大学进行了随机抽样调查,得到如下数据:
幸福
不幸福
总计
男生
638
128
766
女生
372
46
418
总计
1010
174
1184
由此计算得到,已知,.
根据小概率值的独立性检验,________(填“可以”或“不能”)认为男生与女生的幸福感有差异;根据小概率值的独立性检验,________(填“可以”或“不能”)认为男生与女生的幸福感有差异.
题型6:独立性检验解决实际问题
【例6-1】(24-25高二下·江苏徐州·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有_____人.
0.100
0.050
0.010
2.706
3.841
6.635
附:
【例6-2】(24-25高二下·江苏南通·期末)为了解高中生的体育成绩(优秀与非优秀)和性别是否有关,对某高中在校学生进行了抽样调查,调查结果如下表所示:
优秀
非优秀
合计
男
s
30
50
女
5
t
50
合计
25
75
100
(1)求的值;
(2)依据小概率值的独立性检验,能否认为体育成绩与性别有关?
附:,其中.
0.050
0.010
0.001
k
3.841
6.635
10.828
【例6-3】(24-25高二下·江苏扬州·期末)为了解某小区居民的周末休闲方式是否与性别有关,随机抽取了该小区居民100 人进行了调查,其中女性60人,男性40人,女性中有40人休闲方式是看电视,另外20人休闲方式是运动;男性中有10人休闲方式是看电视,另外30人休闲方式是运动.
(1)根据以上数据将如下2×2列联表补充完整;
合计
40
合计
(2)请根据小概率值的独立性检验,判断休闲方式与性别是否有关.
附:,
【变式6-1】某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中,且,若有的把握可以认为性别与对工作的满意程度具有相关性,则的值是______.
对工作满意
对工作不满意
男
女
附:,其中.
【变式6-2】(24-25高二下·江苏泰州·期末)某中学对50名学生的学习兴趣和主动预习情况进行了长期的调查,得到的统计数据如下表所示.
主动预习
不太主动预习
合计
学习兴趣高
18
学习兴趣一般
19
合计
24
50
(1)补全该表;
(2)试运用独立性检验的思想方法判断:是否有以上的把握认为,学生的学习兴趣与主动预习有关.
附:独立性检验临界值表
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中).
【变式6-3】(24-25高二下·江苏·期末)随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析社区的市民是否喜欢网上买菜与年龄是否有关;
(2)社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜,如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选择平台买菜,那么周二选择平台买菜的概率为,求小张周二选择平台买菜的概率.
参考公式及数据:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
一、单选题
1.在2×2列联表中,若每个数据变为原来的2倍,则的值变为原来的倍数为( )
A.8倍 B.4倍
C.2倍 D.不变
2.如果有95%的把握判断事件A与B有关系,那么具体计算出的数据( )
A. B.
C. D.
3.在对某小学的学生进行吃零食的调查中,得到如表数据:
吃零食
不吃零食
合计
男学生
27
34
61
女学生
12
29
41
合计
39
63
102
根据上述数据分析,我们得出的χ2约为( )
A.2.072 B.2.334
C.3.957 D.4.514
4.在某次独立性检验中,得到如下列联表:
合计
30
90
120
24
合计
54
最后发现,两个分类变量和没有任何关系,则的值可能是( )
A.72 B.30
C.24 D.20
5.某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.没有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
6.在吸烟与患肺癌是否相关的研究中,下列说法正确的是( )
A.若,我们有99%的把握认为吸烟与患肺癌有关,则在100个吸烟的人中必有99个人患肺癌
B.由独立性检验可知,当有99%的把握认为吸烟与患肺癌有关时,若某人吸烟,则他有99%的可能患有肺癌
C.通过计算得到,是指有95%的把握认为吸烟与患肺癌有关系
D.以上三种说法都不正确
7.某校团委对“喜欢吃水果和学生性别是否有关”进行了一次调查,其中被调查的女生人数是男生人数的,男生喜欢吃水果的人数占被调查的男生人数的,女生喜欢吃水果的人数占被调查的女生人数的,若有99%的把握认为喜欢吃水果和学生性别有关,则被调查的男生至少有( )
0.10
0.05
0.010
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
A.12人 B.18人
C.24人 D.30人
8.(24-25高二下·江苏连云港·月考)为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.01的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.59 B.60
C.61 D.62
二、多选题
9.(24-25高二上·江苏常州·期末)为了探究某次数学测试中成绩达到优秀等级是否与性别存在关联,小华进行了深入的调查,并绘制了下侧所示的列联表(个别数据暂用字母表示):
数学成绩
性别
合计
男
女
优秀
27
70
非优秀
58
110
合计
180
经计算得:,参照下表:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
则下列选项正确的为( )
A.
B.
C.可以在犯错误的概率不超过5%的前提下认为“数学达到优秀等级与性别有关”
D.没有充分的证据显示“数学达到优秀等级与性别有关”
10.(2024高二下·江苏·专题练习)为考察某种药物预防疾病的效果,进行动物试验,得到如下药物效果与动物试验列联表:
患病
未患病
合计
服用药
10
45
55
没服用药
20
30
50
合计
30
75
105
由上述数据给出下列结论,其中正确的是( )
附:;
0.05
0.025
0.010
0.005
3.841
5.024
6.635
7.879
A.能在犯错误的概率不超过0.05的前提下认为药物有效
B.不能在犯错误的概率不超过0.025的前提下认为药物有效
C.能在犯错误的概率不超过0.010的前提下认为药物有效
D.不能在犯错误的概率不超过0.005的前提下认为药物有效
11.(24-25高二上·江苏常州·期末)下列关于回归分析与独立性检验的说法正确的有( )
A.回归直线就是散点图中经过样本数据点最多的那条直线
B.相关变量的线性回归方程为,若样本点中心为,则
C.在独立性检验中,随机变量的观测值越小,“认为两个变量有关”这种判断犯错误的概率越大
D.以拟合一组数据时,经代换后的线性回归方程为,则
三、填空题
12.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:
患慢性气管炎
未患慢性气管炎
合计
吸烟
20
m
40
不吸烟
n
55
60
合计
25
75
100
根据列联表数据,求得χ2=________(保留3位有效数字),根据下表,有________的把握认为患慢性气管炎与吸烟有关.
附:
P(χ2≥x0)
0.050
0.010
0.001
x0
3.841
6.635
10.828
χ2=.
13.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:
电离辐
射剂量
存活情况
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
由表中数据算得:χ2=________,说明两种电离辐射剂量对小白鼠的致死作用________.(填“相同”或“不相同”)
14.若两个分类变量X与Y的2×2列联表为:
y1
y2
合计
x1
10
15
25
x2
40
16
56
合计
50
31
81
则有________的把握认为“X与Y之间有关系”.
附:
0.050
0.010
0.001
3.841
6.635
10.828
四、解答题
15.(24-25高二下·江苏宿迁·期末)某景区为测试并推广一款预约游览APP,上线的第1、2两天在APP上预约可获得费游览资格,第3天开始恢复为原票价,下表是该景区在该APP上前7天的预约情况
第t天
1
2
3
4
5
6
7
预约量y(万张)
9.03
9
8.58
8.7
8.76
8.74
8.79
经计算得:,,.
(1)由于前两天预约游览免费,所以剔除第1、2两天数据,求y关于t的线性回归方程及第5天的残差:
(2)为了调查该APP在不同年龄的人群中的推广情况,从第7天成人游客中随机抽取200人进行分析,所得的部分数据见下表:
50岁以下
50岁(含50)以上
合计
通过APP预约人数
70
其它方式购票人数
80
合计
100
①完成以上2×2列联表:
②如果有95%的把握认定游客通过APP预约游览与其年龄有关,就要进行针对性宣传,请你判断是否需要针对年龄超过50岁(含50)以上的人群进行宣传.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:,,
16.(25-26高二上·江苏常州·期末)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解乡村居民对新能源汽车的接受程度,某乡村汽车协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取80名村民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了以下统计数据:
选择新能源汽车
选择传统汽车
总计
40岁以下
56
80
40岁及以上
36
80
总计
160
完成列联表,并判断是否有的把握认为选择新能源汽车与年龄有关;
(2)为了了解某一地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量(单位:万台)关于年份的线性回归方程,且销售量的方差为,年份的方差为.求与间的样本相关系数,并据此判断该地区新能源汽车销售量与年份的线性相关性强弱.
附:(i)在线性回归方程中,;
(ii)样本相关系数,若,则可判断与线性相关性较强;
(iii),其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
17.(24-25高二下·江苏·期末)为调查学生喜欢在食堂就餐是否和性别有关,学校随机调研了男女生各100人,经统计得到如下列联表:
男
女
喜欢
80
40
不喜欢
20
60
(1)依据的独立性检验,判断学生喜欢在食堂就餐是否与性别有关?
(2)为听取学生对食堂的建议,从学生中抽取9人召开座谈会,并给其中3名同学赠送礼品,每人1份(其余人员仅赠送餐券).已知参加座谈会的学生中有且只有4名学生来自高一,求高一这4名学生中得到礼品的人数的分布列和数学期望.
0.010
0.005
0.001
6.635
7.879
10.828
附:,其中
18.(24-25高二下·江苏徐州·期末)为了解学生对某项运动的喜欢情况,学校进行了一次抽样调查,得到如下数据:
男生
女生
合计
喜欢
65
35
100
不喜欢
50
50
100
合计
115
85
200
(1)能否有99%的把握认为是否喜欢该项运动与性别有关?
(2)若学校有甲,乙两队进行此项运动比赛,每场比赛采用“5局3胜制”(有一队先胜3局即获胜,比赛结束),甲队每局获胜的概率为().
①若比赛打满5局的概率为,求的最大值;
②若,在甲队赢得该场比赛的条件下,求比赛的局数的概率分布及数学期望.
附:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
19.某学校有甲、乙、丙三家餐厅,分布在生活区的南北两个区域,其中甲、乙餐厅在南区,丙餐厅在北区,各餐厅菜品丰富多样,可以满足学生的不同口味和需求.
性别
就餐区域
合计
南区
北区
男
女
合计
(1)现在对学生性别与在南北两个区域就餐的相关性进行分析,得到下表所示的抽样数据,依据的独立性检验,能否认为在不同区域就餐与学生性别有关联?
(2)张同学选择餐厅就餐时,如果前一天在甲餐厅,那么后一天去甲,乙餐厅的概率均为;如果前一天在乙餐厅,那么后一天去甲,丙餐厅的概率分别为;如果前一天在丙餐厅,那么后一天去甲,乙餐厅的概率均为.张同学第1天就餐时选择甲,乙,丙餐厅的概率分别为.
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
(i)求第2天他去乙餐厅用餐的概率;
(ii)求第天他去甲餐厅用餐的概率.
附:;
1
学科网(北京)股份有限公司
$