内容正文:
专题14 列联表与独立性检验
知识点1:列联表
定义一对分类变量X和Y,我们整理数据如表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
上表是关于分类变量X和Y的抽样数据的2×2列联表,最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数n是样本空间中样本点的总数.
知识点2:独立性检验的理解
(1)零假设:设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互为对立事件,故要判断事件{X=1}和{Y=1}之间是否有关联,需要判断假定关系H0:P(Y=1|X=0)=P(Y=1|X=1)是否成立.
(2)独立性检验的公式
χ2=,其中n=a+b+c+d,用随机变量χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.
(3)临界值:对任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)=α.称xα为α的临界值.临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大.
(4)基于小概率值α的检验规则:当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,没有充分证据推断H0不成立,可以认为X和Y独立.利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
(5)χ2独立性检验中几个常用的小概率值和相应的临界值.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【注意】χ2越小,独立性越强,相关性越弱;χ2越大,独立性越弱,相关性越强
考点一 列联表完善与分析
考点二 独立性检验的概念及辨析
考点三 卡方的计算
考点四 独立性检验解决实际问题
考点一 列联表完善与分析
1.(25-26高二下·天津南开·期中)下面是一个列联表,则______.
X
Y
合计
a
合计
b
【答案】
【详解】由列联表的性质可知,解得,
.
2.(25-26高二下·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
【答案】8
【分析】根据列联表的性质,求出a,b,d的值,即可得答案.
【详解】由列联表的性质,可得:,可得,
所以.
故答案为:8
3.(25-26高二下·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
【答案】
【分析】根据古典概型概率公式和条件概率公式进行计算即可.
【详解】;
;
;
故答案为:;;;.
4.(2026·贵州·一模)(多选)2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高堆积条形图.
根据图中的信息,下列结论中一定正确的是( ).
A.样本中男性比女性更关注地铁1号线全线开通
B.样本中多数女性是35岁及以上
C.样本中35岁以下的男性人数比35岁及以上的女性人数多
D.样本中35岁及以上的人对地铁1号线的开通关注度更高
【答案】ABD
【分析】通过等高堆积条形图构建列联表,根据条形图所呈现的信息得出列联表中各部分数量的大小关系,再依据这些关系对各个选项进行分析.
【详解】设等高堆积条形图对应的列联表如下:
项目
35岁及以上
35岁以下
合计
男性
a
c
女性
b
d
合计
根据第1个等高堆积条形图可知,35岁及以上的男性比女性多,即;
35岁以下的男性也比女性多,即,
根据第2个等高堆积条形图可知,男性中35岁及以上的比35岁以下的多,即;
女性中35岁及以上的也比35岁以下的多,即,
对于选项A,男性人数为,女性人数为,,,故A正确,
对于选项B,35岁及以上女性人数为,35岁以下女性人数为d,,故B正确,
对于选项C,35岁以下男性人数为c,35岁及以上女性人数为b,由,无法直接判断b与c的大小关系,故C不一定正确,
对于选项D,35岁及以上的人数为,35岁以下的人数为,,,故D正确,
故选:ABD.
5.(25-26高二下·河南·阶段检测)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【分析】根据题意,得到如下两个列联表,再一一分析即可.
【详解】根据题意,得到如下两个列联表.
35岁以上
35岁及以下
总计
男性
女性
总计
35岁以上
35岁及以下
总计
男性
女性
总计
根据第1个列联表可知,样本中男性市民人数为,
女性市民人数为,又,即样本中男性比女性多,故A正确;
根据第2个列联表可知,样本中35岁以上女性市民人数为,
35岁及以下女性市民人数为,又,即样本中多数女性是35岁以上,故B正确;
由题意,,所以,故C不正确;
根据第2个列联表可知,样本中35岁以上市民人数为,
35岁及以下市民人数为,又,
即样本中35岁以上的市民比35岁及以下的多,故D正确.
故选:C.
6.(2026·上海徐汇·二模)如下是一个列联表,则__________.
y1
y2
总计
x1
a
35
45
x2
7
b
n
总计
m
73
s
【答案】90
【分析】完善列联表即可求解.
【详解】由表格有,
故答案为:.
考点二 独立性检验的概念及辨析
7.(25-26高二·全国·暑假作业)在吸烟与患肺癌是否相关的研究中,下列说法正确的是( )
A.若,我们有99%的把握认为吸烟与患肺癌有关,则在100个吸烟的人中必有99个人患肺癌
B.由独立性检验可知,当有99%的把握认为吸烟与患肺癌有关时,若某人吸烟,则他有99%的可能患有肺癌
C.通过计算推断出吸烟与患肺癌有关联,且此推断犯错误的概率不大于0.05,是指有95%的把握认为吸烟与患肺癌有关联
D.以上三种说法都不正确
【答案】C
【分析】根据独立性检验的思想即可求解.
【详解】依据小概率值的独立性检验,若,我们有99%的把握认为吸烟与患肺癌有关,而不是在100个吸烟的人中必有99个人患肺癌,故A不正确;
99%是指我们有99%的把握认为吸烟与患肺癌有关,而不是吸烟的人有99%的可能患有肺癌,故B不正确;
因为“推断犯错误的概率不大于0.05”即显著性水平,所以有的把握认为吸烟与患肺癌有关联,C正确,D不正确.
8.(25-26高三·全国·一轮复习)为了研究性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用列联表进行独立性检验,经计算,则所得到的统计学结论是认为性别与喜欢乡村音乐有关系的把握至少为( )
0.01
0.005
0.001
6.635
7.879
10.828
A. B. C. D.
【答案】C
【分析】根据观测值 ,对照临界值表即可得出结论.
【详解】因为,所以有的把握认为“性别与喜欢乡村音乐有关系”.
9.(2026高三·全国·专题练习)在性别与吃零食这两个分类变量的计算中,下列说法正确的是________.
①若的观测值为,我们有99%的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有99%的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为99%;
③若从统计量中求出有99%的把握认为吃零食与性别有关系,是指有1%的可能性使得出的判断出现错误.
【答案】③
【分析】有99%的把握认为两个变量有关系”含义是指:如果我们做出“两个变量有关系”的结论,那么这个结论出错(即实际上两个变量相互独立)的概率只有1%,它衡量的是推断结论的可靠程度,由此判断即可.
【详解】①错误:独立性检验中“有99%的把握认为两个分类变量有关系”是对变量关联性判断的可靠程度的描述,并非指特定样本中群体比例具有必然性,属于对统计结论的错误解读。
②错误:99%的把握是“吃零食与性别存在关联”这一判断的可信度,并非单个吃零食的人为女性的概率为99%,混淆了统计推断的可靠度与单个事件的发生概率。
③正确:符合独立性检验的概念,有99%的把握认为两个分类变量有关系,即该判断出现错误的概率约为1%。
10.(25-26高二下·河南驻马店·期中)下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,若有的把握认为吸烟与患肺病有关系时,我们不可以说在100个吸烟的人中,有99人患肺病
D.在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越小
【答案】C
【详解】对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,A错误;
对于B,独立性检验并不能确定两个变量相关,B错误;
对于C,是指“抽烟”和“患肺病”存在关联的可能性大小,并非抽烟人中患肺病的发病率,
因此不可以说在100个吸烟的人中,有99人患肺病,C正确;
对于D,在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大,D错误.
11.(2026·江苏南通·三模)为研究课后整理错题习惯与数学成绩达标之间的关联性,经独立性检验计算得,临界值,.记事件为“学生成绩达标”,事件为“学生坚持整理错题”;已知,,,则有________的把握认为二者存在关联;随机抽取一名学生,其成绩达标的概率为________.
【答案】 /
【详解】由,且,即有的把握认为二者存在关联,
由题设,则,
所以随机抽取一名学生,其成绩达标的概率为.
12.(25-26高二下·黑龙江大庆·期中)独立性检验中,若小于临界值,则下列结论正确的是( )
A.两个变量一定相互独立 B.两个变量一定不独立
C.没有充分证据表明两个变量有关 D.两个变量有关联的可能性为
【答案】C
【分析】根据独立性检验的基本逻辑即可求解.
【详解】对于A,小于临界值,并不意味着“一定相互独立”,只是无足够证据反对独立,故A错误;
对于B,小于临界值,并不意味着“一定不独立”,只是无足够证据反对独立,故B错误;
对于C,这是独立性检验的基本逻辑:当时,无充分证据支持变量相关,即不能认为有关联,故C正确;
对于D,对应的把握认为两个变量有关联,而实际上,故D错误.
考点三 卡方的计算
13.(25-26高二下·河北沧州·期中)为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取男性人数与女性人数相同,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性中不喜爱钓鱼的至少有( )
附:,其中.
A.人 B.人 C.人 D.人
【答案】C
【分析】设被调查的男性有人,则女性有人,列出列联表,根据独立性检验的基本思想可得出关于的不等式,结合可得出的值,即可得出被调查的男性中不喜爱钓鱼的人数至少为.
【详解】设被调查的男性有人,则女性有人,根据题意,可得列联表如下:
钓鱼
性别
男性
女性
总计
喜爱钓鱼
不喜爱钓鱼
总计
则,
本次调查得出“有的把握认为是否喜爱钓鱼与性别有关”的结论,
可得,解得,
又因为列联表中相关人数需为整数,则,
所以,被调查的男性中不喜爱钓鱼的至少有人.
14.(25-26高二下·重庆·期中)某高校组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计,.
(1)根据已知条件,依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关?
性别
男生
女生
合计
不愿报名参加答题活动
愿意报名参加答题活动
合计
200
(2)假设甲每道题回答是否正确相互独立,且每次答对的概率均为.若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)认为学生报名参加答题活动与性别有关联,此推断犯错误的概率不大于0.001
(2)的分布列为:
1
2
3
4
【分析】(1)根据已知条件求出列联表中的数据,再计算出的值判断即可;
(2)写出的所有可能取值,结合独立事件的概率特征求出对应的概率,从而可写出的分布列及期望.
【详解】(1)因为,所以愿意报名参加答题活动人数为,
又因为,所以愿意报名参加答题活动的男生人数为,愿意报名参加答题活动的女生人数为,
则可得到列联表为:
性别
男生
女生
合计
不愿报名参加答题活动
20
60
80
愿意报名参加答题活动
80
40
120
合计
100
100
200
零假设为:学生报名参加答题活动与性别无关,
则
依据小概率值的独立性检验,我们推断不成立,
即认为学生报名参加答题活动与性别有关联,此推断犯错误的概率不大于0.001.
(2)由题意得,的所有可能取值为:,
,,,,
所以的分布列为:
1
2
3
4
故.
15.(25-26高二·全国·暑假作业)随着国家三孩政策的全面放开,为了调查一线城市和非一线城市的三孩生育意愿,某机构用简单随机抽样的方法从不同地区调查了100位育龄妇女,结果如下表.
三孩生育意愿
城市级别
合计
非一线
一线
愿生
45
20
65
不愿生
13
22
35
合计
58
42
100
由,得 .
参照下表:
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
根据小概率值的独立性检验,可以得到的结论是________.
【答案】有把握认为生育意愿与城市级别有关
【分析】由独立性检验的方法可得结论.
【详解】由于 ,所以有把握得出生育意愿与城市级别有关.
16.(25-26高二下·河北沧州·期中)为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射后天的结果如表所示:
电离辐射剂量
存活情况
合计
死亡
存活
第一种剂量
第二种剂量
合计
由表中数据算得:__________精确到 ,说明两种电离辐射剂量对小白鼠的致死作用__________填“相同”或“不相同”.(已知)
【答案】 . 不相同
【分析】根据给定的数表,求出的观测值,再与临界值表比对作答.
【详解】由列联表中数据,计算得,
所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关,
即两种电离辐射剂量对小白鼠的致死作用不相同.
17.(25-26高二下·辽宁朝阳·期中)(多选)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,结果得到列联表如下:则( )
性别
男生
女生
合计
不愿报名参加答题活动
20
60
80
愿意报名参加答题活动
80
合计
100
参考公式:,其中.
附表:
0.1
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
A.当时,有的把握认为参与答题意愿与性别无关.
B.当时,有的把握认为参与答题意愿与性别有关.
C.当时,根据小概率值的独立性检验,认为参与答题意愿与性别有关联.
D.当时,根据小概率值的独立性检验,没有充分的证据推断参与答题意愿与性别有关联.
【答案】BC
【详解】对于AB,当时,,
则,
所以有的把握认为参与答题意愿与性别有关.,故A错误,B正确;
对于CD,当时,,
零假设为:参与答题意愿与性别无关,
则,
依据小概率值的独立性检验,我们推断不成立,
所以根据小概率值的独立性检验,认为参与答题意愿与性别有关联,故C正确,D错误.
18.(25-26高二下·江西萍乡·期中)某医疗研究机构为检验某种新研发的药物对特定疾病治疗是否有效,随机选取了200名患者进行双盲实验.其中100人服用新药,100人服用旧药,统计结果如下表
治愈
未治愈
合计
服用新药
67
33
100
服用旧药
48
52
100
合计
115
85
200
附:统计量临界值表
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中.
则下列说法正确的是( )
A.有的把握认为新研发的药物对特定疾病治疗有效
B.有的把握认为新研发的药物对特定疾病治疗无效
C.有的把握认为新研发的药物对特定疾病治疗无效
D.有的把握认为新研发的药物对特定疾病治疗有效
【答案】D
【分析】求出的值,即可得答案。
【详解】因为,
又因为当时,对应的犯错的概率为,
所以有的把握认为新研发的药物对特定疾病治疗有效.
考点四 独立性检验解决实际问题
19.(25-26高二下·河南·阶段检测)某电动汽车制造企业为了提升电池性能,研发部门对一款新型号的电池进行了充放电循环测试,测试时分别收集了使用液冷技术与风冷技术的电池各250组,测试电池电容量衰减至初始容量的时所经历的充放电循环次数,若循环次数不低于2000次,则认定为A级电池,否则认定为B级电池,统计结果如下表:
A级电池
B级电池
总计
液冷技术
200
50
250
风冷技术
150
100
250
总计
350
150
500
(1)根据小概率值的独立性检验,分析“是A级电池”与“电池冷却技术类型”是否有关;
(2)现从使用液冷技术的250组电池中,按比例用分层随机抽样的方法抽取10组电池,再从这10组电池中用无放回的方式随机抽取3组电池,记为抽到的A级电池的组数,求的分布列和数学期望.
附:.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)“是A级电池”与“电池冷却技术类型”有关
(2)分布列见解析,
【分析】(1)根据题中数据求,并与临界值对比,结合独立性检验思想分析判断;
(2)分析可知的所有可能取值为,,,结合超几何分布求分布列和期望.
【详解】(1)零假设:“是A级电池”与“电池冷却技术类型”无关,
由题中数据得,
根据小概率值的独立性检验,可以推断零假设不成立,
所以“是A级电池”与“电池冷却技术类型”有关.
(2)从使用液冷技术的250组电池中,按比例用分层随机抽样的方法抽取10组电池,
则A级电池抽取8组,B级电池抽取2组,则的所有可能取值为,,,
,,,
故的分布列为
1
2
3
所以.
20.(2026·河南开封·模拟预测)某团队为探究大语言模型参数量与模型性能之间的关系,训练了6个不同参数量的模型,并在同一验证集上评估性能得分,得到如下统计数据:
参数量x(亿)
2
4
6
8
10
12
性能得分y(分)
1.8
2.8
3.4
3.6
3.8
4.0
(1)求y关于x的线性回归方程(系数用分数表示),并预测参数量为14亿时,模型的性能得分;
(2)该团队比较了100次实验的实际性能与预测性能,得到“高效”(实际得分≥预测得分)和“低效”(实际得分<预测得分)两种效率组别.同时,他们记录了每次实验所用的训练数据质量等级(优质/普通),得到如下列联表:
训练数据质量等级
训练效率
总计
高效
低效
优质
42
18
60
普通
18
22
40
总计
60
40
100
请依据小概率值的独立性检验,分析训练效率是否与训练数据质量有关.
附:,,,.
.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)线性回归方程为,预测性能得分约为分
(2)依据的独立性检验,训练效率与训练数据质量有关
【分析】(1)先根据数据算样本均值,再用公式求回归系数和得线性回归方程,最后代入值预测.
(2)提出零假设,根据列联表数据算卡方值,与临界值比较后判断是否拒绝零假设.
【详解】(1)由题意可得,n=6,,,
又因为,,所以根据公式计算回归系数可得:
,
,
所以,关于的线性回归方程为: ,
当参数量亿时,代入可得: ,
即预测参数量为14亿时,模型性能得分约为分(或分).
(2)零假设:训练效率与训练数据质量无关,根据列联表可得:
,,,,,
所以卡方统计量为,
因为对应的临界值为,,所以拒绝,
依据的独立性检验,认为训练效率与训练数据质量有关.
21.(25-26高二下·四川德阳·期末)近期,高中周末双休引起热议,为调查在校高中学生对国家双休政策的支持情况,某中学数学社团在校园内对学生展开随机调查,得到下表.(数据单位:人)
支持
不支持
成绩优秀
60
30
成绩不优秀
90
30
(1)根据该数学社团的调查结果判断,有无90%把握认为支持双休政策与学生成绩是否优秀有关?
0.1
0.05
0.01
2.706
3.841
6.635
附:.
(2)若该数学社团的调查结果可靠,某文学社团按相同方式在该校园内另随机调查了14位同学.其中成绩优秀且支持双休的人数为,请参考数学社团的调查数据,估算和;
(3)该校准备从数学社团调查的210名同学中用“按比例分层抽样”的方法抽取7位同学座谈、并准备在参与座谈的同学中选取5人组成新的调查小组.假设新的调查小组中支持双休但成绩不优秀的人数为,求的分布列.
【答案】(1)
没有90%的把握认为支持双休政策与学生成绩是否优秀有关
(2)
,
(3)
答案见解析
【详解】(1)由列联表可得(成绩优秀支持人数),(成绩优秀不支持人数),(成绩不优秀支持人数),(成绩不优秀不支持人数),则,
所以,
由题可知,把握对应的临界值为,因为,
所以没有把握认为支持双休政策与学生成绩是否优秀有关.
(2)随机抽取一名学生,该学生为成绩优秀且支持双休的概率,
由题意得,
所以,.
(3)分层抽样的抽样比为,则抽取的7人中支持双休但成绩不优秀的共人,其余共4人,
因此的可能取值为,
;;,
因此的分布列为
.
22.(25-26高二下·辽宁鞍山·期中)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中200名居民体育锻炼的次数与年龄,得到如下的频数分布表.
年龄次数
每周0∼2次
33
22
22
23
每周3∼4次
12
17
25
22
每周5次及以上
3
3
12
6
(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,
不低于3次的称为体育锻炼频率高,根据小概率值的独立性检验判断体育锻炼频率的高低与年龄是否有关联;
(2)从每周体育锻炼5次及以上的锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,
再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;
参考公式:
附:
α
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)认为体育锻炼频率的高低与年龄有关;
(2)分布列为:
0
1
2
P
【详解】(1)零假设:体育锻炼频率的高低与年龄无关.
由题得列联表如下:
青年
中年
合计
体育锻炼频率低
55
45
100
体育锻炼频率高
35
65
100
合计
90
110
200
,
根据小概率值的独立性检验推断不成立,
即认为体育锻炼频率的高低与年龄有关,此推断犯错误的概率不大于0.01.
(2)由表知,利用分层抽样的方法抽取的8人中,年龄在,内的人数分别为1,2,
依题意,的所有可能取值分别为为0,1,2,
所以,
,
,
所以的分布列:
0
1
2
P
所以的数学期望为.
23.(2026·河南驻马店·三模)某实验室利用基因编辑技术改良一种小麦品种,使其对锈病产生抗性.实验中将100株小麦分为两组:实验组50株接受基因编辑处理,对照组50株未处理,实验后统计各组抗病情况如下表:
抗病株数
易感病株数
实验组
38
12
对照组
25
25
(1)完成列联表并依据小概率值的独立性检验,分析该小麦品种抗锈病与接受基因编辑处理是否有关联;
(2)用接受基因编辑后小麦抗锈病株数的频率估计基因编辑后单株小麦抗锈病的概率,从接受基因编辑的小麦中随机选取10株,记其中抗锈病的株数为,求的数学期望与方差.
附:,其中.
【答案】(1)表格见解析,有关联
(2)
【分析】(1)根据已知条件完善列联表,然后计算的值,进而得到结论;
(2)先根据题意得到经过基因编辑处理的单株小麦抗锈病的概率为,再结合题意得到,进而利用公式即可求出的数学期望与方差.
【详解】(1)由题得如下列联表:
抗病株数
易感病株数
合计
实验组
38
12
50
对照组
25
25
50
合计
63
37
100
零假设:小麦抗锈病与接受基因编辑处理无关联.
由列联表的数据,得,
依据小概率值的独立性检验,我们推断不成立,可以认为该小麦抗锈病与接受基因编辑处理有关联.
(2)由题意,估计经过基因编辑处理的单株小麦抗锈病的概率为,
由题知,
故其分布列为,
所以
24.(25-26高三·全国·暑假作业)为推动农村可持续生态农业的发展,广东某农场用五年的时间按照有机标准新改良了100亩土地,预计在改良后的土地上种植有机水果和其他作物,并根据市场需求确定有机水果的种植面积.农场经营采用的是CSA农业经营模式即社区支持农业,农场从CSA会员中随机抽取了南方、北方会员共200人,调查数据如下.
喜欢有机水果
不喜欢有机水果
南方会员
80
40
北方会员
40
40
(1)视频率为概率,分别估计南方、北方会员中喜欢有机水果的概率;
(2)(ⅰ)判断是否有的把握认为是否喜欢有机水果与会员的区域有关?
(ⅱ)已知农场CSA会员有2000人,其中南方会员有1200人,若喜欢有机水果的人不低于1100人,则可种植50亩左右的有机水果,否则只能种植30亩左右,试问该农场应怎样安排有机水果的种植面积.
附:,.
0.05
0.025
0.005
3.841
5.024
7.879
【答案】(1),.
(2)(ⅰ)有的把握认为是否喜欢有机水果与会员的区域有关;(ⅱ)农场可以种植50亩左右的有机水果.
【分析】(1)利用频率估计概率求南方、北方会员中喜欢有机水果A的概率;
(2)(i)根据列联表及卡方公式求出卡方值,结合独立检验基本思想即可得结论;
(ii)估计农场会员中喜欢有机水果的总人数,与1100比较大小,即可得结论.
【详解】(1)由题得南方会员中喜欢有机水果的概率;
北方会员中喜欢有机水果的概率为,
所以南方、北方会员中喜欢有机水果的概率分别为,.
(2)(ⅰ) ,
所以有的把握认为是否喜欢有机水果与会员的区域有关
(ⅱ)由题可估计农场的CSA会员中喜欢有机水果的人数为,
所以农场可以种植50亩左右的有机水果.
1.(25-26高三上·广西南宁·期末)为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
【答案】B
【分析】根据等高条形图中的数据即可得出选项.
【详解】根据两个表中的等高条形图知,药物实验显示不服药与服药时患病差异较药物实验显示明显大,
所以药物的预防效果优于药物的预防效果,
故选:B.
2.(25-26高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
【答案】B
【分析】由列联表数据,列出等式即可求解;
【详解】由,得.
由,得.
由,得.
由,得.
故选:B
3.(上海市黄浦区2025-2026学年第二学期高三5月模拟数学试卷)某研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计,根据统计数据制作列联表,提出原假设:“经常用流行用语”与“年轻人”没有关系,计算得,由此可知( ).(显著性水平取0.05,)
A.接受原假设,没有的把握认为“经常用流行用语”与“年轻人”有关系
B.拒绝原假设,有的把握认为“经常用流行用语”与“年轻人”有关系
C.接受原假设,有的把握认为“经常用流行用语”与“年轻人”有关系
D.拒绝原假设,有的把握认为“经常用流行用语”与“年轻人”没有关系
【答案】B
【详解】由于且,故拒绝原假设,有的把握认为“经常用流行用语”与“年轻人”有关系.
4.(25-26高二下·广东深圳·期中)下列说法中错误的有几个( )
①数据1,2,3,5,7,8,9的60%分位数是6;
②根据列联表中的数据计算得出,而,则“两个分类变量有关联”此推断犯错误的概率不大于0.01;
③回归分析时,可用决定系数刻画模型的拟合效果,越大,则拟合效果越好;
④若随机变量服从正态分布,若,则实数.
A.1个 B.2个 C.3个 D.4个
【答案】A
【分析】利用百分位数定义可判断①;利用独立性检验可判断②;利用决定系数与模型拟合效果的关系可判断③;利用正态分布对称性和性质可判断④.
【详解】对于①,将数据按从小到大排列:1,2,3,5,7,8,9共有7个数据,
故60%分位数是第5个数,即7不是6.故①错误;
对于②,根据列联表中的数据计算得出,而,
则有99%的把握认为两个分类变量有关系,
则“两个分类变量有关联”此推断犯错误的概率不大于0.01,故②正确;
对于③,在做回归分析时,可以用决定系数刻画模型的回归效果,
若越大,则说明模型拟合的效果越好,故③正确;
对于④,由随机变量,其正态曲线关于直线对称,
由,若,
则,即得,所以,故④正确.
5.(25-26高二下·河北石家庄·期中)(多选)某校高二年级某次数学周测成绩,且,现随机抽取100名学生的成绩,统计两个变量:①变量A指是否坚持课前预习(“是”与“否”各50人);②变量B指该次数学周测成绩是否在内.整理列联表,计算得,则参考临界值:( )
A.
B.
C.根据小概率值0.10的独立性检验,认为变量A与变量B不独立
D.根据小概率值0.05的独立性检验,认为变量A与变量B不独立
【答案】ABC
【分析】根据已知及正态分布的对称性判断A、B,应用独立性检验基本思想判断C、D.
【详解】正态分布密度曲线关于直线对称,且,
所以,则,A、B正确.
因为,
在显著性水平为的独立性检验中,认为变量A与变量B不独立,
在显著性水平为的独立性检验中,认为变量A与变量B独立,
C正确,D错误.
6.(2026·山东聊城·二模)(多选)某医学研究团队为探究新型降压药的疗效与患者年龄的关联,将120名高血压患者按年龄分为“中青年组(<60岁)”和“老年组(岁)”,记录用药后的疗效(“有效”“无效”),得到如下列联表:
患者
疗效
总计
有效
无效
中青年组
10
40
50
老年组
40
30
70
总计
50
70
120
附:,其中.
0.10
0.05
0.025
0.01
2.706
3.841
5.024
6.635
则下列说法中正确的有( )
A.若在“老年组”中按疗效分层抽样抽取7人,再从这7人中随机抽取2人,则至少抽到1名“无效”患者的概率为
B.从所有患者中随机抽取1人,设事件“该人在中青年组”,事件“该药对此人有效”,则事件A与B相互独立
C.根据小概率值的独立性检验,认为“降压药疗效与患者年龄有关”,且该推断犯错误的概率不超过
D.若将列联表中“中青年组有效”的人数改为15,“中青年组无效”的人数改为35,则所得值比原值大
【答案】AC
【分析】选项A,用分层抽样先确定抽出的“有效”和“无效”人数,再做组合概率;选项B,用独立事件定义检验是否等于;选项C,计算列联表的值,与临界值比较;选项D分别计算修改前后的值大小.
【详解】选项A,老年组中有效与无效的人数比为
按疗效分层抽样抽取7人,则应抽到:4人有效,3人无效,
再从这 7 人中随机抽取 2 人,至少抽到 1 名无效患者的概率为所以 A 正确;
选项B,设事件:表示“该人在中青年组”,事件:表示“该药对此人有效”,
则而
若相互独立,则应有
显然所以事件与不相互独立,B 错误;
选项C,由题中列联表,
所以
即
因为所以根据小概率值的独立性检验,
可以认为“降压药疗效与患者年龄有关”,且该推断犯错误的概率不超过,所以C正确;
选项D,若将“中青年组有效”改为 15,“中青年组无效”改为 35,
则新列联表中
此时
即,而原来的
所以修改后的值比原来的小,D 错误.
7.(25-26高二·全国·课后作业)(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”、“日落云里走,雨在半夜后” ……小波同学为了验证“日落云里走,雨在半夜后”,随机观察了他所在地区的100天日落情况和后半夜天气,得到如下列联表,
日落云里走
后半夜天气
总计
下雨
未下雨
出现
25
5
30
未出现
25
45
70
总计
50
50
100
并计算得到,下列小波对该地区天气的判断正确的是( )
A.后半夜下雨的概率约为
B.未出现“日落云里走”时,后半夜下雨的概率约为
C.在犯错误的概率不超过0.001的前提下,可以认为““日落云里走’是否出现”与“后半夜是否下雨”有关
D.根据的独立性检验,若出现“日落云里走”,则后半夜有99.9%的可能会下雨
【答案】AC
【分析】视频率为概率,利用数表计算后半夜下雨及未出现“日落云里走”时,后半夜下雨的频率即可判断A,B,由给定的观测值与临界值比对即可判断C,D作答.
【详解】由题意,把频率看作概率,可得后半夜下雨的概率约为,A判断正确;
未出现“日落云里走”时,后半夜下雨的概率约为,B判断情误;
由,则在犯错误的概率不超过0.001的前提下,认为“日落云里走”是否出现与“当晚后半夜是否下雨”有关,C判断正确;
“日落云里走’是否出现”与“当晚后半夜是否下雨”有关,有关只是说可能性,不代表一定要下雨,D判断错误.
故选:AC
8.(25-26高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
【答案】74
【分析】根据联表性质计算求解.
【详解】由题意知,所以.
故答案为:.
9.(25-26高二下·江西·阶段检测)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人.
参考数据及公式:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】48
【分析】设男生人数为,由题可得列联表,然后由题设可得关于不等式,据此可得答案.
【详解】设男生人数为,则女生人数为,男生追星人数为,不追星人数为,
女生追星人数为,不追星人数为,据此可得列联表如下:
追星
不追星
总计
男生
女生
总计
则由独立性检验相关计算公式结合题设,可得:
.
又为保证所有人数为正整数,需为的倍数,则.
10.(25-26高二上·宁夏银川·期末)“双减”提出要全面减负作业总量和时长,减轻学生过重作业负担,同时坚持从严治理, 全面规范校外培训行为.在“双减”颁布前,某地教育局为了解当地中学生参加校外培训的情况,随机调查了当地100名学生,得到的数据如下表:
参加校外培训
未参加校外培训
总计
初中生
30
20
50
高中生
40
10
50
总计
70
30
100
根据该表格,在“双减”颁布前,______95%的把握认为学生是否参加校外培训与年级段有关.(填“有”或“没有”)
参考临界值表:
0.10
0.05
0.010
2.706
3.841
6.635
.
【答案】有
【分析】根据公式计算出,然后对照临界值表即可作出正确判断.
【详解】由题可知,,
因为,
所以有95%的把握认为学生是否参加校外培训与年级段有关.
故答案为:有.
11.(2026·贵州毕节·三模)“阳光杯”中学生篮球联赛是毕节市威宁自治县极具本土特色的体育赛事,赛事深度融合威宁多民族文化与高原风情,是当地群众最喜爱的体育赛事之一.威宁县某中学为了研究不同性别的学生对该赛事的了解情况,进行了一次抽样调查,随机抽取该校男生和女生各80名作为样本.设事件“了解‘阳光杯’中学生篮球联赛”,“学生为女生”,已知,.
(1)完成下列列联表,并依据的独立性检验,能否认为该校学生对“阳光杯”中学生篮球联赛的了解情况与性别有关联?
了解
不了解
合计
男生
女生
合计
(2)现从该样本不了解“阳光杯”中学生篮球联赛的学生中,采用分层随机抽样的方法抽取10名学生,再从这10名学生中随机抽取2人,设抽取的2人中男生的人数为X,求X的分布列和数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表如下:
了解
不了解
合计
男生
40
40
80
女生
20
60
80
合计
60
100
160
依据的独立性检验,认为该校学生对“阳光杯”赛事的了解情况与性别有关联.
(2)X的分布列为:
X
0
1
2
P
数学期望为.
【分析】(1)先根据条件概率求得人数完善列联表,再代入公式求出,将该值与临界值比较即可求解.
(2)先根据分层抽样确定抽取的男生人数和女生人数,再写出所有可能取值并计算相应的概率,列出分布列并根据数学期望公式可得出答案.
【详解】(1)由题意,,
可知“了解‘阳光杯’中学生篮球联赛”的女生有人,则不了解联赛的女生有60人
“了解‘阳光杯’中学生篮球联赛”的男生有 人,则不了解联赛的男生有40人.
所以
了解
不了解
合计
男生
40
40
80
女生
20
60
80
合计
60
100
160
零假设:该校学生对“阳光杯”赛事的了解情况与性别无关.
依题意,
则,
依据的独立性检验,推断不成立,所以认为该校学生对“阳光杯”赛事的了解情况与性别有关联.
(2)由(1)知,抽取的10名学生中,男生有4人,女生有6人.
可能的取值为0,1,2
则,,
X的分布列为
X
0
1
2
P
数学期望
12.(25-26高三·全国·一轮复习)文旅部门统计了某网红景点在2025年3月至7月的旅游收入(单位:万),得到以下数据:
月份
3
4
5
6
7
旅游收入
10
12
11
12
20
(1)根据表中所给数据,用相关系数加以判断,是否可用线性回归模型拟合与的关系?若可以,求出关于之间的线性回归方程;若不可以,请说明理由;
(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的列联表,能否在犯错误的概率不超过0.001的情况下认为“游客是否喜欢该网红景点与性别有关联”.
喜欢
不喜欢
总计
男
100
女
60
总计
110
参考公式:相关系数,
参考数据:.线性回归方程:,其中,.
.
临界值表:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)可用线性回归模型拟合与的关系,.
(2)能够在犯错误的概率不超过0.001的情况下认为“游客是否喜欢该网红景点与性别有关联”
【分析】(1)计算,从而得出可用线性回归模型拟合与的关系,再根据最小二乘法求出即可得解.
(2)补全列联表,计算卡方的值,进而判断即可.
【详解】(1)由已知得:
,,,,,
,因为 ,
说明与的线性相关关系很强.
可用线性回归模型拟合与的关系,
,
则关于的线性回归方程为:.
(2)列联表如下所示:
喜欢
不喜欢
总计
男
70
30
100
女
40
60
100
总计
110
90
200
根据列联表中数据,,
所以能够在犯错误的概率不超过0.001的情况下认为“游客是否喜欢该网红景点与性别有关联”.
13.(2026高三·全国·专题练习)考古发掘过程中运用了磁力勘探技术、电阻率勘探技术、地面透射雷达、地面电探CT技术、X射线计算机断层扫描技术等.随着科学技术的发展,越来越多的古迹具备了发掘的条件,然而相关考古专业人才却严重不足.某调查机构为了解高三学生在志愿填报时对考古专业的态度,用分层抽样的方法从某中学高三年级1200名男生和800名女生中随机抽取20名学生进行调查,调查结果如下表:
性别
不填报
填报
非第一志愿填报
第一志愿填报
男生
5
2
女生
1
0
(1)完成下面的列联表,并判断是否有的把握认为该校学生填报志愿时“是否填报考古专业”与性别有关?
是否填报
男生
女生
总计
不填报
填报
总计
20
(2)从抽出的男生中再随机抽取3人进一步了解情况,记为抽取的这3名男生中“第一志愿填报考古专业”和“非第一志愿填报考古专业”人数差的绝对值,求的数学期望.
附:,.
0.050
0.025
0.005
3.841
5.024
7.879
【答案】(1)填表见解析;有
(2)
【分析】(1)结合题意求解出列联表,再进行独立性检验即可.
(2)结合题意求出各个情况的概率,进而利用期望公式求解数学期望即可.
【详解】(1)由题可知,抽取的20人中,
男生有人,则女生有人,
男生中不填报考古专业的人数,
女生中不填报考古专业的人数.
所以列联表如下:
是否填报
男生
女生
总计
不填报
5
7
12
填报
7
1
8
总计
12
8
20
则.
所以有的把握认为该校学生填报志愿时“是否填报考古专业”与性别有关.
(2)由(1)可知,抽取的男生有12人,
不填报考古专业的男生有5人,填报考古专业的男生有7人,
其中第一志愿填报考古专业的有2人,非第一志愿填报考古专业的有5人.
所以的可能取值为.得到,
,
,.
故.
14.(2026·浙江·二模)睡眠是人体生理活动的基本阶段,良好的睡眠质量能够保证身体健康、增强免疫力、提高工作和学习的效率.某科研小组为了研究平均每天使用电子产品的时间(单位:h)对睡眠质量的影响,对100位志愿者平均每天使用电子产品的时间和睡眠质量进行了调研,并统计得到了如下表格:
轻度睡眠障碍人数
1
2
3
1
2
重度睡眠障碍人数
4
3
6
4
4
睡眠质量良好人数
25
25
11
5
4
总人数
30
30
20
10
10
(1)由表中的数据求这100人平均每天使用电子产品时间的估计值(同一组中的数据用该组区间的中点值代表);
(2)从这100人中随机抽取一人,求此人在轻度睡眠障碍的前提下,平均每天使用电子产品的时间在内的概率;
(3)若平均每天使用电子产品的时间大于等于4小时为超标.按所给数据,完成下面列联表,并根据小概率值的独立性检验,能否认为睡眠质量与平均每天使用电子产品的时间有关.
睡眠质量
平均每天使用电子产品的时间
合计
超标
不超标
良好
障碍(包括轻度和重度)
合计
100
附:,
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)3.8小时
(2)
(3)表格见解析,认为睡眠质量与平均每天使用电子产品的时间有关.
【详解】(1)设这100人平均每天使用电子产品时间的估计值为,
则,
所以这100人平均每天使用电子产品时间的估计值为3.8小时.
(2)设:此人轻度睡眠障碍;:此人平均每天使用电子产品的时间在内,
则,,
所以.
(3)由表中数据得列联表如下:
睡眠质量
平均每天使用电子产品的时间
合计
超标
不超标
良好
20
50
70
障碍(包括轻度和重度)
20
10
30
合计
40
60
100
零假设为:睡眠质量与平均每天使用电子产品的时间无关,
根据列联表中的数据,计算得,
根据小概率值的独立性检验,我们推断不成立,
即认为睡眠质量与平均每天使用电子产品的时间有关.
15.(2026·河南·三模)某影城想了解观众性别与喜欢的电影类型是否有关,随机调查了300名观众,得到下表:
喜欢生活片
喜欢战争片
男性观众
70
80
女性观众
90
60
(1)根据的独立性检验,分析观众性别与喜欢的电影类型是否有关;
(2)从这300名观众中随机选择2名,在已知其中至少有1名女性观众条件下,求这2名观众都喜欢生活片的概率.
参考公式:,其中.
临界值表:
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)观众性别与喜欢的电影类型无关
(2)
【分析】(1)计算卡方值并与临界值比较,即可得出结论;
(2)根据条件概率的公式计算得解.
【详解】(1)零假设:观众性别与喜欢的电影类型无关.
因为.
因此依据的独立性检验,没有充分证据说明不成立,即两者无关.
(2)设事件"选出的2人中至少1名女性",事件"选出的2人都喜欢生活片",
由列联表知,;
,因此.
16.(2026·甘肃兰州·模拟预测)纪录片《重返狼群》再度翻红,某市为了了解市民是否关注《重返狼群》与性别的关联性,在本市随机调查了1000名市民,得到如下列联表.
性别
是否关注《重返狼群》
合计
不关注
关注
男
520
80
600
女
380
20
400
合计
900
100
1000
(1)依据小概率值的独立性检验,能否认为市民是否关注《重返狼群》与性别有关;
(2)将频率视为概率,现从全市市民中随机抽取3名,记关注《重返狼群》的人数为,求的数学期望.
附:,.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)认为市民是否关注《重返狼群》与性别有关
(2)
【分析】(1)零假设:市民是否关注《重返狼群》与性别无关,计算出的观测值,结合临界值可得出结论;
(2)根据题意,再计算期望即可.
【详解】(1)零假设:市民是否关注《重返狼群》与性别无关,
计算得,
所以依据小概率值的独立性检验,推断不成立,
即认为市民是否关注《重返狼群》与性别有关,此推断犯错误的概率不超过0.001;
(2)由列联表知1000名市民中有100人关注,关注率为,
用频率估计概率,可知任意抽取一名市民,该市民关注《重返狼群》的概率为,
则,
所以.
1 / 1
学科网(北京)股份有限公司
$
专题14 列联表与独立性检验
知识点1:列联表
定义一对分类变量X和Y,我们整理数据如表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
上表是关于分类变量X和Y的抽样数据的2×2列联表,最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数n是样本空间中样本点的总数.
知识点2:独立性检验的理解
(1)零假设:设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互为对立事件,故要判断事件{X=1}和{Y=1}之间是否有关联,需要判断假定关系H0:P(Y=1|X=0)=P(Y=1|X=1)是否成立.
(2)独立性检验的公式
χ2=,其中n=a+b+c+d,用随机变量χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.
(3)临界值:对任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)=α.称xα为α的临界值.临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大.
(4)基于小概率值α的检验规则:当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,没有充分证据推断H0不成立,可以认为X和Y独立.利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
(5)χ2独立性检验中几个常用的小概率值和相应的临界值.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【注意】χ2越小,独立性越强,相关性越弱;χ2越大,独立性越弱,相关性越强
考点一 列联表完善与分析
考点二 独立性检验的概念及辨析
考点三 卡方的计算
考点四 独立性检验解决实际问题
考点一 列联表完善与分析
1.(25-26高二下·天津南开·期中)下面是一个列联表,则______.
X
Y
合计
a
合计
b
2.(25-26高二下·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
3.(25-26高二下·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
4.(2026·贵州·一模)(多选)2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高堆积条形图.
根据图中的信息,下列结论中一定正确的是( ).
A.样本中男性比女性更关注地铁1号线全线开通
B.样本中多数女性是35岁及以上
C.样本中35岁以下的男性人数比35岁及以上的女性人数多
D.样本中35岁及以上的人对地铁1号线的开通关注度更高
5.(25-26高二下·河南·阶段检测)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
6.(2026·上海徐汇·二模)如下是一个列联表,则__________.
y1
y2
总计
x1
a
35
45
x2
7
b
n
总计
m
73
s
考点二 独立性检验的概念及辨析
7.(25-26高二·全国·暑假作业)在吸烟与患肺癌是否相关的研究中,下列说法正确的是( )
A.若,我们有99%的把握认为吸烟与患肺癌有关,则在100个吸烟的人中必有99个人患肺癌
B.由独立性检验可知,当有99%的把握认为吸烟与患肺癌有关时,若某人吸烟,则他有99%的可能患有肺癌
C.通过计算推断出吸烟与患肺癌有关联,且此推断犯错误的概率不大于0.05,是指有95%的把握认为吸烟与患肺癌有关联
D.以上三种说法都不正确
8.(25-26高三·全国·一轮复习)为了研究性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用列联表进行独立性检验,经计算,则所得到的统计学结论是认为性别与喜欢乡村音乐有关系的把握至少为( )
0.01
0.005
0.001
6.635
7.879
10.828
A. B. C. D.
9.(2026高三·全国·专题练习)在性别与吃零食这两个分类变量的计算中,下列说法正确的是________.
①若的观测值为,我们有99%的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有99%的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为99%;
③若从统计量中求出有99%的把握认为吃零食与性别有关系,是指有1%的可能性使得出的判断出现错误.
10.(25-26高二下·河南驻马店·期中)下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,若有的把握认为吸烟与患肺病有关系时,我们不可以说在100个吸烟的人中,有99人患肺病
D.在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越小
11.(2026·江苏南通·三模)为研究课后整理错题习惯与数学成绩达标之间的关联性,经独立性检验计算得,临界值,.记事件为“学生成绩达标”,事件为“学生坚持整理错题”;已知,,,则有________的把握认为二者存在关联;随机抽取一名学生,其成绩达标的概率为________.
12.(25-26高二下·黑龙江大庆·期中)独立性检验中,若小于临界值,则下列结论正确的是( )
A.两个变量一定相互独立 B.两个变量一定不独立
C.没有充分证据表明两个变量有关 D.两个变量有关联的可能性为
考点三 卡方的计算
13.(25-26高二下·河北沧州·期中)为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取男性人数与女性人数相同,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性中不喜爱钓鱼的至少有( )
附:,其中.
A.人 B.人 C.人 D.人
14.(25-26高二下·重庆·期中)某高校组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计,.
(1)根据已知条件,依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关?
性别
男生
女生
合计
不愿报名参加答题活动
愿意报名参加答题活动
合计
200
(2)假设甲每道题回答是否正确相互独立,且每次答对的概率均为.若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
15.(25-26高二·全国·暑假作业)随着国家三孩政策的全面放开,为了调查一线城市和非一线城市的三孩生育意愿,某机构用简单随机抽样的方法从不同地区调查了100位育龄妇女,结果如下表.
三孩生育意愿
城市级别
合计
非一线
一线
愿生
45
20
65
不愿生
13
22
35
合计
58
42
100
由,得 .
参照下表:
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
根据小概率值的独立性检验,可以得到的结论是________.
16.(25-26高二下·河北沧州·期中)为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射后天的结果如表所示:
电离辐射剂量
存活情况
合计
死亡
存活
第一种剂量
第二种剂量
合计
由表中数据算得:__________精确到 ,说明两种电离辐射剂量对小白鼠的致死作用__________填“相同”或“不相同”.(已知)
17.(25-26高二下·辽宁朝阳·期中)(多选)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,结果得到列联表如下:则( )
性别
男生
女生
合计
不愿报名参加答题活动
20
60
80
愿意报名参加答题活动
80
合计
100
参考公式:,其中.
附表:
0.1
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
A.当时,有的把握认为参与答题意愿与性别无关.
B.当时,有的把握认为参与答题意愿与性别有关.
C.当时,根据小概率值的独立性检验,认为参与答题意愿与性别有关联.
D.当时,根据小概率值的独立性检验,没有充分的证据推断参与答题意愿与性别有关联.
18.(25-26高二下·江西萍乡·期中)某医疗研究机构为检验某种新研发的药物对特定疾病治疗是否有效,随机选取了200名患者进行双盲实验.其中100人服用新药,100人服用旧药,统计结果如下表
治愈
未治愈
合计
服用新药
67
33
100
服用旧药
48
52
100
合计
115
85
200
附:统计量临界值表
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中.
则下列说法正确的是( )
A.有的把握认为新研发的药物对特定疾病治疗有效
B.有的把握认为新研发的药物对特定疾病治疗无效
C.有的把握认为新研发的药物对特定疾病治疗无效
D.有的把握认为新研发的药物对特定疾病治疗有效
考点四 独立性检验解决实际问题
19.(25-26高二下·河南·阶段检测)某电动汽车制造企业为了提升电池性能,研发部门对一款新型号的电池进行了充放电循环测试,测试时分别收集了使用液冷技术与风冷技术的电池各250组,测试电池电容量衰减至初始容量的时所经历的充放电循环次数,若循环次数不低于2000次,则认定为A级电池,否则认定为B级电池,统计结果如下表:
A级电池
B级电池
总计
液冷技术
200
50
250
风冷技术
150
100
250
总计
350
150
500
(1)根据小概率值的独立性检验,分析“是A级电池”与“电池冷却技术类型”是否有关;
(2)现从使用液冷技术的250组电池中,按比例用分层随机抽样的方法抽取10组电池,再从这10组电池中用无放回的方式随机抽取3组电池,记为抽到的A级电池的组数,求的分布列和数学期望.
附:.
0.050
0.010
0.001
3.841
6.635
10.828
20.(2026·河南开封·模拟预测)某团队为探究大语言模型参数量与模型性能之间的关系,训练了6个不同参数量的模型,并在同一验证集上评估性能得分,得到如下统计数据:
参数量x(亿)
2
4
6
8
10
12
性能得分y(分)
1.8
2.8
3.4
3.6
3.8
4.0
(1)求y关于x的线性回归方程(系数用分数表示),并预测参数量为14亿时,模型的性能得分;
(2)该团队比较了100次实验的实际性能与预测性能,得到“高效”(实际得分≥预测得分)和“低效”(实际得分<预测得分)两种效率组别.同时,他们记录了每次实验所用的训练数据质量等级(优质/普通),得到如下列联表:
训练数据质量等级
训练效率
总计
高效
低效
优质
42
18
60
普通
18
22
40
总计
60
40
100
请依据小概率值的独立性检验,分析训练效率是否与训练数据质量有关.
附:,,,.
.
0.05
0.01
0.001
3.841
6.635
10.828
21.(25-26高二下·四川德阳·期末)近期,高中周末双休引起热议,为调查在校高中学生对国家双休政策的支持情况,某中学数学社团在校园内对学生展开随机调查,得到下表.(数据单位:人)
支持
不支持
成绩优秀
60
30
成绩不优秀
90
30
(1)根据该数学社团的调查结果判断,有无90%把握认为支持双休政策与学生成绩是否优秀有关?
0.1
0.05
0.01
2.706
3.841
6.635
附:.
(2)若该数学社团的调查结果可靠,某文学社团按相同方式在该校园内另随机调查了14位同学.其中成绩优秀且支持双休的人数为,请参考数学社团的调查数据,估算和;
(3)该校准备从数学社团调查的210名同学中用“按比例分层抽样”的方法抽取7位同学座谈、并准备在参与座谈的同学中选取5人组成新的调查小组.假设新的调查小组中支持双休但成绩不优秀的人数为,求的分布列.
22.(25-26高二下·辽宁鞍山·期中)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中200名居民体育锻炼的次数与年龄,得到如下的频数分布表.
年龄次数
每周0∼2次
33
22
22
23
每周3∼4次
12
17
25
22
每周5次及以上
3
3
12
6
(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,
不低于3次的称为体育锻炼频率高,根据小概率值的独立性检验判断体育锻炼频率的高低与年龄是否有关联;
(2)从每周体育锻炼5次及以上的锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,
再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;
参考公式:
附:
α
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
23.(2026·河南驻马店·三模)某实验室利用基因编辑技术改良一种小麦品种,使其对锈病产生抗性.实验中将100株小麦分为两组:实验组50株接受基因编辑处理,对照组50株未处理,实验后统计各组抗病情况如下表:
抗病株数
易感病株数
实验组
38
12
对照组
25
25
(1)完成列联表并依据小概率值的独立性检验,分析该小麦品种抗锈病与接受基因编辑处理是否有关联;
(2)用接受基因编辑后小麦抗锈病株数的频率估计基因编辑后单株小麦抗锈病的概率,从接受基因编辑的小麦中随机选取10株,记其中抗锈病的株数为,求的数学期望与方差.
附:,其中.
24.(25-26高三·全国·暑假作业)为推动农村可持续生态农业的发展,广东某农场用五年的时间按照有机标准新改良了100亩土地,预计在改良后的土地上种植有机水果和其他作物,并根据市场需求确定有机水果的种植面积.农场经营采用的是CSA农业经营模式即社区支持农业,农场从CSA会员中随机抽取了南方、北方会员共200人,调查数据如下.
喜欢有机水果
不喜欢有机水果
南方会员
80
40
北方会员
40
40
(1)视频率为概率,分别估计南方、北方会员中喜欢有机水果的概率;
(2)(ⅰ)判断是否有的把握认为是否喜欢有机水果与会员的区域有关?
(ⅱ)已知农场CSA会员有2000人,其中南方会员有1200人,若喜欢有机水果的人不低于1100人,则可种植50亩左右的有机水果,否则只能种植30亩左右,试问该农场应怎样安排有机水果的种植面积.
附:,.
1.(25-26高三上·广西南宁·期末)为考查、两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物的预防效果优于药物的预防效果
B.药物的预防效果优于药物的预防效果
C.药物、对该疾病均有显著的预防效果
D.药物、对该疾病均没有预防效果
2.(25-26高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
3.(上海市黄浦区2025-2026学年第二学期高三5月模拟数学试卷)某研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计,根据统计数据制作列联表,提出原假设:“经常用流行用语”与“年轻人”没有关系,计算得,由此可知( ).(显著性水平取0.05,)
A.接受原假设,没有的把握认为“经常用流行用语”与“年轻人”有关系
B.拒绝原假设,有的把握认为“经常用流行用语”与“年轻人”有关系
C.接受原假设,有的把握认为“经常用流行用语”与“年轻人”有关系
D.拒绝原假设,有的把握认为“经常用流行用语”与“年轻人”没有关系
4.(25-26高二下·广东深圳·期中)下列说法中错误的有几个( )
①数据1,2,3,5,7,8,9的60%分位数是6;
②根据列联表中的数据计算得出,而,则“两个分类变量有关联”此推断犯错误的概率不大于0.01;
③回归分析时,可用决定系数刻画模型的拟合效果,越大,则拟合效果越好;
④若随机变量服从正态分布,若,则实数.
A.1个 B.2个 C.3个 D.4个
5.(25-26高二下·河北石家庄·期中)(多选)某校高二年级某次数学周测成绩,且,现随机抽取100名学生的成绩,统计两个变量:①变量A指是否坚持课前预习(“是”与“否”各50人);②变量B指该次数学周测成绩是否在内.整理列联表,计算得,则参考临界值:( )
A.
B.
C.根据小概率值0.10的独立性检验,认为变量A与变量B不独立
D.根据小概率值0.05的独立性检验,认为变量A与变量B不独立
6.(2026·山东聊城·二模)(多选)某医学研究团队为探究新型降压药的疗效与患者年龄的关联,将120名高血压患者按年龄分为“中青年组(<60岁)”和“老年组(岁)”,记录用药后的疗效(“有效”“无效”),得到如下列联表:
患者
疗效
总计
有效
无效
中青年组
10
40
50
老年组
40
30
70
总计
50
70
120
附:,其中.
0.10
0.05
0.025
0.01
2.706
3.841
5.024
6.635
则下列说法中正确的有( )
A.若在“老年组”中按疗效分层抽样抽取7人,再从这7人中随机抽取2人,则至少抽到1名“无效”患者的概率为
B.从所有患者中随机抽取1人,设事件“该人在中青年组”,事件“该药对此人有效”,则事件A与B相互独立
C.根据小概率值的独立性检验,认为“降压药疗效与患者年龄有关”,且该推断犯错误的概率不超过
D.若将列联表中“中青年组有效”的人数改为15,“中青年组无效”的人数改为35,则所得值比原值大
7.(25-26高二·全国·课后作业)(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”、“日落云里走,雨在半夜后” ……小波同学为了验证“日落云里走,雨在半夜后”,随机观察了他所在地区的100天日落情况和后半夜天气,得到如下列联表,
日落云里走
后半夜天气
总计
下雨
未下雨
出现
25
5
30
未出现
25
45
70
总计
50
50
100
并计算得到,下列小波对该地区天气的判断正确的是( )
A.后半夜下雨的概率约为
B.未出现“日落云里走”时,后半夜下雨的概率约为
C.在犯错误的概率不超过0.001的前提下,可以认为““日落云里走’是否出现”与“后半夜是否下雨”有关
D.根据的独立性检验,若出现“日落云里走”,则后半夜有99.9%的可能会下雨
8.(25-26高二下·甘肃酒泉·期末)下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得________.
9.(25-26高二下·江西·阶段检测)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人.
参考数据及公式:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
10.(25-26高二上·宁夏银川·期末)“双减”提出要全面减负作业总量和时长,减轻学生过重作业负担,同时坚持从严治理, 全面规范校外培训行为.在“双减”颁布前,某地教育局为了解当地中学生参加校外培训的情况,随机调查了当地100名学生,得到的数据如下表:
参加校外培训
未参加校外培训
总计
初中生
30
20
50
高中生
40
10
50
总计
70
30
100
根据该表格,在“双减”颁布前,______95%的把握认为学生是否参加校外培训与年级段有关.(填“有”或“没有”)
参考临界值表:
0.10
0.05
0.010
2.706
3.841
6.635
.
11.(2026·贵州毕节·三模)“阳光杯”中学生篮球联赛是毕节市威宁自治县极具本土特色的体育赛事,赛事深度融合威宁多民族文化与高原风情,是当地群众最喜爱的体育赛事之一.威宁县某中学为了研究不同性别的学生对该赛事的了解情况,进行了一次抽样调查,随机抽取该校男生和女生各80名作为样本.设事件“了解‘阳光杯’中学生篮球联赛”,“学生为女生”,已知,.
(1)完成下列列联表,并依据的独立性检验,能否认为该校学生对“阳光杯”中学生篮球联赛的了解情况与性别有关联?
了解
不了解
合计
男生
女生
合计
(2)现从该样本不了解“阳光杯”中学生篮球联赛的学生中,采用分层随机抽样的方法抽取10名学生,再从这10名学生中随机抽取2人,设抽取的2人中男生的人数为X,求X的分布列和数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
12.(25-26高三·全国·一轮复习)文旅部门统计了某网红景点在2025年3月至7月的旅游收入(单位:万),得到以下数据:
月份
3
4
5
6
7
旅游收入
10
12
11
12
20
(1)根据表中所给数据,用相关系数加以判断,是否可用线性回归模型拟合与的关系?若可以,求出关于之间的线性回归方程;若不可以,请说明理由;
(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的列联表,能否在犯错误的概率不超过0.001的情况下认为“游客是否喜欢该网红景点与性别有关联”.
喜欢
不喜欢
总计
男
100
女
60
总计
110
参考公式:相关系数,
参考数据:.线性回归方程:,其中,.
.
临界值表:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
13.(2026高三·全国·专题练习)考古发掘过程中运用了磁力勘探技术、电阻率勘探技术、地面透射雷达、地面电探CT技术、X射线计算机断层扫描技术等.随着科学技术的发展,越来越多的古迹具备了发掘的条件,然而相关考古专业人才却严重不足.某调查机构为了解高三学生在志愿填报时对考古专业的态度,用分层抽样的方法从某中学高三年级1200名男生和800名女生中随机抽取20名学生进行调查,调查结果如下表:
性别
不填报
填报
非第一志愿填报
第一志愿填报
男生
5
2
女生
1
0
(1)完成下面的列联表,并判断是否有的把握认为该校学生填报志愿时“是否填报考古专业”与性别有关?
是否填报
男生
女生
总计
不填报
填报
总计
20
(2)从抽出的男生中再随机抽取3人进一步了解情况,记为抽取的这3名男生中“第一志愿填报考古专业”和“非第一志愿填报考古专业”人数差的绝对值,求的数学期望.
附:,.
0.050
0.025
0.005
3.841
5.024
7.879
14.(2026·浙江·二模)睡眠是人体生理活动的基本阶段,良好的睡眠质量能够保证身体健康、增强免疫力、提高工作和学习的效率.某科研小组为了研究平均每天使用电子产品的时间(单位:h)对睡眠质量的影响,对100位志愿者平均每天使用电子产品的时间和睡眠质量进行了调研,并统计得到了如下表格:
轻度睡眠障碍人数
1
2
3
1
2
重度睡眠障碍人数
4
3
6
4
4
睡眠质量良好人数
25
25
11
5
4
总人数
30
30
20
10
10
(1)由表中的数据求这100人平均每天使用电子产品时间的估计值(同一组中的数据用该组区间的中点值代表);
(2)从这100人中随机抽取一人,求此人在轻度睡眠障碍的前提下,平均每天使用电子产品的时间在内的概率;
(3)若平均每天使用电子产品的时间大于等于4小时为超标.按所给数据,完成下面列联表,并根据小概率值的独立性检验,能否认为睡眠质量与平均每天使用电子产品的时间有关.
睡眠质量
平均每天使用电子产品的时间
合计
超标
不超标
良好
障碍(包括轻度和重度)
合计
100
附:,
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
15.(2026·河南·三模)某影城想了解观众性别与喜欢的电影类型是否有关,随机调查了300名观众,得到下表:
喜欢生活片
喜欢战争片
男性观众
70
80
女性观众
90
60
(1)根据的独立性检验,分析观众性别与喜欢的电影类型是否有关;
(2)从这300名观众中随机选择2名,在已知其中至少有1名女性观众条件下,求这2名观众都喜欢生活片的概率.
参考公式:,其中.
临界值表:
0.05
0.01
0.001
3.841
6.635
10.828
16.(2026·甘肃兰州·模拟预测)纪录片《重返狼群》再度翻红,某市为了了解市民是否关注《重返狼群》与性别的关联性,在本市随机调查了1000名市民,得到如下列联表.
性别
是否关注《重返狼群》
合计
不关注
关注
男
520
80
600
女
380
20
400
合计
900
100
1000
(1)依据小概率值的独立性检验,能否认为市民是否关注《重返狼群》与性别有关;
(2)将频率视为概率,现从全市市民中随机抽取3名,记关注《重返狼群》的人数为,求的数学期望.
附:,.
0.050
0.010
0.001
3.841
6.635
10.828
1 / 1
学科网(北京)股份有限公司
$