内容正文:
重难点培优专题8:独立性检验的综合应用
独立性检验
独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表:假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表
总计
总计
(3)独立性检验:计算随机变量利用的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
题型一:完善列联表
【例题1-1】.(24-25高二下·山东德州·阶段练习)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
题型二:卡方的计算
【例题2-1】.(24-25高三上·山东青岛·期末)已知某地区成年男士的身高(单位:)服从正态分布,体重(单位:)服从正态分布.若从该地区随机选取成年男士100人,得到数据如下表,则
身高
体重
合计
大于
小于等于
大于
a
b
小于等于
d
总计
附:若,则.
,其中.
A.根据正态分布估计
B.根据正态分布估计
C.若,根据正态分布估计b,c,d的值,基于上述数值,根据小概率值的独立性检验,分析该地区成年男士身高超过与体重超过相关联
D.若,根据正态分布估计b,c,d的值,基于上述数值,根据小概率值的独立性检验,分析该地区成年男士身高超过与体重超过相互独立
【变式2-1】.(24-25高三上·江苏南通·阶段练习)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据通过计算有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为 .
支持
不支持
男生
女生
附:,其中.
题型三:独立性检验的基本思想
【例题3-1】.(23-24高二下·全国·课堂例题)假设有两个分类变量和的列联表如下:注:的观测值.对于同一样本,以下数据能说明和有关系的可能性最大的一组是( )
总计
a
10
a+10
c
30
总计
A. B.
C. D.
【变式3-1】.(24-25高三下·山东青岛·开学考试)下表反映了12月份(共21个工作日)中,李华同学在每天的数学课上携带教材的情况,以及数学课上坐在李华同桌位置的同学,只有梓晴、陈伟和刘瑞可以作为李华的同桌.
日期
1
2
3
4
5
6
7
8
9
10
11
教材
无
有
有
无
有
有
无
有
有
无
无
同桌
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
梓晴
梓晴
陈伟
日期(续)
12
13
14
15
16
17
18
19
20
21
教材(续)
有
有
有
无
无
有
有
无
无
有
同桌(续)
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
从表格信息,我们可以推断( ):(附:)
A.有不小于95%的把握认为李华与梓晴同桌时上数学课有更大的概率携带教材
B.有不小于99%的把握认为李华与梓晴同桌时上数学课有更大的概率携带教材
C.有不小于95%的把握认为李华与刘瑞、陈伟同桌时上数学课有相等的概率携带教材
D.若强制刘瑞或陈伟与李华同桌,可能一定程度上提升李华上数学课携带教材的概率
题型四:独立性检验在体育锻炼中的应用
【例题4-1】.(23-24高三上·重庆沙坪坝·期中)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对学生体育锻炼的经常性有影响,为此随机抽取了40名学生,按照性别和体育锻炼情况整理得到如下的列联表:
性别
锻炼
合计
不经常
经常
女生
5
10
15
男生
5
20
25
合计
10
30
40
(1)根据上表数据,依据小概率值的独立性检验,能否认为性别因素会影响学生体育锻炼的经常性?
(2)如果将表中的数据都扩大为原来的倍,在相同的检验标准下,得到与(1)中不一样的结论.
(i)求的最小值;
(ii)如果抽样方式不变,你认为(1)和(2)的结论哪个更可靠,并说明理由.
附:,其中
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式4-1】.(23-24高三上·辽宁·开学考试)第31届世界大学生夏季运动会,是中国西部第一次举办世界性综合运动会,共设篮球、排球、田径、游泳等18个大项、269个小项.该届赛事约有来自170个国家和地区的1万余名运动员及官员赴蓉参加,该届赛事于2023年7月28日至8月8日在中国四川省成都市举行.为了了解关注该赛事是否与性别有关,某体育台随机抽取2000名观众进行统计,得到如下2×2列联表.
男
女
合计
关注该赛事
600
300
900
不关注该赛事
400
700
1100
合计
1000
1000
2000
(1)在所有女观众中,试估计她们关注该赛事的概率(结果用百分数表示);
(2)根据小概率值的独立性检验,能否认为是否关注该赛事与性别有关联?
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式4-2】.(2025·河北秦皇岛·二模)年哈尔滨亚洲冬季运动会,是继年北京冬奥会后中国举办的又一重大国际综合性冰雪盛会,将于年月日至月日在黑龙江省哈尔滨市举行,人们将在观看比赛的同时,开始投入健身的行列.某兴趣小组为了解哈尔滨市不同年龄段的市民每周锻炼的时长情况,随机抽取人进行调查,得到如下列联表:
年龄
周平均锻炼时长
合计
少于小时
不少于小时
岁以下
岁以上(含)
合计
(1)试根据的独立性检验,判断周平均锻炼时长是否与年龄有关;
(2)现从岁以下的样本中按周平均锻炼时长是否少于小时,用分层随机抽样的方法抽取人做进一步访谈,再从这人中随机抽取人填写调查问卷.记抽取人中周平均锻炼时长少于小时的人数为,求的分布列和数学期望.
附:,其中.
【变式4-3】.(2025高三·全国·专题练习)北京冬奥会助推户外冰雪运动发展持续升温,近年来越来越多的青年学生喜爱这一运动,为了研究性别与青年学生是否喜爱冰雪运动之间的关系,从某高校的男、女生中各随机抽取200名进行问卷调查,得到如下列联表.
喜爱
不喜爱
合计
男生
200
女生
200
合计
280
120
400
(1)当时,从样本中喜爱冰雪运动的学生中,按性别采用按比例分配的分层随机抽样方法抽取7人,再从这7人中随机抽取4人调研喜爱的原因,记这4人中男生的人数为,求的分布列与数学期望.
(2)定义,其中为列联表中第行第列的实际数据,为列联表中第行与第列的总频率之积再乘列联表的总额数得到的理论频数,如,.基于小概率值的检验规则:首先提出零假设(变量相互独立),然后计算的值,当时,我们推断不成立,即认为和不独立,该推断犯错误的概率不超过;否则,我们没有充分证据推断不成立,可以认为和独立.根据的计算公式,求解下面问题:
①当时,依据小概率值的独立性检验,分析性别与青年学生是否喜爱冰雪运动有关?
②当时,依据小概率值的独立性检验,若认为性别与青年学生是否喜爱冰雪运动有关,则至少有多少名男生喜爱冰雪运动?
附:
0.1
0.025
0.005
2.706
5.024
7.879
题型五:独立性检验在生产中的应用
【例题5-1】.(2025·云南·一模)某工厂有甲、乙两条生产线生产同一种产品,产品分为一等品和二等品.为了比较两条生产线产品的质量,分别从甲、乙两条生产线生产的产品中各随机抽取件产品作为样本,检测后得到如下列联表:
生产线
一等品
二等品
总计
甲
60
40
100
乙
70
30
100
总计
130
70
200
(1)根据列联表,能否在犯错误的概率不超过的前提下认为甲、乙两条生产线生产的产品质量有差异?(参考公式:,其中,参考数据:)
(2)从乙生产线的件样本产品中随机抽取件产品,设抽到一等品的件数为,求的分布列和数学期望.
(3)若一等品和二等品的售价分别为元/件和元/件,甲、乙两条生产线生产一件产品的成本分别为元/件和元/件.以样本中一等品的频率作为产品为一等品的概率,分别计算甲、乙两条生产线生产一件产品的利润的期望,并比较大小.
【变式5-1】.(2025·福建厦门·二模)某工厂生产某款产品,根据质量指标值Q对产品进行等级划分,Q小于60的产品视为不合格品,Q不小于60的产品视为合格品,其中Q不小于90的产品视为优质品.工厂为了提升产品质量,对设备进行升级.为考察设备升级后产品的质量,质检部门对设备升级前后生产的产品进行简单随机抽样,得到样本数据,制作如下频数表:
(1)根据所给数据填写下列2×2列联表,并依据小概率值的独立性检验,分析产品合格与设备升级是否有关联.
不合格品件数
合格品件数
合计
升级前
升级后
合计
(2)以上述样本中设备升级后的优质品频率作为升级后产品的优质品率,质检部门为检查设备升级后是否正常运转,每天从该设备生产的产品中随机抽取10件产品并检测.
(i)记X表示抽取的10件产品中的优质品件数,求(精确到0.001);
(ii)质检部门规定:若抽检的10件产品中,至少出现2件优质品,则认为设备正常运转,否则需对设备进行检修.请根据的值解释上述规定的合理性.
附:.
0.1
0.05
0.01
2.706
3.841
6.635
参考数据:,,
【变式5-2】.(2025·河北保定·一模)某工厂为了解员工绩效分数达标情况与员工性别的关系,随机对该厂男、女各30名员工的绩效分数达标情况进行调查,整理得到如下列联表:
单位:人
性别
绩效分数达标情况
合计
未达标
达标
男
20
10
30
女
5
25
30
合计
25
35
60
(1)经计算,所调查的男员工绩效分数的平均数为26;女员工绩效分数的平均数为34,求这60人绩效分数的平均数.
(2)根据上表数据,依据小概率值的独立性检验,能否据此推断绩效分数达标情况与性别有关联?
(3)该厂为激励员工,规定每月绩效分数的第一名奖励1千元,其他名次无奖励.甲为该厂员工,他在工厂开工的第一个月赢得奖励的概率为,从第二个月开始,若上个月没有赢得奖励,则这个月赢得奖励的概率为;若上个月赢得奖励,则这个月仍赢得奖励的概率为,求甲在前两个月所得奖金总额X(单位:千元)的分布列和数学期望.
附:
0.1
0.01
0.001
2.706
6.635
10.828
参考公式:,其中.
【变式5-3】.(23-24高二下·安徽六安·期末)某工厂生产某款电池,在满电状态下能够持续放电时间不低于10小时的为合格品,工程师选择某台生产电池的机器进行参数调试,在调试前后,分别在其产品中随机抽取样本数据进行统计,制作了如下的列联表:
产品
合格
不合格
合计
调试前
45
15
60
调试后
35
5
40
合计
80
20
100
(1)根据表中数据,依据的独立性检验,能否认为参数调试与产品质量有关联;
(2)现从调试前的样本中按合格和不合格,用分层随机抽样法抽取8件产品重新做参数调试,再从这8件产品中随机抽取3件做对比分析,记抽取的3件中合格的件数为,求的分布列和数学期望;
(3)用样本分布的频率估计总体分布的概率,若现在随机抽取调试后的产品1000件,记其中合格的件数为,求使事件“”的概率最大时的取值.
参考公式及数据:,其中.
0.025
0.01
0.005
0.001
5.024
6.635
7.879
10.828
题型六:独立性检验在学习中的应用
【例题6-1】.(2025·甘肃·一模)为了解高一学生整理数学错题与提高数学成绩的相关性,某小组通过随机抽样,获得了每天整理错题和未每天整理错题的各20名学生3次数学考试成绩的平均分,绘制了如图1,2的频率分布直方图,并且已知高一学生3次数学考试成绩的总体均分为115分.
(1)依据频率分布直方图,完成以下列联表:
成绩不低于总体均分
成绩低于总体均分
合计
每天整理错题
未每天整理错题
合计
(2)依据小概率值的独立性检验,分析数学成绩不低于总体均分是否与每天整理数学错题有关.
附
0.10
0.01
0.001
2.706
6.635
10.828
【变式6-1】.(23-24高二下·浙江·期中)假设通过简单随机抽样得到和的抽样数据列联表,
合计
合计
课本中给出统计量计算公式如下:
此处我们把列联表中的,,,称为观察频数,记作,(例如,),
把,,,称为期望频数,记作,
即第i行的频数和乘以第j列的频数和与频数总和的商.(例如,).则我们可以将卡方统计量的计算公式写成以下更为一般的形式:(Σ表示对后面的代数式求和)
根据以上信息,假设一项研究旨在分析不同教学方法对学生数学成绩的影响。研究中采用了三种不同的教学方法:传统方法、在线学习和互动式学习。学生根据他们的成绩被分为三个级别:低、中、高,用频率估计概率。研究结果如下表所示:
教学方法\成绩级别
低
中
高
总计
传统方法
20
30
50
100
在线学习
35
45
20
100
互动式学习
25
15
60
100
总计
80
90
130
300
(1)已知在“传统方法”中,参加数学兴趣小组的同学按照成绩“低”、“中”、“高”的分别占对应人数的、、,求“传统方法”中参加数学兴趣小组同学的概率.
(2)(i)求,;
(ii)依据小概率值的独立性检验,分析这三种教学方法对学生数学成绩影响是否存在显著差异.
参考数据:
0.100
0.050
0.025
0.010
0.005
7.78
9.49
11.14
13.28
14.86
题型七:独立性检验在航天科技中的应用
【例题7-1】.(24-25高二下·山东德州·阶段练习)某航天公司研发一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:
飞行距离(km)
56
63
71
79
90
102
110
117
损坏零件数(个)
61
73
90
105
119
136
149
163
(1)建立关于的回归模型,根据所给数据及回归模型,求关于回归方程;(精确到0.1,精确到1)
(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,飞行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的推进器占比30%,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?
\
保养
未保养
合计
报废
20
未报废
合计
60
100
参考数据、公式如下:
,,,,,其中.
0.25
0.1
0.05
0.025
0.01
0.001
1.323
2.706
3.841
5.024
6.635
10.828
【变式7-1】.(24-25高二下·安徽亳州·阶段练习)随着科技的进步,近年来,我国新能源汽车产业迅速发展,各大品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升.小赵同学对某品牌新能源汽车近5年的广告费投入(单位:亿元)进行了统计,具体数据见下表:
年份代号
1
2
3
4
5
广告费投入
4.8
5.6
6.2
7.6
8.8
并随机调查了200名市民对该品牌新能源汽车的认可情况,得到的部分数据见下表:
认可
不认可
50岁以下市民
70
30
50岁以上市民
60
40
(1)求广告费投入与年份代号之间的线性回归方程;
(2)依据小概率值的独立性检验,能否认为市民的年龄与对该品牌新能源汽车的认可度有关?
附:①回归直线中
②,其中.
0.15
0.10
0.05
0.025
0.010
0.065
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
题型八:独立性检验在农业中的应用
【例题8-1】.(2025高三·全国·专题练习)某地区为了检测某种农业有机肥料的效果,农业专家播撒肥料到200块试验田中,一段时间后测量土地的某项肥力指标,按,,,,分组,绘制成如下频率分布直方图.试验后发现,产生土地肥力的为160块,其中该项指标不小于60的有110块.假设各块试验田播撒肥料后是否产生肥力相互独立.
填写下面的列联表,并根据列联表及的独立性检验,判断能否认为播撒肥料试验田产生肥力与指标值不小于60有关.
指标值
合计
小于60
不小于60
产生肥力
未产生肥力
合计
参考公式:(其中为样本容量)
参考数据:
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
【变式8-1】.(2025·湖南·二模)中国是茶的故乡,茶文化源远流长,博大精深.某兴趣小组,为了了解当地居民对喝茶的态度,随机调查了100人,并将结果整理如下:
单位:人
年龄段
态度
合计
不喜欢喝茶
喜欢喝茶
35岁以上(含35岁)
30
30
60
35岁以下
25
15
40
合计
55
45
100
(1)依据小概率值的独立性检验,能否据此推断该地居民喜欢喝茶与年龄有关?
(2)以样本估计总体,用频率代替概率.该兴趣小组在当地喜欢喝茶的人群中,随机选出2人参加茶文化艺术节.抽取的2人中,35岁以下的人数记为,求的分布列与期望.
参考公式:,其中.
参考数据:
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式8-2】.(2023·江西·模拟预测)为推动农村可持续生态农业的发展,广东某农场用五年的时间按照有机标准新改良了亩土地,预计在改良后的土地上种植有机水果和其它作物,并根据市场需求确定有机水果的种植面积.农场经营采用的是农业经营模式即社区支持农业,农场从会员中随机抽取了南方、北方会员共人,调查数据如下.
喜欢有机水果
不喜欢有机水果
南方会员
北方会员
(1)视频率为概率,分别估计南方、北方会员中喜欢有机水果的概率;
(2)根据小概率值的独立性检验,能否认为是否喜欢有机水果与会员的区域有关?
(3)已知农场会员有人,其中南方会员有人,若喜欢有机水果的人不低于人,则可种植亩左右的有机水果,否则只能种植亩左右,试问该农场应怎样安排有机水果的种植面积.
0.05
0.025
0.005
3.841
5.024
7.879
附:.
【变式8-3 】.(23-24高三上·湖南长沙·阶段练习)某种植物感染病毒极易死亡,当地生物研究所为此研发出了一种抗病毒的制剂.现对20株感染了病毒的该植株样本进行喷雾试验测试药效.测试结果分“植株死亡”和“植株存活”两个结果进行统计,并对植株吸收制剂的量(单位:毫克)进行统计.规定植株吸收在6毫克及以上为“足量”,否则为“不足量”.现对该20株植株样本进行统计,其中“植株存活”的13株,对制剂吸收量统计得下表.已知“植株存活”但“制剂吸收不足量”的植株共1株.
编号
1
2
3
4
5
6
7
8
9
10
吸收量(毫克)
6
8
3
8
9
5
6
6
2
7
编号
11
12
13
14
15
16
17
18
19
20
吸收量(毫克)
7
5
10
6
7
8
8
4
6
9
(1)补全列联表中的空缺部分,依据的独立性检验,能否认为“植株的存活”与“制剂吸收足量”有关?
吸收足量
吸收不足量
合计
植株存活
植株死亡
合计
(2)现假设该植物感染病毒后的存活日数为随机变量(可取任意正整数).研究人员统计大量数据后发现:对于任意的,存活日数为的样本在存活日数超过的样本里的数量占比与存活日数为1的样本在全体样本中的数量占比相同,均等于0.1,这种现象被称为“几何分布的无记忆性”.试推导的表达式,并求该植物感染病毒后存活日数的期望的值.
附:,其中;当足够大时,.
0.010
0.005
0.001
6.635
7.879
10.828
题型九:独立性检验在食品安全中的应用
【例题9-1】.(24-25高三下·湖南衡阳·阶段练习)食品安全负责部门为了对某大型超市经营的某品牌(由A,B两个不同的产地生产)的“预制食品”的某些指标进行检测,随机从A,B两个产地生产的产品中分别抽取了30个作为样本进行检测,依据检测相应指标的相关数据,将其划定为“优良”和“合格”两个级别,记录相关数据得到如下2×2列联表:
单位:个
级别
产地
合计
A
B
优良
20
15
35
合格
10
15
25
合计
30
30
60
(1)依据小概率值的独立性检验,分析“该食品的指标等级与产地”是否有关?
(2)该超市对该“预制食品”进行打包促销,对于同一产地生产的食品采用每5个装为一个“促销大礼包”的促销形式,若某顾客随机购买了一个“促销大礼包”,经检测显示恰有4个为优良级别,试通过概率知识确定该“促销大礼包”内装的是A产地生产的食品的概率(该超市A,B两个产地的售出量之比为3:2,以列联表中产品的优良的频率代替各自产品优良的概率).
参考公式和数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
题型十:独立性检验在调查中的应用
【例题10-1】.(2025·辽宁·一模)心流是由心理学家米哈里提出的概念,指人们在进行某项活动时,完全投入并享受其中的状态.某中学的学习研究小组设计创新性学习活动,用来研究学生在创新性学习活动中体验到心流是否与性别有关.若从该班级中随机抽取1名学生,设“抽取的学生在创新性学习活动中体验到心流”,“抽取的学生为女生”,.
(1)求和,并解释所求结果大小关系的实际意义;
(2)为进一步验证(1)中的判断,该研究小组用分层抽样的方法在该地抽取了一个容量为的样本,利用独立性检验,计算得.为提高检验结论的可靠性,现将样本容量调整为原来的倍,使得能有的把握肯定(1)中的判断,试确定k的最小值.
参考公式及数据:,.
0.01
0.005
0.001
6.635
7.879
10.828
【变式10-1】.(24-25高三下·河北石家庄·开学考试)2024年6月5日《中国教育报》刊发了教育部的“呵护好孩子的眼睛,共创光明的未来”的文章,其中特别强调“幼儿单次使用电子产品的时间不宜超过15分钟,累计每天不超过1小时”等内容.为切实提升儿童青少年视力健康整体水平,某学校积极推进近视综合防控,落实“明眸”工程,开展了近视原因的调查以备有效进行预防.在已近视的学生中随机调查了100人,同时在未近视的学生中随机调查了100人,得到如下数据:
电子产品
近视
未近视
非长时间使用电子产品
40
70
长时间使用电子产品
60
30
(1)依据小概率值的独立性检验,能否认为患近视与长时间使用电子产品有关?
(2)用频率估计概率,从已经近视的学生中采用随机抽样的方式选出1名学生,利用“物理+药物”治疗方案对该学生进行治疗.已知“物理+药物”治疗方案的治愈数据如下:在已近视的学生中,对非长时间使用电子产品的学生的治愈率为,对长时间使用电子产品的学生的治愈率为,求该近视学生被治愈的概率;
(3)若按样本数据利用分层随机抽样的方法从近视学生中抽取5人,再从这5人中抽取3人进行近视矫正实验,记表示这3人中长时间使用电子产品的人数,求的分布列与数学期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式10-2】.(24-25高三下·甘肃·开学考试)“八段锦”,起源于北宋,已有八百多年的历史. 古人把这套动作比喻为“锦”,意为五颜六色,美而华贵. 体现其动作舒展优美,视其为“祛病健身,效果极好,编排精致,动作完美”,此功法分为八段,每段一个动作,故名为“八段锦”. 作为传统养生功法,对人体有着很多的益处. 为了继续推广“八段锦”,吸引更多的老年市民练习“八段锦”,促进老年市民的延年益寿,市老体协统计了全市的男性老年人和女性老年人(不小于 60 岁的均为老年人)练习“八段锦”的情况,采用简单随机抽样的方法抽取了练习“八段锦”的 200 位老年人,得到了性别与年龄的有关数据,并整理得到以下列联表:
类型
年龄 (岁)
合计
男性
36
111
女性
25
合计
200
(1)补全 列联表,并依据小概率值 的独立性检验,能否认为老年人的性别与年龄是否大于 65 岁有关联?
(2)在这 200 位老年人随机抽取一位,求在该老人年龄大于 65 岁的情况下,为女性老年人的概率.
附: ,其中 .
0.01
0.005
0.001
6.635
7.879
10.828
【变式10-3】.(2025·江西·一模)一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车
倾向于购买新能源车
合计
女性居民
150
250
400
男性居民
350
250
600
合计
500
500
1000
(1)能否有99%的把握认为对新能源车与燃油车的购买倾向存在性别差异?
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率.
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,其中.
在统计中,用以下结果对变量的独立性进行判断:
当时,没有充分的证据判断变量,有关联,可以认为变量,是没有关联的;
当时,有90%的把握判断变量,有关联;
当时,有95%的把握判断变量,有关联;
当时,有99%的把握判断变量,有关联.
【变式10-4】.(24-25高三上·四川巴中·期末)一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车
倾向于购买新能源车
合计
女性居民
150
250
400
男性居民
350
250
600
合计
500
500
1000
(1)依据小概率值的独立性检验,分析对新能源车与燃油车的购买倾向是否存在性别差异;
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率;
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式10-5】.(2024·安徽·三模)某校为了给高三学生举办“18岁成人礼”活动,由团委草拟了活动方案,并以问卷的形式调查了部分同学对活动方案的评分(满分100分),所得评分统计如图所示.
(1)以频率估计概率,若在所有的学生中随机抽取3人,记评分在的人数为,求的数学期望和方差.
(2)为了解评分是否与性别有关,随机抽取了部分问卷,统计结果如下表所示,则依据的独立性检验,能否认为评分与性别有关?
男生
女生
评分
30
35
评分
20
15
(3)若将(2)中表格的人数数据都扩大为原来的10倍,则依据的独立性检验,所得结论与(2)中所得结论是否一致?直接给出结论即可,不必书写计算过程.
参考数据:
0.1
0.05
0.01
2.706
3.841
6.635
题型十一:独立性检验在人工智能中的应用
【例题11-1】.(24-25高二下·河南南阳·阶段练习)在2025年春晚《秧BOT》节目中,宇树科技的Unitree H1“福兮”机器人采用人工智能(AI)驱动全身运动控制技术,能根据音乐旋律调整舞步,其最大关节扭矩高达360牛顿•米.节目播出后引发公众对机器人技术的兴趣和热情,为了了解不同性别的学生对AI的关注情况,随机抽取了90名学生,调查结果如下表:
关注
不关注
合计
男生
55
60
女生
合计
75
(1)完成上述列联表,依据该统计数据,能否有的把握认为学生对AI的关注与性别有关?
(2)在这90名学生中随机抽取一位,求在关注AI的情况下,该生为女生的概率.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【变式11-1】.(24-25高三下·上海·阶段练习)向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展以人工智能的应用为例,人工智能中的文生视频模型Sora(以下简称Sora),能够根据用户的文本提示创建最长60秒的逼真视频.为调查Sora的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
Sora的应用情况
视频从业人员
合计
减少
未减少
应用
54
18
72
没有应用
36
42
78
合计
90
60
150
0.010
0.005
0.001
6.635
7.879
10.828
(1)根据所给数据,判断是否有的把握认为Sora的应用与视频从业人员的减少有关?
(附:,其中.)
(2)某公司视频部拟开展Sora培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用Sora.
(i)求员工经过培训能应用Sora的概率;
(ii)已知开展Sora培训前,员工每人每年平均为公司创造利润6万元;开展Sora培训后,能应用Sora的员工每人每年平均为公司创造利润10万元;Sora培训平均每人每年成本为1万元.视频部现有员工100人,根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展Sora培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
【变式11-2】.(2025·河南安阳·一模)随着网络App的普及与发展,刷“抖音”成为了人们日常生活的一部分.某地区随机抽取了部分20~40岁的“抖音”用户,调查他们日均刷“抖音”的时间情况,所得数据统计如下表:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
男性
48
72
女性
24
56
(1)依据小概率值的独立性检验,能否认为日均刷“抖音”时间的长短与性别有关?
(2)现从被调查的日均刷“抖音”时间超过2小时的用户中,按照性别比例采用分层随机抽样的方法抽取3名用户参加抖音知识问答,已知男性用户、女性用户顺利完成知识问答的概率分别为,,每个人是否顺利完成知识问答相互独立,求在有且仅有2人顺利完成知识问答的条件下,这2人性别不同的概率.
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
题型十二:独立性检验在医药中的应用
【例题12-1】.(2025高三·全国·专题练习)为了了解某种新型药物对治疗某种疾病的疗效,某机构日前联合医院,进行了小规模的调查,结果显示,相当多的受访者担心使用新药后会有副作用.为了了解使用该种新型药品后是否会引起疲乏症状,该机构随机抽取了某地患有这种疾病的275人进行调查,得到统计数据如表:
无疲乏症状
有疲乏症状
总计
未使用新药
150
25
t
使用新药
x
y
100
总计
225
m
275
(1)求列联表中的数据的值,判断有疲乏症状与使用该新药是否有关?
(2)从使用该新药的100人中按是否有疲乏症状,采用分层随机抽样的方法抽出4人,再从这4人中随机抽取2人做进一步调查,求这2人中恰有1人有疲乏症状的概率.
附:.
【变式12-1】.(2025·江西鹰潭·一模)预防接种是预防掌握传染病最经济、最有效的手段,是预防疾病传播和保护群众的重要措施.为了考查一种新疫苗预防某一疾病的效果,研究人员对一地区某种动物(数量较大)进行试验,从该试验群中随机抽查了50只,得到如下的样本数据(单位;只):
发病
没发病
合计
接种疫苗
7
18
25
没接种疫苗
19
6
25
合计
26
24
50
(1)能否在犯错误的概率不超过0.001的前提下,认为接种该疫苗与预防该疾病有关?
(2)从该地区此动物群中任取一只,记表示此动物发病,表示此动物没发病,表示此动物接种疫苗,定义事件的优势,在事件发生的条件下的优势,利用抽样的样本数据,求的估计值.
(3)若把表中的频率视作概率,现从该地区没发病的动物中抽取3只动物,记抽取的3只动物中接种疫苗的只数为,求随机变量的分布列、数学期望.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【变式12-2】.(2024·吉林长春·一模)某医学研究团队经过研究初步得出检测某种疾病的患病与否和某项医学指标有关,利用该指标制定一个检测标准,需要确定临界值,将该指标大于的人判定为阳性(患病),小于或等于的人判定为阴性(未患病).此检测标准的漏诊率是将患病者判定为阴性的概率;误诊率是将未患病者判定为阳性的概率.
(1)随机抽取男女各500人进行检验,采用临界值进行判定时,误判共10人(漏诊与误诊之和),其中2男8女,写出列联表,依据小概率值的独立性检验,能否认为误判与性别有关?
(2)经过大量调查,得到如下的患病者和未患病者该指标的频率分布表:
指标
[95,100]
(100,105]
(105,110]
(110,115]
(115,120]
(120,125]
(125,130]
患病者频率
0.01
0.06
0.17
0.18
0.2
0.2
0.18
指标
[70,75]
未患病者频率
0.19
0.2
0.2
0.18
0.17
0.05
0.01
假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.若漏诊率和误诊率同时控制在以内(小于等于),求临界值的范围;
(3)在(2)条件下,求出误判率(漏诊率与误诊率之和)最小时的临界值及对应的误诊率和漏诊率.
附:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
题型十三:独立性检验在研学中的应用
【例题13-1】.(23-24高三上·山东·阶段练习)研学旅行作为一种新兴的教学方式,越来越受中学生的青睐,国家也颁布了一系列政策推进研学旅行发展.为了解学生对“暑期研学旅行”的满意度,某教育部门对180名初一至高三的中学生进行了问卷调查.参与问卷调查的男女比例为5:4,女生初、高中比例为3:1.
(1)完成下面的列联表,并依据的独立性检验,判断“暑期研学旅行”的满意度与性别是否有关联;
性别
满意度
合计
满意
不满意
男生
80
女生
50
合计
(2)该教育部门采用分层随机抽样的方法从参与问卷调查的女生中抽取了8名学生.现从这8名学生中随机抽取4人进行座谈,设抽取的女生是初中生的人数为,求的分布列及数学期望.
附:,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
题型十四:独立性检验在电子竞技中的应用
【例题14-1】.(24-25高三下·重庆沙坪坝·开学考试)继 2023 年电子竞技首次作为正式竞赛项目登上杭州亚运会舞台后,2024 年国际奥委会宣布首届奥林匹克电子竞技运动会将于 2025 年在沙特阿拉伯王国举办.这意味着电子竞技作为虚拟体育正式成为奥运会项目的一部分.为迎接电子竞技行业这一里程碑式的时刻, 甲、乙两俱乐部计划按照现今体育比赛中的赛制举办友谊赛.在体育比赛中有两种常见赛制:一种是局胜制,例如一场比赛有5局, 率先胜3局一方获胜,本场比赛结束; 另一种是局胜制,例如一场比赛有7局,率先胜4局一方获胜, 本场比赛结束.
(1)若采用5局3胜制,甲俱乐部每场比赛获胜的概率为0.8;若采用7局4胜制,甲俱乐部每场比赛获胜的概率为0.9.已知甲、乙俱乐部采用这两种赛制各进行了场比赛,试自行绘制列联表,并根据小概率值的独立性检验,来推断赛制是否对甲队获胜的场数有影响;
(2)设甲俱乐部每局比赛获胜的概率均为,且每局比赛都能决出胜负,没有平同: ①若两俱乐部采用5局3胜制比赛,记事件: “甲俱乐部只要取得3局比赛的胜利比赛结束且甲获胜”,事件: “两俱乐部赛满5局,甲俱乐部至少取得3局比赛胜利且甲获胜”,试证明:;
②若甲、乙两俱乐部创造一种全新的赛制,约定比赛规则为:共进行局,赢得局数大于 局的俱乐部获胜.若甲俱乐部每局比赛获胜的概率,试判断进行几局比赛时,甲俱乐部获胜的概率最大,并说明理由.
0.10
0.05
0.025
0.010
2.706
3.841
5.024
6.635
附:,其中 .
一、单选题
1.(24-25高三上·湖北襄阳·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.789
附:
A.有99.5%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
2.(24-25高三上·山西运城·开学考试)下列说法错误的是( )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.在一元线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05
二、多选题
3.(24-25高三上·江苏苏州·期末)为比较甲、乙两所学校学生的数学水平,采取简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名学生数学成绩优秀;乙校45名学生中有7名学生数学成绩优秀.整理数据如下表:
学校
数学成绩
合计
不优秀
优秀
甲校
33
10
43
乙校
38
7
45
合计
71
17
88
附:.
参考数据:
则下列说法正确的有( )
A.甲校的数学抽测成绩优秀率一定比乙校的数学抽测成绩优秀率高
B.甲校的数学成绩优秀率一定比乙校的数学成绩优秀率高
C.甲校的数学优秀人数可能比乙校的数学优秀人数多
D.对于小概率值,可以认为两校的数学成绩优秀率几乎没有差异
4.(24-25高三上·四川·期中)为了研究某校高三年级学生的性别和身高是否低于的关联性,研究小组从该校高三学生中获取容量为500的有放回简单随机样本,由样本数据整理得到如下列联表:
单位:人
性别
身高
合计
低于
不低于
女
140
60
200
男
120
180
300
合计
260
240
500
附:,其中.
α
小组成员甲用该列联表中的数据进行独立性检验,小组成员乙将该列联表中的所有数据都缩小为原来的后再进行独立性检验,则下列说法正确的是( )
A.依据的独立性检验,小组成员甲可以认为该中学高三年级学生的性别与身高有关联
B.依据的独立性检验,小组成员甲不能认为该中学高三年级学生的性别与身高有关联
C.小组成员甲、乙计算出的值相同,依据的独立性检验,他们得出的结论也相同
D.小组成员甲、乙计算出的值不同,依据的独立性检验,他们得出的结论也不同
5.(24-25高二下·全国·单元测试)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表.经计算,则可以推断出( )
满意
不满意
男
30
20
女
40
10
A.该学校男生对食堂服务满意的概率的估计值为
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.有不少于95%的把握认为男、女生对该食堂服务的评价有差异
D.有不少于99%的把握认为男、女生对该食堂服务的评价有差异
三、解答题
6.(2024·四川德阳·模拟预测)恰逢盛世,风调雨顺.某稻米产地今秋获得大丰收,为促进当地某品牌大米销售,甲、乙两位驻村干部通过直播宣传销售所驻村生产的该品牌大米.通过在某时段100名顾客在观看直播后选择在甲、乙两位驻村干部的直播间(下简称甲直播间、乙直播间)购买的情况进行调查(假定每人只在一个直播间购买大米),得到以下数据:
网民类型
在直播间购买大米的情况
合计
在甲直播间购买
在乙直播间购买
本地区网民
外地区网民
30
45
合计
20
100
(1)补全2×2列联表,并判断依据小概率值的独立性检验,能否认为网民选择在甲、乙直播间购买大米与网民所处地区有关;
(2)用样本分布的频率分布估计总体分布的概率,若共有名网民在甲、乙直播间购买大米,且网民选择在甲、乙两个直播间购买大米互不影响,记其中在甲直播间购买大米的网民数为,求使事件“”的概率取最大值时的值.
附:,其中.
a
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
7.(2025·吉林·二模)国家设立国家自然科学基金,用于资助基础研究,支持人才培养和团队建设. 现对近4年的国家自然科学基金项目支出(以下简称项目支出)概况进行统计,得到数据如下表:
年份
2020年
2021年
2022年
2023年
年份序号
1
2
3
4
项目支出/百亿元
90
96
100
108
(1)经过数据分析,发现年份序号与项目支出具有线性相关关系. 请求出项目支出y关于年份序号x的经验回归方程,并预测2025年的项目支出;
(2)天元基金是国家自然科学基金中的数学专项基金之一,为促进甲、乙两个地区天元基金申报者的交流,天元基金委员会举办了论坛活动. 经调查统计,甲、乙两个地区共有200人参加此次论坛活动,具体数据如下表:
男生
女生
合计/人
甲
65
35
100
乙
45
55
100
合计/人
110
90
200
(i)根据小概率值的独立性检验,能否认为申报者所在地区与性别有关联?
(ii)为了解此次论坛活动的满意度(满意度评分满分为10分),现采用按男、女样本量比例分配的分层随机抽样,从上述200人中抽取40人进行访谈,其中男生样本的满意度平均数为9分,方差为7.19,女生样本的满意度平均数为7分,方差为6.79,由这些数据,请求出总样本的满意度的平均数和方差,并对全体参加此次论坛活动的天元基金申报者的满意度的平均数和方差作出估计.
附:,,,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
8.(23-24高二下·上海奉贤·期末)某疾病预防中心随机调查了340名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如表所示.
不吸烟者
吸烟者
总计
不患慢性气管炎者
120
160
280
患慢性气管炎者
15
45
60
总计
135
205
340
(1)是否有95%的把握认为患慢性气管炎与吸烟有关?
(2)现从不患慢性气管炎者的样本中,按分层抽样的方法选出7人,从这7人里再随机选取3人,求这3人中,不吸烟者的人数X的数学期望.
附:,.
9.(24-25高二上·广西梧州·期末)某超市为调查顾客单次消费金额与性别是否有关,随机抽取70位当日来店消费的顾客,其中女性顾客有40人,统计发现,单次消费超过100元的占抽取总人数的,男性顾客单次消费不超过100元的占抽取总人数的.
单次消费超过100元
单次消费不超过100元
合计
女性
男性
合计
(1)根据所给数据完成列联表,是否有的把握认为顾客单次消费是否超过100元与性别有关联?
(2)在“单次消费超过100元”的顾客中,按照性别比例采用分层随机抽样的方法抽取7人,再从这7人中任选3人参与问卷调查,记3人中女性人数为,求的分布列与数学期望.
参考公式:(其中.
参考数据:
0.050
0.025
0.01
3.841
5.024
6.635
10.(2025·广西柳州·模拟预测)某公司推出一种新品,为了解某地区消费者对新产品的满意度,从中随机调查了名消费者,得到下表:
性别
满意度
合计
满意
不满意
男
220
30
250
女
230
20
250
合计
450
50
500
(1)依据小概率值的独立性检验,能否认为消费者对新产品的满意度与性别有关;
(2)若用频率估计概率,从该地区消费者中随机选取3人,用表示不满意的人数,求的分布列与数学期望.
附:其中.
0.1
0.05
0.01
2.706
3.841
6.635
11.(24-25高三上·甘肃酒泉·期末)在2024年“五四青年节”,某校举办了有关五四运动的知识竞赛活动,为了调查学生对本次活动的满意度,从该校学生中随机抽取一个容量为()的样本进行调查,调查结果如下表:
满意
不满意
合计
男生
女生
合计
(1)完成上面的列联表,若有不少于的把握认为“性别与满意度有关系”,求样本容量的最小值;
(2)本次知识竞赛的晋级环节设置3道必答题目,至少答对2道题目则晋级,否则被淘汰.某年级有20名同学进入晋级环节,根据统计,每人对这3道题目答对的概率分别为,且3道题目答对与否互不影响.
①设表示这20人中晋级的人数,求;
②记这20人中()人晋级的概率为,求取得最大值时的取值.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
12.(2025高三·全国·专题练习)某校采用“翻转课堂”的教学模式,即学生先自学,然后老师再讲学生不会的内容.此地教育部门为调查在此模式下学生的物理考试成绩是否及格(60分及格)与每周学习物理的时间是否足够12小时的相关关系,随机抽取该校49名学生进行了解,其中每周学习物理的时间不少于12小时的有21位学生.余下的人中,物理考试成绩不足60分的学生占余下人数的,每周学习物理的时间不少于12小时但物理考试成绩不足60分的有8位学生.
(1)请完成下面的2×2列联表,并判断能否依据小概率值的独立性检验认为“物理考试成绩是否及格与每周学习物理的时间是否足够12小时有关”.
大于等于60分
不足60分
合计
学时不少于12小时
8
21
学时不足12小时
合计
49
(2)若将频率视为概率,从全校物理考试成绩大于等于60分的学生中随机抽取20人,求这些人中每周学习物理的时间不少于12小时的人数的期望和方差.
附,其中.
α
0.050
0.025
0.005
0.001
3.841
5.024
7.879
10.828
13.(2024·甘肃张掖·一模)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活,某小区将一周网上买菜次数超过3次的居民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的居民认定为“不喜欢网上买菜”.为了解该社区居民网上买菜的情况,工作人员随机抽取了该社区100名居民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的居民
40
10
50
年龄超过45岁的居民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析该社区的居民是否喜欢网上买菜与年龄有关系.
(2)居民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜.如果周一选择在平台买菜,那么周二选择在平台买菜的概率为;如果周一选择在平台买菜,那么周二选择在平台买菜的概率为,求小张周二选择在平台买菜的概率.
(3)用频率估计概率,现从该社区随机抽取10名居民,记其中喜欢网上买菜的居民人数为随机变量,并记随机变量,求X,Y的数学期望和方差.
参考公式及数据:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
14.(24-25高三上·山东德州·阶段练习)某高中学校为了解学生参加体育锻炼的情况,统计了全校所有学生在一年内每周参加体育锻炼的次数,现随机抽取了60名同学在某一周参加体育锻炼的数据,结果如下表
一周参加体育锻炼次数
0
1
2
3
4
5
6
7
合计
男生人数
1
2
4
5
6
5
4
3
30
女生人数
4
5
5
6
4
3
2
1
30
合计
5
7
9
11
10
8
6
4
60
(1)若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为“不经常锻炼”.请完成以下2×2列联表,并依据独立性检验,能否有90%的把握认为性别因素与学生体育锻炼的经常性有关系;
性别
锻炼
合计
不经常
经常
男生
女生
合计
(2)若将一周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼”会导致肥胖等诸多健康问题,以样本频率估计概率,在全校抽取20名同学,其中“极度缺乏锻炼”的人数为X,求和;
(3)若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为,求的分布列和数学期望.
附:
参考数据:
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
15.(2023·安徽蚌埠·一模)文旅部门统计了某网红景点在2022年3月至7月的旅游收入(单位:万),得到以下数据:
月份
3
4
5
6
7
旅游收入
10
12
11
12
20
(1)根据表中所给数据,用相关系数加以判断,是否可用线性回归模型拟合与的关系?若可以,求出关于之间的线性回归方程;若不可以,请说明理由(精确到0.001);
(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的列联表,并判断能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关”.
喜欢
不喜欢
总计
男
100
女
60
总计
110
参考公式:相关系数,参考数据:,线性回归方程:,其中,,,其中.
临界值表:
0.010
0.005
0.001
6.635
7.879
10.828
16.(2024高三·全国·专题练习)为积极响应国家“阳光体育运动”的号召,某学校在了解到学生的实际运动情况后,发起以“走出教室,走到操场,走到阳光”为口号的课外活动倡议,为调查该校学生每周平均体育运动时间的情况,从高一高二基础年级与高三三个年级学生中按照的比例分层抽样,收集300位学生每周平均体育运动时间的样本数据(单位:小时),得到如图所示的频率分布直方图.(已知高一年级共有1200名学生)
(1)据图估计该校学生每周平均体育运动时间,并估计高一年级每周平均体育运动时间不足4小时的人数;
(2)规定每周平均体育运动时间不少于6小时记为“优秀”,否则为“非优秀”,在样本数据中,有30位高三学生的每周平均体育运动时间不少于6小时,请完成下列列联表,并判断是否有99%的把握认为该“校学生的每周平均体育运动时间是否‘优秀’与年级有关”.
基础年级
高三
合计
优秀
非优秀
合计
300
附:.
参考数据:
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
17.(24-25高三上·广西贵港·阶段练习)为了调查某校学生喜欢跑步是否与性别有关,高三年级特选取了200名学生进行了问卷调查,得到如下的列联表:
喜欢跑步
不喜欢跑步
合计
女生
90
120
男生
55
合计
145
200
(1)计算的值,并依据小概率值的独立性检验,判断性别与喜欢跑步是否有关?
(2)从上述的200名学生中按性别比例用分层抽样的方法抽取10名学生,再在这10人中抽取3人调查其是否喜欢跑步,用表示3人中女生的人数,求的分布列及数学期望.
附:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
18.(24-25高三上·吉林长春·阶段练习)已知某学校为提高学生课外锻炼的积极性,开展了丰富的课外活动,为了解学生对开展的课外活动的满意程度,该校随机抽取了350人进行调查,整理得到如下列联表:
性别
课外活动
合计
满意
不满意
男
150
100
250
女
50
50
100
合计
200
150
350
0.1
0.05
0.01
2.706
3.841
6.635
(1)根据小概率值的独立性检验,能否认为该校学生对课外活动的满意情况与性别因素有关联?
(2)从这350名样本学生中任选1名学生,设事件“选到的学生是男生”,事件“选到的学生对课外活动满意”,比较和的大小.
附:
19.(2024·西藏拉萨·一模)某社区组织居民开在垃圾分类知识竞赛活动.随机对该社区名居民的成绩进行统计,成绩均在内,将成绩分成组进行统计分析:第组有人,第组有16人,第组有人,第组有人,第组有人.现使用分层随机抽样的方法在第,组共选取人参加垃圾分类志愿者工作.
(1)对该社区名居民进行问卷调查,部分数据如下表所示,补全表格数据,并依据小概率值的独立性检验,分析能否认为居民喜欢垃圾分类与性别有关;
不喜欢垃圾分类
喜欢垃圾分类
合计
男
女
合计
(2)若从参加垃圾分类志愿者工作的人中随机选取人参加垃圾分类知识宣讲工作,记来自第组的人数为,求的分布列及数学期望.
附:,.
20.(24-25高三上·上海·阶段练习)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析社区的市民是否喜欢网上买菜与年龄有关?
(2)M社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;
(3)用频率估计概率,现从M社区随机抽取20名市民,记其中喜欢网上买菜的市民人数为随机变量,并记随机变量,求、的期望和方差.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式及数据:,其中.
21.(2024·四川成都·模拟预测)已知某学校为提高学生课外锻炼的积极性,开展了丰富的课外活动,为了解学生对开展的课外活动的满意程度,该校随机抽取了350人进行调查,整理得到如下列联表:
性别
课外活动
合计
满意
不满意
男
150
100
250
女
50
50
100
合计
200
150
350
(1)根据小概率值的独立性检验,能否认为该校学生对课外活动的满意情况与性别因素有关联?
(2)从这350名样本学生中任选1名学生,设事件A=“选到的学生是男生”,事件B=“选到的学生对课外活动满意”,比较和的大小,并解释其意义,
附:
0.1
0.05
0.01
2.706
3.841
6.635
22.(24-25高三上·湖南·期中)电动车的安全问题越来越引起广大消费者的关注,目前电动车的电池有石墨烯电池与铅酸电池两种.某公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500名市民,其中被调查的女性市民中偏好铅酸电池电动车的占,得到以下的2-2列联表:
偏好石墨烯电池电动车
偏好铅酸电池电动车
合计
男性市民
200
100
女性市民
合计
500
(1)根据以上数据,完成2×2列联表,依据小概率的独立性检验,能否认为市民对这两种电池的电动车的偏好与性别有关;
(2)采用分层抽样的方法从偏好石墨烯电池电动车的市民中随机抽取7人,再从这7名市民中抽取2人进行座谈,求在有女性市民参加座谈的条件下,恰有一名女性市民参加座谈的概率;
(3)用频率估计概率,在所有参加调查的市民中按男性和女性进行分层抽样,随机抽取5名市民,再从这5名市民中随机抽取2人进行座谈,记2名参加座谈的市民中来自偏好石墨烯电池电动车的男性市民的人数为X,求X的分布列和数学期望.
参考公式:,其中.
参考数据:
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
10 / 37
学科网(北京)股份有限公司
$$
重难点培优专题8:独立性检验的综合应用
独立性检验
独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表:假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表
总计
总计
(3)独立性检验:计算随机变量利用的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
题型一:完善列联表
【例题1-1】.(24-25高二下·山东德州·阶段练习)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
【答案】D
【难度】0.65
【知识点】卡方的计算、完善列联表
【分析】列出列联表,计算即可得解.
【详解】列出列联表:
男生
女生
篮球迷
90
20
110
非篮球迷
60
30
90
150
50
200
,
故在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关.
故选:D
题型二:卡方的计算
【例题2-1】.(24-25高三上·山东青岛·期末)已知某地区成年男士的身高(单位:)服从正态分布,体重(单位:)服从正态分布.若从该地区随机选取成年男士100人,得到数据如下表,则
身高
体重
合计
大于
小于等于
大于
a
b
小于等于
d
总计
附:若,则.
,其中.
A.根据正态分布估计
B.根据正态分布估计
C.若,根据正态分布估计b,c,d的值,基于上述数值,根据小概率值的独立性检验,分析该地区成年男士身高超过与体重超过相关联
D.若,根据正态分布估计b,c,d的值,基于上述数值,根据小概率值的独立性检验,分析该地区成年男士身高超过与体重超过相互独立
【答案】ABC
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、指定区间的概率
【分析】利用正态分布的性质计算可求得判断A;判断B;利用独立性检验计算可判断CD.
【详解】因为该地区成年男士的身高(单位:)服从正态分布,
由正态分布可得,
若从该地区随机选取成年男士100人,则身高大于177的人数约为16人,
所以,故A正确;
因为体重(单位:)服从正态分布.
因为体重大于,
所以可得从该地区随机选取成年男士100人,体重大于73的数约为16人,
所以体重小于等于73的数约为84人,故,故B正确;
若,则,
零假设:该地区成年男士身高超过与体重超过无关,
计算可得,
由小概率值的独立性检验,我们推断不成立,
所以该地区成年男士身高超过与体重超过相关联,故C正确;D错误.
故选:ABC.
【变式2-1】.(24-25高三上·江苏南通·阶段练习)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据通过计算有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为 .
支持
不支持
男生
女生
附:,其中.
【答案】
【难度】0.65
【知识点】卡方的计算
【分析】根据临界值表可得出关于的不等式,结合可得出的最小值,即可得出答案.
【详解】因为有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,
所以,即,
因为函数在时单调递增,
且,,,所以的最小值为,
所以在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为.
故答案为:.
题型三:独立性检验的基本思想
【例题3-1】.(23-24高二下·全国·课堂例题)假设有两个分类变量和的列联表如下:注:的观测值.对于同一样本,以下数据能说明和有关系的可能性最大的一组是( )
总计
a
10
a+10
c
30
总计
A. B.
C. D.
【答案】A
【难度】0.65
【知识点】卡方的计算、独立性检验的基本思想
【分析】当一定时,相差越大,与相差越大,的观测值就越大,得出分类变量和有关系的可能性越大.
【详解】根据独立性检验的方法和列联表可得,当与相差越大,则分类变量和有关系的可能性越大,
即相差越大,与相差越大.
由各选项可得A满足条件,
故选:A.
【变式3-1】.(24-25高三下·山东青岛·开学考试)下表反映了12月份(共21个工作日)中,李华同学在每天的数学课上携带教材的情况,以及数学课上坐在李华同桌位置的同学,只有梓晴、陈伟和刘瑞可以作为李华的同桌.
日期
1
2
3
4
5
6
7
8
9
10
11
教材
无
有
有
无
有
有
无
有
有
无
无
同桌
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
梓晴
梓晴
陈伟
日期(续)
12
13
14
15
16
17
18
19
20
21
教材(续)
有
有
有
无
无
有
有
无
无
有
同桌(续)
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
从表格信息,我们可以推断( ):(附:)
A.有不小于95%的把握认为李华与梓晴同桌时上数学课有更大的概率携带教材
B.有不小于99%的把握认为李华与梓晴同桌时上数学课有更大的概率携带教材
C.有不小于95%的把握认为李华与刘瑞、陈伟同桌时上数学课有相等的概率携带教材
D.若强制刘瑞或陈伟与李华同桌,可能一定程度上提升李华上数学课携带教材的概率
【答案】D
【难度】0.65
【知识点】独立性检验解决实际问题
【分析】完善相应的列联表,求得卡方值,比较临界值,逐项判断即可;
【详解】与梓晴同桌8天,2天带教材,6天没带;
与陈伟同桌7天,5天带教材,2天没带;
与刘瑞同桌6天,5天带教材,1天没带;
带教材
没带教材
合计
梓晴
2
6
8
其他同桌
10
3
13
合计
12
9
21
,
所以认为有95%的把握认为李华是否带教材与谁是同桌有关;
,
所以认为没有99%的把握认为李华是否带教材与谁是同桌有关;故AB错误;
带教材
没带教材
合计
刘瑞
5
1
6
陈伟
5
2
7
合计
10
3
13
,所以没有95%的把握认为李华是否带教材与谁是同桌有关,C错误;
从数据:与梓晴同桌8天,2天带教材,6天没带;
与陈伟同桌7天,5天带教材,2天没带;
与刘瑞同桌6天,5天带教材,1天没带;
可以认为强制刘瑞或陈伟与李华同桌,可能一定程度上提升李华上数学课携带教材的概率,D正确,
故选:D
题型四:独立性检验在体育锻炼中的应用
【例题4-1】.(23-24高三上·重庆沙坪坝·期中)为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对学生体育锻炼的经常性有影响,为此随机抽取了40名学生,按照性别和体育锻炼情况整理得到如下的列联表:
性别
锻炼
合计
不经常
经常
女生
5
10
15
男生
5
20
25
合计
10
30
40
(1)根据上表数据,依据小概率值的独立性检验,能否认为性别因素会影响学生体育锻炼的经常性?
(2)如果将表中的数据都扩大为原来的倍,在相同的检验标准下,得到与(1)中不一样的结论.
(i)求的最小值;
(ii)如果抽样方式不变,你认为(1)和(2)的结论哪个更可靠,并说明理由.
附:,其中
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)根据的独立性检验,没有充分证据推断不成立,因此认为成立,即学生体育锻炼的经常性与学生性别没有关系
(2)(i)的最小值为8,(ii)在抽样方式不变的情况下,(2)中的结论更可靠,理由见解析
【难度】0.65
【知识点】独立性检验解决实际问题、独立性检验的基本思想、卡方的计算、独立性检验的概念及辨析
【分析】(1)根据独立性检验的相关公式代入求出观测值,进而根据临界值表作出判断即可.
(2)(i)当表中的数据都扩大为原来的倍时,,根据题意列出不等式即可求解;(ii)由于频率具有随机性,故样本容量越大越具有说明性.
【详解】(1):学生体育锻炼的经常性与学生性别没有关系.
根据的独立性检验,没有充分证据推断不成立,因此认为成立,即学生体育锻炼的经常性与学生性别没有关系.
(2)(i)当表中的数据都扩大为原来的倍时,
根据的独立性检验,若推断不成立,即在犯错误的概率不超过0.01的前提下认为学生体育锻炼的经常性与学生性别有关系.
则有:,解得,又,故的最小值为8.
(ii)在抽样方式不变的情况下,(2)中的结论更可靠.
这是因为对于随机样本而言,频率具有随机性,我们的推断可能犯错误,样本容量越小,犯错误的可能性会越大,因此在抽样方式不变的前提下,样本容量大的结果更可靠.
【变式4-1】.(23-24高三上·辽宁·开学考试)第31届世界大学生夏季运动会,是中国西部第一次举办世界性综合运动会,共设篮球、排球、田径、游泳等18个大项、269个小项.该届赛事约有来自170个国家和地区的1万余名运动员及官员赴蓉参加,该届赛事于2023年7月28日至8月8日在中国四川省成都市举行.为了了解关注该赛事是否与性别有关,某体育台随机抽取2000名观众进行统计,得到如下2×2列联表.
男
女
合计
关注该赛事
600
300
900
不关注该赛事
400
700
1100
合计
1000
1000
2000
(1)在所有女观众中,试估计她们关注该赛事的概率(结果用百分数表示);
(2)根据小概率值的独立性检验,能否认为是否关注该赛事与性别有关联?
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
(2)认为是否关注该赛事与性别有关联
【难度】0.65
【知识点】计算古典概型问题的概率、独立性检验解决实际问题、卡方的计算、独立性检验的概念及辨析
【分析】(1)应用古典概型公式计算即可;
(2)计算卡方,再根据临界值比较即可判断.
【详解】(1)女观众关注该赛事的概率约为:.
(2)零假设为:是否关注该赛事与性别无关联.
根据列联表中的数据,经计算得到
,
根据小概率值的独立性检验,推断不成立,即认为是否关注该赛事与性别有关联.
【变式4-2】.(2025·河北秦皇岛·二模)年哈尔滨亚洲冬季运动会,是继年北京冬奥会后中国举办的又一重大国际综合性冰雪盛会,将于年月日至月日在黑龙江省哈尔滨市举行,人们将在观看比赛的同时,开始投入健身的行列.某兴趣小组为了解哈尔滨市不同年龄段的市民每周锻炼的时长情况,随机抽取人进行调查,得到如下列联表:
年龄
周平均锻炼时长
合计
少于小时
不少于小时
岁以下
岁以上(含)
合计
(1)试根据的独立性检验,判断周平均锻炼时长是否与年龄有关;
(2)现从岁以下的样本中按周平均锻炼时长是否少于小时,用分层随机抽样的方法抽取人做进一步访谈,再从这人中随机抽取人填写调查问卷.记抽取人中周平均锻炼时长少于小时的人数为,求的分布列和数学期望.
附:,其中.
【答案】(1)有关
(2)分布列见解析,
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、求离散型随机变量的均值、超几何分布的分布列
【分析】(1)根据二联表中数据,计算卡方值,即可求解;
(2)根据抽样比可得抽取的人中,周平均锻炼时长少于小时的有人,不少于小时的有人,即可利用超几何分布的概率公式求解.
【详解】(1)零假设:周平均锻炼时长是否与年龄无关,
由列联表中的数据,可得,
又,根据的独立性检验,我们推断假设不成立,
即周平均锻炼时长与年龄有关.
(2)抽取的人中,周平均锻炼时长少于小时的有人,
不少于小时的有人,
所以所有可能的取值为,
,,,
所以随机变量的分布列为:
随机变量的数学期望.
【变式4-3】.(2025高三·全国·专题练习)北京冬奥会助推户外冰雪运动发展持续升温,近年来越来越多的青年学生喜爱这一运动,为了研究性别与青年学生是否喜爱冰雪运动之间的关系,从某高校的男、女生中各随机抽取200名进行问卷调查,得到如下列联表.
喜爱
不喜爱
合计
男生
200
女生
200
合计
280
120
400
(1)当时,从样本中喜爱冰雪运动的学生中,按性别采用按比例分配的分层随机抽样方法抽取7人,再从这7人中随机抽取4人调研喜爱的原因,记这4人中男生的人数为,求的分布列与数学期望.
(2)定义,其中为列联表中第行第列的实际数据,为列联表中第行与第列的总频率之积再乘列联表的总额数得到的理论频数,如,.基于小概率值的检验规则:首先提出零假设(变量相互独立),然后计算的值,当时,我们推断不成立,即认为和不独立,该推断犯错误的概率不超过;否则,我们没有充分证据推断不成立,可以认为和独立.根据的计算公式,求解下面问题:
①当时,依据小概率值的独立性检验,分析性别与青年学生是否喜爱冰雪运动有关?
②当时,依据小概率值的独立性检验,若认为性别与青年学生是否喜爱冰雪运动有关,则至少有多少名男生喜爱冰雪运动?
附:
0.1
0.025
0.005
2.706
5.024
7.879
【答案】(1)分布列见解析,
(2)①无关联;②151名
【难度】0.65
【知识点】卡方的计算、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)由条件可得的所有可能取值为1,2,3,4,然后分别求得其对应概率,即可得到分布列,从而得到期望;
(2)由的公式代入计算,即可判断;
【详解】(1)当时,样本中喜爱冰雪运动的学生中男生有160人,女生有120人,
则采用按比例分配的分层随机抽样方法抽取的7人中,男生有4人,女生有3人.
由题意可知,的所有可能取值为1,2,3,4,
,,
,,
的分布列为
1
2
3
4
故.
(2)零假设为:性别与青年学生是否喜爱冰雪运动独立,
即性别与青年学生是否喜爱冰雪运动无关联.
当时,列联表如下:
喜爱
不喜爱
合计
男生
150
50
200
女生
130
70
200
合计
280
120
400
,,,,,,,,
.
,根据小概率值的独立性检验,我们推断成立,
即认为性别与青年学生是否喜爱冰雪运动无关联.
,
由题意可知,,整理得.又,,
,的最大值为9.
又,至少有151名男生喜爱冰雪运动.
题型五:独立性检验在生产中的应用
【例题5-1】.(2025·云南·一模)某工厂有甲、乙两条生产线生产同一种产品,产品分为一等品和二等品.为了比较两条生产线产品的质量,分别从甲、乙两条生产线生产的产品中各随机抽取件产品作为样本,检测后得到如下列联表:
生产线
一等品
二等品
总计
甲
60
40
100
乙
70
30
100
总计
130
70
200
(1)根据列联表,能否在犯错误的概率不超过的前提下认为甲、乙两条生产线生产的产品质量有差异?(参考公式:,其中,参考数据:)
(2)从乙生产线的件样本产品中随机抽取件产品,设抽到一等品的件数为,求的分布列和数学期望.
(3)若一等品和二等品的售价分别为元/件和元/件,甲、乙两条生产线生产一件产品的成本分别为元/件和元/件.以样本中一等品的频率作为产品为一等品的概率,分别计算甲、乙两条生产线生产一件产品的利润的期望,并比较大小.
【答案】(1)不能在犯错误的概率不超过的前提下认为甲、乙两条生产线生产的产品质量有差异
(2)分布列见解析,
(3)计算见解析,甲生产线生产一件产品的利润期望大于乙生产线生产一件产品的利润期望
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、超几何分布的均值、超几何分布的分布列
【分析】(1)利用公式计算,通过比较与的大小关系得到结论;
(2)由超几何分布分别求得的概率,从而得到分布列和数学期望;
(3)由表得到甲、乙生产线生产一件产品为一等品、二等品的概率,再由生产一等品和二等品的利润,得到生产一件产品的利润的期望,比较大小即可判断.
【详解】(1)由列联表可知.
代入公式可得,
因为,所以不能在犯错误的概率不超过的前提下认为甲、乙两条生产线生产的产品质量有差异.
(2)从乙生产线的件样本产品中随机抽取件产品,
抽到一等品的件数服从参数为的超几何分布.
,
,
,
,
.
所以的分布列为:
数学期望.
(3)甲生产线生产一件产品为一等品的概率为,生产一件产品为二等品的概率为,
甲生产线生产一件产品为一等品时,利润为元;为二等品时,利润为元,
乙生产线生产一件产品为一等品的概率为,生产一件产品为二等品的概率为,
乙生产线生产一件产品为一等品时,利润为元;为二等品时,利润为元.
从而甲生产线生产一件产品的利润为元,
乙生产线生产一件产品的利润为元,
因为,所以甲生产线生产一件产品的利润期望大于乙生产线生产一件产品的利润期望.
【变式5-1】.(2025·福建厦门·二模)某工厂生产某款产品,根据质量指标值Q对产品进行等级划分,Q小于60的产品视为不合格品,Q不小于60的产品视为合格品,其中Q不小于90的产品视为优质品.工厂为了提升产品质量,对设备进行升级.为考察设备升级后产品的质量,质检部门对设备升级前后生产的产品进行简单随机抽样,得到样本数据,制作如下频数表:
(1)根据所给数据填写下列2×2列联表,并依据小概率值的独立性检验,分析产品合格与设备升级是否有关联.
不合格品件数
合格品件数
合计
升级前
升级后
合计
(2)以上述样本中设备升级后的优质品频率作为升级后产品的优质品率,质检部门为检查设备升级后是否正常运转,每天从该设备生产的产品中随机抽取10件产品并检测.
(i)记X表示抽取的10件产品中的优质品件数,求(精确到0.001);
(ii)质检部门规定:若抽检的10件产品中,至少出现2件优质品,则认为设备正常运转,否则需对设备进行检修.请根据的值解释上述规定的合理性.
附:.
0.1
0.05
0.01
2.706
3.841
6.635
参考数据:,,
【答案】(1)列联表见解析,可以认为产品合格与设备升级有关联,该推断犯错误的概率不超过
(2)(i);(ii)理由见解析
【难度】0.65
【知识点】完善列联表、卡方的计算、独立性检验解决实际问题、利用二项分布求分布列
【分析】(1)先计算出的值,根据独立性检验的思想对照临界值得结论;
(2)(i)根据二项分布的有关计算公式,求出的概率;(ii)优质品件数少于2个的概率只有,据此可得结论.
【详解】(1)依题意可得列联表为:
不合格品件数
合格品件数
合计
升级前
20
80
100
升级后
10
90
100
合计
30
170
200
零假设:产品合格与设备升级没有关联,
由列联表可计算,
依据小概率的独立性检验,我们可以推断不成立,
因此可以认为产品合格与设备升级有关联,该推断犯错误的概率不超过.
(2)(i)根据题意,设备升级后的优质品率为,
可以认为从生产线中抽出的10件产品是否为优质品是相互独立的,则,
,
所以;
(ii)如果设备正常运转,一天内抽取的10 件产品中,优质品件数少于2个的概率只有,发生的概率很小,因此一旦发生这种情况,就有理由认为设备运转异常,需对设备进行检修,可见上述规定是合理的.
【变式5-2】.(2025·河北保定·一模)某工厂为了解员工绩效分数达标情况与员工性别的关系,随机对该厂男、女各30名员工的绩效分数达标情况进行调查,整理得到如下列联表:
单位:人
性别
绩效分数达标情况
合计
未达标
达标
男
20
10
30
女
5
25
30
合计
25
35
60
(1)经计算,所调查的男员工绩效分数的平均数为26;女员工绩效分数的平均数为34,求这60人绩效分数的平均数.
(2)根据上表数据,依据小概率值的独立性检验,能否据此推断绩效分数达标情况与性别有关联?
(3)该厂为激励员工,规定每月绩效分数的第一名奖励1千元,其他名次无奖励.甲为该厂员工,他在工厂开工的第一个月赢得奖励的概率为,从第二个月开始,若上个月没有赢得奖励,则这个月赢得奖励的概率为;若上个月赢得奖励,则这个月仍赢得奖励的概率为,求甲在前两个月所得奖金总额X(单位:千元)的分布列和数学期望.
附:
0.1
0.01
0.001
2.706
6.635
10.828
参考公式:,其中.
【答案】(1)
(2)有关联
(3)分布列见解析,
【难度】0.65
【知识点】计算几个数的平均数、独立性检验解决实际问题、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)根据题意计算即可;
(2)由已知数据利用公式计算,与参考数据比较大小即可得出结论;
(3)根据题意计算出可能取值及相应概率,即可得到分布列,再利用公式计算期望值.
【详解】(1)由题意可知,.
(2)零假设为:绩效分数达标情况与性别无关.
,
根据小概率值的独立性检验,我们推断不成立,即认为绩效分数达标情况与性别有关联,此推断犯错误的概率不大于0.001.
(3)由题意知可能的取值为,
则;
,
所以甲在前两个月所得奖金总额的分布列为
0
1
2
数学期望.
【变式5-3】.(23-24高二下·安徽六安·期末)某工厂生产某款电池,在满电状态下能够持续放电时间不低于10小时的为合格品,工程师选择某台生产电池的机器进行参数调试,在调试前后,分别在其产品中随机抽取样本数据进行统计,制作了如下的列联表:
产品
合格
不合格
合计
调试前
45
15
60
调试后
35
5
40
合计
80
20
100
(1)根据表中数据,依据的独立性检验,能否认为参数调试与产品质量有关联;
(2)现从调试前的样本中按合格和不合格,用分层随机抽样法抽取8件产品重新做参数调试,再从这8件产品中随机抽取3件做对比分析,记抽取的3件中合格的件数为,求的分布列和数学期望;
(3)用样本分布的频率估计总体分布的概率,若现在随机抽取调试后的产品1000件,记其中合格的件数为,求使事件“”的概率最大时的取值.
参考公式及数据:,其中.
0.025
0.01
0.005
0.001
5.024
6.635
7.879
10.828
【答案】(1)依据的独立性检验,可认为参数调试与产品质量无关联
(2)分布列见解析,数学期望为
(3)875
【难度】0.4
【知识点】独立性检验解决实际问题、服从二项分布的随机变量概率最大问题、超几何分布的均值、超几何分布的分布列
【分析】(1)计算的值,将其与对应的小概率值比较即得;
(2)先算出抽取的8件产品中的合格品与不合格品的数目,再从中抽取3件,根据合格品件数的可能值运用超几何分布概率计算出概率,列出分布列计算数学期望即得;
(3)分析得出,利用二项分布概率公式得出再利用作商法分析得时,事件“”的概率最大.
【详解】(1)零假设为:假设依据的独立性检验,认为参数调试与产品质量无关联;
则,
故依据的独立性检验,没有充分证据说明零假设不成立,
因此可认为成立,即认为参数调试与产品质量无关联;
(2)依题意,用分层随机抽样法抽取的8件产品中,
合格产品有件,不合格产品有2件,
而从这8件产品中随机抽取3件,其中的合格品件数的可能值有.
则.
故的分布列为:
1
2
3
则;
(3)依题意,因随机抽取调试后的产品的合格率为,故,
则
由,
故由可解得,
因,故当时,单调递增;
由可解得,即当时,单调递减.
故当事件“”的概率最大时,.
【点睛】方法点睛:(1)计算卡方值,并与小概率值比较得出结论;(2)求随机变量的分布列关键在于判断满足的概率模型;(3)对于二项分布中概率最大值问题,一般考虑作商后分析判断商与1的大小即得.
题型六:独立性检验在学习中的应用
【例题6-1】.(2025·甘肃·一模)为了解高一学生整理数学错题与提高数学成绩的相关性,某小组通过随机抽样,获得了每天整理错题和未每天整理错题的各20名学生3次数学考试成绩的平均分,绘制了如图1,2的频率分布直方图,并且已知高一学生3次数学考试成绩的总体均分为115分.
(1)依据频率分布直方图,完成以下列联表:
成绩不低于总体均分
成绩低于总体均分
合计
每天整理错题
未每天整理错题
合计
(2)依据小概率值的独立性检验,分析数学成绩不低于总体均分是否与每天整理数学错题有关.
附
0.10
0.01
0.001
2.706
6.635
10.828
【答案】(1)答案见解析
(2)有关
【难度】0.65
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、完善列联表、卡方的计算、独立性检验解决实际问题
【分析】(1)根据数表分析计算即可完善列联表;
(2)利用卡方计算公式,及独立性检验思想分析即可;
【详解】(1)根据频率分布直方图,可得
成绩不低于总体均分
成绩低于总体均分
合计
每天整理错题
14
6
20
未每天整理错题
5
15
20
合计
19
21
40
(2)假设:数学成绩不低于总体均分与每天整理数学错题无关.
计算可得
根据小概率值的独立性检验,可推断不成立,
即认为数学成绩不低于总体均分与每天整理错题有关.
【变式6-1】.(23-24高二下·浙江·期中)假设通过简单随机抽样得到和的抽样数据列联表,
合计
合计
课本中给出统计量计算公式如下:
此处我们把列联表中的,,,称为观察频数,记作,(例如,),
把,,,称为期望频数,记作,
即第i行的频数和乘以第j列的频数和与频数总和的商.(例如,).则我们可以将卡方统计量的计算公式写成以下更为一般的形式:(Σ表示对后面的代数式求和)
根据以上信息,假设一项研究旨在分析不同教学方法对学生数学成绩的影响。研究中采用了三种不同的教学方法:传统方法、在线学习和互动式学习。学生根据他们的成绩被分为三个级别:低、中、高,用频率估计概率。研究结果如下表所示:
教学方法\成绩级别
低
中
高
总计
传统方法
20
30
50
100
在线学习
35
45
20
100
互动式学习
25
15
60
100
总计
80
90
130
300
(1)已知在“传统方法”中,参加数学兴趣小组的同学按照成绩“低”、“中”、“高”的分别占对应人数的、、,求“传统方法”中参加数学兴趣小组同学的概率.
(2)(i)求,;
(ii)依据小概率值的独立性检验,分析这三种教学方法对学生数学成绩影响是否存在显著差异.
参考数据:
0.100
0.050
0.025
0.010
0.005
7.78
9.49
11.14
13.28
14.86
【答案】(1)
(2)(i),(ii)存在显著差异
【难度】0.65
【知识点】卡方的计算、独立性检验的基本思想、利用全概率公式求概率
【分析】(1)由条件中概率,代入全概率公式,即可求解;
(2)(ⅰ)根据和公式,即可条件中的数据,即可求解;
(ⅱ)根据公式,分别计算和,再代入求和,并和临界值比较大小,即可判断.
【详解】(1)记“传统式学习方法中成绩级别为低的同学概率”为事件A,
“传统式学习方法中成绩级别为中的同学概率”为事件B,
“传统式学习方法中成绩级别为高的同学概率”为事件C,
“传统式学习方法中参加数学兴趣小组同学的概率”为事件D.
则, ,.
(2)(i),
;
(ii)., ,
,,
,,
,
,
,,
,,
,,;
所以这三种教学方法对学生数学成绩影响存在显著差异.
题型七:独立性检验在航天科技中的应用
【例题7-1】.(24-25高二下·山东德州·阶段练习)某航天公司研发一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:
飞行距离(km)
56
63
71
79
90
102
110
117
损坏零件数(个)
61
73
90
105
119
136
149
163
(1)建立关于的回归模型,根据所给数据及回归模型,求关于回归方程;(精确到0.1,精确到1)
(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,飞行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的推进器占比30%,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?
\
保养
未保养
合计
报废
20
未报废
合计
60
100
参考数据、公式如下:
,,,,,其中.
0.25
0.1
0.05
0.025
0.01
0.001
1.323
2.706
3.841
5.024
6.635
10.828
【答案】(1);
(2)表格见解析,有关.
【难度】0.65
【知识点】求回归直线方程、完善列联表、卡方的计算、独立性检验解决实际问题
【分析】(1)利用最小二乘法求出,即可得出回归方程,
(2)根据题意可将列联表补充完整,根据公式可求得,再对照临界值表即可得出结论.
【详解】(1)由题意可得,
,
又由,,
所以,
,
所以变量关于的线性回归方程为.
(2)设零假设:是否报废与是否保养无关.
由题意,报废推进器中保养过得共台,未保养的推进器共台,补充列联表如下:
\
保养
未保养
合计
报废
6
14
20
未报废
54
26
80
合计
60
40
100
则,
根据小概率值的独立性检验,我们推断不成立,即认为是否报废与保养有关.
【变式7-1】.(24-25高二下·安徽亳州·阶段练习)随着科技的进步,近年来,我国新能源汽车产业迅速发展,各大品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升.小赵同学对某品牌新能源汽车近5年的广告费投入(单位:亿元)进行了统计,具体数据见下表:
年份代号
1
2
3
4
5
广告费投入
4.8
5.6
6.2
7.6
8.8
并随机调查了200名市民对该品牌新能源汽车的认可情况,得到的部分数据见下表:
认可
不认可
50岁以下市民
70
30
50岁以上市民
60
40
(1)求广告费投入与年份代号之间的线性回归方程;
(2)依据小概率值的独立性检验,能否认为市民的年龄与对该品牌新能源汽车的认可度有关?
附:①回归直线中
②,其中.
0.15
0.10
0.05
0.025
0.010
0.065
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)
(2)不能认为市民的年龄与对该品牌新能源汽车的认可度有关
【难度】0.65
【知识点】求回归直线方程、卡方的计算、独立性检验解决实际问题
【分析】(1)计算出平均数后,结合所给公式计算即可得回归直线方程;
(2)结算出卡方结合临界值比较即可得解.
【详解】(1),,
则,
则,故;
(2)由题以可得
,
依据小概率值的独立性检验,没有的把握认为市民的年龄与对该品牌新能源汽车的认可度具有相关性.
题型八:独立性检验在农业中的应用
【例题8-1】.(2025高三·全国·专题练习)某地区为了检测某种农业有机肥料的效果,农业专家播撒肥料到200块试验田中,一段时间后测量土地的某项肥力指标,按,,,,分组,绘制成如下频率分布直方图.试验后发现,产生土地肥力的为160块,其中该项指标不小于60的有110块.假设各块试验田播撒肥料后是否产生肥力相互独立.
填写下面的列联表,并根据列联表及的独立性检验,判断能否认为播撒肥料试验田产生肥力与指标值不小于60有关.
指标值
合计
小于60
不小于60
产生肥力
未产生肥力
合计
参考公式:(其中为样本容量)
参考数据:
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
【答案】列联表见解析,不能认为播撒肥料试验田产生肥力与指标值不小于60有关
【难度】0.65
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、完善列联表、卡方的计算、独立性检验解决实际问题
【分析】根据频率分布直方图概率性质求解各组的块数,再求解,判断与时的大小关系即可.
【详解】在指标内的有块,
同理:内的有25块,内的有35块,内的有100块,
内的有30块,
指标值
指标值
产生肥力
50
110
未产生肥力
20
20
,
所以根据列联表及的独立性检验,不能认为播撒肥料试验田产生肥力与指标值不小于60有关.
【变式8-1】.(2025·湖南·二模)中国是茶的故乡,茶文化源远流长,博大精深.某兴趣小组,为了了解当地居民对喝茶的态度,随机调查了100人,并将结果整理如下:
单位:人
年龄段
态度
合计
不喜欢喝茶
喜欢喝茶
35岁以上(含35岁)
30
30
60
35岁以下
25
15
40
合计
55
45
100
(1)依据小概率值的独立性检验,能否据此推断该地居民喜欢喝茶与年龄有关?
(2)以样本估计总体,用频率代替概率.该兴趣小组在当地喜欢喝茶的人群中,随机选出2人参加茶文化艺术节.抽取的2人中,35岁以下的人数记为,求的分布列与期望.
参考公式:,其中.
参考数据:
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)不能
(2)分布列见解析,
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)根据列联表计算得出的值即可得出结论;
(2)易知的所有取值可能为0,1,2,分别计算出对应概率可得分布列及其期望值.
【详解】(1)零假设为:该地居民喜欢喝茶与年龄没有关系.
根据列联表中的数据,可以求得.
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,据此推断该地居民喜欢喝茶与年龄没有关系.
(2)由题意可知,的取值可能为.
则.
所以的分布列为
0
1
2
所以的期望为.
【变式8-2】.(2023·江西·模拟预测)为推动农村可持续生态农业的发展,广东某农场用五年的时间按照有机标准新改良了亩土地,预计在改良后的土地上种植有机水果和其它作物,并根据市场需求确定有机水果的种植面积.农场经营采用的是农业经营模式即社区支持农业,农场从会员中随机抽取了南方、北方会员共人,调查数据如下.
喜欢有机水果
不喜欢有机水果
南方会员
北方会员
(1)视频率为概率,分别估计南方、北方会员中喜欢有机水果的概率;
(2)根据小概率值的独立性检验,能否认为是否喜欢有机水果与会员的区域有关?
(3)已知农场会员有人,其中南方会员有人,若喜欢有机水果的人不低于人,则可种植亩左右的有机水果,否则只能种植亩左右,试问该农场应怎样安排有机水果的种植面积.
0.05
0.025
0.005
3.841
5.024
7.879
附:.
【答案】(1)南方,北方会员中喜欢有机水果A的概率分别为;
(2)能;
(3)可以种植50亩左右的有机水果A.
【难度】0.65
【知识点】均值的实际应用、计算古典概型问题的概率、独立性检验解决实际问题、卡方的计算
【分析】(1)利用频率估计概率求南方、北方会员中喜欢有机水果A的概率;
(2)根据列联表及卡方公式求出卡方值,结合独立检验基本思想即可得结论;
(3)求出南方、北方会员中喜欢有机水果的均值,与1100比较大小,即可得结论.
【详解】(1)由题设,南方会员中喜欢有机水果A的概率,
北方会员中喜欢有机水果A的概率为,
所以南方、北方会员中喜欢有机水果A的概率分别为.
(2),
所以有的把握认为是否喜欢有机水果A与会员的区域有关.
(3)由题,估计农场的会员中喜欢有机水果A的人数为,
所以农场可以种植50亩左右的有机水果A.
【变式8-3 】.(23-24高三上·湖南长沙·阶段练习)某种植物感染病毒极易死亡,当地生物研究所为此研发出了一种抗病毒的制剂.现对20株感染了病毒的该植株样本进行喷雾试验测试药效.测试结果分“植株死亡”和“植株存活”两个结果进行统计,并对植株吸收制剂的量(单位:毫克)进行统计.规定植株吸收在6毫克及以上为“足量”,否则为“不足量”.现对该20株植株样本进行统计,其中“植株存活”的13株,对制剂吸收量统计得下表.已知“植株存活”但“制剂吸收不足量”的植株共1株.
编号
1
2
3
4
5
6
7
8
9
10
吸收量(毫克)
6
8
3
8
9
5
6
6
2
7
编号
11
12
13
14
15
16
17
18
19
20
吸收量(毫克)
7
5
10
6
7
8
8
4
6
9
(1)补全列联表中的空缺部分,依据的独立性检验,能否认为“植株的存活”与“制剂吸收足量”有关?
吸收足量
吸收不足量
合计
植株存活
植株死亡
合计
(2)现假设该植物感染病毒后的存活日数为随机变量(可取任意正整数).研究人员统计大量数据后发现:对于任意的,存活日数为的样本在存活日数超过的样本里的数量占比与存活日数为1的样本在全体样本中的数量占比相同,均等于0.1,这种现象被称为“几何分布的无记忆性”.试推导的表达式,并求该植物感染病毒后存活日数的期望的值.
附:,其中;当足够大时,.
0.010
0.005
0.001
6.635
7.879
10.828
【答案】(1)表格见解析,无关
(2),
【难度】0.4
【知识点】独立性检验解决实际问题、离散型随机变量的方差与标准差
【分析】(1)由题意补全联表,代入公式求出观测值,将其与临界值进行对比,进而即可求解;
(2)先得到,推出对任意都成立,根据等比数列的定义可得,由,利用错位相减求出,从而得到的值.
【详解】(1)填写列联表如下:
吸收足量
吸收不足量
合计
植株存活
12
1
13
植株死亡
3
4
7
合计
15
5
20
零假设为:“植株的存活”与“制剂吸收足量”无关联.
根据列联表中的数据,经计算得到:,
依据的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为“植株的存活”与“制剂吸收足量”无关.
(2)由题意得.
又,故.
把换成,则.
两式相减,得,
即.
又,
故对任意都成立,
从而是首项为0.1,公比为0.9的等比数列,因此.
由定义可知,
而,下面先求.
,
,
作差得
.
所以,当足够大时,,,故,可认为.
【点睛】关键点点睛:本题第二问的关键是推出是首项为0.1,公比为0.9的等比数列,通项为,再利用错位相减法求出,从而得到期望.
题型九:独立性检验在食品安全中的应用
【例题9-1】.(24-25高三下·湖南衡阳·阶段练习)食品安全负责部门为了对某大型超市经营的某品牌(由A,B两个不同的产地生产)的“预制食品”的某些指标进行检测,随机从A,B两个产地生产的产品中分别抽取了30个作为样本进行检测,依据检测相应指标的相关数据,将其划定为“优良”和“合格”两个级别,记录相关数据得到如下2×2列联表:
单位:个
级别
产地
合计
A
B
优良
20
15
35
合格
10
15
25
合计
30
30
60
(1)依据小概率值的独立性检验,分析“该食品的指标等级与产地”是否有关?
(2)该超市对该“预制食品”进行打包促销,对于同一产地生产的食品采用每5个装为一个“促销大礼包”的促销形式,若某顾客随机购买了一个“促销大礼包”,经检测显示恰有4个为优良级别,试通过概率知识确定该“促销大礼包”内装的是A产地生产的食品的概率(该超市A,B两个产地的售出量之比为3:2,以列联表中产品的优良的频率代替各自产品优良的概率).
参考公式和数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)可以认为“该食品的指标等级与产地”无关.
(2)
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、计算条件概率、全概率公式、贝叶斯公式
【分析】(1)计算,与临界值比较即可得解;
(2)利用全概率公式及条件概率公式求解即可.
【详解】(1)零假设为:该食品的指标等级与产地无关,
根据表中数据计算得,,
依据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为“该食品的指标等级与产地”无关.
(2)记为“‘促销大礼包’中有4个为优良级别”;A为“‘促销大礼包’中的食品由A产地生产”;B为“‘促销大礼包’中的食品由B产地生产”
依题意,,,
,
则,
所以该“促销大礼包”内装的是产地生产的食品的概率为.
题型十:独立性检验在调查中的应用
【例题10-1】.(2025·辽宁·一模)心流是由心理学家米哈里提出的概念,指人们在进行某项活动时,完全投入并享受其中的状态.某中学的学习研究小组设计创新性学习活动,用来研究学生在创新性学习活动中体验到心流是否与性别有关.若从该班级中随机抽取1名学生,设“抽取的学生在创新性学习活动中体验到心流”,“抽取的学生为女生”,.
(1)求和,并解释所求结果大小关系的实际意义;
(2)为进一步验证(1)中的判断,该研究小组用分层抽样的方法在该地抽取了一个容量为的样本,利用独立性检验,计算得.为提高检验结论的可靠性,现将样本容量调整为原来的倍,使得能有的把握肯定(1)中的判断,试确定k的最小值.
参考公式及数据:,.
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1)答案见解析
(2)4
【难度】0.65
【知识点】完善列联表、卡方的计算、独立性检验解决实际问题、利用全概率公式求概率
【分析】(1)由对立事件的概率公式结合条件概率、全概率公式计算即可;实际意义由题干中结合所求概率可得;
(2)完成列联表,计算卡方可得.
【详解】(1)因为,
所以由对立事件概率公式关系可得
代入,
所以,
由全概率公式可得,
即,
所以.
说明学生在创新性学习活动中是否体验到心流与性别有关.
(2)完成列联表如下:
学生体验到心流
学生未体验到心流
合计
男生
女生
总计
,
所以,所以的最值小值为4.
【变式10-1】.(24-25高三下·河北石家庄·开学考试)2024年6月5日《中国教育报》刊发了教育部的“呵护好孩子的眼睛,共创光明的未来”的文章,其中特别强调“幼儿单次使用电子产品的时间不宜超过15分钟,累计每天不超过1小时”等内容.为切实提升儿童青少年视力健康整体水平,某学校积极推进近视综合防控,落实“明眸”工程,开展了近视原因的调查以备有效进行预防.在已近视的学生中随机调查了100人,同时在未近视的学生中随机调查了100人,得到如下数据:
电子产品
近视
未近视
非长时间使用电子产品
40
70
长时间使用电子产品
60
30
(1)依据小概率值的独立性检验,能否认为患近视与长时间使用电子产品有关?
(2)用频率估计概率,从已经近视的学生中采用随机抽样的方式选出1名学生,利用“物理+药物”治疗方案对该学生进行治疗.已知“物理+药物”治疗方案的治愈数据如下:在已近视的学生中,对非长时间使用电子产品的学生的治愈率为,对长时间使用电子产品的学生的治愈率为,求该近视学生被治愈的概率;
(3)若按样本数据利用分层随机抽样的方法从近视学生中抽取5人,再从这5人中抽取3人进行近视矫正实验,记表示这3人中长时间使用电子产品的人数,求的分布列与数学期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关联
(2)
(3)分布列见解析,
【难度】0.65
【知识点】利用全概率公式求概率、超几何分布的分布列、独立性检验解决实际问题、卡方的计算
【分析】(1)先设零假设,计算再与边界值比较判断即可;
(2)应用全概率公式计算求解即可;
(3)根据超几何分布求出概率再计算数学期望即可.
【详解】(1)零假设为:学生患近视与长时间使用电子产品无关,
,
依据小概率值的独立性检验,我们推断不成立,
即认为学生患近视与长时间使用电子产品有关联,此推断犯错误的概率不大于0.001.
(2)设事件表示使用“物理十药物”治疗方案并且治愈,
事件表示非长时间使用电子产品的近视学生,事件表示长时间使用电子产品的近视学生,
由题意可得,
且,
则
,
所以该近视学生被治愈的概率为.
(3)由样本数据可知近视学生中长时间使用电子产品与非长时间使用电子产品的人数比例为,
所以抽取的5人中有3人是长时间使用电子产品,有2人是非长时间使用电子产品,
所以的可能取值为,
且,
;
,
所以的分布列为:
1
2
3
所以数学期望为.
【变式10-2】.(24-25高三下·甘肃·开学考试)“八段锦”,起源于北宋,已有八百多年的历史. 古人把这套动作比喻为“锦”,意为五颜六色,美而华贵. 体现其动作舒展优美,视其为“祛病健身,效果极好,编排精致,动作完美”,此功法分为八段,每段一个动作,故名为“八段锦”. 作为传统养生功法,对人体有着很多的益处. 为了继续推广“八段锦”,吸引更多的老年市民练习“八段锦”,促进老年市民的延年益寿,市老体协统计了全市的男性老年人和女性老年人(不小于 60 岁的均为老年人)练习“八段锦”的情况,采用简单随机抽样的方法抽取了练习“八段锦”的 200 位老年人,得到了性别与年龄的有关数据,并整理得到以下列联表:
类型
年龄 (岁)
合计
男性
36
111
女性
25
合计
200
(1)补全 列联表,并依据小概率值 的独立性检验,能否认为老年人的性别与年龄是否大于 65 岁有关联?
(2)在这 200 位老年人随机抽取一位,求在该老人年龄大于 65 岁的情况下,为女性老年人的概率.
附: ,其中 .
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1)表格见解析,能
(2)
【难度】0.65
【知识点】计算条件概率、计算古典概型问题的概率、独立性检验解决实际问题、卡方的计算
【分析】(1)由公式求得,结合附表即可判断;
(2)法一,法二:由古典概型概率公式及条件概率计算公式即可求解;
【详解】(1)补全 列联表如下:
类型
年龄 (岁)
合计
男性
36
75
111
女性
64
25
89
合计
100
100
200
零假设为 : 老年人的性别与年龄是否大于 65 岁无关联.
根据列联表中的数据, 得
依据小概率值 的独立性检验,推断 不成立,即老年人的性别与年龄是否大于 65 岁有关联,该推断犯错误的概率不大于 0.001 .
(2)设事件 “抽取的一位老年人年龄大于 65 岁”,事件 “抽取的一位老年人为女性老年人”,
法一: 所求概率为 .
法二: 所求概率为 .
【变式10-3】.(2025·江西·一模)一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车
倾向于购买新能源车
合计
女性居民
150
250
400
男性居民
350
250
600
合计
500
500
1000
(1)能否有99%的把握认为对新能源车与燃油车的购买倾向存在性别差异?
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率.
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,其中.
在统计中,用以下结果对变量的独立性进行判断:
当时,没有充分的证据判断变量,有关联,可以认为变量,是没有关联的;
当时,有90%的把握判断变量,有关联;
当时,有95%的把握判断变量,有关联;
当时,有99%的把握判断变量,有关联.
【答案】(1)有99%的把握认为对新能源车与燃油车的购买倾向存在性别差异
(2)
(3)分布列见解析,
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、超几何分布的分布列、求超几何分布的概率
【分析】(1)计算进行独立性检验的判断即可;
(2)应用超几何分布概率公式计算求解;
(3)写出超几何分布的分布列进而求出数学期望.
【详解】(1)因为,
所以有99%的把握认为对新能源车与燃油车的购买倾向存在性别差异.
(2)由表格可得倾向于购买燃油车的居民中男、女性别比为7:3,
所以抽取男性7人,女性3人,
再从中抽取4人进行座谈,有女性居民记为事件,则,
恰有2名男性居民记为事件,则,
所以在有女性居民参加座谈的条件下,
恰有2名男性居民也参加座谈的概率为.
(3)在所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出
12人,可得抽取结果如下表:
倾向于购买燃油车
倾向于购买新能源车
男性居民
7
5
再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,
可取0,1,2,3,9分
可求出,,
,,
的分布列如下:
0
1
2
3
数学期望.
【变式10-4】.(24-25高三上·四川巴中·期末)一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车
倾向于购买新能源车
合计
女性居民
150
250
400
男性居民
350
250
600
合计
500
500
1000
(1)依据小概率值的独立性检验,分析对新能源车与燃油车的购买倾向是否存在性别差异;
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率;
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)对新能源车与燃油车的购买倾向存在性别差异;
(2)
(3)分布列见解析,期望值
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、写出简单离散型随机变量分布列、计算条件概率
【分析】(1)根据表中数据代入公式计算即可判断得出结论;
(2)由分层抽样确定不同性别的人数,再利用条件概率公式计算可得结果;
(3)根据分层抽样确定倾向于购买新能源车与燃油车的人数,得出的所有可能取值并计算对应的概率可得分布列并求得期望值.
【详解】(1)零假设为:对新能源车与燃油车的购买倾向不存在性别差异;
易知,
所以依据小概率值的独立性检验,我们推断假设不成立,
即认为对新能源车与燃油车的购买倾向存在性别差异,此推断犯错误的概率不大于;
(2)根据表中数据可知按性别采用分层随机抽样的方法抽取10人中3人为女性,7人为男性;
再从中抽取4人进行座谈,共有种,
其中有女性居民参加座谈的情况共有种;
恰有2名男性居民参加座谈的情况共有种;
因此在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率为
;
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,
采用分层随机抽样的方法抽出12人,可知抽取结果如下表:
倾向于购买燃油车
倾向于购买新能源车
男性居民
7
5
再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,
的所有可能取值为;
所以,;
,,
的分布列如下:
0
1
2
3
数学期望.
【变式10-5】.(2024·安徽·三模)某校为了给高三学生举办“18岁成人礼”活动,由团委草拟了活动方案,并以问卷的形式调查了部分同学对活动方案的评分(满分100分),所得评分统计如图所示.
(1)以频率估计概率,若在所有的学生中随机抽取3人,记评分在的人数为,求的数学期望和方差.
(2)为了解评分是否与性别有关,随机抽取了部分问卷,统计结果如下表所示,则依据的独立性检验,能否认为评分与性别有关?
男生
女生
评分
30
35
评分
20
15
(3)若将(2)中表格的人数数据都扩大为原来的10倍,则依据的独立性检验,所得结论与(2)中所得结论是否一致?直接给出结论即可,不必书写计算过程.
参考数据:
0.1
0.05
0.01
2.706
3.841
6.635
【答案】(1);
(2)
不能认为评分与性别有关;
(3)不一致.
【难度】0.65
【知识点】卡方的计算、独立性检验的基本思想、独立性检验解决实际问题、求离散型随机变量的均值
【分析】(1)由题意可得,即可得的数学期望和方差;
(2)求出的值,即可判断;
(3)将表中的人数数据都扩大为原来的10倍后,求出的值,即可得结论.
【详解】(1)解:由频率分布直方图可知评分在的频率为,
所以.
所以.
(2)解:依题意,
故依据的独立性检验,不能认为评分与性别有关.
(3)解:将表中的人数数据都扩大为原来的10倍后,
.
所以能认为评分与性别有关,
故所得结论与(2)中所得结论不一致.
题型十一:独立性检验在人工智能中的应用
【例题11-1】.(24-25高二下·河南南阳·阶段练习)在2025年春晚《秧BOT》节目中,宇树科技的Unitree H1“福兮”机器人采用人工智能(AI)驱动全身运动控制技术,能根据音乐旋律调整舞步,其最大关节扭矩高达360牛顿•米.节目播出后引发公众对机器人技术的兴趣和热情,为了了解不同性别的学生对AI的关注情况,随机抽取了90名学生,调查结果如下表:
关注
不关注
合计
男生
55
60
女生
合计
75
(1)完成上述列联表,依据该统计数据,能否有的把握认为学生对AI的关注与性别有关?
(2)在这90名学生中随机抽取一位,求在关注AI的情况下,该生为女生的概率.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【答案】(1)答案见解析;有的把握认为学生对AI的关注与性别有关.
(2)
【难度】0.65
【知识点】完善列联表、卡方的计算、计算条件概率
【分析】(1)根据题意,完成列联表,求出,对照数据即可得到结论.
(2)根据条件概率的计算公式求解.
【详解】(1)完成列联表如下:
关注
不关注
合计
男生
55
5
60
女生
20
10
30
合计
75
15
90
则.
因为,所以有的把握认为学生对AI的关注与性别有关.
(2)设事件:表示关注“关注AI”,事件表示“该生为女生”.
则,,
所以.
即在这90名学生中随机抽取一位,在关注AI的情况下,该生为女生的概率为.
【变式11-1】.(24-25高三下·上海·阶段练习)向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展以人工智能的应用为例,人工智能中的文生视频模型Sora(以下简称Sora),能够根据用户的文本提示创建最长60秒的逼真视频.为调查Sora的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
Sora的应用情况
视频从业人员
合计
减少
未减少
应用
54
18
72
没有应用
36
42
78
合计
90
60
150
0.010
0.005
0.001
6.635
7.879
10.828
(1)根据所给数据,判断是否有的把握认为Sora的应用与视频从业人员的减少有关?
(附:,其中.)
(2)某公司视频部拟开展Sora培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用Sora.
(i)求员工经过培训能应用Sora的概率;
(ii)已知开展Sora培训前,员工每人每年平均为公司创造利润6万元;开展Sora培训后,能应用Sora的员工每人每年平均为公司创造利润10万元;Sora培训平均每人每年成本为1万元.视频部现有员工100人,根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展Sora培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
【答案】(1)有的把握认为Sora的应用与视频从业人员的减少有关,理由见解析;
(2)(i);(ii)人.
【难度】0.65
【知识点】二项分布的均值、独立事件的乘法公式、独立性检验解决实际问题、卡方的计算
【分析】(1)先零假设,然后计算,根据小概率值的独立性检验即可判断;
(2)(i)设“员工经过培训能应用Sora”,结合互斥事件概率加法公式,独立事件概率乘法公式即可求解;
(ii)设视频部调人至其他部门,为培训后视频部能应用Sora的人数,则,由条件列不等式可求结论.
【详解】(1)零假设:Sora的应用与视频从业人员的减少无关,
,
根据小概率值的独立性检验,可以推断出不成立,
所以有的把握认为Sora的应用与视频从业人员的减少有关;
(2)(i)设“员工经过培训能应用Sora”,
所以,
所以员工经过培训能应用Sora的概率为;
(ii)设视频部调人至其他部门,,为培训后视频部能应用Sora的人数,
则,因此,
调整后视频部的期望年利润为:(万元),
令,解得,又,所以,
因此视频部最多可以调人到其他部门.
【变式11-2】.(2025·河南安阳·一模)随着网络App的普及与发展,刷“抖音”成为了人们日常生活的一部分.某地区随机抽取了部分20~40岁的“抖音”用户,调查他们日均刷“抖音”的时间情况,所得数据统计如下表:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
男性
48
72
女性
24
56
(1)依据小概率值的独立性检验,能否认为日均刷“抖音”时间的长短与性别有关?
(2)现从被调查的日均刷“抖音”时间超过2小时的用户中,按照性别比例采用分层随机抽样的方法抽取3名用户参加抖音知识问答,已知男性用户、女性用户顺利完成知识问答的概率分别为,,每个人是否顺利完成知识问答相互独立,求在有且仅有2人顺利完成知识问答的条件下,这2人性别不同的概率.
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)无关;
(2).
【难度】0.65
【知识点】计算条件概率、独立性检验解决实际问题、卡方的计算
【分析】(1)由题意可得列联表,再计算,对比临界值表即可得解;
(2)根据题意,求出有且仅有2人顺利完成知识问答的概率和这2人性别不同的概率,再根据条件概率公式求解即可.
【详解】(1)由题意,列联表如下:
性别
日均刷“抖音”时间超过2小时
日均刷“抖音”时间不超过2小时
合计
男性
48
72
120
女性
24
56
80
合计
72
128
200
零假设为:日均刷“抖音”时间的长短与性别无关,
则,
故依据小概率值的独立性检验,我们推断零假设成立,
即日均刷“抖音”时间的长短与性别无关.
(2)由分层随机抽样可知,抽取男性用户2人,女性用户1人.
记“有且仅有2人顺利完成知识问答”为事件,“2人性别不同”为事件,则,
,
故.
题型十二:独立性检验在医药中的应用
【例题12-1】.(2025高三·全国·专题练习)为了了解某种新型药物对治疗某种疾病的疗效,某机构日前联合医院,进行了小规模的调查,结果显示,相当多的受访者担心使用新药后会有副作用.为了了解使用该种新型药品后是否会引起疲乏症状,该机构随机抽取了某地患有这种疾病的275人进行调查,得到统计数据如表:
无疲乏症状
有疲乏症状
总计
未使用新药
150
25
t
使用新药
x
y
100
总计
225
m
275
(1)求列联表中的数据的值,判断有疲乏症状与使用该新药是否有关?
(2)从使用该新药的100人中按是否有疲乏症状,采用分层随机抽样的方法抽出4人,再从这4人中随机抽取2人做进一步调查,求这2人中恰有1人有疲乏症状的概率.
附:.
【答案】(1),有关.
(2).
【难度】0.65
【知识点】计算古典概型问题的概率、卡方的计算、完善列联表
【分析】(1)由数表可求,求得卡方值,比较临界值即可判断;
(2)由分层抽样确定有疲乏症状的人数为1,无疲乏症状的有3人,再通过列举得到基本事件,由古典概型概率公式即可求解;
【详解】(1)由数表知,,
所以,
根据列联表中的数据,经计算得到,
即有的把握认为有疲乏症状与使用该新药有关.
(2)从使用新药的100人中用分层随机抽样抽取4人的抽样比为,则抽取有疲乏症状的人数为,无疲乏症状的有3人,
抽取的有疲乏症状的1人记为1,无疲乏症状的3人记为,
从4人中随机抽取2人的所有样本点为,共6个,它们等可能,
记2人中恰有1人有疲乏症状的事件为M,它所含样本点是,共3个,
于是得,
所以这2人中恰有1人有疲乏症状的概率是.
【变式12-1】.(2025·江西鹰潭·一模)预防接种是预防掌握传染病最经济、最有效的手段,是预防疾病传播和保护群众的重要措施.为了考查一种新疫苗预防某一疾病的效果,研究人员对一地区某种动物(数量较大)进行试验,从该试验群中随机抽查了50只,得到如下的样本数据(单位;只):
发病
没发病
合计
接种疫苗
7
18
25
没接种疫苗
19
6
25
合计
26
24
50
(1)能否在犯错误的概率不超过0.001的前提下,认为接种该疫苗与预防该疾病有关?
(2)从该地区此动物群中任取一只,记表示此动物发病,表示此动物没发病,表示此动物接种疫苗,定义事件的优势,在事件发生的条件下的优势,利用抽样的样本数据,求的估计值.
(3)若把表中的频率视作概率,现从该地区没发病的动物中抽取3只动物,记抽取的3只动物中接种疫苗的只数为,求随机变量的分布列、数学期望.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)接种该疫苗与预防该疾病有关.
(2)
(3)分布列见解析,.
【难度】0.4
【知识点】独立性检验解决实际问题、计算条件概率、二项分布的均值
【分析】(1)求得卡方值,比较临界值即可判断;
(2)由条件概率计算公式即可求解;
(3)由题意确定,进而可求解;
【详解】(1)根据列联表可得
,
所以,在犯错误的概率不超过0.001的前提下,认为接种该疫苗与预防该疾病有关.
(2)由于.
所以,,
,
由列联表中的数据可得,,所以.
(3)由题可知,抽取的24只没发病的动物中接种疫苗和没接种疫苗的动物分别为18人和6人,所以从没发病的动物中随机抽取1只,抽取的是接种了疫苗的概率为,
则由题意可知,且,
,,
,,
所以随机变量的分布列为
0
1
2
3
所以随机变量的数学期望为.
【变式12-2】.(2024·吉林长春·一模)某医学研究团队经过研究初步得出检测某种疾病的患病与否和某项医学指标有关,利用该指标制定一个检测标准,需要确定临界值,将该指标大于的人判定为阳性(患病),小于或等于的人判定为阴性(未患病).此检测标准的漏诊率是将患病者判定为阴性的概率;误诊率是将未患病者判定为阳性的概率.
(1)随机抽取男女各500人进行检验,采用临界值进行判定时,误判共10人(漏诊与误诊之和),其中2男8女,写出列联表,依据小概率值的独立性检验,能否认为误判与性别有关?
(2)经过大量调查,得到如下的患病者和未患病者该指标的频率分布表:
指标
[95,100]
(100,105]
(105,110]
(110,115]
(115,120]
(120,125]
(125,130]
患病者频率
0.01
0.06
0.17
0.18
0.2
0.2
0.18
指标
[70,75]
未患病者频率
0.19
0.2
0.2
0.18
0.17
0.05
0.01
假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.若漏诊率和误诊率同时控制在以内(小于等于),求临界值的范围;
(3)在(2)条件下,求出误判率(漏诊率与误诊率之和)最小时的临界值及对应的误诊率和漏诊率.
附:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)列联表见解析;无关
(2)
(3);误诊率为,漏诊率为
【难度】0.4
【知识点】完善列联表、卡方的计算、独立性检验解决实际问题、总体百分位数的估计
【分析】(1)依题意列出列联表,将数据代入卡方公式,根据卡方值与对应的小概率值比较即可判断误判与性别的相关程度;
(2)分别根据漏诊率和误诊率都小于,结合频率分布表,先判断临界值所在组别,再利用百分位数的定义,建立满足的不等式,继而得到临界值的范围;
(3)结合频率分布表分段写出误判率的表达式,即可求解.
【详解】(1)依题意,列出列联表为:
误判人数
未误判人数
总计
男性人数
2
498
500
女性人数
8
492
500
总计
10
990
1000
由上表,,
故可以认为,依据小概率值的独立性检验,没有充分的证据证明零假设不成立,即认为误判与性别无关;
(2)因漏诊率小于等于,由频率分布表可知,临界值应在内,
依题意,有;
又因误诊率小于等于,由频率分布表可知,临界值应在内,
依题意,有.
综上,临界值的范围为;
(3)由(2)已得,设误判率为,
当时,,
当时,
,
所以当时,误判率最小,
相应的误诊率为,漏诊率为:.
【点睛】关键点点睛:本题证据要考查独立性检验、百分位数的应用,属于较难题.
解决通过统计图表求百分位数的问题,需要正确理解相关概念的具体含义,结合统计表或分布图表,列出相应的方程或不等式求解.
题型十三:独立性检验在研学中的应用
【例题13-1】.(23-24高三上·山东·阶段练习)研学旅行作为一种新兴的教学方式,越来越受中学生的青睐,国家也颁布了一系列政策推进研学旅行发展.为了解学生对“暑期研学旅行”的满意度,某教育部门对180名初一至高三的中学生进行了问卷调查.参与问卷调查的男女比例为5:4,女生初、高中比例为3:1.
(1)完成下面的列联表,并依据的独立性检验,判断“暑期研学旅行”的满意度与性别是否有关联;
性别
满意度
合计
满意
不满意
男生
80
女生
50
合计
(2)该教育部门采用分层随机抽样的方法从参与问卷调查的女生中抽取了8名学生.现从这8名学生中随机抽取4人进行座谈,设抽取的女生是初中生的人数为,求的分布列及数学期望.
附:,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)表格见解析,认为“暑期研学旅行”的满意度与性别有关联
(2)分布列见解析,3
【难度】0.65
【知识点】卡方的计算、独立性检验的基本思想、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)先求出男,女生抽取的人数,列出列联表,求出,然后对照参照表,从而得出答案.
(2)先求出取的初中女生,高中女生的人数,得出的可能取值,并求出对应的概率,得出分布列,然后求出数学期望.
【详解】(1)男生人数为,女生人数为,
则列联表如下表所示:
性别
满意度
合计
满意
不满意
男生
80
20
100
女生
50
30
80
合计
130
50
180
零假设为:“暑期研学旅行”的满意度与性别无关联.
根据列联表中的数据,经计算得到,
根据小概率值的独立性检验,我们推断不成立,即认为“暑期研学旅行”的满意度与性别有关联,此推断犯错误的概率不大于0.01.
(2)抽取的初中女生有(人),高中女生有(人),
则的可能取值为2,3,4,
,,,
所以的分布列为
2
3
4
故
题型十四:独立性检验在电子竞技中的应用
【例题14-1】.(24-25高三下·重庆沙坪坝·开学考试)继 2023 年电子竞技首次作为正式竞赛项目登上杭州亚运会舞台后,2024 年国际奥委会宣布首届奥林匹克电子竞技运动会将于 2025 年在沙特阿拉伯王国举办.这意味着电子竞技作为虚拟体育正式成为奥运会项目的一部分.为迎接电子竞技行业这一里程碑式的时刻, 甲、乙两俱乐部计划按照现今体育比赛中的赛制举办友谊赛.在体育比赛中有两种常见赛制:一种是局胜制,例如一场比赛有5局, 率先胜3局一方获胜,本场比赛结束; 另一种是局胜制,例如一场比赛有7局,率先胜4局一方获胜, 本场比赛结束.
(1)若采用5局3胜制,甲俱乐部每场比赛获胜的概率为0.8;若采用7局4胜制,甲俱乐部每场比赛获胜的概率为0.9.已知甲、乙俱乐部采用这两种赛制各进行了场比赛,试自行绘制列联表,并根据小概率值的独立性检验,来推断赛制是否对甲队获胜的场数有影响;
(2)设甲俱乐部每局比赛获胜的概率均为,且每局比赛都能决出胜负,没有平同: ①若两俱乐部采用5局3胜制比赛,记事件: “甲俱乐部只要取得3局比赛的胜利比赛结束且甲获胜”,事件: “两俱乐部赛满5局,甲俱乐部至少取得3局比赛胜利且甲获胜”,试证明:;
②若甲、乙两俱乐部创造一种全新的赛制,约定比赛规则为:共进行局,赢得局数大于 局的俱乐部获胜.若甲俱乐部每局比赛获胜的概率,试判断进行几局比赛时,甲俱乐部获胜的概率最大,并说明理由.
0.10
0.05
0.025
0.010
2.706
3.841
5.024
6.635
附:,其中 .
【答案】(1)列联表见解析,答案见解析;
(2)①证明见解析;②4局.
【难度】0.4
【知识点】完善列联表、独立性检验解决实际问题、独立重复试验的概率问题、利用全概率公式求概率
【分析】(1)根据给定条件,列出列联表,求出的观测值并与比较求解.
(2)①利用互斥事件的概率公式及独立重复试验的概率公式列式化简得证;②利用条件概率及全概率公式求出与的关系,再建立不等式求解.
【详解】(1)依题意,列联表如下:
5局3胜
7局4胜
合计
甲胜
乙胜
合计
,依据小概率值的独立性检验,
当时,,赛制对甲胜场数有影响;
当时,,赛制对甲胜场数没有影响.
(2)①,
,
所以.
②设甲赢得比赛的概率为,设“进行局比赛甲最终获胜”,“第一局甲赢”,“第二局甲赢”,
则有,
而发生及发生意味着前2局比赛甲恰好赢一局,则甲在局比赛最终获胜当且仅当
甲在后续的局比赛中赢的局数要大于,因此,
在发生的条件下,甲已经赢了前2局,
则甲最终获胜当且仅当甲在后续的局比赛中赢的局数要大于或等于,
则;
在发生的条件下,甲输掉前2局,则甲最终获胜当且仅当甲在后续的局
比赛中赢的局数要大于,而这个事件可视为“甲在后续的局比赛中赢的局数大于”
与事件“甲在后续的局比赛中恰好赢局”的差事件,
故,
因此
令,得,则当时,,
所以当,即时,最大
【点睛】关键点点睛:利用概率加法公式及乘法公式求概率,把要求概率的事件分拆成两两互斥事件的和,相互独立事件的积是解题的关键.
一、单选题
1.(24-25高三上·湖北襄阳·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.789
附:
A.有99.5%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
【答案】D
【难度】0.65
【知识点】完善列联表、卡方的计算、独立性检验解决实际问题
【分析】根据所给数据完善列联表,计算出卡方,即可判断.
【详解】依题意可得列联表如下:
男生
女生
合计
篮球迷
90
20
110
非篮球迷
60
30
90
合计
150
50
200
所以,
所以没有99%的把握认为是否是篮球迷与性别有关,进而没有99.5%的把握认为是否是篮球迷与性别有关,A,B选项错误;
又,最准确的是在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关,D选项正确.
故选:D.
2.(24-25高三上·山西运城·开学考试)下列说法错误的是( )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.在一元线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05
【答案】C
【难度】0.65
【知识点】抽样比、样本总量、各层总数、总体容量的计算、相关系数的意义及辨析、独立性检验解决实际问题、总体百分位数的估计
【分析】利用分层抽样计算判断A;求出第75百分位数判断B;利用线性相关系数的意义判断C;利用独立性检验的思想判断D.
【详解】对于A,该校高一年级女生人数是,A正确;
对于B,由,得第75百分位数为,B正确;
对于C,线性回归方程中,线性相关系数绝对值越大,两个变量的线性相关性越强,C错误;
对于D,由,可判断与有关联,此推断犯错误的概率不大于0.05,D正确.
故选:C
二、多选题
3.(24-25高三上·江苏苏州·期末)为比较甲、乙两所学校学生的数学水平,采取简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名学生数学成绩优秀;乙校45名学生中有7名学生数学成绩优秀.整理数据如下表:
学校
数学成绩
合计
不优秀
优秀
甲校
33
10
43
乙校
38
7
45
合计
71
17
88
附:.
参考数据:
则下列说法正确的有( )
A.甲校的数学抽测成绩优秀率一定比乙校的数学抽测成绩优秀率高
B.甲校的数学成绩优秀率一定比乙校的数学成绩优秀率高
C.甲校的数学优秀人数可能比乙校的数学优秀人数多
D.对于小概率值,可以认为两校的数学成绩优秀率几乎没有差异
【答案】ACD
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题
【分析】根据样本的抽测成绩的代表性强弱,可判断ABC,利用计算可判断D.
【详解】对于A,因为甲校的数学抽测成绩优秀率为,乙校的数学抽测成绩优秀率为,
所以甲校的数学抽测成绩优秀率一定比乙校的数学抽测成绩优秀率高,故A正确;
对于B,抽测的样本的优秀率可能代表性差,不一定能真实的反映两校的优秀率,故B错误;
对于C,有可能甲校的数学优秀人数可能比乙校的数学优秀人数多,故C正确;
对于D,,
根据小概率的独立性检验,两校的数学成绩优秀率没有差异,故D正确.
故选:ACD.
4.(24-25高三上·四川·期中)为了研究某校高三年级学生的性别和身高是否低于的关联性,研究小组从该校高三学生中获取容量为500的有放回简单随机样本,由样本数据整理得到如下列联表:
单位:人
性别
身高
合计
低于
不低于
女
140
60
200
男
120
180
300
合计
260
240
500
附:,其中.
α
小组成员甲用该列联表中的数据进行独立性检验,小组成员乙将该列联表中的所有数据都缩小为原来的后再进行独立性检验,则下列说法正确的是( )
A.依据的独立性检验,小组成员甲可以认为该中学高三年级学生的性别与身高有关联
B.依据的独立性检验,小组成员甲不能认为该中学高三年级学生的性别与身高有关联
C.小组成员甲、乙计算出的值相同,依据的独立性检验,他们得出的结论也相同
D.小组成员甲、乙计算出的值不同,依据的独立性检验,他们得出的结论也不同
【答案】AD
【难度】0.65
【知识点】独立性检验解决实际问题、卡方的计算
【分析】根据列联表及卡方公式求对应卡方值,结合独立性检验的基本思想得到结论,即可得答案.
【详解】由题设,零假设该中学高三年级学生的性别与身高没有关联,
对于成员甲有,
对于成员乙有,
依据的独立性检验,小组成员甲可认为该中学高三年级学生的性别与身高有关联;
依据的独立性检验,小组成员乙不能认为该中学高三年级学生的性别与身高有关联;
小组成员甲、乙计算出的值不同,他们得出的结论也不同.
故选:AD
5.(24-25高二下·全国·单元测试)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表.经计算,则可以推断出( )
满意
不满意
男
30
20
女
40
10
A.该学校男生对食堂服务满意的概率的估计值为
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.有不少于95%的把握认为男、女生对该食堂服务的评价有差异
D.有不少于99%的把握认为男、女生对该食堂服务的评价有差异
【答案】AC
【难度】0.65
【知识点】独立性检验解决实际问题、计算古典概型问题的概率
【分析】应用古典概型判断A,B选项,根据与边界值比较判断C,D选项.
【详解】对于选项A,该学校男生对食堂服务满意的概率的估计值为,故A正确;
对于选项B,该学校女生对食堂服务满意的概率的估计值为,故B错误;
因为,所以有不少于95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错误.
故选:AC.
三、解答题
6.(2024·四川德阳·模拟预测)恰逢盛世,风调雨顺.某稻米产地今秋获得大丰收,为促进当地某品牌大米销售,甲、乙两位驻村干部通过直播宣传销售所驻村生产的该品牌大米.通过在某时段100名顾客在观看直播后选择在甲、乙两位驻村干部的直播间(下简称甲直播间、乙直播间)购买的情况进行调查(假定每人只在一个直播间购买大米),得到以下数据:
网民类型
在直播间购买大米的情况
合计
在甲直播间购买
在乙直播间购买
本地区网民
外地区网民
30
45
合计
20
100
(1)补全2×2列联表,并判断依据小概率值的独立性检验,能否认为网民选择在甲、乙直播间购买大米与网民所处地区有关;
(2)用样本分布的频率分布估计总体分布的概率,若共有名网民在甲、乙直播间购买大米,且网民选择在甲、乙两个直播间购买大米互不影响,记其中在甲直播间购买大米的网民数为,求使事件“”的概率取最大值时的值.
附:,其中.
a
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
【答案】(1)列联表见解析;能认为网民选择在甲、乙直播间购买大米与网民所处地区有关
(2)
【难度】0.65
【知识点】完善列联表、独立性检验解决实际问题、利用二项分布求分布列、服从二项分布的随机变量概率最大问题
【分析】(1)根据数据关系补充列联表,提出零假设,计算出的观测值,结合临界值表可得出结论;
(2)根据二项分布求出在甲直播间购买大米的网民人数为的概率,利用作商法判断概率的大小即可得解.
【详解】(1)因为网民人数合计为,外地区网民人数为,所以本地区网民人数为,
在甲直播间购买的外地区网民人数为,外地区网民人数为,
所以在乙直播间购买的外地区网民人数为,
又在乙直播间购买的网民总人数为,
所以在甲直播间购买的外地区网民人数为,
所以在甲直播间购买的本地区网民人数为,
所以列联表如下:
网民类型
在直播间购买大米的情况
合计
在甲直播间购买
在乙直播间购买
本地区网民
外地区网民
合计
提出零假设:网民选择在甲、乙直播间购买大米与网民所处地区没有关联,
经计算得,
依据小概率值的独立性检验,我们推断不成立,
即认为网民选择在甲、乙直播间购买大米与网民所处地区有关联.
(2)利用样本分布的频率估计总体分布的概率,
可知网民选择在甲直播间购买大米的概率为,
则,记,,
则,
则问题等价于求当取何值时取最大值,
因为,,
又,
所以当时,;
当时,;
当时,;
所以,
,
所以当时,取最大值,
即使事件“”的概率取最大值的的值为.
7.(2025·吉林·二模)国家设立国家自然科学基金,用于资助基础研究,支持人才培养和团队建设. 现对近4年的国家自然科学基金项目支出(以下简称项目支出)概况进行统计,得到数据如下表:
年份
2020年
2021年
2022年
2023年
年份序号
1
2
3
4
项目支出/百亿元
90
96
100
108
(1)经过数据分析,发现年份序号与项目支出具有线性相关关系. 请求出项目支出y关于年份序号x的经验回归方程,并预测2025年的项目支出;
(2)天元基金是国家自然科学基金中的数学专项基金之一,为促进甲、乙两个地区天元基金申报者的交流,天元基金委员会举办了论坛活动. 经调查统计,甲、乙两个地区共有200人参加此次论坛活动,具体数据如下表:
男生
女生
合计/人
甲
65
35
100
乙
45
55
100
合计/人
110
90
200
(i)根据小概率值的独立性检验,能否认为申报者所在地区与性别有关联?
(ii)为了解此次论坛活动的满意度(满意度评分满分为10分),现采用按男、女样本量比例分配的分层随机抽样,从上述200人中抽取40人进行访谈,其中男生样本的满意度平均数为9分,方差为7.19,女生样本的满意度平均数为7分,方差为6.79,由这些数据,请求出总样本的满意度的平均数和方差,并对全体参加此次论坛活动的天元基金申报者的满意度的平均数和方差作出估计.
附:,,,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1),118.8百亿元
(2)(i)能;(ii)平均数为8.1,方差为8;全体参加论坛活动的天元基金者的满意度的平均数为8.1,方差为8
【难度】0.65
【知识点】估计总体的方差、标准差、求回归直线方程、独立性检验解决实际问题
【分析】(1)利用所给的公式求回归方程,并用之预测2025年的项目支出.
(2)(i)计算,根据独立性检验的思想进行判断;(ii)根据部分数据与整体数据特征数的关系求值.
【详解】(1)(法一),
,
,
所以,
所以国家自然科学技术基金项目支出y关于年份序号x的经验回归方程为.
当时,(百亿元),
预测2025年的国家自然科学技术基金项目支出为118.8百亿元.
(法二),,
,
所以国家自然科学技术基金项目支出y关于年份序号x的经验回归方程为.
当时,(百亿元),
预测2025年的国家自然科学技术基金项目支出为118.8百亿元.
(2)(i)零假设为
申报天元基金者的所在地区与性别无关联.
根据列联表中的数据,经计算得到
.
依据小概率值的独立性检验,我们推断不成立,即认为申报天元基金者的所在地区与性别有关联,此推断犯错误的概率不大于0.005.
(ⅱ)把男生样本的满意度平均数记为,方差记为;
女生样本的满意度平均数记为,方差记为;总样本的满意度平均数记为,方差记为.
则,
根据男、女样本量按比例分配的分层随机抽样总样本平均数与各层样本平均数的关系,
可得总样本的满意度平均数为,
.
总样本的满意度的平均数为8.1,方差为8.
并据此估计全体参加论坛活动的天元基金者的满意度的平均数为8.1,方差为8.
8.(23-24高二下·上海奉贤·期末)某疾病预防中心随机调查了340名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如表所示.
不吸烟者
吸烟者
总计
不患慢性气管炎者
120
160
280
患慢性气管炎者
15
45
60
总计
135
205
340
(1)是否有95%的把握认为患慢性气管炎与吸烟有关?
(2)现从不患慢性气管炎者的样本中,按分层抽样的方法选出7人,从这7人里再随机选取3人,求这3人中,不吸烟者的人数X的数学期望.
附:,.
【答案】(1)有的把握认为患慢性气管炎与吸烟有关
(2)
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、求离散型随机变量的均值
【分析】(1)利用表格中的数据计算的观测值,再与临界值比对得解.
(2)求出的可能值及对应的概率,进而求出数学期望.
【详解】(1)零假设:患慢性气管炎与吸烟无关,
,
由,而,从而否定原假设,
即有的把握认为患慢性气管炎与吸烟有关.
(2)按分层抽样,不吸烟者3人,吸烟者4人,
的可能值为0,1,2,3,
,,,,
所以.
9.(24-25高二上·广西梧州·期末)某超市为调查顾客单次消费金额与性别是否有关,随机抽取70位当日来店消费的顾客,其中女性顾客有40人,统计发现,单次消费超过100元的占抽取总人数的,男性顾客单次消费不超过100元的占抽取总人数的.
单次消费超过100元
单次消费不超过100元
合计
女性
男性
合计
(1)根据所给数据完成列联表,是否有的把握认为顾客单次消费是否超过100元与性别有关联?
(2)在“单次消费超过100元”的顾客中,按照性别比例采用分层随机抽样的方法抽取7人,再从这7人中任选3人参与问卷调查,记3人中女性人数为,求的分布列与数学期望.
参考公式:(其中.
参考数据:
0.050
0.025
0.01
3.841
5.024
6.635
【答案】(1)表格见解析,有把握
(2)分布列见解析,
【难度】0.65
【知识点】求离散型随机变量的均值、写出简单离散型随机变量分布列、独立性检验解决实际问题、完善列联表
【分析】(1)根据顾客总数以及所占比例,得出2×2列联表并代入公式计算可得,即可得出结论;
(2)根据分层抽样比例可知抽取的7人中,女性有人,男性有4人,可知X的可能取值为,分别求得对应的概率即可得分布列和期望值.
【详解】(1)根据题意可知,男性顾客30人,女性顾客40人;
男性顾客单次消费不超过100元的占抽取总人数的,即10人,超过100元的有20人,
又单次消费超过100元的占抽取总人数的,即共35人,所以单次消费超过100元的女性顾客为15人;
可得如下2×2列联表:
单次消费超过100元
单次消费不超过100元
合计
女性
15
25
40
男性
20
10
30
合计
35
35
70
零假设:顾客的单次消费是否超过100元与性别无关联,
由列联表中的数据,计算得
故依据小概率值的独立性检验,能认为顾客单次消费是否超过100元与性别有关联.故有的把握认为顾客单次消费是否超过100元与性别有关联
(2)在“单次消费超过100元”的顾客中,按照性别比例采用分层随机抽样的方法抽取的7人中,
女性有人,男性有4人,
所以X的可能取值为,
则.
,
故X的分布列为
X
0
1
2
3
P
所以.
10.(2025·广西柳州·模拟预测)某公司推出一种新品,为了解某地区消费者对新产品的满意度,从中随机调查了名消费者,得到下表:
性别
满意度
合计
满意
不满意
男
220
30
250
女
230
20
250
合计
450
50
500
(1)依据小概率值的独立性检验,能否认为消费者对新产品的满意度与性别有关;
(2)若用频率估计概率,从该地区消费者中随机选取3人,用表示不满意的人数,求的分布列与数学期望.
附:其中.
0.1
0.05
0.01
2.706
3.841
6.635
【答案】(1)不能
(2)分布列见解析,
【难度】0.65
【知识点】独立性检验解决实际问题、利用二项分布求分布列、二项分布的均值
【分析】(1)利用公式求出,利用临界值表进行判定;
(2)先求出不满意的概率,由二项分布求解概率,列表得到分布列,利用期望公式进行求解
【详解】(1)零假设为:消费者对新产品的满意度与性别无关,
则
所以,根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为消费者对新产品的满意度与消费者性别无关.
(2)从该地区消费者中随机选取1人,对新产品不满意的概率为,
从该地区消费者中随机选取3人,用表示不满意的人数,
则的可能取值为,且,
则,
,
,
,
所以的分布列为:
0
1
2
3
所以的期望为.
11.(24-25高三上·甘肃酒泉·期末)在2024年“五四青年节”,某校举办了有关五四运动的知识竞赛活动,为了调查学生对本次活动的满意度,从该校学生中随机抽取一个容量为()的样本进行调查,调查结果如下表:
满意
不满意
合计
男生
女生
合计
(1)完成上面的列联表,若有不少于的把握认为“性别与满意度有关系”,求样本容量的最小值;
(2)本次知识竞赛的晋级环节设置3道必答题目,至少答对2道题目则晋级,否则被淘汰.某年级有20名同学进入晋级环节,根据统计,每人对这3道题目答对的概率分别为,且3道题目答对与否互不影响.
①设表示这20人中晋级的人数,求;
②记这20人中()人晋级的概率为,求取得最大值时的取值.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【答案】(1)表格见解析,90.
(2)①;②12
【难度】0.65
【知识点】完善列联表、独立性检验解决实际问题、服从二项分布的随机变量概率最大问题、二项分布的均值
【分析】(1)根据表格中已有数据进行分析,完善列联表,并计算出卡方,得到不等式,结合为30的整数倍,故的最小值为90;
(2)①设出事件,得到20名同学中1人晋级的概率,得到,利用二项分布期望公式求出答案;
②得到,根据,求出取最大值时的取值为12.
【详解】(1)列联表如下:
满意
不满意
合计
男生
女生
合计
先提出统计假设为:性别与满意度没有关系,
根据上表可知,,
因为性别与满意度有关系,所以,解得,
由题意可知,为30的整数倍,故的最小值为90;
(2)①设(,,)分别表示3道题目答对事件,
令该年级的20名同学中1人晋级的事件为,
则
,
由题意可知,,则;
②,,,,,,,
最大,则
解得,,
所以,
即取最大值时的取值为12.
12.(2025高三·全国·专题练习)某校采用“翻转课堂”的教学模式,即学生先自学,然后老师再讲学生不会的内容.此地教育部门为调查在此模式下学生的物理考试成绩是否及格(60分及格)与每周学习物理的时间是否足够12小时的相关关系,随机抽取该校49名学生进行了解,其中每周学习物理的时间不少于12小时的有21位学生.余下的人中,物理考试成绩不足60分的学生占余下人数的,每周学习物理的时间不少于12小时但物理考试成绩不足60分的有8位学生.
(1)请完成下面的2×2列联表,并判断能否依据小概率值的独立性检验认为“物理考试成绩是否及格与每周学习物理的时间是否足够12小时有关”.
大于等于60分
不足60分
合计
学时不少于12小时
8
21
学时不足12小时
合计
49
(2)若将频率视为概率,从全校物理考试成绩大于等于60分的学生中随机抽取20人,求这些人中每周学习物理的时间不少于12小时的人数的期望和方差.
附,其中.
α
0.050
0.025
0.005
0.001
3.841
5.024
7.879
10.828
【答案】(1)列联表见解析;有关
(2),.
【难度】0.65
【知识点】独立性检验解决实际问题、二项分布的均值、二项分布的方差
【分析】(1)补全列联表,提出零假设,套用公式求,将与临界值比较大小,推断不成立.
(2)分析题意可得变量服从二项分布,根据二项分布期望与方差的公式计算可得结果.
【详解】(1)由题意得,每周学习物理的时间不足12小时的有(人),
每周学习物理的时间不足12小时且物理成绩不足60分的有(人),
所以每周学习物理的时间不足12小时且物理成绩大于等于60分的有(人),
补全的2×2列联表如下.
大于等于60分
不足60分
合计
学时不少于12小时
13
8
21
学时不足12小时
8
20
28
合计
21
28
49
零假设为:物理成绩是否及格与每周学习物理的时间是否足够12小时无关.
,
依据小概率值的独立性检验,有充分证据推断不成立,
即可以认为“物理考试成绩是否及格与每周学习物理的时间是否足够12小时有关”.
(2)由(1)知全校物理考试成绩大于等于60分的学生中每周学习物理的时间不少于12小时的概率是.
设从全校物理考试成绩大于等于60分的学生中随机抽取20人,
这些人中每周学习物理的时间不少于12小时的人数为随机变量Y,则,
所以,.
13.(2024·甘肃张掖·一模)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活,某小区将一周网上买菜次数超过3次的居民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的居民认定为“不喜欢网上买菜”.为了解该社区居民网上买菜的情况,工作人员随机抽取了该社区100名居民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的居民
40
10
50
年龄超过45岁的居民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析该社区的居民是否喜欢网上买菜与年龄有关系.
(2)居民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜.如果周一选择在平台买菜,那么周二选择在平台买菜的概率为;如果周一选择在平台买菜,那么周二选择在平台买菜的概率为,求小张周二选择在平台买菜的概率.
(3)用频率估计概率,现从该社区随机抽取10名居民,记其中喜欢网上买菜的居民人数为随机变量,并记随机变量,求X,Y的数学期望和方差.
参考公式及数据:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)认为是否喜欢网上买菜与年龄有关系,此推断犯错误的概率不大于0.05
(2)
(3)的数学期望,方差,的数学期望,方差
【难度】0.65
【知识点】独立性检验解决实际问题、利用二项分布求分布列、二项分布的均值、利用全概率公式求概率
【分析】(1)根据给定数表,求出的观测值,再与临界值表比较即可求解;
(2)根据给定条件,利用全概率公式计算作答;
(3)由二项分布的期望、方差公式求解随机变量X的数学期望和方差,再利用数学期望和方差的性质求解Y的数学期望和方差即可.
【详解】(1)统计假设:该社区的居民是否喜欢网上买菜与年龄无关系,
由给定的2×2列联表,得
根据小概率值的独立性检验,否定假设,
即认为是否喜欢网上买菜与年龄有关系,此推断犯错误的概率不大于0.05;
(2)设表示周在平台买菜,表示周在平台买菜,.
由题可得.
由全概率公式,小张周二选择在平台买菜的概率
;
(3)依题意,该社区居民喜欢网上买菜的概率估计值为.
从该社区随机抽取10名居民,其中喜欢网上买菜的居民人数,
所以的数学期望,方差.
又,所以的数学期望,方差.
14.(24-25高三上·山东德州·阶段练习)某高中学校为了解学生参加体育锻炼的情况,统计了全校所有学生在一年内每周参加体育锻炼的次数,现随机抽取了60名同学在某一周参加体育锻炼的数据,结果如下表
一周参加体育锻炼次数
0
1
2
3
4
5
6
7
合计
男生人数
1
2
4
5
6
5
4
3
30
女生人数
4
5
5
6
4
3
2
1
30
合计
5
7
9
11
10
8
6
4
60
(1)若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为“不经常锻炼”.请完成以下2×2列联表,并依据独立性检验,能否有90%的把握认为性别因素与学生体育锻炼的经常性有关系;
性别
锻炼
合计
不经常
经常
男生
女生
合计
(2)若将一周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼”会导致肥胖等诸多健康问题,以样本频率估计概率,在全校抽取20名同学,其中“极度缺乏锻炼”的人数为X,求和;
(3)若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为,求的分布列和数学期望.
附:
参考数据:
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
【答案】(1)列联表见解析;有90%的把握认为性别因素与学生体育锻炼的经常性有关系
(2),
(3)分布列见解析,
【难度】0.65
【知识点】独立性检验解决实际问题、超几何分布的均值、二项分布的均值、二项分布的方差
【分析】(1)由60名同学的统计数据可得列联表,代入公式可得,再对照临界值表即可得出结论;
(2)求出随机抽取一人为“极度缺乏锻炼”者的概率,易得服从二项分布,由二项分布即可得和;
(3)依题意可得的所有可能取值为0,1,2,3,利用超几何分布公式求得概率,进而即可得到的分布列和期望值.
【详解】(1)根据统计表格数据可得列联表如下:
性别
锻炼
合计
不经常
经常
男生
7
23
30
女生
14
16
30
合计
21
39
60
根据列联表的数据计算可得
,
故有90%的把握认为性别因素与学生体育锻炼的经常性有关系;
(2)因学校总学生数远大于所抽取的学生数,故近似服从二项分布,
易知随机抽取一人为“极度缺乏锻炼”者的概率,即可得,
故,;
(3)易知10名“运动爱好者”有7名男生,3名女生,
所以Y的所有可能取值为0,1,2,3,且Y服从超几何分布:
,
,
,
故所求分布列为
Y
0
1
2
3
P
可得
15.(2023·安徽蚌埠·一模)文旅部门统计了某网红景点在2022年3月至7月的旅游收入(单位:万),得到以下数据:
月份
3
4
5
6
7
旅游收入
10
12
11
12
20
(1)根据表中所给数据,用相关系数加以判断,是否可用线性回归模型拟合与的关系?若可以,求出关于之间的线性回归方程;若不可以,请说明理由(精确到0.001);
(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的列联表,并判断能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关”.
喜欢
不喜欢
总计
男
100
女
60
总计
110
参考公式:相关系数,参考数据:,线性回归方程:,其中,,,其中.
临界值表:
0.010
0.005
0.001
6.635
7.879
10.828
【答案】(1)可用线性回归模型拟合与的关系,.
(2)列联表见解析,有99.9%的把握认为游客是否喜欢该网红景点与性别有关.
【难度】0.65
【知识点】求回归直线方程、相关系数的计算、完善列联表、独立性检验解决实际问题
【分析】(1)先依据已知条件依次计算、、、和,进而计算,从而得出可用线性回归模型拟合与的关系,再根据最小二乘法求出即可得解.
(2)由已知数据即可填写列联表;根据表格数据计算,再结合独立性检验基本思想方法即可得解.
【详解】(1)由已知得:,,
所以,
,
,
所以,
因为,说明与的线性相关关系很强,可用线性回归模型拟合与的关系,
所以,
所以关于的线性回归方程为:.
(2)列联表如下所示:
喜欢
不喜欢
总计
男
70
30
100
女
40
60
100
总计
110
90
200
零假设:游客是否喜欢该网红景点与性别无关,
根据列联表中数据,,
依据小概率值的独立性检验推断不成立,
即有的把握认为游客是否喜欢该网红景点与性别有关.
16.(2024高三·全国·专题练习)为积极响应国家“阳光体育运动”的号召,某学校在了解到学生的实际运动情况后,发起以“走出教室,走到操场,走到阳光”为口号的课外活动倡议,为调查该校学生每周平均体育运动时间的情况,从高一高二基础年级与高三三个年级学生中按照的比例分层抽样,收集300位学生每周平均体育运动时间的样本数据(单位:小时),得到如图所示的频率分布直方图.(已知高一年级共有1200名学生)
(1)据图估计该校学生每周平均体育运动时间,并估计高一年级每周平均体育运动时间不足4小时的人数;
(2)规定每周平均体育运动时间不少于6小时记为“优秀”,否则为“非优秀”,在样本数据中,有30位高三学生的每周平均体育运动时间不少于6小时,请完成下列列联表,并判断是否有99%的把握认为该“校学生的每周平均体育运动时间是否‘优秀’与年级有关”.
基础年级
高三
合计
优秀
非优秀
合计
300
附:.
参考数据:
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
【答案】(1)5.8,300
(2)列联表见解析,有握认为“该校学生的每周平均体育运动时间是否‘优秀’与年级有关”
【难度】0.65
【知识点】独立性检验解决实际问题、完善列联表、由频率分布直方图估计平均数、频率分布直方图的实际应用
【分析】(1)根据频率分布直方图即可估算该校学生每周平均体育运动时间,首先算出人中,高一年级每周平均体育运动时间不足4小时的人数,再根据,求解即可.
(2)根据题意完成列联表,再计算,利用独立性检验即可得解.
【详解】(1)该校学生每周平均体育运动时间为.
样本中高一年级每周平均体育运动时间不足4小时的人数为(人).
又样本中高一的人数有120人,所以估计高一年级每周平均体育运动时间不足4小时的人数约为(人).
(2)人中,高一、高二、高三平均体育运动时间不少于6小时,
共有人,
所以基础年级平均体育运动时间不少于6小时共有人,
基础年级平均体育运动时间少于6小时共有人,
高三年级平均体育运动时间少于6小时共有人,
列联表如下:
基础年级
高三
合计
优秀
105
30
135
非优秀
105
60
165
合计
210
90
300
假设该校学生的每周平均体育运动时间是否优秀与年级无关,则
.
又,所以有握认为“该校学生的每周平均体育运动时间是否‘优秀’与年级有关”.
17.(24-25高三上·广西贵港·阶段练习)为了调查某校学生喜欢跑步是否与性别有关,高三年级特选取了200名学生进行了问卷调查,得到如下的列联表:
喜欢跑步
不喜欢跑步
合计
女生
90
120
男生
55
合计
145
200
(1)计算的值,并依据小概率值的独立性检验,判断性别与喜欢跑步是否有关?
(2)从上述的200名学生中按性别比例用分层抽样的方法抽取10名学生,再在这10人中抽取3人调查其是否喜欢跑步,用表示3人中女生的人数,求的分布列及数学期望.
附:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1),,,,无关;
(2)分布列见解析,期望为
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、写出简单离散型随机变量分布列、超几何分布的均值
【分析】(1)根据表格直接计算,再利用卡方公式计算即可;
(2)根据分层抽样和超几何分布即可得到答案.
【详解】(1),,,,
零假设为:性别与学生喜欢跑步无关,
由题意得
依据小概率值的独立性检验,没有充分证据认为不成立,
所以判断性别与喜欢跑步无关;
(2)由题意,参与调查的200人中,女生有120人,男生有80人,
因为,按性别比例分层抽样抽出10人,则女生抽6人,男生抽4人,
从10人中随机抽取3人,则的取值可以为,
,
,
,
,
则随机变量的分布列为
0
1
2
3
.
18.(24-25高三上·吉林长春·阶段练习)已知某学校为提高学生课外锻炼的积极性,开展了丰富的课外活动,为了解学生对开展的课外活动的满意程度,该校随机抽取了350人进行调查,整理得到如下列联表:
性别
课外活动
合计
满意
不满意
男
150
100
250
女
50
50
100
合计
200
150
350
0.1
0.05
0.01
2.706
3.841
6.635
(1)根据小概率值的独立性检验,能否认为该校学生对课外活动的满意情况与性别因素有关联?
(2)从这350名样本学生中任选1名学生,设事件“选到的学生是男生”,事件“选到的学生对课外活动满意”,比较和的大小.
附:
【答案】(1)认为该校学生对课外活动的满意情况与性别因素无关联
(2)
【难度】0.65
【知识点】独立性检验解决实际问题、计算条件概率
【分析】(1)同过列联表中数据计算的值,再与小概率值进行比较得出结论;
(2)根据条件概率公式本别计算和的值并比较两值的大小.
【详解】(1)提出零假设:该校学生对课外活动的满意情况与性别因素无关联,
根据表中数据,得到,
所以根据小概率值的独立性检验,没有充分证据推断不成立,
即认为该校学生对课外活动的满意情况与性别因素无关联.
(2)依题意得,,,
,,
所以,,
则.
19.(2024·西藏拉萨·一模)某社区组织居民开在垃圾分类知识竞赛活动.随机对该社区名居民的成绩进行统计,成绩均在内,将成绩分成组进行统计分析:第组有人,第组有16人,第组有人,第组有人,第组有人.现使用分层随机抽样的方法在第,组共选取人参加垃圾分类志愿者工作.
(1)对该社区名居民进行问卷调查,部分数据如下表所示,补全表格数据,并依据小概率值的独立性检验,分析能否认为居民喜欢垃圾分类与性别有关;
不喜欢垃圾分类
喜欢垃圾分类
合计
男
女
合计
(2)若从参加垃圾分类志愿者工作的人中随机选取人参加垃圾分类知识宣讲工作,记来自第组的人数为,求的分布列及数学期望.
附:,.
【答案】(1)表格见解析,有关
(2)分布列见解析,
【难度】0.65
【知识点】独立性检验解决实际问题、计算古典概型问题的概率、写出简单离散型随机变量分布列
【分析】(1)根据题干完成联表,进而求得,即可判断相关性;
(2)根据古典概型概率公式计算公式,进而可分布列与期望.
【详解】(1)补充列联表如下所示,
不喜欢垃圾分类
喜欢垃圾分类
合计
男
女
合计
零假设:居民喜欢垃圾分类与性别无关,
则,
所以依据小概率值的独立性检验,推断不成立,即认为喜欢垃圾分类与性别有关;
(2)用分层随机抽样的方法在第,组抽取的人数分别是,,
所以可能的取值为,,,
,,,
所以的分布列为
.
20.(24-25高三上·上海·阶段练习)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析社区的市民是否喜欢网上买菜与年龄有关?
(2)M社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;
(3)用频率估计概率,现从M社区随机抽取20名市民,记其中喜欢网上买菜的市民人数为随机变量,并记随机变量,求、的期望和方差.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式及数据:,其中.
【答案】(1)有关
(2)
(3),,,
【难度】0.65
【知识点】利用全概率公式求概率、二项分布的方差、二项分布的均值、独立性检验解决实际问题
【分析】(1)由独立性检验相关知识可得答案;
(2)由题结合全概率公式可得答案;
(3)由题可得,后由期望与方差性质可得答案.
【详解】(1)假设:M社区的市民是否喜欢网上买菜与年龄无关.
由给定的列联表,得:.
根据小概率值的独立性检验,我们推断不成立,
即认为是否喜欢网上买菜与年龄有关联,此推断犯错误的概率不大于.
(2)设表示周在A平台买菜,表示周在B平台买菜,
由题可得,
由全概率公式,小张周二选择平台买菜的概率为:
;
(3)依题意,喜欢网上买菜的概率为:.
从M社区随机抽取20名市民,其中喜欢网上买菜的市民人数服从二项分布:,所以,.
又,所以,.
21.(2024·四川成都·模拟预测)已知某学校为提高学生课外锻炼的积极性,开展了丰富的课外活动,为了解学生对开展的课外活动的满意程度,该校随机抽取了350人进行调查,整理得到如下列联表:
性别
课外活动
合计
满意
不满意
男
150
100
250
女
50
50
100
合计
200
150
350
(1)根据小概率值的独立性检验,能否认为该校学生对课外活动的满意情况与性别因素有关联?
(2)从这350名样本学生中任选1名学生,设事件A=“选到的学生是男生”,事件B=“选到的学生对课外活动满意”,比较和的大小,并解释其意义,
附:
0.1
0.05
0.01
2.706
3.841
6.635
【答案】(1)认为该校学生对课外活动的满意情况与性别因素无关联
(2),意义:男生对课外活动满意的概率比女生对课外活动满意的概率大;或者男生对课外活动满意的人数比女生对课外活动满意的人数多等等
【难度】0.65
【知识点】计算条件概率、独立性检验解决实际问题
【分析】(1)同过列联表中数据计算的值,再与小概率值进行比较得出结论;
(2)根据条件概率公式本别计算和的值并比较两值的大小,并根据条件概率的含义说明所得结论在本题对应的意义.
【详解】(1)提出零假设:该校学生对课外活动的满意情况与性别因素无关联,
根据表中数据,得到,
所以根据小概率值的独立性检验,没有充分证据推断不成立,
即认为该校学生对课外活动的满意情况与性别因素无关联.
(2)解法1:依题意得,,
,
则.
解法2: 依题意得,,,
,,
所以,,
则.
意义:男生对课外活动满意的概率比女生对课外活动满意的概率大;或者男生对课外活动满意的人数比女生对课外活动满意的人数多等等.
22.(24-25高三上·湖南·期中)电动车的安全问题越来越引起广大消费者的关注,目前电动车的电池有石墨烯电池与铅酸电池两种.某公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500名市民,其中被调查的女性市民中偏好铅酸电池电动车的占,得到以下的2-2列联表:
偏好石墨烯电池电动车
偏好铅酸电池电动车
合计
男性市民
200
100
女性市民
合计
500
(1)根据以上数据,完成2×2列联表,依据小概率的独立性检验,能否认为市民对这两种电池的电动车的偏好与性别有关;
(2)采用分层抽样的方法从偏好石墨烯电池电动车的市民中随机抽取7人,再从这7名市民中抽取2人进行座谈,求在有女性市民参加座谈的条件下,恰有一名女性市民参加座谈的概率;
(3)用频率估计概率,在所有参加调查的市民中按男性和女性进行分层抽样,随机抽取5名市民,再从这5名市民中随机抽取2人进行座谈,记2名参加座谈的市民中来自偏好石墨烯电池电动车的男性市民的人数为X,求X的分布列和数学期望.
参考公式:,其中.
参考数据:
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,能
(2)
(3)分布列见解析,
【难度】0.65
【知识点】独立性检验解决实际问题、写出简单离散型随机变量分布列、计算条件概率、求离散型随机变量的均值
【分析】(1)由题意直接确定列联表,计算,对比数据即可判断;
(2)由条件概率计算公式即可求解;
(3)记“3名被抽取的男性市民中,恰好抽到k人参加座谈”记为事件,
求得,再由条件概率乘法公式和互斥事件加法公式计算随机变量取每一个值对应的概率,即可求解;
【详解】(1)被调查的女性市民人数为,
其中偏好铅酸电池电动车的女性市民人数为.
偏好石墨烯电池电动车的女性市民人数为,
所以2×2列联表为:
偏好石墨烯电池电动车
偏好铅酸电池电动车
合计
男性市民
200
100
300
女性市民
80
120
200
合计
280
220
500
零假设:市民对这两种电池的电动车的偏好与市民的性别无关,
根据列联表中的数据可以求得
,
由于,
根据小概率值的独立性检验,我们推断不成立,
即认为市民对这两种电池的电动车的偏好与市民的性别有关.
(2)因为偏好石墨烯电池电动车的市民中,男性市民与女性市民的比为,
所以采用分层抽样的方法抽取7的人中,男性市民有5人,女性市民有2人,
设“有女性市民参加座谈”为事件A,“恰有一名女性市民参加座谈”为事件B,
则,,
所以.
(3)因为所有参加调查的市民中,男性市民和女性市民的比为,
所以由分层抽样知,随机抽取的5名市民中,男性市民有3人,女性市民有2人.
根据频率估计概率知,男性市民偏好石墨烯电池电动车的概率为,偏好铅酸电池电动车的概率为,
从选出的5名市民中随机抽取2人进行座谈,则X可能的取值为0,1,2.
“3名被抽取的男性市民中,恰好抽到k人参加座谈”记为事件,
则.
“参加座谈的2名市民中是偏好石墨烯电池电动车的男性市民的人数恰好为m人”记为事件,
则,,
,,
,,
所以
,
,
,
故X的分布列如下:
X
0
1
2
P
10 / 37
学科网(北京)股份有限公司
$$