内容正文:
预习第12讲 独立性检验7种常见考法归类
模块一 思维导图串知识
模块二 基础知识全梳理(吃透教材)
模块三 核心考点举一反三
模块四 小试牛刀过关测
1.掌握分类变量和列联表的概念,并会依据列联表判断两个分类变量是否独立.
2.理解统计量χ2的意义和独立性检验的基本思想.
知识点1.分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
知识点2.2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
知识点3.等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
知识点4.临界值
χ2 统计量也可以用来作相关性的度量.χ2 越小说明变量之间越独立,χ2越大说明变量之间越相关
χ2=.忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.
知识点5.独立性检验
基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
知识点6.应用独立性检验解决实际问题的大致步骤
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
考点一:用2×2列联表分析两分类变量间的关系
例1.不可以判断两个变量是否有关系的是( )
A.散点图 B.列联表
C.等高条形图 D.频率分布直方图
【变式1-1】考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
考点二:2×2列联表完善
例2.下表是一个列联表,则表中,的值分别为( )
总计
21
25
33
总计
100
A.46,54 B.54,46 C.52,54 D.50,52
【变式2-1】假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
【变式2-2】下面是列联表:
总计
总计
则 .
【变式2-3】某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中 , .
80分及80分以上
80分以下
合计
试验班
对照班
合计
【变式2-4】某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有 人.(请将所有可能的结果都填在横线上)
附表:,其中.
0.050
0.010
3.841
6.635
考点三:用等高堆积条形图分析两类变量间的关系
例3.观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
【变式3-1】为了发展学生的兴趣和个性特长,培养全面发展的人才.某学校在不加重学生负担的前提下.提供个性、全面的选修课程.为了解学生对于选修课《学生领导力的开发》的选择意愿情况,对部分高二学生进行了抽样调查,制作出如图所示的两个等高条形图,根据条形图,下列结论正确的是( )
A.样本中不愿意选该门课的人数较多
B.样本中男生人数多于女生人数
C.样本中女生人数多于男生人数
D.该等高条形图无法确定样本中男生人数是否多于女生人数
【变式3-2】四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
【变式3-3】为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
考点四:对独立性检验的理解
例4.下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病
D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大
【变式4-1】在易怒与患心脏病这两个变量的计算中,有以下结论:①当由独立性检验可知有90%的把握认为易怒与患心脏病有关时,那么在100个易怒的人中有90人患心脏病;②由的观测值得到有90%的把握认为易怒与患心脏病有关系,是指有10%的可能性使得推断出现错误;③由独立性检验可知有90%的把握认为易怒与患心脏病有关,是指在犯错误的概率不超过10%的前提下,可以认为某人是否患心脏病与是否易怒有关,其中正确结论的个数是( )
A.3 B.2 C.1 D.0
【变式4-2】下列关于独立性检验的说法正确的是( )
A.用独立性检验推断的结论可靠,不会犯错误
B.用独立性检验推断的结论可靠,但会犯随机性错误
C.独立性检验的方法适用普查数据
D.对于不同的小概率值,用独立性检验推断的结论相同
【变式4-3】对变量X与Y的统计量的值.说法正确的是( )
A.越大,“X与Y有关系”可信程度越小
B.越小,“X与Y有关系”可信程度越大
C.越小,“X与Y有关”程度越小
D.越大,“X与Y无关"程度越大
【变式4-4】在一项中学生近视情况的调查中,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时最有说服力的方法是( )
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
考点五:卡方的计算与判断
例5.根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为( )
A.变量与不独立,这个结论犯错误的概率不超过
B.变量与不独立,这个结论犯错误的概率不超过
C.变量与独立,这个结论犯错误的概率不超过
D.变量与独立,这个结论犯错误的概率不超过
【变式5-1】某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用2×2列联表进行独立性检验,经计算,则认为“学生性别与支持某项活动有关系”的犯错误的概率不超过( )
A.0.1% B.1%
C.99% D.99.9%
【变式5-2】根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为( )
A.变量与不独立,这个结论犯错误的概率不超过
B.变量与不独立,这个结论犯错误的概率不超过
C.变量与独立,这个结论犯错误的概率不超过
D.变量与独立,这个结论犯错误的概率不超过
【变式5-3】在吸烟与患肺癌是否相关的研究中,下列说法正确的是( )
A.若,我们有99%的把握认为吸烟与患肺癌有关,则在100个吸烟的人中必有99个人患肺癌
B.由独立性检验可知,当有99%的把握认为吸烟与患肺癌有关时,若某人吸烟,则他有99%的可能患有肺癌
C.通过计算得到,是指有95%的把握认为吸烟与患肺癌有关系
D.以上三种说法都不正确
【变式5-4】假设有两个变量和,它们的取值分别为和,其列联表为( )
根据以下选项中的数据计算的值,其中最大的一组为( )
A.
B.
C.
D.
考点六:独立性检验的卡方计算
例6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:
电离辐
射剂量
存活情况
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
由表中数据算得:χ2= ,说明两种电离辐射剂量对小白鼠的致死作用 .(填“相同”或“不相同”)
【变式6-1】考察棉花种子是否经过处理跟得病之间的关系,得如表所示的数据:
种子处理
种子未处理
合计
得病
不得病
合计
根据以上数据得χ2的值是 (精确到).
【变式6-2】为了有针对性地提高学生体育锻炼的积极性,某中学随机抽取了80名学生,按照性别和体育锻炼情况整理为如下列联表:
性别
锻炼
合计
不经常
经常
男生
20
20
40
女生
24
16
40
合计
44
36
80
(1)依据的独立性检验,能否认为性别因素会影响学生锻炼的经常性;
(2)若列联表中的所有样本观测数据都变为原来的10倍,再做第(1)问,得到的结论还一样吗?请说明理由;
附:①,其中.
②临界值表
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式6-3】微信已成为人们常用的社交软件,“微信运动”是微信里由腾讯开发的一个类似计步数据库的公众号.手机用户可以通过关注“微信运动”公众号查看自己每天行走的步数,同时也可以和好友进行运动量的PK或点赞.现从小明的微信好友中随机选取40人(男、女各20人),记录他们某一天行走的步数,并将数据整理如下表:
步数
性别
0~2000
2001~5000
5001~8000
8001~10000
>10000
男
1
2
4
7
6
女
0
3
9
6
2
若某人一天行走的步数超过8000步被评定为“积极型”,否则被评定为“懈怠型”,
(1)根据题意完成下面的列联表;
积极型
懈怠型
总计
男
女
总计
(2)计算的值,并据此判断能否有90%的把握认为“评定类型”与“性别”有关?
本题参考:独立性检验计算公式:,其中.
相关关系的可信度临界值表:
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
考点七:独立性检验与概率统计的综合应用
例7.为考察药物对预防疾病以及药物对治疗疾病的效果,科研团队进行了大量动物对照试验.根据100个简单随机样本的数据,得到如下列联表:(单位:只)
药物
疾病
未患病
患病
合计
未服用
30
15
45
服用
45
10
55
合计
75
25
100
(1)依据的独立性检验,分析药物对预防疾病的有效性;
(2)用频率估计概率,现从患病的动物中用随机抽样的方法每次选取1只,用药物进行治疗.已知药物的治愈率如下:对未服用过药物的动物治愈率为,对服用过药物的动物治愈率为.若共选取3次,每次选取的结果是相互独立的.记选取的3只动物中被治愈的动物个数为,求的分布列和数学期望.
附:,
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【变式7-1】数学运算是数学学科的核心素养之一,具备较好的数学运算素养一般体现为在运算中算法合理、计算准确、过程规范、细节到位,为了诊断学情、培养习惯、发展素养,某老师计划调研准确率与运算速度之间是否有关,他记录了一段时间的相关数据如下表:
项目
速度快
速度慢
合计
准确率高
10
22
32
准确率低
11
17
28
合计
21
39
60
(1)依据的独立性检验,能否认为数学考试中准确率与运算速度相关?
(2)为鼓励学生全面发展,现随机将准确率高且速度快的10名同学分成人数分别为3,3,4的三个小组进行小组才艺展示,若甲、乙两人在这10人中,求甲在3人一组的前提下乙在4人一组的概率.
附:
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
其中.
【变式7-2】环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量(单位:辆)和空气中的的平均浓度(单位:). 调研人员采集了50天的数据,制作了关于的散点图,并用直线与将散点图分成如图所示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的列联表,并判断至少有多大把握认为“平均浓度不小于与“汽车日流量不小于1500辆”有关;
汽车日流量
汽车日流量
合计
的平均浓度
的平均浓度
合计
(2)经计算得回归方程为,且这50天的汽车日流量的标准差,的平均浓度的标准差.
①求相关系数,并判断该回归方程是否有价值;
②若这50天的汽车日流量满足,试推算这50天的日均浓度的平均数.(精确到0.1)
参考公式:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
回归方程,其中.
相关系数. 若,则认为与有较强的线性相关性.
【变式7-3】篮球是一项风靡世界的运动,是深受大众喜欢的一项运动.
喜爱篮球运动
不喜爱篮球运动
合计
男性
60
40
100
女性
20
80
100
合计
80
120
200
(1)为了解喜爱篮球运动是否与性别有关,随机抽取了男性和女性各100名观众进行调查,得到如上列联表,判断是否有99.9%的把握认为喜爱篮球运动与性别有关;
(2)校篮球队中的甲、乙、丙三名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能的将球传给另外两个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第次触球者是甲的概率记为,即.
①求(直接写出结果即可);
②证明:数列为等比数列,并比较第9次与第10次触球者是甲的概率的大小.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
附:,.
一、单选题
1.(23-24高二下·山东青岛·期中)根据分类变量与的成对样本数据,计算得到.已知,依据小概率值的独立性检验,则( )
A.与不独立
B.与不独立,这个结论犯错误的概率不超过0.05
C.与独立
D.与独立,这个结论犯错误的概率不超过0.05
2.(23-24高二下·天津滨海新·期末)现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵严重的A城市和交通拥堵不严重的B城市分别随机调查了20名市民,得到了一个市民是否认可的样本,具体数据如下列联表:
A
B
总计
认可
15
8
23
不认可
5
12
17
总计
20
20
40
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
附:.
根据表中的数据,下列说法中,正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
3.(2024高三·全国·专题练习)某品牌公司在海外设立了多个分支机构,现需要国内公司外派大量中、青年员工该企业为了解这两个年龄层的员工是否愿意被外派,采用分层抽样的方法从中、青年员工中随机抽取了100位进行调查,得到数据如下表:
愿意被外派
不愿意被外派
总计
中年员工
20
30
50
青年员工
40
10
50
总计
60
40
100
得到的正确结论是( )
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.有90%的把握认为“是否愿意被外派与年龄有关”
B.有90%的把握认为“是否愿意被外派与年龄无关”
C.有99%的把握认为“是否愿意被外派与年龄有关”
D.有99%的把握认为“是否愿意被外派与年龄无关”
4.(23-24高二下·浙江·期中)为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.05的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
5.635
7.879
10.828
A.35 B.36 C.37 D.38
5.(23-24高二下·山西长治·期中)某课外兴趣小组为研究数学成绩优秀是否与性别有关,通过随机抽样调查,得到成对样本观测数据的分类统计结果,并计算得出,经查阅独立性检验的小概率值和相应的临界值,知,则下列判断正确的是( )
A.若某人数学成绩优秀,那么他为男生的概率是
B.每100个数学成绩优秀的人中就会有1名是女生
C.数学成绩优秀与性别有关,此推断犯错误的概率不大于
D.在犯错误的概率不超过的前提下认为数学成绩优秀与性别无关
6.(24-25高二下·全国·单元测试)某市对机动车单双号限行进行了调查,在参加调查的2600名有车人中有1700名持反对意见,2500名无车人中有1400名持反对意见,在运用这些数据说明“拥有车辆”与“反对机动车单双号限行”是否相关时,用下列哪种方法最有说服力( )
A.独立性检验 B.数学期望 C.随机误差 D.频率分布直方图
7.(24-25高二下·全国·单元测试)某班主任对全班50名学生进行了作业量的调查,数据如表:
认为作业量大
认为作业量不大
合计
男生
18
9
27
女生
8
15
23
合计
26
24
50
则推断“学生的性别与认为作业量大有关”的把握至少为( )
A. B. C. D.
8.(23-24高二下·黑龙江哈尔滨·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
9.(23-24高二下·天津滨海新·期末)下列说法正确的个数是( )
①线性相关系数越接近1,两个变量的线性相关程度越强;
②独立性检验可以100%确定两个变量之间是否具有某种关系;
③在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高;
④甲、乙两个模型的决定系数分别约为0.88和0.80,则模型甲的拟合效果更好.
A.1 B.2 C.3 D.4
10.(24-25高二下·全国·课后作业)某兴趣小组为研究语文学习与数学、英语、政治、历史四科之间的关系,随机调查部分高二学生,统计数据如下表,则语文对数学、英语、政治、历史学习具有影响的可能性最大的是( )
数学成绩优异
数学成绩一般
英语成绩优异
英语成绩一般
政治成绩优异
政治成绩一般
历史成绩优异
历史成绩一般
语文成绩优异
5
15
4
16
6
14
8
14
语文成绩一般
7
25
10
22
11
21
6
24
A.数学 B.英语 C.政治 D.历史
11.(24-25高二下·全国·课后作业)为了更好地开展多媒体化教学,杭州市某小学对“文理学科教师与喜欢用平板教学”是否有关做了一次研究调查,其中被调查的文科、理科教师人数相同,理科教师喜欢用平板教学的人数占理科教师总人数的80%,文科教师喜欢用平板教学的人数占文科教师总人数的40%,若有95%的把握认为是否喜欢用平板教学和文理学科有关,则调查人数中理科教师人数最少可能是( )
附:,其中.
0.05
0.010
3.841
6.635
A.8 B.12 C.15 D.20
12.(23-24高三下·陕西西安·阶段练习)下列说法正确的是( )
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量,由它们的样本数据计算得到的观测值,
的部分临界值如下表:
0.1
0.05
0.025
0.01
2.706
3.841
5.024
6.635
则在犯错误的概率不超过0.025的前提下认为变量没有关系
13.(2023·甘肃兰州·模拟预测)为了检测某种新药的效果,现随机抽取100只小白鼠进行试验,得到如下列联表:
未治愈
治愈
合计
服用药物
10
40
50
未服用药物
20
30
50
合计
30
70
100
则下列说法一定正确的是( )
附:(其中).
临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
B.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
C.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
D.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
14.(24-25高三上·四川遂宁·阶段练习)下列说法错误的是( )
A.线性相关系数越接近1,两个变量的线性相关程度越强;
B.独立性检验可以100%确定两个变量之间是否具有某种关系;
C.在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高;
D.甲、乙两个模型的决定系数分别约为0.88和0.80,则模型甲的拟合效果更好.
15.(24-25高三上·江西新余·阶段练习)如图为对某高中学生是否对父母说过“我爱你”这样的话的统计结果,则下列统计分析中不正确的是:( ).
A.男性被调查者没有对父母说过“我爱你”这样的话的人数比例高于女性
B.无论男女对母亲说“我爱你”这类话的比例都高于对父亲所说
C.大部分调查者没有对父母说过“我爱你”这样的话
D.经常对父母说“我爱你”这样的话的人数总计比例较女生比例有所下降,说明这张统计图的结果可能存在错误
16.(2024高三·全国·专题练习)为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了50人,得到如下结果(单位:人)
不患肺癌
患肺癌
合计
不吸烟
24
6
30
吸烟
6
14
20
合计
30
20
50
根据表中数据,以下叙述正确的是:( )
A.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
B.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
C.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
D.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
17.(2024高三·全国·专题练习)为了调查各参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为;②在犯错误的概率不超过的前提下,可以认为“是否对主办方表示满意与运动员的性别有关”;③在犯错误的概率不超过的前提下,不可以认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )
男性运动员(人)
女性运动员(人)
对主办方表示满意
200
220
对主办方表示不满意
50
30
注:
0.600
0.050
0.010
0.001
2.706
3.841
6.635
10.828
A.0 B.1 C.2 D.3
18.(24-25高三上·天津北辰·阶段练习)下列说法正确的是( )
A.若两个随机变量的线性相关性越强,则相关系数的值越接近于1
B.根据分类变量与的成对样本数据,计算得到.依据的独立性检验(),可判断与无关
C.对具有线性相关关系的变量,,其线性回归方程为,若样本点的中心为,则实数的值是.
D.已知随机变量服从二项分布,若,则.
19.(24-25高二下·全国·课堂例题)在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是( )
A.若的值大于,则有的把握认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患肺癌
B.由独立性检验可知,有的把握认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有的可能患有肺癌
C.若从统计量中求出有的把握认为吸烟与患肺癌有关系,是指有不超过的可能性使得判断出现错误
D.以上三种说法都不正确
20.(22-23高三下·重庆北碚·阶段练习)一医疗团队为研究治疗某种疾病的新药能否有助于7天内治愈该疾病病人,在已患病的500例病人中,随机分为两组,实验组服用该新药,对照组不服用该药,在其他治疗措施相同的情况下,统计7天内痊愈病例数,得到如下数据:
7天内未痊愈
7天内痊愈
对照组
30
170
实验组
20
280
根据表格数据,下列结论正确的是( )
参考公式及数据:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
A.在犯错误的概率不大于0.01的前提下,可以认为服用该新药与7天内治愈病人无关
B.在犯错误的概率不大于0.001的前提下,可以认为服用该新药与7天内治愈病人无关
C.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
D.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
二、多选题
21.(2024高三·全国·专题练习)(多选题)根据分类变量与的观察数据,计算得到,依据表中给出的独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是( )
A.根据小概率值的独立性检验,分析变量与相互独立
B.根据小概率值的独立性检验,分析变量与不相互独立
C.变量与相互独立,这个结论犯错误的概率不超过
D.变量与不相互独立,这个结论犯错误的概率不超过
22.(23-24高二下·河北·阶段练习)根据分类变量与的成对样本数据,计算得到.已知,依据0.01的独立性检验,下列结论正确的是( )
A.若,则变量与不独立
B.若,则变量与独立
C.若,则变量与独立
D.若,则变量与不独立
23.(24-25高三上·广东深圳·阶段练习)某中学为更好地开展素质教育,现对外出研学课程是否和性别有关做了一项调查,其中被调查的男生和女生人数相同,且男生中选修外出研学课程的人数占男生总人数的,女生中选修外出研学课程的人数占女生总人数的.如果依据的独立性检验认为选修外出研学课程与性别有关,但依据的独立性检验认为选修外出研学课程与性别无关,则调查人数中男生可能有( )
附:
,其中.
A.150人 B.225人
C.300人 D.375人
24.(24-25高三上·重庆·期中)下列说法中,正确的是( )
A.对于独立性检验,随机变量的值越大,则推断“两变量有关系”犯错误的概率越小
B.若,则
C.随机变量服从正态分布 ,若,则
D.数据4,3,2,5,6,7的分位数为 4
25.(23-24高二下·河南漯河·期中)为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40 名学生进行调查,按照性别和体育锻炼情况整理出如下的22列联表:
性别
锻炼情况
合计
不经常
经常
女生/人
14
7
21
男生/人
8
11
19
合计/人
22
18
40
临界值表如下:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
根据这些数据,给出下列四个结论中正确的是( )
A.依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响
B.依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响
C.根据小概率值α=0.05的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05
D.根据小概率值α=0.05的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响
26.(24-25高三上·四川·期中)为了研究某校高三年级学生的性别和身高是否低于的关联性,研究小组从该校高三学生中获取容量为500的有放回简单随机样本,由样本数据整理得到如下列联表:
单位:人
性别
身高
合计
低于
不低于
女
140
60
200
男
120
180
300
合计
260
240
500
附:,其中.
α
小组成员甲用该列联表中的数据进行独立性检验,小组成员乙将该列联表中的所有数据都缩小为原来的后再进行独立性检验,则下列说法正确的是( )
A.依据的独立性检验,小组成员甲可以认为该中学高三年级学生的性别与身高有关联
B.依据的独立性检验,小组成员甲不能认为该中学高三年级学生的性别与身高有关联
C.小组成员甲、乙计算出的值相同,依据的独立性检验,他们得出的结论也相同
D.小组成员甲、乙计算出的值不同,依据的独立性检验,他们得出的结论也不同
三、填空题
27.(23-24高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是 .
28.(2023·广西·模拟预测)某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中,且,若有的把握可以认为性别与对工作的满意程度具有相关性,则x的值可以是 .(横线上给出一个满足条件的x的值即可)
对工作满意
对工作不满意
男
5x
5x
女
4x
6x
附:,其中.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
29.(23-24高二下·广东中山·期末)某市举行了首届阅读大会,为调查市民对阅读大会的满意度,相关部门随机抽取男女市民各名,每位市民对大会给出满意或不满意的评价,得到下面列联表:
满意
不满意
男市民
女市民
当,时,若在的情况下,我们没有充分的证据推断男、女市民对大会的评价有差异,则的最小值为 .
附:,其中.
30.(24-25高三上·山东济宁·阶段练习)某传媒公司针对“社交电商用户是否存在性别差异”进行调查,共调查了个人,得到下侧列联表.已知,若根据的独立性检验认为“社交电商用户存在性别差异”,则的最小值为 .
是社交电商用户
不是社交电商用户
合计
男性
女性
合计
参考公式:,其中.
31.(2024高三·全国·专题练习)在西非“埃博拉病毒"的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:
感染
未感染
合计
服用
10
40
50
未服用
20
30
50
合计
30
70
100
附:
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
根据上表,在犯错误的概率不超过 的前提下,认为“小动物是否感染与服用疫苗有关”.
32.(2024高三·全国·专题练习)下列说法中,正确的有 (填序号).
①回归直线恒过点,且至少过一个样本点;
②根据列联表中的数据计算得出,而,则在犯错误的概率不超过0.01的前提下认为两个分类变量有关系;
③是用来判断两个分类变量是否相关的随机变量,当的值很小时可以推断两类变量不相关;
④某项测量结果服从正态分布,则,则.
33.(24-25高三上·湖南·阶段练习)某传媒公司针对“社交电商用户是否存在性别差异”进行调查,共调查了个人,得到如下列联表:
是社交电商用户
不是社交电商用户
合计
男性
女性
合计
已知,若根据的独立性检验认为“社交电商用户存在性别差异”,则的最小值为 .
34.(24-25高三上·江苏南通·阶段练习)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据通过计算有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为 .
支持
不支持
男生
女生
附:,其中.
四、解答题
35.(24-25高二上·河北沧州·阶段练习)某县承包了一块土地,已知土地的使用面积与相应的管理时间的关系如下表所示:
土地使用面积亩
1
2
3
4
5
管理时间月
8
10
13
25
24
并调查了某村300位村民参与管理的意愿,得到的部分数据如下表所示:
单位:人
愿意参与管理
不愿意参与管理
合计
男性村民
150
50
女性村民
50
合计
(1)求出样本相关系数的大小,并判断管理时间与土地使用面积是否线性相关(当时,即可认为线性相关);
(2)依据的独立性检验,分析村民的性别与参与管理的意愿是否有关;
(3)以该村村民的性别与参与管理意愿的情况估计该县的情况,从该县中任取3人,记取到不愿意参与管理的男性村民的人数为,求的分布列及数学期望.
参考公式:,其中.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考数据:.
36.(24-25高三上·山西·阶段练习)近年来,因使用手机过久、工作压力大等因素导致不少人出现了睡眠问题.某媒体为了了解出现睡眠问题者的年龄分布,调查了200名成年人的睡眠时间,得到如下列联表:
90后
非90后
合计
23:00前入睡
30
80
23:00后入睡
合计
100
200
(1)完成列联表,根据小概率值的独立性检验,分析能否认为“23:00前入睡”与“是90后”有关联?
(2)随着出现睡眠问题人群的增加,及社会对睡眠健康重视程度的加深,有助提高睡眠质量的产品受到消费者推崇,记年的年份代码依次为1,2,3,4,5,下表为年中国睡眠经济市场规模及2024年中国睡眠经济市场规模(单位:千亿元)预测,
年份代码
1
2
3
4
5
市场规模
3.8
4.2
4.5
5.0
5.3
根据上表数据求关于的回归方程.
参考公式:,其中.回归方程,
其中
参考数据:.
37.(24-25高三上·重庆·阶段练习)手机用户可通过某软件查看自己每天行走的步数,同时也可以和好友进行运动量的比较和点赞.若某人一天的行走步数超过8000,则评定为“积极型”,否则评定为“懈怠型”.从小王的男性和女性好友中各随机抽取了50名,统计其一天的步数并给出评定,得到如下数据:
积极型
懈怠型
男
20
30
女
10
40
(1)能否有95%的把握认为“评定类型”与“性别”有关?
(2)以样本数据估计总体数据,且以频率估计概率.若从小王的所有男性好友中抽取3人,记其中评定为“积极型”的人数为,求随机变量的数学期望.
附:,其中.
0.050
0.025
0.010
3.841
5.024
6.635
38.(2024高三·全国·专题练习)微生物生态学的研究表明,水生生物中存在大量的有益微生物,这些有益水生微生物对于维持水质平衡具有非常重要的作用.研究人员为了研究某种有益水生微生物在特定营养物质浓度下的增长速率与水体类型(淡水或咸水)的关系,对100个水体环境样本中的有益水生微生物在一段时间内的数量进行了观察,经统计得到如下的列联表:
水体环境类型
增长情况
合计
快速增长
未快速增长
淡水环境
25
咸水环境
10
合计
100
已知从这100个水体环境样本中随机抽取1个,该水体环境中的有益水生微生物属于“快速增长”的概率为.
(1)求;
(2)根据小概率值的独立性检验,判断该有益水生微生物“快速增长”与水体环境类型是否有关?根据小概率值的独立性检验,判断该有益水生微生物“快速增长”与水体环境类型是否有关?
附:,
0.01
0.005
0.001
6.635
7.879
10.828
39.(24-25高三上·河北邢台·期末)为了研究性别与感冒的关系,某医学研究小组在11月感冒易发季节对某一社区男性和女性的感冒情况进行抽样调研,得到如下列联表.
性别
感冒情况
合计
不感冒
感冒
男性
30
15
45
女性
45
10
55
合计
75
25
100
(1)请根据列联表,并依据小概率值的独立性检验,分析能否认为性别与感冒情况具有相关性;
(2)利用分层随机抽样的方法从样本中不感冒的人群中随机抽取5人,再从这5人中选出2人分享发言,记分享发言中女性的人数为,求随机变量的分布列及数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
40.(2024·全国·模拟预测)某校高一学生共有人,年级组长利用数字化学习软件记录每位学生每日课后作业完成的时长,期中考试之后统计得到了如下平均作业时长与学业成绩的数据表:
平均作业时长(单位:小时)
学业成绩优秀:
学业成绩不优秀:
(1)试判断:是否有的把握认为学业成绩优秀与日均作业时长不小于小时且小于小时有关?
(2)常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.已知该校高一学生女生中成绩优秀的学生占比,现从所有高一学生中任选一人,表示“选到的是男生”,表示“选到的学生成绩优秀”,若,求.
附:,.
41.(24-25高三上·上海·阶段练习)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析社区的市民是否喜欢网上买菜与年龄有关?
(2)M社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;
(3)用频率估计概率,现从M社区随机抽取20名市民,记其中喜欢网上买菜的市民人数为随机变量,并记随机变量,求、的期望和方差.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式及数据:,其中.
42.(22-23高二下·广西玉林·阶段练习)为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,经统计这200人中通过电子阅读与纸质阅读的人数之比为,将这200人按年龄分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示.
(1)求的值及通过电子阅读的居民的平均年龄;(同一组中数据用该组区间的中点值作代表)
(2)把年龄在的居民称为青年组,年龄在的居民称为中老年组,若选出的200人中通过纸质阅读的中老年有30人,请完成下面列联表,依据的独立性检验,能否认为阅读方式与年龄有关联?
单位:人
年龄分组
阅读方式
合计
电子阅读
纸质阅读
青年
中老年
合计
0.15
0.1
0.05
0.025
0.01
2.072
2.706
3.841
5.024
6.635
43.(2024高三·全国·专题练习)“一带一路”是促进各国共同发展,实现共同繁荣的合作共嬴之路.为了了解我国与某国在“一带一路”合作中两国的贸易量情况,随机抽查了100天进口贸易量与出口贸易量(单位:亿元人民币/天),整理数据得下表:
进口贸易量
出口贸易量
32
18
4
6
8
12
3
7
10
(1)用频率估计概率,试估计事件“我国与该国贸易中,一天的进口贸易量与出口贸易量均不超过100亿元人民币”的概率.
(2)根据所给数据,完成下面的列联表.
进口贸易量
出口贸易量
(3)依据的独立性检验,能否认为我国与该国贸易中一天的进口贸易量与出口贸易量有关?
附:,.
0.05
0.01
0.001
3.841
6.635
10.828
原创精品资源学科网独家享有版权,侵权必究!5
学科网(北京)股份有限公司
$$
预习第12讲 独立性检验7种常见考法归类
模块一 思维导图串知识
模块二 基础知识全梳理(吃透教材)
模块三 核心考点举一反三
模块四 小试牛刀过关测
1.掌握分类变量和列联表的概念,并会依据列联表判断两个分类变量是否独立.
2.理解统计量χ2的意义和独立性检验的基本思想.
知识点1.分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
知识点2.2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
知识点3.等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
知识点4.临界值
χ2 统计量也可以用来作相关性的度量.χ2 越小说明变量之间越独立,χ2越大说明变量之间越相关
χ2=.忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.
知识点5.独立性检验
基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
知识点6.应用独立性检验解决实际问题的大致步骤
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
考点一:用2×2列联表分析两分类变量间的关系
例1.不可以判断两个变量是否有关系的是( )
A.散点图 B.列联表
C.等高条形图 D.频率分布直方图
【答案】D
【分析】根据题意,依次分析选项的图、表,结合其统计意义,即可得答案.
【详解】解:对于,根据散点图可以判断两个变量间相关性的强弱,故A正确;
对于,对于列联表,计算的值,可以判断两个变量是否有关系,故B正确;
对于,用等高条形图可以粗略地判断两个变量是否有关,故C正确;
对于,频率分布直方图是反映样本的频率分布规律,不能反映是否相关,故D错误.
故选:.
【变式1-1】考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【答案】C
【分析】根据表格提供的数据作出判断.
【详解】由列联表中的数据可知,
种子经过处理,得病的比例明显降低,
种子未经过处理,得病的比例要高些,
所以可得结论:种子是否经过处理跟是否生病有关.
故选:C
考点二:2×2列联表完善
例2.下表是一个列联表,则表中,的值分别为( )
总计
21
25
33
总计
100
A.46,54 B.54,46 C.52,54 D.50,52
【答案】B
【解析】由表格中的数据可得,,
所以,.故选:B.
【变式2-1】假设有两个变量X和Y,他们的取值分别为,和,,其列联表为:
总计
21
73
8
25
33
总计
46
106
则表中,的值分别是( )
A.94,96 B.54,52 C.52,50 D.52,60
【答案】D
【解析】根据列联表知,,又,所以,故选:
【变式2-2】下面是列联表:
总计
总计
则 .
【答案】
【解析】,
所以.
故答案为:
【变式2-3】某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中 , .
80分及80分以上
80分以下
合计
试验班
对照班
合计
【答案】
【解析】依题意,,解得.
故答案为:;
【变式2-4】某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有 人.(请将所有可能的结果都填在横线上)
附表:,其中.
0.050
0.010
3.841
6.635
【答案】45,50,55,60,65
【分析】利用独立性检验表达列联表及观测值可解得答案.
【详解】设男生有x人,由题意可得列联表如下,
喜欢
不喜欢
合计
男生
x
女生
x
合计
若认为喜欢网络游戏和性别有关,且该推断犯错误的概率超过0.01但不超过0.05,
则.
∵,
∴,解得,
又x为5的整数倍,∴被调查的学生中男生可能人数为45,50,55,60,65.
故答案为:45,50,55,60,65.
考点三:用等高堆积条形图分析两类变量间的关系
例3.观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
【答案】B
【分析】根据题意,由等高条形图的意义分析可得答案.
【详解】根据题意,在等高的条形图中,当,所占比例相差越大时,越有把握认为两个分类变量,之间有关系,
由选项可得:B选项中,,所占比例相差无几,所以最有把握认为两个分类变量,之间没有关系,
故选:B
【变式3-1】为了发展学生的兴趣和个性特长,培养全面发展的人才.某学校在不加重学生负担的前提下.提供个性、全面的选修课程.为了解学生对于选修课《学生领导力的开发》的选择意愿情况,对部分高二学生进行了抽样调查,制作出如图所示的两个等高条形图,根据条形图,下列结论正确的是( )
A.样本中不愿意选该门课的人数较多
B.样本中男生人数多于女生人数
C.样本中女生人数多于男生人数
D.该等高条形图无法确定样本中男生人数是否多于女生人数
【答案】B
【解析】对于A,由图乙可知,样本中男生,女生都大部分愿意选择该门课,
则样本中愿意选该门课的人数较多,A错误;
对于BCD,由图甲可知,在愿意和不愿意的人中,都是男生占比较大,
所以可以确定,样本中男生人数多于女生人数,B正确,CD错误.
故选:B.
【变式3-2】四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
【答案】C
【分析】根据等高条形图的概念结合条件逐项分析即得.
【详解】根据等高条形图图1可知样本中选择物理学科的人数较多,故C正确;
根据等高条形图图2可知样本中男生人数多于女生人数,故D错误;
样本中选择物理学科的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低,
所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;
样本中女生选择历史意愿的人数不一定多于男生选择历史意愿的人数,故B错误.
故选:C.
【变式3-3】为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
【答案】D
【分析】结合所给比例图,依次分析判断4个选项即可.
【详解】对于A,城镇户籍中选择生育二胎,农村户籍中选择生育二胎,相差较大,则是否倾向选择生育二胎与户籍有关,A错误;
对于B,男性和女性中均有选择生育二胎,则是否倾向选择生育二胎与性别无关,B错误;
对于C,由于男性和女性中均有选择生育二胎,但样本中男性40人,女性60人,则倾向选择生育二胎的人员中,男性人数与女性人数不同,C错误;
对于D,倾向选择不生育二胎的人员中,农村户籍有人,城镇户籍有人,农村户籍人数少于城镇户籍人数,D正确.
故选:D.
考点四:对独立性检验的理解
例4.下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以确定两个变量之间是否具有某种关系
C.利用独立性检验推断吸烟与患肺病的关联中,根据小概率值的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在个吸烟的人中,有人患肺病
D.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大
【答案】D
【分析】根据独立性检验的意义分别判断各选项.
【详解】对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故错误;
对于B,独立性检验并不能确定两个变量相关,故错误;
对于C,是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;
对于D,根据卡方计算的定义可知该选项正确;
故选:D.
【变式4-1】在易怒与患心脏病这两个变量的计算中,有以下结论:①当由独立性检验可知有90%的把握认为易怒与患心脏病有关时,那么在100个易怒的人中有90人患心脏病;②由的观测值得到有90%的把握认为易怒与患心脏病有关系,是指有10%的可能性使得推断出现错误;③由独立性检验可知有90%的把握认为易怒与患心脏病有关,是指在犯错误的概率不超过10%的前提下,可以认为某人是否患心脏病与是否易怒有关,其中正确结论的个数是( )
A.3 B.2 C.1 D.0
【答案】B
【解析】由独立性检验可知有90%的把握认为易怒与患心脏病有关,
是指在犯错误的概率不超过10%的前提下,可认为某人是否患心脏病与易怒有关,
则①错误,③正确.
由的观测值得到有90%的把握认为易怒与患心脏病有关系,
是指有10%的可能性使得推断出现错误,则②正确.故选:B
【变式4-2】下列关于独立性检验的说法正确的是( )
A.用独立性检验推断的结论可靠,不会犯错误
B.用独立性检验推断的结论可靠,但会犯随机性错误
C.独立性检验的方法适用普查数据
D.对于不同的小概率值,用独立性检验推断的结论相同
【答案】B
【解析】A.独立性检验取决于样本,来确定是否有把握认为“两个分类变量有关系,
样本不同,所得结果会有差异,不会犯错误的说法太绝对,A错;
B.用独立性检验推断的每个结论都会犯随机性错误,B正确
C.根据普查数据,我们可以通过相关的比率给出准确回答,
不需要用独立性检验,
依据小概率值推断两个分类变量的关联性,
所以独立性检验的方法不适用普查数据,C错;
D.对于不同的小概率值,结论可能不相同,
有时有把握,有时无把握,把握率不同,D错误.故选:B.
【变式4-3】对变量X与Y的统计量的值.说法正确的是( )
A.越大,“X与Y有关系”可信程度越小
B.越小,“X与Y有关系”可信程度越大
C.越小,“X与Y有关”程度越小
D.越大,“X与Y无关"程度越大
【答案】C
【解析】根据独立性检验的概念,可得:当越大,“X与Y有关系”可信程度越大,
越小,“X与Y有关系”可信程度越小,所以A、B、D错误,C正确.故选:C.
【变式4-4】在一项中学生近视情况的调查中,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时最有说服力的方法是( )
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
【答案】C
【分析】近视与性别是两个分类变量,根据分类变量的研究方法确定答案.
【详解】近视与性别是两个分类变量,
在检验两个随机事件是否有关时,最有说服力的方法是独立性检验,
故选:C.
考点五:卡方的计算与判断
例5.根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为( )
A.变量与不独立,这个结论犯错误的概率不超过
B.变量与不独立,这个结论犯错误的概率不超过
C.变量与独立,这个结论犯错误的概率不超过
D.变量与独立,这个结论犯错误的概率不超过
【答案】B
【分析】根据找出对应的的值,并比较与卡方值得大小,进而由卡法的定义推出相应结论即可.
【详解】因为时,所以,
所以变量与不独立,且这个结论犯错误的概率不超过.
故选:B.
【变式5-1】某校为了研究“学生的性别”和“对待某一活动的态度”是否有关,运用2×2列联表进行独立性检验,经计算,则认为“学生性别与支持某项活动有关系”的犯错误的概率不超过( )
A.0.1% B.1%
C.99% D.99.9%
【答案】B
【分析】根据,即可判断结果.
【详解】,认为“学生性别与支持某项活动有关系”的犯错误的概率不超过1%.
故选:B
【变式5-2】根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为( )
A.变量与不独立,这个结论犯错误的概率不超过
B.变量与不独立,这个结论犯错误的概率不超过
C.变量与独立,这个结论犯错误的概率不超过
D.变量与独立,这个结论犯错误的概率不超过
【答案】B
【解析】因为时,所以,
所以变量与不独立,且这个结论犯错误的概率不超过.
故选:B.
【变式5-3】在吸烟与患肺癌是否相关的研究中,下列说法正确的是( )
A.若,我们有99%的把握认为吸烟与患肺癌有关,则在100个吸烟的人中必有99个人患肺癌
B.由独立性检验可知,当有99%的把握认为吸烟与患肺癌有关时,若某人吸烟,则他有99%的可能患有肺癌
C.通过计算得到,是指有95%的把握认为吸烟与患肺癌有关系
D.以上三种说法都不正确
【答案】C
【分析】根据独立性检验的思想即可求解.
【详解】若,我们有99%的把握认为吸烟与患肺癌有关,而不是在100个吸烟的人中必有99个人患肺癌,故A不正确;
99%是指吸烟与患肺癌有关的概率,而不是吸烟的人有99%的可能患有肺癌,故B不正确,C正确,D不正确.
故选:C
【变式5-4】假设有两个变量和,它们的取值分别为和,其列联表为( )
根据以下选项中的数据计算的值,其中最大的一组为( )
A.
B.
C.
D.
【答案】C
【解析】对于A,,
对于B,,
对于C,,
对于D,,
显然最大,故C正确.
故选:C.
考点六:独立性检验的卡方计算
例6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:
电离辐
射剂量
存活情况
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
由表中数据算得:χ2= ,说明两种电离辐射剂量对小白鼠的致死作用 .(填“相同”或“不相同”)
【答案】 5.333 不相同
【解析】由列联表中数据,计算得,
所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关,
即两种电离辐射剂量对小白鼠的致死作用不相同.
故答案为:5.333;不相同
【变式6-1】考察棉花种子是否经过处理跟得病之间的关系,得如表所示的数据:
种子处理
种子未处理
合计
得病
不得病
合计
根据以上数据得χ2的值是 (精确到).
【答案】
【解析】依题意
.
故答案为:
【变式6-2】为了有针对性地提高学生体育锻炼的积极性,某中学随机抽取了80名学生,按照性别和体育锻炼情况整理为如下列联表:
性别
锻炼
合计
不经常
经常
男生
20
20
40
女生
24
16
40
合计
44
36
80
(1)依据的独立性检验,能否认为性别因素会影响学生锻炼的经常性;
(2)若列联表中的所有样本观测数据都变为原来的10倍,再做第(1)问,得到的结论还一样吗?请说明理由;
附:①,其中.
②临界值表
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)不能
(2)不一样,理由见解析
【分析】(1)根据列联表中的数据,求得,再与临界值表对照下结论;
(2)根据数据,求得,再与临界值表对照即可.
【详解】(1)解:零假设为性别与锻炼的经常性无关,
根据列联表中的数据,经计算得到
,
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即不能认为性别因素会影响学生锻炼的经常性.
(2)由题意得,
根据小概率值的独立性检验,我们推断不成立,
因此可以认为性别因素会影响学生锻炼的经常性,此推断犯错误的概率不大于0.05,
得到的结论不一样.
【变式6-3】微信已成为人们常用的社交软件,“微信运动”是微信里由腾讯开发的一个类似计步数据库的公众号.手机用户可以通过关注“微信运动”公众号查看自己每天行走的步数,同时也可以和好友进行运动量的PK或点赞.现从小明的微信好友中随机选取40人(男、女各20人),记录他们某一天行走的步数,并将数据整理如下表:
步数
性别
0~2000
2001~5000
5001~8000
8001~10000
>10000
男
1
2
4
7
6
女
0
3
9
6
2
若某人一天行走的步数超过8000步被评定为“积极型”,否则被评定为“懈怠型”,
(1)根据题意完成下面的列联表;
积极型
懈怠型
总计
男
女
总计
(2)计算的值,并据此判断能否有90%的把握认为“评定类型”与“性别”有关?
本题参考:独立性检验计算公式:,其中.
相关关系的可信度临界值表:
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)表格见解析
(2)2.506,有90%的把握认为“评定类型”与“性别”有关.
【分析】(1)根据所给数据完成列联表即可;
(2)计算出根据所给数据做出判断即可.
【详解】(1)列联表如下:
积极型
懈怠型
总计
男
13
7
20
女
8
12
20
总计
21
19
40
(2),
因为,而观测值2.506对应的两组分类变量的无关概率超过0.1,
则相关概率小于0.9,所以没有90%的把握认为“评定类型”与“性别”有关.
考点七:独立性检验与概率统计的综合应用
例7.为考察药物对预防疾病以及药物对治疗疾病的效果,科研团队进行了大量动物对照试验.根据100个简单随机样本的数据,得到如下列联表:(单位:只)
药物
疾病
未患病
患病
合计
未服用
30
15
45
服用
45
10
55
合计
75
25
100
(1)依据的独立性检验,分析药物对预防疾病的有效性;
(2)用频率估计概率,现从患病的动物中用随机抽样的方法每次选取1只,用药物进行治疗.已知药物的治愈率如下:对未服用过药物的动物治愈率为,对服用过药物的动物治愈率为.若共选取3次,每次选取的结果是相互独立的.记选取的3只动物中被治愈的动物个数为,求的分布列和数学期望.
附:,
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)药物对预防疾病有效果.
(2)答案见解析.
【分析】(1)根据公式算出卡方,与表格中的数据比较即可.
(2)结合全概率公式先求概率,每名志愿者用药互不影响,且实验成功概率相同,X服从二项分布求分布列和数学期望即可.
【详解】(1)零假设为:药物对预防疾病无效果,
根据列联表中的数据,经计算得到
,
根据小概率值的独立性检验,我们推断零假设不成立,
即认为药物对预防疾病有效果.
(2)设A表示药物的治愈率,表示对未服用过药物 , 表示服用过药物由题,,,
且,,
.
药物的治愈率,
则,所以,
,
,
,
X的分布列如下表所示
X
0
1
2
3
P
.
【变式7-1】数学运算是数学学科的核心素养之一,具备较好的数学运算素养一般体现为在运算中算法合理、计算准确、过程规范、细节到位,为了诊断学情、培养习惯、发展素养,某老师计划调研准确率与运算速度之间是否有关,他记录了一段时间的相关数据如下表:
项目
速度快
速度慢
合计
准确率高
10
22
32
准确率低
11
17
28
合计
21
39
60
(1)依据的独立性检验,能否认为数学考试中准确率与运算速度相关?
(2)为鼓励学生全面发展,现随机将准确率高且速度快的10名同学分成人数分别为3,3,4的三个小组进行小组才艺展示,若甲、乙两人在这10人中,求甲在3人一组的前提下乙在4人一组的概率.
附:
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
其中.
【答案】(1)依据的独立性检验,数学考试中准确率与运算速度无关
(2)
【分析】(1)根据独立性检验相关知识直接计算判断即可;
(2)记“甲在3人一组”为事件,记“甲在3人一组,且乙在4人一组”为事件,根据题意分别求出两事件概率,结合条件概率公式求解甲在3人一组的前提下乙在4人一组的概率即可.
【详解】(1)零假设数学考试中准确率与运算速度无关,
,
依据的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即数学考试中准确率与运算速度无关
(2)记“甲在3人一组”为事件,
则需从除甲以外的9人中任选2人与甲形成一组,
再从剩下7人中任选3人形成一组,最后4人形成一组,
所以,
记“甲在3人一组,且乙在4人一组”为事件,
则需从除甲、乙以外的8人中任选2人与甲形成一组,
再从剩下6人中任选3人与乙形成一组,最后3人形成一组,
所以,
由条件概率公式,则,
即甲在3人一组的前提下乙在4人一组的概率为
【变式7-2】环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量(单位:辆)和空气中的的平均浓度(单位:). 调研人员采集了50天的数据,制作了关于的散点图,并用直线与将散点图分成如图所示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的列联表,并判断至少有多大把握认为“平均浓度不小于与“汽车日流量不小于1500辆”有关;
汽车日流量
汽车日流量
合计
的平均浓度
的平均浓度
合计
(2)经计算得回归方程为,且这50天的汽车日流量的标准差,的平均浓度的标准差.
①求相关系数,并判断该回归方程是否有价值;
②若这50天的汽车日流量满足,试推算这50天的日均浓度的平均数.(精确到0.1)
参考公式:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
回归方程,其中.
相关系数. 若,则认为与有较强的线性相关性.
【解析】(1)列联表如下:
汽车日流量
汽车日流量
合计
的平均浓度
16
8
24
的平均浓度
6
20
26
合计
22
28
50
零假设:“PM2.5平均浓度不小于100μg/m3”与“汽车日流量不小于1500辆”无关,
因为,
所以至少有的把握(但还不能有的把握)认为“平均浓度不小于”与“汽车日流量不小于1500辆有关”.
(2)①因为回归方程为,所以,
又因为,,
所以.
与有较强的相关性,该回归方程有价值.
②,解得
而样本中心点位于回归直线上,
因此可推算.
【变式7-3】篮球是一项风靡世界的运动,是深受大众喜欢的一项运动.
喜爱篮球运动
不喜爱篮球运动
合计
男性
60
40
100
女性
20
80
100
合计
80
120
200
(1)为了解喜爱篮球运动是否与性别有关,随机抽取了男性和女性各100名观众进行调查,得到如上列联表,判断是否有99.9%的把握认为喜爱篮球运动与性别有关;
(2)校篮球队中的甲、乙、丙三名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能的将球传给另外两个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第次触球者是甲的概率记为,即.
①求(直接写出结果即可);
②证明:数列为等比数列,并比较第9次与第10次触球者是甲的概率的大小.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
附:,.
【答案】(1)有99.9%的把握认为喜爱篮球运动与性别有关.
(2)①;②证明见解析,第次触球者是甲的概率大.
【分析】(1)直接带公式即可.
(2)①根据题义写即可;通过分析与的概率关系式,再利用数列知识计算结果.
【详解】(1)(1)根据列联表数据,经计算得,
根据独立性检验:即有的把握认为喜爱篮球运动与性别有关.
(2)①由题意得:第二次触球者为乙,丙中的一个,第二次触球者传给包括甲的二人中的一人,故传给甲的概率为,故.
②第次触球者是甲的概率记为,则当时,第次触球者是甲的概率为,
第次触球者不是甲的概率为,
则
从而,又,
所以是以为首项,公比为的等比数列,
故第次触球者是甲的概率大.
一、单选题
1.(23-24高二下·山东青岛·期中)根据分类变量与的成对样本数据,计算得到.已知,依据小概率值的独立性检验,则( )
A.与不独立
B.与不独立,这个结论犯错误的概率不超过0.05
C.与独立
D.与独立,这个结论犯错误的概率不超过0.05
【答案】C
【分析】根据独立性检验的知识判断即可.
【详解】因为
根据,根据小概率值的独立性检验知:与独立,C正确.
故选:C.
2.(23-24高二下·天津滨海新·期末)现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵严重的A城市和交通拥堵不严重的B城市分别随机调查了20名市民,得到了一个市民是否认可的样本,具体数据如下列联表:
A
B
总计
认可
15
8
23
不认可
5
12
17
总计
20
20
40
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
附:.
根据表中的数据,下列说法中,正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
【答案】C
【分析】先计算出卡方值,再分别与各选项中的相应的小概率值比较,根据独立性检验的原理,即可作出判断
【详解】由
对于A,因,故有95%以上的把握认为“是否认可与城市的拥堵情况有关”,即A错误;
对于B,因,故没有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”,即B错误;
对于C,因,故可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”,即C正确;
对于D,因,故在犯错误的概率不超过0.01的前提下不能认为“是否认可与城市的拥堵情况有关”,即D错误.
故选:C.
3.(2024高三·全国·专题练习)某品牌公司在海外设立了多个分支机构,现需要国内公司外派大量中、青年员工该企业为了解这两个年龄层的员工是否愿意被外派,采用分层抽样的方法从中、青年员工中随机抽取了100位进行调查,得到数据如下表:
愿意被外派
不愿意被外派
总计
中年员工
20
30
50
青年员工
40
10
50
总计
60
40
100
得到的正确结论是( )
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.有90%的把握认为“是否愿意被外派与年龄有关”
B.有90%的把握认为“是否愿意被外派与年龄无关”
C.有99%的把握认为“是否愿意被外派与年龄有关”
D.有99%的把握认为“是否愿意被外派与年龄无关”
【答案】C
【分析】先根据列联表中数据,利用公式求出的值,再与临界值比较做判断即可.
【详解】由列联表,可得,
所以有99%的把握认为“是否愿意被外派与年龄有关”,
故选:C.
4.(23-24高二下·浙江·期中)为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.05的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
5.635
7.879
10.828
A.35 B.36 C.37 D.38
【答案】B
【分析】根据题意列出二联表,即可由卡方公式求解即可.
【详解】设没接种只数为k,依题意,得2×2列联表如下:
发病
没发病
合计
接种
2k
没接种
k
合计
3k
则的观测值为:,因为本次调查得出“在犯错误的概率不超过0.05的前提下认为喜爱足球与性别有关的结论,
于是,即,即
∴,∴
故选:B.
5.(23-24高二下·山西长治·期中)某课外兴趣小组为研究数学成绩优秀是否与性别有关,通过随机抽样调查,得到成对样本观测数据的分类统计结果,并计算得出,经查阅独立性检验的小概率值和相应的临界值,知,则下列判断正确的是( )
A.若某人数学成绩优秀,那么他为男生的概率是
B.每100个数学成绩优秀的人中就会有1名是女生
C.数学成绩优秀与性别有关,此推断犯错误的概率不大于
D.在犯错误的概率不超过的前提下认为数学成绩优秀与性别无关
【答案】C
【分析】根据独立性检验的定义判断即可.
【详解】因为,
所以数学成绩优秀与性别有关,此推断犯错误的概率不大于,
即在犯错误率不超过的前提下认为“数学成绩优秀与性别有关”,故C正确,D错误;
若某人数学成绩优秀,由已知数据不能判断他为男生的概率,故A错误;
每个数学成绩优秀的人中可能没有女生,也有可能有多名女生,由已知数据不能确定结论,故B错误;
故选:C.
6.(24-25高二下·全国·单元测试)某市对机动车单双号限行进行了调查,在参加调查的2600名有车人中有1700名持反对意见,2500名无车人中有1400名持反对意见,在运用这些数据说明“拥有车辆”与“反对机动车单双号限行”是否相关时,用下列哪种方法最有说服力( )
A.独立性检验 B.数学期望 C.随机误差 D.频率分布直方图
【答案】A
【分析】根据独立性检验概念判断选项即可.
【详解】独立性检验是检验两个不同分类的变量是否相关的方法,刚好符合题意,
而数学期望、随机误差、频率分布直方图都不是分析两个不同分类的变量是否相关的方法,
故采用独立性检验方法最有说服力.
故选:A.
7.(24-25高二下·全国·单元测试)某班主任对全班50名学生进行了作业量的调查,数据如表:
认为作业量大
认为作业量不大
合计
男生
18
9
27
女生
8
15
23
合计
26
24
50
则推断“学生的性别与认为作业量大有关”的把握至少为( )
A. B. C. D.
【答案】C
【分析】根据列联表中数据计算,对照临界值即可得出结论.
【详解】由公式得.
所以“学生的性别与认为作业量大有关”的把握至少为.
故选:C.
8.(23-24高二下·黑龙江哈尔滨·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
【答案】B
【分析】根据所给数据完善列联表,计算出卡方,即可判断.
【详解】依题意可得列联表如下:
男生
女生
合计
篮球迷
30
15
45
非篮球迷
45
10
55
合计
75
25
100
所以,
所以在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关,
即有的把握认为是否是篮球迷与性别有关,
又,所以没有的把握认为是否是篮球迷与性别有关.
故选:B.
9.(23-24高二下·天津滨海新·期末)下列说法正确的个数是( )
①线性相关系数越接近1,两个变量的线性相关程度越强;
②独立性检验可以100%确定两个变量之间是否具有某种关系;
③在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高;
④甲、乙两个模型的决定系数分别约为0.88和0.80,则模型甲的拟合效果更好.
A.1 B.2 C.3 D.4
【答案】C
【分析】根据线性相关系数,独立性检验,残差图及决定系数的概念分别判断即可.
【详解】线性相关系数越接近1,两个变量的线性相关程度越强,故①正确;
独立性检验并不能100%确定两个变量之间是否具有某种关系,故②错误;
回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高,故③正确;
回归分析中,可用判断模型的拟合效果,越大,模型的拟合效果越好,故④正确;
故选:C.
10.(24-25高二下·全国·课后作业)某兴趣小组为研究语文学习与数学、英语、政治、历史四科之间的关系,随机调查部分高二学生,统计数据如下表,则语文对数学、英语、政治、历史学习具有影响的可能性最大的是( )
数学成绩优异
数学成绩一般
英语成绩优异
英语成绩一般
政治成绩优异
政治成绩一般
历史成绩优异
历史成绩一般
语文成绩优异
5
15
4
16
6
14
8
14
语文成绩一般
7
25
10
22
11
21
6
24
A.数学 B.英语 C.政治 D.历史
【答案】D
【分析】分别计算每一项的卡方并比较大小即可得解.
【详解】数学:,
英语:,
政治:,
历史:,
所以语文对数学、英语、政治、历史学习具有影响的可能性最大的是历史.
故选:D.
11.(24-25高二下·全国·课后作业)为了更好地开展多媒体化教学,杭州市某小学对“文理学科教师与喜欢用平板教学”是否有关做了一次研究调查,其中被调查的文科、理科教师人数相同,理科教师喜欢用平板教学的人数占理科教师总人数的80%,文科教师喜欢用平板教学的人数占文科教师总人数的40%,若有95%的把握认为是否喜欢用平板教学和文理学科有关,则调查人数中理科教师人数最少可能是( )
附:,其中.
0.05
0.010
3.841
6.635
A.8 B.12 C.15 D.20
【答案】C
【分析】利用独立性检验列联表及观测值可解得答案.
【详解】由题意被调查的文理科教师人数相同,设理科教师的人数为,由题意可列出列联表:
理科教师
文科教师
合计
喜欢用平板教学
不喜欢用平板教学
合计
.
由于有的把握认为是否喜欢用平板教学和文理学科有关,
所以,
解得,因为,
故的可能取值为:12,13,14,15,16,17,18,19,
即理科教师的人数可以是:12,13,14,15,16,17,18,19,且考虑到喜欢用平板的人数占理科教师总人数的,故人数为15人时,有实际意义.
故选:C
12.(23-24高三下·陕西西安·阶段练习)下列说法正确的是( )
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量,由它们的样本数据计算得到的观测值,
的部分临界值如下表:
0.1
0.05
0.025
0.01
2.706
3.841
5.024
6.635
则在犯错误的概率不超过0.025的前提下认为变量没有关系
【答案】A
【分析】根据标准差定义可判断A项;通过取反例可排除B项;利用相关系数的概念易排除C项;利用独立性检验的规定,可判断结论不成立.
【详解】对于A,根据标准差定义,一组数据的标准差时,
显然有故A正确;
对于B,两组数据的标准差相等,这两组数据的平均数未必相等,如都为1和都为2的两组数据,
它们的标准差均为0,但它们的平均数分别为1和,故B错误;
对于C,两个变量的相关系数越接近于0,两个变量的相关性越弱,故C错误;
对于D,,根据独立性检验原理,
在犯错误的概率不超过0.025的前提下认为变量有关系,故D错误.
故选:A
13.(2023·甘肃兰州·模拟预测)为了检测某种新药的效果,现随机抽取100只小白鼠进行试验,得到如下列联表:
未治愈
治愈
合计
服用药物
10
40
50
未服用药物
20
30
50
合计
30
70
100
则下列说法一定正确的是( )
附:(其中).
临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
B.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
C.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
D.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
【答案】A
【分析】根据表中数据求出的值,即可得答案.
【详解】解:由列联表中数据,计算,
且,
所以有的把握认为“小白鼠是否被治愈与是否服用新药有关”
所以在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”.
故选:A.
14.(24-25高三上·四川遂宁·阶段练习)下列说法错误的是( )
A.线性相关系数越接近1,两个变量的线性相关程度越强;
B.独立性检验可以100%确定两个变量之间是否具有某种关系;
C.在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高;
D.甲、乙两个模型的决定系数分别约为0.88和0.80,则模型甲的拟合效果更好.
【答案】B
【分析】利用线性相关系数、独立性检验、残差图、决定系数等相关概念,逐一判断选项即可得出结论.
【详解】对于A,根据线性相关系数的定义可判断A正确;
对于B,独立性检验是存在某种程度的错误概率的,因此可得B错误;
对于C,利用回归分析残差概念以及残差图可判断C正确;
对于D,决定系数的值越大,说明拟合效果越好,显然,即模型甲的拟合效果更好,可得D正确.
故选:B
15.(24-25高三上·江西新余·阶段练习)如图为对某高中学生是否对父母说过“我爱你”这样的话的统计结果,则下列统计分析中不正确的是:( ).
A.男性被调查者没有对父母说过“我爱你”这样的话的人数比例高于女性
B.无论男女对母亲说“我爱你”这类话的比例都高于对父亲所说
C.大部分调查者没有对父母说过“我爱你”这样的话
D.经常对父母说“我爱你”这样的话的人数总计比例较女生比例有所下降,说明这张统计图的结果可能存在错误
【答案】D
【分析】根据统计图中的数据进行分析,判断每个选项的正确性.
【详解】对于A选项,观察统计图,比较男性和女性未对父母说过“我爱你”的比例,
发现男性未说的比例高于女性,所以A选项正确.
对于B选项,分别对比男女对母亲和对父亲说“我爱你”的比例,
能看出无论男女对母亲说的比例都高于对父亲说的比例,所以B选项正确.
对于C选项,从统计图整体来看,未说过“我爱你”的人数比例较大,
所以大部分调查者没有对父母说过“我爱你”这样的话,C选项正确.
对于D选项,经常对父母说“我爱你”的人数总计比例较女生比例有所下降,
并不能直接说明统计图结果存在错误,有可能是实际调查结果就是如此,所以D选项错误.
故选:D
16.(2024高三·全国·专题练习)为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了50人,得到如下结果(单位:人)
不患肺癌
患肺癌
合计
不吸烟
24
6
30
吸烟
6
14
20
合计
30
20
50
根据表中数据,以下叙述正确的是:( )
A.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
B.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
C.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
D.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
【答案】C
【分析】利用卡方计算公式求得,再利用独立性检验中的意义即可得解.
【详解】由题意,得12.5,
则,所以有的把握认为“吸烟与患肺癌有关有关”.
故选:C.
17.(2024高三·全国·专题练习)为了调查各参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为;②在犯错误的概率不超过的前提下,可以认为“是否对主办方表示满意与运动员的性别有关”;③在犯错误的概率不超过的前提下,不可以认为“是否对主办方表示满意与运动员的性别有关”;则正确命题的个数为( )
男性运动员(人)
女性运动员(人)
对主办方表示满意
200
220
对主办方表示不满意
50
30
注:
0.600
0.050
0.010
0.001
2.706
3.841
6.635
10.828
A.0 B.1 C.2 D.3
【答案】B
【分析】先根据表格计算满意的男性运动员的概率为判断①,再根据判断②③即可.
【详解】因为对主办方表示满意的男性运动员的人数为,
所以在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为,所以命题①错误,
又因为,
所以在犯错误的概率不超过的前提下,不可以认为“是否对主办方表示满意与运动员的性别有关”;所以命题②错误,命题③正确.
故选:B.
18.(24-25高三上·天津北辰·阶段练习)下列说法正确的是( )
A.若两个随机变量的线性相关性越强,则相关系数的值越接近于1
B.根据分类变量与的成对样本数据,计算得到.依据的独立性检验(),可判断与无关
C.对具有线性相关关系的变量,,其线性回归方程为,若样本点的中心为,则实数的值是.
D.已知随机变量服从二项分布,若,则.
【答案】C
【分析】根据两个随机变量的线性相关性的强弱与相关系数的关系即可判断A;根据卡方检验即可判断B,利用线性回归方程必过样本中心点,即可判断选C;利用二项分布的数学期望计算公式以及期望的运算性质,即可判断D.
【详解】对于A,若两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1,故A错误;
对D,由可判断X与Y有关,故B错误;
对于C:因为线性回归直线过样本点中心,所以,可得,故C正确;
对于D:因为随机变量服从二项分布,所以,
则,
因为,则,所以,故D错误.
故选:C.
19.(24-25高二下·全国·课堂例题)在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是( )
A.若的值大于,则有的把握认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患肺癌
B.由独立性检验可知,有的把握认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有的可能患有肺癌
C.若从统计量中求出有的把握认为吸烟与患肺癌有关系,是指有不超过的可能性使得判断出现错误
D.以上三种说法都不正确
【答案】C
【分析】利用独立性检验的定义逐个选项判断即可.
【详解】若的值大于,则在犯错误的概率不超过的前提下认为吸烟与患肺癌有关系,
不是在100个吸烟的人中必有99人患有肺癌,故A错误,
也不是说某人吸烟,那么他有的可能患有肺癌,故B错误,
若有的把握认为吸烟与患肺癌有关系,
则有不超过的可能性使得判断出现错误,故C正确,D错误.
故选:C
20.(22-23高三下·重庆北碚·阶段练习)一医疗团队为研究治疗某种疾病的新药能否有助于7天内治愈该疾病病人,在已患病的500例病人中,随机分为两组,实验组服用该新药,对照组不服用该药,在其他治疗措施相同的情况下,统计7天内痊愈病例数,得到如下数据:
7天内未痊愈
7天内痊愈
对照组
30
170
实验组
20
280
根据表格数据,下列结论正确的是( )
参考公式及数据:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
A.在犯错误的概率不大于0.01的前提下,可以认为服用该新药与7天内治愈病人无关
B.在犯错误的概率不大于0.001的前提下,可以认为服用该新药与7天内治愈病人无关
C.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
D.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
【答案】C
【分析】求出卡方值,和6.635,10.828比较即可根据小概率值的独立性检验判断.
【详解】,所以根据小概率值的独立性检验,有充分证据推断服用该新药对7天内治愈病人有影响,
因此在犯错误的概率不大于0.01的前提下,可以推断服用该新药与7天内治愈病人有关,故C正确,A错误.
,所以根据小概率值的独立性检验,没有充分证据推断服用该新药对7天内治愈病人有关,
因此在犯错误的概率不大于0.001的前提下,不可以推断服用该新药与7天内治愈病人有关,故BD错误.
故选:C.
二、多选题
21.(2024高三·全国·专题练习)(多选题)根据分类变量与的观察数据,计算得到,依据表中给出的独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是( )
A.根据小概率值的独立性检验,分析变量与相互独立
B.根据小概率值的独立性检验,分析变量与不相互独立
C.变量与相互独立,这个结论犯错误的概率不超过
D.变量与不相互独立,这个结论犯错误的概率不超过
【答案】AD
【分析】根据卡方值与临界值比较,结合独立性检验的概念判断即可.
【详解】因为,,
所以的独立性检验变量x与y相互独立,
的独立性检验变量x与y不相互独立,这个结论犯错误的概率不超过.
故选:AD
22.(23-24高二下·河北·阶段练习)根据分类变量与的成对样本数据,计算得到.已知,依据0.01的独立性检验,下列结论正确的是( )
A.若,则变量与不独立
B.若,则变量与独立
C.若,则变量与独立
D.若,则变量与不独立
【答案】CD
【分析】根据独立性检验的基本思想判断即可.
【详解】若,则变量与不独立,这个结论犯错误的概率不超过0.01.
若,则变量与独立.
故选:CD.
23.(24-25高三上·广东深圳·阶段练习)某中学为更好地开展素质教育,现对外出研学课程是否和性别有关做了一项调查,其中被调查的男生和女生人数相同,且男生中选修外出研学课程的人数占男生总人数的,女生中选修外出研学课程的人数占女生总人数的.如果依据的独立性检验认为选修外出研学课程与性别有关,但依据的独立性检验认为选修外出研学课程与性别无关,则调查人数中男生可能有( )
附:
,其中.
A.150人 B.225人
C.300人 D.375人
【答案】BC
【分析】设男生人数为,根据题意用表示出女生人数、男生中“选修外出研学课程”人数、女生中“选修外出研学课程”人数,进而表示出表格中其它人数,利用公式计算出,由得到的范围,进而得到男生人数的范围,选出符合题意的选项.
【详解】设男生人数为,根据题意可得列联表如下:
男生
女生
合计
选修外出研学课程
不选修外出研学课程
合计
则,
依据依据的独立性检验认为选修外出研学课程与性别有关,但依据的独立性检验认为选修外出研学课程与性别无关,
则,
解得,则.
故选:BC.
24.(24-25高三上·重庆·期中)下列说法中,正确的是( )
A.对于独立性检验,随机变量的值越大,则推断“两变量有关系”犯错误的概率越小
B.若,则
C.随机变量服从正态分布 ,若,则
D.数据4,3,2,5,6,7的分位数为 4
【答案】ABC
【分析】由独立性检验的性质可以判断A;结合条件概率公式可判断B;由正态分布的性质可判断C;将数据从小到大排列,找到分位数即可判断D.
【详解】对于选项A:对于独立性检验,随机变量的值越大,
则两变量有关系的程度的错误率更低,故越大,判定“两变量有关系”的错误率更低,故选项A正确;
对于选项B:结合条件概率公式可知,
所以,所以,故选项B正确;
对于选项C:因为随机变量服从正态分布所以正态曲线关于对称,
又,所以,
因为,所以,故选项C正确;
对于选项D:将数据从小到大排列为2,3,4,5,6,7,
因为,所以这组数据的分位数为,故选项D错误;
故选:ABC.
25.(23-24高二下·河南漯河·期中)为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40 名学生进行调查,按照性别和体育锻炼情况整理出如下的22列联表:
性别
锻炼情况
合计
不经常
经常
女生/人
14
7
21
男生/人
8
11
19
合计/人
22
18
40
临界值表如下:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
根据这些数据,给出下列四个结论中正确的是( )
A.依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响
B.依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响
C.根据小概率值α=0.05的独立性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错误的概率不超过0.05
D.根据小概率值α=0.05的独立性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响
【答案】AD
【分析】分别求出男生和女生经常锻炼的频率即可依据频率稳定于概率的原理判断,求出卡方值,和3.841比较即可根据小概率值的独立性检验判断.
【详解】由表可知,女生有21人,其中经常锻炼的有7人,频率为,
男生有19人,其中经常锻炼的有11人,频率为,
因为,依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响,故A正确,B错误;
,所以根据小概率值的独立性检验,
没有充分证据推断性别对体育锻炼的经常性有影响,因此可以认为性别对体育锻炼的经常性没有影响,故D正确,C错误.
故选:AD
26.(24-25高三上·四川·期中)为了研究某校高三年级学生的性别和身高是否低于的关联性,研究小组从该校高三学生中获取容量为500的有放回简单随机样本,由样本数据整理得到如下列联表:
单位:人
性别
身高
合计
低于
不低于
女
140
60
200
男
120
180
300
合计
260
240
500
附:,其中.
α
小组成员甲用该列联表中的数据进行独立性检验,小组成员乙将该列联表中的所有数据都缩小为原来的后再进行独立性检验,则下列说法正确的是( )
A.依据的独立性检验,小组成员甲可以认为该中学高三年级学生的性别与身高有关联
B.依据的独立性检验,小组成员甲不能认为该中学高三年级学生的性别与身高有关联
C.小组成员甲、乙计算出的值相同,依据的独立性检验,他们得出的结论也相同
D.小组成员甲、乙计算出的值不同,依据的独立性检验,他们得出的结论也不同
【答案】AD
【分析】根据列联表及卡方公式求对应卡方值,结合独立性检验的基本思想得到结论,即可得答案.
【详解】由题设,零假设该中学高三年级学生的性别与身高没有关联,
对于成员甲有,
对于成员乙有,
依据的独立性检验,小组成员甲可认为该中学高三年级学生的性别与身高有关联;
依据的独立性检验,小组成员乙不能认为该中学高三年级学生的性别与身高有关联;
小组成员甲、乙计算出的值不同,他们得出的结论也不同.
故选:AD
三、填空题
27.(23-24高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是 .
【答案】乙
【分析】根据选项中的图形,即可直接求解.
【详解】等高条形图中有两个高度相同的矩形,每个矩形都有两个颜色,观察下方颜色区域的高度,如果高度差越大,则两个分类变量关系越强,观察四个选项可知,B选项中带颜色区域的高度差最大,两个分类变量、相关关系最强;
故答案为:乙
28.(2023·广西·模拟预测)某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中,且,若有的把握可以认为性别与对工作的满意程度具有相关性,则x的值可以是 .(横线上给出一个满足条件的x的值即可)
对工作满意
对工作不满意
男
5x
5x
女
4x
6x
附:,其中.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】14(答案不唯一)
【分析】根据卡方公式求出x的取值范围,再根据且,即可得解.
【详解】由题意得,故,
所以.
故答案为:14(答案不唯一).
29.(23-24高二下·广东中山·期末)某市举行了首届阅读大会,为调查市民对阅读大会的满意度,相关部门随机抽取男女市民各名,每位市民对大会给出满意或不满意的评价,得到下面列联表:
满意
不满意
男市民
女市民
当,时,若在的情况下,我们没有充分的证据推断男、女市民对大会的评价有差异,则的最小值为 .
附:,其中.
【答案】
【分析】根据定义算出的表达式,由题意得,结合可得出的最小值.
【详解】由题意得,
并令,即,
近似解得,即,注意到,
故的最小值为.
故答案为:.
30.(24-25高三上·山东济宁·阶段练习)某传媒公司针对“社交电商用户是否存在性别差异”进行调查,共调查了个人,得到下侧列联表.已知,若根据的独立性检验认为“社交电商用户存在性别差异”,则的最小值为 .
是社交电商用户
不是社交电商用户
合计
男性
女性
合计
参考公式:,其中.
【答案】3
【分析】由题意,应用卡方公式得,根据独立检验的结论确定的最小值.
【详解】由题设,零假设社交电商用户与性别无关,
而,
则,
所以根据的独立性检验认为是不是社交电商用户与性别有关,则的最小值3.
故答案为:3
31.(2024高三·全国·专题练习)在西非“埃博拉病毒"的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:
感染
未感染
合计
服用
10
40
50
未服用
20
30
50
合计
30
70
100
附:
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
根据上表,在犯错误的概率不超过 的前提下,认为“小动物是否感染与服用疫苗有关”.
【答案】0.05
【分析】先根据公式计算,得出值与边界值比较即可判断在犯错误的概率不超过0.05的前提下,认为“小动物是否感染与服用疫苗有关”.
【详解】零假设:小动物是否感染与服用疫苗无关,
由题中数据可得:,
零假设不成立,根据临界值表可得:犯错误的概率不超过0.05.
即在犯错误的概率不超过0.05的前提下,认为“小动物是否感染与服用疫苗有关”.
故答案为:.
32.(2024高三·全国·专题练习)下列说法中,正确的有 (填序号).
①回归直线恒过点,且至少过一个样本点;
②根据列联表中的数据计算得出,而,则在犯错误的概率不超过0.01的前提下认为两个分类变量有关系;
③是用来判断两个分类变量是否相关的随机变量,当的值很小时可以推断两类变量不相关;
④某项测量结果服从正态分布,则,则.
【答案】②④
【分析】根据回归直线恒过点,但不一定过样本点得到判断①,根据独立性检验判断②和③,由正态分布概率的计算判断④.
【详解】对于①,回归直线恒过点,但不一定过样本点,故①错误;
对于②,因独立性检验是选取一个零假设条件下的小概率事件,故②正确;
对于③,当的值很小时推断两类变量相关的把握小,但不能说无关,故③错误;
对于④,因为服从正态分布,且,所以与关于直线对称,
由可得,,则,故④正确. 故答案为:②④.
33.(24-25高三上·湖南·阶段练习)某传媒公司针对“社交电商用户是否存在性别差异”进行调查,共调查了个人,得到如下列联表:
是社交电商用户
不是社交电商用户
合计
男性
女性
合计
已知,若根据的独立性检验认为“社交电商用户存在性别差异”,则的最小值为 .
【答案】3
【分析】先根据已知计算,再根据独立性检验的性质列不等式计算即可.
【详解】,
所以根据的独立性检验认为是不是社交电商用户与性别有关,则的最小值为3.
故答案为:3.
34.(24-25高三上·江苏南通·阶段练习)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据通过计算有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为 .
支持
不支持
男生
女生
附:,其中.
【答案】
【分析】根据临界值表可得出关于的不等式,结合可得出的最小值,即可得出答案.
【详解】因为有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,
所以,即,
因为函数在时单调递增,
且,,,所以的最小值为,
所以在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为.
故答案为:.
四、解答题
35.(24-25高二上·河北沧州·阶段练习)某县承包了一块土地,已知土地的使用面积与相应的管理时间的关系如下表所示:
土地使用面积亩
1
2
3
4
5
管理时间月
8
10
13
25
24
并调查了某村300位村民参与管理的意愿,得到的部分数据如下表所示:
单位:人
愿意参与管理
不愿意参与管理
合计
男性村民
150
50
女性村民
50
合计
(1)求出样本相关系数的大小,并判断管理时间与土地使用面积是否线性相关(当时,即可认为线性相关);
(2)依据的独立性检验,分析村民的性别与参与管理的意愿是否有关;
(3)以该村村民的性别与参与管理意愿的情况估计该县的情况,从该县中任取3人,记取到不愿意参与管理的男性村民的人数为,求的分布列及数学期望.
参考公式:,其中.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考数据:.
【答案】(1),管理时间与土地使用面程线性相关.
(2)认为村民的性别与参与管理的意愿有关.
(3)分布列见解析,
【分析】(1)根据表格数据和公式计算可得,由此可得结论;
(2)根据已知数据可得列联表,计算可得,由此可得结论;
(3)首先确定从该贫困县中随机抽取一位村民,取到不愿意参与管理的男性村民的概率,可知,由二项分布概率公式可计算得到每个取值对应的概率,由此可得分布列,根据数学期望计算公式可求得结果.
【详解】(1)由题知,,
,
,
,
,
则,
故管理时间与土地使用面程线性相关.
(2)依题意,完蟙表格如下:
单位:人
愿意参与管理
不愿意参与管理
合计
男性村民
150
50
200
女性村民
50
50
100
合计
200
100
300
零假设为:村民的性别与参与管理的意愿无关.
计算可得.
依据的独立性检验,推断不成立,即认为村民的性别与参与管理的意愿有关.
(3)法一:依题意,的可能取值为,从该县中随机抽取一位村民,取到不愿意参与管理的男性村民的概率为,
故,
故的分布列为
0
1
2
3
则数学期望.
法二:依题意,从该县中随机抽取一位村民,取到不愿意参与管理的男性村民的概率为,
则,故.
36.(24-25高三上·山西·阶段练习)近年来,因使用手机过久、工作压力大等因素导致不少人出现了睡眠问题.某媒体为了了解出现睡眠问题者的年龄分布,调查了200名成年人的睡眠时间,得到如下列联表:
90后
非90后
合计
23:00前入睡
30
80
23:00后入睡
合计
100
200
(1)完成列联表,根据小概率值的独立性检验,分析能否认为“23:00前入睡”与“是90后”有关联?
(2)随着出现睡眠问题人群的增加,及社会对睡眠健康重视程度的加深,有助提高睡眠质量的产品受到消费者推崇,记年的年份代码依次为1,2,3,4,5,下表为年中国睡眠经济市场规模及2024年中国睡眠经济市场规模(单位:千亿元)预测,
年份代码
1
2
3
4
5
市场规模
3.8
4.2
4.5
5.0
5.3
根据上表数据求关于的回归方程.
参考公式:,其中.回归方程,
其中
参考数据:.
【答案】(1)列联表见解析,认为“前入睡”与“是90后”有关联
(2)
【分析】(1)补全列联表,根据公式求出,再通过独立性检验与临界值比较判断即可;
(2)利用公式得到经验回归方程.
【详解】(1)列联表如下:
90后
非90后
合计
前入睡
30
50
80
后入睡
70
50
120
合计
100
100
200
零假设:“23:00前入睡”与“是90后”无关联,
因为,
根据小概率值的独立性检验,我们推断不成立,
即认为“前入睡”与“是90后”有关联,此推断犯错误的概率不超过0.01.
(2)由的取值依次为,
得,
所以,
,
所以,
所以关于的回归方程为.
37.(24-25高三上·重庆·阶段练习)手机用户可通过某软件查看自己每天行走的步数,同时也可以和好友进行运动量的比较和点赞.若某人一天的行走步数超过8000,则评定为“积极型”,否则评定为“懈怠型”.从小王的男性和女性好友中各随机抽取了50名,统计其一天的步数并给出评定,得到如下数据:
积极型
懈怠型
男
20
30
女
10
40
(1)能否有95%的把握认为“评定类型”与“性别”有关?
(2)以样本数据估计总体数据,且以频率估计概率.若从小王的所有男性好友中抽取3人,记其中评定为“积极型”的人数为,求随机变量的数学期望.
附:,其中.
0.050
0.025
0.010
3.841
5.024
6.635
【答案】(1)有;
(2).
【分析】(1)求出的观测值,与临界值比对即可得解.
(2)求出从小王的男性好友中任选一人,评定为“积极型”的概率,再求出的可能值,利用二项分布的期望公式计算得解.
【详解】(1)列联表如下:
积极型
懈怠型
合计
男
20
30
50
女
10
40
50
合计
30
70
100
则的观测值为,
所以有95%的把握认为“评定类型”与“性别”有关.
(2)由表格中的数据知,从小王的男性好友中任选一人,评定为“积极型”的概率为,
随机变量的可能值为,,
所以随机变量的数学期望.
38.(2024高三·全国·专题练习)微生物生态学的研究表明,水生生物中存在大量的有益微生物,这些有益水生微生物对于维持水质平衡具有非常重要的作用.研究人员为了研究某种有益水生微生物在特定营养物质浓度下的增长速率与水体类型(淡水或咸水)的关系,对100个水体环境样本中的有益水生微生物在一段时间内的数量进行了观察,经统计得到如下的列联表:
水体环境类型
增长情况
合计
快速增长
未快速增长
淡水环境
25
咸水环境
10
合计
100
已知从这100个水体环境样本中随机抽取1个,该水体环境中的有益水生微生物属于“快速增长”的概率为.
(1)求;
(2)根据小概率值的独立性检验,判断该有益水生微生物“快速增长”与水体环境类型是否有关?根据小概率值的独立性检验,判断该有益水生微生物“快速增长”与水体环境类型是否有关?
附:,
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1),;
(2)答案见解析.
【分析】(1)根据已知概率值及频率估计概率求参数a,再由样本总数求参数b即可;
(2)根据(1)完善列联表,应用卡方公式求卡方值,结合独立性检验的基本思想得结论.
【详解】(1)因为从这100个样本中随机抽取1个,该有益水生微生物属于“快速增长”的概率为,
则,解得,又,解得,
所以,.
(2)由(1)得,列联表如下:
水体环境类型
增长情况
合计
快速增长
未快速增长
淡水环境
30
25
55
咸水环境
10
35
45
合计
40
60
100
令零假设为:该有益水生微生物“快速增长”与水体环境类型无关,
由,根据小概率值的独立性检验,推断不成立,
即认为该有益水生微生物“快速增长”与水体环境类型有关,此推断犯错误的概率不超过0.01.
因为,根据小概率值的独立性检验,没有充分证据推断不成立,
即认为成立,即认为该有益水生微生物“快速增长”与水体环境类型无关.
39.(24-25高三上·河北邢台·期末)为了研究性别与感冒的关系,某医学研究小组在11月感冒易发季节对某一社区男性和女性的感冒情况进行抽样调研,得到如下列联表.
性别
感冒情况
合计
不感冒
感冒
男性
30
15
45
女性
45
10
55
合计
75
25
100
(1)请根据列联表,并依据小概率值的独立性检验,分析能否认为性别与感冒情况具有相关性;
(2)利用分层随机抽样的方法从样本中不感冒的人群中随机抽取5人,再从这5人中选出2人分享发言,记分享发言中女性的人数为,求随机变量的分布列及数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)认为性别与感冒情况无关.
(2)分布列见解析,
【分析】(1)根据列联表,计算值并根据其与的大小比较得出结论;
(2)由题意,可分析得出变量服从超几何分布,按照其概率公式写出分布列,计算数学期望即得.
【详解】(1)零假设为:性别与感冒情况不具有相关性.
根据列联表中的数据,
得,
根据小概率值的独立性检验,没有充分证据推断不成立,即认为性别与感冒情况无关.
(2)根据分层随机抽样的知识可知,男性有2人,女性有3人,
所以随机变量的所有可能取值为0,1,2,
则,,,
所以的分布列为
0
1
2
所以.
40.(2024·全国·模拟预测)某校高一学生共有人,年级组长利用数字化学习软件记录每位学生每日课后作业完成的时长,期中考试之后统计得到了如下平均作业时长与学业成绩的数据表:
平均作业时长(单位:小时)
学业成绩优秀:
学业成绩不优秀:
(1)试判断:是否有的把握认为学业成绩优秀与日均作业时长不小于小时且小于小时有关?
(2)常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.已知该校高一学生女生中成绩优秀的学生占比,现从所有高一学生中任选一人,表示“选到的是男生”,表示“选到的学生成绩优秀”,若,求.
附:,.
【答案】(1)有把握;
(2).
【分析】(1)完善列联表,计算的观测值并与临界值比对即可得解.
(2)设,根据给定条件,利用条件概率公式、结合互斥事件的加法公式列出方程求解.
【详解】(1)列联表数据如下:
时长
其他
总计
优秀
不优秀
总计
所以有的把握认为学业成绩优秀与日均作业时长不小于小时且小于小时有关.
(2)设,则,
由,得,
而,则.
又,于是,
得,即,
而,因此,
由,得,所以.
41.(24-25高三上·上海·阶段练习)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析社区的市民是否喜欢网上买菜与年龄有关?
(2)M社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;
(3)用频率估计概率,现从M社区随机抽取20名市民,记其中喜欢网上买菜的市民人数为随机变量,并记随机变量,求、的期望和方差.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式及数据:,其中.
【答案】(1)有关
(2)
(3),,,
【分析】(1)由独立性检验相关知识可得答案;
(2)由题结合全概率公式可得答案;
(3)由题可得,后由期望与方差性质可得答案.
【详解】(1)假设:M社区的市民是否喜欢网上买菜与年龄无关.
由给定的列联表,得:.
根据小概率值的独立性检验,我们推断不成立,
即认为是否喜欢网上买菜与年龄有关联,此推断犯错误的概率不大于.
(2)设表示周在A平台买菜,表示周在B平台买菜,
由题可得,
由全概率公式,小张周二选择平台买菜的概率为:
;
(3)依题意,喜欢网上买菜的概率为:.
从M社区随机抽取20名市民,其中喜欢网上买菜的市民人数服从二项分布:,所以,.
又,所以,.
42.(22-23高二下·广西玉林·阶段练习)为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,经统计这200人中通过电子阅读与纸质阅读的人数之比为,将这200人按年龄分组,其中统计通过电子阅读的居民得到的频率分布直方图如图所示.
(1)求的值及通过电子阅读的居民的平均年龄;(同一组中数据用该组区间的中点值作代表)
(2)把年龄在的居民称为青年组,年龄在的居民称为中老年组,若选出的200人中通过纸质阅读的中老年有30人,请完成下面列联表,依据的独立性检验,能否认为阅读方式与年龄有关联?
单位:人
年龄分组
阅读方式
合计
电子阅读
纸质阅读
青年
中老年
合计
0.15
0.1
0.05
0.025
0.01
2.072
2.706
3.841
5.024
6.635
【答案】(1)a的值为0.035,通过电子阅读的居民的平均年龄为41.5岁
(2)列联表见解析,能认为阅读方式与年龄有关联
【分析】(1)根据频率分布直方图中所有小矩形的面积之后为得到方程求出,再根据频率分布直方图中平均数的求法计算可得;
(2)首先完善列联表,再计算卡方,即可判断.
【详解】(1)由题图可得,,解得.
各组的频率依次为,,,,,
所以通过电子阅读的居民的平均年龄为:
(岁).
所以a的值为,通过电子阅读的居民的平均年龄为岁.
(2)因为200人中通过电子阅读与纸质阅读的人数之比为,
所以通过电子阅读的有150人,通过纸质阅读的有50人.
因为年龄在的居民称为青年组,年龄在的居民称为中老年组,
所以电子阅读的青年有(人),
中老年有(人).
补全列联表如下:(单位:人)
年龄分组
阅读方式
合计
电子阅读
纸质阅读
青年
90
20
110
中老年
60
30
90
合计
150
50
200
零假设为:阅读方式与年龄无关.
根据表中数据,计算得.
所以依据的独立性检验,我们推断不成立,即认为阅读方式与年龄有关联.
43.(2024高三·全国·专题练习)“一带一路”是促进各国共同发展,实现共同繁荣的合作共嬴之路.为了了解我国与某国在“一带一路”合作中两国的贸易量情况,随机抽查了100天进口贸易量与出口贸易量(单位:亿元人民币/天),整理数据得下表:
进口贸易量
出口贸易量
32
18
4
6
8
12
3
7
10
(1)用频率估计概率,试估计事件“我国与该国贸易中,一天的进口贸易量与出口贸易量均不超过100亿元人民币”的概率.
(2)根据所给数据,完成下面的列联表.
进口贸易量
出口贸易量
(3)依据的独立性检验,能否认为我国与该国贸易中一天的进口贸易量与出口贸易量有关?
附:,.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)
(2)列联表见解析
(3)有关
【分析】(1)利用古典概型的概率求解;
(2)依据所给数据,完成列联表;
(3)由(2)计算的值,再与临界值表对照下结论.
【详解】(1)解:由题表中的信息可知,
在这100天中,进口贸易量与出口贸易量均不超过100亿元人民币的天数为,
用频率估计概率,可得所求概率.
(2)列出列联表如下:
进口贸易量
出口贸易量
64
16
10
10
(3)零假设为:我国与该国贸易中一天的进口贸易量与出口贸易量无关.
由(2)得,
所以依据的独立性检验,推断不成立,即认为我国与该国贸易中一天的进口贸易量与出口贸易量有关
(
5
)原创精品资源学科网独家享有版权,侵权必究!
学科网(北京)股份有限公司
$$