第八章 成对数据的统计分析章末检测-2024-2025学年高二下学期数学人教A版(2019)选择性必修第三册
2025-05-05
|
2份
|
28页
|
177人阅读
|
5人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 第八章 成对数据的统计分析 |
| 类型 | 作业-单元卷 |
| 知识点 | - |
| 使用场景 | 同步教学-单元练习 |
| 学年 | 2025-2026 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 1.14 MB |
| 发布时间 | 2025-05-05 |
| 更新时间 | 2025-05-05 |
| 作者 | sdly001 |
| 品牌系列 | - |
| 审核时间 | 2025-05-05 |
| 下载链接 | https://m.zxxk.com/soft/51946085.html |
| 价格 | 1.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
第八章 成对数据的统计分析章末检测解析版
(满分150分,考试用时120分钟)
姓名___________ 班级_________ 分数_________
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.在研究线性回归模型时,若样本数据所对应的点都在直线上,则两组数据和的线性相关系数为( )
A. B.1 C. D.2
【答案】A
【详解】若样本数据所对应的点都在直线上,
则两组数据和的线性相关系数为.
故选:A.
2.某实验中学为调查本校高三学生的学习成绩是否与坚持体育锻炼有关,随机选取了高三300名学生的某次联考成绩进行统计,得到如下表格:
分数
锻炼
合计
坚持锻炼
不坚持锻炼
分数
100
80
180
分数<600
50
70
120
合计
150
150
300
依据小概率值的独立性检验,可以认为高三学生的学习成绩与坚持进行体育锻炼有关,则m的值可能是( )
附:,.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.0.001 B.0.005 C.0.01 D.0.05
【答案】D
【详解】由题意,,
结合表格数据及选项,可以认为高三学生的学习成绩与坚持进行体育锻炼有关,
则m的值可能是0.05.
故选:D.
3.细胞在适宜环境下的繁殖通常符合类型的模型,假设某种细胞的初始数量为,在理想条件下,每个细胞单位时间的繁殖率一定,经过个单位时间后,细胞总数(万个)会呈指数增长.设,变换后得到线性回归方程,已知该回归方程的样本中心为,则( )
A. B.0.596 C. D.0.206
【答案】A
【详解】由题意得,解得,
因此,
由两边取对数,得,
又,所以,即.
故选:A.
4.变量x与y的n组样本数据为,,…,,y与x线性相关,记,,则下面说法错误的是( )
A.回归直线必经过点
B.样本相关系数r与回归系数同号
C.对样本相关系数r,越大,两个变量之间的线性相关性越强
D.回归直线至少经过点,,…,中的一个点
【答案】D
【详解】回归直线必过点,可能不过任何一个样本点,故A正确,D错误.
样本相关系数r为正时,两个变量为正相关,回归系数为正;
样本相关系数r为负时,两个变量为负相关,回归系数为负.
故样本相关系数r与回归系数同号,B正确.
样本相关系数,越大,两个变量之间的线性相关性越强,C正确.
故选:D
5.某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
【答案】D
【详解】列出列联表:
男生
女生
篮球迷
90
20
110
非篮球迷
60
30
90
150
50
200
,
故在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关.
故选:D
6.某书店为了分析书籍销量与宣传投入之间的关系,对宣传投入x(千元)和书籍销量y(百本)的情况进行了调研,并统计得到表中几组对应数据,同时用最小二乘法得到y关于x的线性回归方程为,则下列说法不正确的是( )
x
3
4
5
6
y
5
6.2
7.4
m
A.变量x、y之间呈正相关 B.预测当宣传投入2千元时,书籍销量约为400本
C. D.拟合误差
【答案】C
【详解】因为线性回归方程为,,
所以变量x、y之间呈正相关,故正确;
当时,(百本),所以书籍销量约为400本,故正确;
由表中数据可得,,
所以,解得,故错误;
当时,,,
当时,,,
当时,,,
当时,,,
所以,故正确.
故选:.
7.已知变量与变量的关系可以用模型(,为常数)拟合,设,变换后得到一组数据如下:
2
3
4
5
6
1.02
1.20
1.42
1.62
1.84
由上表可得经验回归方程为,则( )
A.0.206 B. C.0.596 D.
【答案】D
【详解】由表格中数据得,
,
代入方程得,,解得,因此.
由两边取对数,得.
又,所以,,即.
故选:D
8.研究变量,得到一组成对数据,先进行一次线性回归分析,接着增加一个数据,其中,,再重新进行一次线性回归分析,则下列说法正确的是( )
A.变量与变量的相关性变强 B.相关系数的绝对值变小
C.线性回归方程不变 D.拟合误差变大
【答案】C
【详解】设变量,的平均数分别为,,
则,,即,,
可知新数据的样本中心点不变,仍为,
对于AB:可得,
同理可得,
则相关系数,
可知相关系数的值不变,变量与变量的相关性不变,故AB错误;
对于C:因为,且线性回归方程过样本中心点,
即均不变,所以线性回归方程不变,故C正确;
因为即为样本中心点,即,
可知残差平方和不变,
所以拟合误差不变,故D错误;
故选:C.
二、多选题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.在研究某个特殊的路口闯红灯与发生交通事故的关系时,同学甲向有关部门申请并分别调取了2024年7月份至2024年12月份该路口行人是否闯红灯以及经过的汽车是否发生交通事故的有关数据,随机抽取了经过该路口的1000个行人是否闯红灯以及1000辆汽车是否发生交通事故的相关数据.同学甲针对自己获得的数据,利用列联表计算出卡方的值,经查表知.同学甲同时发现每月行人闯红灯次数与汽车发生交通事故次数具有线性相关的关系,并分别求出了相关系数的值以及线性回归方程,则下列说法正确的是( )
A.有95%的把握认为“发生交通事故与闯红灯有关”
B.行人如果不闯红灯,该路口就不会发生交通事故
C.越大时,每月行人闯红灯次数与汽车发生交通事故次数相关程度越高
D.每月行人闯红灯次数与汽车发生交通事故次数具有正相关关系
【答案】ACD
【详解】因为卡方的值,同学有95%的把握认为“发生交通事故与闯红灯有关”,A选项正确;
行人如果不闯红灯,该路口就不会发生交通事故,B选项错误;
越大时,每月行人闯红灯次数与汽车发生交通事故次数相关程度越高,C选项正确;
每月行人闯红灯次数与汽车发生交通事故次数具有正相关关系,D选项正确;
故选:ACD.
10.某中学为了研究高三年级学生的身高和性别的相关性问题,从高三年级800名学生中随机抽取200名学生测量身高,测量数据的列联表如下:
单位人
性别
身高
合计
低于170cm
不低于170cm
女
80
16
96
男
20
84
104
合计
100
100
200
下列说法正确的有( )
A.从列联表可以判断该样本是由分层抽样而得
B.从列联表可以看出该中学高三学生身高最高的是男生
C.有的把握认为该中学高三学生的身高与性别有关联
D.若该样本中男生身高h(单位:cm)服从正态分布,则该样本中身高在区间内的男生超过30人
附1:(其中).
临界值表:
0.15
0.10
0.05
0.02
0.01
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
附2:若,则随机变量X取值落在区间上的概率约为
【答案】CD
【详解】从高三年级名学生中随机抽取名,得列联表,不是分层抽样而得,A错误;
由列联表,高三学生身高最高的不一定是男生,B错误;
由列联表,,
有的把握认为该中学高三学生的身高与性别有关联,C正确;
若该样本中男生身高(单位:)服从正态分布,则,D正确;
故选:CD
11.某同学研究两个变量与的关系,收集了以下5组数据:
1
2
3
4
5
1
4
1
9
10
根据上表数据,求得相关系数为,经验回归方程为,决定系数为.后经检查发现当时记录的有误,实际值应为,修正数据后,求得新相关系数为,新回归方程为,新决定系数为,则以下结论正确的是( )
参考公式:相关系数,经验回归方程为,其中,,.
A. B. C. D.
【答案】ABD
【详解】数据修正前:
,
,,
,
,,
数据修正后:
,
,,
,
,,
因此,,,而,则,ABD正确,C错误.
故选:ABD
三、填空题:本题共3小题,每小题5分,共15分.
12.植物社团的同学观察一株植物的生长情况,为了解植物高度(单位:厘米)与生长期(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表:
生长期
3
9
11
17
植物高度
2.4
3.4
3.8
5.2
由表中数据可得回归方程中,试预测生长期是30天时,植物高度约为 厘米.
【答案】
【详解】由题意可得,,
所以,
所以回归方程为,
所以预测生长期是30天时,植物高度约为厘米.
故答案为:.
13.某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数 .(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
【答案】
【详解】由已知可得,,
,
则,
,
所以,.
故答案为:.
14.红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(个)和温度的8组观测数据,制成图1所示的散点图.现用两种模型①,,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
24
2.9
646
168
422688
50.4
70308
表中,,,;
(1)根据残差图,比较模型①、②的拟合效果,模型 比较合适?
(2)根据(1)中所选择的模型,求出y关于x的回归方程是 .附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.
【答案】 ①
【详解】(1)模型①更合适,理由如下:模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄,所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适;
(2)令,则,
由所给的参考数据可得,,
所以,
所以关于的线性回归方程为,即,
所以产卵数关于温度的回归方程为,
故答案为:①;.
四、解答题:本题共5小题,共77分,解答应写出文字说明、证明过程或演算步骤.
15.(本小题13分)
疫苗是指用各种病原微生物制作的用于预防接种的生物制品,接种疫苗是预防和控制传染病最经济、最有效的公共卫生干预措施.今年入春以来,代号为的病毒在某地流行.某制药厂针对预防病毒研发出了一种特效药物.为了调查该药物的防疫效果,某机构采取了随机抽样的调查方式.其中是否接种特效药与是否感染病毒的调查结果整理如下:
病毒感染情况
使用药物
未使用药物
合计
感染病毒
80
300
未感染病毒
580
700
合计
800
200
1000
(1)完成上面的列联表,并将频率视为概率,用样本估计总体,试求该地区居民病毒的感染率;
(2)在犯错误的概率不超过0.001的前提下,能否认为使用特效药物与预防病毒有关?
(3)科学实验表明,任何形式的医学检测,均有结果检错的可能.已知感染病毒的人其检测结果有的漏诊率(将已感染病毒的人判定为未感染),而没有感染病毒的人其检测结果有的误诊率(将未感染病毒的人判定为已感染).已知某人的病毒检查结果为已感染,求此人真的感染病毒的概率.
附:.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)列联表见解析,所求概率为;
(2)能;
(3).
【详解】(1)列联表如下,
病毒感染情况
使用药物
未使用药物
合计
感染病毒
220
80
300
未感染病毒
580
120
700
合计
800
200
1000
由图知,该地区居民病毒的感染率;
(2)由列联表知,
在犯错误的概率不超过0.001的前提下可以认为使用特效药物与预防病毒有关.
(3)由题意,表示已感染病毒,则,,
表示检测结果为阳性,则,则,且,
所以.
16.(本小题15分)
自“机器人扭秧歌”这一节目在2025年春晚舞台大放异彩后,宇树科技这家专注于四足机器人研发的中国科技公司在全球范围内倍受瞩目,旗下一款机器人Unitree Aliengo在巡检与监控、安防与救援、科研与影视等方面应用广泛.现统计出机器人Unitree Aliengo在某地区2024年1月至5月的销售量如下表所示:
月份x
1
2
3
4
5
销售量y/台
26
37
50
64
93
(1)经计算样本的相关系数,故变量x,y线性相关性很强,求y关于x的经验回归方程;
(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于5时,称该对数据为一对“次数据”,现从这5对数据中任取3对做残差分析,求取到的数据中“次数据”对数的分布列和数学期望.
附:经验回归直线中斜率和截距的最小二乘估计公式分别为:.
【答案】(1)
(2)的分布列见解析,数学期望为1.2
【详解】(1)由表格可得,,,
,,
所以,,
故y关于x的经验回归方程是.
(2)当时,,残差的绝对值为;
当时,,残差的绝对值为;
当时,,残差的绝对值为;
当时,,残差的绝对值为;
当时,,残差的绝对值为.
所以“次数据”为第四组和第五组共两组数据.
故“次数据”对数的所有可能取值为0,1,2.
,,.
所以的分布列如下:
0
1
2
的数学期望.
17.(本小题15分)
无人驾驶被视为推动社会进步和改善生活质量的重要工具,但其安全性和对劳动就业的影响也受到人们的质疑.为了解某大学的学生对无人驾驶的态度,随机调查了该校120名大学生(男女各60人),调查结果如下表所示:
对无人驾驶的态度性别
支持
中立
反对
男
36
18
6
女
24
21
15
用样本的频率分布估计该校每名学生对无人驾驶态度的概率分布,且学生的态度相互独立.为衡量学生对无人驾驶的支持程度,每名支持者得5分,每名中立者得3分,每名反对者得1分.
(1)为判断性别对无人驾驶的支持态度是否存在关联,对上面数据重新整理形成下表,请补齐数据,并作出检验判断:能否有的把握认为性别与对无人驾驶的支持态度有关联?
对无人驾驶的态度性别
支持
不支持
男
女
附:,
0.050
0.010
0.001
3.841
6.635
10.828
(2)从抽样调查的60名男大学生中,按分层抽样选10名学生进行深度追踪访谈,求选出的3名男大学生对无人驾驶的支持态度各异的概率;
(3)从该校任选名学生,其中得分为5的学生人数为,若,利用下面所给的两个结论,求正整数的最小值.
结论一:若随机变量,则随机变量近似服从正态分布;
结论二:若随机变量,则,.
【答案】(1)数据见解析,有
(2)
(3)
【详解】(1)如表,,,,
对无人驾驶的态度
支持
不支持
男
36
24
女
24
36
,
有的把握认为性别与对无人驾驶的支持态度有关联.
(2)按分层抽样从60名男生中选10名,其中支持、中立、反对的人数分别为:6、3、1,
故从中选出3人态度各异的概率为;
(3)由题可知从该校随机选一名学生得5分的概率为,易知,
设,根据结论一,知.
再根据结论二,知.
由条件知,
所以,解得,所以正整数的最小值为11.
18.(本小题17分)
随着科技的不断发展,社会对人工智能方面的人才需求不断扩大,我国高校毕业生中从事软件工程职业的人数在不断攀升.某省统计了该省其中四所高校2024年的毕业生人数及从事软件工程职业的人数(单位:百人),得到如下表格:
高校
高校甲
高校乙
高校丙
高校丁
2024年毕业生人数(百人)
8
7
6
5
2024年从事软件工程职业人数(百人)
0.5
0.4
0.3
0.2
(1)已知与具有较强的线性相关关系,求关于的线性回归方程;
(2)假设该省对从事软件工程职业的大学生每人发放0.5万元的补贴.
①若该省高校2024年毕业生人数为7千人,估计该省要发放补贴的总金额;
②若高校甲的毕业生小辉、小宇选择从事软件工程职业的概率分别为、,该省对小辉、小宇两人从事软件工程职业的补贴总金额的期望不超过0.8万元,求的取值范围.
参考公式:,.
【答案】(1)
(2)①(万元);②
【详解】(1)由题意得(百人),(百人),
,,
,,
,
所以,
故得关于的线性回归方程为;
(2)①当毕业生人数(百人)时,由回归方程(百人),
补贴总金额为(万元);
②设两人从事软件工程职业的补贴总金额为(万元),的取值可能为0,0.5,1.
,
,
,
由,即,得.
又因为解得.
综上,的取值范围是
19.(本小题17分)
乒乓球比赛一般有两种赛制:“5局3胜制”和“7局4胜制”.“5局3胜制”指5局中胜3局的一方取得胜利,“7局4胜制”指7局中胜4局的一方取得胜利.
(1)甲、乙两人进行乒乓球比赛,经统计在某个赛季的所有比赛中,在不同赛制下甲、乙两人的胜负情况如下表.请先将下面的列联表补充完整,然后根据小概率值的独立性检验,分析不同赛制是否对甲获胜的场数有影响.
甲获胜场数
乙获胜场数
5局3胜
8
10
7局4胜
1
合计
20
(2)若甲、乙两人采用5局3胜制比赛,设甲每局比赛的胜率均为,没有平局.记事件为“甲只要取得3局比赛的胜利,比赛结束且甲获胜”,事件为“两人赛满5局,甲至少取得3局比赛胜利且甲获胜”,试证明:.
(3)甲、乙两人进行乒乓球比赛,每局比赛甲的胜率都是,没有平局.若采用“赛满局,胜方至少取得局胜利”的赛制,甲获胜的概率记为.若采用“赛满局,胜方至少取得局胜利”的赛制,甲获胜的概率记为,试比较与的大小.
参考公式:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)表格见解析,赛制对甲获胜的场数没有影响.
(2)证明见解析
(3)
【详解】(1)解:零假设为:赛制与甲获胜场数独立,即两者无关联.
由题设,赛制与甲获胜情况列联表如下:
甲获胜场数
乙获胜场数
5局3胜
8
2
10
7局4胜
9
1
10
合计
17
3
20
可得.
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即赛制对甲获胜的场数没有影响.
(2)解:由事件为“甲只要取得3局比赛的胜利,比赛结束且甲获胜”, 事件为“两人赛满5局,甲至少取得3局比赛胜利且甲获胜”且甲每局比赛的胜率均为,没有平局,
可得,
,
综上可得:.
(3)解:考虑赛满局的情况,以赛完局为第一阶段,第二阶段为最后2局,
记事件为“第一阶段甲获胜”,事件为“第一阶段乙获胜,且甲恰好胜了局”,
事件为“赛满局甲获胜”,
则,
因为,,
所以,
则
,
由,所以,所以.
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
第八章 成对数据的统计分析章末检测
(满分150分,考试用时120分钟)
姓名___________ 班级_________ 分数_________
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.在研究线性回归模型时,若样本数据所对应的点都在直线上,则两组数据和的线性相关系数为( )
A. B.1 C. D.2
2.某实验中学为调查本校高三学生的学习成绩是否与坚持体育锻炼有关,随机选取了高三300名学生的某次联考成绩进行统计,得到如下表格:
分数
锻炼
合计
坚持锻炼
不坚持锻炼
分数
100
80
180
分数<600
50
70
120
合计
150
150
300
依据小概率值的独立性检验,可以认为高三学生的学习成绩与坚持进行体育锻炼有关,则m的值可能是( )
附:,.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.0.001 B.0.005 C.0.01 D.0.05
3.细胞在适宜环境下的繁殖通常符合类型的模型,假设某种细胞的初始数量为,在理想条件下,每个细胞单位时间的繁殖率一定,经过个单位时间后,细胞总数(万个)会呈指数增长.设,变换后得到线性回归方程,已知该回归方程的样本中心为,则( )
A. B.0.596 C. D.0.206
4.变量x与y的n组样本数据为,,…,,y与x线性相关,记,,则下面说法错误的是( )
A.回归直线必经过点
B.样本相关系数r与回归系数同号
C.对样本相关系数r,越大,两个变量之间的线性相关性越强
D.回归直线至少经过点,,…,中的一个点
5.某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
6.某书店为了分析书籍销量与宣传投入之间的关系,对宣传投入x(千元)和书籍销量y(百本)的情况进行了调研,并统计得到表中几组对应数据,同时用最小二乘法得到y关于x的线性回归方程为,则下列说法不正确的是( )
x
3
4
5
6
y
5
6.2
7.4
m
A.变量x、y之间呈正相关 B.预测当宣传投入2千元时,书籍销量约为400本
C. D.拟合误差
7.已知变量与变量的关系可以用模型(,为常数)拟合,设,变换后得到一组数据如下:
2
3
4
5
6
1.02
1.20
1.42
1.62
1.84
由上表可得经验回归方程为,则( )
A.0.206 B. C.0.596 D.
8.研究变量,得到一组成对数据,先进行一次线性回归分析,接着增加一个数据,其中,,再重新进行一次线性回归分析,则下列说法正确的是( )
A.变量与变量的相关性变强 B.相关系数的绝对值变小
C.线性回归方程不变 D.拟合误差变大
二、多选题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.在研究某个特殊的路口闯红灯与发生交通事故的关系时,同学甲向有关部门申请并分别调取了2024年7月份至2024年12月份该路口行人是否闯红灯以及经过的汽车是否发生交通事故的有关数据,随机抽取了经过该路口的1000个行人是否闯红灯以及1000辆汽车是否发生交通事故的相关数据.同学甲针对自己获得的数据,利用列联表计算出卡方的值,经查表知.同学甲同时发现每月行人闯红灯次数与汽车发生交通事故次数具有线性相关的关系,并分别求出了相关系数的值以及线性回归方程,则下列说法正确的是( )
A.有95%的把握认为“发生交通事故与闯红灯有关”
B.行人如果不闯红灯,该路口就不会发生交通事故
C.越大时,每月行人闯红灯次数与汽车发生交通事故次数相关程度越高
D.每月行人闯红灯次数与汽车发生交通事故次数具有正相关关系
10.某中学为了研究高三年级学生的身高和性别的相关性问题,从高三年级800名学生中随机抽取200名学生测量身高,测量数据的列联表如下:
单位人
性别
身高
合计
低于170cm
不低于170cm
女
80
16
96
男
20
84
104
合计
100
100
200
下列说法正确的有( )
A.从列联表可以判断该样本是由分层抽样而得
B.从列联表可以看出该中学高三学生身高最高的是男生
C.有的把握认为该中学高三学生的身高与性别有关联
D.若该样本中男生身高h(单位:cm)服从正态分布,则该样本中身高在区间内的男生超过30人
附1:(其中).
临界值表:
0.15
0.10
0.05
0.02
0.01
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
附2:若,则随机变量X取值落在区间上的概率约为
11.某同学研究两个变量与的关系,收集了以下5组数据:
1
2
3
4
5
1
4
1
9
10
根据上表数据,求得相关系数为,经验回归方程为,决定系数为.后经检查发现当时记录的有误,实际值应为,修正数据后,求得新相关系数为,新回归方程为,新决定系数为,则以下结论正确的是( )
参考公式:相关系数,经验回归方程为,其中,,.
A. B. C. D.
三、填空题:本题共3小题,每小题5分,共15分.
12.植物社团的同学观察一株植物的生长情况,为了解植物高度(单位:厘米)与生长期(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表:
生长期
3
9
11
17
植物高度
2.4
3.4
3.8
5.2
由表中数据可得回归方程中,试预测生长期是30天时,植物高度约为 厘米.
13.某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数 .(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
14.红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(个)和温度的8组观测数据,制成图1所示的散点图.现用两种模型①,,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
24
2.9
646
168
422688
50.4
70308
表中,,,;
(1)根据残差图,比较模型①、②的拟合效果,模型 比较合适?
(2)根据(1)中所选择的模型,求出y关于x的回归方程是 .附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.
四、解答题:本题共5小题,共77分,解答应写出文字说明、证明过程或演算步骤.
15.(本小题13分)
疫苗是指用各种病原微生物制作的用于预防接种的生物制品,接种疫苗是预防和控制传染病最经济、最有效的公共卫生干预措施.今年入春以来,代号为的病毒在某地流行.某制药厂针对预防病毒研发出了一种特效药物.为了调查该药物的防疫效果,某机构采取了随机抽样的调查方式.其中是否接种特效药与是否感染病毒的调查结果整理如下:
病毒感染情况
使用药物
未使用药物
合计
感染病毒
80
300
未感染病毒
580
700
合计
800
200
1000
(1)完成上面的列联表,并将频率视为概率,用样本估计总体,试求该地区居民病毒的感染率;
(2)在犯错误的概率不超过0.001的前提下,能否认为使用特效药物与预防病毒有关?
(3)科学实验表明,任何形式的医学检测,均有结果检错的可能.已知感染病毒的人其检测结果有的漏诊率(将已感染病毒的人判定为未感染),而没有感染病毒的人其检测结果有的误诊率(将未感染病毒的人判定为已感染).已知某人的病毒检查结果为已感染,求此人真的感染病毒的概率.
附:.
0.050
0.010
0.001
3.841
6.635
10.828
16.(本小题15分)
自“机器人扭秧歌”这一节目在2025年春晚舞台大放异彩后,宇树科技这家专注于四足机器人研发的中国科技公司在全球范围内倍受瞩目,旗下一款机器人Unitree Aliengo在巡检与监控、安防与救援、科研与影视等方面应用广泛.现统计出机器人Unitree Aliengo在某地区2024年1月至5月的销售量如下表所示:
月份x
1
2
3
4
5
销售量y/台
26
37
50
64
93
(1)经计算样本的相关系数,故变量x,y线性相关性很强,求y关于x的经验回归方程;
(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于5时,称该对数据为一对“次数据”,现从这5对数据中任取3对做残差分析,求取到的数据中“次数据”对数的分布列和数学期望.
附:经验回归直线中斜率和截距的最小二乘估计公式分别为:.
17.(本小题15分)
无人驾驶被视为推动社会进步和改善生活质量的重要工具,但其安全性和对劳动就业的影响也受到人们的质疑.为了解某大学的学生对无人驾驶的态度,随机调查了该校120名大学生(男女各60人),调查结果如下表所示:
对无人驾驶的态度性别
支持
中立
反对
男
36
18
6
女
24
21
15
用样本的频率分布估计该校每名学生对无人驾驶态度的概率分布,且学生的态度相互独立.为衡量学生对无人驾驶的支持程度,每名支持者得5分,每名中立者得3分,每名反对者得1分.
(1)为判断性别对无人驾驶的支持态度是否存在关联,对上面数据重新整理形成下表,请补齐数据,并作出检验判断:能否有的把握认为性别与对无人驾驶的支持态度有关联?
对无人驾驶的态度性别
支持
不支持
男
女
附:,
0.050
0.010
0.001
3.841
6.635
10.828
(2)从抽样调查的60名男大学生中,按分层抽样选10名学生进行深度追踪访谈,求选出的3名男大学生对无人驾驶的支持态度各异的概率;
(3)从该校任选名学生,其中得分为5的学生人数为,若,利用下面所给的两个结论,求正整数的最小值.
结论一:若随机变量,则随机变量近似服从正态分布;
结论二:若随机变量,则,.
18.(本小题17分)
随着科技的不断发展,社会对人工智能方面的人才需求不断扩大,我国高校毕业生中从事软件工程职业的人数在不断攀升.某省统计了该省其中四所高校2024年的毕业生人数及从事软件工程职业的人数(单位:百人),得到如下表格:
高校
高校甲
高校乙
高校丙
高校丁
2024年毕业生人数(百人)
8
7
6
5
2024年从事软件工程职业人数(百人)
0.5
0.4
0.3
0.2
(1)已知与具有较强的线性相关关系,求关于的线性回归方程;
(2)假设该省对从事软件工程职业的大学生每人发放0.5万元的补贴.
①若该省高校2024年毕业生人数为7千人,估计该省要发放补贴的总金额;
②若高校甲的毕业生小辉、小宇选择从事软件工程职业的概率分别为、,该省对小辉、小宇两人从事软件工程职业的补贴总金额的期望不超过0.8万元,求的取值范围.
参考公式:,.
19.(本小题17分)
乒乓球比赛一般有两种赛制:“5局3胜制”和“7局4胜制”.“5局3胜制”指5局中胜3局的一方取得胜利,“7局4胜制”指7局中胜4局的一方取得胜利.
(1)甲、乙两人进行乒乓球比赛,经统计在某个赛季的所有比赛中,在不同赛制下甲、乙两人的胜负情况如下表.请先将下面的列联表补充完整,然后根据小概率值的独立性检验,分析不同赛制是否对甲获胜的场数有影响.
甲获胜场数
乙获胜场数
5局3胜
8
10
7局4胜
1
合计
20
(2)若甲、乙两人采用5局3胜制比赛,设甲每局比赛的胜率均为,没有平局.记事件为“甲只要取得3局比赛的胜利,比赛结束且甲获胜”,事件为“两人赛满5局,甲至少取得3局比赛胜利且甲获胜”,试证明:.
(3)甲、乙两人进行乒乓球比赛,每局比赛甲的胜率都是,没有平局.若采用“赛满局,胜方至少取得局胜利”的赛制,甲获胜的概率记为.若采用“赛满局,胜方至少取得局胜利”的赛制,甲获胜的概率记为,试比较与的大小.
参考公式:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。