内容正文:
第8章 成对数据的统计分析章末综合检测卷
一、选择题:本大题共8小题,每小题5分,共计40分.每小题给出的四个选项中,只有一个选项是正确的.
1. 在以下4幅散点图中,对于图中的y和x之间的关系判断不正确的是( )
A.图(2)(3)(4)中的y和x之间存在相关关系
B.图(2)(4)中的y和x之间呈现正相关关系
C.图(2)(3)中的y和x之间呈现线性相关关系且(2)的相关性一定比(3)强
D.图(4)中的y和x之间呈现非线性相关关系
【答案】C
【难度】0.85
【知识点】判断两个变量是否有相关关系、判断正、负相关、根据散点图判断是否线性相关
【分析】根据散点图中点集的分布变化趋势判断正负相关性、是否为线性关系,但从点的分布密度无法判断(2)(3)的相关性强弱,即可得答案.
【详解】由题图,(1)中点没有明显的变化趋势,
(2)中点有从左下向右上的线性变化趋势,y和x之间呈现正相关且为线性关系,
(3)中点有从左上向右下的线性变化趋势,y和x之间呈现负相关且为线性关系,
(4)中点有从左下向右上的非线性变化趋势,y和x之间呈现正相关且为非线性关系,
但(2)(3)相关性强弱不能从图中点的分布密度直接分析得出,故(2)的相关性不一定比(3)强,
综上,A、B、D对,C错.
故选:C
2.
根据分类变量X与Y的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量X与Y独立
B.变量X与Y独立,这个结论犯错误的概率不超过0.005
C.变量X与Y不独立
D.变量X与Y不独立,这个结论犯错误的概率不超过0.005
【答案】A
【难度】0.94
【知识点】独立性检验的概念及辨析、独立性检验的基本思想
【分析】利用独立性检验规则来进行判断即可。
【详解】因为,所以没有充分的证据推断变量X与Y不相互独立,即认为变量X与Y独立,故BCD错误,A正确;
故选:A.
3.
已知变量x与y的回归直线方程为,变量y与z负相关,则( )
A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关
C.x与y负相关,x与z正相关 D.x与y正相关,x与z负相关
【答案】D
【难度】0.85
【知识点】判断正、负相关
【分析】根据已知条件,结合回归方程可判断x与y正相关,再由变量y与z负相关,即可判断x与z负相关.
【详解】根据回归方程可知变量x与y正相关,又变量y与z负相关,
由正相关、负相关的定义可知,x与z负相关.
故选:D
4. 下列命题正确的是( )
A.线性回归直线必过样本数据的中心点;
B.当相关系数时,两个变量负相关;
C.甲、乙两个模型的分别约为0.88和0.80,则模型乙的拟合效果更好;
D.残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;
【答案】A
【难度】0.94
【知识点】判断正、负相关、线性回归、决定系数的计算及分析
【分析】利用回归直线的性质,相关系数和决定系数的规定及残差分析的分析方式,逐项判断即可.
【详解】选项A:回归直线的定义规定回归直线必过样本数据的中心点,所以选项A正确;
选项B:当相关系数时,说明两个变量正相关,所以选项B错误;
选项C:模型的决定系数越大,说明残差平方和越小,拟合效果越好,,
所以模型甲的拟合效果更好,所以选项C错误;
选项D:残差图中残差点所在的水平带状区域越宽,说明观测值与预报值之间的差距越大,数据分布越分散,
因此回归方程的预报精确度就越差,所以选项D错误.
故选:A.
5.
已知两个线性相关变量与的统计数据如下表:
其回归直线方程是,据此计算,则样本点在处的残差为( )
A. B. C. D.
【答案】B
【难度】0.94
【知识点】根据样本中心点求参数、根据回归方程进行数据估计
【分析】根据样本中心点在回归直线方程上,可得的值,然后计算样本估计值,从而得到残差.
【详解】根据题意,,
又在回归直线方程上,所以,
所以回归直线方程为,
时,得到预估值为3.15,
所以样本点在处的残差为.
故选:B.
6.
某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下列联表:
去年体检人数
去年未体检人数
合计
高中教师
70
30
100
初中教师
100
合计
200
若根据列表得,则这200名教师中,去年未体检的人数为( )(附:,)
A.20 B.30 C.40 D.50
【答案】D
【难度】0.85
【知识点】独立性检验解决实际问题
【分析】据独立性检验的原理与知识,列式计算即可得结论.
【详解】由于(*),
又,
则可得,代入(*)式可得:
,解得或(舍).
故选:D.
7.
某校数学建模兴趣小组收集了一组恒温动物体重 (单位: 克) 与心率(单位: 次/分钟)的对应数据. 根据生物学常识和散点图得出与近似满足 ( 为参数),令 ,计算得到. 由最小二乘法得到经验回归方程为 ,则的值为( )
A. B.0.4 C. D.0.2
【答案】A
【难度】0.65
【知识点】根据样本中心点求参数、求回归直线方程
【分析】根据回归直线方程必过样本中心点求出,即可求出.
【详解】因为,两边取对数可得,
又,
依题意回归直线方程必过样本中心点,
所以,解得,所以.
故选:A.
8.
为了更好地适应市场需求,某企业根据市场调研得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
1
2
3
4
5
6
7
2
3
5
7
8
8
9
参考公式:,
则下列选项不正确的是( )
A.
B.由散点图知变量和正相关
C.相关系数的绝对值越接近0,表示的线性相关程度越弱
D.用最小二乘法求得关于的线性回归直线方程为
【答案】D
【难度】0.85
【知识点】计算样本的中心点、相关系数的意义及辨析、求回归直线方程、判断正、负相关
【分析】对于A,根据条件,直接求出,即可求解;对于B,根据条件,画出散点图,即可求解;对于C,根据相关系数的定义判断即可;对于D,利用线性回归直线方程过样本中心,代入计算,即可求解.
【详解】对于选项A,由题知,
,故选项A正确;
对于选项B,由图表可得散点图如下,由散点图知变量和正相关,所以选项B正确;
对于选项C,相关系数的绝对值越接近0,表示的线性相关程度越弱,故选项C正确;
对于选项D,因为样本中心点为,又,
所以不是关于的线性回归直线方程,故选项D不正确.
故选:D
二、选择题: 本题共3小题, 每小题6分, 共18分。在每小题给出的选项中, 有多项符合题目要求。全部选对的得6分, 部分选对的得部分分, 有选错的得0分。
9. 某儿童医院用甲、乙两种疗法治疗小儿消化不良.为分析两种疗法效果是否有差异,采取有放回的简单随机抽样的方法对治疗情况进行检查,得到如下数据:
疗法
疗效
未治愈
治愈
甲
15
52
乙
6
63
附常用小概率值及其相应的临界值表为:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算得.则下列说法正确的是:( )
A.以频率估计概率,有
B.以频率估计概率,有
C.若取,可以认为疗效与疗法独立
D.若取,可以认为疗效与疗法独立
【答案】ABD
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、完善列联表
【分析】先由题设求出表格中各行各列总数,再由古典概型即可计算求解判断AB;再由独立性检验思想即可分析判断CD.
【详解】由题设求出表格
疗法
疗效
总数
未治愈
治愈
甲
15
52
67
乙
6
63
69
总数
21
115
136
以频率估计概率,有,故A正确;
以频率估计概率,有,故B正确;
零假设:认为疗效与疗法独立,由题且,
所以若取小概率值,则零假设不成立,即不可以认为疗效与疗法独立;
若取小概率值,则没有充分的证据推翻零假设,故可以认为疗效与疗法独立,故C错误,D正确.
故选:ABD
10. 下列命题成立的是( )
A.已知,若,则
B.若一组样本数据对应的样本点都在直线上,则这组样本数据的相关系数为
C.以模型去拟合一组数据时,为了求出回归方程,设,求得线性回归方程为,则的值分别是4和0.3
D.对分类变量与的独立性检验的统计量来说,值越大,判断“与有关系”的把握性越小
【答案】AB
【难度】0.65
【知识点】非线性回归、指定区间的概率、相关系数的意义及辨析、独立性检验的基本思想
【分析】A.根据,由判断;B.由题意知这组数据完全线性相关,再根据直线斜率的正负判断;C.由两边取自然对数求解判断;D.根据值越大,“与有关系”的可能性越大判断.
【详解】A.已知,且,则,故正确;
B.若一组样本数据对应的样本点都在直线上,说明这组数据完全线性相关,又因为直线斜率是负相关,所以这组样本数据的相关系数为-1,故正确;
C.由两边取自然对数得,求得线性回归方程为,所以,,则,故错误;
D.对分类变量与的独立性检验的统计量来说,值越大,“与有关系”的可能性越大,所以判断“与有关系”的把握性越大,故错误;
故选:AB
11.
已知,其中.下列说法正确的是( )
A.已知一组数据:,1,2,4,3,5,10,9,若为这组数据的第75百分位数,则的展开式中的系数为
B.数据(1,2,3,…,10)组成一个样本,其回归直线方程为,其中,去除一个异常点后,得到新的回归直线必过点
C.若随机变量,则函数为偶函数
D.在列联表中,若每一个数据均变为原来的3倍,则变为原来的9倍
【答案】ABC
【难度】0.65
【知识点】计算样本的中心点、求指定项的系数、指定区间的概率、卡方的计算
【分析】先求出值,再写出的展开式中通项,求出的系数,即可判断A;根据回归直线方程必过样本的中心点,求出,再求出去除异常点后的及,即可判断B;由随机变量,分析出其图象关于对称,找到关于的对称区间,根据正态曲线的对称性得到,即可判断C;根据的计算公式计算即可判断D.
【详解】对于A,将原数据按照从小到大的顺序排序为,
因为上四分位数就是第75百分位数,因为,所以,
因为的二项展开式的通项为,
令,解得,所以的展开式中的系数为,
故A正确;
对于B,因为回归直线方程为过样本的中心点,
所以,
所以去除一个异常点后,,,
所以新的回归直线必过点,故B正确;
对于C,因为随机变量,所以其图象关于对称,
所以关于对称轴的对称点为,即,
关于对称轴的对称点为,即,
根据正态曲线的对称性可知
因为,所以,
所以,所以函数为偶函数,故C正确;
对于D,在列联表中,若每一个数据均变为原来的3倍,则
,
所以变为原来的3倍,故D错误.
故选:ABC
三、填空题: 本大题共3小题,每小题5分,共计15分.
12. 某学校开展研究性学习活动,一组同学获得了下面的一组试验数据:
x
1.99
3
4
5.1
8
y
0.99
1.58
2.01
2.35
3.00
现有如下5个模拟函数:①;②;③;④;⑤,请从中选择一个模拟函数,使它能近似地反映这些数据的规律,应选________(填序号).
【答案】④
【难度】0.85
【知识点】非线性回归
【分析】根据表中提供的数据,可通过描点,连线,画出图象,看哪个函数的图象能接近所画图象,这个函数便可反应这些数据的规律.
【详解】根据表中数据,画出图象如下:
通过图象可看出,能比较近似的反映这些数据的规律.
故答案为:④.
13. 某软件科技公司近8年的年利润额y与投入的年研发经费x(单位:千万元)如表所示.
x
3
4
5
6
6
7
8
9
y
根据散点图可以认为x与y之间存在线性相关关系,且相关系数,用最小二乘法求线性回归方程(,用分数表示),________.
附:(1)参考数据:,.
(2)参考公式:,.
【答案】
【难度】0.65
【知识点】相关系数的计算、求回归直线方程
【分析】首先计算和 ,再比较参考公式,即可求解.
【详解】,
,
由条件可知,
得,
所以,
故答案为:.
14.
针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
【答案】
【难度】0.65
【知识点】独立性检验解决实际问题、卡方的计算
【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.
【详解】因为抽取个学生,女生人数是男生人数的,
所以抽取个男生,个女生,为了便于计算,我们令,
设男生人数为,依题意可得列联表如下:
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,由,解得,
由题知应为6的整数倍,
而根据小概率值的独立性检验,判断中学生追星与性别有关,
则男生至少有30人,
故答案为:30.
四、解答题: 本题共5小题, 共77分。解答应写出文字说明、证明过程或演算步骤。
15.
(13分)年月日,由工业和信息化部、安徽省人民政府共同主办的第十七届“中国芯”集成电路产业大会在合肥成功举办.此次大会以“强芯固基以质为本”为主题,旨在培育壮大我国集成电路产业,夯实产业基础、营造良好产业生态.年,全国芯片研发单位相比年增加家,提交芯片数量增加个,均增长超过倍.某芯片研发单位用在“芯片”上研发费用占本单位总研发费用的百分比()如表所示.
年份
年份代码
(1)根据表中的数据,作出相应的折线图;并结合相关数据,计算相关系数,并推断与线性相关程度;(已知:,则认为与线性相关很强;,则认为与线性相关一般;,则认为与线性相关较弱)
.
(2)求出与的回归直线方程(保留一位小数);
(3)请判断,若年用在“芯片”上研发费用不低于万元,则该单位年芯片研发的总费用预算为万元是否符合研发要求?
附:相关数据:,,,.
相关计算公式:①相关系数;在回归直线方程中,,.
【答案】(1)图见解析,,线性相关很强
(2)
(3)符合研发要求
【难度】0.65
【知识点】求回归直线方程、相关系数的计算、用回归直线方程对总体进行估计、相关系数的意义及辨析
【分析】(1)根据表格数据可绘制折线图,结合公式可求得相关系数r,对比已知线性相关强度判断依据即可得到结论;
(2)采用最小二乘法即可求得回归直线;
(3)将代入回归直线可求得,进而计算得到预算为500万元时的研发费用的预估值,由此可得结论.
【详解】(1)折线图如下:
由题意得:,
,
,
,
,与线性相关很强.
(2)由题意得:,
,
关于的回归直线方程为.
(3)年对应的年份代码,则当时,,
预测年用在“芯片”上的研发费用约为(万元),
,符合研发要求.
16.
(15分)某公司计划对未开通共享电动车的某市进行车辆投放,为了确定车辆投放量,对过去在其他城市的投放量情况以及年使用人次进行了统计,得到了投放量(单位:千辆)与年使用人次(单位:千次)的数据如下表所示,根据数据绘制投放量与年使用人次的散点图如图所示.
1
2
3
4
5
6
7
6
11
21
34
66
101
196
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型或指数函数模型对两个变量的关系进行拟合.请问哪个模型更适宜作为投放量与年使用人次的回归方程类型(给出判断即可,不必说明理由)?并求出关于的回归方程;
(2)公司为了测试共享电动车的性能,从所有同型号共享电动车中随机抽取100辆进行等距离骑行测试,骑行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的共享电动车占比.请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为共享电动车是否报废与保养有关?
\
保养
未保养
合计
报废
20
未报废
合计
60
100
62.14
1.54
2535
50.12
3.47
参考数据:.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:
其中.
0.25
0.1
0.05
0.025
0.01
0.001
1.323
2.706
3.841
5.024
6.635
10.828
【答案】(1)适宜作为投放量与年使用人次的回归方程类型,
(2)列联表见解析,认为是否报废与保养有关
【难度】0.65
【知识点】非线性回归、独立性检验解决实际问题
【分析】(1)由散点图可知,应选指数函数模型,根据已知条件两边同时取对数,转化为关于与的一次函数模型,结合参考数据即可求解;
(2)根据题意完成列联表,利用独立性检验公式,计算的值可判断.
【详解】(1)由散点图判断,适宜作为投放量与年使用人次的回归方程类型.
由,两边同时取常用对数得.
设,则.
因为,,,,
所以.
把代入,得,
所以,所以,
则,
故关于的回归方程为.
(2)设零假设:是否报废与是否保养无关.
由题意,报废电动车中保养过的共台,未保养的电动车共台,补充列联表如下:
\
保养
未保养
合计
报废
20
未报废
80
合计
60
40
100
则,
根据小概率值的独立性检验,我们推断不成立,即认为是否报废与保养有关.
17. (15分)随着智能网联汽车应用服务的推陈出新,智能网联汽车规模持续上升,下表为2021~2025中国智能网联汽车应用服务市场的规模及预测(表中2025年的数据为预测规模).
年份
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
市场规模(单位:千亿元)
0.93
1.26
1.61
2.15
2.79
(1)小张同学根据上表数据求得关于的经验回归方程为,小王同学利用散点图发现,点的分布更像模型,利用变换,可将转换为线性模型,根据下面提供的数据及公式求出该回归方程;
(2)利用相关系数可以判断两变量间线性相关性的强弱,|r|越大,线性相关性就越强,且当时,则认为经验回归方程有价值,否则无价值.用相关系数比较两模型哪一个更有价值?
参考公式:.
参考数据:,(其中).
【答案】(1)
(2)模型更有价值
【难度】0.65
【知识点】决定系数的计算及分析、相关系数的计算、求回归直线方程
【分析】(1)将两边取对数,只需结合所给公式求出的值即可得解;
(2)只需计算出两个相关系数,然后它们和0.75这三个数之间比较大小即可作出结论.
【详解】(1)将两边取对数,得,令,
由题意得,
所以,
所以,
所以,即,
所以.
(2)因为回归直线方程为,
所以,
所以,
所以.
因为,所以该经验回归方程有价值.
因为,
所以,
所以与线性相关性强,其经验回归方程有价值,
又,
所以模型更有价值.
18.
(17分)近年来,政府相关部门引导乡村发展旅游业的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲、乙两名同学一起收集了6家农户的数据,进行回归分析,得到两个回归模型:模型①;模型②.对以上两个回归方程进行残差分析,得到下表:
种植面积亩
2
3
4
5
7
9
每亩种植管理成本/百元
25
24
21
22
16
14
模型①
估计值
25.27
23.62
21.97
17.02
13.72
残差
0.38
0.28
模型②
估计值
26.84
20.17
18.83
17.31
16.46
残差
0.83
3.17
注:表中.
(1)将以上表格补充完整,判断哪个模型拟合效果更好,并简要说明理由;
(2)视残差的绝对值超过1.5的数据为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求其经验回归方程.
参考公式:.
【答案】(1)表格见解析,模型①拟合效果更好.
(2)
【难度】0.65
【知识点】决定系数的计算及分析、残差的计算、求回归直线方程
【分析】(1)根据回归模型①②分别代入求出相应每亩种植管理成本的估计值,再由实际值与估计值的差求出相应残差,然后分别计算残差平方和,比较大小判断拟合效果即可;
(2)根据残差的绝对值剔除异常数据,由参考公式求解可得经验回归方程.
【详解】(1)当时,
当时,,
完成表格如下:
注:表中.
种植面积亩
2
3
4
5
7
9
每亩种植管理成本/百元
25
24
21
22
16
14
模型①
估计值
25.27
23.62
21.97
20.32
17.02
13.72
残差
0.38
1.68
0.28
模型②
估计值
26.84
22.39
20.17
18.83
17.31
16.46
残差
1.61
0.83
3.17
模型①的残差平方和为5.0994,
模型②的残差平方和为24.4832,
因为,
即模型①的残差平方和比模型②的残差平方和小,所以模型①拟合效果更好.
(2)由题意及(1)可知,模型①中仅第四组数据残差的绝对值超过1.5,
故应剔除第四组数据,剔除后,
则,
,
则,
所以所求经验回归方程为.
19. (17分)《最强大脑》是江苏卫视借鉴德国节目《SuperBrain》推出的大型科学竞技类真人秀节目,是专注于传播脑科学知识和脑力竞技的节目.某机构为了了解大学生喜欢《最强大脑》是否与性别有关,对某校的100名大学生进行了问卷调查,得到如下列联表:
喜欢
不喜欢
合计
男生
10
女生
20
合计
已知在这100人中随机抽取1个不喜欢《最强大脑》的大学生的概率为0.4.
(1)请将上述列联表补充完整;
(2)判断在犯错误的概率不超过0.001的前提下能否认为喜欢《最强大脑》与性别有关,并说明你的理由;
(3)已知在被调查的大学生中有5名是大一学生,其中3名喜欢《最强大脑》.现从这5名大一学生中随机抽取2人,抽到喜欢《最强大脑》的人数为,求的分布列与数学期望.
【答案】(1)答案见解析
(2)有关,理由见解析
(3)分布列见解析,
【难度】0.4
【知识点】独立性检验解决实际问题、完善列联表、超几何分布的均值、写出简单离散型随机变量分布列
【分析】(1)根据概率的定义求出不喜欢《最强大脑》的大学生人数,其中已知不喜欢《最强大脑》的男生的人数,可求出不喜欢《最强大脑》的女生的人数,从而得到列联表;
(2)由表中数据求出,从而得到结论;
(3)法一:写出的取值范围.分别求出的可能取值的概率,从而得到的分布列和数学期望.法二:由服从超几何分布,直接利用公式求出.
【详解】(1)因为在100人中随机抽取1人抽到不喜欢《最强大脑》的大学生的概率为0.4,
所以不喜欢《最强大脑》的大学生人数为,
其中已知不喜欢《最强大脑》的男生有10人,
则不喜欢《最强大脑》的女生有30人,列联表补充如下:
喜欢
不喜欢
合计
男生
40
10
50
女生
20
30
50
合计
60
40
100
(2)由表中数据得,
所以在犯错误的概率不超过0.001的前提下能认为喜欢《最强大脑》与性别有关.
(3)法一:的取值范围为.
所以,,.
所以的分布列为
0
1
2
故数学期望.
法二:依题意知,服从超几何分布,故.
(
1
)
学科网(北京)股份有限公司
$
第8章 成对数据的统计分析章末综合检测卷
一、选择题:本大题共8小题,每小题5分,共计40分.每小题给出的四个选项中,只有一个选项是正确的.
1. 在以下4幅散点图中,对于图中的y和x之间的关系判断不正确的是( )
A.图(2)(3)(4)中的y和x之间存在相关关系
B.图(2)(4)中的y和x之间呈现正相关关系
C.图(2)(3)中的y和x之间呈现线性相关关系且(2)的相关性一定比(3)强
D.图(4)中的y和x之间呈现非线性相关关系
2.
根据分类变量X与Y的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量X与Y独立
B.变量X与Y独立,这个结论犯错误的概率不超过0.005
C.变量X与Y不独立
D.变量X与Y不独立,这个结论犯错误的概率不超过0.005
3.
已知变量x与y的回归直线方程为,变量y与z负相关,则( )
A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关
C.x与y负相关,x与z正相关 D.x与y正相关,x与z负相关
4. 下列命题正确的是( )
A.线性回归直线必过样本数据的中心点;
B.当相关系数时,两个变量负相关;
C.甲、乙两个模型的分别约为0.88和0.80,则模型乙的拟合效果更好;
D.残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;
5.
已知两个线性相关变量与的统计数据如下表:
其回归直线方程是,据此计算,则样本点在处的残差为( )
A. B. C. D.
6.
某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下列联表:
去年体检人数
去年未体检人数
合计
高中教师
70
30
100
初中教师
100
合计
200
若根据列表得,则这200名教师中,去年未体检的人数为( )(附:,)
A.20 B.30 C.40 D.50
7.
某校数学建模兴趣小组收集了一组恒温动物体重 (单位: 克) 与心率(单位: 次/分钟)的对应数据. 根据生物学常识和散点图得出与近似满足 ( 为参数),令 ,计算得到. 由最小二乘法得到经验回归方程为 ,则的值为( )
A. B.0.4 C. D.0.2
8.
为了更好地适应市场需求,某企业根据市场调研得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
1
2
3
4
5
6
7
2
3
5
7
8
8
9
参考公式:,
则下列选项不正确的是( )
A.
B.由散点图知变量和正相关
C.相关系数的绝对值越接近0,表示的线性相关程度越弱
D.用最小二乘法求得关于的线性回归直线方程为
二、选择题: 本题共3小题, 每小题6分, 共18分。在每小题给出的选项中, 有多项符合题目要求。全部选对的得6分, 部分选对的得部分分, 有选错的得0分。
9. 某儿童医院用甲、乙两种疗法治疗小儿消化不良.为分析两种疗法效果是否有差异,采取有放回的简单随机抽样的方法对治疗情况进行检查,得到如下数据:
疗法
疗效
未治愈
治愈
甲
15
52
乙
6
63
附常用小概率值及其相应的临界值表为:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算得.则下列说法正确的是:( )
A.以频率估计概率,有
B.以频率估计概率,有
C.若取,可以认为疗效与疗法独立
D.若取,可以认为疗效与疗法独立
10. 下列命题成立的是( )
A.已知,若,则
B.若一组样本数据对应的样本点都在直线上,则这组样本数据的相关系数为
C.以模型去拟合一组数据时,为了求出回归方程,设,求得线性回归方程为,则的值分别是4和0.3
D.对分类变量与的独立性检验的统计量来说,值越大,判断“与有关系”的把握性越小
11.
已知,其中.下列说法正确的是( )
A.已知一组数据:,1,2,4,3,5,10,9,若为这组数据的第75百分位数,则的展开式中的系数为
B.数据(1,2,3,…,10)组成一个样本,其回归直线方程为,其中,去除一个异常点后,得到新的回归直线必过点
C.若随机变量,则函数为偶函数
D.在列联表中,若每一个数据均变为原来的3倍,则变为原来的9倍
三、填空题: 本大题共3小题,每小题5分,共计15分.
12. 某学校开展研究性学习活动,一组同学获得了下面的一组试验数据:
x
1.99
3
4
5.1
8
y
0.99
1.58
2.01
2.35
3.00
现有如下5个模拟函数:①;②;③;④;⑤,请从中选择一个模拟函数,使它能近似地反映这些数据的规律,应选________(填序号).
13. 某软件科技公司近8年的年利润额y与投入的年研发经费x(单位:千万元)如表所示.
x
3
4
5
6
6
7
8
9
y
根据散点图可以认为x与y之间存在线性相关关系,且相关系数,用最小二乘法求线性回归方程(,用分数表示),________.
附:(1)参考数据:,.
(2)参考公式:,.
14.
针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
四、解答题: 本题共5小题, 共77分。解答应写出文字说明、证明过程或演算步骤。
15.
(13分)年月日,由工业和信息化部、安徽省人民政府共同主办的第十七届“中国芯”集成电路产业大会在合肥成功举办.此次大会以“强芯固基以质为本”为主题,旨在培育壮大我国集成电路产业,夯实产业基础、营造良好产业生态.年,全国芯片研发单位相比年增加家,提交芯片数量增加个,均增长超过倍.某芯片研发单位用在“芯片”上研发费用占本单位总研发费用的百分比()如表所示.
年份
年份代码
(1)根据表中的数据,作出相应的折线图;并结合相关数据,计算相关系数,并推断与线性相关程度;(已知:,则认为与线性相关很强;,则认为与线性相关一般;,则认为与线性相关较弱)
.
(2)求出与的回归直线方程(保留一位小数);
(3)请判断,若年用在“芯片”上研发费用不低于万元,则该单位年芯片研发的总费用预算为万元是否符合研发要求?
附:相关数据:,,,.
相关计算公式:①相关系数;在回归直线方程中,,.
16.
(15分)某公司计划对未开通共享电动车的某市进行车辆投放,为了确定车辆投放量,对过去在其他城市的投放量情况以及年使用人次进行了统计,得到了投放量(单位:千辆)与年使用人次(单位:千次)的数据如下表所示,根据数据绘制投放量与年使用人次的散点图如图所示.
1
2
3
4
5
6
7
6
11
21
34
66
101
196
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型或指数函数模型对两个变量的关系进行拟合.请问哪个模型更适宜作为投放量与年使用人次的回归方程类型(给出判断即可,不必说明理由)?并求出关于的回归方程;
(2)公司为了测试共享电动车的性能,从所有同型号共享电动车中随机抽取100辆进行等距离骑行测试,骑行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的共享电动车占比.请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为共享电动车是否报废与保养有关?
\
保养
未保养
合计
报废
20
未报废
合计
60
100
62.14
1.54
2535
50.12
3.47
参考数据:.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:
其中.
0.25
0.1
0.05
0.025
0.01
0.001
1.323
2.706
3.841
5.024
6.635
10.828
17. (15分)随着智能网联汽车应用服务的推陈出新,智能网联汽车规模持续上升,下表为2021~2025中国智能网联汽车应用服务市场的规模及预测(表中2025年的数据为预测规模).
年份
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
市场规模(单位:千亿元)
0.93
1.26
1.61
2.15
2.79
(1)小张同学根据上表数据求得关于的经验回归方程为,小王同学利用散点图发现,点的分布更像模型,利用变换,可将转换为线性模型,根据下面提供的数据及公式求出该回归方程;
(2)利用相关系数可以判断两变量间线性相关性的强弱,|r|越大,线性相关性就越强,且当时,则认为经验回归方程有价值,否则无价值.用相关系数比较两模型哪一个更有价值?
参考公式:.
参考数据:,(其中).
18.
(17分)近年来,政府相关部门引导乡村发展旅游业的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲、乙两名同学一起收集了6家农户的数据,进行回归分析,得到两个回归模型:模型①;模型②.对以上两个回归方程进行残差分析,得到下表:
种植面积亩
2
3
4
5
7
9
每亩种植管理成本/百元
25
24
21
22
16
14
模型①
估计值
25.27
23.62
21.97
17.02
13.72
残差
0.38
0.28
模型②
估计值
26.84
20.17
18.83
17.31
16.46
残差
0.83
3.17
注:表中.
(1)将以上表格补充完整,判断哪个模型拟合效果更好,并简要说明理由;
(2)视残差的绝对值超过1.5的数据为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求其经验回归方程.
参考公式:.
19. (17分)《最强大脑》是江苏卫视借鉴德国节目《SuperBrain》推出的大型科学竞技类真人秀节目,是专注于传播脑科学知识和脑力竞技的节目.某机构为了了解大学生喜欢《最强大脑》是否与性别有关,对某校的100名大学生进行了问卷调查,得到如下列联表:
喜欢
不喜欢
合计
男生
10
女生
20
合计
已知在这100人中随机抽取1个不喜欢《最强大脑》的大学生的概率为0.4.
(1)请将上述列联表补充完整;
(2)判断在犯错误的概率不超过0.001的前提下能否认为喜欢《最强大脑》与性别有关,并说明你的理由;
(3)已知在被调查的大学生中有5名是大一学生,其中3名喜欢《最强大脑》.现从这5名大一学生中随机抽取2人,抽到喜欢《最强大脑》的人数为,求的分布列与数学期望.
(
1
)
学科网(北京)股份有限公司
$