内容正文:
8.2一元线性回归分析
题型1回归直线方程的意义
1.【答案】②③④
【解析】对①,回归直线恒过样本点的中心,但不一定过一个样本点,故①错误;
对②,根据相关系数的意义,可得两个变量相关性越强,则相关系数|r|就越接近1,故②正确;
对③,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,故③正确;对④,根据回归系数的含义,可得在回归直线方程中,
当解释变量x增加一个单位时,预报变量平均减少0.5个单位,故④正确.
2.【答案】①③④
【解析】因为回归直线方程为,所以变量 x 与 y 呈正相关关系,故①正确;
因为,所以去除后y的估计值增加速度变慢,故②错误;
当时,,所以去除前样本点的中心为,
又因为,,
所以去掉两个数据点和后,样本点的中心还是,故③正确;
因为去除后重新求得的回归直线的斜率为1.2,所以可设,
将点代入直线,得,解得,
所以去除后的回归直线方程为,故④正确.
3.【答案】C
【解析】设一条经验回归直线的方程为,则当变量x增加一个单位时,y平均减少1.2个单位.
故选:C.
4.【答案】D
【解析】对于A,若相关系数,即相关系数的绝对值较为接近1,则说明变量与的线性相关程度较强,故A正确;
对于B,在线性回归方程中,回归直线必定过样本中心点,故B正确;
对于C,若散点图中数据点从左上角到右下角分布,整体呈下降趋势,则,负相关,故C正确;
对于D,若回归方程为,则变量每增加1个单位时,变量可能增加2个单位,故D错误.
故选:D.
5.【答案】B
【解析】对于A,两个变量的相关系数反应了两个变量的线性相关程度,不是斜率,故A不正确;
对于B,回归直线一定过这组数据的样本中心点,即,故B正确;
对于C,由图像可知,两个变量是负相关,故C不正确;
对于D,所有的样本点集中在回归直线附近,不一定两侧一样多,故D不正确.
故选:B.
题型2求回归直线方程
6.【答案】
【解析】设线性回归方程为,
,,
,
7.【答案】
【解析】设回归直线方程为,原数据样本的中心点为,
新数据样本的中心点为,于是解得,
所以回归直线方程为.
8.【答案】
【解析】易知,,又,
所以,
,则,
9.【答案】C
【解析】由条件知,,设经验回归方程为,
则,
∴经验回归的方程是.
故选:C.
10.【答案】A
【解析】由题可得,,
由,
,
所以所求经验回归方程为.
故选:A.
题型3利用回归方程进行数据估计
11.【答案】
【解析】将代入回归直线方程可得.
12.【答案】
【解析】由题意知,则:
.
13.【答案】
【解析】因为女儿身高为(单位:)关于父亲身高(单位:)的经验回归方程是,
所以当父亲的身高为时,.
14.【答案】C
【解析】根据2010年至2014年数据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模型,,,
∴由图知:2010年至2014年数据为;
2015年至2019年数据为;
2010年至2019年数据为;均成递减趋势.
又,,,且极差分别为6、51、65,
三条回归方程的直线大致图象,如下图示:
∴回归方程的斜率大小关系为,且截距.
故选:C.
题型4利用样本中心点求参数
15.【答案】11
【解析】依题意,,,
由在回归直线上,得,所以.
16.【答案】
【解析】由条件得,则,
所以,解得.
17.【答案】60
【解析】由题意得,,
因为关于的线性回归方程为,
所以,解得,
18.【答案】1
【解析】根据表格可知,,
,
因为y与x线性相关,且回归直线方程为,
所以,得,解得.
题型5离差的相关问题
19.【答案】
【解析】由题意可得时的预测值为,
所以,解得,即经验回归方程为,
又因为,,
所以,解得,
20.【答案】290
【解析】因为在样本点处的离差为0,
所以,得,
则y关于x的线性回归方程为.
因为,所以,
所以.
21.【答案】D
【解析】,增加两个样本点后的平均数为;
,,增加两个样本点后的平均数为,
,解得:,新的经验回归方程为:,
则当时,,样本的离差为.
故选:D.
22.【答案】C
【解析】选项A:观察数据,增大时也增大,说明正相关,故A正确;
选项B: 易得,,样本中心点为,回归直线方程经过样本中心点,故B正确;
对于CD:将样本中心点坐标代入回归直线方程得
,故D正确.
计算预测值,实际值,
离差.
题目中离差为1.8(未考虑符号),故C错误,
故选:C
题型1非线性回归分析
23.【答案】
【解析】因为,两边取自然对数可得,
令,可得,又,
所以,,所以,所以.
24.【答案】
【解析】令,
则,
因为,所以,所以,解得.
25.【解】(1)由散点图可以判断,随温度升高,产卵数增长速度变快,符合指数函数模型的增长,
所以更适宜作为平均产卵数关于平均温度的回归方程类型.
(2)将两边同时取自然对数,可得,
由题中的数据可得,,
所以,则,
所以关于的线性回归方程为,故关于的回归方程为;
26.【解】(1)根据农户近5年种植药材的收入情况的统计数据可得:
,,
设,则,所以,
则,.
所以,回归方程为.
(2)将值代入可得估计值分别为59,60.8,63.8,68,73.4,
则残差平方和为.
因为,所以回归方程拟合效果符合要求.
题型2线性回归分析与概率统计
27.【解】(1),,
故样本相关系数.
(2)X的取值可以为0,1,2,
则,
,
,
于是X的分布列为
X
0
1
2
P
故.
28.【解】(1),,
则,
,,
则,
因为,且接近于,
故说明场均观众人数与小组赛积分之间具有很强的正线性相关关系;
(2)九龙坡区队在第一阶段未来赛事中至少获得23分,
则设剩余场比赛中九龙坡区队比赛情况有以下几种:
一:场比赛全胜,概率为:;
二:胜场,平或负场,概率为:;
三:胜场,平场,概率为:;
故九龙坡区队在第一阶段未来赛事中至少获得23分的概率为:
.
29.【解】(1)依题意,,而,,,
则.
因为时线性相关程度高,所以y与x线性相关性很强,
可以用线性回归模型拟合.
,,
因此,回归方程为.
(2)记“甲从2号门出学校”为事件A,“甲从1号门进学校”为事件B,
“甲从2号门进学校”为事件C, “甲从3号门进学校”为事件D,
由题意可得,,,
,,,
由全概率公式得:
,同理乙、丙、丁从2号门出学校的概率也为,
为4人中从2号门出学校的人数,则,
,,
,,
,
故的分布列为:
0
1
2
3
4
所以.
30.【解】(1)由表得,.
由,得.
,
,
.
(2)(i)回归直线过样本中心点,且,
.
即,解得.
(ii)
所以 .
31.【答案】
【解析】因为,所以.
32.【答案】
【解析】由表格中的数据,可得,
因为回归方程中的,代入可得,
所以经验回归方程为,
当时,,即每天的销售量约为个.
33.【答案】/
【解析】因为,,且线性回归方程恒过,
所以,解得,将代入回归方程得,
所以此回归方程在样本点处的离差是.
34.【答案】7
【解析】由样本数据点集求得的经验回归方程为,且,
所以,故数据的样本中心点为,去掉,,
重新求得的经验回归直线的斜率估计值为,
经验回归方程设为,代入,求得,
所以经验回归直线的方程为:,将代入经验回归方程,求得的估计值为.
35.【答案】C
【解析】由题知,.
代入,得出,
所以,A选项正确;
,变量和呈正相关,B选项正确;
由题知,,该经验回归方程必过点,C选项错误;
当时,,
故当某户家庭人口数为8时,预测该户茶产业的年收入为25.7万元,D选项正确;故选:C
36.【答案】B
【解析】根据题意可得,,,
则5对样本数据的样本点中心为,将其代入方程中得,,
则.故选:B.
37.【答案】D
【解析】,,
因为回归直线过点,所以,得,
故当时,,得.故选:D.
38.【答案】C
【解析】由题设,随变大而变小,故回归方程一次项的系数为负数,排除A、B;
,,又,
C:,则,符合,
D:,则,不符,故选:C
39.【解】(1)根据题意得:,,
,
,
,,
所以关于的线性回归方程;
(2)当时,(千亿元),
即该地区2022年()的人民币储蓄存款为12千亿元.
40.【解】(1)散点图如图所示;
(2)从散点图上可以看出,食品所含热量的百分比与口味值之间总体趋势近似地成一条直线,也就是说他们之间是线性相关的;
(3)直线如上图所示;
(4)因为当直线上方的食品和下方的食品所含热量相同时,直线上方的食品口味更好.
41.【解】(1)由题意可知,,
,
,
所以,
所以,
所以所求回归直线的方程为;
(2)在(1)中的方程中,令,得,
故如果该企业某年研发费用投入百万元,预测该企业获得年利润为百万元.
42.【解】(1)由题意,数据的最大值为,最小值为,
则极差为;
数据中间两数为与,
则中位数为.
故极差为,中位数为;
(2)由题意,数据共个,以上数据共有个,
故设事件“恰有个数据在以上”,
则,
故恰有个数据在以上的概率为;
(3)由题意,成绩的平均数
,
由直线过,
则,
故回归直线方程为.
当时,.
故预测年冠军队的成绩为秒.
43.【解】(1)由条件可知,,,
,
,
,
所以;
(2),
,
所以,
当时,;
(3),所以,,
,,
所以.
44.【解】(1)根据已知数据以及参考数据可得:,
;
又,
故,
,
故所求线性回归方程为:.
(2)根据(1)所求可得:,令,解得,
故预测该地区2025年农村居民家庭人均纯收入为千元.
(3)根据题意,结合所求线性回归方程可得如下表格:
年份
2019
2020
2021
2022
2023
年份代号x
1
2
3
4
5
人均纯收入
2.3
3.3
4.1
4.4
4.9
2.54
3.17
3.8
4.43
5.06
0.24
0.13
0.3
0.03
0.16
根据“好数据”定义,故组数据中,“好数据”有2组,不是“好数据”的有3组,
从5个数据中任选3个,恰好有两个“好数据”是事件,则.
45.【解】(1)因为,,,,
所以
因为,
所以回归直线方程为,
当时,,
即利润约为9.6万元;
(2)记3名成员的方案分别、;、;、.
从中任选2个方案的基本事件含有:、、、、,
、、、、、、、、
、共15种.
其中这2个方案出自同一个人的基本事件含有、、,共3种.
所以.
46.【解】(1)根据表格中的数据,可得
,,
,
,
,
可得相关系数,
故与之间的关系可用线性回归模型进行拟合,
又由,
可得.
综上回归直线方程.
(2)通过甲大学的考试科目数,则,
设通过乙大学的考试科目数为,则可能的取值为0、1、2、3,
则,
,
,
,
所以,
因为该考生更希望通过乙大学的笔试考试,
所以,即,
又由,解得,
即为该考生更希望通过乙大学的笔试时的范围为.
1 / 10
学科网(北京)股份有限公司
$
8.2一元线性回归分析
题型1回归直线方程的意义
1.给出下列说法:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数|r|就越接近1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位.
其中说法正确的是________.(填写正确序号)
2.已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和的误差较大,去除后重新求得的回归直线 l 的斜率为1.2,则下列说法正确的是______.
①变量x与y呈正相关关系;
②去除后y的估计值增加速度变快;
③去除后与去除前样本点的中心不变;
④去除后的回归直线方程为.
3.设一条经验回归直线的方程为,则当变量x增加一个单位时,( )
A.y平均增加1.2个单位 B.y平均增加3个单位
C.y平均减少1.2个单位 D.y平均减少3个单位
4.关于变量与的线性回归分析,下列说法错误的是( )
A.若相关系数,则说明变量与的线性相关程度较强
B.回归直线必过点
C.若散点图中数据点从左上角到右下角分布,则,负相关
D.若回归方程为,则变量每增加1个单位时,变量一定增加2个单位
5.设是变量和的个样本点,直线是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )
A.和的相关系数为直线的斜率
B.直线过点
C.变量和是正相关
D.当为奇数时,分布在两侧的样本点的个数一定相同
题型2求回归直线方程
6.某品牌的宣传支出与收入的数据如下表所示.
万元
200
400
500
600
800
万元
3000
4000
5000
6000
7000
则线性回归模型为______.
7.一组互不相等的样本数据,其中,若在样本中加入数据后,新样本数据的回归直线方程与原样本数据的相同,则这组样本数据的回归直线方程为_______.
8.随机抽取家超市,得到其广告支出(万元)与销售额(万元)的数据如下:
超市
广告支出
2
4
5
6
8
销售额
30
40
60
60
70
则其经验回归方程__________.
(参考数据:,参考公式:;)
9.已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归的方程是( )
A. B. C. D.
10.为预测某种产品的回收率,需要研究它和原料有效成分含量之间的相关关系,若已知与之间存在线性相关关系,现取了8组观察值,计算知,,,,则关于的经验回归方程是( )
A. B.
C. D.
题型3利用回归方程进行数据估计
11.若对具有线性相关关系的两个变量建立的回归方程为,则当时,的估计值为 .
12.已知,则 .
13.假如女儿的身高y(单位:cm)关于父亲身高x(单位:cm)的线性回归方程是,已知父亲身高为175cm,则估计女儿的身高为 cm.(结果精确到整数)
14.下图是某地区2010年至2019年污染天数(单位:天)与年份的折线图.根据2010年至2014年数据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模型,,,则( )
A., B.,
C., D.,
题型4利用样本中心点求参数
15.已知x,y是两个具有线性相关的两个变量,其取值如下表:
x
1
2
3
4
5
y
4
a
9
b
11
其回归方程为,则 .
16.某产品的广告支出费用x(单位:万元)与销售额y(单位:万元)的数据如下表:
x
2
4
5
6
8
y
30
40
a
50
70
已知y关于x的线性回归方程为,则表格中实数a的值为 .
17.根据变量与的对应关系(如表),求得关于的线性回归方程为,则表中的值为 .
2
4
5
6
8
30
40
50
70
18.已知x,y的对应值如下表所示:
0
2
4
6
8
1
13
若y与x线性相关,且回归直线方程为,则 .
题型5离差的相关问题
19.某工厂为研究某种产品的产量(吨)与所需某种原材料的质量(吨)的相关性,在生产过程中收集组对应数据,如下表所示.(离差观测值预测值)
3
4
5
6
2.5
4
4.5
根据表中数据,得出关于的经验回归方程为,据此计算出在样本处的离差为,则表中的值为 .
20.为研究变量x,y的相关关系,收集得到如下数据:
x
1
2
3
4
5
y
60
若由最小二乘法求得y关于x的线性回归方程为,并据此计算在样本点处的离差为0,则 .
21.已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的离差为( )
A. B. C. D.
22.小明研究温差(单位:)与本单位当天新增感冒人数(单位:人)的关系,他记录了5天的数据:
3
4
5
6
7
16
20
25
28
36
由表中数据求得温差与新增感冒人数满足经验回归方程,则下列结论不正确的是( )
A.与正相关 B.经验回归直线经过点
C.当时,离差为1.8 D.
题型1非线性回归分析
23.用模型拟合一组数据,令,将模型转化为经验回归方程,则______.
24.已知随机变量,的五组观测数据如下表:
1
2
3
4
5
由表中数据通过模型得到经验回归方程为,则实数的值为______.
25.红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数(个)和平均温度有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
参考数据
17713
714
27
81.3
(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适合作为平均产卵数(个)关于平均温度()的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出关于的回归方程.(计算结果精确到0.1)
附:回归方程中
26.某地政府为提高当地农民收入,指导农民种植药材,取得较好的效果.以下是某农户近5年种植药材的年收入的统计数据:
年份
2019
2020
2021
2022
2023
年份代码
1
2
3
4
5
年收入(千元)
59
61
64
68
73
(1)根据表中数据,现决定使用模型拟合与之间的关系,请求出此模型的回归方程;(结果保留一位小数)
(2)统计学中常通过计算残差的平方和来判断模型的拟合效果.在本题中,若残差平方和小于0.5,则认为拟合效果符合要求.请判断(1)中回归方程的拟合效果是否符合要求,并说明理由.
参考数据及公式:,.设,则,.
题型2线性回归分析与概率统计
27.粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.我国于2020年打赢了脱贫攻坚战,其中小麦发挥了重大作用.以2020年为第1年,我国连续5年小麦产量如下:
年份
1
2
3
4
5
产量/千万吨
13.4
13.7
13.8
13.6
14.0
现规定表示第i年的年份,表示第i年的产量,经计算得,,.
(1)求样本(,2,…,5)的相关系数(精确到0.01);
(2)现从这5年中随机抽取2年,记这2年中共有X年的小麦产量不低于13.7千万吨,求X的分布列与期望.
附:样本相关系数,.
28.2025年渝超联赛正如火如荼地进行,联赛分两个阶段,第一阶段为各赛区比赛,第二阶段为总决赛.联赛积分规则为:胜一场得3分,平一场得1分,负一场得0分.九龙坡区队属于中心城区赛区,该赛区共有11支球队进行单循环比赛(每支参赛队伍均与其他所有队伍恰好比赛一次).已知九龙坡区队在与赛区中任何一个对手比赛时,获胜的概率均为,平局的概率均为,失利的概率均为,且各场比赛结果相互独立.
(1)九龙坡区队教练组为研究观众人数对球队成绩的影响,用模拟了该球队在5种不同观众人数(单位:千人)下的比赛表现(每场均模拟完整的小组赛).模拟数据如下:
场均观众人数 (千人)
8
12
6
15
9
小组赛积分
10
16
8
18
13
请计算场均观众人数 (千人)与小组赛积分的样本相关系数 (精确到0.01),并说明两者之间的线性相关程度;
(2)九龙坡区队在9月13日的揭幕赛中以失利于渝中区队,积0分.根据赛事规则推算,在中心城区赛区,球队至少需要获得23分才有晋级总决赛的可能.求九龙坡区队在第一阶段未来赛事中至少获得23分的概率.
附:相关系数,
29.某学校校庆时统计连续5天进入学校参加活动的校友数(单位:千人)如下:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
第x天
1
2
3
4
5
参观人数y
2.2
2.6
3.1
5.2
6.9
(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明(保留小数点后两位);(若,则认为y与x的线性相关性很强),并求出y关于x的线性回归方程;
(2)校庆期间学校开放1号门、2号门和3号门供校友出入,校友从1号门、2号门和3号门进入学校的概率分别为、、,且出学校与进学校选择相同门的概率为,选择与人校不同两门的概率各为.假设校友从1号门、2号门、3号门出入学校互不影响,现有甲、乙、丙、丁4名校友于10月1日回母校参加活动,设X为4人中从2号门出学校的人数,求X的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
30.2025年春晚舞台上,机器人扭秧歌表演成为一大亮点.现统计出机器人Unitree 在某地区2024年2月至6月的销售量,数据如下表:
月份
2
3
4
5
6
销售量
45
55
70
110
用最小二乘法得到Unitree的销售量关于月份的回归直线方程为,且相关系数,销售量的方差.
(1)求的值(结果精确到0.1);
(2)(i)求的值;
(ii)现从这5个月份中随机抽取3个月份,设抽取到销售量大于60的月份个数为,求的分布列和方差.
附:回归系数,相关系数,
31.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得经验回归方程为,则该模型的回归方程为________.
32.某产品在某零售摊位上的零售价(单位:元)与每天的销售量(单位:个)的统计资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程中的,则________,据此模型预计零售价定为15元时,每天的销售量为________.
33.由表格数据得到的线性回归方程为,则此回归方程在样本点处的离差是_______
x
3
4
5
6
y
2.5
4
4.5
34.已知组成对样本数据确定的经验回归方程为且,通过残差分析,发现两组成对样本数据,误差较大,除去这两组成对样本数据后,重新求得经验回归直线的斜率估计值为,则当时,________.
35.茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,已知变量和满足经验回归方程,且变量和一组相关数据统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
17
则下列说法错误的是( )
A.
B.变量和呈正相关
C.该经验回归方程必过点
D.若某户家庭人口数为8时,预测该户茶产业的年收入为万元
36.已知变量之间具有线性相关关系,根据5对样本数据求得经验回归方程为,若,,则( )
A.18 B.3.6 C.2.4 D.1.2
37.某公司根据近几年经营经验,得到广告支出(单位:万元)与获得利润(单位:万元)的数据如下:
广告支出万元
2
5
8
11
15
19
利润万元
33
45
50
53
58
64
根据表中数据可得利润关于广告支出的线性回归方程为.据此线性回归方程,若计划利润达到100万元,估计需要支出广告费( )
A.30万元 B.32万元 C.36万元 D.40万元
38.已知变量x与y,且观测数据如下表(),则由该观测的数据算得的线性回归方程可能是( )
x
1
2
3
4
5
y
6.5
a
4
b
1
A. B. C. D.
39.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2016
2017
2018
2019
2020
时间代号
1
2
3
4
5
储蓄存款/千亿元
5
6
7
8
10
(1)求关于的线性回归方程;
(2)用所求回归方程预测该地区2022年()的人民币储蓄存款.
40.有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第二行表示此种食品所含热量的百分比,第三行数据表示由一些美食家以百分制给出的对此种食品口味的评价:
品牌
A
B
C
D
E
F
G
H
I
J
所含热量的百分比
25
34
20
19
26
20
19
24
19
13
口味记录
89
89
80
78
75
71
65
62
60
52
(1)作出散点图;
(2)你能从散点图中发现两者之间的近似关系吗?
(3)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系;
(4)对于食品,为什么人们更喜欢吃位于直线上方的食品而不是下方的?
41.现有某高新技术企业年研发费用投入(百万元)与企业年利润(百万元)之间具有线性相关关系,近5年的年研发费用和年利润的具体数据如表:
年研发费用(百万元)
1
2
3
4
5
年利润(百万元)
2
3
4
4
7
数据表明与之间有较强的线性关系.
(1)求对的回归直线方程;
(2)如果该企业某年研发费用投入8百万元,预测该企业获得年利润为多少?
42.2024年巴黎奥运会,中国获得了男子米混合泳接力金牌.以下是历届奥运会男子米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列.
206.78
207.46
207.95
209.34
209.35
210.68
213.73
214.84
216.93
216.93
(1)求这组数据的极差与中位数;
(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;
(3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2006,预测2028年冠军队的成绩(精确到0.01秒).
43.某科研活动共进行了5次试验,其数据如表所示:
特征量
第1次
第2次
第3次
第4次
第5次
(1)求成对数据的相关系数;
(2)求特征量关于的回归方程,并据此估算特征量时的值;
(3)设特征量作为随机变量服从正态分布,其中为5次试验中的平均数,为5次试验中的方差.求.(本题所有答数精确到0.01.)
44.某地区2019年至2023年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2019
2020
2021
2022
2023
年份代号x
1
2
3
4
5
人均纯收入
2.3
3.3
4.1
4.4
4.9
(1)由表可知与具有线性相关关系,求关于的线性回归方程;
(2)利用(1)中的回归方程,预测该地区2025年农村居民家庭人均纯收入;
(3)用(1)中所求线性回归方程得到与对应的人均纯收入预测值,当数据对应残差的绝对值时,将该数据称作一个“好数据”,经过计算统计得到这5个数据中“好数据”有2个,不是“好数据”的有3个,现从5个数据中任选3个,求恰好有两个“好数据”的概率.
45.某电商分析了近8年“双十一”期间的宣传费用(单位:万元)和利润(单位:万元)之间的关系,得到下列数据:
2
3
4
5
6
8
9
11
1
2
3
3
4
5
6
8
请回答:
(1)由表中数据,求线性回归方程,并预测当时,对应的利润为多少(、、精确到0.1)
参考数据:,.
(2)为了更好地完成任务,某电商决定让宣传部门的3名成员各自制订两个方案,从中任选2个方案进行宣传,求这2个方案出自同一个人的概率.
46.2020年1月15日,教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.
(1)为了更好地服务于高三学生,某研究机构对随机抽取的5名高三学生的记忆力和判断力进行统计分析,得到下表数据:
6
8
9
10
12
2
3
4
5
6
请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合,并求关于的线性回归方程(精确到0.01);
(2)现有甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为,该考生报考乙大学,每门笔试科目通过的概率依次为、、,其中,根据规定每名考生只能报考强基计划的一所试点高校,若以笔试过程中通过科目数的期望为依据作出决策,求该考生更希望通过乙大学笔试时的取值范围.
1 / 10
学科网(北京)股份有限公司
$
8.2一元线性回归分析
题型1回归直线方程的意义
1.给出下列说法:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数|r|就越接近1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位.
其中说法正确的是________.(填写正确序号)
【答案】②③④
【解析】对①,回归直线恒过样本点的中心,但不一定过一个样本点,故①错误;
对②,根据相关系数的意义,可得两个变量相关性越强,则相关系数|r|就越接近1,故②正确;
对③,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,故③正确;对④,根据回归系数的含义,可得在回归直线方程中,
当解释变量x增加一个单位时,预报变量平均减少0.5个单位,故④正确.
2.已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和的误差较大,去除后重新求得的回归直线 l 的斜率为1.2,则下列说法正确的是______.
①变量x与y呈正相关关系;
②去除后y的估计值增加速度变快;
③去除后与去除前样本点的中心不变;
④去除后的回归直线方程为.
【答案】①③④
【解析】因为回归直线方程为,所以变量 x 与 y 呈正相关关系,故①正确;
因为,所以去除后y的估计值增加速度变慢,故②错误;
当时,,所以去除前样本点的中心为,
又因为,,
所以去掉两个数据点和后,样本点的中心还是,故③正确;
因为去除后重新求得的回归直线的斜率为1.2,所以可设,
将点代入直线,得,解得,
所以去除后的回归直线方程为,故④正确.
3.设一条经验回归直线的方程为,则当变量x增加一个单位时,( )
A.y平均增加1.2个单位 B.y平均增加3个单位
C.y平均减少1.2个单位 D.y平均减少3个单位
【答案】C
【解析】设一条经验回归直线的方程为,则当变量x增加一个单位时,y平均减少1.2个单位.
故选:C.
4.关于变量与的线性回归分析,下列说法错误的是( )
A.若相关系数,则说明变量与的线性相关程度较强
B.回归直线必过点
C.若散点图中数据点从左上角到右下角分布,则,负相关
D.若回归方程为,则变量每增加1个单位时,变量一定增加2个单位
【答案】D
【解析】对于A,若相关系数,即相关系数的绝对值较为接近1,则说明变量与的线性相关程度较强,故A正确;
对于B,在线性回归方程中,回归直线必定过样本中心点,故B正确;
对于C,若散点图中数据点从左上角到右下角分布,整体呈下降趋势,则,负相关,故C正确;
对于D,若回归方程为,则变量每增加1个单位时,变量可能增加2个单位,故D错误.
故选:D.
5.设是变量和的个样本点,直线是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )
A.和的相关系数为直线的斜率
B.直线过点
C.变量和是正相关
D.当为奇数时,分布在两侧的样本点的个数一定相同
【答案】B
【解析】对于A,两个变量的相关系数反应了两个变量的线性相关程度,不是斜率,故A不正确;
对于B,回归直线一定过这组数据的样本中心点,即,故B正确;
对于C,由图像可知,两个变量是负相关,故C不正确;
对于D,所有的样本点集中在回归直线附近,不一定两侧一样多,故D不正确.
故选:B.
题型2求回归直线方程
6.某品牌的宣传支出与收入的数据如下表所示.
万元
200
400
500
600
800
万元
3000
4000
5000
6000
7000
则线性回归模型为______.
【答案】
【解析】设线性回归方程为,
,,
,
7.一组互不相等的样本数据,其中,若在样本中加入数据后,新样本数据的回归直线方程与原样本数据的相同,则这组样本数据的回归直线方程为_______.
【答案】
【解析】设回归直线方程为,原数据样本的中心点为,
新数据样本的中心点为,于是解得,
所以回归直线方程为.
8.随机抽取家超市,得到其广告支出(万元)与销售额(万元)的数据如下:
超市
广告支出
2
4
5
6
8
销售额
30
40
60
60
70
则其经验回归方程__________.
(参考数据:,参考公式:;)
【答案】
【解析】易知,,又,
所以,
,则,
9.已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归的方程是( )
A. B. C. D.
【答案】C
【解析】由条件知,,设经验回归方程为,
则,
∴经验回归的方程是.
故选:C.
10.为预测某种产品的回收率,需要研究它和原料有效成分含量之间的相关关系,若已知与之间存在线性相关关系,现取了8组观察值,计算知,,,,则关于的经验回归方程是( )
A. B.
C. D.
【答案】A
【解析】由题可得,,
由,
,
所以所求经验回归方程为.
故选:A.
题型3利用回归方程进行数据估计
11.若对具有线性相关关系的两个变量建立的回归方程为,则当时,的估计值为 .
【答案】
【解析】将代入回归直线方程可得.
12.已知,则 .
【答案】
【解析】由题意知,则:
.
13.假如女儿的身高y(单位:cm)关于父亲身高x(单位:cm)的线性回归方程是,已知父亲身高为175cm,则估计女儿的身高为 cm.(结果精确到整数)
【答案】
【解析】因为女儿身高为(单位:)关于父亲身高(单位:)的经验回归方程是,
所以当父亲的身高为时,.
14.下图是某地区2010年至2019年污染天数(单位:天)与年份的折线图.根据2010年至2014年数据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模型,,,则( )
A., B.,
C., D.,
【答案】C
【解析】根据2010年至2014年数据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模型,,,
∴由图知:2010年至2014年数据为;
2015年至2019年数据为;
2010年至2019年数据为;均成递减趋势.
又,,,且极差分别为6、51、65,
三条回归方程的直线大致图象,如下图示:
∴回归方程的斜率大小关系为,且截距.
故选:C.
题型4利用样本中心点求参数
15.已知x,y是两个具有线性相关的两个变量,其取值如下表:
x
1
2
3
4
5
y
4
a
9
b
11
其回归方程为,则 .
【答案】11
【解析】依题意,,,
由在回归直线上,得,所以.
16.某产品的广告支出费用x(单位:万元)与销售额y(单位:万元)的数据如下表:
x
2
4
5
6
8
y
30
40
a
50
70
已知y关于x的线性回归方程为,则表格中实数a的值为 .
【答案】
【解析】由条件得,则,
所以,解得.
17.根据变量与的对应关系(如表),求得关于的线性回归方程为,则表中的值为 .
2
4
5
6
8
30
40
50
70
【答案】60
【解析】由题意得,,
因为关于的线性回归方程为,
所以,解得,
18.已知x,y的对应值如下表所示:
0
2
4
6
8
1
13
若y与x线性相关,且回归直线方程为,则 .
【答案】1
【解析】根据表格可知,,
,
因为y与x线性相关,且回归直线方程为,
所以,得,解得.
题型5离差的相关问题
19.某工厂为研究某种产品的产量(吨)与所需某种原材料的质量(吨)的相关性,在生产过程中收集组对应数据,如下表所示.(离差观测值预测值)
3
4
5
6
2.5
4
4.5
根据表中数据,得出关于的经验回归方程为,据此计算出在样本处的离差为,则表中的值为 .
【答案】
【解析】由题意可得时的预测值为,
所以,解得,即经验回归方程为,
又因为,,
所以,解得,
20.为研究变量x,y的相关关系,收集得到如下数据:
x
1
2
3
4
5
y
60
若由最小二乘法求得y关于x的线性回归方程为,并据此计算在样本点处的离差为0,则 .
【答案】290
【解析】因为在样本点处的离差为0,
所以,得,
则y关于x的线性回归方程为.
因为,所以,
所以.
21.已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的离差为( )
A. B. C. D.
【答案】D
【解析】,增加两个样本点后的平均数为;
,,增加两个样本点后的平均数为,
,解得:,新的经验回归方程为:,
则当时,,样本的离差为.
故选:D.
22.小明研究温差(单位:)与本单位当天新增感冒人数(单位:人)的关系,他记录了5天的数据:
3
4
5
6
7
16
20
25
28
36
由表中数据求得温差与新增感冒人数满足经验回归方程,则下列结论不正确的是( )
A.与正相关 B.经验回归直线经过点
C.当时,离差为1.8 D.
【答案】C
【解析】选项A:观察数据,增大时也增大,说明正相关,故A正确;
选项B: 易得,,样本中心点为,回归直线方程经过样本中心点,故B正确;
对于CD:将样本中心点坐标代入回归直线方程得
,故D正确.
计算预测值,实际值,
离差.
题目中离差为1.8(未考虑符号),故C错误,
故选:C
题型1非线性回归分析
23.用模型拟合一组数据,令,将模型转化为经验回归方程,则______.
【答案】
【解析】因为,两边取自然对数可得,
令,可得,又,
所以,,所以,所以.
24.已知随机变量,的五组观测数据如下表:
1
2
3
4
5
由表中数据通过模型得到经验回归方程为,则实数的值为______.
【答案】
【解析】令,
则,
因为,所以,所以,解得.
25.红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数(个)和平均温度有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
参考数据
17713
714
27
81.3
(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适合作为平均产卵数(个)关于平均温度()的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出关于的回归方程.(计算结果精确到0.1)
附:回归方程中
【解】(1)由散点图可以判断,随温度升高,产卵数增长速度变快,符合指数函数模型的增长,
所以更适宜作为平均产卵数关于平均温度的回归方程类型.
(2)将两边同时取自然对数,可得,
由题中的数据可得,,
所以,则,
所以关于的线性回归方程为,故关于的回归方程为;
26.某地政府为提高当地农民收入,指导农民种植药材,取得较好的效果.以下是某农户近5年种植药材的年收入的统计数据:
年份
2019
2020
2021
2022
2023
年份代码
1
2
3
4
5
年收入(千元)
59
61
64
68
73
(1)根据表中数据,现决定使用模型拟合与之间的关系,请求出此模型的回归方程;(结果保留一位小数)
(2)统计学中常通过计算残差的平方和来判断模型的拟合效果.在本题中,若残差平方和小于0.5,则认为拟合效果符合要求.请判断(1)中回归方程的拟合效果是否符合要求,并说明理由.
参考数据及公式:,.设,则,.
【解】(1)根据农户近5年种植药材的收入情况的统计数据可得:
,,
设,则,所以,
则,.
所以,回归方程为.
(2)将值代入可得估计值分别为59,60.8,63.8,68,73.4,
则残差平方和为.
因为,所以回归方程拟合效果符合要求.
题型2线性回归分析与概率统计
27.粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.我国于2020年打赢了脱贫攻坚战,其中小麦发挥了重大作用.以2020年为第1年,我国连续5年小麦产量如下:
年份
1
2
3
4
5
产量/千万吨
13.4
13.7
13.8
13.6
14.0
现规定表示第i年的年份,表示第i年的产量,经计算得,,.
(1)求样本(,2,…,5)的相关系数(精确到0.01);
(2)现从这5年中随机抽取2年,记这2年中共有X年的小麦产量不低于13.7千万吨,求X的分布列与期望.
附:样本相关系数,.
【解】(1),,
故样本相关系数.
(2)X的取值可以为0,1,2,
则,
,
,
于是X的分布列为
X
0
1
2
P
故.
28.2025年渝超联赛正如火如荼地进行,联赛分两个阶段,第一阶段为各赛区比赛,第二阶段为总决赛.联赛积分规则为:胜一场得3分,平一场得1分,负一场得0分.九龙坡区队属于中心城区赛区,该赛区共有11支球队进行单循环比赛(每支参赛队伍均与其他所有队伍恰好比赛一次).已知九龙坡区队在与赛区中任何一个对手比赛时,获胜的概率均为,平局的概率均为,失利的概率均为,且各场比赛结果相互独立.
(1)九龙坡区队教练组为研究观众人数对球队成绩的影响,用模拟了该球队在5种不同观众人数(单位:千人)下的比赛表现(每场均模拟完整的小组赛).模拟数据如下:
场均观众人数 (千人)
8
12
6
15
9
小组赛积分
10
16
8
18
13
请计算场均观众人数 (千人)与小组赛积分的样本相关系数 (精确到0.01),并说明两者之间的线性相关程度;
(2)九龙坡区队在9月13日的揭幕赛中以失利于渝中区队,积0分.根据赛事规则推算,在中心城区赛区,球队至少需要获得23分才有晋级总决赛的可能.求九龙坡区队在第一阶段未来赛事中至少获得23分的概率.
附:相关系数,
【解】(1),,
则,
,,
则,
因为,且接近于,
故说明场均观众人数与小组赛积分之间具有很强的正线性相关关系;
(2)九龙坡区队在第一阶段未来赛事中至少获得23分,
则设剩余场比赛中九龙坡区队比赛情况有以下几种:
一:场比赛全胜,概率为:;
二:胜场,平或负场,概率为:;
三:胜场,平场,概率为:;
故九龙坡区队在第一阶段未来赛事中至少获得23分的概率为:
.
29.某学校校庆时统计连续5天进入学校参加活动的校友数(单位:千人)如下:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
第x天
1
2
3
4
5
参观人数y
2.2
2.6
3.1
5.2
6.9
(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明(保留小数点后两位);(若,则认为y与x的线性相关性很强),并求出y关于x的线性回归方程;
(2)校庆期间学校开放1号门、2号门和3号门供校友出入,校友从1号门、2号门和3号门进入学校的概率分别为、、,且出学校与进学校选择相同门的概率为,选择与人校不同两门的概率各为.假设校友从1号门、2号门、3号门出入学校互不影响,现有甲、乙、丙、丁4名校友于10月1日回母校参加活动,设X为4人中从2号门出学校的人数,求X的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
【解】(1)依题意,,而,,,
则.
因为时线性相关程度高,所以y与x线性相关性很强,
可以用线性回归模型拟合.
,,
因此,回归方程为.
(2)记“甲从2号门出学校”为事件A,“甲从1号门进学校”为事件B,
“甲从2号门进学校”为事件C, “甲从3号门进学校”为事件D,
由题意可得,,,
,,,
由全概率公式得:
,同理乙、丙、丁从2号门出学校的概率也为,
为4人中从2号门出学校的人数,则,
,,
,,
,
故的分布列为:
0
1
2
3
4
所以.
30.2025年春晚舞台上,机器人扭秧歌表演成为一大亮点.现统计出机器人Unitree 在某地区2024年2月至6月的销售量,数据如下表:
月份
2
3
4
5
6
销售量
45
55
70
110
用最小二乘法得到Unitree的销售量关于月份的回归直线方程为,且相关系数,销售量的方差.
(1)求的值(结果精确到0.1);
(2)(i)求的值;
(ii)现从这5个月份中随机抽取3个月份,设抽取到销售量大于60的月份个数为,求的分布列和方差.
附:回归系数,相关系数,
【解】(1)由表得,.
由,得.
,
,
.
(2)(i)回归直线过样本中心点,且,
.
即,解得.
(ii)
所以 .
31.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得经验回归方程为,则该模型的回归方程为________.
【答案】
【解析】因为,所以.
32.某产品在某零售摊位上的零售价(单位:元)与每天的销售量(单位:个)的统计资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程中的,则________,据此模型预计零售价定为15元时,每天的销售量为________.
【答案】
【解析】由表格中的数据,可得,
因为回归方程中的,代入可得,
所以经验回归方程为,
当时,,即每天的销售量约为个.
33.由表格数据得到的线性回归方程为,则此回归方程在样本点处的离差是_______
x
3
4
5
6
y
2.5
4
4.5
【答案】/
【解析】因为,,且线性回归方程恒过,
所以,解得,将代入回归方程得,
所以此回归方程在样本点处的离差是.
34.已知组成对样本数据确定的经验回归方程为且,通过残差分析,发现两组成对样本数据,误差较大,除去这两组成对样本数据后,重新求得经验回归直线的斜率估计值为,则当时,________.
【答案】7
【解析】由样本数据点集求得的经验回归方程为,且,
所以,故数据的样本中心点为,去掉,,
重新求得的经验回归直线的斜率估计值为,
经验回归方程设为,代入,求得,
所以经验回归直线的方程为:,将代入经验回归方程,求得的估计值为.
35.茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,已知变量和满足经验回归方程,且变量和一组相关数据统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
17
则下列说法错误的是( )
A.
B.变量和呈正相关
C.该经验回归方程必过点
D.若某户家庭人口数为8时,预测该户茶产业的年收入为万元
【答案】C
【解析】由题知,.
代入,得出,
所以,A选项正确;
,变量和呈正相关,B选项正确;
由题知,,该经验回归方程必过点,C选项错误;
当时,,
故当某户家庭人口数为8时,预测该户茶产业的年收入为25.7万元,D选项正确;故选:C
36.已知变量之间具有线性相关关系,根据5对样本数据求得经验回归方程为,若,,则( )
A.18 B.3.6 C.2.4 D.1.2
【答案】B
【解析】根据题意可得,,,
则5对样本数据的样本点中心为,将其代入方程中得,,
则.故选:B.
37.某公司根据近几年经营经验,得到广告支出(单位:万元)与获得利润(单位:万元)的数据如下:
广告支出万元
2
5
8
11
15
19
利润万元
33
45
50
53
58
64
根据表中数据可得利润关于广告支出的线性回归方程为.据此线性回归方程,若计划利润达到100万元,估计需要支出广告费( )
A.30万元 B.32万元 C.36万元 D.40万元
【答案】D
【解析】,,
因为回归直线过点,所以,得,
故当时,,得.故选:D.
38.已知变量x与y,且观测数据如下表(),则由该观测的数据算得的线性回归方程可能是( )
x
1
2
3
4
5
y
6.5
a
4
b
1
A. B. C. D.
【答案】C
【解析】由题设,随变大而变小,故回归方程一次项的系数为负数,排除A、B;
,,又,
C:,则,符合,
D:,则,不符,故选:C
39.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2016
2017
2018
2019
2020
时间代号
1
2
3
4
5
储蓄存款/千亿元
5
6
7
8
10
(1)求关于的线性回归方程;
(2)用所求回归方程预测该地区2022年()的人民币储蓄存款.
【解】(1)根据题意得:,,
,
,
,,
所以关于的线性回归方程;
(2)当时,(千亿元),
即该地区2022年()的人民币储蓄存款为12千亿元.
40.有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第二行表示此种食品所含热量的百分比,第三行数据表示由一些美食家以百分制给出的对此种食品口味的评价:
品牌
A
B
C
D
E
F
G
H
I
J
所含热量的百分比
25
34
20
19
26
20
19
24
19
13
口味记录
89
89
80
78
75
71
65
62
60
52
(1)作出散点图;
(2)你能从散点图中发现两者之间的近似关系吗?
(3)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系;
(4)对于食品,为什么人们更喜欢吃位于直线上方的食品而不是下方的?
【解】(1)散点图如图所示;
(2)从散点图上可以看出,食品所含热量的百分比与口味值之间总体趋势近似地成一条直线,也就是说他们之间是线性相关的;
(3)直线如上图所示;
(4)因为当直线上方的食品和下方的食品所含热量相同时,直线上方的食品口味更好.
41.现有某高新技术企业年研发费用投入(百万元)与企业年利润(百万元)之间具有线性相关关系,近5年的年研发费用和年利润的具体数据如表:
年研发费用(百万元)
1
2
3
4
5
年利润(百万元)
2
3
4
4
7
数据表明与之间有较强的线性关系.
(1)求对的回归直线方程;
(2)如果该企业某年研发费用投入8百万元,预测该企业获得年利润为多少?
【解】(1)由题意可知,,
,
,
所以,
所以,
所以所求回归直线的方程为;
(2)在(1)中的方程中,令,得,
故如果该企业某年研发费用投入百万元,预测该企业获得年利润为百万元.
42.2024年巴黎奥运会,中国获得了男子米混合泳接力金牌.以下是历届奥运会男子米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列.
206.78
207.46
207.95
209.34
209.35
210.68
213.73
214.84
216.93
216.93
(1)求这组数据的极差与中位数;
(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;
(3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2006,预测2028年冠军队的成绩(精确到0.01秒).
【解】(1)由题意,数据的最大值为,最小值为,
则极差为;
数据中间两数为与,
则中位数为.
故极差为,中位数为;
(2)由题意,数据共个,以上数据共有个,
故设事件“恰有个数据在以上”,
则,
故恰有个数据在以上的概率为;
(3)由题意,成绩的平均数
,
由直线过,
则,
故回归直线方程为.
当时,.
故预测年冠军队的成绩为秒.
43.某科研活动共进行了5次试验,其数据如表所示:
特征量
第1次
第2次
第3次
第4次
第5次
(1)求成对数据的相关系数;
(2)求特征量关于的回归方程,并据此估算特征量时的值;
(3)设特征量作为随机变量服从正态分布,其中为5次试验中的平均数,为5次试验中的方差.求.(本题所有答数精确到0.01.)
【解】(1)由条件可知,,,
,
,
,
所以;
(2),
,
所以,
当时,;
(3),所以,,
,,
所以.
44.某地区2019年至2023年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2019
2020
2021
2022
2023
年份代号x
1
2
3
4
5
人均纯收入
2.3
3.3
4.1
4.4
4.9
(1)由表可知与具有线性相关关系,求关于的线性回归方程;
(2)利用(1)中的回归方程,预测该地区2025年农村居民家庭人均纯收入;
(3)用(1)中所求线性回归方程得到与对应的人均纯收入预测值,当数据对应残差的绝对值时,将该数据称作一个“好数据”,经过计算统计得到这5个数据中“好数据”有2个,不是“好数据”的有3个,现从5个数据中任选3个,求恰好有两个“好数据”的概率.
【解】(1)根据已知数据以及参考数据可得:,
;
又,
故,
,
故所求线性回归方程为:.
(2)根据(1)所求可得:,令,解得,
故预测该地区2025年农村居民家庭人均纯收入为千元.
(3)根据题意,结合所求线性回归方程可得如下表格:
年份
2019
2020
2021
2022
2023
年份代号x
1
2
3
4
5
人均纯收入
2.3
3.3
4.1
4.4
4.9
2.54
3.17
3.8
4.43
5.06
0.24
0.13
0.3
0.03
0.16
根据“好数据”定义,故组数据中,“好数据”有2组,不是“好数据”的有3组,
从5个数据中任选3个,恰好有两个“好数据”是事件,则.
45.某电商分析了近8年“双十一”期间的宣传费用(单位:万元)和利润(单位:万元)之间的关系,得到下列数据:
2
3
4
5
6
8
9
11
1
2
3
3
4
5
6
8
请回答:
(1)由表中数据,求线性回归方程,并预测当时,对应的利润为多少(、、精确到0.1)
参考数据:,.
(2)为了更好地完成任务,某电商决定让宣传部门的3名成员各自制订两个方案,从中任选2个方案进行宣传,求这2个方案出自同一个人的概率.
【解】(1)因为,,,,
所以
因为,
所以回归直线方程为,
当时,,
即利润约为9.6万元;
(2)记3名成员的方案分别、;、;、.
从中任选2个方案的基本事件含有:、、、、,
、、、、、、、、
、共15种.
其中这2个方案出自同一个人的基本事件含有、、,共3种.
所以.
46.2020年1月15日,教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.
(1)为了更好地服务于高三学生,某研究机构对随机抽取的5名高三学生的记忆力和判断力进行统计分析,得到下表数据:
6
8
9
10
12
2
3
4
5
6
请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合,并求关于的线性回归方程(精确到0.01);
(2)现有甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为,该考生报考乙大学,每门笔试科目通过的概率依次为、、,其中,根据规定每名考生只能报考强基计划的一所试点高校,若以笔试过程中通过科目数的期望为依据作出决策,求该考生更希望通过乙大学笔试时的取值范围.
【解】(1)根据表格中的数据,可得
,,
,
,
,
可得相关系数,
故与之间的关系可用线性回归模型进行拟合,
又由,
可得.
综上回归直线方程.
(2)通过甲大学的考试科目数,则,
设通过乙大学的考试科目数为,则可能的取值为0、1、2、3,
则,
,
,
,
所以,
因为该考生更希望通过乙大学的笔试考试,
所以,即,
又由,解得,
即为该考生更希望通过乙大学的笔试时的范围为.
1 / 10
学科网(北京)股份有限公司
$