内容正文:
8.2.2 一元线性回归模型参数的最小二乘估计
(第1课时)
题型一:最小二乘法的概念及辨析
1.两个变量X和Y的线性回归方程为,样本相关系数为r,则( )
A.与r同号 B.与r同号 C.与r异号 D.与r异号
2.(多选)设是变量和的个样本点,直线是由这些样本点通过最小二乘法得到的线性回归直线,以下结论正确的是( )
A.直线过点
B.直线的斜率即为和的相关系数
C.和的相关系数在到1之间
D.当为偶数时,分布在两侧的样本点的个数相等
3.下列命题是真命题的是( )
A.经验回归方程至少经过其样本数据点,,…,中的一个
B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强
C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
D.残差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好
4.用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
5.(多选)设某大学的女生体重Y(单位:kg)与身高X(单位:cm)具有线性相关关系.根据一组样本数据,用最小二乘法建立的线性回归方程为,则下列结论中正确的是( )
A.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
B.回归直线过点
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.两变量Y与X正相关
6.(多选)某学校数学学习兴趣小组利用信息技术手段探究两个数值变量x,y之间的线性关系,随机抽取8个样本点,,……,,由于操作过程的疏忽,在用最小二乘法求经验回归方程时只输入了前6组数据,得到的线性回归方程为,其样本中心为.后来检查发现后,输入8组数据得到的新的经验回归方程为,新的样本中心为,已知,,则( )
A.新的样本中心仍为
B.新的样本中心为
C.两个数值变量x,y具有正相关关系
D.
7.(多选)中国茶文化博大精深,茶水的口感与茶叶类型和水的温度有关.为了建立茶水温度随时间变化的回归模型,小明每隔1分钟测量一次茶水温度,得到若干组数据,,…,(其中,),绘制了如图所示的散点图.小明选择了如下2个回归模型来拟合茶水温度随时间的变化情况,回归模型一:;回归模型二:,下列说法正确的是( ).
A.茶水温度与时间这两个变量负相关
B.由于水温开始降得快,后面降得慢,最后趋于平缓,因此模型二能更好的拟合茶水温度随时间的变化情况
C.若选择回归模型二,利用最小二乘法求得到的图象一定经过点
D.当时,通过回归模型二计算得,用温度计测得实际茶水温度为65.2,则残差为
8.(多选)下列说法正确的序号是( )
A.在回归直线方程中,当解释变量x每增加一个单位时,响应变量平均平均增加0.8个单位;
B.利用最小二乘法求回归直线方程,就是使得最小的原理;
C.已知X,Y是两个分类变量,若它们的随机变量的观测值越大,则“X与Y有关系”的把握程度越小;
D.在一组样本数据…,(…,不全相等)的散点图中,若所有样本(…)都在直线上,则这组样本数据的线性相关系数为.
题型二:求回归直线方程
1.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,统计出小李某月1号到5号每天打篮球时间(单位:h)与当天投篮命中率的成对数据满足的关系式:,,.若与满足线性回归方程,则回归系数( )(参考公式:)
A.0.04 B.0.03 C.0.02 D.0.01
2.观测两相关变量得如下数据:则两变量间的回归直线方程为( ).
X
Y
A. B.
C. D.
3.某班10名学生的摸底考试成绩和期末考试成绩如下:
摸底成绩
50
35
40
55
80
60
65
35
90
50
期末成绩
53
51
56
68
87
71
46
31
79
68
计算得:,.
(1)画出散点图;
(2)建立一个回归直线方程,用摸底考试成绩来预测期末考试成绩(精确到0.1).
附:,.
4.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的线性回归方程为________.
5.已知某生产商5个月的设备销售数据如下表所示:
时间代码
1
2
3
4
5
销售台数(单位:百台)
5
7
8
14
16.5
生产商发现时间代码和销售台数有很强的相关性,决定用回归方程进行模拟,则的值是( )
参考数据、公式:;;若,则
A.3.2 B.3.1 C.3 D.2.9
题型一:回归直线方程的应用
1.春节将至,某商家统计了去年某商品的日营销费用x(单位:百元)与日销售量y(单位:百件),为今年的营销方案制定提供相关的数据参考,得到的数据如下表:
日营销费用x/百元
2
3
4
5
6
日销售量y/百件
1
1.1
1.5
1.8
2.1
已知y与x线性相关.
(1)根据上表数据,求y关于x的经验回归方程;
(2)请利用(1)中的经验回归方程,试估计当今的日销售费用为1000元时,日销售量为多少百件.
参考公式:对于一组具有线性相关关系的数据().其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
2.当前,冷冻冷藏类技术发展迅速且应用广泛.某制冷技术重点实验室研究了不同果蔬在不同冻结速率下的冰点温度,以及低温环境对果蔬热物性的影响.设冻结速率为x(单位:分钟),冰点温度为y(单位:℃),如表为某种水果冰点温度随冻结速率变化的统计数据:
x
10
20
30
40
50
y
-5
-4.5
-2
1
2
根据以上数据,绘制了散点图:
(1)由散点图可以看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;
(2)求y关于x的线性回归方程,并预测当冻结速率为60分钟时,这种水果的冰点温度.
3.《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:
单价(元/件)
8
8.2
8.4
8.6
8.8
9
销量(万件)
90
84
83
80
75
68
(1)根据以上数据,求关于的线性回归方程;
(2)若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润,最大利润是多少.
附:参考公式:回归方程,
其中,.
参考数据:,.
4.学习了《高中数学必修》的内容后,高二年级某学生认为:考试成绩与考试次数存在相关关系.于是他收集了自己进入高二以后的前5次考试成绩,列表如下:
第次考试
考试成绩
经过进一步研究,他发现:考试成绩与考试的次数具有线性相关关系.
(1)求关于的线性回归方程;
(2)判断变量与之间是正相关还是负相关(只写出结论即可);
(3)按计划,高二年级两学期共有次考试,请你预测该同学高二最后一次考试的成绩(四舍五入,结果保留整数).
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
,
5.“大众创业,万众创新”是李克强总理在本届政府工作报告中向全国人民发出的口号.某生产企业积极响应号召,大力研发新产品,为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据,如表所示:
试销单价(元)
4
5
6
7
8
9
产品销量(件)
84
83
80
75
68
已知.
(1)求出的值;
(2)已知变量,具有线性相关关系,求产品销量(件)关于试销单价(元)的线性回归方程.
参考数据:,;
参考公式:线性回归方程中,的最小二乘估计分别为,.
6.某动漫影视制作公司长期坚持文化自信,不断挖掘中华优秀传统文化中的动漫题材,创作出一批又一批的优秀动漫影视作品,获得市场和广大观众的一致好评,同时也为公司赢得丰厚的利润.该公司2014年至2020年的年销售额y关于年份代号x的统计数据如下表(已知该公司的年销售额与年份代号线性相关).
年份
2014
2015
2016
2017
2018
2019
2020
年份代号x
1
2
3
4
5
6
7
年销售额y(单位:亿元)
29
33
36
44
48
52
59
(1)求y关于x的线性回归方程;
(2)根据(1)中的线性回归方程,预测2022年该公司的年销售额.
附:样本数据的线性回归方程的斜率和截距的最小二乘法估计分别为,.
参考数据:,,.
1.茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,已知变量和满足经验回归方程,且变量和一组相关数据统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
17
则下列说法错误的是( )
A.
B.变量和呈正相关
C.该经验回归方程必过点
D.若某户家庭人口数为8时,预测该户茶产业的年收入为万元
2.(多选)已知变量的5对样本数据为,用最小二乘法得到经验回归方程,过点的直线方程为,则( )
A.变量和之间具有正相关关系
B.
C.样本数据的残差为-0.3
D.
3.某种鱼苗育种基地,饲养员每隔两天观察并统计育种池内鱼苗的尾数,统计结果如下表:
第x天
2
4
6
8
10
鱼苗尾数y
72
140
212
284
340
(1)若y与x之间具有线性相关关系,求y关于x的线性回归方程;
(2)根据(1)中所求的线性回归方程,估计第20天时育种池内鱼苗的尾数(四舍五入精确到整数).
附:样本数据的线性回归方程的斜率和截距的最小二乘法估计分别为,.
参考数据:,,.
4.某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:
身高x(单位:)
167
173
175
177
178
180
181
体重y(单位:)
90
54
59
64
67
72
76
由表格制作成如图所示的散点图:
由最小二乘法计算得到经验回归直线的方程为,其相关系数为;经过残差分析,点对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线的方程为,相关系数为.则下列选项正确的是( )
A. B.
C. D.
5.近些年来,促进新能源汽车产业发展政策频出,新能源市场得到很大发展,销量及渗透率远超预期,新能源几乎成了各个汽车领域的热点.某车企通过市场调研并进行粗略模拟,得到研发投入(亿元)与经济收益(亿元)的数据,统计如下:
研发投入/亿元
1
2
3
4
5
经济收益/亿元
2.5
4
6.5
9
10.5
(1)依据表中统计数据,计算样本相关系数(结果保留3位小数),并判断研发投入与经济收益之间是否有较强的线性相关性;(若,则线性相关程度一般,若,则线性相关程度较强)
(2)求出关于的线性回归方程,并预测研发投入10亿元时的经济收益.
参考数据:.
附:相关系数,线性回归方程的斜率,截距.
6.随着移动互联网技术的发展,直播带货已经成为一种热门的销售方式,某电商直播带货后从7月份到11月份每个月线上的销售量(万件)()的数据如下所示:
月份
7
8
9
10
11
月份代码x
1
2
3
4
5
销售量y
2.2
2.5
2.7
3.1
3.5
(1)从这5个月中随机选取3个月,记月销售量不少于3万件的月份的个数为X,求随机变量X的分布列及期望;
(2)利用最小二乘法求y关于x的经验回归方程,并预测当年12月份的月销售量.
附:经验回归方程=x+中斜率和截距的最小二乘估计公式分别为=,=-
1 / 10
学科网(北京)股份有限公司
$
8.2.2 一元线性回归模型参数的最小二乘估计
(第1课时)
题型一:最小二乘法的概念及辨析
1.两个变量X和Y的线性回归方程为,样本相关系数为r,则( )
A.与r同号 B.与r同号 C.与r异号 D.与r异号
【答案】B
【详解】由线性相关关系可知,若,等价于两个变量正相关,等价于;
若,等价于两个变量负相关,等价于,
所以与同号,故B项正确,D项错误;
与的符号没有关系,故A,C项错误.
2.(多选)设是变量和的个样本点,直线是由这些样本点通过最小二乘法得到的线性回归直线,以下结论正确的是( )
A.直线过点
B.直线的斜率即为和的相关系数
C.和的相关系数在到1之间
D.当为偶数时,分布在两侧的样本点的个数相等
【答案】AC
【分析】根据回归直线方程、相关系数的的概念及特点、回归直线与样本点的关系判断各选项即可.
【详解】回归直线一定过这组数据的样本中心点,故A项正确;
两个变量的相关系数不是回归直线的斜率,两者公式不同,故B项不正确;
两个变量的相关系数在到1之间,故C项正确;
所有样本点集中在回归直线附近,不一定两侧一样多,故D项不正确.
故选:AC.
3.下列命题是真命题的是( )
A.经验回归方程至少经过其样本数据点,,…,中的一个
B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强
C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
D.残差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好
【答案】D
【分析】根据经验回归方程、相关系数、决定系数、残差等知识确定正确答案.
【详解】对于A,经验回归方程是由最小二乘法计算出来的,它不一定经过其样本数据点,一定经过,所以A错误;
对于B,由相关系数的意义,当越接近1时,表示变量y与x之间的线性相关程度越强,所以B错误;
对于C,用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好,所以C是错误;
对于D,因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,
模型的拟合效果越好,故D正确.
故选:D.
4.用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
【答案】D
【分析】根据最小二乘法的概念和求解过程,即可求解.
【详解】根据最小二乘法的概念和求解,可得回归方程是为了使得每个数据与估计值之间的差的平方和最小.
故选:D.
5.(多选)设某大学的女生体重Y(单位:kg)与身高X(单位:cm)具有线性相关关系.根据一组样本数据,用最小二乘法建立的线性回归方程为,则下列结论中正确的是( )
A.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
B.回归直线过点
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.两变量Y与X正相关
【答案】BCD
【分析】根据线性回归方程的含义可判断A,B,C;根据回归方程的系数可判断两变量Y与X正相关,判断D.
【详解】用所给的线性回归方程对总体进行估计不能得到肯定的结论,
故该大学某女生身高为170cm,则可说其体重大约为58.79 kg,故A不正确;
由最小二乘法的计算公式可知,回归直线过样本中心点,B正确;
依据线性回归方程中的含义可知,X每变化1个单位,Y相应变化约为0.85个单位,C正确;
回归方程中X的系数为0.85,,因此Y与X正相关,D正确.
故选:BCD
6.(多选)某学校数学学习兴趣小组利用信息技术手段探究两个数值变量x,y之间的线性关系,随机抽取8个样本点,,……,,由于操作过程的疏忽,在用最小二乘法求经验回归方程时只输入了前6组数据,得到的线性回归方程为,其样本中心为.后来检查发现后,输入8组数据得到的新的经验回归方程为,新的样本中心为,已知,,则( )
A.新的样本中心仍为
B.新的样本中心为
C.两个数值变量x,y具有正相关关系
D.
【答案】BC
【分析】对于A、B:根据题意结合平均数公式运算求解;对于C:根据线性回归方程经过样本中心点求得,分析判断即可;对于D:根据最小二乘法分析判断.
【详解】对于选项A,B:因为前6组数据的样本中心为,且,,
可得 ,,
所以新的样本中心为,故A错误,B正确;
对于选项C:因为8组数据的样本中心为,经验回归方程为,
则,解得,
所以两个数值变量为正相关关系,故C正确;
对于选项D:根据样本估计总体及最小二乘法原理,利用8组数据所得的经验回归方程是与所有样本点“距离”平方和最小的直线方程,
即,故D错误.
故选:BC.
7.(多选)中国茶文化博大精深,茶水的口感与茶叶类型和水的温度有关.为了建立茶水温度随时间变化的回归模型,小明每隔1分钟测量一次茶水温度,得到若干组数据,,…,(其中,),绘制了如图所示的散点图.小明选择了如下2个回归模型来拟合茶水温度随时间的变化情况,回归模型一:;回归模型二:,下列说法正确的是( ).
A.茶水温度与时间这两个变量负相关
B.由于水温开始降得快,后面降得慢,最后趋于平缓,因此模型二能更好的拟合茶水温度随时间的变化情况
C.若选择回归模型二,利用最小二乘法求得到的图象一定经过点
D.当时,通过回归模型二计算得,用温度计测得实际茶水温度为65.2,则残差为
【答案】AB
【分析】由正负相关的定义即可判定A;由图象中变量的变化趋势即可判定B;由最小二乘法及非线性回归模型的拟合方法判断C;由残差的定义即可判定D.
【详解】由散点图可知随时间增加,温度逐渐降低,且变化趋势趋于平缓,故为负相关且模型二拟合更好,即A、B正确;
根据非线性回归模型的拟合方法,先令,则,此时拟合为线性回归方程,
对应的回归直线过点,原曲线不一定经过,故C错误;
残差为真实值减估计值,即为65.2-65.1=0.1,故D错误.
故选:AB.
8.(多选)下列说法正确的序号是( )
A.在回归直线方程中,当解释变量x每增加一个单位时,响应变量平均平均增加0.8个单位;
B.利用最小二乘法求回归直线方程,就是使得最小的原理;
C.已知X,Y是两个分类变量,若它们的随机变量的观测值越大,则“X与Y有关系”的把握程度越小;
D.在一组样本数据…,(…,不全相等)的散点图中,若所有样本(…)都在直线上,则这组样本数据的线性相关系数为.
【答案】AB
【分析】根据回归方程的定义和性质知AB正确,随机变量的观测值越小,则“ 与 有关系”的把握程度越小,C错误,样本相关系与回归直线斜率无关,D错误,得到答案.
【详解】对于选项A:在回归直线方程中,当解释变量每增加一个单位时,响应变量平均增加0.8个单位,正确;
对于选项B:用随机误差的平方和,即,并使之达到最小,这样回归直线就是所有直线中取最小值的那一条,
由于平方又叫二乘,所以这种使 “随机误差的平方和为最小”的方法叫做最小二乘法,
所以利用最小二乘法求回归直线方程,就是使得 最小的原理,正确;
对于选项C:对分类变量与,对它们的随机变量的观测值越小,则“ 与 有关系”的把握程度越小,错误;
对于选项D:样本相关系数反映的是两变量之间线性相关程度的强弱,与回归直线斜率无关,题中样本数据的线性相关系数为,错误.
故选:.
题型二:求回归直线方程
1.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,统计出小李某月1号到5号每天打篮球时间(单位:h)与当天投篮命中率的成对数据满足的关系式:,,.若与满足线性回归方程,则回归系数( )(参考公式:)
A.0.04 B.0.03 C.0.02 D.0.01
【答案】D
【分析】根据回归系数公式,代入数据求出结果即可.
【详解】已知,则,,
则,
故选:D.
2.观测两相关变量得如下数据:则两变量间的回归直线方程为( ).
X
Y
A. B.
C. D.
【答案】B
【分析】利用回归直线方程过样本中心点即可求解.
【详解】由表中数据可得,,
所以样本中心点为,代入选项中检验B正确.
故选:B.
3.某班10名学生的摸底考试成绩和期末考试成绩如下:
摸底成绩
50
35
40
55
80
60
65
35
90
50
期末成绩
53
51
56
68
87
71
46
31
79
68
计算得:,.
(1)画出散点图;
(2)建立一个回归直线方程,用摸底考试成绩来预测期末考试成绩(精确到0.1).
附:,.
【答案】(1)散点图见解析
(2)
【分析】(1)根据表格中的对应数据作为点的横、纵坐标描点即得;
(2)由表格数据求出,将相关数据分别代入的计算公式计算即得.
【详解】(1)散点图如图所示.
(2)(2)由表格数据,,
,
则 .
,
故回归直线方程为.
4.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的线性回归方程为________.
【答案】
【分析】先求出和,再根据公式求出,再结合,求出,即可得出线性回归方程.
【详解】由已知可得,
,
,
,
所以,
所以.
故答案为:
5.已知某生产商5个月的设备销售数据如下表所示:
时间代码
1
2
3
4
5
销售台数(单位:百台)
5
7
8
14
16.5
生产商发现时间代码和销售台数有很强的相关性,决定用回归方程进行模拟,则的值是( )
参考数据、公式:;;若,则
A.3.2 B.3.1 C.3 D.2.9
【答案】C
【分析】计算出,代入公式,求出.
【详解】,,
故.
故选:C
题型一:回归直线方程的应用
1.春节将至,某商家统计了去年某商品的日营销费用x(单位:百元)与日销售量y(单位:百件),为今年的营销方案制定提供相关的数据参考,得到的数据如下表:
日营销费用x/百元
2
3
4
5
6
日销售量y/百件
1
1.1
1.5
1.8
2.1
已知y与x线性相关.
(1)根据上表数据,求y关于x的经验回归方程;
(2)请利用(1)中的经验回归方程,试估计当今的日销售费用为1000元时,日销售量为多少百件.
参考公式:对于一组具有线性相关关系的数据().其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)
(2)3.24百件
【分析】(1)求出的平均值,利用给定公式计算可求出y关于x的经验回归方程;
(2)将代入回归方程即可估算出结果.
【详解】(1),
,
则,
所以
故关于的经验回归方程为.
(2)将代入,得,
故当今年的日营销费用为1000元时,日销售量约为3.24百件.
2.当前,冷冻冷藏类技术发展迅速且应用广泛.某制冷技术重点实验室研究了不同果蔬在不同冻结速率下的冰点温度,以及低温环境对果蔬热物性的影响.设冻结速率为x(单位:分钟),冰点温度为y(单位:℃),如表为某种水果冰点温度随冻结速率变化的统计数据:
x
10
20
30
40
50
y
-5
-4.5
-2
1
2
根据以上数据,绘制了散点图:
(1)由散点图可以看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;
(2)求y关于x的线性回归方程,并预测当冻结速率为60分钟时,这种水果的冰点温度.
【答案】(1)答案见解析
(2), 4.15℃
【分析】(1)根据所给数据计算相关系数可得.
(2)求出回归方程中系数,得回归方程,代入回归方程可得估计值.
【详解】(1),
,因为,
故两个变量间线性相关性很强,可以用线性回归模型拟合y与x的关系;
(2)由表可知,,,
,,
故y关于x的线性回归方程为,
当时,,
故当冻结速率为60分钟时,这种水果的冰点温度为4.15℃.
3.《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:
单价(元/件)
8
8.2
8.4
8.6
8.8
9
销量(万件)
90
84
83
80
75
68
(1)根据以上数据,求关于的线性回归方程;
(2)若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润,最大利润是多少.
附:参考公式:回归方程,
其中,.
参考数据:,.
【答案】(1)
(2)该产品的单价定为元时,工厂获得利润最大,最大利润为万元.
【分析】(1)计算相关数据代入回归方程公式中计算即可;
(2)设工厂获得的利润为万元,写出关于单价的二次函数,求出最大利润即可.
【详解】(1)因为,
,
所以.
则,
因此回归直线方程为.
(2)设工厂获得的利润为万元,
则,
所以该产品的单价定为元时,工厂获得利润最大,最大利润为万元.
4.学习了《高中数学必修》的内容后,高二年级某学生认为:考试成绩与考试次数存在相关关系.于是他收集了自己进入高二以后的前5次考试成绩,列表如下:
第次考试
考试成绩
经过进一步研究,他发现:考试成绩与考试的次数具有线性相关关系.
(1)求关于的线性回归方程;
(2)判断变量与之间是正相关还是负相关(只写出结论即可);
(3)按计划,高二年级两学期共有次考试,请你预测该同学高二最后一次考试的成绩(四舍五入,结果保留整数).
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
,
【答案】(1)
(2)与之间是正相关
(3)分
【分析】(1)使用最小二乘法估计公式进行计算即可;
(2)由线性回归直线方程的斜率进行判断即可;
(3)由线性回归直线方程进行预测即可.
【详解】(1)根据已知可得,,
∴,
,
∴,,
∴关于的线性回归方程为.
(2)∵关于的线性回归方程为,,
∴变量与之间是正相关.
(3)由第(1)问所得关于的线性回归方程为,
当时,,
∴该同学高二最后一次考试的成绩大约为134分.
5.“大众创业,万众创新”是李克强总理在本届政府工作报告中向全国人民发出的口号.某生产企业积极响应号召,大力研发新产品,为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据,如表所示:
试销单价(元)
4
5
6
7
8
9
产品销量(件)
84
83
80
75
68
已知.
(1)求出的值;
(2)已知变量,具有线性相关关系,求产品销量(件)关于试销单价(元)的线性回归方程.
参考数据:,;
参考公式:线性回归方程中,的最小二乘估计分别为,.
【答案】(1)
(2)
【分析】(1)根据即可求解;
(2)根据参考公式求解即可.
【详解】(1)因为,
所以,
解得.
(2)因为
所以,,
所以所求的线性回归方程为.
6.某动漫影视制作公司长期坚持文化自信,不断挖掘中华优秀传统文化中的动漫题材,创作出一批又一批的优秀动漫影视作品,获得市场和广大观众的一致好评,同时也为公司赢得丰厚的利润.该公司2014年至2020年的年销售额y关于年份代号x的统计数据如下表(已知该公司的年销售额与年份代号线性相关).
年份
2014
2015
2016
2017
2018
2019
2020
年份代号x
1
2
3
4
5
6
7
年销售额y(单位:亿元)
29
33
36
44
48
52
59
(1)求y关于x的线性回归方程;
(2)根据(1)中的线性回归方程,预测2022年该公司的年销售额.
附:样本数据的线性回归方程的斜率和截距的最小二乘法估计分别为,.
参考数据:,,.
【答案】(1);
(2)68亿元.
【分析】(1)利用最小二乘法即得线性回归方程;
(2)把代入线性回归直线方程即得.
【详解】(1)∵,,
∴,
又∵,,
∴,
∴y关于x的线性回归方程为;
(2)2022年的年份代号为,
∴,
∴预测2022年该公司的年销售额为68亿元.
1.茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,已知变量和满足经验回归方程,且变量和一组相关数据统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
17
则下列说法错误的是( )
A.
B.变量和呈正相关
C.该经验回归方程必过点
D.若某户家庭人口数为8时,预测该户茶产业的年收入为万元
【答案】C
【分析】由已知表格中的数据,代入回归直线方程即可求解参数判断A,应用回归直线判断B,C,在回归方程中,将代入,求得值即可判断D.
【详解】由题知,.
代入,得出,
所以,A选项正确;
,变量和呈正相关,B选项正确;
由题知,,该经验回归方程必过点,C选项错误;
当时,,
故当某户家庭人口数为8时,预测该户茶产业的年收入为25.7万元,D选项正确;
故选:C
2.(多选)已知变量的5对样本数据为,用最小二乘法得到经验回归方程,过点的直线方程为,则( )
A.变量和之间具有正相关关系
B.
C.样本数据的残差为-0.3
D.
【答案】AD
【分析】根据方程,可知A项正确;求出,代入方程,即可得出.根据两点坐标得出直线方程即可得出;求出预测值,即可得出残差;根据最小二乘法的意义,即可得出D项.
【详解】对于A项,根据经验回归方程,可知变量和之间具有正相关关系,故A项正确;
对于B项,由已知可得,,,根据经验回归方程,可知,所以.
根据已知,可求出,则直线方程为,整理可得,所以,故B项错误;
对于C项,由B知,经验回归方程为,样本数据的预测值为,所以样本数据的残差为,故C项错误;
对于D项,根据最小二乘法的意义,可知,故D项正确.
故选:AD.
3.某种鱼苗育种基地,饲养员每隔两天观察并统计育种池内鱼苗的尾数,统计结果如下表:
第x天
2
4
6
8
10
鱼苗尾数y
72
140
212
284
340
(1)若y与x之间具有线性相关关系,求y关于x的线性回归方程;
(2)根据(1)中所求的线性回归方程,估计第20天时育种池内鱼苗的尾数(四舍五入精确到整数).
附:样本数据的线性回归方程的斜率和截距的最小二乘法估计分别为,.
参考数据:,,.
【答案】(1)
(2)686
【分析】(1)计算出、和代入即可.
(2)把代入已求出的方程可得答案.
【详解】(1) ,
.
.
则y关于x的线性回归方程为.
(2)当时,,
估计第20天时育种池内有鱼苗686尾.
4.某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:
身高x(单位:)
167
173
175
177
178
180
181
体重y(单位:)
90
54
59
64
67
72
76
由表格制作成如图所示的散点图:
由最小二乘法计算得到经验回归直线的方程为,其相关系数为;经过残差分析,点对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线的方程为,相关系数为.则下列选项正确的是( )
A. B.
C. D.
【答案】A
【分析】根据的特点判断斜率和截距;由于去掉,其它点的线性关系更强,从而可判断相关系数.
【详解】身高的平均数为,
因为离群点的横坐标167小于平均值176,纵坐标90相对过大,
所以去掉后经验回归直线的截距变小而斜率变大,故,
去掉后相关性更强,拟合效果也更好,且还是正相关,所以.
故选:A
5.近些年来,促进新能源汽车产业发展政策频出,新能源市场得到很大发展,销量及渗透率远超预期,新能源几乎成了各个汽车领域的热点.某车企通过市场调研并进行粗略模拟,得到研发投入(亿元)与经济收益(亿元)的数据,统计如下:
研发投入/亿元
1
2
3
4
5
经济收益/亿元
2.5
4
6.5
9
10.5
(1)依据表中统计数据,计算样本相关系数(结果保留3位小数),并判断研发投入与经济收益之间是否有较强的线性相关性;(若,则线性相关程度一般,若,则线性相关程度较强)
(2)求出关于的线性回归方程,并预测研发投入10亿元时的经济收益.
参考数据:.
附:相关系数,线性回归方程的斜率,截距.
【答案】(1),具有较强的线性相关程度
(2),预测研发投入10亿元时产品的经济收益为亿元
【详解】(1),
,
又因为,
所以,
所以具有较强的线性相关程度.
(2)因为,
则,所以关于的线性回归方程为,
将代入线性回归方程,得,
所以预测研发投入10亿元时产品的经济收益为亿元.
6.随着移动互联网技术的发展,直播带货已经成为一种热门的销售方式,某电商直播带货后从7月份到11月份每个月线上的销售量(万件)()的数据如下所示:
月份
7
8
9
10
11
月份代码x
1
2
3
4
5
销售量y
2.2
2.5
2.7
3.1
3.5
(1)从这5个月中随机选取3个月,记月销售量不少于3万件的月份的个数为X,求随机变量X的分布列及期望;
(2)利用最小二乘法求y关于x的经验回归方程,并预测当年12月份的月销售量.
附:经验回归方程=x+中斜率和截距的最小二乘估计公式分别为=,=-
【答案】(1)分布列见解析,
(2)3.76万件
【分析】(1)先判定分布列为超几何分布,确定2个满足条件、3个不满足的样本构成,再计算 的概率得到分布列,最终运用公式即可求得期望值;
(2)先计算样本均值、平方和等基础统计量,再通过最小二乘法计算回归系数 和截距 ,得到回归方程 ,最后结合实际情境代入自变量完成预测即可.
【详解】(1)因为月销售量不少于3万件的月份有2个,所以X的所有可能取值为0,1,2,
,
,
,
所以X的分布列为:
0
1
2
所以.
(2)因为,,
,
所以===,
=-=,
故y关于x的经验回归方程为,
又当年12月份对应的月份代码为6,所以,
所以预测当年12月份的月销售量为3.76万件.
1 / 10
学科网(北京)股份有限公司
$