内容正文:
8.2.2 一元线性回归模型参数的最小二乘估计
(第2课时)
题型一:残差的计算
1.为了研究物理成绩与数学成绩之间的关系,随机抽取名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A. B. C. D.
【答案】A
【详解】时的预测值,
时的真实为值,
样本点的残差为.
2.已知关于的经验回归方程为,则样本点的残差为( )
A.-2 B.-1 C.1 D.2
【答案】B
【分析】根据给定条件,求出预测值,进而求出残差.
【详解】当时,,所以样本点的残差为.
故选:B
3.若变量与之间存在线性相关关系,且根据最小二乘法得到的经验回归方程为,则样本点的残差为( )
A. B. C. D.2.5
【答案】A
【分析】根据回归直线方程,令,可得,进而求得样本点的残差,得到答案.
【详解】由回归方程为,令,可得,
所以样本点的残差为.
故选:A.
4.已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则_____.
【答案】
【分析】根据残差计算公式计算即可.
【详解】根据题意得,解得.
故答案为:
5.已知由样本数据组成一个样本,可得到回归直线方程为,且,则样本点的残差为( )
A.0.3 B.-0.3 C.1.3 D.-1.3
【答案】A
【分析】先将中心代入回归方程求出,将代入回归方程求得,结合残差的定义即可求解.
【详解】由题意知,将点代入,
得,所以,
将代入,解得,
所以样本点的残差为.
故选:A
6.下列关于残差图的描述错误的是( )
A.残差图的纵坐标只能是残差
B.残差图的横坐标可以是编号、解释变量和预报变量
C.残差点分布的带状区域的宽度越窄,残差平方和越小
D.残差点分布的带状区域的宽度越窄,决定系数越小
【答案】D
【分析】根据残差图的定义、图象和性质,逐一判断四个选项的正误即可得正确选项.
【详解】对于A:残差图的纵坐标只能是残差,故选项A正确;
对于B:根据残差图的定义和图象即可知:残差图的横坐标可以是编号、解释变量和预报变量,故选项B正确;
对于C和D:用残差图判断模型的拟合效果,残差点比较均匀地分布在水平的带状区域中,残差点分布的带状区域的宽度越窄,说明残差平方和越小,说明模型的拟合精度越高,则对应决定系数越大,故选项C正确,选项D错误.
所以关于残差图的描述错误的是选项D,
故选:D.
7.两个线性相关变量x与y的统计数据如表:
x
9
9.5
10
10.5
11
y
11
10
8
6
5
其回归直线方程是,则相对应于点的残差为( )
A.0.1 B.0.2 C.﹣0.1 D.﹣0.2
【答案】B
【分析】先求出,再计算残差可得正确的选项.
【详解】,,
所以,所以,故.
当时,,故,
故选:B.
题型二:决定系数的计算及分析
1.已知一系列样本点满足,,由最小二乘法得到与的回归方程,现用决定系数来判断拟合效果(越接近1,拟合效果越好),若,则______________.(参考公式:决定系数)
【答案】0.96
【分析】依据决定系数的公式计算即可.
【详解】因为.
故答案为:.
2.已知成对样本数据,,…,中,,…,不全相等,且所有样本点都在直线上,则这组成对样本数据的样本相关系数r=______,其决定系数=______.
【答案】 1
【分析】由所有样本点都在一条直线上,结合相关系数的意义,可得出答案.
【详解】由所有样本点都在直线上,
又,
由题易知,.
故答案为:
3.两个具有线性相关关系的变量的一组数据为,,,,则下列说法正确的是( )
A.若相关系数,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数越大,残差平方和越小,模型的拟合效果越好
D.决定系数越小,残差平方和越小,模型的拟合效果越好
【答案】AC
【分析】根据相关系数的概念可判定AB,根据决定系数的概念可判定CD.
【详解】对于A:因为r的符号反映相关关系的正负性,故A正确;
对于B:根据相关系数越接近1,变量相关性越强,故B错误;
对于C:决定系数越大,残差平方和越小,效果越好,故C正确,D错误.
故选:AC.
4.对两个变量和进行回归分析,得到一组样本数据,下列统计量的数值能够刻画其经验回归方程的拟合效果的是( )
A.平均数 B.相关系数 C.决定系数 D.方差
【答案】C
【分析】根据相关数据的特征可知,决定系数能够刻画其经验回归方程的拟合效果.
【详解】平均数与方差是用来反馈数据集中趋势与波动程度大小的统计量;
变量y和x之间的相关系数的绝对值越大,则变量y和x之间线性相关关系越强;
用决定系数来刻画回归效果,越大说明拟合效果越好.
故选:C
5.某试验小组收集了部分父亲和儿子的身高数据,通过测量与回归方程计算得到如下五组儿子身高的观测值与估计值,则该组统计数据的决定系数______.
儿子身高观测值/
161.3
167.7
170.0
173.5
177.5
儿子身高估计值/
161.3
167.7
170.0
173.5
177.5
【答案】1
【分析】根据决定系数的意义及表格中的数据即可求解.
【详解】因为决定系数,其值越接近1,说明模型拟合效果越好,误差越小,从表中数据可知没有误差,所以.
6.两个变量与的回归模型中,分别选择了4个不同的模型,其中拟合效果最好的模型是( )
A.模型1的决定系数 B.模型2的决定系数
C.模型3的决定系数 D.模型4的决定系数
【答案】D
【分析】根据决定系数的意义即可解答.
【详解】决定系数越大(接近1),模型的拟合效果越好;决定系数越小,模型的拟合效果越差.模型4的决定系数最大、最接近1,其拟合效果最好.
故选:D.
7.在研究体重与身高的相关关系中,计算得到相关指数,则( )
A.是解释变量 B.只有的样本符合得到的相关关系
C.体重解释了的身高 D.身高解释了的体重
【答案】D
【分析】由相关指数的含义进行判断.
【详解】是因变量或响应变量,是自变量或解释变量,所以A错误.
表示解释变量对响应变量变化的贡献率,表示身高解释了的体重,所以D正确,B、C错误.
故选:D
8.变量x与y的成对样本数据的散点图如图所示,若用拟合成对数据,其决定系数记为;若用拟合成对数据,其决定系数记为.则与大小关系为______.(由大到小)
【答案】
【分析】根据散点图的变化趋势确定正确答案.
【详解】根据散点图可知,这两个变量曲线相关,
所以用进行拟合,比用进行拟合更好,
故.
故答案为:
题型一:求非线性回归方程
1.某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
【答案】D
【分析】根据散点图的变化规律,寻求合适的特征函数.
【详解】由图可知,随着温度的增加,发芽率的增长速度越来越慢,符合对数型函数的特征.
故选:D.
2.(多选题)某个国家某种病毒传播的中期,感染人数和时间(单位:天)在天里的散点图如图所示,下面四个回归方程类型中有可能适宜作为感染人数和时间的回归方程类型的是( )
A. B. C. D.
【答案】BD
【分析】由题意结合所给图象的变化趋势,结合选项,逐一分析判断即可求解.
【详解】根据图象可知,函数图象随着自变量的变大,函数值增长速度越来越快,
结合选项,可判定为指数函数或的特征,
故选:BD.
3.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则c,k的值分别是( )
A. 0.6 B. 0.3 C. 0.2 D. 0.6
【答案】C
【分析】根据对数运算性质,将模型的式子化简,结合所给线性方程式子,由对应系数相等即可求得的值.
【详解】因为
等式两边同时取对数可得
设
则上式可化为
因为
则
所以
故选:C
4.为研究某种图书每册的成本费元与印刷数册的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.
表中,.
(1)根据散点图判断:与哪一个更适宜作为每册成本费元与印刷数册的回归方程类型?只要求给出判断,不必说明理由
(2)根据(1)的判断结果及表中数据,建立关于的回归方程;
(3)若每册书定价为元,则至少应该印刷多少册才能使销售利润不低于元?假设能够全部售出
(附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,)
【答案】(1)
(2).
(3)册
【分析】(1)因为散点图呈现的是非线性趋势,所以选择更合适;
(2)令,将转化为线性回归方程,利用最小二乘估计公式计算和,进而得到关于的回归方程;
(3)根据利润公式,结合回归方程列出不等式,求解不等式得到印刷数的取值范围,确定至少印刷的册数.
【详解】(1)由散点图的分布是非线性的,故适宜作为每册成本费与印刷册数的回归方程;
(2)令,先建立关于的线性回归方程,
由于,
,
关于的线性回归方程为,
从而关于的回归方程为;
(3)假设印刷册,依题意,,
,
至少印刷册.
5.为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量(单位:亿元)与研发人员增量(人)的10组数据.现用模型①,②分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图.
根据收集到的数据,计算得到下表数据,其中.
7.5
2.25
82.50
4.50
12.14
2.88
(1)根据残差图,判断应选择哪个模型;(无需说明理由)
(2)根据(1)中所选模型,求出关于的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少多少人?(精确到1)
【答案】(1)选择模型②
(2);10人
【分析】(1)根据残差图即可求解;
(2)根据最小二乘法求解线性回归方程,即可换元得非线性回归方程,代入即可求解预测值.
【详解】(1)选择模型②,理由如下:
由于模型②残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄,
所以模型②的拟合精度更高,回归方程的预报精度相应就会越高,所以选模型②比较合适;
(2)根据模型②,令与可用线性回归来拟合,有,
则,
所以,
则关于的经验回归方程为.
所以关于的经验回归方程为,
由题意,,解得,又为整数,所以,
所以,要使年收益增量超过8亿元,研发人员增量至少为10人.
6.为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1-10分别对应年份2013-2022.
根据散点图,分别用模型①,②作为年研发投入关于年份代码的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
75
2.25
82.5
4.5
120
28.35
表中.
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入关于年份代码的经验回归方程模型?并说明理由;
(2)根据(1)中所选模型,求出关于的经验回归方程,并预测该公司2028年的高科技研发投入.
附:对于一组数据,其经验回归直线的斜率和截距的最小二乘估计分别为.
【答案】(1)选择模型②,理由见解析
(2),预测该公司2028年的高科技研发投入亿元.
【分析】(1)根据残差图判断;
(2)利用最小二乘法求非线性回归方程即可求解.
【详解】(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差;模型②的残差波动性很小,基本分布在0的附近,说明拟合关系很好,所以选择模型②更适宜.
(2)设,所以,
所以,,
所以关于的经验回归方程为,
令,则,
即预测该公司2028年的高科技研发投入亿元.
1.已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则( )
A. B.6 C. D.8
【答案】C
【分析】观测值减去预测值称为残差;进而利用残差的定义即可求解.
【详解】样本点的观测值为,预测值为,
则残差为,解得.
故选:C.
2.(多选)对两组线性相关成对数据进行回归分析,得到不同的统计结果,第-组成对数据的样本相关系数、残差平方和、决定系数分别为,,,第二组成对数据的样本相关系数、残差平方和、决定系数分别为,,,则( )
A.若,则第一组成对数据的线性相关关系比第二组的强
B.若,则第一组成对数据的线性相关关系比第二组的强
C.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
D.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
【答案】BC
【分析】根据题意 ,由相关系数、残差平方和、决定系数的意义,依次分析选项,即可求解.
【详解】根据题意,依次分析选项:
对于A中,由,则第一组成对数据的线性相关关系比第二组的强,所以A错误;
对于B中,若,可得,则第一组成对数据的线性相关关系比第二组的强,所以B正确;
对于C中,若,则第二组成对数据的经验回归模型拟合效果比第一组的好,所以C正确;
对于D中,若,则第一组成对数据的经验回归模型拟合效果比第二组的好,
所以D错误.
故选:BC.
3.下列关于两个变量回归分析的说法正确的是( )
A.如果在散点图中所有的样本点都落在一条斜率为非0实数的直线上,那么
B.回归方程得到的预报值就是预报变量的精确值
C.残差平方和越大,模型的拟合效果越好
D.在残差图中,若残差点比较均匀的落在水平带状区域中,说明选用的模型比较合适
【答案】D
【分析】根据回归方程、残差、残差平方和与相关指数的定义以及散点图的关系来解答即可.
【详解】对于A,由于散点图中所有的样本点都落在一条斜率为非0实数的直线上,于是变量与预报变量是线性函数关系,所以,故A错;
对于B,在回归分析中,在利用样本数据得到回归方程的过程中,不可避免的会产生各种误差,因此用回归方程得到的预报值只能是实际值的近似值,故B错;
对于C,越大,表示残差平方和越小,即模型的拟合效果越好;越小,表示残差平方和越大,即模型的拟合效果越差,故C错;
对于D,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,线性回归方程的预报精度越高.故D正确.
故选:D.
4.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润z(单位:万元)的影响.对近8年的年宣传费和年销售量数据进行初步处理后,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①;②;③;④;⑤,则较适宜作为年销售量y关于年宣传费x的回归方程的是( )
A.①② B.②③ C.②④ D.③⑤
【答案】B
【分析】先根据散点图确定函数图象的趋势,再结合5个函数图象,进行判断选择.
【详解】从散点图知,样本点分布在抛物线上或对数型曲线上,结合所给5个的曲线类型,所以或较适宜.
故选:B
5.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如下:
年份
2014
2015
2016
2017
2018
2019
2020
广告费支出x
1
2
4
6
11
13
19
销售量y
1.9
3.2
4.0
4.4
5.2
5.3
5.4
(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程;
(2)若用模型拟合y与x的关系,可得回归方程,经计算线性回归模型和该模型的分别约为0.75和0.88,请用说明选择哪个回归模型更好.
附:
【答案】(1)
(2)更好
【分析】(1)根据线性回归方程相关基本量直接计算即可;
(2)根据反映的残差平方和与拟合效果关系进行判断.
【详解】(1)由题意得,,
,
,
,
所以,
所以,
所以y关于x的线性回归方程为
(2)因为,且越大,反映残差平方和越小,模型的拟合效果越好,
所以选用更好.
6.一所中学组织学生对某线下某实体店2022年部分月份的月利润情况进行调查统计,得到的数据如下:
月份
2
4
6
8
10
12
净利润(万元)
0.9
2.0
4.2
3.9
5.2
5.1
0.7
1.4
1.8
2.1
2.3
2.5
1.4
2.0
2.4
2.8
3.2
3.5
根据散点图,准备用①或②建立关于的回归方程.
(1)用线性相关系数说明上面的两种模型哪种适宜作为关于的回归方程?
(2)由参考数据,根据(1)的判断结果,求关于的回归方程(精确到0.1).
附:对于一组数据(,2,3,⋯,n),其回归直线的斜率和截距的最小二乘估计分别为,.相关系数.
参考数据:,,,,,
,,,
,.
【答案】(1)模型①
(2)
【分析】(1)计算相关系数比较大小即可确定更适宜的模型;
(2)利用最小二乘法相关公式即可求解.
【详解】(1)由题意的线性相关系数的相关系数
.
的相关系数.
所以,因此模型①拟合效果更好.
(2)根据(1)的判断结果,
计算与由参考数据,
所以.
于是关于的回归方程①为.
7.某电商平台统计了近七年小家电的年度广告费支出(万元)与年度销售量(万台)的数据,如表所示:
年份
2016
2017
2018
2019
2020
2021
2022
广告费支出
1
2
4
6
11
13
19
销售量
1.9
3.2
4.0
4.4
5.2
5.3
5.4
其中,
(1)若用线性回归模型拟合与的关系,求出关于的线性回归方程;
(2)若用模型拟合得到的回归方程为,经计算线性回归模型及该模型的分别为0.75和0.88,请根据的数值选择更好的回归模型拟合与的关系,进而计算出年度广告费为何值时,利润的预报值最大?
参考公式:,;
【答案】(1)
(2)选用回归方程更好,时,利润的预报值最大
【分析】(1)根据数据,利用公式即可求出线性回归方程;
(2)越大拟合效果越好,选用回归方程更好,从而计算出结果.
【详解】(1)由题意可得:
所以,
,
关于的线性回归方程:.
(2)因为,越大拟合效果越好,
选用回归方程更好,
,
即当时,时,利润的预报值.
1 / 10
学科网(北京)股份有限公司
$
8.2.2 一元线性回归模型参数的最小二乘估计
(第2课时)
题型一:残差的计算
1.为了研究物理成绩与数学成绩之间的关系,随机抽取名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A. B. C. D.
2.已知关于的经验回归方程为,则样本点的残差为( )
A.-2 B.-1 C.1 D.2
3.若变量与之间存在线性相关关系,且根据最小二乘法得到的经验回归方程为,则样本点的残差为( )
A. B. C. D.2.5
4.已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则_____.
5.已知由样本数据组成一个样本,可得到回归直线方程为,且,则样本点的残差为( )
A.0.3 B.-0.3 C.1.3 D.-1.3
6.下列关于残差图的描述错误的是( )
A.残差图的纵坐标只能是残差
B.残差图的横坐标可以是编号、解释变量和预报变量
C.残差点分布的带状区域的宽度越窄,残差平方和越小
D.残差点分布的带状区域的宽度越窄,决定系数越小
7.两个线性相关变量x与y的统计数据如表:
x
9
9.5
10
10.5
11
y
11
10
8
6
5
其回归直线方程是,则相对应于点的残差为( )
A.0.1 B.0.2 C.﹣0.1 D.﹣0.2
题型二:决定系数的计算及分析
1.已知一系列样本点满足,,由最小二乘法得到与的回归方程,现用决定系数来判断拟合效果(越接近1,拟合效果越好),若,则______________.(参考公式:决定系数)
2.已知成对样本数据,,…,中,,…,不全相等,且所有样本点都在直线上,则这组成对样本数据的样本相关系数r=______,其决定系数=______.
3.(多选)两个具有线性相关关系的变量的一组数据为,,,,则下列说法正确的是( )
A.若相关系数,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数越大,残差平方和越小,模型的拟合效果越好
D.决定系数越小,残差平方和越小,模型的拟合效果越好
4.对两个变量和进行回归分析,得到一组样本数据,下列统计量的数值能够刻画其经验回归方程的拟合效果的是( )
A.平均数 B.相关系数 C.决定系数 D.方差
5.某试验小组收集了部分父亲和儿子的身高数据,通过测量与回归方程计算得到如下五组儿子身高的观测值与估计值,则该组统计数据的决定系数______.
儿子身高观测值/
161.3
167.7
170.0
173.5
177.5
儿子身高估计值/
161.3
167.7
170.0
173.5
177.5
6.两个变量与的回归模型中,分别选择了4个不同的模型,其中拟合效果最好的模型是( )
A.模型1的决定系数 B.模型2的决定系数
C.模型3的决定系数 D.模型4的决定系数
7.在研究体重与身高的相关关系中,计算得到相关指数,则( )
A.是解释变量 B.只有的样本符合得到的相关关系
C.体重解释了的身高 D.身高解释了的体重
8.变量x与y的成对样本数据的散点图如图所示,若用拟合成对数据,其决定系数记为;若用拟合成对数据,其决定系数记为.则与大小关系为______.(由大到小)
题型一:求非线性回归方程
1.某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
2.(多选)某个国家某种病毒传播的中期,感染人数和时间(单位:天)在天里的散点图如图所示,下面四个回归方程类型中有可能适宜作为感染人数和时间的回归方程类型的是( )
A. B. C. D.
3.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则c,k的值分别是( )
A. 0.6 B. 0.3 C. 0.2 D. 0.6
4.为研究某种图书每册的成本费元与印刷数册的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.
表中,.
(1)根据散点图判断:与哪一个更适宜作为每册成本费元与印刷数册的回归方程类型?只要求给出判断,不必说明理由
(2)根据(1)的判断结果及表中数据,建立关于的回归方程;
(3)若每册书定价为元,则至少应该印刷多少册才能使销售利润不低于元?假设能够全部售出
(附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,)
5.为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量(单位:亿元)与研发人员增量(人)的10组数据.现用模型①,②分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图.
根据收集到的数据,计算得到下表数据,其中.
7.5
2.25
82.50
4.50
12.14
2.88
(1)根据残差图,判断应选择哪个模型;(无需说明理由)
(2)根据(1)中所选模型,求出关于的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少多少人?(精确到1)
6.为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1-10分别对应年份2013-2022.
根据散点图,分别用模型①,②作为年研发投入关于年份代码的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
75
2.25
82.5
4.5
120
28.35
表中.
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入关于年份代码的经验回归方程模型?并说明理由;
(2)根据(1)中所选模型,求出关于的经验回归方程,并预测该公司2028年的高科技研发投入.
附:对于一组数据,其经验回归直线的斜率和截距的最小二乘估计分别为.
1.已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则( )
A. B.6 C. D.8
2.(多选)对两组线性相关成对数据进行回归分析,得到不同的统计结果,第-组成对数据的样本相关系数、残差平方和、决定系数分别为,,,第二组成对数据的样本相关系数、残差平方和、决定系数分别为,,,则( )
A.若,则第一组成对数据的线性相关关系比第二组的强
B.若,则第一组成对数据的线性相关关系比第二组的强
C.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
D.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
3.下列关于两个变量回归分析的说法正确的是( )
A.如果在散点图中所有的样本点都落在一条斜率为非0实数的直线上,那么
B.回归方程得到的预报值就是预报变量的精确值
C.残差平方和越大,模型的拟合效果越好
D.在残差图中,若残差点比较均匀的落在水平带状区域中,说明选用的模型比较合适
4.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润z(单位:万元)的影响.对近8年的年宣传费和年销售量数据进行初步处理后,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①;②;③;④;⑤,则较适宜作为年销售量y关于年宣传费x的回归方程的是( )
A.①② B.②③ C.②④ D.③⑤
5.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如下:
年份
2014
2015
2016
2017
2018
2019
2020
广告费支出x
1
2
4
6
11
13
19
销售量y
1.9
3.2
4.0
4.4
5.2
5.3
5.4
(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程;
(2)若用模型拟合y与x的关系,可得回归方程,经计算线性回归模型和该模型的分别约为0.75和0.88,请用说明选择哪个回归模型更好.
附:
6.一所中学组织学生对某线下某实体店2022年部分月份的月利润情况进行调查统计,得到的数据如下:
月份
2
4
6
8
10
12
净利润(万元)
0.9
2.0
4.2
3.9
5.2
5.1
0.7
1.4
1.8
2.1
2.3
2.5
1.4
2.0
2.4
2.8
3.2
3.5
根据散点图,准备用①或②建立关于的回归方程.
(1)用线性相关系数说明上面的两种模型哪种适宜作为关于的回归方程?
(2)由参考数据,根据(1)的判断结果,求关于的回归方程(精确到0.1).
附:对于一组数据(,2,3,⋯,n),其回归直线的斜率和截距的最小二乘估计分别为,.相关系数.
参考数据:,,,,,
,,,
,.
7.某电商平台统计了近七年小家电的年度广告费支出(万元)与年度销售量(万台)的数据,如表所示:
年份
2016
2017
2018
2019
2020
2021
2022
广告费支出
1
2
4
6
11
13
19
销售量
1.9
3.2
4.0
4.4
5.2
5.3
5.4
其中,
(1)若用线性回归模型拟合与的关系,求出关于的线性回归方程;
(2)若用模型拟合得到的回归方程为,经计算线性回归模型及该模型的分别为0.75和0.88,请根据的数值选择更好的回归模型拟合与的关系,进而计算出年度广告费为何值时,利润的预报值最大?
参考公式:,;
1 / 10
学科网(北京)股份有限公司
$