内容正文:
第八章 成对数据的统计分析》同步配套分层练习-2024-2025学年高二数学教材解读与拓展(沪教版2020)选择性必修第二册
【原卷版】 8.2.1 一元线性回归分析的基本思想
【附录】相关考点
考点一
离差的概念与作用
一般地,设给定一组有线性相关关系的成对数据、、…、和一个线性方程(或称线性模型); ①
如何描述数据与此线性方程的贴近度呢?
当变量取值(=1,2,…,)时,令,它是变量与对应的理想值;
但数据中的与不一定相同,它们的差称为在处的离差;
当时称为正离差,而当时称为负离差;
显然,离差直观地描述了单对数据与线性方程①的贴近度;
考点二
拟合误差
可以像计算方差那样,用离差的平方和来刻画直线与点之间的拟合程度;称为拟合误差;它是一个很好的描述数据与线性方程①贴近度的指标;
考点三
回归分析及其相关概念
我们把拟合误差取得最小值时得到的线性方程(线性模型)记为 ②
并称之为变量随波动的回归方程或回归模型,其中自变量称为解释变量,因变量称为反应变量;回归方程所定义的直线称为回归直线,回归方程的系数(或称回归模型的参数)与称为回归系数;
由一组有某种线性关系的成对数据求其回归方程的方法称为一元线性回归分析;
回归系数与的计算方法如下:
其中,与分别是数据与(=1,2,…,)的算术平均数;数对称为样本点的中心。
考点四
最小二乘法与最小二乘估计量
我们的回归分析是基于取最小值的假设,即基于所有离差的平方和取最小值的假设进行的;这种回归分析的方法称为最小二乘法;
由最小二乘法导出的估计量称为最小二乘估计量,所得到的回归系数与又称为模型参数与的最小二乘估计;
说明:
1、现实生活中的两个变量有哪些关系?一元线性回归模型是用来刻画哪类变量间的模型?
【解析】现实生活中的两个变量关系主要有确定性关系与非确定性关系,一元线性回归模型是用来刻画非确定性关系的模型;
2、回归分析中,利用经验回归方程求出的函数值是否一定为真实值?
【解析】不一定是真实值,利用经验回归方程求的值,在很多时候是个预测值;
【必做题】落实与理解教材要求的基本教学内容;
1、已知变量x与y负相关,且由观测数据算得的样本平均数=4,=5.6,则由该观测数据算得的经验回归方程可能是( )
A.y=0.4x+4 B.y=1.2x+0.7
C.y=-0.6x+8 D.y=-0.7x+8.2
2、已知x与y之间的一组数据:
x
0
1
2
3
y
m
3
5.5
7
已求得关于y与x的经验回归方程y=2.2x+0.7,则m的值为( )
A.1 B.0.85
C.0.7 D.0.5
3、根据下表样本数据:
x
6
8
9
10
12
y
6
5
4
3
2
用最小二乘法求得经验回归方程为y=x+10.3,则的值为( B )
A.-0.6 B.-0.7
C.-0.8 D.-0.9
4、对于一组具有线性相关关系的样本数据,其样本中心为,回归方程为,则相应于样本点的残差为( )
A. B.
C. D.
【标答题】掌握与体验用相关数学知识与方法规范审题、析题、答题;
5、由变量x与y相对应的一组成对样本数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的经验回归方程为y=2x+45,则=________.
6、对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,3,…,8),其经验回归方程是y=x+,且x1+x2+x3+…+x8=24,y1+y2+y3+…+y8=12,则实数的值是
7、已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
求:y关于x的经验回归方程,并借助残差平方和;
8、已知变量x,y有如下对应数据:
x
1
2
3
4
y
1
3
4
5
(1)作出散点图;
(2)用最小二乘法求关于x,y的经验回归方程.
【自选题】提升与拓展课本知识与方法,具有知识与方法的交汇与综合,由学生自主选择尝试。
9、为了规定工时定额,需要确定加工某种零件所需的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),由最小二乘法求得经验回归方程为=0.67x+54.9.若已知x1+x2+x3+x4+x5=150,则y1+y2+y3+y4+y5=( )
A.75 B.155.4
C.375 D.466.2
10、若经验回归直线方程中的回归系数=0,则样本相关系数r=________.
11、某校数学建模学生社团进行了一项实验研究,采集了的一组数据如下表所示:
2
3
4
5
6
7
52.5
45
40
30
25
17.5
该社团对上述数据进行了分析,发现与之间具有线性相关关系.
(1)画出表中数据的散点图,并指出与之间的相关系数是正还是负;
(2)求出关于的线性回归方程,并写出当时,预测数据的值.
附:在线性回归方程中,,其中为样本平均值.
12、恩格尔系数法是国际上常用的一种测定贫困线的方法,是指居民家庭年人均食物支出占年人均消费总支出的比重,它随家庭收入的增加而下降,即恩格尔系数越大,生活越贫困.某调研小组通过调查得到了某地年人均消费总支出x(万元)与恩格尔系数y的五组数据如下表:
x
1
1.5
2
2.5
3
y
0.9
0.7
0.5
0.3
0.2
(1)请根据上表数据,用最小二乘法求出y关于x的经验回归方程;
(2)若该地某居民家庭年人均消费总支出为2.6万元,估计该居民家庭的恩格尔系数.
参考公式:经验回归方程y=x+中斜率和截距的最小二乘估计公式分别为
==,=-.
第1页
学科网(北京)股份有限公司
$$第八章 成对数据的统计分析》同步配套分层练习-2024-2025学年高二数学教材解读与拓展(沪教版2020)选择性必修第二册
【解析版】 8.2.1 一元线性回归分析的基本思想
【附录】相关考点
考点一
离差的概念与作用
一般地,设给定一组有线性相关关系的成对数据、、…、和一个线性方程(或称线性模型); ①
如何描述数据与此线性方程的贴近度呢?
当变量取值(=1,2,…,)时,令,它是变量与对应的理想值;
但数据中的与不一定相同,它们的差称为在处的离差;
当时称为正离差,而当时称为负离差;
显然,离差直观地描述了单对数据与线性方程①的贴近度;
考点二
拟合误差
可以像计算方差那样,用离差的平方和来刻画直线与点之间的拟合程度;称为拟合误差;它是一个很好的描述数据与线性方程①贴近度的指标;
考点三
回归分析及其相关概念
我们把拟合误差取得最小值时得到的线性方程(线性模型)记为 ②
并称之为变量随波动的回归方程或回归模型,其中自变量称为解释变量,因变量称为反应变量;回归方程所定义的直线称为回归直线,回归方程的系数(或称回归模型的参数)与称为回归系数;
由一组有某种线性关系的成对数据求其回归方程的方法称为一元线性回归分析;
回归系数与的计算方法如下:
其中,与分别是数据与(=1,2,…,)的算术平均数;数对称为样本点的中心。
考点四
最小二乘法与最小二乘估计量
我们的回归分析是基于取最小值的假设,即基于所有离差的平方和取最小值的假设进行的;这种回归分析的方法称为最小二乘法;
由最小二乘法导出的估计量称为最小二乘估计量,所得到的回归系数与又称为模型参数与的最小二乘估计;
说明:
1、现实生活中的两个变量有哪些关系?一元线性回归模型是用来刻画哪类变量间的模型?
【解析】现实生活中的两个变量关系主要有确定性关系与非确定性关系,一元线性回归模型是用来刻画非确定性关系的模型;
2、回归分析中,利用经验回归方程求出的函数值是否一定为真实值?
【解析】不一定是真实值,利用经验回归方程求的值,在很多时候是个预测值;
【必做题】落实与理解教材要求的基本教学内容;
1、已知变量x与y负相关,且由观测数据算得的样本平均数=4,=5.6,则由该观测数据算得的经验回归方程可能是( )
A.y=0.4x+4 B.y=1.2x+0.7
C.y=-0.6x+8 D.y=-0.7x+8.2
【答案】C;
【解析】因为变量x与y负相关,所以<0,排除选项A、B;将=4,=5.6,代入选项C、D检验即可得到C是正确选项;
2、已知x与y之间的一组数据:
x
0
1
2
3
y
m
3
5.5
7
已求得关于y与x的经验回归方程y=2.2x+0.7,则m的值为( )
A.1 B.0.85
C.0.7 D.0.5
【答案】D;
【解析】经验回归直线必过点(1.5,),故=4,m+3+5.5+7=16,得m=0.5.故选D.
3、根据下表样本数据:
x
6
8
9
10
12
y
6
5
4
3
2
用最小二乘法求得经验回归方程为y=x+10.3,则的值为( B )
A.-0.6 B.-0.7
C.-0.8 D.-0.9
【答案】B;
【解析】根据题意得:=(6+8+9+10+12)÷5=9,=(6+5+4+3+2)÷5=4,
所以4=×9+10.3,解得=-0.7.故选B;
4、对于一组具有线性相关关系的样本数据,其样本中心为,回归方程为,则相应于样本点的残差为( )
A. B.
C. D.
【答案】C;
【解析】因为残差是实际观察值与估计值(拟合值)之间的差,所以相应于样本点的残差为,
故选:C;
【标答题】掌握与体验用相关数学知识与方法规范审题、析题、答题;
5、由变量x与y相对应的一组成对样本数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的经验回归方程为y=2x+45,则=________.
【答案】63;
【解析】因为=(1+5+7+13+19)=9,=2+45,所以,=2×9+45=63.
6、对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,3,…,8),其经验回归方程是y=x+,且x1+x2+x3+…+x8=24,y1+y2+y3+…+y8=12,则实数的值是
【答案】;
【解析】根据题意知,x1+x2+…+x8=24,y1+y2+…+y8=12,
所以,=×24=3,=×12=,所以,经验回归直线y=x+过点,
所以,=-×3=,即实数=;
7、已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
求:y关于x的经验回归方程,并借助残差平方和;
【解析】=×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
=142+162+182+202+222=1 660,
iyi=14×12+16×10+18×7+20×5+22×3=620,
所以,===-1.15,
=7.4+1.15×18=28.1,
所以所求经验回归方程是y=-1.15x+28.1.
列出残差表:
yi-i
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
所以(yi-i)2=0.3;
【说明】残差平方和法:残差平方和(yi-i)2越小,模型的拟合效果越好;
8、已知变量x,y有如下对应数据:
x
1
2
3
4
y
1
3
4
5
(1)作出散点图;
(2)用最小二乘法求关于x,y的经验回归方程.
【解析】(1)散点图如图所示.
(2)==,==,
iyi=1+6+12+20=39,=1+4+9+16=30,
==,
=-×=0,
所以:=x即为所求的经验回归方程;
【自选题】提升与拓展课本知识与方法,具有知识与方法的交汇与综合,由学生自主选择尝试。
9、为了规定工时定额,需要确定加工某种零件所需的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),由最小二乘法求得经验回归方程为=0.67x+54.9.若已知x1+x2+x3+x4+x5=150,则y1+y2+y3+y4+y5=( )
A.75 B.155.4
C.375 D.466.2
【提示】利用经验回归直线过点(,)求出,即得i;
【答案】C;
【解析】由题意,可得==30,代入经验回归方程,可得=0.67×30+54.9=75,所以y1+y2+y3+y4+y5=5×=375,故选C.
10、若经验回归直线方程中的回归系数=0,则样本相关系数r=________.
【答案】0;
【解析】样本相关系数r=与=的分子相同,故r=0;
11、某校数学建模学生社团进行了一项实验研究,采集了的一组数据如下表所示:
2
3
4
5
6
7
52.5
45
40
30
25
17.5
该社团对上述数据进行了分析,发现与之间具有线性相关关系.
(1)画出表中数据的散点图,并指出与之间的相关系数是正还是负;
(2)求出关于的线性回归方程,并写出当时,预测数据的值.
附:在线性回归方程中,,其中为样本平均值.
【答案】(1)散点图见解析,负;(2),
【解析】(1)由题意得散点图如图所示:
由图可知与之间成负相关关系,所以是负.
(2)因为,,
,,
所以,,
所以,关于线性回归方程为,
所以,当时,;
12、恩格尔系数法是国际上常用的一种测定贫困线的方法,是指居民家庭年人均食物支出占年人均消费总支出的比重,它随家庭收入的增加而下降,即恩格尔系数越大,生活越贫困.某调研小组通过调查得到了某地年人均消费总支出x(万元)与恩格尔系数y的五组数据如下表:
x
1
1.5
2
2.5
3
y
0.9
0.7
0.5
0.3
0.2
(1)请根据上表数据,用最小二乘法求出y关于x的经验回归方程;
(2)若该地某居民家庭年人均消费总支出为2.6万元,估计该居民家庭的恩格尔系数.
参考公式:经验回归方程y=x+中斜率和截距的最小二乘估计公式分别为
==,=-.
【解析】(1)由题意可得=×(1+1.5+2+2.5+3)=2,
=×(0.9+0.7+0.5+0.3+0.2)=0.52.
(xi-)(yi-)=-1×0.38-0.5×0.18+0.5×(-0.22)+1×(-0.32)=-0.9,
(xi-)2=1+0.25+0.25+1=2.5,
则=-=-0.36,
=-=1.24,故y=-0.36x+1.24.
(2)当x=2.6时,y=-0.36×2.6+1.24=0.304,
故估计该居民家庭的恩格尔系数为0.304;
第1页
学科网(北京)股份有限公司
$$