内容正文:
第八章 成对数据的统计分析》同步配套分层练习-2024-2025学年高二数学教材解读与拓展(沪教版2020)选择性必修第二册
【原卷版】 8.2.2 一元线性回归分析的应用举例
【附录】相关考点
考点一
建立一元线性回归模型的一般步骤
(1)确定研究对象,从一组数据出发,根据实际问题,明确哪个变量是自变量,哪个变量是因变量;
(2)对确定的自变量和因变量,绘制相应的散点图,观察它们之间的关系(如是否存在线性关系等);
(3)若观察到数据呈线性关系,则选用线性方程;
(4)利用最小二乘法估计线性方程中的参数与,得到回归方程;
(5)得出结果后计算离差,采用统计方法检验模型是否合适(这一步本书不作要求);
(6)利用所求的回归方程进行预测;
说明:
1.任何一组数据都可以由最小二乘法得出回归直线方程吗?
【解析】用最小二乘法求回归直线方程的前提是先判断所给数据具有线性相关关系(可利用散点图来判断),否则求出的回归直线方程无意义;
2、根据=-及回归直线方程y=x+,判断点(,)与回归直线的关系是什么?
【解析】由=-得=+,因此点(,)在回归直线上;
3、恩格尔系数(Engel’s Coefficient)是根据恩格尔定律得出的比例数,指居民家庭中食物支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出金额.
一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出所占比例将会下降.
问题:恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?
【解析】为了对两个变量线性相关关系进行预测,我们通常建立一元线性回归模型进行预测;
【必做题】落实与理解教材要求的基本教学内容;
1、工人工资y(元)与劳动生产率x(千元)的相关关系的经验回归方程为y=50+80x,下列判断正确的是( )
A.劳动生产率为1 000元时,工人工资为130元
B.劳动生产率提高1 000元时,工人工资平均提高80元
C.劳动生产率提高1 000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2 000元
2、广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x(单位:万元)和销售额y(单位:万元)进行统计,得到统计数据表:
广告费x
2
3
4
5
6
销售额y
29
41
50
59
71
由表格可得经验回归方程为=10.2x+,据此模型,预测广告费为10万元时的销售额约为( )
A.101.2万元 B.108.8万元
C.111.2万元 D.118.2万元
3、下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y与月份x之间有较好的线性相关关系,其经验回归方程是y=-0.7x+,则=( B )
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
A.2 B.5.25 C.9.5 D.20
4、恩格尔系数是食品支出总额占个人消费支出总额的比重.据某机构预测,n(n≥10)个城市职工购买食品的人均支出y(千元)与人均月消费支出x(千元)具有线性相关关系,且经验回归方程为=0.4x+1.2,若其中某城市职工的人均月消费支出为5千元,则该城市职工的月恩格尔系数约为( )
A.60% B.64% C.58% D.55%
【标答题】掌握与体验用相关数学知识与方法规范审题、析题、答题;
5、判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?
(1)某公司的销售收入和广告支出;
(2)航空公司的顾客投诉次数和航班正点率;
(3)某地区的人均消费水平和人均国内生产总值(GDP);
(4)学生期末考试成绩和考前用于复习的时间;
(5)一辆汽车在某段路程中的行驶速度和行驶时间;
(6)正方形的面积与周长.
6、某地区近10年居民的年收入x与年支出y之间的关系大致符合y=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.
7、某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm,182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.
8、某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:
时间
二月
上旬
二月
中旬
二月
下旬
三月
上旬
旬平均气温x(℃)
3
8
12
17
旬销售量y(件)
55
m
33
24
由表中数据算出经验回归方程y=x+中的=-2,样本点的中心为(10,38).
(1)表中数据m=________;
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为________件.
【自选题】提升与拓展课本知识与方法,具有知识与方法的交汇与综合,由学生自主选择尝试。
9、设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为=0.85x-85.71,则下列结论中错误的是( )
A.y与x具有正的线性相关关系
B.经验回归方程过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可判定其体重必为58.79 kg
10、某商店为了解气温对某产品销售量的影响,随机记录了该商店3月份中5天的日销售量y(单位:千克)与该地当日最低气温x(单位:℃)的数据,如表所示:
x
2
5
8
9
11
y
12
10
8
8
7
(1)求y与x的经验回归方程y=x+;
(2)判断y与x之间是正相关还是负相关;若该地3月份某天的最低气温为6 ℃,请用(1)中的经验回归方程预测该商店当日的销售量.
参考公式:==,=-.
11、某校对该校高二文科学生的记忆力x和判断力y进行统计分析,得如表数据.
x
6
8
10
12
y
2
3
5
6
(1)请画出表中所给数据的散点图;
(2)请根据表中提供的数据,用最小二乘法求出y关于x的经验回归方程;
(3)试根据(2)中求出的线性回归方程,预测记忆力为16的学生的判断力.
参考公式:经验回归方程=x+中,
12、在入室盗窃类案件中,出现频率最高的痕迹物证之一就是足迹. 负重行走对足迹步伐特征影响的规律强,而且较为稳定. 正在行走的人在负重的同时,步长变短,步宽变大,步角变大. 因此, 以身高分别为170cm, 175cm, 180cm的人员各 20名作为实验对象,让他们采取双手胸前持重物的负重方式行走,得到实验对象在负重0kg,5kg,10kg,15kg,20kg状态下相对稳定的步长数据平均值. 并在不同身高情况下,建立足迹步长s(单位:cm)关于负重x(单位:kg)的三个经验回归方程. 根据身高 170cm组数据建立线性回归方程①: ;根据身高 175cm组数据建立线性回归方程②: 根据身高 180cm 组数据建立线性回归方程③: .
(1)根据身高 180cm组的统计数据,求,的值,并解释参数的含义;
身高 180cm不同负重情况下的步长数据平均值
负重x/kg
0
5
10
15
20
足迹步长s/cm
74.35
73.50
71.80
68.60
65.75
(2)在一起盗窃案中,被盗窃物品重为9kg,在现场勘查过程中,测量得犯罪嫌疑人往返时足迹步长的差值为4.464cm,推测该名嫌疑人的身高,并说明理由.
附: .为回归方程, ,,,
第1页
学科网(北京)股份有限公司
$$第八章 成对数据的统计分析》同步配套分层练习-2024-2025学年高二数学教材解读与拓展(沪教版2020)选择性必修第二册
【解析版】 8.2.2 一元线性回归分析的应用举例
【附录】相关考点
考点一
建立一元线性回归模型的一般步骤
(1)确定研究对象,从一组数据出发,根据实际问题,明确哪个变量是自变量,哪个变量是因变量;
(2)对确定的自变量和因变量,绘制相应的散点图,观察它们之间的关系(如是否存在线性关系等);
(3)若观察到数据呈线性关系,则选用线性方程;
(4)利用最小二乘法估计线性方程中的参数与,得到回归方程;
(5)得出结果后计算离差,采用统计方法检验模型是否合适(这一步本书不作要求);
(6)利用所求的回归方程进行预测;
说明:
1.任何一组数据都可以由最小二乘法得出回归直线方程吗?
【解析】用最小二乘法求回归直线方程的前提是先判断所给数据具有线性相关关系(可利用散点图来判断),否则求出的回归直线方程无意义;
2、根据=-及回归直线方程y=x+,判断点(,)与回归直线的关系是什么?
【解析】由=-得=+,因此点(,)在回归直线上;
3、恩格尔系数(Engel’s Coefficient)是根据恩格尔定律得出的比例数,指居民家庭中食物支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出金额.
一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出所占比例将会下降.
问题:恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?
【解析】为了对两个变量线性相关关系进行预测,我们通常建立一元线性回归模型进行预测;
【必做题】落实与理解教材要求的基本教学内容;
1、工人工资y(元)与劳动生产率x(千元)的相关关系的经验回归方程为y=50+80x,下列判断正确的是( )
A.劳动生产率为1 000元时,工人工资为130元
B.劳动生产率提高1 000元时,工人工资平均提高80元
C.劳动生产率提高1 000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2 000元
【答案】B;
【解析】因为经验回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元;
2、广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x(单位:万元)和销售额y(单位:万元)进行统计,得到统计数据表:
广告费x
2
3
4
5
6
销售额y
29
41
50
59
71
由表格可得经验回归方程为=10.2x+,据此模型,预测广告费为10万元时的销售额约为( )
A.101.2万元 B.108.8万元
C.111.2万元 D.118.2万元
【答案】C;
【解析】根据统计数据表,可得=×(2+3+4+5+6)=4,=×(29+41+50+59+71)=50.因为经验回归直线经过点(4,50),所以50=10.2×4+,解得=9.2,所以经验回归方程为y=10.2x+9.2.当x=10时,y=10.2×10+9.2=111.2.故选C;
3、下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y与月份x之间有较好的线性相关关系,其经验回归方程是y=-0.7x+,则=( B )
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
A.2 B.5.25 C.9.5 D.20
【答案】B;
【解析】由题意知:=×(1+2+3+4)=2.5,=×(4.5+4+3+2.5)=3.5,将(2.5,3.5)代入经验回归方程=-0.7x+,即3.5=-0.7×2.5+,解得=5.25.故选B.
4、恩格尔系数是食品支出总额占个人消费支出总额的比重.据某机构预测,n(n≥10)个城市职工购买食品的人均支出y(千元)与人均月消费支出x(千元)具有线性相关关系,且经验回归方程为=0.4x+1.2,若其中某城市职工的人均月消费支出为5千元,则该城市职工的月恩格尔系数约为( )
A.60% B.64% C.58% D.55%
【答案】B;
【解析】把x=5代入经验回归方程=0.4x+1.2中,得=0.4×5+1.2=3.2,
则该城市职工的月恩格尔系数约为=0.64=64%,故选B.
【标答题】掌握与体验用相关数学知识与方法规范审题、析题、答题;
5、判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?
(1)某公司的销售收入和广告支出;
(2)航空公司的顾客投诉次数和航班正点率;
(3)某地区的人均消费水平和人均国内生产总值(GDP);
(4)学生期末考试成绩和考前用于复习的时间;
(5)一辆汽车在某段路程中的行驶速度和行驶时间;
(6)正方形的面积与周长.
【解析】(1)(2)(3)(4)回归模型,(5)(6)函数模型;
【说明】在函数关系中,变量X对应的是变量Y的确定值,而在相关关系中,变量X对应的是变量Y的概率分布.换句话说,相关关系是随机变量之间或随机变量与非随机变量之间的一种数量依存关系,对于这种关系,通常运用统计方法进行研究;通过对相关关系的研究又可以总结规律,从而指导人们的生活与生活实践;
6、某地区近10年居民的年收入x与年支出y之间的关系大致符合y=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.
【答案】12.1
【解析】将x=15代入y=0.8x+0.1,得y=12.1;
7、某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm,182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.
【答案】185
【解析】因为儿子的身高与父亲的身高有关,所以设儿子的身高为Y(单位:cm),父亲身高为X(单位:cm),根据数据列表:
X
173
170
176
Y
170
176
182
由表中数据,求得回归系数=1,=3.
于是儿子身高与父亲身高的关系式为Y=X+3,
当X=182时,Y=185.
故预测该老师的孙子的身高为185 cm.
8、某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:
时间
二月
上旬
二月
中旬
二月
下旬
三月
上旬
旬平均气温x(℃)
3
8
12
17
旬销售量y(件)
55
m
33
24
由表中数据算出经验回归方程y=x+中的=-2,样本点的中心为(10,38).
(1)表中数据m=________;
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为________件.
【答案】(1)40;(2)14;
【解析】(1)由=38,得m=40.
(2)由=-得=58,故y=-2x+58,
当x=22时,y=14,
故三月中旬的销售量约为14件.
【自选题】提升与拓展课本知识与方法,具有知识与方法的交汇与综合,由学生自主选择尝试。
9、设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为=0.85x-85.71,则下列结论中错误的是( )
A.y与x具有正的线性相关关系
B.经验回归方程过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可判定其体重必为58.79 kg
【答案】D
【解析】A,B,C均正确,是经验回归方程的性质,D项是错误的,经验回归方程只能预测学生的体重,应为大约58.79 kg.
10、某商店为了解气温对某产品销售量的影响,随机记录了该商店3月份中5天的日销售量y(单位:千克)与该地当日最低气温x(单位:℃)的数据,如表所示:
x
2
5
8
9
11
y
12
10
8
8
7
(1)求y与x的经验回归方程y=x+;
(2)判断y与x之间是正相关还是负相关;若该地3月份某天的最低气温为6 ℃,请用(1)中的经验回归方程预测该商店当日的销售量.
参考公式:==,=-.
【提示】(1)先由题中条件,求出,,利用最小二乘法,求出和,即可得出经验回归方程.
(2)根据(1)的结果,直接判断出y与x之间是负相关,再令x=6,即可求出预测值.
【解析】(1)由题中数据可得,==7,==9,
所以=[(2-7)(12-9)+(5-7)(10-9)+(8-7)(8-9)+(9-7)(8-9)+(11-7)(7-9)]÷[(2-7)2+(5-7)2+(8-7)2+(9-7)2+(11-7)2]==-0.56,
则=9+0.56×7=12.92,所以y=-0.56x+12.92.
(2)由(1)知,y与x之间是负相关;
当x=6时y=-0.56×6+12.92=9.56,
即某天的最低气温为6 ℃时,预测该商店当日的销售量为9.56千克.
【说明】求经验回归方程的步骤
(1)利用散点图判定两个变量具有线性相关关系.
(2)列表求出,,,iyi(可用计算器进行计算).
(3)利用相应公式计算,.
(4)写出经验回归方程,并利用经验回归方程进行预测.,说明:经验回归直线一定经过据此性质可以解决有关的计算问题、判断结论的正确性.
11、某校对该校高二文科学生的记忆力x和判断力y进行统计分析,得如表数据.
x
6
8
10
12
y
2
3
5
6
(1)请画出表中所给数据的散点图;
(2)请根据表中提供的数据,用最小二乘法求出y关于x的经验回归方程;
(3)试根据(2)中求出的线性回归方程,预测记忆力为16的学生的判断力.
参考公式:经验回归方程=x+中,
【解析】 (1)散点图如图:
(2)因为=×(6+8+10+12)=9,=×(2+3+5+6)=4,
所以===0.7,
则=-=4-0.7×9=-2.3,
所以y关于x的经验回归方程为=0.7x-2.3.
(3)由(2)可知,当x=16时,得y=0.7×16-2.3=8.9.
所以预测记忆力为16的学生的判断力为8.9.
12、在入室盗窃类案件中,出现频率最高的痕迹物证之一就是足迹. 负重行走对足迹步伐特征影响的规律强,而且较为稳定. 正在行走的人在负重的同时,步长变短,步宽变大,步角变大. 因此, 以身高分别为170cm, 175cm, 180cm的人员各 20名作为实验对象,让他们采取双手胸前持重物的负重方式行走,得到实验对象在负重0kg,5kg,10kg,15kg,20kg状态下相对稳定的步长数据平均值. 并在不同身高情况下,建立足迹步长s(单位:cm)关于负重x(单位:kg)的三个经验回归方程. 根据身高 170cm组数据建立线性回归方程①: ;根据身高 175cm组数据建立线性回归方程②: 根据身高 180cm 组数据建立线性回归方程③: .
(1)根据身高 180cm组的统计数据,求,的值,并解释参数的含义;
身高 180cm不同负重情况下的步长数据平均值
负重x/kg
0
5
10
15
20
足迹步长s/cm
74.35
73.50
71.80
68.60
65.75
(2)在一起盗窃案中,被盗窃物品重为9kg,在现场勘查过程中,测量得犯罪嫌疑人往返时足迹步长的差值为4.464cm,推测该名嫌疑人的身高,并说明理由.
附: .为回归方程, ,,,
【答案】(1),参数的含义详见解析
(2)嫌疑人身高为175cm,理由详见解析
【解析】(1)由题意可知:,,
,
所以,
;
的含义表示,负重每增加足迹步长减少.
(2)设被盗窃物品重为9kg时,身高170cm的步长误差为,高175cm的步长误差为,高180cm的步长误差为,
由题意可得,,,,
因为与测量得犯罪嫌疑人往返时足迹步长的差值最接近,
所以犯罪嫌疑人身高为175cm;
第1页
学科网(北京)股份有限公司
$$