内容正文:
8.2 第2课时 一元线性回归模型的综合问题
[课时跟踪检测]
1.已知变量x,y之间具有线性相关关系,其经验回归方程为=-3+x,若xi=20, yi=30,则的值为 ( )
A.1 B.3
C.-3 D.-1
解析:选B 因为xi=20,所以==2,因为yi=30,所以==3.又因为样本点中心(,)在回归直线=-3+x上,所以=-3+,即3=-3+2,解得=3,故选B.
2.据统计,某产品的市场销售量y(万台)与广告费用投入x(万元)之间的对应数据的散点图如图所示,由图可知y与x之间有较强的线性相关关系,其经验回归方程是=0.3x+,则的值是 ( )
A.2.5 B.3
C.3.5 D.4
解析:选A 由题可知==5,==4,将,代入经验回归方程可得4=0.3×5+⇒=2.5.
3.[多选]对于变量x和变量y,数据(-1,-1),(1,1),(x1,y1),(x2,y2),…,(x18,y18)的样本点的中心为(4.5,9),其经验回归方程为=x,若去除前两个已知样本点后得到的新的经验回归方程为=x+,则对于新的样本数据,下列说法正确的是 ( )
A.新的样本点的中心为(5,10)
B.x与y具有正相关的关系
C.新的经验回归方程=x+与经验回归方程=x是相同的
D.随着变量x的增加,变量y的增加速度增大
解析:选AB 对于A,由题意得-1+1+x1+x2+…+x18=4.5×20,-1+1+y1+y2+…+y18=9×20,
所以x1+x2+…+x18=90,y1+y2+…+y18=180,所以=5,=10,
所以新的样本点的中心为(5,10),故A正确.
对于B,易知=x过点(4.5,9),所以9=4.5×,解得=2,
所以x与y具有正相关的关系,故B正确.
对于C,根据最小二乘估计可得
化简得xiyi=2+2,
所以新的经验回归方程=x+与经验回归方程=x不相同,故C错误.
对于D,因为经验回归方程为直线方程,所以随着变量x的增加,
变量y的增加速度不变,故D错误.故选AB.
4.(5分)2025年9月1日至23日(日期代码分别为1,2,…,23),某餐馆在区域M内投放广告单数量y(万张)与日期代码x满足经验回归方程=,则= (精确到小数点后两位).
参考数据:y1y2y3…y23=e89.7,=12.
解析:对=的两边取自然对数,得ln =x+0.38,所以ln y与x具有线性相关关系.
因为ln(y1y2y3…y23)=ln e89.7=89.7,所以=3.9,
所以3.9=12+0.38,所以≈0.29.
答案:0.29
5.(5分)某学校为了解学生中男生的体重y(单位:kg)与身高x(单位:cm)是否存在线性相关关系,搜集了7位男生的数据,得到如下表格:
序号
1
2
3
4
5
6
7
身高x/cm
166
173
174
178
180
183
185
体重y/kg
57
62
59
71
67
75
78
根据表中数据计算得到y关于x的经验回归方程为=x-136.55.
(1)= ;
解析:(1)由题表中数据可得,
==177,==67,
所以67=×177-136.55,解得=1.15.
(2)由(1)知=67,故(yi-)2=(-10)2+(-5)2+(-8)2+42+02+82+112=390,
则有R2=1-≈0.87,
因为0.8<0.87<0.9,
所以该经验回归方程对应模型的拟合效果良好.
答案:(1)1.15 (2)良好
6.(10分)高考复习经过二轮“见多识广”之后,为了研究考前“限时抢分”强化训练次数x与答题正确率y(%)的关系,对某校高三某班学生进行了关注统计,得到如下表所示数据:
x
1
2
3
4
y
20
30
50
60
(1)求y关于x的经验回归方程,并预测答题正确率是100%的强化训练次数(保留整数);(5分)
(2)现用(i=1,2,3,4)表示统计数据的“强化均值”(保留整数),若“强化均值”的标准差在区间[0,2)内,则强化训练有效,请问这个班的强化训练是否有效?(5分)
解:(1)由所给数据计算得=2.5,=40, xiyi-4 =70,-4=5,
所以=-=40-14×2.5=5,
所以所求经验回归方程是=14x+5.令100=14x+5,解得x≈7.所以预测答题正确率是100%的强化训练次数为7.
(2)经计算知,这四组数据的“强化均值”分别为5,6,8,9,其平均数是7,所以“强化均值”的标准差是s==<2,
所以这个班的强化训练有效.
7.(10分)某乡政府为提高当地农民的收入,指导农民种植药材,并取得了较好的效果.以下是某农户近5年种植药材的平均收入的统计数据:
年份
2019
2020
2021
2022
2023
年份代码x
1
2
3
4
5
平均收入
y/千元
59
61
64
68
73
(1)根据表中数据,现有y=a+bx与y=c+dx2两种模型可以拟合y与x之间的关系,请分别求出两种模型的回归方程;(结果保留一位小数)(5分)
(2)统计学中常通过比较残差的平方和来比较两个模型的拟合效果,请根据残差平方和说明上述两个模型哪一个的拟合效果更好,并据此预测2025年该农户种植药材的平均收入.(5分)
参考数据:(ti-)(yi-)=217,(ti-)2=374,其中ti=.
解:(1)由题表得=×(1+2+3+4+5)=3,=×(59+61+64+68+73)=65,
所以(xi-)(yi-)=35,(xi-)2=10,
=-=65-3.5×3=54.5.
设t=x2,则y=c+dx2=c+dt,
易得=×(12+22+32+42+52)=11,
所以=-≈65-0.6×11=58.4.
所以两种模型的回归方程分别为=3.5x+54.5,=0.6x2+58.4.
(2)对于=3.5x+54.5,其残差平方和为(59-58)2+(61-61.5)2+(64-65)2
+(68-68.5)2+(73-72)2=3.5.
对于=0.6x2+58.4,其残差平方和为(59-59)2+(61-60.8)2+(64-63.8)2+(68-68)2+(73-73.4)2
=0.24.
因为0.24<3.5,所以模型=0.6x2+58.4的拟合效果更好.
当x=7时,=0.6×72+58.4=87.8,故预测2025年该农户种植药材的平均收入为87.8千元,即8.78万元.
8.(10分)大气污染物PM2.5(大气中直径小于或等于2.5 μm的颗粒物)的浓度超过一定的限度会影响人的身体健康.为了研究PM2.5的浓度受车流量影响的程度,某校数学建模社团选择了学校附近5个监测点,统计每个监测点24 h内的车流量x(单位:千辆),同时在低空相同的高度测定每个监测点该时间段内的PM2.5的平均浓度y(单位:μg/m3),得到的数据如表所示:
监测点编号
1
2
3
4
5
车流量x/千辆
1.3
1.2
1.6
1.0
0.9
PM2.5的平均
浓度y/(μg/m3)
66
72
113
34
35
(1)建立y关于x的一元线性回归模型,并用样本相关系数加以说明(一般地,样本相关系数的绝对值在0.75以上(含0.75)认为线性相关性较强,否则认为线性相关性较弱);(8分)
(2)我国规定空气中PM2.5的浓度安全标准为24 h平均浓度为75 μg/m3,该地为使PM2.5 24 h平均浓度不超过68.6 μg/m3,拟对车流量作适当控制,请你根据本题数据估计车流量控制的最大值.(2分)
解:(1)由题表得==1.2,
==64,
xiyi=1.3×66+1.2×72+1.6×113+1.0×34+0.9×35=418.5,
=1.32+1.22+1.62+1.02+0.92=7.5,
=662+722+1132+342+352=24 690,
所以=115x-74.
因为|0.97|>0.75,
所以y与x的线性相关性较强.
(2)令115x-74≤68.6,得x≤1.24,
故估计车流量控制的最大值为1.24千辆.
学科网(北京)股份有限公司
$