题型例析8.2 一元线性回归分析(十一大题型)讲义-2025-2026学年高二上学期数学沪教版选择性必修第二册

2026-02-05
| 37页
| 170人阅读
| 4人下载
特供

资源信息

学段 高中
学科 数学
教材版本 高中数学沪教版选择性必修第二册
年级 高二
章节 8.2 一元线性回归分析
类型 教案-讲义
知识点 -
使用场景 同步教学-单元练习
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 DOCX
文件大小 1.92 MB
发布时间 2026-02-05
更新时间 2026-02-05
作者 sh_xlg
品牌系列 -
审核时间 2026-02-05
下载链接 https://m.zxxk.com/soft/56344021.html
价格 2.00储值(1储值=1元)
来源 学科网

内容正文:

【原卷版】 题型例析 8.2 一元线性回归分析 在必修课程第13章“统计”,主要研究了来自单一变量数据的一些统计特征,如:集中趋势、离散程度、分布等;但现实世界中许多事物和现象之间都是有联系的;在选择性必修第二册第8章中,将主要学习来自两个变量的成对数据的相光分析和回归分析,掌握它们之间的统计规律; 8.2.1离差的概念及其相关概念 1、离差的概念与作用 一般地,设给定一组有线性相关关系的成对数据、、…、和一个线性方程(或称线性模型); ① 如何描述数据与此线性方程的贴近度呢? 当变量取值(=1,2,…,)时,令,它是变量与对应的理想值; 但数据中的与不一定相同,它们的差称为在处的离差; 当时称为正离差,而当时称为负离差; 显然,离差直观地描述了单对数据与线性方程①的贴近度; 2、拟合误差 可以像计算方差那样,用离差的平方和来刻画直线与点之间的拟合程度;称为拟合误差;它是一个很好的描述数据与线性方程①贴近度的指标; 8.2.2回归分析及其相关概念 我们把拟合误差取得最小值时得到的线性方程(线性模型)记为 ② 并称之为变量随波动的回归方程或回归模型,其中自变量称为解释变量,因变量称为反应变量;回归方程所定义的直线称为回归直线,回归方程的系数(或称回归模型的参数)与称为回归系数; 由一组有离差种线性关系的成对数据求其回归方程的方法称为一元线性回归分析; 回归系数与的计算方法如下: 其中,与分别是数据与(=1,2,…,)的算术平均数;数对称为样本点的中心。 最小二乘法与最小二乘估计量 我们的回归分析是基于取最小值的假设,即基于所有离差的平方和取最小值的假设进行的;这种回归分析的方法称为最小二乘法,由最小二乘法导出的估计量称为最小二乘估计量,所得到的回归系数与又称为模型参数与的最小二乘估计; 建立一元线性回归模型的一般步骤 (1)确定研究对象,从一组数据出发,根据实际问题,明确哪个变量是自变量,哪个变量是因变量; (2)对确定的自变量和因变量,绘制相应的散点图,观察它们之间的关系(如是否存在线性关系等); (3)若观察到数据呈线性关系,则选用线性方程; (4)利用最小二乘法估计线性方程中的参数与,得到回归方程; (5)得出结果后计算离差,采用统计方法检验模型是否合适(这一步本书不作要求); (6)利用所求的回归方程进行预测; 题型1 有关离差的计算 例1.下列四幅离差分析图中,与一元线性回归模型拟合精度最高的是(   ) A. B. C. D. 【提示】 【答案】 【解析】 【说明】 例2.已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的离差为 3 4 6 7 20 40 60 题型2 对拟合误差的理解 例3.有一散点图如图所示,在5个数据中去掉后,下列说法中正确的是(    ) A.离差和变小 B.相关系数变小 C.拟合误差变小 D.解释变量与反应变量的相关性变弱 例4.对于平面中的点集,定义直线相对的"拟合误差"为.已知点集,直线相对的"拟合误差"的最小值为 . 题型3 解释回归直线方程的意义 例5.车胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎胎面磨损.离差实验室通过试验测得行驶里程(单位:)与离差品牌轮胎凹槽深度(单位:)的数据,并对这些数据进行了初步处理.现有两种模型可供选用,模型I为线性回归模型,利用最小二乘法,可得到关于的经验回归方程为,模型I的决定系数为0.95,模型II为非线性经验回归方程,模型II的决定系数为0.99,则以下说法正确的是(     ) A.若选用模型I,则两个变量正相关 B.若选用模型I,当自变量每增加1个单位时,因变量一定减少1.14个单位 C.若选用模型II,则此品牌轮胎行驶里程越多,其轮胎凹槽深度一定越大 D.模型II的拟合效果比模型I的拟合效果好 例6.相关变量的样本数据如下表: x 1 2 3 4 y 2 3 a 5 经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为,下列说法正确的是(    ) A.当每增加1时,一定增加1.5 B.当每增加13时,一定增加8 C. 与呈负相关 D. 题型4 用回归直线方程对总体进行估计 例7.近年来,我国云计算市场规模持续增长.离差科技公司云计算市场规模与年份代码的关系可以用模型拟合,设,2018年至2022年的数据统计如表所示: 年份 2018年 2019年 2020年 2021年 2022年 年份代码 1 2 3 4 5 云计算市场规模 7 20 71 200 510 0.85 1.3 1.85 2.3 2.7 若根据上表得到经验回归方程,则该科技公司2025年云计算市场规模约为(     ) A. B. C. D. 例8.若关于离差人工智能设备的使用年限和所支出的维修费用(万元)统计数据如下: 使用年限 2 3 4 5 6 维修费用 2.2 3.8 5.5 6.5 7.0 若有数据知对呈线性相关关系.其线性回归方程为,请估计使用10年时的维修费用是 万元. 题型5根据回归方程求原数据中的值 例9.离差车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为. 零件数x(个) 1 2 3 4 5 加工时间y(min) 50 67 71 79 表中有一个数据模糊不清,请你推断出该数据的值为(   ) A.55 B.55.8 C.59 D.51 例10.已知两个线性相关变量x与y的统计数据如下表: x 3 4 5 6 7 y 2.4 m 4 4.6 5.2 其经验回归方程为 则m=(     ) A.2.8 B.3 C.3.2 D.3.4 题型6 求回归直线方程 3.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,统计出小李离差月1号到5号每天打篮球时间(单位:h)与当天投篮命中率的成对数据满足的关系式:,,.若与满足线性回归方程,则回归系数( ) A.0.04 B.0.03 C.0.02 D.0.01 例12.已知变量和变量的一组成对样本数据为,其中,其线性回归方程为 ,当增加两个样本数据和后,重新得到的回归直线的斜率为3,则在新的线性回归方程下,时,的估计值为(    ) A.13 B.12 C.11 D.8 题型7 最小二乘法的概念及辨析 例13.下列命题是真命题的是(    ) A.经验回归方程至少经过其样本数据点,,…,中的一个 B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强 C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好 D.离差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好 例14.用最小二乘法求回归方程是为了使(    ) A. B. C.最小 D.最小 题型8 利用回归方程求回归系数与 例15.已知x,y的对应取值如下表,从散点图可以看出y与x线性相关,且回归方程为,则(    ) x 0 1 3 4 y 2.2 4.3 4.8 6.7 A.3.2 B.2.7 C.2.6 D.0 例16.为了研究离差班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其经验回归方程为.已知,,,该班离差学生的脚长为24,据此估计其身高为(     ) A.162 B.166 C.170 D.174 题型9 利用样本中心求相关参数 例17.一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据表格可得回归方程,则实数的值为 . 零件数x(个) 2 3 4 5 加工时间y(分钟) 30 a 40 50 例18.由数据可得关于的线性回归方程为,若,则 . 题型10 利用回归方程进行预测 例19.偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把离差个同学的离差科考试成绩与该科班平均分的差叫离差科偏差(实际成绩–平均分=偏差).在离差次考试成绩统计中,离差老师为了对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下: 学生序号 1 2 3 4 5 6 7 8 数学偏差x 20 15 13 3 2 –5 –10 –18 物理偏差y 6.5 3.5 3.5 1.5 0.5 –0.5 –2.5 –3.5 (1)若x与y之间具有线性相关关系,求y关于x的线性回归方程; (2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩. 例20.凯里市至年农村居民家庭纯收入(单位:千元)的数据如下表: 年份 年份代号 人均纯收入 从表出看出,人均纯收入与年份代号线性相关,已知. (1)求关于的线性回归方程; (2)预测2025年的人均纯收入为多少.(附:参考公式:,). 题型11 真题体验 例21.(2016年全国普通高等学校招生统一考试理科数学(新课标3卷))下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.    (Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:,, ,≈2.646. 参考公式:相关系数 回归方程中斜率和截距的最小二乘估计公式分别为: 相关分析和一元线性回归分析是研究两个变量关系的两个互为补充的方法;相关分析描述了两个变量的相关程度,而回归分析则描述了因变量是怎样受自变量影响的; 1、回归方程代表了两个变量间的关系,回归直线经过散点图中数据点的中心;回归直线的斜率越大,解释变量狓的一个单位变化所引起的反应变量狔的波动就越大; 2、回归方程可以通过最小二乘法得到.回归直线能较好地反映一个变量对另一个变量的依赖情况,具有解释因果关系和预测的功能.利用回归方程可以由解释变量的值来预测反应变量的值,从而给出反应变量真实值的一个估计; 1.已知变量和的成对样本数据的经验回归方程为,且,当增加1个样本数据后,重新得到的经验回归方程的斜率为,则在新的经验回归方程的估计下,样本数据所对应的离差为(     ) A. B. C.1 D.2 2.下列是离差商品2025年前5个月的平均价格与月份的统计数据: 月份代码 1 2 3 4 5 平均价格(单位:元) 17 16 20 18 19 用方程拟合上述数据,当离差平方和最小时,(     ) A.0.1 B.0.2 C.0.4 D.0.6 3.已知变量线性相关,其一组样本数据,满足,用最小二乘法得到的经验回归方程为.若增加一个数据后,得到修正后的回归直线的斜率为2.1,则数据的离差为(    ) A.0.1 B.0.2 C.-0.2 D.-0.1 3.已知线性相关系数r是描述成对数据线性相关程度的统计量,也称为皮尔逊相关系数;一元线性回归分析是基于拟合误差Q取最小值的假设进行的,最终可得回归方程(回归直线).现有5个数据点,小明对它们进行了一元线性回归分析,得到线性相关系数和回归方程,随后发现自己漏掉了一个数据点且恰好.重新计算6个数据点得到线性相关系数和回归方程,对于下面两个说法: ①一定小于    ②与一定重合 则(    ) A.①正确②错误 B.①正确②正确 C.①错误②正确 D.①错误②错误 4.已知变量和满足经验回归方程,且变量和之间的一组相关数据如表所示,则下列说法错误的是(    ) 5 6 9 12 8 7 2.4 A. B.当时, C.变量和呈负相关 D.该经验回归直线必过点 5.离差工厂为研究离差种产品的产量(吨)与所需离差种原材料的质量(吨)的相关性,在生产过程中收集组对应数据,如下表所示.(残差观测值预测值) 3 4 5 6 2.5 4 4.5 根据表中数据,得出关于的经验回归方程为,据此计算出在样本处的残差为,则表中的值为 . 6.离差单位为了解日用电量(单位:千瓦时)与当天平均温度(单位:摄氏度)之间的关系,随机统计了4天的日用电量与当天的平均温度,绘制了如下表格,由表中数据可得线性回归方程,则实数 . 5 15 24 60 40 20 7.由一组样本数据得到经验回归方程,则下列说法中正确的是 .(填序号)①直线一定经过点;②直线至少经过点中的一个;③直线的斜率为;④经验回归方程最能代表样本数据中,、之间的线性关系,当时,与正相关,当时,与负相关. 8.下列有关线性回归的说法中,正确的是 (填序号). ①相关关系的两个变量不是因果关系; ②散点图能直观反映数据的相关程度; ③回归直线最能代表线性相关的两个变量之间的关系; ④任意一组数据都有回归方程. 9.手机支付的兴起使得现金支付越来越稀缺.离差便利店统计了该店历年现金收入的数额如下表: 年份 2015 2016 2017 2018 2019 2020 序号 1 2 3 4 5 6 现金收入(万元) 40 36 29 23 14 8 若认为该便利店的历年现金收入与序号满足回归方程为,请你估计该店2021年的年现金收入 为 万元. 10.王伯伯家的果园最近4年的支出(单位:万元)和收入(单位:万元)之间的数据如下: 2020年 2021年 2022年 2023年 1.8 2.1 2.3 3.0 2.0 2.8 3.2 4.0 若果园最近4年的收入与支出满足线性相关关系,则的值为 ,若计划2024年该果园的收入达到6万元,预计2024年的支出为 万元. 11.大数据时代对于数据分析能力的要求越来越高,数据拟合是一种把现有数据通过数学方法来代入离差种算式的表示方式.比如是平面直角坐标系上的一系列点,其中是不小于的正整数,用函数来拟合该组数据,尽可能使得函数图像与点列比较接近.其中一种衡量接近程度的指标是函数的拟合误差,拟合误差越小越好,定义函数的拟合误差为: .已知在平面直角坐标系上,有5个点的坐标数据如下表所示: 2.2 1 2 4.6 7 (1)若用函数来拟合上述表格中的数据,求; (2)若用函数来拟合上述表格中的数据. ①求该函数的拟合误差的最小值,并求出此时的函数解析式; ②指出用中的哪一个函数来拟合上述表格中的数据更好? 12.某校数学建模学生社团进行了一项实验研究,采集了与的一组数据如下表所示: 2 3 4 5 6 7 52.5 45 40 30 25 17.5 该社团对上述数据进行了分析,计算得,,并发现与之间具有线性相关关系. (1)画出表中数据的散点图,并指出与之间的样本相关系数是正数还是负数; (2)求出关于的线性回归方程,并写出当时,预测数据的值. 【解析版】 题型例析 8.2 一元线性回归分析 在必修课程第13章“统计”,主要研究了来自单一变量数据的一些统计特征,如:集中趋势、离散程度、分布等;但现实世界中许多事物和现象之间都是有联系的;在选择性必修第二册第8章中,将主要学习来自两个变量的成对数据的相光分析和回归分析,掌握它们之间的统计规律; 8.2.1离差的概念及其相关概念 1、离差的概念与作用 一般地,设给定一组有线性相关关系的成对数据、、…、和一个线性方程(或称线性模型); ① 如何描述数据与此线性方程的贴近度呢? 当变量取值(=1,2,…,)时,令,它是变量与对应的理想值; 但数据中的与不一定相同,它们的差称为在处的离差; 当时称为正离差,而当时称为负离差; 显然,离差直观地描述了单对数据与线性方程①的贴近度; 2、拟合误差 可以像计算方差那样,用离差的平方和来刻画直线与点之间的拟合程度;称为拟合误差;它是一个很好的描述数据与线性方程①贴近度的指标; 8.2.2回归分析及其相关概念 我们把拟合误差取得最小值时得到的线性方程(线性模型)记为 ② 并称之为变量随波动的回归方程或回归模型,其中自变量称为解释变量,因变量称为反应变量;回归方程所定义的直线称为回归直线,回归方程的系数(或称回归模型的参数)与称为回归系数; 由一组有离差种线性关系的成对数据求其回归方程的方法称为一元线性回归分析; 回归系数与的计算方法如下: 其中,与分别是数据与(=1,2,…,)的算术平均数;数对称为样本点的中心。 最小二乘法与最小二乘估计量 我们的回归分析是基于取最小值的假设,即基于所有离差的平方和取最小值的假设进行的;这种回归分析的方法称为最小二乘法,由最小二乘法导出的估计量称为最小二乘估计量,所得到的回归系数与又称为模型参数与的最小二乘估计; 建立一元线性回归模型的一般步骤 (1)确定研究对象,从一组数据出发,根据实际问题,明确哪个变量是自变量,哪个变量是因变量; (2)对确定的自变量和因变量,绘制相应的散点图,观察它们之间的关系(如是否存在线性关系等); (3)若观察到数据呈线性关系,则选用线性方程; (4)利用最小二乘法估计线性方程中的参数与,得到回归方程; (5)得出结果后计算离差,采用统计方法检验模型是否合适(这一步本书不作要求); (6)利用所求的回归方程进行预测; 题型1 有关离差的计算 例1.下列四幅离差分析图中,与一元线性回归模型拟合精度最高的是(   ) A. B. C. D. 【提示】由各选项的离差数值范围进行比较分析即可得解; 【答案】D; 【解析】选项A离差数值范围约为,选项C离差数值范围约为,两离差分布的带状区域宽,拟合精度低, 选项B离差数值范围约为,选项D离差数值范围约为,两离差分布的带状区域宽度均比选项AC窄, 但选项B离差分布的带状区域宽度大于选项D,所以选项D的拟合精度最高. 故选:D; 【说明】本题考查了有关离差的计算; 例2.已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的离差为 3 4 6 7 20 40 60 【提示】根据样本中心在回归直线上可求的值,从而可求离差. 【答案】2; 【解析】由题设可得,故, 故即,故离差为; 【说明】离差的计算、根据回归方程求原数据中的值 题型2 对拟合误差的理解 例3.有一散点图如图所示,在5个数据中去掉后,下列说法中正确的是(    ) A.离差和变小 B.相关系数变小 C.拟合误差变小 D.解释变量与反应变量的相关性变弱 【提示】根据离差和、相关系数、拟合误差、解释变量与反应变量的相关性逐项判断可得答案; 【答案】C; 【解析】对于A,离差和是每个数据点与均值差值平方后的累计和, 去掉一个点后离差平方和的变化取决于该点的具体数值及其与均值的差距, 如果该点与均值相差较大,去掉它可能会导致离差平方和显著减小, 如果相差较小,则可能对离差平方和的影响不大, 因此,无法说明去掉一个点后离差平方和一定会如何变化,故A错误; 对于B,因为点离其它点较远,去掉后,相关性变强,而且是正相关,所以相关系数变大,故B错误; 对于C,点离其它点较远,是一个异常值,拟合误差减小,故C正确 对于D,解释变量与反应变量的相关性变强,故D错误. 故选:C. 【说明】本题考查了判断正、负相关、解释回归直线方程的意义、相关系数的意义及辨析、离差的计算 例4.对于平面中的点集,定义直线相对的"拟合误差"为.已知点集,直线相对的"拟合误差"的最小值为 . 【提示】方法一:结合“拟合误差”公式进行化简,利用二次函数的性质即可求得最小值;方法二:最小值的几何意义为点到组成的平面的距离,求得平面法向量,由即可求得最小值; 【答案】; 【解析】方法一: ; 方法二:记, 则最小值的几何意义为点到组成的平面的距离. 易求得平面法向量为, 故. 故答案为:. 【说明】点到平面距离的向量求法与“拟合误差”的应用 题型3 解释回归直线方程的意义 例5.车胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎胎面磨损.离差实验室通过试验测得行驶里程(单位:)与离差品牌轮胎凹槽深度(单位:)的数据,并对这些数据进行了初步处理.现有两种模型可供选用,模型I为线性回归模型,利用最小二乘法,可得到关于的经验回归方程为,模型I的决定系数为0.95,模型II为非线性经验回归方程,模型II的决定系数为0.99,则以下说法正确的是(     ) A.若选用模型I,则两个变量正相关 B.若选用模型I,当自变量每增加1个单位时,因变量一定减少1.14个单位 C.若选用模型II,则此品牌轮胎行驶里程越多,其轮胎凹槽深度一定越大 D.模型II的拟合效果比模型I的拟合效果好 【提示】根据回归方程的性质可判断A,B,C;根据决定系数的大小关系可判断模型的拟合效果,即可判断D. 【答案】D; 【解析】模型I所得经验回归方程为,因为,则两个变量负相关,故A不正确; 若选用模型I,当自变量每增加1个单位时,因变量估计减少1.14个单位,故B不正确; 若选用模型II,则此品牌轮胎行驶里程越多,其轮胎凹槽深度可能越小,故C不正确; 由于模型I的决定系数为0.95,模型II的决定系数为0.99,由于,则模型II的拟合效果比模型I的拟合效果好,故D正确. 故选:D. 【说明】本题考查了解释回归直线方程的意义、非线性回归、相关系数的意义及辨析、相关指数的计算及分析 例6.相关变量的样本数据如下表: x 1 2 3 4 y 2 3 a 5 经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为,下列说法正确的是(    ) A.当每增加1时,一定增加1.5 B.当每增加13时,一定增加8 C. 与呈负相关 D. 【提示】根据回归方程的意义可判断AB的正误,根据回归系数的正负可判断C的正误,根据回归方程过样本中心可求,从而可判断D的正误; 【答案】D; 【解析】对于A,因为回归直线方程为,故当每增加1时,增加约为 , 故A错误; 对于B,因为回归直线方程为,故当每增加13时,增加约为, 故B错误; 对于C,因为,故与呈正相关,故C错误; 对于D,,故,故,故, 故D正确; 故选:D. 【说明】本题考查了解释回归直线方程的意义、根据回归方程进行数据估计、根据样本中心点求参数 题型4 用回归直线方程对总体进行估计 例7.近年来,我国云计算市场规模持续增长.离差科技公司云计算市场规模与年份代码的关系可以用模型拟合,设,2018年至2022年的数据统计如表所示: 年份 2018年 2019年 2020年 2021年 2022年 年份代码 1 2 3 4 5 云计算市场规模 7 20 71 200 510 0.85 1.3 1.85 2.3 2.7 若根据上表得到经验回归方程,则该科技公司2025年云计算市场规模约为(     ) A. B. C. D. 【提示】求出,后,根据线性回归方程的性质求得,即回归方程为,可求得2025年即时,,即可求解. 【答案】B 【解析】由题表知,,, 将,代入回归方程,可得, 即,所以z关于x的回归方程为, 2025年时即当时,,此时. 故选:B. 【说明】本题考查了根据样本中心点求参数、用回归直线方程对总体进行估计、对数的运算性质的应用 例8.若关于离差人工智能设备的使用年限和所支出的维修费用(万元)统计数据如下: 使用年限 2 3 4 5 6 维修费用 2.2 3.8 5.5 6.5 7.0 若有数据知对呈线性相关关系.其线性回归方程为,请估计使用10年时的维修费用是 万元. 【提示】根据均值点在回归方程上,可得,得到回归方程,即可求解. 【答案】11; 【解析】由题知, 所以,,即回归方程为, 所以估计使用10年时的维修费用是11万元. 故答案为:11. 【说明】本题考查了根据样本中心点求参数、用回归直线方程对总体进行估计 题型5根据回归方程求原数据中的值 例9.离差车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为. 零件数x(个) 1 2 3 4 5 加工时间y(min) 50 67 71 79 表中有一个数据模糊不清,请你推断出该数据的值为(   ) A.55 B.55.8 C.59 D.51 【提示】首先根据回归直线必过样本点中心,代入方程求,即可求不清楚的数据. 【答案】D 【解析】回归直线必过样本点中心,其中, 所以, 所以不清楚的数值为. 故选:D 【说明】本题考查了根据回归方程求原数据中的值 例10.已知两个线性相关变量x与y的统计数据如下表: x 3 4 5 6 7 y 2.4 m 4 4.6 5.2 其经验回归方程为 则m=(     ) A.2.8 B.3 C.3.2 D.3.4 【提示】利用经验回归方程经过求出; 【答案】A; 【解析】,,经验回归方程经过点, 所以,解得. 故选:A; 【说明】本题考查了根据回归方程求原数据中的值 题型6 求回归直线方程 3.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,统计出小李离差月1号到5号每天打篮球时间(单位:h)与当天投篮命中率的成对数据满足的关系式:,,.若与满足线性回归方程,则回归系数( ) A.0.04 B.0.03 C.0.02 D.0.01 【提示】根据回归系数公式,代入数据求出结果即可; 【答案】D; 【解析】由题意,已知,则,, 则, 故选:D. 【说明】本题考查了求回归直线方程 例12.已知变量和变量的一组成对样本数据为,其中,其线性回归方程为 ,当增加两个样本数据和后,重新得到的回归直线的斜率为3,则在新的线性回归方程下,时,的估计值为(    ) A.13 B.12 C.11 D.8 【提示】首先求得新的线性回归方程,再代入,即可估算; 【答案】B; 【解析】,增加两个样本点后的平均数为; 增加两个样本点前,,增加两个样本点后的平均数为. 设新的线性回归方程为,,解得, 新的线性回归方程为,则当时,. 故选:B. 【说明】本题考查了求回归直线方程、根据回归方程进行数据估计; 题型7 最小二乘法的概念及辨析 例13.下列命题是真命题的是(    ) A.经验回归方程至少经过其样本数据点,,…,中的一个 B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强 C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好 D.离差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好 【提示】根据经验回归方程、相关系数、决定系数、离差等知识确定正确答案; 【答案】D; 【解析】对于A,经验回归方程是由最小二乘法计算出来的,它不一定经过其样本数据点,一定经过,所以A错误; 对于B,由相关系数的意义,当越接近1时,表示变量y与x之间的线性相关程度越强,所以B错误; 对于C,用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好,所以C是错误; 对于D,因为在离差的散点图中,离差分布的水平带状区域的宽度越窄,表明数据越集中, 模型的拟合效果越好,故D正确. 故选:D. 【说明】本题考查了相关指数的计算及分析、相关系数的意义及辨析、最小二乘法的概念及辨析 例14.用最小二乘法求回归方程是为了使(    ) A. B. C.最小 D.最小 【提示】根据最小二乘法的概念和求解过程,即可求解. 【答案】D; 【解析】根据最小二乘法的概念和求解,可得回归方程是为了使得每个数据与估计值之间的差的平方和最小. 故选:D. 【说明】本题考查了最小二乘法的概念及辨析 题型8 利用回归方程求回归系数与 例15.已知x,y的对应取值如下表,从散点图可以看出y与x线性相关,且回归方程为,则(    ) x 0 1 3 4 y 2.2 4.3 4.8 6.7 A.3.2 B.2.7 C.2.6 D.0 【提示】求出样本中心坐标,代入回归直线方程,即可求出的值. 【答案】B; 【解析】由题意可得:2,4.5, 回归直线经过样本中心,所以:4.5=0.9×2+,解得=2.7. 故选:B. 【说明】本题考查了根据样本中心点求参数、计算样本的中心点、求回归直线方程 例16.为了研究离差班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其经验回归方程为.已知,,,该班离差学生的脚长为24,据此估计其身高为(     ) A.162 B.166 C.170 D.174 【提示】根据样本中心落在回归方程上,由已知条件求得,进而求得回归方程,令,则可以估计该学生的身高; 【答案】B; 【解析】根据题意,得,, ,由在上,得,即,故, 令,得,即该学生身高约为166 cm. 故选:B; 【说明】本题考出来根据样本中心点求参数、根据回归方程进行数据估计、计算样本的中心点 题型9 利用样本中心求相关参数 例17.一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据表格可得回归方程,则实数的值为 . 零件数x(个) 2 3 4 5 加工时间y(分钟) 30 a 40 50 【提示】根据回归方程经过样本中心点,代入即可求得的值; 【答案】36; 【解析】根据表中数据可知,, 因为回归方程经过样本中心点, 代入回归直线方程可得,解得, 故答案为:36. 【说明】本题考查了根据回归方程求原数据中的值 例18.由数据可得关于的线性回归方程为,若,则 . 【提示】根据线性回归方程过求解即可; 【答案】32; 【解析】依题意,,由,得,解得,所以. 故答案为:32 【说明】本题考查了根据回归方程求原数据中的值、根据样本中心点求参数 题型10 利用回归方程进行预测 例19.偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把离差个同学的离差科考试成绩与该科班平均分的差叫离差科偏差(实际成绩–平均分=偏差).在离差次考试成绩统计中,离差老师为了对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下: 学生序号 1 2 3 4 5 6 7 8 数学偏差x 20 15 13 3 2 –5 –10 –18 物理偏差y 6.5 3.5 3.5 1.5 0.5 –0.5 –2.5 –3.5 (1)若x与y之间具有线性相关关系,求y关于x的线性回归方程; (2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩. 【提示】(1)分别求出数学偏差和物理偏差的平均数,再根据公式分别求出,从而可求得回归方程; (2)由(1)求出物理偏差,从而可求得答案. 【答案】(1);(2)94分; 【解析】(1)解:由题意可得, , ,, 所以, 故线性回归方程为; (2)由题意,设该同学的物理成绩为分,则物理偏差为分. 而数学偏差为(分), ∴,解得, 所以可以预测这位同学的物理成绩为94分. 【说明】本题综合考查了求回归直线方程、根据回归方程进行数据估计、计算样本的中心点; 例20.凯里市至年农村居民家庭纯收入(单位:千元)的数据如下表: 年份 年份代号 人均纯收入 从表出看出,人均纯收入与年份代号线性相关,已知. (1)求关于的线性回归方程; (2)预测2025年的人均纯收入为多少.(附:参考公式:,). 【提示】(1)结合已知条件求出和,然后利用参考公式求解即可;(2)求出年对应的年份代码,代入线性回归方程即可求解; 【答案】(1);(2)6.82; 【解析】(1)由题中表格知,,,, , 则,, 故回归直线方程为. (2)当年份为2025年时,对应的年份代码, 所以, 故2025年的人均纯收入约为千元. 【说明】本题综合考查了求回归直线方程、根据回归方程进行数据估计、计算样本的中心点 题型11 真题体验 例21.(2016年全国普通高等学校招生统一考试理科数学(新课标3卷))下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.    (Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:,, ,≈2.646. 参考公式:相关系数 回归方程中斜率和截距的最小二乘估计公式分别为: 【提示】(Ⅰ)根据相关系数的公式求出相关数据后,代入公式即可求得的值,最后根据值的大小回答即可;(Ⅱ)准确求得相关数据,利用最小二乘法建立y关于t的回归方程,然后预测. 【解析】(Ⅰ)由折线图中数据和附注中参考数据得 ,,, ; 因为与的相关系数近似为0.99,说明与的线性相关相当高,从而可以用线性回归模型拟合与的关系. (Ⅱ)由及(Ⅰ)得, . 所以,关于的回归方程为:; 将2016年对应的代入回归方程得:; 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨. 【说明】本题综合考查了相关系数的计算、求回归直线方程、用回归直线方程对总体进行估计; 相关分析和一元线性回归分析是研究两个变量关系的两个互为补充的方法;相关分析描述了两个变量的相关程度,而回归分析则描述了因变量是怎样受自变量影响的; 1、回归方程代表了两个变量间的关系,回归直线经过散点图中数据点的中心;回归直线的斜率越大,解释变量狓的一个单位变化所引起的反应变量狔的波动就越大; 2、回归方程可以通过最小二乘法得到.回归直线能较好地反映一个变量对另一个变量的依赖情况,具有解释因果关系和预测的功能.利用回归方程可以由解释变量的值来预测反应变量的值,从而给出反应变量真实值的一个估计; 1.已知变量和的成对样本数据的经验回归方程为,且,当增加1个样本数据后,重新得到的经验回归方程的斜率为,则在新的经验回归方程的估计下,样本数据所对应的离差为(     ) A. B. C.1 D.2 【答案】B 【解析】由,可得增加1个样本数据后的平均数为, 因为,所以, 则增加1个样本数据后的平均数为, 所以,解得, 所以新的经验回归方程为, 则当时,, 样本点的离差为. 故选:B. 2.下列是离差商品2025年前5个月的平均价格与月份的统计数据: 月份代码 1 2 3 4 5 平均价格(单位:元) 17 16 20 18 19 用方程拟合上述数据,当离差平方和最小时,(     ) A.0.1 B.0.2 C.0.4 D.0.6 【答案】D 【解析】当时,,离差的平方为; 当时,,离差的平方为; 当时,,离差的平方为; 当时,,离差的平方为; 当时,,离差的平方为; 所以离差平方和 , 对于二次函数开口向上,故在对称轴时取到最小值,故D正确. 故选:D. 3.已知变量线性相关,其一组样本数据,满足,用最小二乘法得到的经验回归方程为.若增加一个数据后,得到修正后的回归直线的斜率为2.1,则数据的离差为(    ) A.0.1 B.0.2 C.-0.2 D.-0.1 【答案】A 【解析】因,则,则, 则新增数据后,,, 因新的回归直线过点,且修正后的回归直线的斜率为2.1, 则,则修正后的回归直线为:, 则的估计值为,则数据的离差为. 故选:A 3.已知线性相关系数r是描述成对数据线性相关程度的统计量,也称为皮尔逊相关系数;一元线性回归分析是基于拟合误差Q取最小值的假设进行的,最终可得回归方程(回归直线).现有5个数据点,小明对它们进行了一元线性回归分析,得到线性相关系数和回归方程,随后发现自己漏掉了一个数据点且恰好.重新计算6个数据点得到线性相关系数和回归方程,对于下面两个说法: ①一定小于    ②与一定重合 则(    ) A.①正确②错误 B.①正确②正确 C.①错误②正确 D.①错误②错误 【答案】C 【解析】当增加一个与回归直线完全拟合的数据点后,这个点没有产生新的拟合误差,整体数据点与回归直线的拟合程度变得更好,所以,不一定,故①错误; 回归方程是基于5个数据点通过最小二乘法(使拟合误差取最小值)得到的,当加入新的数据点,因为它在回归直线上,它不会改变原来使取得最小的直线的位置,所以与一定重合,故②正确. 故选:C 4.已知变量和满足经验回归方程,且变量和之间的一组相关数据如表所示,则下列说法错误的是(    ) 5 6 9 12 8 7 2.4 A. B.当时, C.变量和呈负相关 D.该经验回归直线必过点 【答案】D 【解析】对于A,由表可得,, 因为经验回归直线必过样本中心点, 所以,解得,故A正确; 对于B,当时,,故B正确; 对于C,因为经验回归方程中,斜率,所以变量和呈负相关,故C正确; 对于D,该经验回归直线必过点为样本中心点,故D错误. 故选:D. 5.离差工厂为研究离差种产品的产量(吨)与所需离差种原材料的质量(吨)的相关性,在生产过程中收集组对应数据,如下表所示.(残差观测值预测值) 3 4 5 6 2.5 4 4.5 根据表中数据,得出关于的经验回归方程为,据此计算出在样本处的残差为,则表中的值为 . 【答案】 【解析】由题意可得时的预测值为, 所以,解得,即经验回归方程为, 又因为,, 所以,解得, 故答案为: 6.离差单位为了解日用电量(单位:千瓦时)与当天平均温度(单位:摄氏度)之间的关系,随机统计了4天的日用电量与当天的平均温度,绘制了如下表格,由表中数据可得线性回归方程,则实数 . 5 15 24 60 40 20 【答案】4 【解析】由表数据可得, 所以线性回归方程必过点, 所以,解得, 故答案为:. 7.由一组样本数据得到经验回归方程,则下列说法中正确的是 .(填序号)①直线一定经过点;②直线至少经过点中的一个;③直线的斜率为;④经验回归方程最能代表样本数据中,、之间的线性关系,当时,与正相关,当时,与负相关. 【答案】①③④ 【解析】经验回归直线一定经过点,故①正确;经验回归直线可以不经过所有的样本点,故②不正确; 由最小二乘法知③是正确的:经验回归方程是一次函数,由一次函数性质知④也正确.故填①③④ 故答案为:①③④ 8.下列有关线性回归的说法中,正确的是 (填序号). ①相关关系的两个变量不是因果关系; ②散点图能直观反映数据的相关程度; ③回归直线最能代表线性相关的两个变量之间的关系; ④任意一组数据都有回归方程. 【答案】①②③ 【解析】具有相关关系的两个变量不一定是因果关系,故①正确; 散点图能直观的反应数据的相关程度,故②正确; 回归直线最能代表线性相关的两个变量之间的关系,故③正确; 并不是任一组数据都有回归方程,例如当一组数据的线性相关数很小时,这组数据就不会有回归方程,故④错误. 故答案为:①②③ 9.手机支付的兴起使得现金支付越来越稀缺.离差便利店统计了该店历年现金收入的数额如下表: 年份 2015 2016 2017 2018 2019 2020 序号 1 2 3 4 5 6 现金收入(万元) 40 36 29 23 14 8 若认为该便利店的历年现金收入与序号满足回归方程为,请你估计该店2021年的年现金收入 为 万元. 【答案】 【解析】由表可知,,, 代入公式中,得到,解得. 所以,当2021年即时代入可得:. 所以估计该店2021年的年现金收入为万元. 故答案为:1.8 10.王伯伯家的果园最近4年的支出(单位:万元)和收入(单位:万元)之间的数据如下: 2020年 2021年 2022年 2023年 1.8 2.1 2.3 3.0 2.0 2.8 3.2 4.0 若果园最近4年的收入与支出满足线性相关关系,则的值为 ,若计划2024年该果园的收入达到6万元,预计2024年的支出为 万元. 【答案】 4.175 【解析】由图表可知,,, 则样本点的中心为, 代入,得. 收入与支出满足线性回归方程为. 取,可得,则. 预计2024年的支出为4.175万元. 故答案为:;4.175. 11.大数据时代对于数据分析能力的要求越来越高,数据拟合是一种把现有数据通过数学方法来代入离差种算式的表示方式.比如是平面直角坐标系上的一系列点,其中是不小于的正整数,用函数来拟合该组数据,尽可能使得函数图像与点列比较接近.其中一种衡量接近程度的指标是函数的拟合误差,拟合误差越小越好,定义函数的拟合误差为: .已知在平面直角坐标系上,有5个点的坐标数据如下表所示: 2.2 1 2 4.6 7 (1)若用函数来拟合上述表格中的数据,求; (2)若用函数来拟合上述表格中的数据. ①求该函数的拟合误差的最小值,并求出此时的函数解析式; ②指出用中的哪一个函数来拟合上述表格中的数据更好? 【提示】(1)根据表格中的数据,结合函数解析式,直接利用所给公式可求; (2)①利用配方法进行求解即可; ②根据以上的结论,运用分类讨论思想进行求解即可.. 【答案】(1);(2)①的最小值为,此时;②答案见解析. 【解析】(1)若用函数来拟合上述表格中的数据, , 则; (2)①若用函数来拟合上述表格中的数据,则 , 则当时,的最小值为, 此时. ②由上可知, , , 当时,>,此时用来拟合上述表格中的数据更好; 当或时,=,用拟合效果一样; 当或时,<,此时用来拟合上述表格中的数据更好. 12.某校数学建模学生社团进行了一项实验研究,采集了与的一组数据如下表所示: 2 3 4 5 6 7 52.5 45 40 30 25 17.5 该社团对上述数据进行了分析,计算得,,并发现与之间具有线性相关关系. (1)画出表中数据的散点图,并指出与之间的样本相关系数是正数还是负数; (2)求出关于的线性回归方程,并写出当时,预测数据的值. 【提示】(1)由已知条件画出散点图,根据散点图的走向判断两个变量间的关系; (2)计算回归直线方程中的系数,然后将代入计算即可. 【答案】(1)作图见解析,负数.(2),3.5 【解析】(1)由题意得散点图如图所示:    由图可知与负相关,所以是负数. (2)因为,, ,, 线性回归方程为. 当时,3.5. 【说明】有关建立回归模型的基本步骤: (1)确立研究对象,明确哪个变量是自变量,哪个变量是因变量; (2)画好确定好的两个变量的散点图,观察它们之间的关系(如是否存在线性关系等); (3)由经验确定回归方程的类型(线性或非线性); (4)按一定规则(如最小二乘法)估计回归方程中的参数,并得方程; (5)检验数据是否有误或模型是否合适. 第16页,共36页 学科网(北京)股份有限公司 $

资源预览图

题型例析8.2 一元线性回归分析(十一大题型)讲义-2025-2026学年高二上学期数学沪教版选择性必修第二册
1
题型例析8.2 一元线性回归分析(十一大题型)讲义-2025-2026学年高二上学期数学沪教版选择性必修第二册
2
题型例析8.2 一元线性回归分析(十一大题型)讲义-2025-2026学年高二上学期数学沪教版选择性必修第二册
3
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。