第31讲 一元线性回归模型及其应用(思维导图+4知识点+六大考点+过关检测)-【寒假自学课】2025年高二数学寒假提升精品讲义(人教A版2019)

2025-01-16
| 2份
| 66页
| 1126人阅读
| 75人下载
精品
温老师高中数学铺子
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 高中数学人教A版选择性必修第三册
年级 高二
章节 8.2 一元线性回归模型及其应用
类型 教案-讲义
知识点 -
使用场景 寒暑假-寒假
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 8.71 MB
发布时间 2025-01-16
更新时间 2025-01-16
作者 温老师高中数学铺子
品牌系列 上好课·寒假轻松学
审核时间 2025-01-16
下载链接 https://m.zxxk.com/soft/50032199.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

第31讲 一元线性回归模型及其应用 模块一 思维导图串知识 模块二 基础知识全梳理(吃透教材) 模块三 核心考点举一反三 【考点一:线性回归方程的相关概念】 【考点二:散点图及其应用】 【考点三:样本中心点的应用】 【考点四:残差分析与决定指数计算】 【考点五:线性回归分析综合应用】 【考点六:非线性回归分析综合应用】 模块四 小试牛刀过关测 1.掌握一元线性回归模型的基本构成,包括自变量、因变量和回归参数; 2.熟练运用最小二乘法进行参数估计,理解其原理; 3.通过残差评估模型拟合度,识别模型假设的有效性;理解R²作为衡量模型解释力的指标,并能计算。 4.准确解释回归系数,理解其在实际问题中的含义; 5.学会从统计角度分析和解释回归结果,包括模型拟合度和预测能力 一、一元线性回归模型 1、一元线性回归模型 我们称 为关于的一元线性回归模型,其中称为因变量或响应变量,称为自变量或解释变量;和为模型的未知参数,称为截距参数,称为斜率参数;是与之间的随机误差. 2、随机误差 在线性回归模型中,和为模型的未知参数,是与之间的误差,通常为随机变量,称为随机误差.它的均值,方程. 线性回归模型的完整表达式为 , 在此模型中,随机误差的方差越小,用预报真实值的精度越高. 二、一元线性回归模型参数的最小二乘法 1、经验回归方程的求解法:最小二乘法 回归直线方程过样本点的中心,是回归直线方程最常用的一个特征; 我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估计,其中称为回归系数,它实际上也就是经验回归直线的斜率,为截距. 其中 2、求经验回归方程的步骤 ①作出散点图,判断两变量是否具有线性相关关系,若具有线性相关关系,则可求其经验回归方程; ②列表求出,的值; ③利用公式先计算,再根据经验回归直线过样本点的中心计算; ④写出经验回归方程. 求经验回归方程,关键在于正确求出系数,,由于计算量较大,所以计算时要仔细谨慎、分层进行,避免因计算产生错误要特别注意,只有两个变量呈线性相关关系时,求出的经验回归方程才有意义. 3、经验回归方程的性质 ①经验回归直线一定过点,点通常称为样本点的中心; ②一次函数的单调性由的符号决定,函数递增的充要条件是;函数递减的充要条件是.这说明:与正相关的充要条件是;与负相关的充要条件是. ③在经验回归方程中,是经验回归直线的斜率,是截距.一般地,当回归系数时,说明两个变量呈正相关关系,它的意义是当每增大一个单位时,平均增大个单位;当时,说明两个变量呈负相关关系,它的意义是当每增大一个单位时,平均减小个单位. 三、残差 1、残差 对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差. 2、残差图 作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好. 3、残差分析 残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.其步骤为:计算残差化残差图在残差图中分析残差特性. 四、决定系数 1、残差平方和 残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差. 2、决定系数 决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力. ,越大,即拟合效果越好,越小,模型拟合效果越差. 3、决定系数与相关系数的联系与区别 ①相关系数反映两个变量的相关关系的强弱及正相关或负相关,决定系数反映回归模型的拟合效果. ②在含有一个解释变量的线性模型中,决定系数的数值是相关系数的平方,其变化范围为,而相关系数的变化范围为. ③当相关系数接近于1时,说明两变量的相关性较强,当接近于0时,说明两变量的相关性较弱;而当接近于1时,说明经验回归方程的拟合效果较好. 【考点一:线性回归方程的相关概念】 一、单选题 1.(24-25高二下·全国·单元测试)船员人数y关于船的吨位x的回归直线方程是.如果两艘轮船吨位相差1000吨.则船员平均人数相差(    ) A.40 B.57 C.60 D.95 2.(23-24高二下·辽宁朝阳·期末)已知一组数据满足线性回归关系,且经验回归方程为,若,则(    ) A.30 B.60 C.630 D.1200 二、多选题 3.(23-24高二下·山西太原·期末)使用经验回归方程进行预测时,下列结论正确的是(    ) A.经验回归方程只适用于所研究的样本的总体 B.经验回归方程一般都有时效性 C.解释变量的取值离样本数据的范围越远,经验回归方程的预报效果越好 D.经验回归方程得到的预报值就是响应变量的精确值 4.(24-25高二下·全国·单元测试)四名同学根据各自的样本数据研究变量,之间的相关关系,并求得回归直线方程,下列选项中,正确的是(    ) A.与负相关且 B.与负相关且 C.与正相关且 D.与正相关且 5.(23-24高二下·河南南阳·阶段练习)已知变量y与x存在线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则下列结论正确的是(    ) A.变量y与x具有负的线性相关关系 B.若r表示y与x之间的样本相关系数,则 C.当变量时,变量 D.当变量时,变量y为90左右 【考点二:散点图及其应用】 一、单选题 1.(23-24高二下·浙江·期中)如下表给出5组数据,为选出4组数据使其线性相关程度最大,且保留第1组数据,则应去掉(    ) 1 2 3 4 5 5 4 3 2 3 2 7 1 A. B. C. D. 2.(23-24高二下·天津西青·期末)鸢是鹰科的一种鸟,《诗经·大雅·早麓》曰“鸢飞戾天,鱼跃于渊”鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量,通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:),绘制对应散点图(图2)如下:    计算得样本相关系数为0.8642,利用最小二乘法求得相应的经验回归方程为.根据以上信息,如下判断正确的为(    ) A.花萼长度与花瓣长度不存在相关关系; B.花萼长度与花瓣长度负相关; C.花萼长度为的该品种鸢尾花的花瓣长度的平均值约为; D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.8642. 3.(23-24高二下·河南南阳·阶段练习)某中学课外活动小组为了研究经济走势,根据该市1999-2021年的GDP(国内生产总值)数据绘制出下面的散点图,该小组选择了如下2个模型来拟合GDP值随年份的变化情况,模型一:;模型二:,下列说法正确的是(    ) A.变量与负相关 B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况 C.变量与有较强的线性相关性 D.若选择模型二,的图象不一定经过点 二、多选题 4.(23-24高二下·河北沧州·期末)如图所示的散点图中,可选取的拟合曲线为(    ) A. B. C. D. 三、解答题 5.(24-25高二下·全国·课后作业)鲫鱼产卵后,鱼卵的孵化时间(单位:天)会受到水温(单位:℃)的影响,下面是某生物研究小组进行8次观察实验收集到的数据: 水温x/℃ 15 16 18 20 21 23 26 29 孵化时间y/天 8 7 6 5 5 4 3 2 (1)画出上述成对数据的散点图; (2)已知水温对鱼卵的孵化时间可表示为一元线性回归模型,请在散点图中近似地作出表示孵化时间y和水温x之间关系的直线,并说明该一元线性回归模型的自变量与因变量. 【考点三:样本中心点的应用】 一、单选题 1.(23-24高二下·天津北辰·期中)如果记录了x,y的几组数据分别为,,,,那么y关于x的经验回归直线必过点(    ) A. B. C. D. 2.(23-24高二下·天津·期中)已知某种商品的广告费投入与销售额之间有如下对应数据:根据上表可得回归方程,计算得,则当投入为6时,销售额的预报值为(   ) 2 4 5 6 8 30 40 50 60 70 A.50 B.60 C.57 D.85 3.(23-24高二下·黑龙江哈尔滨·期末)技术在我国已经进入调整发展的阶段,手机的销量也逐渐上升,某手机商城统计了最近5个月手机的实际销量,如下表所示: 时间 1 2 3 4 5 销售量(千只) 0.5 0.8 1.0 1.2 1.5 若与线性相关,且线性回归方程为,则下列说法正确的是(    ) A.由题中数据可知,变量与负相关 B.当解释变量每增加1个单位时,预报变量平均增加个单位 C.线性回归方程中 D.可以预测时,该商场手机销量约为1.72(千只) 4.(23-24高二下·江西·阶段练习)已知由样本数据组成的一个样本,变量具有线性相关关系,其经验回归方程为,并计算出变量之间的相关系数为,则经验回归直线经过(    ) A.第一、二、三象限 B.第二、三、四象限 C.第一、二、四象限 D.第一、三、四象限 5.(23-24高二下·河南南阳·期末)某商店记录了某种产品近5个月的月销售量(千台)如下表,样本中心点为.由于保管不善,记录的5个数据中有两个数据看不清楚,现用代替,已知,则下列结论正确的是(    ) 第个月 1 2 3 4 5 月销售量 2.5 4 5 A.在确定的条件下,去掉样本点,则样本的相关系数增大 B.在确定的条件下,样本的相关系数 C.在确定的条件下,经过拟合,发现数据基本符合线性回归方程,则 D.在确定的条件下,经过拟合,发现数据基本符合线性回归方程,则可预计该款商品第6个月的销售量为6280台 【考点四:残差分析与决定指数计算】 一、单选题 1.(24-25高二下·全国·课后作业)某团队尝试用回归模型甲、乙、丙、丁描述人的1000米跑步成绩与肺活量的关系,已知模型甲、乙、丙、丁对应的决定系数分别为,则拟合效果最好的模型是(    ) A.甲 B.乙 C.丙 D.丁 2.(23-24高二下·浙江宁波·期中)如图,为某组数据的散点图,由最小二乘法计算得到回归直线的方程为,相关系数为,决定系数为.若经过残差分析后去掉点P,剩余的点重新计算得到回归直线的方程为,相关系数为,决定系数为.则下列结论一定正确的是(    ) A. B. C. D., 3.(23-24高二下·安徽亳州·期末)某市旅游局对全市各旅游景区的环境进行综合治理,投入不同数额的经费(千万元),得到各旅游景区收益的增加值(万元),对应数据如下表所示: 投人的治理经费(单位:千万元) 1 2 3 4 5 6 7 收益的增加值(单位:万元) 2 3 2 5 7 7 9 若与的回归直线方程为,则相应于点的残差是(    ) A. B.0.358 C. D.8.642 4.(23-24高二下·吉林长春·期末)对于数据组,如果由线性回归方程得到的自变量的估计值是,那么将称为样本点处的残差.某商场为了给一种新商品进行合理定价,将该商品按事先拟定的价格进行试销,得到下表所示数据.若某商品销量y(单位:件)与单价x(单位:元)之间的线性回归方程为,且样本点处的残差为2,则(    ) 单价x/元 8.2 8.4 8.6 8.8 销量y/件 84 82 78 m A.66 B.68 C.70 D.72 二、填空题 5.(24-25高二下·全国·课后作业)某蔬菜的保鲜时间(小时)与存放温度样本数据如下表所示: 存放温度 21 15 10 6 3 保鲜时间小时 6 14 26 33 41 建立关于的一元线性回归模型,预测存放温度为时,这种蔬菜的保鲜时间约为 小时(,及结果保留到整数);该模型的决定系数 (保留2位小数).附:. 6.(24-25高二下·全国·课后作业)近几年,我国新能源汽车产业进入了加速发展的阶段,呈现市场规模、发展质量“双提升”的良好局面.新能源汽车的核心部件是动力电池,其中的主要成分是碳酸锂.下表是某地2023年3月1日至2023年3月5日电池级碳酸锂的价格与日期的统计数据: 日期代码 1 2 3 4 5 电池级碳酸锂价格(十万元/吨) 4.1 3.9 3.8 3.9 根据表中数据,得出关于的经验回归方程为,根据数据计算出在样本中心点处的残差为,则决定系数的值为 (结果保留两位小数). 【考点五:线性回归分析综合应用】 一、解答题 1.(23-24高二上·上海·课后作业)某连锁日用品销售公司下属5个社区便利店某月的销售额与利润额如下表所示. 便利店编号 1 2 3 4 5 销售额x/万元 30 60 45 80 89 利润额y/万元 2.3 3.5 3.2 4.0 5.3 (1)绘制销售额和利润额的散点图; (2)若销售额和利润额具有线性相关关系,试计算利润额y与销售额x的经验回归直线方程. 2.(24-25高二下·全国·课后作业)某班10名学生的摸底考试成绩和期末考试成绩如下: 摸底成绩 50 35 40 55 80 60 65 35 90 50 期末成绩 53 51 56 68 87 71 46 31 79 68 计算得:,. (1)画出散点图;    (2)建立一个回归直线方程,用摸底考试成绩来预测期末考试成绩(精确到0.1). 附:,. 3.(24-25高二下·全国·课后作业)铁观音性寒、味甘、酸、归肺、脾经,具有清热降火、健脾消脂、提神醒脑、生津利尿的功效,是中国十大名茶之一.为促使各生产厂家健康科学发展,某调研机构随机抽取家铁观音生产厂家,整理得到生产铁观音的单位成本(元/盒)与铁观音的产量(千盒)之间的关系数据如下: 铁观音的产量千盒 生产铁观音的单位成本(元/盒) (1)根据所给数据,求生产铁观音的单位成本关于铁观音产量的一元线性回归方程,并估计单位成本为元/盒时产量为多少(计算过程保留两位小数); (2)根据(1)中的回归模型,计算各组残差,并计算残差的平方和. 4.(24-25高二下·全国·单元测试)如图所示的是某高校2016至2022年高考报名学生人数(单位:千人)的折线图.    (1)由折线图看出,可用线性回归模型拟合和的关系,请用相关系数加以说明(精确到0.01); (2)建立关于的回归直线方程,并预测2023年该高校高考报名人数. 参考数据:,,,. 参考公式:相关系数,回归直线方程中的系数分别为,. 5.(23-24高二下·山东泰安·期末)2023年全国竞走大奖赛,暨世锦赛及亚运会选拔赛3月4日在安徽黄山开赛.重庆队的贺相红以2小时22分55秒的成绩打破男子35公里竞走亚洲纪录.某田径协会组织开展竞走的步长和步频之间的关系的课题研究,得到相应的试验数据: 步频(单位:s) 0.28 0.29 0.30 0.31 0.32 步长(单位:) 90 95 99 103 117 (1)根据表中数据,得到步频和步长近似为线性相关关系,求出关于的回归直线方程,并利用回归方程预测,当步长为时,步频约是多少? (2)记,其中为观测值,为预测值,为对应的残差,求(1)中步频为0.30的残差. 参考数据:,.参考公式:,. 6.(23-24高二下·重庆·阶段练习)某公司为了解年研发资金(单位:亿元)对年产值(单位:亿元)的影响,对公司近8年的年研发资金和年产值(,)的数据对比分析中,选用了两个回归模型,并利用最小二乘法求得相应的关于的经验回归方程: ①;②. (1)求的值; (2)已知①中的残差平方和,②中的残差平方和,请根据决定系数选择拟合效果更好的经验回归方程,并利用该经验回归方程预测年研发资金为20亿元时的年产值. 参考数据:,,,. 参考公式;刻画回归模型拟合效果的决定系数. 【考点六:非线性回归分析综合应用】 一、解答题 1.(23-24高二下·广东·期中)某地政府为提高当地农民收入,指导农民种植药材,取得较好的效果.以下是某农户近5年种植药材的年收入的统计数据: 年份 2019 2020 2021 2022 2023 年份代码 1 2 3 4 5 年收入(千元) 59 61 64 68 73 (1)根据表中数据,现决定使用模型拟合与之间的关系,请求出此模型的回归方程;(结果保留一位小数) (2)统计学中常通过计算残差的平方和来判断模型的拟合效果.在本题中,若残差平方和小于0.5,则认为拟合效果符合要求.请判断(1)中回归方程的拟合效果是否符合要求,并说明理由. 参考数据及公式:,.设,则,. 2.(23-24高二下·贵州黔西·阶段练习)为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量(单位:亿元)与研发人员增量(人)的10组数据.现用模型①,②分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图. 根据收集到的数据,计算得到下表数据,其中. 7.5 2.25 82.50 4.50 12.14 2.88 (1)根据残差图,判断应选择哪个模型;(无需说明理由) (2)根据(1)中所选模型,求出关于的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少多少人?(精确到1) 3.(23-24高二下·宁夏银川·阶段练习)红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数(个)和平均温度有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值. 参考数据 17713 714 27 81.3 (1)根据散点图判断,与(其中为自然对数的底数)哪一个更适合作为平均产卵数(个)关于平均温度()的回归方程类型?(给出判断即可,不必说明理由) (2)由(1)的判断结果及表中数据,求出关于的回归方程.(计算结果精确到0.1) 附:回归方程中 4.(23-24高二下·山东青岛·期中)肥胖不仅影响形体美,而且给生活带来不便,此外还有关节软组织损伤、心脏病、糖尿病、脂肪肝、痛风等危害.小王通过运动和节食进行减肥,并将时间x(单位:周)和体重(单位:)记录制作如下统计表: 1 2 3 4 6 8 90.1 87.6 87.2 86.2 84.2 84.3 (1)若和满足经验回归模型,求; (2)求该模型的决定系数,并判断该经验回归方程是否有价值(认为有价值); (3)当某组数据残差的绝对值不超过0.3时,称该组数据为“身材有效管理数据”,现从这六组数据中任意抽取两组,设抽取的“身材有效管理数据”的个数为,求的分布列和期望. 附:经验回归方程中,, 参考数据:. 5.(23-24高二上·重庆·阶段练习)混凝土的抗压强度x较容易测定,而抗剪强度y不易测定,工程中希望建立一种能由x推算y的经验公式,下表列出了现有的9对数据,分别为,,…,. x 141 152 168 182 195 204 223 254 277 y 23.1 24.2 27.2 27.8 28.7 31.4 32.5 34.8 36.2 以成对数据的抗压强度x为横坐标,抗剪强度y为纵坐标作出散点图,如图所示. (1)从上表中任选2个成对数据,求该样本量为2的样本相关系数r.结合r值分析,由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的线性相关关系? (2)根据散点图,我们选择两种不同的函数模型作为回归曲线,根据一元线性回归模型及最小二乘法,得到经验回归方程分别为:①,②.经验回归方程①和②的残差计算公式分别为,,. (ⅰ)求; (ⅱ)经计算得经验回归方程①和②的残差平方和分别为,,经验回归方程①的决定系数,求经验回归方程②的决定系数. 附:相关系数,决定系数,. 一、单选题 1.(24-25高二下·全国·课后作业)关于线性回归的描述,有下列命题: ①回归直线一定经过样本点的中心; ②相关系数r越大,线性相关程度越强; ③决定系数越接近1拟合效果越好; ④随机误差平方和越小,拟合效果越好. 其中正确的命题个数为(    ) A.1 B.2 C.3 D.4 2.(23-24高二下·北京房山·期末)如图 ①、②、③、④ 分别为不同样本数据的散点图,其对应的线性相关系数分别为,则中最大的是(    ) A. B. C. D. 3.(23-24高二下·广东江门·期末)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了6次试验,收集数据如下表所示,建立加工时间关于零件数的一元线性回归模型,则回归直线必过点(    ) 零件数个 50 60 70 80 90 100 加工时间min 88 95 102 108 115 122 A. B. C. D. 4.(23-24高二下·北京房山·期末)为了研究儿子身高与父亲身高的关系,某机构调查了某所高校14名男大学生的身高及其父亲的身高(单位:cm),得到的数据如表所示. 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 父亲身高 174 170 173 169 182 172 180 172 168 166 182 173 164 180 儿子身高 176 176 170 170 185 176 178 174 170 168 178 172 165 182 父亲身高的平均数记为,儿子身高的平均数记为,根据调查数据,得到儿子身高关于父亲身高的回归直线方程为.则下列结论中正确的是(    ) A.与正相关,且相关系数为 B.点不在回归直线上 C.每增大一个单位,增大个单位 D.当时,.所以如果一位父亲的身高为176cm,他儿子长大成人后的身高一定是177cm 5.(23-24高二下·江苏南通·阶段练习)已知表格中的数据y关于x的线性经验回归方程为, x 1 2 3 4 5 y 5 15 35 t 140 则样本点的残差为(    ) A.9 B.96 C.105 D. 6.(23-24高二下·福建泉州·期末)某公司为了解年研发资金x(单位:亿元)对年产值y(单位:亿元)的影响,对公司近8年的年研发资金和年产值(,)的数据对比分析中,利用最小二乘法求得y关于x的经验回归方程为,且经数据处理得到,,,则(    ) A. B.49.92 C.62.08 D.120.98 二、多选题 7.(2024·浙江温州·一模)观察下列散点图的分布规律和特点,其中两个变量存在相关关系的有(   ) A. B. C. D. 8.(2024高二·全国·专题练习)如图是根据一组观测数据得到海拔千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为,决定系数为;根据非线性回归模型得到经验回归方程为,决定系数为,则下列说法正确的是(   ) A.由散点图可知,大气压强与海拔高度负相关 B.由方程可知,海拔每升高1千米,大气压强必定降低kPa C.由方程可知,样本点的残差为 D.对比两个回归模型,结合实际情况,方程的预报效果更好 9.(四川省雅安市等8市2024-2025学年高二上学期(12月)第一次诊断性考试数学试题)某直播带货公司统计了今年1月份至5月份的某种产品的月销量(单位:千件)如下表所示: 月份 1 2 3 4 5 月销量 2.4 3.1 4 5 5.5 已知变量与之间具有线性相关关系,通过最小二乘法求得的经验回归直线方程为,则下列说法正确的是(   ) 参考公式:相关系数,决定系数. A. B. C.每增加1,一定增加0.81 D. 三、填空题 10.(24-25高二下·全国·课后作业)某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表,已知,则时,残差为 . 广告支出费用/万元 1 3 4 6 11 销售量万件 1.9 3.2 4.4 6.3 12.7 11.(23-24高二下·湖北十堰·期末)已知一系列样本点满足,,由最小二乘法得到与的回归方程,现用决定系数来判断拟合效果(越接近1,拟合效果越好),若,则 .(参考公式:决定系数) 四、解答题 12.(24-25高二上·新疆喀什·阶段练习)某机构统计了新驾驶员一年内扣除的驾照分(单位:分)及该年对应的新驾驶员数量(单位:万人),得到如下数据表格: 新驾驶员一年内扣除的驾照分(分) 3 4 5 6 7 新驾驶员数量(万人) 1 1.1 1.5 1.9 2.2 已知与线性相关. (1)求关于的线性回归方程; (2)求与的相关系数(精确到0.01). 参考数据:. 参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为 13.(2024·浙江台州·二模)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:令,数据经过初步处理得:    44 4.8 10 40.3 1.612 19.5 8.06 现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数. (1)请从相关系数的角度,分析哪一个模型拟合程度更好? (2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少? (3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量影响,设随机变量服从正态分布,且满足.在(2)的条件下,求该公司年净利润的最大值大于1000(百万元)的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量). 附:①相关系数, 回归直线中公式分别为,; ②参考数据:,,,. 14.(22-23高二下·黑龙江大兴安岭地·期中)碳排放是引起全球气候变暖问题的主要原因.2009年世界气候大会,中国做出了减少碳排放的承诺,2010年被誉为了中国低碳创业元年.2020年中国政府在联合国大会发言提出:中国二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.碳中和是指主体在一定时间内产生的二氧化碳或温室气体排放总量,通过植树造林、节能减排等形式,以抵消自身产生的二氧化碳或温室气体排放量,实现正负抵消,达到相对“零排放”.如图为本世纪来,某省的碳排放总量的年度数据散点图.该数据分为两段,2010年前该省致力于经济发展,没有有效控制碳排放;从2010年开始,该省通过各种举措有效控制了碳排放.用x表示年份代号,记2010年为.用h表示2010年前的年度碳排放量,y表示2010年开始的年度碳排放量. 表一:2011~2017年某省碳排放总量年度统计表(单位:亿吨) 年份 2011 2012 2013 2014 2015 2016 2017 年份代号x 1 2 3 4 5 6 7 年度碳排放量y(单位:亿吨) 2.54 2.635 2.72 2.80 2.885 3.00 3.09 (1)若关于x的线性回归方程为,根据回归方程估计若未采取措施,2017年的碳排放量;并结合表一数据,说明该省在控制碳排放举措下,减少排碳多少亿吨? (2)根据,设2011~2017年间各年碳排放减少量为,建立z关于x的回归方程. ①根据,求表一中y关于x的回归方程(精确到0.001); ②根据①所求的回归方程确定该省大约在哪年实现碳达峰? 参考数据:. 参考公式:. 15.(24-25高二上·河北沧州·阶段练习)近年来,政府相关部门引导乡村发展旅游业的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲、乙两名同学一起收集了6家农户的数据,进行回归分析,得到两个回归模型:模型①;模型②.对以上两个回归方程进行残差分析,得到下表: 种植面积亩 2 3 4 5 7 9 每亩种植管理成本/百元 25 24 21 22 16 14 模型① 估计值 25.27 23.62 21.97 17.02 13.72 残差 0.38 0.28 模型② 估计值 26.84 20.17 18.83 17.31 16.46 残差 0.83 3.17 注:表中. (1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好; (2)视残差的绝对值超过1.5的数据为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求其经验回归方程. 参考公式:. 16.(24-25高二上·重庆·阶段练习)一年一度的“双11”促销活动落下帷幕,各大电商平台发布的数据显示,在消费品以旧换新、家电政府补贴等促消费政策和活动的带动下,消费市场潜能加速释放,带动相关商品销售保持增长. 经过调研,得到2019年到2024年“双11”活动当天某电商平台线上日销售额(单位: 百亿元)与年份(第年)的6组数据(时间变量的取值依次为),对数据进行处理,得到如下散点图(图1)及一些统计量的值. 其中. 48.7 3.5 91 1204 1.1 9.4 388.1 分别用两种模型:①;②进行拟合,得到相应的回归方程,并进行残差分析,得到如图所示的残差图(图2)(残差值真实值预测值). (1)根据题中信息,通过残差图比较模型①,②的拟合效果,应选择哪一个模型进行拟合?请说明理由; (2)根据(1)中所选模型, (i)求出关于的经验回归方程(系数精确到0.1); (ⅱ)若该电商平台每年活动当天线上日销售额与当日营销成本及年份存在线性关系: ,则在第几年活动当日营销成本的预测值最大? 参考公式: ;参考数据:. 17.(23-24高二下·宁夏银川·阶段练习)某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y(万人)与年份x的数据: 第x年 1 2 3 4 5 6 7 8 9 10 旅游人数y(万人) 300 283 321 345 372 435 486 527 622 800 该景点为了预测2021年的旅游人数,建立了y与x的两个回归模型: 模型①:由最小二乘法公式求得y与x的线性回归方程; 模型②:由散点图的样本点分布,可以认为样本点集中在曲线的附近. (1)根据表中数据,求模型②的回归方程.(a精确到个位,b精确到0.001). (2)根据下列表中的数据,比较两种模型的决定系数,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位). 回归方程 ① ② 30407 14607 参考公式、参考数据及说明: ①, ②刻画回归效果的决定系数; ③参考数据: , 5.5 449 6.05 83 4195 9.00 表中. ( 5 )原创精品资源学科网独家享有版权,侵权必究! 学科网(北京)股份有限公司 $$ 第31讲 一元线性回归模型及其应用 模块一 思维导图串知识 模块二 基础知识全梳理(吃透教材) 模块三 核心考点举一反三 【考点一:线性回归方程的相关概念】 【考点二:散点图及其应用】 【考点三:样本中心点的应用】 【考点四:残差分析与决定指数计算】 【考点五:线性回归分析综合应用】 【考点六:非线性回归分析综合应用】 模块四 小试牛刀过关测 1.掌握一元线性回归模型的基本构成,包括自变量、因变量和回归参数; 2.熟练运用最小二乘法进行参数估计,理解其原理; 3.通过残差评估模型拟合度,识别模型假设的有效性;理解R²作为衡量模型解释力的指标,并能计算。 4.准确解释回归系数,理解其在实际问题中的含义; 5.学会从统计角度分析和解释回归结果,包括模型拟合度和预测能力 一、一元线性回归模型 1、一元线性回归模型 我们称 为关于的一元线性回归模型,其中称为因变量或响应变量,称为自变量或解释变量;和为模型的未知参数,称为截距参数,称为斜率参数;是与之间的随机误差. 2、随机误差 在线性回归模型中,和为模型的未知参数,是与之间的误差,通常为随机变量,称为随机误差.它的均值,方程. 线性回归模型的完整表达式为 , 在此模型中,随机误差的方差越小,用预报真实值的精度越高. 二、一元线性回归模型参数的最小二乘法 1、经验回归方程的求解法:最小二乘法 回归直线方程过样本点的中心,是回归直线方程最常用的一个特征; 我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估计,其中称为回归系数,它实际上也就是经验回归直线的斜率,为截距. 其中 2、求经验回归方程的步骤 ①作出散点图,判断两变量是否具有线性相关关系,若具有线性相关关系,则可求其经验回归方程; ②列表求出,的值; ③利用公式先计算,再根据经验回归直线过样本点的中心计算; ④写出经验回归方程. 求经验回归方程,关键在于正确求出系数,,由于计算量较大,所以计算时要仔细谨慎、分层进行,避免因计算产生错误要特别注意,只有两个变量呈线性相关关系时,求出的经验回归方程才有意义. 3、经验回归方程的性质 ①经验回归直线一定过点,点通常称为样本点的中心; ②一次函数的单调性由的符号决定,函数递增的充要条件是;函数递减的充要条件是.这说明:与正相关的充要条件是;与负相关的充要条件是. ③在经验回归方程中,是经验回归直线的斜率,是截距.一般地,当回归系数时,说明两个变量呈正相关关系,它的意义是当每增大一个单位时,平均增大个单位;当时,说明两个变量呈负相关关系,它的意义是当每增大一个单位时,平均减小个单位. 三、残差 1、残差 对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差. 2、残差图 作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好. 3、残差分析 残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.其步骤为:计算残差化残差图在残差图中分析残差特性. 四、决定系数 1、残差平方和 残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差. 2、决定系数 决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力. ,越大,即拟合效果越好,越小,模型拟合效果越差. 3、决定系数与相关系数的联系与区别 ①相关系数反映两个变量的相关关系的强弱及正相关或负相关,决定系数反映回归模型的拟合效果. ②在含有一个解释变量的线性模型中,决定系数的数值是相关系数的平方,其变化范围为,而相关系数的变化范围为. ③当相关系数接近于1时,说明两变量的相关性较强,当接近于0时,说明两变量的相关性较弱;而当接近于1时,说明经验回归方程的拟合效果较好. 【考点一:线性回归方程的相关概念】 一、单选题 1.(24-25高二下·全国·单元测试)船员人数y关于船的吨位x的回归直线方程是.如果两艘轮船吨位相差1000吨.则船员平均人数相差(    ) A.40 B.57 C.60 D.95 【答案】C 【分析】线性回归方程是船员人数吨位,故回归系数为0.06,由于两艘轮船吨位相差1000吨,故可求船员平均人数的差值. 【详解】由于船员人数y关于船的吨位x的回归直线方程是, 两艘轮船吨位相差1000吨,所以船员平均人数的差值是. 故选:C. 2.(23-24高二下·辽宁朝阳·期末)已知一组数据满足线性回归关系,且经验回归方程为,若,则(    ) A.30 B.60 C.630 D.1200 【答案】D 【分析】根据样本中心点在回归直线方程上代入计算可得结果. 【详解】易知样本数据的中心点在回归直线方程上, 易知,所以, 即,可得. 故选:D 二、多选题 3.(23-24高二下·山西太原·期末)使用经验回归方程进行预测时,下列结论正确的是(    ) A.经验回归方程只适用于所研究的样本的总体 B.经验回归方程一般都有时效性 C.解释变量的取值离样本数据的范围越远,经验回归方程的预报效果越好 D.经验回归方程得到的预报值就是响应变量的精确值 【答案】AB 【分析】根据给定条件,结合经验回归方程的意义逐项判断即可. 【详解】对于A,经验回归方程只适用于所研究的样本的总体,A正确; 对于B,经验回归方程适用于有相关关系的两个变量,两者的变化可能会随时间的推移, 互相影响的情况不同,因此经验回归方程一般都有时效性,B正确; 对于C,解释变量的取值范围会影响经验回归方程的适用范围, 解释变量的取值离样本数据的范围越远,经验回归方程的预报效果越差,C错误; 对于D,经验回归方程得到的是响应变量的预报值,不是响应变量的精确值,D错误; 故选:AB 4.(24-25高二下·全国·单元测试)四名同学根据各自的样本数据研究变量,之间的相关关系,并求得回归直线方程,下列选项中,正确的是(    ) A.与负相关且 B.与负相关且 C.与正相关且 D.与正相关且 【答案】BC 【分析】根据正负判断回归直线方程正负相关即可判断选项. 【详解】若y与x负相关,则中,故A不正确,B正确; 若y与x正相关,则中,故C正确,D不正确. 故选:BC. 5.(23-24高二下·河南南阳·阶段练习)已知变量y与x存在线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则下列结论正确的是(    ) A.变量y与x具有负的线性相关关系 B.若r表示y与x之间的样本相关系数,则 C.当变量时,变量 D.当变量时,变量y为90左右 【答案】AD 【分析】根据相关系数和回归直线方程的关系,以及根据回归方程预测变量的关系,即可判断选项. 【详解】因为,所以变量y与x具有负的线性相关关系,故A正确; 相关系数与的正负一致,但数值没关系,故B错误; 当变量时,变量的预测值是,变量不一定是90,故C错误;D正确. 故选:AD 【考点二:散点图及其应用】 一、单选题 1.(23-24高二下·浙江·期中)如下表给出5组数据,为选出4组数据使其线性相关程度最大,且保留第1组数据,则应去掉(    ) 1 2 3 4 5 5 4 3 2 3 2 7 1 A. B. C. D. 【答案】B 【分析】画出散点图,根据线性相关性与偏离程度判断即可. 【详解】根据表格数据,得到散点图如下所示: 由散点图可知数据偏离程度最高,故应该去掉数据. 故选:B 2.(23-24高二下·天津西青·期末)鸢是鹰科的一种鸟,《诗经·大雅·早麓》曰“鸢飞戾天,鱼跃于渊”鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量,通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:),绘制对应散点图(图2)如下:    计算得样本相关系数为0.8642,利用最小二乘法求得相应的经验回归方程为.根据以上信息,如下判断正确的为(    ) A.花萼长度与花瓣长度不存在相关关系; B.花萼长度与花瓣长度负相关; C.花萼长度为的该品种鸢尾花的花瓣长度的平均值约为; D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.8642. 【答案】C 【分析】利用散点图可知花萼长度与花瓣长度存在正相关关系,可判断AB错误;将代入回归方程可得C正确;选取其他品种鸢尾花进行抽样相关系数不一定为0.8642. 【详解】由散点图可知,花萼长度与花瓣长度存在正相关关系,可得A错误;B错误; 由经验回归方程可得,当花萼长度为时, 花瓣长度为,可得C正确; 若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数不一定为0.8642,可得D错误. 故选:C 3.(23-24高二下·河南南阳·阶段练习)某中学课外活动小组为了研究经济走势,根据该市1999-2021年的GDP(国内生产总值)数据绘制出下面的散点图,该小组选择了如下2个模型来拟合GDP值随年份的变化情况,模型一:;模型二:,下列说法正确的是(    ) A.变量与负相关 B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况 C.变量与有较强的线性相关性 D.若选择模型二,的图象不一定经过点 【答案】D 【分析】对于ABC,由散点图的变化趋势分析判断;对于D,由线性回归方程的性判断. 【详解】对于 A,由散点图可知 随年份 的增大而增大,所以变量 与 正相关,所以 A 错误; 对于 BC,由散点图可知变量 与 的变化趋向于一条曲线,所以模型二能更好地 拟合 GDP 值随年份的变化情况,所以 B 错误,C错误; 对于 D,若选择模型二:,令,则的图像一定过点,不一定过点,故D正确. 故选:D. 二、多选题 4.(23-24高二下·河北沧州·期末)如图所示的散点图中,可选取的拟合曲线为(    ) A. B. C. D. 【答案】BD 【分析】根据给定的散点图的形状,结合二次函数和指数函数的图象,即可求解. 【详解】由题意,从曲线上考虑.曲线的形状和过的部分图象类似, 结合选项B、D符合题意. 故选:BD. 三、解答题 5.(24-25高二下·全国·课后作业)鲫鱼产卵后,鱼卵的孵化时间(单位:天)会受到水温(单位:℃)的影响,下面是某生物研究小组进行8次观察实验收集到的数据: 水温x/℃ 15 16 18 20 21 23 26 29 孵化时间y/天 8 7 6 5 5 4 3 2 (1)画出上述成对数据的散点图; (2)已知水温对鱼卵的孵化时间可表示为一元线性回归模型,请在散点图中近似地作出表示孵化时间y和水温x之间关系的直线,并说明该一元线性回归模型的自变量与因变量. 【答案】(1)作图见解析 (2)作图见解析,水温x为自变量,孵化时间y为因变量 【分析】(1)根据表格中的数据,以x轴表示水温,y轴表示孵化时间,画出散点图; (2)由一元线性回归模型定义,近似作出直线,并分析回归模型中自变量和因变量. 【详解】(1)以x轴表示水温,y轴表示孵化时间,可作散点图如下: (2)直线如图所示,由(1)中散点图及一元线性回归模型定义可得,其中水温x为自变量,孵化时间y为因变量. 【考点三:样本中心点的应用】 一、单选题 1.(23-24高二下·天津北辰·期中)如果记录了x,y的几组数据分别为,,,,那么y关于x的经验回归直线必过点(    ) A. B. C. D. 【答案】A 【分析】利用y关于x的经验回归直线必过中心点,计算即得. 【详解】由,,,,可得, ,, 则y关于x的经验回归直线必过点. 故选:A. 2.(23-24高二下·天津·期中)已知某种商品的广告费投入与销售额之间有如下对应数据:根据上表可得回归方程,计算得,则当投入为6时,销售额的预报值为(   ) 2 4 5 6 8 30 40 50 60 70 A.50 B.60 C.57 D.85 【答案】C 【分析】求样本中心点,进而可得,可知,令即可得结果. 【详解】由题意可得:, 可知回归方程过样本中心点,且, 则,解得,可知, 令,可得,即销售额的预报值为57. 故选:C. 3.(23-24高二下·黑龙江哈尔滨·期末)技术在我国已经进入调整发展的阶段,手机的销量也逐渐上升,某手机商城统计了最近5个月手机的实际销量,如下表所示: 时间 1 2 3 4 5 销售量(千只) 0.5 0.8 1.0 1.2 1.5 若与线性相关,且线性回归方程为,则下列说法正确的是(    ) A.由题中数据可知,变量与负相关 B.当解释变量每增加1个单位时,预报变量平均增加个单位 C.线性回归方程中 D.可以预测时,该商场手机销量约为1.72(千只) 【答案】D 【详解】根据已知数据,分析变量增大时,变量的变化趋势,判断A选项;根据已知数据得到样本中心点, 代入回归方程求解即可判断C选项;根据回归方程判断BD选项. 【分析】对于选项A:从数据看,随的增加而增加,故变量与正相关,故A错误; 对于选项B:根据线性回归方程,可得每增加一个单位时,预报变量平均增加0.24个单位,故B错误; 对于选项C:由已知数据得, 代入中得到,故C错误; 对于选项D:将代入中得到,故D正确. 故选:D. 4.(23-24高二下·江西·阶段练习)已知由样本数据组成的一个样本,变量具有线性相关关系,其经验回归方程为,并计算出变量之间的相关系数为,则经验回归直线经过(    ) A.第一、二、三象限 B.第二、三、四象限 C.第一、二、四象限 D.第一、三、四象限 【答案】B 【分析】由题意可知负相关,已知条件求得样本中心点,然后根据经验回归直线经过样本点中心即可得出结果. 【详解】由相关系数为,知负相关,所以. 又,求得样本中心点为, 由于在经验回归直线上,且点在第三象限, 所以经验回归直线经过第二、三、四象限. 故选:B. 5.(23-24高二下·河南南阳·期末)某商店记录了某种产品近5个月的月销售量(千台)如下表,样本中心点为.由于保管不善,记录的5个数据中有两个数据看不清楚,现用代替,已知,则下列结论正确的是(    ) 第个月 1 2 3 4 5 月销售量 2.5 4 5 A.在确定的条件下,去掉样本点,则样本的相关系数增大 B.在确定的条件下,样本的相关系数 C.在确定的条件下,经过拟合,发现数据基本符合线性回归方程,则 D.在确定的条件下,经过拟合,发现数据基本符合线性回归方程,则可预计该款商品第6个月的销售量为6280台 【答案】D 【分析】根据回归直线方程过数据的样本中心点可判断A;根据月销售量随着的增大而增大可判断B;根据样本中心点在回归直线上可判断C;求出回归直线方程,则可预计该款商品第6个月的销售量可判断D. 【详解】对于A,因为回归直线方程过数据的样本中心点, 所以在确定的条件下,去掉样本点,则样本的相关系数不变,故A错误; 对于B,在确定的条件下,月销售量随着的增大而增大, 故样本的相关系数,故B错误; 对于C,在确定的条件下,样本中心点为在回归直线上, 可得,解得,故C错误; 对于D,由C得线性回归方程, 因为台, 则可预计该款商品第6个月的销售量为6280台,故D正确. 故选:D. 【考点四:残差分析与决定指数计算】 一、单选题 1.(24-25高二下·全国·课后作业)某团队尝试用回归模型甲、乙、丙、丁描述人的1000米跑步成绩与肺活量的关系,已知模型甲、乙、丙、丁对应的决定系数分别为,则拟合效果最好的模型是(    ) A.甲 B.乙 C.丙 D.丁 【答案】D 【分析】线性回归模型中越接近1,效果越好,即可得出答案. 【详解】越大,则回归模型的拟合效果越好, 因为,所以拟合效果最好的是模型丁. 故选:D. 2.(23-24高二下·浙江宁波·期中)如图,为某组数据的散点图,由最小二乘法计算得到回归直线的方程为,相关系数为,决定系数为.若经过残差分析后去掉点P,剩余的点重新计算得到回归直线的方程为,相关系数为,决定系数为.则下列结论一定正确的是(    ) A. B. C. D., 【答案】C 【分析】由散点可判断出正相减,去掉离群点后,线性关系更强,由离群点的位置判断去掉离群点后回归方程的斜率变化. 【详解】共8个点且离群点P的横坐标较小而纵坐标相对过大,去掉离群点后回归方程的斜率更大,故C正确 去掉离群点后相关性更强,拟合效果也更好,且还是正相关,故D错误 有,,故AB错误. 故选:C. 3.(23-24高二下·安徽亳州·期末)某市旅游局对全市各旅游景区的环境进行综合治理,投入不同数额的经费(千万元),得到各旅游景区收益的增加值(万元),对应数据如下表所示: 投人的治理经费(单位:千万元) 1 2 3 4 5 6 7 收益的增加值(单位:万元) 2 3 2 5 7 7 9 若与的回归直线方程为,则相应于点的残差是(    ) A. B.0.358 C. D.8.642 【答案】B 【分析】先算出,代入回归直线方程为,可得,进而得到回归直线方程,当时,求出,算出残差即可. 【详解】, 所以, 当时,,因此残差为. 故选:B. 4.(23-24高二下·吉林长春·期末)对于数据组,如果由线性回归方程得到的自变量的估计值是,那么将称为样本点处的残差.某商场为了给一种新商品进行合理定价,将该商品按事先拟定的价格进行试销,得到下表所示数据.若某商品销量y(单位:件)与单价x(单位:元)之间的线性回归方程为,且样本点处的残差为2,则(    ) 单价x/元 8.2 8.4 8.6 8.8 销量y/件 84 82 78 m A.66 B.68 C.70 D.72 【答案】B 【分析】利用样本点处的残差为2,求得,再由,求得,进而可求得. 【详解】由条件知当时,, 代入,解得,于是, 又,所以,即,解得. 故选:B. 二、填空题 5.(24-25高二下·全国·课后作业)某蔬菜的保鲜时间(小时)与存放温度样本数据如下表所示: 存放温度 21 15 10 6 3 保鲜时间小时 6 14 26 33 41 建立关于的一元线性回归模型,预测存放温度为时,这种蔬菜的保鲜时间约为 小时(,及结果保留到整数);该模型的决定系数 (保留2位小数).附:. 【答案】 42 0.99 【分析】利用最小二乘法求解线性回归方程,进行估算判断第一空,利用给定公式求解第二空即可. 【详解】计算得, 所以, 故线性回归方程为,当时,, 所以可估计其保鲜时间约为42小时; 因为,,所以. 故答案为:42;0.99 6.(24-25高二下·全国·课后作业)近几年,我国新能源汽车产业进入了加速发展的阶段,呈现市场规模、发展质量“双提升”的良好局面.新能源汽车的核心部件是动力电池,其中的主要成分是碳酸锂.下表是某地2023年3月1日至2023年3月5日电池级碳酸锂的价格与日期的统计数据: 日期代码 1 2 3 4 5 电池级碳酸锂价格(十万元/吨) 4.1 3.9 3.8 3.9 根据表中数据,得出关于的经验回归方程为,根据数据计算出在样本中心点处的残差为,则决定系数的值为 (结果保留两位小数). 【答案】 【分析】先根据数据在样本中心点处的残差求,再根据回归直线方程必过样本中心点,求出,做出残差表,根据公式求决定系数的值. 【详解】由题知,可得. 又, 由,可得. 列出残差表: 0.1 0.1 0.2 0 0 所以. 故答案为: 【考点五:线性回归分析综合应用】 一、解答题 1.(23-24高二上·上海·课后作业)某连锁日用品销售公司下属5个社区便利店某月的销售额与利润额如下表所示. 便利店编号 1 2 3 4 5 销售额x/万元 30 60 45 80 89 利润额y/万元 2.3 3.5 3.2 4.0 5.3 (1)绘制销售额和利润额的散点图; (2)若销售额和利润额具有线性相关关系,试计算利润额y与销售额x的经验回归直线方程. 【答案】(1)答案见解析 (2) 【分析】(1)根据散点图的作法作出图形即可; (2)根据经验回归直线方程的求解方法求解. 【详解】(1)根据题意,作散点图图如下, (2),, 设回归直线方程为, =, , 所以经验回归直线方程为. 2.(24-25高二下·全国·课后作业)某班10名学生的摸底考试成绩和期末考试成绩如下: 摸底成绩 50 35 40 55 80 60 65 35 90 50 期末成绩 53 51 56 68 87 71 46 31 79 68 计算得:,. (1)画出散点图;    (2)建立一个回归直线方程,用摸底考试成绩来预测期末考试成绩(精确到0.1). 附:,. 【答案】(1)散点图见解析 (2) 【分析】(1)根据表格中的对应数据作为点的横、纵坐标描点即得; (2)由表格数据求出,将相关数据分别代入的计算公式计算即得. 【详解】(1)散点图如图所示.    (2)(2)由表格数据,, , 则. , 故回归直线方程为. 3.(24-25高二下·全国·课后作业)铁观音性寒、味甘、酸、归肺、脾经,具有清热降火、健脾消脂、提神醒脑、生津利尿的功效,是中国十大名茶之一.为促使各生产厂家健康科学发展,某调研机构随机抽取家铁观音生产厂家,整理得到生产铁观音的单位成本(元/盒)与铁观音的产量(千盒)之间的关系数据如下: 铁观音的产量千盒 生产铁观音的单位成本(元/盒) (1)根据所给数据,求生产铁观音的单位成本关于铁观音产量的一元线性回归方程,并估计单位成本为元/盒时产量为多少(计算过程保留两位小数); (2)根据(1)中的回归模型,计算各组残差,并计算残差的平方和. 【答案】(1),盒. (2)答案见解析 【分析】(1)根据最小二乘法可求得回归直线方程,代入即可求得结果; (2)分别计算每组残差,平方后作和可得. 【详解】(1)由表格数据知:,,,, , , 生产铁观音的单位成本关于铁观音的产量的一元线性回归方程为, 令,则,解得:, 当单位成本为元/盒时,预估产量约为盒. (2)各组残差分别为: , , , , , , 残差的平方和. 4.(24-25高二下·全国·单元测试)如图所示的是某高校2016至2022年高考报名学生人数(单位:千人)的折线图.    (1)由折线图看出,可用线性回归模型拟合和的关系,请用相关系数加以说明(精确到0.01); (2)建立关于的回归直线方程,并预测2023年该高校高考报名人数. 参考数据:,,,. 参考公式:相关系数,回归直线方程中的系数分别为,. 【答案】(1)说明见解析 (2),57000人. 【分析】(1)结合题意求得相关系数即可判断变量之间的相关程度; (2)依次计算得,,由此得线性回归方程,进一步即可预测. 【详解】(1)由图中数据可得,,, 又, . 故与之间存在较强的正相关关系. (2)由题意得,, , , 所以关于的回归直线方程为. 当时,, 预测2023年该高校高考报名人数约为57000人. 5.(23-24高二下·山东泰安·期末)2023年全国竞走大奖赛,暨世锦赛及亚运会选拔赛3月4日在安徽黄山开赛.重庆队的贺相红以2小时22分55秒的成绩打破男子35公里竞走亚洲纪录.某田径协会组织开展竞走的步长和步频之间的关系的课题研究,得到相应的试验数据: 步频(单位:s) 0.28 0.29 0.30 0.31 0.32 步长(单位:) 90 95 99 103 117 (1)根据表中数据,得到步频和步长近似为线性相关关系,求出关于的回归直线方程,并利用回归方程预测,当步长为时,步频约是多少? (2)记,其中为观测值,为预测值,为对应的残差,求(1)中步频为0.30的残差. 参考数据:,.参考公式:,. 【答案】(1),秒 (2) 【分析】(1)根据最小二乘法即可求解, (2)由残差的计算公式即可求解. 【详解】(1)依题意可得,, , , 所以回归直线方程为, 将代入得,解得,所以当步长为时,步频约是秒. (2)根据(1)得到,; 所以步长为0.30残差和为. 6.(23-24高二下·重庆·阶段练习)某公司为了解年研发资金(单位:亿元)对年产值(单位:亿元)的影响,对公司近8年的年研发资金和年产值(,)的数据对比分析中,选用了两个回归模型,并利用最小二乘法求得相应的关于的经验回归方程: ①;②. (1)求的值; (2)已知①中的残差平方和,②中的残差平方和,请根据决定系数选择拟合效果更好的经验回归方程,并利用该经验回归方程预测年研发资金为20亿元时的年产值. 参考数据:,,,. 参考公式;刻画回归模型拟合效果的决定系数. 【答案】(1) (2)经验回归方程②的拟合效果更好;亿元. 【分析】(1)求出样本中心点,代入经验回归方程求出; (2)根据公式求出两个经验回归方程的决定系数,并判断拟合效果;利用方程预测. 【详解】(1)根据题意,,, 所以样本中心点为,代入经验回归方程, 得,解得. 所以的值为. (2)设经验回归方程①的决定系数为,由, 则, 设经验回归方程②的决定系数为,由, 则, 因为,所以经验回归方程②的拟合效果更好; 当时,, 所以年研发资金为20亿元时的年产值约为亿元. 【考点六:非线性回归分析综合应用】 一、解答题 1.(23-24高二下·广东·期中)某地政府为提高当地农民收入,指导农民种植药材,取得较好的效果.以下是某农户近5年种植药材的年收入的统计数据: 年份 2019 2020 2021 2022 2023 年份代码 1 2 3 4 5 年收入(千元) 59 61 64 68 73 (1)根据表中数据,现决定使用模型拟合与之间的关系,请求出此模型的回归方程;(结果保留一位小数) (2)统计学中常通过计算残差的平方和来判断模型的拟合效果.在本题中,若残差平方和小于0.5,则认为拟合效果符合要求.请判断(1)中回归方程的拟合效果是否符合要求,并说明理由. 参考数据及公式:,.设,则,. 【答案】(1) (2)拟合效果符合要求,理由见解析 【分析】(1)设,根据数据计算,根据最小二乘法公式计算即可; (2)先利用(1)的方程计算预测值,再利用残差的定义计算残差平方和判定结果即可. 【详解】(1)根据农户近5年种植药材的收入情况的统计数据可得: ,, 设,则,所以, 则,. 所以,回归方程为. (2)将值代入可得估计值分别为59,60.8,63.8,68,73.4, 则残差平方和为. 因为,所以回归方程拟合效果符合要求. 2.(23-24高二下·贵州黔西·阶段练习)为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量(单位:亿元)与研发人员增量(人)的10组数据.现用模型①,②分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图. 根据收集到的数据,计算得到下表数据,其中. 7.5 2.25 82.50 4.50 12.14 2.88 (1)根据残差图,判断应选择哪个模型;(无需说明理由) (2)根据(1)中所选模型,求出关于的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少多少人?(精确到1) 【答案】(1)选择模型② (2);10人 【分析】(1)根据残差图即可求解; (2)根据最小二乘法求解线性回归方程,即可换元得非线性回归方程,代入即可求解预测值. 【详解】(1)选择模型②,理由如下: 由于模型②残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄, 所以模型②的拟合精度更高,回归方程的预报精度相应就会越高,所以选模型②比较合适; (2)根据模型②,令与可用线性回归来拟合,有, 则, 所以, 则关于的经验回归方程为. 所以关于的经验回归方程为, 由题意,,解得,又为整数,所以, 所以,要使年收益增量超过8亿元,研发人员增量至少为10人. 3.(23-24高二下·宁夏银川·阶段练习)红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数(个)和平均温度有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值. 参考数据 17713 714 27 81.3 (1)根据散点图判断,与(其中为自然对数的底数)哪一个更适合作为平均产卵数(个)关于平均温度()的回归方程类型?(给出判断即可,不必说明理由) (2)由(1)的判断结果及表中数据,求出关于的回归方程.(计算结果精确到0.1) 附:回归方程中 【答案】(1)更适宜 (2) 【分析】(1)根据指数型函数图象的特征、一次函数图象的特征进行判断即可; (2)运用对数的运算性质,结合题中所给的公式进行求解即可. 【详解】(1)由散点图可以判断,随温度升高,产卵数增长速度变快,符合指数函数模型的增长, 所以更适宜作为平均产卵数关于平均温度的回归方程类型. (2)将两边同时取自然对数,可得, 由题中的数据可得,, 所以,则, 所以关于的线性回归方程为,故关于的回归方程为; 4.(23-24高二下·山东青岛·期中)肥胖不仅影响形体美,而且给生活带来不便,此外还有关节软组织损伤、心脏病、糖尿病、脂肪肝、痛风等危害.小王通过运动和节食进行减肥,并将时间x(单位:周)和体重(单位:)记录制作如下统计表: 1 2 3 4 6 8 90.1 87.6 87.2 86.2 84.2 84.3 (1)若和满足经验回归模型,求; (2)求该模型的决定系数,并判断该经验回归方程是否有价值(认为有价值); (3)当某组数据残差的绝对值不超过0.3时,称该组数据为“身材有效管理数据”,现从这六组数据中任意抽取两组,设抽取的“身材有效管理数据”的个数为,求的分布列和期望. 附:经验回归方程中,, 参考数据:. 【答案】(1);. (2);该经验回归方程有价值. (3)分布列见解析;数学期望是1. 【分析】(1)设得,计算,继而得到和; (2)分别计算和,计算出,即得结论; (3)依题意,残差的绝对值不超过0.3的有三组,由此确定的可能值有,利用超几何分布计算概率,写出分布列,计算出数学期望即可. 【详解】(1)设则, 因 , 则 又且经验回归直线过点, 故得,, (2)由(1), 1 2 3 4 6 8 90.1 87.6 87.2 86.2 84.2 84.3 90 88 86.8 86 84.8 84 0.01 0.16 0.16 0.04 0.36 0.09 12.25 1 0.36 0.16 5.76 5.29 则,因,则该经验回归方程有价值; (3)经计算,这六组数据中,残差的绝对值不超过0.3的有三组,分别是第一组、第四组和第八组, 故从这六组数据中任意抽取两组,的可能值有, 于是,, 则的分布列为: 0 1 2 故数学期望为. 5.(23-24高二上·重庆·阶段练习)混凝土的抗压强度x较容易测定,而抗剪强度y不易测定,工程中希望建立一种能由x推算y的经验公式,下表列出了现有的9对数据,分别为,,…,. x 141 152 168 182 195 204 223 254 277 y 23.1 24.2 27.2 27.8 28.7 31.4 32.5 34.8 36.2 以成对数据的抗压强度x为横坐标,抗剪强度y为纵坐标作出散点图,如图所示. (1)从上表中任选2个成对数据,求该样本量为2的样本相关系数r.结合r值分析,由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的线性相关关系? (2)根据散点图,我们选择两种不同的函数模型作为回归曲线,根据一元线性回归模型及最小二乘法,得到经验回归方程分别为:①,②.经验回归方程①和②的残差计算公式分别为,,. (ⅰ)求; (ⅱ)经计算得经验回归方程①和②的残差平方和分别为,,经验回归方程①的决定系数,求经验回归方程②的决定系数. 附:相关系数,决定系数,. 【答案】(1),答案见解析 (2)(ⅰ)0;(ⅱ)0.9847 【分析】(1)根据相关系数的计算公式即可求解,由相关系数的定义结合统计学知识即可求解, (2)根据残差公式以及决定系数的计算公式即可求解. 【详解】(1)不妨设选择的成对数据分别为,,则 .又由表格数据得,当时,,则. 因为任意两个样本点都在一条直线上,则样本量为2的样本相关系数绝对值都是1(在样本相关系数存在的情况下),显然据此推断两个变量完全线性相关是不合理的. 样本相关系数可以反映变量之间相关的正负性及线性相关的程度,但由于样本数据的随机性,样本相关系数往往不能确切地反映变量之间的相关关系.一般来说,样本量越大,根据样本相关系数推新变量之间相关的正负性及线性相关的程度越可靠,而样本量越小,则越不可靠. (2)(ⅰ)(直线经过数据的中心). (ⅱ)∵,∴, 则, 越大,越接近于1,则模型的拟合效果越好,因此经验回归方程②的拟合效果更好,为最优模型. 一、单选题 1.(24-25高二下·全国·课后作业)关于线性回归的描述,有下列命题: ①回归直线一定经过样本点的中心; ②相关系数r越大,线性相关程度越强; ③决定系数越接近1拟合效果越好; ④随机误差平方和越小,拟合效果越好. 其中正确的命题个数为(    ) A.1 B.2 C.3 D.4 【答案】C 【分析】根据回归直线方程的性质,相关系数、决定系数及随机误差平方和的意义判断各项的正误即可. 【详解】对于①,回归直线一定经过样本点的中心,故①正确; 对于②,相关系数r的绝对值越接近于1,线性相关性越强,故②错误; 对于③,决定系数R越接近1拟合效果越好,故③正确; 对于④,随机误差平方和越小,拟合效果越好,故④正确. 故选:C. 2.(23-24高二下·北京房山·期末)如图 ①、②、③、④ 分别为不同样本数据的散点图,其对应的线性相关系数分别为,则中最大的是(    ) A. B. C. D. 【答案】A 【分析】由散点图图形趋势可判断大小关系. 【详解】因③图形比较分散,则;因①②④相较③接近于一条直线附近,则, 又②为下降趋势,则,①比④更接近一条直线,且呈上升趋势,则. 综上,最大. 故选:A 3.(23-24高二下·广东江门·期末)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了6次试验,收集数据如下表所示,建立加工时间关于零件数的一元线性回归模型,则回归直线必过点(    ) 零件数个 50 60 70 80 90 100 加工时间min 88 95 102 108 115 122 A. B. C. D. 【答案】B 【分析】求出,,根据回归直线方程必过样本中心点,即可判断. 【详解】依题意可得, , 所以回归直线必过点. 故选:B 4.(23-24高二下·北京房山·期末)为了研究儿子身高与父亲身高的关系,某机构调查了某所高校14名男大学生的身高及其父亲的身高(单位:cm),得到的数据如表所示. 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 父亲身高 174 170 173 169 182 172 180 172 168 166 182 173 164 180 儿子身高 176 176 170 170 185 176 178 174 170 168 178 172 165 182 父亲身高的平均数记为,儿子身高的平均数记为,根据调查数据,得到儿子身高关于父亲身高的回归直线方程为.则下列结论中正确的是(    ) A.与正相关,且相关系数为 B.点不在回归直线上 C.每增大一个单位,增大个单位 D.当时,.所以如果一位父亲的身高为176cm,他儿子长大成人后的身高一定是177cm 【答案】C 【分析】由回归方程意义及性质可判断选项正误. 【详解】A选项,因,则与正相关,但相关系数不是,故A错误; B选项,回归方程过定点,故B错误; C选项,由回归方程可知每增大一个单位,增大个单位,故C正确; D选项,回归方程得到的为预测值,不一定满足实际情况,故D错误. 故选:C 5.(23-24高二下·江苏南通·阶段练习)已知表格中的数据y关于x的线性经验回归方程为, x 1 2 3 4 5 y 5 15 35 t 140 则样本点的残差为(    ) A.9 B.96 C.105 D. 【答案】A 【分析】先求出样本中心点,代入回归方程求出的值,再根据回归方程求出时的值,然后根据残差的定义求解即可. 【详解】,, 所以,解得, 当时,, 所以样本点的残差为. 故选:A 6.(23-24高二下·福建泉州·期末)某公司为了解年研发资金x(单位:亿元)对年产值y(单位:亿元)的影响,对公司近8年的年研发资金和年产值(,)的数据对比分析中,利用最小二乘法求得y关于x的经验回归方程为,且经数据处理得到,,,则(    ) A. B.49.92 C.62.08 D.120.98 【答案】A 【分析】首先利用换元转化为,再求样本点中心,代入回归方程,即可求解. 【详解】设,则, ,则,, 则,所以. 故选:A 二、多选题 7.(2024·浙江温州·一模)观察下列散点图的分布规律和特点,其中两个变量存在相关关系的有(   ) A. B. C. D. 【答案】ABC 【分析】由相关关系对应的图形是散点图,能反映两个变量的变化规律才具有相关关系直接可以判断. 【详解】相关关系对应的图形是散点图,ABC都能反映两个变量的变化规律,它们都具有相关关系; D中的点散乱地分布在坐标平面内,不能反映两个变量的变化规律,不具有相关关系. 故选:ABC. 8.(2024高二·全国·专题练习)如图是根据一组观测数据得到海拔千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为,决定系数为;根据非线性回归模型得到经验回归方程为,决定系数为,则下列说法正确的是(   ) A.由散点图可知,大气压强与海拔高度负相关 B.由方程可知,海拔每升高1千米,大气压强必定降低kPa C.由方程可知,样本点的残差为 D.对比两个回归模型,结合实际情况,方程的预报效果更好 【答案】ACD 【分析】根据散点图即可得出A项;根据回归方程的含义可判断B项;根据残差计算公式求出残差,可判断C项;根据实际大气压强不能为负,可判断D项. 【详解】对于A,由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度负相关,故A正确; 对于B,经验回归方程得到的数据为估计值,而非精确值,故B错误; 对于C,当时, ,所以样本点的残差为,故C正确; 对于D,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程的预报效果更好,故D正确. 故选:ACD. 9.(四川省雅安市等8市2024-2025学年高二上学期(12月)第一次诊断性考试数学试题)某直播带货公司统计了今年1月份至5月份的某种产品的月销量(单位:千件)如下表所示: 月份 1 2 3 4 5 月销量 2.4 3.1 4 5 5.5 已知变量与之间具有线性相关关系,通过最小二乘法求得的经验回归直线方程为,则下列说法正确的是(   ) 参考公式:相关系数,决定系数. A. B. C.每增加1,一定增加0.81 D. 【答案】ABD 【分析】A项,求出,月份和月销量的均值,即可求出;B项,分析的分子和分母都不小于0,即可得出结论;C项,分析经验回归直线方程的意义,即可得出结论;D项,计算出,即可得出结论. 【详解】由题意及表得, 在中,, , A项,∵, ∴,故A正确; B项, ,即,∴,故B正确; C项,经验回归直线方程为, 并不意味着每增加1,一定增加0.81,会有一定的浮动,故C错误; D项, ∴,∴,故D正确; 故选:ABD. 三、填空题 10.(24-25高二下·全国·课后作业)某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表,已知,则时,残差为 . 广告支出费用/万元 1 3 4 6 11 销售量万件 1.9 3.2 4.4 6.3 12.7 【答案】2.02 【分析】先求出样本点的中心点,然后代入回归方程求出,从而求出当时,解得,从而可求解. 【详解】由题意,, 而样本点的中心点在经验回归直线上, 代入得,解得. 所以,当时,解得, 所以残差为. 故答案为:. 11.(23-24高二下·湖北十堰·期末)已知一系列样本点满足,,由最小二乘法得到与的回归方程,现用决定系数来判断拟合效果(越接近1,拟合效果越好),若,则 .(参考公式:决定系数) 【答案】0.96 【分析】依据决定系数的公式计算即可. 【详解】因为. 故答案为:. 四、解答题 12.(24-25高二上·新疆喀什·阶段练习)某机构统计了新驾驶员一年内扣除的驾照分(单位:分)及该年对应的新驾驶员数量(单位:万人),得到如下数据表格: 新驾驶员一年内扣除的驾照分(分) 3 4 5 6 7 新驾驶员数量(万人) 1 1.1 1.5 1.9 2.2 已知与线性相关. (1)求关于的线性回归方程; (2)求与的相关系数(精确到0.01). 参考数据:. 参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为 【答案】(1) (2)0.99 【分析】(1)代入公式,计算出,得到关于的线性回归方程; (2)代入相关系数公式,求出答案. 【详解】(1)由, 有, 故关于的线性回归方程为. (2)与的相关系数 . 13.(2024·浙江台州·二模)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:令,数据经过初步处理得:    44 4.8 10 40.3 1.612 19.5 8.06 现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数. (1)请从相关系数的角度,分析哪一个模型拟合程度更好? (2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少? (3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量影响,设随机变量服从正态分布,且满足.在(2)的条件下,求该公司年净利润的最大值大于1000(百万元)的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量). 附:①相关系数, 回归直线中公式分别为,; ②参考数据:,,,. 【答案】(1)模型②的拟合程度更好 (2),当年广告费为6(百万元)时,产品的销售量大概是13(百万辆) (3)0.3 【分析】(1)分别求得模型①和②的相关系数,,然后比较得出结论; (2)利用最小二乘法求解; (3)由净利润为,求解. 【详解】(1)解:设模型①和②的相关系数分别为,. 由题意可得:, . 所以,由相关系数的相关性质可得,模型②的拟合程度更好. (2)因为, 又由,, 得, 所以,即回归方程为. 当时,, 因此当年广告费为6(百万元)时,产品的销售量大概是13(百万辆). (3)净利润为,, 令, 所以. 可得在上为增函数,在上为减函数. 所以, 由题意得:,即, , 即该公司年净利润大于1000(百万元)的概率为0.3. 14.(22-23高二下·黑龙江大兴安岭地·期中)碳排放是引起全球气候变暖问题的主要原因.2009年世界气候大会,中国做出了减少碳排放的承诺,2010年被誉为了中国低碳创业元年.2020年中国政府在联合国大会发言提出:中国二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.碳中和是指主体在一定时间内产生的二氧化碳或温室气体排放总量,通过植树造林、节能减排等形式,以抵消自身产生的二氧化碳或温室气体排放量,实现正负抵消,达到相对“零排放”.如图为本世纪来,某省的碳排放总量的年度数据散点图.该数据分为两段,2010年前该省致力于经济发展,没有有效控制碳排放;从2010年开始,该省通过各种举措有效控制了碳排放.用x表示年份代号,记2010年为.用h表示2010年前的年度碳排放量,y表示2010年开始的年度碳排放量. 表一:2011~2017年某省碳排放总量年度统计表(单位:亿吨) 年份 2011 2012 2013 2014 2015 2016 2017 年份代号x 1 2 3 4 5 6 7 年度碳排放量y(单位:亿吨) 2.54 2.635 2.72 2.80 2.885 3.00 3.09 (1)若关于x的线性回归方程为,根据回归方程估计若未采取措施,2017年的碳排放量;并结合表一数据,说明该省在控制碳排放举措下,减少排碳多少亿吨? (2)根据,设2011~2017年间各年碳排放减少量为,建立z关于x的回归方程. ①根据,求表一中y关于x的回归方程(精确到0.001); ②根据①所求的回归方程确定该省大约在哪年实现碳达峰? 参考数据:. 参考公式:. 【答案】(1)3.3(亿吨),0.21(亿吨) (2)①;②大约在2026年实现碳达峰 【分析】(1)根据回归方程作出估计,并计算出减少的碳排放量. (2)①根据非线性回归的知识求得正确答案. ②根据二次函数的性质求得正确答案. 【详解】(1)2017年的估计值:(亿吨), 从而估计减少碳排放量为(亿吨). (2)①设,则, , ∴ ∴ ∴, ②∵y的对称轴为, ∴大约在2026年实现碳达峰, 15.(24-25高二上·河北沧州·阶段练习)近年来,政府相关部门引导乡村发展旅游业的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲、乙两名同学一起收集了6家农户的数据,进行回归分析,得到两个回归模型:模型①;模型②.对以上两个回归方程进行残差分析,得到下表: 种植面积亩 2 3 4 5 7 9 每亩种植管理成本/百元 25 24 21 22 16 14 模型① 估计值 25.27 23.62 21.97 17.02 13.72 残差 0.38 0.28 模型② 估计值 26.84 20.17 18.83 17.31 16.46 残差 0.83 3.17 注:表中. (1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好; (2)视残差的绝对值超过1.5的数据为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求其经验回归方程. 参考公式:. 【答案】(1)表格见解析,模型①拟合效果更好. (2) 【分析】(1)根据回归模型①②分别代入求出相应每亩种植管理成本的估计值,再由实际值与估计值的差求出相应残差,然后分别计算残差平方和,比较大小判断拟合效果即可; (2)根据残差的绝对值剔除异常数据,由参考公式求解可得经验回归方程. 【详解】(1)当时, 当时,, 完成表格如下: 种植面积/亩 2 3 4 5 7 9 每亩种植管理成本/百元 25 24 16 14 模估计值 25.27 23.62 21.97 20.32 17.02 13.72 ①残差 0.38 1.68 .02 0.28 模估计值 26.84 22.39 20.17 18.83 17.31 16.46 ②残差 .84 1.61 0.83 3.17 注:表中. 模型①的残差平方和为5.0994, 模型②的残差平方和为24.4832, 因为, 即模型①的残差平方和比模型②的残差平方和小,所以模型①拟合效果更好. (2)由题意及(1)可知,模型①中仅第四组数据残差的绝对值超过1.5, 故应剔除第四组数据,剔除后, 则, 所以 , 则, 所以所求经验回归方程为. 16.(24-25高二上·重庆·阶段练习)一年一度的“双11”促销活动落下帷幕,各大电商平台发布的数据显示,在消费品以旧换新、家电政府补贴等促消费政策和活动的带动下,消费市场潜能加速释放,带动相关商品销售保持增长. 经过调研,得到2019年到2024年“双11”活动当天某电商平台线上日销售额(单位: 百亿元)与年份(第年)的6组数据(时间变量的取值依次为),对数据进行处理,得到如下散点图(图1)及一些统计量的值. 其中. 48.7 3.5 91 1204 1.1 9.4 388.1 分别用两种模型:①;②进行拟合,得到相应的回归方程,并进行残差分析,得到如图所示的残差图(图2)(残差值真实值预测值). (1)根据题中信息,通过残差图比较模型①,②的拟合效果,应选择哪一个模型进行拟合?请说明理由; (2)根据(1)中所选模型, (i)求出关于的经验回归方程(系数精确到0.1); (ⅱ)若该电商平台每年活动当天线上日销售额与当日营销成本及年份存在线性关系: ,则在第几年活动当日营销成本的预测值最大? 参考公式: ;参考数据:. 【答案】(1)应选择模型②,理由见详解; (2)①;②第12年活动当日营销成本的预测值最大. 【分析】(1)根据残差的意义结合题中图表分析判断即可; (2)①令,可得,根据题中数据和公式代入求解即可;②整理可得,构建,利用导数求最值即可. 【详解】(1)由残差图可知模型①的残差值比较分散和远离横轴,所以模型①平方和大于模型②的残差平方和, 所以应选择模型②. (2)(i)对于模型②:, 令,可得, 则, 可得,所以关于的经验回归方程为; (ⅱ)由(i)可得:,整理可得, ,则, 令,解得;令,解得; 可知在内单调递增,在内单调递减, 所以当时,取到最大值,即取得最大值, 所以第12年活动当日营销成本的预测值最大. 17.(23-24高二下·宁夏银川·阶段练习)某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y(万人)与年份x的数据: 第x年 1 2 3 4 5 6 7 8 9 10 旅游人数y(万人) 300 283 321 345 372 435 486 527 622 800 该景点为了预测2021年的旅游人数,建立了y与x的两个回归模型: 模型①:由最小二乘法公式求得y与x的线性回归方程; 模型②:由散点图的样本点分布,可以认为样本点集中在曲线的附近. (1)根据表中数据,求模型②的回归方程.(a精确到个位,b精确到0.001). (2)根据下列表中的数据,比较两种模型的决定系数,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位). 回归方程 ① ② 30407 14607 参考公式、参考数据及说明: ①, ②刻画回归效果的决定系数; ③参考数据: , 5.5 449 6.05 83 4195 9.00 表中. 【答案】(1) (2)答案见解析 【分析】(1)对取对数,得,设,,先建立关于的线性回归方程.再回代,得到建立关于的非线性回归方程. (2)先求出两种模型的决定系数,再根据大小决定选哪种模型,再代值,计算即可预测2021年该景区的旅游人数. 【详解】(1)对取对数,得,设,,先建立关于的线性回归方程. ,, , 模型②的回归方程为. (2)由表格中的数据,有3040714607,即, 即,, 模型①的相关指数小于模型②的,说明回归模型②的拟合效果更好. 2021年时,,预测旅游人数为(万人). ( 5 )原创精品资源学科网独家享有版权,侵权必究! 学科网(北京)股份有限公司 $$

资源预览图

第31讲 一元线性回归模型及其应用(思维导图+4知识点+六大考点+过关检测)-【寒假自学课】2025年高二数学寒假提升精品讲义(人教A版2019)
1
第31讲 一元线性回归模型及其应用(思维导图+4知识点+六大考点+过关检测)-【寒假自学课】2025年高二数学寒假提升精品讲义(人教A版2019)
2
第31讲 一元线性回归模型及其应用(思维导图+4知识点+六大考点+过关检测)-【寒假自学课】2025年高二数学寒假提升精品讲义(人教A版2019)
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。