非线性回归、相关系数、决定系数复习讲义-2026届高三数学三轮冲刺
2026-05-29
|
2份
|
43页
|
435人阅读
|
7人下载
普通
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | - |
| 年级 | 高三 |
| 章节 | - |
| 类型 | 教案-讲义 |
| 知识点 | 回归分析,独立性检验 |
| 使用场景 | 高考复习-三轮冲刺 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 2.81 MB |
| 发布时间 | 2026-05-29 |
| 更新时间 | 2026-05-29 |
| 作者 | ZYSZYSZYSZYS |
| 品牌系列 | - |
| 审核时间 | 2026-05-29 |
| 下载链接 | https://m.zxxk.com/soft/58104770.html |
| 价格 | 1.50储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中数学高考复习讲义围绕非线性回归、相关系数、决定系数三大核心考点,按“知识点解析-解题原理-解题思路”逻辑架构整合内容,通过考点梳理、方法指导、真题精讲及变式训练四环节,帮助学生构建统计模型分析框架,突破非线性转化、相关性判断等高频难点。
资料以“数学思维”和“数学语言”为导向,创新采用换元线性化、残差对比等策略,如非线性回归中通过变量替换转化为线性模型,结合相关系数判断线性相关强弱,利用决定系数评价模型拟合效果。设置分层例题与变式训练,确保学生高效掌握统计方法,为教师把控复习节奏、提升学生应考能力提供有力支持。
内容正文:
2026届高三数学三轮冲刺复习讲义
非线性回归、相关系数、决定系数复习讲义
考点目录
非线性回归
相关系数
决定系数
知识点解析
考点一 非线性回归
知识点
1. 适用场景:散点图不呈直线分布,变量间为曲线相关,无法直接用线性回归。
1. 核心思路:换元线性化,通过代数变形将非线性关系转化为线性回归模型。
1. 常见模型及换元:
· 幂函数:,两边取对数 ,令 ,化为
· 指数函数:,取对数 ,令 ,化为
· 二次函数:,令 ,化为
1. 配套公式:线性回归方程 ,回归系数计算公式。
解题原理
借助对数、整体代换等方式,把非线性函数转化为标准线性形式,再套用线性回归的方法求解参数、回归方程。
解题思路
1. 观察散点图或题干函数形式,判断曲线类型(指数、幂函数、二次函数等)。
1. 设定新变量完成换元,将原式转化为线性方程。
1. 根据变换后的数据,计算线性回归系数 、。
1. 回代还原变量,得到原始变量的非线性回归方程。
1. 利用回归方程进行预测、估值。
考点二 相关系数
知识点
1. 公式:样本相关系数
1. 取值范围:
1. 意义:
· 越接近 ,线性相关程度越强;
· 越接近 ,线性相关程度越弱;
· :正相关, 增大 增大;
· :负相关, 增大 减小。
解题原理
通过量化指标 ,衡量两个变量线性相关的方向与强弱。
解题思路
1. 代入数据,按公式分步计算分子、分母,求出相关系数 。
1. 根据 的正负,判断正/负相关。
1. 根据 大小,判断线性相关强弱。
1. 结合题意,解释变量间的相关关系,辅助选择回归模型。
考点三 决定系数()
知识点
1. 定义:决定系数 ,取值 。
1. 常用公式:
1. 含义:反映回归模型的拟合效果。
· 越接近 ,残差平方和越小,模型拟合效果越好;
· 越接近 ,拟合效果越差。
1. 关联:线性模型中,( 为相关系数)。
解题原理
对比真实值、回归预测值、样本均值的偏差,量化模型对数据的解释能力,评判拟合优劣。
解题思路
1. 明确残差 、样本均值 ,代入公式计算 。
1. 比较多个模型的 大小, 越大,优先选择该模型。
1. 结合结果描述拟合效果,用于模型筛选、结果评价。
补充区分
1. 相关系数 :判断线性相关方向与强弱;
1. 决定系数 :判断回归方程拟合好坏,适用于线性、非线性回归;
1. 非线性回归:先线性变换,再计算回归系数、、。
考点一 非线性回归
【例题分析】
例1.(2026·重庆·模拟预测)现有抽球游戏规则如下:盒子中初始装有2个白球和1个黑球,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球的颜色相同.则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止游戏.否则,在盒子中再放入一个白球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.
1
2
3
4
5
516
209
127
98
50
(1)某人进行该抽球游戏时,最多进行三轮,即使第三轮不成功,也停止游戏,记其进行抽球游戏的轮数为随机变量,求的分布列和期望;
(2)有数学爱好者统计了近1000名玩家进行该抽球游戏的数据,记表示成功时抽球游戏的轮数,表示对应的人数,部分统计数据如表,经计算发现,非线性回归模型的拟合效果优于线性回归模型,求出关于的非线性回归方程(结果保留整数).
附:回归方程系数:,.
参考数据:设,,,,,,.
【答案】(1)分布列见解析,;
(2).
【分析】(1)先求出每一轮成功和失败的概率,再由条件概率公式求解即可;
(2)设,则回归方程为,根据所给数据和公式,求出的值,再代回,即可得答案.
【详解】(1)由题意可知:
第1轮:盒子中共有3个小球(2白1黑),
所以成功的概率为,所以失败的概率为;
第2轮:盒子中共有4个小球(3白1黑),
所以成功的概率为,所以失败的概率为;
第3轮:是否成功都会停止,且只有前两轮失败,就会进行第3轮;
所以,,,
所以的分布列如下:
所以
(2)设,则回归方程为,
因为,,,,,
且,
所以,
所以.
所以回归方程为,
又因为,
所以回归方程为.
例2.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)更适合,
(2)不能
【分析】(1)根据图形,即可作出判断,再将非线性回归方程转化成线性回归方程,再结合条件,求出,即可求解;
(2)根据条件,求出的值,结合条件,即可求解.
【详解】(1)由图可以判断,更适合作为未佩戴头盔人数与天数的回归方程类型,
由,得到,因为,则,
则,所以,则.
(2)零假设:市民佩戴头盔与性别无关联.
根据列联表中的数据,经计算得到:
,
根据小概率值的独立性检验,我们没有理由认为不成立,即认为市民佩戴头盔与性别没有关联.
例3.(2024·湖南邵阳·三模)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由)
(2)依据(1)的结果和上表中的数据求出关于的回归方程.
(3)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)更适合
(2)
(3)能
【分析】(1)根据散点图的形状,可判断更适宜作为未佩戴头盔人数与天数的回归方程类型.
(2)将两边取对数,转化为线性回归方程,利用表中的数据和线性回归方程公式求解即可.
(3)应用卡方公式求卡方值,由独立性检验的基本思想下结论即可.
【详解】(1)依据散点图可以判断,更适合作为未佩戴头盔人数与天数的回归方程类型.
(2)由,得,
依题意得,
,
所以,即.
(3)零假设:市民佩戴头盔与性别无关联.
根据列联表中的数据,经计算得到:
,
根据小概率值的独立性检验,我们推断不成立,即认为市民佩戴头盔与性别有关联,
此推断犯错误的概率不超过0.10.
【变式训练】
变式1.(2026·福建南平·模拟预测)某大型商场的所有饮料自动售卖机在一天中某种饮料的销售量(单位:瓶)与天气温度(单位:)有很强的相关关系,为能及时给饮料自动售卖机添加该种饮料,该商场对天气温度和饮料的销售量进行了数据收集,得到下面的表格:
10
15
20
25
30
35
40
4
16
64
256
2048
4096
8192
经分析,可以用作为关于的经验回归方程.
(1)根据表中数据,求关于的经验回归方程(结果保留两位小数);
(2)若饮料自动售卖机在一天中不需添加饮料的记1分,需添加饮料的记2分,每台饮料自动售卖机在一天中需添加饮料的概率均为,在商场的所有饮料自动售卖机中随机抽取3台,记总得分为随机变量,求的分布列与数学期望.
参考公式及数据:对于一组数据,经验回归方程的斜率和截距的最小二乘估计公式分别为
【答案】(1)
(2)分布列见解析,
【分析】(1)设,转化为,利用最小二乘法,求得,求得,进而得到关于的经验回归方程;
(2)根据题意,得到变量的可能取值为,利用独立重复试验的概率公式,求得相应的概率,列出分布列,结合期望的公式,即可求解.
【详解】(1)解:设,由,可得,
因为,,
,所以,
由表中的数据可得,
则,
所以,
则,可得,
所以关于的经验回归方程为.
(2)解:由题意,随机变量的可能取值为,
可得,,
,,
所以变量的分布列为
3
4
5
6
P
所以,期望为
变式2.(2026·湖南衡阳·模拟预测)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1∼10分别对应年份2013∼2022.
根据散点图,分别用模型①,②作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
75
2.25
82.5
4.5
120
28.35
表中,.
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型?并说明理由;
(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;
(ii)设该科技公司的年利润(单位:亿元)和年研发投入y(单位:亿元)满足(且),问该科技公司哪一年的年利润最大?
附:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.
【答案】(1)选择模型②更适宜,理由见解析
(2)(i);(ii)该公司2028年的年利润最大
【分析】(1)根据残差图确定;
(2)根据最小二乘法求非线性回归方程即可求解;
【详解】(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差;
模型②的残差波动性很小,基本分布在0的附近,说明拟合关系很好,所以选择模型②更适宜.
(2)(i)设,所以,
所以,,
所以关于的经验回归方程为
(ii)由题设可得,
当取对称轴即,即时,年利润L有最大值,
故该公司2028年的年利润最大.
变式3.(2026·贵州贵阳·模拟预测)为了研究某种细菌随天数变化的繁殖个数,收集数据如下:
天数
1
2
3
4
5
6
繁殖个数
6
12
25
49
95
190
(1)在图中作出繁殖个数关于天数变化的散点图,并由散点图判断(为常数)与(为常数,且)哪一个适宜作为繁殖个数关于天数变化的回归方程类型?(给出判断即可,不必说明理由)
(2)对于非线性回归方程(为常数,且),令,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值.
3.50
62.83
3.53
17.50
596.57
12.09
(ⅰ)证明:“对于非线性回归方程,令,可以得到繁殖个数的对数关于天数具有线性关系(即为常数)”;
(ⅱ)根据(ⅰ)的判断结果及表中数据,建立关于的回归方程(系数保留2位小数).
附:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.
【答案】(1)选择为回归方程较宜
(2)(ⅰ)证明见解析;(ⅱ)
【分析】(1)根据表格提供数据画出散点图,并由此选择.
(2)(ⅰ)利用换元法,结合对数运算证得结论成立;(ⅱ)根据回归方程的求法求得正确答案.
【详解】(1)作出散点图如图所示.
由散点图看出样本点分布在一条指数型曲线的周围,
故选择为回归方程较宜.
(2)(i)由已知:令,则,
则,,即.所以繁殖个数的对数关于天数具有线性关系.
(ii)由(i)知繁殖个数的对数关于天数可以用线性回归方程来拟合.由表中数据可得,
,
,
得到关于的线性回归方程为,又,
因此细菌的繁殖个数关于天数的非线性回归方程为.
考点二 相关系数
【例题分析】
例1.(2026·安徽芜湖·二模)某景区在五一劳动节期间开展“致敬最美劳动者”主题游园活动,天的人园游客量统计数据如下:
活动开展第天
人园游客量(百人)
(1)由数据看出,可用线性回归模型拟合与的关系,请计算相关系数(保留小数点后两位),并推断相关程度的强弱;
(2)求经验回归方程以及表中第个观测的残差;(观测值减去预测值称为残差)
(3)该景区在活动期间设置个打卡通道,记为通道①、通道②、通道③,游客人园时选择通道①、②、③的概率依次为、、;游客离园时,从原先入园通道离园的概率为,从另两个通道离园的概率均为,求游客从通道①离园的概率.
附:参考公式:相关系数;回归直线方程,其中,;
参考数据:,,,.
【答案】(1),相关程度很强
(2),残差为百人
(3)
【分析】(1)求出、的值,利用公式求出相关系数的值,即可得出结论;
(2)利用最小二乘法公式求出、的值,可得出回归直线方程,将代入回归直线方程,结合残差的概念求解即可;
(3)记从通道入园的事件为,从通道离园的事件为,结合全概率公式求解即可.
【详解】(1)由表格中的数据可得,,
则,
由相关系数,可以推断入园游客量与活动开展第天相关程度很强.
(2),,
故经验回归方程为.
对于表中第个观测,入园游客量为(百人),
预测值为(百人),残差为(百人)
(3)记从通道入园的事件为,从通道离园的事件为,
由题意可得,,,,
.
例2.(2026·云南昆明·模拟预测)某公司研发了一款新型智能机器人,一经投放市场颇受欢迎,为了更好地服务广大用户,该公司对这款机器人的某个性能指数x()与用户的喜欢程度y()进行调查统计,得到如下数据表:
x
5
6
7
8
9
y
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,利用相关系数r,判断该性能指数与用户的喜欢程度的相关性强弱(当时,x与y的相关性很强);
(2)这款智能机器人的交互性很强,用户可通过语音给机器人发布指令,机器人执行命令的正确率为90%,出错率为10%.当机器人正确执行命令时,使用者满意的概率为90%;当机器人执行命令错误时,使用者满意的概率为30%.如果使用者对某次命令执行结果不满意,求机器人实际正确执行命令的概率(精确到0.01);
(3)该公司科技人员随机抽取一台这款智能机器人进行挑战答题,共准备了4道高难度的问题,若机器人答对的题数不小于3,则挑战成功.已知机器人答对前两道题的概率均为p,答对后两道题的概率均为q,每次答题结果互不影响.当时,求机器人挑战成功的概率的最大值.
附:相关系数.
【答案】(1)该性能指数与用户的喜欢程度的相关性很强
(2)
(3)
【分析】(1)由题意计算出样本均值以及方差、协方差的求和项,代入相关系数公式求出r,并结合给定的判断区间得出结论.
(2)先利用全概率公式求出“使用者对结果不满意”的总概率,再利用条件概率公式逆向推导出在“不满意”前提下“实际正确执行”的概率.
(3)根据独立事件乘法公式列出“挑战成功”的概率解析式,利用已知条件进行代数消元与换元将其转化为一元二次函数,由二次函数的性质即可求得最值.
【详解】(1)由题意知,,,
,
,.
所以
所以该性能指数与用户的喜欢程度的相关性很强.
(2)记事件:机器人正确执行命令;事件:使用者对执行结果满意,则
,,,.
所以,
所以,
故如果使用者对某次命令执行结果表示不满意,机器人实际正确执行命令的概率约为.
(3)设事件:机器人挑战成功,则
.
由,得 .令,
因为,,所以,所以
设,当,即或时,.
所以当时,机器人挑战成功的概率的最大值为.
例3.(2026·江西抚州·模拟预测)某医药研究所为了评估一种新药的疗效,开展了临床试验.研究人员记录了14名志愿者服用不同剂量的药物后,血液中某关键生化指标(单位:)随给药剂量(单位:)的变化情况.为了寻找最合适的预测模型,研究人员分别利用模型一和模型二对这14组数据进行了拟合,并绘制了相应的残差图(如图所示,图中纵轴为残差,横轴为给药剂量).
(1)观察残差图,判断哪个模型的拟合效果更好,并说明理由;
(2)设这14组数据得到的经验回归方程为.
(ⅰ)已知样本中的某位志愿者的给药剂量为,生化指标为.若该样本点在拟合效果更优的模型中的残差对应于图中标注的四点之一,请指出该点并说明理由;
(ii)若在这14组数据中,给药剂量的标准差为,生化指标的标准差为,求生化指标与给药剂量的相关系数.(结果精确到0.01)
参考公式:相关系数;
经验回归方程中斜率和截距的最小二乘估计公式分别为,
【答案】(1)模型一,理由见解析
(2)(i)A点,理由见解析;(ii)
【分析】(1)根据残差图,比较带状区域的宽度即可得出判断;
(2)(ⅰ)计算出残差即可求解;
(ⅱ)根据相关系数公式及经验回归方程计算即可.
【详解】(1)模型一拟合效果好.
理由如下:
模型一的残差图中的点更集中地分布于以取值为0的横轴为中心的宽度更窄的水平带状区域内,
说明预测值与真实值偏差更小.
(2)(ⅰ)在中,代入,得,
于是残差为,因此对于模型一中的A点.
(ⅱ),,
.
【变式训练】
变式1.(2026·四川成都·三模)2025年,我国能源安全保障能力再上新台阶,全口径发电量占全球总发电量的,稳居世界第一,为智能算力的爆发性电力需求持续提供稳定保障.某学习小组收集了2021年至2025年我国全口径发电量相关数据,根据数据制作了如下数据表格和散点图.
年份
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
我国全口径发电量(单位:万亿千瓦时)
8.52
8.85
9.46
10.09
10.58
(1)由散点图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的经验回归方程,并预测2026年我国全口径发电量.
参考数据:.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,相关系数.
【答案】(1),可用线性回归模型拟合与的关系
(2),(万亿千瓦时)
【详解】(1)因为,
所以,
所以
,
故可用线性回归模型拟合与的关系;
(2),
则,
则经验回归方程为,
令,则,
故预估2026年我国全口径发电量为(万亿千瓦时)
变式2.(2026·湖南长沙·一模)为了得到某种新产品表面的腐蚀刻线,技术员通过实验检测,发现该产品的腐蚀深度(单位:)与腐蚀时间(单位:)有关,并收集数据如下表:
腐蚀时间t/s
5
10
15
20
30
40
腐蚀深度 y/μm
5
8
10
13
17
19
(1)根据表中样本数据,计算样本相关系数,(系数精确到)并推断它们的线性相关程度;
(2)建立关于的线性回归方程(系数精确到);若腐蚀时间为,请估计腐蚀深度.参考数据:
参考公式:相关系数
线性回归方程的斜率 截距
【答案】(1),高度线性正相关;
(2),
【分析】(1)根据相关系数公式求出,即可解题;
(2)数据代入公式即可求出回归方程,进而可得腐蚀时间为的腐蚀深度.
【详解】(1)由题可知, ,
,
,
,
,非常接近1,说明腐蚀深度与腐蚀时间呈高度线性正相关;
(2),
,
因此线性回归方程为: ,
当腐蚀时间时,代入得: .
考点三 决定系数
【例题分析】
例1.(2026·陕西西安·模拟预测)某种农作物可以生长在滩涂和盐碱地,将海水稀释后对其进行灌溉.某实验基地为了研究海水浓度对亩产量的影响,通过在试验田的种植实验,测得了该农作物的亩产量与海水浓度的数据如下表.
海水浓度
3
4
5
6
7
亩产量
0.57
0.53
0.44
0.36
0.30
残差
0.02
0
绘制散点图发现,可以用一元线性回归模型拟合与的相关关系,用最小二乘法计算得关于的经验回归方程为.
(1)求,,的值;
(2)请计算该回归模型的决定系数(精确到0.01),并评价其拟合效果.(若,就认为拟合效果好;若,就认为拟合效果一般;若,就认为拟合效果差)
附:决定系数,其中.
【答案】(1),,
(2)0.99,该模型拟合效果良好
【分析】(1)先求出,再代入求得,得回归方程,利用回归方程求得;
(2)根据公式计算出后比较可得.
【详解】(1),
,
将 代入可得,即.
所以经验回归方程为
因,则
又因,则
(2)
所以决定系数,故该模型拟合效果良好.
例2.(2026·广东茂名·模拟预测)一只药用昆虫的产卵数与一定范围内的温度有关,现收集了该种药用昆虫的6组观测数据如下表:
温度
21
23
24
27
29
32
产卵数个
6
11
20
27
57
77
经计算得:线性回归模型的残差平方和,其中分别为观测数据中的温度和产卵数,.
(1)若用线性回归方程,求关于的回归方程(精确到0.1);
(2)若用非线性回归模型求得关于回归方程为,且相关指数0.9522.
(i)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好.
(ii)用拟合效果好的模型预测温度为时该种药用昆虫的产卵数(结果取整数).
附:一组数据,其回归直线的斜率和截距的最小二乘估计为;决定系数.
【答案】(1)
(2)(i)非线性回归模型拟合效果更好;(ii);
【分析】(1)求出、后代入公式直接计算得、,即可得解;
(2)(i)求出线性回归模型的决定系数,与比较即可得解;
(ii)直接把代入,计算即可得解.
【详解】(1)由题意,则,,
,,
y关于x的线性回归方程为.
(2)(i)对于线性回归模型,,,
决定系数为,
因为,所以用非线性回归模型拟合效果更好.
(ii)当,时(个)
所以温度为时,该种药用昆虫的产卵数估计为190个.
【变式训练】
变式1.(2026·新疆·模拟预测)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数(其中10场为一个周期)与产品销售额(千元)的数据统计如下:
直播周期数
1
2
3
4
5
产品销售额(千元)
3
7
15
30
40
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
55
382
65
978
101
其中,
(1)请根据表中数据,建立关于的回归方程(系数精确到);
(2)①乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?
(3)由①所得的结论,计算该直播间欲使产品销售额达到8万元以上,直播周期数至少为多少?(最终答案精确到1)
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,,相关指数:.
【答案】(1)
(2)乙建立的回归模型拟合效果更好
(3)10
【分析】(1)取对数,把非线性方程转化为线性方程,利用公式求解系数可得答案;
(2)根据公式求解相关指数,比较两个方程的相关指数的大小可得结论;
(3)利用乙的方程进行预测,求解不等式可得结果.
【详解】(1)将两边取对数得,令,则;
∵,∴根据最小二乘估计可知,;
∴,
∴回归方程为,
即.
(2)①甲建立的回归模型的.
∴乙建立的回归模型拟合效果更好.
(3)由①知,乙建立的回归模型拟合效果更好.
设,解得,∴直播周期数至少为10.
变式2.(2026·重庆涪陵·模拟预测)为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2021年种植的一批试验紫甘薯在温度升高时6组死亡的株数.
温度/℃
21
23
24
27
29
30
死亡数/株
6
11
20
27
57
77
经计算,,,,,
,,,其中,分别为试验数据中的温度和死亡株数,.
(1)若用一元线性回归模型,求关于的经验回归方程;
(2)若用非线性回归模型求得关于的非线性经验回归方程,且相关指数为.
(ⅰ)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好;
(ii)用拟合效果好的模型预测温度为35℃时该批紫甘薯的死亡株数(结果取整数).
附:对于一组数据其回归直线的斜率和截距的最小二乘估计分别为:,;相关指数为:.
【答案】(1);
(2)①;②192.
【分析】(1)根据题意,利用最小二乘法即可求出回归方程;
(2)①通过题意给的公式计算求出即可比较拟合效果;②根据题意直接带入求值即可.
【详解】(1)由题意可知,
,
∴关于的线性回归方程是;
(2)①用指数回归模型拟合与的关系,相关指数,
线性回归模型拟合与的关系,相关指数,
则,
∴用比拟合效果更好;
②中,令,
则,
故预测温度为时该紫甘薯死亡株数约为192株.
2
学科网(北京)股份有限公司
$2026届高三数学三轮冲刺复习讲义
非线性回归、相关系数、决定系数复习讲义
考点目录
非线性回归
相关系数
决定系数
知识点解析
考点一 非线性回归
知识点
1. 适用场景:散点图不呈直线分布,变量间为曲线相关,无法直接用线性回归。
1. 核心思路:换元线性化,通过代数变形将非线性关系转化为线性回归模型。
1. 常见模型及换元:
· 幂函数:,两边取对数 ,令 ,化为
· 指数函数:,取对数 ,令 ,化为
· 二次函数:,令 ,化为
1. 配套公式:线性回归方程 ,回归系数计算公式。
解题原理
借助对数、整体代换等方式,把非线性函数转化为标准线性形式,再套用线性回归的方法求解参数、回归方程。
解题思路
1. 观察散点图或题干函数形式,判断曲线类型(指数、幂函数、二次函数等)。
1. 设定新变量完成换元,将原式转化为线性方程。
1. 根据变换后的数据,计算线性回归系数 、。
1. 回代还原变量,得到原始变量的非线性回归方程。
1. 利用回归方程进行预测、估值。
考点二 相关系数
知识点
1. 公式:样本相关系数
1. 取值范围:
1. 意义:
· 越接近 ,线性相关程度越强;
· 越接近 ,线性相关程度越弱;
· :正相关, 增大 增大;
· :负相关, 增大 减小。
解题原理
通过量化指标 ,衡量两个变量线性相关的方向与强弱。
解题思路
1. 代入数据,按公式分步计算分子、分母,求出相关系数 。
1. 根据 的正负,判断正/负相关。
1. 根据 大小,判断线性相关强弱。
1. 结合题意,解释变量间的相关关系,辅助选择回归模型。
考点三 决定系数()
知识点
1. 定义:决定系数 ,取值 。
1. 常用公式:
1. 含义:反映回归模型的拟合效果。
· 越接近 ,残差平方和越小,模型拟合效果越好;
· 越接近 ,拟合效果越差。
1. 关联:线性模型中,( 为相关系数)。
解题原理
对比真实值、回归预测值、样本均值的偏差,量化模型对数据的解释能力,评判拟合优劣。
解题思路
1. 明确残差 、样本均值 ,代入公式计算 。
1. 比较多个模型的 大小, 越大,优先选择该模型。
1. 结合结果描述拟合效果,用于模型筛选、结果评价。
补充区分
1. 相关系数 :判断线性相关方向与强弱;
1. 决定系数 :判断回归方程拟合好坏,适用于线性、非线性回归;
1. 非线性回归:先线性变换,再计算回归系数、、。
考点一 非线性回归
【例题分析】
例1.(2026·重庆·模拟预测)现有抽球游戏规则如下:盒子中初始装有2个白球和1个黑球,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球的颜色相同.则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止游戏.否则,在盒子中再放入一个白球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.
1
2
3
4
5
516
209
127
98
50
(1)某人进行该抽球游戏时,最多进行三轮,即使第三轮不成功,也停止游戏,记其进行抽球游戏的轮数为随机变量,求的分布列和期望;
(2)有数学爱好者统计了近1000名玩家进行该抽球游戏的数据,记表示成功时抽球游戏的轮数,表示对应的人数,部分统计数据如表,经计算发现,非线性回归模型的拟合效果优于线性回归模型,求出关于的非线性回归方程(结果保留整数).
附:回归方程系数:,.
参考数据:设,,,,,,.
例2.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
例3.(2024·湖南邵阳·三模)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由)
(2)依据(1)的结果和上表中的数据求出关于的回归方程.
(3)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【变式训练】
变式1.(2026·福建南平·模拟预测)某大型商场的所有饮料自动售卖机在一天中某种饮料的销售量(单位:瓶)与天气温度(单位:)有很强的相关关系,为能及时给饮料自动售卖机添加该种饮料,该商场对天气温度和饮料的销售量进行了数据收集,得到下面的表格:
10
15
20
25
30
35
40
4
16
64
256
2048
4096
8192
经分析,可以用作为关于的经验回归方程.
(1)根据表中数据,求关于的经验回归方程(结果保留两位小数);
(2)若饮料自动售卖机在一天中不需添加饮料的记1分,需添加饮料的记2分,每台饮料自动售卖机在一天中需添加饮料的概率均为,在商场的所有饮料自动售卖机中随机抽取3台,记总得分为随机变量,求的分布列与数学期望.
参考公式及数据:对于一组数据,经验回归方程的斜率和截距的最小二乘估计公式分别为
变式2.(2026·湖南衡阳·模拟预测)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1∼10分别对应年份2013∼2022.
根据散点图,分别用模型①,②作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
75
2.25
82.5
4.5
120
28.35
表中,.
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型?并说明理由;
(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;
(ii)设该科技公司的年利润(单位:亿元)和年研发投入y(单位:亿元)满足(且),问该科技公司哪一年的年利润最大?
附:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.
变式3.(2026·贵州贵阳·模拟预测)为了研究某种细菌随天数变化的繁殖个数,收集数据如下:
天数
1
2
3
4
5
6
繁殖个数
6
12
25
49
95
190
(1)在图中作出繁殖个数关于天数变化的散点图,并由散点图判断(为常数)与(为常数,且)哪一个适宜作为繁殖个数关于天数变化的回归方程类型?(给出判断即可,不必说明理由)
(2)对于非线性回归方程(为常数,且),令,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值.
3.50
62.83
3.53
17.50
596.57
12.09
(ⅰ)证明:“对于非线性回归方程,令,可以得到繁殖个数的对数关于天数具有线性关系(即为常数)”;
(ⅱ)根据(ⅰ)的判断结果及表中数据,建立关于的回归方程(系数保留2位小数).
附:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.
考点二 相关系数
【例题分析】
例1.(2026·安徽芜湖·二模)某景区在五一劳动节期间开展“致敬最美劳动者”主题游园活动,天的人园游客量统计数据如下:
活动开展第天
人园游客量(百人)
(1)由数据看出,可用线性回归模型拟合与的关系,请计算相关系数(保留小数点后两位),并推断相关程度的强弱;
(2)求经验回归方程以及表中第个观测的残差;(观测值减去预测值称为残差)
(3)该景区在活动期间设置个打卡通道,记为通道①、通道②、通道③,游客人园时选择通道①、②、③的概率依次为、、;游客离园时,从原先入园通道离园的概率为,从另两个通道离园的概率均为,求游客从通道①离园的概率.
附:参考公式:相关系数;回归直线方程,其中,;
参考数据:,,,.
例2.(2026·云南昆明·模拟预测)某公司研发了一款新型智能机器人,一经投放市场颇受欢迎,为了更好地服务广大用户,该公司对这款机器人的某个性能指数x()与用户的喜欢程度y()进行调查统计,得到如下数据表:
x
5
6
7
8
9
y
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,利用相关系数r,判断该性能指数与用户的喜欢程度的相关性强弱(当时,x与y的相关性很强);
(2)这款智能机器人的交互性很强,用户可通过语音给机器人发布指令,机器人执行命令的正确率为90%,出错率为10%.当机器人正确执行命令时,使用者满意的概率为90%;当机器人执行命令错误时,使用者满意的概率为30%.如果使用者对某次命令执行结果不满意,求机器人实际正确执行命令的概率(精确到0.01);
(3)该公司科技人员随机抽取一台这款智能机器人进行挑战答题,共准备了4道高难度的问题,若机器人答对的题数不小于3,则挑战成功.已知机器人答对前两道题的概率均为p,答对后两道题的概率均为q,每次答题结果互不影响.当时,求机器人挑战成功的概率的最大值.
附:相关系数.
例3.(2026·江西抚州·模拟预测)某医药研究所为了评估一种新药的疗效,开展了临床试验.研究人员记录了14名志愿者服用不同剂量的药物后,血液中某关键生化指标(单位:)随给药剂量(单位:)的变化情况.为了寻找最合适的预测模型,研究人员分别利用模型一和模型二对这14组数据进行了拟合,并绘制了相应的残差图(如图所示,图中纵轴为残差,横轴为给药剂量).
(1)观察残差图,判断哪个模型的拟合效果更好,并说明理由;
(2)设这14组数据得到的经验回归方程为.
(ⅰ)已知样本中的某位志愿者的给药剂量为,生化指标为.若该样本点在拟合效果更优的模型中的残差对应于图中标注的四点之一,请指出该点并说明理由;
(ii)若在这14组数据中,给药剂量的标准差为,生化指标的标准差为,求生化指标与给药剂量的相关系数.(结果精确到0.01)
参考公式:相关系数;
经验回归方程中斜率和截距的最小二乘估计公式分别为,
【变式训练】
变式1.(2026·四川成都·三模)2025年,我国能源安全保障能力再上新台阶,全口径发电量占全球总发电量的,稳居世界第一,为智能算力的爆发性电力需求持续提供稳定保障.某学习小组收集了2021年至2025年我国全口径发电量相关数据,根据数据制作了如下数据表格和散点图.
年份
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
我国全口径发电量(单位:万亿千瓦时)
8.52
8.85
9.46
10.09
10.58
(1)由散点图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的经验回归方程,并预测2026年我国全口径发电量.
参考数据:.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,相关系数.
变式2.(2026·湖南长沙·一模)为了得到某种新产品表面的腐蚀刻线,技术员通过实验检测,发现该产品的腐蚀深度(单位:)与腐蚀时间(单位:)有关,并收集数据如下表:
腐蚀时间t/s
5
10
15
20
30
40
腐蚀深度 y/μm
5
8
10
13
17
19
(1)根据表中样本数据,计算样本相关系数,(系数精确到)并推断它们的线性相关程度;
(2)建立关于的线性回归方程(系数精确到);若腐蚀时间为,请估计腐蚀深度.参考数据:
参考公式:相关系数
线性回归方程的斜率 截距
考点三 决定系数
【例题分析】
例1.(2026·陕西西安·模拟预测)某种农作物可以生长在滩涂和盐碱地,将海水稀释后对其进行灌溉.某实验基地为了研究海水浓度对亩产量的影响,通过在试验田的种植实验,测得了该农作物的亩产量与海水浓度的数据如下表.
海水浓度
3
4
5
6
7
亩产量
0.57
0.53
0.44
0.36
0.30
残差
0.02
0
绘制散点图发现,可以用一元线性回归模型拟合与的相关关系,用最小二乘法计算得关于的经验回归方程为.
(1)求,,的值;
(2)请计算该回归模型的决定系数(精确到0.01),并评价其拟合效果.(若,就认为拟合效果好;若,就认为拟合效果一般;若,就认为拟合效果差)
附:决定系数,其中.
例2.(2026·广东茂名·模拟预测)一只药用昆虫的产卵数与一定范围内的温度有关,现收集了该种药用昆虫的6组观测数据如下表:
温度
21
23
24
27
29
32
产卵数个
6
11
20
27
57
77
经计算得:线性回归模型的残差平方和,其中分别为观测数据中的温度和产卵数,.
(1)若用线性回归方程,求关于的回归方程(精确到0.1);
(2)若用非线性回归模型求得关于回归方程为,且相关指数0.9522.
(i)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好.
(ii)用拟合效果好的模型预测温度为时该种药用昆虫的产卵数(结果取整数).
附:一组数据,其回归直线的斜率和截距的最小二乘估计为;决定系数.
【变式训练】
变式1.(2026·新疆·模拟预测)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数(其中10场为一个周期)与产品销售额(千元)的数据统计如下:
直播周期数
1
2
3
4
5
产品销售额(千元)
3
7
15
30
40
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
55
382
65
978
101
其中,
(1)请根据表中数据,建立关于的回归方程(系数精确到);
(2)①乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?
(3)由①所得的结论,计算该直播间欲使产品销售额达到8万元以上,直播周期数至少为多少?(最终答案精确到1)
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,,相关指数:.
变式2.(2026·重庆涪陵·模拟预测)为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2021年种植的一批试验紫甘薯在温度升高时6组死亡的株数.
温度/℃
21
23
24
27
29
30
死亡数/株
6
11
20
27
57
77
经计算,,,,,
,,,其中,分别为试验数据中的温度和死亡株数,.
(1)若用一元线性回归模型,求关于的经验回归方程;
(2)若用非线性回归模型求得关于的非线性经验回归方程,且相关指数为.
(ⅰ)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好;
(ii)用拟合效果好的模型预测温度为35℃时该批紫甘薯的死亡株数(结果取整数).
附:对于一组数据其回归直线的斜率和截距的最小二乘估计分别为:,;相关指数为:.
2
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。