内容正文:
2025-2026高二下学期数学《题海探秘》同步考点复习指南(人教A版2019选择性必修第三册)
专题12 一元线性回归模型及其应用
7考点复习指南
1.一元线性回归模型
把式子为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称
为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
2.线性经验回归方程与最小二乘法
设满足一元线性回归模型的两个变量的n对样本数据为(,),(,),,(,),由=+a+
(i=1,2,,n),得|-(+a)|= ||,显然||越小,表示样本数据点离直线y=bx+a的竖直距离越小.
通常用各散点到直线的竖直距离的平方之和Q=来刻画各样本观测数据与直线
y=bx+a的“整体接近程度”.
当a,b的取值为时,Q达到最小.将=x+称为Y关于x的经验回归方
程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二
乘法,求得的,叫做b,a的最小二乘估计.
经验回归直线一定过点(,).
3.残差分析
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减
去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
4.刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称
为残差图.在残差图中,残差点比较均匀地落在以取值为0的横轴为对称轴的水平带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.
(2)残差平方和法
残差平方和为,残差平方和越小,模型拟合效果越好.
(3)利用刻画拟合效果
=.
越大,模型的拟合效果越好,越小,模型的拟合效果越差.
5.回归分析的三大常用结论
(1)求解经验回归方程的关键是确定回归系数,应充分利用回归直线过样本点的中心.
(2)根据经验回归方程计算的值,仅是一个预报值,不是真实发生的值.
(3)根据的值可以判断两个分类变量有关的可信程度,若越大,则两分类变量有关的把握越大.
考点1 解释回归直线方程的意义
1.(2026高二·黑龙江·期中)研究表明某地的山高(km)与该山的年平均气温(℃)具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是( )
A.年平均气温为5℃时该山高估计为5km
B.该山高为8km处的年平均气温估计为10℃
C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关
D.该地的山高与该山的年平均气温成负相关关系
2.(2026高二·辽宁抚顺·期末)已知两个变量和之间有线性相关关系,经调查得到的样本数据如下表所示,根据表格中的数据求得回归直线方程,则( ).
1
2
4
6
7
4
3
2
0
-2
A., B.,
C., D.,
3.(2026高三·天津北辰·期末)下列命题中
①散点图不能直观地判断两个变量是否具有线性相关关系;
②回归直线就是散点图中经过样本数据点最多的那条直线;
③回归直线一定经过样本中心点.
其中正确命题的个数为( )
A. B. C. D.
4.【多选】(2026高二·山西太原·期末)使用经验回归方程进行预测时,下列结论正确的是( )
A.经验回归方程只适用于所研究的样本的总体
B.经验回归方程一般都有时效性
C.解释变量的取值离样本数据的范围越远,经验回归方程的预报效果越好
D.经验回归方程得到的预报值就是响应变量的精确值
5.(2026高二·全国·课堂例题)回归方程中Y的值与变量的实际值有什么区别?
6.(2026高二·河南南阳·开学考试)在线性回归方程中,为回归系数,下列关于的说法中不正确的是( )
A.为回归直线的斜率
B.,表示随增加,值增加,,表示随增加,值减少
C.是唯一确定的值
D.回归系数的统计意义是当每增加(或减少)一个单位,平均改变个单位
考点2 求回归直线方程
7.(2026高二·辽宁抚顺·开学考试)观测两相关变量得如下数据:则两变量间的回归直线方程为( ).
X
Y
A. B.
C. D.
8.(2026高二·全国·课后作业)某班10名学生的摸底考试成绩和期末考试成绩如下:
摸底成绩
50
35
40
55
80
60
65
35
90
50
期末成绩
53
51
56
68
87
71
46
31
79
68
计算得:,.
(1)画出散点图;
(2)建立一个回归直线方程,用摸底考试成绩来预测期末考试成绩(精确到0.1).
附:,.
9.(2026高三·广西桂林·开学考试)春节将至,某商家统计了去年某商品的日营销费用x(单位:百元)与日销售量y(单位:百件),为今年的营销方案制定提供相关的数据参考,得到的数据如下表:
日营销费用x/百元
2
3
4
5
6
日销售量y/百件
1
1.1
1.5
1.8
2.1
已知y与x线性相关.
(1)根据上表数据,求y关于x的经验回归方程;
(2)请利用(1)中的经验回归方程,试估计当今的日销售费用为1000元时,日销售量为多少百件.
参考公式:对于一组具有线性相关关系的数据().其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
10.(2026高三·上海·课堂例题)测得10对父子身高[单位:英寸(1英寸)如下:
父亲身高()
60
62
64
65
66
67
68
70
72
74
儿子身高()
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
(1)对变量与进行相关性检验;
(2)如果与之间具有相关关系,求回归直线方程;
(3)如果父亲身高为73英寸,试估计儿子的身高.
参考数据:,,,,,,.
11.(2026高三·上海·单元测试)当前,冷冻冷藏类技术发展迅速且应用广泛.某制冷技术重点实验室研究了不同果蔬在不同冻结速率下的冰点温度,以及低温环境对果蔬热物性的影响.设冻结速率为x(单位:分钟),冰点温度为y(单位:℃),如表为某种水果冰点温度随冻结速率变化的统计数据:
x
10
20
30
40
50
y
-5
-4.5
-2
1
2
根据以上数据,绘制了散点图:
(1)由散点图可以看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;
(2)求y关于x的线性回归方程,并预测当冻结速率为60分钟时,这种水果的冰点温度.
12.(2026高二·上海·课后作业)某连锁日用品销售公司下属5个社区便利店某月的销售额与利润额如下表所示.
便利店编号
1
2
3
4
5
销售额x/万元
30
60
45
80
89
利润额y/万元
2.3
3.5
3.2
4.0
5.3
(1)绘制销售额和利润额的散点图;
(2)若销售额和利润额具有线性相关关系,试计算利润额y与销售额x的经验回归直线方程.
13.(2026高二·福建三明·期中)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:
单价(元/件)
8
8.2
8.4
8.6
8.8
9
销量(万件)
90
84
83
80
75
68
(1)根据以上数据,求关于的线性回归方程;
(2)若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润,最大利润是多少.
附:参考公式:回归方程,
其中,.
参考数据:,.
14.(2026高二·辽宁朝阳·期中)某高中,高二数学备课组对学生记忆力和判断力进行统计分析,所得数据如下表所示:
4
6
8
10
12
2
3
5
6
8
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:.
15.(2026高二·河南周口·阶段检测)实现乡村振兴,开发本地资源,提高村民的收入,某村办企业研发了一种新手工产品,为确定合适的定价,统计了不同定价x(元)与网上月销量y(万件)的数据如下:
x
10
12
14
16
18
y
8
7
6
5
4
(1)求相关系数r,并说明其意义;
(2)建立y关于x的线性回归方程;
(3)若月销量不低于5万件可保证盈利,根据回归方程预测定价最高可定为多少元?(取整数)
(参考数据:,,,,)
(参考公式:,)
考点3 求样本中心(根据样本中心求参数)
16.(2026高二·河南南阳·阶段检测)已知具有相关关系的变量,它们之间的一组数据如表所示,若关于的回归方程为,则( )
A. B. C. D.
17.(2026·辽宁抚顺·模拟预测)若根据样本数据得到的回归直线方程为,且,,则______.
18.(2026高二·江西宜春·期末)根据下表数据得到y关于x的线性回归方程,则=______.
x
4
6
7
8
10
y
2
3
4
5
6
19.(2026高二·福建厦门·期末)已知变量的4组相关数据分别为,则关于的线性回归直线必经过点( )
A. B. C. D.
20.(2026高二·河北沧州·期末)某工厂为了研究某种产品的产量y(吨)与某种催化剂x(吨)之间的相关关系,在生产过程中,得到数据如下表,通过分析可得,这两个变量满足经验回归方程,则的值为______.
x
3
4
5
6
y
2.5
3
4
4.5
21.(2026·山东泰安·模拟预测)已知变量,具有线性相关关系,5组样本数据如下:
1
2
3
4
5
2
3
6
若其线性回归方程,且满足,则的值是( )
A.3 B.4 C.5 D.6
22.(2026高二·黑龙江大庆·期中)某商店记录2026年4月(16日至20日)每天的平均气温(单位:℃)与矿泉水日销量(单位:瓶),得到数据如下表:
气温
10
11
12
13
14
销量
65
70
75
80
85
经计算,气温与销量的样本相关系数接近1,经验回归直线方程为,其中斜率,则截距的值为( )
A.20 B.15 C.10 D.5
23.(2026·江西萍乡·模拟预测)为了研究与的线性相关关系,某同学收集了5组样本数据(如下表),利用最小二乘法得到关于的线性回归方程为,则下列说法正确的是( )
1
2
3
4
5
2
4
9
7
A.
B.这5组样本数据中,的分位数为4
C.当时,的预测值为10
D.去掉样本点后,与的样本相关系数必会改变
24.【多选】(2026·山东德州·模拟预测)下表是我国2021年至2025年生活垃圾无害化处理量(单位:亿吨)与年份代码(1-5分别对应2021-2025)的相关数据.根据表中数据求得关于的经验回归方程为,则( )
1
2
3
4
5
12
18
25
30
34
A.与正相关
B.回归直线过点
C.
D.预测2030年生活垃圾无害化处理量为60亿吨
25.【多选】(2026·广东深圳·模拟预测)某公司统计了去年1月份到5月份某种产品的销售额如下表:
月份
1
2
3
4
5
销售额万元
1.8
2.2
2.8
3.1
根据表中数据,通过最小二乘法求得的经验回归方程为,则( )
A.变量与正相关
B.
C.样本数据的下四分位数为1.8
D.当时,的预测值为4.1万元
考点4 根据回归直线方程估计数据
26.(2026高二·上海·期中)某公司为了解用电量(单位:)与气温(单位:)之间的关系,随机统计了天的用电量与当天气温,并制作了如下对照表:
气温
用电量
由表中数据可得回归方程中.试预测当气温为时,用电量约为 __.
27.(2026高二·全国·课后作业)从某大学随机选取8名女大学生,其身高(单位:cm)和体重(单位:kg)的回归方程为,则身高172 cm的女大学生,由回归方程可以预测其体重( )
A.为60.316 kg B.约为60.316 kg
C.大于60.316 kg D.小于60.316 kg
28.(2026高二·江苏南通·阶段检测)设某中学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的经验回归方程为.若该中学女生的平均身高为,则该中学女生的平均体重的估计值是( )
A. B. C. D.
29.(2026·上海徐汇·模拟预测)假如女儿的身高y(单位:cm)关于父亲身高x(单位:cm)的线性回归方程是,已知父亲身高为175cm,则估计女儿的身高为______cm.(结果精确到整数)
30.(2026·陕西商洛·模拟预测)已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下对应数据:
4
6
7
8
根据上表可得经验回归方程,据此估计,当投入万元广告费时,销售额为( )
A.万元 B.万元 C.万元 D.万元
31.(2026高二·安徽淮北·期末)李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
32.(2026·湖北随州·模拟预测)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.得到数据如下表:
零件个数x
10
20
30
40
50
加工时间y(min)
53
65
71
76
85
根据上表可得经验回归方程中的,则经验回归方程中___________;据此估计,加工的零件个数为60时所花费的时间为__________min.
33.(2027高三·全国·专题练习)在某文化节活动现场,为了解不同时段的入口游客人流量,从上午10点开始第一次向指挥中心反馈入口人流量,之后每过一个小时反馈一次.指挥中心统计了前5次的数据,其中,2,3,4,5,为第次入口人流量数据(单位:百人),由此得到关于的回归方程.已知,根据回归方程(参考数据:,),可预测下午4点时入口游客的人流量为________.
考点5 残差计算
34.(2026·湖北孝感·模拟预测)为了研究物理成绩与数学成绩之间的关系,随机抽取名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A. B. C. D.
35.(2026高二·河南新乡·月考)若变量与之间存在线性相关关系,且根据最小二乘法得到的经验回归方程为,则样本点的残差为( )
A. B. C. D.2.5
36.(2026高二·福建·期中)两个线性相关变量x与y的统计数据如表:
x
9
9.5
10
10.5
11
y
11
10
8
6
5
其回归直线方程是,则相对应于点的残差为( )
A.0.1 B.0.2 C.﹣0.1 D.﹣0.2
37.(2026高三·山东青岛·专题练习)已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的残差为( )
3
4
6
7
20
40
60
A.2 B. C.3 D.
38.【多选】(2026·广东·模拟预测)已知某AI软件公司为迎合市场的需求开发了一款新型智能AI写作软件,现将该软件上市后的月份以及每个月获得的利润(单位:万元)之间的关系统计如下表所示,并根据表中数据,得到经验回归方程,则( )
月份
1
2
3
4
5
利润
5
8
10
12
15
A. B.可以估计每增加1个月份,月利润提高2.8万元
C.可以估计10月份的利润为26.8万元 D.5月份利润的残差为0.4万元
39.【多选】(2026高三·福建福州·月考)某社会机构统计了某市四所大学年毕业生人数及自主创业人数如表:
A大学
B大学
C大学
D大学
毕业生人数x(千人)
3
4
5
m
自主创业人数y(千人)
根据表中的数据得到自主创业人数关于毕业生人数的经验回归方程为,则( )
A.y与x正相关
B.
C.当时,残差为
D.样本的相关系数r为负数
40.(2026高二·四川绵阳·期末)已知在一定范围内,水稻对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽水稻实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根长度(单位:cm)与氮元素吸收量(单位:mg/天)的相关数据,如下表所示:
9.9
12.1
14.8
18.2
19.9
21.8
25.1
27.7
30.4
32.1
0.30
0.34
0.42
0.50
0.55
0.60
0.71
0.74
0.78
0.86
根据表中数据可得及经验回归方程为,则( )
A.
B.变量和变量的样本相关系数
C.当时,残差为0
D.水稻根长度每增加1cm,一天的氮元素吸收量一定增加mg
41.【多选】(2026·重庆沙坪坝·模拟预测)成对数据和的一元线性回归模型为,依据模型可建立经验回归方程,用回归方程可得到响应变量的预测值及残差,残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果.对下列四幅残差图的描述正确的是( )
A.图甲显示残差的方差随观测时间变大而变大
B.图乙满足一元线性回归模型对随机误差的假设
C.图丙说明残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分
D.图丁说明残差与观测时间有线性相关性,故满足一元线性回归模型对随机误差的假设
考点6 相关指数计算
42.【多选】(2026高三·山东青岛·期末)如果散点图中所有的散点都落在一条斜率为非0的直线上,则( )
A.解释变量和响应变量是线性函数关系 B.解释变量和响应变量是线性相关关系
C.相关系数 D.决定系数
43.【多选】(2026高二·河北沧州·期中)两个具有线性相关关系的变量的一组数据为,,,,则下列说法正确的是( )
A.若相关系数,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数越大,残差平方和越小,模型的拟合效果越好
D.决定系数越小,残差平方和越小,模型的拟合效果越好
44.(2026高二·全国·专题练习)某同学用收集到的6组数据对制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线的方程:,相关系数为,决定系数为;经过残差分析,确定点E为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线的方程:相关系数为,决定系数为.则以下结论中,正确的是( ).
① ② ③ ④
A.①② B.①②③ C.②④ D.②③④
45.(2026高三·全国·专题练习)某公司收集了某商品销售收入(单位:万元)与相应的广告支出(单位:万元)共10组数据,绘制出散点图,如图,并利用线性回归模型进行拟合.若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法错误的是________.
①决定系数变小 ②残差平方和变小
③相关系数的值变小 ④自变量与因变量相关性变弱
46.(2026·广东广州·模拟预测)某校数学建模兴趣小组收集了一组恒温动物体重(单位:克)与脉搏率(单位:心跳次数/分钟)的对应数据,根据生物学常识和散点图得出与近似满足(为参数).令,,计算得,,.由最小二乘法得经验回归方程为,则的值为___________;为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数___________.(参考公式:决定系数)
47.(2026高三·湖南长沙·阶段检测)海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x(‰)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y与海水浓度x之间的相关关系,用最小二乘法计算得y与x之间的经验回归方程为.
海水浓度(‰)
3
4
5
6
7
亩产量 (吨)
0.62
0.58
0.49
0.4
0.31
残差
(1)请你估计:当浇灌海水浓度为8‰时,该品种海水稻的亩产量;
(2)(i)完成上述残差表;
(ii)在统计学中,常用决定系数来刻画回归效果,越大,模型拟合效果越好,并用它来说明响应变量与解释变量的相关性.你能否利用以上表格中的数据,计算决定系数,并判断模型的拟合效果.(计算中数据精确到0.01)
(附:残差,决定系数)
48.(2026高二·全国·课后作业)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本(单位:万元)和企业利润的数据(单位:万元)如下表所示:
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
残差
0.2
0.6
1.8
-3
-1
-4.6
根据最小二乘法公式求得经验回归方程为.
(1)求的值,并利用已知的经验回归方程求出8月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到0.0001),若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)的决定系数,请说明以上两种模型哪种模型拟合效果更好.
参考公式及数据:,,.
49.(2026高二·广东东莞·期末)在科技日新月异的今天,无人驾驶网约车正逐渐成为出行领域的新宠,根据统计数据显示,某区域过去5天的订单数如下:
日期x(天)
1
2
3
4
5
订单数y(件)
13
21
45
55
66
为了进一步了解订单数的变化情况,甲乙两个数学学习小组分别进行了研究,
(1)甲小组决定用线性回归模型进行拟合,求此时y关于x的经验回归方程;
(2)乙小组采用非线性回归模型进行拟合,求得y关于x的经验回归方程为,并计算出决定系数,
①根据回归模型的决定系数,说明哪个小组的模型拟合效果更好;
②用①中选择的模型预测该区域第10天的订单数(结果保留整数).
附:,;决定系数.参考数据:
考点7 非线性回归分析
50.(2026高二·海南·期中)椰树集团为确定下一年度投入椰树椰汁的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
298.8
1.6
1469
108.8
表中
(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?根据判断结果及表中数据,建立关于的回归方程;
(2)已知椰树椰汁的年利润与的关系为.根据(1)的结果求年宣传费时,年销售量及年利润的预报值是多少?
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
51.(2026·辽宁沈阳·模拟预测)某农业技术站研究化肥施用量对大棚青菜产量的影响.在一定范围内,施肥量(单位kg/亩)越大,青菜产量(单位kg/亩)越高.实验测得具体数据如下表:
施肥量
2
3
4
5
6
青菜产量
4200
4300
4350
4380
4400
根据散点数据特征,研究人员分析得出产量与施肥量近似满足的关系,取,经计算可知,,,,
(1)请根据上述数据,计算得出产量y关于施肥量x的回归方程,并结合常识描述的实际意义,为简化计算,计算过程中、均精确到个位数.
(2)若青菜的收购价格为2元/kg,化肥的采购价格为12元/kg,请从利润最大的角度给出大棚的最优施肥量.
参考公式:,.
52.(2026高二·山东·阶段检测)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据(,2,3,…,n),其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
53.(2026高三·安徽淮北·月考)为研究某种图书每册的成本费元与印刷数册的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.
表中,.
(1)根据散点图判断:与哪一个更适宜作为每册成本费元与印刷数册的回归方程类型?只要求给出判断,不必说明理由
(2)根据(1)的判断结果及表中数据,建立关于的回归方程;
(3)若每册书定价为元,则至少应该印刷多少册才能使销售利润不低于元?假设能够全部售出
(附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,)
54.(2026高三·河南新乡·月考)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为x分钟)和他们的数学平均成绩(设为y)做出了以下数据统计,请根据表格回答问题:
x
60
70
80
90
100
110
120
130
y
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间x和平均成绩y的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出y与x的回归方程(系数精确到0.01).
(3)请根据此回归方程,阐述你对花在课后的学习时间和成绩之间关系的看法.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
55.(2026高三·广东深圳·阶段检测)某市近6年的新能源汽车保有量数据如下表
年份代号x
1
2
3
4
5
6
保有量y(万辆)
1
1.8
2.7
4
5.9
9.2
(1)从这6年中任意选取2年,在已知至少有1年的新能源汽车保有量大于3万辆的前提下,求这2年的新能源汽车保有量全都大于3万辆的概率;
(2)用函数模型对变量x,y的关系进行拟合,根据表中数据求出y关于x的回归方程(参数d的估计值精确到0.01).
参考数据:,,,;
设,,
参考公式:回归直线的斜率和截距的最小二乘估计公式分别为:,
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
2025-2026高二下学期数学《题海探秘》同步考点复习指南(人教A版2019选择性必修第三册)
专题12 一元线性回归模型及其应用
7考点复习指南
1.一元线性回归模型
把式子为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称
为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
2.线性经验回归方程与最小二乘法
设满足一元线性回归模型的两个变量的n对样本数据为(,),(,),,(,),由=+a+
(i=1,2,,n),得|-(+a)|= ||,显然||越小,表示样本数据点离直线y=bx+a的竖直距离越小.
通常用各散点到直线的竖直距离的平方之和Q=来刻画各样本观测数据与直线
y=bx+a的“整体接近程度”.
当a,b的取值为时,Q达到最小.将=x+称为Y关于x的经验回归方
程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二
乘法,求得的,叫做b,a的最小二乘估计.
经验回归直线一定过点(,).
3.残差分析
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减
去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
4.刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称
为残差图.在残差图中,残差点比较均匀地落在以取值为0的横轴为对称轴的水平带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.
(2)残差平方和法
残差平方和为,残差平方和越小,模型拟合效果越好.
(3)利用刻画拟合效果
=.
越大,模型的拟合效果越好,越小,模型的拟合效果越差.
5.回归分析的三大常用结论
(1)求解经验回归方程的关键是确定回归系数,应充分利用回归直线过样本点的中心.
(2)根据经验回归方程计算的值,仅是一个预报值,不是真实发生的值.
(3)根据的值可以判断两个分类变量有关的可信程度,若越大,则两分类变量有关的把握越大.
考点1 解释回归直线方程的意义
1.(2026高二·黑龙江·期中)研究表明某地的山高(km)与该山的年平均气温(℃)具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是( )
A.年平均气温为5℃时该山高估计为5km
B.该山高为8km处的年平均气温估计为10℃
C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关
D.该地的山高与该山的年平均气温成负相关关系
【答案】B
【分析】根据回归直线方程逐个验证选项可得答案.
【详解】对于A,因为时,,即山高估计为5km,A正确;
对于B,令,解得,即山高为8km处的年平均气温估计为℃,B错误;
对于C,由线性回归方程的系数的含义可知C正确;
对于D,因为,所以该地的山高与该山的年平均气温成负相关关系.
故选:B
2.(2026高二·辽宁抚顺·期末)已知两个变量和之间有线性相关关系,经调查得到的样本数据如下表所示,根据表格中的数据求得回归直线方程,则( ).
1
2
4
6
7
4
3
2
0
-2
A., B.,
C., D.,
【答案】D
【分析】根据回归方程系数所表示的含义和表格中的数据进行判断即可.
【详解】由样本数据得随着的增大呈现减小的趋势,
所以和之间存在负相关的关系,所以,易得.
故选:D.
3.(2026高三·天津北辰·期末)下列命题中
①散点图不能直观地判断两个变量是否具有线性相关关系;
②回归直线就是散点图中经过样本数据点最多的那条直线;
③回归直线一定经过样本中心点.
其中正确命题的个数为( )
A. B. C. D.
【答案】B
【分析】根据变量间的相关关系以及回归直线定义和性质即可判断选项.
【详解】对于①,散点图可以直观地判断两个变量是否具有线性相关关系,故错误;
对于②,回归直线也可能不过任何一个点,故错误;
对于③,回归直线一定经过样本中心点,故正确.
故选:B
4.【多选】(2026高二·山西太原·期末)使用经验回归方程进行预测时,下列结论正确的是( )
A.经验回归方程只适用于所研究的样本的总体
B.经验回归方程一般都有时效性
C.解释变量的取值离样本数据的范围越远,经验回归方程的预报效果越好
D.经验回归方程得到的预报值就是响应变量的精确值
【答案】AB
【分析】根据给定条件,结合经验回归方程的意义逐项判断即可.
【详解】对于A,经验回归方程只适用于所研究的样本的总体,A正确;
对于B,经验回归方程适用于有相关关系的两个变量,两者的变化可能会随时间的推移,
互相影响的情况不同,因此经验回归方程一般都有时效性,B正确;
对于C,解释变量的取值范围会影响经验回归方程的适用范围,
解释变量的取值离样本数据的范围越远,经验回归方程的预报效果越差,C错误;
对于D,经验回归方程得到的是响应变量的预报值,不是响应变量的精确值,D错误;
故选:AB
5.(2026高二·全国·课堂例题)回归方程中Y的值与变量的实际值有什么区别?
【答案】答案见解析
【详解】回归方程中Y的值是通过统计大量数据所得到的一个预测值,它具有随机性,对于每一个具体的变量实际值而言,预测值Y只是比较接近,但存在一定的误差,即(其中e为随机误差),预测值Y与变量的实际值的接近程度由随机误差e的标准差决定.如,人的体重与身高存在一定的线性相关关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.
6.(2026高二·河南南阳·开学考试)在线性回归方程中,为回归系数,下列关于的说法中不正确的是( )
A.为回归直线的斜率
B.,表示随增加,值增加,,表示随增加,值减少
C.是唯一确定的值
D.回归系数的统计意义是当每增加(或减少)一个单位,平均改变个单位
【答案】C
【分析】利用回归直线方程的特点逐项判断即得.
【详解】对于A,线性回归方程中的为回归直线的斜率,A正确;
对于B,,表示随增加,值增加,,表示随增加,值减少,B正确;
对于C,是由总体的一个样本利用一定的方法计算得到的,选择不同的样本
或不同的计算方法得到的一般是不同的,C错误;
对于D,回归系数的统计意义是当每增加(或减少)一个单位,平均改变个单位,D正确.
故选:C
考点2 求回归直线方程
7.(2026高二·辽宁抚顺·开学考试)观测两相关变量得如下数据:则两变量间的回归直线方程为( ).
X
Y
A. B.
C. D.
【答案】B
【分析】利用回归直线方程过样本中心点即可求解.
【详解】由表中数据可得,,
所以样本中心点为,代入选项中检验B正确.
故选:B.
8.(2026高二·全国·课后作业)某班10名学生的摸底考试成绩和期末考试成绩如下:
摸底成绩
50
35
40
55
80
60
65
35
90
50
期末成绩
53
51
56
68
87
71
46
31
79
68
计算得:,.
(1)画出散点图;
(2)建立一个回归直线方程,用摸底考试成绩来预测期末考试成绩(精确到0.1).
附:,.
【答案】(1)散点图见解析
(2)
【分析】(1)根据表格中的对应数据作为点的横、纵坐标描点即得;
(2)由表格数据求出,将相关数据分别代入的计算公式计算即得.
【详解】(1)散点图如图所示.
(2)(2)由表格数据,,
,
则.
,
故回归直线方程为.
9.(2026高三·广西桂林·开学考试)春节将至,某商家统计了去年某商品的日营销费用x(单位:百元)与日销售量y(单位:百件),为今年的营销方案制定提供相关的数据参考,得到的数据如下表:
日营销费用x/百元
2
3
4
5
6
日销售量y/百件
1
1.1
1.5
1.8
2.1
已知y与x线性相关.
(1)根据上表数据,求y关于x的经验回归方程;
(2)请利用(1)中的经验回归方程,试估计当今的日销售费用为1000元时,日销售量为多少百件.
参考公式:对于一组具有线性相关关系的数据().其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)
(2)3.24百件
【分析】(1)求出的平均值,利用给定公式计算可求出y关于x的经验回归方程;
(2)将代入回归方程即可估算出结果.
【详解】(1),
,
则,
所以
故关于的经验回归方程为.
(2)将代入,得,
故当今年的日营销费用为1000元时,日销售量约为3.24百件.
10.(2026高三·上海·课堂例题)测得10对父子身高[单位:英寸(1英寸)如下:
父亲身高()
60
62
64
65
66
67
68
70
72
74
儿子身高()
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
(1)对变量与进行相关性检验;
(2)如果与之间具有相关关系,求回归直线方程;
(3)如果父亲身高为73英寸,试估计儿子的身高.
参考数据:,,,,,,.
【答案】(1)与之间具有较强的线性相关关系
(2)
(3)69.9英寸
【分析】(1)根据相关系数的公式代入计算的答案;
(2)根据最小二乘法计算得到回归直线方程;
(3)把代入回归方程得.
【详解】(1),
因为非常接近于1,所以与之间具有较强的线性相关关系;
(2)设回归直线方程为,,,
所以回归直线方程为;
(3)时,,所以父亲身高为73英寸时,儿子的身高约为69.9英寸.
11.(2026高三·上海·单元测试)当前,冷冻冷藏类技术发展迅速且应用广泛.某制冷技术重点实验室研究了不同果蔬在不同冻结速率下的冰点温度,以及低温环境对果蔬热物性的影响.设冻结速率为x(单位:分钟),冰点温度为y(单位:℃),如表为某种水果冰点温度随冻结速率变化的统计数据:
x
10
20
30
40
50
y
-5
-4.5
-2
1
2
根据以上数据,绘制了散点图:
(1)由散点图可以看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;
(2)求y关于x的线性回归方程,并预测当冻结速率为60分钟时,这种水果的冰点温度.
【答案】(1)答案见解析
(2), 4.15℃
【分析】(1)根据所给数据计算相关系数可得.
(2)求出回归方程中系数,得回归方程,代入回归方程可得估计值.
【详解】(1),
,因为,
故两个变量间线性相关性很强,可以用线性回归模型拟合y与x的关系;
(2)由表可知,,,
,,
故y关于x的线性回归方程为,
当时,,
故当冻结速率为60分钟时,这种水果的冰点温度为4.15℃.
12.(2026高二·上海·课后作业)某连锁日用品销售公司下属5个社区便利店某月的销售额与利润额如下表所示.
便利店编号
1
2
3
4
5
销售额x/万元
30
60
45
80
89
利润额y/万元
2.3
3.5
3.2
4.0
5.3
(1)绘制销售额和利润额的散点图;
(2)若销售额和利润额具有线性相关关系,试计算利润额y与销售额x的经验回归直线方程.
【答案】(1)答案见解析
(2)
【分析】(1)根据散点图的作法作出图形即可;
(2)根据经验回归直线方程的求解方法求解.
【详解】(1)根据题意,作散点图图如下,
(2),,
设回归直线方程为,
=,
,
所以经验回归直线方程为.
13.(2026高二·福建三明·期中)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:
单价(元/件)
8
8.2
8.4
8.6
8.8
9
销量(万件)
90
84
83
80
75
68
(1)根据以上数据,求关于的线性回归方程;
(2)若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润,最大利润是多少.
附:参考公式:回归方程,
其中,.
参考数据:,.
【答案】(1)
(2)该产品的单价定为元时,工厂获得利润最大,最大利润为万元.
【分析】(1)计算相关数据代入回归方程公式中计算即可;
(2)设工厂获得的利润为万元,写出关于单价的二次函数,求出最大利润即可.
【详解】(1)因为,
,
所以.
则,
因此回归直线方程为.
(2)设工厂获得的利润为万元,
则,
所以该产品的单价定为元时,工厂获得利润最大,最大利润为万元.
14.(2026高二·辽宁朝阳·期中)某高中,高二数学备课组对学生记忆力和判断力进行统计分析,所得数据如下表所示:
4
6
8
10
12
2
3
5
6
8
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:.
【答案】(1);
(2)
【详解】(1),,
,
则,
所以关于的线性回归方程为;
(2)中,令得,
预测记忆力为9的学生的判断力为.
15.(2026高二·河南周口·阶段检测)实现乡村振兴,开发本地资源,提高村民的收入,某村办企业研发了一种新手工产品,为确定合适的定价,统计了不同定价x(元)与网上月销量y(万件)的数据如下:
x
10
12
14
16
18
y
8
7
6
5
4
(1)求相关系数r,并说明其意义;
(2)建立y关于x的线性回归方程;
(3)若月销量不低于5万件可保证盈利,根据回归方程预测定价最高可定为多少元?(取整数)
(参考数据:,,,,)
(参考公式:,)
【答案】(1),与完全负相关
(2)
(3)16元
【详解】(1),,
故,
故与完全负相关.
(2),
故,回归方程为.
(3)由题设,此时,故,故定价最高为16元.
考点3 求样本中心(根据样本中心求参数)
16.(2026高二·河南南阳·阶段检测)已知具有相关关系的变量,它们之间的一组数据如表所示,若关于的回归方程为,则( )
A. B. C. D.
【答案】A
【详解】,,
代入回归方程后可得,故.
17.(2026·辽宁抚顺·模拟预测)若根据样本数据得到的回归直线方程为,且,,则______.
【答案】
【详解】由题意得,
则,
则样本中心点为,将其代入到,
即,解得.
18.(2026高二·江西宜春·期末)根据下表数据得到y关于x的线性回归方程,则=______.
x
4
6
7
8
10
y
2
3
4
5
6
【答案】/
【分析】根据必在线性回归直线上代入求解即得.
线性回归方程中心点性质计算即可.
【详解】,,
因必在线性回归直线上,
则有,解得.
故答案为:.
19.(2026高二·福建厦门·期末)已知变量的4组相关数据分别为,则关于的线性回归直线必经过点( )
A. B. C. D.
【答案】B
【分析】计算出样本中心点即可求解.
【详解】因为,
线性回归直线必经过样本中心点.
故选:B.
20.(2026高二·河北沧州·期末)某工厂为了研究某种产品的产量y(吨)与某种催化剂x(吨)之间的相关关系,在生产过程中,得到数据如下表,通过分析可得,这两个变量满足经验回归方程,则的值为______.
x
3
4
5
6
y
2.5
3
4
4.5
【答案】0.35/
【分析】首先根据表格里面的数据求出的平均值,然后代入回归方程求出参数的值.
【详解】根据表格中的数据可得:,,
又因为在直线上,所以,可得.
故答案为:.
21.(2026·山东泰安·模拟预测)已知变量,具有线性相关关系,5组样本数据如下:
1
2
3
4
5
2
3
6
若其线性回归方程,且满足,则的值是( )
A.3 B.4 C.5 D.6
【答案】B
【分析】求出,再计算得到,得到与的另一个式子,联立可解
【详解】,代入回归方程得:
,联立得.
22.(2026高二·黑龙江大庆·期中)某商店记录2026年4月(16日至20日)每天的平均气温(单位:℃)与矿泉水日销量(单位:瓶),得到数据如下表:
气温
10
11
12
13
14
销量
65
70
75
80
85
经计算,气温与销量的样本相关系数接近1,经验回归直线方程为,其中斜率,则截距的值为( )
A.20 B.15 C.10 D.5
【答案】B
【详解】因为,且,
所以,解得.
23.(2026·江西萍乡·模拟预测)为了研究与的线性相关关系,某同学收集了5组样本数据(如下表),利用最小二乘法得到关于的线性回归方程为,则下列说法正确的是( )
1
2
3
4
5
2
4
9
7
A.
B.这5组样本数据中,的分位数为4
C.当时,的预测值为10
D.去掉样本点后,与的样本相关系数必会改变
【答案】C
【详解】对于A,,,
故,,故A错误;
对于B,的由小到大的排列为,而,
故的分位数为,故B错误;
对于C,由A中计算可得,故当时,,故C正确;
对于D,设原数据的相关系数为,则,
删除样本中心后,设剩余的样本点为,如下表:
1
2
4
5
2
4
9
7
则,,
该组数据对应的相关系数为,则,
故,故D错误.
24.【多选】(2026·山东德州·模拟预测)下表是我国2021年至2025年生活垃圾无害化处理量(单位:亿吨)与年份代码(1-5分别对应2021-2025)的相关数据.根据表中数据求得关于的经验回归方程为,则( )
1
2
3
4
5
12
18
25
30
34
A.与正相关
B.回归直线过点
C.
D.预测2030年生活垃圾无害化处理量为60亿吨
【答案】AC
【详解】,,
而回归直线为,故,故,故C正确,
因为,故与正相关,故A正确;
当时,,故B错误;
2030年对应,此时生活垃圾无害化处理量为(亿吨),
故D错误.
25.【多选】(2026·广东深圳·模拟预测)某公司统计了去年1月份到5月份某种产品的销售额如下表:
月份
1
2
3
4
5
销售额万元
1.8
2.2
2.8
3.1
根据表中数据,通过最小二乘法求得的经验回归方程为,则( )
A.变量与正相关
B.
C.样本数据的下四分位数为1.8
D.当时,的预测值为4.1万元
【答案】ABD
【分析】根据回归系数,可判定A正确;根据回归直线方程经过样本中心,列出方程,求得的值,可判定B正确;根据百分位数的计算方法,可判定C错误;根据回归直线方程,求得预测值,可判定D正确.
【详解】对于A,由回归直线方程,可得,
所以变量与正相关,所以A正确;
对于B,因为回归直线方程经过样本中心,
因为,所以,
又由,解得,所以B正确;
对于C,将样本数据的数据排序为:,
由,则样本数据的下四分位数为第个数据,所以C不正确;
对于D,当时,,所以的预测值为万元,所以D正确.
考点4 根据回归直线方程估计数据
26.(2026高二·上海·期中)某公司为了解用电量(单位:)与气温(单位:)之间的关系,随机统计了天的用电量与当天气温,并制作了如下对照表:
气温
用电量
由表中数据可得回归方程中.试预测当气温为时,用电量约为 __.
【答案】
【分析】根据样本中心在回归直线上可得回归直线方程,进而可得估计值.
【详解】,,
样本点的中心为,
代入,
,
则线性回归方程为,
取,得,
故答案为:.
27.(2026高二·全国·课后作业)从某大学随机选取8名女大学生,其身高(单位:cm)和体重(单位:kg)的回归方程为,则身高172 cm的女大学生,由回归方程可以预测其体重( )
A.为60.316 kg B.约为60.316 kg
C.大于60.316 kg D.小于60.316 kg
【答案】B
【分析】根据题意,令,代入回归直线方程,即可求解.
【详解】由身高和体重的回归方程为,
令,可得(),
即由回归方程可以预测其体重大约为.
故选:B.
28.(2026高二·江苏南通·阶段检测)设某中学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的经验回归方程为.若该中学女生的平均身高为,则该中学女生的平均体重的估计值是( )
A. B. C. D.
【答案】A
【分析】将代入回归直线方程,可得出该中学女生的平均体重的估计值.
【详解】将代入回归直线方程得,
因此,该中学女生的平均体重的估计值是.
故选:A.
29.(2026·上海徐汇·模拟预测)假如女儿的身高y(单位:cm)关于父亲身高x(单位:cm)的线性回归方程是,已知父亲身高为175cm,则估计女儿的身高为______cm.(结果精确到整数)
【答案】
【分析】根据回归方程代入数据计算即得.
【详解】因为女儿身高为(单位:)关于父亲身高(单位:)的经验回归方程是,
所以当父亲的身高为时,.
故答案为:.
30.(2026·陕西商洛·模拟预测)已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下对应数据:
4
6
7
8
根据上表可得经验回归方程,据此估计,当投入万元广告费时,销售额为( )
A.万元 B.万元 C.万元 D.万元
【答案】D
【详解】由上表可知:,,
样本点的中心为,
代入经验回归方程,得,
经验回归方程为,
将代入可得,
当投入万元广告费时,销售额为万元.
31.(2026高二·安徽淮北·期末)李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
【答案】D
【详解】由第7天的实际值是,所以预测值为35.6,得 ①,
因为回归直线经过中心点,又,,所以②,
联立①②,解得,,
所以预计第10天的营业收入(千元).
32.(2026·湖北随州·模拟预测)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.得到数据如下表:
零件个数x
10
20
30
40
50
加工时间y(min)
53
65
71
76
85
根据上表可得经验回归方程中的,则经验回归方程中___________;据此估计,加工的零件个数为60时所花费的时间为__________min.
【答案】 47.5 92.5
【分析】由题中数据可得,,根据经验回归直线必过样本中心点可得,代入运算求解即可.
【详解】由题意可得,,
因为经验回归直线必过样本中心点,且,
则,解得,
即,当时,则,
故估计加工的零件个数为60时,所花费的时间为92.5 min.
33.(2027高三·全国·专题练习)在某文化节活动现场,为了解不同时段的入口游客人流量,从上午10点开始第一次向指挥中心反馈入口人流量,之后每过一个小时反馈一次.指挥中心统计了前5次的数据,其中,2,3,4,5,为第次入口人流量数据(单位:百人),由此得到关于的回归方程.已知,根据回归方程(参考数据:,),可预测下午4点时入口游客的人流量为________.
【答案】11
【分析】先求出自变量的样本均值,再根据回归直线过样本中心点求出回归系数,最后将预测时刻对应的自变量代入回归方程计算预测值.
【详解】由题意得,把代入,
得,解得,则,
当时,.
故答案为:.
考点5 残差计算
34.(2026·湖北孝感·模拟预测)为了研究物理成绩与数学成绩之间的关系,随机抽取名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A. B. C. D.
【答案】A
【详解】时的预测值,
时的真实为值,
样本点的残差为.
35.(2026高二·河南新乡·月考)若变量与之间存在线性相关关系,且根据最小二乘法得到的经验回归方程为,则样本点的残差为( )
A. B. C. D.2.5
【答案】A
【分析】根据回归直线方程,令,可得,进而求得样本点的残差,得到答案.
【详解】由回归方程为,令,可得,
所以样本点的残差为.
故选:A.
36.(2026高二·福建·期中)两个线性相关变量x与y的统计数据如表:
x
9
9.5
10
10.5
11
y
11
10
8
6
5
其回归直线方程是,则相对应于点的残差为( )
A.0.1 B.0.2 C.﹣0.1 D.﹣0.2
【答案】B
【分析】先求出,再计算残差可得正确的选项.
【详解】,,
所以,所以,故.
当时,,故,
故选:B.
【点睛】本题考查线性回归方程中参数的计算以及残差的计算,前者可利用线性回归方程所在的直线过样本中心来计算,本题属于基础题.
37.(2026高三·山东青岛·专题练习)已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的残差为( )
3
4
6
7
20
40
60
A.2 B. C.3 D.
【答案】A
【详解】由表格可得,
因样本中心点满足回归方程,
故有,解得.
当时,,
此时残差为.
38.【多选】(2026·广东·模拟预测)已知某AI软件公司为迎合市场的需求开发了一款新型智能AI写作软件,现将该软件上市后的月份以及每个月获得的利润(单位:万元)之间的关系统计如下表所示,并根据表中数据,得到经验回归方程,则( )
月份
1
2
3
4
5
利润
5
8
10
12
15
A. B.可以估计每增加1个月份,月利润提高2.8万元
C.可以估计10月份的利润为26.8万元 D.5月份利润的残差为0.4万元
【答案】AC
【分析】由回归方程过样本中心点即可求解判断A;由回归方程和残差定义即可逐项分析求解判断BCD.
【详解】依题意,,
将代入中,解得,故A正确;
可以估计每增加1个月份,月利润提高2.4万元,故B错误;
将代入中,得到,故C正确;
将代入中,得到,则所求残差为,故D错误.
故选:AC.
39.【多选】(2026高三·福建福州·月考)某社会机构统计了某市四所大学年毕业生人数及自主创业人数如表:
A大学
B大学
C大学
D大学
毕业生人数x(千人)
3
4
5
m
自主创业人数y(千人)
根据表中的数据得到自主创业人数关于毕业生人数的经验回归方程为,则( )
A.y与x正相关
B.
C.当时,残差为
D.样本的相关系数r为负数
【答案】AB
【分析】根据经验回归方程的性质,结合已知条件逐一分析各选项,对相关性、相关系数、残差等进行判断.
【详解】经验回归方程为,斜率为,函数单调递增,
y随着x的增大而增大,即y与x正相关,故A正确;
样本中心点必在回归线方程上,
,将代入回归方程,得,解得,
,解得,故B正确;
当时,预测值,实际值为,
残差,故C错误;
经验回归方程为,斜率为,
样本的相关系数,故D错误.
故选:AB.
40.(2026高二·四川绵阳·期末)已知在一定范围内,水稻对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽水稻实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根长度(单位:cm)与氮元素吸收量(单位:mg/天)的相关数据,如下表所示:
9.9
12.1
14.8
18.2
19.9
21.8
25.1
27.7
30.4
32.1
0.30
0.34
0.42
0.50
0.55
0.60
0.71
0.74
0.78
0.86
根据表中数据可得及经验回归方程为,则( )
A.
B.变量和变量的样本相关系数
C.当时,残差为0
D.水稻根长度每增加1cm,一天的氮元素吸收量一定增加mg
【答案】C
【分析】利用样本中心在回归直线上求参数判断A;根据回归直线一次项系数判断B;计算残差判断C;由回归直线的实际意义判断D.
【详解】由题设,所以,可得,故A错误;
所以,又,即与正相关,则样本相关系数,故B错误;
由时,,残差为,故C正确;
由回归方程说明随变化值的变化趋势,不能说变量每增加一个单位,的值一定增加个单位,故D错误.
故选:C
41.【多选】(2026·重庆沙坪坝·模拟预测)成对数据和的一元线性回归模型为,依据模型可建立经验回归方程,用回归方程可得到响应变量的预测值及残差,残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果.对下列四幅残差图的描述正确的是( )
A.图甲显示残差的方差随观测时间变大而变大
B.图乙满足一元线性回归模型对随机误差的假设
C.图丙说明残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分
D.图丁说明残差与观测时间有线性相关性,故满足一元线性回归模型对随机误差的假设
【答案】ABC
【分析】根据一元线性回归模型中对随机误差的假定进行判断.
【详解】根据一元线性回归模型中对随机误差的假定,残差应是均值为、方差为的随机变量的观测值.
对于A选项,由图可知残差的方差随观测时间变大而变大,故A正确;
对于B选项,由图可知残差比较均匀地分布在水平带状区域内,满足一元线性回归模型对随机误差的假设,故B正确;
对于C选项,由图知残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分,故C正确;
对于D选项,由图知残差与有线性关系,不符合题意,故D错误.
考点6 相关指数计算
42.【多选】(2026高三·山东青岛·期末)如果散点图中所有的散点都落在一条斜率为非0的直线上,则( )
A.解释变量和响应变量是线性函数关系 B.解释变量和响应变量是线性相关关系
C.相关系数 D.决定系数
【答案】AD
【分析】根据散点图得这两个变量线性相关,由此逐项判断得解.
【详解】由散点图中所有的散点都落在一条斜率为非0的直线上,
得解释变量和响应变量是线性函数关系,不是线性相关关系,,,BC错误,AD正确.
故选:AD
43.【多选】(2026高二·河北沧州·期中)两个具有线性相关关系的变量的一组数据为,,,,则下列说法正确的是( )
A.若相关系数,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数越大,残差平方和越小,模型的拟合效果越好
D.决定系数越小,残差平方和越小,模型的拟合效果越好
【答案】AC
【分析】根据相关系数的概念可判定AB,根据决定系数的概念可判定CD.
【详解】对于A:因为r的符号反映相关关系的正负性,故A正确;
对于B:根据相关系数越接近1,变量相关性越强,故B错误;
对于C:决定系数越大,残差平方和越小,效果越好,故C正确,D错误.
故选:AC.
44.(2026高二·全国·专题练习)某同学用收集到的6组数据对制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线的方程:,相关系数为,决定系数为;经过残差分析,确定点E为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线的方程:相关系数为,决定系数为.则以下结论中,正确的是( ).
① ② ③ ④
A.①② B.①②③ C.②④ D.②③④
【答案】B
【分析】利用回归方程的性质,利用相关系数和相关指数分析解答.
【详解】由散点图可知,x,y之间是正相关关系,所以,故①正确;
由散点图可知,回归直线的斜率是正数,且的斜率大于的斜率,
所以,故②③正确:
由散点图可知,去掉“离群点”E后,相关性更强,拟合的效果更好,
所以,故④错误.
故选:B.
45.(2026高三·全国·专题练习)某公司收集了某商品销售收入(单位:万元)与相应的广告支出(单位:万元)共10组数据,绘制出散点图,如图,并利用线性回归模型进行拟合.若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法错误的是________.
①决定系数变小 ②残差平方和变小
③相关系数的值变小 ④自变量与因变量相关性变弱
【答案】①③④
【分析】回归效果越好,则决定系数越大,相关系数的绝对值越大,残差平方和越小.
【详解】从图中可以看出点较其他点,偏离直线远,故去掉点后,回归效果更好,
故决定系数会变大,更接近于1;残差平方和变小;
相关系数的绝对值,即会更接近于1,由图可得与正相关,故会更接近于1,即相关系数的值变大,自变量与因变量相关性变强,故①,③,④错误,②正确.
故答案为:①③④.
46.(2026·广东广州·模拟预测)某校数学建模兴趣小组收集了一组恒温动物体重(单位:克)与脉搏率(单位:心跳次数/分钟)的对应数据,根据生物学常识和散点图得出与近似满足(为参数).令,,计算得,,.由最小二乘法得经验回归方程为,则的值为___________;为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数___________.(参考公式:决定系数)
【答案】
【分析】根据回归直线方程必过样本中心点求出,即可求出,再根据决定系数公式求出.
【详解】因为,两边取对数可得,
又,,
依题意回归直线方程必过样本中心点,
所以,解得,所以,
又.
故答案为:;
47.(2026高三·湖南长沙·阶段检测)海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x(‰)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y与海水浓度x之间的相关关系,用最小二乘法计算得y与x之间的经验回归方程为.
海水浓度(‰)
3
4
5
6
7
亩产量 (吨)
0.62
0.58
0.49
0.4
0.31
残差
(1)请你估计:当浇灌海水浓度为8‰时,该品种海水稻的亩产量;
(2)(i)完成上述残差表;
(ii)在统计学中,常用决定系数来刻画回归效果,越大,模型拟合效果越好,并用它来说明响应变量与解释变量的相关性.你能否利用以上表格中的数据,计算决定系数,并判断模型的拟合效果.(计算中数据精确到0.01)
(附:残差,决定系数)
【答案】(1)吨.
(2)残差表见解析;,拟合效果较好.
【分析】(1)先求出平均数,代入经验回归方程即可求出b,从而求解.
(2)(i)根据经验回归方程求解,从而可得;
(ii)根据公式求出决定系数,进而判断.
【详解】(1)根据题中数据可知,,
将样本中心点的坐标代入经验回归方程得
,解得,
所以经验回归方程为.
当时,,
即当浇灌海水浓度为8‰时,该品种海水稻的亩产量为吨.
(2)(i)由经验回归方程可得
,;
,;
,;
,;
,.
所以残差表如下:
海水浓度(‰)
3
4
5
6
7
亩产量 (吨)
0.62
0.58
0.49
0.4
0.31
残差
(ii)由上数据可知,
,
所以决定系数,与1比较接近,
所以拟合效果较好.
48.(2026高二·全国·课后作业)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本(单位:万元)和企业利润的数据(单位:万元)如下表所示:
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
残差
0.2
0.6
1.8
-3
-1
-4.6
根据最小二乘法公式求得经验回归方程为.
(1)求的值,并利用已知的经验回归方程求出8月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到0.0001),若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)的决定系数,请说明以上两种模型哪种模型拟合效果更好.
参考公式及数据:,,.
【答案】(1),;
(2),拟合程度更好.
【分析】(1)根据经验回归方程过样本中心点,先由经验回归方程和的平均数,求出的平均数,再根据平均数的定义求出;然后根据残差定义计算8月份的残差.
(2)先求出残差平方和,再代入公式计算,最后与非线性回归模型的比较大小,即可判断.
【详解】(1)因为,,,
则,解得;
8月份对应的残差值.
(2)因为,
所以,
所以,
所以线性回归模型拟合程度更好.
49.(2026高二·广东东莞·期末)在科技日新月异的今天,无人驾驶网约车正逐渐成为出行领域的新宠,根据统计数据显示,某区域过去5天的订单数如下:
日期x(天)
1
2
3
4
5
订单数y(件)
13
21
45
55
66
为了进一步了解订单数的变化情况,甲乙两个数学学习小组分别进行了研究,
(1)甲小组决定用线性回归模型进行拟合,求此时y关于x的经验回归方程;
(2)乙小组采用非线性回归模型进行拟合,求得y关于x的经验回归方程为,并计算出决定系数,
①根据回归模型的决定系数,说明哪个小组的模型拟合效果更好;
②用①中选择的模型预测该区域第10天的订单数(结果保留整数).
附:,;决定系数.参考数据:
【答案】(1)
(2)①甲小组的线性回归模型拟合效果更好 ;②138件
【分析】(1)根据公式求,可得回归方程.
(2)计算甲小组模型的决定系数,比较决定系数的大小,可得结论;把代入线性回归方程,可预测该区域第10天的订单数.
【详解】(1)由题可知:
,,
,,
关于x的回归方程为.
(2)①由(1)知,从而有.
x
1
2
3
4
5
12
26
40
54
68
,
,
,
,从来看甲小组的线性回归模型拟合效果更好.
②当时,.预测第10天的订单数为138件.
考点7 非线性回归分析
50.(2026高二·海南·期中)椰树集团为确定下一年度投入椰树椰汁的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
298.8
1.6
1469
108.8
表中
(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?根据判断结果及表中数据,建立关于的回归方程;
(2)已知椰树椰汁的年利润与的关系为.根据(1)的结果求年宣传费时,年销售量及年利润的预报值是多少?
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
【答案】(1)
(2)644.6;258.3
【分析】(1)根据散点图分析得出回归方程类型,结合非线性回归模型转化线性回归方程分析求解即可;
(2)根据(1)中的方程代入相关变量计算分析即可.
【详解】(1)由散点图可以判断,适宜作为年销售量关于年宣传费的回归方程类型,
令,先建立关于的线性回归方程,
由于 ,
则,
所以关于的线性回归方程为,
因此关于的回归方程为.
(2)当时,年销售量的预报值,
年利润的预报值.
51.(2026·辽宁沈阳·模拟预测)某农业技术站研究化肥施用量对大棚青菜产量的影响.在一定范围内,施肥量(单位kg/亩)越大,青菜产量(单位kg/亩)越高.实验测得具体数据如下表:
施肥量
2
3
4
5
6
青菜产量
4200
4300
4350
4380
4400
根据散点数据特征,研究人员分析得出产量与施肥量近似满足的关系,取,经计算可知,,,,
(1)请根据上述数据,计算得出产量y关于施肥量x的回归方程,并结合常识描述的实际意义,为简化计算,计算过程中、均精确到个位数.
(2)若青菜的收购价格为2元/kg,化肥的采购价格为12元/kg,请从利润最大的角度给出大棚的最优施肥量.
参考公式:,.
【答案】(1),实际意义是当化肥使用量无限增加时,青菜产量的理论上限为/亩
(2)当施肥量为10kg/亩时利润最大
【分析】(1)根据题意,利用回归系数的公式,求得,进而得出回归直线方程,结合的值,得出的实际意义;
(2)由利润为,结合基本不等式,即可求解.
【详解】(1)根据题意,可得,
又由,
所以产量y关于施肥量x的回归方程为,
其中的实际意义是当化肥使用量无限增加时,青菜产量的理论上限为/亩.
(2)设利润为元/亩,
当且仅当kg/亩时取等,即当施肥量为10kg/亩时利润最大.
52.(2026高二·山东·阶段检测)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据(,2,3,…,n),其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
【答案】(1)模型建立y与x的回归方程更合适;
(2);
(3)960万元.
【分析】(1)利用非线性转化为线性,再求相关系数即可得到判断;
(2)利用非线性转化为线性,再求线性回归方程系数即可得解;
(3)利用基本不等式求最大值即可.
【详解】(1)由题意知,,
因为,所以用模型建立y与x的回归方程更合适.
(2)令,回归方程为,因为,,
所以关于x的回归方程为,即.
(3)由题意知,
当且仅当,即时取等号,
则,所以.
所以当研发经费投入为60万元时企业生产的利润最大,最大利润为960万元.
53.(2026高三·安徽淮北·月考)为研究某种图书每册的成本费元与印刷数册的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.
表中,.
(1)根据散点图判断:与哪一个更适宜作为每册成本费元与印刷数册的回归方程类型?只要求给出判断,不必说明理由
(2)根据(1)的判断结果及表中数据,建立关于的回归方程;
(3)若每册书定价为元,则至少应该印刷多少册才能使销售利润不低于元?假设能够全部售出
(附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,)
【答案】(1)
(2).
(3)册
【分析】(1)因为散点图呈现的是非线性趋势,所以选择更合适;
(2)令,将转化为线性回归方程,利用最小二乘估计公式计算和,进而得到关于的回归方程;
(3)根据利润公式,结合回归方程列出不等式,求解不等式得到印刷数的取值范围,确定至少印刷的册数.
【详解】(1)由散点图的分布是非线性的,故适宜作为每册成本费与印刷册数的回归方程;
(2)令,先建立关于的线性回归方程,
由于,
,
关于的线性回归方程为,
从而关于的回归方程为;
(3)假设印刷册,依题意,,
,
至少印刷册.
54.(2026高三·河南新乡·月考)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为x分钟)和他们的数学平均成绩(设为y)做出了以下数据统计,请根据表格回答问题:
x
60
70
80
90
100
110
120
130
y
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间x和平均成绩y的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出y与x的回归方程(系数精确到0.01).
(3)请根据此回归方程,阐述你对花在课后的学习时间和成绩之间关系的看法.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
【答案】(1)②合适
(2);
(3)答案见解析
【分析】(1)根据题意,经比较可得最合适的函数模型;
(2)由(1)中模型可得,设,,则,利用公式可求后者,从而得到前者;
(3)根据回归方程可得相应的看法.
【详解】(1)根据题意,经比较可知,选择②()作为学习时间x和平均成绩y的回归类型最合适;
(2)对()两边取以e为底的对数可得,
设,则,
,所以,
故,即,
所以;
(3)此回归方程为关于学习时间的增函数,说明随着课后的学习时间的增加,学习成绩是提高的,但是函数的增速先快后慢,说明如果原来成绩较低,通过增加课后的学习时间可以有效提高成绩,但是当成绩提高到120分左右时,想要通过延长课后的学习时间来提高学习成绩就比较困难了,需要想别的办法.
55.(2026高三·广东深圳·阶段检测)某市近6年的新能源汽车保有量数据如下表
年份代号x
1
2
3
4
5
6
保有量y(万辆)
1
1.8
2.7
4
5.9
9.2
(1)从这6年中任意选取2年,在已知至少有1年的新能源汽车保有量大于3万辆的前提下,求这2年的新能源汽车保有量全都大于3万辆的概率;
(2)用函数模型对变量x,y的关系进行拟合,根据表中数据求出y关于x的回归方程(参数d的估计值精确到0.01).
参考数据:,,,;
设,,
参考公式:回归直线的斜率和截距的最小二乘估计公式分别为:,
【答案】(1)
(2)
【分析】(1)先确定保有量大于3万辆的年份数量,用对立事件求至少1年大于3万辆的概率,再结合2年都大于3万辆的概率,通过条件概率公式计算结果;
(2)将非线性回归模型取对数转化为线性回归模型,利用给定数据计算斜率和截距,再还原得到原模型的参数.
【详解】(1)保有量大于3万辆的年份有第4,5,6年,共3年,
保有量不大于3万辆的年份有第1,2,3年,共3年,
设至少有1年保有量大于3万辆为事件,2年保有量全都大于3万辆为事件,
事件的对立事件为2年都不大于3万辆,总选法有,
两年都不大于3万辆的选法为,所以,
两年都大于3万辆的选法为,所以,
则.
(2)已知模型,两边取对数得,
令,则,即转化为线性回归方程,
其中,由题意得,
则,
,
因为,所以,
则.
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$