内容正文:
8.2 一元线性回归模型及其应用(第1课时:线性回归方程)
同步练习题
2025-2026学年第二学期高二数学人教A版选择性必修第三册
【学习目标】
1.计算样本中心点、根据样本中心点求参数;
2.用回归直线方程对总体进行估计;
3.求回归直线方程
【例题精练】
【例1】已知变量,的统计数据如下表,对表中数据作分析,发现与之间具有线性相关关系,利用最小二乘法,计算得到经验回归直线方程为,据此模型预测当时的值为__________.
5
6
7
8
9
3.5
4
5
6
6.5
【答案】
【分析】经验回归直线方程过样本点的中心,所以把代入求得的值,再代入求解即可.
【详解】由已知得,即样本点中心,
因为经验回归直线方程过样本点的中心,
所以,解得.
所以,当时,.
【例2】某大型管线网的局部呈网格结构,如图建立平面直角坐标系,一小型机器人沿管线移动执行巡检任务,在某次巡检的路径中经过了点:、、、、、、,若该机器人经过的点的纵坐标关于横坐标的一元线性回归方程是,则的值为______.
【答案】
【分析】求出样本的中心点,根据一元线性回归方程必经过中心点即可求解.
【详解】根据题意,机器人经过的个点的横坐标分别为,
其平均值为,
个点的纵坐标分别为,其平均值为,
又因为这些点的一元线性回归方程是,必过点,
代入得,即的值为.
【例3】乘着文旅融合的东风、借着线上推广的热潮,某非遗工坊生产的油纸伞销量逐年增长.该工坊为了科学规划生产,统计了2021-2025年油纸伞的销量数据如下表:
年份t/年
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
销量/万把
7
8
10
11
14
(1)统计表明销量与年份代码有较强的线性相关关系,求关于的线性回归方程,并预测该工坊油纸伞的销量最早在哪一年能超过20万把:
(2)已知该工坊2023年售出的油纸伞中,有6万把通过线上售出,用频率估计概率,现从2023年售出的油纸伞中随机抽取3把,求其中线上售出数量的分布列.
附:为回归直线方程,.
【答案】(1)答案见解析
(2)答案见解析
【分析】(1)根据题中公式求出关于的线性回归方程,再运用代入法进行求解即可;
(2)运用二项分布的定义和性质进行求解即可.
【详解】(1),
,
,
,
,
所以关于的线性回归方程为;
当,
所以预测该工坊油纸伞的销量最早在年能超过20万把.
(2)该工坊2023年售出的油纸伞中,有6万把通过线上售出,用频率估计概率,
所以2023年售出的油纸伞中,通过线上售出的概率为,
由题意可知:,
所以,
,
,
,
所以其中线上售出数量的分布列为:
【例4】为了解某社区全民健身开展情况,某调查中心统计了该社区2016~2025年每年用于健身设施维护、更新的资金投入(单位:万元)与当年参与健身的居民总人次(单位:千人次),数据如下:
年份
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
/万元
18
20
19
21
22
17
20
19
21
23
/千人次
32
36
34
38
40
30
37
35
39
42
(1)求关于的样本相关系数,并据此判断与的线性相关性强弱;(的值精确到0.01)
(2)若该社区2026年计划投入健身设施维护、更新的资金为25万元,求关于的线性回归方程,并预测该社区2026年参与健身的居民总人次.
附:(ⅰ)在线性回归方程中,,;
(ⅱ)样本相关系数,若,则可判断与的线性相关性很强;
(ⅲ),,,.
【答案】(1)0.99,与的线性相关性很强.
(2),46.3千人次.
【分析】(1)根据给定的数据代入相关系数公式计算,进而推断相关程度;
(2)利用最小二乘法求出线性回归直线方程,进而将代入计算即可.
【详解】(1)依题意得
,
因为,所以与的线性相关性很强.
(2)这10年每年用于健身设施维护、更新的资金投入的平均数
,
这10年每年参与健身活动的居民总人次的平均数
.
,,
所以线性回归方程为.
将代入,得,
即预测该社区2026年参与健身的居民总人次约为46.3千人次.
【A组基础达标】
一、单选题
1.某同学在研究变量,之间的相关关系时,得到以下数据:
4.8
5.8
7
8.3
9.1
2.8
4.1
5.2
5.9
7
并采用最小二乘法得到了线性回归方程,则
A., B., C., D.,
【答案】D
【分析】作出散点图,数形结合即可判断;
【详解】解:在坐标系中作出散点图(如图所示),观察可知,.
故选:D
【点睛】本题考查散点图的应用,以及最小二乘法的理解,属于基础题.
2.研究表明某地的山高(km)与该山的年平均气温(℃)具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是( )
A.年平均气温为5℃时该山高估计为5km
B.该山高为8km处的年平均气温估计为10℃
C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关
D.该地的山高与该山的年平均气温成负相关关系
【答案】B
【分析】根据回归直线方程逐个验证选项可得答案.
【详解】对于A,因为时,,即山高估计为5km,A正确;
对于B,令,解得,即山高为8km处的年平均气温估计为℃,B错误;
对于C,由线性回归方程的系数的含义可知C正确;
对于D,因为,所以该地的山高与该山的年平均气温成负相关关系.
故选:B
3.已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归方程是( )
A. B. C. D.
【答案】C
【分析】先根据斜率值设经验回归方程,再代入样本中心点求出参数得出经验回归方程即可.
【详解】由条件知,,设经验回归方程为,
则,
∴经验回归的方程是.
故选:C.
4.已知变量x,y之间具有线性相关关系,根据10对样本数据求得经验回归方程为.若,,则( )
A.1 B.2 C.3 D.4
【答案】B
【分析】根据题意求得样本中心,代入回归直线方程,即可求解.
【详解】因为,,所以,,
因为,且过点,所以,解得.
5.某品牌啤酒厂,进行市场调研,发现该品牌啤酒在某地的月销量随着每瓶啤酒的定价不同而发生变化,连续调研5个月得到的数据如下表所示:
第1个月
第2个月
第3个月
第4个月
第5个月
单价/元
6
6.5
7
7.5
8
销量/万瓶
90
85
80
75
70
根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程,则( )
A.相关系数 B.点一定在经验回归直线上
C. D.当每瓶啤酒为9.5元时,月销量一定为50万瓶
【答案】B
【分析】根据相关系数的概念可以判断A;求出样本中心点即可判断B;根据线性回归方程过样本中心点即可判断C;根据线性回归方程的性质即可判断D.
【详解】由可得与具有负相关,故A错误;
由表中数据可得,
所以样本中心点为,将代入得,
解得,故C错误.
则回归方程为,当时,,故在回归直线上,故B正确:
当时,,这是一个估计值,不是精确值,故D错误.
故选:B.
6.现有10个样本数据,,…,,可得经验回归方程为,且,若去掉一个数据点后,可以得到新的经验回归方程为,则实数的值为( )
A.1 B. C. D.2
【答案】A
【详解】根据回归直线过样本中心点,代入得:
,所以原个样本的值总和为:,
去掉后,剩余个样本的值总和为:,值总和为:
因此新的样本中心点为:,
因为新的经验回归方程为,回归直线必过新的样本中心点,代入得:
,解得:.
二、多选题
7.对于变量X,Y,经过随机抽样获得成对数据(,2,3,…,10),且,利用最小二乘法得到Y关于X的线性回归方程为,且X与Y的相关系数,则下列结论正确的是( )
A.r越大,X与Y的线性相关性越强
B.若,则
C.若,则
D.若样本点(,2,3,…,10)都在回归直线上,则
【答案】AD
【分析】根据的性质即可求解ABD,根据样本中心在直线上,可求解C.
【详解】由于可得,则,
对于A, r的绝对值越接近1,由于,故的值越大,X与Y的线性相关性越强,故A正确,
对于C,当时,,则,故C错误,
对于D, 若样本点(,2,3,…,10)都在回归直线上,且,则,D正确,
对于B, 当时,无法确定的值,B错误,
8.已知变量x和变量y,根据最小二乘法估计得到成对数据组的经验回归方程,成对数据组的经验回归方程,记,则( )
(参考公式,对于一组成对数据,其经验回归直线的斜率和截距的最小二乘估计公式为:)
A.直线经过点 B.直线不经过点 C. D.
【答案】AC
【分析】根据回归方程的性质判断选择即可.
【详解】根据回归方程的性质得出直线经过点样本中心点,A选项正确;
直线直线经过点样本中心点,B选项错误;
由题意,,,两组数据的也无变化,
,
,C正确;
,D错误.
故选:AC.
三、填空题
9.如图所示,有A,B,C,D,E共5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
【答案】D
【分析】根据散点图中的点分布在一条直线附近时,样本数据有较强的线性相关关系进行求解.
【详解】当散点图中的点分布在一条直线附近时,样本数据有较强的线性相关关系,
应去掉D组数据剩下的4组数据的线性相关性较强.
故答案为:D.
10.某单位为了解日用电量(单位:千瓦时)与当天平均温度(单位:摄氏度)之间的关系,随机统计了4天的日用电量与当天的平均温度,绘制了如下表格,由表中数据可得线性回归方程,则实数________.
5
15
24
60
40
20
【答案】4
【分析】由线性回归方程必过样本中心点求解.
【详解】由表数据可得,
所以线性回归方程必过点,
所以,解得,
故答案为:.
四、解答题
11.数学来源于生活,当然也服务于生活.某学校兴趣小组针对“当地某一零售超市夏天如何配备冷饮”的问题,做了一系列研究.经研究发现,“冷饮的需求量(单位:杯)”与“当天的气温(单位:)”线性相关.根据统计,小组随机抽取了该超市6天销量情况与当天的气温,对应关系如下表:
气温x()
17
19
23
29
33
35
销量(杯)
78
87
96
110
134
149
(1)经过计算,得到当天的气温x与销量y满足回归方程.若今天的气温为31,则该超市可以配备多少杯冷饮?
(2)为了进一步详细研究这种变化规律,该小组又从这6天中随机选取3天,记为销量不低于110杯的天数,求的分布列和数学期望.
【答案】(1)127杯
(2)分布列见解析,
【分析】(1)根据回归直线过样本中心点求出,得到回归方程可得答案;
(2)求出的取值及概率可得分布列和期望.
【详解】(1),
,
又回归直线过样本中心点,所以,得,
所以,当时,(杯),
所以该超市可以配备127杯左右的冷饮;
(2)依题,
,
,
,
,
的分布列为:
0
1
2
3
.
12.2026 年 3 月, 某市“山城邻里”社区团购平台在市中心商业区设立户外直播间, 推广本地特产晚熟春橙. 该社区团购平台共进行了5场户外直播销售,相应的直播时长与销售额数据经财务与运营双岗复核如下:
场次
1
2
3
4
5
时长(小时)
1
2
3
4
5
销售额(万元)
3.0
5.0
7.0
10.0
12.0
求销售额关于直播时长的经验回归方程;
附:回归直线的斜率和截距的最小二乘估计公式分别为: ,.
【详解】首先计算均值:,,
计算所需求和项:
,
,
根据最小二乘公式计算系数:
,
,
因此,经验回归方程为.
【B组能力提升】
1.若某地财政收入x与支出y满足经验回归方程(单位:亿元),其中,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿元 B.9亿元 C.10.5亿元 D.9.5亿元
【答案】C
【分析】由参数值可得经验回归方程,令,代入求得的值,再根据求得预计支出的上下限,即可求得选项.
【详解】由题知,
令得,
又因为,所以.
所以年支出预计不会超过10.5亿元.
故选:C.
2.若变量线性相关,由数据求得回归方程为,则下列结论一定成立的是( )
A. B.
C. D.
【答案】D
【分析】根据回归直线方程必过样本中心建立方程,解方程即可求出结果.
【详解】由回归直线过样本中心点,得,
,代入,得,
方程两边同时乘5,得.
故选:D.
3.(多选)两个具有相关关系的变量,的一组数据为,,,,其经验回归方程为,记,,相关系数为;若将数据调整为,,,,其经验回归方程为,记,相关系数为,则( )
附:,
A. B.
C. D.
【答案】BD
【分析】根据给定条件,可得,再结合最小二乘法、经验回归方程、相关系数计算判断即可.
【详解】对于A,,A错误;
对于B,,B正确;
对于C,,则,C错误;
对于D,,D正确.
故选:BD
4.在某文化节活动现场,为了解不同时段的入口游客人流量,从上午10点开始第一次向指挥中心反馈入口人流量,之后每过一个小时反馈一次.指挥中心统计了前5次的数据,其中,2,3,4,5,为第次入口人流量数据(单位:百人),由此得到关于的回归方程.已知,根据回归方程(参考数据:,),可预测下午4点时入口游客的人流量为________.
【答案】11
【分析】先求出自变量的样本均值,再根据回归直线过样本中心点求出回归系数,最后将预测时刻对应的自变量代入回归方程计算预测值.
【详解】由题意得,把代入,
得,解得,则,
当时,.
故答案为:.
5.为深入贯彻“五育融合”的教育理念,某地在中小学全面推广劳动教育实践课程,定期统计学生参与劳动实践的情况,下表是课程开设后前5个月的数据,其中表示月份编号,表示该月份日平均参与劳动实践的学生人数(单位:万).
月份编号
1
2
3
4
5
日平均参与人数
0.5
0.7
1
1.3
1.5
根据表格数据得到如图所示的散点图.
(1)根据散点图推断与是否线性相关,计算样本相关系数,并推断它们的相关程度;
(2)由(1)所得结论,建立关于的回归方程,并预测第6个月的日平均参与人数;
(3)假设第6个月(按30天计)的日参与人数(单位:万)服从正态分布,并视(2)的结果为的值,预测该月份日参与人数超过1.75万的天数是否不少于25天.
附:
①样本相关系数;
②回归直线的斜率的最小二乘估计为;
③;
④若,则.
【答案】(1)0.997,与的线性相关程度强;
(2),1.78
(3)该月日参与人数超过1.75万人的天数不少于25天.
【分析】(1)由散点图可知与之间线性相关,用不同公式计算可知相关系数,即线性相关程度强;
(2)用不同的公式计算出回归直线方程为,将代入可得出估计值为1.78.
(3)依题意可知,再结合正态分布的对称性计算即可.
本小题主要考查变量间的相关关系、样本相关系数、一元线性回归方程、正态分布的等知识;考查运算求解能力等;考查数形结合思想、化归与转化思想、或然与必然思想等;体现综合性、应用性,导向对数学建模、数学运算核心素养的关注.
【详解】(1)解法一:
根据散点图直观判断与之间线性相关.
因为,
所以与的线性相关程度强;
(也可利用“”或“接近1”判断相关程度强)
解法二:
根据散点图直观判断与之间线性相关.
因为,
,,,
,
所以与的线性相关程度强;
(也可利用“”或“接近1”判断相关程度强)
(2)解法一:
设,则,
所以,
故时,.
解法二:
设,则,
所以,
故时,.
(3)依题意,得,
由正态分布性质,可知.
因为,
所以.
因为,
所以该月日参与人数超过1.75万人的天数不少于25天.
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$
8.2 一元线性回归模型及其应用(第1课时:线性回归方程)
同步练习题
2025-2026学年第二学期高二数学人教A版选择性必修第三册
【学习目标】
1.计算样本中心点、根据样本中心点求参数;
2.用回归直线方程对总体进行估计;
3.求回归直线方程
【例题精练】
【例1】已知变量,的统计数据如下表,对表中数据作分析,发现与之间具有线性相关关系,利用最小二乘法,计算得到经验回归直线方程为,据此模型预测当时的值为__________.
5
6
7
8
9
3.5
4
5
6
6.5
【例2】某大型管线网的局部呈网格结构,如图建立平面直角坐标系,一小型机器人沿管线移动执行巡检任务,在某次巡检的路径中经过了点:、、、、、、,若该机器人经过的点的纵坐标关于横坐标的一元线性回归方程是,则的值为______.
【例3】乘着文旅融合的东风、借着线上推广的热潮,某非遗工坊生产的油纸伞销量逐年增长.该工坊为了科学规划生产,统计了2021-2025年油纸伞的销量数据如下表:
年份t/年
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
销量/万把
7
8
10
11
14
(1)统计表明销量与年份代码有较强的线性相关关系,求关于的线性回归方程,并预测该工坊油纸伞的销量最早在哪一年能超过20万把:
(2)已知该工坊2023年售出的油纸伞中,有6万把通过线上售出,用频率估计概率,现从2023年售出的油纸伞中随机抽取3把,求其中线上售出数量的分布列.
附:为回归直线方程,.
【例4】为了解某社区全民健身开展情况,某调查中心统计了该社区2016~2025年每年用于健身设施维护、更新的资金投入(单位:万元)与当年参与健身的居民总人次(单位:千人次),数据如下:
年份
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
/万元
18
20
19
21
22
17
20
19
21
23
/千人次
32
36
34
38
40
30
37
35
39
42
(1)求关于的样本相关系数,并据此判断与的线性相关性强弱;(的值精确到0.01)
(2)若该社区2026年计划投入健身设施维护、更新的资金为25万元,求关于的线性回归方程,并预测该社区2026年参与健身的居民总人次.
附:(ⅰ)在线性回归方程中,,;
(ⅱ)样本相关系数,若,则可判断与的线性相关性很强;
(ⅲ),,,.
【A组基础达标】
一、单选题
1.某同学在研究变量,之间的相关关系时,得到以下数据:
4.8
5.8
7
8.3
9.1
2.8
4.1
5.2
5.9
7
并采用最小二乘法得到了线性回归方程,则
A., B., C., D.,
2.研究表明某地的山高(km)与该山的年平均气温(℃)具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是( )
A.年平均气温为5℃时该山高估计为5km
B.该山高为8km处的年平均气温估计为10℃
C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关
D.该地的山高与该山的年平均气温成负相关关系
3.已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归方程是( )
A. B. C. D.
4.已知变量x,y之间具有线性相关关系,根据10对样本数据求得经验回归方程为.若,,则( )
A.1 B.2 C.3 D.4
5.某品牌啤酒厂,进行市场调研,发现该品牌啤酒在某地的月销量随着每瓶啤酒的定价不同而发生变化,连续调研5个月得到的数据如下表所示:
第1个月
第2个月
第3个月
第4个月
第5个月
单价/元
6
6.5
7
7.5
8
销量/万瓶
90
85
80
75
70
根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程,则( )
A.相关系数 B.点一定在经验回归直线上
C. D.当每瓶啤酒为9.5元时,月销量一定为50万瓶
6.现有10个样本数据,,…,,可得经验回归方程为,且,若去掉一个数据点后,可以得到新的经验回归方程为,则实数的值为( )
A.1 B. C. D.2
二、多选题
7.对于变量X,Y,经过随机抽样获得成对数据(,2,3,…,10),且,利用最小二乘法得到Y关于X的线性回归方程为,且X与Y的相关系数,则下列结论正确的是( )
A.r越大,X与Y的线性相关性越强
B.若,则
C.若,则
D.若样本点(,2,3,…,10)都在回归直线上,则
8.已知变量x和变量y,根据最小二乘法估计得到成对数据组的经验回归方程,成对数据组的经验回归方程,记,则( )
(参考公式,对于一组成对数据,其经验回归直线的斜率和截距的最小二乘估计公式为:)
A.直线经过点 B.直线不经过点 C. D.
三、填空题
9.如图所示,有A,B,C,D,E共5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
10.某单位为了解日用电量(单位:千瓦时)与当天平均温度(单位:摄氏度)之间的关系,随机统计了4天的日用电量与当天的平均温度,绘制了如下表格,由表中数据可得线性回归方程,则实数________.
5
15
24
60
40
20
四、解答题
11.数学来源于生活,当然也服务于生活.某学校兴趣小组针对“当地某一零售超市夏天如何配备冷饮”的问题,做了一系列研究.经研究发现,“冷饮的需求量(单位:杯)”与“当天的气温(单位:)”线性相关.根据统计,小组随机抽取了该超市6天销量情况与当天的气温,对应关系如下表:
气温x()
17
19
23
29
33
35
销量(杯)
78
87
96
110
134
149
(1)经过计算,得到当天的气温x与销量y满足回归方程.若今天的气温为31,则该超市可以配备多少杯冷饮?
(2)为了进一步详细研究这种变化规律,该小组又从这6天中随机选取3天,记为销量不低于110杯的天数,求的分布列和数学期望.
12.2026 年 3 月, 某市“山城邻里”社区团购平台在市中心商业区设立户外直播间, 推广本地特产晚熟春橙. 该社区团购平台共进行了5场户外直播销售,相应的直播时长与销售额数据经财务与运营双岗复核如下:
场次
1
2
3
4
5
时长(小时)
1
2
3
4
5
销售额(万元)
3.0
5.0
7.0
10.0
12.0
求销售额关于直播时长的经验回归方程;
附:回归直线的斜率和截距的最小二乘估计公式分别为: ,.
【B组能力提升】
1.若某地财政收入x与支出y满足经验回归方程(单位:亿元),其中,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿元 B.9亿元 C.10.5亿元 D.9.5亿元
2.若变量线性相关,由数据求得回归方程为,则下列结论一定成立的是( )
A. B.
C. D.
3.(多选)两个具有相关关系的变量,的一组数据为,,,,其经验回归方程为,记,,相关系数为;若将数据调整为,,,,其经验回归方程为,记,相关系数为,则( )
附:,
A. B. C. D.
4.在某文化节活动现场,为了解不同时段的入口游客人流量,从上午10点开始第一次向指挥中心反馈入口人流量,之后每过一个小时反馈一次.指挥中心统计了前5次的数据,其中,2,3,4,5,为第次入口人流量数据(单位:百人),由此得到关于的回归方程.已知,根据回归方程(参考数据:,),可预测下午4点时入口游客的人流量为________.
5.为深入贯彻“五育融合”的教育理念,某地在中小学全面推广劳动教育实践课程,定期统计学生参与劳动实践的情况,下表是课程开设后前5个月的数据,其中表示月份编号,表示该月份日平均参与劳动实践的学生人数(单位:万).
月份编号
1
2
3
4
5
日平均参与人数
0.5
0.7
1
1.3
1.5
根据表格数据得到如图所示的散点图.
(1)根据散点图推断与是否线性相关,计算样本相关系数,并推断它们的相关程度;
(2)由(1)所得结论,建立关于的回归方程,并预测第6个月的日平均参与人数;
(3)假设第6个月(按30天计)的日参与人数(单位:万)服从正态分布,并视(2)的结果为的值,预测该月份日参与人数超过1.75万的天数是否不少于25天.
附:
①样本相关系数;
②回归直线的斜率的最小二乘估计为;
③;
④若,则.
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$