内容正文:
第11讲 线性回归分析
知识清单
知识点01:一元线性回归
题型讲解
(举一反三)
题型1:根据散点图判断是否线性相关
题型2:解释回归直线方程的意义
题型3:用回归直线方程对总体进行估计
题型4:根据回归方程求原数据中的值
题型5:计算样本的中心点
题型6:根据回归方程进行数据估计
题型7:根据样本中心点求参数
题型8:求回归方程
强化训练
一、单选题(8)
二、多选题(3)
三、填空题(3)
四、解答题(5)
知识点01一元线性回归
回归直线
从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线
回归方程
线性回归方程: =+x中,
回归系数的计算公式: ==,
的计算公式: =-.
相关系数
当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性
[方法技巧]
判断相关关系的两种方法
(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
(2)相关系数法:利用相关系数判定,|r|越趋近于1相关性越强.
1.回归直线方程中系数的两种求法
(1)公式法:利用公式,求出回归系数,.
(2)待定系数法:利用回归直线过样本点中心(,)求系数.
2.回归分析的两种策略
(1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.
(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数.
题型1:根据散点图判断是否线性相关
【例1-1】下面的散点图与相关系数r可能正确的是( )
A. B.
C. D.
【变式1-1】在下列各图中,两个变量具有线性相关关系的图是( )
A. B.
C. D.
【变式1-2】对四组数据进行统计,获得如图散点图,其中线性相关性比较强且负相关的是( )
A. B. C. D.
【变式1-3】下列图形中具有相关关系的两个变量是( ).
A. B.
C. D.
题型2:解释回归直线方程的意义
【例2-1】(24-25高二下·江苏盐城·期中)在研究线性回归模型时,样本数据所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则( )
A. B.1 C. D.2
【变式2-1】(多选)下列有关回归直线方程,叙述正确的是( )
A.反映与之间的函数关系
B.反映与之间的函数关系
C.表示与之间不确定关系
D.表示最接近与之间真实关系的一条直线的方程
【变式2-2】调查了某地若干户家庭的年收入(单位:万元)和年饮食支出(单位:万元),调查显示年收入与年饮食支出具有线性相关关系,并由调查数据得到对的回归直线方程:.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
【变式2-3】某同学在研究变量,之间的相关关系时,得到以下数据:并采用最小二乘法得到了线性回归方程,则______0(填“>”或“<”).
4.8
5.8
7
8.3
9.1
2.8
4.1
7.2
9.1
11.8
题型3:用回归直线方程对总体进行估计
【例3-1】(24-25高二下·江苏南通·月考)假如女儿身高(单位:cm)关于父亲身高(单位:cm)的经验回归方程为,已知父亲身高为180cm,则估计女儿身高为( )
A.166cm B.170cm C.172cm D.176cm
【变式3-1】设某中学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的经验回归方程为.若该中学女生的平均身高为,则该中学女生的平均体重的估计值是( )
A. B. C. D.
【变式3-2】已知一组数据满足线性回归关系,且经验回归方程为,若,则( )
A.30 B.60 C.630 D.1200
【变式3-3】若对具有线性相关关系的两个变量建立的回归方程为,则当时,的估计值为_____.
题型4:根据回归方程求原数据中的值
【例4-1】用最小二乘法得到一组数据的线性回归方程为,若,则( )
A.11 B.13 C.63 D.78
【变式4-1】某种产品的广告费用(单位:万元)与销售额(单位:万元)之间的关系如下表:
1
3
4
5
7
6
8
12
10
14
若与的回归直线方程为,则( )
A.4.1 B.4.7 C.4.8 D.6.8
【变式4-2】已知x,y之间具有线性相关关系,若通过10组数据(,2,…,10)得到的回归方程为,且,则___________.
【变式4-3】已知与之间的一组数据:
0
1
3
3
7
根据数据可求得关于的线性回归方程为,则的值为_______.
题型5:计算样本的中心点
【例5-1】(24-25高二下·江苏泰州·期末)已知的取值如下表所示,若与有线性相关关系且与之对应的线性回归方程为,则的值为( )
1
3
5
7
5.8
6.2
6.6
A.5 B.6 C.7 D.8
【变式5-1】(24-25高二下·江苏徐州·月考)已知变量x与y的5组观测值如下表:且y对x呈线性相关关系,则y关于x的回归直线必过的定点为( )
x
1
2
3
4
5
y
4
8
12
A. B. C. D.
【变式5-2】如果x,y之间的一组数据如下表所示,那么回归直线必过的一个定点坐标是______.
x
0
1
2
3
y
1
2
5
8
【变式5-3】变量x,y的数据如下所示:
x
5
4
3
2
1
y
2
1.5
1
1
0.5
回归直线恒过点______.
题型6:根据回归方程进行数据估计
【例6-1】(24-25高二下·江苏南通·期中)某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得(为人的年龄,为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为岁的人体内脂肪含量一定为
B.年龄为岁的人体内脂肪含量约为
C.年龄为岁的人群中的体内脂肪含量平均为
D.年龄为岁的人群中的大部分人的体内脂肪含量约为
【变式6-1】某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得(为人的年龄,为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为岁的人体内脂肪含量一定为
B.年龄为岁的人体内脂肪含量约为
C.年龄为岁的人群中的体内脂肪含量平均为
D.年龄为岁的人群中的大部分人的体内脂肪含量约为
【变式6-2】某杂交水稻研究小组先培育出第一代杂交水稻,再由第一代培育出第二代,第二代培育出第三代,以此类推,且亲代与子代的每穗总粒数之间的关系如下表所示:
代数代码
1
2
3
4
总粒数
197
193
201
209
通过上面四组数据得到了与之间的线性回归方程是,预测第十代杂交水稻每穗的总粒数为( )
A.233 B.234 C.235 D.236
【变式6-3】对有关数据的分析可知,每一立方米混凝土的水泥用量x(单位:)与28天后混凝土的抗压度y(单位:)之间具有线性相关关系,其线性回归方程为.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7,则每立方米混凝土的水泥用量最少应为______(精确度0.1).
题型7:根据样本中心点求参数
【例7-1】(24-25高二下·江苏南京·期末)某能源汽车制造公司近5年的利润情况如下表所示:
第x年
1
2
3
4
5
利润y(亿元)
2
3
4
m
7
已知变量y与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为:,则m的值为( )
A.4.5 B.4.8 C.5 D.5.4
【变式7-1】(24-25高二下·江苏盐城·期末)已知变量x,y的取值如下表所示,若y与x线性相关,且线性回归方程为,则等于
x
2
4
5
6
8
y
20
40
60
70
80
A.0.5 B.1.5 C.2 D.2.5
【变式7-2】(24-25高二下·江苏南通·月考)某小吃店的日盈利y(单位:百元)与当天平均气温(单位:℃)之间有如下数据:
x/℃
0
1
2
y/百元
5
4
m
2
1
由表中数据可得回归方程.则m值为_______.
【变式7-3】(24-25高二下·江苏·期末)高质量发展是全面建设社会主义现代化国家的首要任务,创新研发是高质量发展的重要前提.某公司研发新产品的投入(单位:百万元)与该产品的收益(单位:百万元)的5组统计数据如下表所示,且经验回归方程为.
x
5
6
8
9
12
y
16
20
25
28
(1)求的值;
(2)若将图表中的点去掉,判断样本相关系数是否改变,并说明你的理由.
参考数据:样本相关系数
题型8:求回归方程
【例8-1】一组样本数据在一条直线附近波动,拟合的回归直线记为,满足:.令,得到新样本数据,且,则直线的方程为( )
附:.
A. B.
C. D.
【变式8-1】(24-25高二下·江苏·月考)某研究机构对高三学生的记忆力和判断力进行统计分析,得表数据.请根据上表提供的数据,求出关于的线性回归方程为______,据此可预测判断力为4的同学的记忆力为______.
6
8
10
12
2
3
5
6
(回归直线方程是:,其中,)
【变式8-2】(24-25高二下·江苏徐州·期末)某研究机构测试了5款新能源汽车,电池容量与实际续航里程之间对应数据如下:
电池容量
40
50
60
70
80
实际续航里程
260
310
380
420
480
已知电池容量与实际续航里程之间具有很强的线性相关关系,求关于的经验回归方程,并估计当时对应的值.
附:经验回归方程中,,.
【变式8-3】(24-25高二下·江苏南京·期末)“爱国、敬业、诚信、友善”是社会主义核心价值观个人层面的价值准则.某学校为加强对学生的教育,倡导全体学生为特困学生捐款,举行“一元钱,一片心,诚信用水”活动,学生在购水处每领取一瓶矿泉水,便自觉向捐款箱中至少投入一元钱,现统计了连续5天的售出和收益情况,如下表:
售出水量
(单位:箱)
7
6
6
5
6
收益
(单位:元)
165
142
148
125
150
(1)求收益y关于售出水量x的回归直线方程,并计算每天售出8箱水时预计收益是多少元?
(2)期中考试以后,学校决定将诚信用水的收益,以奖学金的形式奖励给品学兼优的特困生,规定:特困生考入年级前200名,获一等奖学金500元;考入年级从第201名到500名的同学,获二等奖学金300元;考入年级501名及以后的特困生不获得奖学金.甲、乙两名学生获一等奖学金的概率均为,获二等奖学金的概率均为,不获得奖学金的概率均为.如果已知甲、乙两名学生获得哪个等第的奖学金是相互独立的,求甲、乙两名学生所获得奖学金总金额X的分布列及数学期望
附:
一、单选题
1.(24-25高二·江苏·假期作业)稀土被誉为工业的维生素,具有无法取代的优异磁、光、电性能,对改善产品性能,增加产品品种,提高生产效率起到了巨大的作用.下表是2023年前5个月我国稀土出口均价(单位:万元吨)与月份的统计数据.
1
2
3
4
5
1.7
2.4
2.0
1.6
若与的线性回归方程为,则的值为( )
A.1.6 B.1.8 C.2.0 D.2.2
2.(24-25高二下·江苏镇江·月考)由如表所示的变量之间的一组数据,得到之间的线性回归方程为,则( )
x
6
8
10
12
y
7
t
5.5
4.5
A.点一定在回归直线上 B.x每增加1个单位,y大约增加0.5个单位
C. D.y与x是正相关的
3.(24-25高二下·江苏扬州·期末)已知变量x,y线性相关,其一组样本数据(,2,3,4,5),满足,用最小二乘法得到的线性回归方程是.现增加一个数据,重新计算得到的回归直线斜率是,时,y的估计值是( )
A.3 B. C. D.
4.(24-25高二下·江苏南通·期末)下表提供了某厂进行技术改造后生产产品过程中记录的产量x(单位:t)与相应的生产能耗y(单位:t标准煤)的几组数据:
3
4
5
6
标准煤
2.5
3
m
4.5
根据散点图分析知x与y线性相关,且求得经验回归方程为,则( )
A.x与y负相关 B.
C.回归直线过点 D.时的残差为0.05
5.对于数据组,如果由线性回归方程得到的自变量的估计值是,那么将称为样本点处的残差.某商场为了给一种新商品进行合理定价,将该商品按事先拟定的价格进行试销,得到表所示数据.若销量(单位:件)与单价(单位:元)之间的线性回归方程为,且样本点处的残差为3,则( )
单价/元
8.2
8.4
8.6
8.8
销量件
84
83
78
m
A.65 B.67 C.73 D.75
6.为了研究关于的线性相关关系,收集了组样本数据(见下表):
若已求得一元线性回归方程为,则下列选项中正确的是( )
(其中相关系数)
A.
B.当时,的预测值为
C.样本数据的第40百分位数为
D.去掉样本点后,与的样本相关系数不会改变
7.(24-25高二上·江苏常州·期末)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的残差为( )
A. B. C. D.
8.(24-25高二下·江苏南京·期中)已知两个变量与对应关系如下表:
若与满足一元线性回归模型,且经验回归方程为,则( )
A.与负相关
B.在处的残差为
C.经验回归直线过点
D.变量每增加一个单位,实际值一定增加个单位
二、多选题
9.(24-25高二下·江苏无锡·月考)市物价部门对5家商场的某商品一天的线上销售量及其价格进行调查,5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:
价格x
9
9.5
10
10.5
11
销售量y
11
10
8
6
5
按公式计算,y与x的回归直线方程是:,相关系数,则下列说法正确的是( )
A. B.变量x,y线性负相关且相关性较强
C.相应于点的残差约为 D.当时,y的估计值为14.4
10.(24-25高二下·江苏南京·期末)下列命题中,真命题有( )
A.数据6,2,3,4,5,7,8,9,1,10的70%分位数是8.5
B.若随机变量,则
C.已知两个变量具有线性相关关系,其回归直线方程为;若,则;
D.若,则
11.下列说法正确的是( )
A.将总体划分为2层,通过分层随机抽样,得到两层的样本平均数和样本方差分别为,和、,若,则总体方差
B.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好
C.设为两个随机事件,,若,则事件与事件相互独立
D.若样本数据,,…,的标准差为8,则数据,,…,的标准差为32
三、填空题
12.某小吃店的日盈利(单位:百元)与当天平均气温(单位:℃)之间有如下数据:
0
1
2
百元
5
4
2
2
1
由表中数据可得回归方程中.试预测当天平均气温为时,小吃店的日盈利约为______百元.
13.(24-25高二下·江苏·月考)某软件科技公司近8年的年利润额y与投入的年研发经费x(单位:千万元)如表所示.
x
3
4
5
6
6
7
8
9
y
根据散点图可以认为x与y之间存在线性相关关系,且相关系数,用最小二乘法求线性回归方程(,用分数表示),________.
附:(1)参考数据:,.
(2)参考公式:,.
14.(24-25高二下·江苏镇江·期末)某小吃店的日盈利(单位:百元)与当天平均气温(单位:)之间有如下数据:由表中数据可得回归方程中.试预测当天平均气温为时,小吃店的日盈利约为__________百元.
0
1
2
百元
5
4
2
2
1
四、解答题
15.(24-25高二上·江苏常州·期末)某研究所研究耕种深度(单位:)与水稻每公顷产量(单位:)的关系,所得数据资料如下表.
耕种深度
8
10
12
14
16
18
每公顷产量
6
7
8
9
11
13
(1)求样本相关系数(结果保留两位小数),并判断它们是否具有较强的线性相关性;
(2)求经验回归方程.
参考数据:;
参考公式:,,.
16.(24-25高二下·江苏淮安·月考)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
参考数据:.
参考公式:相关系数.
17.(24-25高二下·江苏镇江·期中)根据统计,某蔬菜基地西红柿亩产量的增加量(单位:百千克)与某种液体肥料每亩使用量(单位:千克)之间的对应数据的散点图如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合与的关系,请计算相关系数,并说明线性相关性的强弱(相关系数精确到小数点后2位,若,则线性相关程度很高);
(2)求关于的线性回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少百千克.
附:数据和公式:;回归方程:,其中.相关系数:.
18.(24-25高二下·江苏·期末)某旅游景点统计今年五一期间进入景区的游客人数(单位:千人)如下:
日期
5月1日
5月2日
5月3日
5月4日
5月5日
第天
1
2
3
4
5
参观人数
2.2
2.6
3.1
5.2
6.9
(1)根据上表数据,判断成对样本数据的线性相关程度,请用样本相关系数加以说明;(若,则认为与的线性相关性很强),如果与的线性相关性很强,那么求出关于的经验回归方程;
(2)五一期间景区开放南门、东门和北门供游客出入,游客从南门、东门和北门进入景区的概率分别为,且出景区与入景区选择相同门的概率为,选择与入景区不同两门的概率各为.假设游客从南门、东门、北门出入景点互不影响,现有甲、乙、丙、丁4名游客于5月1日游玩景点,设为4人中从东门出景区的人数,求的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:经验回归方程,其中,.
样本相关系数.
19.某创业者计划在某旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如下表,x为收费标准(单位:元/日),t为入住天数(单位:天),以频率作为各自的“入住率”,收费标准x与“入住率”y的散点图如图.
x
100
150
200
300
450
t
90
65
45
30
20
(1)令z=ln x,由散点图判断与,哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程;(,的结果精确到0.1)
(2)根据第(1)问所求的回归方程,试估计收费标准为多少时,100天销售额L最大?(100天销售额L=100×入住率×收费标准x)
参考数据:,
1
学科网(北京)股份有限公司
$
第11讲 线性回归分析
知识清单
知识点01:一元线性回归
题型讲解
(举一反三)
题型1:根据散点图判断是否线性相关
题型2:解释回归直线方程的意义
题型3:用回归直线方程对总体进行估计
题型4:根据回归方程求原数据中的值
题型5:计算样本的中心点
题型6:根据回归方程进行数据估计
题型7:根据样本中心点求参数
题型8:求回归方程
强化训练
一、单选题(8)
二、多选题(3)
三、填空题(3)
四、解答题(5)
知识点01一元线性回归
回归直线
从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线
回归方程
线性回归方程: =+x中,
回归系数的计算公式: ==,
的计算公式: =-.
相关系数
当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性
[方法技巧]
判断相关关系的两种方法
(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
(2)相关系数法:利用相关系数判定,|r|越趋近于1相关性越强.
1.回归直线方程中系数的两种求法
(1)公式法:利用公式,求出回归系数,.
(2)待定系数法:利用回归直线过样本点中心(,)求系数.
2.回归分析的两种策略
(1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.
(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数.
题型1:根据散点图判断是否线性相关
【例1-1】下面的散点图与相关系数r可能正确的是( )
A. B.
C. D.
【答案】B
【分析】根据散点图的从左向右是下降的,则,若是上升的,则,分析判断即可
【详解】对于AC,变量的散点图从左向右是下降的,所以,所以AC错误,
对于BD,变量的散点图从左向右是上升的,所以,所以B正确,D错误,
故选:B
【变式1-1】在下列各图中,两个变量具有线性相关关系的图是( )
A. B.
C. D.
【答案】C
【分析】根据题意结合线性相关关系的概念逐项分析判断.
【详解】对于选项A:两个变量为函数关系,不是线性相关关系,所以A错误;
对于选项B:所有点不是在一条直线附近波动,不是线性相关关系,故B错误;
对于选项C:对于两个变量x,y,y随着x的增加而减少,
且所有点都在一条直线附近波动,所以具有线性相关关系,故C正确;
对于选项D:两个变量不具有相关性,故D错误.
故选:C.
【变式1-2】对四组数据进行统计,获得如图散点图,其中线性相关性比较强且负相关的是( )
A. B. C. D.
【答案】B
【分析】根据散点图和相关性的关系,判断结果.
【详解】由散点图知,相关系数对应的散点图呈负相关,
且线性相关性比较强.
故选:B.
【变式1-3】下列图形中具有相关关系的两个变量是( ).
A. B.
C. D.
【答案】C
【分析】根据若样本点成带状分布,则两个变量具有相关关系,结合散点图即得.
【详解】根据散点图可知在C中,样本点成带状分布,则两个变量具有相关关系,
所以两个变量x、y具有相关关系的图是C.
A,B为函数关系,D无相关关系.
故选:C.
题型2:解释回归直线方程的意义
【例2-1】(24-25高二下·江苏盐城·期中)在研究线性回归模型时,样本数据所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则( )
A. B.1 C. D.2
【答案】A
【分析】根据线性相关系数的定义直接得解.
【详解】由已知样本数据所对应的点均在直线上,
则,又,所以满足负相关,即.
故选:A.
【变式2-1】(多选)下列有关回归直线方程,叙述正确的是( )
A.反映与之间的函数关系
B.反映与之间的函数关系
C.表示与之间不确定关系
D.表示最接近与之间真实关系的一条直线的方程
【答案】AD
【分析】根据回归方程的意义直接判断各个选项即可.
【详解】对于AB,表示的与之间的函数关系,并不是与之间的函数关系,A正确,B错误;
对于C,表示与之间的函数关系,为确定性关系,C错误;
对于D,用回归直线来表示最接近与之间真实关系的一条直线方程,D正确.
故选:AD.
【变式2-2】调查了某地若干户家庭的年收入(单位:万元)和年饮食支出(单位:万元),调查显示年收入与年饮食支出具有线性相关关系,并由调查数据得到对的回归直线方程:.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
【答案】0.254
【分析】利用回归方程计算年收入增加1万元后,年饮食支出的增量即可得答案.
【详解】∵对的回归直线方程.∴当家庭年收入增加1万元时,,
∵.故年饮食支出平均增加0.254万元.
故答案为:0.254.
【变式2-3】某同学在研究变量,之间的相关关系时,得到以下数据:并采用最小二乘法得到了线性回归方程,则______0(填“>”或“<”).
4.8
5.8
7
8.3
9.1
2.8
4.1
7.2
9.1
11.8
【答案】
【分析】画出散点图,数形结合得到答案.
【详解】画出散点图如下:
从而可以看出中,.
故答案为:.
题型3:用回归直线方程对总体进行估计
【例3-1】(24-25高二下·江苏南通·月考)假如女儿身高(单位:cm)关于父亲身高(单位:cm)的经验回归方程为,已知父亲身高为180cm,则估计女儿身高为( )
A.166cm B.170cm C.172cm D.176cm
【答案】B
【分析】将父亲的身高代入经验回归方程,即可求出女儿的估算身高.
【详解】当时,则估计女儿身高为cm.
故选:B.
【变式3-1】设某中学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的经验回归方程为.若该中学女生的平均身高为,则该中学女生的平均体重的估计值是( )
A. B. C. D.
【答案】A
【分析】将代入回归直线方程,可得出该中学女生的平均体重的估计值.
【详解】将代入回归直线方程得,
因此,该中学女生的平均体重的估计值是.
故选:A.
【变式3-2】已知一组数据满足线性回归关系,且经验回归方程为,若,则( )
A.30 B.60 C.630 D.1200
【答案】D
【分析】根据样本中心点在回归直线方程上代入计算可得结果.
【详解】易知样本数据的中心点在回归直线方程上,
易知,所以,
即,可得.
故选:D
【变式3-3】若对具有线性相关关系的两个变量建立的回归方程为,则当时,的估计值为_____.
【答案】
【分析】
将代入回归直线方程可得结果.
【详解】将代入回归直线方程可得.
故答案为:.
题型4:根据回归方程求原数据中的值
【例4-1】用最小二乘法得到一组数据的线性回归方程为,若,则( )
A.11 B.13 C.63 D.78
【答案】D
【分析】根据线性回归方程为一定过点,先求出,代入回归方程即可得出,进而可得的值.
【详解】依题意,
因为,所以,
因为线性回归方程为一定过点,
所以,
所以.
故选:D.
【变式4-1】某种产品的广告费用(单位:万元)与销售额(单位:万元)之间的关系如下表:
1
3
4
5
7
6
8
12
10
14
若与的回归直线方程为,则( )
A.4.1 B.4.7 C.4.8 D.6.8
【答案】C
【分析】根据表格的数据求得样本中心为,代入回归直线方程,即可求解.
【详解】根据表格中的数据,可得,,
即样本中心为,代入回归直线方程,即,
解得.
故选:C.
【变式4-2】已知x,y之间具有线性相关关系,若通过10组数据(,2,…,10)得到的回归方程为,且,则___________.
【答案】6
【分析】根据已知条件,求出的平均值,再结合线性回归方程过样本中心,即可求解.
【详解】∵,∴,
∵回归方程为,
∴,
∴,
故答案为:6.
【变式4-3】已知与之间的一组数据:
0
1
3
3
7
根据数据可求得关于的线性回归方程为,则的值为_______.
【答案】/
【分析】根据题意求出,关于的表达式,代入回归方程即可解得的值.
【详解】由表格中的数据可得,,
由于回归直线过样本的中心点,所以,解得,
所以的值为.
故答案为:.
题型5:计算样本的中心点
【例5-1】(24-25高二下·江苏泰州·期末)已知的取值如下表所示,若与有线性相关关系且与之对应的线性回归方程为,则的值为( )
1
3
5
7
5.8
6.2
6.6
A.5 B.6 C.7 D.8
【答案】C
【分析】根据线性回归方程一定过进行计算即可.
【详解】根据表中数据,,,
因为线性回归方程一定过,
所以,
解得.
故选:C.
【变式5-1】(24-25高二下·江苏徐州·月考)已知变量x与y的5组观测值如下表:且y对x呈线性相关关系,则y关于x的回归直线必过的定点为( )
x
1
2
3
4
5
y
4
8
12
A. B. C. D.
【答案】B
【分析】根据给定的数表,求出样本中心点即可.
【详解】由表格知,,,
所以y关于x的回归直线必过的定点.
故选:B
【变式5-2】如果x,y之间的一组数据如下表所示,那么回归直线必过的一个定点坐标是______.
x
0
1
2
3
y
1
2
5
8
【答案】
【分析】根据表格数据计算样本中心,根据样本中心在回归方程上即可判断回归直线必过的定点坐标.
【详解】由表格数据知:,,即样本中心为,
又回归方程必过样本中心知:回归直线必过的—个定点坐标是.
故答案为:.
【变式5-3】变量x,y的数据如下所示:
x
5
4
3
2
1
y
2
1.5
1
1
0.5
回归直线恒过点______.
【答案】
【分析】根据回归直线方程的性质求解变量的平均值,即可确定定点.
【详解】变量的平均值为,变量的平均值为,
故回归直线恒过点.
故答案为:.
题型6:根据回归方程进行数据估计
【例6-1】(24-25高二下·江苏南通·期中)某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得(为人的年龄,为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为岁的人体内脂肪含量一定为
B.年龄为岁的人体内脂肪含量约为
C.年龄为岁的人群中的体内脂肪含量平均为
D.年龄为岁的人群中的大部分人的体内脂肪含量约为
【答案】C
【分析】根据回归直线的定义,结合所给函数即可得出结论.
【详解】由题意,
在中,当时,,
表示的是年龄为37岁的人群中体内脂肪含量平均为,
故选:C.
【变式6-1】某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得(为人的年龄,为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为岁的人体内脂肪含量一定为
B.年龄为岁的人体内脂肪含量约为
C.年龄为岁的人群中的体内脂肪含量平均为
D.年龄为岁的人群中的大部分人的体内脂肪含量约为
【答案】C
【分析】将代入得出结果.
【详解】当时,,
由此估计,年龄为岁的人群中的体内脂肪含量平均为.
故选:C.
【变式6-2】某杂交水稻研究小组先培育出第一代杂交水稻,再由第一代培育出第二代,第二代培育出第三代,以此类推,且亲代与子代的每穗总粒数之间的关系如下表所示:
代数代码
1
2
3
4
总粒数
197
193
201
209
通过上面四组数据得到了与之间的线性回归方程是,预测第十代杂交水稻每穗的总粒数为( )
A.233 B.234 C.235 D.236
【答案】A
【分析】求出样本中心,然后确定回归直线方程,即可求解预测当时,的估计值.
【详解】由题意可知:,.
因为回归直线方程经过样本中心,所以,解得,
回归直线方程为:,
当时,的估计值为:.
故选:A.
【变式6-3】对有关数据的分析可知,每一立方米混凝土的水泥用量x(单位:)与28天后混凝土的抗压度y(单位:)之间具有线性相关关系,其线性回归方程为.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7,则每立方米混凝土的水泥用量最少应为______(精确度0.1).
【答案】265.7
【分析】利用线性回归直线方程建立不等式求解即可.
【详解】由题意,,解得,
故每立方米混凝土的水泥用量最少应为265.7.
故答案为:265.7.
题型7:根据样本中心点求参数
【例7-1】(24-25高二下·江苏南京·期末)某能源汽车制造公司近5年的利润情况如下表所示:
第x年
1
2
3
4
5
利润y(亿元)
2
3
4
m
7
已知变量y与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为:,则m的值为( )
A.4.5 B.4.8 C.5 D.5.4
【答案】C
【分析】求出、,代入回归直线方程可得答案.
【详解】因为,,
所以,解得.
故选:C.
【变式7-1】(24-25高二下·江苏盐城·期末)已知变量x,y的取值如下表所示,若y与x线性相关,且线性回归方程为,则等于
x
2
4
5
6
8
y
20
40
60
70
80
A.0.5 B.1.5 C.2 D.2.5
【答案】B
【分析】利用线性回归方程过样本中心点即可求解.
【详解】根据表格可得,,
因为线性回归方程过样本中心点,
所以将代入中得,.
故选:B.
【变式7-2】(24-25高二下·江苏南通·月考)某小吃店的日盈利y(单位:百元)与当天平均气温(单位:℃)之间有如下数据:
x/℃
0
1
2
y/百元
5
4
m
2
1
由表中数据可得回归方程.则m值为_______.
【答案】2
【分析】先求出样本中心点的横坐标,再根据回归直线方程过样本中心点求出样本中心点的纵坐标,最后根据的计算公式求出的值.
【详解】已知数据分别为,,,,,样本数量.
根据样本均值公式可得:.
因为回归直线方程必过样本中心点,把代入回归方程中,可得:.
已知数据分别为,,,,,样本数量,且.
根据样本均值公式可得:,即,
得:,可得.
故答案为:2.
【变式7-3】(24-25高二下·江苏·期末)高质量发展是全面建设社会主义现代化国家的首要任务,创新研发是高质量发展的重要前提.某公司研发新产品的投入(单位:百万元)与该产品的收益(单位:百万元)的5组统计数据如下表所示,且经验回归方程为.
x
5
6
8
9
12
y
16
20
25
28
(1)求的值;
(2)若将图表中的点去掉,判断样本相关系数是否改变,并说明你的理由.
参考数据:样本相关系数
【答案】(1);
(2)不变,理由见解析.
【分析】(1)首先求出样本中心,再由样本中心在回归直线上求参数值;
(2)根据所去掉的点,结合相关系数公式判断分子、分母各部分的值是否有变化,即可得结论.
【详解】(1)由题设,,
所以,可得;
(2)由(1)知,,故去掉点后样本中心仍然是,
去掉点前,
去掉点后,
显然前后数值没有改变,同理,的值都没有变化,
所以相关系数不变.
题型8:求回归方程
【例8-1】一组样本数据在一条直线附近波动,拟合的回归直线记为,满足:.令,得到新样本数据,且,则直线的方程为( )
附:.
A. B.
C. D.
【答案】A
【分析】利用最小二乘法公式求解线性回归方程.
【详解】由,
则直线的方程为.
故选:A.
【变式8-1】(24-25高二下·江苏·月考)某研究机构对高三学生的记忆力和判断力进行统计分析,得表数据.请根据上表提供的数据,求出关于的线性回归方程为______,据此可预测判断力为4的同学的记忆力为______.
6
8
10
12
2
3
5
6
(回归直线方程是:,其中,)
【答案】 9
【分析】设回归方程,利用表中数据,根据最小二乘原理求得系数,即得方程;再用方程代入数据预测记忆力即可.
【详解】设y关于x的线性回归方程为,直线过样本中心点,
由表格数据得,,
,,
故根据最小二乘原理知,
所以,
即线性回归方程为;将代入方程,得,
即可预测可预测判断力为4的同学的记忆力为.
故答案为:①;②.
【变式8-2】(24-25高二下·江苏徐州·期末)某研究机构测试了5款新能源汽车,电池容量与实际续航里程之间对应数据如下:
电池容量
40
50
60
70
80
实际续航里程
260
310
380
420
480
已知电池容量与实际续航里程之间具有很强的线性相关关系,求关于的经验回归方程,并估计当时对应的值.
附:经验回归方程中,,.
【答案】,
【分析】求出后根据公式可求回归方程,从而可得预测值.
【详解】,.
,,
所以.
又,,所以,
所以关于的经验回归方程为.
当时,.
【变式8-3】(24-25高二下·江苏南京·期末)“爱国、敬业、诚信、友善”是社会主义核心价值观个人层面的价值准则.某学校为加强对学生的教育,倡导全体学生为特困学生捐款,举行“一元钱,一片心,诚信用水”活动,学生在购水处每领取一瓶矿泉水,便自觉向捐款箱中至少投入一元钱,现统计了连续5天的售出和收益情况,如下表:
售出水量
(单位:箱)
7
6
6
5
6
收益
(单位:元)
165
142
148
125
150
(1)求收益y关于售出水量x的回归直线方程,并计算每天售出8箱水时预计收益是多少元?
(2)期中考试以后,学校决定将诚信用水的收益,以奖学金的形式奖励给品学兼优的特困生,规定:特困生考入年级前200名,获一等奖学金500元;考入年级从第201名到500名的同学,获二等奖学金300元;考入年级501名及以后的特困生不获得奖学金.甲、乙两名学生获一等奖学金的概率均为,获二等奖学金的概率均为,不获得奖学金的概率均为.如果已知甲、乙两名学生获得哪个等第的奖学金是相互独立的,求甲、乙两名学生所获得奖学金总金额X的分布列及数学期望
附:
【答案】(1),186
(2)分布列见解析,600
【分析】(1)求出、,从而求出回归方程,将代入求出即可;
(2)计算对应的概率的值,求出其分布列和期望值即可.
【详解】(1),
,
,
当时,(元),
即某天售出8箱水的预计收益是186元.
(2)X的取值可能为0,300,500,600,800,1000,
,,
,,
,,
即X的分布列为
X
0
300
500
600
800
1000
P
X的数学期望
(元).
一、单选题
1.(24-25高二·江苏·假期作业)稀土被誉为工业的维生素,具有无法取代的优异磁、光、电性能,对改善产品性能,增加产品品种,提高生产效率起到了巨大的作用.下表是2023年前5个月我国稀土出口均价(单位:万元吨)与月份的统计数据.
1
2
3
4
5
1.7
2.4
2.0
1.6
若与的线性回归方程为,则的值为( )
A.1.6 B.1.8 C.2.0 D.2.2
【答案】B
【分析】根据线性回归方程为过样本中心点求解即可.
【详解】由题意可知,,
因为线性回归方程为过样本中心点,
所以,
所以,解得.
故选:
2.(24-25高二下·江苏镇江·月考)由如表所示的变量之间的一组数据,得到之间的线性回归方程为,则( )
x
6
8
10
12
y
7
t
5.5
4.5
A.点一定在回归直线上 B.x每增加1个单位,y大约增加0.5个单位
C. D.y与x是正相关的
【答案】C
【分析】根据统计表格中的数据,求得和,利用回归直线过样本点中心可求得,结合选项,逐项计算,分析判断,即可求解.
【详解】由统计表格中的数据,可得,,
因为回归直线过样本中心点,
可得,解得,所以C正确;
当时,可得,所以点不在回归直线上,所以A错误;
由,所以x每增加1个单位,y大约减少0.5个单位,所以B错误;
因为回归方程的系数为负,说明与负相关,所以D错误.
故选:C.
3.(24-25高二下·江苏扬州·期末)已知变量x,y线性相关,其一组样本数据(,2,3,4,5),满足,用最小二乘法得到的线性回归方程是.现增加一个数据,重新计算得到的回归直线斜率是,时,y的估计值是( )
A.3 B. C. D.
【答案】B
【分析】根据已知求原数据的样本中心,再确定增加数据后的样本中心,进而得到修正后的回归直线方程,估计的对应值,
【详解】由题设,则,
增加数据后,,且回归直线为,
所以,得,则,
所以时,有
故选:B.
4.(24-25高二下·江苏南通·期末)下表提供了某厂进行技术改造后生产产品过程中记录的产量x(单位:t)与相应的生产能耗y(单位:t标准煤)的几组数据:
3
4
5
6
标准煤
2.5
3
m
4.5
根据散点图分析知x与y线性相关,且求得经验回归方程为,则( )
A.x与y负相关 B.
C.回归直线过点 D.时的残差为0.05
【答案】C
【分析】由经验回归方程系数为可对A判断求解;分别求出,然后求出,从而可对B、C判断求解;利用残差知识可对D求解判断.
【详解】A:由经验回归方程为,线性系数为,则与正相关,故A错误;
B、C:由,所以,所以回归直线过点,故C正确;
又,解得,故B错误;
D:时,,则残差为:,故D错误.
故选:C.
5.对于数据组,如果由线性回归方程得到的自变量的估计值是,那么将称为样本点处的残差.某商场为了给一种新商品进行合理定价,将该商品按事先拟定的价格进行试销,得到表所示数据.若销量(单位:件)与单价(单位:元)之间的线性回归方程为,且样本点处的残差为3,则( )
单价/元
8.2
8.4
8.6
8.8
销量件
84
83
78
m
A.65 B.67 C.73 D.75
【答案】B
【分析】利用样本点处的残差为3,求得,再由,求得,进而可求得.
【详解】由条件知当时,,
代入,解得,于是,
又,所以,即,解得.
故选:B.
6.为了研究关于的线性相关关系,收集了组样本数据(见下表):
若已求得一元线性回归方程为,则下列选项中正确的是( )
(其中相关系数)
A.
B.当时,的预测值为
C.样本数据的第40百分位数为
D.去掉样本点后,与的样本相关系数不会改变
【答案】D
【分析】A项,求出,将样本中心点代入回归直线方程可求;B项,利用回归直线方程代值运算预测即可;C项,按百分位数求法步骤求解;D项,新样本平均值没有变化,由相关系数公式可知.
【详解】A项,,
所以样本点的中心坐标为,
将它代入得,,解得,故A错误;
B项,当时,的预测值为,故B错误;
C项,由为整数,则样本数据的第40百分位数为,故C错误;
D项,去掉样本点后,新样本数据的平均值没有变化,即仍然成立,
不妨设为第组数据,即,则,其余数据没有变化.
则由相关系数公式可知,
即新样本数据与的相关系数与原数据相关系数相等,
即与的样本相关系数不会改变,故D正确.
故选:D.
7.(24-25高二上·江苏常州·期末)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的残差为( )
A. B. C. D.
【答案】C
【分析】计算增加样本点后的新的样本中心点,代入经验回归方程可求得;根据经验回归方程可求得,由残差定义可得结果.
【详解】,增加两个样本点后的平均数为;
,,
增加两个样本点后的平均数为,
,解得:,新的经验回归方程为:,
则当时,,样本的残差为.
故选:C.
8.(24-25高二下·江苏南京·期中)已知两个变量与对应关系如下表:
若与满足一元线性回归模型,且经验回归方程为,则( )
A.与负相关
B.在处的残差为
C.经验回归直线过点
D.变量每增加一个单位,实际值一定增加个单位
【答案】C
【分析】根据回归直线的斜率可判断A选项;利用残差的定义可判断B选项;求出的值,代入回归直线方程,可判断C选项;根据经验回归方程的意义可判断D选项.
【详解】对于A选项,因为回归直线的斜率为,所以与正相关,A错;
对于B选项,当处的残差为,B错;
对于C选项,,则,
故经验回归直线过点,C对;
对于D选项,变量每增加一个单位,实际值增加个单位左右,D错.
故选:C.
二、多选题
9.(24-25高二下·江苏无锡·月考)市物价部门对5家商场的某商品一天的线上销售量及其价格进行调查,5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:
价格x
9
9.5
10
10.5
11
销售量y
11
10
8
6
5
按公式计算,y与x的回归直线方程是:,相关系数,则下列说法正确的是( )
A. B.变量x,y线性负相关且相关性较强
C.相应于点的残差约为 D.当时,y的估计值为14.4
【答案】BD
【分析】A选项,计算出样本中心点,代入回归直线方程得;B选项,随着的增大而减小,又,B正确;C选项,当时,,从而计算出残差约为0.4;D选项,代入,得到答案.
【详解】A选项,,,
将代入回归直线方程得,,解得,A错误;
B选项,从表可以看出,随着的增大而减小,又,接近于1,
所以变量x,y线性负相关且相关性较强,B正确;
C选项,回归直线方程为,当时,,
,故相应于点的残差约为0.4,C错误;
D选项,当时,y的估计值为,D正确.
故选:BD
10.(24-25高二下·江苏南京·期末)下列命题中,真命题有( )
A.数据6,2,3,4,5,7,8,9,1,10的70%分位数是8.5
B.若随机变量,则
C.已知两个变量具有线性相关关系,其回归直线方程为;若,则;
D.若,则
【答案】BC
【分析】对于A利用百分位数的定义即可判断,对于B利用二项分布即可求方差,进而判断,对于C利用回归方程必过样本中心点即可判断,对于D利用条件概率公式即可判断.
【详解】对于A:由,所以70%分位数是,故A错误;
对于B:由,所以,故B正确;
对于C:由,所以,故C正确;
对于D:,,所以,故D错误.
故选:BC.
11.下列说法正确的是( )
A.将总体划分为2层,通过分层随机抽样,得到两层的样本平均数和样本方差分别为,和、,若,则总体方差
B.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好
C.设为两个随机事件,,若,则事件与事件相互独立
D.若样本数据,,…,的标准差为8,则数据,,…,的标准差为32
【答案】BC
【分析】根据分层抽样种样本、总体间的均值和方差的关系判断A,根据残差平方和的意义判断B,利用条件概率公式和相互独立事件的定义判断C,根据方差的性质判断D.
【详解】选项A:设两层的样本容量依次为,若,设总体均值为,
则总体方差为,
当且仅当时,,故A说法错误;
选项B:回归分析中残差平方和越小,相关指数越接近于1,拟合效果越好,故B说法正确;
选项C:由条件概率公式可知,所以,
由相互独立事件的定义可知事件与事件相互独立,C说法正确;
选项D:设随机变量的取值为,,…,,随机变量的取值为,,…,,
由题意可知,则,
所以数据,,…,的标准差为,D说法错误.
故选:BC
三、填空题
12.某小吃店的日盈利(单位:百元)与当天平均气温(单位:℃)之间有如下数据:
0
1
2
百元
5
4
2
2
1
由表中数据可得回归方程中.试预测当天平均气温为时,小吃店的日盈利约为______百元.
【答案】6
【分析】求出样本中心点,代入得到值,再令即可.
【详解】由已知数据,,
因为,则,代入,则,
则,令,则.
故答案为:6
13.(24-25高二下·江苏·月考)某软件科技公司近8年的年利润额y与投入的年研发经费x(单位:千万元)如表所示.
x
3
4
5
6
6
7
8
9
y
根据散点图可以认为x与y之间存在线性相关关系,且相关系数,用最小二乘法求线性回归方程(,用分数表示),________.
附:(1)参考数据:,.
(2)参考公式:,.
【答案】
【分析】首先计算和 ,再比较参考公式,即可求解.
【详解】,
,
由条件可知,
得,
所以,
故答案为:.
14.(24-25高二下·江苏镇江·期末)某小吃店的日盈利(单位:百元)与当天平均气温(单位:)之间有如下数据:由表中数据可得回归方程中.试预测当天平均气温为时,小吃店的日盈利约为__________百元.
0
1
2
百元
5
4
2
2
1
【答案】6
【分析】根据已知数据求出样本中心点,代入得到值,再令即可得解.
【详解】由已知数据可知变量的平均值,
变量的平均值,
所以样本数据的中心点为,
因为,所以,代入,得,
所以,
令,得.
故答案为:6.
四、解答题
15.(24-25高二上·江苏常州·期末)某研究所研究耕种深度(单位:)与水稻每公顷产量(单位:)的关系,所得数据资料如下表.
耕种深度
8
10
12
14
16
18
每公顷产量
6
7
8
9
11
13
(1)求样本相关系数(结果保留两位小数),并判断它们是否具有较强的线性相关性;
(2)求经验回归方程.
参考数据:;
参考公式:,,.
【答案】(1),有较强的线性相关性,
(2)
【分析】(1)根据相关系数的公式即可求解,
(2)利用最小二乘法即可求解.
【详解】(1)由题意可知,
,
故,故有较强的线性相关性,
(2)
,
故,
将代入可得,
故回归直线方程为
16.(24-25高二下·江苏淮安·月考)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
参考数据:.
参考公式:相关系数.
【答案】(1),
(2)
【分析】(1)利用平均数计算公式得到和;
(2)先计算出,利用公式计算出相关系数.
【详解】(1)由题可知,
;
(2)计算得,
故;
17.(24-25高二下·江苏镇江·期中)根据统计,某蔬菜基地西红柿亩产量的增加量(单位:百千克)与某种液体肥料每亩使用量(单位:千克)之间的对应数据的散点图如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合与的关系,请计算相关系数,并说明线性相关性的强弱(相关系数精确到小数点后2位,若,则线性相关程度很高);
(2)求关于的线性回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少百千克.
附:数据和公式:;回归方程:,其中.相关系数:.
【答案】(1)0.95,与线性相关性很强.
(2),6.1
【分析】(1)根据题意,结合相关系数的公式,求得,即可得到结论;
(2)根据最小二乘法的公式,求得,得出的值,求得回归方程,令,求得的值,即可得到预测值.
【详解】(1)根据题意,可得,
且,
,
,
可得,
因为时线性相关程度很高,所以与线性相关性很强.
(2)由,则,
所以线性回归方程为,
当时,,
即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为6.1百千克.
18.(24-25高二下·江苏·期末)某旅游景点统计今年五一期间进入景区的游客人数(单位:千人)如下:
日期
5月1日
5月2日
5月3日
5月4日
5月5日
第天
1
2
3
4
5
参观人数
2.2
2.6
3.1
5.2
6.9
(1)根据上表数据,判断成对样本数据的线性相关程度,请用样本相关系数加以说明;(若,则认为与的线性相关性很强),如果与的线性相关性很强,那么求出关于的经验回归方程;
(2)五一期间景区开放南门、东门和北门供游客出入,游客从南门、东门和北门进入景区的概率分别为,且出景区与入景区选择相同门的概率为,选择与入景区不同两门的概率各为.假设游客从南门、东门、北门出入景点互不影响,现有甲、乙、丙、丁4名游客于5月1日游玩景点,设为4人中从东门出景区的人数,求的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:经验回归方程,其中,.
样本相关系数.
【答案】(1),与线性相关性很强;.
(2)分布列见解析,数学期望为1,方差为.
【分析】(1)由题意求出相关系数并求出回归方程即可;
(2)由全概率公式计算,利用二项分布计算概率,列出分布式,由公式计算期望和方差可得.
【详解】(1)依题意,,而,,,
.
因为时线性相关程度高,所以与线性相关性很强,可以用线性回归模型拟合.
,
因此,回归方程为.
(2)“甲从东门出学校”为事件,“甲从南门进学校”为事件,“甲从东门进学校”为事件,“甲从北门进学校”为事件,
由题意可得,,,,,
由全概率公式得:
同理乙、丙、丁从东门出景区的概率也为,
为4人中从东门出景区的人数,则,
,,,,,
故的分布列为:
0
1
2
3
4
,.
19.某创业者计划在某旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如下表,x为收费标准(单位:元/日),t为入住天数(单位:天),以频率作为各自的“入住率”,收费标准x与“入住率”y的散点图如图.
x
100
150
200
300
450
t
90
65
45
30
20
(1)令z=ln x,由散点图判断与,哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程;(,的结果精确到0.1)
(2)根据第(1)问所求的回归方程,试估计收费标准为多少时,100天销售额L最大?(100天销售额L=100×入住率×收费标准x)
参考数据:,
【答案】(1),
(2)150元/天
【分析】(1)由散点图判断出更适模型的回归方程,分别求出和,求出回归方程.
(2)写出100天销售额L的表达式,再根据导数求得最大值,即可得出收费标准.
【详解】(1)由散点图可知,散点并非均匀分布在一条直线的两侧,而是大致分布在一条曲线的两侧,不符合线性回归模型要求,∴更合适于此模型,
∵
∴
∴回归方程为:;
(2)由题意得,,
在中,
当时,解得:,
当即时,函数单调递减,
当即时,函数单调递增,
∴函数在处取最大值,
∴收费标准为150元/天时,100天销售额L最大.
1
学科网(北京)股份有限公司
$