内容正文:
第八章 成对数据的统计分析
专题01 模拟效果比较问题
两个相关变量的线性相关关系强弱,用函数模型拟合的效果,可用相关系数,相关指数,残差平方和(残差图)来判断。
从近几年高考命题看,考查考查力度与以往基本相同,与之相关的题目,难度不大.
【题型导图】
类型一 由相关系数判断拟合效果
例1:(2022·内蒙古·赤峰)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的量换算成费用,称之为失效费.某种机械设备的使用年限(单位:年)与失效费(单位:万元)的统计数据如下表所示:
使用年限x
1
2
3
4
5
6
7
失效费y
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据,
(1)推断成对样本数据与线性相关程度,请用相关系数加以说明.(精确到0.01)
(2)求出线性回归方程.预测使用8年时的失效费.
参考公式:相关系数.参考数据:,,.
【变式1】(2022·全国)甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性做试验,并分别求得样本相关系数r,如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则试验结果中x,y两变量有更强线性相关性的是( ).A.甲 B.乙 C.丙 D.丁
【变式2】(2022·全国)对四组数据进行统计,获得以下散点图,关于其线性相关系数比较,正确的是( )
A. B.
C. D.
【变式3】近些年来,短视频社交软件日益受到追捧,用户可以通过软件选择歌曲,拍摄音乐短视频,创作自己的作品.某用户对自己发布的视频个数x与收到的点赞个数y之间的关系进行了分析研究,得到如下数据:
x
2
4
6
8
10
y
64
138
205
285
360
(1)计算x,y的相关系数r(计算结果精确到0.0001),并判断是否可以认为发布的视频个数与收到的点赞数的相关性很强;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程.
参考公式:,,.
参考数据:,.
类型二 由判断拟合效果
例2.(2022·全国·高二)某电视厂家准备在“五一”举行促销活动,现在根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如下:
年份
2014
2015
2016
2017
2018
2019
2020
广告费支出x
1
2
4
6
11
13
19
销售量y
1.9
3.2
4.0
4.4
5.2
5.3
5.4
(1)若用线性回归模型拟合y与x的关系,求出y关于x的回归方程.
(2)若用模型拟合y与x的关系,可得回归方程,经计算线性回归模型和该模型的分别约为0.75和0.88,请用说明选择哪个回归模型更好.
(3)已知利润z(单位:万元)与x,y的关系为.根据(2)的结果回答:当广告费时,销售量及利润的预测值是多少?(精确到0.01)
参考数据:.
参考公式:线性回归方程中的斜率和截距的最小二乘估计公式分别为.
【变式1】(2022·全国·高二)某市相关部门为了了解该市市民2019年1月至2020年1月期间购买二手房情况,首先随机抽取其中200名购房者,并对其购房面积m(单位:平方米,)进行了一次调查统计,制成了如图(1)所示的频率分布直方图,接着调查了该市2019年1月至2020年1月期间当月在售二手房均价y(单位:万元/平方米),制成了如图(2)所示的散点图(图中月份代码1—13分别对应2019年1月至2020年1月).
(1)试估计该市市民的平均购房面积;
(2)现采用分层随机抽样的方法从购房面积位于的40位市民中随机抽取4人,再从这4人中随机抽取2人,求这2人的购房面积恰好有一人在的概率;
(3)根据散点图选择和两个模型进行拟合,经过数据处理得到两个回归方程,分别为和,并得到一些统计量的值,如表所示:
0.000591
0.000164
0.00605
请利用决定系数判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2020年6月份的二手房购房均价(精确到0.001).
参考数据:,,,,,,,,参考公式:决定系数.
【变式2】(2022·全国·高二)身高体重指数(BMI)的大小直接关系到人的健康状况,某高中高三(1)班班主任为了解该班学生的身体健康状况,从该班学生中随机选取5名学生,测量其身高、体重(数据如下表)并进行线性回归分析,得到线性回归方程为,因为某些原因,3号学生的体重数据丢失.
学生编号
1
2
3
4
5
身高
165
170