内容正文:
专题07 统计案例(知识点串讲)
知识整合
1. 变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.
例 1、(2019·郑州市第一次质量预测)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
月份
1
2
3
4
5
6
人均销售额
6
5
8
3
4
7
利润率(%)
12.6
10.4
18.5
3.0
8.1
16.3
根据表中数据,下列说法正确的是( )
A.利润率与人均销售额成正相关关系
B.利润率与人均销售额成负相关关系
C.利润率与人均销售额成正比例函数关系
D.利润率与人均销售额成反比例函数关系
2、已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
【跟踪练习】
1、对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
【解题技巧】 (1)根据散点图确定.(2)用相关系数判断线性相关性的强弱;用残差平方和与相关指数判断拟合效果
知识整合
两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程为y^=b^x+a^_,其中其中a^,b^是待定参数,(yi-bxi-a)2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.
回归直线方程:,其中,
(4)相关系数:
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性
:
例 2 、【山西省运城市康杰中学2017-2018学年高二下学期期中考试】已知的取值如下表:
与线性相关,且线性回归直线方程为,则=
A. B. C. D.
例3、(辽宁省六校2021届高三上学期期中联考)为了了解地区足球特色学校的发展状况,某调查机构得到如下统计数据:
年份
2014
2015
2016
2017
2018
足球特色学校 (百个)
0.30
0.60
1.00
1.40
1.70
(1).根据上表数据,计算与的相关系数,并说明与的线性相关性强弱
(已知:,则认为与线性相关性很强;,则认为与 线性相关性一般;,则认为与线性相关性较弱);
(2).求关于的线性回归方程,并预测地区2019年足球特色学校的个数(精确到个位数).
参考公式:,,,,
=,=-
例4、某汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销量之间的关系进行分析研究并做了记录,得到如下资料.
第几年
1
2
3
4
优惠金额x/万元
1
1.1
1.3
1.2
销量y/辆
22
24
31
27
(1)求出y关于x的线性回归方程x+;
(2)若第5年优惠金额为8 500元,估计第5年的销量y(单位:辆)的值.
参考公式:,.
【跟踪练习】
1、(四川省棠湖中学2018届高三3月月考)如表是降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出关于的线性回归方程为,则表中的值为( )
A. 3 B. 3.5 C. 4.5 D. 2.5[来源:学科网ZXXK]
2、(河北省武邑中学高二上学期期末)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了 1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
该兴趣小组确定的研究方案是:先用2、3、4、5月的4组数据求线性回归方程,再用1月和6月的2组数据进行检验.
(1)请根据2、3、4、5月的数据,求出关于的线性回归方程;
(2)若由线性回归方程得