内容正文:
专题4.1数据的相关性及回归方程
知识点1相关关系
1.相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2.散点图、正相关、负相关
(1)散点图:将样本中几个数据点描在平面直角坐标系中得到的图形.
(2)正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关.
如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
4.样本相关系数
(1)
当时,称成对样本数据正相关;当时,称成对样本数据负相关.
(2)样本相关系数的取值范围为.
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
重难点1变量的相关关系
1.如图,两个变量具有相关关系的是( )
A.(1)(3) B.(1)(4) C.(2)(4) D.(2)(3)
2.下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.每个人体育锻炼的时间与身体的重量
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
3.(多选)下列各组的两个变量中呈正相关关系的是( )
A.学生的身高与学生的化学成绩
B.汽车行驶的里程与它的耗油量
C.人的年龄与年收入
D.水果的重量与它的总价
4.判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画.
回归模型: ;函数模型: .
①某公司的销售收入和广告支出;
②某城市写字楼的出租率和每平米月租金;
③航空公司的顾客投诉次数和航班正点率;
④某地区的人均消费水平和人均国内生产总值(GDP);
⑤学生期末考试成绩和考前用于复习的时间;
⑥一辆汽车在某段路程中的行驶速度和行驶时间;
⑦正方形的面积与周长.
5.以下两个变量成正相关的是 .
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
6.判断以下两个变量之间是否具有相关关系?
(1)正方形的面积与其周长之间的关系;
(2)父母的身高与子女的身高之间的关系;
(3)学生的学号与身高;
(4)汽车匀速行驶时的路程与时间的关系.
重难点2相关关系的理解
7.调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数,则下列说法正确的是( )
A.若从样本中抽取一部分,则这部分的相关系数一定是
B.花瓣长度和花萼长度没有相关性
C.花瓣长度和花萼长度呈现负相关
D.花瓣长度和花萼长度呈现正相关
8.在一组样本数据(不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为( )
A. B. C. D.1
9.对于样本相关系数,下列说法错误的是( )
A.可以用来判断成对样本数据相关的正负性
B.可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线性相关程度也越高
D.取值范围是
10.对于样本相关系数r,下列说法正确的是( )
A.样本相关系数
B.样本相关系数r越小,成对样本数据的线性相关程度越弱
C.当时,成对样本数据没有任何相关关系
D.当时,成对样本数据正相关且两个分量之间满足一种线性关系
重难点3相关系数的大小比较
11.变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则( )
A. B.
C. D.
12.下列两个变量相关程度最强的是( )
A.商品销售额和商品销售量的相关系数是0.9
B.商品销售额和商业利润率的相关系数是0.84
C.平均流通费用率和商业利润率的相关系数是-0.94
D.商品销售价格和商品销售量的相关系数是-0.91
13.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B. C. D.
14.相关变量的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程,相关系数为;方案二:剔除点,根据剩下数据得到线性回归直线方程:,相关系数为.则( )
A.
B.
C.
D.
15.已知四组不同数据的两个变量的线性相关系数如下:数据组①的相关系数;数据组②的相关系数;数据组③的相关系数;数据组④的相关系数.则下列