内容正文:
必考点07 成对数据的统计相关性
题型一 变量间相关关系的判断
例题1 (多选)下列关系中,属于相关关系的是( )
A.正方形的边长与面积之间的关系
B.农作物的产量与施肥量之间的关系
C.出租车费与行驶的里程
D.降雪量与交通事故的发生率之间的关系
例题2某种产品的广告支出费x与销售额y之间有如下对应数据(单位:百万元):
x
2
4
5
6
8
y
30
40
60
50
70
①画出散点图;
②从散点图中判断销售金额与广告支出费成什么样的关系?
【解题技巧提炼】
两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断;
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
题型二 相关系数的性质应用
例题1甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得样本相关系数r如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
例题2在一组成对样本数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组成对样本数据的样本相关系数为-1,则所有的样本点(xi,yi)(i=1,2,…,n)满足的方程可以是( )
A.y=-x+1 B.y=x-1
C.y=x+1 D.y=-x2
【解题技巧提炼】
样本相关系数的性质
(1)r的绝对值越接近0,相关性越弱.
(2)r的绝对值越接近1,相关性越强.
题型三 相关系数的计算及应用
例题1【2020年高考全国Ⅰ卷理数节选】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi) (i=1,2,…,20)的相关系数(精确到0.01);
附:相关系数,.
【解题技巧提炼】
利用相关系数r来判断x,y是否线性相关时,当|r|>0.75,就认为x与y线性相关.
题型一 变量间相关关系的判断
1.以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:
房屋面积x/m2
115
110
80
135
105
销售价格y/万元
24.8
21.6
19.4
29.2
22
(1)画出数据对应的散点图;
(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?
题型二 相关系数的性质应用
1.对变量x,y有成对样本数据(xi,yi)(i=1,2,…,10),得散点图图1;对变量u,v有成对样本数据(ui,vi)(i=1,2,…,10),得散点图图2.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
2.(多选)对两个变量的样本相关系数r,下列说法正确的是( )
A.|r|越大,相关程度越大
B.|r|越小,相关程度越大
C.|r|趋近于0时,没有线性相关关系
D.|r|越接近1时,线性相关程度越强
题型三 相关系数的计算及应用
1.(2022山东潍坊一中高二月考)某单位一种大型设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
计算y与x之间的样本相关系数(精确到0.001,已知,,,,),并推断它们的相关程度.
【解析】∵,,
∴,
,
,
∴
.
由样本相关系数,可以推断这个大型设备的使用年限与所支出的维修费用这两个变量具有正相关关系,且相关程度很强.
一、单选题
1.2020年全球经济都受到了新冠疫情影响,但我国在中国共产党的正确领导下防控及时、措施得当,很多企业的生产所受影响甚微.我国某电子公司于2020年6月底推出了一款领先于世界的5G电子产品,现调查得到该5G产品上市时间x和市场占有率y