内容正文:
9.1.1 变量的相关性
一、 单项选择题
1 (2023重庆期末)下列两个变量中,成正相关的两个变量是( )
A. 汽车自身的重量与行驶每公里的耗油量
B. 每个人体育锻炼的时间与体重
C. 花费在体育活动上面的时间与期末考试数学成绩
D. 期末考试随机编排的准考证号与期末考试成绩总分
2 对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. r2<r4<0<r3<r1
B. r4<r2<0<r1<r3
C. r4<r2<0<r3<r1
D. r2<r4<0<r1<r3
3 (2024吉安期末)对于样本相关系数,下列说法中错误的是( )
A. 可以用来判断成对样本数据相关的正负性
B. 可以是正的,也可以是负的
C. 样本相关系数越大,成对样本数据的线性相关程度也越高
D. 取值范围是[-1,1]
4 (2024辽宁期末)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有的样本点(xi,yi)(i=1,2,…,n)都在直线y=-2x+1上,则这组样本数据的相关系数为( )
A. 2 B. -2
C. -1 D. 1
5 (2024上海浦东期中)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:kg)的散点图.若去掉图中右下方的点A后,则下列说法中正确的是( )
A. “每千克价格”与“年需求量”这两个变量由负相关变为正相关
B. “每千克价格”与“年需求量”这两个变量的线性相关程度不变
C. “每千克价格”与“年需求量”这两个变量的线性相关系数变大
D. “每千克价格”与“年需求量”这两个变量的线性相关系数变小
6 北极冰融是近年来最引人注目的气候变化现象之一,白色冰面融化变成颜色相对较暗的海水,被称为“北极变暗”现象.21世纪以来,北极的气温变化是全球平均水平的2倍,被称为“北极放大”现象.下图为北极的年平均海冰面积(单位:106 km2)与年平均CO2浓度(单位:ppm)图,则下列说法中正确的是( )
A. 北极的年平均海冰面积逐年减少
B. 北极的年平均海冰面积减少速度不断加快
C. 北极的年平均海冰面积与年平均二氧化碳浓度大体成负相关
D. 北极的年平均海冰面积与年平均二氧化碳浓度大体成正相关
二、 多项选择题
7 下列有关样本相关系数的说法中,正确的是( )
A. |r|≥1,且|r|越接近1,相关程度越大
B. |r|≤1,且|r|越接近0,相关程度越小
C. |r|≤1,且|r|越接近1,相关程度越大
D. 相关系数用来衡量变量x与y的线性相关程度
8 (2024江苏月考)下列关系中,有相关关系的是( )
A. 人的年龄与他(她)拥有的财富之间的关系
B. 曲线上的点与该点的坐标之间的关系
C. 苹果的产量与气候之间的关系
D. 森林中的同一种树木,其截面直径与高度之间的关系
三、 填空题
9 (2024赣州期中)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为r1=0.66,r2=-0.97,r3=0.92,r4=0.89,则这四人中,________研究的两个随机变量的线性相关程度最高.
10 如图,有5对数据,去掉点________对应的数据后,剩下的4对数据的线性相关程度更强.
11 (2024天津期末)学习之于信仰和才干,犹如运动之于健康体魄,持之以恒、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数,如下表:
天数x
1
2
3
4
5
6
7
一次最多答
对的题数y
12
15
16
18
21
24
27
参考数据:=4,=19,=140,=2 695,iyi=600,≈2.45,相关系数r==
.
由表中数据可知该老师每天一次最多答对题数y与天数x之间是________相关(填“正”或“负”),其相关系数r≈________(结果保留两位小数).四、 解答题
12 两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,分别判断它们是否具有相关关系;若具有相关关系,说出它们相关关系的区别.
表1 表2
A
26
18
13
10
4
-1
B
20
24
34
38
50
64
C
0
5
10
15
20
25
30
35
D
541.67
602.66
672.09
704.99
806.71
908.59
975.42
1 034.75
13 某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案.方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区,依据抽样数据计算得到相应的相关系数r=0.81;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据(xi,yi)(i=1,2,…,30),其中xi和yi分别表示第i个样本区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=90,(yi-)2=8 000,(xi-)(yi-)=800.
(1) 求该地区这种野生动物数量的估计值(该地区这种野生动物数量的估计值等于样本区这种野生动物数量的平均数乘以地块数);
(2) 求方案二抽取的样本(xi,yi)(i=1,2,…,30)的相关系数(精确到0.01),并判定哪种抽样方法更能准确地估计.
附:相关系数r=,≈1.414,相关系数|r|∈[0.75,1],则相关性很强,|r|的值越大,相关性越强.
9.1.1 变量的相关性
1. A 对于A,一般情况下,汽车越重,则每公里耗油量越多,成正相关,故A正确;对于B,一般情况下,锻炼时间越长,体重越轻,成负相关,故B错误;对于C,一般情况下,花费在体育活动上面的时间越长,则期末考试数学成绩可能会降低,不为正相关,故C错误;对于D,期末考试随机编排的准考证号与期末考试成绩总分没有相关关系,故D错误.
2. A 由题意,得r1>0,r3>0,且r1>r3;r2<0,r4<0,且|r2|>|r4|,所以r2<r4,所以r2<r4<0<r3<r1.
3. C 样本数据的相关性越强,相关系数就越接近于±1,故D正确;相关系数的绝对值越小,样本数据的相关性越弱,故C错误;当相关系数为正数时,样本数据正相关,当相关系数为负数时,样本数据负相关,故A,B正确.
4. C 因为所有的样本点都在直线y=-2x+1上,所以相关系数r满足|r|=1.又因为-2<0,所以r<0,所以r=-1.
5. D 对于A,去掉图中右下方的点A后,根据图象,两个变量还是负相关,故A错误;对于B,C,D,去掉图中右下方的点A后,相对来说数据会更集中,相关程度会更高,但因为是负相关,相关系数会更接近-1,线性相关系数会变小,故D正确,B,C错误.
6. C 对于A,B,由统计图可知北极的年平均海冰面积较前一年有增加有减少,故A,B错误;对于C,D,由统计图可知随着年平均二氧化碳浓度的增加,北极的年平均海冰面积总体呈下降趋势,所以北极的年平均海冰面积与年平均二氧化碳浓度大体成负相关,故C正确,D错误.
7. BCD 由相关系数的定义可得|r|≤1,故A错误;|r|越接近0,相关程度越小,|r|越接近1,相关程度越大,故B,C正确;相关系数和x与y的线性相关程度有关,故D正确.故选BCD.
8. ACD 对于A,人的年龄与他(她)拥有的财富之间的关系是客观存在的相互依存的非确定性关系,具有相关关系,故A正确;对于B,曲线上的点与该点的坐标之间的关系满足函数关系,为确定性关系,故B错误;对于C,苹果的产量与气候之间的关系是客观存在的相互依存的非确定性关系,具有相关关系,故C正确;对于D,森林中的同一种树木,其截面直径与高度之间的关系是客观存在的相互依存的非确定性关系,具有相关关系,故D正确.故选ACD.
9. 乙 因为|r2|>|r3|>|r4|>|r1|,所以这四人中,乙研究的两个随机变量的线性相关程度最高.
10. D 去掉点D对应的数据后,其余四个点大致在一条直线附近,相关性更强.
11. 正 0.99 由表中数据,得y随x的增大而增大,所以该老师每天一次最多答对题数y与天数x之间是正相关,r=×=≈≈0.99.
12. 散点图分别如图1和图2.
从图中可以看出两图中的点各自分布在一条直线附近,因此两对变量都具有相关关系.
图1中,当A的值由小变大时,B的值由大变小,故变量A和B负相关;
图2中,当C的值由小变大时,D的值由小变大,故变量C和D正相关.
图1 图2
13. (1) 由题意,得样本区野生动物数量的平均数为=×1 200=40,
又地块数为300,所以该地区这种野生动物数量的估计值为300×40=12 000.
(2) 由题中数据,得方案二的样本(xi,yi)(i=1,2,…,30)的相关系数为r0===≈0.94.
因为0.81<0.94,
所以方案二的分层抽样更能准确地估计.
学科网(北京)股份有限公司
$$