内容正文:
课时分层评价19 变量的相关关系 样本相关系数
(时间:60分钟 满分:100分)
(本栏目内容,在学生用书中以独立形式分册装订!)
(1—9题,每小题5分,共45分)
1.下列关于散点图的说法中,正确的是( )
A.任意给定统计数据,都可以绘制散点图
B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系
D.从散点图中无法看出数据的分布情况
答案:B
解析:散点图不适合用于展示百分比占比的数据,另外数据量较少的数据也不适合用散点图表示,故A错误;散点图能看出两个量是否具有一定关系,但是并不一定是因果关系,故B正确,C错误;散点图中能看出数据的分布情况,故D错误.故选B.
2.下列图形中具有相关关系的两个变量是( )
答案:C
解析:根据散点图可知,在选项C中,样本点成带状分布,则两个变量具有相关关系,所以两个变量x、y具有相关关系的图是C;选项A,B为函数关系,选项D中的散点杂乱无章,看不出这两个变量有什么相关性.故选C.
3.有变量x与变量m,n,o,p对应的4组样本数据,计算出它们的线性相关系数分别为r1=-0.92,r2=-0.71,r3=0.84,r4=0.51,则与x线性相关关系最弱的是( )
A.m B.n
C.o D.p
答案:D
解析: 相关系数的绝对值越小,变量间的线性相关性越弱,因为<<<,所以与x线性相关关系最弱的是p.故选D.
4.某相关变量x、y的散点图如图所示,现对这两个变量进行回归分析,方案一:根据图中所有数据分析样本相关系数为r1;方案二:剔除点(10,32),根据剩下数据分析样本相关系数为r2.则( )
A.0<r1<r2<1 B.0<r2<r1<1
C.-1<r1<r2<0 D.-1<r2<r1<0
答案:A
解析:由散点图可知这两个变量为正相关,所以0<r1<1,0<r2<1,因为剔除点(10,32)后,剩下点的数据更具有线性相关性,样本相关系数更接近1,所以0<r1<r2<1.故选A.
5.为考察两个变量x,y的相关性,搜集数据如表,则两个变量的线性相关程度( )
x
5
10
15
20
25
y
103
105
110
111
114
(参考数据:=1 375,=59 051,xiyi=8 285,≈15.8,≈9.01)
A.很强 B.很弱
C.无相关 D.不确定
答案:A
解析:依题意,得==15,==108.6,
则r==≈0.983 4,因为相关系数很接近于1,故两个变量的线性相关程度很强.故选A.
6.(多选)对于样本相关系数,下列说法正确的是( )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线性相关程度越强
D.样本相关系数r∈[-1,1]
答案:ABD
解析:对于A,样本相关系数可以用来判断成对样本数据相关的正负性,故A正确;对于B,样本相关系数可以是正的,也可以是负的,故B正确;对于C,样本相关系数的绝对值越大,成对样本数据的线性相关程度也越强,故C错误;对于D,样本相关系数r∈[-1,1],故D正确.故选ABD.
7.根据某省2019年~2025年水果的人均占有量y(单位:kg)和年份代码x绘制的散点图如图所示(其中,2019年~2025年的年份代码x依次为1~7).根据对散点图的分析,可得y与x之间的相关关系为 相关.(填“正”或“负”)
答案:正
解析:根据散点图,可得y与x之间的相关关系为正相关.
8.为了比较甲、乙、丙、丁四组数据的线性相关性的强弱,某同学分别计算了甲、乙、丙、丁四组数据的线性相关系数,求得数值依次为-0.98,-0.27,0.36,0.93,则这四组数据中线性相关性最强的是 组数据.
答案:甲
解析:依题意,因为线性相关系数的绝对值越大,线性相关性越强,由甲、乙、丙、丁四组数据的线性相关系数分别为-0.98,-0.27,0.36,0.93,所以甲组数据的线性相关性最强.
9.若已知(yi-)2是(xi-)2的4倍,(xi-)(yi-)是(xi-)2的1.5倍,则样本相关系数r的值为 .
答案:0.75
解析:r===0.75.
10.(13分)某高中数学兴趣小组,在学习了统计案例后,准备利用所学知识研究成年男性的臂长y(cm)与身高x(cm)之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:
x
159
165
170
176
180
y
67
71
73
76
78
根据上表数据,可用线性回归模型拟合y与x的关系,请用相关系数加以说明.
附:参考数据:xiyi=62 194, ≈8.6,≈16.8
解:由表中的数据和附注中的参考数据得
xi=850,=170,yi=365,=73,(xi-)2=112+52+02+62+102=282,
≈8.6,(xi-)(yi-)=xiyi-5=62 194-170×73×5=144,
所以r=≈≈0.997.
因为y与x的相关系数近似为0.997,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.
(11—13题,每小题5分,共15分)
11.某校学生科研兴趣小组为了解1~12岁儿童的体质健康情况,随机调查了20名儿童的相关数据,分别制作了肺活量、视力、肢体柔韧度、BMI指数和身高之间的散点图,则与身高之间具有正相关关系的是( )
答案:A
解析:对于A,儿童的身高越高,其肺活量越大,肺活量与身高具有正相关关系,故A正确;对于B,儿童的视力随身高的增大先增大,后减小,视力与身高不具有正相关关系,故B错误;对于C,肢体柔韧度随身高增大而减小,肢体柔韧度与身高不具有正相关关系,故C错误;对于D,BMI指数与身高的相关性很弱,不具有正相关关系,故D错误.故选A.
12.(多选)对小明在连续9次高考模拟数学测试中的成绩(单位:分)进行统计得到如图所示的散点图.他的同桌小刚根据散点图对他的数学成绩的分析中,正确的有( )
A.小明的数学成绩总的趋势是在逐步提高
B.小明在这连续9次测试中的最高分与最低分的差超过40分
C.小明的数学成绩与测试序号具有线性相关性,且为负相关
D.小明的数学成绩与测试序号具有线性相关性,且为正相关
答案:ABD
解析:散点图从左向右看呈上升趋势,则小明的数学成绩总的趋势是在逐步提高,故A正确;小明在这连续9次测试中的最高分大于130分,最低分小于90分,两者的差超过40分,故B正确;散点落在某条直线附近,小明的数学成绩与测试序号具有比较明显的线性相关性,且为正相关,故C错误,D正确.故选ABD.
13.已知成对样本数据(x1,y1) ,(x2,y2) ,…,(xn,yn) (n≥3) 中x1,x2,…,xn互不相等,且所有样本点(xi,yi) (i=1,2,…,n) 都在直线y=- x+1上,则这组成对样本数据的样本相关系数r= .
答案:-1
解析:因为所有样本点(xi,yi)(i=1,2,…,n)都在直线y=- x+1上,显然直线y=- x+1的斜率- <0,所以样本数据成负相关,相关系数为-1.
14.(17分)为调查某地区学生在高中学习中错题订正整理情况与考试成绩的关系.首先对该地区所有高中学生错题订正整理情况进行分值评价,给出得分;再组织考试.从这些学生中随机抽取20名学生的错题订正整理情况得分x和对应的考试成绩y作为样本,得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样本错题订正整理情况得分和对应的考试成绩,计算得-20=80,(yi-)2=9 000,xiyi-20 =800.
(1)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01),并推断考试成绩y和错题订正整理情况得分x的相关程度;
(2)已知20个样本中有8个样本的考试成绩低于样本平均数.利用频率估计概率,从该地区所有高中学生中随机抽取4个学生的错题订正整理情况得分和对应的考试成绩,记抽到考试成绩低于的个数为X,求随机变量X的分布列.
附:相关系数r=,≈1.414.
解:(1)依题意,r=====≈0.94,
因为r接近1,所以考试成绩y和错题订正整理情况得分x高度相关.
(2)考试成绩低于样本平均数的概率记为p,则
p==,所以X~B(4,).
所以P(X=0)=)4=,
P(X=1)=)×()3=,
P(X=2)=)2×()2=,
P(X=3)=)3×=,
P(X=4)=)4=.
所以X的分布列为
X
0
1
2
3
4
P
(15、16题,每小题5分,共10分)
15.已知两组数据a1,a2,…,a10和b1,b2,…,b10,其中1≤i≤10且i∈Z时,ai=i;1≤i≤9且i∈Z时,bi=ai,b10=a,我们研究这两组数据的相关性,在集合 中取一个元素作为a的值,使得相关性最强,则a=( )
A.8 B.11
C.12 D.13
答案:B
解析:设点坐标为(ai,bi) ,1≤i≤10且i∈Z,由题意得前9个点位于直线y=x上,而a10=10,则要使相关性更强,b10应更接近10,四个选项中11更接近10.故选B.
16.现调查某地区某种野生动物的数量,将该地区分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样本,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi,yi分别表示第i个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,构造向量a=(x1-,x2-,…,x20-),b=(y1-,y2-,…,y20-),其中=,=,并计算得xi=60,yi=1 200,xiyi=4 400,|a|=9,=100,由人教A版选择性必修第三册教材中的知识,我们知道n对数据的相关系数r=cos<a,b>,则上述数据(xi,yi)(i=1,2,…,20)的相关系数r= .
答案:
解析:由已知数据,xi=60,yi=1 200可得=3,=60,根据夹角公式的定义,r=cos<a,b>=,而a·b=(xi-)(yi-),根据(xi-)(yi-)=(xiyi-yi-xi+·)=xiyi-yi-xi+·=xiyi-20·-20·+20·=xiyi-20·=4 400-20×3×60=800,于是r=cos<a,b>===.
学科网(北京)股份有限公司
$