内容正文:
第八章 成对数据的统计分析》同步配套分层练习-2024-2025学年高二数学教材解读与拓展(沪教版2020)选择性必修第二册
【原卷版】 8.1.2 相关系数
【附录】相关考点
考点一
相关系数
(1)设由变量x和 y获得的两组数据分别为xi和yi(i=1,2,…,n),两组数据分别为xi和yi的线性相关系数是两个变量x和 y之间线性相关程度的统计量,其计算公式为:
;
其中,;
它们分别是这两组数据的算术平均数;
线性相关系数常常简称相关系数;也称为皮尔逊系数;
(2)样本相关系数r的取值范围为[-1,1].
①若r>0时,成对样本数据正相关;
②若r<0时,成对样本数据负相关;
③当|r|越接近1时,成对样本数据的线性相关程度越强;
④当|r|越接近0时,成对样本数据的线性相关程度越弱;
说明:相关系数的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系;
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱;
【必做题】落实与理解教材要求的基本教学内容;
1、关于相关关系,下列说法不正确的是( )
A.相关关系是一种非确定关系
B.相关关系r越大,两个变量的相关性越强
C.当两个变量相关且相关系数时,表明两个变量正相关
D.相关系数r的绝对值越接近1,表明两个变量的相关性越强
2、若变量y与x之间的样本相关系数r=-0.983 2,则变量y与x之间( )
A.不具有线性相关关系
B.具有线性相关关系
C.它们的线性相关关系还需要进一步确定
D.不确定
3、对两个变量进行线性相关检验,得线性相关系数,对两个变量进行线性相关检验,得线性相关系数,则下列判断正确的是( )
A.变量与正相关,变量与负相关,变量与的线性相关性较强
B.变量与负相关,变量与正相关,变量与的线性相关性较强
C.变量与正相关,变量与负相关,变量与的线性相关性较强
D.变量与负相关,变量与正相关,变量与的线性相关性较强
4、一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,,,,,则y与x的相关系数r的绝对值为( )
A.0.6 B.0.5 C.0.4 D.0.3
【标答题】掌握与体验用相关数学知识与方法规范审题、析题、答题;
5、若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的样本相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的一组是 (填:甲、乙、丙中的一个)
6、已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 (计算结果精确到0.01)
6
8
10
12
6
5
3
2
7、为了比较甲、乙、丙、丁四组数据的线性相关性强弱,某同学分别计算了甲、乙、丙、丁四组数据的线性相关系数,求得数值依次为,,0.36,0.93,则这四组数据中线性相关性最强的是 组数据.
8、某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:
x
2
4
6
8
y
30
40
50
70
(1)画出(x,y)的散点图;
(2)计算x与y之间的样本相关系数,并刻画它们的相关程度.
【自选题】提升与拓展课本知识与方法,具有知识与方法的交汇与综合,由学生自主选择尝试。
9、变量与相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量与相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,则( )
参考公式:线性相关系数r=
A. B. C. D.
10、学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x
1
2
3
4
5
6
7
一次最多答对题数y
12
15
16
18
21
24
27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),
其相关系数 (结果保留两位小数)
11、人口结构的变化,能明显影响住房需求.当一个地区青壮年人口占比高,住房需求就会增加,而当一个地区老龄化严重,住房需求就会下降.某机构随机选取了某个地区的10个城市,统计了每个城市的老龄化率和空置率,得到如下表格.
城市
1
2
3
4
5
6
7
8
9
10
总和
老龄化率
0.17
0.2
0.18
0.05
0.21
0.09
0.19
0.3
0.17
0.24
1.8
空置率
0.06
0.13
0.09
0.05
0.09
0.08
0.11
0.15
0.16
0.28
1.2
并计算得.
(1)若老龄化率不低于,则该城市为超级老龄化城市,根据表中数据,估计该地区城市为超级老龄化城市的频率;
(2)估计该地区城市的老龄化率和空置率的相关系数(结果精确到0.01).
参考公式:相关系数.
12、大学生小铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:
样本号
1
2
3
4
5
6
7
8
9
10
总和
零件的横截面积
0.03
0.05
0.04
0.07
0.07
0.04
0.05
0.06
0.06
0.05
0.52
耗材量
0.24
0.40
0.23
0.55
0.50
0.34
0.35
0.45
0.43
0.41
3.9
并计算得.
(1)估算小铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求小铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
(3)小铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为,若这种零件的耗材量和其横截面积近似成正比,请帮小铭计算一下他制作的零件的总耗材量的估计值;附:相关系数.
第1页
学科网(北京)股份有限公司
$$第八章 成对数据的统计分析》同步配套分层练习-2024-2025学年高二数学教材解读与拓展(沪教版2020)选择性必修第二册
【解析版】 8.1.2 相关系数
【附录】相关考点
考点一
相关系数
(1)设由变量x和 y获得的两组数据分别为xi和yi(i=1,2,…,n),两组数据分别为xi和yi的线性相关系数是两个变量x和 y之间线性相关程度的统计量,其计算公式为:
;
其中,;
它们分别是这两组数据的算术平均数;
线性相关系数常常简称相关系数;也称为皮尔逊系数;
(2)样本相关系数r的取值范围为[-1,1].
①若r>0时,成对样本数据正相关;
②若r<0时,成对样本数据负相关;
③当|r|越接近1时,成对样本数据的线性相关程度越强;
④当|r|越接近0时,成对样本数据的线性相关程度越弱;
说明:相关系数的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系;
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱;
【必做题】落实与理解教材要求的基本教学内容;
1、关于相关关系,下列说法不正确的是( )
A.相关关系是一种非确定关系
B.相关关系r越大,两个变量的相关性越强
C.当两个变量相关且相关系数时,表明两个变量正相关
D.相关系数r的绝对值越接近1,表明两个变量的相关性越强
【答案】B
【解析】对于A,相关关系不同于函数关系,它是一种非确定的关系,所以,A正确;
对于B,相关关系|r|越大,两个变量的相关性越强,所以,B错误;
对于C,当两个变量相关且相关系数r>0时,说明两个变量正相关,所以,C正确;
对于D,相关系数r的绝对值越接近1,表明两个变量的相关性越强,所以,D正确.
故选:B;
2、若变量y与x之间的样本相关系数r=-0.983 2,则变量y与x之间( )
A.不具有线性相关关系
B.具有线性相关关系
C.它们的线性相关关系还需要进一步确定
D.不确定
【答案】B;
【解析】变量y与x之间的样本相关系数r=-0.983 2,|r|=0.983 2接近1,样本相关系数的绝对值越大,相关性越强,所以,变量y与x之间有较强的线性相关关系,故选B;
3、对两个变量进行线性相关检验,得线性相关系数,对两个变量进行线性相关检验,得线性相关系数,则下列判断正确的是( )
A.变量与正相关,变量与负相关,变量与的线性相关性较强
B.变量与负相关,变量与正相关,变量与的线性相关性较强
C.变量与正相关,变量与负相关,变量与的线性相关性较强
D.变量与负相关,变量与正相关,变量与的线性相关性较强
【答案】C
【解析】由线性相关系数r1=0.7859>0知x与y正相关,由线性相关系数r2=-0.9568<0知u,v负相关,
又|r1|<|r2|,所以,变量u与v的线性相关性比x与y的线性相关性强;
故选:C;
4、一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,,,,,则y与x的相关系数r的绝对值为( )
A.0.6 B.0.5 C.0.4 D.0.3
【答案】D
【详解】因为,,所以,
,
故选:D;
【标答题】掌握与体验用相关数学知识与方法规范审题、析题、答题;
5、若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的样本相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的一组是 (填:甲、乙、丙中的一个)
【答案】丙;
【解析】两个变量y与x,它们的样本相关系数|r|越接近于1,这两个变量线性相关程度就越强,在甲、乙、丙中,所给的数值中-0.90的绝对值最接近1,所以丙的线性相关程度最强;
6、已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 (计算结果精确到0.01)
6
8
10
12
6
5
3
2
【答案】
【解析】根据表中数据计算可知
,
,
变量之间的相关系数,
故答案为: .
7、为了比较甲、乙、丙、丁四组数据的线性相关性强弱,某同学分别计算了甲、乙、丙、丁四组数据的线性相关系数,求得数值依次为,,0.36,0.93,则这四组数据中线性相关性最强的是 组数据.
【答案】甲
【解析】根据题意,因为线性相关系数的绝对值越大,线性相关性越强,
由甲、乙、丙、丁四组数据的线性相关系数分别为,,0.36,0.93,
所以甲组数据的线性相关性最强.
故答案为:甲;
8、某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:
x
2
4
6
8
y
30
40
50
70
(1)画出(x,y)的散点图;
(2)计算x与y之间的样本相关系数,并刻画它们的相关程度.
【解析】(1)画出(x,y)的散点图如图所示;
(2)=5,=47.5,
=120,=9 900,iyi=1 080,
故样本相关系数r=
=≈0.982 7.
由样本相关系数r≈0.982 7,可以推断生产原料耗费与销售额这两个变量正线性相关,且相关程度很高.
【说明】线性相关强弱的判断方法:
(1)散点图:散点图只是粗略作出判断,其图象越接近直线,相关性越强;
(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强;
【自选题】提升与拓展课本知识与方法,具有知识与方法的交汇与综合,由学生自主选择尝试。
9、变量与相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量与相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,则( )
参考公式:线性相关系数r=
A. B. C. D.
【答案】C
【解析】由已知中的数据可知:第一组数据正相关,则相关系数大于零,
第二组数据负相关,则相关系数小于零,故选:C.
10、学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x
1
2
3
4
5
6
7
一次最多答对题数y
12
15
16
18
21
24
27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),
其相关系数 (结果保留两位小数)
【答案】正; 0.99;
【解析】由表中数据得随的增大而增大,
所以该老师每天一次最多答对题数y与天数x之间是正相关,
.
故答案为:正;.
11、人口结构的变化,能明显影响住房需求.当一个地区青壮年人口占比高,住房需求就会增加,而当一个地区老龄化严重,住房需求就会下降.某机构随机选取了某个地区的10个城市,统计了每个城市的老龄化率和空置率,得到如下表格.
城市
1
2
3
4
5
6
7
8
9
10
总和
老龄化率
0.17
0.2
0.18
0.05
0.21
0.09
0.19
0.3
0.17
0.24
1.8
空置率
0.06
0.13
0.09
0.05
0.09
0.08
0.11
0.15
0.16
0.28
1.2
并计算得.
(1)若老龄化率不低于,则该城市为超级老龄化城市,根据表中数据,估计该地区城市为超级老龄化城市的频率;
(2)估计该地区城市的老龄化率和空置率的相关系数(结果精确到0.01).
参考公式:相关系数.
【答案】(1)估计该地区城市为超级老龄化城市的频率为;
(2)该地区城市的老龄化率和空置率的相关系数约为0.63;
【详解】(1)由表中数据可知,调查的10个城市中,老龄化率不低于的有4个,
故估计该地区城市为超级老龄化城市的频率为.
(2),
则
.
故该地区城市的老龄化率和空置率的相关系数约为0.63.
12、大学生小铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:
样本号
1
2
3
4
5
6
7
8
9
10
总和
零件的横截面积
0.03
0.05
0.04
0.07
0.07
0.04
0.05
0.06
0.06
0.05
0.52
耗材量
0.24
0.40
0.23
0.55
0.50
0.34
0.35
0.45
0.43
0.41
3.9
并计算得.
(1)估算小铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求小铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
(3)小铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为,若这种零件的耗材量和其横截面积近似成正比,请帮小铭计算一下他制作的零件的总耗材量的估计值;附:相关系数.
【答案】(1)平均每个零件的横截面积为,一个零件的耗材量;(2);(3)
【解析】(1)样本中10个这种零件的横截面积的平均值,
样本中10个这种零件的耗材量的平均值,
由此可估算小铭同学制作的这种零件平均每个零件的横截面积为,
平均一个零件的耗材量为.
(2)
,
这种零件的横截面积和耗材量的样本相关系数为.
(3)设这种零件的总耗材量的估计值为,
又已知这种零件的耗材量和其横截面积近似成正比,
所以,,解得,
故这种零件的总耗材量的估计值为;
【说明】1、利用样本相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,有时需要借助计算器;2、理解相关系数公式对应数据关系,防止计算失误;
第1页
学科网(北京)股份有限公司
$$