内容正文:
人教A版 选择性必修 第三册
8.1.2样本相关系数
第八章 成对数据的统计分析
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
1. 相关关系
把成对样本数据用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
2. 散点图
3. 正相关与负相关
一个变量随另一个变量的增加呈现减小的趋势.
正相关:
一个变量随另一个变量的增加呈现增加的趋势.
负相关:
知识回顾
4. 线性相关
如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
1.了解样本相关系数的含义;
2.会用样本相关系数判断两个变量相关性的强弱.
学习目标
自学指导
阅读课本97--100页,完成以下问题:
问题1 样本相关系数。
问题2 样本相关系数的大小与样本数据相关程度的内在联系。
通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等. 散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.
对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1, y1), (x2, y2),‧‧‧, (xn, yn),其中x1, x2, ‧‧‧, xn和y1, y2,‧‧‧, yn的均值分别为 和 . 将数据以 为零点进行平移,得到平移后的成对数据为
并绘制散点图.
如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如图 (1)所示;
如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如图(2)所示.
思考1 利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征.
一般情形下,Lxy>0表明成对样本数据正相关;Lxy <0表明成对样本数据负相关.
思考2 Lxy的大小是否一定能度量出成对样本数据的相关程度吗?
因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小.
我们称r为变量x和变量y的样本相关系数.
样本相关系数r是一个描述成对样本数据的数字特征,它反映了两个随机变量之间的线性相关程度.
r的符号反映了相关关系的正负性.
|r|的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.
教师点拨
样本相关系数
样本相关系数:
相关系数的性质:
① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
② |r|≤1;
③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.
注意:若0.75≤|r|≤1,则认为y与x的线性相关程度很强;
若0.3≤|r|<0.75,则认为y与x的线性相关程度一般;
若|r|≤0.25,则认为y与x的线性相关程度较弱.
图(1) 中成对样本数据的正线性相关程度很强.
图(2) 中成对样本数据的负线性相关程度比较强.
图(3)中 对样本数据的线性相关程度很弱.
图(4)中成对样本数据的线性相关程度极弱.
练习 已知求得甲、乙、丙3组不同的数据的样本相关系数分别为0.81,-0.98,0.63,其中________(填甲、乙或丙)组数据的线性相关程度最强.
乙
小组互助
例1在研究两个变量y与x的相关关系时,分别选择了四组不同的样本数据,由这四组不同的样本数据得到的样本相关系数r分别为0.25,0.50,0.98,0.80,则其中相关程度最大的样本相关系数是( )
A.0.25 B.0.50 C.0.98 D.0.80
C
小组互助
变式1对两个变量x,y进行线性相关检验,得样本相关系数r1=0.785 9,对两个变量u,v进行线性相关检验,得样本相关系数r2=-0.956 8,则下列判断正确的是( )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
C
小组互助
例2 足球是深受全世界人们喜爱的运动,我国大力发展校园足球.为了解本地区足球特色学校的发展状况,社会调查小组得到如下统计数据:
年份x 2016 2017 2018 2019 2020
足球特色学校y(百个) 0.30 0.60 1.00 1.40 1.70
根据上表数据, 计算y与x的样本相关系数r, 并说明y与x的线性相关程度.
小组互助
∴y与x的线性相关程度很强.
变式2 在一次试验中,测得(x, y)的4组值分别为(1, 2), (2, 0), (4, -4), (-1,6), 则y与x的样本相关系数为( )
A.1 B.-2 C.0 D.-1
√
解:
由样本数据可得
小组互助
2. 已知变量x和变量y的3对随机观测数据(2, 2), (3, -1), (5, -7),计算成对样本数据的样本相关系数. 能据此推断这两个变量线性相关吗? 为什么?
虽然样本相关系数为-1,三个样本点在一条直线上,但是由于样本量太小,据此推断两个变量完全线性相关并不可靠.
3. 画出下列成对数据的散点图,并计算样本相关系数. 据此,请你谈谈样本相关系数在刻画成对样本数据相关关系上的特点.
(1) (-2, -3), (-1, -1), (0, 1), (1, 3), (2, 5), (3, 7);
(2) (0, 0), (1, 1), (2, 4), (3, 9), (4, 16);
(3) (-2, -8), (-1, -1), (0, 0), (1, 1), (2, 8), (3, 27);
(4) (2, 0) (1, ), (0, 2), (-1, ), (-2, 0).
2
4
8
x
-4
-3
2
0
-2
1
3
-1
6
y
-2
•
•
•
•
•
•
5
15
x
2
0
4
1
3
10
y
•
•
•
•
•
2
0.5
1.5
x
-3
2
0
-2
1
3
-1
1
y
•
•
•
•
•
•
5
10
20
x
-10
-3
2
0
-2
1
3
-1
15
y
-5
•
•
•
•
•
•
25
样本相关系数主要刻画的是成对样本数据线性相关的程度.
4. 随机抽取7家超市,得到其广告支出与销售额数据如下:
正线性相关,相关性较强,销售额与广告支出的变化趋势相同.
超市 A B C D E F G
广告支出/万元 1 2 4 6 10 14 20
销售额/万元 19 32 44 40 52 53 54
请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.
1. 样本相关系数:
2.相关系数的性质:
① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
② |r|≤1;
③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.
课后反思
$