内容正文:
8.1.2 样本相关系数
一、学习目标:
1. 结合实例,会通过相关系数比较多组成对数据的相关性.
2.了解样本相关系数与标准化数据向量夹角的关系.
3.通过学习样本相关系数,提升数学抽象及数据分析素养.
二、教学重难点:
1. 重点:相关关系,散点图,样本相关系数
2. 难点:根据相关系数判断两个变量的相关程度
三、学习过程
导 散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢?为了搞清这些问题,我们需要学习本节内容.
思 请阅读课本96-----100页,思考以下问题并掌握有关基础知识.
问题1: 你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
问题2: Lxy的大小一定能度量出成对样本数据的相关程度吗?
问题3:成对样本数据构造了样本相关系数r,样本相关系数能否研究变量之间线性相关程度?
1.相关系数r的计算 相关系数是研究变量之间线性相关程度的量
假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量x和变量y的样本相关系数r的计算公式如下:=.
2.相关系数r的性质
(1)当r>0时,称成对样本数据 相关;当r<0时,成对样本数据 相关;当r=0时,成对样本数据间没有线性相关关系.
(2)样本相关系数r的取值范围为 .
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.样本相关系数与标准化数据向量夹角的关系
r=x′·y′=|x′||y′|cos θ=cos θ(其中x′=(x1′,x2′,…,xn′),y′=(y1′,y2′,…,yn′),|x′|=|y′|=,θ为向量x′和向量y′的夹角).
4. 成对样本数据的散点图和相应的样本相关系数
图(1)中的散点有明显的从左下角到右上角沿直线分布的趋势,说明成对样本数据呈现出线性相关关系;样本相关系数r=0.97,表明成对样本数据的正线性相关程度很强.图(2)中的散点有明显的从左上角到右下角沿直线分布的趋势,说明成对样本数据也呈现出线性相关关系;样本相关系数r=-0.85,表明成对样本数据的负线性相关程度比较强.从样本相关系数来看,图(1)中成对样本数据的线性相关程度要比图(2)中强一些;图(3)和图(4)中的成对数据的线性相关程度很弱,其中图(4)中成对样本的线性相关程度极弱.
例1(多选) 下面的各图中,散点图与相关系数r符合的是 ( )
思考:当r=1或-1时,两个变量的相关性如何?当时,两个变量的相关性如何?
例2 若对甲、乙、丙3组不同的成对数据作线性相关性检验,得到这3组成对数据的样本相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的组是________.(填“甲”“乙”或“丙”)
例3已知变量x和变量y的3对随机观测数据,,,计算两个变量的样本相关系数.能据此推出这两个变量线性相关吗?为什么?
例4.假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
已知,,,.
(1)求,;
(2)对x,y进行线性相关性检验.
议、评
1. 判断变量的相关性通常有两种方式:
(1)散点图; (2)相关系数r,请写出计算r的公式
前者只能粗略地说明变量间具有相关性,而后者可以从定量的角度分析变量相关性的强弱变量的相关关系;
2. 例1、例2、例3、例4
检
随机抽取7家超市,得到其广告支出与销售额数据如下:
超市
A
B
C
D
E
F
G
广告支出/万元
1
2
4
6
10
14
20
销售额/万元
19
32
44
40
52
53
54
请判断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.
已知
第 1 页 共 2 页
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$