内容正文:
2022-2023学年高一数学同步精品课堂(沪教版2020选修第二册)
第8章成对数据的统计分析
8.1 相关系数(第2课时)
1
学习目标
1.结合实例,会通过相关系数比较多组成对数据的相关性.
2.了解样本相关系数与标准化数据向量夹角的关系.
宋老师数学精品工作室
2 相关系数
从本节例1可以看出,一些成对数据具有明显的相关性,且在绘制出散点图后可以用一条直线进行拟合,也就是说具有线性相关性.在这种情况下,我们如何进一步描述成对数据的线性相关程度呢?
设由变量x和y获得的两组数据分别为xi和yi (i=1,2,…,n),其对应关系如表8-2所示.
两组数据 xi和yi 的线性相关系数( linearcorrelationcoefficient )是度量两个变量x与y之间线性相关程度的统计量,其计算公式为
其中, ,它们分别是这两组数据的算术平均数
线性相关系数常常简称为相关系数(correlationcoefficient),也称为皮尔逊相关系数(Pearson’scorrelationcoefficient).相关系数计算公式的推导过程比较复杂,这里不予涉及.一般情况下, 只需要把两组数据输入计算机或计算器,有很多软件可以帮助我们进行这一计算.
可以证明,相关系数r的值满足|r|≤1.|r|越接近1,两个变量的线性相关程度越高;|r|越接近0,两个变量的线性相关程度越低.r>0时,当x的值由小变大,y 的值具有由小变大的变化趋势,称这种相关为正相关;r<0时,当x 的值由小变大,y的值具有由大变小的变化趋势,称这种相关为负相关.
相关系数r描述的是两个变量之间线性关系的方向与程度,是一种定量分析的方法.相关系数具有以下特点:
( 1)相关系数的计算公式关于x和y这两个变量是对称的. 画散点图时,不论以哪个变量作为横轴(纵轴),所得的相关系数都一样.
(2)两个变量的相关系数与这两个变量的单位无关.例如,在计算身高与体重的相关系数时,身高单位不管取“米”还是“厘米”,相关系数的结果都一样.
(3)与平均数和标准差一样,相关系数不仅会受到数据量多少的影响,也会受到少数异常值较大的影响
5
例2 为了解某市高中男生身高与体重的关系,随机抽取5所高中学校,并获得这些学校全部男生的身高(单位:cm)与体重(单位:kg)的数据.为了减少篇幅,从中随机选取10名高中男生的身高与体重的数据,如表8-3所示.试根据表中数据绘制散点图,计算相关系数并判断学生身高与体重的相关程度.
解 将表8-3中的数据输入计算机电子表格办公软件的工作簿,
先选中身高与体重两行(或两列)数据,再选择插入统计图中的散点
图,选择图形样式,就完成了散点图的绘制,如图8-1-2所示.
从图8-1-2中可以看出,总体上来说,样本学生的身高和体重之间具有明显的相关性,个子高的学生往往更重一些.
为了计算相关系数,我们把表中的两组数据代入本节公式①,通过计算机或计算器算得 r ≈0.873这说明样本学生的身高与体重之间具有很高的相关性.
课本练习
宋老师数学精品工作室
练习8.1(2)
1.用经过匿名处理的本班同学最近一次期中或期末测验的各科成绩表,
考察不同科目测验成绩之间的相关性.
2.为了研究豆类脂肪含量与其产生的热量的关系,选取了5种豆类进行
实验测定.下面是0.1kg豆类中脂肪含量(单位:kg)与相应热量(单位:kJ)的对照表.
(1)根据表中的数据绘制散点图;
(2)观察散点图的趋势,如果能看成线性关系,请在图中画出一条直线来近似地表示这种关系,并计算豆类脂肪含量与热量的相关系数.
随堂检测
宋老师数学精品工作室
1.两个变量之间的相关程度越低,则其线性相关系数的数值( )
A.越小 B.越接近1
C.越接近0 D.越接近-1
解析 由相关系数的性质知选C.
答案 C
2.给定y与x的一组样本数据,求得相关系数r=-0.690,则( )
A.y与x线性不相关 B.y与x正线性相关
C.y与x负线性相关 D.以上都不对
解析 因为r=-0.690<0,所以y与x负线性相关.
答案 C
3.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x 6 8 10 12
y 2 3 5 6
已知记忆力x和判断力y是线性相关的,求相关系数r.
解 列表如下
i xi yi xiyi
1 6 2 36 4 12