内容正文:
8.1.2 样本相关系数
8.1成对数据的统计相关性
通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等,散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.
样本相关系数
引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析。
r = ————————————
= ————————————
-----我们称 r 为变量x和变量y的样本相关系数.|r|刻画了样本点集中于某条直线的程度。
样本相关系数r
样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:
r的正负:
当r >0时,称成对样本数据正相关;当r <0时,称成对样本数据负相关.
r的绝对值的大小:(r的取值范围为[-1,1])
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
提示:利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若|r|>0.75,则线性相关较为显著,否则不显著.一般来说,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好。
练习:某统计部门对四组数据进行统计分析后,获得如图8-1-2所示的散点图,关于样本相关系数的比较,其中正确的是( )
A.r2<r4<0<r3<r1 B.r4<r2<0<r1< r3
C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
A
4
练习:对两个变量,进行线性相关检验,得样本相关系数,对两个变量,进行线性相关检验,得样本相关系数,则下列判断正确的是( )
A.变量与正相关,变量与负相关,变量与的线性相关程度较强
B.变量与负相关,变量与正相关,变量与的线性相关程度较强
C.变量与正相关,变量与负相关,变量与的线性相关程度较强
D.变量与负相关,变量与正相关,变量与的线性相关程度较强
C
导学案P119、例3变式
样本的相关系数的实际应用
例题1 在对人体脂肪含量和年龄的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如下表,表中每个编号下的年龄和脂肪含量数据都是对同一个个体的观测结果,它们构成了成对数据.
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
年龄/岁 23 27 39 41 45 49 50 53 54 56 57 58 60 61
脂肪含量/% 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6
参考数据:
由样本相关系数r≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.脂肪含量与年龄变化趋势相同.
解:将参考数据代入相关系数公式计算
第n年 1 2 3 4 5 6 7 8 9 10
居民年收入/亿元 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品销售额/万元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
计算样本相关系数,并推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
例题2 有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.
参考数据:
由样本数据计算得样本相关系数r≈0.95,由此推断,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强。
解:将参考数据代入相关系数公式计算
例题3 在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如图所示.
编号 身高/cm 体重/kg 臂展/cm 身高/cm 体重/kg 臂展/cm 身高/cm 体重/kg 臂展/cm
1 173 55 169 177 54 176 184 86 189
2 179 71 170 177 59 170 169 58 164
3 175 52 172 178 67 174 182 54 170
4 179 62 177 174 56 170 171 58 164
5 182 82 174 166 66 161 177 61 173
6 173 63 166 176 61 166 173 58 165
7 180 55 174 176 49 165 173 51 169
8 170 81 169 175 60 173
9 169 54 166 169 48 162
体