内容正文:
成对数据的统计分析
8.1.2 样本相关系数
第八章
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
解
返回导航
数学 选择性必修 第三册 A
解
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
A
返回导航
数学 选择性必修 第三册 A
解 析
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
解
返回导航
数学 选择性必修 第三册 A
解
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
D
返回导航
数学 选择性必修 第三册 A
解 析
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
解
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
解
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
解
返回导航
数学 选择性必修 第三册 A
解
返回导航
数学 选择性必修 第三册 A
返回导航
数学 选择性必修 第三册 A
B
返回导航
数学 选择性必修 第三册 A
C
返回导航
数学 选择性必修 第三册 A
解 析
返回导航
数学 选择性必修 第三册 A
谢谢观看
返回导航
数学 选择性必修 第三册 A
学习目标
1.结合实例,了解样本相关系数的统计含义.
2.结合实例,会通过样本相关系数判断多组成对数据的相关性.
3.掌握样本相关系数的综合运用.
知识点一 样本相关系数
通过上一节的学习,小明提出了自己的一些疑问:
1.由上图可判断出图①是负相关,图②是正相关,那么能否判断出图②的相关性比图①强?
2.怎样定量刻画两个变量的相关性?
样本相关系数
对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1, y1),(x2, y2),…,(xn, yn),其中x1,x2,…,xn和y1,y2,…,yn的均值分别为x和y,则
[例1] (2024·汉中高二期末)某大学生去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:mm2)和耗材量(单位:mm3),得到如下数据:
并计算得iyi=0.214 3,(-10x2)·(-10y2)=1.491 36×10-4.
(1)估算该同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求该同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01).
(1)样本中10个这种零件的横截面积的平均值x==0.052,
样本中10个这种零件的耗材量的平均值y==0.39,
由此可估算该同学制作的这种零件平均每个零件的横截面积为0.052 mm2,
平均一个零件的耗材量为0.39 mm3.
利用样本相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,有时需要借助计算器.
[练1] (2024·天津卷)下列图中,线性相关系数最大的是( )
选项A中的散点有明显的从左下角到右上角沿直线分布的趋势,且散点集中在一条直线的附近,故选项A中的线性相关系数最大,故选A.
知识点二 相关系数与标准化数据向量夹角的关系
问题:将数据“标准化”处理后的成对数据(x′1, y′1),(x′2, y′2),…,(x′n, y′n)的第一分量构成n维向量x′=(x′1,x′2,…,x′n),第二分量构成n维向量y′=(y′1,y′2,…,y′n),设θ为向量x′和向量y′的夹角,则r与θ有什么关系?r的取值范围是什么?
1
越强
0
越弱
1.r=x′·y′=|x′||y′|cos θ=cos θ,其中:|x′|=|y′|=,θ为x′与y′的夹角.
2.样本相关系数r的取值范围为____________.
3.当|r|越接近__时,成对样本数据的线性相关程度____;当|r|越接近__时,成对样本数据的线性相关程度____.
[-1,1]
当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系.
当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
[例2] 下图是我国2018年至2024年生活垃圾无害化处理量(单位:亿吨)的折线图.(注:年份代码1~7分别对应年份2018~2024)
请求出相关系数r,并用相关系数的大小说明y与t相关性的强弱.
参考数据和公式:i=10.97,iyi=47.36,=0.664,≈2.646,样本相关系数r=
.
由折线图中数据和参考数据得t==4,
线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.
[练2] 甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性作试验,并分别求得相关系数r,如下表:
相关系数
甲
乙
丙
丁
r
-0.82
0.78
0.69
0.87
则试验结果更能体现两变量有很强的线性相关性的是同学( )
A.甲 B.乙 C.丙 D.丁
根据线性相关系数的意义可知,在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四位同学中,丁同学求得的相关系数的绝对值最接近1,表明试验结果更能体现两变量有很强的线性相关性的是同学丁. 故选D.
[练3] 某学生的记英语单词的时间t(单位:h)与检测效果y的数据如表所示.
t
1
2
3
4
5
6
7
y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
据统计表明,y与t之间具有线性相关关系,请用相关系数r加以说明(若|r|≥0.75,则认为y与t有很强的线性相关关系,否则认为没有很强的线性相关关系).
由题得==4,
综合应用 样本相关系数的实际应用
[例3] 某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由题意,知
(1)解决此类问题的难点是对数据的处理和计算,要特别注意避免运算失误.
(2)根据已知数据求得相关系数后,利用相关系数绝对值的大小,可以判断两个变量相关性的强弱.
[练4] 有人收集了某城市居民年收入x(所有居民在一年内收入的总和)与A商品销售额y的10年数据,如表所示.
第n年
1
2
3
4
5
居民年收入x(亿元)
32.2
31.1
32.9
35.8
37.1
A商品销售额y(万元)
25.0
30.0
34.0
37.0
39.0
第n年
6
7
8
9
10
居民年收入x(亿元)
38
39
43
44.6
46
A商品销售额y(万元)
41.0
42.0
44.0
48.0
51.0
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
画出散点图如下.从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.
1.知识清单
(1)样本相关系数.
(2)相关关系的强弱.
(3)样本相关系数的实际应用.
2.方法归纳:数形结合.
3.常见误区:样本相关系数绝对值的大小与相关程度的关系.
◎随堂演练
1.对于线性相关系数r,以下正确的是( )
A.r只能是正值,不能为负值
B.|r|≤1,且|r|越接近于1,相关程度越强;相反则越弱
C.|r|≤1,且|r|越接近于1,相关程度越弱;相反则越强
D.r<0时表示两个变量无相关
2.(2024·南阳高二月考)在一组样本数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,x3,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的相关系数为( )
A.- B. C.1 D.-1
所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,所以这组样本数据的相关系数为1.
$$