内容正文:
第4章 统计
4.1 成对数据的统计相关性
第1课时 散点图与相关系数
(教师独具内容)
课程标准:结合实例,了解样本相关系数的统计含义.
教学重点:1.样本相关系数的概念及其统计意义.2.相关系数的计算.
教学难点:推导样本相关系数的过程.
核心素养:1.通过比较相关系数判断两变量相关性的强弱培养逻辑推理素养和数学运算素养.2.通过学习样本相关系数提升数学抽象素养和数据分析素养.
核心概念掌握
核心素养形成
随堂水平达标
目录
课后课时精练
核心概念掌握
知识点一 散点图
每对数据(Hi,Wi)都可在直角坐标系中用一个点Pi(i=1,2,…,n)表示.这些点称为散点,____________________________叫作散点图.
如果两个变量之间的关系近似地表现为一条直线,则称它们有_____________,简称__________.
如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则它们就是函数关系.
由坐标系及散点形成的数据图
线性相关关系
线性相关
核心概念掌握
5
核心概念掌握
6
核心概念掌握
7
知识点三 相关系数的性质
(1)rxy的取值范围是[-1,1].当0<rxy≤1时,称变量x和变量y_________;当-1≤rxy<0时,称变量x和变量y________.
(2)|rxy|越接近于___,变量x,y的线性相关程度越高,这时数据(x1,y1),(x2,y2),…,(xn,yn)分散在一条直线附近.
(3)|rxy|越接近于___,变量x,y的线性相关程度越低.
(4)rxy具有对称性,即__________.
(5)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.
正相关
负相关
1
0
rxy=ryx
核心概念掌握
8
1.相关系数的绝对值越大,只能说明两个变量之间的关系用一次函数刻画时,效果越好,但这并不能保证两个变量之间存在因果关系.
2.通常,当|r|大于0.8时,我们认为两个变量之间存在着比较强的线性相关关系.
核心概念掌握
9
1.判一判(正确的打“√”,错误的打“×”)
(1)相关系数r反映了两个随机变量之间的线性相关程度.( )
(2)当r=-1时,表示成对样本数据的线性相关程度比较低.( )
(3)当r=0时,表示成对样本数据之间一定没有相关关系.( )
√
×
×
核心概念掌握
10
核心概念掌握
11
(2)甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性做试验,并分别求得相关系数r,如下表:
则哪位同学的试验结果体现两变量有更强的线性相关性?( )
A.甲 B.乙
C.丙 D.丁
相关系数 甲 乙 丙 丁
r -0.82 0.78 0.69 0.87
核心概念掌握
12
0.75
核心概念掌握
13
核心素养形成
题型一 相关系数的计算
许多先进国家对驾驶员的培训,大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用.问题是这种方法有效吗?如下表是12名学员的模拟驾驶成绩x与实际考试成绩y的记录(单位:分):
试问:x与y是否线性相关?如果线性相关,求出y与x之间的线性相关系数,并推断它们的相关程度.
x 98 55 50 87 77 89
y 95 60 45 85 75 87
x 79 98 94 83 74 73
y 75 97 92 80 71 72
核心素养形成
15
解 画出散点图,如图所示:
观察散点图可知样本点都集中在一条直线附近,所以变量x与y线性相关.
由表中数据计算可得
核心素养形成
16
核心素养形成
17
核心素养形成
18
【跟踪训练】
1. 某地10户家庭的年收入和年饮食支出的统计资料如下表所示:
试推断该地家庭的年收入和年饮食支出是否线性相关,计算相关系数,并推断它们的相关程度.
年收入x(万元) 2 4 4 6 6
年饮食支出y(万元) 0.9 1.4 1.6 2.0 2.1
年收入x(万元) 6 7 7 8 10
年饮食支出y(万元) 1.9 1.8 2.1 2.2 2.3
核心素养形成
19
解 画出散点图如图所示:
由散点图可以看出样本点都集中在一条直线附近,由此可以推断该地家庭的年收入和年饮食支出线性相关.
核心素养形成
20
核心素养形成
21
题型二 相关系数的性质
(1)对相关系数r,下列说法正确的是( )
A.r越大,线性相关程度越高
B.r越小,线性相关程度越高
C.|r|越大,线性相关程度越低,|r|越接近0,线性相关程度越高
D.|r|≤1,且|r|越接近于1,线性相关程度越高,|r|越接近于0,线性相关程度越低
解析 两个变量之间的相关系数r的绝对值越接近于1,表示两个变量的线性相关程度越高;r的绝对值越接近于0,表示两个变量的线性相关程度越低,此时两个变量之间几乎不存在线性相关关系.故选D.
核心素养形成
22
解析 由散点图可知,变量x与y正相关,所以0<r1<1,0<r2<1.在剔除点(10,32)之后,可看出x与y的线性相关程度更高,r2更接近1,所以0<r1<r2<1.故选A.
(2)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据计算得到相关系数为r1;方案二:剔除点
(10,32),根据剩下的数据计算得到相关系数为r2,则( )
A.0<r1<r2<1 B.0<r2<r1<1
C.-1<r1<r2<0 D.-1<r2<r1<0
核心素养形成
23
【感悟提升】 判定两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:r>0时,正相关;r<0时,负相关.
核心素养形成
24
【跟踪训练】
2.(1)(天津高考)下列图中,线性相关系数最大的是( )
解析 观察题中4幅图可知,A图散点分布比较集中,且大体分布在某一条直线附近,线性回归模型拟合效果比较好,呈现明显的正相关,|r|值相比于其他3幅图更接近1.故选A.
核心素养形成
25
(2)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量X与Y之间的相关系数,r2表示变量U与V之间的相关系数,则( )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
解析 对于变量X与Y而言,Y随X的增大而增大,故变量X与Y正相关,即r1>0;对于变量U与V而言,V随U的增大而减小,故变量U与V负相关,即r2<0.故r2<0<r1.
核心素养形成
26
题型三 相关系数的应用
一个生物研究性学习小组,为了研究平均气温与一天内某豆类胚芽生长之间的关系,他们分别记录了4月6日至4月11日的平均气温x(℃)与该豆类胚芽一天生长的长度y(mm),得到如下数据:
画出散点图,推断成对数据是否线性相关,并通过相关系数推断平均气温x(℃)与该豆类胚芽一天生长的长度y(mm)的相关程度和变化趋势的异同.
日期 4月6日 4月7日 4月8日 4月9日 4月10日 4月11日
平均气温x(℃) 10 11 13 12 8 6
一天生长的长度y(mm) 22 25 29 26 16 12
核心素养形成
27
核心素养形成
28
【感悟提升】 判断两个变量x与y是否具有线性相关关系,常用的简便方法就是绘制散点图.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就具有线性相关关系.然后通过计算相关系数来推断这两个变量的相关程度及变化趋势的异同.
核心素养形成
29
【跟踪训练】
3. 某知名中学高三年级甲班班主任近期对班上每位同学的成绩作相关分析时,得到某同学的某些成绩数据如下:
画出散点图,由样本数据推断该同学的数学总分与该同学的总分年级排名是否线性相关,并通过相关系数推断该同学的数学总分与该同学的总分年级排名的相关程度和变化趋势的异同.
第一次考试 第二次考试 第三次考试 第四次考试
数学总分x(分) 118 119 121 122
总分年级排名y(名) 133 127 121 119
核心素养形成
30
核心素养形成
31
随堂水平达标
1.变量x,y的散点图如图所示,那么x,y之间的相关系数r最接近的值为( )
A.1 B.-0.5
C.0 D.0.5
解析 根据变量x,y的散点图,得x,y之间的样本相关关系非常不明显,所以相关系数r最接近的值应为0.故选C.
随堂水平达标
1
2
3
4
5
33
2.对四对变量x和y进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:
①n=7,r=0.9533;②n=15,r=0.3012;
③n=17,r=0.0091;④n=13,r=-0.9950.
则变量x与y线性相关程度较高的两组是( )
A.①② B.①④
C.②④ D.③④
解析 相关系数r的绝对值越接近于1,变量x,y的线性相关程度越高.
随堂水平达标
1
2
3
4
5
34
3.(多选)对两组数据进行统计后得到的散点图如图所示,关于其相关系数的结论正确的有( )
A.r1>0 B.r2<0
C.|r1|>|r2| D.|r1|<|r2|
解析 由图可知,第一幅图正相关,第
二幅图负相关,故A,B正确;第一幅图中的点比第二幅图中的点更趋于一条直线附近,故第一幅图的相关程度比第二幅图的相关程度高,故C正确,D错误.故选ABC.
随堂水平达标
1
2
3
4
5
35
4.部门所属的10个工业企业生产性固定资产价值x与工业增加值y资料如下表(单位:百万元):
根据上表资料计算的相关系数为________(结果保留四位小数).
固定资产价值x 3 3 5 6 6
工业增加值y 15 17 25 28 30
固定资产价值x 7 8 9 9 10
工业增加值y 36 37 42 40 45
0.9918
随堂水平达标
1
2
3
4
5
36
固定资产价值x 3 3 5 6 6
工业增加值y 15 17 25 28 30
固定资产价值x 7 8 9 9 10
工业增加值y 36 37 42 40 45
随堂水平达标
1
2
3
4
5
37
5.《交通安全法》实施后,某市交通管理部门以周为单位,记录的每周查处的酒驾人数与该周内出现的交通事故数量如下:
根据表中的样本数据,推断酒驾人数与交通事故数量这两个变量是否线性相关,计算相关系数,并推断它们的相关程度.
酒驾人数x 80 147 121 100 96 103 87
交通事故数量y 19 31 30 23 25 24 20
随堂水平达标
1
2
3
4
5
38
随堂水平达标
1
2
3
4
5
39
课后课时精练
一、选择题
1.给定y与x的一组样本数据,求得相关系数r=-0.990,则( )
A.y与x不具有线性相关关系
B.y与x正相关
C.y与x的线性相关程度很高
D.y与x的线性相关程度很低
解析 ∵相关系数r=-0.990,其绝对值很接近于1,∴y与x的线性相关程度很高.故选C.
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
41
2.某中学的兴趣小组在某座山测得海拔高度、气压、沸点的六组数据,并绘制出如图所示的散点图,下列说法错误的是( )
A.气压与海拔高度呈负相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈正相关
D.沸点与海拔高度的相关程度很高
解析 根据散点图知,气压与海拔高度呈负相关,A正确;沸点与气压呈正相关,B正确;又沸点与海拔高度呈负相关,所以C错误;沸点与气压的相关程度很高,气压与海拔高度的相关程度很高,所以沸点与海拔高度的相关程度很高,D正确.故选C.
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
42
A.每月最低气温与最高气温的线性相关程度较高,且二者为正相关
B.月温差(月最高气温-月最低气温)的最大值出现在10月
C.9~12月的月温差相对于5~8月,波动性更大
D.每月最高气温与最低气温的平均值在前6个月逐月增加
3.(多选)如图是某市2023年4月至2024年3月每月最低气温(℃)与最高气温(℃)的折线统计图,已知每月最低气温与最高气温的相关系数r≈0.83,则下列结论正确的是( )
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
43
解析 每月最低气温与最高气温的相关系数r≈0.83,可知每月最低气温与最高气温的线性相关程度较高,且二者为正相关,A正确;由所给的折线图可以看出月温差(月最高气温-月最低气温)的最大值出现在10月,B正确;9~12月的月温差相对于5~8月,波动性更大,C正确;每月的最高气温与最低气温的平均值在前5个月逐月增加,第6个月开始减少,D错误.故选ABC.
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
44
二、填空题
4.用相关系数公式求得甲、乙、丙3组不同成对数据的相关系数分别为0.81,-0.98,0.63,则____组数据的线性相关程度最高.
解析 因为相关系数r的绝对值越接近于1,表示成对数据的线性相关程度越高,而1>|-0.98|>|0.81|>|0.63|,所以乙组数据的线性相关程度最高.
乙
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
45
5.某单位为了了解用电量y(千瓦时)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下表格:
由表中数据可知,气温与用电量这两个变量____ (填“正”或“负”)相关,相关系数r约为________(结果保留三位小数).
气温x(℃) 18 13 10 -1
用电量y(千瓦时) 24 34 38 64
负
-0.997
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
46
气温x(℃) 18 13 10 -1
用电量y(千瓦时) 24 34 38 64
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
47
6.已知变量xi,yi具有相关关系,其散点图如图所示,则它们分别对应的相关系数ri(i=1,2,3,4)的大小关系是_____________.
解析 由给出的四组数据的散点图可以看出,图1和图3是正相关,相关系数大于0,图2和图4是负相关,相关系数小于0,图1和图2中的点相对更加集中,所以相关程度更高,所以r1更接近于1,r2更接近于-1.由此可得r2<r4<r3<r1.
r2<r4<r3<r1
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
48
三、解答题
7.某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:
根据上表提供的数据,推断高三学生的记忆力和判断力这两个变量是否线性相关,计算相关系数,并推断它们的相关程度.
记忆力x 6 8 10 12
判断力y 2 3 5 6
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
49
解 画出散点图,如图所示:
从散点图可以看出样本点都集中在一条直线附近,由此推断高三学生的记忆力和判断力这两个变量线性相关.
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
50
记忆力x 6 8 10 12
判断力y 2 3 5 6
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
51
8.PM2.5是指空气中直径小于或等于2.5微米的颗粒物,为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5浓度的数据如下表:
画出散点图,推断成对数据是否线性相关,并通过相关系数推断车流量与PM2.5的浓度的相关程度和变化趋势的异同.
时间 周一 周二 周三 周四 周五
车流量x(万辆) 100 102 108 114 116
PM2.5的浓度y(微克/立方米) 78 80 84 88 90
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
52
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
53
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
54
1.某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:
根据此表提供的数据,请推断广告费用与销售额之间的相关关系的类型、相关程度和变化趋势的特征.
广告费用x(万元) 4 2 3 5
销售额y(万元) 49 26 39 54
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
55
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
56
2.某大学生利用寒假参加社会实践,对机械销售公司7月份至11月份销售某种机械配件的销售量及销售单价进行了调查,得到销售单价x元和销售量y件之间的一组数据如下表所示:
画出散点图,推断销售单价与销售量之间的相关关系的类型、相关程度和变化趋势的异同.
月份 7 8 9 10 11
销售单价x(元) 9 9.5 10 10.5 11
销售量y(件) 11 10 8 6 5
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
57
课后课时精练
1
2
3
4
5
6
7
8
A级
B级
1
2
58
R
知识点二 相关系数的概念
一般地,对n个成对观测数据(x1,y1),(x2,y2),…,(xn,yn),我们用eq \o(x,\s\up6(-))=
eq \f(1,n)
eq \o(∑,\s\up10(n),\s\do12(i=1))xi,eq \o(y,\s\up6(-))=eq \f(1,n)
eq \o(∑,\s\up10(n),\s\do12(i=1))yi分别表示数据x1,x2,…,xn与y1,y2,…,yn的均值,用sx=eq \r(\f(1,n)\o(∑,\s\up10(n),\s\do14(i=1)) (xi-\o(x,\s\up6(-)))2),sy=eq \r(\f(1,n)\o(∑,\s\up10(n),\s\do14(i=1)) (yi-\o(y,\s\up6(-)))2)分别表示数据x1,x2,…,xn与y1,y2,…,yn的标准差.
记sxy=eq \f(x1y1+x2y2+…+xnyn,n)-eq \o(x,\s\up6(-))
eq \o(y,\s\up6(-))=eq \f(1,n)
eq \o(∑,\s\up10(n),\s\do14(i=1)) (xi-eq \o(x,\s\up6(-)))(yi-eq \o(y,\s\up6(-))),则当sxsy≠0时,
我们称rxy=eq \f(sxy,sxsy)=eq \f(\f(1,n)\o(∑,\s\up12(n),\s\do12(i=1)) (xi-\o(x,\s\up12(-)))(yi-\o(y,\s\up12(-))),\r(\f(1,n)\o(∑,\s\up12(n),\s\do12(i=1)) (xi-\o(x,\s\up12(-)))2·\f(1,n)\o(∑,\s\up12(n),\s\do12(i=1)) (yi-\o(y,\s\up12(-)))2))
=eq \f(\o(∑,\s\up12(n),\s\do12(i=1)) (xi-\o(x,\s\up12(-)))(yi-\o(y,\s\up12(-))),\r(\o(∑,\s\up12(n),\s\do12(i=1)) (xi-\o(x,\s\up12(-)))2·\o(∑,\s\up12(n),\s\do12(i=1)) (yi-\o(y,\s\up12(-)))2))
=eq \x(\s\up1(01))________________________________
为变量x和变量y的相关系数.
2,i)eq \f(\o(∑,\s\up12(n),\s\do10(i=1))xiyi-n\o(x,\s\up12(-))\o(y,\s\up12(-)),\r(\b\lc\(\rc\)(\a\vs4\al\co1(\o(∑,\s\up12(n),\s\do10(i=1))x-n\o(x,\s\up12(-))2))·\b\lc\(\rc\)(\a\vs4\al\co1(\o(∑,\s\up12(n),\s\do10(i=1))yeq \o\al(2,i)-n\o(y,\s\up12(-))2))))
2.做一做
(1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq \f(1,2)x+1上,则这组样本数据的相关系数为( )
A.-1
B.0
C.eq \f(1,2)
D.1
(3)若已知eq \o(∑,\s\up12(n),\s\do10(i=1)) (yi-eq \o(y,\s\up6(-)))2是eq \o(∑,\s\up12(n),\s\do10(i=1)) (xi-eq \o(x,\s\up6(-)))2的4倍,eq \o(∑,\s\up12(n),\s\do10(i=1)) (xi-eq \o(x,\s\up6(-)))(yi-eq \o(y,\s\up6(-)))是eq \o(∑,\s\up12(n),\s\do10(i=1)) (xi-eq \o(x,\s\up6(-)))2的1.5倍,则相关系数r的值为________.
eq \o(x,\s\up6(-))=79.75,eq \o(y,\s\up6(-))≈77.833,eq \o(∑,\s\up12(12),\s\do10(i=1))xeq \o\al(2,i)=78923,eq \o(∑,\s\up12(12),\s\do10(i=1))yeq \o\al(2,i)=75192,eq \o(∑,\s\up12(12),\s\do10(i=1))xiyi=77002.
由相关系数计算公式可得
r=eq \f(\o(∑,\s\up12(12),\s\do10(i=1)) (xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up12(12),\s\do10(i=1)) (xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up12(12),\s\do10(i=1)) (yi-\o(y,\s\up6(-)))2))=2,i)eq \f(\o(∑,\s\up12(12),\s\do10(i=1))xiyi-12\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up12(12),\s\do10(i=1))x-12\o(x,\s\up6(-))2)\r(\o(∑,\s\up12(12),\s\do10(i=1))yeq \o\al(2,i)-12\o(y,\s\up6(-))2))
≈eq \f(77002-12×79.75×77.833,\r(78923-12×79.752)×\r(75192-12×77.8332))≈eq \f(2515.819,51.012×49.963)≈0.987.
由相关系数r≈0.987,可以推断学员的模拟驾驶成绩与实际考试成绩这两个变量正线性相关,且相关程度很高.
【感悟提升】 在直接利用相关系数公式r=eq \f(\o(∑,\s\up12(n),\s\do12(i=1)) (xi-\o(x,\s\up12(-)))(yi-\o(y,\s\up12(-))),\r(\o(∑,\s\up12(n),\s\do12(i=1)) (xi-\o(x,\s\up12(-)))2)\r(\o(∑,\s\up12(n),\s\do12(i=1)) (yi-\o(y,\s\up12(-)))2))计算相关系数比较困难时,可以利用其变形形式,即r=eq \f(\o(∑,\s\up12(n),\s\do12(i=1)) (xi-\o(x,\s\up12(-)))(yi-\o(y,\s\up12(-))),\r(\o(∑,\s\up12(n),\s\do12(i=1)) (xi-\o(x,\s\up12(-)))2)\r(\o(∑,\s\up12(n),\s\do12(i=1)) (yi-\o(y,\s\up12(-)))2))=2,i)eq \f(\o(∑,\s\up12(n),\s\do12(i=1))xiyi-n\o(x,\s\up12(-))\o(y,\s\up12(-)),\r(\o(∑,\s\up12(n),\s\do12(i=1))x-n\o(x,\s\up12(-))2)\r(\o(∑,\s\up12(n),\s\do12(i=1))yeq \o\al(2,i)-n\o(y,\s\up12(-))2))
,分别计算出eq \o(x,\s\up12(-)),eq \o(y,\s\up12(-)),eq \o(∑,\s\up12(n),\s\do12(i=1))xeq \o\al(2,i),eq \o(∑,\s\up12(n),\s\do12(i=1))yeq \o\al(2,i),eq \o(∑,\s\up12(n),\s\do12(i=1))xiyi,然后代入公式计算即可.
由表中数据计算可得eq \o(x,\s\up6(-))=6,eq \o(y,\s\up6(-))=1.83,eq \o(∑,\s\up12(10),\s\do10(i=1))xeq \o\al(2,i)=406,eq \o(∑,\s\up12(10),\s\do10(i=1))yeq \o\al(2,i)=35.13,eq \o(∑,\s\up12(10),\s\do10(i=1))xiyi=117.7.
所以相关系数
r=eq \f(\o(∑,\s\up12(10),\s\do10(i=1)) (xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up12(10),\s\do10(i=1)) (xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up12(10),\s\do10(i=1)) (yi-\o(y,\s\up6(-)))2))=2,i)eq \f(\o(∑,\s\up12(10),\s\do10(i=1))xiyi-10\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up12(10),\s\do10(i=1))x-10\o(x,\s\up6(-))2)\r(\o(∑,\s\up12(10),\s\do10(i=1))yeq \o\al(2,i)-10\o(y,\s\up6(-))2))
=eq \f(117.7-10×6×1.83,\r(406-10×62)×\r(35.13-10×1.832))≈0.909.
由相关系数r≈0.909,可以推断该地家庭的年收入和年饮食支出这两个变量正线性相关,且相关程度很高.
解 画出成对样本数据的散点图,如图所示:
从散点图看,平均气温x(℃)与该豆类胚芽一
天生长的长度y(mm)的样本数据呈现出线性相关关系.
由表中数据计算可得eq \o(x,\s\up6(-))=10,eq \o(y,\s\up6(-))≈21.667,
eq \o(∑,\s\up12(6),\s\do10(i=1))xeq \o\al(2,i)=634,eq \o(∑,\s\up12(6),\s\do10(i=1))yeq \o\al(2,i)=3026,eq \o(∑,\s\up12(6),\s\do10(i=1))xiyi=1384,所以相关系数r=2,i)eq \f(\o(∑,\s\up12(6),\s\do10(i=1))xiyi-6\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up12(6),\s\do10(i=1))x-6\o(x,\s\up6(-))2)\r(\o(∑,\s\up12(6),\s\do10(i=1))yeq \o\al(2,i)-6\o(y,\s\up6(-))2))
≈0.996.
由此可以推断,平均气温x(℃)与该豆类胚芽一天生长的长度y(mm)正相关,即平均气温x(℃)与该豆类胚芽一天生长的长度y(mm)有相同的变化趋势,且相关程度很高.
解 画出成对数据的散点图,如图所示:
从散点图看,该同学的数学总分与该同学
的总分年级排名的样本数据呈现出线性相关关
系.由表中数据计算可得eq \o(x,\s\up6(-))=120,eq \o(y,\s\up6(-))=125,
eq \o(∑,\s\up12(4),\s\do10(i=1))xeq \o\al(2,i)=57610,eq \o(∑,\s\up12(4),\s\do10(i=1))yeq \o\al(2,i)=62620,eq \o(∑,\s\up12(4),\s\do10(i=1))xiyi=59966,
所以相关系数r=2,i)eq \f(\o(∑,\s\up12(4),\s\do10(i=1))xiyi-4\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up12(4),\s\do10(i=1))x-4\o(x,\s\up6(-))2)\r(\o(∑,\s\up12(4),\s\do10(i=1))yeq \o\al(2,i)-4\o(y,\s\up6(-))2))
≈-0.981.
由此可以推断,该同学的数学总分与该同学的总分年级排名负相关,即该同学的数学总分与该同学的总分年级排名的变化趋势相反,但相关程度很高.
解析 由表中数据计算可得eq \o(x,\s\up12(-))=6.6,eq \o(y,\s\up12(-))=31.5,eq \o(∑,\s\up12(10),\s\do12(i=1))xeq \o\al(2,i)=490,eq \o(∑,\s\up12(10),\s\do12(i=1))yeq \o\al(2,i)=10877,eq \o(∑,\s\up12(10),\s\do12(i=1))xiyi=2305,所以r=2,i)eq \f(\o(∑,\s\up12(10),\s\do12(i=1))xiyi-10\o(x,\s\up12(-))\o(y,\s\up12(-)),\r(\o(∑,\s\up12(10),\s\do12(i=1))x-10\o(x,\s\up12(-))2)\r(\o(∑,\s\up12(10),\s\do12(i=1))yeq \o\al(2,i)-10\o(y,\s\up12(-))2))
≈0.9918.
解 画出散点图,如图所示:
从散点图可以看出样本点都集中在一条直线附近,
由此推断酒驾人数与交通事故数量这两个变量线性相关.
由表中数据计算可得eq \o(x,\s\up6(-))≈104.857,eq \o(y,\s\up6(-))≈24.571,
eq \o(∑,\s\up12(7),\s\do10(i=1))xeq \o\al(2,i)=80044,eq \o(∑,\s\up12(7),\s\do10(i=1))yeq \o\al(2,i)=4352,eq \o(∑,\s\up12(7),\s\do10(i=1))xiyi=18619.
所以相关系数r=2,i)eq \f(\o(∑,\s\up12(7),\s\do10(i=1))xiyi-7\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up12(7),\s\do10(i=1))x-7\o(x,\s\up6(-))2)\r(\o(∑,\s\up12(7),\s\do10(i=1))yeq \o\al(2,i)-7\o(y,\s\up6(-))2))
≈0.938.
由此可以推断酒驾人数与交通事故数量这两个变量正相关,且相关程度很高.
解析 由表中数据可知,随着气温的降低,用电量逐渐升高,故气温与用电量这两个变量负相关.由表中数据计算可得eq \o(x,\s\up12(-))=10,eq \o(y,\s\up12(-))=40,eq \o(∑,\s\up12(4),\s\do12(i=1))xeq \o\al(2,i)=594,
eq \o(∑,\s\up12(4),\s\do12(i=1))yeq \o\al(2,i)=7272,eq \o(∑,\s\up12(4),\s\do12(i=1))xiyi=1190,所以相关系数r=2,i)eq \f(\o(∑,\s\up12(4),\s\do12(i=1))xiyi-4\o(x,\s\up12(-))\o(y,\s\up12(-)),\r(\o(∑,\s\up12(4),\s\do12(i=1))x-4\o(x,\s\up12(-))2)\r(\o(∑,\s\up12(4),\s\do12(i=1))yeq \o\al(2,i)-4\o(y,\s\up12(-))2))
=eq \f(-410,\r(194)×2\r(218))≈-0.997.
由表中数据计算可得eq \o(x,\s\up6(-))=9,eq \o(y,\s\up6(-))=4,eq \o(∑,\s\up12(4),\s\do10(i=1))xeq \o\al(2,i)=344,eq \o(∑,\s\up12(4),\s\do10(i=1))yeq \o\al(2,i)=74,eq \o(∑,\s\up12(4),\s\do10(i=1))xiyi=158.
所以相关系数r=eq \f(\o(∑,\s\up12(4),\s\do10(i=1)) (xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up12(4),\s\do10(i=1)) (xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up12(4),\s\do10(i=1)) (yi-\o(y,\s\up6(-)))2))=2,i)eq \f(\o(∑,\s\up12(4),\s\do10(i=1))xiyi-4\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up12(4),\s\do10(i=1))x-4\o(x,\s\up6(-))2)\r(\o(∑,\s\up12(4),\s\do10(i=1))yeq \o\al(2,i)-4\o(y,\s\up6(-))2))
=eq \f(158-4×9×4,2\r(5)×\r(10))≈0.990.
由相关系数r≈0.990,可以推断高三学生的记忆力和判断力这两个变量正相关,且相关程度很高.
解 画出成对样本数据的散点图,如图所示:
从散点图看,车流量与PM2.5的浓度的样本数据呈现出线性相关关系.
由表中数据计算可得eq \o(x,\s\up6(-))=108,eq \o(y,\s\up6(-))=84,eq \o(∑,\s\up12(5),\s\do10(i=1))xeq \o\al(2,i)=58520,eq \o(∑,\s\up12(5),\s\do10(i=1))yeq \o\al(2,i)=35384,eq \o(∑,\s\up12(5),\s\do10(i=1))xiyi=45504.
所以相关系数r=2,i)eq \f(\o(∑,\s\up12(5),\s\do10(i=1))xiyi-5\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up12(5),\s\do10(i=1))x-5\o(x,\s\up6(-))2)\r(\o(∑,\s\up12(5),\s\do10(i=1))yeq \o\al(2,i)-5\o(y,\s\up6(-))2))
≈0.998.
由此可以推断,车流量与PM2.5的浓度正相关,即车流量与PM2.5的浓度有相同的变化趋势,且相关程度很高.
解 根据表中数据画出散点图,如图所示,
从散点图可以看出广告费用与销售额之间呈
现出线性相关关系,且是正相关.
由表中数据计算得eq \o(x,\s\up6(-))=3.5,eq \o(y,\s\up6(-))=42,eq \o(∑,\s\up12(4),\s\do10(i=1))xeq \o\al(2,i)=54,
eq \o(∑,\s\up12(4),\s\do10(i=1))yeq \o\al(2,i)=7514,eq \o(∑,\s\up12(4),\s\do10(i=1))xiyi=635,
所以相关系数r=2,i)eq \f(\o(∑,\s\up12(4),\s\do10(i=1))xiyi-4\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up12(4),\s\do10(i=1))x-4\o(x,\s\up6(-))2)\r(\o(∑,\s\up12(4),\s\do10(i=1))yeq \o\al(2,i)-4\o(y,\s\up6(-))2))
≈0.982.
由此可以推断,广告费用与销售额有相同的变化趋势,且相关程度很高.
解 画出成对样本数据的散点图,如图所示,
从散点图可以看出销售单价与销售量之间呈现
出线性相关关系,且是负相关.
由表中数据计算得eq \o(x,\s\up6(-))=10,eq \o(y,\s\up6(-))=8,eq \o(∑,\s\up12(5),\s\do10(i=1))xeq \o\al(2,i)=502.5,
eq \o(∑,\s\up12(5),\s\do10(i=1))yeq \o\al(2,i)=346,eq \o(∑,\s\up12(5),\s\do10(i=1))xiyi=392,
所以相关系数r=2,i)eq \f(\o(∑,\s\up12(5),\s\do10(i=1))xiyi-5\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up12(5),\s\do10(i=1))x-5\o(x,\s\up6(-))2)\r(\o(∑,\s\up12(5),\s\do10(i=1))yeq \o\al(2,i)-5\o(y,\s\up6(-))2))
≈-0.992.
由此可以推断销售单价与销售量变化趋势相反,但相关程度很高.
$