内容正文:
第八章 成对数据的统计分析
8.1 成对数据的统计相关性
8.1.1 变量的相关关系
8.1.2 样本相关系数
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
目
录
课前案·自主落实
01
02
CONTENTS
03
课堂案·互动探究
课后案·学业评价
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
课前案·自主落实
01
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
导学1 相关关系
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
精确地
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
导学2 散点图
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
对应点
散点
增加的趋势
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
减少的趋势
正相关或负相关
一条直线
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
导学3 样本的相关系数
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
正
负
[-1,1]
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
课堂案·互动探究
02
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
点击进入Word
课后案·学业评价
03
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
谢谢观看
返回目录
第八章 成对数据的统计分析
数学•选择性必修 第三册(配RJA版)
1
学业标准
素养目标
1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.(重点)
2.结合实例,会通过相关系数比较多组成对数据的相关性.(难点)
1.通过对相关关系等概念的学习,培养数学抽象等核心素养.
2.根据样本相关系数对两个成对数据的相关程度进行估计,提升数学运算、数据分析等核心素养.
(1)吸烟一定可以导致肺癌吗?吸烟与患肺癌有关吗?
[提示] 吸烟不一定患肺癌,但它们有一定的关系.
(2)下表是某小卖部6天卖出热茶的杯数与当天气温的对比表.
气温/℃
25
18
12
10
4
0
杯数
18
30
37
35
50
54
小卖部中卖出的热茶杯数与当天气温有关吗?两者之间是如何变化的?
[提示] 两者间有关系.随着气温的降低卖出的热茶杯数增加.
(3)y=x2+5(x∈R)中,x,y之间是什么关系?
[提示] y与x间是函数关系,是一种确定关系.
◎结论形成
相关关系:两个变量有关系,但又没有确切到可由其中一个去________决定另一个的程度,这种关系称为相关关系.
对一作直线运动的质点的运动过程观测了8次得到时间x(单位:s)与质点的运动距离的观测值y(单位:cm)如下表:
x
1
2
3
4
5
6
7
8
y
5.54
7.52
10.02
11.73
15.69
16.12
16.98
21.06
(1)以x为横坐标,y为纵坐标在平面直角坐标系中作出表示以上数据的点.
[提示]
(2)怎样描述时间与质点的运动距离之间的关系?
[提示] 从图上看时间越长,距离越大,但不是正比例函数关系.
(3)时间与质点的运动距离之间有关系吗?
[提示] 有关系.
◎结论形成
1.散点图
将成对样本数据在平面直角坐标系中的________画出来,得到表示两个变量的一组数据的统计图,这样的统计图叫做_____图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.
2.正相关和负相关
(1)正相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现_____________,我们就称这两个变量正相关.
(2)负相关:从整体上看,当一个变量的值增加时,另一个变量的相应值呈现_____________,则称这两个变量负相关.
3.线性相关和非线性相关
(1)线性相关:如果两个变量的取值呈现__________________,而且散点落在__________附近,我们就称这两个变量线性相关.
(2)非线性相关:如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
下表是某班部分同学的数学,物理和化学成绩
学号
1
2
3
4
5
6
7
8
9
10
数学
70
76
80
82
89
90
91
94
97
98
物理
81
78
83
87
90
92
89
94
90
96
化学
85
82
86
90
78
90
91
99
92
95
(1)由表中的数据可以看出,数学成绩与物理成绩是否相关?数学成绩与化学成绩是否相关?
[提示] 数学成绩与物理成绩相关;数学成绩与化学成绩相关.
(2)上述两个相关关系中,从直观上看哪一个相关性更强?如何定量的描述两个变量的相关性强弱呢?
[提示] 从直观上看数学成绩与物理成绩的相关性更强一些,可以用相关系数定量的描述两个变量的相关性强弱.
◎结论形成
1.样本相关系数的计算公式
称为变量x和变量y的样本相关系数.
2.样本相关系数r是一个描述成对样本数据的数字特征,它的正负可以反映成对数据的变化特征:
(1)当r>0时,称成对数据___相关;
(2)当r<0时,称成对数据___相关.
3.样本相关系数r的取值范围为_______________,样本相关系数r的绝对值大小可以反映成对数据之间线性相关的程度:
(1)当|r|越接近1时,成对数据的线性相关程度越强;
(2)当|r|越接近0时,成对数据的线性相关程度越弱.
1.判断正误(正确的打“√”,错误的打“×”)
(1)若两个变量正相关,则样本相关系数大于0.( )
(2)散点图可以直观地分析出两个变量是否具有相关性.( )
(3)样本的容量对用样本相关系数估计两个变量的相关系数的效果没有影响.( )
(4)相关系数越大,两个变量的相关性就越强.( )
答案 (1)√ (2)√ (3)× (4)×
2.下面哪些变量是相关关系( )
A.出租车费与行驶的里程
B.房屋面积与房屋价格
C.身高与体重
D.铁块的体积与质量
解析 A,B,D中的两个变量都是函数关系.
答案 C
3.(多选题)关于回归分析,下列说法正确的是( )
A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
B.线性相关系数可以是正的也可以是负的
C.在回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关
D.样本相关系数r∈(-1,1)
解析 选项D中,样本的相关系数应满足-1≤r≤1,故D错误,其余都正确.
答案 ABC
4.如图所示的两个变量不具有相关关系的是_______(填序号).
解析 ①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.
答案 ①④
题型一 相关关系的直接判断
(多选题)下列变量之间的关系是相关关系的是( )
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩田施肥量和粮食亩产量
[解析] 在A中,由于取b为自变量,因变量是判别式Δ=b2-4ac,判别式与b是函数关系,两者不是相关关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.故选BCD.
[答案] BCD
两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.
[触类旁通]
1.(多选题)某中学的兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法正确的是( )
INCLUDEPICTURE "教师WORD/8-4A.TIF" \* MERGEFORMAT"
A.沸点与海拔高度呈正相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关
D.沸点与海拔高度、沸点与气压的相关性都很强
解析 由左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸点与海拔高度呈负相关,由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.
答案 BCD
题型二 样本相关系数及其应用
维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:
甲醛浓度(g/L)
18
20
22
24
26
28
30
缩醛化度(克分子%)
26.86
28.35
28.75
28.87
29.75
30.00
30.36
(1)画散点图,并判断成对样本数据是否线性相关;
(2)求相关系数r(精确到0.01),并通过样本相关系数判断甲醛浓度与缩醛化度的相关程度和变化趋势的异同.
[解析] (1)散点图如图.
由散点图可以看出,成对数据呈现出相关关系.
(2)因为eq \x\to(x)=eq \f(168,7)=24,eq \x\to(y)=eq \f(202.94,7),
eq \i\su(i=1,7,x)iyi=4 900.16,eq \i\su(i=1,7,x)eq \o\al(2,i)=4 144,
eq \i\su(i=1,7,y)eq \o\al(2,i)≈5 892,
所以r=eq \f(\i\su(i=1,7,x)iyi-7\x\to(x) \x\to(y),\r(\b\lc\(\rc\)(\a\vs4\al\co1(\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2))\b\lc\(\rc\)(\a\vs4\al\co1(\i\su(i=1,7,y)\o\al(2,i)-7\x\to(y)2))))
=eq \f(4 900.16-7×24×\f(202.94,7),\r(4 144-7×242×\b\lc\[\rc\](\a\vs4\al\co1(5 892-7×\b\lc\(\rc\)(\a\vs4\al\co1(\f(202.94,7)))2))))
≈0.96.
由此推断,甲醛浓度与缩醛化度正线性相关,即甲醛浓度与缩醛化度有相同的变化趋势,且相关程度很强.
[素养聚焦] 解题的过程中体会数学建模核心素养的提升,加强数据分析和数学运算核心素养的培养.
(1)解决此类问题的难点是对数据的处理和计算,要特别注意避免运算失误.
(2)根据已知数据求得回归直线方程后,利用相关系数绝对值的大小,可以判断两个变量相关性的强弱.
[触类旁通]
2.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得eq \i\su(i=1,20,x)i=60,eq \i\su(i=1,20,y)i=1 200,eq \i\su(i=1,20, )(xi-eq \o(x,\s\up16(-)))2=80,eq \i\su(i=1,20, )(yi-eq \o(y,\s\up16(-)))2=9 000,eq \i\su(i=1,20, )(xi-eq \o(x,\s\up16(-)))(yi-eq \o(y,\s\up16(-)))=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=eq \f(\i\su(i=1,n, )xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n, )xi-\x\to(x)2\i\su(i=1,n, )yi-\x\to(y)2)),eq \r(2)≈1.414.
解析 (1)由已知得样本平均数y=eq \f(1,20)
eq \o(∑,\s\up16(20),\s\do4(i=1))yi=60,从而该地区这种野生动物数量的估计值为60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
r=eq \f(\o(∑,\s\up16(20),\s\do4(i=1)) xi-\x\to(x)yi-\x\to(y),\r(\o(∑,\s\up16(20),\s\do4(i=1)) xi-\x\to(x)2\o(∑,\s\up16(20),\s\do4(i=1)) yi-\x\to(y)2))=eq \f(800,\r(80×9 000))=eq \f(2 \r(2),3)≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
知识落实
技法强化
1.相关关系.
2.散点图.
3.正相关、负相关、线性相关、非线性相关.
4.样本相关系数.
解题过程中常出现相关关系与函数关系不分,样本相关系数绝对值的大小与相关程度的关系.
$$