内容正文:
8.1成对数据的统计相关性
8.1.1变量的相关关系
第八章
成对数据的统计分析
人教A版选择性必修第三册·高二
章节导读
成对数据的统计相关性
变量的相关关系
样本相关系数
一元线性回归模型及其应用
列联表与独立性检验
一元线性回归模型
一元线性回归模型参数的最小二乘估计
分类变量与列联表
独立性检验
学 习 目 标
1
2
3
结合实例,了解变量的相关关系,能正确区分变
量的函数关系与相关关系,提升数学抽象的核心素养
变量相关关系的分类,了解正相关、负相关关系
能根据散点图判断变量的相关性以及正相关或负相关,提升直观想象的核心素养.
新知导入
在必修课程中,我们学习了单个变量的观察数据的直观表示和统计特征的刻画等知识与方法.例如,用直方图描述样本数据的分布规律,用均值刻画样本数据的集中趋势,用方差刻画样本数据的离散程度等.这些方法主要适用于通过样本认识单个变量的统计规律.
在现实中,我们还经常需要了解两个或两个以上变量之间的关系.例如:
为掌握学生身体健康状况,需要了解身高变量和体重变量之间的关系;
医疗卫生部门要制定预防青少年近视的措施,需要了解有哪些因素会影响视力;
商家要根据顾客的意见改进服务水平,希望了解哪些因素影响服务水平等等.
为此,我们需要进一步学习通过样本推断变量之间关系的知识和方法.
新知导入
对于人的身高与体重来说,一般而言,个子高的人往往体重值较大,个子矮的人往往体重值较小.但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素.
像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
相关关系
新知探究
两个变量具有相关关系的事例在现实中大量存在. 例如:
(1)子女身高y与父亲身高x之间的关系;
(2)商品销售收入y与广告支出x之间的关系;
(3)空气污染指数y与汽车保有量x之间的关系;
(4)粮食亩产量y与施肥量x之间的关系.
商品销售收人还与商品质量、居民收入等因素有关.
影响子女身高的因素还与母亲身高、饮食结构、体育锻炼等有关
气象条件、工业生产排放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素.
粮食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影响.
新知探究
问题1 函数关系与相关关系有什么相同点和区别?
关 系
项 目 函数关系 相关关系
相同点
都是两个变量间的关系
不同点
是一种确定关系
是一种非确定关系
是一种因果关系
不一定是因果关系,也可能是伴随关系
新知探究
在相关关系中,变量y的值不能随变量x的值的确定而唯一确定,所以我们无法直接用函数去描述变量之间的这种关系.
对上述各例中两个变量之间的相关关系,我们往往会根据自己以往积累的经验作出推断.“经验之中有规律”,经验的确可以为我们的决策提供一定的依据,但仅凭经验推断又有不足.
例如,不同经验的人对同一情形可能会得出不同结论,不是所有的情形都有经验可循等. 因此,在研究两个变量之间的相关关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断.
新知探究
探究 在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如下表所示.表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据.
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
年龄/岁 23 27 39 41 45 49 50 53 54 56 57 58 60 61
脂肪含量/% 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6
根据以上数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗?
用横轴表示年龄,纵轴表示脂肪含量,通过作图可以对两个变量之间的关系有一个直观的印象.
为了更加直观地描述上述成对数据中脂肪含量与年龄之间的关系,类似于用直方图描述单个变量样本数据的分布特征,我们用图形展示成对样本数据的变化特征.
新知探究
问题2 通过观察散点图可以发现年龄和脂肪含量之间有什么样的关系?
散点大致落在一条从左下角到右上角的直线附近.
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图. 我们把这样的统计图叫做散点图.
问题3 你能根据散点图的特征来解析数据得到的结论吗?
由散点图可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.
这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.
新知探究
变量相关关系的分类
正相关:指的是两个变量有相同的变化趋势,即从整体上来看一个变量会随着另一个变量变大而变大,点的位置散布在从左下角到右上角的区域.
负相关:指的是两个变量有相反的变化趋势,即从整体上来看一个变量会随着另一个变量变大而变小,点的位置散布在从左上角到右下角的区域内.
追问1 两个变量正相关、负相关时,成对样本数据的散点图有什么特点?
散点图中的点散布在从左下角到右上角的区域
散点图中的点散布在从左上角到右下角的区域
23 27 39 41 45 49 50 53 54 56 57 58 60 61 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6
23 27 39 41 45 49 50 53 54 56 57 58 60 61 34.6 35.2 33.5 30.8 31.4 30.2 29.6 28.2 26.3 27.5 25.9 21.2 17.8 9.5
新知探究
线性相关和非线性相关
①线性相关
如果两个变量的取值呈现正相关或负相关,而且散点落在一一条直线附近,我们就称这两个变量线性相关.
新知探究
②非线性相关
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
散点落在某条曲线附近,而不是落在一条直线附近,说明这两个变量具有相关性,但不是线性相关.
散点落在一条折线附近,这两个变量也具有相关性,但它们既不是正相关,也不是负相关.
散点杂乱无章,无规律可言,看不出这两个变量有什么相关性.
巩固练习
课本95页
2. 根据下面的散点图,推断图中的两个变量是否存在相关关系.
√
√
√
不相关
正相关
非线性相关
负相关
巩固练习
课本95页
3.下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相关关系? 如果是,那么这种相关关系有什么特点?
地区 A B C D E F G H I J K
海拔高度/m 1250 1158 1067 457 701 731 610 670 1493 762 549
鸟的种类/种 36 30 37 11 11 13 17 13 29 4 15
解:画鸟的种类数与海拔高度的散点图,如图所示.
5
10
海拔高度/m
20
1600
1400
1200
600
0
200
400
800
1000
15
40
35
30
25
鸟的种类/种
•
•
•
•
•
•
•
•
•
•
•
从散点图中散点的分布看,鸟的种类数与海拔高度正相关,鸟的种类数在海拔高度1000m以上的明显多于在海拔高度1000m以下的. 但从局部看,不管是在海拔高度1000m以上,还是在海拔高度1000m以下,鸟的种类数和海拔高度正相关都不明显.
变量间相关关系的判断
题型一
题型探究
【例1】(1)下列说法正确的是( )
D
A. 任何两个变量都具有相关关系
B. 球的体积与该球的半径具有相关关系
C. 农作物的产量与施肥量之间的关系是一种确定性关系
D. 产品的成本与产量之间的关系是相关关系
[解析] 两个变量可能没有关系或有函数关系,故A错误;
球的体积与该球的半径之间是函数关系,故B错误;
农作物的产量与施肥量之间的关系是相关关系,而非确定性关系,故C错误;
产品的成本与产量之间具有相关关系,故D正确.
变量间相关关系的判断
题型一
题型探究
【例1】(2)(多选题)下列各项中的两个变量之间存在相关关系的是( )
ABD
A. 商品的销售价格与其供应量
B. 汽车的行驶速度与耗油量
C. 真空中自由降落的小球的位移(单位:)与时间(单位: )
D. 日降雨量(单位:)与空气中的污染物浓度(单位: )
[解析] 商品的销售价格与其供应量之间具有相关关系.一般来说,在品质相当的情况
下,供应量越大,价格就越低;供应量越小,价格就越高.某些品牌商品限量供应,
就是保持较高价位的销售策略.故A正确.
汽车的行驶速度与耗油量之间具有相关关系.通常情况下,当汽车速度很慢或速度很
快时,耗油较多,而当汽车以中等车速(不同的汽车范围不一定一样)行驶时,速
度稍快,耗油反而较少.故B正确.
根据自由落体运动方程,可知真空中自由降落的小球的位移与时间之间是函数关系.
故C错误.
日降雨量与空气中的污染物浓度之间具有相关关系.通常情况下,降雨量越大,空气
中的污染物浓度就越低.故D正确.故选 .
变量间相关关系的判断
题型一
题型探究
解题感悟
判断两个变量之间是否具有相关关系的方法
(1)根据生活、学习经验进行判断.
(2)根据两个变量相应值的对应关系进行判断.
散点图与两个变量的相关性的判断
题型二
题型探究
【例2】 让利促销是商家经常采用的营销策略,现有一商场对5年来春节期间服装类商品的优惠金额 (单位:万元)与销售额 (单位:万元)之间的关系进行分析研究并做了记录,得到的数据如表所示.
年份 2017 2018 2019 2020 2021
2 4 5 6 8
30 40 60 50 70
请根据题目所给数据画出相应的散点图,并判断服装类商品的优惠金额与销售额是否具有线性相关关系.
[解析] 散点图如图所示.
由图可知,各散点基本落在一条直线附近,所以可以认为服装类商品的优惠金额与销售额具有线性相关关系.
散点图与两个变量的相关性的判断
题型二
题型探究
提分笔记
在研究两个变量之间是否存在某种关系时,必须从散点图入手,依据散点图可以作出如下判断:
(1)如果散点落在某一函数曲线上,那么就用该函数来描述这两个变
量之间的关系,即两个变量之间具有函数关系;
(2)如果散点落在某一条直线附近,那么这两个变量之间具有线性相
关关系;
(3)如果散点落在某一条曲线附近,那么这两个变量之间具有非线性
相关关系;
(4)如果散点的分布几乎没有什么规律,那么这两个变量之间不具有
相关关系,即两个变量之间是相互独立的.
变量正相关、负相关
题型三
题型探究
【例3】 由变量 , 的观测数据 得散点图①;由变量 , 的观测数据 得散点图②.由这两个散点图可以判断( @14@ )
A. 变量 与 正相关,变量 与 正相关
B. 变量 与 正相关,变量 与 负相关
C. 变量 与 负相关,变量 与 正相关
D. 变量 与 负相关,变量 与 负相关
C
[解析] 由题图知,变量 与 负相关,变量 与 正相关,故选C.
课堂达标
1.下列两个变量具有相关关系的是( @18@ )
A. 正方体的体积与棱长 B. 汽车匀速行驶时的路程与时间
C. 人的体重与饭量 D. 人的身高与视力
C
[解析] 正方体的体积与棱长是函数关系,故选项A错误;
汽车匀速行驶时的路程与时间是函数关系,故选项B错误;饭量会影响体重,但不是唯一因素,所以人的体重与饭量是相关关系,故选项C正确;人的身高与视力无任何关系,故选项D错误.故选C.
课堂达标
2.(多选题) 下列两个变量具有负相关关系的是( @20@ )
A. 正方形的面积与边长
B. 吸烟与健康
C. 数学成绩与物理成绩
D. 汽车的质量与汽车每消耗 汽油所行驶的平均路程
BD
[解析] 正方形的面积与边长是确定的函数关系,故A不符合;吸烟与健康具有负相关关系,故B符合;数学成绩与物理成绩不具有相关关系,故C不符合;汽车的质量越大,每消耗 汽油所行驶的平均路程越短,所以汽车的质量与汽车每消耗 汽油所行驶的平均路程具有负相关关系,故D符合.故选BD.
课堂达标
3.下列关于散点图的说法中,正确的是( )
B
A. 任意的统计数据都可以绘制散点图
B. 从散点图中可以看出两个量是否具有一定的关系
C. 从散点图中可以看出两个量的因果关系
D. 从散点图中无法看出数据的分布情况
[解析] 只有成对数据才可以绘制散点图,故A错误;散点图能看出两
个量是否具有一定的关系,但并不一定是因果关系,故B正确,C错误;
从散点图中能看出数据的分布情况,故D错误.故选B.
课堂达标
4. 下列四个图象中,两个变量具有正相关关系的是( @22@ )
D
[解析] 对于 ,两个变量之间是确定的函数关系,不是相关关系,故错误;对于 ,样本点呈直线形带状分布,呈下降趋势,是负相关,故错误;对于 ,样本点不呈直线形带状分布,故错误;对于 ,样本点呈直线形带状分布,呈上升趋势,是正相关,故正确.故选D.
课堂小结
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
1. 相关关系
把成对样本数据用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
2. 散点图
3. 正相关与负相关
一个变量随另一个变量的增加呈现减小的趋势.
正相关:
一个变量随另一个变量的增加呈现增加的趋势.
负相关:
感谢聆听!
$