8.1 成对数据间的关系(教学课件)数学沪教版选择性必修第二册
2026-05-21
|
27页
|
110人阅读
|
2人下载
精品
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学沪教版选择性必修第二册 |
| 年级 | 高二 |
| 章节 | 8.1 成对数据的相关分析 |
| 类型 | 课件 |
| 知识点 | 统计案例 |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | PPTX |
| 文件大小 | 1.82 MB |
| 发布时间 | 2026-05-21 |
| 更新时间 | 2026-05-21 |
| 作者 | 高中数学资料 |
| 品牌系列 | 上好课·上好课 |
| 审核时间 | 2026-05-21 |
| 下载链接 | https://m.zxxk.com/soft/57958238.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
8.1 成对数据的相关分析
第八章 成对数据的统计分析
沪教版选择性必修第二册·高二
学 习 目 标
1
2
结合实例,体会成对数据的相关关系,能根据散点图对线性相关关系进行判断.
了解样本相关系数公式的关系,能够理解相关系数的意义.
3
结合实例,会通过相关系数比较多组成对数据的相关性.
1
情景导入
发现现象背后的知识
1.根据犯罪分子在作案过程中遗留的脚印,能够对罪犯的性别、年龄、身高、走路姿势等方面分析画像,而且能起到揭露和证实犯罪的重要作用.
2.水稻是喜光植物,经研究发现,水稻的产量与光照时间有着某种必然的联系,
最开始随着光照时间的增长,产量增大,之后产量趋
于平缓,随着时间增长不再增加,时间继续增加,产
量会下降.
2
问题提出
在统计活动中,我们常常需要研究来自同一对象的两个相关变量的两组数据间的关系.
例如,为考察某班学生的身高与体重的关系,首先需要对每个学生的身高和体重进行测量,得到两组数据:一组是反映“身高”这个变量的数据,另一组是反映“体重”这个变量的数据.
那么,该如何刻画这两个变量之间的关系呢?
3
新知讲授
成对数据
来自同一对象的两组数据称为成对数据
相关分析
研究成对数据相关性的方法称为相关分析
定义
注意:①相关性是一种不确定性关系;
②相关关系是相对于函数关系而言的.
3
新知探究
在研究成对数据的相关性时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断.
思考:成对数据的相关性应该如何去分析?
在必修课程第13章中,我们曾经用散点图观察两个变量之间的相关性.例如,我们分别讨论了钻石价格与质量、颜色之间的关系.
3
典例分析
请绘制上述数据的散点图,并依据散点图观察两组数据的相关性.
下面再来看一个例子.
例1 通过随机抽样,我们获得某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的一组调查数据,如表8-1所示.
例1
3
典例分析
解:由于这两组数据分别来自同一商品的两个变量:“每千克价格”与“年需求量”,因此来自这两个变量的两组数据可以看作成对数据.
把“每千克价格”作为横坐标(自变量),“年需求量”作为纵坐标(因变量),在平面直角坐标系中绘制相应的点,就得到年需求量和每千克价格的散点图
3
新知探究
从图8-1-1可以看出,消费者对该商品的年需求量大体上随着价格的上升而减少,但也有一些例外的情况.例如,价格都是4百元,但不同年份的需求量分别是3.5千克和3千克,说明在价格不变的情况下,需求量仍可能发生变化.类似地,价格改变,需求也可能基本不变.
对例1所示的散点图,从整体上看,所有点都在一条直线的附近波动,在这种情况下,我们说两个变量之间具有一种线性相关关系.此时可以用一条直线来拟合这两组数据(图8-1-1).
4
新知应用
1.若已知下列各组数据,它们是否可以看作成对数据?是否可以进行相关分析?判断并简要说明理由.
(1)A校学生的身高与B校学生的体重;
(2)人体内的脂肪含量与体重;
(3)某班学生的物理成绩与数学成绩.
解:(1)A校学生的身高与B校学生的体重毫无关系,因此不能看作成对数据,不能进行相关分析.
(2)人体内的脂肪含量与体重有相关关系,因此可以看作成对数据,可以进行相关分析.
(3)某班学生物理成绩与数学成绩具有相关关系,因此可以看作成对数据,可以进行相关分析.
4
新知应用
2.某种木材体积与树木的树龄之间有如下的对应关系:
树龄 2 3 4 5 6 7 8
体积 30 34 40 60 55 62 70
(1)请作出这些数据的散点图;
(2)你能由散点图发现木材体积与树木的树龄近似成什么关系吗?
4
新知应用
解:(1)以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示:
(2)由散点图发现木材体积随着树龄的增加而呈增加的趋势,且散点落在一条直线附近,所以木材的体积与树龄成线性相关关系.
5
问题提出
相关系数
从本节例1可以看出,一些成对数据具有明显的相关性,且在绘制出散点图后可以用一条直线进行拟合,也就是说具有线性相关性.
在这种情况下,我们如何进一步描述成对数据的线性相关程度呢?
问题:能否引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?
6
新知讲授
设由变量x和y获得的两组数据分别为xi和yi (i=1,2,…,n),其对应关系如下表所示.
变量x
变量y
两组数据和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量,其计算公式为
6
新知讲授
相关系数
①
我们称为变量和变量的样本相关系数.
定义
线性相关系数常常简称为相关系数(correlationcoefficient),也称为皮尔逊相关系数(Pearson’scorrelationcoefficient).相关系数计算公式的推导过程比较复杂,这里不予涉及.一般情况下, 只需要把两组数据输入计算机或计算器,有很多软件可以帮助我们进行这一计算.
7
新知探究
思考: 通过计算可得相关系数,当相关系数变化时,成对样本数据之间具有怎样的关系呢?
相关系数r的值满足|r|≤1.|r|越接近1,两个变量的线性相关程度越高;|r|越接近0,两个变量的线性相关程度越低.
r>0时,当x的值由小变大,y 的值具有由小变大的变化趋势,称这种相关为正相关;r<0时,当x 的值由小变大,y的值具有由大变小的变化趋势,称这种相关为负相关.
7
归纳小结
思考:两个变量负相关时,成对样本数据的散点图有什么特点?
●
●
●
●
●
●
●
●
●
正相关
●
●
●
●
●
●
●
●
●
负相关
两个变量正相关和负相关散点图的特点
7
归纳小结
相关系数的性质:
① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
② |r|≤1;
③ 当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱;
特别地,当|r|=0时,成对数据的没有线性相关关系(但不排除它们间有其他相关关系);
当|r|=1时,成对数据都落在一条直线上.
7
新知探究
思考: 相关系数具有哪些特征呢?
(1)相关系数的计算公式关于x和y这两个变量是对称的.画散点图时,不论以哪个变量作为横轴(纵轴),所得的相关系数都一样.
(2)两个变量的相关系数与这两个变量的单位无关.例如,在计算身高与体重的相关系数时,身高单位不管取“米”还是“厘米”,相关系数的结果都一样.
(3)与平均数和标准差一样,相关系数不仅会受到数据量多少的影响,也会受到少数异常值较大的影响
相关系数r描述的是两个变量之间线性关系的方向与程度,是一种定量分析的方法.
相关系数具有以下特点:
7
典例分析
为了解某市高中男生身高与体重的关系,随机抽取5所高中学校,并获得这些学校全部男生的身高(单位:cm)与体重(单位:kg)的数据.为了减少篇幅,从中随机选取10名高中男生的身高与体重的数据,如下表所示.试根据表中数据绘制散点图,计算相关系数并判断学生身高与体重的相关程度.
例2
7
新知探究
解: 将表中的数据输入计算机电子表格办公软件的工作簿,先选中身高与体重两行(或两列)数据,再选择插入统计图中的散点图,选择图形样式,就完成了散点图的绘制,如下图所示.
7
典例分析
从散点图图中可以看出,总体上来说,样本学生的身高和体重之间具有明显的相关性,个子高的学生往往更重一些.
为了计算相关系数,我们把表中的两组数据代入本节公式①,通过计算机或计算器算得 r ≈0.873这说明样本学生的身高与体重之间具有很高的相关性.
8
新知应用
1.为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的样本线性相关系数,其数值分别为0.939, <m></m> , <m></m> ,则( ).
A.甲组数据的相关性最强,乙组数据的相关性最弱
B.乙组数据的相关性最强,丙组数据的相关性最弱
C.丙组数据的相关性最强,甲组数据的相关性最弱
D.丙组数据的相关性最强,乙组数据的相关性最弱
D
解:因为样本相关系数的绝对值越大,则相关性越强,所以丙组数据的相关性最强,乙组数据的相关性最弱.
8
新知应用
2.为了研究豆类脂肪含量与其产生的热量的关系,选取了5种豆类进行实验测定.下面是0.1kg豆类中脂肪含量(单位:kg)与相应热量(单位:kJ)的对照表.
(1)根据表中的数据绘制散点图;
(2)观察散点图的趋势,如果能看成线性关系,请在图中画出一条直线来近似地表示这种关系,并计算豆类脂肪含量与热量的相关系数.
8
新知应用
通过计算机或计算器算得 r ≈0.99这说明样本豆类脂肪含量与热量之间具有很高的相关性.
课堂小结
感谢聆听!
沪教版选择性必修第二册·高二
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。