内容正文:
第八章 成对数据的统计分析
第八章 章末小结
1
知识导图·明架构
题型探究·悟思路
拓展延伸·育素养
2
知识导图·明架构
LONGCHENG NO.1 MIDDLE SCHOOL
返回至目录
3
题型1 一元线性回归方程及应用
例1 某项科研活动共进行了5次试验,其数据如表所示:
特征量 第1次 第2次 第3次 第4次 第5次
<m></m> 2 5 8 9 11
<m></m> 12 10 8 8 7
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合 <m></m> 与 <m></m> 的关系,并指出是正相关还是负相关;
(2)求特征量 <m></m> 关于 <m></m> 的线性回归方程,并预测当特征量 <m></m> 为12时特征量 <m></m> 的值;
题型探究·悟思路
LONGCHENG NO.1 MIDDLE SCHOOL
返回至目录
4
(3)设特征量 <m></m> ,其中 <m></m> 为样本平均数 <m></m> , <m></m> 为样本方差 <m></m> ,求 <m></m> .
参考公式:
相关系数 <m></m> , <m></m> , <m></m> .
参考数据: <m></m> , <m></m> , <m></m> .若 <m></m> ,则 <m></m> , <m></m> .
返回至目录
5
方法指导 (1)根据表中的数据,结合相关系数的公式,求出相关系数,即可得出结论;(2)根据最小二乘法,求出 <m></m> , <m></m> ,即可得出线性回归方程,从而可得预测值;(3)根据正态分布的对称性及题中的条件,即可求出结果.
返回至目录
6
[解析] (1)由题意,得 <m></m> , <m></m> ,
<m></m> ,
<m></m> , <m></m> ,
∴相关系数 <m></m> .
由于 <m></m> 很接近1,说明 <m></m> , <m></m> 的线性相关性很强,因而可以用线性回归模型拟合 <m></m> 与 <m></m> 的关系.
由于 <m></m> ,故其关系为负相关.
返回至目录
7
(2)由(1)知, <m></m> ,
<m></m> ,
∴所求的线性回归方程是 <m></m> .
当特征量 <m></m> 为12时,可预测特征量 <m></m> .
(3)由(1)知 <m></m> ,又由 <m></m> ,得 <m></m> ,
从而 <m></m> .
返回至目录
8
方法总结 分析两个变量的相关关系时,可根据样本数据作出散点图来判断两个变量之间是否具有相关关系.若具有线性相关关系,则利用最小二乘法估计求出的值,利用线性回归方程进行预测估计.本题渗透了数据分析、数学建模以及数学运算的素养.
返回至目录
9
题型2 成对数据的线性相关性
例2 [2020年全国Ⅱ卷] 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据 <m></m> ,其中 <m></m> 和 <m></m> 分别表示第 <m></m> 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得 <m></m> , <m></m> , <m></m> , <m></m> , <m></m> .
返回至目录
10
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本 <m></m> 的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数 <m></m> , <m></m> .
返回至目录
11
[解析] (1)由题意可得,样区野生动物平均数为 <m></m> ,
因为地块数为200,所以该地区这种野生动物的估计值为 <m></m> .
(2)样本 <m></m> 的相关系数 <m></m> .
(3)分层抽样:根据植物覆盖面积的大小对地块进行分层抽样,理由如下:
由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
返回至目录
12
方法总结 当相关系数 <m></m> 越接近1时