内容正文:
2020-2021学年高二数学下学期期末专项复习(人教A版选修1-2)
知识梳理
第一章 统计案例
1、两个变量的线性相关
(1)正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关;
(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关;
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。
(4)相关系数:,越接近于相关性越强。
2、回归方程
(1)最小二乘法:求回归直线使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法;
(2)回归方程:方程是两个具有线性相关关系的变量的一组数据、、…、的回归方程,其中、是待定参数。
,。
(3)求回归直线方程的一般步骤:
①作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系;
②计算出、、、的值,求回归系数、;
③写出回归直线方程 ,并利用回归直线方程进行预测说明。
3、回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。
建立回归模型的基本步骤是:
(1)确定研究对象,明确两个变量即解释变量和预报变量;
(2)画出散点图,观察它们之间的关系;
(3)由经验确定回归方程类型(若呈线性关系,选用线性回归方程);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差出现不随机的规律性,等等),若存在异常,则检查数据是否有误,或模型是否合适等。
4、利用统计方法解决实际问题的基本步骤:
(1)提出问题;
(2)收集数据;
(3)分析整理数据;
(4)进行预测或决策。
5、残差变量的主要来源:
(1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。可能存在非线性的函数能够更好地描述与之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。这种由于模型近似所引起的误差包含在中。
(2)忽略了某些因素的影响。影响变量的因素不只变量一个,可能还包含其他许多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们