内容正文:
专题03 统计案例【知识梳理】-2020-2021学年高一数学
下学期期中专项复习(人教A版)
一、回归分析
数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系.
(1)正相关与负相关
散点图中的点散布在从左下角到右上角的区域时,我们就称这两个变量正相关;散点图中的点散布在从左上角到右下角的区域时,则称这两个变量负相关.
线性相关与回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)样本相关系数
统计中用相关系数r来衡量两个变量之间线性关系的强弱,若相应于变量x取值
,变量y的观测值为
,则相关系数的计算公式为
.
当
时,表明两个变量正相关;当
时,表明两个变量负相关.
r的取值范围为
,当
越接近1时,表明两个变量的线性相关性越强;
当
越接近0时,表明两个变量之间几乎不存在线性相关关系.
2、两变量之间的关系存在两种不同的类型
(1)相关关系——非确定性关系
(2)函数关系——确定性关系
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
其基本步骤是:①画出两个变量的散点图;
②求回归直线方程;
③并用回归直线方程进行预报。
最小二乘法
求回归方程的关键是如何用数学的方法来刻画“从总体上看,各点与直线
的距离最小” .在实际应用中,人们常用各个散点到直线的竖直距离的平方之和最小来刻画整体接近程度.经过数学上的推导a,b的值由下列公式给出
这样,回归方程的斜率为
,截距为
,即回归方程为
.
这种得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的
方法叫做最小二乘法.
注:回归直线
必过
,我们可以利用回归直线进行预测.
二、独立性检验的基本思想
(1)分类变量:变量的不同值表示个体所属的不同类别,这样的变量称为分类变量.
(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y它们的取值分别为
和
,其样本频数列联表(称为
列联表)为