内容正文:
第一章 统 计 案 例
§1 回 归 分 析
1.线性回归方程
(1)线性回归方程y=bx+a中的系数:b=
(2)“最小二乘法”的含义
使样本点的纵坐标与直线上对应点的纵坐标差的平方和最小,即Q(a,b)=(y1-a-bx1)2+(y2-a-bx2)2+…+(yn-a-bxn)2最小.
【思考】
(1)回归分析中的两个变量具有什么关系?
提示:回归分析中的两个变量具有相关关系.
(2)回归直线一定过样本中心点,样本中心点的坐标是什么?
提示:( )称为样本点的中心.
2.相关系数
公式
范围 r∈[-1,1]
性质 (1)|r|值越大,变量之间的线性相关程度越高
(2)|r|值越接近0,变量之间的线性相关程度越低
(3)当r>0时,两个变量正相关;当r<0时,两个变量负相关;当r=0时,两个变量线性不相关
【思考】
r的正负与线性回归方程中斜率的正负是什么关系?
提示:r的正负与线性回归方程中斜率的正负是一致的.
3.可线性化的回归分析的方法
通过变换先将其转化成线性函数,利用最小二乘法得到线性回归方程,再通过相应变换得到非线性回归方程.
【基础小测】
1.辨析记忆(对的打“√”,错的打“×”)
(1)求线性回归方程前可以不进行相关性检验. ( )
(2)利用线性回归方程求出的值是准确值. ( )
(3)设回归方程为y=-5x+3,若变量x增加1个单位,则y平均增加5个单位.
提示:(1)×.只有满足线性相关关系的两个变量才能求出线性回归方程,所以必须画散点图进行相关性检验,故错误.
(2)×.利用线性回归方程求出的值是通过回归直线求出的估计值,故错误.
(3)×.若变量x增加1个单位,则y平均减少5个单位,故错误.
2.已知线性回归方程中斜率的估计值为1.23,样本点的中心为(4,5),则线性回归方程为 ( )
A.y=1.23x+0.08 B.y=0.08x+1.23
C.y=1.23x+4 D.y=1.23x+5
【解析】选A.线性回归方程过样本点的中心,把点(4,5)代入选项中的方程,只有选项A成立.
3.若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的一组是________.(填甲、乙、丙中的一个)
【解析