内容正文:
1.1 回归分析
自主整理
假设样本点为(x1,y1),(x2,y2),…,(xn,yn),设线性回归方程为y=a+bx,使这n个点与直线y=a+bx的_____________最小,即使得Q(a,b)=_____________达到最小.利用最小二乘法的思想求得.
当b=_____________,a=_____________时,Q(a,b)取最小值.
高手笔记
1.对具有相关关系的两个变量进行统计分析的方法叫回归分析.回归分析是寻找相关关系中非确定性关系的某种确定性.
2.如果散点图中点的分布从整体上看大致在一条直线附近,我们称这两个变量之间具有线性相关关系,这条直线叫回归直线,从整体上看各点与此直线的距离平方之和最小,即最贴近已知的数据点,最能代表变量x与y之间的关系.
名师解惑
1.相关关系与函数关系有哪些相同点和不同点?
剖析:相同点:两者均指两个变量的关系.
不同点:(1)函数关系是一种确定的关系,相关关系是一种非确定的关系;(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.如何理解相关关系的不确定性?
剖析:教材中利用始祖鸟的5个标本求出股骨长度x与肱骨长度y的回归直线方程为y=-3.660+1.197x,那么将第6个标本中股骨长度x=50代入回归直线方程,可以预测第6个标本中的肱骨长度的估计值约为56 cm.是不是当股骨长度x=50时,肱骨长度y一定为56呢?不一定.但如果有大量化石供研究时,股骨长度为50 cm的始祖鸟的肱骨的平均值应为56 cm.
讲练互动
【例】关于人体的脂肪含量(百分比)和年龄关系的研究中,研究人员获得了一组数据:
年龄x
23
27
39
41
45
49
50
脂肪y
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄x
53
54
56
57
58
60
61
脂肪y
29.6
30.2
31.4
30.8
33.5
35.2
34.6
(1)求y与x之间的回归直线方程;
(2)给出37岁人的脂肪含量的预测值.
分析:两个变量呈现近似的线性关系,可通过公式计算出其线性回归方程,并根据方程求出其预测值.
解:设方程为y=a+bx,根据已知列表为:
i
xi
yi
xi2
xiyi
1
23