内容正文:
高效作业(十四) 成对数据的统计相关性
一元线性回归模型及应用
1.线性回归方程
对于满足一元线性回归模型的两个变量X,
Y 的n 对样本数据(x1,y1),(x2,y2),,
(xn,yn),
b̂=
∑
n
i=1
(xi-x)(yi-y)
∑
n
i=1
(xi-x)2
=
∑
n
i=1
xiyi-nxy
∑
n
i=1
x2i-nx2
,̂a=y
-̂bx.
则称Y=̂a+̂bX为Y 关于X的线性回归方程.
求得的b̂,̂a是这个线性回归方程的系数.
2.样本相关系数
对于变量X,Y 利用成对样本数据(x1,y1),
(x2,y2),,(xn,yn)构造
r=
∑
n
i=1
(xi-x)(yi-y)
∑
n
i=1
(xi-x)2 ∑
n
i=1
(yi-y)2
,
则称r为变量X 和变量Y 的样本线性相关
系数,其取值范围为 .
样本相关系数r是一个描述成对样本数据的
数字特征,它的正负性和绝对值的大小可以
反映成对样本数据的变化特征及线性相关
程度;
(1)当 时,称成对样本数据正相关,当
r<0时,称成对样本数据负相关;
(2)当|r|越接近1时,成对样本数据的线性
相关程度越 ,当|r|越接近0时,成
对样本数据的线性相关程度越 .
92
一、选择题
1.两个变量的相关关系有①正相关,②负相关,
③不相关,则下列散点图从左到右分别反映
的变量间的相关关系是 ( )
A.①②③ B.②③①
C.②①③ D.①③②
2.变量 X 与Y 相应的一组数据为(10,1),
(11.3,2),(11.8,3),(12.5,4),(13,5);变量
U 与V 相对应的一组数据为(10,5),(11.3,
4),(11.8,3),(12.5,2),(13,1).r1 表示变
量Y 与X 之间的线性相关系数,r2 表示变量
V 与U 之间的线性相关系数,则 ( )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
3.已知x与y 之间的一组数据如表:
x 0 1 2 3
y m 3 5.5 7
已求得y关于x 的线性回归方程为ŷ=2.1x
+0.85,则m 的值为 ( )
A.1 B.0.85
C.0.7 D.0.5
4.(多选题)为了检验变量x与y 的线性相关程
度,由样本点(x1,y1),(x2,y2),,(x10,
y10)求得两个变量的样本相关系数为r,则下
列说法错误的是 ( )
A.若所有样本点都在直线y=-2x+1上,
则r=1
B.若所有样本点都在直线y=-2x+1上,
则r=-1
C.若|r|越大,则变量x 与y 的线性相关程
度越强
D.若|r|越小,则变量x与y 的线性相关程
度越强
5.某考察团对10个城市的职工人均工资x(千
元)与居民人均消费y(千元)进行调查统计,
得出y与x 具有线性相关关系,且经验回归
方程为ŷ=0.6x+1.2.若某城市职工人均工
资为5千元,估计该城市人均消费额占人均
工资收入的百分比为 ( )
A.66% B.67%
C.79% D.84%
6.对两个具有非线性相关关系的变量x,y 进
行回归分析,设u=lny,v=(x-4)2,利用最
小二乘法得到u关于v 的线性回归方程为
û=-0.5v+2,则ŷ的最大值是 ( )
A.e B.e2
C.ln2 D.2ln2
二、填空题
7.已知x,y的取值如下表,从散点图可以看出
y与x 具有线性相关关系,且线性回归方程
为ŷ=0.95x+̂a,则â= .
x 0 1 3 4
y 2.2 4.3 4.8 6.7
8.某炼钢厂废品率x(%)与成本y(元/吨)的线
性回归直线方程为ŷ=105.492+42.569x.
当成本控制在176.5元/吨时,可以预计生产
的1000吨钢中,约有 吨钢是废品
(结果保留两位小数).
9.经调查某地若干户家庭的年收入x(万元)和年
饮食支出y(万元)具有线性相关关系,并得到y
关于x的线性回归方程:̂y=0.245x+0.321,由
线性回归方程可知,家庭