内容正文:
4.3.1 一元线性回归模型
第2课时
新授课
回顾
回归直线方程:
1.结合具体实例,了解样本相关系数的统计含义及样本相关系数与标准化数据向量夹角的关系.
2.结合实例,会通过相关系数比较多组成对样本数据的相关性.
新课讲授
学习目标
课堂总结
如下是某班级学生数学成绩与英语成绩的对应表.
数学 43 51 56 58 61 63 65 66 68 69 70 71 73 74 74 75
英语 81 76 67 78 65 73 71 74 76 62 64 77 80 81 68 72
数学 75 76 77 78 78 79 79 80 82 82 83 84 88 89 92 98
英语 85 69 71 70 76 62 89 69 76 84 94 84 79 81 85 68
知识点一:相关系数
由以上数据,能直接看出该班英语与数学成绩之间存在线性相关关系吗?作出这些数据的散点图,你能得出什么结论?
新课讲授
学习目标
课堂总结
直观上可以看出,数学成绩与英语成绩之间线性相关关系较弱.
新课讲授
学习目标
课堂总结
问题2:通过散点图可以直观推断两个变量的相关程度,那么该怎样定量的刻画两个变量之间线性相关关系的强弱呢?
由图得:回归直线过一,三象限,散点大多分布在一、三象限,且横、纵坐标同号.
数学与英语成绩正相关.
若以数学与英语成绩建立成对数据(xi,yi),i=1,2,3...,32,得回归直
线方程为 ,直线经过点 ,以 为原点建立新的坐标系x′O′y′,如图所示,
新课讲授
学习目标
课堂总结
如果变量x,y正相关,
如果变量x,y负相关,
那么大多数点将分布在x′O′y′的一、三象限,
对应的成对数据同号居多;
那么大多数点将分布在x′O′y′的二、四象限,对应的成对数据异号居多.
给定两个变量x,y的成对数据为(xi,yi),i=1,2,3,...,n,以 为
原点建立新的坐标系x′O′y′.
·
·
·
·
·
·
·
·
·
·
·
·
x′
O′
y′
相应象限内的点越多,y与x的线性相关关系越强.
·
·
·
·
·
·
·
·
·
·
·
·
x′
y′
O′
新课讲授
学习目标
课堂总结
因此可用含有
的量来判定y与x的线性相关性强弱.
重新建系后,
点(xi,yi)
变为
若点在二、四象限,则
若点在一、三象限,则
落在一,三象限(或二,四象限)的点越多,
则此量的绝对值越大,线性相关性越强.
新课讲授
学习目标
课堂总结
(1) x 1 2 3 4 5 6 7
y 6.1 5.2 4.5 4.7 3.8 3.4 3.1
(2) x 10 20 30 40 50 60 70
y 61 52 45 47 38 34 31
思考:结合下列两组成对数据,判断能否直接用 来衡量y与x的线性相关性强弱?并说明理由.
新课讲授
学习目标
课堂总结
由图可知,它们的线性相关程度差不多.
因此直接用
来衡量y与x的线性相关性强弱并不合适.
根据上述两组成对数据得散点图及回归直线方程如下,
(1)
(2)
两者数据相差较大
新课讲授
学习目标
课堂总结
相关系数
衡量y与x的线性相关性强弱,这里的r称为线性相关系数(简称为相关系数).
注意到现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里一般用
新课讲授
学习目标
课堂总结
(3) |r|=1的充要条件是成对数据构成的点都在回归直线上.
相关系数r的性质
(1) y与x正相关的充要条件是r>0,y与x负相关的充要条件是r<0.
(2)|r|≤1
当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱.
新课讲授
学习目标
课堂总结
r ≈0.21
r ≈0.73
r ≈-0.97
新课讲授
学习目标
课堂总结
归纳总结
r 两个变量之间的线性相关关系
r与 的符号相同,具体关系如下:
0<r≤1
正相关
-1≤r<0
负相关
r=0
不相关
在统计学中,通常认为当|r|≥0.75时,两个变量有较强的线性相关关系.
新课讲授
学习目标
课堂总结
例2 某人工智能公司从某年起7年的利润情况如下表所示.
第x年 1 2 3 4 5 6 7
利润y 2.9 3.3 3.6 4.4 4.8 5.2 5.9