内容正文:
第8章 成对数据的统计分析
§8.1 成对数据的统计相关性
1. 相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2. 相关关系分类:
正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量正相关;
负相关:当一个变量的值增加时,另一个变量的相应值也呈现减小的趋势,就称这两个变量负相关.
3. 线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,就称这两个变量线性相关.
4.
样本相关系数:
(1)
(2)样本相关系数的数字特征:
当时,称成对样本数据正相关;
当时,称成对样本数据负相关;
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
§8.2 一元线性回归模型及其应用
1.一元线性回归模型:
称为因变量或响应变量,称为自变量或解释变量,为截距参数,为斜率参数,是与之间的随机误差.
2.经验回归方程:
(1)相关概念:
经验回归直线:经验回归方程也称经验回归函数或经验回归公式,图形称为经验回归直线.
最小二乘估计:求经验回归方程的方法叫做最小二乘法,求得的叫做的最小二乘估计.
残差:对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
(2)
(3)决定系数:
越大,表示残差平方和越小,即模型的拟合效果越好;
越小,表示残差平方和越大,即模型的拟合效果越差;
§8.3 列联表与独立性检验
1.分类变量:现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题,为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
2.列联表:
合计
合计
3.独立性检验:
(1)零假设(原假设):,即分类变量和独立.
(2)独立性检验:
①
②临界值:对于小概率值,可以找到相应的正实数,使下面关系成立:,我们称为的临界值.
常用小概率值和相应的临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
③基于小概率值的检验规则:
当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过.
当时,我们没有充分证据推断不成立,可以认为和独立.
这种利用的取值推断分类变量和是否独立的方法称为独立性检验,简称独立性检验.
原创精品资源学科网独家享有版权,侵权必究!1
学科网(北京)股份有限公司
$