内容正文:
第八章成对数据的统计分析复习课件
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
质疑探究1:相关关系与函数关系有何异同点?
提示:(1)相同点:两者均是指两个变量的关系.
(2)不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.
②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.回归方程与回归分析
(1)线性相关关系与回归直线
如果散点图中点的分布从整体上看大致在_________附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程
①最小二乘法:求回归直线使得样本数据的点到回归直线的______________最小的方法叫做最小二乘法.
一条直线
距离的平方和
(3)回归分析
①定义:对具有 的两个变量进行统计分析的一种常用方法.
相关关系
b.当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间相关性越弱.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
3.独立性检验
(1)分类变量
变量的不同“值”表示个体所属的 ,像这样的变量称为分类变量.
(2)列联表
列出两个分类变量的 ,称为列联表.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
不同类别
频数表
2×2列联表
构造一个随机变量K2=______________________,其中n=a+b+c+d为样本容量.
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
(3)独立性检验
利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(4)独立性检验的步骤
①计算随机变量K2的观测值k,查表确定临界值k0:
②如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的