内容正文:
第八章 成对数据的统计分析(知识归纳+题型突破)
知识点1:相关系数
两组数据和的线性相关系数是度量两个变量与之间线性相关程度的统计量,其计算公式为其中,,,它们分别是这两组数据的算术平均数。
知识点2:相关系数的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
知识点3:一元线性回归模型参数的最小二乘法
(1)经验回归方程的求解法:最小二乘法
回归直线方程过样本点的中心,是回归直线方程最常用的一个特征;
我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估计,其中称为回归系数,它实际上也就是经验回归直线的斜率,为截距.
其中
知识点4:分类变量与列联表
(1)分类变量
为了方便,会使用一种特殊的随机变量,区别不同的现象或性质,这随机变量称为分类变量.
(2)列联表
①2×2列联表给出了两个分类变量数据的交叉分类频数.
②定义一对分类变量和,我们整理数据如下表所示:
合计
合计
知识点5:独立性检验
(1)独立性检验定义:
利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”.简称独立性检验.
(2)独立性检验公式:
其中(注意使用公式时分子的平方不要忽略了)
题型一:判断相关性
例题1.(23·24高三上·上海黄浦·开学考试)观察下列散点图,则①正相关,②负相关,③不相关,图中的甲、乙、丙三个散点图按顺序相对应的是( ).
A.①②③ B.②①③ C.①③② D.③①②
例题2.(2024高三·全国·专题练习)下列图形中具有相关关系的两个变量是( ).
A. B.
C. D.
例题3.(22·23高三·全国·课时练习)对变量x、y有观测数据(i=1,2,…,10),得散点图如图1所示;对变量u、v有观测数据(i=1,2,…,10),得散点图如图2所示.由这两个散点图函可以判断变量x与y ,u与v .(填写“正相关”或“负相关”)
巩固训练
1.(2024·全国·模拟预测)已知变量和满足关系,变量y与正相关,则( )
A.与负相关,与负相关 B.与正相关,与正相关
C.与正相关,与负相关 D.与负相关,与正相关
2.(22·23高二下·河南省直辖县级单位·期末)下列两个变量中能够具有相关关系的是( )
A.人所站的高度与视野 B.人眼的近视程度与身高
C.正方体的体积与棱长 D.某同学的学籍号与考试成绩
3.(2023高二·全国·专题练习)如图所示的两个变量不具有相关关系的有 .(填序号)
题型二:根据回归方程求原数据中的值
例题1.(2023高三上·福建三明·阶段练习)下表提供了某工厂节能降耗技术改造后,一种产品的产量(单位:吨)与相应的生产能耗(单位:吨)的几组对应数据:
3
4
5
6
2.5
t
4
4.5
根据上表提供的数据,求得关于的线性回归方程为,那么表格中的值为 .
例题2.(2023·陕西西安·模拟预测)数学兴趣小组对具有线性相关的两个变量x和y进行了统计分析,得到了下表:
x
4
6
8
10
12
y
a
2
b
c
6
并由表中数据求得y关于x的回归方程为,若a,b,c成等差数列,则 .
例题3.(23·24高二上·全国·课时练习)某食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如下表).
年份
芳香度
由最小二乘法得到线性回归方程,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为 .
巩固训练
1.(22·23高二下·江苏盐城·期末)已知、的取值如下表所示,从散点图分析可知与线性相关,如果线性回归方程为,那么表格中的数据的值为 .
2.(2023·江苏·三模)某工厂月产品的总成本(单位:万元)与月产量(单位:万件)有如下一组数据,从散点图分析可知与线性相关.如果回归方程是,那么表格中数据的值为 .
/万件
1
2
3
4
/万元
3.8
5.6
8.2
3.(2023·陕西·二模)某产品的广告费用x与销售额y的统计数据如下表: