内容正文:
第八章成对数据的统计分析
人教A版2019必修第三册
全章复习(教学课件)
一、变量的相关性
1.变量的相关关系与样本相关系数是学习一元线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度.
2.在学习该部分知识时,体会直观想象和数学运算的素养.
例1 已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x 14 16 18 20 22
y 12 10 7 5 3
求y关于x的经验回归方程,并借助残差平方和和R2说明回归模型拟合效果的好坏.
列出残差表为
所以回归模型的拟合效果很好.
变量相关性的判断的两种方法
(1)散点图法:直观形象.
(2)公式法:可用公式精确计算相关系数
样本相关系数r的取值范围为 .
当|r|越接近1时,成对样本数据的线性相关程度越 ;
当|r|越接近0时,成对样本数据的线性相关程度越 .
注意点:
当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系.
当r=0时,表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系.
[-1,1]
强
弱
7
二、一元线性回归模型及其应用
1.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际问题做出预测和分析.
2.主要培养数学建模和数据分析的素养.
例2关于x与y有以下数据:
x 2 4 5 6 8
y 30 40 60 50 70
方法技巧 一元线性回归模型拟合问题的求解策略
在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的效果.|r|越大,R2就越大,用模型拟合数据的效果就越好.
三、非线性经验回归方程
1.在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化.
2.体现数学建模的优劣,提升数据分析的素养.
例3 某公司为确定下一年度投入产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,于是对近8年的宣传费xi和年销售量yi(i=1,2,…,8)的数据进行了初步处理,得到如图所示的散点图及一些统计量的值.
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y之间的关系为z=0.2y-x,根据(2)的结果回答下列问题.
①当年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的估计值最大?
故当年宣传费为46.24千元时,年利润的估计值最大.
非线性经验回归方程的求解策略
(1)本例中,y与x不是线性相关关系,但通过wi= ,转换为w与y的线性相关关系,从而可利用线性回归分析间接讨论y与x的相关关系.
(2)可线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.
四、独立性检验
1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,查表分析并判断相关性结论的可信程度.
2.通过计算χ2值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.
例4 某校对学生课外活动进行调查,结果整理成下表,试根据小概率值α=0.005的独立性检验,分析喜欢体育还是文娱与性别是否有关系.
性别 喜欢 合计
体育 文娱
男生 21 23 44
女生 6 29 35
合计 27 52 79
解 零假设为H0:喜欢体育还是喜欢文娱与性别没有关系.
∵a=21,b=23,c=6,d=29,n=79,
根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为喜欢体育还是喜欢文娱与性别有关.
方法技巧 独立性检验的一般步骤
(1)根据样本数据制成2×2列联表;
(2)根据公式计算χ2;
(3)比较χ2与临界值xα的大小关系,得到推断结论.
五、数形结合思想在独立性检验中的应用
1.数形结合思想就是在解决与几何图形有关的问题时,将图形信息转换成代数信息,利用数量特征,将其转化为代数问题;在进行回归分析时,常利用散点图、残差图等说明线性相关情况或模型的拟合效果.在独立性检验中,我们常用等高堆积条形图直观地反映数据的情况,从而可以粗略地判断两个分类变量是否有关系.
2.主要培养数学抽象和数学运算的素养.
例5.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
根据已知条件完成下面的2×