内容正文:
第八章 成对数据的统计分析
章末复习
1
1
知识框架
2
重点题型
一、线性回归分析
2
重点题型
1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为通过散点图和经验选择经验回归方程的类型,然后通过一定的规则确定出相应的经验回归方程,通过一定的方法进行检验,最后应用于实际或对预报变量进行预测.
2.主要培养数学建模和数据分析的素养.
例1 假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下表:
x 15.0 25.8 30.0 36.6 44.4
y 39.4 42.9 42.9 43.1 49.2
(1)计算各组残差,并计算残差平方和;
反思感悟 刻画回归效果的三种方法
(1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.
跟踪训练1 已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x 14 16 18 20 22
y 12 10 7 5 3
求y关于x的经验回归方程,并借助残差平方和和R2说明回归模型拟合效果的好坏.
列出残差表为
所以回归模型的拟合效果很好.
2
重点题型
二、独立性检验
2
重点题型
1.独立性检验研究的问题是有多大把握认为两个分类变量之间有关系.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.另外等高堆积条形图能更直观地反映两个分类变量之间的情况.独立性检验的思想是可以先假设二者无关系,求随机变量χ2的值,若χ2大于临界值,则拒绝假设,否则,接受假设.
2.通过计算χ2的值,进而分析相关性结论的可信程度,提升数学运算、数据分析的素养.
例2 甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:
零件尺寸x 1.01 1.02 1.03 1.04 1.05
零件
个数y 甲 3 7 8 9 3
乙 7 4 4 4 a
由表中数据得y关于x的经验回归方程为 =-91+100x(1.01≤x≤1.05),其中合格零件尺寸为1.03±0.01 cm.完成下面列联表,并依据小概率值α=0.01的独立性检验,分析加工零件的质量与甲、乙是否有关.
机床加工 零件的质量 合计
合格零件数 不合格零件数
甲
乙
合计
所以a=11.由于合格零件尺寸为1.03±0.01 cm,
故甲、乙加工的合格与不合格零件的数据表为
机床加工 零件的质量 合计
合格零件数 不合格零件数
甲 24 6 30
乙 12 18 30
合计 36 24 60
零假设为H0:加工零件的质量与甲、乙无关.
根据小概率值α=0.01的独立性检验,我们推断H0不成立.即认为加工零件的质量与甲、乙有关.
反思感悟 用χ2进行“相关的检验”步骤
(1)零假设:即先假设两变量间没关系.
(2)计算χ2:套用χ2的公式求得χ2值.
(3)查临界值:结合所给小概率值α查得相应的临界值xα.
(4)下结论:比较χ2与xα的大小,并作出结论.
跟踪训练2 某校对学生课外活动进行调查,结果整理成下表,试根据小概率值α=0.005的独立性检验,分析喜欢体育还是文娱与性别是否有关系.
性别 喜欢 合计
体育 文娱
男生 21 23 44
女生 6 29 35
合计 27 52 79
解 零假设为H0:喜欢体育还是喜欢文娱与性别没有关系.
∵a=21,b=23,c=6,d=29,n=79,
根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为喜欢体育还是喜欢文娱与性别有关.
三、数形结合思想在独立性检验中的应用
1.数形结合思想就是在解决与几何图形有关的问题时,将图形信息转换成代数信息,利用数量特征,将其转化为代数问题;在进行回归分析时,常利用散点图、残差图等说明线性相关情况或模型的拟合效果.在独立性检验中,我们常用等高堆积条形图直观地反映数据的情况,从而可以粗略地判断两个分类变量是否有关系.
2.主要培养数学抽象和数学运算的素养.
例3 某机构为了了解患色盲是否与性别有关,随机抽取了1 000名成年人进行调查,在调查的480名男性中有38名患色盲,520名女性中有6名患色盲,分别利用图形和独立性检验(α=0.001)的方法来判断患色盲与性别是否有关.
解 根据题目所给的数据作出如下的列联表:
性别 色盲 合计
患色盲 未患色盲
男 38 442 480
女 6 514 520
合计 44 956 1 000
根据列联表作出相应的等高
堆积条形图,如图所示.
图中两个深色条的高分别表示男性和女性中患色盲的频率,
从图中可以看出,男性中患色盲的频率明显高于女性中