内容正文:
章末复习
湘教版选择性必修第二册
第4章统计
学习目标
目标
1
掌握散点图和样本相关系数判断相关性的方法
了解一元线性回归模型的统计意义
掌握一元线性回归模型参数的最小二乘估计方法
会通过残差分析和利用R2判断回归模型的拟合效果
掌握独立性检验的思想方法
重点
2
掌握一元线性回归模型参数的最小二乘估计方法
掌握独立性检验的思想方法
难点
3
一元线性回归模型参数的最小二乘估计方法
独立性检验的思想方法
知识结构图
1. 样本相关系数:
2.相关系数的性质:
① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
② |r|≤1;
③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.
知识梳理
成对数据的统计相关性
3.对于多组成对数据相关性如何判断?
4.相关系数与向量夹角的关系
知识梳理
分成几个不同的两组数据分别进行相关性分析.
用最小二乘法得到的回归直线方程为 ,
其中 是回归直线在y轴上的截距, 是回归直线的斜率.
知识梳理
一元线性回归模型
知识梳理
独立性检验
例1 在以下4幅散点图中,判断哪些图中的y和x之间存在相关关系?其中哪些正相关,哪些负相关?哪些图所对应的成对样本数据呈现出线性相关关系?哪些图所对应的成对样本数据呈现出非线性相关关系.
图(1)(2)(3)中的y和x之间存在相关关系;其中图(1)(3)中的y和x之间呈现正相关关系;图(2中的y和x之间呈现线性相关关系;其中图(4)中的y和x之间呈现非线性相关关系.
题型一 根据散点图判断相关性
典例分析
例2 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x(分)与入学后第一次考试的数学成绩y(分)如下:
题型二 线性相关性检验
学生号 1 2 3 4 5 6 7 8 9 10
x 120 108 117 104 103 110 104 105 99 108
y 84 64 84 68 69 68 69 46 57 71
请问这10名学生的两次数学成绩是否具有线性关系?
典例分析
典例分析
判断是否具有线性相关关系,计算样本的相关系数
典例分析
根据计算所得样本的相关系数结果,判断两个变量是否具有线性相关关系
例3 随机抽取7家超市,得到其广告支出与销售额数据如下:
超市 A B C D E F G
广告支出/万元 1 2 4 6 10 14 20
销售额/万元 19 32 44 40 52 53 54
请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.
典例分析
解:
正线性相关,相关性较强,销售额与广告支出的变化趋势相同.
典例分析
例4 随着我国经济的发展,居民储蓄存款逐年增长;设某地区城乡居民人民币储蓄存款(年底余额)如下表:
典例分析
年份 2015 2016 2017 2018 2019
时间代号x 1 2 3 4 5
储蓄存款y(千亿元) 5 6 7 8 10
题型三 求一元线性回归模型
(2)用所求经验回归方程预测该地区2025年(t=11)的人民币储蓄存款?
典例分析
典例分析
所以预测该地区2025年的人民币储蓄存款为16.8千亿元.
例5 某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
题型四 残差分析
x 14 16 18 20 22
y 12 10 7 5 3
借助残差平方和和R2说明回归模型拟合效果的好坏?
典例分析
解:列出残差表:
所以回归模型的拟合效果很好.
典例分析
例6.江苏省将对入学的高一年级学生开始实施高考综合改革,不分文理科,实行新的学业水平考试制度.某校为研究高一学生选修物理与性别是否有关,随机选取100名学生进行调查,数据如下:
男生 女生 总计
选修物理 36 32 68
不选修物理 16 16 32
总计 52 48 100
(1)分析能否有90%的把握认为性别与是否选修物理有关?
附:
题型五 独立性检验
(2)从选取的100名学生中任取一名,求该同学选修物理的概率;
典例分析
(2)从选取的100名学生中任取一名,求该同学选修物理的概率;
解:由题知,样本中的100名学生选修物理的有68名,故从选取的100名学生中任取一名,求该同学选修物理的概率为
解:(1)计算得
所以没有90%的把握认为性别与是否选修物理有关.
典例分析
例7.2021年2月11日20:00整,中央电视台辛丑牛年春节联欢晚会隆重举行.晚会中,华美的舞台令观众沉醉,震撼的科技让酷炫尽显,饱含深情的歌曲、充满感染力的舞蹈、笑中有思的相声小品等一个个节目将过去一年来我国取得的举世成就生动,形象、深刻地呈现出来,描绘出逐梦中国的万千气象,携着吉祥的祝福与全国人民一同迈入新的春天.为了了解电视观众对晚会的整体评价,某调查机构通过不同途径调查了大量完整收看了春晚节目的电视观众的评分(满分100分),并对其进行统计分析,制作了如图的频率分布直方图:
典例分析
(1)试估算春晚评分的平均值;
解:根据频率分布直方图中的数据,可得估计春晚评分的平均值为:
典例分析
45岁以下 45岁以上 合计
满意
不满意
合计
(2)假设评分在60分以上的,则认为观众对春晚是满意的;不足60分,则认为观众对春晚是不满意.研究者从样本中抽取了年龄在45岁以上和45岁以下的观众各100名,发现年龄在45岁以上的100名的观众中满意的有60人,年龄在45岁以下的观众中满意的有35人,请结合独立性检验的思想,完成下列列联表,并分析是否有99.9%的把握认为观众的满意度与年龄分布有关?
典例分析
解:根据题意,可得2×2列联表为
45岁以下 45岁以上 合计
满意 35 60 95
不满意 65 40 105
合计 100 100 200
所以有99.9%的把握认为观众的满意度与年龄分布有关.
典例分析
湘教版选择性必修第二册
感谢聆听
解:=(120+108+…+99+108)=107.8,
=(84+64+…+57+71)=68,
=1202+1082+…+992+1082=116 584,
=842+642+…+572+712=47 384,
iyi=120×84+108×64+…+99×57+108×71
=73 796.
所以r=
≈0.750 6.
由此可看出这10名学生的两次数学成绩
具有线性相关关系.
(1)求y关于t的经验回归方程=t+;
又=55,iyi=120,
所以=1.2,=-=7.2-1.2×3=3.6.
故所求经验回归方程为=1.2x+3.6.
解:(1)由题意可知,n=5,=i==3,
=i==7.2.
(2)将t=11代入=1.2x+3.6,可得=1.2×11+3.6=16.8(千亿元),
经验回归方程是=-1.15x+28.1.
R2≈0.994,
yi-i
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
所以2=0.3, 2=53.2,
$$