内容正文:
9.2.4 总体离散程度的估计
第九章 统 计
9.2 用样本估计总体
一
二
三
学习目标
知道极差 方差 标准差可以刻画数据的离散程度,反应数据的稳定性
会算方差和标准差
能用平均值 中位数 众数和极差、方差、标准差对数据进行比较和评价
学习目标
平均数、中位数、众数各自的含义、特点及优缺点:
平均数 中位数 众数
在频率分布直方图中的含义
特点
优点
缺点
每个小矩形面积乘以小矩形底边中点的横坐标之和
与每一个数据有关,任何一个数的改变都会引起它的改变
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
只利用了样本数据中间位置的一个或两个值,并未利用其他数据
最高矩形底边中点的横坐标
只利用了出现次数最多的那个值的信息
受极端数据的影响较大.
代表了样本数据更多的信息.
只能表达样本数据中的少量信息.
容易计算,不受少数几个极端值的影响.
复习回顾
这节课学习数据的另一大重要特征:离散程度
新课导入
平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法,但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策.
?
离散程度简单理解就是数据聚在一块还是分散开!
聚在一块
分散开
福建
温度 15 14 16 14 17 15 15.5 16 14 17 天 1 2 3 4 5 6 7 8 9 10
武汉
12 24 27 10 12 28 10 13 20 24
新知探究
问题1 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
追问1 甲、乙两人本次射击成绩的平均数、中位数、众数分别为多少环?
追问2 观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?
甲成绩比较分散乙成绩相对集中
都是7
环数
频率
0.4
0.3
0.2
0.1
4 5 6 7 8 9 10
O
(甲)
环数
频率
0.4
0.3
0.2
0.1
4 5 6 7 8 9 10
O
(乙)
新知探究
问题2 上述问题中,甲、乙的平均数、中位数、众数相同,但二者的射击成绩存在差异,那么,如何度量这种差异呢?
我们可以利用极差进行度量。
根据上述数据计算得:甲的极差=10-4=6 乙的极差=9-5=4
极差在一定程度上刻画了数据的离散程度。
由极差发现甲的成绩波动范围比乙的大。
但由于极差只使用了数据中最大、最小两个值的信息,所含的信息量很少。也就是说,极差度量出的差异误差较大。
追问:你还能想出其他刻画数据离散程度的办法吗?
我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;
相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.
因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.
新知探究
新知探究
问题3 如何定义“平均距离”?
概念生成
我们称(1)式为这组数据的方差 . 有时为了计算方便,我们还把方差写成以下形式
由于方差的单位是原始数据的单位的平方,与原始数据不一致 . 为了使二者单位一致,我们对方差开方,取它的算数平方根,即
我们称(2)式为这组数据的标准差.
思考 标准差的取值范围是什么?标准差为0的一组数据有什么特点?
标准差的取值范围是[0, +∞),
标准差为0的样本所有数据都相等.
总体方差、总体标准差
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为 ,则称 S 2=_______________为总体方差,S=________为总体标准差 .
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,
Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…, k),则总体方差为
样本方差、样本标准差的定义
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 ,则称 s2=_______________为样本方差,s=________为样本标准差 .
概念生成
10
特征:
标准差和方差刻画了数据的____ __程度或波动幅度.
标准差(或方差)越大,数据的离散程度越____,越不稳定;
标准差(或方差)越小,数据的离散程度越____,越稳定.
在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用 .
离散
大
小
标准差
在实际问题中,总体平均数和总体标准差都是未知的. 就像用样本平均数估计总体平均数一样,通常我们也用样本标准差去估计总体标准差. 在随机抽样中,样本标准差依赖于样本的选取,具有随机性.
问题4 标准差和方差是怎样刻画数据的离散程度的?
新知探究
11
新知探究
问题1 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
追问 甲、乙两人射击谁比较稳定?
甲的成绩离散程度大,乙的成绩离散程度小.
由此可以估计,乙比甲的射击成绩稳定.
计算可得:
如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置.如果两人都排在前面,就选成绩稳定的乙选手,否则可以选甲.
巩固练习
课本P215
1. 不经过计算,你能给下列各组数的方差排序吗?
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.
解:
典例解析
例 在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高作出估计吗?
解:把男生样本记为: x1,x2,…,x23,平均数记为x,方差记为sx2 ;
把女生样本记为: y1,y2,…,y27,平均数记为y,方差记为sy2 ;
把总样本数据的平均数记为z,方差记为s2 . 则
根据方差的定义,总样本方差为
典例解析
典例解析
根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为
∴总样本的方差为51.4682,估计高一年级全体学生的身高的方差为51.4862.
分层抽样总样本方差的计算
归纳小结
(以分两层的样本为例)
把第一层样本记为: x1,x2,…,xm,平均数记为x,方差记为sx2 ;
把第二层样本记为: y1,y2,…,yn,平均数记为y,方差记为sy2 ;
把总样本数据的平均数记为z,方差记为s2 . 则
新知探究
样本标准差刻画了数据离平均数波动的幅度大小 ,平均数和标准差一起能反映数据取值的信息.
例如,根据9.2.1节中100户居民用户的月均用水量数据,可以计算出样本平均数和样本标准差分别为
可以发现,这100个数据中大部分落在区间 =[2.59,14.99]内 ,在区间 =[-3.61,21.19]外的只有7 个.也就是说,绝大部分数据落在 内.
巩固练习
课本P215
5.某学校有高中学生500人,其中男生320人,女生180人,有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位: cm ),计算得男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03.
(1)根据以上信息,能够计算出总样本的均值和方差吗?为什么?
(2)如果已知男、女样本量按比例分配,你能计算出总样本的均值和方差各为多少吗?
(3)如果已知男、女的样本量都是25,你能计算出总样本的均值和方差各为多少吗?它们分别作为总体均值和方差的估计合适吗?为什么?
例 已知一组数据为: x1,x2,…,xn,平均数记为x,方差记为sx2 ,标准差为s,计算下列各组数据的平均数,方差和标准差。
典例解析
例 已知一组数据为: x1,x2,…,xn,平均数记为x,方差记为sx2 ,标准差为s,计算下列各组数据的平均数,方差和标准差。
典例解析
例 已知一组数据为: x1,x2,…,xn,平均数记为x,方差记为sx2 ,标准差为s,计算下列各组数据的平均数,方差和标准差。
典例解析
平均数、方差性质
归纳小结
课堂小结
本节课你学会了哪些主要内容?
1.用定义计算样本方差和样本标准差
2.分层抽样总样本方差的计算
3. 标准差与方差的特征:
(1)标准差、方差描述了一组数据围绕平均数波动的大小.
标准差、方差越大,数据的离散程度越大 ;
标准差、方差越小 , 数据的离散程度越小;
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性;
(3)标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差;
(4)标准差的单位与样本数据一致.
3. 标准差与方差的特征:
课堂小结
$$