内容正文:
6.4 用样本估计总体
6.4.2 用样本估计总体的离散程度
第6章 统计学初步
复习引入
平均数、众数以及中位数作为一组数据的代表,刻画了该组数据的集中趋势.而数据的离散程度可以用极差、方差或标准差来描述.
在统计学中,我们将一组数据中的最大值与最小值统称为极值,将最大值与最值之差称为极差,也称全距,用表示.
例如,某地随机抽取个家庭,调查得到每个家庭的人均月收入(单位:元)为,,,,,,,,,
则个家庭人均月收人的极差(元).
新知探索
极差反映了一组数据变化的幅度,是描述数据离散程度的最简单的代表值,计算简单又易于理解,但它容易受极端值的影响.由于极差只利用了一组数据两端的信息,不能反映中间数据的离散状况,因而不能全面地描述数据的离散程度.
学校从甲、乙两名射击运动员中选拔一人参加市中学生运动会,
甲、乙两人参加测试的成绩(单位:环)如下:
甲:
乙:
教练员该如何选出合适选手?
新知探索
很自然地,我们首先考虑两人射击测试的平均成绩,经计算得
,,可见两人的平均成绩相同.
那么是否意味着两个人的射击水平没有差异呢?
我们可以将甲、乙的射击成绩表示在图中.
比较上面两幅图可以发现,甲的射击成绩大多集中在平均成绩环的附近,而乙的射击成绩与平均成绩比较,波动较大.
新知探索
统计上,常采用方差来刻画一组数据波动的大小:若设,,…,是总体的全部个体,是总体均值,则称为总体方差或方差.
总体方差刻画了总体中的个体向总体均值的集中或离散的程度;方差越小,表明个体与均值的距离越近,个体向集中得越好.
总体方差也刻画了总体中个体的稳定或波动的程度:方差越小,表明个体越整齐,波动越小.
新知探索
类似地,若从总体中随机抽样,获得个观测数据,…,,
用表示这个数据的均值,则称
为这个数据的样本方差,也简称为方差.
样本方差刻画了样本数据相对于样本均值集中或离散的程度.
样本方差依赖于样本的选取,带有随机性.如果样本是随机抽取的,当样本容量较大时,样本方差是总体方差的估计.
新知探索
下面,我们由获得的样本数据,并利用方差来分析甲、乙射击成绩的波动大小:
,
.
由于,可以估计甲的射击成绩比乙更稳定,故可推荐甲参加运动会.
例 5 某省农科院在某地区选择了自然条件相同的两个试验区,用相同的管理技术试种甲、乙两种水稻各亩.待水稻成熟,分别从甲、乙的亩水稻中随机抽取 亩水稻,它们的亩产量如下表所示.就产量这一指标来讲,试确定哪个品种的水稻在该地区更适合推广.
新知探索
分析 为选择合适的水稻品种,从产量这一指标而言,可以从样本的平均亩产量与产量的稳定性两个角度来衡量.
解 使用计算器可算出甲、乙品种各亩抽样水稻的平均亩产量为, .由于这亩水稻是随机抽取的,而这两种水稻的样本均值相差很小,从而我们可以估计大面积种植这两种水稻后的平均亩产量也应相差很小.
新知探索
借助计算器计算方差可得,.
由于,因此我们可以估计乙种水稻的亩产量要比甲种水稻稳定.综合以上两种因素,我们可以得出:在该地区,乙种水稻更有推广价值.
例析
例 6 某校高一年级有男生人,女生人.某统计小组为调查本年级学生身高情况,采取分层抽样的方法从总体中随机抽取样本,其中男生抽取人,女生抽取人.将男生组看作样本,计算出样本的平均身高为,方差为;将女生组看作样本,计算出样本的平均身高为,方差为.试根据以上数据计算由,组成的样本的方差,并估计总体方差.
分析 按分层抽样获取的样本分为两层:男生组与女生组.现已知男生组样本和女生组样本的均值与方差,借助方差的定义可计算出分层抽样样本的方差,进而估计总体方差.
新知探索
解 设从男生中抽出的样本个体为…,均值记为,方差记为;从女生中抽取的样本个体为…,均值记为,方差记为.
先计算总体样本均值:
;
再计算总体样本方差:
新知探索
于是可以估计该校高一年级学生身高的方差为.
.
新知探索
分层抽样在获得总体方差估计的同时,也得到各层的方差估计.
从例可知,如果将总体分为两层,第一、二层的样本量分别为,,样本均值分别为,,样本方差分别为,,则全部样本的样本容量、样本均值和样本方差分别为,,
.
如果将总体分为层,第层抽取的样本为,,…,,第层的样本容量为,样本均值为,样本方差为,.记,你能计算出全部样本的均值和方差吗?
新知探索
方差充分利用所有数据,并且仅用一个数值来刻画一组数据的离散程度,但方差也有局限性,如方差的单位是观测数据的单位的平方,而刻画离散程度的一种理想度量应当具有与观测数据相同的单位.解决这一局限性的方法就是引入标准差.
标准差是方差的算术平方根.
如果是总体方差,则称是总体标准差;
如果是总体方差,则称是样本标准差.
新知探索
给定数据,,和均值.由方差计算公式知道,样本标准差可以用下面的公式计算:.
标准差是方差的算术平方根.
显然,在刻画观测数据的离散程度上,方差与标准差是一样的.在对许多实际问题进行分析时,人们更多地使用标准差.
样本标准差依赖于样本的选取,也带有随机性,样本方差是总体方差的估计.样本标准差是总体标准差的估计.
例析
例 7 一台机床生产一种直径为的零件,在正常生产时,零件的直径的标准差不应超过.如果超过,则机床应检修调整.
下表是某日及两个时段中各随机抽取个零件量出的直径的数值(单位:):
试判断在这两个时段内机床生产是否正常.
分析 判断机床生产是否正常可以从样本的均值与标准差两个角度来衡量.
例析
解 设为甲时段,为乙时段.
用计算器计算可得,,.,.
从样本均值看,两个时段生产的零件尺寸差异性不大;从样本标准差看,,这说明甲时段()机床生产不正常,而经过调试,机床在乙时段()生产正常:生产的零件稳定程度高,且在质量控制范围内.
在工业生产中,平均数和标准差是监测产品质量的重要指标.若样本的平均数或标准差超过了规定的界限,说明这批产品的质量可能距生产要求有较大偏离,应检查并找出原因,及时解决问题.
练习
题型一:方差和标准差的计算
例1.甲、乙两机床同时加工直径为100的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
练习
甲:99 100 98 100 100 103 乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
解(1):
,
(2)两台机床加工零件的直径的平均值相同,又,所以乙机床加工零件的质量更稳定.
练习
方法技巧:
标准差、方差的意义
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差,方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小,标准差的大小不会超过极差.
(2)标准差、方差的取值范围是.标准差,方差为0时,样本各数距相等,说明数据没有波动幅度,数据没有离散性.
练习
变1.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
则成绩较为稳定(方差较小)的那位运动员成绩的方差为_____.
答案:2.
运动员 第1次 第2次
第3次
第4次
第5次
甲 87 91 90 89 93
乙 89 90 91 88 92
练习
题型二:分层随机抽样的方差和标准差
例2.甲、乙两只田径队的体检结果为:甲队的体重的平均数为60,方差为200,乙对体重的平均数为70,方差为300,又已知甲、乙两队的队员人数之比为1 : 4,那么甲、乙两队全部队员的平均体重和方差分别是什么?
解:由题意可知甲队队员在所有队员中所占权重为,乙队队员在所有队员中所占权重为则甲、乙两队全部队员的平均体重为,
甲乙两队全部队员的体重的方差为
练习
方法技巧:
计算分层随机抽样的方差的步骤
(1)确定,,,;
(2)确定;
(3)应用公式计算.
练习
变2.已知某省二、三、四线城市数量之比为1:3:6,2020年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.7万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市的房价的方差为_____.
答案:117.98.
解:设二线城市的房价的方差为,由题意可知,
,解得,即二线城市的房价的方差为117.98.
课堂小结&作业
课堂小结:
(1)极差;
(2)方差、标准差.
作业:
(1)整理本节课的题型;
(2)课本P241的练习1——3题.
谢谢学习
Thank you for learning
$$