内容正文:
9.2.4总体离散程度的估计
第九章 统计
1.理解方差、标准差含义,会计算样本方差、标准差。
会用样本方差、标准差估计总体离散程度,能对比数据稳定性。
了解分层随机抽样中方差的简单运算。
掌握与平均数及方差相关的线性运算的性质
2.体会用样本估计总体思想
3体会统计实用价值,养成严谨计算、理性分析的习惯。
教学目标
问题引入
问题:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
平均数,众数,中位数
如果你是教练,你如何对两位运动员的射击情况作出评价?
如果这是一次选拔性考核,你应当如何作出选择?
思考1:根据已知数据,选择哪个统计量来分析甲乙运动员的射击情况?
计算发现,甲、乙两名运动员射击成绩的平均数、中位数、众数都是7.
从这个角度看,两名运动员之间没有差别.
思考2:为了获取更多信息,你能借助恰当的统计图对数据进一步整理分析吗?
从条形图看,甲的成绩比较分散,波动较大;
乙的成绩比较集中,比较稳定.
环数
频率
0.4
0.3
0.2
0.1
4 5 6 7 8 9 10
O
(甲)
环数
频率
0.4
0.3
0.2
0.1
4 5 6 7 8 9 10
O
(乙)
思考3:如何度量成绩的这种差异(数据的“稳定”、“集中”)呢?
一种简单的度量数据离散程度的方法就是用极差.
根据甲、乙运动员的10次射击成绩,可以得到
甲命中环数的极差=10-4=6, 乙命中环数的极差=9-5=4.
甲:4 4 5 7 7 7 8 9 9 10
乙:5 6 6 7 7 7 7 8 8 9
但极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少,没有足够说服力。
可以发现甲的成绩波动范围比乙的大.
如果射击成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;
如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.
因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.
思考4:我们知道,平均数与样本的每一个数据有关,那么,数据的稳定性能不能依托每个数据和平均数的关系来描述?
探究新知
一、平均距离 :
假设一组数据是x1 , x2 , …,xn , 用 表示这组数据的平均数.我们用每个数据xi 与 平均数 的差的绝对值作为“距离”,即
可以得到这组数据x1 , x2 , …,xn 到 的平均距离
为了避免式中含有绝对值,通常改用平方来代替
二、方差:
样本各数据到平均数的距离的平方的平均值
化简上式可得:
三、标准差:
由于方差的单位是原始数据的单位的平方,与原始数据不一致.为了使二者单位一致,我们对方差开平方
方差的算术平方根
附:
(平方的均值减去均值的平方)
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为 ,则称 S 2=_______________为总体方差,S=________为总体标准差 .
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,
…,Yk,其中Yi出现的频数为fi(i=1,2,…, k),则总体方差为:
四、总体方差、总体标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 ,
则称 s2=_______________为样本方差,s=________为样本标准差 .
样本方差、样本标准差
思想:用样本标准差估计总体标准差
在刻画样本数据的分散程度上,方差和标准差效果是一样的,
但在解决实际问题时,一般多采用标准差。
五、方差和标准差的意义
标准差刻画了数据的离散程度或波动幅度:
标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小
注:s≥0;s=0时表示这组数据的每个数据都是相等的.
有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
求两位运动员射击成绩的标准差,并回答谁更稳定。
由s甲>s乙可知,乙比甲的射击成绩稳定
解决问题:
练习
1.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为( ).
A.√𝟐 B.1 C.√𝟑 D.2
2.某同学近5次考试的数学附加题的得分分别为30,26,32,27,35,则这组数据的方差为 .
3.不经过计算,你能给下列各组数的方差排序吗?
5,5,5,5,5,5,5,5,5
4,4,4,5,5,5,6,6,6
3,3,4,4,5,6,6,7,7
2,2,2,2,5,8,8,8,8
六、平均数、方差、标准差的性质
1.若样本数据x1,x2,…,x10的平均数为8,则2x1-1,2x2-1,…,2x10-1的平均数为( )
A.8 B.15 C.16 D.32
2.若样本数据x1,x2,…,x10的标准差为8,则2x1-1,2x2-1,…,2x10-1
的标准差为( )
A.8 B.15 C.16 D.32
数据 平均数 方差 标准差
x1,x2,…,xn
ax1,ax2,…,axn
ax1+b,ax2+b,…,axn+b
例6.在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62. 你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差做出估计吗?
代入数据得总样本方差为51.4862
七、分层随机抽样的方差和标准差
在分层随机抽样中,如果层数为2层,抽取的样本量分别m和n.
第一层为: x1,x2,…,xm,平均数记为 ,方差记为sx2 ;
第二层为: y1,y2,…,yn, 平均数记为 ,方差记为sy2,
总样本数据的平均数记为z,方差记为s2 . 则
甲、乙两只田径队的体检结果为:甲队的体重的平均数为60kg,方差为200,乙对体重的平均数为70kg,方差为300,又已知甲、乙两队的队员人数之比为1 : 4,求甲、乙两队全部队员的平均体重和方差。
练习
例7 根据下面100户居民用户的月均用水量数据,计算样本平均数和标准差。
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3
2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7
3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9
5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5
5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8
6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9
8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2
10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6
13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9
18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
平均数
标准差s≈6.20
标准差刻画了数据离平均数波动的幅度大小,计算下面式子的值,体会标准差对数据集中程度的
探究:
根据频率分布直方图求一组数据的方差的方法:
1.先求平均数:频率分布直方图每个矩形底边中点的横坐标与小矩形面积的乘积之和
2.再将平均数减去每组的底边中点值的平方后乘该组的频率求和
附:
小结:
总体离散程度的估计
1、方差与标准差的定义
2、方差与标准差的统计意义
3、分层抽样的方差与标准差
$