内容正文:
14.4.2
用样本估计总体的离散程度参数
第十四章
统计
学 习 目 标
1
2
3
理解极差、方差、标准差的定义,掌握三者刻画数据离散程度(稳定性)的核心意义;
熟练掌握原始数据的方差、标准差计算公式,能运用组中值计算分组数据的方差和标准差;
能运用样本方差、标准差估计总体的离散程度,结合集中趋势参数全面分析数据特征.
新课导入
在前面的课程中,我们学习了用平均数、众数、中位数刻画数据的集中趋势,也就是数据的“平均水平”.但只看平均水平够吗?
甲、乙两种钢筋各抽取 10 根,测得抗拉强度(单位:MPa):
甲:
乙.
你能计算甲、乙两种钢筋的平均强度吗?
新课导入
甲的数据更集中,乙的数据更分散.
两种钢筋的平均抗拉强度都是 128MPa,能说它们的质量一样好吗?
数据的分散程度称为离散程度
刻画离散程度的参数有极差、方差、标准差.
本节课我们学习如何用这些参数估计总体的离散程度.
新知探究
甲 110 120 130 125 120 125 135 125 135 125
乙 115 100 125 130 115 125 125 145 125 145
探究一:极差
有甲、乙两种钢筋,现从中各抽取一个样本(如表 )检查它们的抗拉强度(单位:kg/mm²),通过计算发现,两个样本的平均数均为 125 kg/mm².
将甲、乙两个样本数据分别标在数轴上,如图所示.
哪种钢筋的质量较好?
新知探究
从图中可以看出,乙样本的最小值 100 低于甲样本的最小值 110
乙样本的最大值 145 高于甲样本的最大值 135
这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.
我们把一组数据的最大值与最小值的差称为极差.
甲极差 = 135-110=25,乙极差 = 145-100=45.
结论:乙的极差更大,数据更分散,甲更稳定.
知识小结
极差
极差定义:一组数据的最大值与最小值的差
优点:计算简单,能快速反映数据的波动范围.
缺点:只利用了最值两个数据,不能反映中间数据的离散程度;易受极端值影响
7
探究二:方差与标准差
新知探究
极差还是极易受到极端数据的影响,那么该用什么数据刻画一组数据的离散程度呢?
用每个数据与平均数的离差之和表示离散程度,但离差有正有负,和为 0;用离差的绝对值之和计算不方便;因此用离差的平方和.
定义:设样本数据,平均数为,则样本方差
方差越大,离差平方和越大,数据越分散,越不稳定。
新知探究
因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,所以我们将方差的算术平方根称为这组数据的标准差.
方差的算术平方根,
①标准差的单位与原始数据一致,更直观
②方差和标准差刻画离散程度的效果一致
即时训练
1.为评估某种新型水稻的种植效果,选择了n块面积相等的试验稻田.这块稻田的亩产量(单位:)分别为,下列统计量中,能用来评估这种新型水稻亩产量稳定程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的众数 D.样本的平均数
【分析】根据标准差的含义判断即可.
【详解】标准差刻画了数据的离散程度,故A正确.
故选:A.
A
即时训练
2.若样本数据,,,的方差为32,则数据的方差为( )
A.16 B.8 C.13 D.5
【分析】根据方差的性质进行求解即可.
【详解】因为样本数据的方差为32
所以数据的方差为
.
故选:B
B
知识小结
方差与标准差
设一组样本数据 ,其平均数为 ,则称
为这个样本的方差,其算术平方根 为样本的标准差,分别简称样本方差、样本标准差。
12
品种 第 1 年 第 2 年 第 3 年 第 4 年 第 5 年
甲
乙
典例分析
例1
甲、乙两种水稻试验品种连续 5 年的平均单位面积产量(单位:t/hm²)如表 所示,试根据这组数据估计哪一种水稻品种的产量比较稳定.
【分析】通过计算甲、乙两种水稻产量的平均数与方差,比较方差大小,方差越小说明数据波动越小、产量越稳定.
解:甲品种的样本平均数为10,样本方差为
乙品种的样本平均数也为10,样本方差为
因为,所以由这组数据可以认为甲种水稻的产量比较稳定。
典例分析
典例分析
例2
为了保护学生的视力,教室内的日光灯在使用一段时间后 必须更换.已知某校使用的 100 只日光灯在必须换掉前的使用天数如所示,试估计这种日光灯的平均使用寿命和标准差.
使用天数 451~480 481~510 511~540 541~570 571~600 601~630 631~660 661~690
日光灯数 1 11 18 20 25 16 7 2
【分析】用每一区间 的组中值作为相应日光灯的使用寿命,再求平均使用寿命.
解:各区间 的组中值分别为 ,,,,,,,,
由此算得平均数约为
典例分析
典例分析
这些组中值的方差为
故所求的标准差为 .
答:估计这种日光灯的平均使用寿命约为 天,标准差约 天.
巩固提升
题型1 求标准差
1.若数据的方差为25,则数据的标准差为( )
A.225 B.76 C.75 D.15
【分析】根据数据的方差的性质,可得的方差,继而得其标准差,即得答案.
【详解】∵若的方差为,则的方差为,
∴数据的方差为25,
则数据的方差为,
故数据的标准差为
故选:D
D
巩固提升
题型2 求方差
2.小明体育测验6次立定跳远成绩分别为214,213,214,215,216,212,则6次成绩的平均值与方差为( )
A.213,1.67 B.214,1.66 C.214,1.29 D.214,1.67
【分析】根据已知数据得平均数,方差运算解决即可.
【详解】由题知,
6个数分别减去214,得0,,0,1,2,,这6个数的平均数为0,
所以6个数平均数为214,
又,
所以方差为1.67,
故选:D.
D
巩固提升
题型3 利用方差或标准差解决实际问题
3.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场的进球数是3.2,全年进球数的标准差为3;乙队平均每场的进球数是1.8,全年进球数的标准差为0.3.下列说法中正确的是 ( )
A.乙队的技术比甲队好
B.乙队发挥比甲队稳定
C.乙队几乎每场都进球
D.甲队的表现时好时坏
【分析】根据平均数、方差的知识,对四个说法逐一分析,由此得出正确选项.
巩固提升
题型3 利用方差或标准差解决实际问题
【详解】因为甲队每场进球数为,乙队平均每场进球数为,
甲队平均数大于乙队较多,所以甲队技术比乙队好,所以A不正确;
因为甲队全年比赛进球个数的标准差为,乙队全年进球数的标准差为,
乙队的标准差小于甲队,所以乙队比甲队稳定,所以B正确;
因为乙队的标准差为,说明每次进球数接近平均值,
乙队几乎每场都进球,甲队标准差为,
说明甲队表现时好时坏,所以C,D正确,
故选:BCD.
课堂总结
一起来看看这节课我们学到了些什么?
点击图标,进入本节课的课堂总结
要点回顾
感谢聆听!
课堂小结
样本估计总体离散程度
知识点回顾
易错点警示
解题技巧
知识点回顾
1. 极差 (Range)
一组数据中最大值与最小值的差,反映了数据的 波动范围。
2. 方差 (Variance)
设一组样本数据为 x₁, x₂, ..., xₙ,其平均数为 x̄,则样本方差 s² 为:
s² = 1n[(x₁ - x̄)² + (x₂ - x̄)² + ... + (xₙ - x̄)²]
方差反映了数据相对于平均数的 离散程度。
3. 标准差 (Standard Deviation)
样本标准差 s 是方差的 算术平方根:
s = √s²
标准差的单位与原数据的单位 一致。
易错点警示
单位问题: 方差的单位是原数据单位的 平方,而标准差的单位与原数据相同。在实际问题中要注意单位的合理性。
极差的局限性: 极差只利用了数据中的两个极端值,不能反映中间数据的 分布情况,容易受极端值影响。
计算平均数: 计算方差前必须先准确求出 平均数,平均数的错误会导致后续所有计算失效。
离散程度的含义: 方差或标准差越 小,说明数据越稳定,波动越小。
解题技巧
1. 数据平移与伸缩性质
若数据 x₁, x₂, ..., xₙ 的方差为 s²,则:
新数据 x₁ + a, x₂ + a, ..., xₙ + a 的方差仍为 s²。
新数据 ax₁, ax₂, ..., axₙ 的方差为 a²s²。
2. 简化计算法
当原始数据较大时,可以先将所有数据减去一个接近平均数的常数 a,计算新数据的方差,其结果与原数据方差 相等。
3. 决策模型
在比较两组数据的优劣时,通常遵循:先看 平均数(反映水平),若平均数相同,再看 方差(反映稳定性)。
$