内容正文:
6.4.2 用样本估计总体的离散程度(强基课—梯度进阶式教学)
课时目标
1.结合实例能用样本估计总体的离散程度参数(极差、方差、标准差).会求样本的方差、标准差.
2.理解离散程度参数的统计含义,能用样本的统计量估计总体的统计量,并做出合理解释和决策.
1.极差
我们将一组数据中的最大值与最小值统称为极值,将最大值与最小值之差称为极差,也称全距,用R表示.
2.方差
若设y1,y2,…,yN是总体的全部个体,μ是总体均值,则称σ2=为总体方差或方差.
若从总体中随机抽样,获得n个观测数据x1,x2,…,xn,用表示这n个数据的均值,则称s2=[(x1-)2+(x2-)2+…+(xn-)2]为这n个数据的样本方差,也简称为方差.
3.分层抽样的方差
如果将总体分为两层,第一、二层的样本量分别为n1,n2,样本均值分别为1,2,样本方差分别为s,s,则全部样本的样本容量、样本均值和样本方差分别为
n=n1+n2,
=(n11+n22),
s2=.
4.标准差
标准差是方差的算术平方根,
如果σ2是总体方差,则称σ=是总体标准差;
如果s2是样本方差,则称s=是样本标准差.
给定数据x1,x2,…,xn,则
s= .
微点助解
(1)极差反映一组数据变化的幅度,易受极端的影响,不能反映中间数据的离散状况,不能全面描述数据的离散程度.
(2)方差刻画了总体中的个体向总体均值的集中或离散的程度:方差越小,表明个体与均值的距离越近,个体向均值集中得越好.方差也刻画了总体中个体的稳定或波动的程度:方差越小,表明个体越整齐,波动越小.
[基点训练]
1.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数中有一个数据的个位数模糊,无法辨认,以x表示,9个分数分别为87,87,94,90,91,90,9x,99,91.则7个剩余分数的方差为( )
A. B.
C.36 D.
解析:选B 由题意知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4.
故s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
2.在教学调查中,甲、乙、丙三个班的数学测试成绩分布如图,假设三个班的平均分都是75分,s1,s2,s3分别表示甲、乙、丙三个班数学测试成绩的标准差,则有( )
A.s3>s1>s2 B.s2>s1>s3
C.s1>s2>s3 D.s3>s2>s1
解析:选D 所给图是成绩分布图,平均分是75分,在题图甲中,集中在75分附近的数据最多,题图丙中从50分到100分均匀分布,所有成绩不集中在任何一个数据附近,题图乙介于两者之间.由标准差的意义可得s3>s2>s1.
题型(一) 方差和标准差的计算
[典例] 为调查家庭人口数,从某小区抽取了263户家庭,人口数表示如下:
家庭人口数
1
2
3
4
5
6
7
8
9
10
家庭数
20
29
48
50
46
36
19
8
4
3
求该样本的平均数、中位数、方差和标准差.(精确到0.01)
[解] 根据题意,该样本的平均数为=(1×20+2×29+3×48+4×50+5×46+6×36+7×19+8×8+9×4+10×3)=≈4.30;
因为20+29+48=97<,97+50=147>,所以该样本的中位数为4.
该样本的方差为s2=(20×3.32+29×2.32+48×1.32+50×0.32+46×0.72+36×1.72+19×2.72+8×3.72+4×4.72+3×5.72)≈3.87;
因为1.972=3.880 9,1.982=3.920 4,
所以该样本的标准差为s==≈1.97.
[方法技巧]
标准差、方差的意义
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小,标准差的大小不会超过极差.
(2)标准差、方差的取值范围为[0,+∞).标准差、方差为0时,样本各数据相等,说明数据没有波动幅度,数据没有离散性.
[针对训练]
1.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数x及其方差s2如下表所示,则选送决赛的最佳人选应是( )
甲
乙
丙
丁
x
7
8
8
7
s2
6.3
6.3
7
8.7
A.甲 B.乙
C.丙 D.丁
解析:选B 因为乙=丙>甲=丁,且s=s<s<s,故应选择乙进入决赛.
2.某校高一(1)班50名学生在世界环境日这一天调查了各自家庭丢弃旧塑料袋的情况,得到有关数据如下表:
每户丢弃旧塑料袋个数
2
3
4
5
户数