内容正文:
5.1.4 用样本估计总体
课程标准
学科素养
理解并会运用样本的数字特征估计总体的数字特征,用样本的分布估计总体的分布,通过实例体会其意义和作用.
通过对用样本估计总体的学习,强化数据分析、数学运算、数学建模的核心素养.
知识点1 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
[微体验]
1.下列判断正确的是( )
A.样本平均数一定小于总体平均数
B.样本平均数一定大于总体平均数
C.样本平均数一定等于总体平均数
D.样本量越大,样本平均数越接近总体平均数
答案 D
2.某医院急诊中心关于病人等待急诊的时间记录如下:
等待时间/min
5
10
15
20
21
频数
1
8
5
2
1[来源:学科网]
则病人候诊时间的平均数为________.
13 [甲=i= (1×5+8×10+5×15+2×20+1×21)=13.]
知识点2 用样本的分布来估计总体的分布
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.
[微思考]
1.如何从频率分布直方图中估计中位数?
提示 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
2.在条形统计图中怎样估计众数?
提示 众数是最高矩形的中点的横坐标.
3.怎样估计平均数?
提示 平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.
探究一 方差估计总体
对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(m/s)如下:
甲:27,38,30,37,35,31
乙:33,29,38,34,28,36
根据以上数据,试判断他们谁的成绩比较稳定.
解 甲=×(27+38+30+37+35+31)=33,
s=×[(27-33)2+(38-33)2+…+(31-33)2]=×94≈15.7,
乙=×(33+29+38+34+28+36)=33,
s=×[(33-33)2+(29-33)2+…+(36-33)2]=×76≈12.7.
所以甲=乙,s>s,
这说明甲、乙两运动员的最大速度的平均值相同,但乙的成绩比甲的稳定,故乙的成绩比较稳定.
[方法总结]
在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差).方差大说明取值离散程度大,方差小说明取值离散程度小或者取值集中、稳定. ,
[跟踪训练1] 抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员
第1次
第2次
第3次
第4次
第5次
甲
87
91
90
89
93
乙
89
90
91
88
92
则成绩较为稳定的那位运动员成绩的方差为________.
2 [由表中数据计算可得甲=90,乙=90,且
s=[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,[来源:学科网]
s=[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
由于s>s,故乙的成绩较为稳定,其方差为2.]
探究二 用样本平均数和样本标准差估计总体
某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)的开支,在全校8 000名学生中用分层随机抽样抽出了一个200人的样本,根据学生科的统计,本科生人数为全校学生的70%,调查最近一个学期课外进修支出(元)的结果如下:
层
样本量
样本均值
样本方差
本科
140
253.4
231
研究
60
329.4
367
试估计全校学生用于课外进修的平均开支和开支的方差.
解 把本科生样本记为x1,x2,…,x140,其平均数记为,方差记为s;把研究生记为y1,y2,…,y60,其平均数为,方差记为s;把总体数据的平均数记为,方差记为s2.则=i,s= -2;
=j,s=-2.
所以=140,=60.
总样本平均数为:
=×253.4+×329.4=276.2(元)
总样本方差为:s2=-2
=-2.
=-276.22=1 484.76.
由于分层随机抽样是按比例分配的,所以可以估计全校学生用于课外进修的平均开支为276.2元,开支的方差为1 484.76.
[方法总结]
1.计算样本平均数、样本方差直接利用公式,注意公式的变形,样本方差s2=2=-2.
2.在按比例分配分层随机抽样中,我们可以用样本平均数和样本方差估计总体平均数和总体