内容正文:
5.1.4 用样本估计总体
课程标准
学科素养
理解并会运用样本的数字特征估计总体的数字特征,用样本的分布估计总体的分布,通过实例体会其意义和作用.
通过对用样本估计总体的学习,强化数据分析、数学运算、数学建模的核心素养.
[对应学生用书P54]
知识点1 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
1.下列判断正确的是( )
A.样本平均数一定小于总体平均数
B.样本平均数一定大于总体平均数
C.样本平均数一定等于总体平均数
D.样本量越大,样本平均数越接近总体平均数
答案:D
2.某医院急诊中心关于病人等待急诊的时间记录如下:
等待时间/min
5
10
15
20
21
频数
1
8
5
2
1
则病人候诊时间的平均数为________.
13 解析:甲=i= (1×5+8×10+5×15+2×20+1×21)=13.
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.
1.如何从频率分布直方图中估计中位数?
提示 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
2.在条形统计图中怎样估计众数?
提示 众数是最高矩形的中点的横坐标.
3.怎样估计平均数?
提示 平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.
凡是可以被“数据化”的信息载体都可以看成数据.信息载体包括的数据量达到一定的规模或者达到一定的复杂程度,都可以被认为是“大数据”.
(教材改编)样本容量为100的频率分布直方图如图所示,根据样本频率分布直方图,则平均数为________.
14.24 解析:平均数=10×0.06+12×0.20+14×0.40+16×0.24+18×0.10=14.24.
[对应学生用书P55]
对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(m/s)如下:
甲:27,38,30,37,35,31
乙:33,29,38,34,28,36
根据以上数据,试判断他们谁的成绩比较稳定.
解:=×(27+38+30+37+35+31)=33,
s=×[(27-33)2+(38-33)2+…+(31-33)2]
=×94≈15.7,
=×(33+29+38+34+28+36)=33,
s=×[(33-33)2+(29-33)2+…+(36-33)2]
=×76≈12.7.
所以=,s>s,
这说明甲、乙两运动员的最大速度的平均值相同,但乙的成绩比甲的稳定,故乙的成绩比较稳定.
在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差).方差大说明取值离散程度大,方差小说明取值离散程度小或者取值集中、稳定
[训练1] 抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员
第1次
第2次
第3次
第4次
第5次
甲
87
91
90
89
93
乙
89
90
91
88
92
则成绩较为稳定的那位运动员成绩的方差为________.
2 解析:由表中数据计算可得x甲=90,x乙=90,且
s=[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,
s=[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
由于s>s,故乙的成绩较为稳定,其方差为2.
探究二 用样本平均数和样本标准差估计总体
某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)的开支,在全校8 000名学生中用分层随机抽样抽出了一个200人的样本,根据学生科的统计,本科生人数为全校学生的70%,调查最近一个学期课外进修支出(元)的结果如下:
层
样本量
样本均值
样本方差
本科
140
253.4
231
研究
60
329.4
367
试估计全校学生用于课外进修的平均开支和开支的方差.
解:把本科生样本记为x1,x2,…,x140,其平均数记为,方差记为s;把研究生记为y1,y2,…,y60,其平均数为,方差记为s;把总体数据的平均数记为,方差记为s2.则=i,s= -2;
=j,s=-2.
所以=140(s+2),=60(s+2).
总样本平均数为:
=×253.4+×329.4=276.2(元)
总样本方差为:s2=(+)-2
=-2.
=-276.22=1 484.76.
由于分层随机抽样是按比例分配的,所以可以估计全校学生用于课外进修的平均开支为276.2元,开支的方差为1 484.76.
1.计算样本平均数、样本方差直接利用公式,注意公式的变形,样本方差
2.在按比例分配分层随机抽样中,我们可以用样本平均数和样本方差估计总体平均数和总体方差.
[训练2] 在一个文艺比赛中,8名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分.在给某选手的打分中,专业人士打分的平均数和标准差分别为47.4和3.7,观众代表打分的平均数和标准差为56.2和11.8,试根据这些数据计算这名选手得分的平均数和标准差.
解:把专业人士打分样本记为x1,x2,…,x8,其平均数记为,方差记为s;把观众代表打分样本记为y1,y2,…,y12,其平均数为,方差记为s;把总体数据的平均数记为,方差记为s2.
则总样本平均数为:
=
=107.6,总样本标准差s≈10.37.
所以计算这名选手得分的平均数为52.68分,标准差约为10.37.
探究三 在频率分布直方图中求平均数、中位数、众数
某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数;
(3)求这次测试数学成绩的平均分.
解:(1)由图知众数为=75.
(2)由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),
所以x≈73.3.
(3)由图知这次数学成绩的平均分为:
×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
[变式] 本例条件不变,试估计80分以上的学生人数.
解:[80,90)分的频率为:0.025×10=0.25,
频数为:0.25×80=20.
[90,100]分的频率为:0.005×10=0.05,
频数为:0.05×80=4.
所以估计80分以上的学生人数为20+4=24.
1.众数、中位数、平均数与频率分布表、频率分布直方图的关系
(1)众数:众数一般用频率分布表中频率最高的一小组的组中值来表示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数值的频率叫作该数值点的累计频率)为0.5时所对应的样本数据的值,而在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等
(3)平均数:平均数在频率分布直方图中等于每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.又平均数是频率分布直方图的“重心”.
2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数
[训练3] 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.
求:(1)高一参赛学生的成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解:(1)由图可知众数为65,又∵第一个小矩形的面积为0.3,
∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,
∴中位数为60+5=65.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩为67分.
[对应学生用书P57]
1.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为( )
A.4.55 B.4.5
C.12.5 D.1.64
答案:A
2.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:
班级
人数
平均分数
方差
甲
20
甲
2
乙
30
乙
3
其中甲=乙,则两个班数学成绩的方差为( )
A.3 B.2
C.2.6 D.2.5
答案:C
3.(多选题)甲、乙两人的各科成绩如茎叶图所示,则下列说法正确的是( )
A.甲、乙两人的各科成绩的平均分相同
B.甲成绩的中位数是83,乙成绩的中位数是85
C.甲各科成绩比乙各科成绩稳定
D.甲成绩的众数是89,乙成绩的众数是87
答案:ABC
4.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为________.
答案:
学科网(北京)股份有限公司
$$