内容正文:
9.2 用样本估计总体
9.2.1 总体取值规律的估计
第一课时 总体取值规律的估计
第九章 统计
学习单元8 随机抽样 用样本估计总体
[学习目标] 1.掌握频率分布表的作法以及频率分布直方图的画法. 2.掌握用频率分布直方图估计总体. 3.能根据频率分布表和频率分布直方图观测数据的分布规律.
知识点1 频率分布直方图
内容索引
知识点2 频率分布直方图的应用
课堂达标·素养提升
课时作业 巩固提升
3
知识点1 频率分布直方图
作频率分布直方图的步骤
(1)求极差
极差为一组数据中最大值与最小值的________.
差
(2)决定组距与组数
将数据分组时,一般取________组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.当样本量不超过100时,常分成5~12组.
(3)将数据分组
按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.
等长
(4)列频率分布表
一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本量,频率合计是1.
各小组的频率=.
高度
从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
例1
[解] (1)频率分布表如下.
成绩分组 频数累计 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 正正 10 0.2
[70,80) 正正正 15 0.3
[80,90) 正正 12 0.24
[90,100] 正 8 0.16
合计 50 1.00
(2)画出频率分布直方图;
[解] (2)画出频率分布直方图,如图所示.
(3)估计成绩在[60,90)的学生比例.
[解] (3)学生成绩在[60,90)的频率为0.2+0.3+0.24=0.74=74%,所以估计成绩在[60,90)的学生比例为74%.
在绘制出频率分布表以后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“”所占的比例来定高.
思维提升
1.某家庭记录了50天的日用水量数据(单位:m3),得到频数分布表如下:
50天的日用水量频数分布表
跟踪训练
日用
水量 [0,0.1) [0.1,
0.2) [0.2,
0.3) [0.3,
0.4) [0.4,
0.5) [0.5,
0.6]
频数 1 5 13 10 16 5
(1)作出50天的日用水量数据的频率分布直方图;
解:(1)
(2)估计日用水量小于0.35 m3的频率.
解: (2)由题可知用水量在[0.3,0.4)的频数为10,所以可估计在[0.3,0.35)的频数为5,故用水量小于0.35 m3的频数为1+5+13+5=24,其频率==0.48.
知识点2 频率分布直方图的应用
为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示).图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
例2
(1)第二小组的频率是多少?样本容量是多少?
[分析] 根据频率分布直方图,求出各小组的频率,然后在计算.
[解] (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本容量==150.
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
[分析] 根据频率分布直方图,求出各小组的频率,然后在计算.
[解] (2)由频率分布直方图可估计该校高一年级学生的达标率为×100%=88%.
(3)试求样本中不达标的学生人数.
[分析] 根据频率分布直方图,求出各小组的频率,然后在计算.
[解] (3)样本的达标率为88%,样本容量为150,不达标的学生频率为1-0.88=0.12,所以样本中不达标的学生人数为150×0.12=18.
(4)试求次数在130以上(含130次)的学生人数.
[分析] 根据频率分布直方图,求出各小组的频率,然后在计算.
[解] (4)次数在130以上(含130次)的学生人数为
×150=36.
频率分布直方图的性质
1.因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
思维提升
2.=样本容量.
3.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
2.为了了解某工厂生产的产品情况,从该工厂生产的产品中随机抽取了一个容量为200的样本,测量它们的尺寸(单位:mm),并将数据分为[92,94),[94,96),[96,98),[98,100),[100,102),[102,104),[104,106]七组,其频率分布直方图如图所示.
跟踪训练
(1)求图中的x值.
解:(1)由(0.02+0.04+0.06+0.07+0.09+0.10+x)×2=1,解得x=0.12.
(2)根据频率分布直方图,求200件样本中尺寸在[98,100)内的样本数.
解: (2)200件样本中尺寸在[98,100)内的样本数为200×0.09×2=36.
(3)记产品尺寸在[98,102)内为A等品,每件可获利5元;产品尺寸在[92,94)内为不合格品,每件亏损2元;其余为合格品,每件可获利3元.若该工厂一个月共生产3 000件产品.以样本的频率代替总体在各组的频率,若单月利润未能达到11 000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.
解: (3)由题意可得,这批产品中A等品有3 000×(0.18+0.20)=1 140(件),
这批产品中不合格品有3 000×0.04=120(件),
这批产品中合格品有3 000-1 140-120=1 740(件),
1 140×5+1 740×3-120×2=10 680(元).
所以该工厂生产的产品一个月所获
得的利润为10 680元,
因为10 680<11 000,所以需要对该工
厂设备实施升级改造.
〈课堂达标·素养提升〉
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
C
用样本频率分布估计总体频率分布时,若总体一定,则样本的容量越大,估计就越精确.
2.如图所示为某企业员工年龄(岁)的频率分布直方图,从左到右依次为第一组、第二组……第五组,若第五组的员工有80人,则第二组的员工人数为( )
A.140 B.240
C.280 D.320
C
由已知得5(a+0.06+0.04+0.02+0.01)=1,所以
a=0.07,因为第五组的员工人数为80,所以第
二组的员工人数为0.07×=280.
3.在样本频率分布直方图中共有9个小矩形,若其中1个小矩形的面积等于其他8个小矩形面积和的,且样本容量为210,则该组的频数为( )
A.28 B.40
C.56 D.60
D
设该小矩形的面积为x,9个小矩形的总面积为1,
则其他8个小矩形的面积和为x,所以x+x=1,
所以x=,所以该组的频数为×210=60.
4.为了解今年某校高三毕业班准备报考飞行员的学生的体重(单位:千克)情况,将所得数据整理后,画出频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.则该校准备报考飞行员的总人数为 .
48
设该校准备报考飞行员的总人数为n,设第1小组的频率为a,则有a+2a+3a+(0.013+0.037)×5=1,解得a=0.125,所以第2小组的频率为0.25.
又第2小组的频数为12,则有0.25=,解得n=48.
课时作业 巩固提升
[A组 必备知识练]
1.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
1
2
3
4
5
6
7
8
9
10
A
组号 1 2 3 4 5 6 7 8
频数 10 13 x 14 15 13 12 9
第三组的频数和频率分别是( )
A.14和0.14 B.0.14和14
C.
第三组的频数x=100-(10+13+14+15+13+12+9)=100-86=14,频率为=0.14.
1
2
3
4
5
6
7
8
9
10
2.在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,该组的频率为m,在频率分布直方图中该组的小长方形的高为h,则|a-b|等于( )
A.hm B.
C. D.h+m
1
2
3
4
5
6
7
8
9
10
B
=h,故|a-b|=组距=.
1
2
3
4
5
6
7
8
9
10
3.(多选)将样本容量为100的样本数据分为4组:[2,6),[6,10),[10,14),[14,18],得到频率分布直方图如图所示,则下列说法中正确的是( )
A.样本数据分布在[6,10)内的频率为0.32
B.样本数据分布在[10,14)内的频数为40
C.样本数据分布在[2,10)内的频数为40
D.估计总体数据大约有10%分布在[10,14)内
1
2
3
4
5
6
7
8
9
10
ABC
对于A,由题图可得,样本数据分布在[6,10)内的
频率为0.08×4=0.32,故A正确;对于B,由题图可
得,样本数据分布在[10,14)内的频数为100×0.1
×4=40,故B正确;对于C,由题图可得,样本数据
分布在[2,10)内的频数为100×(0.02+0.08)×4=
40,故C正确;对于D,由题图可估计,总体数据分布在[10,14)内的比例约为0.1×4×100%=40%,故D错误.
1
2
3
4
5
6
7
8
9
10
4.某校抽取100名学生测量身高,其中身高最大值为186 cm,最小值为154 cm,根据身高数据绘制频率分布直方图,组距为5,且第一组下限为153.5,则组数为 .
1
2
3
4
5
6
7
8
9
10
7
极差为186-154=32,组距为5,且第一组下限为153.5,=6.4,故组数为7组.
5.某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照[11.5,12),[12,12.5),…,
[15.5,16]分成9组,制成了如图所示的频率分布直方图.由直方图估计本校高三男生100米体能测试成绩大于13.25秒的频率是 .
1
2
3
4
5
6
7
8
9
10
0.63
由频率分布直方图中各矩形面积之和为1,
可得0.5×(0.08×2+0.16+0.30×2+a+0.52+0.12+0.04)=1,解得a=0.40,故体能测试成绩大于13.25秒的频率是0.5×=0.63.
1
2
3
4
5
6
7
8
9
10
6.某商家对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.
1
2
3
4
5
6
7
8
9
10
解:(1)由题意可得a=×[1-(0.01+0.06+0.07+0.04)×5]=0.02.
(2)若商家在一天的销售量不低于25件,
则上级商企会给商家赠送100元的礼金,
估计该商家在一年内获得的礼金数.
1
2
3
4
5
6
7
8
9
10
解: (2)根据频率分布直方图知,日销售量不低于25件的天数为:
(0.04+0.02)×5×30=9(天),
一个月可获得的礼金数为9×100=900(元),
依此可以估计该商家一年内获得的礼金数为900×12=10 800(元).
[B组 关键能力练]
7.(多选)学校为了了解新课程标准中提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示.将阅读时间不低于30 min的学生称为“阅读霸”,则下列结论正确的是( )
A.抽样表明,该校约有一半学生为“阅读霸”
B.抽取的100名学生中有50名学生为“阅读霸”
C.抽取的100名学生中有45名学生为“阅读霸”
D.抽样表明,该校有50名学生为“阅读霸”
1
2
3
4
5
6
7
8
9
10
AB
根据频率分布直方图可列下表:
1
2
3
4
5
6
7
8
9
10
阅读时
间/min [0,
10) [10,
20) [20,
30) [30,
40) [40,
50) [50,
60]
抽样人
数/名 10 18 22 25 20 5
抽取的100名学生中有50名为“阅读霸”,据此可判断该校约有一半学生为“阅读霸”.
8.某学校为了调查学生生活方面的日支出情况,抽出了一个容量为n的样本,将数据按[20,30),[30,40),[40,50),[50,60),[60,70]分成5组,绘制成如图所示的频率分布直方图,则a= .要从日支出在[50,70]的样本中用分层随机抽样的方法抽取10人,则日支出在[60,70]中被抽取的人数为 .
1
2
3
4
5
6
7
8
9
10
0.005
2
(2×a+0.02+0.025+0.045)×10=1,解得a=0.005.
因为在[50,60)内和[60,70]内的样本个数比例为0.020∶0.005=4∶1,
根据分层随机抽样可知,日支出在[60,70]中被抽取的人数为10×=2.
1
2
3
4
5
6
7
8
9
10
9.相关部门对某城市“五朵金花”之一的某景区在“十一”黄金周期间每天的游客人数作了统计,其频率分布如表所示.
1
2
3
4
5
6
7
8
9
10
48
时间 10月
1日 10月
2日 10月
3日 10月
4日 10月
5日 10月
6日 10月
7日
频率 0.05 0.08 0.09 0.13 0.30 0.15 0.20
已知10月1日这天该景区的营业额约为8万元,假定这七天每天游客人均消费相同,则这个黄金周该景区游客人数最多的那一天的营业额约为
万元.
设这个黄金周该景区游客人数最多的那一天的营业额约为x万元.由,得x=48,则游客人数最多的那一天的营业额约为48万元.
1
2
3
4
5
6
7
8
9
10
[C组 素养培优练]
10.某中学新建了学校食堂,每天有近2 000名学生在学校食堂用午餐,午餐开放时间约40分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约6种菜和主食米饭中任意选购;第二类是套餐,已按配套好菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为了更合理地设置窗口布局,增加学生的用餐满意度,学校学生会在用餐的学生中对就餐选择、各类餐食的平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
类别 选餐 套餐 面食
选择人数 50 30 20
平均每份取餐时长(单位:分钟) 2 0.5 1
已知饭堂的售饭窗口一共有20个,就餐高峰期时有200名学生在等待就餐.
(1)根据以上的调查统计,如果设置12个选餐
窗口,4个套餐窗口,4个面食窗口,就餐高峰期
时,假设大家在排队时自动选择较短的队伍
等待(即各类餐食的窗口前队伍长度各自相
同),问:选择选餐的同学最长等待时间是多
少?这能否让80%的同学感到满意(即在接受等待时长内取到餐)?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解:(1)由题意得,就餐高峰期时选择选餐
的总人数为200×=100人;
这100人平均分布在12个选餐窗口,
平均每个窗口等待就餐的人数为≈9人,
所以选择选餐同学的最长等待时间为2×9=18分钟,
由可接受等待时长的频率分布直方图可知,分组为[5,10),[10,15),[15,20),[20,25)的频率分别为0.15,0.45,0.35,0.05,
所以可接受等待时长在15分钟以上的同学占0.05+0.35=40%<80%,
故设置12个选餐窗口,4个套餐窗口,4个面食窗口,不能让80%的同学感到满意.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更优化,并给出你的求解过程.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解: (2)假设设置m个选餐窗口,n个套餐窗口,k个面食窗口,则各队伍的同学最长等待时间如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
类别 选餐 套餐 面食
高峰期就餐总人数 100 60 40
各队伍长度(人)
最长等待时间(分钟) 2× 0.5× 1×
依题意,从等待时长和公平的角度上考虑,则要求每个队伍的最长等待时间大致相同,
即得2×,即有m∶n∶k=20∶3∶4,
而m+n+k=20,故m≈15,n≈2,k≈3,
因此建议设置选餐、套餐、面食三个
类别的窗口数分别为15,2,3个.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(5)画频率分布直方图
横轴表示分组,纵轴表示,实际上就是频率分布直方图中各小长方形的______,小长方形的面积=__________________.各小长方形的面积的总和等于1.
组距×=频率
$$