内容正文:
第2课时 频数分布直方图与频率分布直方图
[教学方式:深化学习课——梯度进阶式教学]
[课时目标]
1.本课时的重点是会列频率分布表,会画频数分布直方图、频率分布直方图、频数分布折线图和频率分布折线图.
2.本课时的难点是能够利用图形解决实际问题.
1.频率分布表、频率分布直方图的绘制步骤
(1)找出最值,计算极差(全距);
(2)合理分组,确定区间(组距);
(3)整理数据(可以将频数与频率列表);
(4)作出有关图示(频数分布直方图与频率分布直方图).
2.频率分布直方图
3.频率分布折线图
把频率分布直方图中每个矩形上面一边的中点用线段连接起来,就得到频率分布折线图.为了方便看图,折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.
|微|点|助|解|
频率分布直方图的理解
(1)频率分布直方图的纵坐标是,而不是.
(2)因为小长方形的面积=组距×=频率,所以各个小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(3)在频率分布直方图中,所有小长方形的面积之和等于1.
基础落实训练
1.在频率分布直方图中,矩形的面积等于 ( )
A.组距 B.频率
C.组数 D.频数
解析:选B 根据矩形的宽及高的意义,可知矩形的面积为一组样本数据的频率.
2.某校120名学生某一周用于阅读课外书籍的时间的频率分布直方图如图所示,其中阅读时间是8~10小时的组频数和组频率分别是 ( )
A.15和0.125 B.15和0.25
C.30和0.125 D.30和0.25
解析:选D 由频率分布直方图知,阅读时间是8~10小时的组频率是0.125×2=0.25,阅读时间是8~10小时的组频数是120×0.25=30.
3.已知某校初二年级学生一次数学考试成绩(单位:分)的频率分布直方图如图所示,则该图中a的值为 ( )
A. B.
C. D.
解析:选D 根据频率分布直方图可得10(a+4a+7a+6a+2a)=1,解得a=.
4.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n= .
解析:由题意得=0.25,所以n=200.
答案:200
题型(一) 频数与频率
[例1] 某市共有5 000名高三学生参加联考,为了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成频率分布表:
分组/分
频数
频率
[80,90)
①
②
[90,100)
0.050
[100,110)
0.200
[110,120)
36
0.300
[120,130)
0.275
[130,140)
12
[140,150]
0.050
合计
根据上面的频率分布表,可知①处的数值为 ,②处的数值为 .
解析:设样本容量为n,由位于[110,120)的频数为36,频率为=0.300,得样本容量n=120.所以[130,140)的频率为=0.100.
②处的数值为1-0.050-0.200-0.300-0.275-0.100-0.050=0.025,
①处的数值为0.025×120=3.
答案:3 0.025
|思|维|建|模|
对于频数与频率的问题,首先要明确几个关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清楚已知和所求,选择合适的公式解题.
[针对训练]
1.将容量为100的样本数据分为8个组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
则第3组的频率为 ( )
A.0.03 B.0.07
C.0.14 D.0.21
解析:选C 由题意得x=100-(10+13+14+15+13+12+9)=14.所以第3组的频率为=0.14.
2.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为 ( )
A.15 B.16
C.17 D.19
解析:选A 由题意得样本在[40,50),[50,60)内的数据个数共为30×0.8-4-5=15.
题型(二) 频率分布直方图的绘制
[例2] 如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
[150,154)
[154,158]
人数
20
11
6
5
(1)列出样本频率分布表;
(2)画出频率分布直方图及频率分布折线图;
(3)估计身高小于134 cm的人数占总人数的百分比.
解:(1)样本频率分布表如图:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158]
5
0.04
合计
120
1.00
(2)其频率分布直方图、频率分布折线图如图所示.
(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.
|思|维|建|模|
(1)在列频率分布表时,极差、组距、组数有如下关系:
①若为整数,则=组数;
②若不为整数,则的整数部分+1=组数.
(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况.
[针对训练]
3.某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
根据所给的数据,回答下列问题:
(1)这次测验成绩的最高分和最低分分别是多少?
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图和频率分布折线图.
解:(1)这次测验成绩的最高分是97分,最低分是32分.
(2)根据题意,列出样本的频率分布表如下:
分组
频数
频率
[30,40)
1
0.02
[40,50)
6
0.12
[50,60)
12
0.24
[60,70)
14
0.28
[70,80)
9
0.18
[80,90)
6
0.12
[90,100]
2
0.04
合计
50
1.00
频率分布直方图和频率分布折线图如图所示.
题型(三) 频率分布直方图的应用
[例3] 某校从高二年级学生中随机抽取60名学生,将其期中考试的政治成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100]后得到如下频率分布直方图.
(1)根据频率分布直方图,估计该校高二年级学生期中考试政治成绩的平均分、众数、中位数;(小数点后保留一位有效数字)
(2)用分层抽样的方法在各分数段的学生中抽取一个容量为20的样本,则[70,80)分数段抽取的人数是多少?
解:(1)由题图可知众数为75,
因为0.1+0.15+0.15+10a+0.25+0.05=1,
解得a=0.030,
设中位数为x,
所以0.1+0.15+0.15+(x-70)×0.03=0.5,
解得x≈73.3,
所以中位数为73.3,
平均数为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
(2)因为总人数有60人,抽取20人,
所以抽取比例为=,
因为60人中[70,80)分数段人数为60×0.03×10=18,
所以[70,80)分数段抽取的人数是18×=6.
|思|维|建|模|
(1)频率分布直方图中包含了大量的信息:①各小矩形的面积等于相应各组的频率;②各小组的频数之和等于数据总个数(样本容量);③各小组的频率之和等于1;④各小矩形的面积之和等于1;⑤各小矩形的高与该组的频数成正比.
(2)虽然没有保留原始数据,由频率分布直方图仍能估计数据的众数、中位数(百分位数)、平均数、方差等.众数估计值为频率最大的组的中点(横坐标),中位数的两侧面积相等,平均数在频率分布直方图中等于组的中点值与对应的频率之积的和,方差=(其中n为组数,为估计平均值,pi,xi分别为第i组的频率和中点值).
[针对训练]
4.为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如右栏图所示.
(1)求图中a的值;
(2)估计这种植物果实重量的平均数(同一组中的数据用该组区间的中点值作代表);
(3)已知这种植物果实重量不低于37.5克即为优质果实,现对该种植物果实的某批10 000个果实进行检测.据此估算这批果实中的优质果实的个数.
解:(1)由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050.
(2)由题图,得这种植物果实重量的平均数约为
30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40.
∴这种植物果实重量的平均数的估计值约为40克.
(3)样本中,这种植物果实重量不低于37.5克即优质果实的频率为0.075×5+0.050×5+0.015×5=0.7.由此估计这批10 000个果实中,重量不低于37.5克即优质果实的概率为0.7,∴这批果实中的优质果实的个数约为10 000×0.7=7 000.
学科网(北京)股份有限公司
$