内容正文:
频数分布直方图与频率分布直方图
(教学方式:深化学习课—梯度进阶式教学)
第2课时
课时目标
1.本课时的重点是会列频率分布表,会画频数分布直方图、频率分布直方图、频数分布折线图和频率分布折线图.
2.本课时的难点是能够利用图形解决实际问题.
CONTENTS
目录
1
2
3
课前预知教材·自主落实基础
课堂题点研究·迁移应用融通
课时跟踪检测
课前预知教材·自主落实基础
1.频率分布表、频率分布直方图的绘制步骤
(1)找出最值,计算______ (全距);
(2)合理分组,确定区间(______);
(3)整理数据(可以将频数与频率列表);
(4)作出有关图示(频数分布直方图与频率分布直方图).
极差
组距
2.频率分布直方图
3.频率分布折线图
把频率分布直方图中_________________________用线段连接起来,就得到频率分布折线图.为了方便看图,折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.
每个矩形上面一边的中点
|微|点|助|解|
频率分布直方图的理解
(1)频率分布直方图的纵坐标是,而不是.
(2)因为小长方形的面积=组距×=频率,所以各个小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(3)在频率分布直方图中,所有小长方形的面积之和等于1.
基础落实训练
1.在频率分布直方图中,矩形的面积等于 ( )
A.组距 B.频率
C.组数 D.频数
解析:根据矩形的宽及高的意义,可知矩形的面积为一组样本数据的频率.
√
2.某校120名学生某一周用于阅读课外书籍的时间的频率分布直方图如图所示,其中阅读时间是8~10小时的组频数和组频率分别是 ( )
A.15和0.125 B.15和0.25
C.30和0.125 D.30和0.25
√
解析:由频率分布直方图知,阅读时间是8~10小时的组频率是0.125×2=0.25,阅读时间是8~10小时的组频数是120×0.25=30.
3.已知某校初二年级学生一次数学考试成绩(单位:分)的频率分布直方图如图所示,则该图中a的值为 ( )
A. B. C. D.
解析:根据频率分布直方图可得10(a+4a+7a+6a+2a)=1,解得a=.
√
4.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n= .
解析:由题意得=0.25,所以n=200.
200
课堂题点研究·迁移应用融通
题型(一) 频数与频率
[例1] 某市共有5 000名高三学生参加联考,为了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成频率分布表:
分组/分 频数 频率
[80,90) ① ②
[90,100) 0.050
[100,110) 0.200
[110,120) 36 0.300
[120,130) 0.275
[130,140) 12
[140,150] 0.050
合计
根据上面的频率分布表,可知①处的数值为 ,②处的数值为 .
解析:设样本容量为n,由位于[110,120)的频数为36,频率为=0.300,得样本容量n=120.所以[130,140)的频率为=0.100.
②处的数值为1-0.050-0.200-0.300-0.275-0.100-0.050=0.025,
①处的数值为0.025×120=3.
3
0.025
|思|维|建|模|
对于频数与频率的问题,首先要明确几个关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清楚已知和所求,选择合适的公式解题.
针对训练
1.将容量为100的样本数据分为8个组,如下表:
√
组号 1 2 3 4 5 6 7 8
频数 10 13 x 14 15 13 12 9
则第3组的频率为 ( )
A.0.03 B.0.07 C.0.14 D.0.21
解析:由题意得x=100-(10+13+14+15+13+12+9)=14.所以第3组的频率为=0.14.
2.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为 ( )
A.15 B.16 C.17 D.19
解析:由题意得样本在[40,50),[50,60)内的数据个数共为30×0.8-4-5=15.
√
题型(二) 频率分布直方图的绘制
[例2] 如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142)
人数 5 8 10 22 33
区间界限 [142,146) [146,150) [150,154) [154,158]
人数 20 11 6 5
(1)列出样本频率分布表;
解:样本频率分布表如图:
分组 频数 频率
[122,126) 5 0.04
[126,130) 8 0.07
[130,134) 10 0.08
[134,138) 22 0.18
[138,142) 33 0.28
[142,146) 20 0.17
[146,150) 11 0.09
[150,154) 6 0.05
[154,158] 5 0.04
合计 120 1.00
(2)画出频率分布直方图及频率分布折线图;
解:其频率分布直方图、频率分布折线图如图所示.
(3)估计身高小于134 cm的人数占总人数的百分比.
解:由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.
|思|维|建|模|
(1)在列频率分布表时,极差、组距、组数有如下关系:
①若为整数,则=组数;
②若不为整数,则的整数部分+1=组数.
(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况.
针对训练
3.某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
根据所给的数据,回答下列问题:
(1)这次测验成绩的最高分和最低分分别是多少?
解:这次测验成绩的最高分是97分,最低分是32分.
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图和频率分布折线图.
解:根据题意,列出样本的频率分布表如下:
分组 频数 频率
[30,40) 1 0.02
[40,50) 6 0.12
[50,60) 12 0.24
[60,70) 14 0.28
[70,80) 9 0.18
[80,90) 6 0.12
[90,100] 2 0.04
合计 50 1.00
频率分布直方图和频率分布折线图如图所示.
题型(三) 频率分布直方图的应用
[例3] 某校从高二年级学生中随机抽取60名学生,将其期中考试的政治成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100]后得到如下频率分布直方图.
(1)根据频率分布直方图,估计该校高二年级学生期中考试政治成绩的平均分、众数、中位数;(小数点后保留一位有效数字)
解:由题图可知众数为75,
因为0.1+0.15+0.15+10a+0.25+0.05=1,
解得a=0.030,
设中位数为x,
所以0.1+0.15+0.15+(x-70)×0.03=0.5,
解得x≈73.3,
所以中位数为73.3,
平均数为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
(2)用分层抽样的方法在各分数段的学生中抽取一个容量为20的样本,则[70,80)分数段抽取的人数是多少?
解:因为总人数有60人,抽取20人,
所以抽取比例为=,
因为60人中[70,80)分数段人数为60×0.03×10=18,
所以[70,80)分数段抽取的人数是18×=6.
|思|维|建|模|
(1)频率分布直方图中包含了大量的信息:①各小矩形的面积等于相应各组的频率;②各小组的频数之和等于数据总个数(样本容量);③各小组的频率之和等于1;④各小矩形的面积之和等于1;⑤各小矩形的高与该组的频数成正比.
(2)虽然没有保留原始数据,由频率分布直方图仍能估计数据的众数、中位数(百分位数)、平均数、方差等.众数估计值为频率最大的组的中点(横坐标),中位数的两侧面积相等,平均数在频率分布直方图中等于组的中点值与对应的频率之积的和,
为估计平均值,pi,xi分别为第i组的频率和中点值).
针对训练
4.为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),
[47.5,52.5]分为5组,其频率分布直方图如图所示.
(1)求图中a的值;
解:由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050.
(2)估计这种植物果实重量的平均数(同一组中的数据用该组区间的中点值作代表);
解:由题图,得这种植物果实重量的平均数约为
30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40.
∴这种植物果实重量的平均数的估计值约为40克.
(3)已知这种植物果实重量不低于37.5克即为优质果实,现对该种植物果实的某批10 000个果实进行检测.据此估算这批果实中的优质果实的个数.
解:样本中,这种植物果实重量不低于37.5克即优质果实的频率为0.075×5+0.050×5+0.015×5=0.7.由此估计这批10 000个果实中,重量不低于37.5克即优质果实的概率为0.7,
∴这批果实中的优质果实的个数约为10 000×0.7=7 000.
课时跟踪检测
1
3
4
5
6
7
8
9
10
11
12
13
2
A级——达标评价
1.已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,20,那么这组数据落在8.5~11.5的频率为( )
A.0.5 B.0.4 C.0.3 D.0.2
解析:样本数据落在8.5~11.5内的数据有10,11,10,10,10,11,9,9,共8个,频率为8÷20=0.4.
√
1
5
6
7
8
9
10
11
12
13
2
3
4
2.在样本的频率分布直方图中,共有8个矩形,若最后一个矩形的面积等于其他7个矩形的面积之和的,且样本容量为200,则第8组的频数为( )
A.40 B.0.2
C.50 D.0.25
解析:设最后一个矩形的面积为x,则其他7个矩形的面积和为4x,
从而x+4x=1,所以x=0.2.故第8组的频数为200×0.2=40.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
3.在2023年某地销售的汽车中随机选取1 000台,对销售价格与销售数量进行统计,这1 000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:[5,10),
[10,15),[15,20),[20,25),[25,30)(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1 000台汽车中,销售价格在[10,20)内的车辆台数为 ( )
A.800 B.600 C.700 D.750
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:由频率分布直方图知,销售价格在[10,20)内的频率是1-(0.015+
0.025+0.02)×5=0.7.所以1 000台汽车中,销售价格在[10,20)内的车辆台数为0.7×1 000=700.
1
5
6
7
8
9
10
11
12
13
3
4
2
4.如图是某班50名学生期中考试物理成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于 ( )
√
A.0.018 B.0.020 C.0.021 D.0.024
解析:依题意得(0.008×3+0.016+x+0.036)×10=1,解得x=0.024.
1
5
6
7
8
9
10
11
12
13
3
4
2
5.(多选)居家学习期间,某学校发起了“畅读经典,欢度新年”活动,根据统计数据可知,该校共有1 200名学生,所有学生每天读书时间均在20分钟到100分钟之间,他们的日阅读时间频率分布直方图如图所示.则下列结论正确的是 ( )
A.该校学生日阅读时间的众数约为70
B.该校学生日阅读时间不低于60分钟的人数约为360
C.该校学生日阅读时间的50%分位数约为65
D.该校学生日阅读时间的平均数约为64
√
√
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:对于A,由题图可知众数约为=70,故A正确;
对于B,阅读时间不低于60分钟的人数约为(0.02+0.01)×20×1 200=
720,故B错误;
对于C, [20,60)的频率为(0.005+0.015)×20=0.4, [60,80)的频率为0.02×20=0.4,所以50%分位数为60+×20=65,故C正确;
对于D,平均数为30×0.005×20+50×0.015×20+70×0.02×20+90×
0.01×20=64,故D正确.故选ACD.
1
5
6
7
8
9
10
11
12
13
3
4
2
6.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n= .
解析:设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x,x,
则2x+3x+4x+6x+4x+x=1,解得x=.所以前三组数据的频率分别是,,,故前三组数据的频数之和为++=27,解得n=60.
60
7.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出 人.
1
5
6
7
8
9
10
11
12
13
3
4
2
25
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:由题图,得抽到在[2 500,3 000)(元)月收入段的频率为0.000 5×
500=0.25.所以在[2 500,3 000)(元)月收入段应抽出100×0.25=25人.
1
5
6
7
8
9
10
11
12
13
3
4
2
8.从本市某高中全体高二学生中抽取部分学生参加体能测试,按照测试成绩绘制茎叶图,并以[50,60),[60,70),[70,80),[80,90),[90,100]为分组作出频率分布直方图,后来茎叶图受到了污损,可见部分信息如图所示,则a的值为 .
0.02
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:由频率分布直方图可得,[90,100]组内数据的频率等于[50,60)组内数据的频率,所以[90,100]组内有2个数据.
设样本容量为n,则=0.01×10,所以n=20.
所以[80,90)组内的数据有20-2-5-7-2=4个,所以[80,90)组内数据的频率等于=0.2.所以a==0.02.
1
5
6
7
8
9
10
11
12
13
3
4
2
9.(10分)某高校在2023年的强基计划考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如表所示:
组号 分组 频数 频率
第1组 [160,165) 5 0.050
第2组 [165,170) m 0.350
第3组 [170,175) n p
第4组 [175,180) 20 0.200
第5组 [180,185] 10 0.100
合计 100 1.000
1
5
6
7
8
9
10
11
12
13
3
4
2
(1)求频率分布表中m,n,p的值,并补充完整相应的频率分布直方图;
1
5
6
7
8
9
10
11
12
13
3
4
2
解:由题表,知0.05+0.35+p+0.2+0.1=1⇒p=0.3,m=0.35×100=35,
n=0.3×100=30,则=0.06.
补充频率分布直方图如图所示.
1
5
6
7
8
9
10
11
12
13
3
4
2
(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3,4,5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3,4,5组每组各抽取多少名学生进入第二轮面试?
解:由已知,笔试成绩高的第3,4,5组的人数之比为30∶20∶10=
3∶2∶1.现用分层抽样的方法选6名学生,故第3,4,5组每组各抽学生人数为3,2,1.
1
5
6
7
8
9
10
11
12
13
3
4
2
B级——重点培优
10.某教育机构随机抽查某校20个班级,调查各班关注“汉字听写大赛”的学生人数,根据所得数据的茎叶图,以5为组距将数据分组成[0,5),[5,10),[10,15),[15,20),
[20,25),[25,30),[30,35),[35,40]时,所作的频率分布直方图如图所示,则原始的茎叶图可能是( )
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:由频率分布直方图知,各组频数统计如下表:
分组 [0,5) [5,10) [10,15) [15,20)
频数 1 1 4 2
分组 [20,25) [25,30) [30,35) [35,40]
频数 4 3 3 2
结合各选项茎叶图中的数据可知选项A正确.
1
5
6
7
8
9
10
11
12
13
3
4
2
11.(多选)某电视台举办才艺比赛,比赛现场有9名评委评分,场外观众采用网络评分,比赛评分采取10分制,某选手比赛后,现场9名评委原始评分中去掉一个最高分和一个最低分,得到7个有效评分如表所示,对观众网络评分按[7,8),[8,9),[9,10]分成三组,其频率分布直方图如图所示:
现场评委 A B C D E F G
有效评分 9.6 9.1 9.4 8.9 9.2 9.3 9.5
1
5
6
7
8
9
10
11
12
13
3
4
2
则下列说法正确的是 ( )
A.现场评委的7个有效评分与9个原始评分的中位数相同
B.由图可估计网络评分的众数为8
C.在去掉最高分和最低分之前9名评委原始评分的极差一定不小于0.7
D.场外观众网络评分的平均数大于现场评委有效评分的平均数
√
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:去掉9个原始评分中的一个最高分和一个最低分,不会改变该组数据的中位数,A正确;
由题图估计网络评分的众数为9.5,B错误;
7个有效评分极差为9.6-8.9=0.7,在去掉最高分和最低分之前,9名评委原始评分的极差大于等于0.7,C正确;
现场评分的平均数为(9.6+9.1+9.4+8.9+9.2+9.3+9.5)≈9.29,网络评分的平均数为7.5×0.2+8.5×0.3+9.5×0.5=8.8<9.29,D错误.故选AC.
1
5
6
7
8
9
10
11
12
13
3
4
2
12.(多选)供电部门对某社区1 000位居民12月份人均用电情况进行统计后,按人均用电量分为[0,10),[10,20),[20,30),[30,40),[40,50]五组,
整理得到频率分布直方图(如图所示),则有关这1 000位居民,下列说法正确的是 ( )
A.12月份人均用电量人数最多的一组有400人
B.12月份人均用电量在[20,30)内的有300人
C.12月份人均用电量不低于20度的有500人
D.12月份人均用电量为25度
√
√
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:根据频率分布直方图知,12月份人均用电量人数最多的一组是[10,20),有1 000×0.04×10=400人,A正确;
12月份人均用电量在[20,30)内的人数为1 000×0.03×10=300,B正确;
12月份人均用电量不低于20度的频率是(0.03+0.01+0.01)×10=0.5,
有1 000×0.5=500人,C正确;
12月份人均用电量为5×0.1+15×0.4+25×0.3+35×0.1+45×0.1=22,
D错误.
1
5
6
7
8
9
10
11
12
13
3
4
2
13.(12分)随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A和B两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如图所示.
1
5
6
7
8
9
10
11
12
13
3
4
2
(1)试估计使用A款订餐软件的50个商家的“平均送达时间”的众数及平均数.
解:由已知,使用A款订餐软件的50个商家的“平均送达时间”的众数为55,
平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.
1
5
6
7
8
9
10
11
12
13
3
4
2
(2)根据以上抽样调查数据,将频率视为概率,回答下列问题:
①能否认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%?
②如果你要从A和B两款订餐软件中选择一款订餐,根据平均数你会选择哪款?请说明理由.
解:①由题图,知使用B款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.04+0.2+0.56=0.80=80%>75%.
故可以认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%.
②使用B款订餐软件的50个商家的“平均送达时间”的平均数为15×0.04+25×
0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以选B款订餐软件.
方差=pi(xi-)2(其中n为组数,
$$