内容正文:
培优课 例析频率直方图中的统计问题
频率直方图是表达和分析数据的重要工具,还可以直观、准确地理解相应的有用信息.所以成为新高考的重点.
一、求样本中限制条件下的个体所占频率或频数
例1 某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分),现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率直方图如图所示.
已知第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.
答案 100 0.15
解析 设参赛的人数为n,第二小组的频率为
1-(0.30+0.15+0.10+0.05)=0.4,
依题意=0.4,
∴n=100,成绩优秀的频率是0.10+0.05=0.15.
反思感悟 频率为相应直方图的面积,即频率=纵坐标×横坐标差的绝对值.
跟踪训练1 有一个容量为200的样本,其频率直方图如图所示,根据样本的频率直方图估计,样本数据落在区间[10,12]内的频数为( )
A.18 B.36 C.54 D.72
答案 B
解析 样本数据落在区间[10,12]内的频率为0.18,则样本数据落在区间[10,12]内的频数为36.
二、求频率直方图中的参数问题
例2 某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率直方图(如图所示),其中上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].
(1)求频率直方图中x的值;
(2)如果上学所需时间不少于1小时的学生可申请在学校住宿,请估计学校600名新生中有多少名学生可以申请住宿.
解 (1)由频率直方图可得20×x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.
(2)由频率直方图可知,新生上学所需时间不少于1小时的频率为0.003×2×20=0.12.因为600×0.12=72,所以估计600名新生中有72名学生可以申请住宿.
反思感悟 解答本类题关键是要利用频率直方图中残缺不全的数据,分析它们之间存在的内在关系.
跟踪训练2 某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1 120名学生中随机抽取了100名学生的数学成绩,发现都在[80,150]内,现将这100名学生的成绩按照[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]分组后,得到的频率直方图如图所示,则下列说法正确的是( )
A.频率直方图中a的值为0.040
B.样本数据低于130分的频率为0.3
C.总体的中位数(保留1位小数)估计为123.3分
D.总体分布在[90,100)的频数一定与总体分布在[100,110)的频数相等
答案 C
解析 由频率直方图,得(0.005+0.010+0.010+0.015+a+0.025+0.005)×10=1,a=0.030,A错;
样本数据不低于130分的频率为(0.025+0.005)×10=0.3,因此低于130分的频率为0.7,B错;
分数低于120分的频率为(0.005+0.010+0.010+0.015)×10=0.4,低于130分的频率为0.4+0.03×10=0.7>0.5,因此中位数在[120,130)这一组,设中位数为n,则=,解得n≈123.3(分),C正确;
总体分布在[90,100)与[100,110)频数只能大致相等但不一定相等,D错误.
三、频率直方图中的数字特征
例3 从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率直方图(如图).
(1)由图中数据求a的值;
(2)若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为多少?
(3)估计这所小学的小学生身高的众数、中位数(保留两位小数)及平均数.
解 (1)因为频率直方图中的各个矩形的面积之和为1,
所以10×(0.005+0.035+a+0.020+0.010)=1,
解得a=0.030.
(2)由直方图知,身高在[120,130),[130,140),[140,150]三组的学生总数为
100×10×(0.030+0.020+0.010)=60,
其中身高在[140,150]的学生人数为10,
所以从身高在[140,150]内选取的学生人数为
×18=3.
(3)根据频率直方图知,身高在[110,120)的小矩形最高,所以这所小学的小学生身高的众数为=115(cm).
又0.005×10+0.035×10=0.4<0.5,
0.4+0.030×10=0.7>0.5,
所以中位数在[120,130)内,可设为x,
则(x-120)×0.030+0.4=0.5,
解得x≈123.33(cm),所以中位数为123.33 cm.
根据频率直方图,计算平均数为
105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm).
反思感悟 用频率直方图求得的众数、中位数不一定是样本中的具体数.
跟踪训练3 我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成如图所示的频率直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)估计居民月均用水量的中位数.
解 (1)由频率直方图可知,
(0.08+0.16+0.30+0.42+0.50+0.30+a+0.08+0.04)×0.5=1,
解得a=0.12.
(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12,
由以上样本的频率分布,可估计30万居民中月均用水量不低于3吨的人数为
300 000×0.12=36 000.
(3)设中位数为x吨,
∵前5组频率之和为
0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为
0.04+0.08+0.15+0.21=0.48<0.5,
∴2≤x<2.5.
由0.5×(x-2)=0.5-0.48,
得x=2.04.故可估计居民月均用水量的中位数为2.04吨.
1.(多选)我国网络购物市场保持较快发展,某电商平台为了精准发展,对某地区市场的N个人进行了调查,将调查对象的年龄分组为[20,25),[25,30),[30,35),[35,40),[40,45),[45,50),[50,55],得到频率直方图如图所示.已知年龄在[25,30)内的调查对象有6人,则下列说法正确的是( )
A.N=40
B.年龄在[30,35)内的调查对象有12人
C.调查对象中,年龄大于35岁的频率是0.1
D.调查对象的年龄的中位数为35岁
答案 ABD
解析 年龄在[25,30)内的频率为0.03×5=0.15,
∴N==40,故A正确;
年龄在[30,35)内的频率为
1-(0.01×2+0.02+0.03×2+0.04)×5=0.3,
∴年龄在[30,35)内的调查人数为40×0.3=12,故B正确;
年龄大于35岁的频率为(0.04+0.03+0.02+0.01)×5=0.5,则中位数的估计值为35岁,故C错误,D正确.
2.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机抽取了24名笔试者的成绩,统计结果如下表所示.
分数段
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
[85,90]
人数
2
3
4
9
5
1
据此估计允许参加面试的分数线大约是( )
A.90 B.85 C.80 D.75
答案 C
解析 参加面试的频率为=0.25,
样本中[80,90]的频率为=0.25,
由样本估计总体知,分数线大约为80分.
3.(多选)供电部门对某社区1 000位居民某年12月份人均用电情况进行统计后,按人均用电量分为[0,10),[10,20),[20,30),[30,40),[40,50]五组,整理得到如图所示的频率直方图,则下列说法正确的是( )
A.12月份人均用电量最多的一组有400人
B.12月份人均用电量不低于20 kW·h的有500人
C.12月份人均用电量为25 kW·h
D.在这1 000位居民中任选1位协助收费,选到的居民用电量在[30,40)内的可能性为
答案 ABD
解析 由图可知,用电量人数最多的一组有1 000×10×0.04=400(人),∴A正确;
12月份人均用电量不低于20 kW·h的有1 000×10×(0.03+0.01+0.01)=500(人),∴B正确;
12月份人均用电量为0.01×10×5+0.04×10×15+0.03×10×25+0.01×10×35+0.01×10×45=22(kW·h),故C错误;
由图知各组人数比为1∶4∶3∶1∶1,
∴在这1 000位居民中任取1位协助收费,
选到的居民用电量在[30,40)内的可能性为
=,∴D正确.
4.(多选)统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩依次分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],得到如图所示的频率直方图,若不低于140分的人数为110,则下列说法正确的是( )
A.m=0.031
B.n=800
C.100分以下的人数为60
D.成绩在区间[120,140)的人数占大多数
答案 AC
解析 由频率直方图,得10(m+0.020+0.016+0.016+0.011+0.006)=1,解得m=0.031,故A正确;因为不低于140分的频率为0.011×10=0.11,所以n==1 000,故B错误;因为100分以下的频率为0.006×10=0.06,所以100分以下的人数为1 000×0.06=60,故C正确;成绩在区间[120,140)的频率为0.031×10+0.016×10=0.47<0.5,故D错误.故选AC.
5.袁隆平院士是中国杂交水稻事业的开创者,是当代神农,50多年来,他始终在农业科学的第一线辛勤耕耘、不懈探索,为人类运用科技手段战胜饥饿带来了绿色的希望和金色的收获.袁老的科研团队发现“野败”后,将其带回实验,在试验田中随机抽取了100株水稻统计每株水稻的稻穗数(单位:颗)得到如图所示的频率直方图(同一组中的数据用该组区间的中点值代表),则下列说法错误的是( )
A.a=0.01
B.这100株水稻的稻穗数平均数在区间[280,300)中
C.这100株水稻的稻穗数的众数是250
D.这100株水稻的稻穗数的中位数在区间[240,260)中
答案 B
解析 根据频率直方图知,组距为20,
所以a=-0.017 5-0.007 5×2-0.005-0.002 5=0.01,故A选项正确;
这100株水稻的稻穗数平均数
=20×(0.005×210+0.007 5×230+0.017 5×250+0.01×270+0.007 5×290+0.002 5
×310)=256,
可知这100株水稻的稻穗数平均数在区间[240,260)中,故B选项错误;
由频率直方图知第三个矩形最高,所以这100株水稻的稻穗数的众数是250,故C选项正确;
前两个矩形的面积是0.25<0.5,前三个矩形的面积是0.6>0.5,
所以中位数在第三组数据中,
即这100株水稻的稻穗数的中位数在区间[240,260)中,故选项D正确.
6.某区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习的时间,对本班40名学生某天上网学习的时间进行了调查,将数据(取整数)整理后,绘制出如图所示的频率直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据频率直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生有________人.如果只用这40名学生这一天上网学习的时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?________(填“合理”或“不合理”).
答案 14 不合理
解析 一天上网学习时间在100~119分钟之间的学生有40×0.35=14(人),
因为该样本的选取只在高一(8)班,不具有代表性,故推断不合理.
7.为了调查某市市民对出行的满意程度,研究人员随机抽取了该市1 000名市民进行调查,并将满意程度以分数的形式统计成如图所示的频率直方图,其中a=4b.
则被调查的市民的满意程度的平均数为________,众数为________,中位数为________.
答案 74.9 75 75.14
解析 依题意得
(a+b+0.008+0.027+0.035)×10=1,
所以a+b=0.03.
又a=4b,所以a=0.024,b=0.006,
所以平均数为
55×0.08+65×0.24+75×0.35+85×0.27+95×0.06=74.9.
中位数为70+≈75.14.
众数为=75.
8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率直方图如图所示.
(1)频率直方图中x的值为________.
(2)在这些用户中,用电量落在区间[100,250)内的户数为________.
答案 (1)0.004 4 (2)70
解析 (1)由频率直方图中各小矩形的总面积为1,
得(0.001 2+0.002 4×2+0.003 6+x+0.006 0)×50=1,
∴x=0.004 4.
(2)用电量在[100,250)内的频率为
(0.003 6+0.004 4+0.006 0)×50=0.7,
故用户人数为100×0.7=70.
9.某校在5月份开展了科技月活动.在活动中某班举行了小制作评比,规定作品上交的时间为5月1日到5月31日,逾期不得参加评比.评委会把同学们上交作品的件数按5天一组分布统计,绘制了频率直方图(如图).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数最多,有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?
解 (1)设从左到右各长方形的高分别为2x,3x,4x,6x,4x,x.
设参加评比的作品总数为a件,
依题意得4x×5=,x=,
由(2x+3x+4x+6x+4x+x)×5=1,
解得x=,所以a=60.
所以本次活动共有60件作品参加评比.
(2)由频率直方图可以看出第四组上交的作品数量最多,共有6××5×60=18(件).
(3)第四组和第六组上交的作品数分别为18件,×5×60=3(件),
则它们的获奖率分别为=,.
又<,所以第六组的获奖率较高.
10.某市招聘特岗教师需要进行笔试和面试,一共有600名应聘者参加笔试考试,从中随机抽取了100名应聘者,记录他们的笔试分数,将数据分成7组:[20,30),[30,40),…,[80,90),得到如图所示的频率直方图.
(1)若该市计划168人进入面试,请估计参加面试的最低分数线;
(2)已知样本中笔试分数低于40分的有5人,试估计总体中笔试分数在[40,50)内的人数.
解 (1)根据题意,得进入面试的频率
P==0.28,
由频率直方图可知,笔试分数位于[70,80),[80,90)的频率分别为0.4,0.2,
所以设参加面试的最低分数线x∈(70,80),
得(80-x)×0.04+0.2=P,解得x=78(分),
故参加面试的最低分数线约为78分.
(2)样本中笔试分数不低于50分的频率为0.1+0.2+0.4+0.2=0.9,
样本中笔试分数低于40分的频率为=0.05,
所以样本中笔试分数在[40,50)内频率为1-0.05-0.9=0.05,
故总体中笔试分数在[40,50)内的人数约为
600×0.05=30.
学科网(北京)股份有限公司
$$