内容正文:
14.4.3 用频率分布直方图估计总体分布 14.4.4 百分位数
A层 基础达标练
1.已知一组数据为20,30,40,50,50,50,70,80,其平均数、第60百分位数和众数的大小关系是( )
A.平均数=第60百分位数>众数
B.平均数<第60百分位数=众数
C.第60百分位数=众数<平均数
D.平均数=第60百分位数=众数
2.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有( )
A.a=13.7,b=15.5 B.a=14,b=15
C.a=12,b=15.5 D.a=14.7,b=15
3.某班50名学生到图书馆借书的数量统计如下:
借书数量/本
5
6
7
8
9
10
频数
5
8
13
11
9
4
则这50名学生的借书数量的上四分位数是( )
A.8本 B.8.5本 C.9本 D.10本
4.(多选题)某校从参加某学业水平测试的学生中抽出80名学生,其数学成绩(均为整数,满分为100分)的频率分布直方图如图所示,则下列说法正确的是( )
A.数学成绩的众数是70分
B.数学成绩的众数是75分
C.数学成绩的平均数是73分
D.数学成绩的平均数是72分
5.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花的纤维长度(棉花的纤维长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花的纤维长度的样本数据的第80百分位数是( )
A.28 mm B.28.5 mm C.29 mm D.29.5 mm
6.某校从参加知识竞赛的同学中,随机选取若干名同学将其成绩(均为整数分值)分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到如图所示的频率分布直方图(图有残缺).观察此图,回答下列问题:
(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;
(2)若选取的人数为100,求分数不低于70分的共有多少人;
(3)由频率分布直方图,估计本次考试成绩的中位数.
B层 能力提升练
7.某市政府为了解居民节约用水的意识,随机调查了100户居民某年的月均用水量数据(单位:m3),制成如图所示的频率分布直方图,则下列说法中正确的是( )
A.该组样本数据的极差是4 m3
B.可估计全市居民用户月均用水量的中位数是2.25 m3
C.可估计全市居民用户月均用水量的众数是2 m3
D.可估计全市居民用户中月均用水量超过3 m3的占15%
8.某单位为了解该单位党员开展学习党史知识活动的情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:
党史学习时间/小时
7
8
9
10
11
党员人数
6
10
9
8
7
则该单位党员一周学习党史时间的众数及第40百分位数分别是( )
A.8,8.5 B.8,8 C.9,8 D.8,9
9.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
甲 乙
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的平均数等于乙的成绩的平均数
C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数
D.甲的成绩的极差等于乙的成绩的极差
10.(多选题)为了解“全民齐参与,城市更美丽”的志愿服务情况,随机抽取了100名志愿者进行问卷调查,将这100名志愿者问卷调查的得分按[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,并绘制出如图所示的频率分布直方图,则下列结论中正确的是( )
A.a的值为0.015
B.估计这100名志愿者问卷调查得分的第90百分位数为85
C.这100名志愿者问卷调查得分的平均数为75(同一组中的数据用该组区间的中点值为代表)
D.若采用分层抽样从得分在区间[50,60)和区间[90,100]内的志愿者中抽取8人,则抽取的这8名志愿者得分在区间[50,60)内的人数为6
11.一组数据按从小到大的顺序排列为1,4,4,x,7,8(其中x≠7),若该组数据的中位数是众数的倍,则该组数据的第60百分位数是 .
12.如图是某市4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的第10百分位数为 ,日最低气温的第80百分位数为 .
13.某年级120名学生在一次百米跑测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组,即[13,14),[14,15),[15,16),[16,17),[17,18],得到频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的第70百分位数约为 .
14.某学校为了解本校历史、物理方向学生的学业水平模拟测试数学成绩情况,分别从物理方向的学生中随机抽取60人的成绩得到样本甲,从历史方向的学生中随机抽取n人的成绩得到样本乙,根据两个样本数据分别得到如图所示的频率分布直方图,已知乙样本中,在区间[70,80)上的数据有10个.
甲样本数据频率分布直方图
乙样本数据频率分布直方图
(1)求n和乙样本频率分布直方图中a的值;
(2)试估计该校物理方向的学生本次模拟测试数学成绩的平均值和历史方向的学生本次模拟测试数学成绩的中位数(同一组中的数据用该组区间的中点值为代表);
(3)若本校历史方向的学生约为300人,估计其中数学成绩在85分以上的人数.
C层 拓展探究练
15.某地苹果出现滞销现象,为了帮助当地果农打开销路,当地政府与全国一些企业采用团购的方式带动销售链,使得当地果农积压的许多苹果有了销路.为了解果农们苹果的销售量情况,当地农业局随机对100名果农的苹果销售量进行统计,将数据按照[90,110),[110,130),[130,150),[150,170]分成4组,得到如图所示的频率分布直方图.
(1)试估计这100名果农苹果销售量的平均数.
(2)根据题中的频率分布直方图,估计销售量样本数据的第80百分位数(结果精确到0.1).
(3)假设这100名果农在未打开销路之前都积压了2万千克的苹果,通过团购的方式销售,果农每千克苹果的纯利润为1.3元,而积压仍未售出的苹果每千克将损失2元的成本费,试估计这100名果农积压的苹果通过此次团购活动获得的总利润.
参考答案
1.B 平均数为(20+30+40+50+50+50+70+80)=48.75,
∵8×60%=4.8,∴第60百分位数为50.
又众数为50,
∴它们的大小关系是平均数<第60百分位数=众数.故选B.
2.D 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=(10+12+14+14+15+15+16+17+17+17)=14.7,因为50=5,所以这10名工人一小时内生产零件的第50百分位数为b==15.故选D.
3.C 因为上四分位数即第75百分位数,50×75%=37.5,所以75百分位数为将借书数量从小到大排序后的第38个,即为9本,故上四分位数是9本.故选C.
4.BD 由频率分布直方图知众数为=75,即这80名学生的数学成绩的众数为75分,故A错误,B正确;
由频率分布直方图知这次数学成绩的平均数为0.005×10+0.015×10+0.02×10+0.03×10+0.025×10+0.005×10=72,故C错误,D正确.
5.C 棉花的纤维长度在25 mm以下的频率为(0.01+0.01+0.04+0.06)×5=0.6=60%,
在30 mm以下的频率为60%+25%=85%,
因此,第80百分位数一定位于[25,30)内,
由25+5=29,
可以估计棉花的纤维长度的样本数据的第80百分位数是29 mm.故选C.
6.解 (1)设分数在[70,80)内的频率为x,根据频率分布直方图,得(0.01+0.015×2+0.025+0.005)×10+x=1,解得x=0.3,所以=0.03,补全的频率分布直方图如图所示,
(2)由频率分布直方图可知,不低于70分的频率为(0.030+0.025+0.005)×10=0.6,则分数不低于70分的人数为0.6×100=60.
(3)分数在[40,70)内的频率为(0.01+0.015×2)×10=0.4,分数在[70,80)内的频率为0.3,
因为70+1073.33,
所以估计本次考试成绩的中位数为73.
7.D 对于A,由频率分布直方图无法得到这组数据的最大值和最小值,故无法准确判断这组数据的极差,故A错误;对于B,因为(0.2+0.3+0.4)×0.5=0.45,0.45+0.5×0.5=0.7,所以中位数在区间[2,2.5)内.设中位数为x,由0.45+0.5×(x-2)=0.5,得x=2.1,故B错误;对于C,众数为=2.25,故C错误;对于D,月均用水量超过3 m3的频率为(0.1+0.1+0.1)×0.5=0.15,故D正确.
8.A 由统计数表可知,学习7小时的有6人,学习8小时的有10人,学习9小时的有9人,学习10小时的有8人,学习11小时的有7人,共有40人.学习8小时的人数最多,故学习党史时间的众数是8.又40%×40=16,故第40百分位数为数据从小到大排序第16个与第17个数据的平均数,即=8.5,故学习党史时间的第40百分位数是8.5.故选A.
9.BCD 由图可得,=6,=6,所以A项错误,B项正确;甲的成绩的第80百分位数为=7.5,乙的成绩的第80百分位数为=7.5,所以二者相等,所以C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.故选BCD.
10.ABD 对于A,由(a+0.035+0.035+0.010+0.005)×10=1,解得a=0.015,故A正确;对于B,设这100名志愿者问卷调查得分的第90百分位数为m,则0.015×10+0.035×10+0.035×10+0.010×(m-80)=0.9,解得m=85,故B正确;对于C,这100名志愿者问卷调查得分的平均数约为55×0.15+65×0.35+75×0.35+85×0.10+95×0.05=70.5,故C错误;对于D,根据频率分布直方图可得抽取的这8名志愿者得分在区间[50,60)内的人数为8=6,故D正确.故选ABD.
11.6 ∵数据1,4,4,x,7,8(其中x≠7)的中位数为,众数为4,=4,∴x=6,
∴该组数据为1,4,4,6,7,8,共6个,且6×60%=3.6,
∴这组数据的第60百分位数是第4位数,即为6.
故答案为6.
12.24 16 由折线图可知,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7=0.7,不是整数,所以这7天日最高气温的第10百分位数是第1个数据,为24.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,因为共有7个数据,所以7=5.6,不是整数,所以这7天日最低气温的第80百分位数是第6个数据,为16.
13.16.5 设成绩的第70百分位数为x,因为=0.55,=0.85,所以x∈[16,17),所以0.55+(x-16)=0.7,解得x=16.5.故答案为16.5.
14.解 (1)由频率分布直方图可知乙样本中数据在区间[70,80)的频率为0.020×10=0.20,则=0.20,解得n=50.
由乙样本频率分布直方图可知(0.006+0.016+0.020+0.040+a)×10=1,解得a=0.018.
(2)甲样本数据的平均值的估计值为(55×0.005+65×0.010+75×0.020+85×0.045+95×0.020)×10=81.5.
乙样本频率分布直方图中前3组的频率之和为(0.006+0.016+0.020)×10=0.42<0.5,
前4组的频率之和为(0.006+0.016+0.02+0.04)×10=0.82>0.5,所以乙样本数据的中位数在第4组.
设中位数为x,则(x-80)×0.04+0.42=0.5,解得x=82,所以乙样本数据的中位数为82.
(3)乙样本中数学成绩在85分以上的学生频率为+0.18=0.38,
由样本估计总体,得300×0.38=114,故历史方向的学生数学成绩在85分以上的约有114人.
15.解 (1)设这100名果农苹果销售量的平均数为,则=(100×0.002 5+120×0.01+140×0.022 5+160×0.015)×20=140,故这100名果农苹果销售量的平均数为1.4万千克.
(2)因为(0.002 5+0.010 0)×20=0.25<0.8,
0.25+0.022 5×20=0.7<0.8,
所以第80百分位数在第4组内,且第80百分位数为150+20≈156.7.
(3)销售量在[90,110)内的每位果农的利润为100×100×1.3-(2×104-100×100)×2=-0.7(万元);
销售量在[110,130)内的每位果农的利润为120×100×1.3-(2×104-120×100)×2=-0.04(万元);
销售量在[130,150)内的每位果农的利润为100×140×1.3-(2×104-140×100)×2=0.62(万元);
销售量在[150,170]内的每位果农的利润为100×160×1.3-(2×104-160×100)×2=1.28(万元).
因为[90,110),[110,130),[130,150),[150,170]这4组的人数分别为5,20,45,30,
所以这100名果农积压的苹果通过此次团购活动获得的总利润约为-0.7×5-0.04×20+0.62×45+1.28×30=62(万元).
10
学科网(北京)股份有限公司
$