内容正文:
9.2.2 总体百分位数的估计
知晓结构体系
1夯实必备知识
知识点 百分位数的定义及计算
1.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.一组数据常用的分位数:
(1)中位数相当于是第50百分位数.除了中位数外,常用的分位数还有第25百分位数,第75百分位数.
(2)第25,50,75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(3)第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
4.由频率分布直方图求百分位数的方法:
(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.
(2)可采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可.
2提升学科能力
一、题点一 百分位数的定义
1.下列表述不正确的是( )
A.总体的50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
2.分位数的含义是( )
A.总体中任何一个数小于它的可能性是
B.总体中任何一个数小于或等于它的可能性至少是
C.总体中任何一个数大于它的可能性是
D.总体中任何一个数大于或等于它的可能性是
3.下列关于一组数据的百分位数的说法正确的是( )
A.百分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是
C.它一定是这组数据中的一个数据
D.它适用于总体是离散型的数据
4.已知100个数据的75%分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数
5.下列关于分位数的说法不正确的是( )
A.分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是
C.它是四分位数
D.它适用于总体是离散型的数据
二、题点二由样本数据求百分位数
6.数据2,3,5,5,6,7,8,8,9,10的分位数为( )
A.6 B.7 C.8 D.7.5
7.某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的分位数为( )
A.93 B.93.5 C.94 D.94.5
8.从某公司生产的产品中任意抽取12件,得到它们的质量(单位:)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,则这组数据的四分位数不可能是( )
A.8.75 B.8.15 C.9.9 D.8.5
9.2022年7月21日至30日某地区的最高温度(单位:℃)分别为:33,33,32,36,34,35,35,37,34,38,则这组数据的分位数是 .
10.学校组织秋季运动会,在一项比赛中,学生甲进行了8组投篮,得分(单位:分)分别为10,8,,8,7,9,6,8,如果学生甲的平均得分为8分,那么这组数据的75%分位数为 .
三、题点三用频数(频率)分布表求百分位数
11.某高校12名毕业生的起始月薪如下表所示:
毕业生
1
2
3
4
5
6
7
8
9
10
11
12
起始月薪
4850
4950
5050
4880
4755
4710
4890
5130
4940
5325
4920
4880
则第85百分位数是( )
A.5325 B.5130 C.5050 D.4950
12.设一组样本的容量为50,经过数据整理,得出了如下所示的频数分布表,则该组样本的第80百分位数为 .
数据分组区间
频数
15
18
6
5
6
13.某面包店记录了最近一周A,B两种口味的面包的销售情况,如表所示:
A口味
B口味
星期
一
二
三
四
五
六
日
星期
一
二
三
四
五
六
日
销量/个
16
12
14
10
18
19
13
销量/个
13
18
10
20
12
9
14
(1)试比较最近一周A,B这两种口味的面包日销量的第60百分位数的大小.
(2)该面包店店主将在下一周每天都制作n个A口味的面包,假设下一周A口味的面包日销量和被记录的这一周的日销量保持一致,每个面包当天卖出可获利6元,当天未售出则将损失5元,从,15,16中选一个,你应该选择哪一个?说明你的理由.
14.某单位为了了解退休职工生活情况,对50名退休职工做了一次问卷调查,满分100分,并从中随机抽取了10名退休职工的问卷,得分情况统计如下:
分数
77
79
81
84
88
92
93
人数
1
1
1
3
2
1
1
试回答以下问题:
(1)求抽取的10名退休职工问卷得分的分位数;
(2)求抽取的10名退休职工问卷得分的平均数和标准差s.
15.下表记录了一个家庭6月份每天在食品上面的消费金额(单位:元).
第1
天
第2
天
第3
天
第4
天
第5
天
第6
天
第7
天
第8
天
第9
天
第10
天
31
29
26
32
34
28
34
31
34
34
第11
天
第12
天
第13
天
第14
天
第15
天
第16
天
第17
天
第18
天
第19
天
第20
天
35
26
27
35
34
28
28
30
32
28
第21
天
第22
天
第23
天
第24
天
第25
天
第26
天
第27
天
第28
天
第29
天
第30
天
32
26
35
34
35
30
28
34
31
29
(1)该家庭6月份每天在食品上面的消费金额的中位数是多少?众数是多少?
(2)分别求该家庭6月份每天在食品上面的消费金额的5%,25%,50%,75%,95%分位数.
四、题点四 由频率分布直方图求百分位数
16.高二年级进行消防知识竞赛.统计所有参赛同学的成绩.成绩都在内.估计所有参赛同学成绩的第75百分位数为( )
A.65 B.75 C.85 D.95
17.某校举办了数学知识竞赛,把1000名学生的竞赛成绩(满分100分,成绩取整数)按,,,分成四组,并整理成如图所示的频率分布直方图,则下列说法正确的为( )
A.的值为0.015 B.估计这组数据的众数为80
C.估计这组数据的第60百分位数为87 D.估计成绩低于80分的有350人
18.为进一步提升物业管理和服务质量,某小区随机抽取100名住户开展了年度幸福指数测评活动,将其测评得分(均为整数)分成六组:,,…,,并绘制成如图所示的频率分布直方图.由此估计此次测评中居民幸福指数的第75百分位数为 .
19.某厂家为了保证防寒服的质量,从生产的保暖絮片中随机抽取多组,得到每组纤维长度(单位:)的均值,并制成如下所示的频率分布直方图,由此估计其纤维长度均值的分位数是 .
20.随机抽取100名男学生,测得他们的身高(单位:cm),按照区间,,,,分组,得到样本身高的频率分布直方图如图所示
(1)求这100名男学生身高在170cm及以上的学生人数;
(2)估计该校100名学生身高的75%分位数.
五、题点五 已知百分位数求参数
21.设实数满足.若数据1,3,4,,,的平均数和第50百分位数相等,则( )
A. B. C.或 D.或
22.一组数据:,其中为正整数,且.若该组数据的分位数为,则该组数据的众数为( )
A.1 B.3 C.5 D.7
23.数据的第63百分位数是,则实数的最小值是 .
24.5名学生的期中考试数学成绩分别为,若这5名学生成绩的第60百分位数为111,则 .
25.数据1,2,7,3,4,5,3,6的分位数是,则的取值范围是
六、题点六有关百分位数的综合题
26.某中学为了解该校高三年级学生数学学习情况,对一模考试数学成绩进行分析,从中抽取了200名学生的成绩作为样本进行统计(若该校全体学生的成绩均在分),按照,,,,,,,的分组做出频率分布直方图如图所示,若用分层抽样从分数在内抽取17人,则抽得分数在的人数为6人.
(1)求频率分布直方图中的x,y的值;
(2)该高三数学组准备选取数学成绩在前4%的学生进行培优指导,若小明此次数学分数是132,请你估算他能被选取吗?
27.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将100个样本数据按分成6组,并整理得到如下频率分布直方图.
(1)请通过频率分布直方图估计这100份样本数据的平均值(同一组中的数据用该组区间的中点值作代表).
(2)该市决定表彰知识竞赛成绩排名前的市民,某市民知识竞赛的成绩是,请估计该市民能否得到表彰
28.某市在万成年人中随机抽取了名成年市民进行平均每天读书时长调查.根据调查结果绘制市民平均每天读书时长的频率分布直方图(如图),将平均每天读书时长不低于小时的市民称为“阅读爱好者”,并将其中每天读书时长不低于小时的市民称为“读书迷”.
(1)试估算该市“阅读爱好者”的人数,并指出其中“读书迷”约为多少人;
(2)省某机构开展“儒城”活动评选,规则如下:若城市中的成年人平均每天读书时长不低于小时,则认定此城市为“儒城”.若该市被认定为“儒城”,则评选标准应满足什么条件?(精确到)
(3)该市要成立“墨葫芦”读书会,吸纳会员不超过万名.根据调查,如果收取会费,则非阅读爱好者不愿意加入读书会,而阅读爱好者愿意加入读书会.为了调控入会人数,设定会费参数,适当提高会费,这样“阅读爱好者”中非“读书迷”愿意加入的人数会减少,“读书迷”愿意加入的人数会减少.问会费参数至少定为多少时,才能使会员的人数不超过万人?
29.某营养学研究人员用随机抽样的方法获得了某高校100名女大学生平均每日摄取的热量(单位:千大卡,1千大卡=1000千卡),这组数据的频率分布直方图如图所示.
(1)健康的成年女性每天需要摄取1.80~1.90千大卡(不含1.90千大卡)的热量,试估计该校有多少比例的女大学生摄取的热量在此范围之内;
(2)已知摄取热量范围在的数据为:1.90,1.90,1.91,1.91,1.91,1.93,1.94,1.94,1.95,1.95,1.96,1.96, 1.97, 1.98,1.99.若1.91是这100个样本数据的第k百分位数,求正整数k的值.
30.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年200位居民家庭的月平均用水量(单位:吨),将数据按照,分成6组,制成了如图所示的频率分布直方图.
(1)求直方图中的值;
(2)该市决定设置议价收费标准,用水量低于的居民家庭按照“民用价”收费,不低于的按照“商业价”收费,为保障有的居民能享受“民用价”,请设置该标准;
(3)以每组数据的中点值作为该组数据的代表,分别是.规定“最佳稳定值”是这样一个量:与各组代表值的差的平方和最小.依此规定,请求出的值.
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
$$
9.2.2 总体百分位数的估计
知晓结构体系
1夯实必备知识
知识点 百分位数的定义及计算
1.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.一组数据常用的分位数:
(1)中位数相当于是第50百分位数.除了中位数外,常用的分位数还有第25百分位数,第75百分位数.
(2)第25,50,75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(3)第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
4.由频率分布直方图求百分位数的方法:
(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.
(2)可采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可.
2提升学科能力
一、题点一 百分位数的定义
1.下列表述不正确的是( )
A.总体的50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
【答案】C
【分析】根据百分位数定义分别判断各个选项即可.
【详解】50%分位数就是总体的中位数,故A选项正确,
第p百分位数可以有单位,故B选项正确,
一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误.
样本容量越大,第p百分位数估计总体就越准确,故D选项正确.
故选:C.
2.分位数的含义是( )
A.总体中任何一个数小于它的可能性是
B.总体中任何一个数小于或等于它的可能性至少是
C.总体中任何一个数大于它的可能性是
D.总体中任何一个数大于或等于它的可能性是
【答案】B
【分析】根据百分位数的定义,结合选项,即可求解.
【详解】根据第百分位数的定义知,分位数的含义是总体中任何一个数小于或等于它的可能性至少是15%.
故选:B.
3.下列关于一组数据的百分位数的说法正确的是( )
A.百分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是
C.它一定是这组数据中的一个数据
D.它适用于总体是离散型的数据
【答案】A
【分析】由百分位数的意义便可得到答案.
【详解】总体数据中的任意一个数至少有的数据小于或等于50百分位数,一组数据的百分位数不一定是这组数据中的一个数据,一组数据的百分位数也适用于总体是连续性的数据,所以选项B,C,D错误.
故选:A
4.已知100个数据的75%分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数
【答案】C
【分析】根据百分位数的定义得到BD错误,C正确;A选项可举出反例.
【详解】因为为整数,所以第75个数据和76个数据的平均数为75%分位数,是9.3,则C正确,BD错误;
A选项不一定正确,比如第75和第76个数均为9.3,那么这100个数据中有76个数小于或等于9.3.
故选:C
5.下列关于分位数的说法不正确的是( )
A.分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是
C.它是四分位数
D.它适用于总体是离散型的数据
【答案】BCD
【分析】根据百分位数的定义、特征和适用条件依次判断各项即可.
【详解】对于A,由百分位数定义可知:分位数就是中位数,A正确;
对于B,若总体数据各不相同且共有个,则分位数为从小到大排序的第个数,
此时从总体中抽取一个数,该数小于分位数的可能性为,B错误;
对于C,四分位数为和分位数,C错误;
对于D,总体是离散型的数据或是连续型的数据,均存在分位数,D错误.
故选:BCD.
二、题点二由样本数据求百分位数
6.数据2,3,5,5,6,7,8,8,9,10的分位数为( )
A.6 B.7 C.8 D.7.5
【答案】D
【分析】根据百分位数的定义进行求解.
【详解】,从小到大第6个数据为7,第7个数据为8,
故分位数为.
故选:D
7.某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的分位数为( )
A.93 B.93.5 C.94 D.94.5
【答案】B
【分析】利用百分位数的定义即可得解.
【详解】将比赛得分从小到大重新排列:85,87,89,90,91,91,92,93,94,96,
因为,
所以这组数据的分位数第8个数与第9个数的平均值,即.
故选:B.
8.从某公司生产的产品中任意抽取12件,得到它们的质量(单位:)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,则这组数据的四分位数不可能是( )
A.8.75 B.8.15 C.9.9 D.8.5
【答案】C
【分析】将这组数据从小到大排序,根据百分位数的概念,即可得到答案.
【详解】将这12个数据从小到大排序得:7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
由,可知这组数据的第25百分位数为,
由,可知这组数据的第50百分位数为,
由,可知这组数据的第75百分位数为,所以这组数据的四分位数不可能是9.9.
故选:C
9.2022年7月21日至30日某地区的最高温度(单位:℃)分别为:33,33,32,36,34,35,35,37,34,38,则这组数据的分位数是 .
【答案】
【分析】根据百分位数的计算公式计算即可.
【详解】将33,33,32,36,34,35,35,37,34,38,按照从小到大的顺序排列,
得共10个数,
由,得这组数据的分位数是第7个数,
所以这组数据的分位数是.
故答案为:.
10.学校组织秋季运动会,在一项比赛中,学生甲进行了8组投篮,得分(单位:分)分别为10,8,,8,7,9,6,8,如果学生甲的平均得分为8分,那么这组数据的75%分位数为 .
【答案】
【分析】由平均数求出的值,将这组数据从小到大的顺序排列,由百分位数的定义即可求解.
【详解】由题意可得,解得,将这组数据按从小到大的顺序排列为6,7,8,8,8,8,9,10,因为为整数,所以这组数据的75%分位数为.
故答案为:
三、题点三用频数(频率)分布表求百分位数
11.某高校12名毕业生的起始月薪如下表所示:
毕业生
1
2
3
4
5
6
7
8
9
10
11
12
起始月薪
4850
4950
5050
4880
4755
4710
4890
5130
4940
5325
4920
4880
则第85百分位数是( )
A.5325 B.5130 C.5050 D.4950
【答案】B
【分析】、
将所有数据从小到大重新排列后借助百分位数的定义计算即可得.
【详解】将所有数据从小到大重新排列后有:4710、4755、4850、4880、4880、4890、4920、
4940、4950、5050、5130、5325,
,则第85百分位数是第个数,即为5130.
故选:B.
12.设一组样本的容量为50,经过数据整理,得出了如下所示的频数分布表,则该组样本的第80百分位数为 .
数据分组区间
频数
15
18
6
5
6
【答案】
【分析】借助百分位数的定义计算即可得.
【详解】,,故第80百分位数必在,
设第80百分位数为,则有,解得.
故答案为:.
13.某面包店记录了最近一周A,B两种口味的面包的销售情况,如表所示:
A口味
B口味
星期
一
二
三
四
五
六
日
星期
一
二
三
四
五
六
日
销量/个
16
12
14
10
18
19
13
销量/个
13
18
10
20
12
9
14
(1)试比较最近一周A,B这两种口味的面包日销量的第60百分位数的大小.
(2)该面包店店主将在下一周每天都制作n个A口味的面包,假设下一周A口味的面包日销量和被记录的这一周的日销量保持一致,每个面包当天卖出可获利6元,当天未售出则将损失5元,从,15,16中选一个,你应该选择哪一个?说明你的理由.
【答案】(1)A口味的面包日销量的第60百分位数大于B口味的面包日销量的第60百分位数
(2)应该选择,理由见解析
【分析】(1)利用百分位数的定义求解即可;
(2)依题意分别求得,15,16时,面包店店主下一周A口味的面包可获利的金额,进而进行比较即可得解.
【详解】(1)最近一周A口味的面包日销量按照从小到大的顺序排列为10,12,13,14,16,18,19.
因为,所以A口味的面包日销量的第60百分位数为16;
最近一周B口味的面包日销量按照从小到大的顺序排列为9,10,12,13,14,18,20,
所以B口味的面包日销量的第60百分位数为14;
故最近一周A口味的面包日销量的第60百分位数大于B口味的面包日销量的第60百分位数.
(2)当时,下一周A口味的面包可获利
元;
当时,下一周A口味的面包可获利
元;
当时,下一周A口味的面包可获利
元;
因为,所以应该选择.
14.某单位为了了解退休职工生活情况,对50名退休职工做了一次问卷调查,满分100分,并从中随机抽取了10名退休职工的问卷,得分情况统计如下:
分数
77
79
81
84
88
92
93
人数
1
1
1
3
2
1
1
试回答以下问题:
(1)求抽取的10名退休职工问卷得分的分位数;
(2)求抽取的10名退休职工问卷得分的平均数和标准差s.
【答案】(1)86分
(2)85分,5
【分析】(1)依题意可得职工问卷得分的分位数为第个与第个数据的平均数,从而计算可得;
(2)根据平均数、标准差公式计算可得.
【详解】(1)解:∵,
∴抽取的10名退休职工问卷得分的分位数为第个与第个数据的平均数,
即,
故抽取的10名退休职工问卷得分的分位数为86分.
(2)解:抽取的10名退休职工问卷得分的平均数为分.
抽取的10名退休职工问卷得分的标准差
.
15.下表记录了一个家庭6月份每天在食品上面的消费金额(单位:元).
第1
天
第2
天
第3
天
第4
天
第5
天
第6
天
第7
天
第8
天
第9
天
第10
天
31
29
26
32
34
28
34
31
34
34
第11
天
第12
天
第13
天
第14
天
第15
天
第16
天
第17
天
第18
天
第19
天
第20
天
35
26
27
35
34
28
28
30
32
28
第21
天
第22
天
第23
天
第24
天
第25
天
第26
天
第27
天
第28
天
第29
天
第30
天
32
26
35
34
35
30
28
34
31
29
(1)该家庭6月份每天在食品上面的消费金额的中位数是多少?众数是多少?
(2)分别求该家庭6月份每天在食品上面的消费金额的5%,25%,50%,75%,95%分位数.
【答案】(1)中位数为31;众数为34
(2)消费金额的5%,25%,50%,75%,95%分位数依次为:26;28;31;34;35
【分析】(1)将所有数据由小到大排列,根据中位数及众数的概念求解;
(2)将所有数据由小到大排列,根据百分位数的概念计算即可.
【详解】(1)将所有数据由小到大排列得:26,26,26,27,28,28,28,28,28,29,29,30,30,31,31,31,32,32,32,34,34,34,34,34,34,34,35,35,35,35.
该样本共有30个数据,
∵30×50%=15,∴消费金额的中位数为第15个数31与第16个数31的平均数31;
根据众数的概念可知,消费金额的众数为34.
(2)将所有数据由小到大排列得:26,26,26,27,28,28,28,28,28,29,29,30,30,31,31,31,32,32,32,34,34,34,34,34,34,34,35,35,35,35.
该样本共有30个数据,
∵30×5%=1.5,∴消费金额的5%分位数为第2个数26;
∵30×25%=7.5,∴消费金额的25%分位数为第8个数28;
∵30×50%=15,∴消费金额的50%分位数为第15个数31与第16个数31的平均数31;
∵30×75%=22.5,∴消费金额的75%分位数为第23个数34;
∵30×95%=28.5,∴消费金额的95%分位数为第29个数35.
四、题点四 由频率分布直方图求百分位数
16.高二年级进行消防知识竞赛.统计所有参赛同学的成绩.成绩都在内.估计所有参赛同学成绩的第75百分位数为( )
A.65 B.75 C.85 D.95
【答案】C
【分析】根据给定的频率分布直方图,利用第75百分位数的定义求解即得.
【详解】观察频率分布直方图知,成绩在的频率为,
成绩在的频率为,
因此成绩的第75百分位数,,解得,
所以估计所有参赛同学成绩的第75百分位数为85.
故选:C
17.某校举办了数学知识竞赛,把1000名学生的竞赛成绩(满分100分,成绩取整数)按,,,分成四组,并整理成如图所示的频率分布直方图,则下列说法正确的为( )
A.的值为0.015 B.估计这组数据的众数为80
C.估计这组数据的第60百分位数为87 D.估计成绩低于80分的有350人
【答案】C
【分析】利用频率分布直方图的性质可判定A,利用众数、百分位数的求法可判定B、C,根据频率分布直方图计算可估计总体判定D.
【详解】易知,解得,所以A错误;
由频率分布直方图可知众数落在区间,用区间中点表示众数即85,所以B错误;
由频率分布直方图可知前两组频率之和为,
前三组频率之和为,
故第60百分位数落在区间,设第60百分位数为,
则,解得,所以C正确;
成绩低于80分的频率为,所以估计总体有,故D错误.
故选:C.
18.为进一步提升物业管理和服务质量,某小区随机抽取100名住户开展了年度幸福指数测评活动,将其测评得分(均为整数)分成六组:,,…,,并绘制成如图所示的频率分布直方图.由此估计此次测评中居民幸福指数的第75百分位数为 .
【答案】82
【分析】由百分位数的定义和频率分布直方图求解即可.
【详解】因为所有小矩形的面积之和为1,所以,
所以,测评得分落在内的频率为,
落在内的频率为,
设第75百分位数为,由,解得,
故第75百分位数为82.
故答案为:
19.某厂家为了保证防寒服的质量,从生产的保暖絮片中随机抽取多组,得到每组纤维长度(单位:)的均值,并制成如下所示的频率分布直方图,由此估计其纤维长度均值的分位数是 .
【答案】36
【分析】计算前6个以及前面7个矩形面积之和,确定纤维长度均值的分位数位于第7组内,根据分位数的含义,列式计算,即得答案.
【详解】由频率分布直方图可得从左到右前6个矩形面积之和为:,
前7个矩形面积之和为,
故纤维长度均值的分位数位于第7组内,
设纤维长度均值的分位数为x,则,
解得,
即估计其纤维长度均值的分位数是36,
故答案为:36
20.随机抽取100名男学生,测得他们的身高(单位:cm),按照区间,,,,分组,得到样本身高的频率分布直方图如图所示
(1)求这100名男学生身高在170cm及以上的学生人数;
(2)估计该校100名学生身高的75%分位数.
【答案】(1)60人
(2)176.25
【分析】(1)根据频率和为1列出方程,可得,进而结合频率公式进行求解即可;
(2)先求出,和,的人数占比,可得该校100名生学身高的分位数落在,,进而列出方程即可求解;
【详解】(1)由频率分布直方图可知,解得,
身高在及以上的学生人数(人;
(2),的人数占比为,,的人数占比为,
所以该校100名学生身高的分位数落在,,
设该校100名生学身高的分位数为,
则,解得,
故该校100名生学身高的分位数为176.25;
五、题点五 已知百分位数求参数
21.设实数满足.若数据1,3,4,,,的平均数和第50百分位数相等,则( )
A. B. C.或 D.或
【答案】C
【分析】由于,个数从小到大排列后有三种形式,分情况研究个数的平均数和第50百分位数相等即可求出的值.
【详解】数据1,3,4,,,共有个数,,
故第50百分位数应该是从小到大排列后的第个数和第个数的平均数,
且这个数的平均数和第50百分位数相等,
当个数从小到大排列后为:1,3,4,,,时,
有等式:,解得;
当个数从小到大排列后为:1,3,4,,,或1,3,4,,,时,
有等式:,解得;
综上,或,
故选:C.
22.一组数据:,其中为正整数,且.若该组数据的分位数为,则该组数据的众数为( )
A.1 B.3 C.5 D.7
【答案】A
【分析】确定分位数为第4个数和第5个数的平均数,考虑,,三种情况,计算得到答案.
【详解】,故分位数为第4个数和第5个数的平均数,不妨设,
①若,则,解得,,众数为;
②若,则中位数大于或等于,不成立;
③若,则中位数,不成立;
综上所述:,,众数为;
故选:A.
23.数据的第63百分位数是,则实数的最小值是 .
【答案】/
【分析】根据百分位数的定义进行求解即可.
【详解】由题意可知这组数据一个有8个,
因为,
所以这组数据第63百分位数是这组数据从小到大排列,第6个数据,
因为这组数据第63百分位数是,
所以实数的最小值是,
故答案为:
24.5名学生的期中考试数学成绩分别为,若这5名学生成绩的第60百分位数为111,则 .
【答案】112
【分析】由百分位数的定义求解即可.
【详解】由,将成绩从小到大排列,
得第60百分位数为第三个成绩和第四个成绩的平均数,
所以,解得.
故答案为:112
25.数据1,2,7,3,4,5,3,6的分位数是,则的取值范围是
【答案】
【分析】根据百分位数的知识求得的取值范围.
【详解】数据从小到大排序为:,
在第位,所以.
故答案为:
六、题点六有关百分位数的综合题
26.某中学为了解该校高三年级学生数学学习情况,对一模考试数学成绩进行分析,从中抽取了200名学生的成绩作为样本进行统计(若该校全体学生的成绩均在分),按照,,,,,,,的分组做出频率分布直方图如图所示,若用分层抽样从分数在内抽取17人,则抽得分数在的人数为6人.
(1)求频率分布直方图中的x,y的值;
(2)该高三数学组准备选取数学成绩在前4%的学生进行培优指导,若小明此次数学分数是132,请你估算他能被选取吗?
【答案】(1);
(2)不能,理由见解析.
【分析】(1)根据分层抽样求出的值,再利用所有分组的概率之和为,求出,从而可求解;
(2)利用百分位数的概念求解.
【详解】(1)由已知得用分层抽样从分数在内抽取的人数为人,
则由分层抽样可得分数在的人数与分数在的人数之比为,
所以,则,
所以 .
(2)由题意可知分数在的频率为,所以前在该组,不妨设第名的分数为,
则可得等式为,
即,
因为,所以小明不能被选取.
27.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将100个样本数据按分成6组,并整理得到如下频率分布直方图.
(1)请通过频率分布直方图估计这100份样本数据的平均值(同一组中的数据用该组区间的中点值作代表).
(2)该市决定表彰知识竞赛成绩排名前的市民,某市民知识竞赛的成绩是,请估计该市民能否得到表彰
【答案】(1)68.3
(2)估计该市民能得到表彰
【分析】(1)用每组中点值为代表,估算平均值;
(2)估算排名在的成绩,和比较,得到结论.
【详解】(1)100份样本数据的平均值为:
(2)成绩低于70分的频率为0.45,成绩低于80分的频率为0.77,
则被表彰的最低成绩为,
所以估计该市民能得到表彰.
28.某市在万成年人中随机抽取了名成年市民进行平均每天读书时长调查.根据调查结果绘制市民平均每天读书时长的频率分布直方图(如图),将平均每天读书时长不低于小时的市民称为“阅读爱好者”,并将其中每天读书时长不低于小时的市民称为“读书迷”.
(1)试估算该市“阅读爱好者”的人数,并指出其中“读书迷”约为多少人;
(2)省某机构开展“儒城”活动评选,规则如下:若城市中的成年人平均每天读书时长不低于小时,则认定此城市为“儒城”.若该市被认定为“儒城”,则评选标准应满足什么条件?(精确到)
(3)该市要成立“墨葫芦”读书会,吸纳会员不超过万名.根据调查,如果收取会费,则非阅读爱好者不愿意加入读书会,而阅读爱好者愿意加入读书会.为了调控入会人数,设定会费参数,适当提高会费,这样“阅读爱好者”中非“读书迷”愿意加入的人数会减少,“读书迷”愿意加入的人数会减少.问会费参数至少定为多少时,才能使会员的人数不超过万人?
【答案】(1)万“阅读爱好者”,“读书迷”约有万人
(2)参考标准不能高于小时(分钟)
(3)至少定为时,才能使入会的人员不超过万人
【分析】(1)利用频率分布直方图的性质直接求解即可;
(2)根据百分位数的定义直接求解即可;
(3)结合对数的运算,根据题意列出不等式,然后求解即可.
【详解】(1)样本中“阅读爱好者”出现频率为,
“阅读爱好者”的人数为(万),
“读书迷”人数为(万),
所以万“阅读爱好者”中,“读书迷”约有万人.
(2)由题意知至多有的成年人每天读书时长少于,
即找到分位数,
又,,
所以,可得,
即参考标准不能高于小时(分钟).
(3)“阅读爱好者”中非“读书迷”约有万人,
“读书迷”约有万人,
令,
化简得:,
解得:或,所以,
所以会费参数至少定为时,才能使入会的人员不超过万人.
29.某营养学研究人员用随机抽样的方法获得了某高校100名女大学生平均每日摄取的热量(单位:千大卡,1千大卡=1000千卡),这组数据的频率分布直方图如图所示.
(1)健康的成年女性每天需要摄取1.80~1.90千大卡(不含1.90千大卡)的热量,试估计该校有多少比例的女大学生摄取的热量在此范围之内;
(2)已知摄取热量范围在的数据为:1.90,1.90,1.91,1.91,1.91,1.93,1.94,1.94,1.95,1.95,1.96,1.96, 1.97, 1.98,1.99.若1.91是这100个样本数据的第k百分位数,求正整数k的值.
【答案】(1)
(2)或
【分析】(1)利用频数分布直方图的性质计算即可.
(2)利用百分位数的定义求解即可.
【详解】(1)小长方形面积和为1,,
解得,故比例为,
综上有的女大学生摄取的热量在此范围之内,
(2)在区间内有个数,
所以1.91是这100个样本数据的第个数,
则第个数的平均数,或第个数的平均数为1.91,
同时,第个数的平均数,或第个数的平均数皆不是1.91,
因为,所以为整数,
所以当1.91是这100个样本数据的第k百分位数时,必有或,
故k的值为或.
30.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年200位居民家庭的月平均用水量(单位:吨),将数据按照,分成6组,制成了如图所示的频率分布直方图.
(1)求直方图中的值;
(2)该市决定设置议价收费标准,用水量低于的居民家庭按照“民用价”收费,不低于的按照“商业价”收费,为保障有的居民能享受“民用价”,请设置该标准;
(3)以每组数据的中点值作为该组数据的代表,分别是.规定“最佳稳定值”是这样一个量:与各组代表值的差的平方和最小.依此规定,请求出的值.
【答案】(1)0.0625
(2)19.2
(3)12
【分析】(1)根据每组小矩形的面积之和为1即可求解.
(2)由频率分布直方图求第p百分位数的计算公式即可求解.
(3)设与各数据的差的平方和为,由题意得,利用二次函数性质即可求解.
【详解】(1)由频率分布直方图知,家庭月均用水量在中的频率为,
同理,在中的频率分别为.
由,解得;
(2)由(1)知,前4组的总频率为,
前5组的总频率为,所以,
所以根据百分位数的计算方法有,解得;
(3)设与各数据的差的平方和为,
则
,
由二次函数的性质知,当时,取得最小值,
故.
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
$$