内容正文:
9.2.2&9.2.3 总体百分位数的估计总体集中趋势的估计知识归纳与试题检测(详解版)
问题式教材知识归纳
【1】百分位数
(1)把个样本数据按从小到大排序,得到第个和第(个数据分别为,区间()内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数,并称此数为这组数据的第百分位数,或分位数.
(2)一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有_______的数据小于或等于这个值,且至少有的数据大于或等于这个值.
【答案】
【2】计算一组n个数据的p分位数的一般步骤如下:
第一步,按照_______排列原始数据;
第二步,计算_______;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第______项数据;若i是整数,则p分位数为第i项与第_______项数据的_______.
【答案】 从小到大 平均数
【3】四分位数
_________,_________,_________这三个分位数把一组数据由小到大排列后的数据分成四等份,因此称为四分位数.
【答案】 第25百分位数 第50百分位数 第75百分位数
【4】[微思考]
(1)班级人数为50的班主任老师说“的同学能够考取本科院校”,这里的“”是百分位数吗?
__________________
(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
______________
【答案】 不是,是指能够考取本科院校的同学占同学总数 的百分比 有75%的同学数学测试成绩小于或等于85分
【5】众数、中位数和平均数的定义
(1)众数:一组数据中__________的数.
(2)中位数:一组数据按大小顺序排列后,处于_________位置的数.如果个数是偶数,则取__________两个数据的平均数.
(3)平均数:一组数据的_________除以数据个数所得到的数.
【答案】 出现次数最多 中间 中间 和
【6】众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的__________与小矩形的__________的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该__________.
(3)众数:众数是__________小矩形底边的中点所对应的数据.
【答案】 横坐标 面积 相等 最高
【7】众数、中位数和平均数的比较:
名称
优点
缺点
平均数
与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
不受少数几个极端数据(即排序靠前或靠后的数据)的影响
对极端值不敏感
众数
体现了样本数据的最大集中点
众数只能传递数据中的信息的很少一部分,对极端值不敏感
基于教材的检测题
一、单选题
1.数据1,2,4,5,7,9的第60百分位数为( )
A.4 B.5 C.6 D.7
【答案】B
【详解】易知共6个数据,且,
因此第60百分位数取第四个数即可,即为5.
2.某市连续8天的AQI(空气质量指数)按从小到大的顺序排列为26,29,35,40,43,57,61,68,则这组数据的下四分位数为( )
A.29 B.32 C.57 D.59
【答案】B
【详解】由题意得:,所以下四分位数即从小到大排列中的第2与第3个数据的平均数,即.
3.某小商品生产企业对2025年1月到11月甲,乙两个车间的产量(单位:百万件)进行了统计,得到如图所示的折线图,则( )
A.乙车间产量的中位数为6月份的产量
B.甲车间产量的极差大于乙车间产量的极差
C.甲车间产量的平均值小于乙车间产量的平均值
D.甲车间产量的第80百分位数大于乙车间产量的第80百分位数
【答案】D
【详解】一共11个月的产量数据,中位数是将产量从小到大排序后的第个数据,
对乙车间产量排序后,第6个数据是月份的产量,不是6月份,A错误;
甲车间产量极差约为,乙车间产量极差约为,甲的极差小于乙的极差,B错误;
观察折线图,除9月、10月外,其余月份甲车间产量均高于乙车间,整体估算可得甲产量平均值大于乙的平均值,C错误;
第80百分位数为,根据百分位数计算可知第80百分位数是排序后的第9个数据,
从小到大排序后,甲的第9个数据约为3.85,乙的第9个数据约为3.6,甲的第80百分位数大于乙,D正确.
4.已知一组数据:中的最小数据为9,且第75百分位数是14,则的不同取值可能有( )
A.8个 B.6个 C.4个 D.1个
【答案】B
【分析】根据数据中最小数据为,得到,再由百分位数的计算方法,求得,进而得到的可能取值的个数,即可求解.
【详解】因为数据中最小数据为,可得且,
将7个数据从小到大排序,
因为,则该组数据的第75百分位数为第6个数据,可得,
所以,则的可能取值有,共6个.
5.一组从小到大排列的数据:.若它们的第60百分位数比平均数大2,则的值为( )
A.10 B.11 C.12 D.13
【答案】A
【分析】借助百分位数定义与平均数定义计算即可得.
【详解】,这5个数据的第60百分位数是第三个数据和第四个数据的平均数,
即,即有,解得.
6.为了保证驾乘人员的安全,某市要对该市出租车司机的年龄进行调查,现从中随机抽出名司机,已知抽到的司机年龄都在岁,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )
A.岁 B.岁 C.岁 D.岁
【答案】C
【分析】先补全组的频率,再通过累计频率判断中位数落在区间,最后利用中位数定义列方程求解即可.
【详解】根据所给的信息可知,在区间上的数据的频率为
,
因为的频率为,的频率为,
所以中位数在,
设为中位数为,则,
解得.
7.如图所示,某单峰频率分布直方图在右边“拖尾”,若由频率分布直方图估计样本数据的中位数为m,众数为n,平均数为p,则( )
A. B. C. D.
【答案】A
【分析】根据平均数,中位数,众数的概念结合图形分析判断.
【详解】由频率分布直方图可知,单峰不对称且右“拖尾”,最高峰偏左,众数最小.
平均数受极端值影响,与中位数相比,平均数总在“拖尾”那边,故平均数大于中位数,
故得.
8.为了解某校学生的某次数学测试情况,随机抽取部分学生成绩(最低分为50分,满分100分),得到如图所示的频率分布直方图,则下列结论不正确的是( )
A.对应矩形的高度为0.016 B.样本众数估计值为75
C.样本平均数估计值为77.4 D.样本成绩的第70百分位数落在内
【答案】D
【分析】A选项利用矩形的面积之和为1列方程求解,B选项根据众数的定义以及直方图中最高的矩形条来判断,C选项根据平均值的公式计算,D选项判断样本数据在的频率和的频率,可得到70百分位数的范围.
【详解】设对应矩形的高度为,则,解得,A选项正确;
由图可知,的数据最多,众数的估计值为,B选项正确;
平均值为:,C选项正确;
样本数据的频率为,
样本数据的频率为,
故样本成绩的第70百分位数落在内,所以D选项错误.
二、多选题
9.电影南京照相馆在全国各地热映,某影院连续天的观影人数单位:百人依次为,,,,,,,,则这组数据的( )
A.众数为 B.中位数为
C.平均数为 D.第百分位数为
【答案】AC
【分析】由样本数据的数字特征依次判断选项即可.
【详解】对于A,160出现的次数最多,故众数是160,故A正确;
对于B,将数据从小到大排列为80,90,120,160,160,160,170,180,
共八个数据,则中位数是第4位与第5位的平均数,即中位数是,故B错误;
对于C,平均数为,故C正确;
对于D,,故第百分位数为从小到大的第3位数,即120,故D错误.
10.为了解某校学生的某次数学测试情况,随机抽取部分学生成绩(最低分为50分,满分100分),得到如图所示的频率分布直方图,则下列结论正确的有( )
A.对应矩形的高度为
B.样本众数估计值为75
C.样本平均数估计值为
D.样本成绩的第70百分位数落在内
【答案】ABC
【分析】A选项利用矩形的面积之和为1列方程求解,B选项根据众数的定义以及直方图中最高的矩形条来判断,C选项根据平均值的公式计算,D选项判断样本数据在的频率和的频率,可得到70百分位数的范围.
【详解】设对应矩形的高度为,则,
解得,A选项正确;
由图可知,的数据最多,众数的估计值为,B选项正确;
平均值为:,C选项正确;
样本数据的频率为,
样本数据的频率为,
故样本成绩的第70百分位数落在内,D选项错误.
11.已知年中国体育产业规模(单位:万亿元)数据如表所示:
年份
体育产业规模(单位:万亿元)
则这个数据的( )
A.极差为 B.中位数为
C.分位数为 D.平均数大于
【答案】ACD
【分析】根据极差为最大值与最小值的差,求出极差即可判断选项;求百分位数和中位数,需对数据按从小到大重新排序,再按照定义即可判断选项和选项;选项,只需求出平均数与比较即可判断.
【详解】对于A,根据表格数据可以看出,最大值为万亿元,最小值为万亿元,
所以极差为,故A正确;
对于B,表格中8个数据从小到大排序为,,,,,,,,
所以中位数为,故B错误;
对于C,,所以分位数是第个数字,即,故C正确;
对于D,
平均数为,
故D正确.
三、填空题
12.某班学号1-8的学生铅球测试成绩如下表:
学号
1
2
3
4
5
6
7
8
成绩
9.2
7.9
8.5
6.8
5.2
7.2
8.1
8.2
这8名学生铅球测试成绩的第25百分位数为__________.
【答案】7
【分析】先排序,再利用百分位数的计算方法即可求解.
【详解】先将这8个数据从小到大排序:5.2,6.8,7.2,7.9,8.1,8.2,8.5,9.2,
因为,所以这8名学生铅球测试成绩的第25百分位数为.
13.某运动员在某次男子10米气手枪射击比赛中的得分数据(单位:环,数据均为整数)如茎叶图所示,则这组数据的平均数为___________.
【答案】97.1
【分析】由茎叶图得到全部数据,然后由平均数的定义求得结果.
【详解】这组数据为:83,91,95,97,97,98,100,101,102,107,
所以这组数据的平均数为,
故答案为:97.1
14.先后抛掷一枚质地均匀的骰子次,记录向上一面的点数,若已知个点数的中位数为,唯一的众数为,则平均数最大为_____.
【答案】
【分析】根据题意将符合要求的个数据由小到大排列出来,再结合平均数公式求解即可.
【详解】将个数据由小到大进行排列,前个数依次为、、,要使得这个数据的平均数最大,
则后面两个数分别为、,即这个数据由小到大依次为、、、、,
所以这个点数的平均数的最大值为.
四、解答题
15.为了解学校高二学生的物理成绩,从某次测试中随机抽取100份测试卷进行成绩调查,发现抽取的测试卷的成绩分数都在40~100之间,将抽取的测试卷按成绩分成六组:,,画出如图所示的频率分布直方图.
(1)若60分(包含60)以上为合格,求的值和合格人数;
(2)求抽取测试卷成绩的第80百分位数.
【答案】(1),合格人数为75人.
(2)84
【分析】(1)利用频率和为1求的值,再根据频率与频数的关系估计合格人数.
(2)根据百分位数的概念求第80百分位数.
【详解】(1)由.
100份测试卷中,合格人数为:人.
(2)因为,,
所以成绩的第80百分位数为:.
16.第二届全国城市生活垃圾分类宣传周的主题为“践行新时尚分类志愿行”.某中学高三年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中第1组频数的平方等于第2组、第4组频数之积,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求,的值;
(2)若根据这次成绩,学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为多少合理?
【答案】(1),
(2)78分
【分析】(1)根据频率的性质即可求解,
(2)求解80%分位数即可得解.
【详解】(1)由第1组频数的平方等于第2组、第4组频数之积,即,则;
又,解得;
(2)由于成绩在内的频率为,在内的频率为,
故80%分位数位于,设为m,则,解得;
故学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为78分.
17.某学校高一新生体检,校医室为了解新生的身高情况,随机抽取了100名同学的身高数据(单位:),制作成频率分布直方图如图所示.
(1)估计这100名同学身高的上四分位数;
(2)用分层抽样的方法从中抽出一个容量为17的样本,如果样本按比例分配,则各区间应抽取多少人?
【答案】(1)176.25
(2)7人,6人,4人
【分析】(1)根据频率分布直方图的性质求得,再由百分位数的定义列方程求解即得;
(2)根据抽样比即可计算出各组应抽取的人数.
【详解】(1)由频率分布直方图可得,第一组的频率为0.05,第二组的频率为0.35,第三组的频率为,第四组的频率为0.20,第五组的频率为0.10,
则解得,
因为前3组的频率和为0.7,前4组的频率和为0.9,
所以第75百分位数在第四组,不妨设为,
则,
解得,即第75百分位数约为176.25;
(2)根据题意,第组应抽取人,
第组应抽取人,
第组应抽取人.
18.某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
【答案】(1)
(2),
(3)众数:75 分;平均数:76.5 分;人
【分析】(1)由频率分布直方图中各个矩形的面积和为1即可求解;
(2)由频率分布直方图确定成绩落在,的频率,再由频率估计人数即可;
(3)由样本数据的数字特征求法依次求解即可.
【详解】(1)由题意得,解得.
(2)设为成绩落在上的概率,为成绩落在的人数,
由题意得,
设为成绩落在上的概率,为成绩落在的人数,
.
(3)由题意得众数为75分;
由(1)得成绩落在的频率为0.1,落在的频率为0.15,
落在的频率为0.35,落在的频率为0.3,落在的频率为0.1,
则平均数为,
设为78分以上的频率,为78分以上的人数,
则
,
故78分以上的人数为47人.
19.如图是某地某公司1000名员工的月收入的直方图.根据直方图估计:
(1)该公司月收入在1000元到1500元之间的人数;
(2)该公司员工的月平均收入;
(3)该公司员工收入的众数;
(4)该公司员工月收入的中位数;
(5)该公司员工月收入的第90分位数.
【答案】(1)100
(2)2400
(3)2500元
(4)2400元.
(5)3333
【分析】(1)先计算出该公司月收入在1000元到1500元之间的频率,即可求解;
(2)将每个矩形底边的中点值乘以对应矩形的面积,再将所得的积全部相加可得出该公司员工月收入的平均数;
(3)由众数的定义求解;
(4)由中位数的定义求解;
(5)由百分位数的定义求解.
【详解】(1)根据频率分布直方图知,满足条件的频率为:
所以满足条件的人数为:(人).
(2)据题意该公司员工的平均月收入为:
(元)
(3)根据频率分布直方图知,最高矩形(由两个频率相同的矩形构成)的底边中点的横坐标为2500,即公司员工月收入的众数为2500元.
(4)根据频率分布直方图知,中位数介于2000元至2500元之间,故可设中位数为,则由,即公司员工月收入的中位数为2400元.
(5)根据频率分布直方图知,公司员工月收入小于3000元的百分比为,公司员工月收入小于3500元的百分比为(
所以公司员工月收入的第90分位数是.
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
$
9.2.2&9.2.3 总体百分位数的估计总体集中趋势的估计知识归纳与试题检测(学生版)
问题式教材知识归纳
【1】百分位数
(1)把个样本数据按从小到大排序,得到第个和第(个数据分别为,区间()内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数,并称此数为这组数据的第百分位数,或分位数.
(2)一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有_______的数据小于或等于这个值,且至少有的数据大于或等于这个值.
【2】计算一组n个数据的p分位数的一般步骤如下:
第一步,按照_______排列原始数据;
第二步,计算_______;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第______项数据;若i是整数,则p分位数为第i项与第_______项数据的_______.
【3】四分位数
_________,_________,_________这三个分位数把一组数据由小到大排列后的数据分成四等份,因此称为四分位数.
【4】[微思考]
(1)班级人数为50的班主任老师说“的同学能够考取本科院校”,这里的“”是百分位数吗?
__________________
(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
______________
【5】众数、中位数和平均数的定义
(1)众数:一组数据中__________的数.
(2)中位数:一组数据按大小顺序排列后,处于_________位置的数.如果个数是偶数,则取__________两个数据的平均数.
(3)平均数:一组数据的_________除以数据个数所得到的数.
【6】众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的__________与小矩形的__________的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该__________.
(3)众数:众数是__________小矩形底边的中点所对应的数据.
【7】众数、中位数和平均数的比较:
名称
优点
缺点
平均数
与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
不受少数几个极端数据(即排序靠前或靠后的数据)的影响
对极端值不敏感
众数
体现了样本数据的最大集中点
众数只能传递数据中的信息的很少一部分,对极端值不敏感
基于教材的检测题
一、单选题
1.数据1,2,4,5,7,9的第60百分位数为( )
A.4 B.5 C.6 D.7
2.某市连续8天的AQI(空气质量指数)按从小到大的顺序排列为26,29,35,40,43,57,61,68,则这组数据的下四分位数为( )
A.29 B.32 C.57 D.59
3.某小商品生产企业对2025年1月到11月甲,乙两个车间的产量(单位:百万件)进行了统计,得到如图所示的折线图,则( )
A.乙车间产量的中位数为6月份的产量
B.甲车间产量的极差大于乙车间产量的极差
C.甲车间产量的平均值小于乙车间产量的平均值
D.甲车间产量的第80百分位数大于乙车间产量的第80百分位数
4.已知一组数据:中的最小数据为9,且第75百分位数是14,则的不同取值可能有( )
A.8个 B.6个 C.4个 D.1个
5.一组从小到大排列的数据:.若它们的第60百分位数比平均数大2,则的值为( )
A.10 B.11 C.12 D.13
6.为了保证驾乘人员的安全,某市要对该市出租车司机的年龄进行调查,现从中随机抽出名司机,已知抽到的司机年龄都在岁,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )
A.岁 B.岁 C.岁 D.岁
7.如图所示,某单峰频率分布直方图在右边“拖尾”,若由频率分布直方图估计样本数据的中位数为m,众数为n,平均数为p,则( )
A. B. C. D.
8.为了解某校学生的某次数学测试情况,随机抽取部分学生成绩(最低分为50分,满分100分),得到如图所示的频率分布直方图,则下列结论不正确的是( )
A.对应矩形的高度为0.016 B.样本众数估计值为75
C.样本平均数估计值为77.4 D.样本成绩的第70百分位数落在内
二、多选题
9.电影南京照相馆在全国各地热映,某影院连续天的观影人数单位:百人依次为,,,,,,,,则这组数据的( )
A.众数为 B.中位数为
C.平均数为 D.第百分位数为
10.为了解某校学生的某次数学测试情况,随机抽取部分学生成绩(最低分为50分,满分100分),得到如图所示的频率分布直方图,则下列结论正确的有( )
A.对应矩形的高度为
B.样本众数估计值为75
C.样本平均数估计值为
D.样本成绩的第70百分位数落在内
11.已知年中国体育产业规模(单位:万亿元)数据如表所示:
年份
体育产业规模(单位:万亿元)
则这个数据的( )
A.极差为 B.中位数为
C.分位数为 D.平均数大于
三、填空题
12.某班学号1-8的学生铅球测试成绩如下表:
学号
1
2
3
4
5
6
7
8
成绩
9.2
7.9
8.5
6.8
5.2
7.2
8.1
8.2
这8名学生铅球测试成绩的第25百分位数为__________.
13.某运动员在某次男子10米气手枪射击比赛中的得分数据(单位:环,数据均为整数)如茎叶图所示,则这组数据的平均数为___________.
14.先后抛掷一枚质地均匀的骰子次,记录向上一面的点数,若已知个点数的中位数为,唯一的众数为,则平均数最大为_____.
四、解答题
15.为了解学校高二学生的物理成绩,从某次测试中随机抽取100份测试卷进行成绩调查,发现抽取的测试卷的成绩分数都在40~100之间,将抽取的测试卷按成绩分成六组:,,画出如图所示的频率分布直方图.
(1)若60分(包含60)以上为合格,求的值和合格人数;
(2)求抽取测试卷成绩的第80百分位数.
16.第二届全国城市生活垃圾分类宣传周的主题为“践行新时尚分类志愿行”.某中学高三年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中第1组频数的平方等于第2组、第4组频数之积,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求,的值;
(2)若根据这次成绩,学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为多少合理?
17.某学校高一新生体检,校医室为了解新生的身高情况,随机抽取了100名同学的身高数据(单位:),制作成频率分布直方图如图所示.
(1)估计这100名同学身高的上四分位数;
(2)用分层抽样的方法从中抽出一个容量为17的样本,如果样本按比例分配,则各区间应抽取多少人?
18.某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
19.如图是某地某公司1000名员工的月收入的直方图.根据直方图估计:
(1)该公司月收入在1000元到1500元之间的人数;
(2)该公司员工的月平均收入;
(3)该公司员工收入的众数;
(4)该公司员工月收入的中位数;
(5)该公司员工月收入的第90分位数.
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
$