内容正文:
9.2.2 总体百分位数的估计
9.2.3 总体集中趋势的估计
目 标 素 养
1.结合实例,能用样本估计百分位数,提升数学抽象素养.
2.理解百分位数的统计含义并掌握其计算方法,提升数学运算素养.
3.理解集中趋势参数的统计含义.掌握平均数、中位数、众数的计算方法,能用样本估计总体的集中趋势参数,提升数学抽象和数学运算素养.
知 识 概 览
课前·基础认知
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 p% 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按 从小到大 排列原始数据.
第2步,计算i= n×p% .
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第 j 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 平均数 .
微思考1 (1)第p百分位数有什么特点?
提示:总体数据中的任意一个数小于或等于它的可能性是p.
(2)某组数据的第p百分位数在此组数据中一定存在吗?为什么?
提示:不一定.因为按照计算第p百分位数的步骤,第2步计算所得的i=n×p%如果是整数,则第p百分位数为第i项与第(i+1)项数据的平均数,若第i项与第(i+1)项数据不相等,则第p百分位数在此组数据中就不存在.
3.四分位数
第25百分位数、第50百分位数和第75百分位数把一组由小到大排列后的数据分成 四等份 ,因此称为四分位数.其中第25百分位数也称为 第一 四分位数或 下 四分位数等,第75百分位数也称为 第三 或 上 四分位数等.
微思考2 (1)某班有50人,班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?
提示:不是.它是指能够考取本科院校的同学人数占同学总人数的百分比.
(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
提示:有70%的同学数学测试成绩小于或等于85分.
4.众数、中位数和平均数的定义
(1)众数:一组数据中出现次数最多的数据.
(2)中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则称处于 中间 位置的数为这组数据的中位数;如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数.
(3)平均数:一组数据的和与这组数据的个数的商.
5.众数、中位数和平均数的比较
微思考3 (1)中位数一定是样本数据中的一个数吗?
提示:不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数是中位数;如果有偶数个数据,则中间两个数据的平均数是中位数.
(2)一组数据的众数可以有几个?中位数是否也具有相同的结论?
提示:一组数据的众数可能有一个,也可能有多个,中位数只有唯一一个.
6.众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的 横坐标 与小矩形的 面积 的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该 相等 .
(3)众数:在频率分布直方图中, 最高 小矩形所在区间的中点作为众数的估计值.
微训练 某班全体学生参加物理测试
成绩(单位:分)的频率分布直方图如图
所示,则估计该班物理测试成绩的众数
是( )
A.60分 B.70分
C.80分 D.90分
答案:B
课堂·重难突破
一 百分位数的计算
典例剖析
1.某良种培育基地正在培育一种小麦新品种,随机抽出试种的45亩所得亩产的样本数据(单位:千克)如下:
399 359 400 368 375 388 392 357 367
405 412 430 415 421 427 403 423 414
430 434 443 445 445 451 454 422 430
363 391 374 410 385 386 371 392 394
415 401 401 423 406 407 383 412 400
估计试种小麦新品种的第25,50,75百分位数.
解:把45个样本数据按从小到大排序
357 359 363 367 368 371 374 375 383
385 386 388 391 392 392 394 399 400
400 401 401 403 405 406 407 410 412
412 414 415 415 421 422 423 423 427
430 430 430 434 443 445 445 451 454
由25%×45=11.25,50%×45=22.5,75%×45=33.75,
可知样本数据的第25,50,75百分位数分别为第12,23,34项数据,即分别为388,405,423.
由此可以估计试种小麦新品种的第25,50,75百分位数分别为388,405,423.
规律总结
计算一组n个数据的第p百分位数的步骤
(1)排序:按从小到大排列原始数据.
(2)算i:计算i=n×p%.
(3)定项:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
学以致用
1.为了解中学生的身高状况,对某中学同龄的50名男生的身高进行了测量,数据(单位: cm)如下:
175 168 170 176 167 181 162 173 172 177
171 172 174 173 174 175 177 166 163 160
166 166 163 169 174 165 175 165 170 158
174 172 166 172 167 172 175 161 173 167
170 172 165 157 172 173 166 177 169 181
估计同龄的50名男生的身高的第35,50,80百分位数.
解:把50个样本数据按从小到大排序
157 158 160 161 162 163 163 165 165 165
166 166 166 166 166 167 167 167 168 169
169 170 170 170 171 172 172 172 172 172
172 172 173 173 173 173 174 174 174 174
175 175 175 175 176 177 177 177 181 181
由35%×50=17.5,50%×50=25,80%×50=40,
可知样本数据的第35百分位数为第18项数据,即为167;
第50百分位数是第25项和第26项数据的平均数,即171.5;
第80百分位数是第40项和第41项数据的平均数,即174.5.
由此可以估计同龄的50名男生的身高的第35,50,80百分位数分别为167,171.5,174.5.
二 根据频率分布直方图(表)求百分位数
典例剖析
2.某班50名学生参加一项测试,将测试成绩(单位:分)的数据整理,得到如下频数分布表:
试估计样本中50名学生的测试成绩的80%分位数和95%分位数.
组号 分组 频数
1 [60,70) 8
2 [70,80) 15
3 [80,90) 17
4 [90,100] 10
合计 50
解:由题中统计表可知,测试成绩在90分以下的学生所占比例为0.8,所以估计测试成绩的80%分位数是90分.
测试成绩的95%分位数一定位于区间[90,100]上,
可以估计测试成绩的95%分位数是97.5分.
规律总结 计算频率分布直方图(表)中第p百分位数,一般先求频率,找到所求百分位数所在的区间[a,b],若小于a的频率为m,小于b的频率为n,则所求百分位数是a+|b-a|× .
学以致用
2.某校为了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了频率分布直方图如图所示,则估计抽取样本的80%分位数约为 (精确到0.01).
答案:53.33
解析:由题图,可知体重在50 kg以下的女生所占比例为0.60,体重在55 kg以下的女生所占比例为0.90.
因此80%分位数一定位于区间[50,55)内,
故估计抽取样本的80%分位数约为53.33.
三 根据频率分布直方图求平均数、中位数和众数
典例剖析
3.某校从参加高二年级
学业水平测试的学生中
抽出80名学生,其数学成
绩(单位:分)的频率分布
直方图如图所示.估计:
(1)这次测试数学成绩的众数;
(2)这次测试数学成绩的中位数(精确到0.01).
(2)设中位数为x,由于前三个矩形面积之和为0.4,
第四个矩形面积为0.3,0.3+0.4>0.5,
因此中位数位于第四分组,
由0.1=0.03(x-70),得x≈73.33.
故估计这次测试数学成绩的中位数约为73.33.
互动探究
1.(变问法)若本例条件不变,估计这次测试数学成绩的平均数.
解:由题图,估计这次测试数学成绩的平均数为
2.(变问法)若本例条件不变,求80分以下的学生人数.
解:80分以下的频率为(0.005+0.015+0.020+0.030)×10=0.7,
所以80分以下的学生人数为80×0.7=56.
规律总结 众数、中位数、平均数与频率分布直方图的联系
(1)众数:在样本数据的频率分布直方图中,最高小矩形的底边中点的横坐标作为众数的估计值.
(2)中位数:在样本中,有50%的个体大于或等于中位数,因此在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘以每个小矩形底边中点的横坐标之和.
学以致用
3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩(单位:分)进行整理后分成五组,绘制成频率分布直方图如图所示.估计:
(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生成绩的平均数.
解:(1)由题图可估计高一参赛学生成绩的众数为65.
因为第一个小矩形的面积为0.3,
第二个小矩形的面积为0.4,0.3+0.4>0.5,
因此中位数位于第二个小矩形对应的分组内.
设中位数为60+x,则0.3+x×0.04=0.5,得x=5,
所以估计高一参赛学生成绩的中位数为60+5=65.
(2)估计高一参赛学生成绩的平均数为
55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67.
随堂训练
1.(多选题)在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法正确的是
( )
A.众数是83 B.中位数是83
C.极差是30 D.平均数是83
答案:ABC
2.已知一组数据x1,x2,x3,x4,x5的平均数是2,那么另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为( )
A.1 B.2
C.3 D.4
答案:A
3.从某小学随机抽取100名学生,将他们的身高(单位:cm)分布情况汇总如下表:
身高/cm [100,110) [110,120) [120,130) [130,140) [140,150]
频数 5 35 30 20 10
由此估计这100名小学生身高的50%分位数为( )(精确到0.1)
A.119.3 B.119.7
C.123.3 D.126.7
答案:C
解析:50%分位数,即样本数据的中位数.由题可知身高在区间[100,110),[110,120),[120,130)内的频率依次为0.05,0.35,0.30,前两组频率和为0.40,组距为10,设中位数为x,则(x-120) × =0.1,解得x≈123.3.
4.某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理下表:
亩产量 [900,
950) [950,
1 000) [1 000,
1 050) [1 050,
1 100) [1 100,
1 150) [1 150,
1 200)
生产数 6 12 18 30 24 10
据表中数据,结论中正确的是( )
A.100块稻田亩产量中位数小于1 050 kg
B.100块稻田中的亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
答案:C
解析:由6+12+18=36<50,6+12+18+30=66>50,
得中位数在[1 050,1 100)范围内,故A错误;
亩产量低于1 100 kg的稻田生产数为6+12+18+30=66,
亩产量最大值在[1 150,1 200)范围内,最小值在[900,950)范围内,故极差在(1 150-950,1 200-900)范围内,即200 kg至300 kg之间,故C正确;
取各区间中点估算平均值:
5.为了调查某厂工人生产某种产品
的能力,随机抽查了20名工人某天
生产该产品的数量,绘制频率分布
直方图如图所示,则:
(1)这20名工人中一天生产该产品
数量在区间[55,75)内的人数是 .
(2)估计这20名工人一天生产该产品数量的中位数为 .
(3)估计这20名工人一天生产该产品数量的平均数为 .
答案:(1)13 (2)62.5 (3)64
解析:(1)由频率分布直方图可知,落在区间[55,75)内的频率为(0.040+0.025)×10=0.65.
故落在区间[55,75)内的人数为0.65×20=13.
(2)设中位数为x,则0.2+(x-55)×0.040=0.5,解得x=62.5,
故这20名工人一天生产该产品数量的中位数为62.5.
(3)取每个小矩形底边的中点值乘每个小矩形的面积,其和即为该产品数量平均数的估计值,为0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
6.从高三学生中抽出50名学生参加数学竞赛,由成绩得到频率分布直方图如图所示.利用频率分布直方图估计:
(1)这50名学生成绩的50%分位数(精确到0.1);
(2)这50名学生的平均成绩.
解:(1)成绩在70分以下的学生所占比例为0.04+0.06+0.20=0.30,成绩在80分以下学生所占比例为0.04+0.06+0.20+0.30=0.60.
因此50%分位数一定位于区间[70,80)内,
可以估计样本数据的50%分位数约为76.7.
(2)取每个小矩形底边的中点的横坐标乘每个小矩形的面积求和即为平均数的估计值,因此平均成绩约为45×(0.004×10)+55×(0.006×10)+65×(0.020×10)+75×(0.030×10)+85×(0.024×10)+95×(0.016×10)=76.2.
$