内容正文:
5.1.4 用样本估计总体
学业标准
素养目标
1.会用样本的数字特征估计总体的数字特征.(重点)
2.能通过频率分布表或频率分布直方图对数据做出总体估计.(难点)
1.通过用样本的数字特征估计总体的数字特征,培养学生数学运算、逻辑推理等核心素养.
2.通过用样本的分布估计总体的分布,主要提升学生数据分析核心素养.
导学1
用样本估计总体
1.前提
样本的容量恰当,抽样方法合理.
2.必要性
(1)在容许一定误差存在的前提下,可以用样本估计总体,这样能节省人力和物力.
(2)有时候总体的数字特征不可能获得,只能用样本估计总体.
3.误差
估计一般是有误差的.但是,大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能性将越来越大.
导学2
用样本的数字特征估计总体的数字特征
某学校高一年级,只知道甲班和乙班的数学平均成绩为甲=70,乙=80;甲班人数为50人,乙班人数为40人,而缺少每名学生的成绩,如何计算甲、乙这两个班的数学平均成绩?
[提示] 甲、乙这两个班的平均成绩==·甲+·乙=甲+乙≈74.4(分).
◎结论形成
1.一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
2.样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.
条件
假设第一层抽取m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层抽取n个数,分别为y1,y2,…,yn,平均数为,方差为t2
结论
如果记样本均值为,样本方差为b2,则=,b2=×
导学3
用样本的分布估计总体的分布
2024年学期末,某学校对100间学生公寓进行综合评比,依考核分数分为A,B,C,D四种等级,其中分数在[60,70)为D等级,有15间;分数在[70,80)为C等级,有40间;分数在[80,90)为B等级,有20间;分数在[90,100]为A等级,有25间.考核评估后,得其频率分布直方图如图所示,估计这100间学生公寓评估得分的中位数为 .
[提示] 根据题意,由直方图可知,在[60,70)内的频率为0.15,在[70,80)内的频率为0.40,其和为0.55,故可知中位数在70~80之间,设为x,则可知(x-70)×0.040=0.35,解得x=78.75,可知满足题意的中位数即为78.75.
[答案] 78.75
◎结论形成
如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说, (πi-pi)2不等于零.当样本的容量越来越大时,上式很小的可能性将越来越大.
1.判断正误(正确的打“√”,错误的打“×”)
(1)样本的数字特征有随机性.( )
(2)只要样本抽取合理,样本平均数与总体平均数相等.( )
(3)一般地,样本容量越大,用样本去估计总体就越准确.( )
(4)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.( )
答案 (1)√ (2)× (3)√ (4)√
2.某商场买来一车苹果,从中随机抽取了10个苹果,其质量(单位:克)分别为150,152,149,148,146,151,150,152,147,153,由此评估这车苹果单个质量的平均值是( )
A.150.2克 B.149.8克
C.149.4克 D.147.8克
解析 这车苹果单个质量的平均值约是(150+152+149+148+146+151+150+152+147+153)=149.8(克).
答案 B
3.为了了解某地区10 000名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,估计该地区高三男生中体重在[56.5,64.5)的学生人数是( )
A.40 B.400
C.4 000 D.4 400
解析 依题意得,该地区高三男生中体重在[56.5,64.5)的学生人数是10 000×(0.03+2×0.05+0.07)×2=4 000.
答案 C
4.若用样本数据1,0,-1,2,1,3来估计总体的标准差,则总体的标准差估计值是 .
解析 样本平均值为
==1,
样本方差为
s2=[(1-1)2+(0-1)2+(-1-1)2+(2-1)2+(1-1)2+(3-1)2]=.
所以样本标准差为,则总体的标准差估计值是.
答案
题型一 用样本的数字特征估计总体的数字特征
甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)填写下表;
平均数
方差
中位数
命中9环及以上
甲
7
1.2
1
乙
5.4
3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环及以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
[解析] (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以乙=(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①甲、乙的平均数相同,均为7,但s<s,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
样本数字特征所反映的样本的特征
一般地,平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”,而标准差则反映了样本的波动程度、离散程度,即均衡性、稳定性、差异性等.因此,我们可以根据问题的需要选择用样本的不同数字特征来分析问题.
[触类旁通]
1.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的柱形图如图所示,则( )
A.甲的成绩的平均数等于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析 由柱形图知:
甲射靶5次的成绩分别为4,5,6,7,8;
乙射靶5次的成绩分别为5,5,5,6,9,
所以甲==6,
乙==6.
所以甲=乙.故A正确.
甲的成绩的中位数为6,乙的成绩的中位数为5,故B不正确.
s=[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=×10=2,s=[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=×12=,因为2<,所以s<s.故C正确.
甲的成绩的极差为8-4=4,
乙的成绩的极差为9-5=4,
故D不正确.
答案 AC
题型二 利用样本的频率分布直方图估计总体\a\vs4\al((一题多变)
某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数.
[解析] (1)由题干图知众数为=75.
(2)由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.
[母题变式]
1.(变结论)若本例条件不变,估计数学成绩的平均分.
解析 由题干图知这次数学成绩的平均分为
×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
2.(变结论)若本例条件不变,估计80分以上的学生人数.
解析 [80,90)分的频率为0.025×10=0.25,
频数为0.25×80=20.
[90,100)分的频率为0.005×10=0.05,
频数为0.05×80=4.
所以80分以上的学生人数为20+4=24.
1.因为频率分布直方图中没有保留样本的原始数据,所以利用频率分布直方图求的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
2.利用频率分布直方图求众数、中位数、平均数的方法如下:
(1)在频率分布直方图中,众数是最高的矩形的底边的中点;
(2)在频率分布直方图中,中位数左边和右边的直方图的面积相等;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
[触类旁通]
2.某年级120名学生在一次百米测试中的成绩(单位:秒)全部介于13秒与18秒之间.将测试成绩分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么测试成绩的70%分位数约为 .
解析 设测试成绩(秒)的70%分位数为x,
因为=0.55,=0.85,所以x∈[16,17),
所以0.55+(x-16)×=0.70,
解得x=16.5.
答案 16.5
题型三 利用样本的茎叶图估计总体
为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示(如图).
(1)求该样本数据的平均数、中位数、众数;
(2)试估计全校教师中,上学期使用多媒体教学次数在[15,25)内的人数.
[解析] (1)该样本数据的平均数=(7+9+13+13+15+16+17+21+22+24+25+28+28+30+31+34+37+41+41+42)=24.7;
该组数据的中位数为=24.5;
该组数据的众数是13,28,41.
(2)由样本数据可知,上学期使用多媒体教学次数在[15,25)内的频率为=,因此在全校教师中,上学期使用多媒体教学次数在[15,25)内的人数估计有×200=60(人).
[素养聚焦] 通过茎叶图的应用重点提升数据分析等核心素养.
1.由于茎叶图中保留了样本的原始数据,因此在计算样本数据的数字特征时,可套用公式,代入数据计算可得.
2.由茎叶图估计总体分布及数字特征时,可通过样本数据的分布情况及数字特征进行估计.
[触类旁通]
3.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2
3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1
2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3
1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2
2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?
解析 (1)A=(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3.
B=(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.
从计算结果看,A药服用者的睡眠时间增加的平均数大于服用B药的.所以A药的疗效更好.
(2)
从茎叶图看,A药的疗效更好.
[缜密思维提能区] 易错辨析
统计思想的实际应用
[典例] 在一次科技知识竞赛中,两组学生的成绩如下表.
分数
50
60
70
80
90
100
人数
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩如何,并说明理由.
[解析] (1)甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较看,甲组成绩好些.
(2)由已知得甲=乙=80,
s=[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,
s=[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.
∵s<s,
∴甲组成绩较乙组成绩稳定,故甲组好些.
(3) 甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好.
(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,所以乙组成绩集中在高分段的人数多.同时,乙组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成绩较好.
纠错心得
要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.
知识落实
技法强化
1.用样本的数字特征估计总体的数字特征.
2.用样本的分布估计总体的分布.
用频率分布直方图来估计有关数字特征时要注意:由于频率分布直方图已经损失了一些样本数据的信息,因而由频率分布直方图所估计出来的有关数字特征与实际数据可能会有一些误差,但频率分布直方图形象直观,利用它可以快速得到相关数字特征,还可以用来检验我们直接计算的结果是否正确.
[必备知识·基础巩固]
1.有一个容量为60的样本,数据的分组及各组的频数如下:
分组
[11.5,15.5)
[15.5,19.5)
[19.5,23.5)
[23.5,27.5)
频数
2
4
5
16
分组
[27.5,31.5)
[31.5,35.5)
[35.5,39.5)
[39.5,43.5]
频数
11
12
7
3
根据样本的频率分布估计,数据落在[27.5,39.5)的频率约是( )
A. B.
C. D.
解析 数据落在[27.5,39.5)内的个数为11+12+7=30,故数据落在[27.5,39.5)内的频率为=.
答案 A
2.(多选题)某城市为促进家庭节约用电,计划制定阶梯电价,阶梯电价按年月均用电量从低到高分为一、二、三、四档,属于第一档电价的家庭约占10%,属于第二档电价的家庭约占40%.属于第三档电价的家庭约占30%,属于第四档电价的家庭约占20%.为确定各档之间的界限,从该市的家庭中抽查了部分家庭,调查了他们上一年度的年月均用电量(单位:千瓦时),由调查结果得下面的直方图.由此直方图可以做出的合理判断是( )
A.年月均用电量不超过80千瓦时的家庭属于第一档
B.年均用电量低于200千瓦时,且超过80千瓦时的家庭属于第二档
C.年月均用电量超过240千瓦时的家庭属于第四档
D.该市家庭的年月均用电量的平均数大于年月均用电量的中位数
解析 对于A,年月均用电量不超过80千瓦时的家庭的频率为0.002 5×40=0.1,属于第一档,故选项A正确;
对于B,年均用电量低于200千瓦时,且超过80千瓦时的家庭的频率为0.004 0×40+0.006 0×40+0.004 5×40=0.58>0.50,不属于第二档,故选项B错误;
对于C,年月均用电量超过240千瓦时的家庭的频率为0.002 0×40+0.001 0×40×3=0.20,属于第四档,故选项C正确;
对于D,由频率分布直方图可知,该组数据多集中在200以前的小数据,所以中位数应该较小,平均数因受极大值的影响,平均数应该大于中位数,故选项D正确.
答案 ACD
3.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
解析 从茎叶图可以看出,甲运动员的成绩集中在大“茎”上的“叶”多,故成绩好.故选A.
答案 A
4.(多选题)为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图.根据统计图的数据,下列结论正确的是( )
A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次
B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次
C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约为320
D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约为32
解析 由题图可知中位数是26.25,众数是27.5.1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20的人数约为160.D是错误的.
答案 ABC
5.某市有大、中、小型商店的数量之比为1∶5∶9,其中大型商店的年纳税额为300万元,中型商店的年纳税额为25万元,小型商店的年纳税额为0.4万元,则该市所有商店的年平均纳税额为 万元.(结果保留一位小数)
解析 由题意知,该市所有商店的年平均纳税额为=×300+×25+×0.4≈28.6(万元),所以该市所有商店的年平均纳税额28.6万元.
答案 28.6
6.甲、乙、丙、丁四名射击手在选拔赛中的平均环数及其标准差s如下表所示,则选送决赛的最佳人选应是 .
甲
乙
丙
丁
7
8
8
7
s
2.5
2.5
2.8
3
解析 甲、乙、丙、丁四个人中乙和丙的平均数最大且相等,乙与丙中乙的标准差较小,说明乙的成绩比丙稳定,从而得到乙是最佳人选.
所以综合平均数和标准差两个方面说明乙成绩既高又稳定,所以乙是最佳人选.
答案 乙
7.取100件做使用寿命的测试,则第一分厂应抽取的件数为 ;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1 020 小时、980小时、1 030小时,估计这个企业所生产的该产品的平均使用寿命为 小时.
解析 第一分厂应抽取的件数为100×50%=50(件);该产品的平均使用寿命为1 020×0.5+980×0.2+1 030×0.3=1 015(小时).
答案 50 1 015
8.某学校为了调查了解高一新生上学所需时间的情况,从高一新生中随机抽取了部分同学,调查其上学所需时间,获得相应数据,制成了频率分布直方图(如图所示).
(1)试计算该校高一新生上学所需时间的平均数、中位数、众数;
(2)如果上学所需时间不少于1小时的学生可申请在学校住宿,请估计学校1 200名新生中有多少名学生可以申请住宿?
解析 (1)上学所需时间在[0,20),[20,40),[40,60),[60,80),[80,100]内的频率分别为0.012 5×20=0.25,0.025×20=0.5,0.006 5×20=0.13,0.003×20=0.06,0.003×20=0.06,因此平均数为10×0.25+30×0.5+50×0.13+70×0.06+90×0.06=33.6(分);
众数为频率最大的一组的组中值,即为30分;
设中位数为x,则有0.25+(x-20)×0.025=0.5,解得x=30,即中位数为30分.
(2)由频率分布直方图可知,新生上学所需时间不少于1小时的频率为(0.003+0.003)×20=0.12.
因为1 200×0.12=144,所以1 200名新生中有144名学生可以申请住宿.
[关键能力·综合提升]
9.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可推断我国13岁男孩的平均身高为( )
A.1.57 m B.1.56 m
C.1.55 m D.1.54 m
解析 因为从北方抽取了300个男孩,平均身高为1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.所以这500个13岁男孩的平均身高是=1.56(m).所以由此可推断我国13岁男孩的平均身高为1.56 m.故选B.
答案 B
10.(多选题)某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的数据绘制的频率分布直方图,其中产品净重(单位:克)的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则下列结论正确的是( )
A.样本中产品净重大于或等于98克且小于102克的个数是36
B.样本的众数是101
C.样本的中位数是
D.样本的平均数是101.3
解析 由题意可知样本中产品净重小于100克的频率是(0.05+0.1)×2=0.3,所以样本量为=120,所以样本中产品净重在[98,102)的个数是(0.1+0.15)×2×120=60,故A错误;由题图知,最高小矩形底边中点的横坐标是101,故众数是101,故B正确;因为最左边的两个小矩形的面积和是0.3,最右边的两个小矩形的面积和是0.4,故中位数为100+×2=,故C正确;样本的平均数是2×(97×0.05+99×0.1+101×0.15+103×0.125+105×0.075)=101.3,故D正确.故选BCD.
答案 BCD
11.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|= .
解析 由题意这组数据的平均数为10,方差为2可得
解这个方程组需要用一些技巧,
因为不要直接求出x,y,只要求出|x-y|,
设x=10+t,y=10-t,由
(x-10)2+(y-10)2=8得t2=4;
∴|x-y|=2|t|=4.
答案 4
12.为了解学生在课外读物方面的支出情况,抽取了100名同学进行调查,结果显示这些同学的支出都在[10,50](单位:元),其频率分布直方图如图所示,估计学生课外读物支出的样本数据的65%分位数为 元(结果保留两位小数).
解析 由频率分布直方图可得,(0.01+0.023)×10=0.33,(0.01+0.023+0.037)×10=0.7,所以65%分位数应位于[30,40)内,所以样本数据的65%分位数为30+10×≈38.65(元),所以估计学生课外读物支出的样本数据的65%分位数为38.65(元).
答案 38.65
13.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表.
质量指标
值分组
[75,
85)
[85,
95)
[95,
105)
[105,
115)
[115,
125]
频数
6
26
38
22
8
(1)在下面作出这些数据的频率分布直方图.
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
解析 (1)直方图如图,
(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
[核心价值·探索创新]
14.某高校进行自主选拔招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机抽取了24名笔试者的成绩,统计结果如表所示.
分数段
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
[85,90]
人数
2
3
4
9
5
1
据此估计允许参加面试的分数线大约是 .
解析 依题意,参加面试的频率为=0.25,
由统计表知,样本中数据在[80,90]内的频率为=0.25,
由样本估计总体知,分数线大约为80,所以估计允许参加面试的分数线大约是80.
答案 80
15.某大学艺术专业400名学生参加某次测评,根据男、女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到频率分布直方图:
(1)已知样本中分数在[40,50)的学生有5人,试估计总体中分数小于40的人数;
(2)试估计测评成绩的75%分位数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男、女生人数相等.试估计总体中男生和女生人数的比例.
解析 (1)由频率分布直方图知,
分数在[50,90)的频率为(0.01+0.02+0.04+0.02)×10=0.9,
在样本中分数在[50,90)的人数为100×0.9=90(人),
在样本中分数在[40,90)的人数为95人,
所以分数在[40,90)的人数为400×0.95=380(人),总体中分数小于40的人数为20人.
(2)测试成绩从低到高排序,占人数75%的人分数在[70,80)之间,所以估计测评成绩的75%分位数为70+10×=70+8.75=78.75.
(3)由频率分布直方图知,分数不小于70的人数共有60,由已知男、女各占30人,从而样本中男生有60人,女生有40人,故总体中男生与女生的比例为=.
学科网(北京)股份有限公司
$