内容正文:
9.2.1 总体取值规律的估计 9.2.2 总体百分位数的估计
基础过关练
考点一 频数分布表和频率分布直方图
1.(2024安徽江淮十校大联考)工厂对某车间某一天生产的产品采用随机抽样的方法抽到一个容量为40的样本数据,分组后,各组的频数如下表:
分组
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
频数
4
6
x
10
y
4
已知样本数据在(20,40]内的频率为0.35,则样本数据在(50,60]内的频率为( )
A.0.70 B.0.50 C.0.25 D.0.20
2.(2024安徽亳州期末)某企业员工年龄(岁)的频率分布直方图如图所示,从左到右依次为第一组、第二组、……、第五组,若第五组的员工有80人,则第二组的员工人数为( )
A.140 B.240 C.280 D.320
3.(多选题)(2024河北衡水武强学校开学考试)将样本容量为100的样本数据分为4组:[2,6),[6,10),[10,14),[14,18].得到的频率分布直方图如图所示,则下列说法中正确的是( )
A.样本数据分布在[6,10)内的频率为0.32
B.样本数据分布在[10,14)内的频数为40
C.样本数据分布在[2,10)内的频数为40
D.估计总体数据大约有10%分布在[10,14)内
4.(多选题)(2024云南昭通期中)某学校为了调查学生某次研学活动中的消费支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在50元到60元范围内的学生有60人,则( )
A.样本中消费支出在50元到60元范围内的频率为0.3
B.样本中消费支出不少于40元的人数为132
C.n的值为200
D.若该校有2 000名学生参加研学活动,则约有20人的消费支出在20元到30元范围内
5.(2024河南信阳高级中学月考)学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为100的样本,其频率分布直方图如图所示,则其中支出在[30,40)内的同学有 人,图中m的值为 .
6.(2024吉林长春第三中学月考)为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄(单位:岁)情况如下表所示:
分组
频数
频率
[20,25)
5
0.05
[25,30)
①
0.20
[30,35)
35
②
[35,40)
30
0.30
[40,45]
10
0.10
总计
100
1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,并估计这500名志愿者中年龄在[30,35)内的人数;
(3)现用分层随机抽样从年龄在[30,35)、[35,40)、[40,45)内的样本中共抽取n名志愿者,已知从年龄在[40,45)内的志愿者中抽取了2人,求n的值.
考点二 条形图、扇形图、折线图
7.(多选题)(2024四川成都期中)某高中三个年级的学生共有2 000人,且各年级人数比例扇形图如下.现因举办校庆活动,以按比例分配的分层随机抽样从中随机选出志愿服务小组,已知选出的志愿服务小组中高一学生有32人,则下列说法正确的有( )
A.该学校高一学生共有800人
B.志愿服务小组共有学生96人
C.志愿服务小组中高三学生共有20人
D.某高三学生被选入志愿服务小组的概率为
8.(2024四川德阳模拟)某校秋季运动会中,甲、乙两班的各个项目得分(满分5分,分值高者为优)的雷达图如图所示,则下列说法不正确的是( )
A.在200 m项目中,甲班的得分比乙班高
B.在铅球项目中,甲班的得分比乙班高
C.在跳高项目中,乙班的得分比甲班高
D.乙班的总分比甲班高
9.(2024湖南湘楚名校联考)2023年1~2月到2024年1~2月我国商品零售总额和餐饮收入总额同比增速情况折线图如图所示,则下列结论正确的是( )
(注:同比指当前的数据与上一年同期进行比较;环比指当前数据与上个月的数据进行比较)
A.2024年1~2月份,商品零售总额同比增长9.2%
B.2023年3~12月份,餐饮收入总额同比都降低
C.2023年6~10月份,商品零售总额同比都增加
D.2023年12月,餐饮收入总额环比增速为-14.1%
10.(2024辽宁葫芦岛期末)为了关注学生们的健康成长,学校开展了一次高一年级的学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A、B、C、D、E五个层次,根据抽样结果得到如下统计图,则以下说法错误的是( )
A.样本中A层次身高的女生少于男生
B.样本中B层次身高的人数最多
C.样本中D层次身高的人数占总人数的17%
D.样本中E层次身高的男生有6人
考点三 总体百分位数的估计
11.(2024四川内江一中开学考试)样本数据24,13,14,18,12,14,20,16的75%分位数为( )
A.17 B.18
C.19 D.20
12.(2024海南中学月考)2024年巴黎奥运会金牌榜前8名的金牌数依次为40,40,20,18,16,15,14,13,这组数据的下四分位数为 ( )
A.13 B.14
C.14.5 D.15.5
13.(2024浙江县域教研联盟学业水平测试)某数学兴趣小组20名成员在规定时间内独立解答6个数学问题,最终结果如下:有1人解出1个问题,有1人解出2个问题,有4人解出3个问题,有4人解出4个问题,有5人解出5个问题,有5人解出6个问题,则解出问题个数的第三四分位数为( )
A.3 B.4.5
C.5 D.5.5
14.(2024山东菏泽第一中学月考)某市在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将得分分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为 (结果保留两位小数).
能力提升练
考点一 统计图表的综合应用
1.(2024广东广州黄广中学开学考试)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄的分布扇形图、90后从事互联网行业者的岗位分布条形图,则下列结论中不一定正确的是( )
A.互联网行业从事技术岗位的人数中,90后比80后多
B.90后互联网行业者中从事技术岗位的人数超过整个从事互联网行业者总人数的20%
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业从业人员中90后占一半以上
2.(2024四川成都二诊)居民消费价格指数(Consumer Price Index,简称CPI),是度量一定时期内居民消费商品和服务价格水平总体变动情况的相对数,综合反映居民消费商品和服务价格水平的变动趋势和变动程度.下图是2024年11月9日国家统计局公布的2024年10月各类商品及服务价格同比和环比涨跌幅情况同比=×100%,环比=×100%,下列结论正确的是( )
A.2024年10月份食品烟酒类价格低于2023年10月份食品烟酒类价格
B.2024年10月份教育文化娱乐类价格低于2024年9月份教育文化娱乐类价格
C.2024年9月份医疗保健类价格高于2023年10月份医疗保健类价格
D.2024年9月份居住类价格高于2023年10月份居住类价格
3.(多选题)(2024湖北咸宁赤壁一中月考)某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到统计图如图,则( )
A.丁险种参保人数超过五成
B.41岁以上参保人数超过总参保人数的五成
C.18~29周岁人群参保的总费用最少
D.人均参保费用不超过5 000元
4.(2024重庆八中期中)某大学数学专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)估计该大学数学专业400名学生此次测评分数小于60的人数;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中女生的人数.
考点二 百分位数及其应用
5.(2024天津第二十中学模拟)已知按从小到大排列的两组数据,甲组:7,11,14,m,22;乙组:5,10,n,18,20.若这两组数据的第50百分位数、第80百分位数分别对应相等,则m+n=( )
A.28 B.29 C.30 D.32
6.(2024吉林白山期末)为了解学生的周末学习时间(单位:小时),高一年级某班班主任对本班40名学生某周末的学习时间进行了调查,将所得数据整理绘制出如图所示的频率分布直方图,根据直方图所提供的信息,解决下列问题.
(1)求该班学生周末的学习时间不少于20小时的人数;
(2)估计这40名学生周末学习时间的25%分位数;
(3)将该班学生周末学习时间从低到高排列,估计第10名学生的学习时长.
答案
基础过关练
1.D 由题意得=0.35,解得x=8,所以y=40-4-6-8-10-4=8,
因此样本数据在(50,60]内的频率为=0.20.
2.C 由已知得5(a+0.06+0.04+0.02+0.01)=1,
所以a=0.07,因为第五组的员工人数为80,
所以第二组的员工人数为80×=280.
3.ABC 对于A,样本数据分布在[6,10)内的频率为0.08×4=0.32,故A正确;
对于B,样本数据分布在[10,14)内的频数为100×0.1×4=40,故B正确;
对于C,样本数据分布在[2,10)内的频数为100×(0.02+0.08)×4=40,故C正确;
对于D,总体数据分布在[10,14)内的比例约为0.1×4×100%=40%,故D错误.
4.ABC 根据题中频率分布直方图可得样本中消费支出在50元到60元范围内的频率为1-10×(0.01+0.024+0.036)=0.3,A正确;
n==200,C正确;
样本中消费支出不少于40元的人数为200×(0.036×10+0.3)=132,B正确;
样本中消费支出在20元到30元范围内的频率为0.1,故若该校有2 000名学生参加研学活动,则消费支出在20元到30元范围内的约为2 000×0.1=200(人),D错误.
5.答案 24;0.01
解析 由题图知,支出在[30,40)内的频率为0.024×10=0.24,故支出在[30,40)内的同学有0.24×100=24人.
支出在[20,30)内的频率为1-10×(0.024+0.036+0.030)=0.1,
所以m==0.01.
6.解析 (1)0.20×100=20,=0.35,因此①处应填20,②处应填0.35.
(2)补全频率分布直方图,如图所示:
这500名志愿者中年龄在[30,35)内的人数为0.35×500=175.
(3)年龄在[30,35)、[35,40)、[40,45)内的人数之比为0.07∶0.06∶0.02=7∶6∶2,
从年龄在[40,45)内的志愿者中抽取了2人,因此从年龄在[30,35)、[35,40)内的志愿者中分别抽取了7人和6人,
所以n=7+6+2=15.
7.AC 对于A,由题图可知,高三学生人数占总人数的25%,高二学生人数占总人数的35%,
所以高一学生人数占总人数的1-25%-35%=40%,所以高一学生共有2 000×40%=800人,故A正确;
对于B,因为2 000×=80,所以志愿服务小组共有学生80人,故B错误;
对于C,志愿服务小组中高三学生共有80×25%=20人,故C正确;
对于D,高三学生共有2 000×25%=500人,志愿服务小组中高三学生共有20人,
所以某高三学生被选入志愿服务小组的概率为=,故D错误.
8.B 对于A,在200 m项目中,甲班的得分为4分,乙班的得分为3分,甲班的得分比乙班高,A中的说法正确;
对于B,在铅球项目中,甲班的得分为3分,乙班的得分为4分,甲班的得分比乙班低,B中的说法不正确;
对于C,在跳高项目中,乙班的得分为4分,甲班的得分为3分,乙班的得分比甲班高,C中的说法正确;
对于D,乙班的总分为5+3+4+5+3+4=24(分),甲班的总分为4+4+3+5+4+3=23(分),乙班的总分比甲班高,D中的说法正确.
9.C 对于A,2024年1~2月份,商品零售总额同比增长2.9%,故A错误;
对于B,2023年8月,餐饮收入总额同比增加,故B错误;
对于C,2023年6~10月份,商品零售总额同比都增加,故C正确;
对于D,2023年12月,餐饮收入总额环比增速并未告知,故D错误.
10.D 对于A,样本中女生人数为4+12+10+8+6=40,则男生人数为60,
样本中A层次身高的男生人数为60×15%=9,女生人数为4,
所以样本中A层次身高的女生少于男生,故A中说法正确;
对于B,因为男生中B层次身高的比例最大,女生中B层次身高的人数最多,
所以样本中B层次身高的人数最多,故B中说法正确;
对于C,样本中D层次身高的女生有8人,男生有60×15%=9(人),
所以样本中D层次身高的人数占总人数的×100%=17%,故C中说法正确;
对于D,样本中E层次身高的男生有60×(1-15%-40%-25%-15%)=3人,故D中说法错误.
11.C 数据按从小到大排序为12,13,14,14,16,18,20,24,则8×75%=6,
所以75%分位数为=19(易错点).
12.C 将这组数据按从小到大排序为13,14,15,16,18,20,40,40,
因为下四分位数即第25百分位数,且8×25%=2,
所以这组数据的下四分位数为=14.5.
13.D 第三四分位数即75%分位数,
把20个数据按从小到大排序为1,2,3,3,3,3,4,4,4,4,5,5,5,5,5,6,6,6,6,6,因为20×75%=15,所以75%分位数为第15和16个数的平均数,即=5.5.
14.答案 84.55
解析 由题意得(0.004+a+0.018+2×0.022+0.028)×10=1,解得a=0.006,
因为前4组数据的频率之和为(0.004+0.006+0.022+0.028)×10=0.6,
前5组数据的频率之和为0.6+0.022×10=0.82,
所以第70百分位数在[80,90)内,设第70百分位数为x,则0.6+(x-80)×0.022=0.7,解得x≈84.55,
所以第70百分位数约为84.55.
能力提升练
1.A 对于A,设整个互联网行业从业者的总人数为a,
互联网行业中从事技术岗位的90后人数为56%a×39.6%=22.176%a,小于80后从事互联网行业者的人数38%a,但互联网行业中从事技术岗位的80后人数未知,因此A中结论不一定正确;
对于B,由A选项知,90后互联网行业者中从事技术岗位的人数为22.176%a,整个从事互联网行业者总人数的20%为20%a,因为22.176%a>20%a,因此B中结论一定正确;
对于C,互联网行业中从事运营岗位的90后人数为56%a×17%=9.52%a,超过80前互联网行业从业者的人数6%a,所以虽然从事运营岗位的80前人数比例未知,但可以判断C中结论一定正确;
对于D,由整个互联网行业从业者年龄分布扇形图得到互联网行业从业人员中90后占56%,因此D中结论一定正确.
2.C 对于A,由题图可知,2024年10月份食品烟酒类价格同比涨幅为2%,所以2024年10月份食品烟酒类价格高于2023年10月份食品烟酒类价格,因此A错误;
对于B,由题图可知,2024年10月份教育文化娱乐类价格环比涨幅为0.2%,所以2024年10月份教育文化娱乐类价格高于2024年9月份教育文化娱乐类价格,因此B错误;
对于C,2024年10月份医疗保健类价格环比涨幅为0.0%,即2024年10月份医疗保健类价格等于2024年9月份医疗保健类价格,又2024年10月份医疗保健类价格同比涨幅为1.1%,
所以2024年10月份医疗保健类价格高于2023年10月份医疗保健类价格,即2024年9月份医疗保健类价格高于2023年10月份医疗保健类价格,因此C正确;
对于D,2024年10月份居住类价格环比涨幅为0.0%,即2024年10月份居住类价格等于2024年9月份居住类价格,又2024年10月份居住类价格同比涨幅为-0.1%,所以2024年10月份居住类价格低于2023年10月份居住类价格,即2024年9月份居住类价格低于2023年10月份居住类价格,因此D错误.
3.ACD 由题图1可知,丁险种参保人数所占比例为1-2%-4%-10%-30%=54%,超过五成,故A正确;
由题图2可知,41岁以上参保人数所占比例为35%+10%=45%,不到五成,故B错误;
由题图2与题图3可知,18~29周岁参保人数所占比例为15%,人均参保费用在区间(3 000,4 000)(单位:元)内,54周岁及以上参保人数所占比例最少,为10%,人均参保费用为6 000元,所以18~29周岁人群参保的总费用少于54周岁及以上人群参保的总费用,结合题图2和题图3易知C正确;
由题图2与题图3可知,人均参保费用不超过5 000元,故D正确.
4.解析 (1)根据题图,可得分数小于60的频率为1-10×(0.02+0.04+0.02)=0.2,
所以估计该大学数学专业400名学生此次测评分数小于60的人数为0.2×400=80.
(2)根据题图,可得分数小于50的频率为1-10×(0.01+0.02+0.04+0.02)=0.1,
所以容量为100的样本中,分数小于50的频数为0.1×100=10,
已知样本中分数小于40的学生有5人,所以样本中分数在[40,50)内的学生有5人,
因此分数在[40,50)内的频率为=0.05,
从而可估计总体中分数在区间[40,50)内的人数为0.05×400=20.
(3)根据题图,可得分数不小于70的频率为10×(0.04+0.02)=0.6,
则样本中分数不小于70的学生有0.6×100=60(人),
因为样本中分数不小于70的男女生人数相等,所以样本中分数不小于70的男女生各有30人.
因为样本中有一半男生的分数不小于70,所以样本中男生共有60人,
所以样本中女生有40人,所以可以估计总体中女生有×400=160(人).
5.C 甲组数据的第50百分位数为14,乙组数据的第50百分位数为n,则n=14,
由5×80%=4,得甲组数据的第80百分位数为,乙组数据的第80百分位数为=19,因此=19,解得m=16,所以m+n=30.
6.解析 (1)该班学生周末的学习时间不少于20小时的频率为(0.03+0.015)×5=0.225,
则该班学生周末的学习时间不少于20小时的人数为40×0.225=9.
(2)学习时间在5小时以下的频率为0.02×5=0.1<0.25,
学习时间在10小时以下的频率为0.1+0.04×5=0.3>0.25,
所以25%分位数在[5,10)内,则5+5×=8.75,
所以这40名学生周末学习时间的25%分位数约为8.75小时.
(3)第10名学生的学习时长是40名学生周末学习时间的25%分位数,所以由(2)知第10名学生的学习时长约为8.75小时.
7
学科网(北京)股份有限公司
$