内容正文:
期末复习讲义06 统计
【考点一】简单随机抽样和分层抽样
【考点四】用样本估计总体的离散程度参数
【考点二】扇形统计图、折线统计图、频数直方图和频率直方图
【考点五】用频率直方图估计总体分布
【考点三】用样本估计总体的集中趋势参数
【考点六】百分位数
一、获取数据的基本途径及相关概念
1. 核心概念
总体:研究对象的全体;个体:总体中的每一个研究对象;样本:从总体中抽取的一部分个体;样本容量:样本中个体的数量(无单位)。
普查:对所有个体进行调查,结果准确,但耗人力、物力、财力,适用于总体规模小或必须全面调查的情况(如人口普查)。
抽样调查:从总体中抽取部分个体调查,省时省力,适用于总体规模大、具有破坏性或无需全面调查的情况(如灯泡寿命检测)。
2. 获取数据的基本途径
直接途径:调查(普查、抽样调查)、试验(设计试验获取数据)。
间接途径:查阅资料、互联网搜索(获取已有的数据)。
3. 易错点
样本容量是数量,无单位,易误写单位;
抽样调查的样本需具有代表性和广泛性,避免片面性。
二、抽样
1. 简单随机抽样(基础抽样)
定义:从总体中逐个抽取,每个个体被抽到的可能性相等,适用于总体个数较少的情况。
方法:抽签法(编号、制签、搅拌、抽取)、随机数法(利用随机数表、计算器、计算机生成随机数)。
概率:从个体数为N的总体中抽取容量为n的样本,每个个体被抽到的概率为。
2. 分层随机抽样(高频必考)
定义:按一个或多个变量把总体分成若干个子总体(层),每层独立进行简单随机抽样,再合并为总样本,适用于总体由差异明显的几部分组成的情况。
比例分配(核心公式):第i层抽取的样本数(为第i层个体数,为总体个体数,为总样本数)。
样本平均数(分层):(为第i层样本平均数)。
特点:等可能抽样,每个个体被抽到的概率相等,样本代表性强。
3. 易错点
分层抽样的分层标准:层间差异大、层内差异小;
比例分配计算时,易混淆各层个体数与总体数的比例。
三、统计图表
1. 扇形统计图
作用:直观表示各部分数据占总体的比例。
核心公式:某部分圆心角该部分占比。
特点:各部分圆心角之和为,比例之和为1。
2. 折线统计图
作用:反映数据随时间或顺序变化的趋势。
特点:能清晰展示数据的增减变化,适用于动态数据。
3. 频数直方图(核心高频)
核心概念:
频数:每组中数据的个数;
频率:频数与样本容量的比值,;
组距:每组数据的范围,。
频率分布直方图:
纵轴:;
每组频率:(对应矩形面积);
所有矩形面积之和为1。
4. 易错点
频数直方图与条形图区别:直方图无间隔,条形图有间隔;
频率分布直方图中,易混淆纵轴为频率(实际为频率/组距)。
四、用样本估计总体
1. 集中趋势参数(高频计算)
众数:一组数据中出现次数最多的数,反映多数水平,可多个。
中位数:将数据从小到大排列,中间位置的数(奇数个)或中间两个数的平均数(偶数个),反映中间水平。
平均数:
算术平均数:;
加权平均数:(为频数,);
频率加权:(为频率)。
2. 离散程度参数(高频难点)
极差:最大值与最小值的差,,粗略反映波动。
方差(核心公式):
总体方差:(为总体均值);
样本方差:(无偏估计,除以n-1);
简化公式:。
标准差:方差的算术平方根,,单位与原数据一致,反映波动大小。
3. 百分位数(中档高频)
定义:第p百分位数是这样一个值,至少p%的数据≤它,至少(100-p)%的数据≥它。
计算步骤:
数据从小到大排列;
计算;
i不是整数:取大于i的最小整数j,对应第j项数据;i是整数:取第i项与第(i+1)项数据的平均数。
常用:中位数即第50百分位数,四分位数(25%、50%、75%)。
4. 易错点
样本方差除以n-1,总体方差除以n,易混淆;
百分位数计算时,排序错误或i的处理错误;
平均数易受极端值影响,中位数、众数不受极端值影响。
【考点一】简单随机抽样和分层抽样
1.(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
2.(23-24高一下·四川达州·期末)根据统计,2024年五一假期,网红城市C和H接待的旅客数分别为1亿和8千万,在这两城市用分层随机抽样的方法抽取360名旅客,则应在H城市抽取的人数为( )
A.80 B.100 C.200 D.160
3.(24-25高一下·黑龙江哈尔滨·期末)某地区有1000家商铺,其中大型商铺50家,中型商铺100家,其余为小型商铺,为调查营业情况,现用比例分配的分层随机抽样方法抽取一个样本容量为100的样本,则应抽取大型商铺( )
A.33家 B.20家 C.5家 D.10家
4.(23-24高一下·山西大同·期末)采用简单随机抽样的方法,从含有8个个体的总体中抽取1个容量为2的样本,则某个个体被抽到的概率为( )
A. B. C. D.
5.(23-24高一下·四川·期末)某企业利用随机数表对生产的60个太阳能面板进行抽样测试,先将60个太阳能面板进行编号,.从中抽取12个样本,下图提供随机数表的第6行至第8行,若从表中第7行第9列开始向右读取数据,则得到的第6个样本编号是( )
12 23 43 56 77
32 21 18 34 29
78 64 54 07 32
52 42 06 44 38
35 78 90 56 42
25 30 07 32 86
23 45 58 89 07
23 18 96 08 04
84 42 12 53 31
34 57 86 07 36
34 89 94 83 75
32 56 78 08 43
67 89 53 55 77
22 53 55 78 32
45 77 89 23 45
A.07 B.18 C.23 D.08
6.(多选)(23-24高一下·山西大同·期末)下列抽样方法是简单随机抽样的有( )
A.从20名同学中随机抽取5名同学参加义务劳动
B.从20个零件中一次性抽取3个进行质量检验
C.某班45名同学,指定个子最高的5名同学参加学校组织的某项活动
D.中国福利彩票30选7,得到7个彩票中奖号码
7.(多选)(24-25高一下·河北雄安·期末)某城市为了解不同年龄段市民对垃圾分类政策的支持情况,对参与同卷调查的市民按老、中、青三十年龄段进行统计,发现三个年龄段的人数比例为4∶3∶3.现用按比例分层随机抽样的方法从这些市民中抽取n名进行深入访谈,若老年市民抽到80人,则下列结论正确的是( )
A.中年市民抽到60人
B.青年市民抽到90人
C.
D.抽取的中年与青年市民人数之和比老年市民多40人
8.(23-24高一下·吉林白山·期末)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一名学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为______
随机数表如下:
0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
9.(24-25高一下·福建福州·期末)某校高一年级的学生共有800人,按性别进行分层,现用分层随机抽样的方法从该年段的学生中按比例分配抽取100人进行肺活量测试,这100人中有60人是女生,则该校高一年级女生共有______人.
10.(24-25高一上·安徽宿州·期末)某校高中部高一、高二、高三人数之比为5:4:3,其中女生有600人,现准备从该校所有高中学生中抽取容量为120的样本.若根据年级采用按比例分配的分层随机抽样,抽取的高三学生为n个人;若根据性别采用按比例分配的分层随机抽样,抽取的女生为m个人,且,则该校高中部学生人数为______.
【考点二】扇形统计图、折线统计图、频数直方图和频率直方图
11.(24-25高一上·辽宁锦州·期末)某校高一组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,高一1500名学生每人都参加且只参加其中一个社团,学校从这1500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:
则选取的学生中,参加舞蹈社团的学生数为( )
A.20 B.30 C.35 D.40
12.某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中一定错误的是( )
A.丁险种参保人数超过五成 B.41岁以上参保人数超过总参保人数的五成
C.18-29周岁人群参保的总费用最少 D.人均参保费用不超过5000元
13.(24-25高一上·江西宜春·期末)某校高一组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,高一1500名学生每人都参加且只参加其中一个社团,学校从这1500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:
则估计该校参加舞蹈社团的学生人数为( )
A.300 B.225 C.150 D.40
14. (多选)(24-25高一上·辽宁葫芦岛·期末)为了关注学生的健康成长,某学校开展了一次高一年级学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则从图中能得出的信息是( )
A.样本中A层次身高的女生少于男生
B.样本中B层次身高的学生人数最多
C.样本中D层次身高的学生人数占总人数的17%
D.样本中E层次身高的男生有6人
15.(多选)(24-25高一下·广东清远·期末)某学校对高一学生预选科进行调查统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选择物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总人数为800
B.该校高一学生中选择物化政组合的人数为90
C.该校高一学生中选择物理的人数比选择历史的人数多
D.按选科组合用分层随机抽样的方法从该校高一学生抽取40人,则生史地组合应抽取8人
16.(多选)(24-25高一下·安徽芜湖·期末)某学生一日时间分配饼形图,如图,下列说法正确的有( )
A.该饼形图为某一位中学生的一日时间分配情况
B.该饼形图为中学生这个群体的平均一日时间分配情况
C.该图表明中学生一日睡眠时间约为7小时
D.该图表明中学生一天花费在课外活动的时间与自由活动、通勤时间总和相当
17.(多选)(23-24高一上·辽宁·期末)为了了解某社区用水量情况,对该社区居民去年的月均用水量进行抽样调查,整理该社区居民去年的月均用水量的数据,得到如下频率分布直方图.根据此频率分布直方图,下列结论正确的是( )
A.该社区居民去年的月均用水量高于9吨的用户比率估计为
B.估计该社区去年有一半的居民月均用水量在5吨到9吨之间
C.若该社区有1000户居民,估计该社区去年月均用水量不足3吨的用户有100户
D.估计该社区居民去年的月均用水量的平均值大于7吨(同一组中的数据用该组区间的中点值代替)
18.(多选)(24-25高一下·广东河源·期末)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
19.(多选)(24-25高一下·广东佛山·期末)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
20.某农户从一批待售的苹果中随机抽取100个,对样本中每个苹果称重,数据如下表.
质量(单位,千克)
[0.08,0.09)
[0.09,0.1)
[0.1,0.11)
[0.11,0.12)
[0.12,0.13)
[0.13,0.14]
个数
10
10
20
40
15
5
若将这批苹果按质量大小进行分级,质量不小于0.12千克的苹果为一级果;质量不小于0.1千克且小于0.12千克的苹果为二级果;质量在0.1千克以下的苹果为三级果.
(1)根据以上抽样调查数据,能否认为这批苹果符合“二级果和一级果的数量之和至少要占全部产品的70%”的规定?
(2)若将这批苹果按等级出售,一级果的售价为10元/千克;二级果的售价为8元/千克;三级果的售价为6元/千克经估算,这批苹果有150000个,请问该批苹果的销售收入约为多少元?(问一组中的数据用该组区间的中点值作代表)
【考点三】用样本估计总体的集中趋势参数
21.(24-25高一下·河北雄安·期末)样本数据的中位数为( )
A.5.5 B.6 C.6.5 D.7
22.(24-25高一下·重庆·期末)某商场记录了2025年1-6月的销售额(单位:万元),绘制了如下的折线图.已知这6个月销售额的平均数为20万元,下列说法正确的是( )
A.该商场这6个月销售额的众数是22万元
B.该商场1-6月的销售额逐月递增
C.该商场这6个月的销售额的中位数与平均数相等
D.该商场预测7月份的销售额一定不低于25万元
23.(24-25高一下·贵州六盘水·期末)为了研究我市甲、乙两个旅游景点的游客情况,文旅局统计了今年4月到9月甲、乙两个旅游景点的游客人数(单位:万人),得到如图所示的折线图.根据两个景点的游客人数的折线图,下列说法错误的是( )
A.7,8,9月份的总游客人数甲景点比乙景点少
B.乙景点4月到9月的游客人数总体呈上升趋势
C.甲景点4月到9月游客人数的平均值在内
D.甲、乙两景点4月到9月中游客量的最高峰期都在8月
24.(多选)(24-25高一下·湖南怀化·期末)某学校举行的数学史知识答题比赛,对参赛的名考生的成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为,若同一组中数据用该组区间中间值作为代表值,则下列说法中正确的是( )
A.这人成绩的中位数为分
B.这人成绩的众数约为分
C.这人成绩的平均分约为分
D.用分层抽样的方法从该校学生中抽取一个容量为的样本,则成绩在区间应抽取人
25.(多选)(23-24高一下·湖北·期末)如图所示,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成不规则形态,图(3)形成“右拖尾”形态,根据所给图形作出以下判断,正确的是( )
A.图(1)中平均数中位数众数 B.图(2)中众数平均数
C.图(3)中众数中位数平均数 D.图(3)中众数平均数中位数
26.(24-25高一下·四川资阳·期末)将一个总体分为,,三层,其个体数之比为.若,,三层的样本的平均数分别为20,30,40,则总体的平均数为__________.
27.(24-25高一下·山西大同·期末)某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6.若甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,则合在一起后的样本平均数为________.(精确到0.1)
28.(24-25高一上·江西抚州·期末)抚州市政府为了促进十一黄金假期期间文昌里文化街区餐饮服务质量的提升,抚州市旅游管理部门需了解游客对餐饮服务工作的认可程度.为此该部门随机调查了名游客,把这名游客对餐饮服务工作认可程度给出的评分分成、、、、五组,得到如图所示的频率分布直方图.则直方图中的值为____________,评分的平均数为____________.
29.(24-25高一下·新疆哈密·期末)某学校对学生身高进行调查,抽取名学生,数据分为,,,,五组.统计各组频数并计算相应频率,绘制出如图所示的频率分布直方图.
(1)求图中的值;
(2)求平均身高的估计值(同一组中的数据用该组区间的中点值作代表);
(3)若该市共有5万名高中生,试估计身高低于的学生人数.
30.(25-26高一上·辽宁辽阳·期末)某工厂有工人人,其中名工人参加过短期培训(称为类工人),另外名工人参加过长期培训(称为类工人).现用分层抽样的方法(按类、类分二层)从该工厂的工人中共抽查 名工人,调查他们的生产能力(此处的生产能力指一天加工的零件数).
(1)类工人和类工人中各抽查多少工人?
(2)从类工人中的抽查结果和从类工人中的抽查结果分别如下表1和表2.
表1
生产能力分组
人数
表2
生产能力分组
人数
①求、,再完成下列频率分布直方图;
②分别估计类工人和类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).
【考点四】用样本估计总体的离散程度参数
31.(24-25高一下·山东青岛·期末)抽样调查得到20个样本数据,记作,样本数据的平均数为9,方差5.现去掉一个最大值13和一个最小值5,产生一组新数据,关于这组新数据,下列说法错误的是( )
A.中位数一定不变 B.极差一定变小
C.方差一定变小 D.平均数一定不变
32.(24-25高一上·贵州遵义·期末)高三一数学优生为了检测自己的解题速度,记录了完成五套高考模拟题所用的时间(单位:分钟)分别为,,100,105,110.已知这组数据的平均数为105,方差为,则( )
A.1 B.2 C.3 D.4
33.(24-25高一下·山西大同·期末)若一组样本数据为,,,另一组样本数据,,的方差为8,则,,这组数据的方差为( )
A.4 B.2 C.6 D.8
34.(多选)(24-25高一下·吉林·期末)下列说法正确的是( ).
A.数据的上四分位数是
B.已知样本数据,,…,的平均数为,则数据,,…,,与原数据的极差、平均数都相同
C.将总体划分为两层,通过分层抽样,得到样本数为的两层样本,其样本平均数和样本方差分别为,和,,若,则总体方差
D.甲组数据的方差为,乙组数据为,则这两组数据中较稳定的是乙组
35.(多选)(24-25高一下·陕西西安·期末)已知互不相等的数据,,,,,的平均数为,方差为,则下列选项中正确的是( )
A.数据,,…,的平均数为
B.数据,,…,的标准差为
C.给原数据增加一个数据,且,若这七个数据的方差为,则
D.给原数据增加一个数据,且,若这七个数据的方差为,则
36.(24-25高一下·黑龙江绥化·期末)据统计某市学生的男女生人数比为,为了调查该市学生每天睡眠时长的情况,按照男女生人数比用分层抽样的方法抽取样本.根据样本数据计算得男生每天睡眠时长的平均数为7.3小时,方差为2,女生每天睡眠时长的平均数为6.8小时,方差为1.9,则可估计该市学生每天睡眠时长的平均数为________小时,方差为________;
参考公式:分层抽样中,假设第一层有m个数,平均数为,方差为;第二层有y个数,平均数为,方差为.则样本方差.
37.(24-25高一下·湖南长沙·期末)甲、乙两支羽毛球队体检结果如下:甲队体重的平均数为,方差为100,乙队体重的平均数为,方差为200,又已知甲、乙两队的队员人数之比为1:3,那么甲、乙两队全部队员体重的方差等于______.
38.(24-25高一下·黑龙江大庆·期末)若一组样本数据,,,的平均数为2,方差为4,则数据,,,,,,,的方差为__________.
39.(25-26高一上·河南焦作·期末)无土栽培是未来太空探索所必需的技术,现用相同的种子分别在无土环境与土壤环境中种植,将两种环境下生长的植株各分成五组,分别计算各组植株的平均高度(单位:),得到如下表格:
第1组
第2组
第3组
第4组
第5组
无土环境
12.8
13.2
13.1
12.9
13.0
土壤环境
15.2
16.4
14.9
17.3
16.2
规定:记第组中无土环境生长植株的平均高度为,土壤环境生长植株的平均高度为,若,则称两种环境下植株生长差异较小,否则称两种环境下植株生长差异较大.
(1)求土壤环境中5组植株平均高度的中位数和极差;
(2)证明:两种环境下植株生长差异较大.
40.(24-25高一下·山东聊城·期末)某校高一年级为了解学生近期的数学学习情况,组织了一次数学阶段测试.从所有学生的数学成绩中随机抽取400名学生的数学成绩作为样本,整理数据并分成,,,,,这6组,得到如图所示的频率分布直方图.
(1)求a的值,并估计参加这次测试的学生数学成绩的中位数(四舍五入取整数);
(2)从所抽取的数学成绩在,内的学生中,采用样本量按比例分配的分层抽样抽取n名学生,若这n名学生数学成绩的平均数为126分,方差为50,且这n名学生中数学成绩在内的只有1名,其数学成绩为136分,求这n名学生中数学成绩在内的学生数学成绩的平均数与方差.
【考点五】用频率直方图估计总体分布
41.(23-24高一下·河北·期末)某校为了了解学生的体能情况,于6月中旬在全校进行体能测试,统计得到所有学生的体能测试成绩均在内.现将所有学生的体能测试成绩按分成三组,绘制成如图所示的频率分布直方图.若根据体能测试成绩采用按比例分层随机抽样的方法抽取20名学生作为某项活动的志愿者,则体能测试成绩在内的被抽取的学生人数为( )
A.4 B.6 C.8 D.10
42.(23-24高一下·四川达州·期末)在某次考试成绩中随机抽取50个,成绩均在之间,将这些成绩共分成五组:,,,,,得到如图所示的频率分布直方图,由图中数据估计总体的众数和中位数(中位数精确到个位)分别是( ).
A.65,70 B.65,71 C.65,72 D.65,73
43.(23-24高一下·河南三门峡·期末)某高中为了积极响应国家“阳光体育运动”的号召,调查该校3 000名学生每周平均体育运动时长的情况,从高一、高二、高三三个年级学生中按照4∶3∶3的比例进行分层随机抽样,收集了300名学生每周平均体育运动时长(单位:小时)的数据,整理后得到如图所示的频率分布直方图.下列说法不正确的是( )
A.估计该校学生每周平均体育运动时长为5.8小时
B.估计该校高一年级学生每周平均体育运动时长不足4小时的人数为300
C.估计该校学生每周平均体育运动时长不少于8小时的百分比为10%
D.估计该校学生每周平均体育运动时长不少于8小时的人数为600
44.(多选)(24-25高一下·吉林长春·期末)在某市初三年级举行的一次体育统考考试中,共有500人参加考试.为了解学生的成绩情况,抽取了样本容量为的部分考生成绩,已知所有考生成绩均在,按照,,,,的分组作出如图所示的频率分布直方图、若在样本中,成绩落在区间的人数为32,则由样本估计总体可知下列结论正确的为( )
A. B.估计考生成绩的众数为72
C.估计考生成绩的中位数为71 D.估计该市考生成绩的平均分为70.6
45.(多选)(24-25高一下·海南海口·期末)在一次对甲、乙两个工厂生产的相同数量的零件质量(单位:克)统计中,得到如下表:
工厂
平均质量
中位数
众数
方差
甲厂
63
63
61
乙厂
63
62
61
其中,根据统计数据,下列结论中正确的是( )
A.甲厂生产的零件质量稳定性优于乙厂
B.甲厂生产零件质量的极差可能小于乙厂
C.甲、乙两厂生产的零件中61克出现的次数相同
D.甲厂生产的零件中质量大于63克的数量多于乙厂
46.(24-25高一上·江西·期末)某校60名同学数学竞赛的成绩(满分:100分)均在之间,进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,若从这60名参赛者中随机选取1人,试估计其成绩在的概率为_____.
47.(21-22高一下·广东广州·期末)为了解某市今年初二年级男生的身体素质状况,从该市初二年级男生中抽取了一部分学生进行“掷实心球”的项目测试.经统计,成绩均在2m到12m之间,把获得的所有数据分成,,,,五组,得到如图所示的频率分布直方图.则直方图中的值为________,如果有4名学生的成绩在10m到12m之间,则参加“掷实心球”项目测试的人数为________.
48.(23-24高一下·吉林·期末)某水产养殖户对其养殖的一批鱼的重量(单位:)进行统计,所得数据都在内,按,,,,,分成六组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)估计该水产养殖户养殖的这批鱼的重量的中位数;
(3)若这批鱼有条,估计这批鱼中重量在内的数量.
49.(25-26高一上·江西·期末)课外阅读有很多好处,可以帮助提高阅读能力、拓展知识面、提高思维能力、提高情感素养和提高人际交往能力.某校为了解学生课外阅读的情况,随机统计了名学生的一个学期课外阅读时间(单位:小时),所得数据都在内,将所得的数据分成4组:,,,,得到如图所示的频率分布直方图,现知道课外阅读时间在内的有80人.
(1)求和的值;
(2)估计该校学生一个学期课外阅读时间的平均数(同一组中的数据用该组区间的中点值代表);
(3)求所得数据的中位数.
50.(24-25高一下·贵州黔东南·期末)中国AI大模型正处于一个技术进步迅速、市场规模快速增长的爆发式发展阶段.为了了解中国AI大模型用户的年龄分布,公司调查了500名中国AI大模型用户,统计他们的年龄(都在内),按照,,,,进行分组,得到如图所示的频率分布直方图.
(1)求的值;
(2)求这500名中国AI大模型用户的年龄在内的人数;
(3)估计这500名中国AI大模型用户年龄的平均数(各组数据以该组区间的中点值作代表).
【考点六】百分位数
51.(24-25高一下·新疆阿克苏·期末)某班级的老师随机抽查了该班8名同学周末在家学习的时长(单位:h),所得数据如下:3,4,4,5,6,6,7,8,则这组数据的75%分位数为( )
A.6.5 B.6 C.5.5 D.5
52.(25-26高一上·内蒙古呼和浩特·期末)某校高一年级10个班参加艺术节合唱比赛的得分如下:91,89,90,92,94,87,93,96,91,85.则这组数据的25%分位数、70%分位数为( )
A.88,92 B.88,92.5 C.89,92.5 D.90,94.5
53.(25-26高一上·辽宁鞍山·期末)下列说法错误的是( )
A.一组数据的众数和中位数相同
B.对A,B,C三种个体按的比例分层随机抽样调查,如果抽取A的个体数为9,则样本容量为18
C.一组数据为,则这组数据的分位数为10
D.若样本数据,,,的标准差和平均数均为8,则数据,,…,的标准差为16,平均数为15
54.(多选)(23-24高一下·黑龙江鸡西·期末)“体育强则中国强,国运兴则体育兴”,为备战2024年巴黎奥运会,运动员们都在积极参加集训.已知某射击运动员在一次集训中7次射击的分数分别为:,,,,,,,则这组数据的( )
A.平均数为9 B.众数为9
C.第70百分位数为10 D.方差为
55.(多选)(25-26高一上·江西景德镇·期末)某公司为保证产品生产质量,连续10天监测某种新产品生产线的次品件数,得到关于每天出现的次品的件数的一组样本数据:,则关于这组数据的结论正确的是( )
A.极差是4 B.众数等于平均数
C.方差是2 D.数据的分位数为3.5
56.(24-25高一下·河北唐山·期末)数据:1,2,3,3,5的第50百分位数是______.
57.(24-25高一下·河北秦皇岛·期末)一组数据按从大到小的顺序排列为8,7,x,4,4,1,若该组数据的中位数是众数的倍,则该组数据的第60百分位数是____.
58.(24-25高一下·黑龙江绥化·期末)有5人进行定点投篮游戏,每人投篮12次.这5人投中的次数形成一组数据,中位数为10,唯一众数为11,极差为3,则该组数据的第40百分位数是_________.
59.(24-25高一下·内蒙古·期末)甲机床一天内生产的零件的重量(单位:)从小到大为.
(1)求这组数据的分位数;
(2)求这组数据的平均数和标准差;
(3)求零件重量位于和之间的个数及所占的百分比.
参考数据:.
60.(24-25高一下·陕西·期末)为了调查学生完成课后作业所用时间的基本情况,从600名初中学生中抽取100名学生进行调查统计,学生完成作业所需时间的频率分布直方图如图:
(1)估计该年级学生完成课后作业所需时间的平均值;
(2)估计该年级学生完成课后作业所需时间的25%分位数;
(3)估计全年级学生完成课后作业所需时间超过了2.5小时的人数.
1
学科网(北京)股份有限公司
$
期末复习讲义06 统计
【考点一】简单随机抽样和分层抽样
【考点四】用样本估计总体的离散程度参数
【考点二】扇形统计图、折线统计图、频数直方图和频率直方图
【考点五】用频率直方图估计总体分布
【考点三】用样本估计总体的集中趋势参数
【考点六】百分位数
一、获取数据的基本途径及相关概念
1. 核心概念
总体:研究对象的全体;个体:总体中的每一个研究对象;样本:从总体中抽取的一部分个体;样本容量:样本中个体的数量(无单位)。
普查:对所有个体进行调查,结果准确,但耗人力、物力、财力,适用于总体规模小或必须全面调查的情况(如人口普查)。
抽样调查:从总体中抽取部分个体调查,省时省力,适用于总体规模大、具有破坏性或无需全面调查的情况(如灯泡寿命检测)。
2. 获取数据的基本途径
直接途径:调查(普查、抽样调查)、试验(设计试验获取数据)。
间接途径:查阅资料、互联网搜索(获取已有的数据)。
3. 易错点
样本容量是数量,无单位,易误写单位;
抽样调查的样本需具有代表性和广泛性,避免片面性。
二、抽样
1. 简单随机抽样(基础抽样)
定义:从总体中逐个抽取,每个个体被抽到的可能性相等,适用于总体个数较少的情况。
方法:抽签法(编号、制签、搅拌、抽取)、随机数法(利用随机数表、计算器、计算机生成随机数)。
概率:从个体数为N的总体中抽取容量为n的样本,每个个体被抽到的概率为。
2. 分层随机抽样(高频必考)
定义:按一个或多个变量把总体分成若干个子总体(层),每层独立进行简单随机抽样,再合并为总样本,适用于总体由差异明显的几部分组成的情况。
比例分配(核心公式):第i层抽取的样本数(为第i层个体数,为总体个体数,为总样本数)。
样本平均数(分层):(为第i层样本平均数)。
特点:等可能抽样,每个个体被抽到的概率相等,样本代表性强。
3. 易错点
分层抽样的分层标准:层间差异大、层内差异小;
比例分配计算时,易混淆各层个体数与总体数的比例。
三、统计图表
1. 扇形统计图
作用:直观表示各部分数据占总体的比例。
核心公式:某部分圆心角该部分占比。
特点:各部分圆心角之和为,比例之和为1。
2. 折线统计图
作用:反映数据随时间或顺序变化的趋势。
特点:能清晰展示数据的增减变化,适用于动态数据。
3. 频数直方图(核心高频)
核心概念:
频数:每组中数据的个数;
频率:频数与样本容量的比值,;
组距:每组数据的范围,。
频率分布直方图:
纵轴:;
每组频率:(对应矩形面积);
所有矩形面积之和为1。
4. 易错点
频数直方图与条形图区别:直方图无间隔,条形图有间隔;
频率分布直方图中,易混淆纵轴为频率(实际为频率/组距)。
四、用样本估计总体
1. 集中趋势参数(高频计算)
众数:一组数据中出现次数最多的数,反映多数水平,可多个。
中位数:将数据从小到大排列,中间位置的数(奇数个)或中间两个数的平均数(偶数个),反映中间水平。
平均数:
算术平均数:;
加权平均数:(为频数,);
频率加权:(为频率)。
2. 离散程度参数(高频难点)
极差:最大值与最小值的差,,粗略反映波动。
方差(核心公式):
总体方差:(为总体均值);
样本方差:(无偏估计,除以n-1);
简化公式:。
标准差:方差的算术平方根,,单位与原数据一致,反映波动大小。
3. 百分位数(中档高频)
定义:第p百分位数是这样一个值,至少p%的数据≤它,至少(100-p)%的数据≥它。
计算步骤:
数据从小到大排列;
计算;
i不是整数:取大于i的最小整数j,对应第j项数据;i是整数:取第i项与第(i+1)项数据的平均数。
常用:中位数即第50百分位数,四分位数(25%、50%、75%)。
4. 易错点
样本方差除以n-1,总体方差除以n,易混淆;
百分位数计算时,排序错误或i的处理错误;
平均数易受极端值影响,中位数、众数不受极端值影响。
【考点一】简单随机抽样和分层抽样
1.(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
【答案】D
【分析】根据条件,利用简单随机抽样的定义,即可求解.
【详解】总体有个个体,每个个体被抽到的概率相同,均为,
故选:D.
2.(23-24高一下·四川达州·期末)根据统计,2024年五一假期,网红城市C和H接待的旅客数分别为1亿和8千万,在这两城市用分层随机抽样的方法抽取360名旅客,则应在H城市抽取的人数为( )
A.80 B.100 C.200 D.160
【答案】D
【分析】利用分层抽样求得网红城市C和H的人数占比,再根据比例求得结果即可.
【详解】根据题意,网红城市C和H接待的旅客数比例为,
所以应在H城市抽取的人数为.
故选:D.
3.(24-25高一下·黑龙江哈尔滨·期末)某地区有1000家商铺,其中大型商铺50家,中型商铺100家,其余为小型商铺,为调查营业情况,现用比例分配的分层随机抽样方法抽取一个样本容量为100的样本,则应抽取大型商铺( )
A.33家 B.20家 C.5家 D.10家
【答案】C
【分析】根据给定条件,利用分层抽样的抽样比求出答案.
【详解】依题意,分层抽样的抽样比为,
所以应抽取大型商铺(家).
故选:C
4.(23-24高一下·山西大同·期末)采用简单随机抽样的方法,从含有8个个体的总体中抽取1个容量为2的样本,则某个个体被抽到的概率为( )
A. B. C. D.
【答案】C
【分析】根据简单抽样每个个体被抽到的概率相等,即可求解.
【详解】由于每个个体被抽到的概率相等,所以每个个体被抽到的概率是.
故选:C.
5.(23-24高一下·四川·期末)某企业利用随机数表对生产的60个太阳能面板进行抽样测试,先将60个太阳能面板进行编号,.从中抽取12个样本,下图提供随机数表的第6行至第8行,若从表中第7行第9列开始向右读取数据,则得到的第6个样本编号是( )
12 23 43 56 77
32 21 18 34 29
78 64 54 07 32
52 42 06 44 38
35 78 90 56 42
25 30 07 32 86
23 45 58 89 07
23 18 96 08 04
84 42 12 53 31
34 57 86 07 36
34 89 94 83 75
32 56 78 08 43
67 89 53 55 77
22 53 55 78 32
45 77 89 23 45
A.07 B.18 C.23 D.08
【答案】D
【分析】利用随机数表法来选取样本编号即可.
【详解】从第7行第9列开始向右读取数据,开始为86,不符合要求,第一个数是23,第二个数是45,第三个数是58,下一个数是89,不符合要求,第四个数是07,下一个数是23,重复,第五个数是18,下一个数是96,不符合要求,第六个数是08;
故选:D.
6.(多选)(23-24高一下·山西大同·期末)下列抽样方法是简单随机抽样的有( )
A.从20名同学中随机抽取5名同学参加义务劳动
B.从20个零件中一次性抽取3个进行质量检验
C.某班45名同学,指定个子最高的5名同学参加学校组织的某项活动
D.中国福利彩票30选7,得到7个彩票中奖号码
【答案】ABD
【分析】根据简单随机抽样定义逐项判断可得答案.
【详解】对于A,从20名同学中随机抽取5名同学参加义务劳动,是简单随机抽样,故正确;
对于B,是简单随机抽样,一次性抽取3个个体,等价于逐个抽取个体3次,故正确;
对于C,不是简单随机抽样,不符合“等可能性”,因为5名同学是指定的,
而不是随机抽取的,故错误;
对于D,中国福利彩票30选7,得到7个彩票中奖号码,是简单随机抽样,故正确.
故选:ABD.
7.(多选)(24-25高一下·河北雄安·期末)某城市为了解不同年龄段市民对垃圾分类政策的支持情况,对参与同卷调查的市民按老、中、青三十年龄段进行统计,发现三个年龄段的人数比例为4∶3∶3.现用按比例分层随机抽样的方法从这些市民中抽取n名进行深入访谈,若老年市民抽到80人,则下列结论正确的是( )
A.中年市民抽到60人
B.青年市民抽到90人
C.
D.抽取的中年与青年市民人数之和比老年市民多40人
【答案】ACD
【分析】由分层抽样的性质逐一验算即可.
【详解】设中年市民、青年市民抽到的人数为,
从而,解得,而,
抽取的中年与青年市民人数之和减去老年市民人数:,故ACD正确,B错误.
故选:ACD.
8.(23-24高一下·吉林白山·期末)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一名学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为______
随机数表如下:
0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
【答案】44
【分析】根据随机数表的读取方法列出前几个数,即可得解
【详解】根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,
如下:32,58,65,74,13,36,98,32,44;
其中58,65,74,98不在编号范围内,舍去,再去除重复的,剩下的号码为32,13,36,44,
所以选取的第四个号码为44.
故答案为:44
9.(24-25高一下·福建福州·期末)某校高一年级的学生共有800人,按性别进行分层,现用分层随机抽样的方法从该年段的学生中按比例分配抽取100人进行肺活量测试,这100人中有60人是女生,则该校高一年级女生共有______人.
【答案】
【分析】利用分层抽样的性质直接求解.
【详解】设该校高一年级女生共有人,
由分层抽样的性质得:,解得.
故答案为:.
10.(24-25高一上·安徽宿州·期末)某校高中部高一、高二、高三人数之比为5:4:3,其中女生有600人,现准备从该校所有高中学生中抽取容量为120的样本.若根据年级采用按比例分配的分层随机抽样,抽取的高三学生为n个人;若根据性别采用按比例分配的分层随机抽样,抽取的女生为m个人,且,则该校高中部学生人数为______.
【答案】1800
【分析】根据给定条件,利用分层抽样的定义列式计算得解.
【详解】设该校高中部高一、高二、高三人数分别为5k,4k,3k,
依题意,,,,
所以该校高中部人数为1800.
故答案为:1800
【考点二】扇形统计图、折线统计图、频数直方图和频率直方图
11.(24-25高一上·辽宁锦州·期末)某校高一组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,高一1500名学生每人都参加且只参加其中一个社团,学校从这1500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:
则选取的学生中,参加舞蹈社团的学生数为( )
A.20 B.30 C.35 D.40
【答案】D
【分析】根据演讲人数及所占比求出选取的总人数,再由条形图得演讲人数即可得解.
【详解】由条形图得合唱人数为70,由饼状图得合唱人数占比,
因此选取的总人数为,
由饼状图得演讲及舞蹈人数和占比为,
人数和为,
由条形图得演讲人数为30,所以舞蹈人数为40.
故选:D.
12.某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中一定错误的是( )
A.丁险种参保人数超过五成 B.41岁以上参保人数超过总参保人数的五成
C.18-29周岁人群参保的总费用最少 D.人均参保费用不超过5000元
【答案】B
【分析】利用统计图表一一分析选项即可.
【详解】对于A,由条形图可知丁险种参保比例为,
超过五成,故A正确;
对于B,由扇形图可知,41岁以上参保人数占比:,故B错误;
对于C,由扇形图与折线图可知18-29周岁人群参保人数占比,
人均参保费用在,而54岁及以上人群参保比例虽,
但人均参保费用在6000,所以18-29周岁人群参保的总费用最少,故C正确;
对于D,由扇形图与折线图可知,人均参保费用约
,
不超过5000元,故D正确.
故选:B
13.(24-25高一上·江西宜春·期末)某校高一组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,高一1500名学生每人都参加且只参加其中一个社团,学校从这1500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:
则估计该校参加舞蹈社团的学生人数为( )
A.300 B.225 C.150 D.40
【答案】A
【分析】结合两个统计图直接求解即可;
【详解】由条形图得合唱人数为70,演讲人数为30,由饼状图得合唱人数占比,
因此演讲人数占比为,舞蹈人数占比为,
用样本估计总体,估计该校参加舞蹈社团的人数为.
故选:A.
14. (多选)(24-25高一上·辽宁葫芦岛·期末)为了关注学生的健康成长,某学校开展了一次高一年级学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则从图中能得出的信息是( )
A.样本中A层次身高的女生少于男生
B.样本中B层次身高的学生人数最多
C.样本中D层次身高的学生人数占总人数的17%
D.样本中E层次身高的男生有6人
【答案】ABC
【分析】由题中统计图可判断各选项正误.
【详解】对于A,样本中女生人数为,则样本中男生有(人),样本中A层次身高的男生人数为,女生人数为4,所以样本中A层次身高的女生少于男生.故A正确;
对于B,因为男生中B层次身高的人数比例最大,女生中B层次身高的人数比例也最大,所以样本中B层次身高的学生人数最多.故B正确;
对于C,样本中D层次身高的女生有8人,D层次身高的男生有(人),所以样本中D层次身高的学生人数占总人数的比例为.故C正确;
对于D,样本中E层次身高的男生有(人).故D错误.
故选:ABC
15.(多选)(24-25高一下·广东清远·期末)某学校对高一学生预选科进行调查统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选择物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总人数为800
B.该校高一学生中选择物化政组合的人数为90
C.该校高一学生中选择物理的人数比选择历史的人数多
D.按选科组合用分层随机抽样的方法从该校高一学生抽取40人,则生史地组合应抽取8人
【答案】ACD
【分析】选项A:由选科为政史地这种组合的学生人数和所占比例即可求得总人数;选项B:由选科为物化政这种组合的学生所占比例和高一学生总人数即可求得选科为物化政这种组合的学生人数;选项C:比较选择物理的学生所占比例与选择历史的学生所占比例即可;选择D:根据选科是生史地这种组合的学生所占比例进行分层随机抽样即可.
【详解】选项A:由扇形图可知选科是政史地这种组合的学生所占比例为,
由条形图可知选科是政史地这种组合的学生人数为200,
故该校高一学生总人数为,选项A正确;
选项B:由条形图可知选科是生史地这种组合的学生人数为160,
则选科是生史地这种组合的学生所占比例为,
依题意,选择物化地和物化政组合的人数相等,
因此选科是物化政这种组合的学生所占比例为,
故选科是物化政这种组合的学生人数为,选项B错误;
选项C:该校高一学生中选择物理的学生所占比例为:,
该校高一学生中选择历史的学生所占比例为:,,
故该校高一学生中选择物理的人数比选择历史的人数多,故选项C正确;
选项D:选科是生史地这种组合的学生所占比例为,
故生史地组合应抽取人,选择D正确.
故选:ACD.
16.(多选)(24-25高一下·安徽芜湖·期末)某学生一日时间分配饼形图,如图,下列说法正确的有( )
A.该饼形图为某一位中学生的一日时间分配情况
B.该饼形图为中学生这个群体的平均一日时间分配情况
C.该图表明中学生一日睡眠时间约为7小时
D.该图表明中学生一天花费在课外活动的时间与自由活动、通勤时间总和相当
【答案】BCD
【分析】根据题意,上图为中学生一日时间分配饼形图,可判断AB;分别算出睡眠时间、课外活动的时间和自由活动、通勤时间总和,即可判断CD.
【详解】根据题意,上图为中学生一日时间分配饼形图,
不能确定是某一位中学生的具体一日时间分配,故A错误;
该饼形图为中学生这个群体的平均一日时间分配情况,B正确;
该图表明中学生一日睡眠时间约为小时,从而估计中学生一日睡眠时间约为7小时,C正确;
该图表明中学生一天花费在课外活动的时间为小时,
自由活动、通勤时间总和为小时,
故中学生一天花费在课外活动的时间与自由活动、通勤时间总和相当,D正确.
故选:BCD
17.(多选)(23-24高一上·辽宁·期末)为了了解某社区用水量情况,对该社区居民去年的月均用水量进行抽样调查,整理该社区居民去年的月均用水量的数据,得到如下频率分布直方图.根据此频率分布直方图,下列结论正确的是( )
A.该社区居民去年的月均用水量高于9吨的用户比率估计为
B.估计该社区去年有一半的居民月均用水量在5吨到9吨之间
C.若该社区有1000户居民,估计该社区去年月均用水量不足3吨的用户有100户
D.估计该社区居民去年的月均用水量的平均值大于7吨(同一组中的数据用该组区间的中点值代替)
【答案】BCD
【分析】利用频率分布直方图的相关知识,逐一分析判断即可.
【详解】对A:该社区居民去年的月均用水量高于吨的比率估计为,故A错误.
对B:该社区去年有一半的居民月均用水量在吨到吨之间为,故B正确.
对C:估计该社区去年月均用水量不足吨的户数为,故C正确.
对D:月均用水量的平均值为,故D正确.
故选:BCD.
18.(多选)(24-25高一下·广东河源·期末)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
【答案】ABC
【分析】根据条形图,逐项判断即可.
【详解】对于A,根据条形图,2024年,我国数字阅读用户规模为6.7亿,网民规模为11.1亿,数字阅读用户规模约占网民规模的,故A正确;
对于B,近五年,我国数字阅读用户规模的增长量为亿,网民规模的增长量为亿,
数字阅读用户规模的增长量大于网民规模的增长量,故B正确;
对于C,根据条形图,可以看出,从2020年至2024年,我国数字阅读用户规模在逐年递增,故C正确;
对于D,根据条形图,从2020年至2021年,我国网民规模的增长率为,
从2023年至2024年,我国网民规模的增长率为,增长率减小了,故D错误.
故选:ABC.
19.(多选)(24-25高一下·广东佛山·期末)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
【答案】ABD
【分析】根据扇形图及条形图得出5条线路的各个数据,再结合选项分别判断即可.
【详解】因为2025年高明线的参与人数是2016年的2倍,则2016年的高明线的参与人数是万人,
对于A:根据扇形图得出万,所以2016年佛山50公里徒步总的参与人数是20万,A选项正确;
2016年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
2025年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
对于B:因为,2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和,B选项正确;
对于C:五条线的参与人数2025年与2016年相比增加人数最少的是高明线,C选项错误;
对于D:南海线的参与人数2025年与2016年相比增长率,顺德线的参与人数2025年与2016年相比增长率,
禅城线的参与人数2025年与2016年相比增长率,三水线的参与人数2025年与2016年相比增长率,
高明线的参与人数2025年与2016年相比增长率,所以五条线的参与人数2025年与2016年相比增长率最高的是南海线,D选项正确;
故选:ABD
20.某农户从一批待售的苹果中随机抽取100个,对样本中每个苹果称重,数据如下表.
质量(单位,千克)
[0.08,0.09)
[0.09,0.1)
[0.1,0.11)
[0.11,0.12)
[0.12,0.13)
[0.13,0.14]
个数
10
10
20
40
15
5
若将这批苹果按质量大小进行分级,质量不小于0.12千克的苹果为一级果;质量不小于0.1千克且小于0.12千克的苹果为二级果;质量在0.1千克以下的苹果为三级果.
(1)根据以上抽样调查数据,能否认为这批苹果符合“二级果和一级果的数量之和至少要占全部产品的70%”的规定?
(2)若将这批苹果按等级出售,一级果的售价为10元/千克;二级果的售价为8元/千克;三级果的售价为6元/千克经估算,这批苹果有150000个,请问该批苹果的销售收入约为多少元?(问一组中的数据用该组区间的中点值作代表)
【答案】(1)符合规定
(2)183450元
【分析】(1)根据已知数据计算“二级果和一级果的数量之和的占比可得;
(2)求出一级、二组、三级果品的数量及平均质量后得各级果品质量,从而得总收入.
【详解】(1)由题意可知,样本中二级果和一级果的数量之和占比为.
所以这批苹果符合规定;
(2)由样本知,这批苹果中一级果占20%,二级果占60%,三级果占20%,
所以150000个苹果中一级果有30000个,二级果有90000个,三级果有30000个.
一级果的质量约为千克
三级果的质量约为千克.
三级果的质量约为千克:
总售价约为
所以该苹果的销售收入的为183450元
【考点三】用样本估计总体的集中趋势参数
21.(24-25高一下·河北雄安·期末)样本数据的中位数为( )
A.5.5 B.6 C.6.5 D.7
【答案】A
【分析】将给定数据由小到大排列,利用中位数的定义求解.
【详解】样本数据由小到大排列为,共个数,
所以所求中位数是.
故选:A
22.(24-25高一下·重庆·期末)某商场记录了2025年1-6月的销售额(单位:万元),绘制了如下的折线图.已知这6个月销售额的平均数为20万元,下列说法正确的是( )
A.该商场这6个月销售额的众数是22万元
B.该商场1-6月的销售额逐月递增
C.该商场这6个月的销售额的中位数与平均数相等
D.该商场预测7月份的销售额一定不低于25万元
【答案】C
【分析】根据中位数,众数,和折线统计图的概念,逐个判断各选项正误.
【详解】由图可知,22只出现一次,众数不是22万元,所以A错误;
由图可知,3月到4月出现下降,所以B错误;
这6个月的销售额由小到大排列为:,6个数的中位数是第3个和第4个的平均数,所以中位数为,所以C正确;
折线统计图无法预测下个月的变化,所以D错误.
故选;C.
23.(24-25高一下·贵州六盘水·期末)为了研究我市甲、乙两个旅游景点的游客情况,文旅局统计了今年4月到9月甲、乙两个旅游景点的游客人数(单位:万人),得到如图所示的折线图.根据两个景点的游客人数的折线图,下列说法错误的是( )
A.7,8,9月份的总游客人数甲景点比乙景点少
B.乙景点4月到9月的游客人数总体呈上升趋势
C.甲景点4月到9月游客人数的平均值在内
D.甲、乙两景点4月到9月中游客量的最高峰期都在8月
【答案】D
【分析】根据折线图分别判断信息及计算平均数进而判断各个选项即可.
【详解】对于A,由游客人数折线图可知,甲景点7,8,9月份的总游客人数为,乙景点的7,8,9月份的总游客人数为,,A正确;
对于B,根据乙景点的游客人数折线图可知,乙景点每月的游客人数逐月增多,所以总体呈上升趋势,故B正确;
对于C,甲景点游客人数的平均值为,,C正确;
对于D,由游客人数折线图可知,甲景点4月到9月中游客量的最高峰期在8月,乙景点4月到9月中游客量的最高峰期在9月,D错误.
故选:D.
24.(多选)(24-25高一下·湖南怀化·期末)某学校举行的数学史知识答题比赛,对参赛的名考生的成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为,若同一组中数据用该组区间中间值作为代表值,则下列说法中正确的是( )
A.这人成绩的中位数为分
B.这人成绩的众数约为分
C.这人成绩的平均分约为分
D.用分层抽样的方法从该校学生中抽取一个容量为的样本,则成绩在区间应抽取人
【答案】BC
【分析】利用中位数、众数、平均数的计算方法,结合频率分布直方图,可判断出A,B和C正确,对于D,求出各组的频率比,即可求解.
【详解】对于选项A,设这人成绩的中位数为,则,
解得,所以选项A错误,
对于选项B,由频率分布直方图知,人成绩的众数在区间,约为分,所以B正确,
对于选项D,人成绩的平均分约为,
所以选项C正确,
对于选项D,由频率分布直方图知,各组频率比为,
所以成绩在区间应抽取,故选项D错误,
故选:BC.
25.(多选)(23-24高一下·湖北·期末)如图所示,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成不规则形态,图(3)形成“右拖尾”形态,根据所给图形作出以下判断,正确的是( )
A.图(1)中平均数中位数众数 B.图(2)中众数平均数
C.图(3)中众数中位数平均数 D.图(3)中众数平均数中位数
【答案】BC
【分析】根据平均数,中位数,众数的概念结合图形分析判断.
【详解】图(1)的分布直方图是对称的,所以平均数中位数众数,故A错误;
图(2)频率直方图可知,众数位于第二组,而平均数位于第二组后,
所以众数平均数,故B正确;
图(3)频率直方图可得,单峰不对称且“右拖尾”,最高峰偏左,众数最小,
平均数易受极端值的影响,与中位数相比,平均数总是在“拖尾”那边,
平均数大于中位数,故C正确,D错误;
故选:BC.
26.(24-25高一下·四川资阳·期末)将一个总体分为,,三层,其个体数之比为.若,,三层的样本的平均数分别为20,30,40,则总体的平均数为__________.
【答案】
【分析】结合分层抽样的概念即可求解.
【详解】由题意可知样本的平均数为.
所以总体的平均数为.
故答案为:.
27.(24-25高一下·山西大同·期末)某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6.若甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,则合在一起后的样本平均数为________.(精确到0.1)
【答案】5.4
【分析】根据平均数的计算公式即可求解.
【详解】由题意可知合在一起的样本平均数为,
故答案为:5.4
28.(24-25高一上·江西抚州·期末)抚州市政府为了促进十一黄金假期期间文昌里文化街区餐饮服务质量的提升,抚州市旅游管理部门需了解游客对餐饮服务工作的认可程度.为此该部门随机调查了名游客,把这名游客对餐饮服务工作认可程度给出的评分分成、、、、五组,得到如图所示的频率分布直方图.则直方图中的值为____________,评分的平均数为____________.
【答案】
【分析】利用频率分布直方图中所有矩形面积之和为,可求得的值;将每个矩形底边的中点值乘以对应矩形的面积,再将所得结果全加,可得出评分的平均数.
【详解】因为频率分布直方图中所有矩形面积之和为,
则有,解得,
评分的平均数为.
故答案为:;.
29.(24-25高一下·新疆哈密·期末)某学校对学生身高进行调查,抽取名学生,数据分为,,,,五组.统计各组频数并计算相应频率,绘制出如图所示的频率分布直方图.
(1)求图中的值;
(2)求平均身高的估计值(同一组中的数据用该组区间的中点值作代表);
(3)若该市共有5万名高中生,试估计身高低于的学生人数.
【答案】(1)
(2)
(3)人
【分析】(1)利用频率分布直方图的性质建立方程,求解参数即可.
(2)利用频率分布直方图的性质求解平均数即可.
(3)先求出身高低于的频率,再求解总人数即可.
【详解】(1)因为小长方形的面积和为,
所以,解得.
(2)由频率分布直方图的性质得平均身高为
,
则平均身高的估计值为.
(3)由题意得身高低于的频率为,
而该市共有5万名高中生,则身高低于的学生有人,
故身高低于的学生人数有人.
30.(25-26高一上·辽宁辽阳·期末)某工厂有工人人,其中名工人参加过短期培训(称为类工人),另外名工人参加过长期培训(称为类工人).现用分层抽样的方法(按类、类分二层)从该工厂的工人中共抽查 名工人,调查他们的生产能力(此处的生产能力指一天加工的零件数).
(1)类工人和类工人中各抽查多少工人?
(2)从类工人中的抽查结果和从类工人中的抽查结果分别如下表1和表2.
表1
生产能力分组
人数
表2
生产能力分组
人数
①求、,再完成下列频率分布直方图;
②分别估计类工人和类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).
【答案】(1)名和名;
(2)①,,频率分布直方图见解析;②,,.
【分析】(1)先计算抽样比,进而可得各层抽取人数;
(2)根据第一问结合表1和表2即可求出,根据频率分布直方图的画法即可画出频率分布直方图;利用频率分布直方图的平均数公式可求出答案.
【详解】(1)由已知可得,抽样比,
故类工人应抽取名,类工人应抽取名,
所以类工人和类工人中分别抽查名和名.
(2)①由(1)得,解得,
,解得,
所以类工人生产能力频率分布直方图如下所示:
类工人生产能力频率分布直方图如下所示:
②,
,
,
所以类工人生产能力的平均数,类工人生产能力的平均数以及该工厂工人生产能力的平均数的估计值分别为、和.
【考点四】用样本估计总体的离散程度参数
31.(24-25高一下·山东青岛·期末)抽样调查得到20个样本数据,记作,样本数据的平均数为9,方差5.现去掉一个最大值13和一个最小值5,产生一组新数据,关于这组新数据,下列说法错误的是( )
A.中位数一定不变 B.极差一定变小
C.方差一定变小 D.平均数一定不变
【答案】B
【分析】由题可设20个样本数据从小到大排列为,通过计算可逐项判断.
【详解】不妨设20个样本数据从小到大排列为,
去掉最小,最大,剩下共18个样本数据,
原样本中位数为,新样本中位数也为,故A正确;
新样本极差为,所以极差有可能与原来相等,故B错误;
因为原样本均值为,所以新样本均值,故D正确;
原样本方差,
新样本方差,
所以新样本方差变小,故C错误;
故选:B.
32.(24-25高一上·贵州遵义·期末)高三一数学优生为了检测自己的解题速度,记录了完成五套高考模拟题所用的时间(单位:分钟)分别为,,100,105,110.已知这组数据的平均数为105,方差为,则( )
A.1 B.2 C.3 D.4
【答案】B
【分析】代入平均数和方差公式,求,即可求解.
【详解】由条件可知,得,①
方差,
所以,②
由①,,代入②,可得
解得:或,所以.
故选:B
33.(24-25高一下·山西大同·期末)若一组样本数据为,,,另一组样本数据,,的方差为8,则,,这组数据的方差为( )
A.4 B.2 C.6 D.8
【答案】B
【分析】根据方差的性质即可求解.
【详解】设,,这组数据的方差为,则,得,
故选:B
34.(多选)(24-25高一下·吉林·期末)下列说法正确的是( ).
A.数据的上四分位数是
B.已知样本数据,,…,的平均数为,则数据,,…,,与原数据的极差、平均数都相同
C.将总体划分为两层,通过分层抽样,得到样本数为的两层样本,其样本平均数和样本方差分别为,和,,若,则总体方差
D.甲组数据的方差为,乙组数据为,则这两组数据中较稳定的是乙组
【答案】ABC
【分析】根据上四分位数、平均数、极差、分层抽样的总体方差以及方差的意义,需要分别对每个选项进行分析判断.
【详解】对于A,,所以上四分位数为,A正确.
对于B,原数据的平均数为,
当添加后,新数据的和为,共有数据,
因此新数据平均数为,即平均数不变,
因新加入数据为介于数据最大值与最小值之间,所以不影响新数据极差,故极差不变,B正确.
对于C,因为总体平均数为,
所以总体方差为,C正确.
对于D,乙组数据的平均数为,
方差为,
所以这两组数据中较稳定的是甲组,D错误.
故选:ABC.
35.(多选)(24-25高一下·陕西西安·期末)已知互不相等的数据,,,,,的平均数为,方差为,则下列选项中正确的是( )
A.数据,,…,的平均数为
B.数据,,…,的标准差为
C.给原数据增加一个数据,且,若这七个数据的方差为,则
D.给原数据增加一个数据,且,若这七个数据的方差为,则
【答案】AC
【分析】根据平均值的性质求得平均数,然后利用方差的概念求解即可判断各项.
【详解】由题知,,,
所以,的平均数为,
的方差为,
所以数据,,…,的标准差为2s,A正确,B错误;
给原数据增加一个数据,且,
这七个数据的方差为,
故C正确,D错误.
故选:AC
36.(24-25高一下·黑龙江绥化·期末)据统计某市学生的男女生人数比为,为了调查该市学生每天睡眠时长的情况,按照男女生人数比用分层抽样的方法抽取样本.根据样本数据计算得男生每天睡眠时长的平均数为7.3小时,方差为2,女生每天睡眠时长的平均数为6.8小时,方差为1.9,则可估计该市学生每天睡眠时长的平均数为________小时,方差为________;
参考公式:分层抽样中,假设第一层有m个数,平均数为,方差为;第二层有y个数,平均数为,方差为.则样本方差.
【答案】
【分析】对于平均数,根据分层抽样中各层人数比例与各层平数来计算总体平均数;
对于方差,利用给定的分层抽样方差公式进行计算.
【详解】该市学生的男女生人数比为,设男生人数为,女生人数为,
男生每天睡眠时长的平均数为7.3小时,故个男生睡眠时长为小时;
女生每天睡眠时长的平均数为6.8小时,故个女生睡眠时长为小时,
则该市学生每天睡眠时长的平均数为(小时);
由题干可得,,,,,,
代入公式得,
.
故答案为:;.
37.(24-25高一下·湖南长沙·期末)甲、乙两支羽毛球队体检结果如下:甲队体重的平均数为,方差为100,乙队体重的平均数为,方差为200,又已知甲、乙两队的队员人数之比为1:3,那么甲、乙两队全部队员体重的方差等于______.
【答案】
【分析】先求出体重的总平均数,然后根据分层方差和总方差关系直接计算可得.
【详解】体重的总平均数为,
则甲、乙两队全部队员体重的方差.
故答案为:
38.(24-25高一下·黑龙江大庆·期末)若一组样本数据,,,的平均数为2,方差为4,则数据,,,,,,,的方差为__________.
【答案】14
【分析】先根据已知数据平均数和方差的定义解出两个关系,再由这两个关系来新数据的方差.
【详解】因为数据数据,,,的平均数为2,方差为4.
所以,即——①
,
,
,
即——②.
设数据,,,,,,,的平均数为.
设数据,,,,,,,的方差为.
.
故答案为:14.
39.(25-26高一上·河南焦作·期末)无土栽培是未来太空探索所必需的技术,现用相同的种子分别在无土环境与土壤环境中种植,将两种环境下生长的植株各分成五组,分别计算各组植株的平均高度(单位:),得到如下表格:
第1组
第2组
第3组
第4组
第5组
无土环境
12.8
13.2
13.1
12.9
13.0
土壤环境
15.2
16.4
14.9
17.3
16.2
规定:记第组中无土环境生长植株的平均高度为,土壤环境生长植株的平均高度为,若,则称两种环境下植株生长差异较小,否则称两种环境下植株生长差异较大.
(1)求土壤环境中5组植株平均高度的中位数和极差;
(2)证明:两种环境下植株生长差异较大.
【答案】(1)中位数为16.2,极差为
(2)证明见解析
【分析】(1)将土壤环境的植株高度数据排序后,取中间值得到中位数,用最大值减去最小值得到极差.
(2)计算每组两种环境下植株高度差的绝对值,求其平均值并与比较,判断差异是否较大.
【详解】(1)将土壤环境中5组植株平均高度按照从小到大的顺序排列为14.9,15.2,16.2,16.4,17.3,
易得其中位数为16.2,其极差为
(2)先计算,
计算每一组:
第一组:
第二组:
第三组:
第四组:
第五组:
求和:
计算平均值:
因此,不满足“”的条件,所以两种环境下植株生长差异较大.
40.(24-25高一下·山东聊城·期末)某校高一年级为了解学生近期的数学学习情况,组织了一次数学阶段测试.从所有学生的数学成绩中随机抽取400名学生的数学成绩作为样本,整理数据并分成,,,,,这6组,得到如图所示的频率分布直方图.
(1)求a的值,并估计参加这次测试的学生数学成绩的中位数(四舍五入取整数);
(2)从所抽取的数学成绩在,内的学生中,采用样本量按比例分配的分层抽样抽取n名学生,若这n名学生数学成绩的平均数为126分,方差为50,且这n名学生中数学成绩在内的只有1名,其数学成绩为136分,求这n名学生中数学成绩在内的学生数学成绩的平均数与方差.
【答案】(1),中位数为99分,
(2)平均数为124分,方差为36
【分析】(1)利用频率分布直方图各小矩形面积和为1求出,再确定中位数所在区间,列式求解.
(2)求出,利用分层抽样平均数、方差公式列式求解.
【详解】(1)由频率分布直方图知,,解得;
由,,
得这400名学生数学成绩的中位数,由,得,
所以估计参加这次测试的学生数学成绩的中位数为99分.
(2)依题意,,解得,
设这6名学生的数学成绩分别为,,,,,136,
由这6名学生的数学成绩的平均数为126分,得,
解得,因此;
设,,,,的方差为,由这6名学生的数学成绩的方差为50,
得,解得,
所以所求学生数学成绩的平均数为124分,方差为36.
【考点五】用频率直方图估计总体分布
41.(23-24高一下·河北·期末)某校为了了解学生的体能情况,于6月中旬在全校进行体能测试,统计得到所有学生的体能测试成绩均在内.现将所有学生的体能测试成绩按分成三组,绘制成如图所示的频率分布直方图.若根据体能测试成绩采用按比例分层随机抽样的方法抽取20名学生作为某项活动的志愿者,则体能测试成绩在内的被抽取的学生人数为( )
A.4 B.6 C.8 D.10
【答案】B
【分析】由频率分布直方图可知体能测试成绩在内的频率为,由此采用按比例分层随机抽样的方法求解即可
【详解】根据题意可得体能测试成绩在内的被抽取的学生人数为.
故选:B
42.(23-24高一下·四川达州·期末)在某次考试成绩中随机抽取50个,成绩均在之间,将这些成绩共分成五组:,,,,,得到如图所示的频率分布直方图,由图中数据估计总体的众数和中位数(中位数精确到个位)分别是( ).
A.65,70 B.65,71 C.65,72 D.65,73
【答案】D
【分析】本题根据众数和中位数的概念以及在频率分布直方图的表达方法即可计算求解.
【详解】众数是频率分布直方图中最高的矩形的中点的坐标,即众数为,
设把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标为,
先求图中的a值,由得,,
则,所以.
故选:D.
43.(23-24高一下·河南三门峡·期末)某高中为了积极响应国家“阳光体育运动”的号召,调查该校3 000名学生每周平均体育运动时长的情况,从高一、高二、高三三个年级学生中按照4∶3∶3的比例进行分层随机抽样,收集了300名学生每周平均体育运动时长(单位:小时)的数据,整理后得到如图所示的频率分布直方图.下列说法不正确的是( )
A.估计该校学生每周平均体育运动时长为5.8小时
B.估计该校高一年级学生每周平均体育运动时长不足4小时的人数为300
C.估计该校学生每周平均体育运动时长不少于8小时的百分比为10%
D.估计该校学生每周平均体育运动时长不少于8小时的人数为600
【答案】C
【分析】利用频率分布直方图计算出样本的平均数可判断A;根据频率分布直方图计算出高一年级每周平均体育运动时间不足小时的人数,可判断B;根据频率分布直方图计算出该校学生每周平均体育运动时间不少于小时的频率与人数,可判断CD.
【详解】对于A,估计该校学生每周平均体育运动时长为
(小时),故选项A正确;
对于B,该校高一年级的总人数为,由题中频率分布直方图可知,
该校学生每周平均体育运动时长不足4小时的频率为,
所以估计该校高一年级学生每周平均体育运动时长不足4小时的人数为,
故选项B正确;
对于C,估计该校学生每周平均体育运动时长不少于8小时的百分比为
,故选项C错误;
对于D,估计该校学生每周平均体育运动时长不少于8小时的人数为,
故选项D正确.
故选:C.
44.(多选)(24-25高一下·吉林长春·期末)在某市初三年级举行的一次体育统考考试中,共有500人参加考试.为了解学生的成绩情况,抽取了样本容量为的部分考生成绩,已知所有考生成绩均在,按照,,,,的分组作出如图所示的频率分布直方图、若在样本中,成绩落在区间的人数为32,则由样本估计总体可知下列结论正确的为( )
A. B.估计考生成绩的众数为72
C.估计考生成绩的中位数为71 D.估计该市考生成绩的平均分为70.6
【答案】ACD
【分析】根据频率分布直方图的特征先计算,再计算样本数即可得A,由频率分布直方图计算众数、中位数、平均数并估计总体即可判定B、C、D选项.
【详解】由频率分布直方图可知,
∴,故A正确;
由频率分布直方图可知众数落在区间上,则考生成绩的众数为75,故B错误;
由于,所以中位数位于区间内,
同时可知考生成绩的中位数为:,故C正确;
由频率分布直方图可知样本中,
考生成绩的平均分为,
可估计整体学生的平均分为70.6,故D正确.
故选:ACD.
45.(多选)(24-25高一下·海南海口·期末)在一次对甲、乙两个工厂生产的相同数量的零件质量(单位:克)统计中,得到如下表:
工厂
平均质量
中位数
众数
方差
甲厂
63
63
61
乙厂
63
62
61
其中,根据统计数据,下列结论中正确的是( )
A.甲厂生产的零件质量稳定性优于乙厂
B.甲厂生产零件质量的极差可能小于乙厂
C.甲、乙两厂生产的零件中61克出现的次数相同
D.甲厂生产的零件中质量大于63克的数量多于乙厂
【答案】AB
【分析】根据平均数,中位数,众数和方差的定义逐一验证即可求解.
【详解】根据表格有,所以甲厂生产的零件质量稳定性优于乙厂,故A正确;
根据平均数,中位数和众数不能判断极差,而,所以甲厂生产零件质量的极差可能小于乙厂,故B正确;
根据众数的定义可知,众数是出现次数最多的,不能判断甲、乙两厂生产的零件中61克出现的次数相同,故C错误;
由于甲乙两厂的平均质量为63克,不能判断甲厂生产的零件中质量大于63克的数量多于乙厂,故D错误.
故选:AB.
46.(24-25高一上·江西·期末)某校60名同学数学竞赛的成绩(满分:100分)均在之间,进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,若从这60名参赛者中随机选取1人,试估计其成绩在的概率为_____.
【答案】0.05
【分析】由频率分布直方图的性质面积和为1,即可求解;
【详解】由图可知,,解得,
成绩在的频率为,以频率为概率估计概率为0.05.
故答案为:0.05
47.(21-22高一下·广东广州·期末)为了解某市今年初二年级男生的身体素质状况,从该市初二年级男生中抽取了一部分学生进行“掷实心球”的项目测试.经统计,成绩均在2m到12m之间,把获得的所有数据分成,,,,五组,得到如图所示的频率分布直方图.则直方图中的值为________,如果有4名学生的成绩在10m到12m之间,则参加“掷实心球”项目测试的人数为________.
【答案】 /
【分析】根据频率分布直方图的性质可求出,根据样本容量频数频率可求出结果.
【详解】由,得.
学生的成绩在10m到12m之间的频率为,频数为,
所以参加“掷实心球”项目测试的人数为(人).
故答案为:;.
48.(23-24高一下·吉林·期末)某水产养殖户对其养殖的一批鱼的重量(单位:)进行统计,所得数据都在内,按,,,,,分成六组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)估计该水产养殖户养殖的这批鱼的重量的中位数;
(3)若这批鱼有条,估计这批鱼中重量在内的数量.
【答案】(1)
(2)中位数为
(3)条
【分析】(1)根据频率分布直方图概率和为,可得解;
(2)根据中位数的定义可得解;
(3)由频率分布直方图可得重量在的频率,进而可得数量.
【详解】(1)由频率分布直方图可得,
解得;
(2)设该水产养殖户养殖的这批鱼的重量的中位数为,
因为,,
所以,
则,解得,
即该水产养殖户养殖的这批鱼的重量的中位数为;
(3)由频率分布直方图可知这批鱼中重量在内的频率是,
则这批鱼中重量在内的数量是条.
49.(25-26高一上·江西·期末)课外阅读有很多好处,可以帮助提高阅读能力、拓展知识面、提高思维能力、提高情感素养和提高人际交往能力.某校为了解学生课外阅读的情况,随机统计了名学生的一个学期课外阅读时间(单位:小时),所得数据都在内,将所得的数据分成4组:,,,,得到如图所示的频率分布直方图,现知道课外阅读时间在内的有80人.
(1)求和的值;
(2)估计该校学生一个学期课外阅读时间的平均数(同一组中的数据用该组区间的中点值代表);
(3)求所得数据的中位数.
【答案】(1)
(2)105
(3)106.25
【分析】(1)根据频率公式和频率和为1列出方程,即可得解.
(2)根据频率分布直方图中平均数计算公式计算即可.
(3)根据频率分布直方图中中位数计算公式计算即可.
【详解】(1)依题意,课外阅读时间在内的有80人,频率为,则,
由频率分布直方图,得,所以.
(2)估计该校学生一个学期课外阅读时间的平均数为:
.
(3)课外阅读时间在的频率为,在的频率为,
则中位数,因此,解得,
所以所得数据的中位数为.
50.(24-25高一下·贵州黔东南·期末)中国AI大模型正处于一个技术进步迅速、市场规模快速增长的爆发式发展阶段.为了了解中国AI大模型用户的年龄分布,公司调查了500名中国AI大模型用户,统计他们的年龄(都在内),按照,,,,进行分组,得到如图所示的频率分布直方图.
(1)求的值;
(2)求这500名中国AI大模型用户的年龄在内的人数;
(3)估计这500名中国AI大模型用户年龄的平均数(各组数据以该组区间的中点值作代表).
【答案】(1)
(2)300人
(3)
【分析】(1)由所有频率之和为1求解;
(2)由年龄在内的频率计算求解;
(3)由频率分布直方图的平均数计算公式计算求解.
【详解】(1)由题可知组距为,
则:
解得:.
(2)这500名中国AI大模型用户的年龄在内的频率为:
所以这500名中国AI大模型用户的年龄在内的人数为:人.
(3)估计这500名中国AI大模型用户年龄的平均数为:
.
【考点六】百分位数
51.(24-25高一下·新疆阿克苏·期末)某班级的老师随机抽查了该班8名同学周末在家学习的时长(单位:h),所得数据如下:3,4,4,5,6,6,7,8,则这组数据的75%分位数为( )
A.6.5 B.6 C.5.5 D.5
【答案】A
【分析】根据百分位数的计算公式即可求解。
【详解】,故这组数据的75%分位数为,
故选:A
52.(25-26高一上·内蒙古呼和浩特·期末)某校高一年级10个班参加艺术节合唱比赛的得分如下:91,89,90,92,94,87,93,96,91,85.则这组数据的25%分位数、70%分位数为( )
A.88,92 B.88,92.5 C.89,92.5 D.90,94.5
【答案】C
【分析】由百分数的计算可得.
【详解】从小到大排列为85,87,89,90,91,91,92,93,94,96,
因为,,
所以这组数据的25%分位数为89,70%分位数为.
故选:C.
53.(25-26高一上·辽宁鞍山·期末)下列说法错误的是( )
A.一组数据的众数和中位数相同
B.对A,B,C三种个体按的比例分层随机抽样调查,如果抽取A的个体数为9,则样本容量为18
C.一组数据为,则这组数据的分位数为10
D.若样本数据,,,的标准差和平均数均为8,则数据,,…,的标准差为16,平均数为15
【答案】C
【分析】根据众数、中位数、分层随机抽样中的比例分配、百分位数、标准差和平均数的定义和计算方法分别判断即可.
【详解】对于A,将这组数据按从小到大的顺序排列为,所以众数为出现次数最多的3,中位数为中间两个数的平均数,即,众数和中位数相同,故A说法正确;
对于B,由知A在样本中所占比例为,所以样本容量为,故B说法正确;
对于C,将这组数据按从小到大的顺序排列为,共8个数,因为,所以这组数据的分位数为第6,第7个数据的平均数,即,亦即这组数据的分位数为11,故C说法错误;
对于D,因为样本数据,,,的标准差和平均数均为8,则数据,,…,的标准差为,平均数为,故D说法正确.
故选:C.
54.(多选)(23-24高一下·黑龙江鸡西·期末)“体育强则中国强,国运兴则体育兴”,为备战2024年巴黎奥运会,运动员们都在积极参加集训.已知某射击运动员在一次集训中7次射击的分数分别为:,,,,,,,则这组数据的( )
A.平均数为9 B.众数为9
C.第70百分位数为10 D.方差为
【答案】ABD
【分析】根据平均数、众数、百分位数、方差定义逐项计算即可判断得出答案.
【详解】对于A,易知平均数为,即A正确;
对于B,7次射击的分数中9出现了3次,出现次数最多,所以众数为9,即B正确;
对于C,将本组数据从小到大重新排列为,
又,因此第70百分位数为第五个数据9,所以C错误;
对于D,易知方差为,
因此D正确.
故选:ABD
55.(多选)(25-26高一上·江西景德镇·期末)某公司为保证产品生产质量,连续10天监测某种新产品生产线的次品件数,得到关于每天出现的次品的件数的一组样本数据:,则关于这组数据的结论正确的是( )
A.极差是4 B.众数等于平均数
C.方差是2 D.数据的分位数为3.5
【答案】ABD
【分析】由极差的定义计算后判断选项A;由众数和平均数的定义计算后判断选项B;计算数据方差判断选项C;计算分位数判断选项D.
【详解】该组数据从小到大排列为,
对于A,该组数据的极差为,故A正确;
对于B,众数为3,平均数为,故B正确;
对于C,该组数据的方差为:
,故C错误;
对于D,因为,所以这组数据的百分位数为,故D正确.
故选:ABD.
56.(24-25高一下·河北唐山·期末)数据:1,2,3,3,5的第50百分位数是______.
【答案】3
【分析】第50百分位数为数据的中位数,即得.
【详解】数据:1,2,3,3,5的第50百分位数是3.
故答案为:3
57.(24-25高一下·河北秦皇岛·期末)一组数据按从大到小的顺序排列为8,7,x,4,4,1,若该组数据的中位数是众数的倍,则该组数据的第60百分位数是____.
【答案】6
【分析】先根据中位数是众数的倍,求出,然后根据百分位数的定义可求得结果.
【详解】因为数据1,4,4,,7,8(其中)的中位数为,众数为4,
所以,得,
因为,
所以这组数据的第60百分位数是6;
故答案为:6
58.(24-25高一下·黑龙江绥化·期末)有5人进行定点投篮游戏,每人投篮12次.这5人投中的次数形成一组数据,中位数为10,唯一众数为11,极差为3,则该组数据的第40百分位数是_________.
【答案】9.5
【分析】根据统计量计算中中位数、众位数、极差以及百分数的概念,结合多个条件构造符合条件的数据组求解.
【详解】设这5个数据从小到大为:
已知中位数为第三个数,故;
唯一众数为11,故d,e至少含11,且11出现次数至少2次,故;
极差为3,即;
若,则10和11均出现2次,众数不唯一;若,则8和11均出现2次,众数不唯一. 因此,.
综上,数据为:8,9,10,11,11.
根据百分位数公式:设数据个数为n,第百分位数的位置.
已知,,故.
当i为整数时,第百分位数位第项与第项的平均值,即
故答案为:9.5.
59.(24-25高一下·内蒙古·期末)甲机床一天内生产的零件的重量(单位:)从小到大为.
(1)求这组数据的分位数;
(2)求这组数据的平均数和标准差;
(3)求零件重量位于和之间的个数及所占的百分比.
参考数据:.
【答案】(1)10.5
(2)10,
(3)6个,
【分析】(1)利用总体百分位数的估计求解分位数即可.
(2)利用平均数公式求解平均数,利用标准差公式求解标准差即可.
(3)结合题意求出和,再求出其中的零件个数和百分比即可.
【详解】(1)因为,
所以这组数据的分位数为.
(2)由题意得,
由标准差公式得.
(3)由题意得,
则零件重量位于和之间的有,共6个,
可得所占的百分比是.
60.(24-25高一下·陕西·期末)为了调查学生完成课后作业所用时间的基本情况,从600名初中学生中抽取100名学生进行调查统计,学生完成作业所需时间的频率分布直方图如图:
(1)估计该年级学生完成课后作业所需时间的平均值;
(2)估计该年级学生完成课后作业所需时间的25%分位数;
(3)估计全年级学生完成课后作业所需时间超过了2.5小时的人数.
【答案】(1);
(2);
(3).
【分析】(1)由各区间中点横坐标乘以各矩形面积之和可得;
(2)根据各组频率确定25%分位数所在区间,由频率之和等于列方程可解;
(3)求出所需时间超过分钟的频率,结合该年级学生人数可得.
【详解】(1)由直方图可知,;
(2)因为前两组的频率之和为,
前三组的频率之和为,
所以该年级学生完成课后作业所需时间的25%分位数在区间,设为,
则,解得;
(3)小时分钟,
所需时间超过分钟的频率为,
所以全年级学生完成课后作业所需时间超过了2.5小时的人数大约为人.
1
学科网(北京)股份有限公司
$