内容正文:
2024-2025学年高一数学考点剖析及分层精练(人教A版2019必修第二册)
第18讲 用样本估计总体
学习目标:
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性;
2.结合实例,能用样本估计百分位数,理解百分位数的统计含义;
3.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数)、离散程度参数(标准差、方差、极差),理解集中趋势参数和离散程度参数的统计含义.
重点难点:
重点:1.掌握频率分布表、频率分布直方图的制作步骤;
2.用平均数、中位数和众数对数据的集中趋势进行描述,利用频率颁布直方图估计总体的众数、中位数和平均数;
难点:1.能通过样本的频率分布估计总体的频率分布;
2.学会数据分析的方法,理解总体集中趋势的估计思路并学会运用;
一、频率分布直方图
1.画频率分布直方图的步骤
第1步:求极差(即一组数据中最大值与最小值的差); 第2步:决定组距与组数;
第3步:将数据分组; 第4步:列频率分布表;
第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
二、数字特征
①众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
②极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
③性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
三、百分位数
1.定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2.计算一组几个数据第p百分位数的步骤
第1步,按从小到大排列原始数据;
第2步,计算.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
考点01 频率分布直方图的绘制与应用
1.为了了解学校质量监测成绩,现随机抽取该校200名学生的成绩作为样本进行分析,并绘制频率分布直方图,若该频率分布直方图的组距为10,且样本中成绩在区间这一组内的学生有40人,则在频率分布直方图中该组数据对应的矩形高度为( )
A.0.02 B.0.2 C.0.04 D.0.4
2.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为的样本,其频率直方图如图所示,其中支出在[20,30)内的同学有10人,则的值为 .
3.为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压(单位:kPa)的分组区间为,.将其按从左到右的顺序分别编号为第一组,第二组,,第五组,下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数是( ).
A.8 B.12
C.16 D.18
4.为了了解某地区高三学生的身体发育情况,随机抽查了该地区100名年龄为17.5~18岁的男生体重(kg),得到频率分布直方图如图所示,根据该图可得这100名男生中体重在的人数为
5.为弘扬中华传统文化,某校组织若干名学生参加汉字听写大赛,为了解学生整体听写能力,从中抽取部分学生的成绩(得分取正整数,满分为100分)进行统计分析,请根据尚未完成的下列图表,解答问题:
分组
49.5~59.5
59.5~69.5
69.5~79.5
79.5~89.5
89.5~100.5
频数
2
a
20
16
8
频率
0.04
0.08
0.40
0.32
b
(1)本次抽样调查的样本容量为_______,此样本中成绩的中位数落在_______范围内.表中_______,_______;
(2)补全频数分布直方图;
(3)若该校共有初中生3000名,若成绩超过80分为优秀,请估计该校汉字听写能力为优秀的约有多少人.
考点02 统计图的分析
6.中国人口亿人口中肠胃病患者高达亿,慢性胃炎发病率高达,消化性溃疡病发率也高达,是全世界当之无愧的“胃病大国”.根据随机对名青少年随机抽查,的青少年表示自己患有胃病,的青少年不清楚自己是否患有胃病,只有明确自己没有胃病.肠胃病的严重程度,一般可体现在排便量、排便时长上. 某高中为了了解学生肠胃病占比和严重程度,对年高一高二学生单日单次的排便时长进行了统计(记排便分钟内为正常,排便分钟为轻度肠胃病,排便分钟以上为重度肠胃病),并将结果制成统计图(如图所示),若高一学生人,高二学生人,占比百分数均保留整数,下列说法正确的是( )
A.高二学生的肠胃病人数比高一年级少
B.高一年级的各肠胃病区间人数占比都比高二年级少
C.高一年级重度肠胃病人数占比比高二年级少
D.高一肠胃质量参数比高二高(肠胃质量参数)
7.(多选)为了解某企业员工的学习情况,对该企业员工进行问卷调查,已知他们的得分都处在A,B,C,D四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占,则下列结论错误的是( )
A.男、女员工得分在A区间的占比相同
B.在各得分区间男员工的人数都多于女员工的人数
C.得分在C区间的员工最多
D.得分在D区间的员工占总人数的19%
8.(多选)近年来中国冰雪产业快速发展,冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领户外用品行业市场进一步增长.下面是2015年至2021年中国雪场滑雪人次(单位:万人次)与同比增长率的统计图,则下面结论中正确的是( )
A.2015年至2021年,中国雪场滑雪人次逐年增加
B.2016年至2018年,中国雪场滑雪人次和同比增长率均逐年增加
C.2021年与2016年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人数也近似相等
D.2021年与2019年相比,中国雪场滑雪人次增长率约为
9.(多选)某企业2024年12个月的收入与支出数据的折线图如图所示.
已知:利润=收入-支出,根据该折线图,下列说法正确的是( )
A.该企业2024年1月至6月的总利润低于2024年7月至12月的总利润
B.该企业2024年第一季度的利润约是60万元
C.该企业2024年4月至7月的月利润持续增长
D.该企业2024年11月份的月利润最大
10.(多选)某校秋季运动会中两班的各个单项得分(满分5分,分值高者为优)的雷达图如图所示,则下列说法正确的是( )
A.在200米项目中,班的得分比班的得分高
B.在铅球项目中,班的得分比班的得分高
C.在跳高项目中,班的得分比班的得分高
D.班的总分比班的总分高
考点03 总体百分位数的估计
11.已知一组数据的平均数为16,则这组数据的第65百分位数为( )
A.17 B.16.5 C.16 D.15.5
12.某水产单位对其投放的网箱产量(单位:kg)进行了样本统计,得到样本数据的频率分布直方图如下图所示,请根据频率分布直方图估计该水产单位所有网箱产量的72%分位数为 kg.
13.某次期中考试随机抽取了12名同学的数学成绩作为样本,分别是53,59,61,62,67,75,77,80,82,86,90,93.则这组数据的60百分位数为 .
14.如图所示是一样本的频率分布直方图,样本数据共分3组,分别为.估计该样本数据的第60百分位数是 .
15.某水产单位对其投放的网箱产量(单位:)进行了样本统计,得到样本数据的频率分布直方图如下图所示,请根据频率分布直方图估计该水产单位所有网箱产量的上四分位数为 .
考点04 频率直方图中的平均数、众数、中位数
16.某人工智能公司为优化新开发的语言模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,图中,则下列结论不正确的是( )
A. B.满意度计分的众数约为75分
C.满意度计分的平均分约为79分 D.满意度计分的第一四分位数约为70分
17.为了调查某厂工人生产某种产品的能力,随机抽查了40名工人某天生产该产品的数量,得到频率分布直方图如图所示.
(1)求频率分布直方图中的值.
(2)求这40名工人一天生产该产品的数量的众数,中位数和平均数.
18.(多选)某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:
分组
频率
0.25
0.30
0.20
0.25
则下列关于高一年级学生每周体育锻炼时长的说法正确的是( )
A.众数约为2.5 B.中位数约为3.83 C.平均数为3.95 D.第80百分位数约为5.2
19.(多选)某校100名学生学业水平测试数学成绩的频率分布直方图如图所示,已知所有学生成绩均在区间内,则( )
A.图中的值为0.005
B.这组数据的平均数为73
C.这组数据的众数为75
D.这组数据的中位数约为71.7
20.(多选)为弘扬中华优秀传统文化,树立正确的价值导向,落实立德树人的根本任务,某校组织全体高一年级学生进行古典诗词知识测试,从中随机抽取100名学生,记录他们的分数,整理得到频率分布直方图如图(各组区间除最后一组为闭区间外,其余各组均为左闭右开区间),则以下说法正确的是( )
A.
B.估计此次测试学生分数的众数为95
C.估计此次测试学生分数的中位数为90
D.估计此次测试学生分数的下四分位数为85
考点05 标准差、方差的计算
21.若一组样本数据的平均数为2,方差为4,则样本数据的平均数与方差分别为( )
A.3,4 B.2,4 C.3, D.2,
22.已知,两组数据,其中:2,3,4,5,6;:11,,13,14,12;组数据的方差为 ,若,两组数据的方差相同,试写出一个值 .
23.(多选)某次演唱比赛结束后,10个评委为选手评分,恰好原始评分为9.1到10.0(公差为0.1的等差数列),按照规则要求去掉最高分和最低分,那么( )
A.去掉最高分和最低分之前,评分的80百分位数为9.8
B.去掉最高分和最低分之前,评分的80百分位数为9.3
C.去掉最高分和最低分之后,方差相比原先减小
D.去掉最高分和最低分之后,极差相比原先减小
24.甲、乙两地10月1日至7日每天最低气温(单位:℃)如下:
日
日
日
日
日
日
日
甲地
乙地
记这天甲地每天最低气温的标准差为;记这天乙地每天最低气温的标准差为.根据上述信息,若,则值可以为 .(写出一个符合题意答案即可)
25.(多选)一组数据,,,,满足,若去掉,后组成一组新数据,则新数据与原数据相比( )
A.极差变小 B.平均数变大 C.方差变小 D.第25百分位数变小
考点06 平均数、标准差、方差的性质
26.有一组样本数据,其平均数为,方差为,若样本数据,的平均数为,方差为,则( )
A. B.
C. D.
27.若一组数据的中位数为9,方差为36,则另一组数据的中位数为 ,方差为 .
28.若甲组样本数据(数据各不相同)的平均数为5,乙组样本数据的平均数为12,则下列说法错误的是( )
A.
B.乙组样本数据的方差是甲组样本数据方差的9倍
C.两组样本数据的中位数可能相等
D.两组样本数据的极差可能相等
29.已知一组数,,,的平均数是3,方差为4,则数据,,,的平均数和方差分别是( )
A.7,8 B.7,16 C.6,8 D.6,16
30.(多选)已知甲组样本数据,由这组数据得到乙组样本数据,其中,则( )
A.乙组样本数据的极差是甲组样本数据极差的2倍
B.乙组样本数据的中位数是甲组样本数据中位数的2倍
C.乙组样本数据的平均数是甲组样本数据平均数的2倍
D.乙组样本数据的标准差是甲组样本数据标准差的2倍
考点07 利用分层方差求总体方差
31.某班级有30名男生和20名女生,现调查学生周末在家学习时长(单位:小时),得到男生样本数据的平均值为8,方差为2,女生样本数据的平均值为10.5,方差为0.75,则该班级全体学生周末在家学习时长的平均值和方差的值分别是( )
A. B.
C. D.
32.运动员在平时训练时通常会将自己的训练成绩记录下来,以此评估自己的训练成果.小明记录了他在2月份的8次训练成绩和3月份的12次训练成绩.通过计算,他发现2月份的训练成绩平均值为72,方差为4.2;3月份的训练成绩平均值为75,方差为6.1.则他在这两个月的20次训练的方差为 .
33.在对某中学高三年级学生体重(单位:kg)的调查中,按男、女生人数比例用分层随机抽样的方法抽取部分学生进行测量,已知抽取的男生有50人,其体重的平均数和方差分别为54,20,抽取的女生有40人,其体重的平均数和方差分别为45,11,则估计该校高三年级学生体重的方差为 .
34.某校有学生500人,其中男生320人,女生180人.某人想了解该校全体学生的身高(单位:cm)信息,从男生、女生中分别随机抽取人进行测量.如果已知男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03,但原始测量数据已丢失.设总体均值与方差分别为与,则下列说法正确的是( ).
A.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
B.若,无法算出总样本的均值与方差
C.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
D.若,无法算出总样本的均值与方差
35.某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据;
抽取次序
1
2
3
4
5
6
7
8
9
10
身高
155
158
156
157
160
161
159
162
169
163
记抽取的第个女生的身高为,样本平均数,方差.
参考数据:,,.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在范围内的人数;
(2)用总样本平均数和标准差分别估计该校高一学生总体身高的平均数和标准差,求,的值.
基础试炼
1.居民消费价格指数(Consumer Price Index,简称CPI),是度量一定时期内居民消费商品和服务价格水平总体变动情况的相对数,综合反映居民消费商品和服务价格水平的变动趋势和变动程度.下图是2024年11月9日国家统计局公布的2024年10月各类商品及服务价格同比和环比涨跌幅情况(同比,环比),下列结论正确的是( )
A.2024年10月份食品烟酒类价格低于2023年10月份食品烟酒类价格
B.2024年10月份教育文化娱乐类价格低于2024年9月份教育文化娱乐类价格
C.2024年9月份医疗保健类价格高于2023年10月份医疗保健类价格
D.2024年9月份居住类价格高于2023年10月份居住类价格
2.某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是( )
A.4 B.5
C.8 D.10
3.为了了解我校报考飞行员的学生的体重情况,将所得的数据整理后,作出频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为,且第1小组的频数为6,则报考飞行员的学生总人数是( )
A.48 B.60 C.72 D.76
4.某科研团队对某产品的一项新功能进行了8次测试,将不合格、合格、良、优的结果分别用0,1,2,3标记,若8次测试结果中有3次不合格、3次合格、1次良、1次优,则对于标记后的数据,下列结论正确的是( )
A.75%分位数为1 B.平均数为1.2
C.方差为1 D.极差为4
5.建设“书香校园”成为越来越多学校的办学追求.在对某高中1000名高一年级学生的图书馆借阅量的调查中,已知这1000名高一年级学生中男生有600人,采用分层随机抽样的方法抽取100人,抽取的样本中男生借阅量的平均数和方差分别为5和6,女生借阅量的平均数和方差分别为10和6,则估计该校学生借阅量的总体方差是( )
A.7 B.8 C.12 D.13
6.(多选)人工智能是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学.很多学校已经推出基于的人工智能通识课程,帮助学生深入了解人工智能的历史、关键技术及其在科学研究、社会发展中的高效应用,培养跨学科思维,推动人工智能技术在多领域的深度融合与创新.某探究小组利用解答了50份高考模拟试卷,收集其准确率,整理得到如下频率分布直方图,则下列说法正确的是( )
A.
B.估计准确率的分位数为
C.估计准确率的平均数为
D.估计准确率的中位数为
7.已知一组数据,,,,的平均数为,则的值是 ,该组数据的方差是 .
8.某高三年级组采用随机抽样的方式抽取了20名学生在某次数学周测中解答填空压轴题的时间记录如下表:
解答时间/分钟
频数
2
8
8
2
根据上表数据估计这20名学生解答时间的平均值为 ,中位数为 .
9.将某大型出版公司所有打字员每分钟的平均打字数统计如图所示,则可以估计该公司打字员每分钟的平均打字数的中位数为 .
10.“仓廪实,天下安”,对我们这样一个有着亿人口的大国来说,农业基础地位任问时候都不能被忽视和削弱.种子是农业的“芯片”,确保粮食安全,必须攥紧种子“芯片”,某农科院的专家为了丁解新培育的甲,乙两种种子出芽后麦苗的长势情况,从种植有甲、乙两种种子的两块试验田中各取株麦苗测量株高,得到的数据用茎叶图表示如下(单位:),中间一列的数字表示株高的十位数,两边的数字表示株高的个位数.
甲
乙
9
0
8
0
1
1
1
1
4
3
0
1
0
2
2
(1)求甲种麦苗株高的中位数和众数;
(2)分别计算两组数据的平均数和方差,并由此判断甲、乙两种麦菌株高的差异性.
11.“累积净化量(CCM)”是空气净化器质量的一个重要衡量指标,它是指空气净化器从开始使用到净化效率为时对颗粒物的累积净化量,以克表示.根据GB/T18801-2015《空气净化器》国家标准,对空气净化器的累计净化量(CCM)有如下等级划分:
累积净化量(克)
以上
等级
为了了解一批空气净化器(共台)的质量,随机抽取台机器作为样本进行估计,已知这台机器的累积净化量都分布在区间中.按照,,,,均匀分组,其中累积净化量在的所有数据有:,,,,和,并绘制了如图所示频率分布直方图:
(1)求的值及频率分布直方图中的值;
(2)以样本估计总体,试估计这批空气净化器(共台)中等级为的空气净化器有多少台?
12.从某校随机抽取名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布和频率分布直方图:
组号
1
2
3
4
5
6
7
8
9
合计
分组
频数
6
8
17
22
25
12
6
2
2
100
(1)求频率分布直方图中的、的值;
(2)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于小时的频率;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的名学生该周课外阅读时间的平均数.
高阶突破
1.已知10个样本数据的平均值为10,方差为6,则这10个数据的分位数的最大值为( )
A.11 B.12 C.13 D.14
2.已知互不相等的数据,,,,,,的平均数为,方差为,数据,,,,,的方差为,则( )
A. B.
C. D.与的大小关系无法判断
3.已知5名篮球运动员在某场比赛中的得分均为个位数,且平均数、中位数和极差均为6,则当方差取最大值时,这组得分的第60百分位数是( )
A.6 B.6.5 C.7 D.7.5
4.已知一组数据,其中位数为,平均数为,极差为,方差为.现从中删去某一个数,得到一组新数据,其中位数为,平均数为,极差为,方差为,则下列说法不正确的是( )
A.若删去3,则 B.若删去9,则
C.无论删去哪个数,均有 D.若,则
5.(多选)每年4月23日为“世界读书日”,某小学为鼓励学生进行课外阅读,拓宽学生眼界,对热爱课外阅读的班级进行表彰,规定从班级中随机抽取5位同学,统计他们一学年内阅读课外书籍的本数,若抽取的5位同学在一学年内阅读课外书籍的本数都不低于10,则该班级被评选为“优阅班级”.以下是4个班级抽取的5位同学的统计数据:
六(1)班:中位数为11,众数为10 六(2)班:众数为12,极差为3
六(3)班:平均数为12,极差为3 六(4)班:平均数为12,方差为2
根据以上信息,一定被评为“优阅班级”的是( )
A.六(1)班 B.六(2)班 C.六(3)班 D.六(4)班
6.(多选)有互不相同的7个样本数据,去掉第25百分位数和最大的数后组成一组新数据,则新数据与原数据相比( )
A.平均数可能变小 B.中位数变大
C.极差不变 D.方差可能变小
7.(多选)掷骰子5次,分别记录每次骰子出现的点数,下列统计情况中,可能有出现过点数1的有( )
A.平均数为4,中位数为5 B.平均数为4,众数为3
C.平均数为4,方差为1.6 D.平均数为5,标准差为2
8.(多选)某校有男生人,女生人,且男生身高的均值为,方差为,女生身高的均值为,方差为,全体学生身高均值和方差分别为,,则下列说法一定正确的是()
A.若,则 B.若,则
C.若,则 D.若,则
2
学科网(北京)股份有限公司
$$2024-2025学年高一数学考点剖析及分层精练(人教A版2019必修第二册)
第18讲 用样本估计总体
学习目标:
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性;
2.结合实例,能用样本估计百分位数,理解百分位数的统计含义;
3.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数)、离散程度参数(标准差、方差、极差),理解集中趋势参数和离散程度参数的统计含义.
重点难点:
重点:1.掌握频率分布表、频率分布直方图的制作步骤;
2.用平均数、中位数和众数对数据的集中趋势进行描述,利用频率颁布直方图估计总体的众数、中位数和平均数;
难点:1.能通过样本的频率分布估计总体的频率分布;
2.学会数据分析的方法,理解总体集中趋势的估计思路并学会运用;
一、频率分布直方图
1.画频率分布直方图的步骤
第1步:求极差(即一组数据中最大值与最小值的差); 第2步:决定组距与组数;
第3步:将数据分组; 第4步:列频率分布表;
第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
二、数字特征
①众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
②极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
③性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
三、百分位数
1.定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2.计算一组几个数据第p百分位数的步骤
第1步,按从小到大排列原始数据;
第2步,计算.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
考点01 频率分布直方图的绘制与应用
1.为了了解学校质量监测成绩,现随机抽取该校200名学生的成绩作为样本进行分析,并绘制频率分布直方图,若该频率分布直方图的组距为10,且样本中成绩在区间这一组内的学生有40人,则在频率分布直方图中该组数据对应的矩形高度为( )
A.0.02 B.0.2 C.0.04 D.0.4
【答案】A
【详解】由题意成绩在区间内学生的频率为,因此,
故选:A
2.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为的样本,其频率直方图如图所示,其中支出在[20,30)内的同学有10人,则的值为 .
【答案】
【详解】
由频率直方图可得,支出在内的频率为,
所以有
故答案为:.
3.为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压(单位:kPa)的分组区间为,.将其按从左到右的顺序分别编号为第一组,第二组,,第五组,下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数是( ).
A.8 B.12
C.16 D.18
【答案】B
【详解】由直方图可得第一组与第二组的频率之和为,第一组和第二组共有20人,
所以样本容量为,所以第三组的人数为人,
第三组中没有疗效的有6人,则第三组有疗效的有12人.
故选:B.
4.为了了解某地区高三学生的身体发育情况,随机抽查了该地区100名年龄为17.5~18岁的男生体重(kg),得到频率分布直方图如图所示,根据该图可得这100名男生中体重在的人数为
【答案】40
【详解】由频率分布直方图得,体重在的频率为,
所求人数为.
故答案为:40.
5.为弘扬中华传统文化,某校组织若干名学生参加汉字听写大赛,为了解学生整体听写能力,从中抽取部分学生的成绩(得分取正整数,满分为100分)进行统计分析,请根据尚未完成的下列图表,解答问题:
分组
49.5~59.5
59.5~69.5
69.5~79.5
79.5~89.5
89.5~100.5
频数
2
a
20
16
8
频率
0.04
0.08
0.40
0.32
b
(1)本次抽样调查的样本容量为_______,此样本中成绩的中位数落在_______范围内.表中_______,_______;
(2)补全频数分布直方图;
(3)若该校共有初中生3000名,若成绩超过80分为优秀,请估计该校汉字听写能力为优秀的约有多少人.
【答案】(1)50,,,
(2)频率直方图见解析
(3)
【详解】(1)学生总数是:(人),(人),;
∴本次抽样调查的样本容量为50,成绩的中位数落在范围内,(人),;
(2)根据(1)得出的a的值,补图如下:
(3)(人).
该校汉字听写能力为优秀的约有人.
考点02 统计图的分析
6.中国人口亿人口中肠胃病患者高达亿,慢性胃炎发病率高达,消化性溃疡病发率也高达,是全世界当之无愧的“胃病大国”.根据随机对名青少年随机抽查,的青少年表示自己患有胃病,的青少年不清楚自己是否患有胃病,只有明确自己没有胃病.肠胃病的严重程度,一般可体现在排便量、排便时长上. 某高中为了了解学生肠胃病占比和严重程度,对年高一高二学生单日单次的排便时长进行了统计(记排便分钟内为正常,排便分钟为轻度肠胃病,排便分钟以上为重度肠胃病),并将结果制成统计图(如图所示),若高一学生人,高二学生人,占比百分数均保留整数,下列说法正确的是( )
A.高二学生的肠胃病人数比高一年级少
B.高一年级的各肠胃病区间人数占比都比高二年级少
C.高一年级重度肠胃病人数占比比高二年级少
D.高一肠胃质量参数比高二高(肠胃质量参数)
【答案】C
【详解】由扇形统计图可得高一年级肠胃病人数为,
高一年级的轻度肠胃病人数占比,
高一年级重度肠胃病人数占比为,
高一肠胃质量参数为,
由条形统计图可得高二年级肠胃病人数为,
高二年级的轻度肠胃病人数占比为,
高二年级重度肠胃病人数占比为,
高二肠胃质量参数为,
所以高二学生的肠胃病人数比高一年级多,A错误;
高一年级轻度肠胃病区间人数占比比高二年级高,B错误;
高一年级重度肠胃病人数占比比高二年级少,C正确;
高一肠胃质量参数比高二低,D错误;
故选:C.
7.(多选)为了解某企业员工的学习情况,对该企业员工进行问卷调查,已知他们的得分都处在A,B,C,D四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占,则下列结论错误的是( )
A.男、女员工得分在A区间的占比相同
B.在各得分区间男员工的人数都多于女员工的人数
C.得分在C区间的员工最多
D.得分在D区间的员工占总人数的19%
【答案】BC
【详解】根据题意,设员工总人数为,因为女员工人数为(人),
所以,解得,
所以男员工人数为(人),
对于A,女员工得分在区间的占比为,男员工得分在区间的占比为,故A正确;
对于B,由题图1可知,女员工在区间有20人,区间有60人,区间有70人,区间有50人,
男员工在区间有(人),区间有(人),区间有(人),区间有(人),所以区间男员工少于女员工,故B错误;
对于C,区间有(人),区间有(人),所以区间人数比C区间多,故C错误;
对于D,区间有(人),所以得分在区间的员工占总人数的,故D正确.
故选:BC.
8.(多选)近年来中国冰雪产业快速发展,冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领户外用品行业市场进一步增长.下面是2015年至2021年中国雪场滑雪人次(单位:万人次)与同比增长率的统计图,则下面结论中正确的是( )
A.2015年至2021年,中国雪场滑雪人次逐年增加
B.2016年至2018年,中国雪场滑雪人次和同比增长率均逐年增加
C.2021年与2016年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人数也近似相等
D.2021年与2019年相比,中国雪场滑雪人次增长率约为
【答案】ABD
【详解】对于A:由统计图可知,2015年至2021年,中国雪场滑雪人次逐年增加,故A正确;
对于B:由统计图可知2016年至2018年,中国雪场滑雪人次和同比增长率均逐年增加,故B正确;
对于C:2021年与2016年相比,中国雪场滑雪人次的同比增长率近似相等,
2021年同比增长人数为,2016年同比增长人数为,
显然不近似相等,故C错误;
对于D:2021年与2019年相比,中国雪场滑雪人次增长率为,故D正确.
故选:ABD
9.(多选)某企业2024年12个月的收入与支出数据的折线图如图所示.
已知:利润=收入-支出,根据该折线图,下列说法正确的是( )
A.该企业2024年1月至6月的总利润低于2024年7月至12月的总利润
B.该企业2024年第一季度的利润约是60万元
C.该企业2024年4月至7月的月利润持续增长
D.该企业2024年11月份的月利润最大
【答案】AC
【详解】对于A,由企业2024年12个月的收入与支出数据的折线图,得该企业2024年1月至6月的总利润约为
(万元),
该企业2024年7月至12月的总利润约为(万元),
所以该企业2024年1月至6月的总利润低于2024年7月至12月的总利润,故A正确;
对于B,该企业2024年第一季度的利润约是(万元),故B错误;
对于C,该企业2024年4月至7月的月利润(单位:万元)分别为10,28,30,52,所以该企业2024年4月至7月的月利润持续增长,故C正确;
对于D,该企业2024年7月和8月的月利润比11月份的月利润大,故D错误.
故选:AC.
10.(多选)某校秋季运动会中两班的各个单项得分(满分5分,分值高者为优)的雷达图如图所示,则下列说法正确的是( )
A.在200米项目中,班的得分比班的得分高
B.在铅球项目中,班的得分比班的得分高
C.在跳高项目中,班的得分比班的得分高
D.班的总分比班的总分高
【答案】ACD
【详解】对于A,在200米项目中,班的得分为4分,班的得分为3分,A正确;
对于B,在铅球项目中,班的得分为3分,班的得分为4分,班得分比班低,B错误;
对于C,在跳高项目中,班的得分为4分,班的得分为3分,C正确;
对于D,班的总分为(分),
班的总分为(分),即班的总分比班的总分高,D正确.
故选:ACD
考点03 总体百分位数的估计
11.已知一组数据的平均数为16,则这组数据的第65百分位数为( )
A.17 B.16.5 C.16 D.15.5
【答案】A
【详解】由数据的平均数为16,可得,可得,
将这组数据从小到大排列,可得,
因为,所以这组数据的第65百分位数为.
故选:A.
12.某水产单位对其投放的网箱产量(单位:kg)进行了样本统计,得到样本数据的频率分布直方图如下图所示,请根据频率分布直方图估计该水产单位所有网箱产量的72%分位数为 kg.
【答案】49
【详解】设分位数为,
因为,,
所以分位数在区间上,
则,解得.
故答案为:49.
13.某次期中考试随机抽取了12名同学的数学成绩作为样本,分别是53,59,61,62,67,75,77,80,82,86,90,93.则这组数据的60百分位数为 .
【答案】80
【详解】由,所以组数据的第60百分位数为80.
故答案为:80
14.如图所示是一样本的频率分布直方图,样本数据共分3组,分别为.估计该样本数据的第60百分位数是 .
【答案】14
【详解】由题图知,数据落在区间上的频率为,
数据落在区间上的频率为,
所以第百分位数是.
故答案为:.
15.某水产单位对其投放的网箱产量(单位:)进行了样本统计,得到样本数据的频率分布直方图如下图所示,请根据频率分布直方图估计该水产单位所有网箱产量的上四分位数为 .
【答案】49.375
【详解】上四分位数即为分位数,网箱产量在的频率分别为,
因此分位数,由,解得49.375,
所以所有网箱产量的上四分位数为49.375.
故答案为:49.375
考点04 频率直方图中的平均数、众数、中位数
16.某人工智能公司为优化新开发的语言模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,图中,则下列结论不正确的是( )
A. B.满意度计分的众数约为75分
C.满意度计分的平均分约为79分 D.满意度计分的第一四分位数约为70分
【答案】C
【详解】对于A,由频率分布直方图可得,
又,解得,故A正确;
对于B,由频率分布直方图可得,满意度计分的众数为最高矩形底边中点横坐标75分,故B正确;
对于C,满意度计分的平均分约为,故C错误;
对于D,前两组的频率之和为,所以满意度计分的第一四分位数约为70分,故D正确.
故选:C
17.为了调查某厂工人生产某种产品的能力,随机抽查了40名工人某天生产该产品的数量,得到频率分布直方图如图所示.
(1)求频率分布直方图中的值.
(2)求这40名工人一天生产该产品的数量的众数,中位数和平均数.
【答案】(1)
(2)60,62.5,64
【详解】(1)解:由频率分别直方图的性质,可得,
解得.
(2)解:由频率分布直方图,可得众数为,
设中位数为,则,解得,所以中位数为,
这40名工人一天生产该产品的数量的平均数为:,
所以这40名工人一天生产该产品的数量的平均数为.
18.(多选)某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:
分组
频率
0.25
0.30
0.20
0.25
则下列关于高一年级学生每周体育锻炼时长的说法正确的是( )
A.众数约为2.5 B.中位数约为3.83 C.平均数为3.95 D.第80百分位数约为5.2
【答案】BCD
【详解】对于A,根据频率分布表可得,高一年级学生每周体育锻炼时长的众数约为,故A错误;
对于B,设高一年级学生每周体育锻炼时长的中位数为x,则,解得,故B正确;
对于C,高一年级学生每周体育锻炼时长的平均数为,故C正确;
对于D,因为,
所以高一年级学生每周体育锻炼时长的第80百分位数约为,故D正确.
故选:BCD
19.(多选)某校100名学生学业水平测试数学成绩的频率分布直方图如图所示,已知所有学生成绩均在区间内,则( )
A.图中的值为0.005
B.这组数据的平均数为73
C.这组数据的众数为75
D.这组数据的中位数约为71.7
【答案】ABD
【详解】对于A,由频率分布图可知:,解得,故A正确;
对于B,由频率分布图可知:,故B正确;
对于C,由频率分布图可知众数为65,故C错误;
对于D,设这组数据的中位数约为,因为,,
所以中位数在区间内,则,解得,故D正确;
故选:ABD.
20.(多选)为弘扬中华优秀传统文化,树立正确的价值导向,落实立德树人的根本任务,某校组织全体高一年级学生进行古典诗词知识测试,从中随机抽取100名学生,记录他们的分数,整理得到频率分布直方图如图(各组区间除最后一组为闭区间外,其余各组均为左闭右开区间),则以下说法正确的是( )
A.
B.估计此次测试学生分数的众数为95
C.估计此次测试学生分数的中位数为90
D.估计此次测试学生分数的下四分位数为85
【答案】BD
【详解】对于A,由得,所以A错误;
对于B,因众数是频率分布直方图中最高矩形的底边中点的横坐标,故众数是95,B正确;
对于C,由于90左边的频率是0.35,所以C错误;
对于D,由第25百分位数就是下四分位数,又85左边的频率是0.25,所以D正确.
故选:BD.
考点05 标准差、方差的计算
21.若一组样本数据的平均数为2,方差为4,则样本数据的平均数与方差分别为( )
A.3,4 B.2,4 C.3, D.2,
【答案】D
【详解】样本数据的平均数,
因为,
所以样本数据的方差.
故选:D.
22.已知,两组数据,其中:2,3,4,5,6;:11,,13,14,12;组数据的方差为 ,若,两组数据的方差相同,试写出一个值 .
【答案】 2 10或15
【详解】组的平均数,
组的平均数,
则组的方差为
,
则组的方差为
,
解得或15.
故答案为:2;10或15.
23.(多选)某次演唱比赛结束后,10个评委为选手评分,恰好原始评分为9.1到10.0(公差为0.1的等差数列),按照规则要求去掉最高分和最低分,那么( )
A.去掉最高分和最低分之前,评分的80百分位数为9.8
B.去掉最高分和最低分之前,评分的80百分位数为9.3
C.去掉最高分和最低分之后,方差相比原先减小
D.去掉最高分和最低分之后,极差相比原先减小
【答案】CD
【详解】原始得分为,
由得80百分位数为,AB错误;
去掉最高分和最低分之前,平均数,
方差,
去掉最高分和最低分之后,平均数,
方差,
所以方差减小,C正确;
去掉最高分和最低分之前,极差,
去掉最高分和最低分之后,极差,
所以极差变小,D正确.
故选:CD.
24.甲、乙两地10月1日至7日每天最低气温(单位:℃)如下:
日
日
日
日
日
日
日
甲地
乙地
记这天甲地每天最低气温的标准差为;记这天乙地每天最低气温的标准差为.根据上述信息,若,则值可以为 .(写出一个符合题意答案即可)
【答案】(答案不唯一)
【详解】,
,
,
则
,
化简得,解得或,
故值可以为或.
故答案为:.(答案不唯一)
25.(多选)一组数据,,,,满足,若去掉,后组成一组新数据,则新数据与原数据相比( )
A.极差变小 B.平均数变大 C.方差变小 D.第25百分位数变小
【答案】AC
【详解】由于,故,
A选项,原来极差为,去掉,后,极差为,极差变小,A正确;
B选项,原来的平均数为,
去掉,后的平均数为,平均数不变,B错误;
C选项,原来的方差为,
去掉,后的方差为,方差变小,C正确;
D选项,,从小到大排列,选第3个数作为第25百分位数,即,
去掉,后,,故从小到大排列,选择第2个数和第3个数的平均数作为第25百分位数,
即,由于,第25百分位数变大,D错误.
故选:AC
考点06 平均数、标准差、方差的性质
26.有一组样本数据,其平均数为,方差为,若样本数据,的平均数为,方差为,则( )
A. B.
C. D.
【答案】C
【详解】根据样本数据平均数公式可知,,方差.
故选:C
27.若一组数据的中位数为9,方差为36,则另一组数据的中位数为 ,方差为 .
【答案】 2 4
【详解】因为数据的中位数为9,方差为36,
所以数据的中位数为3,方差为,
所以数据的中位数为,方差为4.
故答案为:2;4.
28.若甲组样本数据(数据各不相同)的平均数为5,乙组样本数据的平均数为12,则下列说法错误的是( )
A.
B.乙组样本数据的方差是甲组样本数据方差的9倍
C.两组样本数据的中位数可能相等
D.两组样本数据的极差可能相等
【答案】D
【详解】A.设甲组样本数据的平均数为,则乙组样本数据的平均数为,
由,得,A正确.
B. 乙组样本数据的方差是甲组样本数据方差的倍,B正确.
C.设甲组样本数据的中位数为,则乙组样本数据的中位数为,
由得,,故两组样本数据的中位数可能相等,C正确.
D.不妨设,则甲组数据的极差为,乙组数据的极差为,
∵甲组数据各不相同,∴两组样本数据的极差不相等,D错误.
故选:D.
29.已知一组数,,,的平均数是3,方差为4,则数据,,,的平均数和方差分别是( )
A.7,8 B.7,16 C.6,8 D.6,16
【答案】B
【详解】由题意,,.
所以,,,的平均数
,
方差.
故选:B.
30.(多选)已知甲组样本数据,由这组数据得到乙组样本数据,其中,则( )
A.乙组样本数据的极差是甲组样本数据极差的2倍
B.乙组样本数据的中位数是甲组样本数据中位数的2倍
C.乙组样本数据的平均数是甲组样本数据平均数的2倍
D.乙组样本数据的标准差是甲组样本数据标准差的2倍
【答案】AD
【详解】A选项,甲组数据的极差为,则乙组样本数据的极差是,
乙组样本数据的极差是甲组样本数据极差的2倍,故A正确;
B选项,设甲组数据的中位数为,则乙组数据的中位数为,故B错误;
C选项,设甲组数据的平均数为,则乙组数据的平均数为,故C错误;
D选项,甲组数据的标准差为,则乙组数据的标准差为,故D正确.
故选:AD.
考点07 利用分层方差求总体方差
31.某班级有30名男生和20名女生,现调查学生周末在家学习时长(单位:小时),得到男生样本数据的平均值为8,方差为2,女生样本数据的平均值为10.5,方差为0.75,则该班级全体学生周末在家学习时长的平均值和方差的值分别是( )
A. B.
C. D.
【答案】D
【详解】,
故选:D
32.运动员在平时训练时通常会将自己的训练成绩记录下来,以此评估自己的训练成果.小明记录了他在2月份的8次训练成绩和3月份的12次训练成绩.通过计算,他发现2月份的训练成绩平均值为72,方差为4.2;3月份的训练成绩平均值为75,方差为6.1.则他在这两个月的20次训练的方差为 .
【答案】7.5
【详解】这两个月的20次训练的平均数为,
故这两个月的20次训练的方差为
.
故答案为:7.5
33.在对某中学高三年级学生体重(单位:kg)的调查中,按男、女生人数比例用分层随机抽样的方法抽取部分学生进行测量,已知抽取的男生有50人,其体重的平均数和方差分别为54,20,抽取的女生有40人,其体重的平均数和方差分别为45,11,则估计该校高三年级学生体重的方差为 .
【答案】36
【详解】由分层随机抽样样本平均数公式可得,
根据分层随机抽样样本方差公式.
故答案为:36.
34.某校有学生500人,其中男生320人,女生180人.某人想了解该校全体学生的身高(单位:cm)信息,从男生、女生中分别随机抽取人进行测量.如果已知男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03,但原始测量数据已丢失.设总体均值与方差分别为与,则下列说法正确的是( ).
A.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
B.若,无法算出总样本的均值与方差
C.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
D.若,无法算出总样本的均值与方差
【答案】C
【详解】由于男生、女生总人数不相等,需要用分层抽样的方式估计出样本的均值和方差,
此时所得样本特征可作为总体特征的估计值,故不合适、合适,A、D错,C对;
在情况下,只有所有男生、女生身高都在各自身高均值附近波动且幅度很小时,可以算出总样本的均值与方差,B错;
故选:C.
35.某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据;
抽取次序
1
2
3
4
5
6
7
8
9
10
身高
155
158
156
157
160
161
159
162
169
163
记抽取的第个女生的身高为,样本平均数,方差.
参考数据:,,.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在范围内的人数;
(2)用总样本平均数和标准差分别估计该校高一学生总体身高的平均数和标准差,求,的值.
【答案】(1)40
(2)
【详解】(1)因女生样本中,身高在范围内的占比为,
故该校高一女生身高在范围内的人数估计为.
(2)记总样本的平均数为,标准差为,
由题意,设男生样本(20人)的身高平均数为,方差为,
女生样本(10人)的身高平均数为,方差,
则,
,
故.
基础试炼
1.居民消费价格指数(Consumer Price Index,简称CPI),是度量一定时期内居民消费商品和服务价格水平总体变动情况的相对数,综合反映居民消费商品和服务价格水平的变动趋势和变动程度.下图是2024年11月9日国家统计局公布的2024年10月各类商品及服务价格同比和环比涨跌幅情况(同比,环比),下列结论正确的是( )
A.2024年10月份食品烟酒类价格低于2023年10月份食品烟酒类价格
B.2024年10月份教育文化娱乐类价格低于2024年9月份教育文化娱乐类价格
C.2024年9月份医疗保健类价格高于2023年10月份医疗保健类价格
D.2024年9月份居住类价格高于2023年10月份居住类价格
【答案】C
【详解】对于A,由题可知,2024年10月份食品烟酒类价格同比涨幅为,
所以2024年10月份食品烟酒类价格高于2023年10月份食品烟酒类价格,故A错误;
对于B,由图可知,2024年10月份教育文化娱乐类价格环比涨幅为,
所以2024年10月份教育文化娱乐类价格高于2024年9月份教育文化娱乐类价格,故B错误;
对于C,2024年10月份医疗保健类价格环比涨幅为,即2024年10月份医疗保健类价格等于2024年9月份医疗保健类价格,
又2024年10月份医疗保健类价格同比涨幅为,
所以2024年10月份医疗保健类价格高于2023年10月份医疗保健类价格,故C正确;
对于D,2024年10月份居住类价格环比涨幅为,即2024年10月份居住类价格等于2024年9月份居住类价格,
又2024年10月份居住类价格同比涨幅为,
所以2024年10月份居住类价格低于2023年10月份居住类价格,故D错误.
故选:C.
2.某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是( )
A.4 B.5
C.8 D.10
【答案】B
【详解】设从左到右前3个小组的频率分别为x,2x,3x,第5小组的频数是y,
则,解得.
故选:B.
3.为了了解我校报考飞行员的学生的体重情况,将所得的数据整理后,作出频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为,且第1小组的频数为6,则报考飞行员的学生总人数是( )
A.48 B.60 C.72 D.76
【答案】A
【详解】设第一小组的频率为,则,
解得,
故总人数为,
故选:A.
4.某科研团队对某产品的一项新功能进行了8次测试,将不合格、合格、良、优的结果分别用0,1,2,3标记,若8次测试结果中有3次不合格、3次合格、1次良、1次优,则对于标记后的数据,下列结论正确的是( )
A.75%分位数为1 B.平均数为1.2
C.方差为1 D.极差为4
【答案】C
【详解】将8次测试结果标记后得到数据0,0,0,1,1,1,2,3,
对于A:因为,所以数据的75%分位数为:,故A错误;
对于B:平均数为,故B错误;
对于C:方差为,故C正确;
对于D:极差为,故D错误.
故选:C
5.建设“书香校园”成为越来越多学校的办学追求.在对某高中1000名高一年级学生的图书馆借阅量的调查中,已知这1000名高一年级学生中男生有600人,采用分层随机抽样的方法抽取100人,抽取的样本中男生借阅量的平均数和方差分别为5和6,女生借阅量的平均数和方差分别为10和6,则估计该校学生借阅量的总体方差是( )
A.7 B.8 C.12 D.13
【答案】C
【详解】名高一学生,男生人,则女生人,
所以抽取的人中,男生人,女生人,
总体平均数为,
所以总体方差为.
故选:C
6.(多选)人工智能是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学.很多学校已经推出基于的人工智能通识课程,帮助学生深入了解人工智能的历史、关键技术及其在科学研究、社会发展中的高效应用,培养跨学科思维,推动人工智能技术在多领域的深度融合与创新.某探究小组利用解答了50份高考模拟试卷,收集其准确率,整理得到如下频率分布直方图,则下列说法正确的是( )
A.
B.估计准确率的分位数为
C.估计准确率的平均数为
D.估计准确率的中位数为
【答案】ABD
【详解】对于A选项,由频率分布直方图可得,解得,A对;
对于B选项,前两个矩形的面积之和为,
所以估计准确率的分位数为,B对;
对于C选项,估计准确率的平均数为,C错;
对于D选项,设中位数为,前三个矩形的面积之和为,
所以,则,解得,
所以估计准确率的中位数为,D对.
故选:ABD.
7.已知一组数据,,,,的平均数为,则的值是 ,该组数据的方差是 .
【答案】 /
【详解】由已知得,,得,
则这5个数据为,
则方差.
故答案为:;.
8.某高三年级组采用随机抽样的方式抽取了20名学生在某次数学周测中解答填空压轴题的时间记录如下表:
解答时间/分钟
频数
2
8
8
2
根据上表数据估计这20名学生解答时间的平均值为 ,中位数为 .
【答案】 10 10
【详解】.
因为解答时间位于区间的频率为,所以解答时间的中位数为10,
故答案为10,10.
9.将某大型出版公司所有打字员每分钟的平均打字数统计如图所示,则可以估计该公司打字员每分钟的平均打字数的中位数为 .
【答案】360
【详解】第一个矩形面积为,
第二个矩形面积为:,
前两个个面积和为:,
第三个矩形面积为:,
所以中位数为:,
故答案为:360
10.“仓廪实,天下安”,对我们这样一个有着亿人口的大国来说,农业基础地位任问时候都不能被忽视和削弱.种子是农业的“芯片”,确保粮食安全,必须攥紧种子“芯片”,某农科院的专家为了丁解新培育的甲,乙两种种子出芽后麦苗的长势情况,从种植有甲、乙两种种子的两块试验田中各取株麦苗测量株高,得到的数据用茎叶图表示如下(单位:),中间一列的数字表示株高的十位数,两边的数字表示株高的个位数.
甲
乙
9
0
8
0
1
1
1
1
4
3
0
1
0
2
2
(1)求甲种麦苗株高的中位数和众数;
(2)分别计算两组数据的平均数和方差,并由此判断甲、乙两种麦菌株高的差异性.
【答案】(1)中位数为,众数为
(2)答案见解析
【详解】(1)甲种麦苗株高由小到大依次为:、、、、、,
中位数为,众数为.
(2)甲种麦苗株高的平均数为,
方差为,
乙种麦苗株高由小到大依次为:、、、、、,
乙种麦苗株高的平均数为,
方差为,
所以,,,
所以乙麦苗普遍长得高,但是高低质量差异明显.
11.“累积净化量(CCM)”是空气净化器质量的一个重要衡量指标,它是指空气净化器从开始使用到净化效率为时对颗粒物的累积净化量,以克表示.根据GB/T18801-2015《空气净化器》国家标准,对空气净化器的累计净化量(CCM)有如下等级划分:
累积净化量(克)
以上
等级
为了了解一批空气净化器(共台)的质量,随机抽取台机器作为样本进行估计,已知这台机器的累积净化量都分布在区间中.按照,,,,均匀分组,其中累积净化量在的所有数据有:,,,,和,并绘制了如图所示频率分布直方图:
(1)求的值及频率分布直方图中的值;
(2)以样本估计总体,试估计这批空气净化器(共台)中等级为的空气净化器有多少台?
【答案】(1),
(2)台
【详解】(1)因为之间的数据一共有个,
再由频率分布直方图可知:落在之间的频率为,
因此,,
又,
;
(2)由频率分布直方图可知:落在之间共:(台)
又因为在之间共台,
落在之间共台,
所以(台).
故这批空气净化器等级为的空气净化器共有台.
12.从某校随机抽取名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布和频率分布直方图:
组号
1
2
3
4
5
6
7
8
9
合计
分组
频数
6
8
17
22
25
12
6
2
2
100
(1)求频率分布直方图中的、的值;
(2)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于小时的频率;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的名学生该周课外阅读时间的平均数.
【答案】(1),
(2)
(3)(小时)
【详解】(1)由频率分布直方图和表格中的数据可得,解得,,解得.
(2)由频数分布表可知,从该校随机选取一名学生,这名学生课外阅读时间少于小时的频率为.
(3)由题意,样本中的名学生的学生该周课外阅读时间的平均数为
(小时).
高阶突破
1.已知10个样本数据的平均值为10,方差为6,则这10个数据的分位数的最大值为( )
A.11 B.12 C.13 D.14
【答案】C
【详解】设这10个样本数据分别为,且.
因为,所以这10个数据的分位数为.
设的平均值为,方差为,的平均值为,方差为,
由题意知,则;
,
所以,整理得,解得,
所以,
当且仅当时等号成立,
即,时,取到最大值13.
故选:C.
2.已知互不相等的数据,,,,,,的平均数为,方差为,数据,,,,,的方差为,则( )
A. B.
C. D.与的大小关系无法判断
【答案】C
【详解】根据已知条件第一组数据的个数为个,且,
所以,
,
第二组数据的个数为个,且平均数,
,
因为,
所以.
故选:C
3.已知5名篮球运动员在某场比赛中的得分均为个位数,且平均数、中位数和极差均为6,则当方差取最大值时,这组得分的第60百分位数是( )
A.6 B.6.5 C.7 D.7.5
【答案】D
【详解】因为这组得分的中位数和极差均为6,
可设这组得分从小到大分别为,
因为平均数为6,可得
又因为,,所以,所以,
所以,故.
当时,这组得分分别为2,6,6,8,8.
方差:
当时,要使方差最大,则取最小值3,取最大值9,这组得分分别为3,3,6,9,9,
方差: ,
此时方差最大.
又由,所以方差最大时的这组得分的第60百分位数是6和9的平均数7.5.
故选:D.
4.已知一组数据,其中位数为,平均数为,极差为,方差为.现从中删去某一个数,得到一组新数据,其中位数为,平均数为,极差为,方差为,则下列说法不正确的是( )
A.若删去3,则 B.若删去9,则
C.无论删去哪个数,均有 D.若,则
【答案】B
【详解】对于A,若删去3,根据中位数的定义得,故满足,故A正确
对于B,若删去9,根据平均数的定义得,
,故B错误,
对于C,根据极差的定义,若去掉的数是中的一个,
显然去掉前后极差都是,满足,若去掉1,,
若去掉9,.综上,,故C正确.
对于D,原数据平均数,去掉一个数后平均数保持不变,
即,则剩下的四个数之和为,显然去掉的数只能是5,
由方差的定义得,,
,满足,故D正确.
故选:B
5.(多选)每年4月23日为“世界读书日”,某小学为鼓励学生进行课外阅读,拓宽学生眼界,对热爱课外阅读的班级进行表彰,规定从班级中随机抽取5位同学,统计他们一学年内阅读课外书籍的本数,若抽取的5位同学在一学年内阅读课外书籍的本数都不低于10,则该班级被评选为“优阅班级”.以下是4个班级抽取的5位同学的统计数据:
六(1)班:中位数为11,众数为10 六(2)班:众数为12,极差为3
六(3)班:平均数为12,极差为3 六(4)班:平均数为12,方差为2
根据以上信息,一定被评为“优阅班级”的是( )
A.六(1)班 B.六(2)班 C.六(3)班 D.六(4)班
【答案】ACD
【详解】对于A,设六(1)班的这5为同学的阅读课外书籍的本数为(自左向右按照从小到大顺序),
因为中位数为11,则,又众数为10,则,
所以该班级一定被评为“优阅班级”,故A正确;
对于B,举反例,如六(2)班这5为同学的阅读课外书籍的本数为,
满足众数为12,极差为3,故B错误;
对于C,设六(3)班的这5为同学的阅读课外书籍的本数为(自左向右按照从小到大顺序),
由平均数,极差为3,即,
若,则,解得,这与矛盾,故,故C正确;
对于D,设六(4)班的这5为同学的阅读课外书籍的本数为(自左向右按照从小到大顺序),
设平均数,方差,
则,
,
若,则,与上式不符,不合题意,
若,由,则,上式不成立,不合题意,
所以,故D正确.
故选:ACD.
6.(多选)有互不相同的7个样本数据,去掉第25百分位数和最大的数后组成一组新数据,则新数据与原数据相比( )
A.平均数可能变小 B.中位数变大
C.极差不变 D.方差可能变小
【答案】AD
【详解】设7个数由小到大分别为a,b,c,d,e,f,g,则第25百分位数为b,
所以去掉第25百分位数和最大的数后5个数由小到大为a,c,d,e,f,
原中位数为d,现中位数为d,故B错,原极差为,现极差为,故C错.
设这7个数从小到大依次为1,2,3,4,5,6,7,
对于A,其平均数为,
去掉2和7后,余下5个数的平均数为:,故A正确;
对于D,其方差为:,
同理,去掉2和7后,余下5个数的方差为:
,故D正确.
故选:AD.
7.(多选)掷骰子5次,分别记录每次骰子出现的点数,下列统计情况中,可能有出现过点数1的有( )
A.平均数为4,中位数为5 B.平均数为4,众数为3
C.平均数为4,方差为1.6 D.平均数为5,标准差为2
【答案】AD
【详解】对于A,有可能出现点数1,例如:1,4,5,5,5.故A正确;
对于B,因为众数为3,则点数3至少出现2次,如果点数1出现1次,那么剩下的2次都取最大点数6,平均数还是小于4 ,所以不可能出现过点数1,故B错误;
对于C,平均数为4,如果出现点数1,则,即方差不可能为1.6,所以不可能出现过点数1,故C错误;
对于D,有可能出现点数1,例如:1,6,6,6,6. 故D正确.
故选:AD.
8.(多选)某校有男生人,女生人,且男生身高的均值为,方差为,女生身高的均值为,方差为,全体学生身高均值和方差分别为,,则下列说法一定正确的是()
A.若,则 B.若,则
C.若,则 D.若,则
【答案】ABD
【详解】选项A:若,则全体均值,A正确;
选项若,则,B正确;
选项C:因为
当时,由A选项可知
代入上式可得,若,可能(例如时),C不成立;
选项D:当时,由B可知,代入上式并化简可得
因为恒成立,故D正确.
故选:ABD.
2
学科网(北京)股份有限公司
$$