内容正文:
9.1随机抽样与9.2用样本估计总体(人教2019A版专用)
目录
【知识回顾】 2
【基础训练】 6
【提升训练】 13
【培优训练】 19
知识回顾
1. 全面调查与抽样调查
统计的相关概念
(1)全面调查
对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
(2)总体、个体
在一个调查中,我们把调查对象的全体称为总体.组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.
(3)抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.
(4)样本、样本量
我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.
2. 简单随机抽样
放回简单随机抽样
不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本
如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,把这样的抽样方法叫做放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,把这样的抽样方法叫做不放回简单随机抽样
简单随机抽样:放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,简单随机抽样获得的样本称为简单随机样本
3. 简单随机抽样的方法
(1)抽签法
先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.
(2)随机数法
先把总体中的个体编号,用随机数工具产生总体范围内的整数随机数,把产生的随机数作为抽中的编号,并剔除重复的编号,直到抽足样本所需要的个体数.
4. 用样本的平均数估计总体的平均数
总体均值和样本均值
(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则==Yi为总体均值,又称总体平均数.
(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式=fiYi.
(3)样本均值:如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称==yi为样本均值,又称样本平均数.
5. 分层随机抽样
分层随机抽样的相关概念
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
6. 用分层随机抽样的平均数估计总体的平均数
如果总体分为2层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为,,两层的总体平均数分别为,,总体平均数为,样本平均数为,则=+,=+_.
7. 获取数据的基本途径
获取数据的基本途径
适用类型
注意问题
通过调查获取数据
对于有限总体问题,一般通过抽样调查或普查的方法获取数据
要充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误
通过试验获取数据
没有现存的数据可以查询
严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察获取数据
自然现象
借助专业测量设备通过长久的持续观察获取数据
通过查询获得数据
众多专家研究过,其收集的数据有所存储
必须根据问题背景知识“清洗”数据,去伪存真
8. 画频率分布直方图的步骤
(1)求极差:极差是一组数据中最大值与最小值的差.
(2)决定组距与组数:当样本容量不超过100时,常分成5~12组,一般取等长组距,并且组距应力求“取整”.
(3)将数据分组:分组时,第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值,分组区间一般是“前闭后开”.
(4)列频率分布表:一般分四列,即分组、频数、频率、.其中频数合计应是样本容量,频率合计是1.
(5)画频率分布直方图:横轴表示样本数据,纵轴表示.小长方形的面积=组距×=频率.各小长方形的面积和等于1.
9. 统计图表
统计图表
主要应用
扇形图
直观描述各类数据占总数的比例
条形图和直方图
直观描述不同类别或分组数据的频数和频率
折线图
描述数据随时间的变化趋势
10. 总体百分位数的估计
(1)总体百分位数的估计
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步:按从小到大排列原始数据.
第2步:计算i=n×p%.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据,若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3)四分位数
25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.
11. 众数、中位数和平均数的定义
众数、中位数和平均数的定义
(1)众数:一组数据中出现次数最多的数.
(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.
(3)平均数:如果n个数为x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
12. 频率分布直方图中的众数、中位数、平均数
(1)单峰频率分布直方图中的平均数与中位数
①如果直方图是对称的,那么平均数与中位数大体上该差不多.
②如果直方图在右边“拖尾”,那么平均数大于中位数.
③如果直方图在左边“拖尾”,那么平均数小于中位数,也就是说,和中位数相比,平均数总是在“长尾巴”那边.
(2)在频率分布直方图中,众数是最高矩形底边中点的横坐标,中位数左边和右边的直方图的面积应该相等,样本平均数的估计值等于频率分布直方图中每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
13. 总体离散程度的估计
(1)总体方差和标准差
①总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=(Yi-)2为总体方差,S=为总体标准差.
②总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2.
(2)样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2=(yi-)2为样本方差,s=为样本标准差.
(3)标准差的意义
标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
基础训练
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(23-24高二下·上海·阶段练习)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为( )
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
A.14 B.08 C.09 D.06
2.(23-24高一下·吉林·期末)某纺织厂4月份生产了三种类型的纱线,分别为大卷纱线、中卷纱线和小卷纱线,其中大卷纱线有2000卷,中卷纱线有8000卷,小卷纱线有20000卷.为检查该纺织厂4月份生产的这三种类型纱线的质量,按比例用分层随机抽样的方法从中抽检240卷,则被抽检的小卷纱线有( )
A.120卷 B.150卷 C.160卷 D.200卷
3.(2023高二上·甘肃·学业考试)下图为某地区2010至2022年地方财政预算内收入、城乡居民储蓄年末余额折线图,根据该折线图可知,该地区2010年至2022年( )
A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势
B.财政预算内收入、城乡居民储蓄年末余额年增长速度相同
C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量
D.城乡居民储蓄年末余额与财政预算内收入差额逐年增大
4.(2024·辽宁·模拟预测)某高中2023年的高考考生人数是2022年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2022年和2023年高考分数达线情况,得到如图所示扇形统计图:
下列结论正确的是( )
A.该校2023年与2022年的本科达线人数比为6:5
B.该校2023年与2022年的专科达线人数比为6:7
C.2023年该校本科达线人数比2022年该校本科达线人数增加了80%
D.2023年该校不上线的人数有所减少
5.(23-24高一下·湖南长沙·阶段练习)某校举行“勇士杯”学生篮球比赛,统计高一年级部分班级的得分数据如下:
班级
1
2
3
4
5
6
7
8
得分
28
34
34
30
26
28
28
32
则下列说法正确的是( )
A.得分的众数为34
B.得分的中位数为28
C.得分的75%分位数为33
D.得分的极差为6
6.(23-24高一下·天津河北·期末)某市6月1日至14日的空气质量指数变化趋势如图所示,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,下列说法中不正确的是( )
A.该市14天空气质量指数的中位数为78.5
B.该市14天空气质量指数的第30百分位数为55
C.该市14天空气质量指数的平均值大于100
D.计算连续3天空气质量指数的方差,其中6日到8日的方差最大
7.(23-24高一下·陕西咸阳·阶段练习)在某学校开展的“防电信诈骗知识竞赛”活动中,高三年级部派出甲、乙、丙、丁四个小组参赛,每个小组各有10位选手.记录参赛人员失分(均为非负整数)情况,若小组的每位选手失分都不超过7分,则该组为“优秀小组”,已知选手失分数据信息如下,则一定为“优秀小组”的是( )
A.甲组中位数为3,极差为5 B.乙组平均数为2,众数为2
C.丙组平均数为2,方差为3 D.丁组平均数为2,第85百分位数为7
8.(21-22高二·全国·课后作业)某地区发生公共卫生事件期间,如果以“连续7天每天新增感染人数不超过5”作为未发生大规模感染的判断指标,那么根据连续7天的新增感染人数计算,下列各数据中,一定符合上述指标的是( )
①平均数.
②标准差.
③平均数且标准差.
④平均数且极差小于或等于2.
⑤众数等于1且极差小于或等于4.
A.①② B.③④ C.③④⑤ D.④⑤
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(23-24高一上·陕西汉中·期末)为了了解参加运动会的1000名运动员的年龄情况,从中抽取了10名运动员的年龄进行统计分析.下列说法中正确的有( )
A.1000名运动员的年龄是总体 B.所抽取的10名运动员是一个样本
C.样本容量为10 D.每个运动员被抽到的机会相等
10.(23-24高一下·四川德阳·阶段练习)某学校对高一学生选科情况进行了统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总数为800
B.该校高一学生中选考物化政组合的人数为96
C.该校高一学生中选考物理的人数比选考历史的人数多
D.用比例分配的分层随机抽样方法从该校高一学生抽取20人,则生史地组合抽取6人
11.(2024高一下·全国·专题练习)某电影艺术中心为了解短视频平台的观众年龄分布情况,向各大短视频平台的观众发放了线上调查问卷,共回收有效问卷4000份,根据所得信息制作了如图所示的频率分布直方图,则下列说法正确的是( )
A.a=0.028
B.在4 000份有效问卷中,短视频观众年龄在10~20岁的有1 320人
C.估计短视频观众的平均年龄为32岁
D.估计短视频观众年龄的75%分位数为39岁
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(21-22高二·全国·课后作业)一名交警在高速公路上随机观测了6辆车的行驶速度(单位:km/h),然后做了一份报告,结果如下表.
车序号
1
2
3
4
5
6
速度
66
65
71
54
69
58
(1)交警采取的是 (选填“普查”或“抽样调查”);
(2)这次调查的总体是 ,样本是 .
13.(23-24高二上·江西南昌·期末)记样本、、…、的平均数为,样本、、…、的平均数为().若样本、、…、、、、…、的平均数为,则的值为 .
14.(2024高一下·江苏·专题练习)水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级抽取的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (2024高一下·全国·专题练习)判断下列抽取样本的方式是否属于简单随机抽样?
(1)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
(2)从20件玩具中一次性抽取3件进行质量检验;
(3)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛;
(4)环保人员在上游取河水进行化验,了解河流的污染状况;
(5)从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编号).
16. (15分) (2024高一下·全国·专题练习)某校高一某班的某次数学测试成绩(满分100分,单位:分)如下:56,58,62,63,63,65,66,68,69,71,72,72,73,74,75,76,77,78,79, ,90,95,由于保存不利,其中内的成绩被墨水覆盖.根据该数据绘制的频率分布直方图(如图)也被墨水覆盖了部分区域.
(1)求成绩在区间内的频率及抽样人数;
(2)求成绩在区间内的频数,并计算频率分布直方图中区间对应的小长方形的高.
17. (15分) (23-24高二上·湖北孝感·阶段练习)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的第75百分位数;
(3)已知落在的平均成绩是56,方差是7,落在的平均成绩为65,方差是4,求两组成绩的总平均数和总方差.
18. (17分) (23-24高一下·湖北武汉·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的一种流行的营销形式.某直播平台1200个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图所示.
(1)该直播平台为了更好地服务买卖双方,打算随机抽取60个直播商家进行问询交流.如果按照比例分层抽样的方式抽取,则应抽取小吃类、生鲜类商家各多少家?
(2)在问询了解直播商家的利润状况时,工作人员对(1)中抽取的60个商家的平均日利润进行了统计(单位:元),所得频率分布直方图如右图所示,请根据频率分布直方图计算下面的问题:
①估计该直播平台商家平均日利润的中位数与平均数(结果保留一位小数,求平均数时同一组中的数据用该组区间的中点值作代表);
②若将平均日利润超过430元的商家评为“优秀商家”,估计该直播平台“优秀商家”的个数.
19. (17分) (23-24高一下·黑龙江哈尔滨·阶段练习)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的第75百分位数;
(3)已知落在的平均成绩是57,方差是7,落在的平均成绩为69,方差是4,求两组成绩的总平均数和总方差.
提升训练
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(23-24高二上·江西·开学考试)年夏天,国产动画电影《长安三万里》热映,点燃“唐诗热”,为此某市电视台准备在该电视台举办的“我爱背唐诗”前三届参加总决赛的名选手(假设每位选手只参加其中一届总决赛)中随机抽取名参加一个唐诗交流会,若按前三届参加总决赛的人数比例分层随机抽样,则第一届抽取人,若按性别比例分层随机抽样,则女选手抽取人,则下列结论错误的是( )
A.是样本容量 B.第二届与第三届参加总决赛的选手共有人
C.名选手中男选手有人 D.第一届参加总决赛的女选手最多有人
2.(23-24高一下·海南省直辖县级单位·期中)如图是某校高一年级1000名男生体检时身高的频率分布直方图,现用分层随机抽样的方法从身高在160~175cm的男生中抽取130名,则抽取到的身高在165~170cm的人数为( )
A.20 B.30 C.40 D.50
3.(2024·陕西安康·模拟预测)演讲比赛中,12位评委对小李的演讲打出了如下的分数:
9.3
8.8
8.9
9.0
8.9
9.0
9.1
8.7
9.2
9.0
9.1
9.2
若去掉两个最高分,两个最低分,则剩下8个分数的平均数为( )
A.9.075 B.9.05 C.9.025 D.9
4.(23-24高一下·吉林通化·阶段练习)2024年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
5.(23-24高一下·山西忻州·阶段练习)2016年至2023年我国原油进口数量如图所示:
下列结论正确的是( )
A.2016年至2023年我国原油进口数量逐年增加
B.2016年至2023年我国原油进口数量的极差为16138万吨
C.2016年至2023年我国原油进口数是的分位数为54239万吨
D.2015年我国原油进口数量少于30000万吨
6.(23-24高一下·河南·阶段练习)已知样本数据的平均数为,样本数据的平均数为,若样本数据的平均数为,则( )
A.12 B.10 C.2 D.11
7.(23-24高一下·福建福州·期末)图为某地2014年至2023年的粮食年产量折线图,则下列说法错误的是( )
A.这10年粮食年产量的极差为16
B.这10年粮食年产量的第70百分位数为35
C.这10年粮食年产量的平均数为33.7
D.前5年的粮食年产量的方差小于后5年粮食年产量的方差
8.(22-23高三下·安徽亳州·开学考试)现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2024高一下·全国·专题练习)下列抽取样本的方式不属于简单随机抽样的是( )
A.从无限多个个体中抽取100个个体作为样本
B.箱子里共有100个零件,从中取出5个零件进行质量检验.在抽样操作过程中,从中任意拿出一个零件进行质量检验后再把它放回箱子里,然后再抽取下一个零件进行质量检验
C.从30件玩具中,逐个抽取4件进行质量检验
D.某班有45名同学,指定身高最高的5名同学参加学校组织的排球赛
10.(22-23高一下·广西南宁·期末)(多选)某学校为了解同学们某天上学的交通方式,在高一年级开展了随机调查,将学生某天上学的交通方式归为四类:A一家人接送,B一乘坐地铁,C一乘坐公交,D一其他方式,学校把收集到的数据整理绘制成条形图和扇形图,如图只给出了其中部分信息,根据图中信息,下列说法正确的是( )
A.若该校高一年级有学生1300人,则高一年级约有780人乘坐公共交通工具上学
B.估计该校高一年级有的学生某天家人接送上学
C.扇形图中B的占比为40%
D.估计该校学生上学交通方式为乘坐地铁或者其他方式的人数占全校学生的一半
11.(2024·湖北·模拟预测)设一组样本数据满足,则( )
A.拿走,这组数据的方差变大 B.拿走,这组数据的方差变大
C.拿走,这组数据的方差减小 D.拿走,这组数据的方差减小
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(23-24高三上·广东梅州·期中)某中学为了了解初中部学生的某项行为规范的养成情况,在校门口每分钟随机抽取一名学生,登记佩戴了胸卡的学生的名字,结果在名学生中有名学生佩戴胸卡.学校调查了初中部的所有学生,发现有名学生佩戴胸卡.则估计该中学初中部共有 名学生.
13.(2024高三下·全国·专题练习)为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为 .
14.(21-22高一·全国·课后作业)在分层抽样时,如果将总体分为k层,第j层抽取的样本量为,第j层的样本平均数为,样本方差为,,.记,则所有数据的样本方差为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (22-23高一·全国·随堂练习)为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
16. (15分) (23-24高一下·河南·阶段练习)已知某工厂一区生产车间与二区生产车间均生产某种型号的零件,这两个生产车间生产的该种型号的零件尺寸的频率分布直方图如图所示(每组区间均为左开右闭).
尺寸大于的零件用于大型机器中,尺寸小于或等于的零件用于小型机器中.
(1)若,试分别估计该工厂一区生产车间生产的500个该种型号的零件和二区生产车间生产的500个该种型号的零件用于大型机器中的零件个数.
(2)若,现有足够多的来自一区生产车间与二区生产车间的零件,分别用于大型机器、小型机器各5000台的生产,每台机器仅使用一个该种型号的零件.
方案一:直接将一区生产车间生产的零件用于大型机器中,其中用了尺寸小于或等于的零件的大型机器每台会使得工厂损失200元;直接将二区生产车间生产的零件用于小型机器中,其中用了尺寸大于的零件的小型机器每台会使得工厂损失100元.
方案二:重新测量一区生产车间与二区生产车间生产的零件尺寸,并正确匹配型号,重新测量的总费用为35万元.
请写出采用方案一,工厂损失费用的估计值(单位:万元)的表达式,并从工厂损失的角度考虑,选择合理的方案.
17. (15分) (23-24高一下·浙江丽水·期末)某中学为了调查高一年级学生劳动实践活动情况,对名学生某周的劳动时间统计如下:
周劳动时间(小时)
人数
20
80
140
200
60
(1)根据提供的数据,直接在答题卡中补充完整周劳动时间的频率分布直方图(用阴影填涂,不需要书写具体步骤);
(2)求周劳动时间的平均数(同一组数据用该组区间的中点值为代表);
(3)根据图表,估计周劳动时间的样本数据分位数.
18. (17分) (21-22高三·云南昆明·阶段练习)《中国制造2025》是中国实施制造强国战略第一个十年的行动纲领,制造业是国民经济的主体,是立国之本、兴国之器、强国之基.发展制造业的基本方针为质量为先,坚持把质量作为建设制造强国的生命线某电子产品制造企业为了提升生产效率,对现有的一条电子产品生产线进行技术升级改造,为了分析改造的效果,该企业质检人员从该条生产线所生产的电子产品中随机抽取了1000件,检测产品的某项质量指标值,根据检测数据得到下表(单位:件).
质量指标值
产品
60
100
160
300
200
100
80
(1)估计这组样本的质量指标值的平均数和方差(同一组中的数据用该组区间中点值作代表);
(2)设表示不大于x的最大整数,表示不小于x的最小整数,s精确到个位,,,,根据检验标准,技术升级改造后,若质量指标值有落在内,则可以判断技术改造后的产品质量初级稳定;若有落在内,则可以判断技术改造后的产品质量稳定,可认为生产线技术改造成功.请问:根据样本数据估计,是否可以判定生产线的技术改造是成功的?
19. (17分) (21-22高二上·广东湛江·期中)某市为了了解人们对“中国梦”的伟大构想的认知程度,针对本市不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(95分及以上为认知程度高),结果认知程度高的有20人,按年龄分成5组,其中第一组:,第二组:,第三组:,第四组:,第五组:,得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计这20人的平均年龄和第80百分位数;
(2)若第四组宣传使者的年龄的平均数与方差分别为37和,第五组宣传使者的年龄的平均数与方差分别为43和1,求这20人中35~45岁所有人的年龄的方差.
培优训练
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(2024·四川成都·模拟预测)用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A., B.,
C., D.,
2.(2024·黑龙江哈尔滨·模拟预测)在哈尔滨市2024年第一次市模考试中,三所学校高三年级的参考人数分别为、.现按比例分层抽样的方法从三个学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为,则三所学校学生数学成绩的总平均数约为( )
A.101 B.100 C.99 D.98
3.(2024·陕西西安·模拟预测)国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(居民消费水平)( )
A.2018年至2022年我国居民消费水平逐年提高
B.2018年至2022年我国城镇居民消费水平逐年提高
C.2018年至2022年我国居民消费水平数据的极差为6463元
D.2022年我国城镇人口数比农村人口数的1.5倍还要多
4.(23-24高一下·贵州铜仁·期中)年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
5.(2024·天津·二模)为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为( )
A.89.09 B.86.52 C.84.55 D.81.32
6.(23-24高三下·天津南开·阶段练习)某校举办了数学知识竞赛,并将1000名学生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则以下四个说法正确的个数为( )
①a的值为0.005
②估计这组数据的众数为75
③估计这组数据的下四分位数为60
④估计成绩高于80分的有300人
A.1 B.2 C.3 D.4
7.(23-24高一下·湖北武汉·期末)在某次比赛中运动员五轮的成绩互不相等,记为,平均数为,若随机删去其中一轮的成绩,得到一组新数据,记为,平均数为,下面说法正确的是( )
A.新数据的极差不可能等于原数据的极差
B.新数据的中位数可能等于原数据的中位数
C.若,则新数据的方差一定小于原数据方差
D.若,则新数据的第40百分位数一定大于原数据的第40百分位数
8.(23-24高二下·安徽·阶段练习)在一组数3,3,8,11,28中插入两个整数,,使得新的一组数极差为原来极差的两倍,且众数和中位数保持不变,则的最大值为( )
A.57 B.58 C.60 D.61
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2024·河北·二模)如图为“苍松迎客快餐店”两种类型的套餐在2024年前3个月的销售情况统计图,已知套餐卖出一份盈利20元,套餐卖出一份盈利10元.图中点的纵坐标分别表示套餐2024年前3个月的销售量,点的纵坐标分别表示套餐2024年前3个月的销售量.根据图中信息,下列结论中正确的是( )
A.2月两种套饏的总销售量最多
B.3月两种套餐的总销售量最多
C.1月两种套餐的总利润最多
D.2月两种套餐的总利润最多
10.(23-24高一下·海南省直辖县级单位·阶段练习)下列说法正确的是( )
A.用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体被抽到的概率是0.1
B.数据的平均数为90,方差为3;数据的平均数为85,方差为5,则的平均数为87,方差为10.2
C.数据的第70百分位数是23
D.已知数据的极差为6,方差为2,则数据的极差和方差分别为12,8
11.(21-22高一上·全国·课后作业)(多选题)某高校大一新生中,来自东部地区的学生有2 400人、中部地区的学生有1 600人、西部地区的学生有1 000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列判断正确的有( )
A.用分层抽样的方法分别抽取东部地区学生48人、中部地区学生32人、西部地区学生20人
B.用简单随机抽样的方法从新生中选出100人最适合
C.西部地区学生小刘被选中的可能性为
D.中部地区学生小张被选中的可能性为
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(21-22高一上·全国·课后作业)某省有关部门要求各中小学要把“每天锻炼一小时”写入课程表,为了响应这一号召,某校围绕着“你最喜欢的体育活动项目是什么?(只写一项)”的问题,对在校学生进行了随机抽样调查,从而得到一组数据.图1是根据这组数据绘制的条形统计图.由条形统计图可知本次抽样调查中,最喜欢篮球活动的占被调查人数的百分比是 ,若该校九年级共有200名学生,图2是根据各年级学生人数占全校学生总人数的百分比绘制的扇形统计图,则全校学生中最喜欢跳绳活动的人数估计为 .
13.(23-24高三上·上海宝山·期末)在某次比赛中运动员五轮的成绩互不相等,记为,平均数为,若随机删去其中一轮的成绩,得到一组新数据,记为,平均数为,下面说法正确的是 .(写出所有正确选项)
①新数据的极差可能等于原数据的极差.
②新数据的中位数可能等于原数据的中位数.
③若,则新数据的方差一定大于原数据方差.
④若,则新数据的第40百分位数一定大于原数据的第40百分位数.
14.(23-24高三上·河南·阶段练习)商场为改进服务质量,提升顾客购物体验,从2023年第三季度消费过的顾客中随机抽取部分人进行满意度问卷调查.并将这部分人满意度的得分分成以下6组:,统计结果如图所示.那么该商场顾客满意度得分的第60百分位数为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (23-24高一下·河北邢台·阶段练习)已知某高速服务区餐厅的窗口有四类:①自选快餐,平均每份取餐时长为1分钟;②商务套餐,平均每份取餐时长为0.5分钟;③现炒现做,平均每份取餐时长为5分钟;④自动售货机,平均每份取餐时长为1分钟.已知该高速服务区餐厅的取餐窗口(每台自动售货机按1个取餐窗口计算)一共有18个,就餐高峰期时有400名消费者在等待就餐.为了提高消费者的用餐满意度,该高速服务区工作人员选取了100名用餐的消费者进行问卷调查,其中有50人选择了自选快餐,30人选择了商务套餐,15人选择了现炒现做,5人选择了自动售货机.(注:为了方便计算,若某消费者选择两类或多类就餐类别,则按该消费者的主要就餐类别归类,每名消费者只统计为其中一类).
(1)根据以上的调查统计,用样本估计总体,如果设置10个自选快餐窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类取餐的窗口前队伍长度各自相等),试问选择自选快餐的消费者最长等待时长是多少分钟?
(2)根据以上的调查数据统计,用样本估计总体,从等待时长和公平的角度上考虑,要求每个队伍的最长等待时长大致相等,应如何设置各类取餐窗口数(结果采用四舍五入法保留整数)?并说明理由.
16. (15分) (23-24高一下·湖北武汉·期末)随着社会的进步、科技的发展,人民对自己生活的环境要求越来越高,尤其是居住环境的环保和绿化受到每一位市民的关注,因此,2019年6月25日,生活垃圾分类制度入法,提倡每位居民做好垃圾分类储存、分类投放,方便工作人员依分类搬运,提高垃圾的资源价值和经济价值,力争物尽其用.某市环卫局在A、B两个小区分别随机抽取6户,进行生活垃圾分类调研工作,依据住户情况对近期一周(7天)进行生活垃圾分类占用时间统计如下表:
住户编号
1
2
3
4
5
6
A小区(分钟)
220
185
220
225
205
235
B小区(分钟)
205
195
245
235
225
215
(1)分别计算小区每周进行生活垃圾分类所用时间的平均值和方差;以及两个小区抽取的一共12户每周进行生活垃圾分类所用时间的平均值和方差;
(2)如果两个小区住户均按照1000户计算,小区的垃圾也要按照垃圾分类搬运,市环卫局与两个小区物业及住户协商,初步实施下列方案:
①小区方案:号召住户生活垃圾分类“从我做起”,为了利国利民,每200位住户至少需要一名工作人员进行检查和纠错生活垃圾分类,每位工作人员月工资按照3000元(按照28天计算标准)计算,则每位住户每月至少需要承担的生活垃圾分类费是多少?
②小区方案:为了方便住户,住户只需要将垃圾堆放在垃圾点,物业让专职人员进行生活垃圾分类,一位专职工作人员对生活垃圾分类的效果相当于5位普通居民对生活垃圾分类效果,每位专职工作人员(每天工作8小时)月工资按照4000元(按照28天计算标准)计算,则每位住户每月至少需要承担的生活垃圾分类费是多少?
(3)市环卫局与两个小区物业及住户协商分别试行一个月,根据实施情况,试分析哪个方案惠民力度大,值得进行推广?
17. (15分) (23-24高一下·江苏连云港·期末)为了调查疫情期间数学网课学习情况,某校组织了高一年级学生进行了数学测试.根据测试成绩(总分100分),将所得数据按照分成6组,其频率分布直方图如图所示.
(1)求图中a的值;为了更全面地了解疫情对网课的影响,求该样本的60百分位数;
(2)试估计本次数学测试成绩的平均分;(同一组中的数据用该组区间的中点值作代表);
(3)该校准备对本次数学测试成绩优异(将成绩从高到低排列,排在前的为优异)的学生进行嘉奖,则受嘉奖的学生分数不低于多少?
18. (17分) (23-24高一下·广西贺州·阶段练习)某棉纺厂为了了解一批棉花的质量,随机抽查了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),将所得到的数据分成7组:,,,,,,(棉花纤维的长度均在内),绘制得到如图所示的频率分布直方图.
(1)求的值,并估计棉花纤维的长度的众数和平均数(同一组数据用该区间的中点值作为代表);
(2)估计棉花纤维的长度的75%分位数.
19. (17分) (22-23高一下·吉林长春·阶段练习)某城市户居民的月平均用电量单位:度,以,,,分组的频率分布直方图如图.
(1)求直方图中的值;
(2)在这户居民中,月平均用电量不低于度的有多少户?
(3)在月平均用电量为,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?
2 / 2
学科网(北京)股份有限公司
$$
9.1随机抽样与9.2用样本估计总体(人教2019A版专用)
目录
【知识回顾】 2
【基础训练】 6
【提升训练】 20
【培优训练】 36
知识回顾
1. 全面调查与抽样调查
统计的相关概念
(1)全面调查
对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
(2)总体、个体
在一个调查中,我们把调查对象的全体称为总体.组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.
(3)抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.
(4)样本、样本量
我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.
2. 简单随机抽样
放回简单随机抽样
不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本
如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,把这样的抽样方法叫做放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,把这样的抽样方法叫做不放回简单随机抽样
简单随机抽样:放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,简单随机抽样获得的样本称为简单随机样本
3. 简单随机抽样的方法
(1)抽签法
先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.
(2)随机数法
先把总体中的个体编号,用随机数工具产生总体范围内的整数随机数,把产生的随机数作为抽中的编号,并剔除重复的编号,直到抽足样本所需要的个体数.
4. 用样本的平均数估计总体的平均数
总体均值和样本均值
(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则==Yi为总体均值,又称总体平均数.
(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式=fiYi.
(3)样本均值:如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称==yi为样本均值,又称样本平均数.
5. 分层随机抽样
分层随机抽样的相关概念
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
6. 用分层随机抽样的平均数估计总体的平均数
如果总体分为2层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为,,两层的总体平均数分别为,,总体平均数为,样本平均数为,则=+,=+_.
7. 获取数据的基本途径
获取数据的基本途径
适用类型
注意问题
通过调查获取数据
对于有限总体问题,一般通过抽样调查或普查的方法获取数据
要充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误
通过试验获取数据
没有现存的数据可以查询
严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察获取数据
自然现象
借助专业测量设备通过长久的持续观察获取数据
通过查询获得数据
众多专家研究过,其收集的数据有所存储
必须根据问题背景知识“清洗”数据,去伪存真
8. 画频率分布直方图的步骤
(1)求极差:极差是一组数据中最大值与最小值的差.
(2)决定组距与组数:当样本容量不超过100时,常分成5~12组,一般取等长组距,并且组距应力求“取整”.
(3)将数据分组:分组时,第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值,分组区间一般是“前闭后开”.
(4)列频率分布表:一般分四列,即分组、频数、频率、.其中频数合计应是样本容量,频率合计是1.
(5)画频率分布直方图:横轴表示样本数据,纵轴表示.小长方形的面积=组距×=频率.各小长方形的面积和等于1.
9. 统计图表
统计图表
主要应用
扇形图
直观描述各类数据占总数的比例
条形图和直方图
直观描述不同类别或分组数据的频数和频率
折线图
描述数据随时间的变化趋势
10. 总体百分位数的估计
(1)总体百分位数的估计
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步:按从小到大排列原始数据.
第2步:计算i=n×p%.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据,若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3)四分位数
25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.
11. 众数、中位数和平均数的定义
众数、中位数和平均数的定义
(1)众数:一组数据中出现次数最多的数.
(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.
(3)平均数:如果n个数为x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
12. 频率分布直方图中的众数、中位数、平均数
(1)单峰频率分布直方图中的平均数与中位数
①如果直方图是对称的,那么平均数与中位数大体上该差不多.
②如果直方图在右边“拖尾”,那么平均数大于中位数.
③如果直方图在左边“拖尾”,那么平均数小于中位数,也就是说,和中位数相比,平均数总是在“长尾巴”那边.
(2)在频率分布直方图中,众数是最高矩形底边中点的横坐标,中位数左边和右边的直方图的面积应该相等,样本平均数的估计值等于频率分布直方图中每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
13. 总体离散程度的估计
(1)总体方差和标准差
①总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=(Yi-)2为总体方差,S=为总体标准差.
②总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2.
(2)样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2=(yi-)2为样本方差,s=为样本标准差.
(3)标准差的意义
标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
基础训练
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(23-24高二下·上海·阶段练习)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为( )
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
A.14 B.08 C.09 D.06
2.(23-24高一下·吉林·期末)某纺织厂4月份生产了三种类型的纱线,分别为大卷纱线、中卷纱线和小卷纱线,其中大卷纱线有2000卷,中卷纱线有8000卷,小卷纱线有20000卷.为检查该纺织厂4月份生产的这三种类型纱线的质量,按比例用分层随机抽样的方法从中抽检240卷,则被抽检的小卷纱线有( )
A.120卷 B.150卷 C.160卷 D.200卷
3.(2023高二上·甘肃·学业考试)下图为某地区2010至2022年地方财政预算内收入、城乡居民储蓄年末余额折线图,根据该折线图可知,该地区2010年至2022年( )
A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势
B.财政预算内收入、城乡居民储蓄年末余额年增长速度相同
C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量
D.城乡居民储蓄年末余额与财政预算内收入差额逐年增大
4.(2024·辽宁·模拟预测)某高中2023年的高考考生人数是2022年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2022年和2023年高考分数达线情况,得到如图所示扇形统计图:
下列结论正确的是( )
A.该校2023年与2022年的本科达线人数比为6:5
B.该校2023年与2022年的专科达线人数比为6:7
C.2023年该校本科达线人数比2022年该校本科达线人数增加了80%
D.2023年该校不上线的人数有所减少
5.(23-24高一下·湖南长沙·阶段练习)某校举行“勇士杯”学生篮球比赛,统计高一年级部分班级的得分数据如下:
班级
1
2
3
4
5
6
7
8
得分
28
34
34
30
26
28
28
32
则下列说法正确的是( )
A.得分的众数为34
B.得分的中位数为28
C.得分的75%分位数为33
D.得分的极差为6
6.(23-24高一下·天津河北·期末)某市6月1日至14日的空气质量指数变化趋势如图所示,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,下列说法中不正确的是( )
A.该市14天空气质量指数的中位数为78.5
B.该市14天空气质量指数的第30百分位数为55
C.该市14天空气质量指数的平均值大于100
D.计算连续3天空气质量指数的方差,其中6日到8日的方差最大
7.(23-24高一下·陕西咸阳·阶段练习)在某学校开展的“防电信诈骗知识竞赛”活动中,高三年级部派出甲、乙、丙、丁四个小组参赛,每个小组各有10位选手.记录参赛人员失分(均为非负整数)情况,若小组的每位选手失分都不超过7分,则该组为“优秀小组”,已知选手失分数据信息如下,则一定为“优秀小组”的是( )
A.甲组中位数为3,极差为5 B.乙组平均数为2,众数为2
C.丙组平均数为2,方差为3 D.丁组平均数为2,第85百分位数为7
8.(21-22高二·全国·课后作业)某地区发生公共卫生事件期间,如果以“连续7天每天新增感染人数不超过5”作为未发生大规模感染的判断指标,那么根据连续7天的新增感染人数计算,下列各数据中,一定符合上述指标的是( )
①平均数.
②标准差.
③平均数且标准差.
④平均数且极差小于或等于2.
⑤众数等于1且极差小于或等于4.
A.①② B.③④ C.③④⑤ D.④⑤
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(23-24高一上·陕西汉中·期末)为了了解参加运动会的1000名运动员的年龄情况,从中抽取了10名运动员的年龄进行统计分析.下列说法中正确的有( )
A.1000名运动员的年龄是总体 B.所抽取的10名运动员是一个样本
C.样本容量为10 D.每个运动员被抽到的机会相等
10.(23-24高一下·四川德阳·阶段练习)某学校对高一学生选科情况进行了统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总数为800
B.该校高一学生中选考物化政组合的人数为96
C.该校高一学生中选考物理的人数比选考历史的人数多
D.用比例分配的分层随机抽样方法从该校高一学生抽取20人,则生史地组合抽取6人
11.(2024高一下·全国·专题练习)某电影艺术中心为了解短视频平台的观众年龄分布情况,向各大短视频平台的观众发放了线上调查问卷,共回收有效问卷4000份,根据所得信息制作了如图所示的频率分布直方图,则下列说法正确的是( )
A.a=0.028
B.在4 000份有效问卷中,短视频观众年龄在10~20岁的有1 320人
C.估计短视频观众的平均年龄为32岁
D.估计短视频观众年龄的75%分位数为39岁
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(21-22高二·全国·课后作业)一名交警在高速公路上随机观测了6辆车的行驶速度(单位:km/h),然后做了一份报告,结果如下表.
车序号
1
2
3
4
5
6
速度
66
65
71
54
69
58
(1)交警采取的是 (选填“普查”或“抽样调查”);
(2)这次调查的总体是 ,样本是 .
13.(23-24高二上·江西南昌·期末)记样本、、…、的平均数为,样本、、…、的平均数为().若样本、、…、、、、…、的平均数为,则的值为 .
14.(2024高一下·江苏·专题练习)水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级抽取的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (2024高一下·全国·专题练习)判断下列抽取样本的方式是否属于简单随机抽样?
(1)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
(2)从20件玩具中一次性抽取3件进行质量检验;
(3)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛;
(4)环保人员在上游取河水进行化验,了解河流的污染状况;
(5)从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编号).
16. (15分) (2024高一下·全国·专题练习)某校高一某班的某次数学测试成绩(满分100分,单位:分)如下:56,58,62,63,63,65,66,68,69,71,72,72,73,74,75,76,77,78,79, ,90,95,由于保存不利,其中内的成绩被墨水覆盖.根据该数据绘制的频率分布直方图(如图)也被墨水覆盖了部分区域.
(1)求成绩在区间内的频率及抽样人数;
(2)求成绩在区间内的频数,并计算频率分布直方图中区间对应的小长方形的高.
17. (15分) (23-24高二上·湖北孝感·阶段练习)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的第75百分位数;
(3)已知落在的平均成绩是56,方差是7,落在的平均成绩为65,方差是4,求两组成绩的总平均数和总方差.
18. (17分) (23-24高一下·湖北武汉·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的一种流行的营销形式.某直播平台1200个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图所示.
(1)该直播平台为了更好地服务买卖双方,打算随机抽取60个直播商家进行问询交流.如果按照比例分层抽样的方式抽取,则应抽取小吃类、生鲜类商家各多少家?
(2)在问询了解直播商家的利润状况时,工作人员对(1)中抽取的60个商家的平均日利润进行了统计(单位:元),所得频率分布直方图如右图所示,请根据频率分布直方图计算下面的问题:
①估计该直播平台商家平均日利润的中位数与平均数(结果保留一位小数,求平均数时同一组中的数据用该组区间的中点值作代表);
②若将平均日利润超过430元的商家评为“优秀商家”,估计该直播平台“优秀商家”的个数.
19. (17分) (23-24高一下·黑龙江哈尔滨·阶段练习)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的第75百分位数;
(3)已知落在的平均成绩是57,方差是7,落在的平均成绩为69,方差是4,求两组成绩的总平均数和总方差.
参考答案:
1.A
【分析】根据随机数表法的读取规则,即可求解.
【详解】依次选出的编号为:01,17,09,08,06,14;
则选出来的第6支水笔的编号为14.
故选:A.
2.C
【分析】利用分层抽样的意义列式计算即得.
【详解】依题意,被抽检的小卷纱线有(卷).
故选:C
3.D
【分析】根据折线图,观察图象的变化情况,逐项分析即可得出答案.
【详解】由图可以看出前三年财政预算内收入增长趋势不明显,无法确定,故A错误;
图中两曲线间隔越来越大,说明年增长速度不同,差额逐年增大,故B错误,D正确;
又从图中可以看出财政预算内收入年平均增长量应该小于城乡居民储蓄年末余额年平均增长量,故C错误.
故选:D.
4.C
【分析】设2022年的高考人数为100,则2023年的高考人数为150,再根据扇形统计图中各个种类的人数所占的比例,逐个选项判断即可.
【详解】不妨设2022年的高考人数为100,则2023年的高考人数为150,
2022年本科达线人数为50,2023年本科达线人数为90,
2023年与2022年的本科达线人数比为9:5,
本科达线人数增加了,故A错误,C正确;
2022年专科达线人数为35,2023年专科达线人数为45,
2023年与2022年的专科达线人数比为9:7,故B错误;
2022年不上线人数为15,2023年不上线人数也是15,不上线的人数无变化,故D错误.
故选:C.
5.C
【分析】将数据从小到大重新排列,由众数、中位数、百分位数的定义计算即可得C正确,再根据极差的概念可得D错误.
【详解】根据表格中数据可知,出现次数最多的是28,所以得分的众数为28,即A错误;
将8个数据从小到大排列为26,28,28,28,30,32,34,34,
所以中位数为,可知B错误;
易知为整数,所以第75%分位数为第6个和第7个数的平均值,即C正确;
得分的极差为,即D错误.
故选:C
6.C
【分析】由平均数、中位数、百分位数和方差的概念即可得出答案.
【详解】对于A,将14天的空气质量指数由小到大排列为:
,
所以该市14天空气质量指数的中位数为:,故A正确.
对于B:因为,所以该市14天空气质量指数的百分位数为,故B正确;
对于C:,
该市14天空气质量指数的平均值小于100,故C错误;
对于D:因为连续3天空气质量指数,6日到8日的波动最大,也即方差最大,故D正确.
故选:C.
7.C
【分析】A选项,假设有选手失8分,根据极差得到最低失分为3分,中位数为3,故A错误;C选项,根据方差得到,若有选手失8分,则有,矛盾,故C正确;BD选项,举出反例即可判断.
【详解】A选项,假设存在选手失分超过7分,失8分,根据极差为5,得到最低失分为3分,
此时中位数为3,故假设可以成立,故A错误;
B选项,假设乙组的失分情况为,
满足平均数为2,众数为2,但该组不为“优秀小组”,B错误;
C选项,丙组的失分情况从小到大排列依次为,
丙组平均数为2,方差为3,即,
若,则,不合要求,故,
所以该组每位选手失分都不超过7分,则该组为“优秀小组”,故C正确;
D选项,,故从小到大,选取第9个数作为第85百分位数,
即从小到大第9个数为7,假设丁组失分情况为,
满足平均数为2,第85百分位数为7,但不是“优秀小组”,故D错误.
故选:C.
8.D
【分析】假设连续7天新增感染人数为1、2、3、3、3、3、6,得到①②③错误;若极差等于0或者1,在平均数的条件下符合指标,得出④正确,众数等于1且极差小于或等于4,符合指标,⑤正确.
【详解】提示:由题意,假设连续7天新增感染人数为1、2、3、3、3、3、6,易知满足平均数且标准差,但是不符合指标,所以①②③错误.
若极差等于0或者1,在平均数的条件下符合指标;
若极差等于2,则极小值与极大值的组合可能有:0和2;1和3;2和4;3和5;4和6.
在平均数的条件下,只有前3种可能符合指标,所以④正确.
若众数为1,且极差最大为4,则最小值为0或者1,最大数不超过5,所以⑤正确.
故选:D.
9.ACD
【分析】根据抽样方法,利用总体、样本、样本容量的定义逐项判断作答.
【详解】对于A,1000名运动员的年龄是总体,故A正确;
对于B,所抽取的10名运动员的年龄是一个样本,故B错误;
对于C,样本容量为10,故C正确;
对于D,每个运动员被抽到的机会相等,故D正确.
故选:ACD.
10.AC
【分析】根据政史地的人数和占比即能得到A;先求物化生的人数为人,物化地和物化政组合的人数相等,就能得到物化政组合人数,即B;物理440,历史360,C对;利用分层抽样的特点就能得到D.
【详解】对于A,选科为政史地的人数为200人,占比为.该校高一学生共有人,A正确;
对于B:选科为物化生的人数为人,选科为物化政的人数为B错误;
对于C,选考历史的人数有人,选考物理的人数有人,
选考物理的人数比选考历史的人数多,C正确;
对于D,选科为生史地的学生人数占比为,
采用分层抽样抽取20人,生史地组合应抽取人,D错误.
故选:AC.
11.CD
【分析】根据频率和为可构造方程求得,可判断A;由频率和频数的关系可求得观众年龄在岁的人数,可判断B;由平均数和百分位数的计算方法可验证CD.
【详解】对于A,∵(0.015+0.033+a+0.011+0.011)×10=1,
∴a=0.03,故A错误;
对于B,由频率分布直方图,短视频观众年龄在10~20岁的对应频率为0.15,
∴短视频观众年龄在10~20岁的有4 000×0.15=600(人),故B错误;
对于C,平均年龄为
=(0.015×15+0.033×25+0.03×35+0.011×45+0.011×55)×10=32(岁),故C正确;
对于D,设75%分位数为x,
由年龄在10~20岁和20~30岁两组频率是(0.015+0.033) ×10=0.48,
又年龄在10~20岁和20~30岁,30~40岁三组频率是(0.015+0.033+0.03) ×10=0.78,
所以75%分位数位于年龄在30~40岁这一组,
则0.015×10+0.033×10+(x-30)×0.03=0.75,
解得x=39,故D正确.
故选:CD.
12. 抽样调查; 高速公路上所有车的行驶速度; 6辆车的行驶速度.
【分析】(1)本题是随机抽取,因而是抽样调查;
(2)所有考查的对象的全体是总体,而组成总体的每一个考查对象是个体,研究中实际观测或调查的一部分个体称为样本.
【详解】解:(1)一名交警在高速公路上随机观察了6辆车的车速,然后他给出了一份报告,
交警采用的是抽样调查的调查方式.
(2)这个调查的样本是6辆车的车速,个体是每辆车的车速.
故答案为:抽样调查;高速公路上所有车的行驶速度,6辆车的行驶速度.
13.
【分析】根据平均数公式运算求解即可.
【详解】因为样本、、…、的平均数为,可得,
样本、、…、的平均数为,可得,
又因为样本、、…、、、、…、的平均数为
,
且,整理得,即.
故答案为:.
14.
【分析】根据样本平均数为,样本方差为,样本数据为互不相等的整数,可得到符合题意的样本数据,进而得到样本数据的最大值.
【详解】设五个班抽取的人数分别为,,,,,
则,
,
则,
,
样本数据为整数,根据方差,样本数据中最大值为,
此时样本数据依次为,,,,,不满足样本数据互不相同;
当样本数据中最大值为时,样本数据依次为,,,,,符合题意.
即样本数据中最大值为.
故答案为:.
15.(1)不是
(2)不是
(3)不是
(4)不是
(5)是
【分析】(1)(2)(3)(4)(5)根据简单随机抽样的特征逐个分析即可.
【详解】(1)不是,该抽样是放回抽样;
(2)不是,因为题中是“一次性”抽取,而不是“逐个”抽取;
(3)不是,因为题中“指定个子最高的5名同学”不存在随机性,不是等可能抽样;
(4)不是,因为题中“在上游”不具有代表性也没有随机性和等可能性;
(5)是简单随机抽样,符合简单随机抽样特征.
16.(1)0.08;25
(2)4;0.016
【分析】(1)根据频率分布直方图求频率,再根据频率和样本个数求抽样人数;
(2)根据(1)的结果,以及样本数据,结合频率公式,即可求解.
【详解】(1)易知成绩在区间内的频率为,成绩在区间内的频数为2,所以抽样人数为.
(2)成绩在区间内的频数为;
频率分布直方图中区间对应的小长方形的高为:.
17.(1)0.030
(2)84
(3)平均数为62;方差为23
【分析】(1)根据各组的频率和为1列方程可求出的值;
(2)先判断第75百分位数,然后列方程可求得结果;
(3)先根据频率分布直方图计算出成绩在和的人数,然后根据平均数的定义和方差公式可求得结果.
【详解】(1)由每组小矩形的面积之和为1得,,解得.
(2)成绩落在内的频率为,
落在内的频率为,
显然第75百分位数,
由,解得,
所以第75百分位数为84;
(3)由频率分布直方图知,成绩在的市民人数为,
成绩在的市民人数为,所以;
由样本方差计算总体方差公式,得总方差为
18.(1)小吃类家,生鲜类家
(2)①中位数为342.9,平均数为352.5;②
【分析】(1)根据分层抽样的定义计算即可;
(2)①根据中位数和平均数的定义计算即可;
②根据样本中“优秀商家”的个数来估计总体中“优秀商家”的个数即可.
【详解】(1),,
所以应抽取小吃类家,生鲜类家;
(2)①根据题意可得,解得,
设中位数为,因为,,
所以,解得,
平均数为:
,
所以该直播平台商家平均日利润的中位数为342.9,平均数为352.5.
②,
所以估计该直播平台“优秀商家”的个数为.
19.(1)
(2)84
(3)总平均数为;总方差为
【分析】(1)根据每组小矩形的面积之和为1即可求解;
(2)由频率分布直方图求第百分位数的计算公式即可求解;
(3)利用分层抽样的平均数和方差的计算公式即可求解.
【详解】(1)因为每组小矩形的面积之和为1,
所以,则.
(2)成绩落在内的频率为,
落在内的频率为,
设第75百分位数为m,
由,得,故第75百分位数为84.
(3)由图可知,成绩在的市民人数为,
成绩在的市民人数为,
故这两组成绩的总平均数为,
由样本方差计算总体方差公式可得总方差为:
.
提升训练
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(23-24高二上·江西·开学考试)年夏天,国产动画电影《长安三万里》热映,点燃“唐诗热”,为此某市电视台准备在该电视台举办的“我爱背唐诗”前三届参加总决赛的名选手(假设每位选手只参加其中一届总决赛)中随机抽取名参加一个唐诗交流会,若按前三届参加总决赛的人数比例分层随机抽样,则第一届抽取人,若按性别比例分层随机抽样,则女选手抽取人,则下列结论错误的是( )
A.是样本容量 B.第二届与第三届参加总决赛的选手共有人
C.名选手中男选手有人 D.第一届参加总决赛的女选手最多有人
2.(23-24高一下·海南省直辖县级单位·期中)如图是某校高一年级1000名男生体检时身高的频率分布直方图,现用分层随机抽样的方法从身高在160~175cm的男生中抽取130名,则抽取到的身高在165~170cm的人数为( )
A.20 B.30 C.40 D.50
3.(2024·陕西安康·模拟预测)演讲比赛中,12位评委对小李的演讲打出了如下的分数:
9.3
8.8
8.9
9.0
8.9
9.0
9.1
8.7
9.2
9.0
9.1
9.2
若去掉两个最高分,两个最低分,则剩下8个分数的平均数为( )
A.9.075 B.9.05 C.9.025 D.9
4.(23-24高一下·吉林通化·阶段练习)2024年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
5.(23-24高一下·山西忻州·阶段练习)2016年至2023年我国原油进口数量如图所示:
下列结论正确的是( )
A.2016年至2023年我国原油进口数量逐年增加
B.2016年至2023年我国原油进口数量的极差为16138万吨
C.2016年至2023年我国原油进口数是的分位数为54239万吨
D.2015年我国原油进口数量少于30000万吨
6.(23-24高一下·河南·阶段练习)已知样本数据的平均数为,样本数据的平均数为,若样本数据的平均数为,则( )
A.12 B.10 C.2 D.11
7.(23-24高一下·福建福州·期末)图为某地2014年至2023年的粮食年产量折线图,则下列说法错误的是( )
A.这10年粮食年产量的极差为16
B.这10年粮食年产量的第70百分位数为35
C.这10年粮食年产量的平均数为33.7
D.前5年的粮食年产量的方差小于后5年粮食年产量的方差
8.(22-23高三下·安徽亳州·开学考试)现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2024高一下·全国·专题练习)下列抽取样本的方式不属于简单随机抽样的是( )
A.从无限多个个体中抽取100个个体作为样本
B.箱子里共有100个零件,从中取出5个零件进行质量检验.在抽样操作过程中,从中任意拿出一个零件进行质量检验后再把它放回箱子里,然后再抽取下一个零件进行质量检验
C.从30件玩具中,逐个抽取4件进行质量检验
D.某班有45名同学,指定身高最高的5名同学参加学校组织的排球赛
10.(22-23高一下·广西南宁·期末)(多选)某学校为了解同学们某天上学的交通方式,在高一年级开展了随机调查,将学生某天上学的交通方式归为四类:A一家人接送,B一乘坐地铁,C一乘坐公交,D一其他方式,学校把收集到的数据整理绘制成条形图和扇形图,如图只给出了其中部分信息,根据图中信息,下列说法正确的是( )
A.若该校高一年级有学生1300人,则高一年级约有780人乘坐公共交通工具上学
B.估计该校高一年级有的学生某天家人接送上学
C.扇形图中B的占比为40%
D.估计该校学生上学交通方式为乘坐地铁或者其他方式的人数占全校学生的一半
11.(2024·湖北·模拟预测)设一组样本数据满足,则( )
A.拿走,这组数据的方差变大 B.拿走,这组数据的方差变大
C.拿走,这组数据的方差减小 D.拿走,这组数据的方差减小
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(23-24高三上·广东梅州·期中)某中学为了了解初中部学生的某项行为规范的养成情况,在校门口每分钟随机抽取一名学生,登记佩戴了胸卡的学生的名字,结果在名学生中有名学生佩戴胸卡.学校调查了初中部的所有学生,发现有名学生佩戴胸卡.则估计该中学初中部共有 名学生.
13.(2024高三下·全国·专题练习)为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为 .
14.(21-22高一·全国·课后作业)在分层抽样时,如果将总体分为k层,第j层抽取的样本量为,第j层的样本平均数为,样本方差为,,.记,则所有数据的样本方差为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (22-23高一·全国·随堂练习)为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
16. (15分) (23-24高一下·河南·阶段练习)已知某工厂一区生产车间与二区生产车间均生产某种型号的零件,这两个生产车间生产的该种型号的零件尺寸的频率分布直方图如图所示(每组区间均为左开右闭).
尺寸大于的零件用于大型机器中,尺寸小于或等于的零件用于小型机器中.
(1)若,试分别估计该工厂一区生产车间生产的500个该种型号的零件和二区生产车间生产的500个该种型号的零件用于大型机器中的零件个数.
(2)若,现有足够多的来自一区生产车间与二区生产车间的零件,分别用于大型机器、小型机器各5000台的生产,每台机器仅使用一个该种型号的零件.
方案一:直接将一区生产车间生产的零件用于大型机器中,其中用了尺寸小于或等于的零件的大型机器每台会使得工厂损失200元;直接将二区生产车间生产的零件用于小型机器中,其中用了尺寸大于的零件的小型机器每台会使得工厂损失100元.
方案二:重新测量一区生产车间与二区生产车间生产的零件尺寸,并正确匹配型号,重新测量的总费用为35万元.
请写出采用方案一,工厂损失费用的估计值(单位:万元)的表达式,并从工厂损失的角度考虑,选择合理的方案.
17. (15分) (23-24高一下·浙江丽水·期末)某中学为了调查高一年级学生劳动实践活动情况,对名学生某周的劳动时间统计如下:
周劳动时间(小时)
人数
20
80
140
200
60
(1)根据提供的数据,直接在答题卡中补充完整周劳动时间的频率分布直方图(用阴影填涂,不需要书写具体步骤);
(2)求周劳动时间的平均数(同一组数据用该组区间的中点值为代表);
(3)根据图表,估计周劳动时间的样本数据分位数.
18. (17分) (21-22高三·云南昆明·阶段练习)《中国制造2025》是中国实施制造强国战略第一个十年的行动纲领,制造业是国民经济的主体,是立国之本、兴国之器、强国之基.发展制造业的基本方针为质量为先,坚持把质量作为建设制造强国的生命线某电子产品制造企业为了提升生产效率,对现有的一条电子产品生产线进行技术升级改造,为了分析改造的效果,该企业质检人员从该条生产线所生产的电子产品中随机抽取了1000件,检测产品的某项质量指标值,根据检测数据得到下表(单位:件).
质量指标值
产品
60
100
160
300
200
100
80
(1)估计这组样本的质量指标值的平均数和方差(同一组中的数据用该组区间中点值作代表);
(2)设表示不大于x的最大整数,表示不小于x的最小整数,s精确到个位,,,,根据检验标准,技术升级改造后,若质量指标值有落在内,则可以判断技术改造后的产品质量初级稳定;若有落在内,则可以判断技术改造后的产品质量稳定,可认为生产线技术改造成功.请问:根据样本数据估计,是否可以判定生产线的技术改造是成功的?
19. (17分) (21-22高二上·广东湛江·期中)某市为了了解人们对“中国梦”的伟大构想的认知程度,针对本市不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(95分及以上为认知程度高),结果认知程度高的有20人,按年龄分成5组,其中第一组:,第二组:,第三组:,第四组:,第五组:,得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计这20人的平均年龄和第80百分位数;
(2)若第四组宣传使者的年龄的平均数与方差分别为37和,第五组宣传使者的年龄的平均数与方差分别为43和1,求这20人中35~45岁所有人的年龄的方差.
参考答案:
1.C
【分析】根据样本容量定义、分层抽样原则依次判断各个选项即可.
【详解】对于A,由样本容量定义知:样本容量为,A正确;
对于B,第一届参加总决赛的选手有人,第二届与第三届参加总决赛的选手共有人,B正确;
对于C,女选手共有人,男选手有人,C错误;
对于D,由B知:第一届参加总决赛的选手共人,第一届参加总决赛的女选手最多有人,D正确.
故选:C.
2.C
【分析】根据频率分布直方图分别求出身高在160~175cm和身高在165~170cm的人数,然后根据分层抽样的定义求解即可
【详解】由频率分布直方图可知,高一年级身高在160~175cm的人数有,
高一年级身高在165~170cm的人数,
设抽取到的身高在165~170cm的人数为,则
,解得,
故选:C
3.C
【分析】根据平均数的公式直接计算即可.
【详解】由题意去掉的数据有:9.3,9.2,8.7,8.8,
所以剩下8个分数的平均数为.
故选:C
4.D
【分析】由饼状图可计算出高一年级共90人,高二年级共60人,高三年级共50人,再由高一学生排名分布的频率条形图可计算出各排名段中高一年级学生的人数,由此即可判断出答案.
【详解】由饼状图可知,成绩在前200名的学生中,高一人数比高二人数多,A正确;
成绩在第名的学生中,高一人数为,因此高三最多有32人,B正确;
由条形图知高一学生的成绩在第名的人数为,
而高三的学生成绩在第名的人数最多为人,
故高一学生的成绩在第名的人数一定比高三的学生成绩在第名的人数多,C正确;
成绩在第名的学生中,高一人数为,
高二成绩在第名的人数最多为,
即成绩在第51~100名的学生中,高一的人数一定比高二的人数多,D错误.
故选:D.
5.C
【分析】根据统计图的数据,依次分析选项即可得答案.
【详解】2021年和2022年我国原油进口数量都比上一年少,A错误;
2016年至2023年我国原油进口数量的极差为18298万吨,B错误;
将数据从小到大排序:,,,,,,,,
由于,则年至2023年我国原油进口数量的分位数为为第7个数,即54239万吨,C正确;
设2015年我国原油进口数量为万吨,,,
所以2015年我国原油进口数量超过30000万吨,D错误.
故选:C
6.B
【分析】依题意总平均数等于总数据和除以总数据的个数,直接解出即可.
【详解】根据题意可得,解得.
故选:B.
7.B
【分析】将数据由小到大排列,利用极差、百分位数、平均数的定义得到A、B、C选项;由前5年和后5年的波动性得到方差的大小,得到D选项.
【详解】A选项,将样本数据从小到大排列为,这10年的粮食年产量极差为,故A正确;
B选项,,结合A选项可知第70百分位数为第7个数和第8个数的平均数,即,故B不正确;
C选项,这10年粮食年产量的平均数,故C正确:
D选项,结合图形可知,前5年的粮食年产量的波动小于后5年的粮食产量波动,所以前5年的粮食年产量的方差小于后5年的粮食年产量的方差,故D正确.
故选:B.
8.D
【分析】利用平均数和方差公式可求得新数据的方差.
【详解】设甲组数据分别为、、、,乙组数据分别为、、、,
甲组数据的平均数为,可得,方差为,可得,
乙组数据的平均数为,可得,方差为,可得,
混合后,新数据的平均数为,
方差为
.
故选:D.
9.AD
【分析】由简单随机抽样的定义和特点逐项判断即可.
【详解】对于A项,不是简单随机抽样,因为被抽取样本的总体的个体数是无限的,而不是有限的;
对于B项,是(放回)简单随机抽样,因为总体的个体数是有限的,这是有放回的抽样,且每次抽取时总体内的每个个体被抽到的机会都相等;
对于C项,是简单随机抽样,符合简单随机抽样的定义;
对于D项,不是简单随机抽样,因为不是等可能的抽样.
故选:AD
10.AD
【分析】根据柱形图和扇形图,可求得总人数,逐一分析各个选项,即可得答案.
【详解】因为C一乘坐公交的调查人数为,所占比例为,
所以调查的总人数为,
对于A选项:,所以A选项正确,
对于B选项:,所以B选项错误,
对于C选项:,所以C选项错误,
对于D选项:,所以D选项正确.
故选:AD.
11.AD
【分析】对于A,直接证明即可;对于B,C,构造反例即可;对于D可直接用拿走后的方差为零说明结论.
【详解】熟知对一组数据,其方差等于各个数据的平方的算术平均值与算术平均值的平方之差,即.
将拿走前后的方差分别记为.
对于A,给五个元素同时加上或减去同一个数,不影响方差,所以可以适当平移,使得剩下的4个元素:的平均值为0,
不妨设,则,,所以.
故
,
所以A正确;
对于B,考虑,则,,所以B错误;
对于C,考虑,则,,所以C错误;
对于D,由于这组数据不全相等,所以,而,所以D正确.
故选:AD.
【点睛】关键点点睛:本题的关键点在于方差的计算.
12.
【分析】设该中学初中部一共有名学生,列出等式,即可求解.
【详解】设该中学初中部一共有名学生,
则,解得,
故该中学初中部一共有1250名学生.
故答案为:.
13.84.55
【分析】利用第70百分位数的定义结合频率分布直方图求解即可.
【详解】由题意得,
解得,
因为前4组数据的频率之和为,
前5组数据的频率之和为,
则分位数在内,设分位数为x,
则,解得,
所以分位数约为.
故答案为:
14.
【分析】
在分层抽样中先计算第层抽取的样本均值,再计算总体k层的样本均值,即可得出;同理,计算第j层抽取的样本方差,进行一系列整理得到,再计算总体k层的样本方差,由此得答案.
【详解】解:.
∴样本均值为.
又.
计算总体
又.
.
.
故答案为:
【点睛】本题主要考查用分层抽样的方法求样本的均值和方差,属于中档题.
15.(1)方式1采用的是简单随机抽样法,方式2采用的是分层抽样法;
(2)答案见解析;
【分析】(1)根据抽样的定义即可合理选取不同的抽样方式;
(2)利用简单随机抽样和分层抽样的定义即可写出具体步骤;
【详解】(1)根据题意可知,方式1采用的是简单随机抽样法,方式2采用的是分层抽样法;
(2)方式1抽样的步骤如下:
在全年级10个班中用抽签法任意抽取一个班级,考察他们的成绩;
方式2抽样的步骤如下:
第一步:分层
把该校高三年级的学生按成绩分成优秀、良好、普通三个级别;
第二步:确定各个层抽取的人数
由于样本容量与总体个数比值为,
所以每层抽取的个体数依次为人,人,人;
第三步:按层分别抽取样本人数
在优秀学生中用简单随机抽样法抽取6人,
在良好学生中用简单随机抽样法抽取18人,
在普通学生中用简单随机抽样法抽取16人,
16.(1)420;200
(2),选择方案二.
【分析】(1)计算出两个生产车间生产的零件尺寸大于60的频率,进而求出两个生产车间生产的500个该种型号的零件用于大型机器中的零件数;
(2)计算出一区生产车间生产的零件尺寸小于或等于的频率和二区生产车间生产的零件尺寸大于的频率,从而得到,结合,求出,与35比较后得到结论.
【详解】(1)一区生产车间生产的零件尺寸大于60的频率为,
则该工厂一区生产车间生产的500个该种型号的零件用于大型机器中的零件个数为;
二区生产车间生产的零件尺寸大于60的频率为,
则该工厂二区生产车间生产的500个该种型号的零件用于大型机器中的零件个数为.
(2)一区生产车间生产的零件尺寸小于或等于的频率为
.
二区生产车间生产的零件尺寸大于的频率为
.
故.
因为,所以.
又因为采用方案二重新测量的总费用为35万元,
所以从工厂损失的角度考虑,应选择方案二.
17.(1)答案见解析
(2)
(3)
【分析】(1)根据频数分布表计算出周劳动时间在和小时的频率,从而可补全频率分布直方图;
(2)根据平均的定义结合频率分布直方图求解即可;
(3)先判断分位数所在的区间,然后列方程求解即可.
【详解】(1)由题意可知,周劳动时间在小时的频率为,
周劳动时间在小时的频率为,
所以补全的频率分布直方图如下图
(2)周劳动时间平均数为:;
(3)因为前3组的频率和为,
前4组的频率和为,
所以数据分位数在内,
设样本数据的分位数为,则,
得,周劳动时间的样本数据分位数为.
18.(1)61,241;
(2)可以判断技术改造后的产品质量初级稳定,但不能判定生产线技术改造成功.
【分析】(1)利用表格中的数据,根据平均数和方差的计算公式计算即可;
(2)根据题中公式,计算出区间并判段数据落在该区间的概率,计算出区间并判段数据落在该区间的概率,与题中条件比较即可得出结论.
【详解】(1)由题,可知
.
.
(2)由知,,
则,,
该抽样数据落在内的频率约为;
又,,
该抽样数据落在内的频率约为,
∴可以判断技术改造后的产品质量初级稳定,但不能判定生产线技术改造成功.
19.(1)32.25,第80百分位数为37.5
(2)10
【分析】(1)直接根据频率分布直方图计算平均数和百分位数;
(2)利用分层抽样得第四组和第五组分别抽取人和人,进而设第四组、第五组的宣传使者的年龄的平均数分别为,,方差分别为,,第四组和第五组所有宣传使者的年龄平均数为,方差为,进而根据方差公式,代入计算即可得答案.
【详解】(1)设这20人的平均年龄为,则
.
设第80百分位数为,由,解得.
(2)由频率分布直方图得各组人数之比为,
故各组中采用分层随机抽样的方法抽取20人,第四组和第五组分别抽取人和人,
设第四组、第五组的宣传使者的年龄的平均数分别为,,方差分别为,,
则,,,,
设第四组和第五组所有宣传使者的年龄平均数为,方差为.
则,,
因此,第四组和第五组所有宣传使者的年龄方差为10,
据此,可估计这人中年龄在35~45岁的所有人的年龄方差约为10.
培优训练
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(2024·四川成都·模拟预测)用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A., B.,
C., D.,
2.(2024·黑龙江哈尔滨·模拟预测)在哈尔滨市2024年第一次市模考试中,三所学校高三年级的参考人数分别为、.现按比例分层抽样的方法从三个学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为,则三所学校学生数学成绩的总平均数约为( )
A.101 B.100 C.99 D.98
3.(2024·陕西西安·模拟预测)国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(居民消费水平)( )
A.2018年至2022年我国居民消费水平逐年提高
B.2018年至2022年我国城镇居民消费水平逐年提高
C.2018年至2022年我国居民消费水平数据的极差为6463元
D.2022年我国城镇人口数比农村人口数的1.5倍还要多
4.(23-24高一下·贵州铜仁·期中)年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
5.(2024·天津·二模)为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为( )
A.89.09 B.86.52 C.84.55 D.81.32
6.(23-24高三下·天津南开·阶段练习)某校举办了数学知识竞赛,并将1000名学生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则以下四个说法正确的个数为( )
①a的值为0.005
②估计这组数据的众数为75
③估计这组数据的下四分位数为60
④估计成绩高于80分的有300人
A.1 B.2 C.3 D.4
7.(23-24高一下·湖北武汉·期末)在某次比赛中运动员五轮的成绩互不相等,记为,平均数为,若随机删去其中一轮的成绩,得到一组新数据,记为,平均数为,下面说法正确的是( )
A.新数据的极差不可能等于原数据的极差
B.新数据的中位数可能等于原数据的中位数
C.若,则新数据的方差一定小于原数据方差
D.若,则新数据的第40百分位数一定大于原数据的第40百分位数
8.(23-24高二下·安徽·阶段练习)在一组数3,3,8,11,28中插入两个整数,,使得新的一组数极差为原来极差的两倍,且众数和中位数保持不变,则的最大值为( )
A.57 B.58 C.60 D.61
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2024·河北·二模)如图为“苍松迎客快餐店”两种类型的套餐在2024年前3个月的销售情况统计图,已知套餐卖出一份盈利20元,套餐卖出一份盈利10元.图中点的纵坐标分别表示套餐2024年前3个月的销售量,点的纵坐标分别表示套餐2024年前3个月的销售量.根据图中信息,下列结论中正确的是( )
A.2月两种套饏的总销售量最多
B.3月两种套餐的总销售量最多
C.1月两种套餐的总利润最多
D.2月两种套餐的总利润最多
10.(23-24高一下·海南省直辖县级单位·阶段练习)下列说法正确的是( )
A.用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体被抽到的概率是0.1
B.数据的平均数为90,方差为3;数据的平均数为85,方差为5,则的平均数为87,方差为10.2
C.数据的第70百分位数是23
D.已知数据的极差为6,方差为2,则数据的极差和方差分别为12,8
11.(21-22高一上·全国·课后作业)(多选题)某高校大一新生中,来自东部地区的学生有2 400人、中部地区的学生有1 600人、西部地区的学生有1 000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列判断正确的有( )
A.用分层抽样的方法分别抽取东部地区学生48人、中部地区学生32人、西部地区学生20人
B.用简单随机抽样的方法从新生中选出100人最适合
C.西部地区学生小刘被选中的可能性为
D.中部地区学生小张被选中的可能性为
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(21-22高一上·全国·课后作业)某省有关部门要求各中小学要把“每天锻炼一小时”写入课程表,为了响应这一号召,某校围绕着“你最喜欢的体育活动项目是什么?(只写一项)”的问题,对在校学生进行了随机抽样调查,从而得到一组数据.图1是根据这组数据绘制的条形统计图.由条形统计图可知本次抽样调查中,最喜欢篮球活动的占被调查人数的百分比是 ,若该校九年级共有200名学生,图2是根据各年级学生人数占全校学生总人数的百分比绘制的扇形统计图,则全校学生中最喜欢跳绳活动的人数估计为 .
13.(23-24高三上·上海宝山·期末)在某次比赛中运动员五轮的成绩互不相等,记为,平均数为,若随机删去其中一轮的成绩,得到一组新数据,记为,平均数为,下面说法正确的是 .(写出所有正确选项)
①新数据的极差可能等于原数据的极差.
②新数据的中位数可能等于原数据的中位数.
③若,则新数据的方差一定大于原数据方差.
④若,则新数据的第40百分位数一定大于原数据的第40百分位数.
14.(23-24高三上·河南·阶段练习)商场为改进服务质量,提升顾客购物体验,从2023年第三季度消费过的顾客中随机抽取部分人进行满意度问卷调查.并将这部分人满意度的得分分成以下6组:,统计结果如图所示.那么该商场顾客满意度得分的第60百分位数为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (23-24高一下·河北邢台·阶段练习)已知某高速服务区餐厅的窗口有四类:①自选快餐,平均每份取餐时长为1分钟;②商务套餐,平均每份取餐时长为0.5分钟;③现炒现做,平均每份取餐时长为5分钟;④自动售货机,平均每份取餐时长为1分钟.已知该高速服务区餐厅的取餐窗口(每台自动售货机按1个取餐窗口计算)一共有18个,就餐高峰期时有400名消费者在等待就餐.为了提高消费者的用餐满意度,该高速服务区工作人员选取了100名用餐的消费者进行问卷调查,其中有50人选择了自选快餐,30人选择了商务套餐,15人选择了现炒现做,5人选择了自动售货机.(注:为了方便计算,若某消费者选择两类或多类就餐类别,则按该消费者的主要就餐类别归类,每名消费者只统计为其中一类).
(1)根据以上的调查统计,用样本估计总体,如果设置10个自选快餐窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类取餐的窗口前队伍长度各自相等),试问选择自选快餐的消费者最长等待时长是多少分钟?
(2)根据以上的调查数据统计,用样本估计总体,从等待时长和公平的角度上考虑,要求每个队伍的最长等待时长大致相等,应如何设置各类取餐窗口数(结果采用四舍五入法保留整数)?并说明理由.
16. (15分) (23-24高一下·湖北武汉·期末)随着社会的进步、科技的发展,人民对自己生活的环境要求越来越高,尤其是居住环境的环保和绿化受到每一位市民的关注,因此,2019年6月25日,生活垃圾分类制度入法,提倡每位居民做好垃圾分类储存、分类投放,方便工作人员依分类搬运,提高垃圾的资源价值和经济价值,力争物尽其用.某市环卫局在A、B两个小区分别随机抽取6户,进行生活垃圾分类调研工作,依据住户情况对近期一周(7天)进行生活垃圾分类占用时间统计如下表:
住户编号
1
2
3
4
5
6
A小区(分钟)
220
185
220
225
205
235
B小区(分钟)
205
195
245
235
225
215
(1)分别计算小区每周进行生活垃圾分类所用时间的平均值和方差;以及两个小区抽取的一共12户每周进行生活垃圾分类所用时间的平均值和方差;
(2)如果两个小区住户均按照1000户计算,小区的垃圾也要按照垃圾分类搬运,市环卫局与两个小区物业及住户协商,初步实施下列方案:
①小区方案:号召住户生活垃圾分类“从我做起”,为了利国利民,每200位住户至少需要一名工作人员进行检查和纠错生活垃圾分类,每位工作人员月工资按照3000元(按照28天计算标准)计算,则每位住户每月至少需要承担的生活垃圾分类费是多少?
②小区方案:为了方便住户,住户只需要将垃圾堆放在垃圾点,物业让专职人员进行生活垃圾分类,一位专职工作人员对生活垃圾分类的效果相当于5位普通居民对生活垃圾分类效果,每位专职工作人员(每天工作8小时)月工资按照4000元(按照28天计算标准)计算,则每位住户每月至少需要承担的生活垃圾分类费是多少?
(3)市环卫局与两个小区物业及住户协商分别试行一个月,根据实施情况,试分析哪个方案惠民力度大,值得进行推广?
17. (15分) (23-24高一下·江苏连云港·期末)为了调查疫情期间数学网课学习情况,某校组织了高一年级学生进行了数学测试.根据测试成绩(总分100分),将所得数据按照分成6组,其频率分布直方图如图所示.
(1)求图中a的值;为了更全面地了解疫情对网课的影响,求该样本的60百分位数;
(2)试估计本次数学测试成绩的平均分;(同一组中的数据用该组区间的中点值作代表);
(3)该校准备对本次数学测试成绩优异(将成绩从高到低排列,排在前的为优异)的学生进行嘉奖,则受嘉奖的学生分数不低于多少?
18. (17分) (23-24高一下·广西贺州·阶段练习)某棉纺厂为了了解一批棉花的质量,随机抽查了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),将所得到的数据分成7组:,,,,,,(棉花纤维的长度均在内),绘制得到如图所示的频率分布直方图.
(1)求的值,并估计棉花纤维的长度的众数和平均数(同一组数据用该区间的中点值作为代表);
(2)估计棉花纤维的长度的75%分位数.
19. (17分) (22-23高一下·吉林长春·阶段练习)某城市户居民的月平均用电量单位:度,以,,,分组的频率分布直方图如图.
(1)求直方图中的值;
(2)在这户居民中,月平均用电量不低于度的有多少户?
(3)在月平均用电量为,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?
参考答案:
1.A
【分析】根据简单随机抽样的等可能性,即可判断和选择.
【详解】总体有10个个体,从中抽取第一个,若为,则其可能性为,若不为,则其可能性为;
抽取第二个,若其为,则第一次一定不是,再从9个个体中抽取1个,且为,则其可能性为.
综上所述,某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是.
故选:A.
2.B
【分析】利用分层抽样的均值公式求解即可.
【详解】由题意得可供参考的总人数为人,
故三所学校学生数学成绩的总平均数约为,
故选:B
3.D
【分析】对于AB选项,由统计图可得答案;对于C选项,结合题目数据可得答案;对于D选项,由统计图数据结合居民消费水平计算公式可得答案.
【详解】对于A,2019年的居民消费水平比2020年的居民消费水平高,故A错误;
对于B, 2018年至2022年我国城镇居民消费水平不是逐年提高,故B错误;
对于C,2018年至2022年我国居民消费水平数据的极差为6473元,故C错误;
对于D,设我国农村人口数为,城镇人口数为,
则,化简得,
所以2022年我国城镇人口数比农村人口数的1.5倍还要多,故D正确.
故选:D
4.D
【分析】求得前名的人中,高一人数和高二人数判断选项A;求得成绩第1-名的人中,高一人数判断选项B;求得成绩第1-50名的50人中,高三最多有多少人判断选项C;求得成绩第51-名的50人中,高二人数与高一人数的关系判断选项D.
【详解】由饼状图,成绩前名的人中,高一人数比高二人数多
(人).故选项A判断正确;
由条形图知,成绩第1-100名的人中,前和后人数相等,
因此高一人数为,故选项B判断正确;
成绩第1-50名的50人中,高一人数为,
因此高三最多有32人. 故选项C判断正确;
成绩第51-名的50人中,高二人数无法确定,故选项D判断错误.
故选:D
5.C
【分析】利用百分位数的概念以及频率分布直方图求解.
【详解】由题意得,
解得,
因为前4组数据的频率之和为,
前5组数据的频率之和为,
则分位数在内,设分位数为x,
则,解得,
所以分位数约为.
故选:C.
6.D
【分析】利用频率分布直方图的性质判断①,利用众数、百分位数的求法判断②③,根据频率分布直方图计算可估计总体判断④.
【详解】由频率分布直方图可知,解得,①正确;
根据频率分布直方图可知众数落在区间,用区间中点表示众数,即众数为75,②正确;
前两组频率之和为,所以这组数据的下四分位数为60,③正确;
成绩高于80分的频率为,所以估计总体成绩高于80分的有人,④正确;
综上①②③④正确,
故选:D
7.B
【分析】根据极差、中位数、平均数和方差的概念,以及百分位数的概念及计算方法,逐项判定,即可求解.
【详解】对A:若随机删去任一轮的成绩,恰好不是最高成绩和最低成绩,
此时新数据的极差等于原数据的极差,故A错误;
对B:不妨假设,
当时,若随机删去的成绩是,
此时新数据的中位数等于原数据的中位数,故B正确;
对C:若,即删去的数据恰为平均数,
根据方差的计算公式,分子不变,分母变小,所以方差会变大,
则新数据的方差一定大于原数据方差,故C错误;
对D:若,即删去的数据恰为平均数,在按从小到大的顺序排列的5个数据中,
因为,此时原数据的分位数为第二数和第三个数的平均数;
删去一个数据后的4个数据,从小到大的顺序排列,可得,
此时新数据的分位数为第二个数,
显然新数据的分位数小于原数据的分位数,故D错误.
故选:B.
8.C
【分析】由题意可得插入的两个数不可能都是;可得一个为,另一个数不小于8,由极差加倍,则另一个数为,若插入的两个数是不等的且不是,,,,且极差为,进而可得,进而可求的最大值.
【详解】若插入两个整数后众数不变,则插入的数可以是“两个都是”,或是“一个为,另一个不是”,
或是“两个不等的且不是,,”.
①因为新的一组数极差加倍,所以插入的两个数不可能都是;
②因为中位数保持不变,若插入的数“一个为,另一个不是”,则一个为,另一个数不小于,
又因为极差加倍,则另一个数为,此时;
③若插入的两个数是不等的且不是,,,,且极差为,中位数保持不变,
则两个数可以为
,,,,,,,
所以,的最大值为.
故选:C.
9.BC
【分析】根据统计图对选项一一判断即可得出答案.
【详解】根据统计图可得,的纵坐标之和显然最大,
故3月两种套餐的总销售量最多,故错误,正确;
因为套餐卖出一份盈利20元,套餐卖出一份盈利10元,
根据统计图,若用对应的点表示对应点的纵坐标,
则易得,故C正确,D错误.
故选:BC.
10.ABD
【分析】A选项,根据简单随机抽样的定义和概率性质得到答案;B选项,根据分层抽样平均数及方差公式判断;C选项,先对数据从小到大排序,再根据百分位数定义计算即可;D选项,根据方差性质得到的方差可判断.
【详解】A选项,每个个体被抽到的概率为,故A正确;
B选项,的平均数为,
方差,故B正确;
C选项,这10个数据从小到大排列为,
由于,故选择第7和第8个数的平均数作为第70百分位数,
即,所以第70百分位数是,故C错误;
D选项,不妨设,则,
即数据的极差为12,由方差性质知,故D正确.
故选:ABD
11.AC
【分析】根据题设可得抽样比,从而可判断AB的正误,根据分层抽样的性质可判断CD的正误.
【详解】由题设可得东部地区、中部地区、西部地区的学生的抽样比为,
故抽取100人时东部地区、中部地区、西部地区的学生人数分别为:
即,故A正确.
用简单随机抽样的方法从新生中选出人数为均合适,故B错误.
由分层抽样的性质可得无论哪一个地区的学生,
被抽取到的概率为,故C正确,D错误.
故选:AC.
12. 36% 160
【分析】由条形图得出最喜欢篮球活动的占被调查人数的百分比,再计算总人数,从而利用图表进行估计.
【详解】最喜欢篮球活动的占被调查人数的百分比是,
由图2可知,九年级学生人数占全校学生总人数的,
则全校总人数为人,
则全校学生中最喜欢跳绳活动的人数估计为人.
故答案为:36%;160
13.①②③
【分析】根据极差、中位数、平均数和方差的概念,以及百分位数的概念及计算方法,逐项判定,即可求解.
【详解】对于①,若随机删去任一轮的成绩,恰好不是最高成绩和最低成绩,
此时新数据的极差可能等于原数据的极差,所以①正确;
对于②,不妨假设,
当时,若随机删去的成绩是,
此时新数据的中位数等于原数据的中位数,所以②正确;
对于③,若,即删去的数据恰为平均数,
根据方差的计算公式,分子不变,分母变小,所以方差会变大,所以③正确;
对于④,若,即删去的数据恰为平均数,在按从小到大的顺序排列的5个数据中,
因为,此时原数据的分位数为第二数和第三个数的平均数;
删去一个数据后的4个数据,从小到大的顺序排列,可得,
此时新数据的分位数为第二个数,
显然新数据的分位数小于原数据的分位数,所以④错误.
故答案为:①②③.
14.75
【分析】利用频率分布直方图每个小矩形面积代表频率表示第60百分位数求解即可.
【详解】由图可知,第1个小矩形面积为0.1,第2个小矩形面积为0.15,第,3个小矩形面积为0.2,第4个小矩形面积为0.3,
则第60百分位数位于内,设60百分位数为,则有,
则,所以商场顾客满意度得分的第60百分位数为75.
故答案为:75
15.(1)20分钟
(2)取餐窗口分别为6个,2个,9个,自动售货机1台;理由见解析
【分析】(1)计算就餐高峰期时选择自选快餐的总人数,再根据平均分布求解即可;
(2)设自选快餐窗口个,商务套餐窗口个,现炒现做窗口个,自售货机台,再分别计算自选快餐、商务套餐、现炒现做、自售货机的最长等待时间,再依题意,从等待时长和公平的角度上考虑,要求每个队伍的最长等待时长大致相等列式求解即可.
【详解】(1)由题意得,就餐高峰期时选择自选快餐的总人数为,
这200人平均分布在10个自选快餐窗口,平均每个窗口等待取餐的人数为,所以选择自选快餐的消费者的最长等待时长为分钟.
(2)设自选快餐窗口个,商务套餐窗口个,现炒现做窗口个,自售货机台.
自选快餐高峰期就餐总人数为,每个窗口等待人数为,最长等待时长为分钟;
商务套餐高峰期就餐总人数为,每个窗口等待人数为,最长等待时长为分钟;
现炒现做高峰期就餐总人数为,每个窗口等待人数为,最长等待时长为分钟;
自动售货机高峰期就餐总人数为,每台售货机等待人数为,最长等待时长为分钟.
依题意,从等待时长和公平的角度上考虑,要求每个队伍的最长等待时长大致相等,
则可得,即有.
因为.所以,,,.
故应设置自选快餐、商务套餐、现炒现做的取餐窗口分别为6个,2个,9个,自动售货机1台.
16.(1)A的平均值为215分钟,B的平均值为220分钟,A、B的方差分别为,且
(2)①15元;②52元
(3)选择方案推广,有利于国民热爱劳动及素质的提升
【分析】(1)利用表格中数值,代入平均值和方差计算即可;
(2)①计算小区一月至少需要名工作人员的费用和每位住户每月需要承担的费用即可;②由一位专职工人一天的工作时间按照小时作为计算标准,每月按照天作为计算标准,一位专职工作人员对生活垃圾分类效果相当于名普通居民对生活垃圾分类的效果,计算出小区一月需要专职工作人员数量即可;
(3)根据以上的运算,分析可以得出结论.
【详解】(1)(分钟),
(分钟),
总体的平均数,
总体的方差
(2)①按照小区方案,小区一月至少需要5名工作人员进行检查和纠错生活垃圾分类,其费用是元,
每位住户每月需要承担的生活垃圾分类费为(元);
②由(1)知,小区平均每位住户每周需要220分钟进行垃圾分类,一月需要(分钟),
小区一月平均需要分钟的时间用于生活垃圾分类,
一位专职工人一天的工作时间按照8小时作为计算标准,每月按照28天作为计算标准,
一位专职工作人员对生活垃圾分类效果相当于5名普通居民对生活垃圾分类的效果,
小区一月需要专职工作人员至少(名),
则每位住户每月需要承担的生活垃圾分类费为(元),
(3)根据上述计算可知,按照每位住户每月需要承担的生活垃圾分类费来说,
选择方案惠民力度大,但需要住户平时做好生活垃圾分类事项;
如果对于高档小区的居民来说,可以选择方案,这只是方便个别高收入住户,
综上,选择方案推广,有利于国民热爱劳动及素质的提升.
17.(1);百分位数为;
(2)
(3)
【分析】(1)由直方图区间频率和为1求参数;设该样本的60百分位数为分,由题意可得,求解即可;
(2)根据直方图求物理测试成绩的平均分即可;
(3)根据直方图求出成绩从高到低排列且频率为对应分数即可.
【详解】(1)由,解得;
设该样本的60百分位数为分,
因为对应的频率分别为0.05,0.15,0.3,0.25,
所以60百分位数在内,由题意可得,解得,
所以60百分位数为;
(2),
故本次防疫知识测试成绩的平均分为;
(3)设受嘉奖的学生分数不低于分,
因为对应的频率分别为0.15,0.1,
所以,解得,
故受嘉奖的学生分数不低于分.
18.(1),众数为,平均数;
(2)
【分析】(1)由频率分布直方图解得,再求出众数及平均数即可;
(2)设棉花纤维的长度的75%分位数为,所以即可求解.
【详解】(1)解:由频率分布直方图知,
解得.
最高小矩形底边中点横坐标即为众数,可得众数为.
平均数;
(2)解:设棉花纤维的长度的75%分位数为,
所以,解得.
19.(1);
(2)55;
(3).
【分析】(1)利用频率分布表各小矩形面积和为1,列式计算即得.
(2)根据频率分布直方图求出内的频率,再利用频率乘以样本容量即得.
(3)利用(2)的信息,求出分层抽样的抽样比即可计算得解.
【详解】(1)由频率分布直方图,得,解得,
所以直方图中x的值是.
(2)月平均用电量为的用户有户,
月平均用电量为的用户有户,
月平均用电量为的用户有户,
月平均用电量为的用户有户,
所以月平均用电量不低于度的有户.
(3)由(2)可知,抽取比例为,
所以月平均用电量在的用户中应抽取户.
2 / 2
学科网(北京)股份有限公司
$$