内容正文:
第14章 统计(13题型清单)
01 思维导图
02 知识速记
1.简单随机抽样
(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n()个个体作为样本,如果每次抽取时各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种:随机数法和抽签法.
2.分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
(2)应用范围:总体是由差异明显的几个部分组成的.
(3)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,抽样比 .
3.频率分布表与频率分布直方图
频率分布表与频率分布直方图的绘制步骤如下:
(1)求极差,即求一组数据中最大值与最小值的差;
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与样本容量的比值叫做这一小组的频率,计算各小组的频率,列出频率分布表;
(5)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积.
各个小长方形面积的总和等于1.
4.用样本的数字特征估计总体的数字特征
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小长方形的面积乘小长方形底边中点的横坐标之和
方差和标准差反映了数据波动程度的大小.
方差:;
标准差:.
5.百分位数
(1)把100个样本数据按从小到大排序,得到第p个和第p+1个数据分别为.可以发现,区间内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数,并称此数为这组数据的第p百分位数,或p%分位数.
(2)一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(3)四分位数
常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
03 题型归纳
题型一 总体与样本
例题1:(2024高一下·江苏·专题练习)从某公司600名员工中抽取20名进行体重的统计分析,下列说法正确的是( )
A.600名员工是总体
B.每个被抽查的员工是个体
C.抽取的20名员工的体重是一个样本
D.抽取的20名员工的体重是样本容量
【答案】C
【知识点】总体与样本
【分析】根据统计中样本,总体及样本容量的概念进行判断.
【详解】本题抽取的是20名员工的体重,因此600名员工的体重是总体,
每个员工的体重是个体,这20名员工的体重构成一个样本,样本容量为20.
故ABD错误,C正确;
故选:C.
例题2:(23-24高二·上海·课堂例题)某高校研究人员希望调查该校大学生平均每天的自习时间.他调查了100名大学生,发现他们每天的平均自习时间是3.5h.这里的总体是( )
A.该校的所有大学生
B.该校所有大学生的平均每天自习时间
C.所调查的100名大学生
D.所调查的100名大学生的平均每天自习时间
【答案】B
【知识点】总体与样本
【分析】由总体的概念可得答案.
【详解】某高校研究人员希望调查该校大学生平均每天的自习时间.
他调查了100名大学生,发现他们每天的平均自习时间是3.5h,
这里的总体是该校所有大学生的平均每天自习时间.
故选:B.
例题3:(多选)(23-24高一上·陕西汉中·期末)为了了解参加运动会的1000名运动员的年龄情况,从中抽取了10名运动员的年龄进行统计分析.下列说法中正确的有( )
A.1000名运动员的年龄是总体 B.所抽取的10名运动员是一个样本
C.样本容量为10 D.每个运动员被抽到的机会相等
【答案】ACD
【知识点】总体与样本
【分析】根据抽样方法,利用总体、样本、样本容量的定义逐项判断作答.
【详解】对于A,1000名运动员的年龄是总体,故A正确;
对于B,所抽取的10名运动员的年龄是一个样本,故B错误;
对于C,样本容量为10,故C正确;
对于D,每个运动员被抽到的机会相等,故D正确.
故选:ACD.
巩固训练
1.(2024高三·全国·专题练习)为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行调查分析,在这个问题中,被抽取的200名学生的成绩是( )
A.总体 B.个体
C.样本 D.样本量
【答案】C
【知识点】总体与样本
【分析】根据统计中抽样调查的概念即可得解.
【详解】从5000名学生的成绩中抽取了200名学生的成绩进行调查分析,
总体: 5000名学生的成绩;
个体:每个学生的成绩;
样本: 200名学生的成绩;
样本容量:200,
所以抽取的200名学生的成绩是样本
故选:C.
2.(23-24高一下·山西太原·期末)为了解某校高中3000名学生的身高情况,从中抽取了100名学生进行调查,则这100名学生是( )
A.总体 B.样本 C.样本量 D.个体
【答案】B
【知识点】总体与样本
【分析】根据总体、样本的定义判断即可.
【详解】依题意,从中抽取了100名学生进行调查,则这100名学生是一组样本.
故选:B
3.(23-24高一下·天津河东·期末)为确保食品安全,某市质检部门检查1000袋方便面的质量,抽查总量的.在这个问题中,下列说法正确的是( )
A.总体是指这1000袋方便面 B.个体是1袋方便面
C.样本是按抽取的20袋方便面 D.样本容量为20
【答案】D
【知识点】总体与样本
【分析】根据总体,个体,样本,样本的定义逐一判断即可得解.
【详解】对于A,总体是指这1000袋方便面的质量,故A错误;
对于B,个体是指1袋方便面的质量,故B错误;
对于C,样本是指按照抽取的20袋方便面的质量,故C错误;
对于D,样本容量为,故D正确.
故选:D.
题型二 随机数表法
例题1:(23-24高一下·江苏连云港·期末)总体编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为( )
7816 1572 0802 6315 0216 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.02 B.14 C.15 D.16
【答案】B
【知识点】随机数表法
【分析】结合随机数表法确定正确答案.
【详解】选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,
则选出来的个体的编号为16,15,72(舍去),08,02,63(舍去),15(舍去),
02(舍去),16(舍去),43(舍去),19,97(舍去),14.
故选出的第6个个体编号为14.
故选:B.
例题2:(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
【答案】D
【知识点】随机数表法
【分析】根据随机数表法的应用,按照已知的要求选出五个三个数字组成编号即可.
【详解】依题意从第2行第7列开始的数为67(舍去),62(舍去),42(舍去),81(舍去),14,
57(舍去),20,42(舍去),53(舍去),32,37,32(舍去),14(舍去),16,
则满足条件的5个样本编号为14,20,32,37,16,则第5个编号为16.
故选:D
例题3:(2024高一下·江苏·专题练习)要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4颗种子的编号: .(下面抽取了随机数表第1行至第8行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 24 67 62 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
12 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 76
55 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53 23 83 01 30 30
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
【答案】227,665,650,267
【知识点】随机数表法
【分析】根据随机数表法的定义结合已知条件求解即可
【详解】从随机数表第3行第6列的数2开始向右读,第一个小于850的数字是227,第二个数字是665,第三个数字是650,第四个数字是267,符合题意.
故答案为:227,665,650,267.
巩固训练
1.(24-25高一上·河南南阳·期末)福利彩票“双色球”中红色球的号码由编号01,02,…,33的33个数字组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表(如下表)第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第3个红色球的编号为( )
49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
A.23 B.09 C.20 D.17
【答案】B
【知识点】随机数表法
【分析】利用随机数表进行抽样的具体步骤超出的不选,但没有重复和不足的,依次抽样得出编号.
【详解】左到右依次选取两个数字,依次选取为:21,32,09,
故选:B.
2.(23-24高一下·江苏扬州·期末)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是 .
【答案】09
【知识点】随机数表法
【分析】按照题意依次读出前4个数即可.
【详解】从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,
删除超出范围及重复的编号,符合条件的编号有14,05,11,09,
所以选出来的第4个个体的编号为09.
故答案为:09
3.(2024高一下·江苏·专题练习)一个总体共有60个个体,其编号为00,01,02,…,59,现从中抽取一个容量为10的样本,请从随机数表的第8行第11列的数字开始,向右读,到最后一列后再从下一行左边开始继续向右读,依次获取样本号码,直到取满样本为止,则获得的样本号码是 .
附表:(第8行~第10行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
12 86 73 58 07 44 39 52 38 79(第8行)
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38
15 51 00 13 42 99 66 02 79 54(第9行)
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62
90 52 84 77 27 08 02 73 43 28(第10行)
【答案】16,55,19,10,50,12,58,07,44,39
【知识点】随机数表法
【分析】从第8行第11列的数字为1,由此开始,依次抽取号码所要号码,对于超出标号的数字将其舍去,重复的数字也舍去,直到取满样本为止
【详解】第8行第11列的数字为1,由此开始,依次抽取号码,第一个号码为16,可取出;
第二个号码为95>59,舍去.
按照这个规则抽取号码,抽取的10个样本号码为16,55,19,10,50,12,58,07,44,39.
故答案为:16,55,19,10,50,12,58,07,44,39.
题型三 简单随机抽样的概率
例题1:(23-24高一下·江苏常州·期末)从某班学号为1到10的十名学生(其中含学生甲)中抽取3名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽3次,设甲第一次被抽到的可能性为,第二次被抽到的可能性为,则( )
A., B.,
C., D.,
【答案】D
【知识点】简单随机抽样的概率
【分析】由题意结合简单随机抽样的特征即可确定实数,的值.
【详解】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
因为每次抽取一个号码,所以甲第一次被抽到的可能性为,
第二次被抽到的可能性为.
即甲同学在每次抽样中被抽到的可能性都是,所以,.
故选:D.
例题2:(24-25高一上·全国·课后作业)在简单随机抽样中,某一个个体被抽到的可能性( )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能抽取,但各次抽取的可能性不一定
【答案】B
【知识点】简单随机抽样的特征及适用条件、简单随机抽样的概率
【分析】根据简单随机抽样的性质即可求解.
【详解】在简单随机抽样中,某一个个体被抽到的可能性与第几次抽样无关,每次抽到的可能性都相等,
故选:B
例题3:(23-24高一下·河南安阳)有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中随机抽取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是( )
A.总体是36个篮球 B.样本是4个篮球
C.样本容量是4 D.每个篮球被抽到的可能性不同
【答案】D
【知识点】总体与样本、简单随机抽样的概率
【分析】利用样本、样本容量、总体的意义,逐项分析判断作答.
【详解】依题意,总体是36个篮球,样本是4个篮球,样本容量是4,选项A,B,C都正确;
甲箱抽3个,每个球被抽到的概率为,乙箱抽1个,每个球被抽到的概率为,则每个篮球被抽到的可能性相同,D不正确.
故选:D
巩固训练
1.(2024·四川成都·模拟预测)用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A., B.,
C., D.,
【答案】A
【知识点】简单随机抽样的概率
【分析】根据简单随机抽样的等可能性,即可判断和选择.
【详解】总体有10个个体,从中抽取第一个,若为,则其可能性为,若不为,则其可能性为;
抽取第二个,若其为,则第一次一定不是,再从9个个体中抽取1个,且为,则其可能性为.
综上所述,某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是.
故选:A.
2.(23-24高一下·河北沧州·期末)某班级有60名学生,班主任用不放回的简单随机抽样的方法从这60名学生中抽取5人进行家访,则同学a被抽到的可能性为( )
A. B. C. D.
【答案】A
【知识点】简单随机抽样的特征及适用条件、简单随机抽样的概率
【分析】本题考查简单随机抽样的特点,总体中的每一个个体被抽到的可能性均等.
【详解】总体有60个个体,每个个体被抽到的概率相同,均为.
故选A.
3.(23-24高一下·山西大同·期末)采用简单随机抽样的方法,从含有8个个体的总体中抽取1个容量为2的样本,则某个个体被抽到的概率为( )
A. B. C. D.
【答案】C
【知识点】简单随机抽样的概率
【分析】根据简单抽样每个个体被抽到的概率相等,即可求解.
【详解】由于每个个体被抽到的概率相等,所以每个个体被抽到的概率是.
故选:C.
题型四 简单随机抽样估计总体
例题1:(23-24高三下·湖北·阶段练习)我国古代数学名著《数书九章》是南宋数学家秦九韶所著数学著作,书中共列算题81问,分为9类,全书采用问题集的形式,并不按数学方法来分类.题文也不只谈数学,还涉及自然现象和社会生活,成为了解当时社会政治和经济生活的重要参考文献.《数书九章》中有“米谷粒分”一题,现有类似的题:粮仓开仓收粮,粮农送来米1500石,验得米夹谷,抽样取米一把,数得304粒夹谷30粒,则这批米内夹谷约为( )
A.148石 B.149石 C.150石 D.151石
【答案】A
【知识点】简单随机抽样估计总体
【分析】抽样调查中简单随机抽样,对象被抽到的概率是相同的, 304粒夹谷30粒,1500石米夹谷的比例是相同的,计算即可.
【详解】由题意可知这批米内夹谷约为(石).
故选:A.
例题2:(2024高一下·全国·专题练习)为了调查某市城区一小河流的水体污染状况,就某个指标,某学校甲班的同学抽取了样本量为50的5个样本,乙班的同学抽取了样本量为100的5个样本,得到如下数据:
抽样序号
1
2
3
4
5
样本量为50的平均数
123.1
120.2
125.4
119.1
123.6
样本量为100的平均数
119.8
120.1
121.0
120.3
120.2
据此可以认定 班的同学调查结果能够更好地反映总体,这两个班的同学调查的该项指标约为 .
【答案】 乙 (答案不唯一,只要合理即可)
【知识点】简单随机抽样的特征及适用条件、简单随机抽样估计总体
【分析】由抽样调查的意义即可判断,结合表中数据判断即可.
【详解】由抽样调查的意义可以知道,增加样本量可以提高估计效果,
所以乙班同学的调查结果能更好地反映总体,由表可知,该项指标约为.
故答案为:乙;(答案不唯一,只要合理即可)
例题3:(23-24高二·上海·课堂例题)某购物网站在其首页发布了一项满意度调查,其中一个问题是:“你对本网站的客服是否满意?”浏览该网站的网民可以点击三个按钮“满意”“一般”和“不满意”中的任意一个.结果有1253人选择“满意”,585人选择“一般”,245人选择“不满意”.
(1)此项调查的样本量是多少?
(2)该网站声称有的网民满意其网站客服,判断该说法是否准确,并说明理由.
【答案】(1)
(2)不准确,理由见解析
【知识点】总体与样本、简单随机抽样估计总体
【分析】(1)样本量即为参与调查的总人数,相加即可;
(2)该满意率只能片面的说明当前的调查情况,由于网民很多,故无法准确的反馈出全体网民的意见.
【详解】(1),即样本量为;
(2)不准确,这里的满意率只能代表当前参与调查的人,没办法代表全体网民的情况,因此这种说法是不准确的.
巩固训练
1.(24-25高一上·全国·课后作业)从一批产品中用简单随机抽样的方法抽取了一部分作为样品,检测产品的合格率,其中甲检验员从中抽取了50件产品,其合格率为,乙检验员从中抽取了100件产品,其合格率为,则估计该产品合格率更接近于 检验员检测的结果.
【答案】乙
【知识点】简单随机抽样估计总体
【分析】抽取的样本量越大,样本越具代表性,据此可以得出答案.
【详解】因为乙检验员抽取的样本量更大,所以检测结果更准确.
故答案为:乙.
2.(2024高一下·全国·专题练习)为了调查新疆阿克苏野生动物保护区内鹅喉羚的数量,调查人员逮到这种动物400只,标记后放回.一个月后,调查人员再次逮到该种动物800只,其中标记的有2只,估算该保护区有鹅喉羚 只.
【答案】160000
【知识点】简单随机抽样估计总体
【分析】利用重捕标记法中每只鹅喉羚被逮到的概率是相同的,估计该保护区有鹅喉羚的只数.
【详解】设保护区内有鹅喉羚x只,每只鹅喉羚被逮到的概率是相同的,
所以=,解得x=160000.
故答案为:160000
3.(23-24高一·江苏·课后作业)从一群做游戏的小孩中随机抽出人,一人分一个苹果,让他们返回继续做游戏.过了一会儿,再从中任取人,发现其中有个小孩曾分过苹果,估计参加游戏的小孩的人数为 .
【答案】
【知识点】简单随机抽样估计总体
【分析】根据随机抽样中每个个体被抽到的概率是相等的,列出方程,即可求解.
【详解】设参加游戏的小孩有人,
根据随机抽样中每个个体被抽到的概率是相等的,可得,解得,
即参加游戏的小孩的人数为.
故答案为:.
题型五 分层抽样各层计算
例题1:(23-24高三下·江苏南京·开学考试)某学校高二年级选择“物化生”,“物化地”和“史地政”组合的同学人数分别为240,90和120.现采用分层抽样的方法选出30位同学进行某项调查研究,则“史地政”组合中选出的同学人数为( )
A.8 B.12 C.16 D.6
【答案】A
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】根据分层抽样的定义列出式子,进行求解.
【详解】由题意得,史地政”组合中选出的同学人数为.
故选:A
例题2:(23-24高一下·江苏常州·期末)某学校高一年级选择“物化生”、“物化地”、“物化政”和“史政地”组合的同学人数分别为240、120、90和150.现采用分层抽样的方法选出20位同学进行一项调查研究,则“史政地”组合中选出的同学人数为( )
A.8 B.4 C.3 D.5
【答案】D
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】根据分层抽样计算规则计算可得.
【详解】依题意“史政地”组合中选出的同学人数为人.
故选:D
例题3:(多选)(2024·江苏苏州·模拟预测)在某次数学练习中,高三班的男生数学平均分为120,方差为2,女生数学平均分为112,方差为1,已知该班级男女生人数分别为25、15,则下列说法正确的有( )
A.该班级此次练习数学成绩的均分为118
B.该班级此次练习数学成绩的方差为16.625
C.利用分层抽样的方法从该班级抽取8人,则应抽取5名男生
D.从该班级随机选择2人参加某项活动,则至少有1名女生的概率为
【答案】BCD
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】利用均值、方差、分层随机抽样、古典概型等知识逐项判断即可.
【详解】对于A,该班级此次练习数学成绩的均分,故A错误;
对于B,该班级此次练习数学成绩的方差
,故B正确;
对于C,利用分层抽样的方法从该班级抽取8人,则应抽取的男生人数为,C正确;
对于D,从该班级随机选择2人参加某项活动,则至少有1名女生的概率,故D正确.
故选BCD.
巩固训练
1.(23-24高一下·江苏苏州·期末)某工厂生产A,B,C,3种不同型号的产品,产量之比为.现用分层抽样的方法抽取1个容量为的样本,若样本中A种型号的产品有18件,则样本容量( )
A.40 B.60 C.80 D.100
【答案】B
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】运用分层抽样知识可解.
【详解】分层抽样抽样比为,样本中A种型号的产品有18件,
则样本中B,C种型号的产品有12件,30件.则样本容量.
故选:B.
2.(23-24高一下·江苏无锡·阶段练习)某单位有青年职工160人,中年职工人数180人,老年职工有90人,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.16 B.18 C.27 D.36
【答案】B
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】先计算出抽样比,然后利用老年职工人数乘上抽样比即可.
【详解】解:因为样本中有青年职工32人,所以抽样比为:,
所以样本中的老年职工人数为,
故选:B.
3.(多选)(23-24高一下·江苏淮安·期末)某学校为了解学校学生视力健康状况,降低学生近视率,增强学生爱眼护眼意识,对三个年级的学生视力健康状况进行调研,已知高一、高二、高三的学生人数之比为4:3:3,现用分层抽样方法抽取一个容量为 n的样本,样本中高一年级学生人数为200人,则( )
A.该校三个年级总的学生数为5000人 B.样本容量n为500
C.该校高二年级总的学生数有1500人 D.样本中高二年级学生数为150人
【答案】BD
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】利用分层抽样性质确定抽样比即可求解.
【详解】设样本中高二、高三的学生人数分别为a,b,
则,
则,故D正确,
故样本容量,故B正确;
无法确定该校三个年级总的学生数和该校高二年级总的学生数,故AC错误;
故选:BD
题型六 分层抽样中的概率
例题1:(2024·湖北·模拟预测)从一个容量为的总体中抽取一个容量为3的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是,则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是( )
A. B. C. D.
【答案】A
【知识点】分层抽样的概率
【分析】由简单随机和随机抽样,每个个体被抽中的概率相等的特点可得答案.
【详解】
随机抽样每个个体被抽到的概率相等,
选取分层抽样抽取样本时总体中每个个体被抽中的概率仍为,
故选:A
例题2:(2024高三·全国·专题练习)某校要从高一、高二、高三共2 023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 023名学生中剔除23名,再从剩下的2 000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性( )
A.都相等且为 B.都相等且为
C.不完全相等 D.均不相等
【答案】A
【知识点】简单随机抽样的概率、分层抽样的概率
【分析】根据简单随机抽样和分层抽样都是等可能抽样得到答案.
【详解】根据简单随机抽样及分层随机抽样的定义可得,每个个体被抽到的概率都相等,所以每个个体被抽到的概率都等于
故选:A.
例题3:(23-24高二上·黑龙江大庆·开学考试)从一个容量为(,)的总体中抽取一个容量为的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是,则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是( )
A. B. C. D.
【答案】D
【知识点】简单随机抽样的概率、分层抽样的概率
【分析】利用随机抽样每个个体被抽到的概率相等即得解
【详解】随机抽样每个个体被抽到的概率相等,
选取分层抽样抽取样本时总体中每个个体被抽中的概率仍为
故选:D
【点睛】本题考查了随机抽样每个个体被抽到的等可能性,考查了学生概念理解能力,属于基础题
巩固训练
1.(23-24高一下·天津滨海新)从一个容量为100的总体中抽取容量为10的样本,选取简单随机抽样和分层随机抽样两种不同方法抽取样本.在简单随机抽样中,总体中每个个体被抽中的概率为,某个体被抽中的概率为;在分层随机抽样中,总体中每个个体被抽中的概率为,则( )
A. B.
C. D.之间没有关系
【答案】B
【知识点】简单随机抽样的概率、分层抽样的概率
【分析】根据简单随机抽样、分层抽样的定义即可得到结论.
【详解】根据抽样调查的原理可得简单随机抽样,分层抽样都必须满足每个个体被抽到的概率相等,即.
故选:B
【点睛】本题考查简单随机抽样、分层抽样的原理的理解,两种抽样都是等可能抽取,是一道容易题.
2.(23-24高一下·江苏泰州·阶段练习)在 120 个零件中,一级品 24 个,二级品 36 个,三级品 60 个,从中抽取容量为 20 的一 个样本,则每个个体被抽到的可能性为( )
A. B. C. D.
【答案】D
【知识点】分层抽样的概率
【分析】根据抽样过程中每个个体被抽到的概率是均等的,结合题意,即可求解.
【详解】根据抽样的概念知,在抽样过程中每个个体被抽到的概率是均等的,
所以每个个体被抽到的可能性为
故选:D.
3.(23-24高二上·福建·阶段练习)某地区高中分三类,A类学校共有学生2000人,B类学校共有学生3000人,C类学校共有学生4000人,若采取分层抽样的方法抽取900人,则A类学校中的学生甲被抽到的概率( )
A. B. C. D.
【答案】D
【知识点】分层抽样的概率
【分析】利用抽样的性质求解
【详解】所有学生数为,
所以所求概率为.
故选:D
题型七 扇形图,折线图,条形图
例题1:(2024高一下·江苏·专题练习)某校公布了该校反映各年级学生体育达标情况的两张统计图(如图),该校七、八、九三个年级共有学生800人,甲、乙、丙三个同学看了这两张统计图后,甲说:“七年级的体育达标率最高”.乙说:“八年级共有学生264人.”丙说:“九年级的体育达标率最高.”甲、乙、丙三个同学中,说法正确的是( )
A.甲和乙 B.乙和丙
C.甲和丙 D.甲、乙和丙
【答案】B
【知识点】根据条形统计图解决实际问题、根据扇形统计图解决实际问题
【分析】根据统计图表数据分别求出达标率,即可判断.
【详解】由扇形统计图可得八年级共有学生(人),
七年级共有学生(人),
九年级共有学生(人),
所以七年级的达标率为;
九年级的达标率为;
八年级的达标率为.
则九年级的达标率最高,则乙、丙的说法是正确的.
故选:B.
例题2:(多选)(2024高一下·江苏·专题练习)(多选)某报告显示:我国农民工收入持续快速增长.某地区农民工人均月收入增长率如图①,并将人均月收入绘制成如图②的不完整的条形统计图.
根据以上统计图,以下说法正确的是( )
A.2020年农民工人均月收入的增长率是10%
B.2018年农民工人均月收入是2 205元
C.小明认为“农民工2019年的人均月收入比2018年的少了”
D.2016年到2020年这五年中,2020年农民工人均月收入最高
【答案】ABD
【知识点】根据条形统计图解决实际问题、根据折线统计图解决实际问题
【分析】由折线统计图和条形统计图中数据分析,作出判断.
【详解】A选项,由折线统计图,知2020年农民工人均月收入的增长率是10%,则A正确;
B选项,由条形统计图,知2018年农民工人均月收入是2205元,则B正确;
C选项,由题图,知2019年农民工人均月收入为,故C说法错误.
D选项,由条形统计图,知2016年到2020年这五年中,2020年农民工人均月收入最高,则D说法正确.
故选:ABD.
例题3:(多选)(24-25高一上·河南南阳·期末)下图是2003年4月21日至5月15日上午10时,北京市非典型肺炎疫情新增数据走势图.
则下列说法正确的有( )
A.新增疑似的人数最多的是4月29日,新增确诊的人数最多的是4月27日
B.新增疑似的人数最多的是4月27日,新增确诊的人数最多的是4月29日
C.新增治愈的人数最多的是5月13日,新增死亡的人数最少的是5月15日
D.从图中可以看出,本次疫情得到了有效控制
【答案】BCD
【知识点】根据折线统计图解决实际问题
【分析】利用折线图提供的数据和变化趋势直接求解.
【详解】新增疑似的人数最多的是4月27日162例,新增确诊的人数最多的是4月29日157例,故A错误,B正确;
新增治愈的人数最多的是5月13日35例,新增死亡的人数最少的是5月15日1例,故C正确;
由图,预测这次北京市非典型性肺炎疫情的发展趋势为:疫情初期确诊病例和疑似病例数量快速上升,然后确诊病例和疑似病例数量逐渐下降,本次疫情得到了有效控制,故D正确.
故选:BCD.
巩固训练
1.(多选)(2024高一下·江苏·专题练习)为比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述正确的是( )
A.甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值
B.甲的数学建模能力指标值优于乙的直观想象能力指标值
C.乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平
D.甲的数学运算能力指标值优于甲的直观想象能力指标值
【答案】AC
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】利用雷达图对每一个选项的命题逐一分析推理得解.
【详解】对于A,甲的逻辑推理能力指标值为4,优于乙的逻辑推理能力指标值为3,故A正确.
对于B,甲的数学建模能力指标值为3,乙的直观想象能力指标值为5,
所以乙的直观想象能力指标值优于甲的数学建模能力指标值,故B错误.
对于C,甲的六维能力指标值的平均值为,
乙的六维能力指标值的平均值为,因为,故C正确.
对于D,甲的数学运算能力指标值为4,甲的直观想象能力指标值为5,
所以甲的数学运算能力指标值不优于甲的直观想象能力指标值,故D错误.
故选:AC.
2.(多选)(24-25高一上·河北保定·期末)改革开放以来,某地区率先推进经济转型升级和高质量发展,成功实现从传统的农业、工业化经济向现代化服务型、创新型、数字经济转化,实现了从粗放型增长向高质量发展的迈进.该地区经过近十年的发展,经济总收入增加了两倍,下图统计了该地区经济转型前和经济转型后经济总收入的构成比例,则下面结论中正确的是( )
A.经济转型后,农业收入减少
B.经济转型后,工业收入增加了一倍以上
C.经济转型后,其他产业收入是转型前的两倍以上
D.经济转型后,第三产业收入超过了经济转型前经济总收入
【答案】BCD
【知识点】根据扇形统计图解决实际问题
【分析】设该地区经济转型前经济总收入为,经济转型后经济总收入为.通过选项逐一分析经济转型前后经济收入情况,利用数据推出结果.
【详解】设该地区经济转型前经济总收入为,经济转型后经济总收入为.由图可知:
A项,经济转型后农业收入,经济转型前农业收入,
故转型后,农业收入增加了,故A项错误.
B项,经济转型后工业收入,经济转型前工业收入,故转型后,工业收入增加了一倍以上,故B项正确.
C项,经济转型后其他产业收入,经济转型前其他产业收入,故转型后,其他产业收入是转型前的两倍以上,故C项正确.
D项,经济转型后第三产业收入,经济转型前经济总收入,故转型后,第三产业收入超过经济转型前经济总收入,D正确.
故选:BCD
3.(多选)(24-25高一上·安徽宿州·期末)2021年某地居民人均可支配收入的构成比例如图所示,已知该地居民人均经营净收入为5250元,则( )
A.2021年该地居民人均经营净收入占居民人均可支配收入的21%
B.2021年该地居民人均可支配收入为25000元
C.2021年该地居民人均转移净收入低于人均经营净收入
D.2021年该地居民人均工资性收入比人均转移净收入多6750元
【答案】ABD
【知识点】根据扇形统计图解决实际问题
【分析】利用给定的饼状图,逐项分析计算判断.
【详解】对于A,2021年该地居民人均经营净收入占居民人均可支配收入的百分比为,A正确;
对于B,2021年该地居民人均可支配收入为(元),B正确;
对于C,由,得2021年该地居民人均转移净收入高于人均经营净收入,C错误;
对于D,2021年该地居民人均工资性收入为(元),
人均转移净收入为(元),,D正确.
故选:ABD
题型八 频率分布直方表(图)
例题1:(23-24高一下·江苏连云港·期末)根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和三个月以上六个月以下暂扣驾驶证,并处500元以上2000元以下罚款.2024年3月以来,某地区交警查处酒后驾车和醉酒驾车共20人.如图,这是对这20人酒后驾车血液中酒精含量进行检测所得结果的频率直方图,则属于醉酒驾车的人数约为( )
A.1 B.2 C.3 D.4
【答案】C
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】根据频率分布直方图求出频率,即可估计人数.
【详解】由频率分布直方图可知酒精浓度在80mg/100ml(含80)以上的频率为,
所以样本中属于醉酒驾车的人数约为人.
故选:C
例题2:(2024高三·全国·专题练习)某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是( )
A.4 B.5
C.8 D.10
【答案】B
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、频率分布直方图的实际应用
【分析】先设从左到右前3个小组的频率分别为x,2x,3x,第5小组的频数是y,由频率之和为1结合题设列出关于的方程组求出即可得解.
【详解】设从左到右前3个小组的频率分别为x,2x,3x,第5小组的频数是y,
则,解得.
故选:B.
例题3:(24-25高一上·江西抚州·阶段练习)某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组抽样结果绘成的频率分布直方图如图所示,则实数 .
【答案】
【知识点】补全频率分布直方图
【分析】由频率分布直方图结合频率和为1可得答案.
【详解】由图可得各分组频率之和为:
因各分组频率之和为1,则
故答案为:0.14.
巩固训练
1.(2024高二上·黑龙江·学业考试)下图是某班学生的一次数学测试成绩的频率分布直方图,则该班学生数学成绩平均数的估计值为( )
A.80 B.85 C.97 D.110
【答案】C
【知识点】由频率分布直方图估计平均数
【分析】根据频率分布直方图中平均数的计算公式求解即可.
【详解】由频率分布直方图中平均数的计算公式,可得该班数学测试的平均成绩:
.
故选:C.
2.(23-24高一下·广东广州·阶段练习)要调查某地区高中学生身体素质,从高中生中抽取100人进行跳远测试,根据测试成绩制作频率分布直方图如下图,现再从这100人中用分层抽样的方法抽取20人,应从间抽取人数为b,则b为( )
A.4 B.5 C.6 D.7
【答案】C
【知识点】抽样比、样本总量、各层总数、总体容量的计算、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】先由频率之和为解得值,计算可得之间的学生人数,根据抽样比可求得.
【详解】由题得,所以.
在之间的学生:人,
现再从这人中用分层抽样的方法抽取人,
应从间抽取人数为,故.
故选:C.
3.(23-24高一下·广东广州·期末)从某小区抽取100户层民用户进行月用电量调查,发现他们的月用电量都在之间,进行适当分组后(每组为左用右开的区间),画出频率分布直方图如图所示,在被调查的用户中,月用电量落在区间内的户数为 .
【答案】
【知识点】补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】首先求出参数的值,再求出月用电量落在区间的频率,即可得解.
【详解】由频率分布直方图可得,解得,
所以月用电量落在区间的频率为,
所以在被调查的用户中,月用电量落在区间内的户数为.
故答案为:
题型九 平均数,众数,中位数有关的计算
例题1:(24-25高二上·江苏盐城·阶段练习)一组数据按从小到大的顺序排列如下:11,12,15,,18,20,22,26,经计算,该组数据的中位数是17,则x的值为( )
A.15 B.16 C.17 D.18
【答案】B
【知识点】计算几个数的中位数
【分析】由中位数的定义即可求解.
【详解】由数据11,12,15,,18,20,22,26,
可知:中位数,
解得:.
故选:B
例题2:(24-25高三上·江苏南通·开学考试)已知实数,则使和最小的实数分别为的( )
A.平均数;平均数 B.平均数;中位数
C.中位数;平均数 D.标准差;平均数
【答案】C
【知识点】计算几个数的中位数、计算几个数的平均数
【分析】结合绝对值的几何意义和二次函数,根据中位数和平均数的定义判断即可.
【详解】,表示2025个绝对值之和,
根据绝对值的几何意义知,绝对值的和的最小值表示距离和的最小值,
因为2025为奇数,所以取的中位数时,有最小值;
为关于的一元二次函数,
故当时,有最小值,
即为的平均数时,有最小值.
故选:C
例题3:(多选)(24-25高三上·江苏南通·阶段练习)已知一组数据1,2,3,5,5,6,则特征量为5的是( )
A.平均数 B.中位数 C.众数 D.极差
【答案】CD
【知识点】计算几个数的众数、计算几个数的中位数、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】根据极差、众数、中位数与平均数的定义判断即可.
【详解】极差为,众数为,中位数为,
平均数,故A、B错误,CD正确.
故选:CD.
巩固训练
1.(23-24高一下·江苏常州·期末)一个射击选手连续射击10次,成绩如下:
成绩/环数
10
9
8
7
次数
2
4
3
1
则该选手射击成绩的中位数为( )
A.8 B.9 C.9.5 D.8.7
【答案】B
【知识点】计算几个数的中位数
【分析】根据题意结合中位数的定义分析判断.
【详解】将射击成绩按升序排列可得:,
所以该选手射击成绩的中位数为第5位数和第6位数的平均数,即为.
故选:B.
2.(24-25高三上·江苏南通·阶段练习)采用分层随机抽样方法对某校共600名高三年级学生的身高(单位:厘米)进行调查,估计得到该年级男生、女生和全体学生的平均身高分别为170.0,160.4,165.6,则该年级的男生人数约为( )
A.315 B.320 C.325 D.330
【答案】C
【知识点】分层抽样的特征及适用条件、计算几个数的平均数
【分析】设该年级的男生人数为,由题意可得,计算即可.
【详解】设该年级的男生人数为,则女生人数为,
则,
即,
即,
所以.
故选:C.
3.(多选)(24-25高三上·江苏苏州·开学考试)已知一组数据的平均数为,另一组数据的平均数为.若数据的平均数为,则 ( )
A.当时, B.当时,
C.当时, D.当时,
【答案】ACD
【知识点】计算几个数的平均数
【分析】对于A,C,D运用分层抽样的平均数公式,结合已知条件计算判断;对于B,举反例判断.
【详解】当时, ,A正确;
当时,取则m与n不一定相等,B错误;
当时, ,C正确;
当时,,有,故
即,所以,D正确.
故选:ACD.
题型十 平均数,众数,中位数有关的估计值
例题1:(多选)(2024·福建漳州·一模)某学校举行消防安全意识培训,并在培训前后对培训人员进行消防安全意识问卷测试,所得分数(满分:100分)的频率分布直方图如图所示,则( )
A.培训前得分的中位数小于培训后得分的中位数
B.培训前得分的中位数大于培训后得分的中位数
C.培训前得分的平均数小于培训后得分的平均数
D.培训前得分的平均数大于培训后得分的平均数
【答案】AC
【知识点】由频率分布直方图估计中位数、由频率分布直方图估计平均数
【分析】根据题意结合中位数的性质判断AB;结合平均数的定义判断CD.
【详解】由频率分布直方图可知:两个频率直方图均为单峰。
且培训前直方图在右侧拖尾,培训后直方图在左侧拖尾,
可知培训前的中位数小于75,培训后的中位数大于75,
所以培训前得分的中位数小于培训后得分的中位数,故A正确,B错误;
设培训前每组的频率依次为,
则培训后每组的频率依次为,
则培训前平均数估计为,
培训后平均数估计为,
则,
可得,即培训前得分的平均数小于培训后得分的平均数,故C正确,D错误;
故选:AC.
例题2:(23-24高一上·江西上饶·期末)某校在上饶市期末数学测试中为统计学生的考试情况,从学校的1000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组,第二组,……第八组,如图是按上述分组方法得到的频率分布直方图的一部分.
(1)求第八组的频率,并完成频率分布直方图;
(2)用样本数据估计该校的1000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值)和中位数(保留小数点后面一位)
【答案】(1),频率直方图见解析
(2),
【知识点】补全频率分布直方图、由频率分布直方图估计中位数、由频率分布直方图估计平均数
【分析】(1)根据频率分布直方图的性质,建立方程,求得频率,补全频率分布直方图,可得答案;
(2)先根据平均数的计算公式求平均数,然后利用中位数的定义列方程求解即可.
【详解】(1)因为各组的频率和等于1,故第八组的频率为:,
则第八组对应矩形的高为,补全频率分布直方图如图所示:
(2)用样本数据估计该校的1000名学生这次考试成绩的平均分为:
(分);
因为,,
所以中位数在内,
设中位数为x,则,解得;所以估计中位数是分.
例题3:(23-24高一上·江西吉安·期末)2022年起,某省将实行“”高考模式,为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高三年级学生的生物成绩进行赋分,具体赋分方案如下:先按照考生原始分从高到低按比例划定A、B、C、D、E共五个等级,然后在相应赋分区间内利用转换公式进行赋分A等级排名占比15%,赋分分数区间是86-100;B等级排名占比35%,赋分分数区间是71-85:C等级排名占比35%,赋分分数区间是56-70:D等级排名占比13%,赋分分数区间是41-55;E等级排名占比2%,赋分分数区间是30-40;现从全年级的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:
(1)求图中a的值;
(2)求抽取的这100名学生的原始成绩的众数、平均数和中位数;
(3)用样本估计总体的方法,估计该校本次生物成绩原始分不少于多少分才能达到赋分后的B等级及以上(含B等级)?(结果保留整数)
【答案】(1)
(2)众数75分;中位数分,平均数71分
(3)74分
【知识点】补全频率分布直方图、由频率分布直方图估计中位数、由频率分布直方图估计平均数、根据频率分布直方图计算众数
【分析】(1)由各组频率之和为1列方程求解即可;
(2)由频率分布直方图中众数、平均数和中位数的计算公式代入即可得出答案;
(3)已知等级达到B及以上所占排名等级占比为,即为频率分布直方图的中位数,求解即可.
【详解】(1)由题意,解得;
(2)抽取的这100名学生的原始成绩的众数的估计值为分;
由频率直方图可得前三组的频率和为,
前四组的频率和为,故中位数落在第四组,
设中位数为x,则,解得,
故抽取的这100名学生的原始成绩的中位数的估计值为分,
抽取的这100名学生的原始成绩的平均数的估计值为:
分;
(3)由已知等级达到B及以上所占排名等级占比为,
由(2)可得,中位数,
故原始分不少于74分才能达到赋分后的B等级及以上.
巩固训练
1.(23-24高一下·新疆喀什·期末)某校从参加高一年级期末考试的学生中抽出名学生,将其成绩(均为整数)分成六段后,画出如图所示部分频率分布直方图.观察图形,回答下列问题:
(1)求第四小组的频率,并补全这个频率分布直方图;
(2)估计这次考试成绩的中位数(结果取整数值);
(3)估计这次考试的众数、平均分.
【答案】(1),直方图见解析
(2)73
(3)众数是75,平均分71
【知识点】补全频率分布直方图、由频率分布直方图估计中位数、由频率分布直方图估计平均数、根据频率分布直方图计算众数
【分析】(1)根据频率和等于1,即可求解;(2)根据中位数平分直方图的面积,列出方程求解即可;(3)根据众数的定义及平均数的计算公式求解即可.
【详解】(1)因为各组的频率和等于1,
故第四组的频率:
直方图如图所示.
(2)成绩在的频率为
成绩在的频率为:,中位数在内.
设中位数为,
中位数要平分直方图的面积
,
解得即中位数为.
(3)频率最大的是组,则众数是;
利用组中值估算抽样学生的平均分为:
估计这次考试的平均分是分.
2.(23-24高一下·河南商丘·阶段练习)某学校为了解学校食堂的服务情况,随机调查了50名就餐的教师和学生.根据这50名师生对食堂服务质量的评分,绘制出了如图所示的频率分布直方图,其中样本数据分组为,,…,.
(1)求频率分布直方图中a的值和样本的众数.
(2)若采用分层抽样的方式从评分在,,的师生中抽取10人,则评分在内的师生应抽取多少人?
(3)学校规定:师生对食堂服务质量的评分的均值不得低于75分,否则将进行内部整顿.用每组数据的中点值代替该组数据,试估计该校师生对食堂服务质量评分的平均分,并据此回答食堂是否需要进行内部整顿.
【答案】(1);众数为
(2)5(人)
(3)平均分为;食堂不需要内部整顿
【知识点】抽样比、样本总量、各层总数、总体容量的计算、补全频率分布直方图、由频率分布直方图估计平均数、根据频率分布直方图计算众数
【分析】(1)根据频率分布直方图中所有小矩形面积之和为得到方程,求出,再由最高小组的组中值即为众数;
(2)根据频率分布直方图求出频率之比,再按照分层抽样计算可得;
(3)根据频率分布直方图中平均数公式计算平均数即可判断;
【详解】(1)解:由,
解得.
众数为
(2)解:由频率分布直方图可知,
评分在,,内的师生人数之比为
,
所以评分在内的师生应抽取(人).
(3)解:由题中数据可得师生对食堂服务质量评分的平均分为
.
因为,所以食堂不需要内部整顿.
3.(2024高一·全国·专题练习)某中学为了了解全校学生五一小长假参加实践活动的情况,抽查了100名学生,统计他们参加实践活动的时间(单位:h),绘制成频率分布直方图如图所示.估计这100名学生参加实践活动时间的众数、中位数和平均数.
【答案】7h;7.2h;7.16h
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计中位数、由频率分布直方图估计平均数、根据频率分布直方图计算众数
【分析】根据频率分布直方图,得出组距,面积和高度等,结合相关公式即可求出实践活动时间的众数、中位数和平均数.
【详解】由题意,频率分布直方图中最高矩形所在的区间的中点值为7,由此估计这100名学生参加实践活动时间的众数为7h.
因为前两个小矩形的面积为,第三个小矩形的面积是0.3,所以中位数在第三组.
设中位数为x,则,解得,估计这100名学生参加社会实践活动时间的中位数为7.2h.
利用平均数的计算公式,得平均数为,
即估计这100名学生参加实践活动时间的平均数为7.16h.
题型十一 百分位数
例题1:(24-25高三上·江苏南通·阶段练习)已知一组数据,,,,的下四分位数是,则的可能取值为( )
A. B. C. D.
【答案】D
【知识点】总体百分位数的估计
【分析】根据百分位数的定义求数据的下四分位数即可.
【详解】一共有个数据,,
故数据的下四分位数为从数据从小排到大的每2个数据,所以.
故选:D.
例题2:(24-25高三上·江苏苏州·开学考试)“绿水青山就是金山银山”的理念深入人心,人民群众的生态境获得感、幸福感、安全感不断提升.某校高一年级举行环保知识竞赛,共500人参加,若参赛学生成绩的第60百分位数是80分,则关于竞赛成绩不小于80分的人数的说法正确的是( )
A.至少为300人 B.至少为200人
C.至多为300人 D.至多为200人
【答案】B
【知识点】总体百分位数的估计
【分析】根据百分位数的定义判断.
【详解】由题意,,因此竞赛成绩不小于80分的人数至少有人,
故选:B.
例题3:(多选)(24-25高二上·江苏盐城·阶段练习)走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.如图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是( )
A.这一星期内甲的日步数的中位数为11600
B.这一星期内甲的日步数的极差大于乙的日步数的极差
C.这一星期内乙的日步数的方差大于甲的日步数的方差
D.这一星期内乙的日步数的上四分位数是7030
【答案】CD
【知识点】计算几个数的中位数、计算几个数据的极差、方差、标准差、总体百分位数的估计
【分析】对于A直接求出中位数,对于B分别计算出甲、乙日步数的极差即可判断,对于C由折线图中数据的波动性即可判断,对于D将乙的日步数从小到大排列计算百分位数可得.
【详解】对于A,甲的日步数从小到大排列为:2435,7965,9500,11600,12700,16000,16800,中位数是11600,故A正确;
对于B,甲的日步数极差为,乙的日步数极差为,所以甲的日步数的极差大于乙的日步数的极差,故B正确;
对于C,由折线图可以看出,甲的日步数的波动性大于乙的日步数的波动性,所以,故C错误;
对于D,乙的步数从小到大排列为:5340,7030,10060,11600,12300,12970,14200,
,故这一星期内乙的日步数的上四分位数为12970,故D错误.
故选:CD.
巩固训练
1.(24-25高三上·江苏镇江·开学考试)已知一组数据:4,6,7,9,11,13,则这组数据的第50百分位数为( )
A.6 B.7 C.8 D.9
【答案】C
【知识点】总体百分位数的估计
【分析】借助百分位数定义计算即可得.
【详解】由,故这组数据的中位数为.
故选:C.
2.(多选)(24-25高二上·江苏南京·阶段练习)国庆期间,某校开展“弘扬中华传统文化,传承中华文明”主题活动知识竞赛.赛前为了解学生的备赛情况,组织对高一年级和高二年级学生的抽样测试,测试成绩数据处理后,得到如下频率分布直方图,则下面说法正确的是( )
A.
B.高一年级抽测成绩的众数为75
C.高二年级抽测成绩的70百分位数为87
D.估计高一年级学生成绩的平均分低于高二年级学生成绩的平均分
【答案】ABD
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、总体百分位数的估计
【分析】根据频率分步直方图、样本的数字特征等基础知识判断即可.
【详解】对于A:由,解得,正确;
对于B:由频率分布直方图可知高一年级抽测成绩的众数为75,正确;
对于C:因为,由,
,所以70百分位数是,故错误;
对于D:高一年学生成绩的平均数约为分;
高二年学生成绩的平均数约为分,
因为,故正确;
故选:ABD
3.(23-24高一下·江苏南京·期末)数据4,1,6,2,9,5,8的60百分位数为 .
【答案】6
【知识点】总体百分位数的估计
【分析】代入百分位数公式,即可求解.
【详解】数据从小到大排序:1,2,4,5,6,8,9,共7个,
,
故第60百分位数为第5个数据,为6.
故答案为:6.
题型十二 方差 标准差的计算
例题1:(多选)(2024·江苏无锡·模拟预测)某校团委为泙价5个社团暑期开展活动的情况,在各社团中分别抽取部分社员进行调查.若各社团抽取的社员人数的平均数为8,方差为4,则各社团被抽取的社员人数的最大值可能为( )
A.13 B.12 C.11 D.10
【答案】BC
【知识点】根据平均数求参数、根据方差、标准差求参数
【分析】根据题意可得,分类讨论最大值,结合选项分析判断.
【详解】因为,则,
且,
则,
不妨设最大,
1.若,则不成立,故A错误;
2.若,例如,满足题意,故B正确;
3.若,例如,满足题意,故C正确;
4.若,则,
可得,可知该方程组无正整数解,故D错误;
故选:BC.
例题2:(23-24高一下·江苏南通·阶段练习)为获得某中学高一学生的身高(单位:)信息,采用随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的均值为176,标准差为10,女生样本的均值为166,标准差为20.则总样本的方差为 .
【答案】275
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】根据总体方差公式即可求解.
【详解】记男生样本的均值为,方差为,女生样本的均值为,方差为,容量为50的样本均值为,方差为,
则,,所以,
.
故答案为:275.
例题3:(23-24高一下·浙江绍兴·期中)为了了解学生躯干、腰、髋等部位关节韧带和肌肉的伸展性、弹性等,某学校对在校1500名学生进行了一次坐位体前屈测试,采用按学生性别比例分配的分层随机抽样抽取75人,已知这1500名学生中男生有900人,且抽取的样本中男生的平均数和方差分别为和,女生的平均数和方差分别为和.
(1)求样本中男生和女生应分别抽取多少人;
(2)求抽取的总样本的平均数,并估计全体学生的坐位体前屈成绩的方差.
【答案】(1)45;30;
(2)平均数;方差16.
【知识点】抽样比、样本总量、各层总数、总体容量的计算、估计总体的方差、标准差
【分析】(1)首先计算抽样比,再计算男生和女生应抽取的人数;
(2)代入总体平均数公式和方差公式,即可求解.
【详解】(1)总体容量1500,样本容量75,则抽样比为,
所以样本中男生数量,女生数量.
(2)抽取的样本中男生的平均数,方差,
抽取的样本中女生的平均数,方差,
所以总体样本的平均数为,
总体样本的方差.
所以估计高三年级全体学生的坐位体前屈成绩的方差为16.
巩固训练
1.(多选)(2024·江苏泰州·模拟预测)已知,有一组数据为,3,,,8,10,,12,13,若在这组数据中去除第5个数8,则( )
A.平均数不变 B.中位数不变 C.方差不变 D.极差不变
【答案】AD
【知识点】计算几个数的中位数、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】根据平均数,中位数,方差,极差的定义及计算公式逐一判断即可.
【详解】原数据的平均数为,
去除第5个数8后的平均数为,
所以平均数不变,故A正确;
当时,原数据的中位数为,
去除第5个数8后的中位数为,
此时中位数改变,故B错误;
对于C,原数据的方差
,
去除第5个数8后的方差,
所以,即方差改变,故C错误;
对于D,因为,所以这个数对于极差没有影响,即极差不变,故D正确.
故选:AD.
2.(24-25高一上·江苏·假期作业)为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,采用分层随机抽样方法抽取了90名男员工、50名女员工的身高和体重数据,计算得到他们的值.男女员工的值的中位数、平均数、标准差、方差和极差如表所示.
中位数
平均数
标准差
方差
极差
男员工
21.6
22.1
3.7
14.3
19.3
女员工
19.6
20.7
4
16.4
17.7
从以上数据可以估算出该公司全体人员的值的平均值为 ,方差为 .(以上结果精确到
【答案】 21.6 15.5
【知识点】计算几个数的平均数、估计总体的方差、标准差
【分析】根据题意,由总体的平均数、方差计算公式直接计算可得答案.
【详解】根据题意,样本中,有90名男员工、50名女员工,
该公司全体人员的值的平均值;
方差.
故答案为:21.6;15.5.
3.(23-24高三上·陕西榆林·期中)(1)已知甲乙两名同学的某次体育项目测试成绩分别为:甲:10,13,12,14,16.乙:13,14,12,12,14.求甲乙两人成绩的平均数与方差,比较谁的成绩更稳定.
(2)某学校为了调查学生的学习情况,现用分层抽样的方法抽取样本,若样本中有20名男生,30名女生,且男生的平均成绩为70分,方差为4,女生的平均成绩为80分,方差为6,求所抽取样本的方差.
【答案】(1)甲同学的平均分为13,方差为4;乙同学的平均分为13,方差为;乙同学的成绩较稳定;
(2)29.2
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、用方差、标准差说明数据的波动程度
【分析】(1)根据平均数和方差的计算公式,结合方差的意义进行分析判断;
(2)将总体平均分代入总体方差公式即可求得总方差.
【详解】(1)设甲同学的平均分为,方差为;乙同学的平均分为,方差为;
,
,
,
,
因为,
所以乙同学的成绩较稳定.
(2)由题意,样本平均数为,
所以样本方差为:.
题型十三 平均数,方差性质
例题1:(23-24高一下·江苏南京·期末)已知数据的平均数为10,方差为5,数据的平均数为,方差为,则( )
A. =10,=14 B. =9,=44
C. =29,=45 D. =29,=44
【答案】C
【知识点】计算几个数的平均数、各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】根据平均数和方差公式计算即可.
【详解】解:原来数据平均值为,方差为则,
方差为
.
故选:C.
例题2:(23-24高一下·江苏南京·期末)若的方差为3,则的方差为( )
A.3 B.6 C.9 D.12
【答案】D
【知识点】计算几个数据的极差、方差、标准差、各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】根据方差的性质进行求解.
【详解】的方差为3,
的方差为.
故选:D
例题3:(23-24高一下·江苏盐城·期末)若,,,的方差为2,则,,,的方差为 .
【答案】18
【知识点】各数据同时乘除同一数对方差的影响、各数据同时加减同一数对方差的影响、计算几个数据的极差、方差、标准差
【分析】法一:利用方差公式求解即可,法二:利用方差的定义直接求解.
【详解】方法一:因为,,,的方差为2
所以,,,的方差为;
方法二:设,,,的平均数为,则,
显然,,,的平均数为:,
所以它们的方差为,
故答案为:18.
巩固训练
1.(23-24高一下·江苏无锡·阶段练习)有一组样本数据如下表:
5
6
7
5
7
6
由这组数据得到新样本数据,其中(),则数据的方差为( )
A. B. C. D.
【答案】D
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】求出,再得样本数据的方差,然后由与的关系得的方差.
【详解】样本数据的平均数为,
方差为,
所以新样本数据的方差为,
故选:D.
2.(23-24高一下·江苏无锡·期末)若样本数据的方差为3,则,,的方差为( )
A.3 B.5 C.6 D.12
【答案】D
【知识点】各数据同时乘除同一数对方差的影响
【分析】根据题意结合方差的性质运算求解.
【详解】因为样本数据的方差为3,
所以,,的方差为.
故选:D.
3.(23-24高一下·江苏淮安·期末)已知一组数据的方差为3,则的方差为 .
【答案】12
【知识点】各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】利用方差的性质求解.
【详解】数据的方差为3,
,,……的方差为:.
故答案为:12.
试卷第42页,共43页
1 / 2
学科网(北京)股份有限公司
$$
第14章 统计(13题型清单)
01 思维导图
02 知识速记
1.简单随机抽样
(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n()个个体作为样本,如果每次抽取时各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种:随机数法和抽签法.
2.分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
(2)应用范围:总体是由差异明显的几个部分组成的.
(3)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,抽样比 .
3.频率分布表与频率分布直方图
频率分布表与频率分布直方图的绘制步骤如下:
(1)求极差,即求一组数据中最大值与最小值的差;
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与样本容量的比值叫做这一小组的频率,计算各小组的频率,列出频率分布表;
(5)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积.
各个小长方形面积的总和等于1.
4.用样本的数字特征估计总体的数字特征
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小长方形的面积乘小长方形底边中点的横坐标之和
方差和标准差反映了数据波动程度的大小.
方差:;
标准差:.
5.百分位数
(1)把100个样本数据按从小到大排序,得到第p个和第p+1个数据分别为.可以发现,区间内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数,并称此数为这组数据的第p百分位数,或p%分位数.
(2)一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(3)四分位数
常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
03 题型归纳
题型一 总体与样本
例题1:(2024高一下·江苏·专题练习)从某公司600名员工中抽取20名进行体重的统计分析,下列说法正确的是( )
A.600名员工是总体
B.每个被抽查的员工是个体
C.抽取的20名员工的体重是一个样本
D.抽取的20名员工的体重是样本容量
例题2:(23-24高二·上海·课堂例题)某高校研究人员希望调查该校大学生平均每天的自习时间.他调查了100名大学生,发现他们每天的平均自习时间是3.5h.这里的总体是( )
A.该校的所有大学生
B.该校所有大学生的平均每天自习时间
C.所调查的100名大学生
D.所调查的100名大学生的平均每天自习时间
例题3:(多选)(23-24高一上·陕西汉中·期末)为了了解参加运动会的1000名运动员的年龄情况,从中抽取了10名运动员的年龄进行统计分析.下列说法中正确的有( )
A.1000名运动员的年龄是总体 B.所抽取的10名运动员是一个样本
C.样本容量为10 D.每个运动员被抽到的机会相等
巩固训练
1.(2024高三·全国·专题练习)为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行调查分析,在这个问题中,被抽取的200名学生的成绩是( )
A.总体 B.个体
C.样本 D.样本量
2.(23-24高一下·山西太原·期末)为了解某校高中3000名学生的身高情况,从中抽取了100名学生进行调查,则这100名学生是( )
A.总体 B.样本 C.样本量 D.个体
3.(23-24高一下·天津河东·期末)为确保食品安全,某市质检部门检查1000袋方便面的质量,抽查总量的.在这个问题中,下列说法正确的是( )
A.总体是指这1000袋方便面 B.个体是1袋方便面
C.样本是按抽取的20袋方便面 D.样本容量为20
题型二 随机数表法
例题1:(23-24高一下·江苏连云港·期末)总体编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为( )
7816 1572 0802 6315 0216 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.02 B.14 C.15 D.16
例题2:(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
例题3:(2024高一下·江苏·专题练习)要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4颗种子的编号: .(下面抽取了随机数表第1行至第8行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 24 67 62 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
12 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 76
55 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53 23 83 01 30 30
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
巩固训练
1.(24-25高一上·河南南阳·期末)福利彩票“双色球”中红色球的号码由编号01,02,…,33的33个数字组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表(如下表)第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第3个红色球的编号为( )
49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
A.23 B.09 C.20 D.17
2.(23-24高一下·江苏扬州·期末)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是 .
3.(2024高一下·江苏·专题练习)一个总体共有60个个体,其编号为00,01,02,…,59,现从中抽取一个容量为10的样本,请从随机数表的第8行第11列的数字开始,向右读,到最后一列后再从下一行左边开始继续向右读,依次获取样本号码,直到取满样本为止,则获得的样本号码是 .
附表:(第8行~第10行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
12 86 73 58 07 44 39 52 38 79(第8行)
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38
15 51 00 13 42 99 66 02 79 54(第9行)
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62
90 52 84 77 27 08 02 73 43 28(第10行)
题型三 简单随机抽样的概率
例题1:(23-24高一下·江苏常州·期末)从某班学号为1到10的十名学生(其中含学生甲)中抽取3名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽3次,设甲第一次被抽到的可能性为,第二次被抽到的可能性为,则( )
A., B.,
C., D.,
例题2:(24-25高一上·全国·课后作业)在简单随机抽样中,某一个个体被抽到的可能性( )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能抽取,但各次抽取的可能性不一定
例题3:(23-24高一下·河南安阳)有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中随机抽取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是( )
A.总体是36个篮球 B.样本是4个篮球
C.样本容量是4 D.每个篮球被抽到的可能性不同
巩固训练
1.(2024·四川成都·模拟预测)用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A., B.,
C., D.,
2.(23-24高一下·河北沧州·期末)某班级有60名学生,班主任用不放回的简单随机抽样的方法从这60名学生中抽取5人进行家访,则同学a被抽到的可能性为( )
A. B. C. D.
3.(23-24高一下·山西大同·期末)采用简单随机抽样的方法,从含有8个个体的总体中抽取1个容量为2的样本,则某个个体被抽到的概率为( )
A. B. C. D.
题型四 简单随机抽样估计总体
例题1:(23-24高三下·湖北·阶段练习)我国古代数学名著《数书九章》是南宋数学家秦九韶所著数学著作,书中共列算题81问,分为9类,全书采用问题集的形式,并不按数学方法来分类.题文也不只谈数学,还涉及自然现象和社会生活,成为了解当时社会政治和经济生活的重要参考文献.《数书九章》中有“米谷粒分”一题,现有类似的题:粮仓开仓收粮,粮农送来米1500石,验得米夹谷,抽样取米一把,数得304粒夹谷30粒,则这批米内夹谷约为( )
A.148石 B.149石 C.150石 D.151石
例题2:(2024高一下·全国·专题练习)为了调查某市城区一小河流的水体污染状况,就某个指标,某学校甲班的同学抽取了样本量为50的5个样本,乙班的同学抽取了样本量为100的5个样本,得到如下数据:
抽样序号
1
2
3
4
5
样本量为50的平均数
123.1
120.2
125.4
119.1
123.6
样本量为100的平均数
119.8
120.1
121.0
120.3
120.2
据此可以认定 班的同学调查结果能够更好地反映总体,这两个班的同学调查的该项指标约为 .
例题3:(23-24高二·上海·课堂例题)某购物网站在其首页发布了一项满意度调查,其中一个问题是:“你对本网站的客服是否满意?”浏览该网站的网民可以点击三个按钮“满意”“一般”和“不满意”中的任意一个.结果有1253人选择“满意”,585人选择“一般”,245人选择“不满意”.
(1)此项调查的样本量是多少?
(2)该网站声称有的网民满意其网站客服,判断该说法是否准确,并说明理由.
巩固训练
1.(24-25高一上·全国·课后作业)从一批产品中用简单随机抽样的方法抽取了一部分作为样品,检测产品的合格率,其中甲检验员从中抽取了50件产品,其合格率为,乙检验员从中抽取了100件产品,其合格率为,则估计该产品合格率更接近于 检验员检测的结果.
2.(2024高一下·全国·专题练习)为了调查新疆阿克苏野生动物保护区内鹅喉羚的数量,调查人员逮到这种动物400只,标记后放回.一个月后,调查人员再次逮到该种动物800只,其中标记的有2只,估算该保护区有鹅喉羚 只.
3.(23-24高一·江苏·课后作业)从一群做游戏的小孩中随机抽出人,一人分一个苹果,让他们返回继续做游戏.过了一会儿,再从中任取人,发现其中有个小孩曾分过苹果,估计参加游戏的小孩的人数为 .
题型五 分层抽样各层计算
例题1:(23-24高三下·江苏南京·开学考试)某学校高二年级选择“物化生”,“物化地”和“史地政”组合的同学人数分别为240,90和120.现采用分层抽样的方法选出30位同学进行某项调查研究,则“史地政”组合中选出的同学人数为( )
A.8 B.12 C.16 D.6
例题2:(23-24高一下·江苏常州·期末)某学校高一年级选择“物化生”、“物化地”、“物化政”和“史政地”组合的同学人数分别为240、120、90和150.现采用分层抽样的方法选出20位同学进行一项调查研究,则“史政地”组合中选出的同学人数为( )
A.8 B.4 C.3 D.5
例题3:(多选)(2024·江苏苏州·模拟预测)在某次数学练习中,高三班的男生数学平均分为120,方差为2,女生数学平均分为112,方差为1,已知该班级男女生人数分别为25、15,则下列说法正确的有( )
A.该班级此次练习数学成绩的均分为118
B.该班级此次练习数学成绩的方差为16.625
C.利用分层抽样的方法从该班级抽取8人,则应抽取5名男生
D.从该班级随机选择2人参加某项活动,则至少有1名女生的概率为
巩固训练
1.(23-24高一下·江苏苏州·期末)某工厂生产A,B,C,3种不同型号的产品,产量之比为.现用分层抽样的方法抽取1个容量为的样本,若样本中A种型号的产品有18件,则样本容量( )
A.40 B.60 C.80 D.100
2.(23-24高一下·江苏无锡·阶段练习)某单位有青年职工160人,中年职工人数180人,老年职工有90人,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.16 B.18 C.27 D.36
3.(多选)(23-24高一下·江苏淮安·期末)某学校为了解学校学生视力健康状况,降低学生近视率,增强学生爱眼护眼意识,对三个年级的学生视力健康状况进行调研,已知高一、高二、高三的学生人数之比为4:3:3,现用分层抽样方法抽取一个容量为 n的样本,样本中高一年级学生人数为200人,则( )
A.该校三个年级总的学生数为5000人 B.样本容量n为500
C.该校高二年级总的学生数有1500人 D.样本中高二年级学生数为150人
题型六 分层抽样中的概率
例题1:(2024·湖北·模拟预测)从一个容量为的总体中抽取一个容量为3的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是,则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是( )
A. B. C. D.
例题2:(2024高三·全国·专题练习)某校要从高一、高二、高三共2 023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 023名学生中剔除23名,再从剩下的2 000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性( )
A.都相等且为 B.都相等且为
C.不完全相等 D.均不相等
例题3:(23-24高二上·黑龙江大庆·开学考试)从一个容量为(,)的总体中抽取一个容量为的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是,则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是( )
A. B. C. D.
巩固训练
1.(23-24高一下·天津滨海新)从一个容量为100的总体中抽取容量为10的样本,选取简单随机抽样和分层随机抽样两种不同方法抽取样本.在简单随机抽样中,总体中每个个体被抽中的概率为,某个体被抽中的概率为;在分层随机抽样中,总体中每个个体被抽中的概率为,则( )
A. B.
C. D.之间没有关系
2.(23-24高一下·江苏泰州·阶段练习)在 120 个零件中,一级品 24 个,二级品 36 个,三级品 60 个,从中抽取容量为 20 的一 个样本,则每个个体被抽到的可能性为( )
A. B. C. D.
3.(23-24高二上·福建·阶段练习)某地区高中分三类,A类学校共有学生2000人,B类学校共有学生3000人,C类学校共有学生4000人,若采取分层抽样的方法抽取900人,则A类学校中的学生甲被抽到的概率( )
A. B. C. D.
题型七 扇形图,折线图,条形图
例题1:(2024高一下·江苏·专题练习)某校公布了该校反映各年级学生体育达标情况的两张统计图(如图),该校七、八、九三个年级共有学生800人,甲、乙、丙三个同学看了这两张统计图后,甲说:“七年级的体育达标率最高”.乙说:“八年级共有学生264人.”丙说:“九年级的体育达标率最高.”甲、乙、丙三个同学中,说法正确的是( )
A.甲和乙 B.乙和丙
C.甲和丙 D.甲、乙和丙
例题2:(多选)(2024高一下·江苏·专题练习)(多选)某报告显示:我国农民工收入持续快速增长.某地区农民工人均月收入增长率如图①,并将人均月收入绘制成如图②的不完整的条形统计图.
根据以上统计图,以下说法正确的是( )
A.2020年农民工人均月收入的增长率是10%
B.2018年农民工人均月收入是2 205元
C.小明认为“农民工2019年的人均月收入比2018年的少了”
D.2016年到2020年这五年中,2020年农民工人均月收入最高
例题3:(多选)(24-25高一上·河南南阳·期末)下图是2003年4月21日至5月15日上午10时,北京市非典型肺炎疫情新增数据走势图.
则下列说法正确的有( )
A.新增疑似的人数最多的是4月29日,新增确诊的人数最多的是4月27日
B.新增疑似的人数最多的是4月27日,新增确诊的人数最多的是4月29日
C.新增治愈的人数最多的是5月13日,新增死亡的人数最少的是5月15日
D.从图中可以看出,本次疫情得到了有效控制
巩固训练
1.(多选)(2024高一下·江苏·专题练习)为比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述正确的是( )
A.甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值
B.甲的数学建模能力指标值优于乙的直观想象能力指标值
C.乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平
D.甲的数学运算能力指标值优于甲的直观想象能力指标值
2.(多选)(24-25高一上·河北保定·期末)改革开放以来,某地区率先推进经济转型升级和高质量发展,成功实现从传统的农业、工业化经济向现代化服务型、创新型、数字经济转化,实现了从粗放型增长向高质量发展的迈进.该地区经过近十年的发展,经济总收入增加了两倍,下图统计了该地区经济转型前和经济转型后经济总收入的构成比例,则下面结论中正确的是( )
A.经济转型后,农业收入减少
B.经济转型后,工业收入增加了一倍以上
C.经济转型后,其他产业收入是转型前的两倍以上
D.经济转型后,第三产业收入超过了经济转型前经济总收入
3.(多选)(24-25高一上·安徽宿州·期末)2021年某地居民人均可支配收入的构成比例如图所示,已知该地居民人均经营净收入为5250元,则( )
A.2021年该地居民人均经营净收入占居民人均可支配收入的21%
B.2021年该地居民人均可支配收入为25000元
C.2021年该地居民人均转移净收入低于人均经营净收入
D.2021年该地居民人均工资性收入比人均转移净收入多6750元
题型八 频率分布直方表(图)
例题1:(23-24高一下·江苏连云港·期末)根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和三个月以上六个月以下暂扣驾驶证,并处500元以上2000元以下罚款.2024年3月以来,某地区交警查处酒后驾车和醉酒驾车共20人.如图,这是对这20人酒后驾车血液中酒精含量进行检测所得结果的频率直方图,则属于醉酒驾车的人数约为( )
A.1 B.2 C.3 D.4
例题2:(2024高三·全国·专题练习)某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是( )
A.4 B.5
C.8 D.10
例题3:(24-25高一上·江西抚州·阶段练习)某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组抽样结果绘成的频率分布直方图如图所示,则实数 .
巩固训练
1.(2024高二上·黑龙江·学业考试)下图是某班学生的一次数学测试成绩的频率分布直方图,则该班学生数学成绩平均数的估计值为( )
A.80 B.85 C.97 D.110
2.(23-24高一下·广东广州·阶段练习)要调查某地区高中学生身体素质,从高中生中抽取100人进行跳远测试,根据测试成绩制作频率分布直方图如下图,现再从这100人中用分层抽样的方法抽取20人,应从间抽取人数为b,则b为( )
A.4 B.5 C.6 D.7
3.(23-24高一下·广东广州·期末)从某小区抽取100户层民用户进行月用电量调查,发现他们的月用电量都在之间,进行适当分组后(每组为左用右开的区间),画出频率分布直方图如图所示,在被调查的用户中,月用电量落在区间内的户数为 .
题型九 平均数,众数,中位数有关的计算
例题1:(24-25高二上·江苏盐城·阶段练习)一组数据按从小到大的顺序排列如下:11,12,15,,18,20,22,26,经计算,该组数据的中位数是17,则x的值为( )
A.15 B.16 C.17 D.18
例题2:(24-25高三上·江苏南通·开学考试)已知实数,则使和最小的实数分别为的( )
A.平均数;平均数 B.平均数;中位数
C.中位数;平均数 D.标准差;平均数
例题3:(多选)(24-25高三上·江苏南通·阶段练习)已知一组数据1,2,3,5,5,6,则特征量为5的是( )
A.平均数 B.中位数 C.众数 D.极差
巩固训练
1.(23-24高一下·江苏常州·期末)一个射击选手连续射击10次,成绩如下:
成绩/环数
10
9
8
7
次数
2
4
3
1
则该选手射击成绩的中位数为( )
A.8 B.9 C.9.5 D.8.7
2.(24-25高三上·江苏南通·阶段练习)采用分层随机抽样方法对某校共600名高三年级学生的身高(单位:厘米)进行调查,估计得到该年级男生、女生和全体学生的平均身高分别为170.0,160.4,165.6,则该年级的男生人数约为( )
A.315 B.320 C.325 D.330
3.(多选)(24-25高三上·江苏苏州·开学考试)已知一组数据的平均数为,另一组数据的平均数为.若数据的平均数为,则 ( )
A.当时, B.当时,
C.当时, D.当时,
题型十 平均数,众数,中位数有关的估计值
例题1:(多选)(2024·福建漳州·一模)某学校举行消防安全意识培训,并在培训前后对培训人员进行消防安全意识问卷测试,所得分数(满分:100分)的频率分布直方图如图所示,则( )
A.培训前得分的中位数小于培训后得分的中位数
B.培训前得分的中位数大于培训后得分的中位数
C.培训前得分的平均数小于培训后得分的平均数
D.培训前得分的平均数大于培训后得分的平均数
例题2:(23-24高一上·江西上饶·期末)某校在上饶市期末数学测试中为统计学生的考试情况,从学校的1000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组,第二组,……第八组,如图是按上述分组方法得到的频率分布直方图的一部分.
(1)求第八组的频率,并完成频率分布直方图;
(2)用样本数据估计该校的1000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值)和中位数(保留小数点后面一位)
例题3:(23-24高一上·江西吉安·期末)2022年起,某省将实行“”高考模式,为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高三年级学生的生物成绩进行赋分,具体赋分方案如下:先按照考生原始分从高到低按比例划定A、B、C、D、E共五个等级,然后在相应赋分区间内利用转换公式进行赋分A等级排名占比15%,赋分分数区间是86-100;B等级排名占比35%,赋分分数区间是71-85:C等级排名占比35%,赋分分数区间是56-70:D等级排名占比13%,赋分分数区间是41-55;E等级排名占比2%,赋分分数区间是30-40;现从全年级的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:
(1)求图中a的值;
(2)求抽取的这100名学生的原始成绩的众数、平均数和中位数;
(3)用样本估计总体的方法,估计该校本次生物成绩原始分不少于多少分才能达到赋分后的B等级及以上(含B等级)?(结果保留整数)
巩固训练
1.(23-24高一下·新疆喀什·期末)某校从参加高一年级期末考试的学生中抽出名学生,将其成绩(均为整数)分成六段后,画出如图所示部分频率分布直方图.观察图形,回答下列问题:
(1)求第四小组的频率,并补全这个频率分布直方图;
(2)估计这次考试成绩的中位数(结果取整数值);
(3)估计这次考试的众数、平均分.
2.(23-24高一下·河南商丘·阶段练习)某学校为了解学校食堂的服务情况,随机调查了50名就餐的教师和学生.根据这50名师生对食堂服务质量的评分,绘制出了如图所示的频率分布直方图,其中样本数据分组为,,…,.
(1)求频率分布直方图中a的值和样本的众数.
(2)若采用分层抽样的方式从评分在,,的师生中抽取10人,则评分在内的师生应抽取多少人?
(3)学校规定:师生对食堂服务质量的评分的均值不得低于75分,否则将进行内部整顿.用每组数据的中点值代替该组数据,试估计该校师生对食堂服务质量评分的平均分,并据此回答食堂是否需要进行内部整顿.
3.(2024高一·全国·专题练习)某中学为了了解全校学生五一小长假参加实践活动的情况,抽查了100名学生,统计他们参加实践活动的时间(单位:h),绘制成频率分布直方图如图所示.估计这100名学生参加实践活动时间的众数、中位数和平均数.
题型十一 百分位数
例题1:(24-25高三上·江苏南通·阶段练习)已知一组数据,,,,的下四分位数是,则的可能取值为( )
A. B. C. D.
例题2:(24-25高三上·江苏苏州·开学考试)“绿水青山就是金山银山”的理念深入人心,人民群众的生态境获得感、幸福感、安全感不断提升.某校高一年级举行环保知识竞赛,共500人参加,若参赛学生成绩的第60百分位数是80分,则关于竞赛成绩不小于80分的人数的说法正确的是( )
A.至少为300人 B.至少为200人
C.至多为300人 D.至多为200人
例题3:(多选)(24-25高二上·江苏盐城·阶段练习)走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.如图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是( )
A.这一星期内甲的日步数的中位数为11600
B.这一星期内甲的日步数的极差大于乙的日步数的极差
C.这一星期内乙的日步数的方差大于甲的日步数的方差
D.这一星期内乙的日步数的上四分位数是7030
巩固训练
1.(24-25高三上·江苏镇江·开学考试)已知一组数据:4,6,7,9,11,13,则这组数据的第50百分位数为( )
A.6 B.7 C.8 D.9
2.(多选)(24-25高二上·江苏南京·阶段练习)国庆期间,某校开展“弘扬中华传统文化,传承中华文明”主题活动知识竞赛.赛前为了解学生的备赛情况,组织对高一年级和高二年级学生的抽样测试,测试成绩数据处理后,得到如下频率分布直方图,则下面说法正确的是( )
A.
B.高一年级抽测成绩的众数为75
C.高二年级抽测成绩的70百分位数为87
D.估计高一年级学生成绩的平均分低于高二年级学生成绩的平均分
3.(23-24高一下·江苏南京·期末)数据4,1,6,2,9,5,8的60百分位数为 .
题型十二 方差 标准差的计算
例题1:(多选)(2024·江苏无锡·模拟预测)某校团委为泙价5个社团暑期开展活动的情况,在各社团中分别抽取部分社员进行调查.若各社团抽取的社员人数的平均数为8,方差为4,则各社团被抽取的社员人数的最大值可能为( )
A.13 B.12 C.11 D.10
例题2:(23-24高一下·江苏南通·阶段练习)为获得某中学高一学生的身高(单位:)信息,采用随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的均值为176,标准差为10,女生样本的均值为166,标准差为20.则总样本的方差为 .
例题3:(23-24高一下·浙江绍兴·期中)为了了解学生躯干、腰、髋等部位关节韧带和肌肉的伸展性、弹性等,某学校对在校1500名学生进行了一次坐位体前屈测试,采用按学生性别比例分配的分层随机抽样抽取75人,已知这1500名学生中男生有900人,且抽取的样本中男生的平均数和方差分别为和,女生的平均数和方差分别为和.
(1)求样本中男生和女生应分别抽取多少人;
(2)求抽取的总样本的平均数,并估计全体学生的坐位体前屈成绩的方差.
巩固训练
1.(多选)(2024·江苏泰州·模拟预测)已知,有一组数据为,3,,,8,10,,12,13,若在这组数据中去除第5个数8,则( )
A.平均数不变 B.中位数不变 C.方差不变 D.极差不变
2.(24-25高一上·江苏·假期作业)为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,采用分层随机抽样方法抽取了90名男员工、50名女员工的身高和体重数据,计算得到他们的值.男女员工的值的中位数、平均数、标准差、方差和极差如表所示.
中位数
平均数
标准差
方差
极差
男员工
21.6
22.1
3.7
14.3
19.3
女员工
19.6
20.7
4
16.4
17.7
从以上数据可以估算出该公司全体人员的值的平均值为 ,方差为 .(以上结果精确到
3.(23-24高三上·陕西榆林·期中)(1)已知甲乙两名同学的某次体育项目测试成绩分别为:甲:10,13,12,14,16.乙:13,14,12,12,14.求甲乙两人成绩的平均数与方差,比较谁的成绩更稳定.
(2)某学校为了调查学生的学习情况,现用分层抽样的方法抽取样本,若样本中有20名男生,30名女生,且男生的平均成绩为70分,方差为4,女生的平均成绩为80分,方差为6,求所抽取样本的方差.
题型十三 平均数,方差性质
例题1:(23-24高一下·江苏南京·期末)已知数据的平均数为10,方差为5,数据的平均数为,方差为,则( )
A. =10,=14 B. =9,=44
C. =29,=45 D. =29,=44
例题2:(23-24高一下·江苏南京·期末)若的方差为3,则的方差为( )
A.3 B.6 C.9 D.12
例题3:(23-24高一下·江苏盐城·期末)若,,,的方差为2,则,,,的方差为 .
巩固训练
1.(23-24高一下·江苏无锡·阶段练习)有一组样本数据如下表:
5
6
7
5
7
6
由这组数据得到新样本数据,其中(),则数据的方差为( )
A. B. C. D.
2.(23-24高一下·江苏无锡·期末)若样本数据的方差为3,则,,的方差为( )
A.3 B.5 C.6 D.12
3.(23-24高一下·江苏淮安·期末)已知一组数据的方差为3,则的方差为 .
试卷第42页,共43页
1 / 2
学科网(北京)股份有限公司
$$