内容正文:
第01讲 数据的收集及数字特征
课程标准
学习目标
1.数据的收集
2.数据的数字特征及其意义;
1.通过学习简单随机抽样,理解并掌握分层抽样的概念和步骤,会用分层抽样解决实际问题,提升数据分析与解决问题的核心素养.
2.会计算样本数据的数字特征,并能解决有关实际问题,提升学生的数据分析、逻辑推理、数学运算的能力.
知识点01 抽样方法
1.总体与样本
考察问题涉及的对象全体是总体,总体中每个对象都是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.
一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查),只抽取样本进行考察的方法称为抽样调查.
2.简单随机抽样
从总体中不加任何分组、划类、排队等,完全随机地抽取个体,这种抽样方法称为简单随机抽样(也称纯随机抽样).
常见的简单随机抽样方法有抽签法、随机数表法.
注意:分层抽样的适用前提条件是总体可以分层,层与层之间有明显区别,而层内个体间差异较小.
3.分层抽样
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
注意:使用分层抽样应遵循的原则:(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.
(2) 分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
【即学即练1】
1. (多选题)下列抽取样本的方式不是简单随机抽样的是( )
A.从无限多个个体中抽取100个个体作为样本
B.盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里
C.从20件玩具中逐个抽取3件进行质量检验
D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛
2. 某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )
A.4 B.5 C.6 D.7
知识点02 最值与平均数
1.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
2.平均数
如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).
这一公式在数学中常简记为,其中的符号“∑”表示求和,读作“西格玛”,∑右边式子中的i表示求和的范围,其最小值与最大值分别写在∑的下面与上面.
(1)=;(2)
【即学即练2】(23-24高一下·河南郑州·期末)用抽签法抽取的一个容量为5的样本,它们的变量值分别为2,4,5,7,9,则该样本的平均数为( )
A.4.5 B.4.8 C.5.4 D.6
知识点03 中位数、百分位数、众数
1.中位数
一般地,有时也可以借助中位数来表示一组数的中心位置:如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.(注意:一组数据的中位数是唯一的.)
2.百分位数
(1)定义
一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于该值,且至少有(100-p)%的数据不小于该值.
直观来说,一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.
(2)求百分位数的步骤
为了方便,我们按如下方式确定p%分位数:设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取x为p%分位数;如果i是整数,取为p%分位数.特别地,规定:0分位数是x1(即最小值),100%分位数是xn(即最大值).
注意:(1)中位数就是一个50%分位数.
(2)按照定义可知,p%分位数可能不唯一,也正因为如此,各种统计软件所得出的p%分位数可能会有差异.
(3)实际应用中,除了中位数外,经常使用的是25%分位数(简称为第一四分位数)与75%分位数(简称为第三四分位数).
3.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.有些情形中,我们用众数来描述一组数据的中心位置.
注意:(1)众数不唯一,可以有一个,也可以有多个,还可以没有.如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.
(2)众数一定是原数据中的数,百分位数和中位数都不一定是原数据中的数.
【即学即练3】(24-25高一上·四川南充·开学考试)“杂交水稻之父”袁隆平培育的超级杂交稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取7株水稻苗,测得苗高(单位:)分别是23,24,23,25,26,23,25.则这组数据的众数和中位数分别是( )
A.24,25 B.23,23
C.23,24 D.24,24
知识点04 极差、方差与标准差
1.极差
一组数的极差指的是这组数的最大值减去最小值所得的差.不难看出,极差反映了一组数的变化范围,描述了这组数的离散程度.
注意: (1)极差反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.一般情况下,极差大,则数据较分散,数据的波动性大;极差小,则数据相对集中,数据的波动性小,极差的计算非常简单,但极差只考虑了两个极端值,而没有考虑中间的数据,因此很多时候,极差作为数据的离散程度的统计量,可靠性较差.
(2)极差的取值范围是[0,+∞).
2.方差
如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为.
3.标准差
方差的算术平方根称为标准差.
如果一组数中,各数据值都相等,则标准差为0,表明数据没有波动,数据没有离散性;若各数据的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也较大,数据的离散程度较高.因此标准差描述了数据相对于平均数的离散程度.
注意:标准差与方差的统计意义
(1)标准差(方差)的取值范围是[0,+∞)(标准差的大小不会超过极差).
(2)标准差(方差)描述了一组数据相对于平均数离散程度的大小.可以根据不同组数据的离散程度比较标准差(方差)的大小.
【即学即练4】(24-25高二上·河南·阶段练习)已知退休的王大爷连续天户外运动的步数(单位:百步)分别为,,,,,则该组数据的均值与方差分别为( )
A., B., C., D.,
知识点05平均数、方差的计算方法总结
1.平均数的计算方法
(1)定义法:当所给数据x1,x2,…,xn比较小,又比较分散时,一般选用公式来计算.
(2)新数据法:当所给的一组数据都在某一常数a的附近波动时,一般选用简单化公式xi=a+xi′,其中常数a通常取接近于这组数据的平均数的较“整”的数,先计算则.
(3)性质法:如果x1,x2,…,xn,的平均数为 ,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
(4)频数平均数法(也称为加权平均数法):在给定的n个数据中,如果x1出现了f1次,x2出现了f2次,…,xk出现了fk次,则一般选用=(其中=n)来计算平均数.
2.方差的计算方法
(1)定义法:s2=.
(2)简化法:s2=[(x+x+…+x)-n2].
(3)性质法:如果a,b为常数(a=0),则ax1+b,ax2+b,...,axn+b的方差为a2s2.
【即学即练5】设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1 C.1 D.10
题型01 普查与抽样
【典例1】(24-25高一上·四川成都·开学考试)下列调查中,适合用普查的是( )
A.了解我省初中学生的家庭作业时间 B.了解“嫦娥四号”卫星零部件的质量
C.了解一批电池的使用寿命 D.了解某市居民对废电池的处理情况
【变式1】(25-26高一上·全国·课前预习)下列调查中,最适宜采用全面调查方式(普查)的是( )
A.对某市中学生每天学习所用时间的调查
B.对全国中学生心理健康现状的调查
C.对某班学生进行6月5日是“世界环境日”知晓情况的调查
D.对某市初中学生课外阅读量的调查
【变式2】(25-26高一上·全国·课后作业)在以下调查中,适合用普查的个数是( )
①调查一个班级学生的吃早餐情况; ②调查某种饮料质量合格情况;
③调查某批飞行员的身体健康指标; ④调查某个水库中草鱼所占的比例.
A.1 B.2 C.3 D.4
【变式3】(23-24高一下·青海海南·期末)下列调查中,调查方式选择合理的是( )
A.了解某一品牌空调的使用寿命,选择普查
B.了解神舟飞船的设备零件的质量情况,选择抽样调查
C.了解一批袋装食品是否含有防腐剂,选择普查
D.了解某公园全年的游客流量,选择抽样调查
题型02 总体与样本
【典例2】(23-24高一下·西藏日喀则·期末)高考结束后,为了分析该校高三年级1000名学生的高考成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100名学生是个体
B.样本容量是100
C.每名学生的成绩是所抽取的一个样本
D.1000名学生是样本
【变式1】(25-26高一上·全国·课前预习)从某年级500名学生中抽取60名学生进行身高的统计分析,下列说法正确的是( )
A.500名学生是总体 B.每个被抽查的学生是个体
C.抽取的60名学生的身高是一个样本 D.抽取的60名学生的身高是样本容量
【变式2】(25-26高二上·上海·单元测试)学校为了调查高二年级学生体重情况,随机抽取50个高二年级学生进行体重测量,这50个学生的体重是( )
A.总体 B.个体 C.样本 D.样本容量
【变式3】(23-24高一下·广西河池·期末)某市市场监管局为了了解饮料的质量,从该市区某超市在售的种饮料中抽取了种饮料,对其质量进行了检查.在这个问题中,是( )
A.总体 B.个体 C.样本 D.样本量
【变式4】(23-24高一下·新疆伊犁·阶段练习)为了解某中学高一年级600名学生的身高情况,抽查了其中100名学生的身高进行统计分析.下列叙述错误的是( )
A.以上调查属于全面调查
B.每名学生的身高是总体的一个个体
C.100名学生的身高是总体的一个样本
D.600名学生的身高是总体
题型03 简单随机抽样
【典例3】(24-25高一上·全国·课前预习)下列问题中最适合用简单随机抽样方法的是( )
A.某学校有学生1320人,卫生部门为了了解学生身体发育情况,准备从中抽取一个容量为300的样本
B.从1135个村庄中抽取50个进行收入调查
C.从全班30名学生中,任意选取5名进行家访
D.为了解某地区某传染病的发病情况,从该地区的5000人中抽取200人进行统计
【变式1】24-25高二上·四川成都·阶段练习)某校高一共有10个班,编号1至10,某项调查要从中抽取三个班作为样本,现用抽签法抽取样本,每次抽取一个号码,共抽3次,设五班第二次被抽到的可能性为,则( )
A. B. C. D.
【变式2】(23-24高一下·天津南开·期末)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( ).
A. B. C. D.
题型04 随机数表法
【典例4】(23-24高一下·甘肃白银·阶段练习)某总体由编号为的个个体组成,利用下列随机数表选出个个体,选法是下列表中第一行第列开始从左到右依次选个数字,选出的第个个体编号为( )
1818
0792
4544
1716
5809
7983
8619
6216
7650
0310
5523
6405
0526
6238
A.16 B.09 C.19 D.61
【变式1】(23-24高一下·云南玉溪·阶段练习)某工厂用简单随机抽样中的随机数法对生产的700个零件进行抽样,先将700个零件进行编号,.从中抽取70个样本,下图是利用软件生成的随机数,只需随机选定一个初始位置和方向开始读数,每次读取一个3位数,只要读取的号码落在编号范围内,该号码就是所抽到的样本编号,这样即可获得70个样本的编号,注意样本号码不能重复.若从表中第2行第6列的数2开始向右读取数据,取到的第一个样本编号是253,则得到的第6个样本编号是( )
A.007 B.328 C.253 D.623
【变式2】(23-24高一下·江苏连云港·期末)总体编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为( )
7816 1572 0802 6315 0216 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.02 B.14 C.15 D.16
【变式3】(23-24高一下·陕西咸阳·阶段练习)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,,649,650.从中抽取50个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.007 B.253 C.328 D.860
题型05 分层抽样
【典例5】(23-24高一下·广东茂名·阶段练习)某工厂生产三种不同型号的产品,它们的产量之比为,用分层抽样的方法抽取一个容量为的样本.若样本中型号的产品有120件,则样本容量为( )
A.150 B.180 C.200 D.250
【变式1】(23-24高一下·江苏常州·期末)某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
【变式2】(23-24高一下·陕西·期末)中国古代科举制度始于隋而成于唐,兴盛于明、清两朝.明代会试分南卷、北卷、中卷,按的比例录取,若某年会试录取人数为200,则中卷录取人数为( )
A.150 B.110 C.70 D.20
【变式3】(23-24高一下·安徽马鞍山·期末)某校高一年级有810名学生,现用比例分配的分层随机抽样方法抽取一个容量为72的样本,则抽取男生和女生的人数分别为40,32,则该校高一年级的女生人数为( ).
A.450 B.360 C.400 D.320
【变式4】(24-25高一上·全国·随堂练习)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.抽签法
题型06 平均数
【典例6】若样本数据的平均数是2,则数据的平均数是( )
A.2 B.3 C.5 D.7
【变式1】(23-24高一下·甘肃定西·阶段练习)为了配合调配水资源,某市欲了解全市居民的月用水量.若通过简单随机抽样从中抽取了1000户进行调查,得到其月用水量的平均数为9吨,则可推测全市居民用户月用水量的平均数( )
A.一定为9吨 B.高于9吨 C.约为9吨 D.低于9吨
【变式2】(24-25高二上·湖南·阶段练习)某学校的高一、高二及高三年级分别有学生人、人、人,用分层抽样的方法从全体学生中抽取一个容量为人的样本,抽出的高一、高二及高三年级学生的平均身高为、、,估计该校学生的平均身高是( )
A. B. C. D.
【变式3】(23-24高一下·福建福州·期末)若数据、、…、的平均数是4,方差是4,数据、、…、的平均数是,标准差是,则下列结论正确的是( )
A., B.,
C., D.,
【变式4】(2023·陕西榆林·模拟预测)已知数据,,,,,,的极差和平均数相等,则实数的值为( )
A.34 B.35 C.36 D.37
题型07 众数
【典例7】(23-24高一下·新疆·期末)已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是( )
A.86,84 B.84.5,85 C.85,84 D.86.5,84
【变式1】(23-24高一上·福建厦门·开学考试)今年是我国现行宪法公布施行40周年.为贯彻党的二十大精神,强化宪法意识,弘扬宪法精神,推动宪法实施,某学校开展法律知识竞赛活动,全校一共100名学生参与其中,得分情况如下表.则分数的中位数和众数分别是( )
分数(分)
60
70
80
90
100
人数
8
22
20
30
20
A.80,90 B.90,100
C.85,90 D.90,90
【变式2】(23-24高三上·河北秦皇岛·开学考试)五名学生每人投篮15次,统计他们每人投中的次数,得到五个数据,若这五个数据的中位数是6,唯一的众数是7,则他们投中次数的总和最大是 .
【变式2】(2024高一下·全国·专题练习)某鞋店试销一种新款女鞋,销售情况如下表:
码号
34
35
36
37
38
39
40
41
数量/双
2
5
9
16
9
5
3
2
如果你是鞋店经理,最关心的是哪种码号的鞋销量最大,那么对你来说最重要的是 (填“平均数”“众数”或“中位数”).
题型08 百分位数
【典例8】(23-24高一下·江苏无锡·阶段练习)从小到大排列的数据1,2,3,5,6,7,8,9,10,14,15,18的下四分位数为( )
A.3 B.4 C.10 D.12
【变式1】(23-24高一下·贵州黔西·期末)兴义市峰林布依景区在春节期间,迎来众多游客,其中某天接受了一个小型的旅行团,他们的年龄(单位:岁)如下:6,6,7,8,10,37,39,45,46,52,53,61,则这组数据的第75百分位数是( )
A.34.5 B.46 C.49 D.52
【变式2】(24-25高二上·上海·单元测试)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居民,他们的幸福感指数分别为5、6、7、8、9、5,则这组数据的第80百分位数是( )
A.5 B.6 C.7 D.8
【变式3】(24-25高一上·全国·课后作业)某部门有8位员工,其中6位员工的月工资分别为8200,8300,8500,9100,9500,9600(单位:元),另两位员工的月工资数据不清楚,但两人的月工资和为17000元,则这8位员工月工资的可能的最大值为( )
A.9100 B.8800
C.8700 D.8500
【变式4】(24-25高一上·全国·课后作业)若数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的,则实数x的取值范围是( )
A.[4.5,+∞) B.[4.5,6.6)
C.(4.5,+∞) D.[4.5,6.6]
【变式5】气象意义上从春季进入夏季的标志为"连续5天的日平均温度全都不低于22℃".现有甲、乙、丙、丁四地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃):①甲地:5个数据的中位数为23,众数为22;②乙地:5个数据的中位数为26,平均数为25,众数为27;③丙地:5个数据中有1个数据是32,平均数为26,方差为11.2;④丁地:5个数据的20百分位数为23,平均数为27.其中肯定进入夏季的地区个数为( )
A.4 B.3 C.2 D.1
题型09 方差与标准差
【典例9】(24-25高一上·山东·开学考试)为了解家里每月的用水量情况,小明收集并记录了家里连续6个月的用水量,分别是(单位:吨),关于这几个数据的说法,下列结论中正确的是( )
A.平均数是5 B.众数是6 C.中位数是5 D.方差是
【变式1】(23-24高一下·吉林长春·期末)高一年级某位同学在五次考试中的数学成绩分别为105,90,104,106,95,这位同学五次数学成绩的方差为( )
A.20.2 B.40.4 C.50 D.50.2
【变式2】(23-24高一下·广东广州·期末)已知样本数据都为正数,其方差,则样本数据的平均数为( )
A.2 B. C.4 D.
【变式3】.(23-24高一下·河南·开学考试)已知数据,,…,的方差为,数据,,…,的方差为.则( )
A.1 B.2
C. D.
【变式4】(23-24高二下·湖南·期中)为了解某高中甲、乙两个清北班一周内的请假同学人数情况,采用样本量比例分配分层随机抽样方法进行了调查.已知甲班调查了40名同学,其一周内请假人数的平均数和方差分别为5和1.65,乙班调查了60名同学,其一周内请假人数的平均数和方差分别为4和3.5,据此估计该校两个清北班一周内请假人数的总体方差为( )
A.2.6 B.3 C.3.4 D.4.1
题型10 数字特征的实际应用
【典例10】(多选)(23-24高一下·贵州黔西·期末)为了强化学校体育,增强学生体质,狠抓校园足球工作,全面推动校园足球高质量发展,2023年10月22日,第七届“金州杯”校园足球联赛在普安举行.在去年的足球联赛上,甲队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;乙队每场比赛平均失球数是2.1,全年比赛失球个数的标准差为0.4,则下列说法正确的是( )
A.平均说来乙队比甲队的防守技术好
B.乙队比甲队技术水平更稳定
C.甲队防守中有时防守表现较差,有时表现又非常好
D.乙队很少不失球
【变式1】(24-25高一上·四川成都·开学考试)甲、乙两人各射击次,甲所中的环数是,,,,,,且甲所中的环数的平均数是,众数是;乙所中的环数的平均数是,方差是4.根据以上数据,对甲,乙射击成绩的正确判断是( )
A.甲射击成绩比乙稳定 B.乙射击成绩比甲稳定
C.甲,乙射击成绩稳定性相同 D.甲、乙射击成绩稳定性无法比较
【变式2】(24-25高一上·甘肃定西·开学考试)某市2022年和2023年5月1日至5日每日的最高气温(单位:℃)如表:则这五天的最高气温更稳定的是 年.(选填“2022”或“2023”)
1日
2日
3日
4日
5日
2022年
26
27
30
33
31
2023年
22
25
24
24
22
【变式3】为了参加全运会,省运动管理中心对自行车运动员甲、乙两人在相同的条件下进行了6次测试,测得他们的最大速度的数据如表所示:请用平均数和方差来分析甲、乙两人谁参加这项重大比赛更合适.
甲
27
38
30
37
35
31
乙
33
29
38
34
28
36
【变式4】气象意义上从春季进入夏季的标志为“连续5天日平均温度不低于22 ℃”,现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位是℃)
①甲地:5个数据的中位数为24,众数为22;
②乙地:5个数据的中位数为27,平均数为24;
③丙地:5个数据中有一个数据是32,平均数为26,方差为10.2.
则肯定进入夏季的地区是 .
一、单选题
1.(23-24高一下·青海西宁·阶段练习)一个公司共有名员工,下设一些部门,要采用分层抽样方法从全体员工中抽取一个容量为的样本.已知某部门有名员工,那么从这一部门抽取的员工人数为( )
A.3 B.5 C.8 D.10
2.(23-24高二下·上海·阶段练习)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为( )
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
A.14 B.08 C.09 D.06
3.(24-25高一上·四川雅安·开学考试)已知一组数据8,5,x,8,10的平均数是8,以下说法错误的是( )
A.极差是5 B.众数是8 C.中位数是9 D.方差是2.8
4.(23-24高一上·浙江台州·开学考试)水果店有一批大小不一的橘子,某顾客从中选购了个头大且均匀的橘子若干个,设原有橘子的重量的平均数和方差分别是,,该顾客选购的橘子的重量的平均数和方差分别是,,则下列结论一定成立的是( )
A. B. C. D.
5.(23-24高一下·广东深圳·阶段练习)已知数据的平均数为10,方差为10,则的平均数和方差分别为( )
A.30,91 B.31,91 C.30,90 D.31,90
6.(23-24高一下·天津西青·期末)8个样本数据11,2,8,13,5,7,4,6的75%分位数为( )
A.11 B.9.5 C.8 D.7.5
7.(24-25高一上·四川成都·开学考试)如表是某公司员工月收入的资料.
月收入/元
45000
18000
10000
5500
5000
3400
3300
1000
人数
1
1
1
3
6
1
11
1
能够反映该公司全体员工月收入水平的统计量是( )
A.平均数和众数 B.平均数和中位数
C.中位数和众数 D.平均数和方差
8.(23-24高一下·湖南长沙·期末)有一组互不相等的样本数据,平均数为.若随机剔除其中一个数据,得到一组新数据,记为,平均数为,则下列说法错误的是( )
A.新数据的极差可能等于原数据的极差
B.新数据的中位数不可能等于原数据的中位数
C.若,则新数据的方差一定大于原数据方差
D.若,则新数据的分位数一定大于原数据的分位数
二、多选题
9.(24-25高一上·全国·课堂例题)(多选)某市模考共有70000多名学生参加,某校教科室为了了解本校3390名考生的数学成绩,从中抽取300名考生的数学成绩进行统计分析,下列说法正确的是( )
A.3390名考生是总体的一个样本 B.3390名考生的数学成绩是总体
C.样本容量是300 D.70000多名考生的数学成绩是总体
10.(23-24高一下·山东菏泽·阶段练习)据医院对某种病情治愈率统计为:老年患者治愈率为,中年患者治愈率为,青年患者治愈率为.现医院共有30名老年患者,40名中年患者,50名青年患者,则( )
A.若从该医院所有患者中抽取容量为20的样本,老年患者应抽取5人
B.该医院中年患者所占的频率为
C.估计该医院的平均治愈率大约是
D.估计该医院的平均治愈率大约是
11.(23-24高一下·黑龙江绥化·期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续10天,每天新增疑似病例不超过7人”,过去10天,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:平均数为2,众数为2;乙地:中位数为3,极差为4;丙地:平均数为2,中位数为3;丁地:平均数为2,标准差为,甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
三、填空题
12.(24-25高一上·全国·课堂例题)将一个总体分为A,B,C三层,其个体数之比为2∶3∶4,现用同比例分层抽样方法抽出一个容量为n的样本,其中A层中的个体数为16,那么此样本容量为n= .
13.(24-25高一上·四川成都·开学考试)已知一组数据1,2,0,,x,1的平均数是1,则这组数据的中位数为 .
14.(23-24高一下·江苏常州·期末)设x,y,z都是正整数,且,,,当x,y,z的取值依次为 时,x,y,z这三个数的方差最小.(若存在多组取值符合条件,只需写出其中一组取值)
四、解答题
15.(24-25高一上·全国·课前预习)某单位拟从40名员工中选5人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取5个号签,与这个号签编号一致的员工是幸运人选;
选法二:将35个白球与5个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选,试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能是否相等?
16.(22-23高一下·甘肃白银·期末)某选手在参加某次比赛中,各评委打出的分数为10,9,8,9,9,8,10,7,8,6.
(1)求该选手所有得分的平均数;
(2)若该选手所有得分的分位数为9,求整数m的取值集合.
17.(23-24高一上·黑龙江哈尔滨·开学考试)某校为了解九年级学生近两个月“推荐书目”的阅读情况,随机抽取了该年级的部分学生,调查了他们每人“推荐书目”的阅读本数,设每名学生的阅读本数为n,并按以下规定分为四档:当时,为“偏少”;当时,为“一般”;当时,为“良好”;当时,为“优秀”,现将调查结果统计后绘制成不完整的统计图表:
阅读本数(本)
1
2
3
4
5
6
7
8
9
人数(名)
1
2
6
7
12
7
y
1
请根据以上信息回答下列问题:
(1)求出本次随机抽取的学生总人数;
(2)分别求出统计表中的的值;
(3)估计该校九年级400名学生中为“优秀”档次的人数.
18.(24-25高一上·四川成都·开学考试)某次世界魔方大赛吸引世界各地共900名魔方爱好者参加,本次大赛首轮进行3×3阶魔方赛,组委会随机将爱好者平均分到30个区域,每个区域30名同时进行比赛,完成时间小于8秒的爱好者进入下一轮角逐;如图是3×3阶魔方赛A区域30名爱好者完成时间统计图,
(1)填空:A区域3×3阶魔方爱好者进入下一轮角逐的有______人.
(2)填空:若A区域30名爱好者完成时间为9秒的人数是7秒人数的3倍,
①a=______,b=______;
②完成时间的平均数是______秒,中位数是______秒,众数是______秒.
(3)若3×3阶魔方赛各个区域的情况大体一致,则根据A区域的统计结果估计在3×3阶魔方赛后进入下一轮角逐的约有多少人?
19.(23-24高一下·宁夏固原·期末)统计学作为数学的一个重要分支,其犹如一座坚实的大厦,构建于严谨的数学基石之上,为理解和诠释数据提供了强大的支撑,请用你所学到的统计知识解答以下问题:
(1)如果将总体分为k层,第j层抽取的样本为,,…,,第j层的样本量为,样本平均数为,样本方差为,.记,总的样本平均数为,样本方差为,证明:,即.
(2)为研究男女学生在生活费支出(单位:元)上的差异,某校在高一年级400名学生中随机抽取40人,统计他们某一周的生活费支出,得到下面的结果:
抽取的学生
生活费支出的平均数
生活费支出的标准差
男生22人
380
女生18人
360
根据以上数据及(1)结论,估计该校高一学生这周生活费支出的总体平均数、总体方差.
学科网(北京)股份有限公司
$$
第01讲 数据的收集及数字特征
课程标准
学习目标
1.数据的收集
2.数据的数字特征及其意义;
1.通过学习简单随机抽样,理解并掌握分层抽样的概念和步骤,会用分层抽样解决实际问题,提升数据分析与解决问题的核心素养.
2.会计算样本数据的数字特征,并能解决有关实际问题,提升学生的数据分析、逻辑推理、数学运算的能力.
知识点01 抽样方法
1.总体与样本
考察问题涉及的对象全体是总体,总体中每个对象都是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.
一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查),只抽取样本进行考察的方法称为抽样调查.
2.简单随机抽样
从总体中不加任何分组、划类、排队等,完全随机地抽取个体,这种抽样方法称为简单随机抽样(也称纯随机抽样).
常见的简单随机抽样方法有抽签法、随机数表法.
注意:分层抽样的适用前提条件是总体可以分层,层与层之间有明显区别,而层内个体间差异较小.
3.分层抽样
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
注意:使用分层抽样应遵循的原则:(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.
(2) 分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
【即学即练1】
1. (多选题)下列抽取样本的方式不是简单随机抽样的是( )
A.从无限多个个体中抽取100个个体作为样本
B.盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里
C.从20件玩具中逐个抽取3件进行质量检验
D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛
【答案】ABD
【解析】A不是简单随机抽样,因为题中被抽取的总体中的个体数是无限的,而不是有限的;B不是简单随机抽样,因为它是有放回抽样;C是简单随机抽样;D不是简单随机抽样,指定个子最高的5名同学是56名同学中特指的,不是等可能抽样.故选ABD.
2. 某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )
A.4 B.5 C.6 D.7
【答案】C
【解析】由已知得四类食品的抽样比为=,所以抽取的植物油类和果蔬类食品的种数之和为(10+20)×=6.故选C.
知识点02 最值与平均数
1.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
2.平均数
如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).
这一公式在数学中常简记为,其中的符号“∑”表示求和,读作“西格玛”,∑右边式子中的i表示求和的范围,其最小值与最大值分别写在∑的下面与上面.
(1)=;(2)
【即学即练2】(23-24高一下·河南郑州·期末)用抽签法抽取的一个容量为5的样本,它们的变量值分别为2,4,5,7,9,则该样本的平均数为( )
A.4.5 B.4.8 C.5.4 D.6
【答案】C
【分析】根据平均数的计算方法计算即可.
【详解】该样本平均数为.
故选:C
知识点03 中位数、百分位数、众数
1.中位数
一般地,有时也可以借助中位数来表示一组数的中心位置:如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.(注意:一组数据的中位数是唯一的.)
2.百分位数
(1)定义
一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于该值,且至少有(100-p)%的数据不小于该值.
直观来说,一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.
(2)求百分位数的步骤
为了方便,我们按如下方式确定p%分位数:设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取x为p%分位数;如果i是整数,取为p%分位数.特别地,规定:0分位数是x1(即最小值),100%分位数是xn(即最大值).
注意:(1)中位数就是一个50%分位数.
(2)按照定义可知,p%分位数可能不唯一,也正因为如此,各种统计软件所得出的p%分位数可能会有差异.
(3)实际应用中,除了中位数外,经常使用的是25%分位数(简称为第一四分位数)与75%分位数(简称为第三四分位数).
3.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.有些情形中,我们用众数来描述一组数据的中心位置.
注意:(1)众数不唯一,可以有一个,也可以有多个,还可以没有.如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.
(2)众数一定是原数据中的数,百分位数和中位数都不一定是原数据中的数.
【即学即练3】(24-25高一上·四川南充·开学考试)“杂交水稻之父”袁隆平培育的超级杂交稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取7株水稻苗,测得苗高(单位:)分别是23,24,23,25,26,23,25.则这组数据的众数和中位数分别是( )
A.24,25 B.23,23
C.23,24 D.24,24
【答案】C
【分析】把给定数据由小到大排列,再求出众数、中位数即得.
【详解】苗高由小到大排列为:,
所以这组数据的众数和中位数分别是23,24.
故选:C
知识点04 极差、方差与标准差
1.极差
一组数的极差指的是这组数的最大值减去最小值所得的差.不难看出,极差反映了一组数的变化范围,描述了这组数的离散程度.
注意: (1)极差反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.一般情况下,极差大,则数据较分散,数据的波动性大;极差小,则数据相对集中,数据的波动性小,极差的计算非常简单,但极差只考虑了两个极端值,而没有考虑中间的数据,因此很多时候,极差作为数据的离散程度的统计量,可靠性较差.
(2)极差的取值范围是[0,+∞).
2.方差
如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为.
3.标准差
方差的算术平方根称为标准差.
如果一组数中,各数据值都相等,则标准差为0,表明数据没有波动,数据没有离散性;若各数据的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也较大,数据的离散程度较高.因此标准差描述了数据相对于平均数的离散程度.
注意:标准差与方差的统计意义
(1)标准差(方差)的取值范围是[0,+∞)(标准差的大小不会超过极差).
(2)标准差(方差)描述了一组数据相对于平均数离散程度的大小.可以根据不同组数据的离散程度比较标准差(方差)的大小.
【即学即练4】(24-25高二上·河南·阶段练习)已知退休的王大爷连续天户外运动的步数(单位:百步)分别为,,,,,则该组数据的均值与方差分别为( )
A., B., C., D.,
【答案】A
【分析】根据平均值和方差的计算公式,可得答案.
【详解】均值:,
方差:.
故选:A.
知识点05平均数、方差的计算方法总结
1.平均数的计算方法
(1)定义法:当所给数据x1,x2,…,xn比较小,又比较分散时,一般选用公式来计算.
(2)新数据法:当所给的一组数据都在某一常数a的附近波动时,一般选用简单化公式xi=a+xi′,其中常数a通常取接近于这组数据的平均数的较“整”的数,先计算则.
(3)性质法:如果x1,x2,…,xn,的平均数为 ,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
(4)频数平均数法(也称为加权平均数法):在给定的n个数据中,如果x1出现了f1次,x2出现了f2次,…,xk出现了fk次,则一般选用=(其中=n)来计算平均数.
2.方差的计算方法
(1)定义法:s2=.
(2)简化法:s2=[(x+x+…+x)-n2].
(3)性质法:如果a,b为常数(a=0),则ax1+b,ax2+b,...,axn+b的方差为a2s2.
【即学即练5】设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1 C.1 D.10
【答案】C
【解析】
因为数据的方差是数据的方差的倍,
所以所求数据方差为
故选:C
题型01 普查与抽样
【典例1】(24-25高一上·四川成都·开学考试)下列调查中,适合用普查的是( )
A.了解我省初中学生的家庭作业时间 B.了解“嫦娥四号”卫星零部件的质量
C.了解一批电池的使用寿命 D.了解某市居民对废电池的处理情况
【答案】B
【分析】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果没有普查准确,但相对节约人力,物力和时间.
【详解】A、了解我省初中学生的家庭作业时间,适合抽样调查,故此选项错误;
B、了解“嫦娥三号”卫星零部件的状况,适合用普查,符合题意;
C、华为公司一批某型号手机电池的使用寿命,适合抽样调查,故此选项错误;
D、了解某市居民对废电池的处理情况,适合抽样调查,故此选项错误;
故选:B.
【变式1】(25-26高一上·全国·课前预习)下列调查中,最适宜采用全面调查方式(普查)的是( )
A.对某市中学生每天学习所用时间的调查
B.对全国中学生心理健康现状的调查
C.对某班学生进行6月5日是“世界环境日”知晓情况的调查
D.对某市初中学生课外阅读量的调查
【答案】C
【分析】利用抽样调查和全面调查的适用条件逐项分析判断即得.
【详解】对于A,对某市中学生每天学习所用时间的调查,人数众多,宜采用抽样调查,A错误;
对于 B,对全国中学生心理健康现状的调查,人数众多,宜采用抽样调查,B错误;
对于C,对某班学生进行6月5日是“世界环境日”知晓情况的调查,人数不多,宜采用全面调查,C正确;
对于D,对某市初中学生课外阅读量的调查,人数众多,宜采用抽样调查,D错误.
故选:C
【变式2】(25-26高一上·全国·课后作业)在以下调查中,适合用普查的个数是( )
①调查一个班级学生的吃早餐情况; ②调查某种饮料质量合格情况;
③调查某批飞行员的身体健康指标; ④调查某个水库中草鱼所占的比例.
A.1 B.2 C.3 D.4
【答案】B
【分析】根据普查的定义逐个分析判断即可.
【详解】①因为一个班级学生的人数不太多,吃早餐情况的全面调查也容易操作,所以适合普查;
②某种饮料数量太多,质量合格情况适合抽样调查;
③飞行员的职业特点决定了身体健康指标必须普查;
④某个水库中鱼的种类和数量一般都较多,不适合普查.
故选:B.
【变式3】(23-24高一下·青海海南·期末)下列调查中,调查方式选择合理的是( )
A.了解某一品牌空调的使用寿命,选择普查
B.了解神舟飞船的设备零件的质量情况,选择抽样调查
C.了解一批袋装食品是否含有防腐剂,选择普查
D.了解某公园全年的游客流量,选择抽样调查
【答案】D
【分析】根据抽样调查和普查的定义,逐个选项判断调查方式是否合理即可.
【详解】对于A,了解某一品牌空调的使用寿命,选择抽样调查更符合经济效益,故A错误;
对于B,了解神舟飞船的设备零件的质量情况,
安全是最重要的,应该采取普查,故B错误;
对于C,了解一批袋装食品是否含有防腐剂,选择抽样调查更符合经济效益,故C错误;
对于D,了解某公园全年的游客流量,选择抽样调查比较符合经济效益,故D正确.
故选:D.
题型02 总体与样本
【典例2】(23-24高一下·西藏日喀则·期末)高考结束后,为了分析该校高三年级1000名学生的高考成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100名学生是个体
B.样本容量是100
C.每名学生的成绩是所抽取的一个样本
D.1000名学生是样本
【答案】B
【分析】根据有关的概念可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,再结合题中选项即可得到答案.
【详解】根据有关的概念并且结合题意可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,
根据选项可得选项A、D表达的对象都是学生,而不是成绩,所以A、D都错误.
C每名学生的成绩是所抽取的一个样本也是错的,应是每名学生的成绩是一个个体.
B:样本的容量是100正确.
故选:B.
【变式1】(25-26高一上·全国·课前预习)从某年级500名学生中抽取60名学生进行身高的统计分析,下列说法正确的是( )
A.500名学生是总体 B.每个被抽查的学生是个体
C.抽取的60名学生的身高是一个样本 D.抽取的60名学生的身高是样本容量
【答案】C
【分析】根据统计中样本,总体及样本容量的概念进行判断.
【详解】由于抽取的是60名学生的身高,因此500名学生的身高是总体,每个学生的身高是个体,
这60名学生的身高构成一个样本,样本的容量为60,ABD错误,C正确.
故选:C
【变式2】(25-26高二上·上海·单元测试)学校为了调查高二年级学生体重情况,随机抽取50个高二年级学生进行体重测量,这50个学生的体重是( )
A.总体 B.个体 C.样本 D.样本容量
【答案】C
【分析】根据总体,个体,样本,样本容量的定义分析判断.
【详解】从高二年级随机抽取50个高二年级学生进行体重测量,
则这50个学生的体重组成一个样本.
故选:C
【变式3】(23-24高一下·广西河池·期末)某市市场监管局为了了解饮料的质量,从该市区某超市在售的种饮料中抽取了种饮料,对其质量进行了检查.在这个问题中,是( )
A.总体 B.个体 C.样本 D.样本量
【答案】D
【分析】根据随机抽样概念求解即可.
【详解】总体:我们把与所研究问题有关的全体对象称为总体;
个体:把组成总体的每个对象称为个体;
样本:从总体中,抽取的一部分个体组成了一个样本;
样本量:样本中个体的个数叫样本量,其不带单位;
在售的50种饮料中抽取了30种饮料,对其质量进行了检查,
在这个问题中,50种饮料是总体,每一种饮料是个体,30种饮料是样本,30是样本量.
故选:D.
【变式4】(23-24高一下·新疆伊犁·阶段练习)为了解某中学高一年级600名学生的身高情况,抽查了其中100名学生的身高进行统计分析.下列叙述错误的是( )
A.以上调查属于全面调查
B.每名学生的身高是总体的一个个体
C.100名学生的身高是总体的一个样本
D.600名学生的身高是总体
【答案】A
【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象.从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.
【详解】A.以上调查属于抽样调查,故符合题意;
B.每名学生的身高情况是总体的一个个体,故不符合题意;
C.100名学生的身高是总体的一个样本,故不符合题意;
D.600名学生的身高情况是总体,故不符合题意;
故选:A.
题型03 简单随机抽样
【典例3】(24-25高一上·全国·课前预习)下列问题中最适合用简单随机抽样方法的是( )
A.某学校有学生1320人,卫生部门为了了解学生身体发育情况,准备从中抽取一个容量为300的样本
B.从1135个村庄中抽取50个进行收入调查
C.从全班30名学生中,任意选取5名进行家访
D.为了解某地区某传染病的发病情况,从该地区的5000人中抽取200人进行统计
【答案】C
【分析】分析总体容量的大小,以及样本之间是否有明显差异,综合比较可得.
【详解】A项,总体容量较大,有明显的层次性,如男女生在身高体重等方面有较大差异,宜采用分层抽样方法;
B项,总体容量较大,且各村庄人口、地域、发展等方面的差异,收入可能有明显的差异,不宜采用简单随机抽样方法;
C项,总体个数少,家访活动学生个体平等,且无明显差异,宜采用简单随机抽样方法;
D项,总体容量大,不同年龄的人传染病发病情况不同,有明显的差异,不宜采用简单随机抽样方法;
综上比较,最适合用简单随机抽样方法的是C.
故选:C.
【变式1】24-25高二上·四川成都·阶段练习)某校高一共有10个班,编号1至10,某项调查要从中抽取三个班作为样本,现用抽签法抽取样本,每次抽取一个号码,共抽3次,设五班第二次被抽到的可能性为,则( )
A. B. C. D.
【答案】D
【分析】根据题意,在抽样过程中每个个体被抽到的概率相等即可求解.
【详解】因为总体中共有10个个体,
所以五班第一次没被抽到,第二次被抽到的可能性为
.
故选:.
【变式2】(23-24高一下·天津南开·期末)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( ).
A. B. C. D.
【答案】B
【分析】根据已知条件,结合简单随机抽样的定义,即可求解.
【详解】解:第二次抽取时,余下的每个个体被抽到的概率为,
则,
解得,
故在整个抽样过程中,每个个体被抽到的可能性为.
故选:B.
题型04 随机数表法
【典例4】(23-24高一下·甘肃白银·阶段练习)某总体由编号为的个个体组成,利用下列随机数表选出个个体,选法是下列表中第一行第列开始从左到右依次选个数字,选出的第个个体编号为( )
1818
0792
4544
1716
5809
7983
8619
6216
7650
0310
5523
6405
0526
6238
A.16 B.09 C.19 D.61
【答案】C
【分析】根据随机数表,依次进行选择即可得出结果.
【详解】选取方法是从随机数表第1行的第列数字开始,
从左到右依次选取两个数字,
则选出来的个个体编号分别为∶
所以选出来的第个个体编号为.
故选:C.
【变式1】(23-24高一下·云南玉溪·阶段练习)某工厂用简单随机抽样中的随机数法对生产的700个零件进行抽样,先将700个零件进行编号,.从中抽取70个样本,下图是利用软件生成的随机数,只需随机选定一个初始位置和方向开始读数,每次读取一个3位数,只要读取的号码落在编号范围内,该号码就是所抽到的样本编号,这样即可获得70个样本的编号,注意样本号码不能重复.若从表中第2行第6列的数2开始向右读取数据,取到的第一个样本编号是253,则得到的第6个样本编号是( )
A.007 B.328 C.253 D.623
【答案】D
【分析】根据系统抽样规则列举出前几个,即可得解.
【详解】依题意可得抽取的样本编号依次为:,,,,,,,
所以第个样本编号是.
故选:D
【变式2】(23-24高一下·江苏连云港·期末)总体编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为( )
7816 1572 0802 6315 0216 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.02 B.14 C.15 D.16
【答案】B
【分析】结合随机数表法确定正确答案.
【详解】选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,
则选出来的个体的编号为16,15,72(舍去),08,02,63(舍去),15(舍去),
02(舍去),16(舍去),43(舍去),19,97(舍去),14.
故选出的第6个个体编号为14.
故选:B.
【变式3】(23-24高一下·陕西咸阳·阶段练习)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,,649,650.从中抽取50个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.007 B.253 C.328 D.860
【答案】A
【分析】按照随机数表提供的数据,三位一组的读数,并取001到650内的数,重复的只取一次,读取到第4个即可.
【详解】从第5行第6列开始向右读取数据,
第一个数为253,第二个数是313,
第三个数是457,下一个数是860,不符合要求,
下一个数是736,不符合要求,下一个是253,重复,
第四个是007,故A正确.
故选:A.
题型05 分层抽样
【典例5】(23-24高一下·广东茂名·阶段练习)某工厂生产三种不同型号的产品,它们的产量之比为,用分层抽样的方法抽取一个容量为的样本.若样本中型号的产品有120件,则样本容量为( )
A.150 B.180 C.200 D.250
【答案】C
【分析】根据分层抽样的性质分析求解即可.
【详解】由题意得,,解得.
故选:C.
【变式1】(23-24高一下·江苏常州·期末)某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
【答案】D
【分析】按照分层抽样计数规则计算可得.
【详解】依题意高一年级应抽取的人数为人.
故选:D.
【变式2】(23-24高一下·陕西·期末)中国古代科举制度始于隋而成于唐,兴盛于明、清两朝.明代会试分南卷、北卷、中卷,按的比例录取,若某年会试录取人数为200,则中卷录取人数为( )
A.150 B.110 C.70 D.20
【答案】D
【分析】根据分层抽样的性质和抽样比计算即可.
【详解】由于分层抽样比为,则200个人中,中卷录取人数为.
故选:D.
【变式3】(23-24高一下·安徽马鞍山·期末)某校高一年级有810名学生,现用比例分配的分层随机抽样方法抽取一个容量为72的样本,则抽取男生和女生的人数分别为40,32,则该校高一年级的女生人数为( ).
A.450 B.360 C.400 D.320
【答案】B
【分析】根据分层抽样定义计算即可.
【详解】由分层抽样可得高一年级的女生人数为.
故选:B.
【变式4】(24-25高一上·全国·随堂练习)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.抽签法
【答案】C
【分析】由已知条件,适合分层抽样法,即可得到答案.
【详解】因为事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.为了解该地区中小学生的视力情况,应按学段分层抽样,这种抽样方式抽出的样本具有代表性,比较合理.
故选;C.
题型06 平均数
【典例6】若样本数据的平均数是2,则数据的平均数是( )
A.2 B.3 C.5 D.7
【答案】C
【分析】由均值的定义求解.
【详解】由题意,
所以
,
故选:C.
【变式1】(23-24高一下·甘肃定西·阶段练习)为了配合调配水资源,某市欲了解全市居民的月用水量.若通过简单随机抽样从中抽取了1000户进行调查,得到其月用水量的平均数为9吨,则可推测全市居民用户月用水量的平均数( )
A.一定为9吨 B.高于9吨 C.约为9吨 D.低于9吨
【答案】C
【分析】由样本估计总体的相关知识即可求解.
【详解】推测全市居民用户月用水量的平均数是估计值,约为9吨.
故选:C.
【变式2】(24-25高二上·湖南·阶段练习)某学校的高一、高二及高三年级分别有学生人、人、人,用分层抽样的方法从全体学生中抽取一个容量为人的样本,抽出的高一、高二及高三年级学生的平均身高为、、,估计该校学生的平均身高是( )
A. B. C. D.
【答案】B
【分析】由分层抽样的概念求出各个年级抽得的人数,计算平均数即可.
【详解】因为高一、高二及高三年级分别有学生人、人、人,
用分层抽样的方法从全体学生中抽取一个容量为人的样本,
则高一、高二及高三年级分别抽人,人,人,
抽出的高一、高二及高三年级学生的平均身高为、、,
所以该校学生的平均身高为.
故选:B
【变式3】(23-24高一下·福建福州·期末)若数据、、…、的平均数是4,方差是4,数据、、…、的平均数是,标准差是,则下列结论正确的是( )
A., B.,
C., D.,
【答案】D
【分析】由数据、、…、的平均数是4,方差是4,数据、、…、的平均数是,方差,代入计算可得平均数,方差的值,开方求出标准差,可得答案.
【详解】因为数据、、…、的平均数是4,方差是4,
即,,
数据、、…、的平均数
,
数据、、…、的方差
,
所以标准差是.
故选:D.
【变式4】(2023·陕西榆林·模拟预测)已知数据,,,,,,的极差和平均数相等,则实数的值为( )
A.34 B.35 C.36 D.37
【答案】B
【分析】根据极差、平均数的定义表示出极差与平均数,从而得到方程,解得即可.
【详解】依题意可得极差为,
平均数为,
所以,解得.
故选:B
题型07 众数
【典例7】(23-24高一下·新疆·期末)已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是( )
A.86,84 B.84.5,85 C.85,84 D.86.5,84
【答案】D
【分析】根据平均数和众数的概念求解.
【详解】将样本数据按升序排列为79,84,84,84,86,87,93,95,可得平均数,
因为84出现了三次,且次数最多,所以众数为84.
故选:D
【变式1】(23-24高一上·福建厦门·开学考试)今年是我国现行宪法公布施行40周年.为贯彻党的二十大精神,强化宪法意识,弘扬宪法精神,推动宪法实施,某学校开展法律知识竞赛活动,全校一共100名学生参与其中,得分情况如下表.则分数的中位数和众数分别是( )
分数(分)
60
70
80
90
100
人数
8
22
20
30
20
A.80,90 B.90,100
C.85,90 D.90,90
【答案】C
【分析】本题根据中位数和众数的概念进行解答即可.
【详解】把这些数据从小到大排列,最中间的两个数是第两个数,
所以全班名同学的成绩的中位数是,
出现了次,出现次数最多,则众数为.
所以分数的中位数和众数分别是.
故选:C.
【变式2】(23-24高三上·河北秦皇岛·开学考试)五名学生每人投篮15次,统计他们每人投中的次数,得到五个数据,若这五个数据的中位数是6,唯一的众数是7,则他们投中次数的总和最大是 .
【答案】29
【分析】假设五个数据按照由小到大排列为,根据中位数和众数的定义可求出的值,再由两个较小的数一定是小于6的非负整数,且不相等,从而可求出这五个数和的范围,进而可得答案.
【详解】假设五个数据按照由小到大排列为,
因为这五个数据的中位数是6,唯一的众数是7,
所以,所以最大的三个数的和为,
因为两个较小的数一定是小于6的非负整数,且不相等,最大为4和5,
所以这五个数的和一定大于20且小于等于29,
故答案为:29
【变式2】(2024高一下·全国·专题练习)某鞋店试销一种新款女鞋,销售情况如下表:
码号
34
35
36
37
38
39
40
41
数量/双
2
5
9
16
9
5
3
2
如果你是鞋店经理,最关心的是哪种码号的鞋销量最大,那么对你来说最重要的是 (填“平均数”“众数”或“中位数”).
【答案】众数
【分析】根据众数、平均数、中位数的意义进行选择.
【详解】鞋店经理最关心的是哪种码号的鞋销量最大,
由题表可知,码号为37的鞋销量最大,共销售了16双,37是这组数据的众数.
故答案为:众数
题型08 百分位数
【典例8】(23-24高一下·江苏无锡·阶段练习)从小到大排列的数据1,2,3,5,6,7,8,9,10,14,15,18的下四分位数为( )
A.3 B.4 C.10 D.12
【答案】B
【分析】利用分位数的定义进行求解.
【详解】数据共12个,,
故从小到大,选择第3和第4个数的平均数作为下四分位数,即.
故选:B.
【变式1】(23-24高一下·贵州黔西·期末)兴义市峰林布依景区在春节期间,迎来众多游客,其中某天接受了一个小型的旅行团,他们的年龄(单位:岁)如下:6,6,7,8,10,37,39,45,46,52,53,61,则这组数据的第75百分位数是( )
A.34.5 B.46 C.49 D.52
【答案】C
【分析】根据题意结合百分位数的定义运算求解.
【详解】因为,所以这组数据的第75百分位数是第9位数和第10位数的中位数.
故选:C.
【变式2】(24-25高二上·上海·单元测试)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居民,他们的幸福感指数分别为5、6、7、8、9、5,则这组数据的第80百分位数是( )
A.5 B.6 C.7 D.8
【答案】D
【分析】利用百分位数的概念求解即可,先将数据排序,再计算第80百分位数的位置进而求解.
【详解】将数据排序:5、5、6、7、8、9,则
所以这组数据的第80百分位数是第5个数据,为8.
故选:D.
【变式3】(24-25高一上·全国·课后作业)某部门有8位员工,其中6位员工的月工资分别为8200,8300,8500,9100,9500,9600(单位:元),另两位员工的月工资数据不清楚,但两人的月工资和为17000元,则这8位员工月工资的可能的最大值为( )
A.9100 B.8800
C.8700 D.8500
【答案】B
【分析】根据题意可知中位数为第两位员工工资的平均数,假设未知月工资的两位员工的月工资分别为,进而得到,然后进行分类讨论即可.
【详解】第分位数为第两位员工工资的平均数,
设未知月工资的两位员工的月工资分别为和,则,
若时,则8位员工月工资的;
若中有一个大于8500,一个小于8500,则8位员工月工资的最大为,
即这8位员工月工资的可能的最大值为8800.
故选:B.
【变式4】(24-25高一上·全国·课后作业)若数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的,则实数x的取值范围是( )
A.[4.5,+∞) B.[4.5,6.6)
C.(4.5,+∞) D.[4.5,6.6]
【答案】A
【分析】根据百分位数的计算公式求解即可.
【详解】因为所以这组数据的分位数是第6项数据4.5,
则,
故选:A.
【变式5】气象意义上从春季进入夏季的标志为"连续5天的日平均温度全都不低于22℃".现有甲、乙、丙、丁四地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃):①甲地:5个数据的中位数为23,众数为22;②乙地:5个数据的中位数为26,平均数为25,众数为27;③丙地:5个数据中有1个数据是32,平均数为26,方差为11.2;④丁地:5个数据的20百分位数为23,平均数为27.其中肯定进入夏季的地区个数为( )
A.4 B.3 C.2 D.1
【答案】C
【分析】根据数据的特点估计出甲、乙、丙三地连续5天的日平均温度的记录数据,分析数据的可能性进行解答即可
【详解】对于①,甲地:5个数据的中位数为23,众数为22,则甲地连续5天的日平均温度的记录数据可能为:22,22,23,24,25,其连续5天的日平均温度不低于22℃;
对于②,乙地:5个数据的中位数为26,平均数为25,众数为27,当5个数据为20,25,26,27,27时,其连续5天的日平均温度有低于22℃,故不确定;
对于③,丙地:5个数据中有1个数据是32,平均数为26,方差为11.2,设剩余4个数分别为,所以,所以,若有一天温度低于22度,因为平均值为26,则必有一天高于30度,所以有,故可知其连续5天的日平均温度均不低于22℃;
对于④,丁地:符合条件,但未进入夏季
综上所述,肯定进入夏季的地区有甲、丙两地
故选:C
题型09 方差与标准差
【典例9】(24-25高一上·山东·开学考试)为了解家里每月的用水量情况,小明收集并记录了家里连续6个月的用水量,分别是(单位:吨),关于这几个数据的说法,下列结论中正确的是( )
A.平均数是5 B.众数是6 C.中位数是5 D.方差是
【答案】D
【分析】将这组数据重新排列,再根据平均数、众数、中位数及方差的定义求解即可.
【详解】将这组数据重新排列为2、3、4、4、5、6,
∴这组数据的平均数为,
众数为4,
中位数为=,
方差为,
故选项A、B、C不符合题意,选项D符合题意.
故选:D.
【变式1】(23-24高一下·吉林长春·期末)高一年级某位同学在五次考试中的数学成绩分别为105,90,104,106,95,这位同学五次数学成绩的方差为( )
A.20.2 B.40.4 C.50 D.50.2
【答案】B
【分析】根据题中数据结合平均数、方差公式运算求解.
【详解】由题意可得:数学成绩平均数为,
所以数学成绩的方差为.
故选:B.
【变式2】(23-24高一下·广东广州·期末)已知样本数据都为正数,其方差,则样本数据的平均数为( )
A.2 B. C.4 D.
【答案】C
【分析】根据给定条件,利用方差计算公式即可得解.
【详解】令样本数据的平均数为,则,而,
因此,又样本数据均为正数,所以.
故选:C
【变式3】.(23-24高一下·河南·开学考试)已知数据,,…,的方差为,数据,,…,的方差为.则( )
A.1 B.2
C. D.
【答案】C
【分析】由方差的性质得到,,…,的方差为,从而得到方程,求出答案.
【详解】已知样本数据的平均数为,方差为,
记数据的平均数为,方差为,
则
,
,
故,,…,的方差为,
所以,则.
故选:C.
【变式4】(23-24高二下·湖南·期中)为了解某高中甲、乙两个清北班一周内的请假同学人数情况,采用样本量比例分配分层随机抽样方法进行了调查.已知甲班调查了40名同学,其一周内请假人数的平均数和方差分别为5和1.65,乙班调查了60名同学,其一周内请假人数的平均数和方差分别为4和3.5,据此估计该校两个清北班一周内请假人数的总体方差为( )
A.2.6 B.3 C.3.4 D.4.1
【答案】B
【分析】根据题意,由分层抽样方法可得甲班和乙班所占的比重,进而由总体平均数,方差的计算公式计算可得结果.
【详解】因为甲班调查了40人,则甲班所占比重为,
乙班调查了60人,则乙班所占比重为,
甲班平均数和方差分别为和乙班平均数和方差分别为和
设调查的总样本的平均数为和方差为则,
故选:B.
题型10 数字特征的实际应用
【典例10】(多选)(23-24高一下·贵州黔西·期末)为了强化学校体育,增强学生体质,狠抓校园足球工作,全面推动校园足球高质量发展,2023年10月22日,第七届“金州杯”校园足球联赛在普安举行.在去年的足球联赛上,甲队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;乙队每场比赛平均失球数是2.1,全年比赛失球个数的标准差为0.4,则下列说法正确的是( )
A.平均说来乙队比甲队的防守技术好
B.乙队比甲队技术水平更稳定
C.甲队防守中有时防守表现较差,有时表现又非常好
D.乙队很少不失球
【答案】BCD
【分析】根据两个队伍的平均数和方差,进行比较,结合平均数以及方差的意义逐项分析判断.
【详解】对于选项A:因为,可知平均说来甲队比乙队的防守技术好,故A错误;
对于选项BC:因为,可知乙队比甲队技术水平更稳定,
即甲队防守中有时防守表现较差,有时表现又非常好,故BC正确;
对于选项D:因为乙队每场比赛平均失球数是2.1,且标准差为0.4,
结合选项B可知:乙队平均失球数多,且乙队防守技术水平更稳定,
即乙队很少不失球,故D正确;
故选:BCD.
【变式1】(24-25高一上·四川成都·开学考试)甲、乙两人各射击次,甲所中的环数是,,,,,,且甲所中的环数的平均数是,众数是;乙所中的环数的平均数是,方差是4.根据以上数据,对甲,乙射击成绩的正确判断是( )
A.甲射击成绩比乙稳定 B.乙射击成绩比甲稳定
C.甲,乙射击成绩稳定性相同 D.甲、乙射击成绩稳定性无法比较
【答案】B
【分析】甲所中的环数的平均数是,众数是,则可以得到a,b,c三个数其中一个是2,另两个数是8,求得则甲的方差,再进行比较得出结果.
【详解】∵这组数中的众数是8,
∴a,b,c中至少有两个是8,
∵平均数是6,
∴a,b,c三个数其中一个是2,
综上,甲所中环数为,
∴甲所中环数的方差,
∵,
∴乙射击成绩比甲稳定.
故选:B.
【变式2】(24-25高一上·甘肃定西·开学考试)某市2022年和2023年5月1日至5日每日的最高气温(单位:℃)如表:则这五天的最高气温更稳定的是 年.(选填“2022”或“2023”)
1日
2日
3日
4日
5日
2022年
26
27
30
33
31
2023年
22
25
24
24
22
【答案】2023
【分析】先根据方差的定义列式计算出2022、2023年的方差,再依据方差的意义求解即可.
【详解】2022年的平均气温为,
则其方差为,
2023年的平均气温为,
则其方差为,
因为,所以这五天的最高气温更稳定的是2023年;
故答案为:2023
【变式3】为了参加全运会,省运动管理中心对自行车运动员甲、乙两人在相同的条件下进行了6次测试,测得他们的最大速度的数据如表所示:请用平均数和方差来分析甲、乙两人谁参加这项重大比赛更合适.
甲
27
38
30
37
35
31
乙
33
29
38
34
28
36
【答案】派乙参赛更合适
【分析】根据已知数据算出平均数和方差,平均数相同,再选方差较小的即可.
【详解】,
,
,
,
因为,,
所以派乙参赛更合适.
【变式4】气象意义上从春季进入夏季的标志为“连续5天日平均温度不低于22 ℃”,现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位是℃)
①甲地:5个数据的中位数为24,众数为22;
②乙地:5个数据的中位数为27,平均数为24;
③丙地:5个数据中有一个数据是32,平均数为26,方差为10.2.
则肯定进入夏季的地区是 .
【答案】甲、乙
【解析】对于①,甲地肯定进入夏季,因为众数为22,所以22至少出现两次,若有一天低于22 ℃,则中位数不可能为24;
对于②,乙地不一定进入夏季,
如13,23,27,28,29;
对于③,丙地肯定进入夏季,
根据方差的定义有[(x1-26)2+(x2-26)2+(x3-26)2+(x4-26)2+(32-26)2]=10.2,
即(x1-26)2+(x2-26)2+(x3-26)2+(x4-26)2=15,显然x1,x2,x3,x4都要大于22,才能成立.故满足题意的有①③.
答案:甲、丙
一、单选题
1.(23-24高一下·青海西宁·阶段练习)一个公司共有名员工,下设一些部门,要采用分层抽样方法从全体员工中抽取一个容量为的样本.已知某部门有名员工,那么从这一部门抽取的员工人数为( )
A.3 B.5 C.8 D.10
【答案】B
【分析】根据分层抽样的概念即可计算.
【详解】设该部门抽取的员工人数为,
则,解得.
故选:B.
2.(23-24高二下·上海·阶段练习)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为( )
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
A.14 B.08 C.09 D.06
【答案】A
【分析】根据随机数表法的读取规则,即可求解.
【详解】依次选出的编号为:01,17,09,08,06,14;
则选出来的第6支水笔的编号为14.
故选:A.
3.(24-25高一上·四川雅安·开学考试)已知一组数据8,5,x,8,10的平均数是8,以下说法错误的是( )
A.极差是5 B.众数是8 C.中位数是9 D.方差是2.8
【答案】C
【分析】根据平均数解得,将数据按升序排列,根据极差、众数、中位数和方差逐项分析判断.
【详解】由题意可知:,解得,
将数据按升序排列可得:5,8,8,9,10,则有:
极差为,故A正确;
众数是8,故B正确;
中位数为8,故C错误;
方差为,故D正确;
故选:C.
4.(23-24高一上·浙江台州·开学考试)水果店有一批大小不一的橘子,某顾客从中选购了个头大且均匀的橘子若干个,设原有橘子的重量的平均数和方差分别是,,该顾客选购的橘子的重量的平均数和方差分别是,,则下列结论一定成立的是( )
A. B. C. D.
【答案】C
【分析】根据方差和平均数的意义,结合题设的实际场景即可判断.
【详解】水果店有一批大小不一的橘子,某顾客从中选购了个头大且均匀的橘子若干个,
所以该顾客选购橘子的质量平均数>原有橘子的质量的平均数,
该顾客选购的橘子的质量的方差<原有橘子的质量的方差.
故选:C
5.(23-24高一下·广东深圳·阶段练习)已知数据的平均数为10,方差为10,则的平均数和方差分别为( )
A.30,91 B.31,91 C.30,90 D.31,90
【答案】D
【分析】根据平均数、方差的性质计算可得.
【详解】因为,,,,的平均数是10,方差是10,
所以的平均数是,方差是.
故选:D.
6.(23-24高一下·天津西青·期末)8个样本数据11,2,8,13,5,7,4,6的75%分位数为( )
A.11 B.9.5 C.8 D.7.5
【答案】B
【分析】将数据从小到大排列,根据百分位数的求法,即可求得答案.
【详解】8个样本数据从小到大排列为:2,4,5,6,7,8,11,13,
由于,故这8个样本数据的75%分位数为,
故选:B
7.(24-25高一上·四川成都·开学考试)如表是某公司员工月收入的资料.
月收入/元
45000
18000
10000
5500
5000
3400
3300
1000
人数
1
1
1
3
6
1
11
1
能够反映该公司全体员工月收入水平的统计量是( )
A.平均数和众数 B.平均数和中位数
C.中位数和众数 D.平均数和方差
【答案】C
【分析】求出数据的众数和中位数,再与25名员工的收入进行比较即可.
【详解】公司共有员工1+1+1+3+6+1+11+1=25人,
该公司员工月收入的众数为3300元,在25名员工中有13人这此数据之上,
因此众数能够反映该公司全体员工月收入水平;
月收入由小到大排列,3400为第13个数,因此该公司员工月收入的中位数为3400元;
在25名员工中在此数据及以上的有13人,则中位数也能够反映该公司全体员工月收入水平,
而25名员工月收入的平均数元
受极端数据45000、18000等影响,平均数偏离多数人的收入水平,而方差是表征数据波动大小的量,
所以能够反映该公司全体员工月收入水平的统计量是中位数和众数.
故选:C
8.(23-24高一下·湖南长沙·期末)有一组互不相等的样本数据,平均数为.若随机剔除其中一个数据,得到一组新数据,记为,平均数为,则下列说法错误的是( )
A.新数据的极差可能等于原数据的极差
B.新数据的中位数不可能等于原数据的中位数
C.若,则新数据的方差一定大于原数据方差
D.若,则新数据的分位数一定大于原数据的分位数
【答案】D
【分析】根据题意,由数据极差、中位数、方差和百分位数的计算公式逐项分析即可.
【详解】不妨设原数据,新数据..,
A:例如原数据为,新数据为,此时极差均为,故A正确;
B:原数据中位数为,新数据中位数为,可知或,
若,可得;若,可得;
综上所述:新数据的中位数不可能等于原数据的中位数,故B正确;
C:若,可知去掉的数据为,则,
可得,所以新数据的方差一定大于原数据方差,故C正确;
D:若,可知去掉的数据为,因为,可知原数据的分位数为第3位数,,可知新数据的分位数为第2位数与第3位数的平均数,
例如原数据为,新数据为,此时新数据的分位数、原数据的分位数均为3,故D错误,
故选:D.
二、多选题
9.(24-25高一上·全国·课堂例题)(多选)某市模考共有70000多名学生参加,某校教科室为了了解本校3390名考生的数学成绩,从中抽取300名考生的数学成绩进行统计分析,下列说法正确的是( )
A.3390名考生是总体的一个样本 B.3390名考生的数学成绩是总体
C.样本容量是300 D.70000多名考生的数学成绩是总体
【答案】BC
【分析】根据总体、个体、样本、样本容量的概念,可以判断BC正确.
【详解】总体是3390名考生的数学成绩,样本是抽取的300名考生的数学成绩,样本容量是300.
故选:BC.
10.(23-24高一下·山东菏泽·阶段练习)据医院对某种病情治愈率统计为:老年患者治愈率为,中年患者治愈率为,青年患者治愈率为.现医院共有30名老年患者,40名中年患者,50名青年患者,则( )
A.若从该医院所有患者中抽取容量为20的样本,老年患者应抽取5人
B.该医院中年患者所占的频率为
C.估计该医院的平均治愈率大约是
D.估计该医院的平均治愈率大约是
【答案】ABC
【分析】根据频率的计算即可结合选项逐一求解.
【详解】对于A,若从该医院所有患者中抽取容量为20的样本,老年患者应抽取的人数为,A对;
对于B,该医院中年患者所占的频率为,B对;
对于CD,估计该医院的平均治愈率大约是,C对D错.
故选:ABC.
11.(23-24高一下·黑龙江绥化·期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续10天,每天新增疑似病例不超过7人”,过去10天,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:平均数为2,众数为2;乙地:中位数为3,极差为4;丙地:平均数为2,中位数为3;丁地:平均数为2,标准差为,甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
【答案】BCD
【分析】对于A,举例判断,对于B,计算出每天新增疑似病例人数的最大值判断,对于CD,利用反证法判断.
【详解】对于A,若甲地过去10天每天新增疑似病例人数分别为0,0,0,2,2,2,2,2,2,8,
则满足平均数2,众数为2,但不满足每天新增疑似病例不超过7人,所以A错误,
对于B,因为乙地:中位数为3,极差为4,则最大值不大于,
所以乙地满足每天新增疑似病例不超过7人,所以B正确,
对于C,假设丙地至少有一天新增疑似病例人数超过7人,
由中位数为3可得平均数的最小值为,
与题意矛盾,所以C正确,
对于D,假设丁地至少有一天新增疑似病例人数超过7人,
则方差的最小值为,与题意矛盾,所以D正确,
故选:BCD.
三、填空题
12.(24-25高一上·全国·课堂例题)将一个总体分为A,B,C三层,其个体数之比为2∶3∶4,现用同比例分层抽样方法抽出一个容量为n的样本,其中A层中的个体数为16,那么此样本容量为n= .
【答案】72
【分析】先算出抽样比,再将层个体数除以抽样比即得样本容量.
【详解】由于A层中的样本数为16,A层中的个体所占的比例为,
故样本容量.
故答案为:72.
13.(24-25高一上·四川成都·开学考试)已知一组数据1,2,0,,x,1的平均数是1,则这组数据的中位数为 .
【答案】1
【分析】由平均数的公式求得,根据中位数的概念求出结果.
【详解】这组数据的平均数为,
有,
可求得.
将这组数据从小到大重新排列后,观察数据可知最中间的两个数是1与1,
其平均数即中位数是.
故答案为:1.
14.(23-24高一下·江苏常州·期末)设x,y,z都是正整数,且,,,当x,y,z的取值依次为 时,x,y,z这三个数的方差最小.(若存在多组取值符合条件,只需写出其中一组取值)
【答案】(或)
【分析】根据方差定义计算方差,再由方差最小,确定后转化为关于的二次函数,利用二次函数求最小值即可得解.
【详解】设,
则
,
要使方差最小,三个数据应尽量靠近,故,
则,
关于的二次函数的对称轴为,又且为正整数,
所以当或时,方差最小,最小值为.
故满足条件的为或.
故答案为:(或).
四、解答题
15.(24-25高一上·全国·课前预习)某单位拟从40名员工中选5人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取5个号签,与这个号签编号一致的员工是幸运人选;
选法二:将35个白球与5个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选,试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能是否相等?
【答案】(1)答案见解析
(2)答案见解析
【详解】(1)选法一满足抽签法的特征,是抽签法,选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的35个白球,5个红球均无法相互区分.
(2)由于选法一中抽取每个号签和选法二中摸到每个球都是等可能的,因此这两种选法中每名员工被选中的可能性相等.
16.(22-23高一下·甘肃白银·期末)某选手在参加某次比赛中,各评委打出的分数为10,9,8,9,9,8,10,7,8,6.
(1)求该选手所有得分的平均数;
(2)若该选手所有得分的分位数为9,求整数m的取值集合.
【答案】(1)8.4;
(2).
【分析】(1)根据平均数的定义进行求解,得出答案;
(2)先从小到大排序,再根据百分位数定义,分,,,,,和等情况进行求解即可.
【详解】(1)该选手平均分为:;
(2)将所得分数从小到大排列为:6,7,8,8,8,9,9,9,10,10,共10个数,
9在第6,7,8三个位置上,
当时,,选择第6个数作为分位数,满足要求,
若,则,选择第6个和第7个数的平均数作为分位数,满足要求,
当时,,选择第7个数作为分位数,满足要求,
若,则,选择第7个和第8个数的平均数作为分位数,满足要求,
当时,,选择第8个数作为分位数,满足要求,
当或时,经检验,不合要求,
综上,整数m的取值集合为.
17.(23-24高一上·黑龙江哈尔滨·开学考试)某校为了解九年级学生近两个月“推荐书目”的阅读情况,随机抽取了该年级的部分学生,调查了他们每人“推荐书目”的阅读本数,设每名学生的阅读本数为n,并按以下规定分为四档:当时,为“偏少”;当时,为“一般”;当时,为“良好”;当时,为“优秀”,现将调查结果统计后绘制成不完整的统计图表:
阅读本数(本)
1
2
3
4
5
6
7
8
9
人数(名)
1
2
6
7
12
7
y
1
请根据以上信息回答下列问题:
(1)求出本次随机抽取的学生总人数;
(2)分别求出统计表中的的值;
(3)估计该校九年级400名学生中为“优秀”档次的人数.
【答案】(1)50
(2)11;3
(3)32
【分析】(1)根据“一般”档次占比与对应人数即得;
(2)根据“良好”档次占比与对应人数建立方程,求解即得的值,再由学生总数求得的值;
(3)先算出“优秀”档次占比,再由总人数即可计算估计出“优秀”人数.
【详解】(1)由统计图表可知:当时,“一般”档次占比,对应的学生数为,故学生总人数为人;
(2)由统计图表可知:当时,“良好”档次占比,即,解得,
又总人数为人,故,即,;
(3)由统计图表可知:“优秀”档次占比为,
故该校九年级400名学生中为“优秀”档次的人数约为人.
18.(24-25高一上·四川成都·开学考试)某次世界魔方大赛吸引世界各地共900名魔方爱好者参加,本次大赛首轮进行3×3阶魔方赛,组委会随机将爱好者平均分到30个区域,每个区域30名同时进行比赛,完成时间小于8秒的爱好者进入下一轮角逐;如图是3×3阶魔方赛A区域30名爱好者完成时间统计图,
(1)填空:A区域3×3阶魔方爱好者进入下一轮角逐的有______人.
(2)填空:若A区域30名爱好者完成时间为9秒的人数是7秒人数的3倍,
①a=______,b=______;
②完成时间的平均数是______秒,中位数是______秒,众数是______秒.
(3)若3×3阶魔方赛各个区域的情况大体一致,则根据A区域的统计结果估计在3×3阶魔方赛后进入下一轮角逐的约有多少人?
【答案】(1)4;
(2)①7,9;②8.8,9,10;
(3)约有120人.
【分析】(1)由图知1人6秒,3人1秒,小于8秒的爱好者共有4人;
(2)①根据A区域30名爱好者完成时间为9秒的人数是1秒人数的3倍,可得,再用数据总数30减去其余各组人数得出a的值;②利用加权平均数的计算公式列式计算求出平均数,再根据中位数、众数的定义求解;
(3)先求出样本中进入下一轮角逐的百分比,再乘以900即可.
【详解】(1)由图知1人6秒,3人1秒,小于8秒的爱好者共有4人,
即A区域3×3阶魔方爱好者进入下一轮角逐的有(人).
故答案为:4;
(2)①根据A区域30名爱好者完成时间为9秒的人数是1秒人数的3倍,可得,
则.
故答案为:7,9;
②完成时间的平均数是:(秒);
按从小到大的顺序排列后,第15、16个数据都是9,所以中位数是(秒);
数据10秒出现了10次,此时最多,所以众数是10秒.
故答案为:8.8,9,10;
(3)(人).
答:估计在3×3阶魔方赛后进入下一轮角逐的约有120人.
19.(23-24高一下·宁夏固原·期末)统计学作为数学的一个重要分支,其犹如一座坚实的大厦,构建于严谨的数学基石之上,为理解和诠释数据提供了强大的支撑,请用你所学到的统计知识解答以下问题:
(1)如果将总体分为k层,第j层抽取的样本为,,…,,第j层的样本量为,样本平均数为,样本方差为,.记,总的样本平均数为,样本方差为,证明:,即.
(2)为研究男女学生在生活费支出(单位:元)上的差异,某校在高一年级400名学生中随机抽取40人,统计他们某一周的生活费支出,得到下面的结果:
抽取的学生
生活费支出的平均数
生活费支出的标准差
男生22人
380
女生18人
360
根据以上数据及(1)结论,估计该校高一学生这周生活费支出的总体平均数、总体方差.
【答案】(1)证明见解析
(2)363.5
【分析】(1)推导出, ,再利用方差公式可证得结论成立.
(2)由(1)公式代入即可计算.
【详解】(1)
,,
同理可得,
即,即得证.
(2),.
学科网(北京)股份有限公司
$$