内容正文:
完成时间: 月 日 今日打卡:☐ 已完成
用时: min 自评勋章:
暑假作业18 统计
【知识点1 统计基本概念与调查方式】
1.全面调查(普查):对_________________都进行调查的方式。
2.抽样调查:从总体中抽取_________________组成样本,用样本推断总体的调查方式。
3.基础概念
总体:调查对象的__________。
个体:组成总体的_________________
样本:从总体中抽取的_________________
样本容量:样本中包含的_________________(无单位)。
【注意】(1) 区分调查对象,避免混淆总体、个体;(2) 样本容量只是数字,不能带单位。
【知识点2 简单随机抽样】
1.概念:从总体中逐个不放回地抽取n个个体作为样本,每次抽取时总体内的各个个体被抽到的机会都相等.简单随机抽样分为放回简单随机抽样和不放回简单随机抽样,除非特殊声明,本章指不放回简单随机抽样.
2.分类
放回简单随机抽样
不放回简单随机抽样
一般地,设一个总体含有(为正整数)个个体,从中___________抽取个个体作为样本
如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都___________,把这样的抽样方法叫做放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内_________________被抽到的概率都相等.把这样的抽样方法叫做不放回简单随机抽样
简单随机抽样:放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样(除非特殊说明,本章所称的简单随机抽样指不放回简单随机抽样).通过简单随机抽样获得的样本称为简单随机样本.
3.常用方法
(1)抽签法:先把总体中的(为正整数)个个体___________,并把编号依次分别写在形状、大小相同的签上(签可以是纸条、卡片或小球等),再将这些号签放在同一个不透明的箱子里_______________,每次随机地从中抽取____________,然后将箱中余下的号签________________,再进行下一次抽取.如此下去,直到抽到预先设定的样本容量.抽签法的具体步骤:①给总体中的每个个体____________;②_____________.
(2)随机数法:先把总体中的个个体依次编码为、、、、,然后利用工具(转盘或摸球、_______________、科学计算器或计算机)产生、、、、中的随机数,产生的随机数是几(号码重复,则舍去),就选第几号个体,直至选到预先设定的样本容量.
【注意】 抽签法务必保证“搅拌均匀”;随机数法读数时注意方向(可向左、向右、向上、向下)、跳过重复和超出范围的数字.
【知识点3 分层随机抽样】
1.概念:按一个或多个变量把总体划分成若干个______________,每个个体_______________一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这种抽样方法称为分层随机抽样,每一个子总体称为____________,分层随机抽样中,如果每层样本量都与层的大小成_______________,那么称这种样本量的分配方式为比例分配.
2.抽样比例:各层抽取比例 = 样本容量 / 总体容量.
【注意】分层定比:各层样本数与该层总体数的比值相等,即分层抽样中,每层抽样概率与整体抽样概率相等。
3.总体平均数计算(以两层为例):设第1层和第2层个体数分别为M和N,抽取的样本量分别为m和n,样本平均数分别为,则总样本平均数为.
【注意】(1) 每层抽样是按比例分配;(2) 每层内部可继续使用简单随机抽样。
(2)抽样辨析:总体有明显分层分层抽样;总体均匀、数量少简单随机抽样。
【知识点4 总体取值规律的估计(统计图表)】
1.相关公式
组距:每组区间的长度
频率频数样本容量
:频率分布直方图纵轴含义
每组频率
所有矩形面积之和(总频率为 1)
2.频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中______________的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取________________区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,例如第一小组的频率是,作出频率分布表,
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
3. 频率分布直方图的特点:各个小长方形的_____表示相应各组的频率;各小长方形的面积的总和等于.
4. 从频率分布直方图中估计数字特征
众数:最高矩形底边中点的横坐标.
中位数:使直方图左、右两边面积相等的分界线与横轴交点的横坐标.
平均数:每个小矩形的面积 × 小矩形底边中点的横坐标之和.
直方图偏态规律:若直方图右侧“拖尾”,则平均数 > 中位数;若左侧“拖尾”,则平均数 < 中位数.
【注意】:估计中位数时必须保证两侧面积之和恰好为0.5,不可直接取最高矩形中点.
5.其他常用统计图
条形图:直观展示各组频数大小
折线图:反映数据变化趋势
扇形图:展示各组频率 或占比
【注意】条形图与直方图的区别——条形图用于离散数据,直方图用于连续数据分组;扇形图中各部分比例之和为100%.
【知识点5 总体百分位数】
1.百分位数(p%分位数)的定义:一般地,一组数据的p%()分位数是这样一个值,它使得这组数据中至少有_______的数据不大于该值,且至少有_______的数据不小于该值.
2.可以通过下面的步骤计算一组个数据的第百分位数:
第1步,按_________排列原始数据.
第2步,计算 _______
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的_______
3. 四分位数:常用的分位数有第________百分位数、第________百分位数、第_______百分位数,这三个分位数把一组由小到大排列后的数据分成_______份,因此称为四分位数.其中第_______百分位数也称为第一个四分位数或下四分位数,第_______百分位数也称为第三个四分位数或上四分位数.
【知识点6 总体集中趋势的估计】
1. 众数、中位数、平均数
数字特征
定义与求法
优点与缺点
众数
一组数据中出现次数最多的数
众数通常用于描述变量的中心位置,但显然它对其他数据信息的忽视使得其无法客观地反映总体特征
中位数
把一组数据按大小顺序排列,处在_____________位置的一个数据(或两个数据的平均数)
中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有个数,,,…,,那么这个数的平均数______________
平均数与每一个样本数据有关,可以反映样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
2. 算术平均数:
加权平均数:(为频数)
3. 数字特征的比较
平均数、中位数、众数从不同角度描述数据的集中趋势.
平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广;
中位数不受个别偏大或偏小数据的影响;
众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
4. 频率分布直方图中估计数字特征
众数:最高矩形底边中点的横坐标.
中位数:使直方图左、右两边面积相等的分界线与横轴交点的横坐标.
平均数:每个小矩形的面积 × 小矩形底边中点的横坐标之和.
直方图偏态规律:若直方图右侧“拖尾”,则平均数 > 中位数;若左侧“拖尾”,则平均数 < 中位数.
【注意】:估计中位数时必须保证两侧面积之和恰好为0.5,不可直接取最高矩形中点.
【知识点7 总体离散程度的估计】
1. 极差:是数据中最大值和最小值的_______,它计算简单,但没有充分利用其他数据.
2. 方差的定义:样本数据到平均数的平均距离的平方。如果的平均数为,
则方差
3.方差的性质:如果a,b为常数,那么的方差为_______.
4.标准差:(方差的算术平方根)
由于方差的单位是原始数据单位的平方,而刻画离散程度的一种理想度量应当具有与原始数据相同的单位.为此,计算方差的算术平方根,得,称之为标准差.
4.统计意义
(1)方差:方差用于描述一组数据的离散程度。较大的方差表示数据点与平均值之间的差异较大,数据较为分散;较小的方差表示数据点较为集中。方差为0时,所有样本数据相等。方差在统计学中常用于评估数据的稳定性、预测误差等。
(2)标准差:标准差是方差的平方根,常用于实际数据分析中。它表示数据点与平均值之间的平均距离。标准差越小,表示数据越稳定,波动越小;反之,标准差越大,表示数据波动越大稳定性较差 。
【题型 1 统计基本概念与调查方式辨析】
1.(24-25高一下·天津河西·期末)下列调查方式合适的是( )
A.要了解一批节能灯泡的使用寿命,采用全面调查的方式
B.要调查某个班级同学的身高,采用抽样调查的方式
C.调查海河某段水域的水质情况,采用抽样调查的方式
D.调查全市高中生每天的睡眠时间,采用全面调查的方式
2.(25-26高一上·重庆潼南·开学考试)下列调查中,适合采用抽样调查的是( )
A.调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况
B.重庆西站对乘坐高铁的旅客进行安检
C.为保证飞机飞行安全,工人对其零部件进行检查
D.调查重庆市中学生的周末作业完成时间
3.(25-26高一下·吉林四平·阶段检测)下列调查中,适合用普查的是( )
A.调查全国居民的食品消费结构
B.调查一批袋装牛奶的细菌数是否超标
C.调查某款新能源汽车电池的使用寿命
D.检查某载人飞船零部件的质量情况
4.(2026高三·全国·专题练习)为了解某市参加升学考试的学生的数学成绩,从参加考试的学生中随机抽取1000名学生的数学成绩进行统计分析,在这个问题中,下列说法错误的是( )
A.总体指的是该市参加升学考试的全体学生
B.样本指的是抽取的1000名学生的数学成绩
C.样本量是1000
D.个体指的是抽取的1000名学生中的每一名学生
5.(25-26高二上·四川南充·阶段检测)2020年3月疫情期间,某市质检部门为了检查某批个)口罩的质量,决定抽查其中的.在这个问题中下列说法正确的个数是( )
①总体是指这1000个口罩; ②个体是每个口罩;
③样本是按的比例抽取的20个口罩;④样本容量为20
A.1 B.2 C.3 D.4
6.(2025高三·全国·专题练习)(多选)为了解某中学2 500名学生家长对“骑电动车需戴头盔”的态度,从中随机调查400名家长,结果有380名家长持赞成态度,则下列说法不正确的是( )
A.调查方式是全面调查
B.该校只有380名家长持赞成态度
C.样本是400
D.该校约有95%的家长持赞成态度
【题型 2 简单随机抽样的理解与应用】
1.(25-26高一下·全国·课后作业)下面的抽样方法是简单随机抽样的是( )
A.某班45名同学,指定个子最高的5名同学参加学校组织的某项活动
B.从20个零件中随机逐个抽取3个进行质量检验
C.一个儿童从玩具箱中的20件玩具中拿出一件自己喜欢的来玩,玩后放回再拿下一件,连续玩了5件
D.从无限多个个体中抽取50个个体作为样本
2.(25-26高一下·全国·课后作业)(多选)下列说法中正确的有( )
A.抽签法是简单随机抽样
B.随机数表法是简单随机抽样
C.简单随机抽样要求被抽取样本的总体的个数有限
D.简单随机抽样可以从总体中一次性抽出样本
3.(25-26高一下·全国·课后作业)(多选)(多选题)下列抽样的方式属于简单随机抽样的是( )
A.从500个个体中一次性抽取50个作为样本
B.将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本
C.箱子共有100个零件,从中选出10个进行检验,在抽样操作中,从中任意取出一个零件进行检验后,再把它放回箱子
D.福利彩票用摇奖机摇奖
4.(11-12高一·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
5.(25-26高一下·北京·期末)要考察某种品牌的450颗种子的发芽率,从中抽取50颗种子进行实验.利用随机数表抽取种子时,先将450颗种子按001,002,,450进行编号,如果从随机数表第2行第4组(随机数组中每5个数为一组)开始,自左向右自上至下读数,使用各个5位数组的前3位,则最先抽取的4颗种子的编号是__,___,___,___.
(下面摘取了随机数表第1行至第4行)
43021 92980 27768 26916 27783 84572 78483 39820
61459 39073 79242 20372 21048 87088 34600 34636
63171 58247 12907 50303 28814 40422 97895 61421
42372 53183 51546 90385 12120 64042 51320 22983..
6.(25-26高三·全国·一轮复习)某中学举行“讲好航天故事”演讲比赛.现从报名的40位学生中利用下面的随机数表抽取10位同学参加演讲比赛,将40位学生按01,02,…,40进行编号,假设从随机数表第1行第3个数字开始由左向右依次选取两个数字,重复的跳过,则选出来的第7个号码所对应的学生编号为________.
0627 4313 2636 1547 0941 2512 6317 6323 2616
8045 6011 1410 9577 7424 6762 4281 1457 2042
5332 3732 2707 3607 5124 5179 3014 2310 2118
2191 3726 3890 0140 0523 2617
【题型 3 分层随机抽样计算与应用】
1.(25-26高一下·湖南衡阳·期中)“一尺一拳一寸间,科学用眼护双眼”,为保护青少年视力,培养科学健康的用眼习惯,某市疾控中心联合教育局开展“青少年视力健康监测与科学用眼宣传”.计划从全市三所高中(A校2400人、B校1800人、C校1200人)的所有学生中,按人数比例采用分层随机抽样的方法抽取270人进行视力检测与用眼习惯问卷调查,则A校应抽取的人数为( )
A.60 B.90 C.120 D.150
2.(2026·河南开封·二模)某人工智能公司为训练垃圾分类识别模型,需对采集的4000张图片进行人工标注,图片分为可回收物、厨余垃圾、有害垃圾、其他垃圾四类,已知四类图片的数量之比为,现采用分层抽样的方法抽取容量为n的样本对标注情况进行抽检,若抽到的厨余垃圾图片比有害垃圾图片多25张,则( )
A.80 B.100 C.120 D.160
3.(2026·重庆·一模)某地区有高中教师300人,初中教师800人,小学教师1100人,为调查某次教师培训的成效,采用分层抽样的方法从这些教师中抽取一个容量为44的样本进行访问,则小学教师应抽取( )
A.6人 B.16人 C.22人 D.28人
4.(2026·湖南长沙·模拟预测)甲校有名学生,乙校有名学生,丙校有名学生,为统计三校学生某方面的情况,计划采用分层随机抽样法抽取一个容量为的样本,应在这三校分别抽取学生( )
A.人,人,人 B.人,人,人
C.人,人,人 D.人,人,人
5.(24-25高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
【题型 4 频率分布表与频率分布直方图】
1.(2025·新疆喀什·二模)(多选)防溺水安全教育不仅是为了防止学生在游泳时发生意外,更是为了提高学生的安全意识和自我保护能力,为此某校组织了“防溺水安全知识”答题比赛,并对参赛的200名学生的成绩进行了统计,得到如图所示的频率分布直方图,其中分组区间分别为,,,,,则(同一组中的数据用该组区间的中点值作代表)( )
A.这200名参赛学生的成绩的中位数为76分
B.这200名参赛学生的成绩的平均值为分
C.这200名参赛学生的成绩不低于80分的频率为
D.这200名参赛学生的成绩在之间的有40人
2.(25-26高一上·广西桂林·期末)为传承和弘扬数学文化,激发学生学习数学的兴趣,某校高一年级举办数学文化知识竞赛活动,现从1000名参赛的学生成绩中随机抽取100个成绩进行统计得到频率分布直方图如图所示.
(1)求的值;
(2)以每组成绩的中点数值代表该组成绩,估计该校高一学生平均成绩;
(3)从和两组中用分层抽样的方法共抽取了7人,再从这7人中随机抽取2人,求这两人来自不同的组的概率.
3.(24-25高三下·云南德宏·阶段检测)(多选)某学校为了提高高三年级学生的某学科成绩,在第一次联考后采取了“培优补短”等一系列举措.为了更好地总结经验,现从高三年级1000名学生中随机抽取100名学生,将其前后两次联考成绩(满分150分)分别按照[50,70),[70,90),…,[130,150]分成五组,绘制成频率分布直方图,如图所示.下列说法正确的是( )
A.
B.估计该年级第二次联考成绩在130分以上的学生比第一次联考对应分数段的多10人
C.第二次联考学生的成绩波动更小
D.与第一次联考相比,第二次联考成绩在[50,90)内的学生人数减少,在[110,150]内的学生人数增加
4.(25-26高二上·上海奉贤·阶段检测)为进一步增强学生的疫情防控意识,友实学校组织学生进行了新冠肺炎疫情防控科普知识线上问答,共有100人参加了这次问答,将他们的成绩(满分100分)分成六组:,,,,,,制成如图所示的频率分布直方图.
(1)求图中的值;
(2)用分层抽样的方法从问答成绩在内的学生中抽取24人参加疫情防控知识宣讲,那么在,,内应各抽取多少人?
5.(24-25高一下·吉林长春·阶段检测)为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁)
频数
频率
5
0.05
①
0.20
35
②
30
0.30
10
0.10
总计
100
1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在岁的人数;
(3)现用比例分配的分层随机抽样从、、的样本中共抽取n名志愿者,已知从中抽取了2人,求n的值.
【题型 5 百分位数计算】
1.(25-26高一下·山东泰安·阶段检测)参加某次数学竞赛的10名学生的成绩(单位:分)如下:71,86,76,80,96,81,84,83,92,88,则以这10人成绩的第60百分位数为实部,第75百分位数为虚部的复数是( )
A. B. C. D.
2.(25-26高一下·湖南·阶段检测)某校组织了“人工智能知识”测试,现随机抽取了100名学生的测试成绩(单位:分),这100名学生的成绩都分布在区间内,绘制成如图所示的频率分布直方图. 则这100名学生成绩的61%分位数为______.
3.(25-26高三下·河北衡水·阶段检测)为落实“五育并举”育人理念,某校随机对10名学生的劳动教育素养进行测评,10名学生的得分情况如下(满分10分):4,5,5,6,6,7,7,8,8,9,则这组数据的下四分位数是( )
A.4 B.5 C.6 D.8
4.(2026·陕西咸阳·三模)已知样本数据8,12,13,a,17的第80百分位数为16,则( )
A.14 B.15 C.16 D.17
5.(2026·浙江·三模)已知一组实数:1,2,4,x,8,10,若该组数据的第百分位数为4,则不可能是( )
A.40 B.50 C.60 D.70
6.(24-25高二上·重庆·阶段检测)关于百分位数,下列选项错误的是( )
A.一组数按照从小到大排列后为:,,…,,计算得:,则这组数的80%分位数是
B.一组数据的百分位数可能是这组数据中的数,也可能不是这组数据中的数
C.一组数据的某些百分位数可能是同一个数
D.第50百分位数就是中位数
【题型 6 众数、中位数、平均数的计算】
1.(24-25高三上·甘肃白银·期末)若有一组数据为6,6,5,5,4,4,3,2,1,则该组数据的平均数为( )
A.2 B.3 C.4 D.
2.(25-26高一上·江西吉安·期末)数据,,,的平均数是4,则数据,,,的平均数是( )
A.9 B.10 C.11 D.12
3.(25-26高一上·四川成都·开学考试)某学校组织了一场体育测试,现抽出60个人的体育考试分数,并对此进行统计,如图所示,关于这60人的分数,下列说法正确的是( )
A.众数是85 B.中位数是80
C.众数是21 D.中位数是12
4.(2024·广东惠州·模拟预测)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分如图所示,假设得分值的中位数为,众数为,平均值为,则( )
A. B.
C. D.
5.(2026·河南开封·模拟预测)一组数据:1,1,2,1,2,3,1,2,3,4,则关于这组数据的结论错误的是( )
A.平均数为2 B.众数为1
C.极差为3 D.中位数为
6.(25-26高一下·北京·期末)某学校全体学生参加一次关于人工智能使用常识测评,其成绩的频率分布直方图如图所示,假设同组中的数据是均匀分布的,则成绩的中位数约为__ (填写整数).
【题型 7 方差、标准差计算与实际意义】
1.(浙江省9 1联考2025-2026学年高二第二学期学考模拟数学试题)(多选)一组样本数据为9,11,10,13,12,8,14,11,则这组数据的( )
A.中位数为11 B.方差为28 C.平均数为11 D.60%分位数为11
2.(25-26高一下·安徽合肥·阶段检测)某校在一次考试后,对两班的数学成绩进行分析.已知班有人,平均成绩为分,方差为;班有人,平均成绩为分,方差为.则两班全部名同学数学成绩的方差是( )
A. B. C. D.
3.(2025·湖北十堰·模拟预测)若一组数据的平均值,方差,若删去一个数之后,平均值没有改变,方差变为40,则这组数据的个数( )
A.5 B.6 C.7 D.8
4.(25-26高二下·江苏镇江·期中)(多选)已知一组数据如下:2023,2024,2025,2025,2026,2027,则( )
A.这组数据的极差为4
B.这组数据的方差为2
C.这组数据的众数等于平均数
D.这组数据的第70百分位数为2026
5.(25-26高一下·河北保定·阶段检测)已知样本数据,,,,的平均数为4,方差为2,则样本数据,,,,的平均数和方差分别为________和________.
【题型 8 统计图表综合(条形图、折线图、扇形图)】
1.(25-26高三上·福建福州·期中)(多选)某超市在两周内的蓝莓每日促销量如图所示,根据此折线图,下面结论正确的是( )
A.这14天日促销量的众数是214
B.这14天日促销量的中位数是196
C.这14天日促销量的极差为194
D.这14天日促销量的第80百分位数是260
2.(22-23高二下·四川德阳·阶段检测)已知甲、乙两名同学在高三的6次数学测试成绩统计的折线图如下,下列说法正确的是( )
A.若甲、乙两组数据的方差分别为,,则
B.甲成绩比乙成绩更稳定
C.甲成绩的极差大于乙成绩的极差
D.若甲、乙两组数据的平均数分别为,,则
3.(25-26高一下·山西晋中·阶段检测)(多选)2021至2025年我国快递业务量及其增长速度如图所示,则( )
A.2021至2025年我国快递业务量逐年增长
B.2021至2025年我国快递业务量增长速度逐年增长
C.2021至2025年我国快递业务量每年增长量超过200亿件
D.估计我国2020年的快递业务量小于650亿件
4.(24-25高一下·广东河源·期末)(多选)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
5.(25-26高一上·河南南阳·阶段检测)(多选)某调查研究小组收集并整理了南阳市2025年11月21日至30日每日最低气温与最高气温(单位:)的数据,并绘制了如图所示的折线图,则( )
A.11月21日至30日的日最低气温的极差是
B.11月21日至30日的日最高气温的中位数是
C.在11月21日至30日中,有4天的日最低气温低于
D.在11月21日至30日中,11月24日的日温差(最高气温减最低气温)最大
6.(2025高三·全国·专题练习)(多选)人均可支配收入和人均消费支出是两个非常重要的经济和民生指标,常被用于衡量一个地区经济发展水平和群众生活水平.图为2018—2023年前三季度全国城镇居民人均可支配收入及人均消费支出统计图,据此进行分析,则( )
A.2018—2023年前三季度全国城镇居民人均可支配收入逐年递增
B.2018—2023年前三季度全国城镇居民人均消费支出逐年递增
C.2018—2023年前三季度全国城镇居民人均可支配收入的极差比人均消费支出的极差大
D.2018—2023年前三季度全国城镇居民人均消费支出的中位数为21180元
7.(25-26高二上·云南曲靖·阶段检测)(多选)如图是某公司2020年和2024年支出的比例分配图,其中这两年用于文体活动的支出费用相等,则( )
A.2024年总支出比2020年增长
B.用于宣发的支出2024年比2020年多
C.用于水电的支出2024年与2020年相等
D.用于工资的支出2024年比2020年增长
8. 2025高三·全国·专题练习)(多选)南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔(Florence Nightingale)设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年中国知识付费用户数量(单位:亿人次,数据为年末数据),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法正确的是( )
A.2016年至2023年,知识付费用户数量逐年增加
B.2017年至2023年,知识付费用户数量逐年增加量2018年最多
C.2017年至2023年,知识付费用户数量的逐年增加量逐年递增
D.2023年知识付费用户数量超过2016年知识付费用户数量的10倍
9.(25-26高二上·宁夏中卫·开学考试)(多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险,各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图:
用样本估计总体,以下四个选项正确的( )
A.丁险种最受参保人青睐 B.随着年龄的增长人均参保费用越来越高
C.30周岁以上的参保人数约占总参保人数的20% D.30~41周岁参保人数最多
【题型 9 抽样方法综合辨析】
1.(23-24高一上·全国·单元测试)简单随机抽样,分层抽样之间的共同点是( )
A.都是从总体中逐个抽取
B.将总体分成几个部分,按事先确定的规则在各部分抽取
C.抽样过程中每个个体被抽到的概率是相等的
D.将总体分成几层,然后分层按照比例抽取
2.(23-24高一上·全国·课后作业)现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查.
②某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查.
③某中学共有320名教职工,其中教师240名,行政人员32名,后勤人员48名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为40的样本.
较为合理的抽样方法的选择是( )
A.①简单随机抽样,②分层随机抽样,③分层随机抽样
B.①简单随机抽样,②分层随机抽样,③简单随机抽样
C.①分层随机抽样,②简单随机抽样,③分层随机抽样
D.①分层随机抽样,②抽签法,③简单随机抽样
3.(24-25高二上·四川绵阳·期末)①在一次满分为100分的测试中,有12人的成绩在90分以上,30人的成绩在60~80分,12人的成绩低于60分,现从中抽取9人了解有关考试题目难度的情况;②一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
4.(24-25高一下·贵州黔南·期末)(多选)某高校大一新生中,来自东部地区的学生有2500人、中部地区的学生有1500人、西部地区的学生有1000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列说法正确的有( )
A.用简单随机抽样的方法从新生中选出100人最适合
B.用分层随机抽样的方法从新生中选出100人最适合,且用分层随机抽样的方法分别抽取东部地区学生50人、中部地区学生30人、西部地区学生20人
C.用分层随机抽样的方法抽取的100名学生中,西部地区学生小刘被选中的可能性比中部地区学生小张被选中的可能性大
D.总体是该高校全体大一新生
5.(2024·福建泉州·模拟预测)从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A. B. C. D.
6.(25-26高一下·山西·阶段检测)某小学有学生3300人,卫生部门为了解学生身体发育情况,准备从中抽取一个容量为300的样本,则适合的抽样方法是( )
A.抽签法 B.随机数法
C.简单随机抽样 D.分层随机抽样
7.(25-26高一下·全国·课堂例题)(多选)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
方法一:采用简单随机抽样的方法,将零件编号为00,01,…,99,用抽签法抽取20个.
方法二:采用分层抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.
对于上述问题,下列说法中正确的有( )
A.不论采用哪种抽样方法,这100个零件中每个零件被抽到的概率都是
B.采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同
C.在上述两种抽样方法中,方法一抽到的样本比方法二抽到的样本更能反映总体的特征
D.在上述两种抽样方法中,方法二抽到的样本比方法一抽到的样本更能反映总体的特征
【题型 10 统计综合解答题】
1.(25-26高一下·浙江金华·阶段检测)学校对高一学生期中考试的数学成绩进行调查,现抽取100人进行数据统计,绘制频率分布直方图如下,
(1)求的值和该组数据的中位数:
(2)若这100人中有女生40人,且男生平均分106,方差为16;女生平均分101,方差为36,求这100人的数学平均分和方差.
2.(25-26高一下·江苏泰州·阶段检测)某幼儿园根据部分同年龄段儿童的身高数据绘制了如图所示的频率分布直方图,其中身高(单位:)的变化范围是,样本数据分组为,,,,.
(1)求出的值;
(2)已知样本中身高小于的人数是60,求出样本容量的数值;
(3)根据频率分布直方图提供的数据,现用分层抽样的方法从身高在,,内的儿童中共抽出42名儿童参加活动,求三个组内分别要抽取的儿童数.
3.(25-26高一下·安徽蚌埠·阶段检测)为点燃同学们对数学的热爱,使其探寻数字背后的文化密码,某校高一年级举办“数学文化”知识竞赛.为了解参赛者的成绩情况,从所有参赛者中随机抽取100人的成绩(百分制)作为样本,并按分组,作出频率分布直方图如图所示.
(1)求的值,并估计样本中成绩不低于60分的人数;
(2)估计样本中成绩的上四分位数;
(3)若规定成绩不低于80分为“良好”等级,已知样本中成绩在内的平均数为88,方差为7,成绩在内的平均数为96,方差为7,求样本中“良好”等级的成绩的平均数和方差.
4.(25-26高一下·湖南衡阳·期中)某烘焙店为调研某款全麦面包的质量情况,随机抽取了100个这款全麦面包,将称重后得到的数据分成六组,分别为[,,…,(单位:克),得到如图所示的频率分布直方图.
(1)求图中的值,并估计这100个样本数据的平均数;(同一组中的数据以该组所在区间的中点值为代表)
(2)若样本在内的平均质量是65克,方差是6,在内的平均质量为75克,方差是3,求这两组质量的总方差.
5.(25-26高一下·甘肃兰州·期中)某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
6.(25-26高二下·重庆·期中)某校法联社团组织高一年级所有学生参加“感受法治内涵,争做法治宣传人”的主题知识比赛,旨在引导同学们深入学习法治知识,争当法治精神的传播者.比赛分为初赛和决赛两个环节,现从所有初赛成绩(满分分,最低分分)中,随机调查了位同学的测试成绩,按、、、、分组,并绘制出了如图所示的频率分布直方图.
(1)若规定成绩排名前的同学可入围决赛,请估计进入决赛的同学成绩应不低于多少分?
(2)已知落在内的平均成绩是分,方差是分,落在内的平均成绩是分,方差是分,求两组成绩合并后的平均数和方差.
附:设两组数据的样本量、样本平均数和样本方差分别为、、;、、,记两组数据总体的样本平均数为,则总体样本方差.
7.(25-26高二上·云南临沧·开学考试)在一次区域的统考中,为了了解学生数学学科成绩的情况,从所有考生的成绩中随机抽取了40位考生的成绩进行统计分析,得到如图所示的频率分布直方图.
(1)估计这40名学生的数学成绩的平均数与上四分位数;(同一组中的数据用该组区间的中点值作代表,结果保留1位小数);
(2)为了进一步了解70分以下的学生的数学学习情况,调查方从成绩在分数段的同学中按组(各算一组从样本中分层抽取了6个人进行深入地学习交流,学习交流完后再从这6个人中随机抽取2个人进行再测试,求这两个人中至少有一个人在之前的统考中成绩位于的概率;
(3)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的方差.
1.(2026·海南海口·一模)(多选)某高中学校高一年级、高二年级、高三年级的学生分别有400、500、300人.现用比例分配的分层随机抽样的方法,按年级从这些学生中抽取n人开展“教师作业批改情况”问卷调查,若高二年级抽到学生15人,则下列说法正确的是( )
A.从高二年级学生500人中抽取15人可采用简单随机抽样的方法
B.高一年级抽到学生12人
C.样本容量
D.三个年级中高三年级每个学生被抽取到的概率最小
2.(25-26高一下·全国·课后作业)(多选)(多选题)下列抽样的方式属于简单随机抽样的是( )
A.从500个个体中一次性抽取50个作为样本
B.将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本
C.箱子共有100个零件,从中选出10个进行检验,在抽样操作中,从中任意取出一个零件进行检验后,再把它放回箱子
D.福利彩票用摇奖机摇奖
3.(25-26高一下·吉林四平·阶段检测)某地区教育部门为了解该地区中小学生的近视情况,采用分层随机抽样的方法,抽取一定数量的中小学生进行调查.若得到的样本中初中的学生人数比小学少80人,比高中多40人,该地区小学、高中的学生人数之比为,则样本容量为( )
A.460 B.690 C.880 D.980
4.(25-26高一下·北京·期末)要考察某种品牌的450颗种子的发芽率,从中抽取50颗种子进行实验.利用随机数表抽取种子时,先将450颗种子按001,002,,450进行编号,如果从随机数表第2行第4组(随机数组中每5个数为一组)开始,自左向右自上至下读数,使用各个5位数组的前3位,则最先抽取的4颗种子的编号是__,___,___,___.
(下面摘取了随机数表第1行至第4行)
43021 92980 27768 26916 27783 84572 78483 39820
61459 39073 79242 20372 21048 87088 34600 34636
63171 58247 12907 50303 28814 40422 97895 61421
42372 53183 51546 90385 12120 64042 51320 22983.
5.(25-26高三上·重庆·期中)已知某9个数的平均数为5,方差为.现又加入一个新数5,此时这10个数的平均数为,方差为,则( )
A., B.,
C., D.,
6.(2026·陕西榆林·三模)已知一组数据8,12,15,,11,18()中的最小数据为8,且第75百分位数是15,则的不同取值可能有( )
A.8个 B.7个 C.6个 D.1个
7.(2026·河北邢台·二模)某小组在试验中得到了一组样本数据:8,6,10,8,5,9,11,12,若这组数据的第百分位数恰为这组数据的众数,则的取值范围是( )
A. B. C. D.
8.(25-26高三上·河南南阳·期末)(多选)进入12月份后,受冷暖空气的共同影响,我市气温起伏较大.现记录了12月上旬(1日-10日)我市的日最高气温如下(单位:℃):13,8,9,11,12,12,18,16,13,15,则下列说法正确的是( )
A.12月上旬我市日最高气温的极差为10℃
B.12月上旬我市日最高气温的平均数为12.7℃
C.2日-10日我市日最高气温持续上升
D.12月上旬我市日最高气温的分位数为13℃
9.(2026·河北邯郸·二模)已知一组数据:,1,2,3,4,5,17,若该组数据的第80百分位数为5,平均数不小于5,则实数的取值范围是( )
A. B. C. D.
10.(25-26高二下·山西长治·阶段检测)一组从小到大排列的数据:3,4,,12,16,若这组数据的第60百分位数比平均数大2,则的值为( )
A.10 B.9 C.8 D.7
11.(2026·安徽·模拟预测)(多选)如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态.根据所给的直方图,下列结论正确的有( )
A.图(1)的平均数=中位数=众数 B.图(2)的众数<中位数<平均数
C.图(2)的平均数<众数<中位数 D.图(3)的平均数<中位数<众数
12.(2026·安徽合肥·一模)某公司50名员工的月工资统计表如下:
工资/元
3600
4000
4400
5000
6000
7000
人数/名
5
10
20
7
5
3
记这50名员工月工资的平均数为元,中位数为元,众数为元,则( )
A. B. C. D.
13.(2026·辽宁大连·三模)在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续7天,每天新增疑似病例不超过5人”.过去7日,甲、乙、丙、丁四地新增疑似病例数据信息如下,则一定符合该标志的是( )
甲地:总体平均数,且中位数为0;
乙地:中位数为2,3为众数;
丙地:总体平均数为2,且标准差;
丁地:总体平均数,且极差.
A.甲地 B.乙地 C.丙地 D.丁地
14.(25-26高二上·安徽·阶段检测)某班男生、女生人数之比为,对该班同学每周运动时间(单位:时)进行调查,得知男生每周运动时间的平均数为,方差为,女生每周运动时间的平均数为,方差为,则该班全体同学每周运动时间的方差为( )
A.5.2 B.5.3 C.5.4 D.5.5
15.(2026高三下·内蒙古鄂尔多斯·专题练习)某AI公司有男性30人,女性10人,在一次知识竞技团建中,男性平均成绩为110分,方差为55,女性平均成绩为130分,方差为95,则在这次团建中,该公司的平均成绩和方差分别为( )
A.120分,75 B.120分,20 C.115分,65 D.115分,140
16.(25-26高二上·广西·期中)某中学为提升学生的数学素养,激发大家学习数学的兴趣,举办了一场“数学文化素养知识大赛”,分为初赛和复赛两个环节,全校学生参加了初赛,现从参加初赛的全体学生中随机地抽取200人的成绩作为样本,得到如下频率分布直方图,根据图形,请回答下列问题:
(1)求频率分布直方图中的值.用样本估计总体,估计该校学生初赛成绩的平均数以及中位数.(同一组中的数据用该组区间中点值作代表)(保留小数点后两位);
(2)若甲、乙、丙三位同学均进入复赛,已知甲、乙、丙复赛获一等奖的概率分别为,,,甲、乙、丙获一等奖互不影响,求至少有两位同学复赛获一等奖的概率.
17.(25-26高一上·陕西渭南·期末)某中学初一男生共有400人,为了解初一男生的体重情况,该中学统计了所有初一男生的体重(单位:千克),并将数据按照,,,,分成5组,画成如图所示的频率分布直方图.
(1)估计这400名男生的平均体重(同组数据用该组区间中点值作代表);
(2)根据体重区间,按比例分层抽样,从体重不足48千克的男生中抽取38人了解营养状况,试计算分别应当抽取体重在区间,,上的人数依次为多少?
1.(25-26高二上·上海浦东新·阶段检测)已知样本数据、、、、的平均数为,方差为,则的值为( )
A. B. C. D.
2.(2026·重庆万州·模拟预测)若一组样本数据,,,的平均数为3,方差为2;另一组样本数据,,,,3的方差为,则的值为( )
A.7 B.8 C.9 D.10
3.(25-26高一上·辽宁沈阳·阶段检测)(多选)下列说法正确的是( )
A.已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5
B.数据27,12,14,30,15,17,19,23的第70百分位数是23
C.若样本,,…,的平均值为8,则,,…,的平均值为15
D.某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出58人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为20人
4.(23-24高一下·云南昆明·期末)某班同学身高的平均数为,方差为,其中女生身高的平均数为,方差为,男生身高的平均数为,方差为,下列说法错误的是( )
A.若,则 B.若,则
C.若,则 D.若,则
5.(2026高一·全国·专题练习)已知某工厂有三条流水线用于生产同一种产品,三条流水线的产量之比为,根据比例分层抽样得到流水线2的样本平均数为9.0,流水线3的样本平均数为9.4,所有样本的平均数为9.3,则流水线1的样本平均数为_____.
6.(25-26高一下·贵州遵义·阶段检测)引体向上是中小学体质健康测试男生的项目,主要测试学生上肢力量.在对某高中1000名高一、高二年级男生的引体向上成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名学生中高一年级男生有600人,且抽取的样本中高一男生成绩的平均数和方差分别为5.5和6.74,高二男生成绩的平均数和方差分别为6.5和5.34,则总体方差( )
(附:)
A.6.42 B.6.18 C.5.96 D.5.84
7.(25-26高二下·上海·阶段检测)某高中随机抽取100名学生,测得他们的身高(单位:),按照区间,,,,分组,得到样本身高的频率分布直方图(如下图所示).
(1)求身高在区间的学生人数;
(2)将身高在,,区间内的学生依次记为,,三个组,用分层抽样的方法从三个组中抽取6人.
①求从这三个组分别抽取的学生人数;
②若要从6名学生中抽取2人,求B组中至少有1人被抽中的概率.
8.(21-22高一·全国·单元测试)随着手机和网络的普及,外卖行业得到迅速的发展.某外卖平台为了解某地区用户对其提供的服务的满意度,随机调查了40个用户,得到用户的满意度评分如下:
用户编号
评分
用户编号
评分
用户编号
评分
用户编号
评分
1
78
11
88
21
79
31
93
2
73
12
86
22
83
32
78
3
81
13
95
23
72
33
75
4
92
14
76
24
74
34
81
5
95
15
97
25
91
35
84
6
85
16
78
26
66
36
77
7
79
17
88
27
80
37
81
8
84
18
82
28
83
38
76
9
63
19
76
29
74
39
85
10
86
20
89
30
82
40
89
(1)请你估计该地区所有用户评分的25%,95%分位数;
(2)若从这40个用户中抽取一个容量为10的样本,且抽到的10个用户的评分分别为92,84,86,78,89,74,83,78,77,89,试计算这10个数据的平均数和方差;
(3)在(2)的条件下,若用户的满意度评分在内,则满意度等级为“A级”,试用样本估计总体的思想,根据所抽到的10个数据,估计该地区满意度等级为“A级”的用户所占的百分比.
(参考数据:,,)
.
9.(25-26高三上·山东青岛·开学考试)已知样本数据的各项均不为0,这组样本数据的方差为,,样本数据的方差为.设甲:,乙:全为正数,或全为负数.则甲是乙的( )
A.充分必要条件 B.充分不必要条件 C.必要不充分条件 D.既不充分也不必要条件
10.(24-25高一下·山东青岛·期末)对于没有重复数据的样本,记这m个数的第k百分位数为.若在区间中的样本数据有且只有13个,则m的所有可能值的和为______.
11.(25-26高三上·广东佛山·阶段检测)某书店内有2017本书.下面的框线图显示店内书的售价的分布.已知这些书的总售价是,而该分布的分布域是四分位数间距的4倍.
(1)求该分布的下四分位数和分布域.
(2)现书店的经理增加210本新书,如下表所示:
种类
每本书的售价
书的数目
旅游书
92$
102
小说
h$
54
漫画
k$
54
已知增加210本新书后店内所有书的平均售价至少是,且.该经理宣称增加210本新书后,书的售价的中位数小于105$.你是否同意?试解释你的答案.
12.(25-26高三上·上海·开学考试)某学校有800名高中学生,其中男生512名,女生288名.按照分层抽样原则抽取了50名学生,被抽取的50名学生身高全部介于155cm和195cm之间,将测量结果按如下方式分成八组:第一组,第二组,第八组[190,195],图是频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人.
(1)求第七组的频率;
(2)通过计算得到男生身高样本平均数为,方差为17,女生身高样本平均数为163.83cm,方差为30.03.求该50名高中学生身高的样本平均数和方差,并估计该校学生身高的总体方差.(结果精确到0.01)
(3)若从身高属于第六组和第八组的所有学生中随机抽取两名学生,记他们的身高分别为,记事件,求.
1 / 2
学科网(北京)股份有限公司
$
完成时间: 月 日 今日打卡:☐ 已完成
用时: min 自评勋章:
暑假作业18 统计
【知识点1 统计基本概念与调查方式】
1.全面调查(普查):对总体中每一个个体都进行调查的方式。
2.抽样调查:从总体中抽取部分个体组成样本,用样本推断总体的调查方式。
3.基础概念
总体:调查对象的全体。
个体:组成总体的每一个调查对象。
样本:从总体中抽取的一部分个体。
样本容量:样本中包含的个体数量(无单位)。
【注意】(1) 区分调查对象,避免混淆总体、个体;(2) 样本容量只是数字,不能带单位。
【知识点2 简单随机抽样】
1.概念:从总体中逐个不放回地抽取n个个体作为样本,每次抽取时总体内的各个个体被抽到的机会都相等.简单随机抽样分为放回简单随机抽样和不放回简单随机抽样,除非特殊声明,本章指不放回简单随机抽样.
2.分类
放回简单随机抽样
不放回简单随机抽样
一般地,设一个总体含有(为正整数)个个体,从中逐个抽取个个体作为样本
如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,把这样的抽样方法叫做放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等.把这样的抽样方法叫做不放回简单随机抽样
简单随机抽样:放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样(除非特殊说明,本章所称的简单随机抽样指不放回简单随机抽样).通过简单随机抽样获得的样本称为简单随机样本.
3.常用方法
(1)抽签法:先把总体中的(为正整数)个个体编号,并把编号依次分别写在形状、大小相同的签上(签可以是纸条、卡片或小球等),再将这些号签放在同一个不透明的箱子里搅拌均匀_,每次随机地从中抽取一个,然后将箱中余下的号签搅拌均匀,再进行下一次抽取.如此下去,直到抽到预先设定的样本容量.抽签法的具体步骤:①给总体中的每个个体编号;②抽签.
(2)随机数法:先把总体中的个个体依次编码为、、、、,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生、、、、中的随机数,产生的随机数是几(号码重复,则舍去),就选第几号个体,直至选到预先设定的样本容量.
【注意】 抽签法务必保证“搅拌均匀”;随机数法读数时注意方向(可向左、向右、向上、向下)、跳过重复和超出范围的数字.
【知识点3 分层随机抽样】
1.概念:按一个或多个变量把总体划分成若干个__子总体___,每个个体___属于且仅属于___一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这种抽样方法称为分层随机抽样,每一个子总体称为__层____,分层随机抽样中,如果每层样本量都与层的大小成__比例____,那么称这种样本量的分配方式为比例分配.
2.抽样比例:各层抽取比例 = 样本容量 / 总体容量.
【注意】分层定比:各层样本数与该层总体数的比值相等,即分层抽样中,每层抽样概率与整体抽样概率相等。
3.总体平均数计算(以两层为例):设第1层和第2层个体数分别为M和N,抽取的样本量分别为m和n,样本平均数分别为,则总样本平均数为.
【注意】(1) 每层抽样是按比例分配;(2) 每层内部可继续使用简单随机抽样。
(2)抽样辨析:总体有明显分层分层抽样;总体均匀、数量少简单随机抽样。
【知识点4 总体取值规律的估计(统计图表)】
1.相关公式
组距:每组区间的长度
频率频数样本容量
:频率分布直方图纵轴含义
每组频率
所有矩形面积之和(总频率为 1)
2.频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中_最大值与最小值___的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取_左闭右开___区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,例如第一小组的频率是,作出频率分布表,
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示__.
3. 频率分布直方图的特点:各个小长方形的_面积____表示相应各组的频率;各小长方形的面积的总和等于.
4. 从频率分布直方图中估计数字特征
众数:最高矩形底边中点的横坐标.
中位数:使直方图左、右两边面积相等的分界线与横轴交点的横坐标.
平均数:每个小矩形的面积 × 小矩形底边中点的横坐标之和.
直方图偏态规律:若直方图右侧“拖尾”,则平均数 > 中位数;若左侧“拖尾”,则平均数 < 中位数.
【注意】:估计中位数时必须保证两侧面积之和恰好为0.5,不可直接取最高矩形中点.
5.其他常用统计图
条形图:直观展示各组频数大小
折线图:反映数据变化趋势
扇形图:展示各组频率 或占比
【注意】条形图与直方图的区别——条形图用于离散数据,直方图用于连续数据分组;扇形图中各部分比例之和为100%.
【知识点5 总体百分位数】
1.百分位数(p%分位数)的定义:一般地,一组数据的p%()分位数是这样一个值,它使得这组数据中至少有________的数据不大于该值,且至少有________的数据不小于该值.
2.可以通过下面的步骤计算一组个数据的第百分位数:
第1步,按____从小到大______排列原始数据.
第2步,计算 _______
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的_平均数______
3. 四分位数:常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成__四等______份,因此称为四分位数.其中第__25______百分位数也称为第一个四分位数或下四分位数,第__75______百分位数也称为第三个四分位数或上四分位数.
【知识点6 总体集中趋势的估计】
1. 众数、中位数、平均数
数字特征
定义与求法
优点与缺点
众数
一组数据中出现次数最多的数
众数通常用于描述变量的中心位置,但显然它对其他数据信息的忽视使得其无法客观地反映总体特征
中位数
把一组数据按大小顺序排列,处在______中间_______位置的一个数据(或两个数据的平均数)
中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有个数,,,…,,那么这个数的平均数______________
平均数与每一个样本数据有关,可以反映样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
2. 算术平均数:
加权平均数:(为频数)
3. 数字特征的比较
平均数、中位数、众数从不同角度描述数据的集中趋势.
平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广;
中位数不受个别偏大或偏小数据的影响;
众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
4. 频率分布直方图中估计数字特征
众数:最高矩形底边中点的横坐标.
中位数:使直方图左、右两边面积相等的分界线与横轴交点的横坐标.
平均数:每个小矩形的面积 × 小矩形底边中点的横坐标之和.
直方图偏态规律:若直方图右侧“拖尾”,则平均数 > 中位数;若左侧“拖尾”,则平均数 < 中位数.
【注意】:估计中位数时必须保证两侧面积之和恰好为0.5,不可直接取最高矩形中点.
【知识点7 总体离散程度的估计】
1. 极差:是数据中最大值和最小值的___差_____,它计算简单,但没有充分利用其他数据.
2. 方差的定义:样本数据到平均数的平均距离的平方。如果的平均数为,
则方差
3.方差的性质:如果a,b为常数,那么的方差为________.
4.标准差:(方差的算术平方根)
由于方差的单位是原始数据单位的平方,而刻画离散程度的一种理想度量应当具有与原始数据相同的单位.为此,计算方差的算术平方根,得,称之为标准差.
4.统计意义
(1)方差:方差用于描述一组数据的离散程度。较大的方差表示数据点与平均值之间的差异较大,数据较为分散;较小的方差表示数据点较为集中。方差为0时,所有样本数据相等。方差在统计学中常用于评估数据的稳定性、预测误差等。
(2)标准差:标准差是方差的平方根,常用于实际数据分析中。它表示数据点与平均值之间的平均距离。标准差越小,表示数据越稳定,波动越小;反之,标准差越大,表示数据波动越大稳定性较差 。
【题型 1 统计基本概念与调查方式辨析】
1.(24-25高一下·天津河西·期末)下列调查方式合适的是( )
A.要了解一批节能灯泡的使用寿命,采用全面调查的方式
B.要调查某个班级同学的身高,采用抽样调查的方式
C.调查海河某段水域的水质情况,采用抽样调查的方式
D.调查全市高中生每天的睡眠时间,采用全面调查的方式
【答案】C
【分析】根据全面调查与抽样调查的定义逐项判断即可.
【详解】对于A,了解一批节能灯的使用寿命,调查过程带有破坏性,只能采取抽样调查,
而不能将整批节能灯全部用于实验,故A错误;
对于B,要调查某个班级同学的身高,采用全面调查的方式,故B错误;
对于C,调查海河某段水域的水质情况,采用抽样调查的方式,故C正确;
对于D,调查全市高中生每天的睡眠时间,采用抽样调查的方式,故D错误.
故选:C.
2.(25-26高一上·重庆潼南·开学考试)下列调查中,适合采用抽样调查的是( )
A.调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况
B.重庆西站对乘坐高铁的旅客进行安检
C.为保证飞机飞行安全,工人对其零部件进行检查
D.调查重庆市中学生的周末作业完成时间
【答案】D
【分析】根据抽样调查的特点,它适用于总体较大、全面调查不经济或不现实的情况,分析选项即可.
【详解】对于A,调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况:总体较小(仅50人),容易进行全面调查,不适合抽样调查,
对于B,重庆西站对乘坐高铁的旅客进行安检:安检涉及安全风险,必须对每位旅客进行全面检查,不适合抽样调查,
对于C,为保证飞机飞行安全,工人对其零部件进行检查:飞机零部件检查要求全面性,任何遗漏都可能造成安全事件,不适合抽样调查,
对于D,调查重庆市中学生的周末作业完成时间:调查对象是全市范围中学生,总体较大,适合抽样调查,
因此,适合采用抽样调查的是D,
故选:D.
3.(25-26高一下·吉林四平·阶段检测)下列调查中,适合用普查的是( )
A.调查全国居民的食品消费结构
B.调查一批袋装牛奶的细菌数是否超标
C.调查某款新能源汽车电池的使用寿命
D.检查某载人飞船零部件的质量情况
【答案】D
【详解】A选项,全国居民数量庞大,全面调查难度大、成本高,适合抽样调查,A错误;
B选项,调查一批袋装牛奶的细菌数具有破坏性,适合抽样调查,B错误;
C选项,调查电池使用寿命会对电池造成损坏,适合抽样调查,C错误;
D选项,载人飞船零部件的质量关乎飞行安全,必须确保每个零部件都合格,适合用普查,D正确.
4.(2026高三·全国·专题练习)为了解某市参加升学考试的学生的数学成绩,从参加考试的学生中随机抽取1000名学生的数学成绩进行统计分析,在这个问题中,下列说法错误的是( )
A.总体指的是该市参加升学考试的全体学生
B.样本指的是抽取的1000名学生的数学成绩
C.样本量是1000
D.个体指的是抽取的1000名学生中的每一名学生
【答案】D
【分析】根据给定条件,利用总体、样本的定义直接判断作答.
【详解】对于A,总体指的是该市参加升学考试的全体学生或他们的数学成绩,故A正确;
对于B,样本指的是抽取的1000名学生或他们的数学成绩,故B正确;
对于C,样本量是1000,故C正确;
对于D,个体指的是全体学生或他们的数学成绩,故D错误.
故选:D.
5.(25-26高二上·四川南充·阶段检测)2020年3月疫情期间,某市质检部门为了检查某批个)口罩的质量,决定抽查其中的.在这个问题中下列说法正确的个数是( )
①总体是指这1000个口罩; ②个体是每个口罩;
③样本是按的比例抽取的20个口罩;④样本容量为20
A.1 B.2 C.3 D.4
【答案】A
【分析】根据总体、个体、样本、样本容量的概念判断.
【详解】总体是研究对象的全体.这里是“1000个口罩的质量”,而非“1000个口罩”,所以①错误;
个体是总体中的单个单位.即“每个口罩的质量”,而非“每个口罩”,所以②错误;
样本是从总体中抽取的部分个体,即“按2%比例抽取的20个口罩的质量”,而非“20个口罩”,所以③错误;
样本容量是样本中个体的数量,抽取了1000×2%=20,所以样本容量为20,④正确.
故选:A.
6.(2025高三·全国·专题练习)(多选)为了解某中学2 500名学生家长对“骑电动车需戴头盔”的态度,从中随机调查400名家长,结果有380名家长持赞成态度,则下列说法不正确的是( )
A.调查方式是全面调查
B.该校只有380名家长持赞成态度
C.样本是400
D.该校约有95%的家长持赞成态度
【答案】ABC
【分析】根据抽样调查、样本等基本概念对每个选项进行逐一判断即可.
【详解】对于A,由题意得调查方式是抽样调查,不是全面调查,故A错误;
对于B,400名家长中有380名家长持赞成态度,按照比例推算,全校2 500名学生家长中约2 375名家长持赞成态度,故B错误;
对于C,样本是400名家长对“骑电动车需戴头盔”的态度,样本容量是400,故C错误;
对于D,该校约有×100%=95%的家长持赞成态度,故D正确.
故选:ABC.
【题型 2 简单随机抽样的理解与应用】
1.(25-26高一下·全国·课后作业)下面的抽样方法是简单随机抽样的是( )
A.某班45名同学,指定个子最高的5名同学参加学校组织的某项活动
B.从20个零件中随机逐个抽取3个进行质量检验
C.一个儿童从玩具箱中的20件玩具中拿出一件自己喜欢的来玩,玩后放回再拿下一件,连续玩了5件
D.从无限多个个体中抽取50个个体作为样本
【答案】B
【分析】根据简单随机抽样的概念依次判断即可求解.
【详解】对于A,抽取个子最高的5名,不是随机抽取,不是简单随机抽样,故A不符合题意;
对于B,从有限总体中进行随机、不放回抽样,符合简单随机抽样的特征,故B符合题意;
对于C,不具有随机性,不是简单随机抽样,故C不符合题意;
对于D,总体个数是无限的,不是简单随机抽样,故D不符合题意.
故选:B.
2.(25-26高一下·全国·课后作业)(多选)下列说法中正确的有( )
A.抽签法是简单随机抽样
B.随机数表法是简单随机抽样
C.简单随机抽样要求被抽取样本的总体的个数有限
D.简单随机抽样可以从总体中一次性抽出样本
【答案】ABC
【分析】由简单随机抽样的定义逐项判断即可.
【详解】抽签法是简单随机抽样,所以A正确;
随机数表法是简单随机抽样,所以B正确;
简单随机抽样要求被抽取样本的总体的个数有限,所以C正确;
简单随机抽样要求从总体中逐个抽出样本,所以D错误.
故选:ABC.
3.(25-26高一下·全国·课后作业)(多选)(多选题)下列抽样的方式属于简单随机抽样的是( )
A.从500个个体中一次性抽取50个作为样本
B.将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本
C.箱子共有100个零件,从中选出10个进行检验,在抽样操作中,从中任意取出一个零件进行检验后,再把它放回箱子
D.福利彩票用摇奖机摇奖
【答案】BD
【分析】根据简单随机抽样的概念依次判断即可.
【详解】根据简单随机抽样的概念:从有限总体中进行随机、不放回抽样,
可知 A不是逐个抽取,C不是不放回抽取,故不是简单随机抽样,BD是简单随机抽样.
故选:BD
4.(11-12高一·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【答案】B
【分析】根据抽签法的适用条件,结合选项依次判断即可.
【详解】选项A,总体中的个体数较大,样本容量也较大,不适合用抽签法,故A不符合题意;
选项B,总体中的个体数较小,样本容量也较小,
且同厂生产的两箱产品可视为搅拌均匀了,可用抽签法,故B符合题意;
选项C,甲、乙两厂生产的两箱产品质量可能差别较大,
不能满足搅拌均匀的条件,不能用抽签法,故C不符合题意;
选项D,总体中的个体数较大,不适合用抽签法,故D不符合题意.
故选:B
5.(25-26高一下·北京·期末)要考察某种品牌的450颗种子的发芽率,从中抽取50颗种子进行实验.利用随机数表抽取种子时,先将450颗种子按001,002,,450进行编号,如果从随机数表第2行第4组(随机数组中每5个数为一组)开始,自左向右自上至下读数,使用各个5位数组的前3位,则最先抽取的4颗种子的编号是__,___,___,___.
(下面摘取了随机数表第1行至第4行)
43021 92980 27768 26916 27783 84572 78483 39820
61459 39073 79242 20372 21048 87088 34600 34636
63171 58247 12907 50303 28814 40422 97895 61421
42372 53183 51546 90385 12120 64042 51320 22983.
【答案】 203 210 346 129
【详解】从随机数表第2行第4组(随机数组中每5个数为一组)开始,自左向右自上至下读数,
使用各个5位数组的前3位,可得:
第一个数字是203,符合题意;
第二个数字是210,也符合题意;
第三个数字是870,大于450,舍去;
第四个数字是346,符合题意;
第五个数字是346,重复,舍去;
第六个数字是631,大于450,舍去;
第七个数字是582,大于450,舍去;
第八个数字是129,符合题意.
最先抽取的4颗种子的编号为:203,210,346,129.
6.(25-26高三·全国·一轮复习)某中学举行“讲好航天故事”演讲比赛.现从报名的40位学生中利用下面的随机数表抽取10位同学参加演讲比赛,将40位学生按01,02,…,40进行编号,假设从随机数表第1行第3个数字开始由左向右依次选取两个数字,重复的跳过,则选出来的第7个号码所对应的学生编号为________.
0627 4313 2636 1547 0941 2512 6317 6323 2616
8045 6011 1410 9577 7424 6762 4281 1457 2042
5332 3732 2707 3607 5124 5179 3014 2310 2118
2191 3726 3890 0140 0523 2617
【答案】25
【详解】从随机数表第1行第3个数字开始由左向右依次选取两个数字,去掉超过40和重复的号码,
选取的个号码对应的学生编号依次为27,13,26,36,15,09,25,12,17,23,
其中第7个号码所对应的学生编号为25.
【题型 3 分层随机抽样计算与应用】
1.(25-26高一下·湖南衡阳·期中)“一尺一拳一寸间,科学用眼护双眼”,为保护青少年视力,培养科学健康的用眼习惯,某市疾控中心联合教育局开展“青少年视力健康监测与科学用眼宣传”.计划从全市三所高中(A校2400人、B校1800人、C校1200人)的所有学生中,按人数比例采用分层随机抽样的方法抽取270人进行视力检测与用眼习惯问卷调查,则A校应抽取的人数为( )
A.60 B.90 C.120 D.150
【答案】C
【分析】根据分层随机抽样的比例分配原则求解即可.
【详解】因为A校2400人、B校1800人、C校1200人,
所以A校人数在三所高中人数中占比为,
所以按人数比例采用分层随机抽样的方法抽取270人时,A校应抽取的人数为.
2.(2026·河南开封·二模)某人工智能公司为训练垃圾分类识别模型,需对采集的4000张图片进行人工标注,图片分为可回收物、厨余垃圾、有害垃圾、其他垃圾四类,已知四类图片的数量之比为,现采用分层抽样的方法抽取容量为n的样本对标注情况进行抽检,若抽到的厨余垃圾图片比有害垃圾图片多25张,则( )
A.80 B.100 C.120 D.160
【答案】B
【详解】已知四类图片的数量之比为,则厨余垃圾图片占总图片数量的比例为,
有害垃圾图片占总图片数量的比例为.
因为采用分层抽样的方法抽取容量为n的样本,所以抽到的厨余垃圾图片数量为,
抽到的有害垃圾图片数量为.
由题意可得,解得.
3.(2026·重庆·一模)某地区有高中教师300人,初中教师800人,小学教师1100人,为调查某次教师培训的成效,采用分层抽样的方法从这些教师中抽取一个容量为44的样本进行访问,则小学教师应抽取( )
A.6人 B.16人 C.22人 D.28人
【答案】C
【分析】由抽样比即可计算求解.
【详解】由题可得抽样比为.
所以小学教师应抽取人.
故选:C.
4.(2026·湖南长沙·模拟预测)甲校有名学生,乙校有名学生,丙校有名学生,为统计三校学生某方面的情况,计划采用分层随机抽样法抽取一个容量为的样本,应在这三校分别抽取学生( )
A.人,人,人 B.人,人,人
C.人,人,人 D.人,人,人
【答案】A
【详解】因为,所以甲校应抽取,
乙校应抽取,丙校应抽取.
5.(24-25高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
【答案】B
【分析】由分层抽样的概念即可判断;
【详解】因为男、女生的阅读时间差异不大,而小学、初中、高中三个学段学生的课外阅读时间存在较大差异,故应按照学段分层随机抽样.
故选:B.
【题型 4 频率分布表与频率分布直方图】
1.(2025·新疆喀什·二模)(多选)防溺水安全教育不仅是为了防止学生在游泳时发生意外,更是为了提高学生的安全意识和自我保护能力,为此某校组织了“防溺水安全知识”答题比赛,并对参赛的200名学生的成绩进行了统计,得到如图所示的频率分布直方图,其中分组区间分别为,,,,,则(同一组中的数据用该组区间的中点值作代表)( )
A.这200名参赛学生的成绩的中位数为76分
B.这200名参赛学生的成绩的平均值为分
C.这200名参赛学生的成绩不低于80分的频率为
D.这200名参赛学生的成绩在之间的有40人
【答案】ABD
【分析】根据频率直方图中中位数的计算方法即可判断;根据小矩形的面积乘以对应矩形中点的横坐标之和即可求解平均数,即可判断;求解的频率即可判断;根据频数的求解方法即可判断.
【详解】对于,设中位数为,
所以,解得,
所以这200名参赛学生的成绩的中位数为76分,故正确;
对于,,
所以这200名参赛学生的成绩的平均值为分,故正确;
对于,这200名参赛学生的成绩不低于80分的频率为,故错误;
对于,因为,所以这200名参赛学生的成绩在之间的有40人,故正确.
故选:.
2.(25-26高一上·广西桂林·期末)为传承和弘扬数学文化,激发学生学习数学的兴趣,某校高一年级举办数学文化知识竞赛活动,现从1000名参赛的学生成绩中随机抽取100个成绩进行统计得到频率分布直方图如图所示.
(1)求的值;
(2)以每组成绩的中点数值代表该组成绩,估计该校高一学生平均成绩;
(3)从和两组中用分层抽样的方法共抽取了7人,再从这7人中随机抽取2人,求这两人来自不同的组的概率.
【答案】(1)0.03
(2)74
(3)
【分析】(1)根据频率分布直方图所有小长方形面积和为1的性质列方程计算即可.
(2)找出每组中点值及对应频率,根据平均数公式计算即可.
(3)计算两组样本数,确定抽样比,得到每组抽样人数,结合概率计算公式计算即可.
【详解】(1)由频率分布直方图的性质可知,,
整理得,解得.
(2)每组成绩的中点值为:45,55,65,75,85,95;频率为0.05,0.1,0.2,0.3,0.25,0.1,
所以平均成绩为
.
(3)抽取100个样本中,在的人数为,在的人数为.
抽样比为,
所以在中抽取的人数为,在中抽取的人数为.
从中抽2人,共有10个基本事件;从中抽2人,共有1个基本事件;跨组抽共10个基本事件,
故抽取方法共个基本事件.
所以这两人来自不同的组的概率为.
3.(24-25高三下·云南德宏·阶段检测)(多选)某学校为了提高高三年级学生的某学科成绩,在第一次联考后采取了“培优补短”等一系列举措.为了更好地总结经验,现从高三年级1000名学生中随机抽取100名学生,将其前后两次联考成绩(满分150分)分别按照[50,70),[70,90),…,[130,150]分成五组,绘制成频率分布直方图,如图所示.下列说法正确的是( )
A.
B.估计该年级第二次联考成绩在130分以上的学生比第一次联考对应分数段的多10人
C.第二次联考学生的成绩波动更小
D.与第一次联考相比,第二次联考成绩在[50,90)内的学生人数减少,在[110,150]内的学生人数增加
【答案】BCD
【分析】由频率和为1列方程求参数判断A;再根据两次联考对应的直方图分析B、C、D的正误.
【详解】因为,所以,A错误.
因为第一次联考成绩在130分以上的学生人数大约占,
第二次联考成绩在130分以上的学生人数大约占,
所以增加,则增加的学生人数为10,B正确.
第一次联考成绩集中于70~110分的学生人数占比为,
第二次联考成绩集中于90~130分的学生人数占比为,
第二次联考成绩数据更集中,所以方差更小,C正确.
第一次联考成绩在[50,90)内的学生人数占比为,在[110,150]内的学生人数占比为,
第二次联考成绩在[50,90)内的学生人数占比为,在[110,150]内的学生人数占比为,D正确.
故选:BCD
4.(25-26高二上·上海奉贤·阶段检测)为进一步增强学生的疫情防控意识,友实学校组织学生进行了新冠肺炎疫情防控科普知识线上问答,共有100人参加了这次问答,将他们的成绩(满分100分)分成六组:,,,,,,制成如图所示的频率分布直方图.
(1)求图中的值;
(2)用分层抽样的方法从问答成绩在内的学生中抽取24人参加疫情防控知识宣讲,那么在,,内应各抽取多少人?
【答案】(1)
(2),,
【分析】(1)由各小矩形的高之和为求解;
(2)由比例求解.
【详解】(1).
(2)因为,
所以在,,内应各抽取:
,,.
故在,,内分别抽取,,人.
5.(24-25高一下·吉林长春·阶段检测)为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁)
频数
频率
5
0.05
①
0.20
35
②
30
0.30
10
0.10
总计
100
1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在岁的人数;
(3)现用比例分配的分层随机抽样从、、的样本中共抽取n名志愿者,已知从中抽取了2人,求n的值.
【答案】(1)①应填,②应填;
(2)直方图见解析,人数为175;
(3)15
【分析】(1)结合抽取的总人数,结合表格中数据,计算出结果;
(2)计算出区间的频率/组距,绘制直方图,并利用年龄在岁的频率得到答案;
(3)计算出三个区间的比例,从而计算出从、中分别抽取的人数,得到答案.
【详解】(1)①应填,②应填;
(2)区间的频率为0.20,故频率/组距为,
故补全频率分布直方图,如下:
这500名志愿者中年龄在岁的人数为;
(3)、、的人数比例为,
从中抽取了2人,故从、中分别抽取了7人和6人,
故.
【题型 5 百分位数计算】
1.(25-26高一下·山东泰安·阶段检测)参加某次数学竞赛的10名学生的成绩(单位:分)如下:71,86,76,80,96,81,84,83,92,88,则以这10人成绩的第60百分位数为实部,第75百分位数为虚部的复数是( )
A. B. C. D.
【答案】B
【分析】先将成绩从小到大排序,再根据百分位数的计算规则分别求出第60、75百分位数,组合得到对应复数即可
【详解】首先将10名学生的成绩按从小到大排序:.
由,故第60百分位数为排序后第6位和第7位数据的平均数,即,即所求复数的实部为85.
由,故第75百分位数为排序后第8位数据88,即所求复数的虚部为88.
因此所求复数为.
2.(25-26高一下·湖南·阶段检测)某校组织了“人工智能知识”测试,现随机抽取了100名学生的测试成绩(单位:分),这100名学生的成绩都分布在区间内,绘制成如图所示的频率分布直方图. 则这100名学生成绩的61%分位数为______.
【答案】82
【分析】由百分位数求解即可.
【详解】设这100名学生成绩的61%分位数为x,
因为前4组频率之和为,
前5组频率之和为,
所以这100名学生成绩的61%分位数落在第5组内,
所以,解得,所以这200名学生成绩的61%分位数为82.
3.(25-26高三下·河北衡水·阶段检测)为落实“五育并举”育人理念,某校随机对10名学生的劳动教育素养进行测评,10名学生的得分情况如下(满分10分):4,5,5,6,6,7,7,8,8,9,则这组数据的下四分位数是( )
A.4 B.5 C.6 D.8
【答案】B
【分析】根据百分位数的求法,结合条件,即可得答案.
【详解】下四分位数为第百分位数,且,
所以这组数据的下四分位数为数据的第三位数,是5.
4.(2026·陕西咸阳·三模)已知样本数据8,12,13,a,17的第80百分位数为16,则( )
A.14 B.15 C.16 D.17
【答案】B
【详解】因为,所以第百分位数为将数据从小到大排序后的第4个数与第5个数的平均数,
经讨论可知,为使第80百分位数为16,排序后的数据必为,
故有,解得.
5.(2026·浙江·三模)已知一组实数:1,2,4,x,8,10,若该组数据的第百分位数为4,则不可能是( )
A.40 B.50 C.60 D.70
【答案】D
【分析】按分类,结合第百分位数的定义逐项分析判断.
【详解】对于A,当时,由,得该组数据的第百分位数为由小到大排列的第3个数4,A可能;
对于B,当时,由,得该组数据的第百分位数为由小到大排列的第3、4个数的平均数4,B可能;
对于C,当时,由,得该组数据的第百分位数为由小到大排列的第4个数4,C可能;
对于D,,无论取何值,该组数据由小到大排列的第5个数不可能为4,因此不可能为,D不可能.
6.(24-25高二上·重庆·阶段检测)关于百分位数,下列选项错误的是( )
A.一组数按照从小到大排列后为:,,…,,计算得:,则这组数的80%分位数是
B.一组数据的百分位数可能是这组数据中的数,也可能不是这组数据中的数
C.一组数据的某些百分位数可能是同一个数
D.第50百分位数就是中位数
【答案】A
【分析】根据百分位数的定义分别判断各选项即可.
【详解】由百分位数的定义可知,若,则这组数的80%分位数是,故A错误;
由百分位数的定义可知,对分位数,若不为整数时,则分位数是这组数据中的数,若为整数时,则分位数是相邻两个数据的平均值,故可能不是这组数据中的数,故B正确;
当一组数据的分位数,分位数,满足是整数部分相同的非整数时,它们对应百分位数是同一个数,故C正确;
由百分位数的意义可知第50百分位数就是中位数,故D正确.
故选:A
【题型 6 众数、中位数、平均数的计算】
1.(24-25高三上·甘肃白银·期末)若有一组数据为6,6,5,5,4,4,3,2,1,则该组数据的平均数为( )
A.2 B.3 C.4 D.
【答案】C
【分析】借助平均数定义计算即可得.
【详解】平均数为.
故选:C.
2.(25-26高一上·江西吉安·期末)数据,,,的平均数是4,则数据,,,的平均数是( )
A.9 B.10 C.11 D.12
【答案】C
【分析】若,,,的平均数为,则,,,的平均数是.利用此公式求解.
【详解】设,,,的平均数为,
,,,的平均数是,
,,,的平均数是.
故选:C.
3.(25-26高一上·四川成都·开学考试)某学校组织了一场体育测试,现抽出60个人的体育考试分数,并对此进行统计,如图所示,关于这60人的分数,下列说法正确的是( )
A.众数是85 B.中位数是80
C.众数是21 D.中位数是12
【答案】A
【分析】按照众数与中位数这两个概念进行求解即可
【详解】从统计图中知,85分出现的次数最多,故众数是85;
把分数按大小排列,最中间的两个数是第30与31个数,
而,故中位数是;
故只有选项A正确;
故选:A.
4.(2024·广东惠州·模拟预测)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分如图所示,假设得分值的中位数为,众数为,平均值为,则( )
A. B.
C. D.
【答案】D
【分析】根据题意求中位数、众数和平均数,对比即可得结果.
【详解】30个数中第15个数是5,第16个数是6,所以中位数,
由题意可知:众数,
平均值=.
所以.
故选:D.
5.(2026·河南开封·模拟预测)一组数据:1,1,2,1,2,3,1,2,3,4,则关于这组数据的结论错误的是( )
A.平均数为2 B.众数为1
C.极差为3 D.中位数为
【答案】D
【详解】平均数:,A正确;
众数为1,B正确;
极差:,C正确;
将10个数排列:1,1,1,1,2,2,2,3,3,4,可知:中位数为2,故D错误.
6.(25-26高一下·北京·期末)某学校全体学生参加一次关于人工智能使用常识测评,其成绩的频率分布直方图如图所示,假设同组中的数据是均匀分布的,则成绩的中位数约为__ (填写整数).
【答案】81
【详解】因为前四组的频率为,前五组的频率为,
所以中位数位于组内,设为,
所以,解得,故中位数约为81.
【题型 7 方差、标准差计算与实际意义】
1.(浙江省9 1联考2025-2026学年高二第二学期学考模拟数学试题)(多选)一组样本数据为9,11,10,13,12,8,14,11,则这组数据的( )
A.中位数为11 B.方差为28 C.平均数为11 D.60%分位数为11
【答案】ACD
【分析】我们先对数据进行排序,再依次计算中位数、平均数、方差和分位数,判断各选项的正误.
【详解】首先将数据从小到大排序:
,共个数据.
对于A,中位数是第、个数的平均数:,A正确.
对于C, 平均数,C正确.
对于B, 方差
,B错误.
对于D,60%分位数,向上取整为第个数,即,D正确.
2.(25-26高一下·安徽合肥·阶段检测)某校在一次考试后,对两班的数学成绩进行分析.已知班有人,平均成绩为分,方差为;班有人,平均成绩为分,方差为.则两班全部名同学数学成绩的方差是( )
A. B. C. D.
【答案】C
【详解】两班全部名同学数学成绩的平均数为,
方差.
3.(2025·湖北十堰·模拟预测)若一组数据的平均值,方差,若删去一个数之后,平均值没有改变,方差变为40,则这组数据的个数( )
A.5 B.6 C.7 D.8
【答案】A
【分析】由题意得到删除的数为5,再利用方差公式求解.
【详解】由题意得到删去一个数之后,平均值没有改变,所以删除的数为5,
由题意,得,
删除一个数后的方差为:,
得,即.
故选:A.
4.(25-26高二下·江苏镇江·期中)(多选)已知一组数据如下:2023,2024,2025,2025,2026,2027,则( )
A.这组数据的极差为4
B.这组数据的方差为2
C.这组数据的众数等于平均数
D.这组数据的第70百分位数为2026
【答案】ACD
【详解】A:由数据知,极差为,对;
B:平均数为
则方差,错;
C:众数为,即与平均数相等,对;
D:由,则数据的第70百分位数为,对.
5.(25-26高一下·河北保定·阶段检测)已知样本数据,,,,的平均数为4,方差为2,则样本数据,,,,的平均数和方差分别为________和________.
【答案】 10 18
【分析】根据平均数及方差的计算公式计算即可得解.
【详解】由题意知,
.
所以
.
.
【题型 8 统计图表综合(条形图、折线图、扇形图)】
1.(25-26高三上·福建福州·期中)(多选)某超市在两周内的蓝莓每日促销量如图所示,根据此折线图,下面结论正确的是( )
A.这14天日促销量的众数是214
B.这14天日促销量的中位数是196
C.这14天日促销量的极差为194
D.这14天日促销量的第80百分位数是260
【答案】AD
【分析】根据给定的折线图,把14天日促销量从小到大排列,再由众数、中位数、极差、第80百分位数的定义依次求解判断.
【详解】由折线图得14天日促销量从小到大排列为:,
对于A,这14天日促销量的众数是214,A正确;
对于B,这14天日促销量的中位数是,B错误;
对于C,这14天日促销量的极差为,C错误;
对于D,由,得这14天日促销量的第80百分位数是260,D正确.
故选:AD
2.(22-23高二下·四川德阳·阶段检测)已知甲、乙两名同学在高三的6次数学测试成绩统计的折线图如下,下列说法正确的是( )
A.若甲、乙两组数据的方差分别为,,则
B.甲成绩比乙成绩更稳定
C.甲成绩的极差大于乙成绩的极差
D.若甲、乙两组数据的平均数分别为,,则
【答案】B
【分析】根据题中折线图的数据信息以及变化趋势,结合平均数、方差和极差的定义逐项分析判断
【详解】对A、B:由折线图的变化趋势可知:甲的成绩较为集中,乙成绩波动很大,故甲成绩比乙成绩更稳定,故,故A错误,B正确;
对C:极差为样本的最大值与最小值之差,甲的极差大约为30,乙的极差远大于30,故甲的极差小于乙的极差,C错误;
对D:由图可知:甲的成绩除第二次略低于乙的成绩,其余均高于乙的成绩,故,D错误;
故选:B.
3.(25-26高一下·山西晋中·阶段检测)(多选)2021至2025年我国快递业务量及其增长速度如图所示,则( )
A.2021至2025年我国快递业务量逐年增长
B.2021至2025年我国快递业务量增长速度逐年增长
C.2021至2025年我国快递业务量每年增长量超过200亿件
D.估计我国2020年的快递业务量小于650亿件
【答案】AD
【详解】 选项A:由柱状图数据可知,2021至2025年我国快递业务量分别为(亿件),数值逐年增大,
说明业务量在逐年增加,故选项A正确;
选项B:由折线图数据可知,2021至2025年我国快递业务量增长速度分别为,呈现先减后增的趋势,并非逐年增长,故选项B错误;
选项C:2023年的快递业务量增长量为(亿件),显然,不满足每年增长量超过200亿件,故选项C错误;
选项D:设我国2020年的快递业务量为亿件,根据2021年的业务量为亿件且增长率为,
可得,解得.
因为,所以估计我国2020年的快递业务量小于650亿件,故选项D正确.
4.(24-25高一下·广东河源·期末)(多选)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
【答案】ABC
【分析】根据条形图,逐项判断即可.
【详解】对于A,根据条形图,2024年,我国数字阅读用户规模为6.7亿,网民规模为11.1亿,数字阅读用户规模约占网民规模的,故A正确;
对于B,近五年,我国数字阅读用户规模的增长量为亿,网民规模的增长量为亿,
数字阅读用户规模的增长量大于网民规模的增长量,故B正确;
对于C,根据条形图,可以看出,从2020年至2024年,我国数字阅读用户规模在逐年递增,故C正确;
对于D,根据条形图,从2020年至2021年,我国网民规模的增长率为,
从2023年至2024年,我国网民规模的增长率为,增长率减小了,故D错误.
故选:ABC.
5.(25-26高一上·河南南阳·阶段检测)(多选)某调查研究小组收集并整理了南阳市2025年11月21日至30日每日最低气温与最高气温(单位:)的数据,并绘制了如图所示的折线图,则( )
A.11月21日至30日的日最低气温的极差是
B.11月21日至30日的日最高气温的中位数是
C.在11月21日至30日中,有4天的日最低气温低于
D.在11月21日至30日中,11月24日的日温差(最高气温减最低气温)最大
【答案】BD
【分析】根据折线图结合极差、中位数的理解逐项分析即可得出.
【详解】由图知11月21日至30日最低气温的最大值均小于,最小值为,则极差小于,故A不正确;
由图可知11月21日至30日的日最高气温共计10天,
从小到大排序的日期为:25日,26日,27日,22日,21日,24日,23日,28日,29日,30日,
所以日最高气温的中位数为21日,24日两天对应气温的平均值,即,
故11月21日至30日的日最高气温的中位数是,故B正确;
由图可知在11月21日至30日中,有24日,25日,26日共3天的日最低气温低于,故C不正确;
由11月21日的日温差为,11月22日的日温差约为,
11月23日的日温差约为,11月24日的日温差为,
11月25日的日温差约为,11月26日的日温差约为,
11月27日的日温差约为,11月28日的日温差约为,
11月29日的日温差约为,11月30日的日温差为,
所以11月24日的日温差(最高气温减最低气温)最大,故D正确.
故选:BD.
6.(2025高三·全国·专题练习)(多选)人均可支配收入和人均消费支出是两个非常重要的经济和民生指标,常被用于衡量一个地区经济发展水平和群众生活水平.图为2018—2023年前三季度全国城镇居民人均可支配收入及人均消费支出统计图,据此进行分析,则( )
A.2018—2023年前三季度全国城镇居民人均可支配收入逐年递增
B.2018—2023年前三季度全国城镇居民人均消费支出逐年递增
C.2018—2023年前三季度全国城镇居民人均可支配收入的极差比人均消费支出的极差大
D.2018—2023年前三季度全国城镇居民人均消费支出的中位数为21180元
【答案】ACD
【分析】根据折线图中标注的数据逐项分析.
【详解】由折线图可知人均可支配收入逐年递增,A正确;
2018—2023年前三季度全国城镇居民人均消费支出先增后减再增,B错误;
2018—2023年前三季度全国城镇居民人均可支配收入的极差为元,人均消费支出的极差为元,,C正确;
2018—2023年前三季度全国城镇居民人均消费支出的中位数为元,D正确.
故选:ACD.
7.(25-26高二上·云南曲靖·阶段检测)(多选)如图是某公司2020年和2024年支出的比例分配图,其中这两年用于文体活动的支出费用相等,则( )
A.2024年总支出比2020年增长
B.用于宣发的支出2024年比2020年多
C.用于水电的支出2024年与2020年相等
D.用于工资的支出2024年比2020年增长
【答案】ACD
【分析】设年总支出为,年总支出为,依题意可得,即可判断A,再分别求出各年用于宣发、水电、工资的支出,即可判断B、C、D.
【详解】对于A:设年总支出为,年总支出为,
依题意可得,所以,
即年总支出比年增长,故A正确;
对于B:年用于宣发的支出为,
年用于宣发的支出为,
故用于宣发的支出年比年少,故B错误;
对于C:年用于水电的支出为,
年用于水电的支出为,
故用于水电的支出年与年相等,故C正确;
对于D:年用于工资的支出为,
年用于工资的支出为,
因为,
所以工资的支出年比年增长,故D正确;
故选:ACD
8. 2025高三·全国·专题练习)(多选)南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔(Florence Nightingale)设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年中国知识付费用户数量(单位:亿人次,数据为年末数据),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法正确的是( )
A.2016年至2023年,知识付费用户数量逐年增加
B.2017年至2023年,知识付费用户数量逐年增加量2018年最多
C.2017年至2023年,知识付费用户数量的逐年增加量逐年递增
D.2023年知识付费用户数量超过2016年知识付费用户数量的10倍
【答案】AB
【分析】利用题中所给的南丁格尔玫瑰图逐一考查所给选项,即可得解.
【详解】对于A,由图可知,2016年至2023年,知识付费用户数量逐年增加,故A正确.
对于B和C,知识付费用户数量的逐年增加量分别为:2017年,;2018年,;2019年,;2020年,;2021年,;2022年,;2023年:.则知识付费用户数量逐年增加量2018年最多,知识付费用户数量的逐年增加量不是逐年递增,故B正确,C错误.
对于D,由,则2023年知识付费用户数量未超过2016年知识付费用户数量的10倍,故D错误.
故选:AB.
9.(25-26高二上·宁夏中卫·开学考试)(多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险,各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图:
用样本估计总体,以下四个选项正确的( )
A.丁险种最受参保人青睐 B.随着年龄的增长人均参保费用越来越高
C.30周岁以上的参保人数约占总参保人数的20% D.30~41周岁参保人数最多
【答案】ABD
【分析】利用条形图、折线图、扇形图一一分析选项即可.
【详解】对于A,由条形图可知丁险种参保比例最高,即A正确;
对于B,由折线图可知,参保费用随年龄增长而增长,即B正确;
对于C,由扇形图可知,30周岁以下参保人数占总参保人数的20%,
所以30周岁以上参保人数占总参保人数的80%,即C错误;
对于D,由扇形图可知,30~41周岁参保人数占比最多,即D正确.
故选:ABD
【题型 9 抽样方法综合辨析】
1.(23-24高一上·全国·单元测试)简单随机抽样,分层抽样之间的共同点是( )
A.都是从总体中逐个抽取
B.将总体分成几个部分,按事先确定的规则在各部分抽取
C.抽样过程中每个个体被抽到的概率是相等的
D.将总体分成几层,然后分层按照比例抽取
【答案】C
【分析】根据两种抽样方法的特点可知:抽样过程中每个个体被抽到的机会相同,即可找到答案.
【详解】选项A,只有简单随机抽样是从总体中逐个随机抽取,故A错误.
选项B,只有分层抽样是将总体分成几部分,按事先确定的规则在各部分抽取,故B错误.
选项C,简单随机抽样、分层抽样之间的共同点是抽样过程中每个个体被抽到的机会相同,故C正确.
选项D,只有分层抽样是将总体分成几层,分层进行抽取,故D错误.
故选:C
2.(23-24高一上·全国·课后作业)现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查.
②某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查.
③某中学共有320名教职工,其中教师240名,行政人员32名,后勤人员48名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为40的样本.
较为合理的抽样方法的选择是( )
A.①简单随机抽样,②分层随机抽样,③分层随机抽样
B.①简单随机抽样,②分层随机抽样,③简单随机抽样
C.①分层随机抽样,②简单随机抽样,③分层随机抽样
D.①分层随机抽样,②抽签法,③简单随机抽样
【答案】A
【分析】根据抽样定义判断各个小题即可.
【详解】①总体和样本量都很小,用简单随机抽样;
②③总体由差异明显的几部分构成,用分层随机抽样.
故答案为:A.
3.(24-25高二上·四川绵阳·期末)①在一次满分为100分的测试中,有12人的成绩在90分以上,30人的成绩在60~80分,12人的成绩低于60分,现从中抽取9人了解有关考试题目难度的情况;②一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【答案】A
【分析】根据分层抽样和简单随机抽样的特点判断即可.
【详解】对于①:考试成绩在不同分数段之间的同学有明显的差异,用分层随机抽样比较恰当;
对于②:总体包含的个体较少,用简单随机抽样比较恰当.
故选:A.
4.(24-25高一下·贵州黔南·期末)(多选)某高校大一新生中,来自东部地区的学生有2500人、中部地区的学生有1500人、西部地区的学生有1000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列说法正确的有( )
A.用简单随机抽样的方法从新生中选出100人最适合
B.用分层随机抽样的方法从新生中选出100人最适合,且用分层随机抽样的方法分别抽取东部地区学生50人、中部地区学生30人、西部地区学生20人
C.用分层随机抽样的方法抽取的100名学生中,西部地区学生小刘被选中的可能性比中部地区学生小张被选中的可能性大
D.总体是该高校全体大一新生
【答案】BD
【分析】由分层抽样的性质结合题意逐一判断可得.
【详解】因为各部地区的饮食习惯各不相同,差异较大,所以用分层抽样更合适,
又各地区人数比为,若抽取人数为100人,
则取东部地区学生50人、中部地区学生30人、西部地区学生20人,故A错误,B正确;
采取分层抽样,每个学生被抽取的可能性均为,各地区学生被选中的可能性大小是相等的,故C错误;
事件的总体为该高校全体大一新生,故D正确.
故选:BD.
5.(2024·福建泉州·模拟预测)从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A. B. C. D.
【答案】B
【分析】根据抽样的概念,每个个体被抽中的概率是均等的,进而即可选择答案.
【详解】因为在抽签法抽样、随机数法抽样和分层随机抽样中,每个个体被抽中的概率均为,
所以.
故选:B.
6.(25-26高一下·山西·阶段检测)某小学有学生3300人,卫生部门为了解学生身体发育情况,准备从中抽取一个容量为300的样本,则适合的抽样方法是( )
A.抽签法 B.随机数法
C.简单随机抽样 D.分层随机抽样
【答案】D
【详解】由于不同年级的学生身体发育情况可能存在差异,因此适合采用分层随机抽样的方法.
7.(25-26高一下·全国·课堂例题)(多选)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
方法一:采用简单随机抽样的方法,将零件编号为00,01,…,99,用抽签法抽取20个.
方法二:采用分层抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.
对于上述问题,下列说法中正确的有( )
A.不论采用哪种抽样方法,这100个零件中每个零件被抽到的概率都是
B.采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同
C.在上述两种抽样方法中,方法一抽到的样本比方法二抽到的样本更能反映总体的特征
D.在上述两种抽样方法中,方法二抽到的样本比方法一抽到的样本更能反映总体的特征
【答案】AD
【详解】选项A,.
选项B,方法一抽取时零件之间没有区别,抽取概率为.
方法二抽取时各分层概率也均为,因此两方法每一个零件被抽取概率相同.
选项C,方法二的分层抽样按照比例从不同级别的样品中抽取比随机抽样更能反映总体的特征.
选项D,和C同理.
【题型 10 统计综合解答题】
1.(25-26高一下·浙江金华·阶段检测)学校对高一学生期中考试的数学成绩进行调查,现抽取100人进行数据统计,绘制频率分布直方图如下,
(1)求的值和该组数据的中位数:
(2)若这100人中有女生40人,且男生平均分106,方差为16;女生平均分101,方差为36,求这100人的数学平均分和方差.
【答案】(1),
(2),
【详解】(1),
,,
所以中位数在区间内,故.
(2),.
所以这100人的数学平均分为,方差为.
2.(25-26高一下·江苏泰州·阶段检测)某幼儿园根据部分同年龄段儿童的身高数据绘制了如图所示的频率分布直方图,其中身高(单位:)的变化范围是,样本数据分组为,,,,.
(1)求出的值;
(2)已知样本中身高小于的人数是60,求出样本容量的数值;
(3)根据频率分布直方图提供的数据,现用分层抽样的方法从身高在,,内的儿童中共抽出42名儿童参加活动,求三个组内分别要抽取的儿童数.
【答案】(1)
(2)
(3)
在,,内抽取儿童数为名
【分析】(1)利用频率分布直方图中所有小矩形的面积之和为建立方程求解;
(2)先计算身高小于的频率,再利用频数除以频率求样本容量;
(3)计算三个区间的频率之比或人数之比,利用分层抽样的比例关系求解。
【详解】(1) 由频率分布直方图可知,组距为, 根据所有小矩形的面积之和为,
所以 ;
(2)身高小于的频率为.
因为身高小于的人数是, 所以样本容量;
(3)身高在,,内的频率分别为,,,
这三组的人数分别为,,.
这三组的总人数为,故抽样比为,
则三个组内分别要抽取的儿童数为:
第一组(名) ,第二组(名) ,第三组(名) ,
故三个组内分别要抽取的儿童数为名.
3.(25-26高一下·安徽蚌埠·阶段检测)为点燃同学们对数学的热爱,使其探寻数字背后的文化密码,某校高一年级举办“数学文化”知识竞赛.为了解参赛者的成绩情况,从所有参赛者中随机抽取100人的成绩(百分制)作为样本,并按分组,作出频率分布直方图如图所示.
(1)求的值,并估计样本中成绩不低于60分的人数;
(2)估计样本中成绩的上四分位数;
(3)若规定成绩不低于80分为“良好”等级,已知样本中成绩在内的平均数为88,方差为7,成绩在内的平均数为96,方差为7,求样本中“良好”等级的成绩的平均数和方差.
【答案】(1),90
(2)86
(3)平均数为91,方差为22.
【分析】(1)根据频率分布直方图的特征求的值,再利用频率估计总体即可;
(2)根据百分位数的求解方式求解即可;
(3)根据分层抽样的方差公式求解.
【详解】(1)在频率分布直方图中,所有小矩形的面积之和为1,
则,解得,
估计样本中成绩不低于60分的人数为.
(2)前四个小矩形的面积之和为,
前五个小矩形的面积之和为,
所以成绩的上四分位数落在内,设其为,
则,解得,
即估计样本中成绩的上四分位数为86.
(3)样本中成绩在内占成绩在内的比例为,
样本中成绩在内占成绩在内的比例为.
设样本中“良好”等级的成绩的平均数和方差分别为,
由分层随机抽样的平均数公式可得,
由分层随机抽样的方差公式可得,
故样本中“良好”等级的成绩的平均数为91,方差为22.
4.(25-26高一下·湖南衡阳·期中)某烘焙店为调研某款全麦面包的质量情况,随机抽取了100个这款全麦面包,将称重后得到的数据分成六组,分别为[,,…,(单位:克),得到如图所示的频率分布直方图.
(1)求图中的值,并估计这100个样本数据的平均数;(同一组中的数据以该组所在区间的中点值为代表)
(2)若样本在内的平均质量是65克,方差是6,在内的平均质量为75克,方差是3,求这两组质量的总方差.
【答案】(1);
(2)
【分析】(1)根据频率分布直方图的性质,列出方程求得,结合平均数的计算公式,即可求解;
(2)根据题意,利用分层抽样的方差的计算公式,即可求解.
【详解】(1)解:由频率分布直方图的性质,可得,
解得.
各组的组中值依次为,对应频率依次为,
所以数据的平均数
,
所以估计这100个样本数据的平均数为.
(2)解:由于样本数据在与内的频率之比为,
所以两组的总平均数为,
所以总方差.
5.(25-26高一下·甘肃兰州·期中)某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
【答案】(1)
(2),
(3)众数:75 分;平均数:76.5 分;人
【分析】(1)由频率分布直方图中各个矩形的面积和为1即可求解;
(2)由频率分布直方图确定成绩落在,的频率,再由频率估计人数即可;
(3)由样本数据的数字特征求法依次求解即可.
【详解】(1)由题意得,解得.
(2)设为成绩落在上的概率,为成绩落在的人数,
由题意得,
设为成绩落在上的概率,为成绩落在的人数,
.
(3)由题意得众数为75分;
由(1)得成绩落在的频率为0.1,落在的频率为0.15,
落在的频率为0.35,落在的频率为0.3,落在的频率为0.1,
则平均数为,
设为78分以上的频率,为78分以上的人数,
则
,
故78分以上的人数为47人.
6.(25-26高二下·重庆·期中)某校法联社团组织高一年级所有学生参加“感受法治内涵,争做法治宣传人”的主题知识比赛,旨在引导同学们深入学习法治知识,争当法治精神的传播者.比赛分为初赛和决赛两个环节,现从所有初赛成绩(满分分,最低分分)中,随机调查了位同学的测试成绩,按、、、、分组,并绘制出了如图所示的频率分布直方图.
(1)若规定成绩排名前的同学可入围决赛,请估计进入决赛的同学成绩应不低于多少分?
(2)已知落在内的平均成绩是分,方差是分,落在内的平均成绩是分,方差是分,求两组成绩合并后的平均数和方差.
附:设两组数据的样本量、样本平均数和样本方差分别为、、;、、,记两组数据总体的样本平均数为,则总体样本方差.
【答案】(1)
(2),
【分析】(1)根据频率分布直方图计算样本数据的第百分位数即可;
(2)先求出总体平均数,再利用分层抽样的方差公式求解即可.
【详解】(1)由题意可知,进入决赛的同学成绩的分数线为样本数据的第百分位数,
设样本数据的第百分位数为,
由频率分布直方图中所有矩形的面积之和为可得,
解得,
前三个矩形的面积之和为,
前四个矩形的面积之和为,所以,
由百分位数的定义可得,解得,
故进入决赛的同学成绩应不低于分.
(2)由题意可知,成绩落在的频率为,
成绩落在的频率为,
所以,,
.
7.(25-26高二上·云南临沧·开学考试)在一次区域的统考中,为了了解学生数学学科成绩的情况,从所有考生的成绩中随机抽取了40位考生的成绩进行统计分析,得到如图所示的频率分布直方图.
(1)估计这40名学生的数学成绩的平均数与上四分位数;(同一组中的数据用该组区间的中点值作代表,结果保留1位小数);
(2)为了进一步了解70分以下的学生的数学学习情况,调查方从成绩在分数段的同学中按组(各算一组从样本中分层抽取了6个人进行深入地学习交流,学习交流完后再从这6个人中随机抽取2个人进行再测试,求这两个人中至少有一个人在之前的统考中成绩位于的概率;
(3)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的方差.
【答案】(1)平均数约为75分,上四分位数约为83.3分;
(2).
(3)平均数为88;方差为10
【分析】(1)借助平均数与上四分位数定义计算即可得;
(2)结合分层抽样定义可得抽取6人中成绩在及的人数,再借助列举法计算即可得;
(3)借助分层抽样的平均数与方差公式计算即可得.
【详解】(1)设平均数为,上四分位数为;
则,
上四分位数满足方程,.
这40名学生的数学成绩的平均数约为75分,上四分位数约为83.3分;
(2)由频率分布直方图可知,分数在的人数有4人,分数在的人数有8人,
分层抽样的抽样比为,
分数在的学生中抽取2人,分数在的学生中抽取4人,
将抽取的这6个人编号:1,2,3,4,5,6,其中1,2是成绩在的两个学生,
则这两个人的所有可能情况有:、、、、、、、
、、、、、、、,共15种可能;
其中至少有一个人在之前的统考中成绩位于的情况有:、、、、
、、、、,共9种可能;
这两个人中至少有一个人在之前的统考中成绩位于的概率为;
(3)在内有人,在内有人,
在内的平均成绩,
估计在内数据的原始成绩的方差为:
.
1.(2026·海南海口·一模)(多选)某高中学校高一年级、高二年级、高三年级的学生分别有400、500、300人.现用比例分配的分层随机抽样的方法,按年级从这些学生中抽取n人开展“教师作业批改情况”问卷调查,若高二年级抽到学生15人,则下列说法正确的是( )
A.从高二年级学生500人中抽取15人可采用简单随机抽样的方法
B.高一年级抽到学生12人
C.样本容量
D.三个年级中高三年级每个学生被抽取到的概率最小
【答案】AB
【分析】根据分层随机抽样的概念与性质进行求解判断即可.
【详解】对于,从高二年级学生500人中抽取15人,由于总体数量比较少,可采用简单随机抽样方法,故正确;
对于,根据题意知抽样比为,所以高一年级应抽取人,高三年级应抽取人,故样本容量,故正确,错误;
对于,在分层随机抽样中,每个个体被抽到的概率是相等的,故错误.
故选:AB.
2.(25-26高一下·全国·课后作业)(多选)(多选题)下列抽样的方式属于简单随机抽样的是( )
A.从500个个体中一次性抽取50个作为样本
B.将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本
C.箱子共有100个零件,从中选出10个进行检验,在抽样操作中,从中任意取出一个零件进行检验后,再把它放回箱子
D.福利彩票用摇奖机摇奖
【答案】BD
【分析】根据简单随机抽样的概念依次判断即可.
【详解】根据简单随机抽样的概念:从有限总体中进行随机、不放回抽样,
可知 A不是逐个抽取,C不是不放回抽取,故不是简单随机抽样,BD是简单随机抽样.
故选:BD
3.(25-26高一下·吉林四平·阶段检测)某地区教育部门为了解该地区中小学生的近视情况,采用分层随机抽样的方法,抽取一定数量的中小学生进行调查.若得到的样本中初中的学生人数比小学少80人,比高中多40人,该地区小学、高中的学生人数之比为,则样本容量为( )
A.460 B.690 C.880 D.980
【答案】C
【分析】根据抽样比例和相差人数,解方程即可.
【详解】设样本中小学学生人数为,则高中学生人数为,所以,
解得,即高中学生数为,初中学生人数为,
小学学生人数为,样本容量为.
4.(25-26高一下·北京·期末)要考察某种品牌的450颗种子的发芽率,从中抽取50颗种子进行实验.利用随机数表抽取种子时,先将450颗种子按001,002,,450进行编号,如果从随机数表第2行第4组(随机数组中每5个数为一组)开始,自左向右自上至下读数,使用各个5位数组的前3位,则最先抽取的4颗种子的编号是__,___,___,___.
(下面摘取了随机数表第1行至第4行)
43021 92980 27768 26916 27783 84572 78483 39820
61459 39073 79242 20372 21048 87088 34600 34636
63171 58247 12907 50303 28814 40422 97895 61421
42372 53183 51546 90385 12120 64042 51320 22983.
【答案】 203 210 346 129
【详解】从随机数表第2行第4组(随机数组中每5个数为一组)开始,自左向右自上至下读数,
使用各个5位数组的前3位,可得:
第一个数字是203,符合题意;
第二个数字是210,也符合题意;
第三个数字是870,大于450,舍去;
第四个数字是346,符合题意;
第五个数字是346,重复,舍去;
第六个数字是631,大于450,舍去;
第七个数字是582,大于450,舍去;
第八个数字是129,符合题意.
最先抽取的4颗种子的编号为:203,210,346,129.
5.(25-26高三上·重庆·期中)已知某9个数的平均数为5,方差为.现又加入一个新数5,此时这10个数的平均数为,方差为,则( )
A., B.,
C., D.,
【答案】B
【分析】根据平均数与方差的计算公式进行计算即可求得结果.
【详解】∵,
∴,解得.
故选:B
6.(2026·陕西榆林·三模)已知一组数据8,12,15,,11,18()中的最小数据为8,且第75百分位数是15,则的不同取值可能有( )
A.8个 B.7个 C.6个 D.1个
【答案】A
【分析】根据百分位数的求解方法,结合已知条件得到的取值范围,即可得到答案.
【详解】由题意知,,.
已知数据有6个,将数据从小到大排序,,
则该组数据的第75百分位数即为第5个数据,所以.
综上,,.
所以的可能取值有8,9,10,11,12,13,14,15,共8个.
7.(2026·河北邢台·二模)某小组在试验中得到了一组样本数据:8,6,10,8,5,9,11,12,若这组数据的第百分位数恰为这组数据的众数,则的取值范围是( )
A. B. C. D.
【答案】A
【分析】先求出众数,再根据是否为整数分类讨论后可求的取值范围.
【详解】将数据从小到大排列为5,6,8,8,9,10,11,12,众数为8,
则这组数据的第百分位数为8,
又 ,
若为整数,则,解得;
若不为整数,则或,
解得或,综上,.
8.(25-26高三上·河南南阳·期末)(多选)进入12月份后,受冷暖空气的共同影响,我市气温起伏较大.现记录了12月上旬(1日-10日)我市的日最高气温如下(单位:℃):13,8,9,11,12,12,18,16,13,15,则下列说法正确的是( )
A.12月上旬我市日最高气温的极差为10℃
B.12月上旬我市日最高气温的平均数为12.7℃
C.2日-10日我市日最高气温持续上升
D.12月上旬我市日最高气温的分位数为13℃
【答案】ABD
【分析】根据极差的概念计算判断A;计算日最高气温的平均数判断B;根据日最高气温变化规律判断C;根据百分位数的计算方法求解判断D.
【详解】对于A,12月上旬我市日最高气温的极差为18-8=10℃,故A正确;
对于B,12月上旬我市日最高气温的平均数为℃,故B正确;
对于C,7日到8日气温是下降的,所以2日-10日我市日最高气温不是持续上升,故C错误;
对于D,气温由低到高排列为8,9,11,12,12,13,13,15,16,18
因为,所以12月上旬我市日最高气温的分位数为℃,故D正确.
故选:ABD.
9.(2026·河北邯郸·二模)已知一组数据:,1,2,3,4,5,17,若该组数据的第80百分位数为5,平均数不小于5,则实数的取值范围是( )
A. B. C. D.
【答案】A
【分析】由百分位数计算公式确定,再结合平均数计算公式即可求解.
【详解】这组数据共个,因为,
则第个数据为第80百分位数,
由题意第80百分位数为,说明从小到大排序后,第个数是,
若,则第80百分位数为或17,不符合题意,因此,
又平均数不小于,则,即,
综上可得,.
10.(25-26高二下·山西长治·阶段检测)一组从小到大排列的数据:3,4,,12,16,若这组数据的第60百分位数比平均数大2,则的值为( )
A.10 B.9 C.8 D.7
【答案】A
【分析】先求出第60百分位数和平均数,再根据第60百分位数比平均数大2,建立等量关系求解即可.
【详解】解:由题意得,则第60百分位数为,
因为平均数为,第60百分位数比平均数大2,
所以,解得.
11.(2026·安徽·模拟预测)(多选)如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态.根据所给的直方图,下列结论正确的有( )
A.图(1)的平均数=中位数=众数 B.图(2)的众数<中位数<平均数
C.图(2)的平均数<众数<中位数 D.图(3)的平均数<中位数<众数
【答案】BD
【详解】图(1)的频率分布直方图是对称的,平均数、中位数和众数相差不大,但不一定相等,A错误;
图(2)的频率分布直方图是“右拖尾”形态,众数最小,平均数大于中位数,B正确,C错误;
图(3)的频率分布直方图是“左拖尾”形态,众数最大,平均数小于中位数,D正确.
12.(2026·安徽合肥·一模)某公司50名员工的月工资统计表如下:
工资/元
3600
4000
4400
5000
6000
7000
人数/名
5
10
20
7
5
3
记这50名员工月工资的平均数为元,中位数为元,众数为元,则( )
A. B. C. D.
【答案】B
【分析】利用平均数,中位数,众数的意义分别求得平均数,中位数,众数即可.
【详解】这50名员工月工资的平均数为元;
从小到大排列后第25和第26个数均为4400,所以中位数为元;
显然4400出现次数最多为20次,所以众数为元
故.
故选:B.
13.(2026·辽宁大连·三模)在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续7天,每天新增疑似病例不超过5人”.过去7日,甲、乙、丙、丁四地新增疑似病例数据信息如下,则一定符合该标志的是( )
甲地:总体平均数,且中位数为0;
乙地:中位数为2,3为众数;
丙地:总体平均数为2,且标准差;
丁地:总体平均数,且极差.
A.甲地 B.乙地 C.丙地 D.丁地
【答案】D
【分析】根据各地区的统计量(中位数,极差,平均数,众数,方差),判断是否满足题意.
【详解】甲地:需满足总体平均数,且中位数为0,
假设7天新增疑似病例为0,0,0,0,5,6,7,第6天、第7天新增疑似病例超过5人,不符合该标志.
乙地:假设7天新增疑似病例为0,1,2,2,3,3,7,满足中位数为2,
其中一个众数为3,但是第7天新增疑似病例超过5人,不符合该标志.
丙地:若7天新增疑似病例为1,1,1,1,2,2,6,满足平均数为2,
方差,,但不符合该标志.
丁地:由极差可知,若新增疑似病例最多超过5人,比如6人,那么最小值不低于4人
,此时平均数,与矛盾,故每天新增疑似病例不超过5人,丁地符合该标志.
14.(25-26高二上·安徽·阶段检测)某班男生、女生人数之比为,对该班同学每周运动时间(单位:时)进行调查,得知男生每周运动时间的平均数为,方差为,女生每周运动时间的平均数为,方差为,则该班全体同学每周运动时间的方差为( )
A.5.2 B.5.3 C.5.4 D.5.5
【答案】C
【分析】根据整体方差的计算公式即可求解.
【详解】该班全体同学每周运动时间的平均数为,
方差为,
故选:C
15.(2026高三下·内蒙古鄂尔多斯·专题练习)某AI公司有男性30人,女性10人,在一次知识竞技团建中,男性平均成绩为110分,方差为55,女性平均成绩为130分,方差为95,则在这次团建中,该公司的平均成绩和方差分别为( )
A.120分,75 B.120分,20 C.115分,65 D.115分,140
【答案】D
【详解】因为某AI公司有男性30人,女性10人,男性平均成绩为110分,方差为55,女性平均成绩为130分,方差为95,
所以该公司的平均成绩为分,
该公司成绩的方差为.
16.(25-26高二上·广西·期中)某中学为提升学生的数学素养,激发大家学习数学的兴趣,举办了一场“数学文化素养知识大赛”,分为初赛和复赛两个环节,全校学生参加了初赛,现从参加初赛的全体学生中随机地抽取200人的成绩作为样本,得到如下频率分布直方图,根据图形,请回答下列问题:
(1)求频率分布直方图中的值.用样本估计总体,估计该校学生初赛成绩的平均数以及中位数.(同一组中的数据用该组区间中点值作代表)(保留小数点后两位);
(2)若甲、乙、丙三位同学均进入复赛,已知甲、乙、丙复赛获一等奖的概率分别为,,,甲、乙、丙获一等奖互不影响,求至少有两位同学复赛获一等奖的概率.
【答案】(1),平均数为,中位数为;
(2)
【分析】(1)根据频率分布直方图的性质及平均数、中位数的求法计算即可;
(2)利用独立事件的概率公式计算即可.
【详解】(1)易知,
则该校学生初赛成绩的平均数为
,
又,则中位数位于之间,
中位数不妨设为x,则;
(2)设事件甲、乙、丙获奖分别为
至少两位同学获奖有如下情况:甲乙获奖丙未获奖,甲丙获奖乙未获奖,乙丙获奖甲未获奖,甲乙丙三人均获奖,
则
.
17.(25-26高一上·陕西渭南·期末)某中学初一男生共有400人,为了解初一男生的体重情况,该中学统计了所有初一男生的体重(单位:千克),并将数据按照,,,,分成5组,画成如图所示的频率分布直方图.
(1)估计这400名男生的平均体重(同组数据用该组区间中点值作代表);
(2)根据体重区间,按比例分层抽样,从体重不足48千克的男生中抽取38人了解营养状况,试计算分别应当抽取体重在区间,,上的人数依次为多少?
【答案】(1)45.04千克
(2)6,14,18
【分析】(1)利用频率分布直方图计算平均数即可求解;
(2)根据频率分布直方图先计算各组的频数,再利用分层抽样即可求解.
【详解】(1),
故可估计这400名男生的平均体重为45.04千克;
(2)由题意得:
应当抽取体重在区间上的男生人数为:人;
应当抽取体重在区间上的男生人数为:人;
应当抽取体重在区间上的男生人数为:人.
故分别应当抽取体重在区间,,上的人数依次为6,14,18.
1.(25-26高二上·上海浦东新·阶段检测)已知样本数据、、、、的平均数为,方差为,则的值为( )
A. B. C. D.
【答案】D
【分析】利用平均数公式可得出的值,利用方差公式可得出的值,结合平方关系可求得的值.
【详解】由平均数公式可得,可得,
由方差公式可得,
整理可得,即,所以,
因为,所以,
故.
故选:D.
2.(2026·重庆万州·模拟预测)若一组样本数据,,,的平均数为3,方差为2;另一组样本数据,,,,3的方差为,则的值为( )
A.7 B.8 C.9 D.10
【答案】C
【分析】根据方差公式代入求解,即可得出答案.
【详解】,,,这组样本数据的平均数为3,可得 ,则,
新增一个数据3后,数据变为 ,
则新数据的平均数为 ,
已知原数据 的方差为 2 ,根据方差公式可得 ,
则,
所以新数据的方差为,,
则,化简可得 ,解得.
3.(25-26高一上·辽宁沈阳·阶段检测)(多选)下列说法正确的是( )
A.已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5
B.数据27,12,14,30,15,17,19,23的第70百分位数是23
C.若样本,,…,的平均值为8,则,,…,的平均值为15
D.某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出58人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为20人
【答案】BCD
【分析】A项,根据平均数公式求的值并计算方差;B项,按步骤求解第70百分位数即可;C项,利用平均数的性质求新数据的平均数;D项,根据抽样比求解可得.
【详解】A选项,由平均数公式得,,解得,
根据方差公式得,
,故A项错误;
B选项,将数据从小到大排序可得,
由不是整数,
所以第70百分位数是排序后第6个数,即,故B项正确;
C选项,已知样本的平均值为,
即,
则的平均数为:
,
故,所以C项正确;
D选项,由题意知,抽样比为,
则从高二年级抽取人数为,
设高三年级学生中抽取的人数为,
则由,解得,故D项正确;
故选:BCD.
4.(23-24高一下·云南昆明·期末)某班同学身高的平均数为,方差为,其中女生身高的平均数为,方差为,男生身高的平均数为,方差为,下列说法错误的是( )
A.若,则 B.若,则
C.若,则 D.若,则
【答案】B
【分析】利用均值公式、方差公式逐项判断正误即可
【详解】选项A:,所以,若,则,
故选项A正确.
选项B:
,
所以
,不妨令则
,
故选项B错误.
选项C:若,则故选项C正确.
选项D:若,
因为,所以,
则.
又,
所
故选项D正确.
故选:B.
5.(2026高一·全国·专题练习)已知某工厂有三条流水线用于生产同一种产品,三条流水线的产量之比为,根据比例分层抽样得到流水线2的样本平均数为9.0,流水线3的样本平均数为9.4,所有样本的平均数为9.3,则流水线1的样本平均数为_____.
【答案】9.5
【分析】由题干中的比例,根据平均数的计算公式建立方程,可得答案.
【详解】根据题意,不妨设抽取的样本容量分别为,,,
设三条流水线的样本平均数分别为,总体样本平均数为,
则
根据样本平均数公式可得,
解得,所以流水线1的样本平均数为9.5.
6.(25-26高一下·贵州遵义·阶段检测)引体向上是中小学体质健康测试男生的项目,主要测试学生上肢力量.在对某高中1000名高一、高二年级男生的引体向上成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名学生中高一年级男生有600人,且抽取的样本中高一男生成绩的平均数和方差分别为5.5和6.74,高二男生成绩的平均数和方差分别为6.5和5.34,则总体方差( )
(附:)
A.6.42 B.6.18 C.5.96 D.5.84
【答案】A
【详解】依题意,在分层随机抽样的方法所抽取的100人中,高一男生有人,高二男生有40人,
记高一男生成绩的平均数和方差分别为和;
高二男生成绩的平均数和方差分别为和,
则样本平均数为,
样本总体方差.
7.(25-26高二下·上海·阶段检测)某高中随机抽取100名学生,测得他们的身高(单位:),按照区间,,,,分组,得到样本身高的频率分布直方图(如下图所示).
(1)求身高在区间的学生人数;
(2)将身高在,,区间内的学生依次记为,,三个组,用分层抽样的方法从三个组中抽取6人.
①求从这三个组分别抽取的学生人数;
②若要从6名学生中抽取2人,求B组中至少有1人被抽中的概率.
【答案】(1)30人
(2)①3人,2人,1人;②
【分析】(1)根据频率分布直方图的概念,求出身高在区间的频率。进而根据总人数,求出这一区间的学生人数;
(2)根据分层抽样的概念和方法,分别求出这三组的人数,根据比例求出各组抽取的人数,再根据古典概率公式,求出事件的概率;
【详解】(1)设的频率为,
由频率分布直方图可知,解得.
所以身高在区间的学生人数为(人).
(2)①,,三组的人数分别为30人,20人,10人.
因此三组中每组各抽取(人),(人),(人).
②设组的3位同学为,,,组的2位同学为,,组的1位同学为,
则从6名学生中抽取2人有15种可能:
,,,,, ,,,,,,,,,.
其中组的2位学生至少有1人被抽中有9种可能:
,,,,,,,,.
所以组中至少有1人被抽中的概率为.
8.(21-22高一·全国·单元测试)随着手机和网络的普及,外卖行业得到迅速的发展.某外卖平台为了解某地区用户对其提供的服务的满意度,随机调查了40个用户,得到用户的满意度评分如下:
用户编号
评分
用户编号
评分
用户编号
评分
用户编号
评分
1
78
11
88
21
79
31
93
2
73
12
86
22
83
32
78
3
81
13
95
23
72
33
75
4
92
14
76
24
74
34
81
5
95
15
97
25
91
35
84
6
85
16
78
26
66
36
77
7
79
17
88
27
80
37
81
8
84
18
82
28
83
38
76
9
63
19
76
29
74
39
85
10
86
20
89
30
82
40
89
(1)请你估计该地区所有用户评分的25%,95%分位数;
(2)若从这40个用户中抽取一个容量为10的样本,且抽到的10个用户的评分分别为92,84,86,78,89,74,83,78,77,89,试计算这10个数据的平均数和方差;
(3)在(2)的条件下,若用户的满意度评分在内,则满意度等级为“A级”,试用样本估计总体的思想,根据所抽到的10个数据,估计该地区满意度等级为“A级”的用户所占的百分比.
(参考数据:,,)
【答案】(1)该地区所有用户评分的,分位数分别约为,
(2),
(3)
【分析】(1)这个用户评分按从小到大排列,该地区所有用户评分的第,百分位数分别为第项和第项数据的平均数,第项和第项数据的平均数, 即可求解.(2)根据已知条件, 直接利用平均数和方差公式, 即可求解.(3)评分在即内满意度等级为 “ A 级”, 样本中评分在 内的有人, 求出符合评分的人数占比, 即可求解.
【详解】(1)这40个用户评分按从小到大排列如下:63,66,72,73,74,74,75,76,76,76,77,78,78,78,79,79,80,81,81,81,82,82,83,83,84,84,85,85,86,86,88,88,89,89,91,92,93,95,95,97,
得到,,可知这40个用户评分的,分位数分别为第10项和第11项数据的平均数,第38项和第39项数据的平均数,分别为,,据此估计该地区所有用户评分的,分位数分别约为,.
(2),
.
(3)由题意知评分在,即内的满意度等级为“A级”,样本中评分在内的有5人,则可估计该地区满意度等级为“A级”的用户所占的百分比约为.
9.(25-26高三上·山东青岛·开学考试)已知样本数据的各项均不为0,这组样本数据的方差为,,样本数据的方差为.设甲:,乙:全为正数,或全为负数.则甲是乙的( )
A.充分必要条件 B.充分不必要条件 C.必要不充分条件 D.既不充分也不必要条件
【答案】A
【分析】先证明充分性,设的平均数为,的平均数为,,,因为,所以,,结合绝对值不等式得到充分性成立,再分全为正数和全是负数两种情况,得到必要性成立,得到结论.
【详解】充分性:设的平均数为,的平均数为,
,,
因为,所以,所以,
其中,故,
由绝对值不等式得,
当且仅当同号,即全为正数,或全为负数,等号成立,
故充分性成立,
必要性:若全为正数,则,,显然,
若全为负数,则,,
设的平均数为,则的平均数为,
,,
,必要性成立,
综上,甲是乙充分必要条件.
故选:A
10.(24-25高一下·山东青岛·期末)对于没有重复数据的样本,记这m个数的第k百分位数为.若在区间中的样本数据有且只有13个,则m的所有可能值的和为______.
【答案】
【分析】分是否为整数求出,根据在区间中的样本数据有且只有13个,取得的范围,然后验证可得.
【详解】不妨假设,用表示不超过的最大整数.
若为正整数,即为正整数,则是5的倍数,此时必是正整数,
则,
则在区间的数据为,
所以,解得;
若都不是正整数,则,
则在区间的数据为,
所以,则,
解得.
综上,的可能取值有.
当时,在区间内的数据有,共个数,满足题意;
当时,在区间内的数据有,共个数,不满足题意;
当时,在区间内的数据有,共个数,不满足题意;
当时,在区间内的数据有,共个数,满足题意;
当时,在区间内的数据有,共个数,满足题意;
当时,在区间内的数据有,共个数,不满足题意;
当时,在区间内的数据有,共个数,满足题意;
当时,在区间内的数据有,共个数,满足题意;
当时,在区间内的数据有,共个数,不满足题意;
当时,在区间内的数据有,共个数,不满足题意;
故的可能取值有,.
故答案为:
11.(25-26高三上·广东佛山·阶段检测)某书店内有2017本书.下面的框线图显示店内书的售价的分布.已知这些书的总售价是,而该分布的分布域是四分位数间距的4倍.
(1)求该分布的下四分位数和分布域.
(2)现书店的经理增加210本新书,如下表所示:
种类
每本书的售价
书的数目
旅游书
92$
102
小说
h$
54
漫画
k$
54
已知增加210本新书后店内所有书的平均售价至少是,且.该经理宣称增加210本新书后,书的售价的中位数小于105$.你是否同意?试解释你的答案.
【答案】(1)下四分位数为,分布域为;
(2)不同意,理由见解析.
【分析】(1)根据题图分析确定上下四分位数,结合分布域及间距的数量关系列方程求,即可得;
(2)根据已知得,进而有,再分析原中位数和新中位数的位置,进而判断新增书的位置,即可得结论.
【详解】(1)由图知,下四分位数为,上四分位数为,则四分位数的间距为,
而分布域端点值分别为,则分布域为,
由该分布的分布域是四分位数间距的4倍,则,可得,
所以下四分位数为,分布域为;
(2)由已知原本书总价为,新增本后共本,
由平均售价至少,故总售价至少,
新增书的总价至少为,
新增书的总价,
所以,且,则,所以,
由个数的中位数是第的位置,而原本书的中位数是第的位置,售价为,
由上分析,新增的本书售价均大于等于,
所以新增的本书都在原来第的位置之后,且新增之后第的位置是在原来第的位置之后加个数的位置,
所以第的位置上的书售价必大于等于,因此,不同意该经理的结论.
12.(25-26高三上·上海·开学考试)某学校有800名高中学生,其中男生512名,女生288名.按照分层抽样原则抽取了50名学生,被抽取的50名学生身高全部介于155cm和195cm之间,将测量结果按如下方式分成八组:第一组,第二组,第八组[190,195],图是频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人.
(1)求第七组的频率;
(2)通过计算得到男生身高样本平均数为,方差为17,女生身高样本平均数为163.83cm,方差为30.03.求该50名高中学生身高的样本平均数和方差,并估计该校学生身高的总体方差.(结果精确到0.01)
(3)若从身高属于第六组和第八组的所有学生中随机抽取两名学生,记他们的身高分别为,记事件,求.
【答案】(1)0.06;
(2)样本平均数、方差分别为170.02cm;43.24;该校学生总体方差为43.24;
(3).
【分析】(1)由频率分布直方图可求出第六组的频率,根据性质即可求第七组的频率;
(2)根据平均数和方差的公式直接求解即可;
(3)确定样本空间,利用古典概型概率公式求概率.
【详解】(1)根据题意可知,第六组的频率为,
则第七组的频率为;
(2)由题意,样本总量为50,其中男生样本量为32,女生样本量为18.
记男生样本为,平均数为,方差为;
记女生样本为、,平均数为,方差为,
所有数据样本平均值为,方差为.
由,
所有数据的样本平均数为.
据此可以估计该校学生身高的总体方差为43.24.
(3)第六组的人数为4,设为,
第八组的人数为,设为,
则从中随机抽取两名学生有共15种情况,
因事件发生当且仅当随机抽取的两名学生在同一组,
事件包含的基本事件为共7种情况,
.
1 / 2
学科网(北京)股份有限公司
$