专题04 统计(知识必备+9大重难题型+过关验收)(期末复习讲义)高二数学上学期沪教版
2026-01-10
|
2份
|
50页
|
760人阅读
|
30人下载
精品
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学沪教版必修第三册 |
| 年级 | 高二 |
| 章节 | 第13章 统计 |
| 类型 | 教案-讲义 |
| 知识点 | 统计 |
| 使用场景 | 同步教学-期末 |
| 学年 | 2025-2026 |
| 地区(省份) | 上海市 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 2.12 MB |
| 发布时间 | 2026-01-10 |
| 更新时间 | 2026-01-10 |
| 作者 | 宋老师数学图文制作室 |
| 品牌系列 | 上好课·考点大串讲 |
| 审核时间 | 2025-12-30 |
| 下载链接 | https://m.zxxk.com/soft/55716346.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中数学统计专题复习讲义通过表格系统梳理核心考点、复习目标与考情规律,以“统计概念-抽样方法-数据特征-实际应用”为主线构建知识脉络,用步骤分解图呈现抽样流程,用对比表格区分不同统计图表的特点与应用场景,清晰呈现重难点分布。
讲义亮点在于“情境化问题链”设计,如通过水库鱼群估计、学生成绩分析等实例,引导学生用数学眼光观察现实问题,培养数据意识与模型观念。题型涵盖基础通关、重难突破与综合拓展,分层适配不同学生,配套答题模板与易错点提示,助力教师实施精准教学,提升学生用数学语言表达现实世界的能力。
内容正文:
专题04 统计(期末复习讲义)
核心考点
复习目标
考情规律
抽样方法
理解简单随机抽样、分层抽样的核心逻辑,明确分层抽样中各层抽样比与总体占比的关系,掌握系统抽样中剔除个体时的概率均等性特点。
高频核心考点,命题多结合实际场景,考查分层抽样的计算或抽样方法的选择依据。
统计图表与数据特征
掌握频率分布表的绘制步骤,能精准解读频率分布直方图,区分并运用折线统计图。
必考考点,客观题常考折线图、直方图的识别,解答题多要求根据数据绘制频率分布表/直方图,结合平均数、方差分析数据特征。
实际应用问题
能将实际问题转化为统计问题,通过数据收集、整理、分析得出结论,为决策提供依据。
重点,命题贴近生活实际,如通过样本数据估算总体数量、分析学生成绩变化趋势等,考查数据解读与实际建模能力。
知识点01 统计中的相关概念
总体
一般地,在获取数据时,我们把所考察对象(某一项指标的数据)的全体叫作总体
个体
把组成总体的每一个考察对象叫作个体
样本
从总体中所抽取的一部分个体叫作总体的一个样本
样本容量
样本中个体的数目叫作样本容量
知识点02 简单随机抽样
1. 抽签法
用抽签法从个体个数为N的总体中抽取一个容量为k的样本的步骤:
(1)将总体中的N个个体编号;
(2)将这N个号码写在形状、大小相同的号签上;
(3)将号签放在同一箱中,并搅拌均匀;
(4)从箱中每次抽出1个号签,连续抽取k次;
(5)将总体中与抽到的号签的编号一致的k个个体取出.
2. 随机数表法
(1)相关概念
制作一个表,这个表由0,1,2,3,4,5,6,7,8,9这10个数字组成,表中任一位置出现任一数字的概率相同,且不同位置的数字之间是独立的. 这样的表称为随机数表,其中的每个数都称为“随机数”. 于是,我们只要按一定的规则从随机数表中选取号码就可以了. 这种抽样方法叫作随机数表法.
(2)用随机数表法抽取样本的步骤
①对总体中的个体编号(每个号码位数一致).
②在随机数表中任选一个数.
③从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过. 如此继续下去,直到取满为止.
④根据选定的号码抽取样本.
3. 简单随机抽样
一般地,从个体数为N的总体中逐步不放回地取出n个个体作为样本(n<N),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样. 抽签法和随机数表法都是简单随机抽样.
知识点03 分层抽样
1. 定义
一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫作分层抽样,所分成的各个部分称为“层”.
2. 步骤
(1)将总体按一定标准分层;
(2)计算各层的个体数与总体的个体数的比;
(3)按各层的个体数占总体的个体数的比确定各层应抽取的样本容量;
(4)在每一层进行抽样(可用简单随机抽样).
3. 特点
(1)适用于总体由差异明显的几部分组成的情况;
(2)按比例确定各层应抽取个体的个数;
(3)在每一层进行抽样时,可采用简单随机抽样的方法;
(4)分层抽样能充分利用已掌握的信息,使样本具有良好的代表性;
(5)分层抽样也是等可能抽样,每个个体被抽到的可能性都是,而且在每层抽样时,可以根据个体情况采用不同的抽样方法.
知识点04 百分位数
1. 一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有k%的
数据小于或等于pk,且至少有(100-k)%的数据大于或等于pk.
如果将样本数据从小到大排列成一行,那么k百分位数pk所处位置如图所示.
2. 四分位数:中位数即为50百分位数,我们也把中位数、25百分位数和75百分位数称为四分位数.
题型一 总体与样本
【例1】(25-26高二上·上海·单元测试)某出租公司在“五一”长假期间平均每天的营业额为5万元,由此可推断出5月份的总营业额约为(万元),根据所学知识,你认为这样的推断是 (选填“合理”或“不合理”).
【变式1】(25-26高二上·上海·单元测试)学校为了调查高二年级学生体重情况,随机抽取50个高二年级学生进行体重测量,这50个学生的体重是( )
A.总体 B.个体 C.样本 D.样本容量
题型二 数据的获取
【例1】(24-25高二上·上海·期末)在以下调查中,适合用普查的是( ).
A.调查某批次汽车的抗撞击能力 B.调查一批LED灯的寿命
C.调查某城市居民的食品消费结构 D.调查一个班级学生的身高情况
【变式1】(24-25高二上·上海长宁·期末)完成下列任务所获得的数据是观测数据还是实验数据 .
某旅游公司为开发新的旅游产品,调查了5000名客户对于旅游目的地的偏好.
【变式2】(24-25高二上·上海·单元测试)粮食安全是每一个国家必须高度关注的问题,在现有条件下,降雨量对粮食生产的影响是非常巨大的,某次降雨之后该地气象台播报说本次降雨量是该地有气象记录以来最大的一次,气象台获取这些数据的途径是通过 获取数据.(填“观测”或“实验”)
题型三 简单随机抽样
【例1】(23-24高二上·上海·期末)已知一个总体含有N个个体,要用简单随机抽样方法从中抽取一个个体,则在抽样过程中,每个个体被抽取的概率( )
A.变小 B.变大 C.相等 D.无法确定
【变式1】(24-25高二上·上海·月考)某工厂利用随机数表对生产的 50 个零件进行抽样测试, 先将 50 个零件进行编号, 编号分别为 01, 02, ......, 50. 从中抽取 5 个样本,下面提供随机数表的第 1 行到第 2 行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第 1 行第 7 列开始向右依次读取数据, 则得到的第5个样本编号是 ( ).
A.09 B.05 C.65 D.71
【变式2】(24-25高二上·上海黄浦·月考)某果园种植了240棵苹果树,现从中随机抽取了20棵苹果树,算得这20棵苹果树平均每棵产量为28kg,则预估该果园的苹果产量为 kg.
题型四 分层随机抽样
【例1】(22-23高二上·上海黄浦·期末)一个总体分为两层,用分层抽样方法从总体中抽取一个容量为的样本.已知层中每个个体被抽到的概率都是 ,则总体中的个体数为 .
【变式1】(22-23高二上·上海徐汇·期末)某校要从高一、高二、高三共2023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2023名学生中剔除23名,再从剩下的2000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性为 .
【变式2】(23-24高二上·上海·月考)管理人员为了了解某水库里大概有多少条鱼,拖网打捞出1000条鱼,在鱼身处打上一个不会掉落的印记,再放回水库,一个月后再次捕捞1000条鱼,发现其中有20条有印记的鱼,问:这个水库里大概有 条鱼.
题型五 频数分布表和频率分布直方图
【例1】(24-25高二上·上海黄浦·期末)已知某校高一年级所有学生的体重(单位:kg),且最大值为98,最小值为44.在制作频率分布直方图时,要对这些体重数据进行分组.若组距为5,则将数据分成 组为宜.
【例2】(25-26高二上·上海浦东新·月考)“绿水青山就是金山银山,坚持人与自然和谐共生”的理念越来越深入人心,现已形成了全民自觉参与,造福百姓的良性循环.据此,某网站推出了关于生态文明建设进展情况的调查,调查数据表明,环境治理和保护问题仍是百姓最为关心的热点.现从参与关注生态文明建设的人群中随机选出100人,并将这100人按年龄分为第1组,第2组,第3组,第4组,如图所示.
(1)求的值,并估计这组数据的平均数;
(2)现从年龄在及的人群中按分层抽样抽取5人,再从中选2人作为生态文明建设知识宣讲员,求这两人来自同一组的概率;
【变式1】(24-25高二上·上海·期末)某校抽取100名学生测量他们的身高,其山最大值为,最小值,绘制身高频率分布直方图,若组距为5,且第一组下限为,则组数为 .
【变式2】(23-24高二上·上海宝山·月考)为了让学生适应上海“3+3”的新高考模式,某校在高二期末考试中使用赋分制给等级考科目的成绩进行赋分.先按照考生原始分从高到低按比例划定A+、A、B+、B、B-、C+、C、C-、D+、D、E共5等11级,然后在相应赋分区间内利用转换公式进行赋分,A+和E级排名各占比5%,其余各级排名各占比10%.现从全年级的等级考化学成绩中随机取100名学生的原始成绩(满分100分)进行分析,其频率分布直方图如图所示:
(1)求图中的值;
(2)若采用分层抽样的方法,从原始成绩在和内的学生中共抽取6人查看他们的答题情况,再从中选取2人进行个案分析,求这2人中恰有一人原始成绩在内的概率;
(3)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的标准差(结果精确到0.1).
题型六 茎叶图
【例1】(22-23高二上·上海浦东新·期末)小明同学每天阅读数学文化相关的书籍,他每天阅读的页数分别为:4、5、4.5、5、6、8、7、5、4.5、6(单位:页).下列图形中不利于描述这些数据的是( )
A.条形图 B.茎叶图 C.散点图 D.扇形图
【例2】(2023·上海宝山·二模)如图是某班一次数学测试成绩的茎叶图(图中仅列出,的数据)和频率分布直方图,则 .
【变式1】(22-23高二上·上海闵行·期末)甲、乙两名运动员5场比赛得分的茎叶图如图所示已知甲得分的极差为32,乙得分的众数为26,则 .
【变式2】(22-23高二上·上海徐汇·期末)从本市某高中全体高二学生中抽取部分学生参加体能测试,按照测试成绩绘制茎叶图,并以,,,,为分组作出频率分布直方图,后来茎叶图受到了污损,可见部分信息如图,则a的值为 .
【变式3】(24-25高二上·上海·单元测试)某城市为了解该市甲、乙两个旅游景点的游客数量情况,随机抽取了这两个景点20天的游客人数,得到如下茎叶图:由此可估计,全年(按360天计算)中,游客人数在内时,甲景点比乙景点多 天.
甲
乙
3
2
60
3
4
7
8
6
4
2
61
1
2
5
9
8
7
3
3
0
62
1
2
4
4
6
7
5
4
3
2
1
63
3
5
6
7
9
8
7
4
64
2
4
6
题型七 估计总体的分布
【例1】(24-25高二上·上海黄浦·期末)某大型超市从一家贸易公司购进600袋白糖.为了了解这些白糖的重量情况,从中抽取了21袋白糖,称出各袋白糖的重量(单位:g)如下:
486 494 496 498 499 493 492
498 490 497 504 489 495 503
498 502 509 498 487 501 508
若设这21袋白糖的平均重量为,标准差为.
(1)求与(精确到0.1);
(2)试估计在这600袋白糖中重量位于与之间的共有多少袋?所占的百分比是多少?
【变式1】(22-23高二上·上海浦东新·期末)“二十四节气歌”是以“春、夏、秋、冬”开始的四句诗.某校高二共有学生400名,随机抽查100名学生并提问二十四节气歌,只能说出一句的有45人,能说出两句及以上的有38人,据此估计该校高二年级的400名学生中,对“二十四节气歌”一句也说不出的有 人.
【变式2】(22-23高二上·上海徐汇·期末)某校高二年级一个班有60名学生,将期中考试的数学成绩(均为整数)分成六段:[40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100),得到如图所示的频率分布直方图.
(1)求a的值;
(2)用分层抽样的方法从中抽取一个容量为的样本,则在分数段抽取的人数是多少?
题型八 估计总体的数字特征
【例1】(24-25高二上·上海长宁·期末)某校高一共有学生240人,现采用分层抽样的方法从中抽取80人进行体能测试;若这80人中有35人是男生,则该校高一男生共有 人.
【例2】(24-25高二上·上海·期末)某学校组织全校学生进行了一次“两会知识知多少”的问卷测试,已知所有学生的测试成绩均位于区间,从中随机抽取了40名学生的测试成绩,绘制得到如图所示的频率分布直方图.
(1)求图中的值,并估算这40名学生测试成绩的平均数;
(2)现学校准备利用分层随机抽样方法,从和的学生中抽取7人组成两会知识宣讲团.从选定的7人中随机抽取2人对高一同学进行宣讲,设事件为“至少有1人测试成绩位于区间”,求事件发生的概率.
【变式1】(24-25高二上·上海徐汇·期末)某高中的三个年级共有学生1000人,其中高一300人,高二340人,高三360人,该校现在要了解学生对校本课程的看法,准备从全校学生中抽取50人进行访谈,若采取分层抽样,且按年级来分层,则高一年级应抽取的人数是 .
【变式2】(24-25高二上·上海·期末)校高一年级共有学生330名,为了解该校高一年级学生的身高情况,学校采用分层随机抽样的方法抽取66名学生,其中女生32名,男生34名,测量他们的身高.
(1)该校高一学生中男、女生各有多少名?
(2)在32名女生身高的数据中,其中一个数据记录有误,错将165cm记录为156cm,由错误数据求得这32个数据的平均数为161cm,方差为23.6875,求原始数据的平均数及方差(平均数结果保留精确值,方差结果精确到0.01).
【变式3】(25-26高二上·上海·月考)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.如当临界值时,漏诊率为患病者在区间上的频率,故漏诊率
(1)当临界值时,求误诊率;
(2)设函数,当时,求的解析式,并求在区间上的最大值.
题型九 总体百分位数的估计
【例1】(25-26高三上·上海浦东新·期末)某班一次数学小测验(百分制)后,老师为了奖励同学们平时认真学习,决定给每位同学的成绩加上5分作为过程性评价奖励.加分后,与原始分数相比,不会发生改变的是( )
A.平均数 B.中位数 C.第80百分位数 D.方差
【例2】(25-26高二上·上海浦东新·月考)样本数据14,25,32,46,60的第40百分位数为 .
【例3】(25-26高二上·上海青浦·月考)某中学从甲、乙两个班中各选出15名学生参加知识竞赛,将他们的成绩(满分100分)进行统计分析,绘制成如图所示的茎叶图.已知甲班级15名学生成绩的中位数为,乙班级15名学生成绩的第60百分位数为,则
【变式1】(24-25高二上·上海金山·期末)现有一组数据:,其第70百分位数为 .
【变式2】(24-25高二上·上海·月考)某次数学考试后,随机选取14位学生的成绩,得到如下茎叶图,其中个位数部分作为“叶”,百位数和十位数作为“茎”,若该组数据的第25百分位为87,则 .
【变式3】(25-26高二上·上海杨浦·期中)甲机床一天内生产的10个零件重量(单位:g)从小到大为.
(1)求这组数据的平均数和标准差;
(2)求零件重量位于和之间的个数及所占的百分比.
【变式4】(24-25高二上·上海·期末)某工厂选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:分钟)绘制了如下茎叶图:
(1)求40名工人完成生产任务所需时间的第75百分数;
(2)为了解该工厂职工的基本信息,从工厂中抽取了100个职工的体重数据,发现全部介于45公斤到75公斤之间,现将100个体重数据分为6组:第一组,第二组,…,第六组,得到如图2所示的频率分布直方图.其中第一组有2人,第二组有13人.求与的值.
期末基础通关练(测试时间:10分钟)
1.(25-26高二上·上海浦东新·月考)已知样本数据、、、、的平均数为,方差为,则的值为( )
A. B. C. D.
2.(23-24高二上·上海·期末)某同学将观察学校柚子树生长习性作为自主研究课题,他观察了校园内6株柚子树成熟结果个数(两位数)并用茎叶图(如图所示)做了记录,则这6株柚子树成熟结果个数的中位数为( )
A.21 B.21.5 C.22 D.22.5
3.(24-25高二上·上海长宁·期末)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92583556 43890890 06482834 59741458 29778149 64608925
期末重难突破练(测试时间:10分钟)
4.(25-26高二上·上海松江·期中)某课外活动小组为研究日平均气温的变化情况,将每连续5天的日平均气温(单位: )的记录数据作为一组样本,他们得到了满足下列条件的四个样本:①平均数为3,极差为2;②中位数为7,众数为9;③众数为5,极差为6;④平均数为4,方差为2;则这四个样本中,连续5天的日平均气温记录数据均低于的样本个数至少有( )
A.1个 B.2个 C.3个 D.4个
5.(25-26高二上·上海·期末)现有甲、乙两组数据.甲组数据有6个数,其平均数为3,方差为5;乙组数据有9个数,其平均数为5,方差为3.若将这两组数据混合成一组,则新的一组数据的方差为
6.(25-26高二上·上海·月考)甲、乙两班参加了同一学科的考试,其中甲班50人,乙班40人.甲班的平均成绩为76分,方差为96分;乙班的平均成绩为85分,方差为60分.那么甲、乙两班全部90名学生的方差是 分.
7.(24-25高二上·上海长宁·期末)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
企业数
2
24
53
14
7
(1)估计这类企业中产值增长率不低于40%的企业占比;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
8.(25-26高二上·上海青浦·月考)某芯片代工厂生产甲、乙两种型号的芯片,为了解芯片的某项指标,从这两种芯片中各抽取100件进行检测,获得该项指标的频率分布直方图,如图所示:
假设数据在组内均匀分布,以样本估计总体,以事件发生的频率作为相应事件发生的概率.
(1)求频率分布直方图中的值
(2)估计乙型芯片该项指标的平均值(同一组中的数据用该组区间的中点值为代表);
(3)已知甲型芯片指标在为航天级芯片,乙型芯片指标在为航天级芯片.现分别采用分层抽样的方式,从甲型芯片指标在内取2件,乙型芯片指标在内取4件,再从这6件中任取2件,求这2件都是航天级芯片的概率.
期末综合拓展练(测试时间:15分钟)
9.(24-25高二上·上海宝山·期末)某学校为了获得该校全体高中学生的体育锻炼情况,按男、女学生的比例分别抽样调查了48名男生和27名女生的每周锻炼时间.通过计算得到男生每周锻炼时间的平均数为7.6小时,方差为7;女生每周锻炼时间的平均数为6.4小时,方差为8.
(1)若该校男生总数为1280,求该校学生总数;
(2)若所选27名女生每周锻炼时间从小到大排列后的第9至第13个数据依次为5、5.3、5.6、5.8、5.9,求所选女生样本的第40百分位数;
(3)求所有样本数据的平均数和方差(精确到0.001).
10.(24-25高二上·上海青浦·期末)为加强学生睡眠监测督导,学校对高中三个年级学生的日均睡眠时间进行调查.根据分层随机抽样法,学校在高一、高二和高三年级中共抽取了100名学生的日均睡眠时间作为样本,其中高一35人,高二33人.已知该校高三年级一共512人.
(1)学校高中三个年级一共有多少个学生?
(2)若抽取100名学生的样本极差为2,数据如下表所示(其中,n是正整数)
日均睡眠时间(小时)
8.5
9
9.5
10
学生数量
32
13
11
4
求该样本的第40百分位数.
11.(21-22高二上·上海浦东新·期末)2020年1月8日,在“不忘初心、牢记使命”主题教育总结大会上,习总书记指出:“要把学习贯彻党的创新理论作为思想武装的重中之重,同学习党史、新中国史、改革开放史、社会主义发展史结合起来.”为了提高思想认识,某校开展了“学史明鉴、牢记使命”知识竞赛活动,从950名参赛的学生中随机选取100人的成绩作为样本,得到如图所示的频率分布直方图.
(1)现将全体参赛学生成绩编号为001--950,使用附图提供的“随机数表”从第二行的第三个数开始从左往右抽,请写出前3个被抽到样本编号;
(2)求频率分布直方图中的值,并估计该校此次参赛学生成绩的平均分(同一组数据用该组区间的中点值代表).
附图:
12.(24-25高二上·上海奉贤·期中)2022年2月4日,第24届冬季奥林匹克运动会开幕式在北京国家体育场(鸟巢)举行,某调研机构为了了解人们对“奥运会”相关知识的认知程度,针对本市不同年龄和不同职业的人举办了一次“奥运会”知识竞赛,满分100分(95分及以上为认知程度高),结果认知程度高的有人,按年龄分成5组,其中第一组,第二组,第三组,第四组,第五组,得到如图所示的频率分布直方图,已知第一组有10人.现从以上各组中用分层随机抽样的方法选取20人,担任本市的“奥运会”宣传使者.
(1)若有甲(年龄38),乙(年龄40)两人已确定入选,现计划从第四组和第五组被抽到的使者中,再随机抽取2名作为组长,求甲、乙两人至少有一人被选上的概率;
(2)若第四组宣传使者的年龄的平均数与方差分别为36和,第五组宣传使者的年龄的平均数与方差分别为42和1,据此估计这人中35~45岁所有人的年龄的方差.
1 / 3
学科网(北京)股份有限公司
$
专题04 统计(期末复习讲义)
核心考点
复习目标
考情规律
抽样方法
理解简单随机抽样、分层抽样的核心逻辑,明确分层抽样中各层抽样比与总体占比的关系,掌握系统抽样中剔除个体时的概率均等性特点。
高频核心考点,命题多结合实际场景,考查分层抽样的计算或抽样方法的选择依据。
统计图表与数据特征
掌握频率分布表的绘制步骤,能精准解读频率分布直方图,区分并运用折线统计图。
必考考点,客观题常考折线图、直方图的识别,解答题多要求根据数据绘制频率分布表/直方图,结合平均数、方差分析数据特征。
实际应用问题
能将实际问题转化为统计问题,通过数据收集、整理、分析得出结论,为决策提供依据。
重点,命题贴近生活实际,如通过样本数据估算总体数量、分析学生成绩变化趋势等,考查数据解读与实际建模能力。
知识点01 统计中的相关概念
总体
一般地,在获取数据时,我们把所考察对象(某一项指标的数据)的全体叫作总体
个体
把组成总体的每一个考察对象叫作个体
样本
从总体中所抽取的一部分个体叫作总体的一个样本
样本容量
样本中个体的数目叫作样本容量
知识点02 简单随机抽样
1. 抽签法
用抽签法从个体个数为N的总体中抽取一个容量为k的样本的步骤:
(1)将总体中的N个个体编号;
(2)将这N个号码写在形状、大小相同的号签上;
(3)将号签放在同一箱中,并搅拌均匀;
(4)从箱中每次抽出1个号签,连续抽取k次;
(5)将总体中与抽到的号签的编号一致的k个个体取出.
2. 随机数表法
(1)相关概念
制作一个表,这个表由0,1,2,3,4,5,6,7,8,9这10个数字组成,表中任一位置出现任一数字的概率相同,且不同位置的数字之间是独立的. 这样的表称为随机数表,其中的每个数都称为“随机数”. 于是,我们只要按一定的规则从随机数表中选取号码就可以了. 这种抽样方法叫作随机数表法.
(2)用随机数表法抽取样本的步骤
①对总体中的个体编号(每个号码位数一致).
②在随机数表中任选一个数.
③从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过. 如此继续下去,直到取满为止.
④根据选定的号码抽取样本.
3. 简单随机抽样
一般地,从个体数为N的总体中逐步不放回地取出n个个体作为样本(n<N),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样. 抽签法和随机数表法都是简单随机抽样.
知识点03 分层抽样
1. 定义
一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫作分层抽样,所分成的各个部分称为“层”.
2. 步骤
(1)将总体按一定标准分层;
(2)计算各层的个体数与总体的个体数的比;
(3)按各层的个体数占总体的个体数的比确定各层应抽取的样本容量;
(4)在每一层进行抽样(可用简单随机抽样).
3. 特点
(1)适用于总体由差异明显的几部分组成的情况;
(2)按比例确定各层应抽取个体的个数;
(3)在每一层进行抽样时,可采用简单随机抽样的方法;
(4)分层抽样能充分利用已掌握的信息,使样本具有良好的代表性;
(5)分层抽样也是等可能抽样,每个个体被抽到的可能性都是,而且在每层抽样时,可以根据个体情况采用不同的抽样方法.
知识点04 百分位数
1. 一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有k%的
数据小于或等于pk,且至少有(100-k)%的数据大于或等于pk.
如果将样本数据从小到大排列成一行,那么k百分位数pk所处位置如图所示.
2. 四分位数:中位数即为50百分位数,我们也把中位数、25百分位数和75百分位数称为四分位数.
题型一 总体与样本
【例1】(25-26高二上·上海·单元测试)某出租公司在“五一”长假期间平均每天的营业额为5万元,由此可推断出5月份的总营业额约为(万元),根据所学知识,你认为这样的推断是 (选填“合理”或“不合理”).
【答案】不合理
【知识点】总体与样本
【分析】根据样本的选择需要具有代表性和普遍性来分析判断.
【详解】在“五一”长假期间,由于假期的影响,出租车公司的营业额通常会比平时高。
因此,仅凭“五一”长假期间的营业额来推断整个5月份的营业额是不准确的。
这是因为“五一”长假的营业额受到节假日的特殊影响,而5月份的其他时间(非节假日)的营业额可能与长假期间的营业额有较大差异。
此外,样本的选择需要具有代表性和普遍性,而“五一”长假期间的营业额并不能代表整个月份的营业额情况。
因此,基于“五一”长假期间的营业额来推断整个5月份的营业额是不合理的.
故答案为:不合理
【变式1】(25-26高二上·上海·单元测试)学校为了调查高二年级学生体重情况,随机抽取50个高二年级学生进行体重测量,这50个学生的体重是( )
A.总体 B.个体 C.样本 D.样本容量
【答案】C
【知识点】总体与样本
【分析】根据总体,个体,样本,样本容量的定义分析判断.
【详解】从高二年级随机抽取50个高二年级学生进行体重测量,
则这50个学生的体重组成一个样本.
故选:C
题型二 数据的获取
【例1】(24-25高二上·上海·期末)在以下调查中,适合用普查的是( ).
A.调查某批次汽车的抗撞击能力 B.调查一批LED灯的寿命
C.调查某城市居民的食品消费结构 D.调查一个班级学生的身高情况
【答案】D
【知识点】普查与抽样的合理选择
【分析】根据普查的概念判断即可;
【详解】A选项,每个批次生产的汽车的数量非常多,且调查汽车抗重击能力具有破坏性,不适合使用普查,应使用抽样调查;
B选项,调查一批LED灯的寿命具有破坏性,不宜使用普查,应使用抽样调查;
C选项,某城市居民数量非常多,不适合使用全面普查,应使用抽样调查;
D选项,一个班级学生的身高情况,人数较少,适合用普查;
故选:D
【变式1】(24-25高二上·上海长宁·期末)完成下列任务所获得的数据是观测数据还是实验数据 .
某旅游公司为开发新的旅游产品,调查了5000名客户对于旅游目的地的偏好.
【答案】观测数据
【知识点】普查与抽样的定义辨析
【分析】根据观测数据和实验数据的定义结合题意分析判断即可
【详解】由题意可知是通过调查观测得到的数据,所以是观测数据.
故答案为:观测数据
【变式2】(24-25高二上·上海·单元测试)粮食安全是每一个国家必须高度关注的问题,在现有条件下,降雨量对粮食生产的影响是非常巨大的,某次降雨之后该地气象台播报说本次降雨量是该地有气象记录以来最大的一次,气象台获取这些数据的途径是通过 获取数据.(填“观测”或“实验”)
【答案】观测
故答案为:观测
题型三 简单随机抽样
【例1】(23-24高二上·上海·期末)已知一个总体含有N个个体,要用简单随机抽样方法从中抽取一个个体,则在抽样过程中,每个个体被抽取的概率( )
A.变小 B.变大 C.相等 D.无法确定
【答案】C
【知识点】简单随机抽样的特征及适用条件
【分析】由简单随机抽样的定义可知每个个体被抽取的概率相等.
【详解】一个总体含有N个个体,要用简单随机抽样方法从中抽取一个个体,
则在抽样过程中,每个个体被抽取的概率为.
故选:C.
【变式1】(24-25高二上·上海·月考)某工厂利用随机数表对生产的 50 个零件进行抽样测试, 先将 50 个零件进行编号, 编号分别为 01, 02, ......, 50. 从中抽取 5 个样本,下面提供随机数表的第 1 行到第 2 行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第 1 行第 7 列开始向右依次读取数据, 则得到的第5个样本编号是 ( ).
A.09 B.05 C.65 D.71
【答案】A
【知识点】随机数表法
【分析】根据随机数表的读法,注意除去重复的,得到第5组符合要求的编码.
【详解】第一行第7列为3,依次往右读,37,14,05,11,09.
09为第5个样本编号,
故选:A
【变式2】(24-25高二上·上海黄浦·月考)某果园种植了240棵苹果树,现从中随机抽取了20棵苹果树,算得这20棵苹果树平均每棵产量为28kg,则预估该果园的苹果产量为 kg.
【答案】6720
【知识点】简单随机抽样估计总体
【分析】将样本均值视为总体均值,即可估计果园的苹果产量.
【详解】将样本均值视为总体均值,故预估该果园的苹果产量为kg.
故答案为:
题型四 分层随机抽样
【例1】(22-23高二上·上海黄浦·期末)一个总体分为两层,用分层抽样方法从总体中抽取一个容量为的样本.已知层中每个个体被抽到的概率都是 ,则总体中的个体数为 .
【答案】
【知识点】分层抽样的概率
【分析】根据分层抽样每个个体抽到的概率相等,即可求出结论
【详解】因为用分层抽样方法从总体中抽取一个容量为的样本.
由层中每个个体被抽到的概率都为 ,知道在抽样过程中每个个体被抽到的概率是,
所以总体中的个体数为.
故答案为:.
【变式1】(22-23高二上·上海徐汇·期末)某校要从高一、高二、高三共2023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2023名学生中剔除23名,再从剩下的2000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性为 .
【答案】
【知识点】简单随机抽样的概率、分层抽样的特征及适用条件
【分析】应用随机抽样定义,每各个体被抽到的概率相等求解即可.
【详解】先用简单随机抽样的方法从2023名学生中剔除23名,每各个体被抽到的概率相等,
再从剩下的2000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性为
故答案为:
【变式2】(23-24高二上·上海·月考)管理人员为了了解某水库里大概有多少条鱼,拖网打捞出1000条鱼,在鱼身处打上一个不会掉落的印记,再放回水库,一个月后再次捕捞1000条鱼,发现其中有20条有印记的鱼,问:这个水库里大概有 条鱼.
【答案】
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】设这个水库里大概有条鱼,利用等比例性质求即可.
【详解】令这个水库里大概有条鱼,由题意有,可得条.
故答案为:
题型五 频数分布表和频率分布直方图
【例1】(24-25高二上·上海黄浦·期末)已知某校高一年级所有学生的体重(单位:kg),且最大值为98,最小值为44.在制作频率分布直方图时,要对这些体重数据进行分组.若组距为5,则将数据分成 组为宜.
【答案】
【知识点】绘制频率分布直方图
【分析】计算出极差,即可得解.
【详解】因为最大值为98,最小值为44,则,
又组距为5,则将数据分成组.
故答案为:
【例2】(25-26高二上·上海浦东新·月考)“绿水青山就是金山银山,坚持人与自然和谐共生”的理念越来越深入人心,现已形成了全民自觉参与,造福百姓的良性循环.据此,某网站推出了关于生态文明建设进展情况的调查,调查数据表明,环境治理和保护问题仍是百姓最为关心的热点.现从参与关注生态文明建设的人群中随机选出100人,并将这100人按年龄分为第1组,第2组,第3组,第4组,如图所示.
(1)求的值,并估计这组数据的平均数;
(2)现从年龄在及的人群中按分层抽样抽取5人,再从中选2人作为生态文明建设知识宣讲员,求这两人来自同一组的概率;
【答案】(1),平均数是
(2)
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、计算古典概型问题的概率
【分析】(1)根据直方图中小长方形的面积和为1求解,然后由平均数的定义计算即可;
(2)根据分层抽样确定两组抽取的人数,然后根据列举法求解.
【详解】(1)由题知,,解得,
平均数为:;
(2)和两组的频率之比为,
由于共抽取5人,根据分层抽样性质可知在和两组分别抽取2人,3人,
假设来自的2人编号为,来自的3人编号为,
这5人中抽取2人,所有的可能是共10种情形,
2人来自同一组共有4种情形如下,
根据古典概型的计算公式,两人来自同一组的概率是.
【变式1】(24-25高二上·上海·期末)某校抽取100名学生测量他们的身高,其山最大值为,最小值,绘制身高频率分布直方图,若组距为5,且第一组下限为,则组数为 .
【答案】7
【知识点】绘制频率分布直方图
【分析】根据组距即可求解.
【详解】,则组数为7.
故答案为:7.
【变式2】(23-24高二上·上海宝山·月考)为了让学生适应上海“3+3”的新高考模式,某校在高二期末考试中使用赋分制给等级考科目的成绩进行赋分.先按照考生原始分从高到低按比例划定A+、A、B+、B、B-、C+、C、C-、D+、D、E共5等11级,然后在相应赋分区间内利用转换公式进行赋分,A+和E级排名各占比5%,其余各级排名各占比10%.现从全年级的等级考化学成绩中随机取100名学生的原始成绩(满分100分)进行分析,其频率分布直方图如图所示:
(1)求图中的值;
(2)若采用分层抽样的方法,从原始成绩在和内的学生中共抽取6人查看他们的答题情况,再从中选取2人进行个案分析,求这2人中恰有一人原始成绩在内的概率;
(3)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的标准差(结果精确到0.1).
【答案】(1)0.03
(2)
(3),
【知识点】计算古典概型问题的概率、估计总体的方差、标准差、计算几个数的平均数、补全频率分布直方图
【分析】(1)借助频率之和为1即可得;
(2)根据分层抽样,计算出每个区间中的人数,结合概率公式即可得;
(3)借助平均数、方差与标准差的定义计算即可.
【详解】(1),解得;
(2)由原始分在和中的频率之比为,
故抽取的6人中,原始分在中的有人,记为、,
原始分在中的有人,记为、、、,
则从人中抽取人所有可能的结果有:
,,,,,,,,
,,,,,,,
共个基本事件,
其中抽取这2人中恰有一人原始成绩在内的结果有,
,,,,,,,,
共个基本事件,
故这2人中恰有一人原始成绩在内的概率;
(3),
,
故其估计值为.
题型六 茎叶图
【例1】(22-23高二上·上海浦东新·期末)小明同学每天阅读数学文化相关的书籍,他每天阅读的页数分别为:4、5、4.5、5、6、8、7、5、4.5、6(单位:页).下列图形中不利于描述这些数据的是( )
A.条形图 B.茎叶图 C.散点图 D.扇形图
【答案】C
【知识点】根据条形统计图解决实际问题、根据扇形统计图解决实际问题、茎叶图的优缺点与适用对象
【分析】根据相关图的特征理解判断.
【详解】条形图:是用宽度相同的条形的高度(或长度)表示数据的频数,故符合题意;
茎叶图:即可以保留原始数据又可以方便记录数据,故符合题意;
散点图:用两组数据构成多个坐标点,通常用于比较跨类别的成对数据,不符合题意;
扇形图:是用整个圆表示总体,用圆内各个扇形的大小表示各个部分占总体的百分数,扇形图可以容易看出各个部分所占总体的比例,故符合题意;
故选:C.
【例2】(2023·上海宝山·二模)如图是某班一次数学测试成绩的茎叶图(图中仅列出,的数据)和频率分布直方图,则 .
【答案】
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、茎叶图的优缺点与适用对象
【分析】根据茎叶图可得相应的频数,根据频率分布直方图可得相应的频率,根据频率与频数之间的关系列式求解.
【详解】由茎叶图可知:,的频数分别为5,2;
由频率分布直方图可得:每组的频率依次为,
设样本容量为,
则,解得,
故.
故答案为:.
【变式1】(22-23高二上·上海闵行·期末)甲、乙两名运动员5场比赛得分的茎叶图如图所示已知甲得分的极差为32,乙得分的众数为26,则 .
【答案】
【知识点】补全茎叶图中的数据、由茎叶图计算众数、计算几个数据的极差、方差、标准差
【分析】根据茎叶图,以及极差和众数的定义,即可求解.
【详解】由茎叶图可知,甲的最低得分为6分,由甲得分的极差为32,可知,甲的最高得分为,所以的值为8,
乙得分的众数为26,所以的值为6,
所以.
故答案为:
【变式2】(22-23高二上·上海徐汇·期末)从本市某高中全体高二学生中抽取部分学生参加体能测试,按照测试成绩绘制茎叶图,并以,,,,为分组作出频率分布直方图,后来茎叶图受到了污损,可见部分信息如图,则a的值为 .
【答案】
【知识点】补全频率分布直方图、补全茎叶图中的数据
【分析】根据频率分布图可得组内有2个数据.结合茎叶图和频率分布直方图可知样本容量,即可得出组内的数据有4个,进而求出a的值.
【详解】由频率分布直方图可得,组内数据的频率等于组内数据的频率,所以组内有2个数据.
设样本容量为,则,所以.
所以组内的数据有,所以组内数据的频率等于,所以.
故答案为:.
【变式3】(24-25高二上·上海·单元测试)某城市为了解该市甲、乙两个旅游景点的游客数量情况,随机抽取了这两个景点20天的游客人数,得到如下茎叶图:由此可估计,全年(按360天计算)中,游客人数在内时,甲景点比乙景点多 天.
甲
乙
3
2
60
3
4
7
8
6
4
2
61
1
2
5
9
8
7
3
3
0
62
1
2
4
4
6
7
5
4
3
2
1
63
3
5
6
7
9
8
7
4
64
2
4
6
【答案】72
【知识点】观察茎叶图比较数据的特征
【分析】根据给定的茎叶图,得到游客人数在内时,甲景点共有7天,乙景点共有3天,进而求得全年中,甲景点比乙景点多的天数,得到答案.
【详解】由给定的茎叶图知,在随机抽取了这两个景点20天的游客人数中,
游客人数在内时,甲景点共有7天,乙景点共有3天,
所以在全年中,游客人数在内时,甲景点比乙景点多天.
故答案为:
题型七 估计总体的分布
【例1】(24-25高二上·上海黄浦·期末)某大型超市从一家贸易公司购进600袋白糖.为了了解这些白糖的重量情况,从中抽取了21袋白糖,称出各袋白糖的重量(单位:g)如下:
486 494 496 498 499 493 492
498 490 497 504 489 495 503
498 502 509 498 487 501 508
若设这21袋白糖的平均重量为,标准差为.
(1)求与(精确到0.1);
(2)试估计在这600袋白糖中重量位于与之间的共有多少袋?所占的百分比是多少?
【答案】(1),
(2)400袋,
【知识点】计算频率、计算几个数据的极差、方差、标准差、计算几个数的平均数
【分析】(1)根据均值定义计算均值,根据方差公式计算出方差,然后得标准差;
(2)直接计数即可得,然后计算所占百分比即可.
【详解】(1)根据题意,,
.
(2)质量位于与之间等于在区间上的白糖的袋数,共有14袋,所占的百分比为.
由此估计600袋白糖中质量位于与之间的共有袋,所占的百分比为.
【变式1】(22-23高二上·上海浦东新·期末)“二十四节气歌”是以“春、夏、秋、冬”开始的四句诗.某校高二共有学生400名,随机抽查100名学生并提问二十四节气歌,只能说出一句的有45人,能说出两句及以上的有38人,据此估计该校高二年级的400名学生中,对“二十四节气歌”一句也说不出的有 人.
【答案】
【知识点】简单随机抽样估计总体
【分析】根据题意可知,随机抽查比例是,算出被抽查的100名学生中对“二十四节气歌”一句也说不出的人数,按比例计算即可得出结果.
【详解】由题意可知,随机抽查100名学生中有人一句也说不出,
又抽查比例为,
所以,该校高二年级的400名学生中共有人对“二十四节气歌”一句也说不出.
故答案为:
【变式2】(22-23高二上·上海徐汇·期末)某校高二年级一个班有60名学生,将期中考试的数学成绩(均为整数)分成六段:[40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100),得到如图所示的频率分布直方图.
(1)求a的值;
(2)用分层抽样的方法从中抽取一个容量为的样本,则在分数段抽取的人数是多少?
【答案】(1)
(2)
【知识点】抽样比、样本总量、各层总数、总体容量的计算、补全频率分布直方图
【分析】(1)根据频率之和为计算即可;
(2)根据分层抽样的定义计算即可.
【详解】(1)由题意,
解得;
(2)在分数段抽取的人数为人.
题型八 估计总体的数字特征
【例1】(24-25高二上·上海长宁·期末)某校高一共有学生240人,现采用分层抽样的方法从中抽取80人进行体能测试;若这80人中有35人是男生,则该校高一男生共有 人.
【答案】105
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】根据给定条件,求出分层抽样的抽样比,进而求得答案.
【详解】依题意,分层抽样的抽样比为:,所以该校男生的人数为:.
故答案为:105
【例2】(24-25高二上·上海·期末)某学校组织全校学生进行了一次“两会知识知多少”的问卷测试,已知所有学生的测试成绩均位于区间,从中随机抽取了40名学生的测试成绩,绘制得到如图所示的频率分布直方图.
(1)求图中的值,并估算这40名学生测试成绩的平均数;
(2)现学校准备利用分层随机抽样方法,从和的学生中抽取7人组成两会知识宣讲团.从选定的7人中随机抽取2人对高一同学进行宣讲,设事件为“至少有1人测试成绩位于区间”,求事件发生的概率.
【答案】(1);
(2)
【知识点】计算古典概型问题的概率、由频率分布直方图估计平均数、由频率分布直方图计算频率、频数、样本容量、总体容量、抽样比、样本总量、各层总数、总体容量的计算
【分析】(1)根据频率分布直方图中所有小矩形的面积之和等于1列方程,可得实数的值,进而求平均数;
(2)根据频率分布直方图得比例抽样,列出7人中随机抽取2人的21种情况,确定至少有1人测试成绩位于区间有11种,即可得解.
【详解】(1)根据题意,,解得,
所以这40名学生测试成绩的平均数为.
(2)由频率分布直方图,和这两组的频率之比为,
故应从学生中抽取的学生人数为人,
从学生中抽取的学生人数为人,
设从学生中抽取的5人为,从学生中抽取的2人为,
则这个试验的样本空间为,
故,
又,则,
所以事件的概率为.
【变式1】(24-25高二上·上海徐汇·期末)某高中的三个年级共有学生1000人,其中高一300人,高二340人,高三360人,该校现在要了解学生对校本课程的看法,准备从全校学生中抽取50人进行访谈,若采取分层抽样,且按年级来分层,则高一年级应抽取的人数是 .
【答案】
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】确定抽样比,即可求解;
【详解】由题意可知抽样比为:,
所以高一年级应抽取的人数是,
故答案为:
【变式2】(24-25高二上·上海·期末)校高一年级共有学生330名,为了解该校高一年级学生的身高情况,学校采用分层随机抽样的方法抽取66名学生,其中女生32名,男生34名,测量他们的身高.
(1)该校高一学生中男、女生各有多少名?
(2)在32名女生身高的数据中,其中一个数据记录有误,错将165cm记录为156cm,由错误数据求得这32个数据的平均数为161cm,方差为23.6875,求原始数据的平均数及方差(平均数结果保留精确值,方差结果精确到0.01).
【答案】(1)男生共有名,女生共有名.
(2)原始数据的平均数(cm),方差
【知识点】计算几个数据的极差、方差、标准差、抽样比、样本总量、各层总数、总体容量的计算
【分析】(1)根据分层抽样的步骤,由题中条件,可直接得出结果;
(2)先设原始的32个数据为,根据错误数据的平均数与原始数据平均数之间关系,求出原始数据的平均数;根据错误数据的方差与原始数据的方差之间关系,可求出原始数据的方差.
【详解】(1)该校高一学生中,男生共有名,
女生共有名.
(2)设原始的32个数据为,其中,
由错误数据的平均数,
得原始数据的平均数(cm).
由,
得,
故.
【变式3】(25-26高二上·上海·月考)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.如当临界值时,漏诊率为患病者在区间上的频率,故漏诊率
(1)当临界值时,求误诊率;
(2)设函数,当时,求的解析式,并求在区间上的最大值.
【答案】(1)3.5%
(2),在区间上的最大值为0.07.
【知识点】分段函数模型的应用、由频率分布直方图计算频率、频数、样本容量、总体容量、频率分布直方图的实际应用
【分析】(1)根据频率分布直方图的概率计算,可得答案;
(2)由题意可得函数解析式,根据分段函数的单调性,可得答案.
【详解】(1)依题意.
(2)当时,
,
当时,;
当时,
,
当时,,
所以,在区间上的最大值为0.07.
题型九 总体百分位数的估计
【例1】(25-26高三上·上海浦东新·期末)某班一次数学小测验(百分制)后,老师为了奖励同学们平时认真学习,决定给每位同学的成绩加上5分作为过程性评价奖励.加分后,与原始分数相比,不会发生改变的是( )
A.平均数 B.中位数 C.第80百分位数 D.方差
【答案】D
【知识点】计算几个数的中位数、计算几个数的平均数、计算几个数据的极差、方差、标准差、总体百分位数的估计
【分析】根据平均值、中位数、百分位数的概念判断ABC,根据方差性质判断D.
【详解】加分后,与原始分数相比,平均值,中位数,第80百分位数的数值都会发生改变,
但根据方差的性质,一组数据同时加上相同的数后,方差大小不变.
故选:D.
【例2】(25-26高二上·上海浦东新·月考)样本数据14,25,32,46,60的第40百分位数为 .
【答案】
【知识点】总体百分位数的估计
【分析】根据百分位数定义计算求解.
【详解】因为,所以样本数据14,25,32,46,60的第40百分位数为.
故答案为:.
【例3】(25-26高二上·上海青浦·月考)某中学从甲、乙两个班中各选出15名学生参加知识竞赛,将他们的成绩(满分100分)进行统计分析,绘制成如图所示的茎叶图.已知甲班级15名学生成绩的中位数为,乙班级15名学生成绩的第60百分位数为,则
【答案】
【知识点】由茎叶图计算中位数、总体百分位数的估计
【分析】将两个班级的成绩从小到大进行排列,再根据中位数和百分位数的概念求出即可.
【详解】甲班级学生成绩为:,
则;
乙班级学生成绩为:,
因为,所以,
故.
故答案为:
【变式1】(24-25高二上·上海金山·期末)现有一组数据:,其第70百分位数为 .
【答案】10
【知识点】总体百分位数的估计
【分析】根据百分位数定义计算即可.
【详解】因为,从小到大排列数据:,向上取整取第6位数为10.
故答案为:10.
【变式2】(24-25高二上·上海·月考)某次数学考试后,随机选取14位学生的成绩,得到如下茎叶图,其中个位数部分作为“叶”,百位数和十位数作为“茎”,若该组数据的第25百分位为87,则 .
【答案】7
【知识点】观察茎叶图比较数据的特征、总体百分位数的估计
【分析】根据百分位数计算方法,结合茎叶图可得.
【详解】由题意知,则第四位数为87,结合茎叶图可知.
故答案为:7
【变式3】(25-26高二上·上海杨浦·期中)甲机床一天内生产的10个零件重量(单位:g)从小到大为.
(1)求这组数据的平均数和标准差;
(2)求零件重量位于和之间的个数及所占的百分比.
【答案】(1),
(2)6个,
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、总体百分位数的估计
【分析】(1)利用平均数公式求解平均数,利用标准差公式求解标准差即可;
(2)结合题意求出和,再求出其中的零件个数和百分比即可.
【详解】(1)由题意可得,
标准差为:
.
(2)由题得,,
则零件重量位于和之间的有,共6个,
可得所占的百分比是.
【变式4】(24-25高二上·上海·期末)某工厂选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:分钟)绘制了如下茎叶图:
(1)求40名工人完成生产任务所需时间的第75百分数;
(2)为了解该工厂职工的基本信息,从工厂中抽取了100个职工的体重数据,发现全部介于45公斤到75公斤之间,现将100个体重数据分为6组:第一组,第二组,…,第六组,得到如图2所示的频率分布直方图.其中第一组有2人,第二组有13人.求与的值.
【答案】(1)
(2)
【知识点】总体百分位数的估计、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】(1)按照求百分数的计算步骤计算即可;
(2)据直方图面积为1的性质及第一组第二组的人数建立方程组,解出,进而得解.
【详解】(1)40名工人完成生产任务所需时间按从小到大排列为: ,因为,
所以第75百分数为;
(2)依题意,则,
又因为,所以,
因为,所以,
所以,
所以.
期末基础通关练(测试时间:10分钟)
1.(25-26高二上·上海浦东新·月考)已知样本数据、、、、的平均数为,方差为,则的值为( )
A. B. C. D.
【答案】D
【知识点】根据平均数求参数、根据方差、标准差求参数
【分析】利用平均数公式可得出的值,利用方差公式可得出的值,结合平方关系可求得的值.
【详解】由平均数公式可得,可得,
由方差公式可得,
整理可得,即,所以,
因为,所以,
故.
故选:D.
2.(23-24高二上·上海·期末)某同学将观察学校柚子树生长习性作为自主研究课题,他观察了校园内6株柚子树成熟结果个数(两位数)并用茎叶图(如图所示)做了记录,则这6株柚子树成熟结果个数的中位数为( )
A.21 B.21.5 C.22 D.22.5
【答案】B
【知识点】由茎叶图计算中位数
【分析】利用中位数的定义,结合茎叶图列式计算即得.
【详解】由茎叶图知,这6株柚子树成熟结果个数的中位数为.
故选:B
3.(24-25高二上·上海长宁·期末)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92583556 43890890 06482834 59741458 29778149 64608925
【答案】14
【知识点】随机数表法
【分析】根据随机数表及其选取方法依次取到第6个数即可.
【详解】由题意可知,符合题意的编号依次为01,17,09,08,06,14,
故选出来的第6支水笔的编号为14.
故答案为:14
期末重难突破练(测试时间:10分钟)
4.(25-26高二上·上海松江·期中)某课外活动小组为研究日平均气温的变化情况,将每连续5天的日平均气温(单位: )的记录数据作为一组样本,他们得到了满足下列条件的四个样本:①平均数为3,极差为2;②中位数为7,众数为9;③众数为5,极差为6;④平均数为4,方差为2;则这四个样本中,连续5天的日平均气温记录数据均低于的样本个数至少有( )
A.1个 B.2个 C.3个 D.4个
【答案】C
【知识点】用平均数的代表意义解决实际问题、计算几个数据的极差、方差、标准差
【分析】将天数据从小到大排序为:,对于①,由平均数为3得,又极差为2,则,可推导,与平均值矛盾;对于②,根据中位数,纵数推导即可;对于③,根据题意可推导第天超过10即可判断;对于④,根据均值方差推导即可判断.
【详解】设“连续5天的日平均温度均低于”,将天数据从小到大排序为:,
①选项,,,若,则,
与平均数为矛盾,所以①选项正确;
②选项,中位数是,众数是,所以将数据从小到大排序后,第3个数是,
第个数为,所以个数据都小于,所以②选项正确;
③选项,众数是,极差为,如,第天超过,不符合,所以③选项错误;
④选项,,
,,
若,则,矛盾,所以④选项正确;
故选:C.
5.(25-26高二上·上海·期末)现有甲、乙两组数据.甲组数据有6个数,其平均数为3,方差为5;乙组数据有9个数,其平均数为5,方差为3.若将这两组数据混合成一组,则新的一组数据的方差为
【答案】
【知识点】计算几个数据的极差、方差、标准差
【分析】根据题意,混合数据的平均数和方差的计算公式,准确计算,即可求解.
【详解】设甲、乙组平均数分别为,方差分别为,
设两组数据混合成一组的平均数为,方差为,则,,,
则,
故答案为:.
6.(25-26高二上·上海·月考)甲、乙两班参加了同一学科的考试,其中甲班50人,乙班40人.甲班的平均成绩为76分,方差为96分;乙班的平均成绩为85分,方差为60分.那么甲、乙两班全部90名学生的方差是 分.
【答案】
【知识点】计算几个数据的极差、方差、标准差
【分析】根据方差公式求解即可.
【详解】设甲班50人的成绩为,则其平均成绩,
设乙班40人的成绩为,则其平均成绩,
则甲乙两班全部90名学生的平均成绩为;
设甲班50人成绩的方差为,所以
则,
设乙班40人成绩的方差为,则,
设甲乙两班全部90人成绩的方差为,则
故答案为:.
7.(24-25高二上·上海长宁·期末)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
企业数
2
24
53
14
7
(1)估计这类企业中产值增长率不低于40%的企业占比;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
【答案】(1);
(2)平均数与标准差的估计值分别为0.30,0.17.
【知识点】根据频率分布表解决实际问题、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】(1)根据频数分布表中的数据计算出所调查的100个企业中产值增长率不低于的企业占比,从而可估计出估计这类企业中产值增长率不低于40%的企业占比;
(2)根据平均数与标准差的定义结合表中的数据求解即可.
【详解】(1)根据产值增长率频数表得,所调查的100个企业中产值增长率不低于的企业为:,
用样本频率分布估计总体分布得这类企业中产值增长率不低于的企业比例为.
(2)企业产值增长率的平均数
,
产值增长率的方差
,
产值增长率的标准差,
这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
8.(25-26高二上·上海青浦·月考)某芯片代工厂生产甲、乙两种型号的芯片,为了解芯片的某项指标,从这两种芯片中各抽取100件进行检测,获得该项指标的频率分布直方图,如图所示:
假设数据在组内均匀分布,以样本估计总体,以事件发生的频率作为相应事件发生的概率.
(1)求频率分布直方图中的值
(2)估计乙型芯片该项指标的平均值(同一组中的数据用该组区间的中点值为代表);
(3)已知甲型芯片指标在为航天级芯片,乙型芯片指标在为航天级芯片.现分别采用分层抽样的方式,从甲型芯片指标在内取2件,乙型芯片指标在内取4件,再从这6件中任取2件,求这2件都是航天级芯片的概率.
【答案】(1)
(2)
(3)
【知识点】计算古典概型问题的概率、由频率分布直方图估计平均数、补全频率分布直方图
【分析】(1)由频率和为1求出的值.
(2)根据平均数公式求出平均值.
(3)根据条件列举样本容量和样本点的方法,利用古典概型概率公式求解即可.
【详解】(1)由题意得,解得.
(2)由频率分布直方图得乙型芯片该项指标的平均值:
.
(3)由甲型芯片的频率分布直方图可知指标在和的频率相同,
根据分层抽样得,来自甲型芯片指标在和的各1件,分别记为和,
由乙型芯片的频率分布直方图可知指标在和的频率之比为,
所以根据分层抽样得,来自乙型芯片指标在和的分别为3件和1件,分别记为和,
从中任取2件,样本空间可记为:,
共15个,
记事件:这2件都是航天级芯片,则共1个,
所以.
期末综合拓展练(测试时间:15分钟)
9.(24-25高二上·上海宝山·期末)某学校为了获得该校全体高中学生的体育锻炼情况,按男、女学生的比例分别抽样调查了48名男生和27名女生的每周锻炼时间.通过计算得到男生每周锻炼时间的平均数为7.6小时,方差为7;女生每周锻炼时间的平均数为6.4小时,方差为8.
(1)若该校男生总数为1280,求该校学生总数;
(2)若所选27名女生每周锻炼时间从小到大排列后的第9至第13个数据依次为5、5.3、5.6、5.8、5.9,求所选女生样本的第40百分位数;
(3)求所有样本数据的平均数和方差(精确到0.001).
【答案】(1)2000;
(2)5.6;
(3)平均数为7.168,方差为7.692.
【知识点】抽样比、样本总量、各层总数、总体容量的计算、计算几个数的平均数、计算几个数据的极差、方差、标准差、总体百分位数的估计
【详解】(1)设该校学生总数为,依题意,,解得,
所以该校学生总数为2000.
(2)由,得所选女生样本的第40百分位数为第11个数5.6.
(3)所有样本数据的平均数;
所有样本数据的方差为.
10.(24-25高二上·上海青浦·期末)为加强学生睡眠监测督导,学校对高中三个年级学生的日均睡眠时间进行调查.根据分层随机抽样法,学校在高一、高二和高三年级中共抽取了100名学生的日均睡眠时间作为样本,其中高一35人,高二33人.已知该校高三年级一共512人.
(1)学校高中三个年级一共有多少个学生?
(2)若抽取100名学生的样本极差为2,数据如下表所示(其中,n是正整数)
日均睡眠时间(小时)
8.5
9
9.5
10
学生数量
32
13
11
4
求该样本的第40百分位数.
【答案】(1)1600
(2)8.25小时
【知识点】抽样比、样本总量、各层总数、总体容量的计算、总体百分位数的估计
【分析】根据分层抽样,按比例抽取即可得到答案.
根据极差可得,再结合学生总数量为100,可求出,再根据求第百分位数的方法即可求得.
【详解】(1)设学校高中三个年级一共有个学生,
因为采用分层抽样法抽取一个容量为100的样本,
在高一年级抽取了35人,高二年级抽取了33人,
所以高三抽取的人数为:人,
又因为高三年级一共512人,所以有:,解得.
所以学校高中三个年级一共有1600个学生.
(2)因为抽取100名学生的样本极差为2,,
所以,
又因为,
所以样本的第40百分位数为:(小时).
11.(21-22高二上·上海浦东新·期末)2020年1月8日,在“不忘初心、牢记使命”主题教育总结大会上,习总书记指出:“要把学习贯彻党的创新理论作为思想武装的重中之重,同学习党史、新中国史、改革开放史、社会主义发展史结合起来.”为了提高思想认识,某校开展了“学史明鉴、牢记使命”知识竞赛活动,从950名参赛的学生中随机选取100人的成绩作为样本,得到如图所示的频率分布直方图.
(1)现将全体参赛学生成绩编号为001--950,使用附图提供的“随机数表”从第二行的第三个数开始从左往右抽,请写出前3个被抽到样本编号;
(2)求频率分布直方图中的值,并估计该校此次参赛学生成绩的平均分(同一组数据用该组区间的中点值代表).
附图:
【答案】(1)580;438;908
(2),
【知识点】随机数表法、由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数
【分析】(1)按照题目要求从给到的“随机数表”中从第二行的第三个数开始从左往右抽,每3个数字合为一个编号,需注意抽取的编号需要在成绩编号001—950的范围内;
(2)利用频率分布直方图的概率总和为1可计算的值,然后按照频率分布直方图中平均数的计算公式即可完成求解。
【详解】(1)从给到的“随机数表”中从第二行的第三个数开始从左往右抽,依次是580,956,438,908,其中956不在给到的成绩编号001—950的范围内,故去掉,因此,前3个被抽到样本编号580,438,908;
(2)由题意可知:,解得;
有频率分布直方图的平均数为:
,
故该校此次参赛学生成绩估计的平均分为71分.
12.(24-25高二上·上海奉贤·期中)2022年2月4日,第24届冬季奥林匹克运动会开幕式在北京国家体育场(鸟巢)举行,某调研机构为了了解人们对“奥运会”相关知识的认知程度,针对本市不同年龄和不同职业的人举办了一次“奥运会”知识竞赛,满分100分(95分及以上为认知程度高),结果认知程度高的有人,按年龄分成5组,其中第一组,第二组,第三组,第四组,第五组,得到如图所示的频率分布直方图,已知第一组有10人.现从以上各组中用分层随机抽样的方法选取20人,担任本市的“奥运会”宣传使者.
(1)若有甲(年龄38),乙(年龄40)两人已确定入选,现计划从第四组和第五组被抽到的使者中,再随机抽取2名作为组长,求甲、乙两人至少有一人被选上的概率;
(2)若第四组宣传使者的年龄的平均数与方差分别为36和,第五组宣传使者的年龄的平均数与方差分别为42和1,据此估计这人中35~45岁所有人的年龄的方差.
【答案】(1)
(2)
【知识点】由频率分布直方图估计平均数、计算古典概型问题的概率、计算频率分布直方图中的方差、标准差
【分析】(1)根据古典型概念公式可得;
(2)根据分层抽样平均数和方差公式可得.
【详解】(1)由题意得,第四组应抽取人,记为(甲),,,,
第五组抽取人,记为(乙),,对应的样本空间的样本点为:
,
,设事件为“甲、乙两人至少一人被选上”,
则,
所以;
(2)设第四组、第五组的宣传使者的年龄的平均数分别为,,方差分别为,,
则,,,,
设第四组和第五组所有宣传使者的年龄平均数为,方差为,
则,
,因此第四组和第五组所有宣传使者的年龄方差为10.
据此估计这人中35~45岁所有人的年龄的方差为10.
1 / 3
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。