专题05 统计与概率(期末复习讲义)高一数学上学期人教B版必修第二册

2026-01-10
| 2份
| 82页
| 1365人阅读
| 43人下载
精品

资源信息

学段 高中
学科 数学
教材版本 高中数学人教B版必修第二册
年级 高一
章节 本章小结
类型 教案-讲义
知识点 统计,概率
使用场景 同步教学-期末
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 7.33 MB
发布时间 2026-01-10
更新时间 2026-01-10
作者 书山路
品牌系列 上好课·考点大串讲
审核时间 2025-12-31
下载链接 https://m.zxxk.com/soft/55729901.html
价格 3.00储值(1储值=1元)
来源 学科网

摘要:

该高中数学统计与概率期末复习讲义通过表格系统梳理10个核心考点,明确复习目标与考情规律,各知识点按“概念-方法-易错点-示例”层次展开,用对比表格呈现抽样方法差异、数字特征计算要点,构建清晰知识脉络。 讲义亮点在于分层练习设计与方法指导,基础通关练夯实抽样、概率基础,重难突破练结合频率分布直方图求中位数等题型,培养数据意识与推理能力。每个题型附解题技巧,如平移法简化平均数计算,助力不同学生提升,支持教师精准教学。

内容正文:

专题05 统计与概率(期末复习讲义) 核心考点 复习目标 考情规律 数据的收集 理解 “总体、个体、样本、样本容量” 等统计基本概念的内涵;理解简单随机抽样(抽签法、随机数法)、分层抽样的定义及操作步骤 基础考题,多为选择题、填空题.分层抽样考查较多.. 数据的数字特征 能熟练计算简单数据的平均数、中位数、众数、极差、方差与标准差. 高频考点,题型覆盖选择题、填空题、解答题. 数据的直观表示 (1)能制作条形图、折线图和饼图,掌握其绘制步骤和方法;(2)能从图表中提取有效信息,分析数据分布和变化趋势.(3)掌握频率分布表、频率分布直方图和频率分布折线图的绘制,理解其反映数据分布的原理 高频考点,大题、小题均有. 用样本估计总体 能通过样本的平均数、中位数、众数,合理估计总体的集中趋势;会用样本的极差、方差、标准差估计总体的离散程度. 高频考点,小题、大题均有,往往一题考查多个知识点. 样本空间与事件 理解定义,能写出样本空间. 常出现在大题中,计算概率等问题. 事件之间的关系与运算 理解随机事件的包含、相等、互斥(互不相容)、对立这四种基本关系的定义,熟练掌握事件的和(并)、积(交)、差三种基本运算的定义、符号表示及运算性质. 基础核心考点,以选择题、填空题为主,偶会与概率计算结合. 古典概型 理解定义、掌握概率计算公式. 基础考点,多为选择题、填空题.或作为大题的一问. 频率与概率 理解概念及二者之间的关系,会用频率估计概率. 多为选择题、填空题,结合实际应用 随机事件的独立性 理解定义、会区分判断事件的独立性,能完成概率的计算. 高频考点,题型覆盖选择题、填空题、解答题,常与古典概型、互斥事件概率公式结合,作为概率计算的关键步骤 统计与概率的应用 掌握利用统计、概率处理问题的方法,能解决相关实际问题. 高频考点,题型覆盖选择题、填空题、解答题.题目的综合性较强. 知识点01 数据的收集 1.总体与样本:总体、个体、样本、样本容量的概念: (1)总体:总体是指我们要进行研究的对象的全部集合. (2)个体:个体是指总体中的一个单独的对象. (3) 样本:样本是总体的一个子集,通过对样本进行研究,我们可以推断出总体的一些性质. (4)样本容量:样本容量是指选取到的样本中个体的数量. 2.普查与抽样调查: (1)普查:又称全面调查,即对需要调查的对象进行逐个调查 (2)抽样调查:是从调查对象的总体中,抽取若干个个体进行调查。抽样调查可以把调查对象集中在少数个体上,并获得与全面调查相近的结果. 3.简单的随机抽样 (1)随机抽样:如果在抽样过程中,能使总体中的每个个体都有相同的可能性被选入样本,那么这样的抽样叫作随机抽样. (2)简单随机抽样:一般地,设一个总体含有N个个体,从中无放回地抽取n(n≤N)个个体为样本,如果总体内的每个个体都有相同的可能性被抽到,则把这样的抽样方法称为简单随机抽样.我们把简单随机抽样得到的样本称为简单随机样本. (3)简单随机抽样方法: ①抽签法:抽签法的步骤简单总结如下:①设一个总体有N个个体,将它们逐一编号;②制作 N个号签(号签可以用小球、纸片等制作),将编号写在号签上;③将号签放在一个容器中,并充分搅拌均匀;④从容器中任意抽取n个号签,记录其编号,就得到一个容量为n的样本. ②随机数法 4.分层抽样:当总体由差异明显的几个部分组成时,为了使抽取的样本更好地反映总体的情况,把总体中各个个体按照某种特征或某种规则划分为互不交叉的层,然后对各层按其在总体中所占比例独立进行简单随机抽样,这种抽样方法称为分层抽样. ·易错点:抽样方法选择不当或计算错误 示例:(24-25高一上·全国·课堂例题)有以下两个案例: 案例一:从同一批次同类型号的10袋牛奶中抽取3袋分别检测三聚氰胺的含量; 案例二:某公司有员工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其他人员120人,从中抽取容量为40的样本,了解他们的收入情况. (1)你认为这两个案例分别应采用怎样的抽样方式较为合适? (2)在你使用的分层抽样案例中写出抽样过程. 知识点02 数据的数字特征 1.最值:一组数据的最大值和最小值统称作最值. 2.平均数:平均数是反映一组数据平均水平的量. 3.中位数、百分位 (1)中位数:将一组数据按从小到大(或从大到小)的顺序排列后,处于中间位置的数. (2)百分位:百分位数是位于按一定顺序排列的一组数据中某一个百分位置的数值,以Pr表示,其中r是区间[1,99]上的整数.一个百分位数Pr将总体或样本的全部观测值分为两部分:至少有r%的观测值小于或等于它,且至少有(100−r)%的观测值大于或等于它.当r=50时,P50即对应中位数. 4.众数:一组数据中出现次数最多的数据值. 5.极差、方差与标准差 (1)极差:一组数据中最大值与最小值的差.也称全距,用R表示. (2)总体方差(方差):定义:设y1 ,y2 ,…,yN是总体的全部个体,μ是总体均值,则.称为总体方差 (3)样本方差:若从总体中随机抽样,获得n个观测数据用表示这n个数据的均值,则:称为这n个数据的样本方差(也简称为方差). (4)标准差:方差的算术平方根叫做这组数据的标准差.总体标准差 ·易错点:数据计算错误 示例:(多选)(25-26高二上·安徽·期中)在庆祝抗日战争胜利周年的演讲比赛中,共有位评委分别给出某选手的原始评分(假设各位评委打分均不相同),评定该选手的成绩时,从个原始评分中去掉个最高分、个最低分,得到个有效评分.个有效评分与个原始评分相比,可能变化的数字特征是(    ) A.中位数 B.平均数 C.方差 D.极差 知识点03 数据的直观表示 1.柱形图(条形图):条形图是一种以等宽直条的长度(或高度) 为核心标识的统计图表.它通常建立二维坐标系,横轴(水平轴)表示分类变量(如不同类别、组别、项目等),纵轴(垂直轴)表示数值变量(如数量、频率、次数等);每个类别对应一条直条,直条的长度(水平条形图)或高度(垂直条形图)与该类别的数值大小成正比,通过直条的长短对比,直观展示不同类别数据的数量关系或差异. 2.折线图:折线图是一种以数据点和连线为核心标识的统计图表.它建立二维坐标系,横轴通常表示连续变量(如时间、年龄、序号等具有先后顺序或递进关系的变量),纵轴表示数值变量(如数量、增长率、频率等);先将每个数据对应的坐标(横轴值,纵轴值)标记为 “数据点”,再用线段依次连接相邻数据点,通过线段的起伏变化,直观反映数据随横轴变量的变化趋势或发展规律. 3.扇形图(饼图):饼图是一种以圆形及内部扇形为核心标识的统计图表.它将整个圆形视为总体(对应数据总量,即 100%) ,根据各类别数据占总体的比例,将圆形分割为若干个扇形;每个扇形的圆心角大小与该类别占总体的比例成正比(圆心角 = 360°× 该类别占比),通过扇形的面积占比,直观展示总体中各部分的比例关系. 4.茎叶图:将数据分为 “茎”(高位数)和 “叶”(低位数),茎不变,叶按顺序排列.茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列,茎叶图也可以只表示一组数.将一组数整理成茎叶图后,如果每一行的数都是按从大到小 (或从小到大) 顺序排列,则从中可以方便地看出这组数的最值、中位数等数字特征 5.频数分布直方图与频率分布直方图 (1)频数分布直方图是一种用于展示连续型数据分布特征的统计图,它以矩形的高度表示各组的频数,直观反映数据在不同区间的集中程度和分布形态. (2)频率分布直方图:基于频率分布表绘制的统计图形,以等宽小矩形表示数据分组区间,小矩形的面积对应该组数据的频率(矩形高度 = 频率 / 组距). ·易错点:数据统计错误. 示例:(多选)(23-24高二上·四川眉山·月考)如图所示是世界人口变化情况的三幅统计图:    下列结论中正确的是(    ) A.从折线图能看出世界人口的总量随着年份的增加而增加 B.2050年亚洲人口比其他各洲人口的总和还要多 C.2050年南美洲及大洋洲人口之和与欧洲人口基本持平 D.1957年到2050年各洲中北美洲人口增长速度最慢 知识点04 用样本估计总体 1.用样本的数字特征根据总体的数字特征 (1)对称分布(如正态分布):众数 = 中位数 = 平均数; (2)左偏分布:平均数 < 中位数 < 众数;右偏分布:众数 < 中位数 < 平均数 2.用样本的分布来估计总体的分布 (1)总体在某区间的取值频率≈样本在该区间的频率; (2)总体的分布形状(如 “钟形”“左偏”“右偏”)与样本分布形状一致. 3.“大数据”简介 随着数据收集以及数据存储技术的不断进步,现在人们能够以非常便捷的方式、非常低廉的成本、非常快的速度,收集规模非常宏大的数据集合."大数据" 时代已经悄然来临. ·易错点:结论应用混淆. 示例:(25-26高一上·河南南阳·月考)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图. (1)求频率分布直方图中的值及样本成绩的第75百分位数; (2)求样本成绩的平均数; (3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差. 知识点05 样本空间与事件 1.样本点和样本空间: (1)样本点(基本事件):我们把随机试验中每一个可能出现的基本结果叫做样本点,用小写希腊字母 ω(欧米伽)表示. (2)样本空间:把一个随机试验中所有样本点组成的集合叫做这个试验的样本空间,用大写希腊字母 Ω(欧米伽)表示. 2.随机事件:一般地,我们把样本空间Ω的子集叫做随机事件,简称事件,用大写英文字母 A、B、C等表示.(1)基本事件:由单个样本点组成的事件(就是样本点本身对应的事件);(2)必然事件:在每次试验中一定发生的事件,即样本空间本身(Ω);(3)不可能事件:在每次试验中一定不发生的事件,即空集( ∅). 3.随机事件发生的概率: 概率的核心性质:(1)对任意随机事件A,有0≤P(A)≤1; (2)P(Ω)=1(必然事件概率为 1),P(∅)=0(不可能事件概率为 0); ·易错点:只要样本点有限,就用古典概型公式 —— 必须同时满足有限性 + 等可能性,缺一不可; 示例:(24-25高三上·四川绵阳·月考)在如下图的的方格表中选4个方格,要求每行和每列均恰有1个方格被选中,在所有符合上述要求的选法中,选中方格中的4个数之和的最小值是 . 8 27 32 62 3 23 37 63 6 27 38 66 5 26 39 66 知识点06 事件之间的关系与运算 1.事件的包含与相等 (1)若事件A发生必然导致事件B发生,则称事件B包含事件A(或事件A包含于事件B),记作A⊆B(或B⊇A). (2)若A⊆B且B⊆A,则称事件A与事件B相等,记作A=B. 2.事件的和(并):若事件发生当且仅当事件A发生或事件B发生(至少有一个发生),则称这个事件为事件A与事件B的和(并),记作A∪B(或A+B). 3.事件的积(交):若事件发生当且仅当事件A发生且事件B发生(两个事件同时发生),则称这个事件为事件A与事件B的积(交),记作A∩B(或AB). 4.事件的互斥与对立:(1)若A∩B=∅(A与B没有公共样本点),则称事件A与事件B互斥(互不相容);(2)若A∪B=Ω且A∩B=∅,则称事件A与事件B对立(互逆),称B为A的对立事件(逆事件),记作B=(或A=). 5.事件的混合运算: 运算规则(类比集合运算,优先级从高到低) 先算对立(补):(先求逆事件); 再算积(交):A∩B(再求交事件); 最后算和(并):A∪B(最后求并事件); 有括号先算括号内的,符号可简写:A∩B=AB, =∩, = ∪ ·易错点:误将 “互斥” 当作 “对立”、运算优先级错误 示例:(多选)(24-25高一下·全国·课后作业)(多选)对空中飞行的飞机连续射击两次,每次发射一枚炮弹,记事件“两次都击中飞机”,事件“两次都没击中飞机”,事件“恰有一次击中飞机”,事件“至少有一次击中飞机”,则(   ) A. B. C. D. 知识点07 古典概型 1.若一个随机试验满足以下两个核心条件,则称这个试验的概率模型为古典概型(也叫等可能概型): (1)有限性:试验的样本空间Ω包含有限个样本点(基本事件有限); (2)等可能性:试验中每个样本点发生的可能性大小相等. 2.对于古典概型中的任意随机事件A,事件A发生的概率为: ·易错点:误将 “放回抽样” 当作 “不放回抽样”. 示例:(25-26高一上·辽宁锦州·月考)若将,,,,这个数字不重复填入如下表格中,有个表格中数字不能确定,用字母,,,表示,但可以确定为奇数,则的概率为 . 知识点08 频率与概率 1. 频率:在相同条件下,重复做n次试验,若随机事件A发生了m次,则称为事件A发生的频率, 记作fn (A)= 2.概率:在相同条件下,当试验次数n很大时,事件A发生的频率f n (A)会稳定在某个常数p附近,这个常数p就叫做事件A发生的概率,记作P(A)=p. 3. 用频率估计概率 ① 频率是概率的近似值:试验次数n越大,频率fn (A)越接近概率P(A); ② 概率是频率的稳定值:频率围绕概率上下波动,当n→∞时,频率趋近于概率; ③ 取值范围一致:均满足0≤值≤1; ④ 特殊事件统一:不可能事件频率 / 概率均为 0,必然事件频率 / 概率均为 1. ·易错点:混淆频率与概率,认为 “频率 = 概率” 示例:(24-25高一下·天津河西·期末)一个不透明的袋中装有除颜色外均相同的8个红球,4个白球,若干个黑球,每次摇匀后随机摸出一个球,记下颜色后再放回袋中,经过大量重复实验后,发现摸到黑球的频率稳定在0.4,则袋中约有黑球(   ) A.6个 B.7个 C.8个 D.9个 知识点09 随机事件的独立性 1.定义:设A,B为两个随机事件,若满足P(A∩B)=P(A)⋅P(B)则称事件A与事件B相互独立,简称A,B 独立. 2.独立性的核心判定方法: (1)方法 1:定义法(根本方法,通用所有概率模型) 步骤:计算P(A)、P(B)、P(AB),验证是否满足P(AB)=P(A)P(B),满足则独立,不满足则不独立. (2)方法 2:直观法(经验判断,快速解题) 核心原则:若两个事件的发生互不影响、无因果关系、无关联,则可直接判定相互独立. 3. 概率的计算: (1)两独立事件同时发生的概率(积事件):若A,B相互独立,则P(AB)=P(A)P(B); (2)两独立事件至少一个发生的概率(和事件):若A,B相互独立, 则P(A∪B)=1−P( )P( ). 4. 对立事件的独立性:若A,B相互独立,则以下四组事件均相互独立:① A与; ② 与B;③ 与;④ A∪B与(若再加独立事件C). 5.推广结论: (1)多个独立事件同时发生的概率(推广): 若A1 ,A2 ,…,An相互独立,则P(A1 A2 ⋯An )=P(A1 )P(A2 )⋯P(An ) 文字:多个独立事件同时发生的概率 = 每个事件概率的连乘积。 (2)多个独立事件至少一个发生的概率: 若A1 ,A2 ,…,An相互独立,则 ·易错点:混淆 “独立” 与 “互斥”,认为独立就是互斥. 示例:(多选)(25-26高二上·山东淄博·月考)连续抛掷一枚质地均匀的硬币次,记录这次实验的结果.设事件表示“次实验结果中,既出现正面又出现反面”,事件表示“次实验结果中,至多出现一次正面”,则下列结论正确的有  (   ). A.若,则与互斥 B.若,则与不相互独立 C.若,则与不互斥 D.若,则与相互独立 知识点10 统计与概率的应用 统计与概率的应用,本质是用统计的方法获取数据、估计总体特征,用概率的模型分析随机事件的可能性,结合二者解决生活 / 生产中的实际决策、推断、风险评估问题,是统计概率模块的最终落脚点. ·易错点:计算错误较多. 示例:(2025高一·全国·专题练习)某公司面临一个决策问题,有两种策略可选:策略A和策略B. 选择策略有的概率获得100万元收益,的概率获得50万元收益.—选择策略先进行市场调研,花费10万元.调研结果有两种可能:—结果1(概率):此时有的概率获得150万元收益,的概率获得30万元收益.—结果2(概率):此时有的概率获得120万元收益,的概率获得20万元收益. 公司希望最大化期望净收益(总收益减去成本).请问公司应选择哪种策略?期望净收益是多少? 题型一 数据的数字特征 解|题|技|巧 1. 平均数计算技巧:平移法(均值简化法):任取一个常数a,令xi′=xi−a,先求,则=+a; 2.中位数快速求解技巧:先排序,再找中间位置; 3.频率分布直方图求中位数:中位数所在位置,左右两侧面积和均为 0.5; 4.众数只看 “出现频次”,与数据大小、位置无关; 易|错|点|拨 1. 加权平均数漏乘频数,直接算简单平均数; 2. 平移法还原时漏加常数a; 3. 频率分布直方图求平均数,用 “组限” 代替 “组中值”; 4. 新数据平均数公式用错,多乘 / 漏乘常数; 5.方差分母混淆n与n−1; 6.方差简便公式用错,符号错误 / 漏项; 7.方差计算时,(xi−)漏平方,直接算差的和; 8.综合分析易错点:只比平均数,不比方差,分析不全面. 【典例1】(25-26高二上·湖北孝感·期中)已知数据的平均数为5,方差为16,那么数据,的平均数和方差分别为(    ) A.6,8 B.5,8 C.6,4 D.8,6 【典例2】(多选)(25-26高一上·辽宁沈阳·月考)下列说法正确的是(   ) A.已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5 B.数据27,12,14,30,15,17,19,23的第70百分位数是23 C.若样本,,…,的平均值为8,则,,…,的平均值为15 D.某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出58人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为20人 【变式1】(多选)(25-26高一上·辽宁辽阳·期末)已知一组样本数据:2,2,0,2,4,1,3,则下列关于该组样本数据说法不正确的是(   ) A.极差是5 B.众数不等于平均数 C.方差是 D.分位数是3 【变式2】(2025高一上·辽宁沈阳·专题练习)已知甲、乙两组按顺序排列的数据:甲组:27,28,37,,40,50;乙组:24,,34,43,48,52;若这两组数据的第30百分位数、第50百分位数分别对应相等,则等于 . 题型二 数据的直观表示问题 解|题|技|巧 (一)四类图表通用解题技巧 1.审题先圈关键信息:圈出「样本容量、组距、分组区间、图表类型」,明确求 “频率 / 频数 / 数字特征 / 概率”; 2.数据转化三步走:图表读数→频率 / 频数转化→结合公式计算(所有考法的核心逻辑); 3.两组数据对比模板:先比「平均数 / 中位数」(平均水平)→再比「方差 / 数据分布」(稳定性)→结合图表特征(如直方图高低、茎叶图集中程度)下结论; 4.验算技巧:直方图验证「面积和 = 1」,扇形图验证「百分比和 = 100%」,频数验证「各组频数和 = 样本容量」,快速排查计算错误. (二)核心避坑4原则 1.看图表:先辨类型,再看标注,最后读数; 2.算数据:牢记公式,面积为率,组中为均; 3.求特征:直方看中位 / 平均 / 众数,茎叶看排序 / 稳定; 4.验结果:面积和为 1,频数和为总,百分比和为百 易|错|点|拨 1.频率分布直方图易错:(1)混淆纵轴含义,误将当作频率(致命错误);(2)组距与组数选择错误,导致数据分组失真;(3)计算中位数 / 平均数,误用 “组限” 代替 “组中值”;(4)忽略 “小矩形面积和 = 1”,计算后不验算. 2. 扇形图求圆心角,误算为百分比 ×180°; 3. 多图表数据不统一,样本容量混淆. 【典例1】(多选)(24-25高一上·辽宁葫芦岛·期末)为了关注学生的健康成长,某学校开展了一次高一年级学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则从图中能得出的信息是(    ) A.样本中A层次身高的女生少于男生 B.样本中B层次身高的学生人数最多 C.样本中D层次身高的学生人数占总人数的17% D.样本中E层次身高的男生有6人 【典例2】(24-25高一上·陕西西安·开学考试)为深化义务教育课程改革,某校积极开展拓展性课程建设,计划开设艺术、体育、劳技、文学等多个类别的拓展性课程,要求每一位学生都自主选择一个类别的拓展性课程.为了了解学生选择拓展性课程的情况,随机抽取了部分学生进行调查,并将调查结果绘制成如下统计图(部分信息未给出): 根据统计图中的信息,解答下列问题: (1)求本次被调查的学生人数. (2)将条形统计图补充完整. (3)若该校共有1600名学生,请估计全校选择体育类的学生人数. 【变式1】(23-24高二下·陕西西安·期中)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为且支出在元的样本,其频率分布直方图如图所示,则下列说法正确的是(    )    A.估计众数为 B.估计中位数是 C.估计平均数为 D.支出在的频率为 【变式2】(2025高一下·全国·专题练习)如图是2024年5月~2025年5月“规模以上工业钢材同比增速及日均产量统计图”,则(    )    A.2024年5月~2025年5月,规模以上工业钢材日均产量呈上升趋势 B.2024年5月~2025年3月,规模以上工业钢材日均产量极差为万吨 C.2024年5月~2024年12月,规模以上工业钢材日均产量上四分位数为万吨 D.2025年3月~2025年5月,日均产量约为万吨 题型三 用样本估计总体 解|题|技|巧 1.计算平均数优先用加权公式:尤其当数据有重复频数时,简化计算; 2.方差计算简便公式,避免多次减平均数,减少计算错误; 3.比较两组数据:先比平均数(看平均水平),再比方差(看稳定性). 4.直方图计算频率 / 频数:频率 = 小矩形面积 = 组距 ×;频数 = 频率 × 样本容量; 5.直方图求中位数:先算前几组面积和,找到不足 0.5 的最后一组,设中位数为x,列方程; 6.直方图求平均数:提前算每组中点值,再乘对应频率,累加即可,避免逐个数计算; 7.茎叶图快速找中位数 / 众数:叶按顺序排列后,直接数位置 / 找出现次数最多的数. 易|错|点|拨 1.混淆 “中位数” 计算前提:未对数据排序直接找中间数,导致结果错误; 2.方差公式用错分母:高中用样本估计总体时,方差分母是n−1,不是n; 3.忽略极端值的影响:平均数易受极端值干扰,此时用中位数描述更合理; 4.误将 “样本数字特征” 当作 “总体数字特征”:样本特征是估计值,不是总体真实值; 5.纵轴理解错误:把当作频率,直接用纵轴数值求和(正确是面积求和 = 1); 6.组距与组数选择不当:组数过少(分布模糊)、组数过多(波动过大),导致分布估计失真; 7.直方图中中位数计算错误:未按 “面积和为 0.5” 找,而是直接找数据中间值; 8.误将 “样本分布” 当作 “总体分布”:样本分布是近似估计,总体分布是真实规律,存在抽样误差. 【典例1】(25-26高一上·甘肃·期末)从某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: 质量指标值分组 频数 6 26 38 22 8 (1)根据上表补全所示的频率分布直方图; (2)估计这种产品质量指标值的平均数、方差(同一组中的数据用该组区间的中点值作代表)及中位数(保留一位小数); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定? 质量指标值分组 频数 6 26 38 22 8 频率/组距 0.006 0.026 0.038 0.022 0.008 【典例2】(25-26高一上·辽宁辽阳·期末)某工厂有工人人,其中名工人参加过短期培训(称为类工人),另外名工人参加过长期培训(称为类工人).现用分层抽样的方法(按类、类分二层)从该工厂的工人中共抽查 名工人,调查他们的生产能力(此处的生产能力指一天加工的零件数). (1)类工人和类工人中各抽查多少工人? (2)从类工人中的抽查结果和从类工人中的抽查结果分别如下表1和表2. 表1 生产能力分组 人数 表2 生产能力分组 人数 ①求、,再完成下列频率分布直方图; ②分别估计类工人和类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表). 【变式1】(24-25高一下·黑龙江·期末)为了了解某工厂生产的产品情况,从该工厂生产的产品中随机抽取了一个容量为400的样本,测量它们的尺寸(单位:mm),并将数据分为七组,其频率分布直方图如图所示.    (1)求值; (2)根据频率分布直方图,求400件样本中尺寸在内的样本数; (3)已知利用分层随机抽样从第一、二组共抽出十二个数据,从第一组,第二组抽出的数据的标准差分别为1和,平均值分别为93和94.5,求抽出数据的均值和方差. 参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:;记总的样本平均数为,样本方差为,则. 【变式2】(25-26高一上·贵州遵义·期中)某校高一年级20名学生期末考试数学成绩的频率分布直方图如图所示,其中成绩分组区间为. (1)求图中的值: (2)根据频率分布直方图,估计这200名学生数学成绩的平均分(同一组中的数据用该组区间的中点值作代表); (3)若从数学成绩在内的学生中用分层随机抽样的方法抽取7人,再从这7人中随机抽取2人分析学习情况,求抽到数学成绩在内各1人的概率. 题型四 事件之间的关系与运算 解|题|技|巧 事件的混合运算运算规则(类比集合运算,优先级从高到低) 1.先算对立(补):(先求逆事件); 2.再算积(交):A∩B(再求交事件); 3.最后算和(并):A∪B(最后求并事件); 4.有括号先算括号内的,符号可简写:A∩B=AB, =∩, = ∪ 易|错|点|拨 1.混淆 “A∪B” 与 “A+B”:仅互斥事件中A∪B可记为A+B,非互斥事件不能用 “+” 表示并事件; 2.误将 “互斥” 当作 “对立”:互斥是 “不同时发生”,对立是 “不同时发生且必其一发生”,互斥范围更广; 3.运算优先级错误:未先算对立再算积,直接算和,导致结果错误; 4.忽略 “同一样本空间”:只有同一试验的事件,才能讨论包含、互斥、和积运算. 【典例1】(多选)(24-25高二上·广东佛山·月考)如图,一个电路中有甲、乙、丙三个电子元件,设“甲元件故障”,“乙元件故障”,“丙元件故障”,则能表示电路是通路的事件是(   ) A. B. C. D. 【典例2】(24-25高二上·广东佛山·月考)把分别写在10张形状大小一样的卡片上,并随机抽取1张.设事件:出现奇数,事件:出现被3除余2的数.写出下面两个事件的对应子集: (1)事件、事件至少有一个发生; (2)事件、事件恰好有一个发生. 【变式1】(24-25高二上·安徽阜阳·开学考试)已知某随机试验中,事件A,B,C发生的概率分别是,,,则下列说法正确的是(    ) A.()与C是互斥事件,且是对立事件 B.一定是必然事件 C.的概率一定不超 D.的概率一定等于0.5 【变式2】(24-25高一下·全国·课后作业)从学号为1,2,3,4,5,6的六名同学中选出一名同学担任班长,其中1,3,5号同学为男生,2,4,6号同学为女生,记:“选出1号同学”,“选出2号同学”,“选出3号同学”,“选出4号同学”,“选出5号同学”,“选出6号同学”,“选出的同学学号不大于1,”“选出的同学学号大于4,”“选出的同学学号小于6,”“选出的同学学号小于7”“选出的同学学号大于6”“选出的同学学号为偶数”,“选出的同学学号为奇数”,等等.据此回答下列问题: (1)上述事件中哪些是必然事件?哪些是随机事件?哪些是不可能事件? (2)如果事件发生,则一定有哪些事件发生? (3)如果事件H发生,则可能是哪些事件发生?在集合中,事件H与这些事件之间有何关系? (4)有没有某事件发生当且仅当事件A发生且事件B发生的情况?它们之间的关系如何描述? (5)两个事件的交事件也可能为不可能事件,在上述事件中能找出这样的例子吗? 题型五 随机事件的独立性 解|题|技|巧 1. 利用定义判断两事件是否独立. 2. 独立事件的积事件概率计算(直接套用公式). 3. “至少 / 至多” 类独立事件概率(优先用对立事件). 易|错|点|拨 1.混淆 “独立” 与 “互斥”,认为独立就是互斥; 2.凭直观判断独立,忽略定义验证(经验主义错误); 3.误用对立事件的独立性,认为A与B独立则A与A∪B独立; 4.多个事件仅证两两独立,就判定相互独立; 5.不放回抽样误判为独立事件. 【典例1】(24-25高一下·湖南岳阳·期末)“猜灯谜”又叫“打灯谜”,是元宵节的一项活动,出现在南宋时期.开始时是好事者把谜语写在纸条上,贴在五光十色的彩灯上供人猜.因为谜语既能启迪智慧又饶有兴趣,所以流传过程中深受社会各阶层的欢迎.在一次猜灯谜活动中,共有30道灯谜,三位同学独立竞猜,甲同学猜对了15道,乙同学猜对了10道,丙同学猜对了道.假设对每位同学而言,他们猜对每道灯谜的可能性都相等. (1)任选一道灯谜,求甲,乙两位同学恰有一个人猜对的概率; (2)任选一道灯谜,若甲,乙,丙三个人中至少有一个人猜对的概率为,求的值. 【典例2】(2025高一·全国·专题练习)某电子竞技比赛中,两支队伍进行(三局两胜制)比赛.每局比赛,强队对阵弱队时:若采取保守策略,获胜概率为,若A采取激进策略,获胜概率为,但若失败,下一局获胜概率降为,比赛开始时,可以自由选择策略.之后,每局开始前,可以根据当前比分选择策略. (1)若在第一局采取保守策略,求最终获胜的概率; (2)若在第一局采取激进策略,求最终获胜的概率; (3)应该在第一局选择哪种策略?为什么? 【变式1】(25-26高一上·河南南阳·月考)先后两次掷一枚质地均匀的骰子,表示事件“两次掷出的点数之和是),表示事件“第二次掷出的点数是偶数”,表示事件“两次掷出的点数相同”,表示事件“至少出现一个奇数点”,则(   ) A.与互斥 B. C.与对立 D.与相互独立 【变式2】(25-26高二上·湖北·期中)甲、乙两人进行轮流投篮比赛,每人每次只投一球.约定先投中者获胜,当有人投中或者每人都已投球3次时投篮结束.设甲每次投篮投中的概率为,乙每次投篮投中的概率为,且两人各次投篮互不影响. (1)若甲先投篮,求投篮结束时,甲只投了2个球的概率; (2)若乙先投篮,求乙获胜的概率. 题型六 统计与概率的应用问题 解|题|技|巧 1用样本数字特征估计总体,做决策分析: (1)看平均水平:平均数 / 中位数高,代表整体性能优; (2)看稳定性:方差 / 标准差小,代表数据波动小,结果更可靠; 2.用频率分布估计总体,做区间推断: 核心依据:频率分布表、频率分布直方图(频率 = 概率近似值);推断原则:频率≈概率(试验 / 样本容量足够大时),用样本某区间的频率,估计总体在该区间的取值概率; 3.抽样方法的实际应用(保证样本代表性):根据总体特征选抽样方法,分层抽样按比例抽取,保证样本能真实反映总体,避免估计偏差; 4.互斥 / 对立事件的概率应用(“至少 / 至多” 场景):优先用对立事件,将 “至少发生” 转化为 “都不发生” 的反面,简化计算; 5.独立事件的概率应用(多事件互不影响场景):先判断事件独立性,再用乘积公式计算 “同时发生” 概率,用对立公式计算 “至少发生” 概率; 6.概率应用的决策原则:概率是事件发生可能性的量化指标,根据概率大小做决策.(1)利益最大化:选择概率大的有利事件(如选中奖概率高的抽奖方式、命中率高的选手);(2)风险最小化:选择概率小的不利事件(如选故障率低的设备、次品率低的产品);(3)公平性判断:若各方获胜 / 受益的概率相等,则方案公平;否则不公平(如游戏规则、抽签规则). .易|错|点|拨 (一)统计层面:样本无代表性、数字特征计算错误、直方图纵轴理解偏差; 1.样本缺乏代表性(如抽样片面、分层比例错误),导致估计失真; 2. 混淆样本数字特征与总体真实特征,将估计值当作确定值; 3. 频率分布直方图中,误将纵轴当作频率计算; 4. 忽略方差的实际意义,只看平均数不看稳定性. (二)概率层面:模型判断错误、独立 / 互斥混淆、等可能性忽略、对立事件误用; (三)综合层面:统计与概率衔接断层,未用统计结果估计概率,或概率计算脱离统计数据; (四)逻辑层面:结论无依据,未结合实际场景分析,仅单纯计算数据 / 概率 【典例1】(25-26高二上·山东·月考)为提高生产效率,某工厂开展技术创新活动,提出了完成某项任务的两种新的生产方式.为比较两种生产方式的效率,选取20名工人,将他们随机分成两组,每组10人,第一组工人采用第一种生产方式,第二组工人采用第二种生产方式.两组工人完成任务的工作时间(单位:min)如下: 生产方式 工作时间(单位:min) 第一种 68 72 76 77 79 82 83 83 84 85 第二种 65 65 66 68 69 70 71 72 72 73 假设每个工人完成工作所需时间相互独立,用频率估计概率. (1)从采用第一种生产方式的工人中随机抽取1人,估计该工人完成生产任务的工作时间小于的概率; (2)将工作时间分为三层,从第一组和第二组工人中各随机抽取1人,求这两人完成生产任务的工作时间不在同一层的概率. 【典例2】(23-24高二下·上海·月考)本市某区对全区高中生的身高(单位:厘米)进行统计,得到如下的频率分布直方图. (1)若数据分布均匀, 用频率估计概率,则在全市随机取一名高中生,求其身高不低于180厘米的概率; (2)现从身高在区间的高中生中分层抽样抽取一个80人的样本,若身高在区间中样本的均值为176厘米,方差为10;身高在区间[180, 190)中样本的均值为184 厘米,方差为16,试求这80人的方差. 【变式1】(24-25高二上·广东湛江·月考)某校高二年级500名学生的学考适应性演练数学成绩频率分布直方图如图所示,其中成绩分组区间是,,,,,.    (1)求图中a的值; (2)估计这500名学生的这次考试数学成绩的中位数,第80百分位数; (3)估计这500名学生的这次考试数学成绩的平均数. 【变式2】(2025高一·全国·专题练习)阶梯挑战赛中的排名跃迁,某电竞比赛采用阶梯挑战赛制,共有5个阶梯(从低到高为阶),初始时10支队伍随机分布在各阶梯上,分布情况为:1阶2队、2阶2队、3阶2队、4阶2队、5阶2队. 比赛规则: 1.每轮比赛,各阶梯内随机配对进行比赛(若某阶梯队伍数为奇数,则有一队轮空) 2.比赛胜者上升1阶,败者下降1阶(5阶胜者保持5阶,1阶败者保持1阶) 3.每轮结束后,重新按阶梯排序,进行下一轮比赛 4.比赛共进行3轮 假设每支队伍实力相当,任意两队比赛获胜概率均为,且各场比赛结果相互独立. (1)求初始位于3阶的某支队伍在3轮比赛后仍位于3阶的概率; (2)求初始位于3阶的某支队伍在3轮比赛后升至5阶的概率; (3)若某支队伍希望最大化3轮后位于5阶的概率,应选择从哪一阶开始比赛?证明你的结论. 期末基础通关练(测试时间:10分钟) 1.(2025高三上·江苏·学业考试)某工厂生产A,B两种不同型号的产品,产量之比为,现用分层抽样的方法抽取一个容量为的样本,若样本中型号的产品有40件,则(   ) A.80 B.100 C.120 D.200 2.(22-23高二上·广东佛山·期中)某商场推出抽奖活动,在甲抽奖箱中有四张有奖奖票,六张无奖奖票;乙抽奖箱中有三张有奖奖票,七张无奖奖票.每人能在甲乙两箱中各抽一次,以表示“在甲抽奖箱中抽奖中奖的事件”,表示“在乙抽奖箱中抽奖中奖的事件”,表示“两次抽奖均未中奖的事件”,下列结论中不正确的是(      ) A. B.与相互独立 C. D.与互斥 3.(23-24高一下·四川眉山·期末)为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为12的样本,并算得样本的平均数为5,方差为9.84;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为15.64.已知甲、乙两同学抽取的样本合在一起组成一个容量为20的样本,则合在一起后的样本方差为 . 4.(25-26高二上·山东济宁·期中)九宫格数独游戏是一种训练推理能力的数字谜题游戏,某九宫格如图所示,小王需要在九宫格上填上1至9中不重复的整数,小王通过推理已经得到了4个小格子中的准确数字,a,b,c,d,e这5个数字未知,且b,d为奇数,则的概率为 . 期末重难突破练(测试时间:10分钟) 1.(多选)(24-25高一下·江西南昌·月考)近日,数字化构建社区服务新模式成为一种时尚.某社区为优化数字化社区服务,问卷调查调研数字化社区服务的满意度,满意度采用计分制(满分100分),统计满意度绘制成如下频率分布直方图,图中,则下列结论正确的是(    ) A. B.满意度计分的众数为75分 C.满意度计分的75%分位数是85分 D.满意度计分的平均分是76 2.(多选)(25-26高一上·江西赣州·月考)下列说法正确的是(    ) A.用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则总体中个体被抽到的概率为0.03 B.已知一组数据1,2,,6,7的平均数为4,则这组数据的方差是5 C.数据27,12,14,30,15,17,19,23的第70百分位数是23 D.若样本数据的标准差为8,则数据的标准差为16 3.(24-25高二下·山西·期中)“科学技术是第一生产力”.科技进步能够更好地推动高质量发展,如人工智能中的DeepSeek.某公司部门有员工100名,公司拟开展DeepSeek培训,分三轮进行,每位员工一轮至三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有两轮及两轮以上获得“优秀”的员工才能应用DeepSeek. (1)估计部门员工经过培训能应用DeepSeek的人数(去尾法精确到个位); (2)已知开展DeepSeek培训前,员工每人每年为公司创造利润6万元;开展DeepSeek培训后,能应用DeepSeek的员工每人每年平均为公司创造利润10万元.DeepSeek培训平均每人每年成本为1万元.根据公司发展需要,计划先将部门的部分员工随机调至公司其他部门,然后对其余员工开展DeepSeek培训.要保证培训后部门的年利润不低于员工调整前的年利润,部门最多可以调多少人到其他部门? 期末综合拓展练(测试时间:15分钟) 1.(24-25高一上·河南焦作·期末)某林场在海拔(单位:米)0至2500米内均种植树木,从中随机抽取100棵树,将其海拔分布情况绘制成如图所示的频率分布直方图,再从海拔在的树中采用分层随机抽样的方式抽取5棵深入检查,用频率估计概率. (1)根据频率分布直方图,估计该林场树木海拔的中位数; (2)从参与深入检查的5棵树中随机选择3棵,求有且仅有2棵海拔在内的概率. 2.(25-26高一上·辽宁锦州·月考)某校举办了校园诗词大赛,学生的比赛成绩均在内(单位:分),随机抽取了100名学生的成绩,整理后按照分成五组,并绘制成如图所示的频率分布直方图. (1)若规定成绩较高的前的学生获奖,请求出的值并估计获奖学生的最低分数线; (2)现从样本成绩在与两个分数段内,按分层随机抽样的方法选取5人,再从这5人中随机选取2人,求这2人中恰有1人的成绩落在内的概率; (3)已知样本数据落在的平均数是77,方差是6,落在的平均数是82,方差是3,求这两组数据合并后的平均数和总方差. 3.(25-26高三上·北京·月考)2025年3月14日(第六个国际数学日),某校开展了“站播台”、“史探秘”、“日海报”、“徽设计”、“帽设计”共5项挑战活动,每名学生至少参与其中一项活动.为了解该校上述活动的参与情况,现从高一、高二、高三学生中各随机选取100名学生作为样本进行调查,调查数据如下表: 挑战活动参与人数 站播台 史探秘 日海报 徽设计 帽设计 高一 80 45 55 75 45 高二 40 60 60 80 40 高三 15 50 40 20 30 通过样本估计该校全体学生参与活动的情况. (1)从5项活动中随机选择1项,估计此项活动全校参与的人数大于该校总人数的一半的概率; (2)从该校高一年级和高二年级中各随机选取2名学生,求这4名学生中恰有2名学生参与“徽设计”的概率; (3)假设高一某班参加挑战活动的情况如下: 挑战活动 站播台 史探秘 日海报 徽设计 帽设计 参与人数 7 9 已知,当数据,,,,的方差最小时,写出,,的取值.(结论不要求证明) 1 / 3 学科网(北京)股份有限公司 $ 专题05 统计与概率(期末复习讲义) 核心考点 复习目标 考情规律 数据的收集 理解 “总体、个体、样本、样本容量” 等统计基本概念的内涵;理解简单随机抽样(抽签法、随机数法)、分层抽样的定义及操作步骤 基础考题,多为选择题、填空题.分层抽样考查较多.. 数据的数字特征 能熟练计算简单数据的平均数、中位数、众数、极差、方差与标准差. 高频考点,题型覆盖选择题、填空题、解答题. 数据的直观表示 (1)能制作条形图、折线图和饼图,掌握其绘制步骤和方法;(2)能从图表中提取有效信息,分析数据分布和变化趋势.(3)掌握频率分布表、频率分布直方图和频率分布折线图的绘制,理解其反映数据分布的原理 高频考点,大题、小题均有. 用样本估计总体 能通过样本的平均数、中位数、众数,合理估计总体的集中趋势;会用样本的极差、方差、标准差估计总体的离散程度. 高频考点,小题、大题均有,往往一题考查多个知识点. 样本空间与事件 理解定义,能写出样本空间. 常出现在大题中,计算概率等问题. 事件之间的关系与运算 理解随机事件的包含、相等、互斥(互不相容)、对立这四种基本关系的定义,熟练掌握事件的和(并)、积(交)、差三种基本运算的定义、符号表示及运算性质. 基础核心考点,以选择题、填空题为主,偶会与概率计算结合. 古典概型 理解定义、掌握概率计算公式. 基础考点,多为选择题、填空题.或作为大题的一问. 频率与概率 理解概念及二者之间的关系,会用频率估计概率. 多为选择题、填空题,结合实际应用 随机事件的独立性 理解定义、会区分判断事件的独立性,能完成概率的计算. 高频考点,题型覆盖选择题、填空题、解答题,常与古典概型、互斥事件概率公式结合,作为概率计算的关键步骤 统计与概率的应用 掌握利用统计、概率处理问题的方法,能解决相关实际问题. 高频考点,题型覆盖选择题、填空题、解答题.题目的综合性较强. 知识点01 数据的收集 1.总体与样本:总体、个体、样本、样本容量的概念: (1)总体:总体是指我们要进行研究的对象的全部集合. (2)个体:个体是指总体中的一个单独的对象. (3) 样本:样本是总体的一个子集,通过对样本进行研究,我们可以推断出总体的一些性质. (4)样本容量:样本容量是指选取到的样本中个体的数量. 2.普查与抽样调查: (1)普查:又称全面调查,即对需要调查的对象进行逐个调查 (2)抽样调查:是从调查对象的总体中,抽取若干个个体进行调查。抽样调查可以把调查对象集中在少数个体上,并获得与全面调查相近的结果. 3.简单的随机抽样 (1)随机抽样:如果在抽样过程中,能使总体中的每个个体都有相同的可能性被选入样本,那么这样的抽样叫作随机抽样. (2)简单随机抽样:一般地,设一个总体含有N个个体,从中无放回地抽取n(n≤N)个个体为样本,如果总体内的每个个体都有相同的可能性被抽到,则把这样的抽样方法称为简单随机抽样.我们把简单随机抽样得到的样本称为简单随机样本. (3)简单随机抽样方法: ①抽签法:抽签法的步骤简单总结如下:①设一个总体有N个个体,将它们逐一编号;②制作 N个号签(号签可以用小球、纸片等制作),将编号写在号签上;③将号签放在一个容器中,并充分搅拌均匀;④从容器中任意抽取n个号签,记录其编号,就得到一个容量为n的样本. ②随机数法 4.分层抽样:当总体由差异明显的几个部分组成时,为了使抽取的样本更好地反映总体的情况,把总体中各个个体按照某种特征或某种规则划分为互不交叉的层,然后对各层按其在总体中所占比例独立进行简单随机抽样,这种抽样方法称为分层抽样. ·易错点:抽样方法选择不当或计算错误 示例:(24-25高一上·全国·课堂例题)有以下两个案例: 案例一:从同一批次同类型号的10袋牛奶中抽取3袋分别检测三聚氰胺的含量; 案例二:某公司有员工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其他人员120人,从中抽取容量为40的样本,了解他们的收入情况. (1)你认为这两个案例分别应采用怎样的抽样方式较为合适? (2)在你使用的分层抽样案例中写出抽样过程. 【答案】(1)案例一用简单随机抽样,案例二用分层抽样 (2)答案见解析 【知识点】简单随机抽样的特征及适用条件、分层抽样的特征及适用条件、设计分层抽样过程 【分析】(1)由分层抽样和简单随机抽样的定义即可得出答案; (2)按照分层、确定抽样比、确定各层样本数、按简单随机抽样方式在各层确定相应的样本、汇总构成一个容量为40的样本的过程求解即可. 【详解】(1)案例一用简单随机抽样,案例二用分层抽样. (2)①分层,将总体分为具有高级职称、中级职称、初级职称及其他人员四层; ②确定抽样比; ③按抽样比确定各层应分别抽取的人数为8,16,10,6; ④按简单随机抽样的方法在各层确定相应的样本; ⑤汇总构成一个容量为40的样本. 知识点02 数据的数字特征 1.最值:一组数据的最大值和最小值统称作最值. 2.平均数:平均数是反映一组数据平均水平的量. 3.中位数、百分位 (1)中位数:将一组数据按从小到大(或从大到小)的顺序排列后,处于中间位置的数. (2)百分位:百分位数是位于按一定顺序排列的一组数据中某一个百分位置的数值,以Pr表示,其中r是区间[1,99]上的整数.一个百分位数Pr将总体或样本的全部观测值分为两部分:至少有r%的观测值小于或等于它,且至少有(100−r)%的观测值大于或等于它.当r=50时,P50即对应中位数. 4.众数:一组数据中出现次数最多的数据值. 5.极差、方差与标准差 (1)极差:一组数据中最大值与最小值的差.也称全距,用R表示. (2)总体方差(方差):定义:设y1 ,y2 ,…,yN是总体的全部个体,μ是总体均值,则.称为总体方差 (3)样本方差:若从总体中随机抽样,获得n个观测数据用表示这n个数据的均值,则:称为这n个数据的样本方差(也简称为方差). (4)标准差:方差的算术平方根叫做这组数据的标准差.总体标准差 ·易错点:数据计算错误 示例:(多选)(25-26高二上·安徽·期中)在庆祝抗日战争胜利周年的演讲比赛中,共有位评委分别给出某选手的原始评分(假设各位评委打分均不相同),评定该选手的成绩时,从个原始评分中去掉个最高分、个最低分,得到个有效评分.个有效评分与个原始评分相比,可能变化的数字特征是(    ) A.中位数 B.平均数 C.方差 D.极差 【答案】BCD 【知识点】计算几个数的中位数、计算几个数的平均数、计算几个数据的极差、方差、标准差 【分析】设位评委评分按从小到大排列为,结合中位数、平均数、方差、极差的概念逐项判断即可. 【详解】设位评委评分按从小到大排列为, 去掉一个最高分和最低分后,剩余, 原始中位数为,去掉最低分和最高分后,中位数仍为,则中位数不变; 原始平均数,后来平均数, 平均数受极端值影响较大,所以与不一定相同,则平均数可能改变; 原始方差为, 新数据的方差为, 方差受极端值影响较大,所以与不一定相同,则方差可能改变; 原极差为,新极差为, 因为,则,又因为,由不等式的性质可得,则极差可能改变. 故选:BCD. 知识点03 数据的直观表示 1.柱形图(条形图):条形图是一种以等宽直条的长度(或高度) 为核心标识的统计图表.它通常建立二维坐标系,横轴(水平轴)表示分类变量(如不同类别、组别、项目等),纵轴(垂直轴)表示数值变量(如数量、频率、次数等);每个类别对应一条直条,直条的长度(水平条形图)或高度(垂直条形图)与该类别的数值大小成正比,通过直条的长短对比,直观展示不同类别数据的数量关系或差异. 2.折线图:折线图是一种以数据点和连线为核心标识的统计图表.它建立二维坐标系,横轴通常表示连续变量(如时间、年龄、序号等具有先后顺序或递进关系的变量),纵轴表示数值变量(如数量、增长率、频率等);先将每个数据对应的坐标(横轴值,纵轴值)标记为 “数据点”,再用线段依次连接相邻数据点,通过线段的起伏变化,直观反映数据随横轴变量的变化趋势或发展规律. 3.扇形图(饼图):饼图是一种以圆形及内部扇形为核心标识的统计图表.它将整个圆形视为总体(对应数据总量,即 100%) ,根据各类别数据占总体的比例,将圆形分割为若干个扇形;每个扇形的圆心角大小与该类别占总体的比例成正比(圆心角 = 360°× 该类别占比),通过扇形的面积占比,直观展示总体中各部分的比例关系. 4.茎叶图:将数据分为 “茎”(高位数)和 “叶”(低位数),茎不变,叶按顺序排列.茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列,茎叶图也可以只表示一组数.将一组数整理成茎叶图后,如果每一行的数都是按从大到小 (或从小到大) 顺序排列,则从中可以方便地看出这组数的最值、中位数等数字特征 5.频数分布直方图与频率分布直方图 (1)频数分布直方图是一种用于展示连续型数据分布特征的统计图,它以矩形的高度表示各组的频数,直观反映数据在不同区间的集中程度和分布形态. (2)频率分布直方图:基于频率分布表绘制的统计图形,以等宽小矩形表示数据分组区间,小矩形的面积对应该组数据的频率(矩形高度 = 频率 / 组距). ·易错点:数据统计错误. 示例:(多选)(23-24高二上·四川眉山·月考)如图所示是世界人口变化情况的三幅统计图:    下列结论中正确的是(    ) A.从折线图能看出世界人口的总量随着年份的增加而增加 B.2050年亚洲人口比其他各洲人口的总和还要多 C.2050年南美洲及大洋洲人口之和与欧洲人口基本持平 D.1957年到2050年各洲中北美洲人口增长速度最慢 【答案】ABC 【知识点】根据扇形统计图解决实际问题、根据折线统计图解决实际问题、根据条形统计图解决实际问题 【分析】根据所给折线图、扇形图以及直方图,分析每个选项中涉及的量的变化,即可得答案. 【详解】对于A,从折线图能看出世界人口的总量随着年份的增加而增加,故A正确; 对于B,从扇形图中能够明显地看出2050年亚洲人口比其他各洲人口的总和还要多,故B正确; 对于C,从条形图中能够明显地看出2050年南美洲及大洋洲人口之和与欧洲人口基本持平,故C正确; 对于D,由题中三幅统计图可看得出北美洲人口数量最少, 并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故D错误. 故选:ABC 知识点04 用样本估计总体 1.用样本的数字特征根据总体的数字特征 (1)对称分布(如正态分布):众数 = 中位数 = 平均数; (2)左偏分布:平均数 < 中位数 < 众数;右偏分布:众数 < 中位数 < 平均数 2.用样本的分布来估计总体的分布 (1)总体在某区间的取值频率≈样本在该区间的频率; (2)总体的分布形状(如 “钟形”“左偏”“右偏”)与样本分布形状一致. 3.“大数据”简介 随着数据收集以及数据存储技术的不断进步,现在人们能够以非常便捷的方式、非常低廉的成本、非常快的速度,收集规模非常宏大的数据集合."大数据" 时代已经悄然来临. ·易错点:结论应用混淆. 示例:(25-26高一上·河南南阳·月考)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图. (1)求频率分布直方图中的值及样本成绩的第75百分位数; (2)求样本成绩的平均数; (3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差. 【答案】(1);84 (2)74 (3)62;37 【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、计算频率分布直方图中的方差、标准差、总体百分位数的估计 【分析】(1)根据频率分布直方图频率关系可得的值,再根据百分位数的概念求解样本成绩的第75百分位数即可; (2)根据频率分布直方图计算平均数即可; (3)根据样本的平均数与方差求解总体的平均数与方差即可. 【详解】(1)由频率分布直方图面积和为1, 可得, 解得; 成绩在的频率为, 则第75百分位数为. (2)由频率分布直方图可得样本平均数为 . (3)可知成绩落在的人数为人, 成绩落在的人数为人, 则两组总体成绩平均数为, 则总体方差为. 知识点05 样本空间与事件 1.样本点和样本空间: (1)样本点(基本事件):我们把随机试验中每一个可能出现的基本结果叫做样本点,用小写希腊字母 ω(欧米伽)表示. (2)样本空间:把一个随机试验中所有样本点组成的集合叫做这个试验的样本空间,用大写希腊字母 Ω(欧米伽)表示. 2.随机事件:一般地,我们把样本空间Ω的子集叫做随机事件,简称事件,用大写英文字母 A、B、C等表示.(1)基本事件:由单个样本点组成的事件(就是样本点本身对应的事件);(2)必然事件:在每次试验中一定发生的事件,即样本空间本身(Ω);(3)不可能事件:在每次试验中一定不发生的事件,即空集( ∅). 3.随机事件发生的概率: 概率的核心性质:(1)对任意随机事件A,有0≤P(A)≤1; (2)P(Ω)=1(必然事件概率为 1),P(∅)=0(不可能事件概率为 0); ·易错点:只要样本点有限,就用古典概型公式 —— 必须同时满足有限性 + 等可能性,缺一不可; 示例:(24-25高三上·四川绵阳·月考)在如下图的的方格表中选4个方格,要求每行和每列均恰有1个方格被选中,在所有符合上述要求的选法中,选中方格中的4个数之和的最小值是 . 8 27 32 62 3 23 37 63 6 27 38 66 5 26 39 66 【答案】126 【知识点】写出样本空间 【分析】先按列分析,可知十位数是固定的,利用列举法写出所有个位数的可能结果,即可求解. 【详解】先按列分析,每列必选出一个数,所选4个数的十位数字分别为0,2,3,6, 若选中方格中的4个数之和的最小值,则需要个位数之和最小, 每种选法可标记为,分别表示第一、二、三、四列的个位数字, 则所有的可能结果为: , , , , 此时最小为, 所以选中的方格中,的4个数之和最小,为. 故答案为:126. 知识点06 事件之间的关系与运算 1.事件的包含与相等 (1)若事件A发生必然导致事件B发生,则称事件B包含事件A(或事件A包含于事件B),记作A⊆B(或B⊇A). (2)若A⊆B且B⊆A,则称事件A与事件B相等,记作A=B. 2.事件的和(并):若事件发生当且仅当事件A发生或事件B发生(至少有一个发生),则称这个事件为事件A与事件B的和(并),记作A∪B(或A+B). 3.事件的积(交):若事件发生当且仅当事件A发生且事件B发生(两个事件同时发生),则称这个事件为事件A与事件B的积(交),记作A∩B(或AB). 4.事件的互斥与对立:(1)若A∩B=∅(A与B没有公共样本点),则称事件A与事件B互斥(互不相容);(2)若A∪B=Ω且A∩B=∅,则称事件A与事件B对立(互逆),称B为A的对立事件(逆事件),记作B=(或A=). 5.事件的混合运算: 运算规则(类比集合运算,优先级从高到低) 先算对立(补):(先求逆事件); 再算积(交):A∩B(再求交事件); 最后算和(并):A∪B(最后求并事件); 有括号先算括号内的,符号可简写:A∩B=AB, =∩, = ∪ ·易错点:误将 “互斥” 当作 “对立”、运算优先级错误 示例:(多选)(24-25高一下·全国·课后作业)(多选)对空中飞行的飞机连续射击两次,每次发射一枚炮弹,记事件“两次都击中飞机”,事件“两次都没击中飞机”,事件“恰有一次击中飞机”,事件“至少有一次击中飞机”,则(   ) A. B. C. D. 【答案】ABC 【知识点】事件的运算及其含义、确定所给事件的包含关系 【分析】A选项,事件A包含于事件D;B选项,事件B,D不能同时发生,B正确;C选项,根据事件运算得到C正确;D选项,,,D错误. 【详解】对于A,事件A包含于事件D,故A正确; 对于B,由于事件B,D不能同时发生,故,故B正确; 对于C,至少有一次击中飞机包含两种情况: 两次都击中飞机和恰有一次击中飞机,故,故C正确; 对于D,由于,不是必然事件,而为必然事件,故D不正确. 故选:ABC 知识点07 古典概型 1.若一个随机试验满足以下两个核心条件,则称这个试验的概率模型为古典概型(也叫等可能概型): (1)有限性:试验的样本空间Ω包含有限个样本点(基本事件有限); (2)等可能性:试验中每个样本点发生的可能性大小相等. 2.对于古典概型中的任意随机事件A,事件A发生的概率为: ·易错点:误将 “放回抽样” 当作 “不放回抽样”. 示例:(25-26高一上·辽宁锦州·月考)若将,,,,这个数字不重复填入如下表格中,有个表格中数字不能确定,用字母,,,表示,但可以确定为奇数,则的概率为 . 【答案】 【知识点】计算古典概型问题的概率 【分析】列出数组的所有情况,即可得实数对的所有情况,可判断满足条件的概率. 【详解】由已知数组的所有情况有,,,,,,,,,,,, 对应实数对的所有情况有,,,,,,,,,,,,共种, 其中满足的有,,,,共种, 所以满足的概率, 故答案为:. 知识点08 频率与概率 1. 频率:在相同条件下,重复做n次试验,若随机事件A发生了m次,则称为事件A发生的频率, 记作fn (A)= 2.概率:在相同条件下,当试验次数n很大时,事件A发生的频率f n (A)会稳定在某个常数p附近,这个常数p就叫做事件A发生的概率,记作P(A)=p. 3. 用频率估计概率 ① 频率是概率的近似值:试验次数n越大,频率fn (A)越接近概率P(A); ② 概率是频率的稳定值:频率围绕概率上下波动,当n→∞时,频率趋近于概率; ③ 取值范围一致:均满足0≤值≤1; ④ 特殊事件统一:不可能事件频率 / 概率均为 0,必然事件频率 / 概率均为 1. ·易错点:混淆频率与概率,认为 “频率 = 概率” 示例:(24-25高一下·天津河西·期末)一个不透明的袋中装有除颜色外均相同的8个红球,4个白球,若干个黑球,每次摇匀后随机摸出一个球,记下颜色后再放回袋中,经过大量重复实验后,发现摸到黑球的频率稳定在0.4,则袋中约有黑球(   ) A.6个 B.7个 C.8个 D.9个 【答案】C 【知识点】用频率估计概率 【分析】利用频率估计概率,可知随机摸出一个球摸到黑球的概率约为0.4,进而分析求解. 【详解】设袋中黑球有个, 利用频率估计概率,可知随机摸出一个球摸到黑球的概率约为0.4, 由题意可得:,解得, 所以袋中约有黑球8个. 故选:C. 知识点09 随机事件的独立性 1.定义:设A,B为两个随机事件,若满足P(A∩B)=P(A)⋅P(B)则称事件A与事件B相互独立,简称A,B 独立. 2.独立性的核心判定方法: (1)方法 1:定义法(根本方法,通用所有概率模型) 步骤:计算P(A)、P(B)、P(AB),验证是否满足P(AB)=P(A)P(B),满足则独立,不满足则不独立. (2)方法 2:直观法(经验判断,快速解题) 核心原则:若两个事件的发生互不影响、无因果关系、无关联,则可直接判定相互独立. 3. 概率的计算: (1)两独立事件同时发生的概率(积事件):若A,B相互独立,则P(AB)=P(A)P(B); (2)两独立事件至少一个发生的概率(和事件):若A,B相互独立, 则P(A∪B)=1−P( )P( ). 4. 对立事件的独立性:若A,B相互独立,则以下四组事件均相互独立:① A与; ② 与B;③ 与;④ A∪B与(若再加独立事件C). 5.推广结论: (1)多个独立事件同时发生的概率(推广): 若A1 ,A2 ,…,An相互独立,则P(A1 A2 ⋯An )=P(A1 )P(A2 )⋯P(An ) 文字:多个独立事件同时发生的概率 = 每个事件概率的连乘积。 (2)多个独立事件至少一个发生的概率: 若A1 ,A2 ,…,An相互独立,则 ·易错点:混淆 “独立” 与 “互斥”,认为独立就是互斥. 示例:(多选)(25-26高二上·山东淄博·月考)连续抛掷一枚质地均匀的硬币次,记录这次实验的结果.设事件表示“次实验结果中,既出现正面又出现反面”,事件表示“次实验结果中,至多出现一次正面”,则下列结论正确的有  (   ). A.若,则与互斥 B.若,则与不相互独立 C.若,则与不互斥 D.若,则与相互独立 【答案】BCD 【知识点】判断所给事件是否是互斥关系、计算古典概型问题的概率、独立事件的判断 【分析】依次写出和时样本总空间、事件的样本空间,以及利用古典概型求出相应的概率,再结合互斥事件和独立事件定义分析即可得解. 【详解】记抛掷一枚硬币正面向上为1,反面向上为0, 则连续抛掷一枚硬币两次的样本空间为, 此时事件的样本空间为,事件的样本空间为, 积事件的样本空间为, 所以事件交集不空,不互斥,且, 所以,故与不相互独立,故A错误,B正确; 连续抛掷一枚硬币3次的样本空间为共8个样本点, 此时事件的样本空间为共6个样本点, 事件的样本空间为共4个样本点, 积事件的样本空间为, 所以事件的交集不空,不互斥,且, 所以,故与相互独立,故CD正确; 故选:BCD 知识点10 统计与概率的应用 统计与概率的应用,本质是用统计的方法获取数据、估计总体特征,用概率的模型分析随机事件的可能性,结合二者解决生活 / 生产中的实际决策、推断、风险评估问题,是统计概率模块的最终落脚点. ·易错点:计算错误较多. 示例:(2025高一·全国·专题练习)某公司面临一个决策问题,有两种策略可选:策略A和策略B. 选择策略有的概率获得100万元收益,的概率获得50万元收益.—选择策略先进行市场调研,花费10万元.调研结果有两种可能:—结果1(概率):此时有的概率获得150万元收益,的概率获得30万元收益.—结果2(概率):此时有的概率获得120万元收益,的概率获得20万元收益. 公司希望最大化期望净收益(总收益减去成本).请问公司应选择哪种策略?期望净收益是多少? 【答案】公司应选择策略B,期望净收益为96.2万元,理由见解析 【知识点】决策中的概率思想 【分析】计算两种策略的期望净收益,进行比较,从而得到答案. 【详解】问题中,策略A的期望净收益:万元, 策略B的期望收益:调研结果1(概率): 期望收益为万元, 调研结果2(概率):期望收益为万元, 因此,策略B的总期望收益(不含调研成本): 万元 扣除调研成本10万元,策略B的期望净收益为:万元, 比较万元和万元,策略B的期望净收益更高. 因此,公司应选择策略B,期望净收益为96.2万元. 题型一 数据的数字特征 解|题|技|巧 1. 平均数计算技巧:平移法(均值简化法):任取一个常数a,令xi′=xi−a,先求,则=+a; 2.中位数快速求解技巧:先排序,再找中间位置; 3.频率分布直方图求中位数:中位数所在位置,左右两侧面积和均为 0.5; 4.众数只看 “出现频次”,与数据大小、位置无关; 易|错|点|拨 1. 加权平均数漏乘频数,直接算简单平均数; 2. 平移法还原时漏加常数a; 3. 频率分布直方图求平均数,用 “组限” 代替 “组中值”; 4. 新数据平均数公式用错,多乘 / 漏乘常数; 5.方差分母混淆n与n−1; 6.方差简便公式用错,符号错误 / 漏项; 7.方差计算时,(xi−)漏平方,直接算差的和; 8.综合分析易错点:只比平均数,不比方差,分析不全面. 【典例1】(25-26高二上·湖北孝感·期中)已知数据的平均数为5,方差为16,那么数据,的平均数和方差分别为(    ) A.6,8 B.5,8 C.6,4 D.8,6 【答案】C 【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响 【分析】根据平均数和方差的公式进行求解即可. 【详解】因为数据的平均数为5, 所以,解得, 所以数据的平均数为; 因为数据的方差为16, 所以, 化简得, 可以看出数据的方差为4. 故选:C. 【典例2】(多选)(25-26高一上·辽宁沈阳·月考)下列说法正确的是(   ) A.已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5 B.数据27,12,14,30,15,17,19,23的第70百分位数是23 C.若样本,,…,的平均值为8,则,,…,的平均值为15 D.某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出58人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为20人 【答案】BCD 【知识点】抽样比、样本总量、各层总数、总体容量的计算、平均数的和差倍分性质、计算几个数据的极差、方差、标准差、总体百分位数的估计 【分析】A项,根据平均数公式求的值并计算方差;B项,按步骤求解第70百分位数即可;C项,利用平均数的性质求新数据的平均数;D项,根据抽样比求解可得. 【详解】A选项,由平均数公式得,,解得, 根据方差公式得, ,故A项错误; B选项,将数据从小到大排序可得, 由不是整数, 所以第70百分位数是排序后第6个数,即,故B项正确; C选项,已知样本的平均值为, 即, 则的平均数为: , 故,所以C项正确; D选项,由题意知,抽样比为, 则从高二年级抽取人数为, 设高三年级学生中抽取的人数为, 则由,解得,故D项正确; 故选:BCD. 【变式1】(多选)(25-26高一上·辽宁辽阳·期末)已知一组样本数据:2,2,0,2,4,1,3,则下列关于该组样本数据说法不正确的是(   ) A.极差是5 B.众数不等于平均数 C.方差是 D.分位数是3 【答案】ABC 【知识点】计算几个数的众数、计算几个数的平均数、计算几个数据的极差、方差、标准差、总体百分位数的估计 【分析】将所给数据从小到大排列,由数据的最大值减去最小值可得极差,即可判断;出现次数最多的为众数,求出7个数据的平均数即可判断;根据方差公式求解即可判断;由百分位数的计算方法即可求解. 【详解】将,从小到大排列,得. 对于,由已知样本数据的最大值为,最小值为,所以极差为,故不正确; 对于,样本数据的众数为,平均数为,所以众数等于平均数,故不正确; 对于,方差为,故不正确; 对于,因为,所以分位数是第6个数,即,故正确. 故选:ABC.. 【变式2】(2025高一上·辽宁沈阳·专题练习)已知甲、乙两组按顺序排列的数据:甲组:27,28,37,,40,50;乙组:24,,34,43,48,52;若这两组数据的第30百分位数、第50百分位数分别对应相等,则等于 . 【答案】/ 【知识点】总体百分位数的估计 【分析】根据百分位数的定义计算,建立关于的方程组,解之即可求解. 【详解】对于甲组数据,, 所以甲组数据的第30百分位数为28,第50百分位数为 对于乙组数据,, 所以乙组数据的第30百分位数为,第50百分位数为. 由题意得,,解得, 所以. 故答案为: 题型二 数据的直观表示问题 解|题|技|巧 (一)四类图表通用解题技巧 1.审题先圈关键信息:圈出「样本容量、组距、分组区间、图表类型」,明确求 “频率 / 频数 / 数字特征 / 概率”; 2.数据转化三步走:图表读数→频率 / 频数转化→结合公式计算(所有考法的核心逻辑); 3.两组数据对比模板:先比「平均数 / 中位数」(平均水平)→再比「方差 / 数据分布」(稳定性)→结合图表特征(如直方图高低、茎叶图集中程度)下结论; 4.验算技巧:直方图验证「面积和 = 1」,扇形图验证「百分比和 = 100%」,频数验证「各组频数和 = 样本容量」,快速排查计算错误. (二)核心避坑4原则 1.看图表:先辨类型,再看标注,最后读数; 2.算数据:牢记公式,面积为率,组中为均; 3.求特征:直方看中位 / 平均 / 众数,茎叶看排序 / 稳定; 4.验结果:面积和为 1,频数和为总,百分比和为百 易|错|点|拨 1.频率分布直方图易错:(1)混淆纵轴含义,误将当作频率(致命错误);(2)组距与组数选择错误,导致数据分组失真;(3)计算中位数 / 平均数,误用 “组限” 代替 “组中值”;(4)忽略 “小矩形面积和 = 1”,计算后不验算. 2. 扇形图求圆心角,误算为百分比 ×180°; 3. 多图表数据不统一,样本容量混淆. 【典例1】(多选)(24-25高一上·辽宁葫芦岛·期末)为了关注学生的健康成长,某学校开展了一次高一年级学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则从图中能得出的信息是(    ) A.样本中A层次身高的女生少于男生 B.样本中B层次身高的学生人数最多 C.样本中D层次身高的学生人数占总人数的17% D.样本中E层次身高的男生有6人 【答案】ABC 【知识点】根据扇形统计图解决实际问题、补全扇形统计图、根据条形统计图解决实际问题 【分析】由题中统计图可判断各选项正误. 【详解】对于A,样本中女生人数为,则样本中男生有(人),样本中A层次身高的男生人数为,女生人数为4,所以样本中A层次身高的女生少于男生.故A正确; 对于B,因为男生中B层次身高的人数比例最大,女生中B层次身高的人数比例也最大,所以样本中B层次身高的学生人数最多.故B正确; 对于C,样本中D层次身高的女生有8人,D层次身高的男生有(人),所以样本中D层次身高的学生人数占总人数的比例为.故C正确; 对于D,样本中E层次身高的男生有(人).故D错误. 故选:ABC 【典例2】(24-25高一上·陕西西安·开学考试)为深化义务教育课程改革,某校积极开展拓展性课程建设,计划开设艺术、体育、劳技、文学等多个类别的拓展性课程,要求每一位学生都自主选择一个类别的拓展性课程.为了了解学生选择拓展性课程的情况,随机抽取了部分学生进行调查,并将调查结果绘制成如下统计图(部分信息未给出): 根据统计图中的信息,解答下列问题: (1)求本次被调查的学生人数. (2)将条形统计图补充完整. (3)若该校共有1600名学生,请估计全校选择体育类的学生人数. 【答案】(1)200 (2)答案见解析 (3)560 【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、根据条形统计图解决实际问题、抽样比、样本总量、各层总数、总体容量的计算 【分析】(1)结合题中给出的条形图和扇形图,选择劳技的人数和百分率都知道,即可求出被调查的学生人数; (2)有了总体,由扇形图可知选择文学的百分率是,即可求出选择文学的人数,再用学生总人数减去艺术、劳技、文学、其他的人数,得到选择体育的人数,并据此画完该条形图; (3)根据用样本估计总体的方法,先计算选择体育类的百分率,再乘以全校总人数即可. 【详解】(1)由条形图和扇形图,选择劳技的人数为60人,百分率是, 则被调查学生的总人数为:(人); (2)选择文学的百分率是,由(1)知被调查学生的总人数为人; 则选择文学的学生人数为:(人), 选择体育的学生人数:(人), 完成的条形图如下: (3)选择体育类的百分比为, 所以估计全校选择体育类的学生有(人) . 【变式1】(23-24高二下·陕西西安·期中)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为且支出在元的样本,其频率分布直方图如图所示,则下列说法正确的是(    )    A.估计众数为 B.估计中位数是 C.估计平均数为 D.支出在的频率为 【答案】B 【知识点】根据频率分布直方图计算众数、由频率分布直方图估计平均数、由频率分布直方图估计中位数、由频率分布直方图计算频率、频数、样本容量、总体容量 【分析】根据频率分布直方图的性质特征逐个选项求解判断即可. 【详解】由频率分布直方图可知, 支出在对应矩形最高,所以估计众数为,A错; 支出在的频率为,D错; 前两个矩形面积之和是, 故将第三个矩形分成即可, 所以中位数是,B正确; 平均数为,C错. 故选:B 【变式2】(2025高一下·全国·专题练习)如图是2024年5月~2025年5月“规模以上工业钢材同比增速及日均产量统计图”,则(    )    A.2024年5月~2025年5月,规模以上工业钢材日均产量呈上升趋势 B.2024年5月~2025年3月,规模以上工业钢材日均产量极差为万吨 C.2024年5月~2024年12月,规模以上工业钢材日均产量上四分位数为万吨 D.2025年3月~2025年5月,日均产量约为万吨 【答案】C 【知识点】总体百分位数的估计、计算几个数据的极差、方差、标准差、计算几个数的平均数、根据条形统计图解决实际问题 【分析】根据规模以上工业钢材日均产量变化趋势判断A;根据极差的定义判断B;根据上四分位数的定义判断C;计算出平均数判断D. 【详解】由图可知,2024年5月~2024年12月,规模以上工业钢材日均产量有上升也有下降,A错误; 2024年5月~2024年12月,规模以上工业钢材日均产量极差为(万吨),故B错误; ,故2024年5月~2024年12月,规模以上工业钢材日均产量上四分位数为(万吨),故C正确; 2025年3月~2025年5月,日均产量约为:,故D错误. 故选:C. 题型三 用样本估计总体 解|题|技|巧 1.计算平均数优先用加权公式:尤其当数据有重复频数时,简化计算; 2.方差计算简便公式,避免多次减平均数,减少计算错误; 3.比较两组数据:先比平均数(看平均水平),再比方差(看稳定性). 4.直方图计算频率 / 频数:频率 = 小矩形面积 = 组距 ×;频数 = 频率 × 样本容量; 5.直方图求中位数:先算前几组面积和,找到不足 0.5 的最后一组,设中位数为x,列方程; 6.直方图求平均数:提前算每组中点值,再乘对应频率,累加即可,避免逐个数计算; 7.茎叶图快速找中位数 / 众数:叶按顺序排列后,直接数位置 / 找出现次数最多的数. 易|错|点|拨 1.混淆 “中位数” 计算前提:未对数据排序直接找中间数,导致结果错误; 2.方差公式用错分母:高中用样本估计总体时,方差分母是n−1,不是n; 3.忽略极端值的影响:平均数易受极端值干扰,此时用中位数描述更合理; 4.误将 “样本数字特征” 当作 “总体数字特征”:样本特征是估计值,不是总体真实值; 5.纵轴理解错误:把当作频率,直接用纵轴数值求和(正确是面积求和 = 1); 6.组距与组数选择不当:组数过少(分布模糊)、组数过多(波动过大),导致分布估计失真; 7.直方图中中位数计算错误:未按 “面积和为 0.5” 找,而是直接找数据中间值; 8.误将 “样本分布” 当作 “总体分布”:样本分布是近似估计,总体分布是真实规律,存在抽样误差. 【典例1】(25-26高一上·甘肃·期末)从某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: 质量指标值分组 频数 6 26 38 22 8 (1)根据上表补全所示的频率分布直方图; (2)估计这种产品质量指标值的平均数、方差(同一组中的数据用该组区间的中点值作代表)及中位数(保留一位小数); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定? 质量指标值分组 频数 6 26 38 22 8 频率/组距 0.006 0.026 0.038 0.022 0.008 【答案】(1)答案见解析 (2)平均数为,方差为,中位数为99.7 (3)答案见解析 【知识点】由频率分布直方图估计平均数、由频率分布直方图估计中位数、频率分布直方图的实际应用、补全频率分布直方图 【分析】(1)由图表绘制直方图即可; (2)根据直方图,结合平均数、中位数的概念求值; (3)根据质量指标值不低于95的产品所占比例说明即可. 【详解】(1) 质量指标值分组 频数 6 26 38 22 8 频率/组距 0.006 0.026 0.038 0.022 0.008 则频率分布直方图如下图所示: (2)质量指标值的样本平均数为: , 质量指标值的样本方差为: , ∴这种产品质量指标值的平均数约为100,方差约为104. 第一组频率为:0.06,第二组频率为:0.26,第三组频率为:0.38, ∵,, ∴中位数落在第三组内,设中位数为x, 则,解得, 因此,中位数为99.7; (3)质量指标值不低于95的产品所占比例约为, 由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标不低于95的产品至少要占全部产品的80%”的规定. 【典例2】(25-26高一上·辽宁辽阳·期末)某工厂有工人人,其中名工人参加过短期培训(称为类工人),另外名工人参加过长期培训(称为类工人).现用分层抽样的方法(按类、类分二层)从该工厂的工人中共抽查 名工人,调查他们的生产能力(此处的生产能力指一天加工的零件数). (1)类工人和类工人中各抽查多少工人? (2)从类工人中的抽查结果和从类工人中的抽查结果分别如下表1和表2. 表1 生产能力分组 人数 表2 生产能力分组 人数 ①求、,再完成下列频率分布直方图; ②分别估计类工人和类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表). 【答案】(1)名和名; (2)①,,频率分布直方图见解析;②,,. 【知识点】由频率分布直方图估计平均数、补全频率分布直方图、抽样比、样本总量、各层总数、总体容量的计算 【分析】(1)先计算抽样比,进而可得各层抽取人数; (2)根据第一问结合表1和表2即可求出,根据频率分布直方图的画法即可画出频率分布直方图;利用频率分布直方图的平均数公式可求出答案. 【详解】(1)由已知可得,抽样比, 故类工人应抽取名,类工人应抽取名, 所以类工人和类工人中分别抽查名和名. (2)①由(1)得,解得, ,解得, 所以类工人生产能力频率分布直方图如下所示: 类工人生产能力频率分布直方图如下所示: ②, , , 所以类工人生产能力的平均数,类工人生产能力的平均数以及该工厂工人生产能力的平均数的估计值分别为、和. 【变式1】(24-25高一下·黑龙江·期末)为了了解某工厂生产的产品情况,从该工厂生产的产品中随机抽取了一个容量为400的样本,测量它们的尺寸(单位:mm),并将数据分为七组,其频率分布直方图如图所示.    (1)求值; (2)根据频率分布直方图,求400件样本中尺寸在内的样本数; (3)已知利用分层随机抽样从第一、二组共抽出十二个数据,从第一组,第二组抽出的数据的标准差分别为1和,平均值分别为93和94.5,求抽出数据的均值和方差. 参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:;记总的样本平均数为,样本方差为,则. 【答案】(1); (2)72件; (3)均值、方差分别为94、. 【知识点】计算几个数据的极差、方差、标准差、计算几个数的平均数、由频率分布直方图计算频率、频数、样本容量、总体容量、抽样比、样本总量、各层总数、总体容量的计算 【分析】(1)利用频率和为1列方程求参数值; (2)根据直方图估计400件样本中尺寸在内的样本数即可; (3)利用分层抽样中各层样本与总体均值、方差间的关系求总体的均值和方差. 【详解】(1)由图知,可得; (2)由图知400件样本中尺寸在内的样本数为件; (3)由分层抽样的等比例性质,第一、二组抽取数据分别为4、8个, 所以抽出数据的均值为, 抽出数据的方差为. 【变式2】(25-26高一上·贵州遵义·期中)某校高一年级20名学生期末考试数学成绩的频率分布直方图如图所示,其中成绩分组区间为. (1)求图中的值: (2)根据频率分布直方图,估计这200名学生数学成绩的平均分(同一组中的数据用该组区间的中点值作代表); (3)若从数学成绩在内的学生中用分层随机抽样的方法抽取7人,再从这7人中随机抽取2人分析学习情况,求抽到数学成绩在内各1人的概率. 【答案】(1) (2) (3) 【知识点】抽样比、样本总量、各层总数、总体容量的计算、补全频率分布直方图、由频率分布直方图估计平均数、计算古典概型问题的概率 【分析】(1)利用频率分布直方图小矩形面积之和为1,进而求解; (2)利用频率分布直方图计算平均数即可求解; (3)应用分层抽样的等比例性质求中各抽取的学生人数,再利用列举法及古典概型的概率求法求概率. 【详解】(1)由频率分布直方图得, 解得; (2)平均分约为. (3)应从数学成绩在内的学生中抽取人, 记为. 从数学成绩在内的学生中抽取人,记为. 从这7人中随机抽取2人的样本空间 成绩在内各1人的情况有, 所以抽到数学成绩在内各1人的概率. 题型四 事件之间的关系与运算 解|题|技|巧 事件的混合运算运算规则(类比集合运算,优先级从高到低) 1.先算对立(补):(先求逆事件); 2.再算积(交):A∩B(再求交事件); 3.最后算和(并):A∪B(最后求并事件); 4.有括号先算括号内的,符号可简写:A∩B=AB, =∩, = ∪ 易|错|点|拨 1.混淆 “A∪B” 与 “A+B”:仅互斥事件中A∪B可记为A+B,非互斥事件不能用 “+” 表示并事件; 2.误将 “互斥” 当作 “对立”:互斥是 “不同时发生”,对立是 “不同时发生且必其一发生”,互斥范围更广; 3.运算优先级错误:未先算对立再算积,直接算和,导致结果错误; 4.忽略 “同一样本空间”:只有同一试验的事件,才能讨论包含、互斥、和积运算. 【典例1】(多选)(24-25高二上·广东佛山·月考)如图,一个电路中有甲、乙、丙三个电子元件,设“甲元件故障”,“乙元件故障”,“丙元件故障”,则能表示电路是通路的事件是(   ) A. B. C. D. 【答案】ACD 【知识点】事件的运算及其含义、写出某事件的对立事件 【分析】要使电路是通路,则需甲原件正常,乙原件和丙原件至少有一个正常,分析各个选项表示的实际意义,得出结果. 【详解】A. 由题意得, “甲元件正常”, “乙、丙元件同时故障”, “乙原件和丙原件至少有一个正常”,故表示电路是通路. B. “甲、乙元件同时故障”,“甲原件和乙原件至少有一个正常”, “乙、丙元件同时故障”,“乙原件和丙原件至少有一个正常”,不能得到甲原件一定正常,故不能表示电路是通路. C. “甲元件正常”, “乙元件正常”, “丙元件正常”, “乙原件和丙原件至少有一个正常”,故表示电路是通路. D. “甲、乙元件均正常”, “甲、丙元件均正常”, 故表示电路是通路. 故选:ACD. 【典例2】(24-25高二上·广东佛山·月考)把分别写在10张形状大小一样的卡片上,并随机抽取1张.设事件:出现奇数,事件:出现被3除余2的数.写出下面两个事件的对应子集: (1)事件、事件至少有一个发生; (2)事件、事件恰好有一个发生. 【答案】(1) (2) 【知识点】事件的运算及其含义 【分析】(1)根据题意将事件一一列出,然后求它们的并事件即可; (2)根据题意将事件一一列出,然后求它们的交事件即可; 【详解】(1)由题意可知出现奇数所有可能为, 出现被3除余2的数的可能为, 所以A、B至少有一个发生为; (2)由(1)知事件,事件, 所以A、B同时发生为. 所以事件、事件恰好有一个发生为 【变式1】(24-25高二上·安徽阜阳·开学考试)已知某随机试验中,事件A,B,C发生的概率分别是,,,则下列说法正确的是(    ) A.()与C是互斥事件,且是对立事件 B.一定是必然事件 C.的概率一定不超 D.的概率一定等于0.5 【答案】C 【知识点】互斥事件与对立事件关系的辨析、判断所给事件是否是互斥关系、概率的基本性质、事件的运算及其含义 【分析】根据A,B,C不一定互斥,利用和事件的一般概率公式计算可判断各选项得解. 【详解】由事件A,B,C不一定两两互斥, 所以, ,且, 所以不一定是必然事件,无法判断与C是不是互斥事件, 所以A、B、D中说法错误. 故选:C. 【变式2】(24-25高一下·全国·课后作业)从学号为1,2,3,4,5,6的六名同学中选出一名同学担任班长,其中1,3,5号同学为男生,2,4,6号同学为女生,记:“选出1号同学”,“选出2号同学”,“选出3号同学”,“选出4号同学”,“选出5号同学”,“选出6号同学”,“选出的同学学号不大于1,”“选出的同学学号大于4,”“选出的同学学号小于6,”“选出的同学学号小于7”“选出的同学学号大于6”“选出的同学学号为偶数”,“选出的同学学号为奇数”,等等.据此回答下列问题: (1)上述事件中哪些是必然事件?哪些是随机事件?哪些是不可能事件? (2)如果事件发生,则一定有哪些事件发生? (3)如果事件H发生,则可能是哪些事件发生?在集合中,事件H与这些事件之间有何关系? (4)有没有某事件发生当且仅当事件A发生且事件B发生的情况?它们之间的关系如何描述? (5)两个事件的交事件也可能为不可能事件,在上述事件中能找出这样的例子吗? 【答案】(1)答案见解析 (2)答案见解析 (3)答案见解析 (4)答案见解析 (5)答案见解析 【知识点】事件的运算及其含义 【分析】(1)根据必然事件、随机事件、不可能事件的定义进行判断即可. (2)根据事件包含关系的定义进行判断即可. (3)根据和事件的定义进行判断即可. (4)根据交事件的定义进行判断即可. (5)根据交事件的性质进行判断即可. 【详解】(1)必然事件有E;随机事件有,,, ,,,,,,G,H;不可能事件有F. (2)事件,,和H一定发生. (3)可能是,,发生,. (4)和同时发生时,即为发生了,. (5)有,如和;和等. 题型五 随机事件的独立性 解|题|技|巧 1. 利用定义判断两事件是否独立. 2. 独立事件的积事件概率计算(直接套用公式). 3. “至少 / 至多” 类独立事件概率(优先用对立事件). 易|错|点|拨 1.混淆 “独立” 与 “互斥”,认为独立就是互斥; 2.凭直观判断独立,忽略定义验证(经验主义错误); 3.误用对立事件的独立性,认为A与B独立则A与A∪B独立; 4.多个事件仅证两两独立,就判定相互独立; 5.不放回抽样误判为独立事件. 【典例1】(24-25高一下·湖南岳阳·期末)“猜灯谜”又叫“打灯谜”,是元宵节的一项活动,出现在南宋时期.开始时是好事者把谜语写在纸条上,贴在五光十色的彩灯上供人猜.因为谜语既能启迪智慧又饶有兴趣,所以流传过程中深受社会各阶层的欢迎.在一次猜灯谜活动中,共有30道灯谜,三位同学独立竞猜,甲同学猜对了15道,乙同学猜对了10道,丙同学猜对了道.假设对每位同学而言,他们猜对每道灯谜的可能性都相等. (1)任选一道灯谜,求甲,乙两位同学恰有一个人猜对的概率; (2)任选一道灯谜,若甲,乙,丙三个人中至少有一个人猜对的概率为,求的值. 【答案】(1) (2) 【知识点】互斥事件的概率加法公式、利用对立事件的概率公式求概率、计算古典概型问题的概率、独立事件的乘法公式 【分析】(1)设出相应事件后,利用相互独立事件概率乘法公式进行求解即可; (2)利用对立事件的概率关系及相互独立事件概率乘法公式即可求出的值. 【详解】(1)设“甲猜对灯谜”为事件,“乙猜对灯谜”为事件, “任选一道灯谜,恰有一个人猜对”为事件C, 由题意得,,,且事件A、B相互独立, 则 . 所以任选一道灯谜,恰有一个人猜对的概率为. (2)设“丙猜对灯谜”为事件D, “任选一道灯谜,甲、乙、丙三个人都没有猜对”为事件E, 由题意知,甲、乙、丙三个人中至少有一个人猜对的概率为, 则其对立事件“三个人都没有猜对”的概率为, 因此 , 解得. 【典例2】(2025高一·全国·专题练习)某电子竞技比赛中,两支队伍进行(三局两胜制)比赛.每局比赛,强队对阵弱队时:若采取保守策略,获胜概率为,若A采取激进策略,获胜概率为,但若失败,下一局获胜概率降为,比赛开始时,可以自由选择策略.之后,每局开始前,可以根据当前比分选择策略. (1)若在第一局采取保守策略,求最终获胜的概率; (2)若在第一局采取激进策略,求最终获胜的概率; (3)应该在第一局选择哪种策略?为什么? 【答案】(1) (2) (3)应在第一局选择保守策略,理由见解析 【知识点】决策中的概率思想、互斥事件的概率加法公式、独立事件的乘法公式 【分析】(1)分为第一局胜和第一局负两种情况分别讨论,求出第二局选保守和选激进两种策略获胜的概率,选择最优策略,根据独立事件的概率计算公式即可求出答案; (2)分为第一局胜和第一局负两种情况分别讨论,求出第二局选保守和选激进两种策略获胜的概率,选择最优策略,根据独立事件的概率计算公式即可求出答案; (3)比较(1)(2)问两个概率的大小即可得到答案. 【详解】(1)第一局采取保守策略: 情况1:第一局胜(概率),此时比分, 若第二局选保守:胜率;败率,进入第三局选择激进策略(胜率) 若第二局选激进:胜率;败率,则进入第三局(胜率), 比较第二局策略:保守策略总胜率:,激进策略总胜率:, 由于,第二局应选保守策略,胜率为, 情况2:A第一局败(概率),此时比分 若第二局选保守:胜率;进入第三局选择激进策略(胜率), 若第二局选激进:胜率;第三局选择激进策略(胜率), 比较第二局策略:保守策略总胜率:,激进策略总胜率:, 由于,第二局应选激进策略,胜率为, 综上,第一局保守策略的总胜率. (2)第一局采取激进策略: 情况1:第一局胜(概率),此时比分, 第二局选保守:胜率;败率,则进入第三局选择激进策略(胜率), 第二局选激进:胜率;败率,则进入第三局(胜率), 比较第二局策略:保守策略总胜率:,激进策略总胜率:, 由于,第二局应选保守策略,胜率为, 情况2:第一局败(概率),此时比分, 因第一局使用激进策略失败,第二局胜率降为 若第三局选保守:胜率,若第三局选激进:胜率,所以第三局选择激进策略, 综上,第一局激进策略的总胜率: (3)因为,即第一局选择保守策略最终获胜的概率大于第一局选择激进策略最终获胜的概率,所以应在第一局选择保守策略. 【变式1】(25-26高一上·河南南阳·月考)先后两次掷一枚质地均匀的骰子,表示事件“两次掷出的点数之和是),表示事件“第二次掷出的点数是偶数”,表示事件“两次掷出的点数相同”,表示事件“至少出现一个奇数点”,则(   ) A.与互斥 B. C.与对立 D.与相互独立 【答案】D 【知识点】判断所给事件是否是互斥关系、互斥事件与对立事件关系的辨析、独立事件的判断 【分析】根据互斥事件与对立事件的关系判断A,C;根据对立事件概率计算即可判断B;根据结合古典概型求解概率,结合独立事件概率性质即可判断D. 【详解】若两次掷出的点数之和是4,由于每次掷出的点数都在1到6之间, 所以第一次掷出的点数一定小于4,而“两次掷出的点数相同”中的“”的点数之和等于4, 故与不互斥,故A错误; “至少出现一个奇数点”的对立事件是“两次掷出的点数都是偶数点”, 所以,故B错误; 由于“至少出现一个奇数点”的对立事件是“两次掷出的点数都是偶数点”.故B与D不是对立的,故C错误; 先后两次掷一枚质地均匀的骰子,两次出现的点数组有种等可能的不同情况, 第二次掷出的点数为偶数的情况有共18种不同情况, 两次掷出的点数相同的情况有:共6种, 两次掷出的点数相同且第二次掷出的点数为偶数的情况有共3种情况, 所以, 所以,所以独立,故正确. 故选:D. 【变式2】(25-26高二上·湖北·期中)甲、乙两人进行轮流投篮比赛,每人每次只投一球.约定先投中者获胜,当有人投中或者每人都已投球3次时投篮结束.设甲每次投篮投中的概率为,乙每次投篮投中的概率为,且两人各次投篮互不影响. (1)若甲先投篮,求投篮结束时,甲只投了2个球的概率; (2)若乙先投篮,求乙获胜的概率. 【答案】(1); (2) 【知识点】互斥事件的概率加法公式、独立事件的乘法公式 【分析】(1)分甲乙甲乙、甲乙甲(只有最后一局赢)两种情况,根据互斥事件和独立事件的概率公式计算; (2)分乙、乙甲乙、乙甲乙甲乙(只有最后一局赢)三种情况,根据互斥事件和独立事件的概率公式计算. 【详解】(1)设,分别表示甲、乙在第次投篮投中, 则由题意可得,, 记事件为“投篮结束时甲只投了2个球”, 则 , 即若甲先投,投篮结束时,甲只投了2个球的概率为; (2)若由乙首次投篮,记事件为“乙获胜”, 则 , 故若乙先投篮,乙获胜的概率为. 题型六 统计与概率的应用问题 解|题|技|巧 1用样本数字特征估计总体,做决策分析: (1)看平均水平:平均数 / 中位数高,代表整体性能优; (2)看稳定性:方差 / 标准差小,代表数据波动小,结果更可靠; 2.用频率分布估计总体,做区间推断: 核心依据:频率分布表、频率分布直方图(频率 = 概率近似值);推断原则:频率≈概率(试验 / 样本容量足够大时),用样本某区间的频率,估计总体在该区间的取值概率; 3.抽样方法的实际应用(保证样本代表性):根据总体特征选抽样方法,分层抽样按比例抽取,保证样本能真实反映总体,避免估计偏差; 4.互斥 / 对立事件的概率应用(“至少 / 至多” 场景):优先用对立事件,将 “至少发生” 转化为 “都不发生” 的反面,简化计算; 5.独立事件的概率应用(多事件互不影响场景):先判断事件独立性,再用乘积公式计算 “同时发生” 概率,用对立公式计算 “至少发生” 概率; 6.概率应用的决策原则:概率是事件发生可能性的量化指标,根据概率大小做决策.(1)利益最大化:选择概率大的有利事件(如选中奖概率高的抽奖方式、命中率高的选手);(2)风险最小化:选择概率小的不利事件(如选故障率低的设备、次品率低的产品);(3)公平性判断:若各方获胜 / 受益的概率相等,则方案公平;否则不公平(如游戏规则、抽签规则). .易|错|点|拨 (一)统计层面:样本无代表性、数字特征计算错误、直方图纵轴理解偏差; 1.样本缺乏代表性(如抽样片面、分层比例错误),导致估计失真; 2. 混淆样本数字特征与总体真实特征,将估计值当作确定值; 3. 频率分布直方图中,误将纵轴当作频率计算; 4. 忽略方差的实际意义,只看平均数不看稳定性. (二)概率层面:模型判断错误、独立 / 互斥混淆、等可能性忽略、对立事件误用; (三)综合层面:统计与概率衔接断层,未用统计结果估计概率,或概率计算脱离统计数据; (四)逻辑层面:结论无依据,未结合实际场景分析,仅单纯计算数据 / 概率 【典例1】(25-26高二上·山东·月考)为提高生产效率,某工厂开展技术创新活动,提出了完成某项任务的两种新的生产方式.为比较两种生产方式的效率,选取20名工人,将他们随机分成两组,每组10人,第一组工人采用第一种生产方式,第二组工人采用第二种生产方式.两组工人完成任务的工作时间(单位:min)如下: 生产方式 工作时间(单位:min) 第一种 68 72 76 77 79 82 83 83 84 85 第二种 65 65 66 68 69 70 71 72 72 73 假设每个工人完成工作所需时间相互独立,用频率估计概率. (1)从采用第一种生产方式的工人中随机抽取1人,估计该工人完成生产任务的工作时间小于的概率; (2)将工作时间分为三层,从第一组和第二组工人中各随机抽取1人,求这两人完成生产任务的工作时间不在同一层的概率. 【答案】(1) (2) 【知识点】独立事件的乘法公式、计算古典概型问题的概率、利用互斥事件的概率公式求概率 【分析】(1)根据古典概型概率公式直接求解即可. (2)先表示出事件并由古典概型概率公式求出概率,然后根据互斥事件概率加法公式和独立事件乘法公式求解即可. 【详解】(1)第一组工人中工作时间小于的有5人,占第一组人数的, 所以从采用第一种生产方式的工人中随机抽取1人,估计该工人完成生产任务的工作时间小于的概率为; (2)将工作时间段分别记为第一、二、三层,从第一组工人中抽取1人,该工人完成生产任务的工作时间属于第层,记作;从第二组工人中抽取1人,该工人完成生产任务的工作时间属于第层,记作; 这两人完成生产任务的工作时间不在同一层,记作;由题意得,, 所以,,,,, 所以. 【典例2】(23-24高二下·上海·月考)本市某区对全区高中生的身高(单位:厘米)进行统计,得到如下的频率分布直方图. (1)若数据分布均匀, 用频率估计概率,则在全市随机取一名高中生,求其身高不低于180厘米的概率; (2)现从身高在区间的高中生中分层抽样抽取一个80人的样本,若身高在区间中样本的均值为176厘米,方差为10;身高在区间[180, 190)中样本的均值为184 厘米,方差为16,试求这80人的方差. 【答案】(1); (2) 【知识点】利用互斥事件的概率公式求概率、估计总体的方差、标准差、由频率分布直方图计算频率、频数、样本容量、总体容量、抽样比、样本总量、各层总数、总体容量的计算 【分析】(1)先由频率分布直方图中每组的频率之和等于1求出的值,再对身高不低于180厘米的各个小组的频率进行累加即得; (2)由分层抽样确定两个组别分别抽取的人数,设出两组的样本,计算出所抽取的80人的身高总样本的均值,化简总样本方差公式,将数据代入计算即得. 【详解】(1)由频率分布直方图可得:解得 则在全市随机取一名高中生,求其身高不低于180厘米的概率为. (2)由于身高在区间,的人数之比为,所以分层抽样抽取80人,区间,内抽取的人数分别为50人与30人. 设在区间中抽取的50个样本为,其均值为176,方差为,即. 设区间中抽取的30个样本为.其均值为,方差为,即; 所以这80人身高的均值为. 从而这80人身高的方差为 因此,这80人身高的方差为 【变式1】(24-25高二上·广东湛江·月考)某校高二年级500名学生的学考适应性演练数学成绩频率分布直方图如图所示,其中成绩分组区间是,,,,,.    (1)求图中a的值; (2)估计这500名学生的这次考试数学成绩的中位数,第80百分位数; (3)估计这500名学生的这次考试数学成绩的平均数. 【答案】(1)0.0050 (2)90,122 (3)94 【知识点】总体百分位数的估计、由频率分布直方图估计平均数、由频率分布直方图估计中位数、频率分布直方图的实际应用 【分析】(1)根据频率之和为1列方程可求出的值. (2)计算中位数及第80百分位数所在的区间,利用中位数和百分位数的定义建立等量关系可计算出结果. (3)根据平均数的概念列式计算可得结果. 【详解】(1)根据频率之和为1可得,, 解得. (2)∵成绩在区间内的频率为:, ∴估计这500名学生的这次考试数学成绩的中位数为90. ∵成绩在区间内的频率为:, 成绩在区间内的频率为:, ∴第80百分位数在区间内,设第80百分位数为, 则,解得, 综上得,中位数为90,第80百分位数为. (3)设这500名学生的这次考试数学成绩的平均数为, 则. 【变式2】(2025高一·全国·专题练习)阶梯挑战赛中的排名跃迁,某电竞比赛采用阶梯挑战赛制,共有5个阶梯(从低到高为阶),初始时10支队伍随机分布在各阶梯上,分布情况为:1阶2队、2阶2队、3阶2队、4阶2队、5阶2队. 比赛规则: 1.每轮比赛,各阶梯内随机配对进行比赛(若某阶梯队伍数为奇数,则有一队轮空) 2.比赛胜者上升1阶,败者下降1阶(5阶胜者保持5阶,1阶败者保持1阶) 3.每轮结束后,重新按阶梯排序,进行下一轮比赛 4.比赛共进行3轮 假设每支队伍实力相当,任意两队比赛获胜概率均为,且各场比赛结果相互独立. (1)求初始位于3阶的某支队伍在3轮比赛后仍位于3阶的概率; (2)求初始位于3阶的某支队伍在3轮比赛后升至5阶的概率; (3)若某支队伍希望最大化3轮后位于5阶的概率,应选择从哪一阶开始比赛?证明你的结论. 【答案】(1) (2) (3)3轮后,证明见解析 【知识点】决策中的概率思想、利用互斥事件的概率公式求概率 【详解】(1)设表示该队第n轮后所处的阶梯,. 要使,需满足3轮中胜场数等于负场数,即1胜2负或2胜1负(因为3轮总比赛场次为3). 计算1胜2负的路径:—(概率:)—(概率:)—(概率:)—(概率:) 计算2胜1负的路径:—(已计算)(概率:)—(概率:)—(已计算) 注意:部分路径重复计算,实际不同路径为:—— 每条路径概率均为,共有6条路径,因此: (2)要使,需满足3轮中至少2胜且路径不违反阶梯边界. 可能路径:—(3胜,但第3轮在5阶胜后仍为5阶):概率—(2胜1负):概率—(2胜1负):概率, 因此:, (3)设从k开始,3轮后位于5阶的概率为. 对于—必须3连胜:,概率, 对于—3连胜:,概率—2胜1负(不影响最终到5阶):(无法到5阶)(无法到5阶)(无法到5阶)(已计入3连胜)因此,, 对于—如(2)所计算,, 对于—至少1胜:(概率)—1胜2负:(概率)—2胜1负:(无法到5阶)(概率)(已计入)因此,,对于—无需胜场:(概率1) 比较:, 因此,从5阶开始比赛,3轮后位于5阶的概率最大(为1).这符合直观,因为高阶梯起点意味着离目标更近,且5阶胜者保持5阶的规则使得从5阶开始的队伍不会下降. 期末基础通关练(测试时间:10分钟) 1.(2025高三上·江苏·学业考试)某工厂生产A,B两种不同型号的产品,产量之比为,现用分层抽样的方法抽取一个容量为的样本,若样本中型号的产品有40件,则(   ) A.80 B.100 C.120 D.200 【答案】B 【知识点】抽样比、样本总量、各层总数、总体容量的计算 【分析】根据分层抽样的方法计算样本容量即可. 【详解】A,B产品产量之比为,型号的产品有40件 B型号的产品有60件, . 故选:B. 2.(22-23高二上·广东佛山·期中)某商场推出抽奖活动,在甲抽奖箱中有四张有奖奖票,六张无奖奖票;乙抽奖箱中有三张有奖奖票,七张无奖奖票.每人能在甲乙两箱中各抽一次,以表示“在甲抽奖箱中抽奖中奖的事件”,表示“在乙抽奖箱中抽奖中奖的事件”,表示“两次抽奖均未中奖的事件”,下列结论中不正确的是(      ) A. B.与相互独立 C. D.与互斥 【答案】D 【知识点】判断所给事件是否是互斥关系、独立事件的判断、独立事件的乘法公式 【分析】分别求出,,进一步求出与,从而判断AC选项,在甲抽奖箱抽奖和在乙抽奖箱抽奖互不影响,故事件A和事件B相互独立,判断BD选项. 【详解】由题意可知:,,,, 因为在甲抽奖箱抽奖和在乙抽奖箱抽奖互不影响,可知事件A和事件B相互独立,故B正确,D错误; 可得,故A正确; 又因为, 所以,故C正确; 故选:D. 3.(23-24高一下·四川眉山·期末)为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为12的样本,并算得样本的平均数为5,方差为9.84;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为15.64.已知甲、乙两同学抽取的样本合在一起组成一个容量为20的样本,则合在一起后的样本方差为 . 【答案】12.4 【知识点】估计总体的方差、标准差 【分析】由分层抽样的方差公式求解. 【详解】甲同学抽取的样本占总样本的比例为, 乙同学抽取的样本占总样本的比例为, 总平均数为, 总方差为:, 故答案为: 4.(25-26高二上·山东济宁·期中)九宫格数独游戏是一种训练推理能力的数字谜题游戏,某九宫格如图所示,小王需要在九宫格上填上1至9中不重复的整数,小王通过推理已经得到了4个小格子中的准确数字,a,b,c,d,e这5个数字未知,且b,d为奇数,则的概率为 . 【答案】/ 【知识点】计算古典概型问题的概率 【分析】根据题意,列出关于的表格,结合古典摡型的概率计算公式,即可求解. 【详解】根据题意,小王需要再9个小格子中填上中不重复的整数, 小王通过推理已经得到了4个小格子中的准确数字, 且这5个数字未知,为奇数, 这个试验的等可能结果用下表表示: 2 2 6 6 8 8 2 2 6 6 8 8 1 1 1 1 1 1 3 3 3 3 3 3 6 8 2 8 2 6 6 8 2 8 2 6 3 3 3 3 3 3 1 1 1 1 1 1 8 6 8 2 6 2 8 6 8 2 6 2 共有12种情况,即基本事件的总数为, 其中包含着种,即, 所以的概率为. 故答案为:. 期末重难突破练(测试时间:10分钟) 1.(多选)(24-25高一下·江西南昌·月考)近日,数字化构建社区服务新模式成为一种时尚.某社区为优化数字化社区服务,问卷调查调研数字化社区服务的满意度,满意度采用计分制(满分100分),统计满意度绘制成如下频率分布直方图,图中,则下列结论正确的是(    ) A. B.满意度计分的众数为75分 C.满意度计分的75%分位数是85分 D.满意度计分的平均分是76 【答案】ABC 【知识点】根据频率分布直方图计算众数、总体百分位数的估计、由频率分布直方图估计平均数、由频率分布直方图计算频率、频数、样本容量、总体容量 【分析】根据频率之和为1即可求解A,根据众数,中位数以及平均数的计算即可分别求解BCD. 【详解】对于A,,解得,故A正确; 对于B,由图可知,70-80段的频率/组距值最大,所以众数为,故B正确; 对于C,前三组的频率之和为0.1+0.15+0.35=0.6<0.75,前四组的频率之和为0.6+0.3=0.9>0.75,则75%分位数,故,所以C正确; 对于D,,故D错误; 故选:ABC. 2.(多选)(25-26高一上·江西赣州·月考)下列说法正确的是(    ) A.用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则总体中个体被抽到的概率为0.03 B.已知一组数据1,2,,6,7的平均数为4,则这组数据的方差是5 C.数据27,12,14,30,15,17,19,23的第70百分位数是23 D.若样本数据的标准差为8,则数据的标准差为16 【答案】CD 【知识点】简单随机抽样的概率、根据平均数求参数、各数据同时乘除同一数对方差的影响、总体百分位数的估计 【分析】利用简单随机抽样的意义判断A,利用平均数和方差的计算公式判断B,利用百分位数的定义判断C,利用方差的性质判断D. 【详解】对于A,一个总体含有50个个体,从该总体中抽取一个容量为5的样本, 则指定的某个个体被抽到的概率为,故A错误; 对于B,因为数据1,2,,6,7的平均数是,所以,解得, 这组数据的方差是,故B错误; 对于C,该组数据从小到大排列为12,14,15,17,19,23,27,30,又, 故这组数据的第70百分位数为第6个数,即23,故C正确; 对于D,依题意,,则数据的方差为, 故数据的标准差为,故D正确. 故选:CD 3.(24-25高二下·山西·期中)“科学技术是第一生产力”.科技进步能够更好地推动高质量发展,如人工智能中的DeepSeek.某公司部门有员工100名,公司拟开展DeepSeek培训,分三轮进行,每位员工一轮至三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有两轮及两轮以上获得“优秀”的员工才能应用DeepSeek. (1)估计部门员工经过培训能应用DeepSeek的人数(去尾法精确到个位); (2)已知开展DeepSeek培训前,员工每人每年为公司创造利润6万元;开展DeepSeek培训后,能应用DeepSeek的员工每人每年平均为公司创造利润10万元.DeepSeek培训平均每人每年成本为1万元.根据公司发展需要,计划先将部门的部分员工随机调至公司其他部门,然后对其余员工开展DeepSeek培训.要保证培训后部门的年利润不低于员工调整前的年利润,部门最多可以调多少人到其他部门? 【答案】(1) (2) 【知识点】独立事件的乘法公式、利用互斥事件的概率公式求概率、其他问题中的概率解释 【分析】(1)求出每个员工“优秀”的概率,再乘以总人数即可得解; (2)设调出人,分别求出调整期和调整后的利润,再根据题意建立不等式,解之即可. 【详解】(1)由题意每个员工“优秀”的概率 , 则估计部门员工经过培训能应用DeepSeek的人数为个, 按去尾法取整,有人; (2)设调出人, 调整前的利润为(万元), 调整后的利润为, 要保证培训后部门的年利润不低于员工调整前的年利润, 则,解得, 因为为整数,所以最大值为, 即部门最多可以调人到其他部门. 期末综合拓展练(测试时间:15分钟) 1.(24-25高一上·河南焦作·期末)某林场在海拔(单位:米)0至2500米内均种植树木,从中随机抽取100棵树,将其海拔分布情况绘制成如图所示的频率分布直方图,再从海拔在的树中采用分层随机抽样的方式抽取5棵深入检查,用频率估计概率. (1)根据频率分布直方图,估计该林场树木海拔的中位数; (2)从参与深入检查的5棵树中随机选择3棵,求有且仅有2棵海拔在内的概率. 【答案】(1)1125米 (2) 【知识点】计算古典概型问题的概率、由频率分布直方图估计中位数、抽样比、样本总量、各层总数、总体容量的计算 【分析】(1)根据频率分布直方图判断海拔在的频率为0.4,海拔在的频率为0.8,则中位数在内,进而可估计该林场树木海拔的中位数; (2)从海拔在的树中采用分层随机抽样的方式抽取5棵,则从中抽取棵,从)中抽取棵,利用列举法,结合古典概型概率公式可得答案. 【详解】(1)计算各组对应的频率,海拔在为, 海拔在为,海拔在为, 故海拔在的频率为0.4, 海拔在的频率为0.8, 所以中位数在内, 故该林场树木海拔的中位数为(米) (2)从海拔在的树中采用分层随机抽样的方式抽取5棵深入检查, 故从的树中抽取(棵), 从)的树中抽取(棵), 设抽取的海拔在的树为,海拔在的树为, 故从这5棵树中随机选择3棵的可能结果有, ,,共10种, 其中有且仅有2棵海拔在内的可能结果有,,共6种, 故有且仅有2棵海拔在内的概率为. 2.(25-26高一上·辽宁锦州·月考)某校举办了校园诗词大赛,学生的比赛成绩均在内(单位:分),随机抽取了100名学生的成绩,整理后按照分成五组,并绘制成如图所示的频率分布直方图. (1)若规定成绩较高的前的学生获奖,请求出的值并估计获奖学生的最低分数线; (2)现从样本成绩在与两个分数段内,按分层随机抽样的方法选取5人,再从这5人中随机选取2人,求这2人中恰有1人的成绩落在内的概率; (3)已知样本数据落在的平均数是77,方差是6,落在的平均数是82,方差是3,求这两组数据合并后的平均数和总方差. 【答案】(1),84分 (2) (3)78,9.4 【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、计算几个数据的极差、方差、标准差、计算古典概型问题的概率、总体百分位数的估计 【分析】(1)根据频率分布直方图中各小组频率之和等于1,求出的值,根据题意,由百分位数确定获奖学生的最低分数线即可; (2)依题意,根据抽样比确定在和这两组内所抽取的人数,分别记为和,列出试验和所求事件包含的样本点,利用古典概型概率公式计算即得; (3)根据混合样本后的平均数与方差公式计算即可. 【详解】(1)由频率分布直方图易知,,解得, 由图知,的频率为.的频率为, 所以获奖学生最低分数线落在内,不妨设为, 则,解得, 所以估计获奖学生的最低分数线为84分. (2)由图可知,与的频率之比是, 根据分层随机抽样的方法可知,在内抽取4人,记为,在内抽取1人,记为, 从这5人中选取2人,则该试验的样本空间为: 则, 记事件“这2人中恰有1人的成绩落在内”, 则,则, 由古典概型概率公式,可得. (3)样本数据在内的人数为,在内的人数为, 所以, . 3.(25-26高三上·北京·月考)2025年3月14日(第六个国际数学日),某校开展了“站播台”、“史探秘”、“日海报”、“徽设计”、“帽设计”共5项挑战活动,每名学生至少参与其中一项活动.为了解该校上述活动的参与情况,现从高一、高二、高三学生中各随机选取100名学生作为样本进行调查,调查数据如下表: 挑战活动参与人数 站播台 史探秘 日海报 徽设计 帽设计 高一 80 45 55 75 45 高二 40 60 60 80 40 高三 15 50 40 20 30 通过样本估计该校全体学生参与活动的情况. (1)从5项活动中随机选择1项,估计此项活动全校参与的人数大于该校总人数的一半的概率; (2)从该校高一年级和高二年级中各随机选取2名学生,求这4名学生中恰有2名学生参与“徽设计”的概率; (3)假设高一某班参加挑战活动的情况如下: 挑战活动 站播台 史探秘 日海报 徽设计 帽设计 参与人数 7 9 已知,当数据,,,,的方差最小时,写出,,的取值.(结论不要求证明) 【答案】(1) (2) (3)答案见解析 【知识点】计算几个数据的极差、方差、标准差、计算古典概型问题的概率、独立事件的乘法公式 【分析】(1)根据题意找出符合题意的情况,利用古典概型即可求解; (2)由题可得高一、高二随机选取1名学生参与“徽设计”的概率,然后根据独立事件乘法公式可得. (3)先求出数据,,,,的平均数为8.2,进而结合方差的公式及特点求解即可. 【详解】(1)设“从5项活动中随机选择1项,此项活动全校参与的人数大于该校总人数的一半”, 根据题意,5项活动中,参与的人数大于该校总人数的一半的有:史探秘,日海报,徽设计, 则. (2)从该校高一年级中随机选取1名学生参与“徽设计”的概率为, 从高二年级中随机选取1名学生参与“徽设计”的概率为, 设“从高一年级随机选取2名学生,高二年级随机选取2名学生,这4名学生中恰有2名学生参与徽设计”, 则. (3)由, 则数据,,,,的平均数为 , 则数据,,,,的方差为 , 则的值集中在8.2附近时方差最小,又,, 此时的值为(任意分配),此情况相对更集中,其他情况较分散, 则或或. 1 / 3 学科网(北京)股份有限公司 $

资源预览图

专题05 统计与概率(期末复习讲义)高一数学上学期人教B版必修第二册
1
专题05 统计与概率(期末复习讲义)高一数学上学期人教B版必修第二册
2
专题05 统计与概率(期末复习讲义)高一数学上学期人教B版必修第二册
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。