内容正文:
专题02 概率初步与统计(14知识&16题型&4易错&3方法清单)
【清单01】样本点和样本空间
(1)定义:我们把随机试验的每个可能的基本结果称为样本点,全体样本点的集合称为试验的样本空间.
(2)表示:一般地,我们用表示样本空间,用表示样本点.如果一个随机试验有个可能结果,,…,,则称样本空间为有限样本空间.
【清单02】古典概型
1古典概型的定义
试验具有如下共同特征:
(1)有限性:样本空间的样本点只有有限个;
(2)等可能性:每个样本点发生的可能性相等.
我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.
2古典概型的判断
一个试验是否为古典概型,在于这个试验是否具有古典概型的两个特点:有限性和等可能性.并不是所有的试验都是古典概型.
下列三类试验都不是古典概型:
①样本点个数有限,但非等可能.②样本点个数无限,但等可能.③样本点个数无限,也不等可能.
【清单03】古典概型的概率计算公式
一般地,设试验是古典概型,样本空间包含个样本点,事件包含其中的个样本点,则定义事件的概率.
其中,和分别表示事件和样本空间包含的样本点个数.
【清单04】频率与概率
1随机事件的频率
在相同的条件下重复次试验,观察某一事件是否出现,称次试验中事件出现的次数为事件出现的频数,称事件出现的比例为事件出现的频率.
2频率的特点
随机事件在一次试验中是否发生具有不确定性,但是,在相同条件下的大量重复试验中,它发生的频
率有以下特点.
①在某次随机试验中,事件发生的频率是一个变量,事先是无法确定的.但在大量重复试验后,它又
具有稳定性,即频率在某个“常数”附近摆动,并且随着试验次数的增加,摆动的幅度具有越来越小的趋势.
②有时候试验也可能出现频率偏离“常数”较大的情况,但是随着试验次数的增加,频率偏离“常数”的可
能性会减小.
③个别随机事件在一次试验中可能出现也可能不出现,但在大量试验中,它出现的次数与总试验次数
之比常常是比较稳定的.这种现象称为频率的稳定性,是随机事件内在规律性的反映.
3频率的稳定性(用频率估计概率)
大量试验表明,在任何确定次数的随机试验中,一个随机事件发生的频率具有随机性.一般地,随着
试验次数的增大,频率偏离概概率的幅度会缩小,即事件发生的频率会逐渐稳定于事件发生
的概率.我们称频率的这个性质为频率的稳定性.因此,我们可以用频率估计概率.
【清单05】相互独立事件的概念
对任意两个事件与,如果成立,则称事件与事件相互独立(mutually independent),简称为独立.
性质1:必然事件、不可能事件与任意事件相互独立
性质2:如果事件与相互独立,则与,与,与也相互独立
则:,,
【清单06】互斥事件与对立事件
1互斥事件
一般地,如果事件与事件不能同时发生,也就是说是一个不可能事件,即,则称事件与事件互斥(或互不相容),符号表示:.
图示:
2对立事件
一般地,如果事件和事件在任何一次试验中有且仅有一个发生,即,且,那么
称事件与事件互为对立,事件的对立事件记为,符号表示:,且.
图示:
【清单07】互斥事件与相互独立事件的区别与联系
相互独立事件
互斥事件
判断方法
一个事件发生与否对另一个事件发生的概率没有影响
两个事件不可能同时发生,
即
概率公式
事件与相互独立等价于
事件与互斥,
则
【清单08】总体平均数与样本平均数
(1)总体平均数
一般地,总体中有个个体,它们的变量值分别为,,…,
则称为总体均值,又称总体平均数.
(2)加权平均数
如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数(),则总体均值还可以写成加权平均数的形式:.
(3)样本平均数
如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,
则称为样本均值,又称样本平均数.
【清单09】分层随机抽样的概念及特点
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个字总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2分层随机抽样的步骤
①根据己经掌握的信息,将总体分成互不相交的层;
②根据总体中的个体数和样本量计算抽样比;
③确定第层应该抽取的个体数目(为第层所包含的个体数),使得各之和为;
④在各个层中,按步骤③中确定的数目在各层中随机抽取个体,合在一起得到容量为的样本.
【清单10】分层随机抽样的平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和.我们用表示第1层各个个体的变量值,用表示第1层样本的各个个体的变量值;用表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
.
第2层的总体平均数和样本平均数分别为
.
总体平均数和样本平均数分别为
.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用.
【清单11】频率分布表与频率分布直方图
(1)频数与频率
将一批数据按要求分为若干个组,各组内数据的个数叫做该组的频数.每组数据的频数除以全体数据的个数的商叫做该组数据的频率.频率反映各个小组数据在样本量中所占比例的大小.
(2)样本的频率分布及频率分布表
根据随机抽取的样本量的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况)就
叫做样本的频率分布.
为了能直观地显示样本的频率分布情况,通常将样本量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,这张表叫做频率分布表.分组、频数、频率是频率分布表中最基本也是必要的三列,在实际操作中,每组的频数是通过类似统计选票时的“唱票”的方式进行统计的,所以通常频率分布表中
还会有“频数累计”一列.
(3)用样本的频率分布估计总体的分布
在实际应用中,总体分布可以为合理决策提供依据(总体分布描述的是总体在各个范围内个体的百分比).总体分布一般不好直接获得,往往通过样本的频率分布估计总体分布.用样本估计总体,是研究统计问
题的一个基本思想方法误区.
(4)样本的频率分布直方图
为了将频率分布表中的结果直观形象地表现出来,常画出频率分布直方图.画图时,应以横轴表示分组、纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,画成小长方形,这样得到的直方图就是频率分布直方图.
【清单12】第百分位数
(1)第百分位数的概念
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;
若是整数,则第百分位数为第项与第项数据的平均数.
(3)四分位数
在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.另外,像第1百分位数,第5百分位数,第95百分位数和第99百分位数在统计中也经常被使用.
【清单13】总体集中趋势的估计
(1)平均数
①定义:一组数据的和与这组数据的个数的商.数据,,的平均数为.
②特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.
(2)众数
①定义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数。
②特征:一组数据的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.
(3)中位数
①定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
②特征:一组数据的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.
【清单14】在频率分布直方图中平均数,中位数,众数的估计值
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
【题型一】基本事件
【例1】(24-25高二上·上海·期末)“抛掷一枚骰子,观察朝上的点数”的样本空间为 .
【变式1-1】(23-24高二上·上海·期末)从装有标号为1,2,3的三个球的袋子中依次取两个球(第一次取出的球不再放回),观察记录两个球标号(依次)的情况,则上述随机试验的样本空间中的基本事件数量是 .
【变式1-2】(23-24高二上·上海黄浦·期末)掷一颗质地均匀的骰子,观察朝上的点数,若A表示事件“点数大于3”,B表示事件“点数为偶数”,则事件“点数为5”可以表示为( )
A. B. C. D.
【变式1-3】(23-24高二上·上海黄浦·期末)袋子里装有大小与质地均相同的1个红球、1个白球和1个黑球,从中任取一个球,观察其颜色,该随机试验的样本空间中的样本点为 .(只需写出一个)
【题型二】古典概型
【例2】(23-24高三上·上海黄浦·期中)从3名男同学和2名女同学中任选2名同学参加志愿者服务,则选出的2名同学中至少有1名女同学的概率是( )
A. B. C. D.
【变式2-1】(22-23高二上·上海·单元测试)先后两次抛掷同一个骰子,将得到的点数分别记为a,b,则a,b,5能够构成等腰三角形的概率是( )
A. B. C. D.
【变式2-2】(24-25高二下·上海·期末)将一颗质地均匀的骰子先后抛掷次,则出现点数之和等于的概率是 .
【变式2-3】(24-25高二上·四川广安·期中)“石头、剪刀、布”是一种古老的游戏,操作简单,具有极为广泛的群众基础,游戏规则为:石头克剪刀,剪刀克布,布克石头.两人参加游戏,若两人都随机出手,则出手1次就能分出胜负的概率为 .
石头
剪刀
布
石头
石头、石头
石头、剪刀
石头、布
剪刀
剪刀、石头
剪刀、剪刀
剪刀、布
布
布、石头
布、剪刀
布、布
【题型三】频率与概率
【例3】(24-25高二上·上海金山·期末)某同学抛掷硬币100次,有51次出现正面.因此出现正面的频率是 .
【变式3-1】(24-25高二上·上海浦东新·期末)某袋子内装有三种颜色的小球,小明每次从袋子中随机摸出一个小球,观察颜色后再放回,重复了90次,得到的信息如下:观察到红色小球52次,蓝色小球26次.如果从这个袋子内任意摸一个小球,这个小球既不是红色也不是蓝色的经验概率为 .
【变式3-2】(2024·上海徐汇·一模)一个不透明的盒子中装有若干个红球和5个黑球,这些球除颜色外均相同.每次将球充分搅匀后,任意摸出1个球记下颜色后再放回盒子.经过重复摸球足够多次试验后发现,摸到黑球的频率稳定在0.1左右,则据此估计盒子中红球的个数约为( )
A.40个 B.45个 C.50个 D.55个
【变式3-3】(21-22高二上·上海崇明·期末)某药物公司实验一种降低胆固醇的新药,在500个病人中进行实验,结果如下表所示.
胆固醇降低的人数
没有起作用的人数
胆固醇升高的人数
307
120
73
则使用药物后胆固醇降低的经验概率等于 .
【题型四】独立事件的判断
【例4】(23-24高二下·上海·期末)现有4个礼品盒,前三个礼品盒中分别装了一支钢笔,一本书以及一个笔袋,第4个礼品盒中三样均有.现随机抽取一个礼盒,事件A为抽中的盒子里面有钢笔,事件B为抽中的盒子里面有书,事件C为抽中的盒子里面有笔袋,则下面选项正确的是( )
A.A与B互斥 B.A与B相互独立
C.A与互斥 D.A与相互独立
【变式4-1】(2024·江苏·模拟预测)有5张相同的卡片,分别标有数字,从中有放回地随机取两次,每次取1张卡片,表示事件“第一次取出的卡片上的数字为2”,表示事件“第一次取出的卡片上的数字为奇数”,表示事件“两次取出的卡片上的数字之和为6”,表示事件“两次取出的卡片上的数字之和为”,则( )
A.与为对立事件 B.与为相互独立事件
C.与为相互独立事件 D.与为互斥事件
【变式4-2】(23-24高二上·上海·期末)(1)骰子是每一面上分别标注数字圆点1,2,3,4,5,6且质地均匀的小正方体,常被用来做等可能性试验,习惯上总是观察朝上的面和点数,请写出下列随机试验的样本空间;
①单次掷一颗骰子,观察点数;
②先后掷两颗骰子,观察点数之和为7且第二次点数大于第一次点数的可能结果;
(2)掷一颗骰子,用分别表示事件“结果是偶数”与事件“结果不小于3”.请验证这两个随机事件是否独立,并请说明理由.
【变式4-3】(25-26高三上·上海·期中)投掷一枚均匀的骰子,若事件表示“掷出的倍数”,事件表示“掷出偶数”,事件表示“掷出合数”,则与事件独立的事件是( ).
A.是和 B.只有 C.只有 D.不存在
【题型五】互斥事件与对立事件与独立事件
【例5】(25-26高二上·广东汕头·月考)有4个相同的球,分别标有数字1,2,3,4,从中不放回的随机取两次,每次取1个球.甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是5”,丁表示事件“两次取出的球的数字之和是4”,则下列选项错误的是( )
A.甲与丙相互独立 B.甲与乙相互独立 C.丙与丁互斥 D.乙与丁互斥
【变式5-1】(22-23高一下·江苏宿迁·期末)下列关于互斥事件、对立事件、独立事件(上述事件的概率都大于零)的说法中正确的是( )
A.互斥事件一定是对立事件 B.对立事件一定是互斥事件
C.互斥事件一定是独立事件 D.独立事件一定是互斥事件
【变式5-2】(22-23高二上·上海杨浦·期末)已知,,,则事件与的关系是( )
A.与互斥不对立 B.与对立
C.与相互独立 D.与既互斥又独立
【变式5-3】(2025·河北石家庄·三模)已知随机事件A、B,表示事件B的对立事件,,,则下面结论正确的是( )
A.事件A与B一定是对立事件
B.
C.
D.若事件A、B相互独立,则
【题型六】独立事件乘法公式
【例6】(2025·上海黄浦·一模)甲、乙两人独立破译某个密码,甲译出密码的概率为,乙译出密码的概率为,则该密码被破译的概率为 .
【变式6-1】(2025·上海杨浦·一模)已知甲、乙两个篮球运动员罚球的命中率分别为、,两人各投一次,假设事件“甲命中”与“乙命中”是独立的,则至少有一个人命中的概率为 .
【变式6-2】(25-26高二上·上海松江·期中)若事件与事件相互独立,, ,则 .
【变式6-3】(25-26高三上·上海·月考)为调查JC学生户外活动时长和视力的关系,某研究小组在该校随机选取了100名学生,记录他们的日均户外活动时长(单位:小时)及近视情况,统计得到:日均户外活动时长在区间内有70人,近视率为80%;日均户外活动时长在区间内有20人,近视率为40%;日均户外活动时长在区间内有10人,近视率为20%.
注:近视率是指某区间内近视人数与该区间内人数的比值.
(1)估计该校日均户外活动时长不低于1小时的学生的近视率;
(2)用频率估计概率从该校日均户外活动时长低于1小时的学生和不低于1小时的学生中各随机选取2名,求这4名学生中恰有2名近视的概率;
【题型七】独立事件的实际应用
【例7】(2024·上海徐汇·一模)某企业招聘员工,指定“英语听说”、“信息技术”、“逻辑推理”作为三门考试课程,有两种考试方案.
方案一:参加三门课程的考试,至少有两门及格为通过;
方案二:在三门课程中,随机选取两门,并参加这两门课程的考试,两门都及格为通过.
假设某应聘者参加三门指定课程考试及格的概率分别是,且三门课程考试是否及格相互之间没有影响.
(1)分别求该应聘者选方案一考试通过的概率和选方案二考试通过的概率;
(2)试比较该应聘者在上述两种方案下考试通过的概率的大小,并说明理由.
【变式7-1】(25-26高二上·上海·期末)一名工人维护甲、乙两台独立的机床,在一小时内,甲需要维护和乙需要维护相互独立,它们的概率分别为,求下列事件的概率.
(1)一小时内没有一台机床需要维护;
(2)一小时内至少有一台机床不需要维护.
【变式7-2】(23-24高二上·上海长宁·期末)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首次比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场比赛轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都是,则甲最终获胜的概率是( )
A. B. C. D.
【变式7-3】(22-23高一下·甘肃庆阳·期末)为了备战2024年法国巴黎奥运会(第33届夏季奥林匹克运动会),中国射击队甲、乙两名运动员展开队内对抗赛.甲、乙两名运动员对同一目标各射击两次,且每人每次击中目标与否均互不影响.已知甲每次击中目标的概率为,乙每次击中目标的概率为.
(1)求甲两次都没有击中目标的概率;
(2)在四次射击中,求甲、乙恰好各击中一次目标的概率.
【题型八】递推法求概率
【例8】(24-25高二下·山东临沂·期中)甲、乙、丙、丁四人相互做传球训练,第一次由甲将球传出,每次传球时,传球者都等可能地将球传给其他人中的任意1人,设第n次传球后,球在甲手中的概率为.则( )
A.
B.若第3次传球后,戊开始加入传球训练,则
C.若第2次传球后,球恰好在丁手中,他将球传出后便离开了,则
D.若添加规定:当球在甲手中时,甲只能传给乙,乙再等可能传给其他人,则
【变式8-1】(2025·广东茂名·二模)甲、乙、丙三人练习传球,每次传球时,持球者会等可能地传给另外两人中的任意一位,若第一次由甲开始传球,则经过四次传球后,球回到甲手中的概率为( )
A. B. C. D.
【变式8-2】(2025·湖南永州·模拟预测)箱子里有四张卡片,分别写有数字1,2,3,4,每次从箱子中随机抽取一张卡片,各卡片被抽到的概率均为,记录卡片上的数字,然后将卡片放回箱子.重复这个操作,直到满足下列条件之一结束:
(a)第一次抽取的卡片上写的数字是4;
(b)设n为大于等于2的整数,第n次抽取的卡片上写的数字大于第次抽取的卡片上写的数字.例如,当记录的数字依次为3,2,2,4时,这个操作在第4次结束.
(1)若操作进行了4次仍未结束,求前四次抽取的情况总数;
(2)求操作在第n次结束的概率.
【变式8-3】(23-24高二下·云南曲靖·月考)小华玩一种跳棋游戏,一个箱子中装有大小质地均相同的且标有1~10的10个小球,每次随机抽取一个小球并放回,规定:若每次取到号码小于或等于5的小球,则前进1步,若每次取到号码大于5的小球,则前进2步.每次抽取小球互不影响,记小华一共前进步的概率为,则下列说法错误的是( )
A. B.
C.() D.小华一共前进2步的概率最大
【题型九】总体与样本
【例9】(22-23高二下·河北石家庄·期末)从全年级20个班中任取一个班,再从该班中任意抽取20名学生,考察他们本学期的期中考试的数学成绩,在这次抽样中样本容量为 .
【变式9-1】(25-26高二上·四川南充·月考)2020年3月疫情期间,某市质检部门为了检查某批个)口罩的质量,决定抽查其中的.在这个问题中下列说法正确的个数是( )
①总体是指这1000个口罩; ②个体是每个口罩;
③样本是按的比例抽取的20个口罩;④样本容量为20
A.1 B.2 C.3 D.4
【变式9-2】(25-26高二上·河南·开学考试)某校有个班,每班有人,要求从每班随机选派5人观看“校十佳歌手赛”决赛.在这个问题中样本容量是 .
【变式9-3】(24-25高三上·上海·月考)某校为了解高三年级学生体重情况,从该年级1000名学生中抽取125名学生测量他们的体重进行分析.在这项调查中,抽取的125名学生的体重是( )
A.总体 B.样本 C.总体容量 D.样本容量
【题型十】普查与抽查
【例10】(24-25高二上·上海·期末)在以下调查中,适合用普查的是( ).
A.调查某批次汽车的抗撞击能力 B.调查一批LED灯的寿命
C.调查某城市居民的食品消费结构 D.调查一个班级学生的身高情况
【变式10-1】(2020高一·全国·专题练习)“中国天眼”为500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
【变式10-2】(24-25高一下·天津河西·期末)下列调查方式合适的是( )
A.要了解一批节能灯泡的使用寿命,采用全面调查的方式
B.要调查某个班级同学的身高,采用抽样调查的方式
C.调查海河某段水域的水质情况,采用抽样调查的方式
D.调查全市高中生每天的睡眠时间,采用全面调查的方式
【变式10-3】(23-24高二·上海·课堂例题)完成下列任务所获得的数据是观测数据还是实验数据?
(1)某高校为了解大学一年级新生的计算机水平,举行了新生计算机水平测试,获得了每一位大学一年级新生的计算机成绩;
(2)某旅游公司为开发新的旅游产品,调查了500名客户对于旅游目的地的偏好;
(3)某科研团队研发出一种新型生态除草剂,检测了该除草剂防控稻田杂草的效果.
【题型十一】分层抽样
【例11】(25-26高三上·上海·期中)某单位老年、中年、青年员工分别有80人、100人、120人,现采用分层随机抽样的方法,从该单位上述员工中抽取30人调查专项附加扣除的享受情况,则应该从青年员工中抽取的人数为 .
【变式11-1】(24-25高一下·甘肃白银·期中)一个志愿者组织有成员45人,40岁以上的成员有25人,如果按照年龄进行分层随机抽样,要抽取一个容量为18的样本,则应抽取40岁以上成员的人数为( )
A.12 B.10 C.8 D.6
【变式11-2】(23-24高二上·上海黄浦·期末)某高中二年级共有学生425名,其中男生204名,女生221名,为了解该校高二年级学生的身高情况,从中抽取50名学生测量身高,若采用分层随机抽样的方法,则要抽取男生的人数为 .
【变式11-3】(22-23高二下·上海浦东新·期末)为了了解同学们的作业量,学校决定采用分层抽样的方法从高一、高二、高三学生中选取150人进行调查,已知高一学生有400人,高二学生有500人,高三学生有600人,则应抽取的高三学生人数为 .
【题型十二】分层抽样中的平均数和方差
【例12】(2025高二上·上海·专题练习)在对某中学高一年级学生身高调查中,采用按比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生30人,其平均数和方差分别为170和10,抽取了女生20人,其平均数和方差分别为160和20,则估计高一年级全体学生的身高方差为 .
【变式12-1】(2025·上海杨浦·一模)为了了解某校高三年级学生的体育成绩,随机选取名学生参加考核,将考核的成绩(满分分,成绩均为不低于分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)在考核成绩为,,的三组学生中,用分层抽样的方法抽取人,则考核成绩在中的学生应抽取多少人?
(3)若落在学生的平均成绩是,方差是,落在学生的平均成绩为,方差是,求这两组学生成绩的平均数和方差.(结果精确到)
【变式12-2】(25-26高二上·黑龙江大庆·开学考试)某公司为了调查员工的体重(单位:千克),因为女员工远多于男员工,所以按性别分层,用按比例分层随机抽样的方法抽取样本,已知抽取的所有员工的体重的方差为120,其中女员工的平均体重为50,方差为50,男员工的平均体重为70,方差为30.若样本中有21名男员工,则样本中女员工的人数为( )
A.68 B.63 C.35 D.48
【变式12-3】(24-25高一下·广东清远·期末)已知某中学共有学生1000名,其中男生有600人,现按性别采用分层随机抽样的方法抽取100人,抽取的样本中男生身高的平均数和方差分别为160和4,女生身高的平均数和方差分别为155和3,则估计该校学生身高的总体方差是( )
A.9.6 B.9 C.8.6 D.8
【题型十三】频率分布直方图
【例13】(24-25高二下·上海·期末)为积极参与马拉松比赛,某中学决定从3000名学生随机抽取100名学生进行体能检测,这100名学生进行了15公里的马拉松比赛,比赛成绩(分钟)的频率分布直方图如图所示,其中成绩分布区间是,,,,.
(1)求图中的值,并估计这100名学生比赛成绩的平均数;
(2)根据样本频率分布直方图,估计该校3000名学生中约有多少名学生能在80分钟内完成15公里马拉松比赛?
【变式13-1】(24-25高二下·上海虹口·期末)某校高一年级名同学在一次数学测验中成绩(百分制,均为整数)的频率分布直方图如图,则成绩在之间的学生人数为 .
【变式13-2】(23-24高二下·上海虹口·期末)为了解体育锻炼情况,随机统计了名学生在某个时间段内的体育锻炼时间,所得数据都在区间中,其频率分布直方图如图所示. 若在区间中的频数为30,则的值是 .
【变式13-3】(23-24高二下·上海杨浦·期末)学校开展国防知识竞赛,对100名学生的竞赛成绩进行统计,发现这100名同学的成绩都在[50,100]的范围内,可得到如图所示的频率分布直方图,其中分组的区间为,,,,,图中x的值是 .
【题型十四】茎叶图
【例14】(24-25高一下·上海·期末)已知抽样统计甲、乙两位同学8次数学成绩,绘制成如图所示的茎叶图,则成绩更稳定的那位同学成绩的方差为 .
【变式14-1】(23-24高一下·重庆长寿·期末)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数分别是 ( )
A.45,45 B.45,46
C.46,45 D.47,45
【变式14-2】(23-24高二下·上海静安·期末)甲、乙两位气步枪运动员在射击队内的选拔赛成绩茎叶图如右:
(1)求甲、乙两名选手射击的平均环数;
(2)请用具有统计意义的数量来刻画甲、乙两位运动员的射击成绩的稳定性,并帮助射击队选拔一名运动员外出参加比赛.
【变式14-3】(23-24高二上·上海·期末)某同学将观察学校柚子树生长习性作为自主研究课题,他观察了校园内6株柚子树成熟结果个数(两位数)并用茎叶图(如图所示)做了记录,则这6株柚子树成熟结果个数的中位数为( )
A.21 B.21.5 C.22 D.22.5
【题型十五】频率分布直方图中的平均数、众数、中位数
【例15】(25-26高三上·天津·月考)在一次科普知识竞赛中共有200名同学参赛,经过评判,这200名参赛者的得分都在之间,其得分的频率分布直方图如图,则下列结论错误的是( )
A.可求得 B.这200名参赛者得分的中位数为64
C.得分在之间的频率为 D.得分在之间的共有80人
【变式15-1】(2025·云南·模拟预测)某地区对100名新入职教师技能测试的成绩进行了分析,成绩都在区间内,绘制频率分布直方图如图.则下列结论中不正确的是( )
A.成绩在的频数为10 B.所有小矩形面积之和为1
C.成绩中位数在区间内 D.成绩平均数在区间内
【变式15-2】(25-26高三上·四川内江·月考)某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法错误的是( )
A.
B.评分在的人数约为20
C.估计评分的第25百分位数为65
D.估计评分的平均数为76.5
【变式15-3】(25-26高二上·云南·月考)为了深入调研学生会考模拟考试成绩,掌握学生数学会考成绩情况,现从该年级同学中随机抽取100名学生,对其测试成绩(满分:100分)进行统计,得到样本频率分布直方图,如图,下列说法不正确的是( )
A. B.众数为85
C.第70百分位数为80 D.该样本平均成绩为76
【题型十六】总体百分位数估计
【例16】(24-25高二下·上海松江·期末)一组数据70,72,78,79,80,81,84,86,88,94的第 70 百分位数是 .
【变式16-1】(24-25高二下·上海嘉定·期末)某个品种的小麦麦穗长度(单位:cm)的样本数据在7~12cm之间,其茎叶图如图所示(整数部分作为茎,小数部分作为叶),则该样本数据的第75百分位数是 .
【变式16-2】(2025·上海宝山·二模)甲、乙两名篮球运动员在8场比赛中的单场得分用茎叶图表示如左下图,茎叶图中甲的得分有部分数据丢失,但甲得分的折线图完好(右下图),则下列结论正确的是( )
A.甲得分的极差小于乙得分的极差
B.甲得分的第25百分位数大于乙得分的第75百分位数
C.甲得分的平均数大于乙得分的平均数
D.甲得分的方差小于乙得分的方差
【变式16-3】(24-25高二下·贵州贵阳·月考)2025年春节档上映的动画电影《哪吒之魔童闹海》引发全民观影热潮.某数据平台实时统计了该片上映前10天的全国单日票房(单位:亿元),并生成如图所示的折线图.假设横轴为上映时间(日期),纵轴为单日票房(亿),则下列说法正确的是( )
A.前十日之后,随着上映时间的增加,单日票房一定会呈现下降趋势
B.上映前十天的票房极差为4.76(亿)
C.上映前十天的票房中位数为6.34(亿)
D.上映前十天的票房第70百分位数为7.30(亿)
【题型一】不能正确提取图表信息
【例1】(23-24高二上·上海黄浦·期末)以下是“我国2018-2022年货物进出口总额统计图”,下列说法错误的是( )
A.从2019年开始,2020年的进口额年增长率最小
B.从2019年开始,2021年的出口额年增长率最大
C.从2019年开始,进出口总额逐年增大
D.从2019年开始,进出口总额年增长率逐年增大
【变式1-1】(24-25高二·上海·课堂例题)某校高二年级为选拔参加数学竞赛的学生组织了一次考试,最后选出13名男生和7名女生,这20名学生的考试成绩如茎叶图所示(单位:分),学校规定:成绩不低于130分的人到班培训,低于130分的人到班培训,如果用分层抽样的方法从到班的人和到班的人中共选取5人,则5人中到班的有 人.
【变式1-2】(22-23高二上·上海闵行·期末)甲、乙两名运动员5场比赛得分的茎叶图如图所示已知甲得分的极差为32,乙得分的众数为26,则 .
【变式1-3】(2023·上海宝山·二模)如图是某班一次数学测试成绩的茎叶图(图中仅列出,的数据)和频率分布直方图,则 .
【题型二】对样本数字特征认识不到位
【例2】(24-25高二下·上海·期末)已知数据、、…、的平均数为3,方差为520,则、、…、的平均数为 .
【变式2-1】(24-25高二下·上海杨浦·期末)已知数据,,,,的方差是4,则,,,,的方差为 .
【变式2-2】(2025·上海普陀·二模)某市职业技能大赛的移动机器人比赛项目有19位同学参赛,他们在预赛中所得的积分互不相同,只有积分在前10位的同学才能进入决赛.若该比赛项目中的某同学知道自己的积分后,要判断自己能否进入决赛,则他只需要知道这19位同学的预赛积分的( )
A.平均数 B.众数 C.中位数 D.方差
【变式2-3】(24-25高二下·上海虹口·期末)随着Deepseek的流行,各种大模型层出不穷,现有甲、乙两个大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分(满分10分),得到如图所示的统计表格:
评委编号模型名称
1
2
3
4
5
6
甲
8.0
9.2
8.0
8.2
8.6
8.4
乙
7.8
9.0
8.3
8.4
8.5
8.5
则下列结论正确的是( )
A.甲得分的平均数大于乙得分的平均数 B.甲得分的中位数大于乙得分的中位数
C.甲得分的极差大于乙得分的极差 D.甲得分的方差大于乙得分的方差
【题型三】混淆频率和概率
【例3】(21-22高二下·上海浦东新·期末)已知某厂的产品合格率为0.7,现抽出10件产品检查,则下列说法正确的是( )
A.合格产品少于7件 B.合格产品多于7件
C.合格产品正好是7件 D.合格产品可能是7件
【变式3-1】(25-26高二上·内蒙古赤峰·期中)某厂产品的次品率为2%,估算该厂8000件产品中合格品的件数为( )
A.7840 B.160 C.7998 D.1600
【变式3-2】(2026高三·全国·专题练习)某射击运动员平时训练成绩的统计结果如下:
命中环数
6
7
8
9
10
频率
0.1
0.15
0.25
0.3
0.2
如果这名运动员只射击一次,则命中的环数大于8环的概率为 ;命中的环数不超过5环的概率为 .
【变式3-3】(25-26高二上·湖北·期中)国庆长假市民旅游观光非常活跃.为提高服务质量,A市文旅部门对属地W景区的游客进行满意度调研,通过微信小程序共随机收集到300名游客的反馈数据如下表:
不满意
一般
满意
男性
15
20
女性
5
20
(1)请据此表数据,估计游客对景区的满意率;
(2)若,求满意的顾客中女性顾客不少于男性顾客的概率.
【题型四】混淆互斥与独立
【例4】(23-24高一下·云南·期末)已知甲盒中有3个大小和质地相同的小球,标号为,乙盒中有3个大小和质地相同的小球,标号为,现从甲、乙两盒中分别随机摸出1个小球,记事件“摸到的两个小球标号相同”,事件“摸到的两个小球标号之和为奇数”,则( )
A.事件A和相等 B.事件A和互相对立
C.事件A和相互独立 D.事件A和互斥
【变式4-1】(23-24高一下·河南安阳·月考)袋子中有5个相同的球,分别标有数字1,2,3,4,5,从中随机取出两个球,设事件A=“取出的球的数字之积为奇数”,事件B=“取出的球的数字之积为偶数”,事件C=“取出的球的数字之和为偶数”,事件D=“取出的球的数字之和大于5”,则下列说法错误的是( )
A.事件A与B是互斥事件 B.事件A与B是对立事件
C.事件C与D相互独立 D.事件C与D不是互斥事件
【变式4-2】(22-23高一下·江苏扬州·期末)抛掷两枚质地均匀的硬币一次,设“第一枚硬币正面朝上”为事件A,“第二枚硬币反面朝上”为事件B,则下述正确的是( ).
A.A与B对立 B.A与B互斥
C. D.A与B相互独立
【变式4-3】(21-22高二下·陕西咸阳·月考)已知是两个概率大于0的随机事件,则下列说法错误的是( )
A.若是对立事件,则是互斥事件
B.若事件相互独立,则与也相互独立
C.若事件相互独立,则与不互斥
D.若事件互斥,则与相互独立
【题型一】求百分位数
第一步:按从小到大排列原始数据.
第二步:计算.
第三步:若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
【例1】(25-26高三上·江苏南京·期中)已知样本数据,则该组数据的第60百分位数为( )
A.6 B.7 C.8 D.9
【变式1-1】(25-26高三上·云南昆明·期中)样本数据,,,,的第百分位数是( )
A. B. C. D.
【变式1-2】(24-25高一下·新疆阿克苏·期末)某班级的老师随机抽查了该班8名同学周末在家学习的时长(单位:h),所得数据如下:3,4,4,5,6,6,7,8,则这组数据的75%分位数为( )
A.6.5 B.6 C.5.5 D.5
【变式1-3】(2026高三·全国·专题练习)某次射击比赛中,甲、乙两名运动员在决赛中14次射击环数如图,则( )
A.甲的平均射击环数超过10.6
B.乙射击环数的第80百分位数为10.65
C.甲射击环数的标准差小于乙射击环数的标准差
D.乙射击环数的极差小于甲射击环数的极差
【题型二】互斥、对立事件的辨析
判断互斥事件、对立事件时,首先要明确两个事件包含的样本点,再判断两个事件的交事件是否是空集,是空集则两个事件是互斥事件;若这两个互斥事件的并事件是样本空间,则两个事件是对立事件. 注意事件对立的前提是互斥.
【例2】(25-26高三上·山西·月考)甲、乙两人玩石头、剪刀、布游戏.在一次游戏中,记事件:甲、乙两人出的都是剪刀;事件:甲、乙两人出的相同;事件:甲、乙两人至少有1人出的是布.则下列结论错误的是( )
A.与互斥 B.与互为对立事件
C. D.
【变式2-1】(2025高二上·浙江绍兴·专题练习)抛掷两枚质地均匀的硬币,设事件“第一枚反面向上”,事件“第二枚正面向上”,则下列说法正确的是( )
A.与互斥 B.
C.与对立 D.与相互独立
【变式2-2】(25-26高二上·湖北·期中)已知,,,则事件与的关系是( )
A.与互斥但不对立 B.与对立
C.与相互独立 D.与既互斥又相互独立
【变式2-3】(25-26高二上·福建泉州·期中)掷两枚质地均匀的骰子,设“第一枚出现偶数点”,“第二枚出现点数超过”,则事件与事件的关系为( )
A.相等 B.互斥 C.互为对立 D.相互独立
【题型三】求相互独立事件同时发生的概率的步骤
(1)确定各事件是相互独立的;
(2)确定各事件会同时发生;
(3)求每个事件发生的概率,再用公式求解.
【例3】(24-25高二下·上海松江·期末)为丰富学生的业余生活, 学校开展了一系列文体活动, 其中有一项是 3 对 3 篮球对抗赛. 现有甲、乙两队进行比赛,假设每局比赛结果相互独立且无平局,每局比赛甲队获胜的概率为 ,乙队获胜的概率为 .
(1)若采用三局两胜制(即先胜两局者赢得比赛,同时比赛结束)进行比赛,求甲队获胜的概率;
(2)若比赛有三局两胜制(即先胜两局者赢得比赛,同时比赛结束)和五局三胜制(即先胜三局者赢得比赛, 同时比赛结束)两种选择, 从概率角度考虑, 甲队如何选择对自己更有利? 请说明理由.
【变式3-1】(2023·上海宝山·一模)一个盒子中装有4张卡片,卡片上分别写有数字1、2、3、4.现从盒子中随机抽取卡片.
(1)若一次抽取3张卡片,事件A表示“3张卡片上数字之和大于7”,求;
(2)若第一次抽取1张卡片,放回后再抽取1张卡片,事件B表示“两次抽取的卡片上数字之和大于6”,求;
(3)若一次抽取2张卡片,事件C表示“2张卡片上数字之和是3的倍数”,事件D表示“2张卡片上数字之积是4的倍数”,验证C、D是独立的.
【变式3-2】(24-25高二上·四川成都·月考)甲、乙二人进行一次羽毛球比赛,有五局三胜制和三局两胜制两种赛制.五局三胜制中,约定先胜3局者获得这次比赛的胜利,同时比赛结束;三局两胜制中,约定先胜2局者获得这次比赛的胜利,同时比赛结束.假设在一局中,甲获胜的概率为0.6,乙获胜的概率为0.4,各局比赛结果相互独立.
(1)若采用五局三胜制,且已知前2局中,甲、乙各胜1局.
①求再赛2局结束这次比赛的概率;
②求甲获得这次比赛胜利的概率.
(2)采用五局三胜制还是三局两胜制对甲更有利,并通过计算说明理由.
【变式3-3】(24-25高三上·上海浦东新·期末)申辉中学为期两周的高一、高二年级校园篮球赛告一段落.高一小、高二小分别荣获了高一年级和高二年级比赛的年级MVP(最有价值球员).以下是他们在各自8场比赛的二分球和三分球出手次数及其命中率.
二分球出手
二分球命中率
三分球出手
三分球命中率
小
100次
100次
小
190次
10次
现以两人的总投篮命中率(二分球+三分球)较高者评为校(总投篮命中率总命中次数÷总出手次数)
(1)小认为,目测小的二分球命中率和三分球命中率均高于小,此次必定能评为校,试通过计算判断小的想法是否准确?
(2)小是游戏爱好者,设置了一款由游戏人物小、小轮流投篮对战游戏,游戏规则如下:①游戏中小的命中率始终为0.4,小的命中率始终为0.3,②游戏中投篮总次数最多为次,且同一个游戏人物不允许连续技篮.③游戏中若投篮命中,则游戏结束,投中者获得胜利;若直至第次投篮都没有命中,则规定第二次投篮者获胜.若每次游戏对战前必须设置“第一次投篮人物”和“”的值,请解答以下两个问题.
(ⅰ)若小第一次投篮,请证明小获胜概率大;
(ⅱ)若小第一次投篮,试问谁的获胜概率大?并说明理由.
学科网(北京)股份有限公5 / 5
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题02 概率初步与统计(14知识&16题型&4易错&3方法清单)
【清单01】样本点和样本空间
(1)定义:我们把随机试验的每个可能的基本结果称为样本点,全体样本点的集合称为试验的样本空间.
(2)表示:一般地,我们用表示样本空间,用表示样本点.如果一个随机试验有个可能结果,,…,,则称样本空间为有限样本空间.
【清单02】古典概型
1古典概型的定义
试验具有如下共同特征:
(1)有限性:样本空间的样本点只有有限个;
(2)等可能性:每个样本点发生的可能性相等.
我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.
2古典概型的判断
一个试验是否为古典概型,在于这个试验是否具有古典概型的两个特点:有限性和等可能性.并不是所有的试验都是古典概型.
下列三类试验都不是古典概型:
①样本点个数有限,但非等可能.②样本点个数无限,但等可能.③样本点个数无限,也不等可能.
【清单03】古典概型的概率计算公式
一般地,设试验是古典概型,样本空间包含个样本点,事件包含其中的个样本点,则定义事件的概率.
其中,和分别表示事件和样本空间包含的样本点个数.
【清单04】频率与概率
1随机事件的频率
在相同的条件下重复次试验,观察某一事件是否出现,称次试验中事件出现的次数为事件出现的频数,称事件出现的比例为事件出现的频率.
2频率的特点
随机事件在一次试验中是否发生具有不确定性,但是,在相同条件下的大量重复试验中,它发生的频
率有以下特点.
①在某次随机试验中,事件发生的频率是一个变量,事先是无法确定的.但在大量重复试验后,它又
具有稳定性,即频率在某个“常数”附近摆动,并且随着试验次数的增加,摆动的幅度具有越来越小的趋势.
②有时候试验也可能出现频率偏离“常数”较大的情况,但是随着试验次数的增加,频率偏离“常数”的可
能性会减小.
③个别随机事件在一次试验中可能出现也可能不出现,但在大量试验中,它出现的次数与总试验次数
之比常常是比较稳定的.这种现象称为频率的稳定性,是随机事件内在规律性的反映.
3频率的稳定性(用频率估计概率)
大量试验表明,在任何确定次数的随机试验中,一个随机事件发生的频率具有随机性.一般地,随着
试验次数的增大,频率偏离概概率的幅度会缩小,即事件发生的频率会逐渐稳定于事件发生
的概率.我们称频率的这个性质为频率的稳定性.因此,我们可以用频率估计概率.
【清单05】相互独立事件的概念
对任意两个事件与,如果成立,则称事件与事件相互独立(mutually independent),简称为独立.
性质1:必然事件、不可能事件与任意事件相互独立
性质2:如果事件与相互独立,则与,与,与也相互独立
则:,,
【清单06】互斥事件与对立事件
1互斥事件
一般地,如果事件与事件不能同时发生,也就是说是一个不可能事件,即,则称事件与事件互斥(或互不相容),符号表示:.
图示:
2对立事件
一般地,如果事件和事件在任何一次试验中有且仅有一个发生,即,且,那么
称事件与事件互为对立,事件的对立事件记为,符号表示:,且.
图示:
【清单07】互斥事件与相互独立事件的区别与联系
相互独立事件
互斥事件
判断方法
一个事件发生与否对另一个事件发生的概率没有影响
两个事件不可能同时发生,
即
概率公式
事件与相互独立等价于
事件与互斥,
则
【清单08】总体平均数与样本平均数
(1)总体平均数
一般地,总体中有个个体,它们的变量值分别为,,…,
则称为总体均值,又称总体平均数.
(2)加权平均数
如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数(),则总体均值还可以写成加权平均数的形式:.
(3)样本平均数
如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,
则称为样本均值,又称样本平均数.
【清单09】分层随机抽样的概念及特点
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个字总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2分层随机抽样的步骤
①根据己经掌握的信息,将总体分成互不相交的层;
②根据总体中的个体数和样本量计算抽样比;
③确定第层应该抽取的个体数目(为第层所包含的个体数),使得各之和为;
④在各个层中,按步骤③中确定的数目在各层中随机抽取个体,合在一起得到容量为的样本.
【清单10】分层随机抽样的平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和.我们用表示第1层各个个体的变量值,用表示第1层样本的各个个体的变量值;用表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
.
第2层的总体平均数和样本平均数分别为
.
总体平均数和样本平均数分别为
.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用.
【清单11】频率分布表与频率分布直方图
(1)频数与频率
将一批数据按要求分为若干个组,各组内数据的个数叫做该组的频数.每组数据的频数除以全体数据的个数的商叫做该组数据的频率.频率反映各个小组数据在样本量中所占比例的大小.
(2)样本的频率分布及频率分布表
根据随机抽取的样本量的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况)就
叫做样本的频率分布.
为了能直观地显示样本的频率分布情况,通常将样本量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,这张表叫做频率分布表.分组、频数、频率是频率分布表中最基本也是必要的三列,在实际操作中,每组的频数是通过类似统计选票时的“唱票”的方式进行统计的,所以通常频率分布表中
还会有“频数累计”一列.
(3)用样本的频率分布估计总体的分布
在实际应用中,总体分布可以为合理决策提供依据(总体分布描述的是总体在各个范围内个体的百分比).总体分布一般不好直接获得,往往通过样本的频率分布估计总体分布.用样本估计总体,是研究统计问
题的一个基本思想方法误区.
(4)样本的频率分布直方图
为了将频率分布表中的结果直观形象地表现出来,常画出频率分布直方图.画图时,应以横轴表示分组、纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,画成小长方形,这样得到的直方图就是频率分布直方图.
【清单12】第百分位数
(1)第百分位数的概念
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;
若是整数,则第百分位数为第项与第项数据的平均数.
(3)四分位数
在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.另外,像第1百分位数,第5百分位数,第95百分位数和第99百分位数在统计中也经常被使用.
【清单13】总体集中趋势的估计
(1)平均数
①定义:一组数据的和与这组数据的个数的商.数据,,的平均数为.
②特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.
(2)众数
①定义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数。
②特征:一组数据的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.
(3)中位数
①定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
②特征:一组数据的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.
【清单14】在频率分布直方图中平均数,中位数,众数的估计值
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
【题型一】基本事件
【例1】(24-25高二上·上海·期末)“抛掷一枚骰子,观察朝上的点数”的样本空间为 .
【答案】{(1点朝上),(2点朝上),(3点朝上),(4点朝上),(5点朝上),(6点朝上)},
【详解】由题意可得样本空间为:{(1点朝上),(2点朝上),(3点朝上),(4点朝上),(5点朝上),(6点朝上)},
故答案为:{(1点朝上),(2点朝上),(3点朝上),(4点朝上),(5点朝上),(6点朝上)},
【变式1-1】(23-24高二上·上海·期末)从装有标号为1,2,3的三个球的袋子中依次取两个球(第一次取出的球不再放回),观察记录两个球标号(依次)的情况,则上述随机试验的样本空间中的基本事件数量是 .
【答案】6
【分析】利用列举法即可直接得出结果.
【详解】设第一次取出的球标号为,第二次取出的球标号为,
记基本事件为,,
则所有的基本事件为,共6个.
所以上述随机试验的样本空间中的基本事件数量是6.
故答案为:6
【变式1-2】(23-24高二上·上海黄浦·期末)掷一颗质地均匀的骰子,观察朝上的点数,若A表示事件“点数大于3”,B表示事件“点数为偶数”,则事件“点数为5”可以表示为( )
A. B. C. D.
【答案】B
【分析】根据事件的和事件以及交事件,结合选项即可求解.
【详解】表示“点数为2”, 表示“点数5”, 表示“点数为3或2或1或4或6”, 表示“点数为1或3或4或5或6”,
故选:B
【变式1-3】(23-24高二上·上海黄浦·期末)袋子里装有大小与质地均相同的1个红球、1个白球和1个黑球,从中任取一个球,观察其颜色,该随机试验的样本空间中的样本点为 .(只需写出一个)
【答案】(白球)(答案不唯一)
【分析】根据样本点的定义即可求解.
【详解】所有的样本点为(白球),(黑球),(红球),
故答案为:(白球)(答案不唯一)
【题型二】古典概型
【例2】(23-24高三上·上海黄浦·期中)从3名男同学和2名女同学中任选2名同学参加志愿者服务,则选出的2名同学中至少有1名女同学的概率是( )
A. B. C. D.
【答案】B
【分析】根据给定条件,利用列举法结合古典概率计算即得.
【详解】记3名男同学为,2名女同学为,从5名同学中任选2名的结果有:
,共10个,
选出的2名同学中至少有1名女同学的事件含有的结果有,共7个,
所以选出的2名同学中至少有1名女同学的概率是.
故选:B
【变式2-1】(22-23高二上·上海·单元测试)先后两次抛掷同一个骰子,将得到的点数分别记为a,b,则a,b,5能够构成等腰三角形的概率是( )
A. B. C. D.
【答案】C
【分析】利用乘法原理求出基本事件总数,然后按照分类讨论的方法求出a,b,5能够构成等腰三角形的基本事件数,然后利用古典概型的概率公式求解即可.
【详解】由乘法原理可知,基本事件的总数是36,
结合已知条件可知,
当时,符合要求,有1种情况;
当时,符合要求,有1种情况;
当时,符合要求,有2种情况;
当时,符合要求,有2种情况;
当时,均符合要求,有6种情况;
当时,符合要求,有2种情况,
所以能构成等腰三角形的共有14种情况,
故a,b,5能够构成等腰三角形的概率.
故选:C.
【变式2-2】(24-25高二下·上海·期末)将一颗质地均匀的骰子先后抛掷次,则出现点数之和等于的概率是 .
【答案】
【分析】由古典概型概率计算公式即可求解.
【详解】将一颗质地均匀的骰子先后抛掷次有种可能的结果,
而出现点数之和等于的情况只能是先后抛出的点数均为6这一种情况,
故所求为.
故答案为:.
【变式2-3】(24-25高二上·四川广安·期中)“石头、剪刀、布”是一种古老的游戏,操作简单,具有极为广泛的群众基础,游戏规则为:石头克剪刀,剪刀克布,布克石头.两人参加游戏,若两人都随机出手,则出手1次就能分出胜负的概率为 .
【答案】
【分析】列出表格结合古典概型概率公式即得.
【详解】
石头
剪刀
布
石头
石头、石头
石头、剪刀
石头、布
剪刀
剪刀、石头
剪刀、剪刀
剪刀、布
布
布、石头
布、剪刀
布、布
从表中可以看出,两个人每次随机出手,则出手1次就能分出胜负的概率为.
故答案为:.
【题型三】频率与概率
【例3】(24-25高二上·上海金山·期末)某同学抛掷硬币100次,有51次出现正面.因此出现正面的频率是 .
【答案】0.51/
【分析】根据频率公式计算即可.
【详解】由题意,出现正面的频率为.
故答案为:0.51.
【变式3-1】(24-25高二上·上海浦东新·期末)某袋子内装有三种颜色的小球,小明每次从袋子中随机摸出一个小球,观察颜色后再放回,重复了90次,得到的信息如下:观察到红色小球52次,蓝色小球26次.如果从这个袋子内任意摸一个小球,这个小球既不是红色也不是蓝色的经验概率为 .
【答案】
【分析】计算红色球、蓝色球出现的频率,即为概率,由事件的关系可计算既不是红色也不是蓝色的概率.
【详解】记取到红球为事件A,取到蓝球为事件B,取到的球不是红球也不是蓝球为事件C.
所以,,
由题意,,且互斥,
则.
故答案为:
【变式3-2】(2024·上海徐汇·一模)一个不透明的盒子中装有若干个红球和5个黑球,这些球除颜色外均相同.每次将球充分搅匀后,任意摸出1个球记下颜色后再放回盒子.经过重复摸球足够多次试验后发现,摸到黑球的频率稳定在0.1左右,则据此估计盒子中红球的个数约为( )
A.40个 B.45个 C.50个 D.55个
【答案】B
【分析】因为重复摸球次数足够多,所以将频率视为概率,应用古典概型概率的计算公式计算即可.
【详解】设红球个数为,
由题意可得:,解得:.
故选:B
【变式3-3】(21-22高二上·上海崇明·期末)某药物公司实验一种降低胆固醇的新药,在500个病人中进行实验,结果如下表所示.
胆固醇降低的人数
没有起作用的人数
胆固醇升高的人数
307
120
73
则使用药物后胆固醇降低的经验概率等于 .
【答案】/0.614
【分析】根据经验概率的定义可求出结果.
【详解】依题意使用药物后胆固醇降低的人数为,又试验总次数为,
所以使用药物后胆固醇降低的经验概率等于.
故答案为:
【题型四】独立事件的判断
【例4】(23-24高二下·上海·期末)现有4个礼品盒,前三个礼品盒中分别装了一支钢笔,一本书以及一个笔袋,第4个礼品盒中三样均有.现随机抽取一个礼盒,事件A为抽中的盒子里面有钢笔,事件B为抽中的盒子里面有书,事件C为抽中的盒子里面有笔袋,则下面选项正确的是( )
A.A与B互斥 B.A与B相互独立
C.A与互斥 D.A与相互独立
【答案】B
【分析】根据互斥事件判断AC,结合独立事件的概率乘法公式判断BD.
【详解】由题意可知:事件A为取到第1或4个礼品盒,事件B为取到第2或4个礼品盒,事件C为取到第3或4个礼品盒,
对于选项A:因为事件为取到第4个礼品盒,所以A与B不互斥,故A错误;
对于选项B:因为,
可知,所以A与B相互独立,故B正确;
对于选项C:因为事件为取到第2或3或4个礼品盒,
则事件为取到第4个礼品盒,所以A与不互斥,故C错误;
对于选项D:因为事件为取到第4个礼品盒,则,
且事件为取到第4个礼品盒,则,
可知,所以A与不相互独立,故D错误;
故选:B.
【变式4-1】(2024·江苏·模拟预测)有5张相同的卡片,分别标有数字,从中有放回地随机取两次,每次取1张卡片,表示事件“第一次取出的卡片上的数字为2”,表示事件“第一次取出的卡片上的数字为奇数”,表示事件“两次取出的卡片上的数字之和为6”,表示事件“两次取出的卡片上的数字之和为”,则( )
A.与为对立事件 B.与为相互独立事件
C.与为相互独立事件 D.与为互斥事件
【答案】B
【分析】根据对立事件和互斥事件的定义即可判断AD;根据相互独立事件的定义结合古典概型公式进行计算,即可判断BC.
【详解】由题意,与互斥但不对立,故A错;
事件有共种,则,
事件有共种,则,
其中事件有共种,事件有共种,
,
则,所以与相互独立,故B对;
,所以与不独立,故C错;
因为与可同时发生,所以与不互斥,故D错.
故选:B.
【变式4-2】(23-24高二上·上海·期末)(1)骰子是每一面上分别标注数字圆点1,2,3,4,5,6且质地均匀的小正方体,常被用来做等可能性试验,习惯上总是观察朝上的面和点数,请写出下列随机试验的样本空间;
①单次掷一颗骰子,观察点数;
②先后掷两颗骰子,观察点数之和为7且第二次点数大于第一次点数的可能结果;
(2)掷一颗骰子,用分别表示事件“结果是偶数”与事件“结果不小于3”.请验证这两个随机事件是否独立,并请说明理由.
【答案】(1);②;(2)相互独立,理由见解析
【分析】(1)列举法即可求解,
(2)根据乘法公式验证即可判定是否独立.
【详解】(1)①;②.
(2),
,
则事件是相互独立的.
【变式4-3】(25-26高三上·上海·期中)投掷一枚均匀的骰子,若事件表示“掷出的倍数”,事件表示“掷出偶数”,事件表示“掷出合数”,则与事件独立的事件是( ).
A.是和 B.只有 C.只有 D.不存在
【答案】B
【分析】利用事件独立性的定义判断即可.
【详解】由题意可得,,,,,
由古典概型的概率公式可得,,,
所以,,
故事件与相互独立,事件与不独立.
故选:B.
【题型五】互斥事件与对立事件与独立事件
【例5】(25-26高二上·广东汕头·月考)有4个相同的球,分别标有数字1,2,3,4,从中不放回的随机取两次,每次取1个球.甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是5”,丁表示事件“两次取出的球的数字之和是4”,则下列选项错误的是( )
A.甲与丙相互独立 B.甲与乙相互独立 C.丙与丁互斥 D.乙与丁互斥
【答案】B
【分析】分别列出甲、乙、丙、丁可能的情况,然后根据独立事件、互斥事件的定义判断即可.
【详解】由题意可得两次取球所有可能情况为,,,,,,
,,,,,共种情况;
第一次取出的球的数字是1,所有可能为,,共3种情况;
第二次取出的球的数字是2,所有可能为,,共3种情况;
则两次取出球的数字之和为,的所有可能为,,,共种情况;
两次取出球的数字之和为,所有可能为,共种情况;
记“第一次取出的球的数字是1”为,“第二次取出的球的数字是2”为,
“两次取出的球的数字之和是5”为,“两次取出的球的数字之和是4”为,
则,,,.
A:当出现情况时,甲丙同时发生,则,
故甲丙相互独立,故A正确;
B:当出现情况时,甲乙同时发生,则,
故甲乙不相互独立,故B错误;
C:由不可能同时发生,故丙与丁互斥,故C正确;
D:由于两次不可能都取2,故乙丁不能同时发生,则乙与丁互斥,故D正确;
故选:B.
【变式5-1】(22-23高一下·江苏宿迁·期末)下列关于互斥事件、对立事件、独立事件(上述事件的概率都大于零)的说法中正确的是( )
A.互斥事件一定是对立事件 B.对立事件一定是互斥事件
C.互斥事件一定是独立事件 D.独立事件一定是互斥事件
【答案】B
【分析】根据互斥事件、对立事件、独立事件的概念进行判断即可.
【详解】互斥事件不一定是对立事件,对立事件一定是互斥事件,故A错误,B正确;
互斥事件一定不能同时发生,而独立事件可以同时发生,所以互斥事件一定不是独立事件,独立事件可能互斥也可能不互斥,故C,D均错误.
故选:B.
【变式5-2】(22-23高二上·上海杨浦·期末)已知,,,则事件与的关系是( )
A.与互斥不对立 B.与对立
C.与相互独立 D.与既互斥又独立
【答案】C
【分析】利用计算出,可得到则能得到与不互斥,不对立;再利用算出即可得到答案
【详解】由可得,
因为,则与不互斥,不对立,
由可得,
因为,所以与相互独立
故选:C
【变式5-3】(2025·河北石家庄·三模)已知随机事件A、B,表示事件B的对立事件,,,则下面结论正确的是( )
A.事件A与B一定是对立事件
B.
C.
D.若事件A、B相互独立,则
【答案】D
【分析】举例判断AB,由于不确定事件A、B的关系,故不能求解,即可判断C,结合对立事件概率公式和相互独立事件乘法公式求解判断D.
【详解】对于AB,一个密封的盒子中有标号为1,2,3,4,5的5个小球从中任取1球,
记事件A:从中取出球的标号为1,2,事件:从中取出球的标号为1,2,3,
则,满足,但不是对立事件,故A错误;
由上例可知,故B错误;
对于C,仅在事件A、B相互独立时才成立,而不知道事件A、B的关系,故不确定的值,错误.
对于D,若事件A、B相互独立,则事件A、也相互独立,
所以,正确.
故选:D
【题型六】独立事件乘法公式
【例6】(2025·上海黄浦·一模)甲、乙两人独立破译某个密码,甲译出密码的概率为,乙译出密码的概率为,则该密码被破译的概率为 .
【答案】
【分析】根据甲、乙两人破译某个密码为独立事件,利用独立事件概率公式求出甲、乙两人均未破译的概率,再利用对立事件概率公式求出该密码被破译的概率.
【详解】设甲破译某个密码为事件,乙破译某个密码为事件,
甲、乙两人独立破译某个密码,甲译出密码的概率为,乙译出密码的概率为,
甲未破译的概率为,乙未破译的概率为,
甲、乙两人均未破译的概率为,
“甲、乙两人均未破译”的对立事件为“密码被破译”,
该密码被破译的概率为.
故答案为:.
【变式6-1】(2025·上海杨浦·一模)已知甲、乙两个篮球运动员罚球的命中率分别为、,两人各投一次,假设事件“甲命中”与“乙命中”是独立的,则至少有一个人命中的概率为 .
【答案】
【分析】正难则反,先求其对立事件的概率,即两人都未命中的概率即可.
【详解】记事件“甲和乙至少一人命中”,则其对立事件为“甲和乙两人都未命中”,
由相互独立事件同时发生的概率乘法公式得,
所以.
故答案为:.
【变式6-2】(25-26高二上·上海松江·期中)若事件与事件相互独立,, ,则 .
【答案】0.6
【分析】考查事件的独立性,直接用其性质和运算法则求解即可.
【详解】因为事件与事件相互独立,所以事件与事件也相互独立,且,所以
所以.
故答案为:0.6.
【变式6-3】(25-26高三上·上海·月考)为调查JC学生户外活动时长和视力的关系,某研究小组在该校随机选取了100名学生,记录他们的日均户外活动时长(单位:小时)及近视情况,统计得到:日均户外活动时长在区间内有70人,近视率为80%;日均户外活动时长在区间内有20人,近视率为40%;日均户外活动时长在区间内有10人,近视率为20%.
注:近视率是指某区间内近视人数与该区间内人数的比值.
(1)估计该校日均户外活动时长不低于1小时的学生的近视率;
(2)用频率估计概率从该校日均户外活动时长低于1小时的学生和不低于1小时的学生中各随机选取2名,求这4名学生中恰有2名近视的概率;
【答案】(1)
(2)
【分析】(1)根据题意求相应人数和频率,即可得结果;
(2)分析可知从该校日均户外活动时长低于1小时、不低于1小时的学生中随机选取1名,这名学生近视的概率为、,结合独立事件概率乘法公式运算求解.
【详解】(1)由题意,样本中日均户外活动时长不低于1小时的学生有人,
其中近视的学生有人,
所以估计该校日均户外活动时长不低于1小时学生的近视率为.
(2)设事件“从该校日均户外活动时长低于1小时的学生和不低于1小时的学生中各随机选取2名,这4名学生中恰有2名近视”.
由题意,从该校日均户外活动时长低于1小时的学生中随机选取1名,这名学生近视的概率为,
从该校日均户外活动时长不低于1小时的学生中随机选取1名,这名学生近视的概率为.
则.
【题型七】独立事件的实际应用
【例7】(2024·上海徐汇·一模)某企业招聘员工,指定“英语听说”、“信息技术”、“逻辑推理”作为三门考试课程,有两种考试方案.
方案一:参加三门课程的考试,至少有两门及格为通过;
方案二:在三门课程中,随机选取两门,并参加这两门课程的考试,两门都及格为通过.
假设某应聘者参加三门指定课程考试及格的概率分别是,且三门课程考试是否及格相互之间没有影响.
(1)分别求该应聘者选方案一考试通过的概率和选方案二考试通过的概率;
(2)试比较该应聘者在上述两种方案下考试通过的概率的大小,并说明理由.
【答案】(1);
(2),理由见解析
【分析】(1)记该应聘者对三门指定课程考试及格的事件分别为,方案一即可表示为,方案二先考虑随机选取两门的概率为,再计算这两门都及格的概率即可.
(2)为了比较概率大小,可作差与比较即可.
【详解】(1)记该应聘者对三门指定课程考试及格的事件分别为,
则.
应聘者选方案一考试通过的概率
应聘者选方案二考试通过的概率
(2)
,
因为,所以,即.
故,即选方案一,该应聘者考试通过的概率较大.
【变式7-1】(25-26高二上·上海·期末)一名工人维护甲、乙两台独立的机床,在一小时内,甲需要维护和乙需要维护相互独立,它们的概率分别为,求下列事件的概率.
(1)一小时内没有一台机床需要维护;
(2)一小时内至少有一台机床不需要维护.
【答案】(1)
(2)
【分析】(1)设事件A为“甲机床需要维护”,事件B为“乙机床需要维护”, 一小时内没有一台机床需要维护,即,计算即可;
(2)一小时内至少有一台机床不需要维护,即,计算可得.
【详解】(1)设事件A为“甲机床需要维护”,事件B为“乙机床需要维护”,
则,
则一小时内没有一台机床需要维护,
即.
(2)一小时内至少有一台机床不需要维护,
即.
【变式7-2】(23-24高二上·上海长宁·期末)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首次比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场比赛轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都是,则甲最终获胜的概率是( )
A. B. C. D.
【答案】D
【分析】设甲失败的事件为,乙失败的事件为,丙失败的事件为,甲最终获胜事件为,根据题意列出的所有可能,结合独立事件乘法公式即可求解.
【详解】设甲失败的事件为,乙失败的事件为,丙失败的事件为,甲最终获胜事件为,
则甲最终获胜的概率为
.
故选:D.
【点睛】关键点睛:将甲最终获胜事件拆解为互斥事件的和,利用加法公式、乘法公式进一步得解.
【变式7-3】(22-23高一下·甘肃庆阳·期末)为了备战2024年法国巴黎奥运会(第33届夏季奥林匹克运动会),中国射击队甲、乙两名运动员展开队内对抗赛.甲、乙两名运动员对同一目标各射击两次,且每人每次击中目标与否均互不影响.已知甲每次击中目标的概率为,乙每次击中目标的概率为.
(1)求甲两次都没有击中目标的概率;
(2)在四次射击中,求甲、乙恰好各击中一次目标的概率.
【答案】(1)
(2)
【分析】(1)设甲第一次击中目标为事件,甲第二次击中目标为事件,结合独立事件乘法公式,求出事件概率即可得到答案;
(2)设乙第一次击中目标为事件,乙第二次击中目标为事件,结合独立事件乘法公式,求出事件的概率即可,
【详解】(1)设甲第一次击中目标为事件,甲第二次击中目标为事件,
则.
因为事件“甲两次都没有击中目标”即为事件,
则所求的概率为.
(2)设乙第一次击中目标为事件,乙第二次击中目标为事件,
则.
所以事件“四次射击中,甲、乙恰好各击中一次目标”表示为,
所以所求的概率为
【题型八】递推法求概率
【例8】(24-25高二下·山东临沂·期中)甲、乙、丙、丁四人相互做传球训练,第一次由甲将球传出,每次传球时,传球者都等可能地将球传给其他人中的任意1人,设第n次传球后,球在甲手中的概率为.则( )
A.
B.若第3次传球后,戊开始加入传球训练,则
C.若第2次传球后,球恰好在丁手中,他将球传出后便离开了,则
D.若添加规定:当球在甲手中时,甲只能传给乙,乙再等可能传给其他人,则
【答案】C
【分析】对于A,由题意可得传球递推关系,且初始条件,由递推关系可算得;
对于B,由A可知当传球3次后,球在甲手中的概率,接下来的递推关系不同,可算得此时;
对于C,第3次传球后球在甲手中的概率,接下来递推关系为,由此可算得;
对于D,添加规定后传球递推关系仍为,所以的值与A选项相同,由此可得出答案.
【详解】对于A,由题意可知第次传球后,球在甲手中的概率为,所以在其他人手中的概率为,
因为每次传球时,传球者都等可能地将球传给其他3人中的任意1人,
所以第次传球后,球在甲手中的概率为,可以得到传球递推关系:
,且,由此可算得,所以A错误;
对于B,当传球3次后,球在甲手中的概率,而接下来,
,所以B错误;
对于C,第2次传球后,球恰好在丁手中,第3次传球丁传给甲、乙、丙的概率均相等为,
故第3次传球后球在甲手中的概率,而接下来,,
,所以C正确;
对于D,添加的规定不影响传球递推关系:,所以,所以D错误.
故选:C.
【变式8-1】(2025·广东茂名·二模)甲、乙、丙三人练习传球,每次传球时,持球者会等可能地传给另外两人中的任意一位,若第一次由甲开始传球,则经过四次传球后,球回到甲手中的概率为( )
A. B. C. D.
【答案】C
【分析】由题意可列出球在甲手中的概率递推关系式,构造出等比数列,求出第次球在甲手中的概率表达式,代入计算即可.
【详解】设事件“第次球在甲手中”,“第次球在乙手中”,“第次球在丙手中”,
那么由题意可知:,又,
所以,构造等比数列,
因为第一次由甲传球,可认为第次传球在甲,即,
所以是以为首项,公比为的等比数列,
故,
则.
故选:C.
【变式8-2】(2025·湖南永州·模拟预测)箱子里有四张卡片,分别写有数字1,2,3,4,每次从箱子中随机抽取一张卡片,各卡片被抽到的概率均为,记录卡片上的数字,然后将卡片放回箱子.重复这个操作,直到满足下列条件之一结束:
(a)第一次抽取的卡片上写的数字是4;
(b)设n为大于等于2的整数,第n次抽取的卡片上写的数字大于第次抽取的卡片上写的数字.例如,当记录的数字依次为3,2,2,4时,这个操作在第4次结束.
(1)若操作进行了4次仍未结束,求前四次抽取的情况总数;
(2)求操作在第n次结束的概率.
【答案】(1)15;
(2)操作在第n次结束的概率为.
【分析】(1)由操作的的条件直接写出所有可能情况即可得解.
(2)设操作在第次结束的概率为,操作在第次未结束的概率为,由题设表示和,利用隔板法讨论操作进行了次,但是并没有结束的情形,从而求出,进而得解.
【详解】(1)由题意可得若操作进行了4次仍未结束,则前四次抽取的卡片数字可能为:
1111,2111,3111,2211,3211,3311,2221,3221,3321,3331,2222,3222,3322,3332,3333,共有15种情况.
(2)设操作在第次结束的概率为,操作在第次未结束的概率为.
则当时,,; 当时,.
接下来我们讨论操作进行了次,但是并没有结束的情形,抽取的数字结构如下所示:
分别设序列中的3,2,1的个数为,,,可知.
利用隔板法,可以知道对应情形的数量,操作如下:
令,,,即,
一共有种情形,
各情形概率均为,所以有,
当时,.
经检验,其对依然成立,所以.
【变式8-3】(23-24高二下·云南曲靖·月考)小华玩一种跳棋游戏,一个箱子中装有大小质地均相同的且标有1~10的10个小球,每次随机抽取一个小球并放回,规定:若每次取到号码小于或等于5的小球,则前进1步,若每次取到号码大于5的小球,则前进2步.每次抽取小球互不影响,记小华一共前进步的概率为,则下列说法错误的是( )
A. B.
C.() D.小华一共前进2步的概率最大
【答案】B
【分析】综合应用概率和数列的知识即可解决.
【详解】对于A,前进1步的概率和前进2步的概率都是,所以,故A正确;
对于B,,故B错误;
对于C,当时,其前进步是由两部分组成:第一部分先前进步,再前进1步,其概率为;第二部分先前进步,再前进2步,其概率为,所以,故C正确;
对于D,因为,可得,
即,因为,
所以,即,
可得,又,
所以数列是首项为,公比为的等比数列,可得.
当为奇数时,为偶数,则,即,
此时数列单调递增,所以;
当为偶数时,为奇数,则,此时数列单调递减,
所以,
综上,当时,概率最大,即小华一共前进2步的概率最大,故D正确.
故选:B.
【题型九】总体与样本
【例9】(22-23高二下·河北石家庄·期末)从全年级20个班中任取一个班,再从该班中任意抽取20名学生,考察他们本学期的期中考试的数学成绩,在这次抽样中样本容量为 .
【答案】20
【分析】先找出样本,即可求得样本容量.
【详解】从该班中任意抽取20名学生,考察他们本学期的期中考试的数学成绩,
样本为20名学生的数学成绩,
故在这次抽样中样本容量为20.
故答案为:20.
【变式9-1】(25-26高二上·四川南充·月考)2020年3月疫情期间,某市质检部门为了检查某批个)口罩的质量,决定抽查其中的.在这个问题中下列说法正确的个数是( )
①总体是指这1000个口罩; ②个体是每个口罩;
③样本是按的比例抽取的20个口罩;④样本容量为20
A.1 B.2 C.3 D.4
【答案】A
【分析】根据总体、个体、样本、样本容量的概念判断.
【详解】总体是研究对象的全体.这里是“1000个口罩的质量”,而非“1000个口罩”,所以①错误;
个体是总体中的单个单位.即“每个口罩的质量”,而非“每个口罩”,所以②错误;
样本是从总体中抽取的部分个体,即“按2%比例抽取的20个口罩的质量”,而非“20个口罩”,所以③错误;
样本容量是样本中个体的数量,抽取了1000×2%=20,所以样本容量为20,④正确.
故选:A.
【变式9-2】(25-26高二上·河南·开学考试)某校有个班,每班有人,要求从每班随机选派5人观看“校十佳歌手赛”决赛.在这个问题中样本容量是 .
【答案】
【分析】样本容量是个班一共选派的总人数.
【详解】由题意可知在这个问题中样本容量是36×5=180.
故答案为:
【变式9-3】(24-25高三上·上海·月考)某校为了解高三年级学生体重情况,从该年级1000名学生中抽取125名学生测量他们的体重进行分析.在这项调查中,抽取的125名学生的体重是( )
A.总体 B.样本 C.总体容量 D.样本容量
【答案】B
【分析】根据样本的定义即可求解.
【详解】抽取的125名学生的体重是样本,
故选:B
【题型十】普查与抽查
【例10】(24-25高二上·上海·期末)在以下调查中,适合用普查的是( ).
A.调查某批次汽车的抗撞击能力 B.调查一批LED灯的寿命
C.调查某城市居民的食品消费结构 D.调查一个班级学生的身高情况
【答案】D
【分析】根据普查的概念判断即可;
【详解】A选项,每个批次生产的汽车的数量非常多,且调查汽车抗重击能力具有破坏性,不适合使用普查,应使用抽样调查;
B选项,调查一批LED灯的寿命具有破坏性,不宜使用普查,应使用抽样调查;
C选项,某城市居民数量非常多,不适合使用全面普查,应使用抽样调查;
D选项,一个班级学生的身高情况,人数较少,适合用普查;
故选:D
【变式10-1】(2020高一·全国·专题练习)“中国天眼”为500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
【答案】C
【分析】根据获取数据的途径判断即可.
【详解】“中国天眼”主要是通过观察获取数据.
故选:C.
【变式10-2】(24-25高一下·天津河西·期末)下列调查方式合适的是( )
A.要了解一批节能灯泡的使用寿命,采用全面调查的方式
B.要调查某个班级同学的身高,采用抽样调查的方式
C.调查海河某段水域的水质情况,采用抽样调查的方式
D.调查全市高中生每天的睡眠时间,采用全面调查的方式
【答案】C
【分析】根据全面调查与抽样调查的定义逐项判断即可.
【详解】对于A,了解一批节能灯的使用寿命,调查过程带有破坏性,只能采取抽样调查,
而不能将整批节能灯全部用于实验,故A错误;
对于B,要调查某个班级同学的身高,采用全面调查的方式,故B错误;
对于C,调查海河某段水域的水质情况,采用抽样调查的方式,故C正确;
对于D,调查全市高中生每天的睡眠时间,采用抽样调查的方式,故D错误.
故选:C.
【变式10-3】(23-24高二·上海·课堂例题)完成下列任务所获得的数据是观测数据还是实验数据?
(1)某高校为了解大学一年级新生的计算机水平,举行了新生计算机水平测试,获得了每一位大学一年级新生的计算机成绩;
(2)某旅游公司为开发新的旅游产品,调查了500名客户对于旅游目的地的偏好;
(3)某科研团队研发出一种新型生态除草剂,检测了该除草剂防控稻田杂草的效果.
【答案】(1)观测数据
(2)观测数据
(3)实验数据
【分析】(1)根据观测数据与实验数据的意义作答即可;
(2)根据观测数据与实验数据的意义作答即可;
(3)根据观测数据与实验数据的意义作答即可.
【详解】(1)通过举行新生计算机水平测试,获得了每一位大学一年级新生的计算机成绩,是通过调查观测得到的数据,是观测数据.
(2)调查500名客户对于旅游目的地的偏好,是通过调查观测得到的数据,是观测数据.
(3)检测该除草剂防控稻田杂草的效果,是通过控制实验对象来看对何种杂草的试验效果,是实验数据.
【题型十一】分层抽样
【例11】(25-26高三上·上海·期中)某单位老年、中年、青年员工分别有80人、100人、120人,现采用分层随机抽样的方法,从该单位上述员工中抽取30人调查专项附加扣除的享受情况,则应该从青年员工中抽取的人数为 .
【答案】
【分析】根据分层抽样求解即可.
【详解】由分层抽样可知,应从青年员工中抽取的人数为(人),
故答案为:
【变式11-1】(24-25高一下·甘肃白银·期中)一个志愿者组织有成员45人,40岁以上的成员有25人,如果按照年龄进行分层随机抽样,要抽取一个容量为18的样本,则应抽取40岁以上成员的人数为( )
A.12 B.10 C.8 D.6
【答案】B
【分析】计算分层抽样的抽取比例乘以样本容量可得答案.
【详解】因为分层抽样的抽取比例为,所以应抽取40岁以上成员的人数为.
故选:B
【变式11-2】(23-24高二上·上海黄浦·期末)某高中二年级共有学生425名,其中男生204名,女生221名,为了解该校高二年级学生的身高情况,从中抽取50名学生测量身高,若采用分层随机抽样的方法,则要抽取男生的人数为 .
【答案】
【分析】应用分层抽样的等比例关系求样本中要抽取男生的人数.
【详解】由分层抽样的等比例性质,要抽取男生为人.
故答案为:
【变式11-3】(22-23高二下·上海浦东新·期末)为了了解同学们的作业量,学校决定采用分层抽样的方法从高一、高二、高三学生中选取150人进行调查,已知高一学生有400人,高二学生有500人,高三学生有600人,则应抽取的高三学生人数为 .
【答案】60
【分析】根据分层抽样的定义求解即可.
【详解】由题可知,三个年级共有人,
抽样比例为,
则抽取的学生中,高三年级有人.
故答案为:60.
【题型十二】分层抽样中的平均数和方差
【例12】(2025高二上·上海·专题练习)在对某中学高一年级学生身高调查中,采用按比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生30人,其平均数和方差分别为170和10,抽取了女生20人,其平均数和方差分别为160和20,则估计高一年级全体学生的身高方差为 .
【答案】38
【分析】根据题意,利用分层抽样的总体均值和方差公式,进行计算,即可求解.
【详解】根据分层抽样的均值和方差的计算公式,可得:
总体均值为:,
总体方差为:.
故答案为:38
【变式12-1】(2025·上海杨浦·一模)为了了解某校高三年级学生的体育成绩,随机选取名学生参加考核,将考核的成绩(满分分,成绩均为不低于分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)在考核成绩为,,的三组学生中,用分层抽样的方法抽取人,则考核成绩在中的学生应抽取多少人?
(3)若落在学生的平均成绩是,方差是,落在学生的平均成绩为,方差是,求这两组学生成绩的平均数和方差.(结果精确到)
【答案】(1)
(2)
(3)平均数为,方差为
【分析】(1)利用频率之和为结合频率分布直方图列式求出;
(2)利用频率分布直方图求出成绩为,,的学生人数,再根据分层抽样的概念求解即可;
(3)先利用频率分布直方图求出和的学生人数,再根据平均数和方差公式计算求解即可.
【详解】(1)由频率分布直方图可得,
解得.
(2)由频率分布直方图知,样本考核成绩在,,的三组学生有(人),
其中样本考核成绩在的市民人数为,
用分层抽样的方法应从考核成绩在的市民中抽取(人).
(3)由频率分布直方图知,成绩在的学生人数为,
成绩在的市民人数为,
所以总平均数,
总方差.
【变式12-2】(25-26高二上·黑龙江大庆·开学考试)某公司为了调查员工的体重(单位:千克),因为女员工远多于男员工,所以按性别分层,用按比例分层随机抽样的方法抽取样本,已知抽取的所有员工的体重的方差为120,其中女员工的平均体重为50,方差为50,男员工的平均体重为70,方差为30.若样本中有21名男员工,则样本中女员工的人数为( )
A.68 B.63 C.35 D.48
【答案】B
【分析】由题意,知样本中男、女员工的平均体重和方差分别为,,,,所占权重分别为和,根据分层抽样的均值和方差公式列方程求出的值,即可求得女员工的人数.
【详解】由题意,记样本中女员工的平均体重和方差分别为,,所占权重为,
男员工的平均体重和方差分别为,,则所占权重为,
则样本中全部员工的平均体重为,
依题意,方差为
.
化简得,解得 或(舍).
所以女员工的人数为: .
故选:B
【变式12-3】(24-25高一下·广东清远·期末)已知某中学共有学生1000名,其中男生有600人,现按性别采用分层随机抽样的方法抽取100人,抽取的样本中男生身高的平均数和方差分别为160和4,女生身高的平均数和方差分别为155和3,则估计该校学生身高的总体方差是( )
A.9.6 B.9 C.8.6 D.8
【答案】A
【分析】利用分层数据中的平均数公式和方差公式来计算样本中的平均数和方差,问题即可得解.
【详解】由题意得:抽取的100人中,男生有60人,女生有40人,
由抽取的样本中男生身高的平均数为160,女生身高的平均数为155,
可得这100位学生的平均身高为,
再由抽取的样本中男生身高的平均数和方差分别为160和4,女生身高的平均数和方差分别为155和3,
则这100位学生身高的方差为,
所以估计该校学生身高的总体方差是9.6,
故选:A.
【题型十三】频率分布直方图
【例13】(24-25高二下·上海·期末)为积极参与马拉松比赛,某中学决定从3000名学生随机抽取100名学生进行体能检测,这100名学生进行了15公里的马拉松比赛,比赛成绩(分钟)的频率分布直方图如图所示,其中成绩分布区间是,,,,.
(1)求图中的值,并估计这100名学生比赛成绩的平均数;
(2)根据样本频率分布直方图,估计该校3000名学生中约有多少名学生能在80分钟内完成15公里马拉松比赛?
【答案】(1),平均数为73
(2)2250
【分析】(1)利用各组的频率和为1列方程可求出的值,根据平均数的定义可求得这100名学生比赛成绩的平均数;
(2)先求出样本中小于80分钟的频率,然后总数乘以频率可得结果.
【详解】(1)由频率分布直方图得,解得,
这100名学生比赛成绩的平均数为
;
(2)由频率分布直方图可知,样本中能在80分钟内完成15公里马拉松比赛的频率为
,
所以该校3000名学生中能在80分钟内完成15公里马拉松比赛的学生人数约为
名.
【变式13-1】(24-25高二下·上海虹口·期末)某校高一年级名同学在一次数学测验中成绩(百分制,均为整数)的频率分布直方图如图,则成绩在之间的学生人数为 .
【答案】5
【分析】由频率分布直方图可得,据此可估计大致人数.
【详解】
所以成绩在之间的学生人数为.
故答案为:5
【变式13-2】(23-24高二下·上海虹口·期末)为了解体育锻炼情况,随机统计了名学生在某个时间段内的体育锻炼时间,所得数据都在区间中,其频率分布直方图如图所示. 若在区间中的频数为30,则的值是 .
【答案】
【分析】首先由频率分布直方图求出中的频率,再由频率等于频数除以样本总数即可求出.
【详解】由频率分布直方图可知在之间的频率为,
又因为,所以.
故答案为:
【变式13-3】(23-24高二下·上海杨浦·期末)学校开展国防知识竞赛,对100名学生的竞赛成绩进行统计,发现这100名同学的成绩都在[50,100]的范围内,可得到如图所示的频率分布直方图,其中分组的区间为,,,,,图中x的值是 .
【答案】0.030
【分析】利用面积之和等于1即能解.
【详解】因为每个小矩形的面积就是频率,所以面积之和等于1,即,解出.
故答案为:0.030.
【题型十四】茎叶图
【例14】(24-25高一下·上海·期末)已知抽样统计甲、乙两位同学8次数学成绩,绘制成如图所示的茎叶图,则成绩更稳定的那位同学成绩的方差为 .
【答案】
【分析】根据题意,由茎叶图分析读出甲乙的成绩,再由方差公式分别计算甲、乙的方差,结合方差的意义分析可得答案.
【详解】根据题意,甲同学的8次成绩依次为:76、77、77、87、89、90、91、93,
其平均数为,
其方差为
乙同学的8次成绩依次为:78、79、88、89、90、91、92、93,
.
则乙同学的成绩较稳定,其方差为.
故答案是:.
【变式14-1】(23-24高一下·重庆长寿·期末)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数分别是 ( )
A.45,45 B.45,46
C.46,45 D.47,45
【答案】C
【分析】直接根据茎叶图知识求出中位数和众数即可.
【详解】根据题意,有30个数据,所以中位数为排序后第15和16个数的平均值:
,众数为出现最多的数,为45.
故选:C.
【变式14-2】(23-24高二下·上海静安·期末)甲、乙两位气步枪运动员在射击队内的选拔赛成绩茎叶图如右:
(1)求甲、乙两名选手射击的平均环数;
(2)请用具有统计意义的数量来刻画甲、乙两位运动员的射击成绩的稳定性,并帮助射击队选拔一名运动员外出参加比赛.
【答案】(1)
(2)答案见解析
【分析】(1)利用平均数公式求解即可.
(2)利用方差公式分别求解方程,依据方差大小分析稳定性,再选人即可.
【详解】(1)
(2)
由可知甲、乙两位运动员的平均成绩一致;
而即甲的射击成绩的离散程度较小,乙的射击成绩的离散程度较大,
因此甲的成绩较稳定,所以选甲代表射击队出去参加比赛.
【变式14-3】(23-24高二上·上海·期末)某同学将观察学校柚子树生长习性作为自主研究课题,他观察了校园内6株柚子树成熟结果个数(两位数)并用茎叶图(如图所示)做了记录,则这6株柚子树成熟结果个数的中位数为( )
A.21 B.21.5 C.22 D.22.5
【答案】B
【分析】利用中位数的定义,结合茎叶图列式计算即得.
【详解】由茎叶图知,这6株柚子树成熟结果个数的中位数为.
故选:B
【题型十五】频率分布直方图中的平均数、众数、中位数
【例15】(25-26高三上·天津·月考)在一次科普知识竞赛中共有200名同学参赛,经过评判,这200名参赛者的得分都在之间,其得分的频率分布直方图如图,则下列结论错误的是( )
A.可求得 B.这200名参赛者得分的中位数为64
C.得分在之间的频率为 D.得分在之间的共有80人
【答案】B
【分析】根据频率分布直方图中所有小矩形面积和为1,计算即可判断A的正误;根据直方图中位数的求法,代入计算,即可判断B的正误;根据直方图中矩形面积代表频率,即频率、频数、总数的关系,即可判断C、D的正误.
【详解】选项A:由题意得,解得,故A正确;
选项B:,,
所以中位数位于内,且设为x,
则,解得,故B错误;
选项C:得分在之间的频率为,故C正确;
选项D:得分在之间的频率为,
所以得分在之间的共有人,故D正确.
故选:B
【变式15-1】(2025·云南·模拟预测)某地区对100名新入职教师技能测试的成绩进行了分析,成绩都在区间内,绘制频率分布直方图如图.则下列结论中不正确的是( )
A.成绩在的频数为10 B.所有小矩形面积之和为1
C.成绩中位数在区间内 D.成绩平均数在区间内
【答案】D
【分析】根据频率分布直方图的小矩形的面积之和为1先求出,根据频率分布直方图性质直接求每个选项即可.
【详解】根据频率分布直方图可知:,可得.所以B正确;
成绩在的频数为:,故A正确;
设成绩中位数为,
,
易得中位数在区间内,故C正确;
设成绩平均数为,
而,
平均数在区间内,故D错误.
故选:D.
【变式15-2】(25-26高三上·四川内江·月考)某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法错误的是( )
A.
B.评分在的人数约为20
C.估计评分的第25百分位数为65
D.估计评分的平均数为76.5
【答案】C
【分析】利用频率和为1求出判断A;利用频率求出频数判断B;求出下四分位数判断C;求出评分的平均数判断D.
【详解】对于A,由,得,故A正确;
对于B,评分在的频率为,评分在的人数约为,故B正确;
对于C,评分在的频率为,评分在的频率为,
则评分的第25百分位数在内,由,解得,故C错误;
对于D,评分的平均数,故D正确.
故选:C.
【变式15-3】(25-26高二上·云南·月考)为了深入调研学生会考模拟考试成绩,掌握学生数学会考成绩情况,现从该年级同学中随机抽取100名学生,对其测试成绩(满分:100分)进行统计,得到样本频率分布直方图,如图,下列说法不正确的是( )
A. B.众数为85
C.第70百分位数为80 D.该样本平均成绩为76
【答案】C
【分析】根据频率之和为1求出可判断A;根据频率分布直方图估算众数、百分位数和平均数的方法求解可判断BCD.
【详解】对A,依题意,得(频率之和为1),
解得,正确;
对B,众数为最高矩形对应中点横坐标为85,正确;
对C,因为,
,
所以第70百分位数,由解得为,错误;
对D,由频率分布直方图,估计这100名学生测试成绩的平均数为:
,正确.
故选:C.
【题型十六】总体百分位数估计
【例16】(24-25高二下·上海松江·期末)一组数据70,72,78,79,80,81,84,86,88,94的第 70 百分位数是 .
【答案】
【分析】根据题意,利用数据的百分位数的概念与计算方法,即可求解.
【详解】由70,72,78,79,80,81,84,86,88,94,共有10个数据,可得,
所以数据的第 70 百分位数是.
故答案为:.
【变式16-1】(24-25高二下·上海嘉定·期末)某个品种的小麦麦穗长度(单位:cm)的样本数据在7~12cm之间,其茎叶图如图所示(整数部分作为茎,小数部分作为叶),则该样本数据的第75百分位数是 .
【答案】10.2
【分析】根据茎叶图得出从小到大的数据,利用百分位数定义直接求解即可.
【详解】由题知,样本数据有,
共个,则,
则这组数据的第百分位数为.
故答案为:
【变式16-2】(2025·上海宝山·二模)甲、乙两名篮球运动员在8场比赛中的单场得分用茎叶图表示如左下图,茎叶图中甲的得分有部分数据丢失,但甲得分的折线图完好(右下图),则下列结论正确的是( )
A.甲得分的极差小于乙得分的极差
B.甲得分的第25百分位数大于乙得分的第75百分位数
C.甲得分的平均数大于乙得分的平均数
D.甲得分的方差小于乙得分的方差
【答案】C
【分析】利用极差、百分位数和平均数的计算公式可以判断A、B、C三个选项,对于D选项,利用数据的分散程度判断方差的大小即可.
【详解】对于A选项,甲得分的极差为:,乙得分的极差为:,
因为,所以甲得分的极差大于乙得分的极差,故A错误;
对于B选项,因为,所以甲得分的第25百分位数为,
又,所以乙得分的第75百分位数为,
因为,所以甲得分的第25百分位数小于乙得分的第75百分位数,故B错误;
对于C选项,由折线图可知,在茎叶图中甲的得分中丢失的数据一个为,另一个设为,其中,
所以甲的平均数为,
乙的平均数为,
因为,所以,所以,
所以甲得分的平均数大于乙得分的平均数,故C正确;
对于D选项,方差是刻画数据离散程度或波动幅度的指标.
从茎叶图中可以看到,甲的得分分布比乙的得分分布分散,
所以甲得分的方差大于乙得分的方差,故D错误.
故选:C
【变式16-3】(24-25高二下·贵州贵阳·月考)2025年春节档上映的动画电影《哪吒之魔童闹海》引发全民观影热潮.某数据平台实时统计了该片上映前10天的全国单日票房(单位:亿元),并生成如图所示的折线图.假设横轴为上映时间(日期),纵轴为单日票房(亿),则下列说法正确的是( )
A.前十日之后,随着上映时间的增加,单日票房一定会呈现下降趋势
B.上映前十天的票房极差为4.76(亿)
C.上映前十天的票房中位数为6.34(亿)
D.上映前十天的票房第70百分位数为7.30(亿)
【答案】C
【分析】根据极差、中位线、百分位的定义计算可得.
【详解】对于A:根据折线统计图,无法预测前十日之后,随着上映时间的增加,单日票房一定会呈现下降趋势,故A错误;
对于B:上映前十天的票房极差为(亿),故B错误;
对于C:上映前十天的票房从小到大排列为、、、、、、、、、,
所以上映前十天的票房中位数为(亿),故C正确;
对于D:因为,所以上映前十天的票房第70百分位数为(亿),故D错误.
故选:C
【题型一】不能正确提取图表信息
【例1】(23-24高二上·上海黄浦·期末)以下是“我国2018-2022年货物进出口总额统计图”,下列说法错误的是( )
A.从2019年开始,2020年的进口额年增长率最小
B.从2019年开始,2021年的出口额年增长率最大
C.从2019年开始,进出口总额逐年增大
D.从2019年开始,进出口总额年增长率逐年增大
【答案】D
【分析】根据条形图即可结合选项逐一求解.
【详解】由图中数据可知:2020年以及2019年的进口额分别为142936亿元和143254亿元,所以2020年的进口额年增长率为负数,而其他年份的增长率均为正数,故A正确,
由图中数据可知2021年与2020年比较,出口额差距最大,且为正增长,所以增长率最大,B正确,
由图中条形图的高度逐年上升可知从2019年开始,进出口总额逐年增大,C正确,
2020年的进出口总额为亿元,故2021年的增长率为,2022年的增长率为,故D错误,
故选:D
【变式1-1】(24-25高二·上海·课堂例题)某校高二年级为选拔参加数学竞赛的学生组织了一次考试,最后选出13名男生和7名女生,这20名学生的考试成绩如茎叶图所示(单位:分),学校规定:成绩不低于130分的人到班培训,低于130分的人到班培训,如果用分层抽样的方法从到班的人和到班的人中共选取5人,则5人中到班的有 人.
【答案】2
【分析】先根据茎叶图求得到A班的人数和到B班的人数,再利用分层抽样的定义求解即可.
【详解】由题意结合茎叶图的数据可知,这20名学生有8人到A班培训,12人到B班培训,
根据分层抽样的定义知:5人中到A班的有人人,
故答案为:2.
【变式1-2】(22-23高二上·上海闵行·期末)甲、乙两名运动员5场比赛得分的茎叶图如图所示已知甲得分的极差为32,乙得分的众数为26,则 .
【答案】
【分析】根据茎叶图,以及极差和众数的定义,即可求解.
【详解】由茎叶图可知,甲的最低得分为6分,由甲得分的极差为32,可知,甲的最高得分为,所以的值为8,
乙得分的众数为26,所以的值为6,
所以.
故答案为:
【变式1-3】(2023·上海宝山·二模)如图是某班一次数学测试成绩的茎叶图(图中仅列出,的数据)和频率分布直方图,则 .
【答案】
【分析】根据茎叶图可得相应的频数,根据频率分布直方图可得相应的频率,根据频率与频数之间的关系列式求解.
【详解】由茎叶图可知:,的频数分别为5,2;
由频率分布直方图可得:每组的频率依次为,
设样本容量为,
则,解得,
故.
故答案为:.
【题型二】对样本数字特征认识不到位
【例2】(24-25高二下·上海·期末)已知数据、、…、的平均数为3,方差为520,则、、…、的平均数为 .
【答案】
【分析】根据方差求出、、…、的和后可求它们的均值.
【详解】因为、、…、的平均数为3,方差为520,
故,
故,
故、、…、的平均数为,
故答案为:.
【变式2-1】(24-25高二下·上海杨浦·期末)已知数据,,,,的方差是4,则,,,,的方差为 .
【答案】16
【分析】根据方差与平均数的计算公式,可得答案.
【详解】由题意可得,,
则,.
故答案为:.
【变式2-2】(2025·上海普陀·二模)某市职业技能大赛的移动机器人比赛项目有19位同学参赛,他们在预赛中所得的积分互不相同,只有积分在前10位的同学才能进入决赛.若该比赛项目中的某同学知道自己的积分后,要判断自己能否进入决赛,则他只需要知道这19位同学的预赛积分的( )
A.平均数 B.众数 C.中位数 D.方差
【答案】C
【分析】根据中位数的概念进行判断即可.
【详解】因为19位同学的积分,中位数是第10名,所以知道中位数即可判断是否在前10.
故选:C
【变式2-3】(24-25高二下·上海虹口·期末)随着Deepseek的流行,各种大模型层出不穷,现有甲、乙两个大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分(满分10分),得到如图所示的统计表格:
评委编号模型名称
1
2
3
4
5
6
甲
8.0
9.2
8.0
8.2
8.6
8.4
乙
7.8
9.0
8.3
8.4
8.5
8.5
则下列结论正确的是( )
A.甲得分的平均数大于乙得分的平均数 B.甲得分的中位数大于乙得分的中位数
C.甲得分的极差大于乙得分的极差 D.甲得分的方差大于乙得分的方差
【答案】D
【分析】分别求出甲,乙两个大模型的平均数,中位数,极差,方差即可得解.
【详解】因为甲得分的平均数,
乙得分的平均数,,故A错误;
将甲的6个得分从小到大排序:,
所以甲的中位数为;
将乙的6个得分从小到大排序:,
所以甲的中位数为;,故B错误;
甲的极差为,乙的极差为,故C错误;
甲得分的方差,
乙得分的方差,
,故D正确.
故选:D
【题型三】混淆频率和概率
【例3】(21-22高二下·上海浦东新·期末)已知某厂的产品合格率为0.7,现抽出10件产品检查,则下列说法正确的是( )
A.合格产品少于7件 B.合格产品多于7件
C.合格产品正好是7件 D.合格产品可能是7件
【答案】D
【分析】根据概率的定义和性质直接求解即可.
【详解】根据概率的性质可计算出合格产品可能是件,
故选:D.
【变式3-1】(25-26高二上·内蒙古赤峰·期中)某厂产品的次品率为2%,估算该厂8000件产品中合格品的件数为( )
A.7840 B.160 C.7998 D.1600
【答案】A
【分析】利用概率的意义求解即可.
【详解】,所以估算该厂8000件产品中合格品的件数为.
故选:A.
【变式3-2】(2026高三·全国·专题练习)某射击运动员平时训练成绩的统计结果如下:
命中环数
6
7
8
9
10
频率
0.1
0.15
0.25
0.3
0.2
如果这名运动员只射击一次,则命中的环数大于8环的概率为 ;命中的环数不超过5环的概率为 .
【答案】 0.5/ 0
【分析】根据给定的数表,利用频率估计概率,结合互斥事件、对立事件的概率公式求解即得.
【详解】用频率估计概率,得这名运动员只射击一次,命中的环数大于8环的概率;
命中的环数超过5环的概率,
所以命中的环数不超过5环的概率为.
故答案为:0.5;0
【变式3-3】(25-26高二上·湖北·期中)国庆长假市民旅游观光非常活跃.为提高服务质量,A市文旅部门对属地W景区的游客进行满意度调研,通过微信小程序共随机收集到300名游客的反馈数据如下表:
不满意
一般
满意
男性
15
20
女性
5
20
(1)请据此表数据,估计游客对景区的满意率;
(2)若,求满意的顾客中女性顾客不少于男性顾客的概率.
【答案】(1)
(2)
【分析】(1)先计算满意的总人数,再利用频率公式计算满意率.
(2)先确定的取值范围及对应的基本事件总数,再确定满足 “女性顾客不少于男性顾客” 的基本事件数,最后利用古典概型公式计算概率.
【详解】(1)根据题意,,,
所以游客对景区的满意率.
(2)因为,,,
所以满意的顾客中,男性和女性的人数对所有可能为:,,,,,,共个数对,
其中的有:,共个数对,
所以满意的顾客中,女性顾客不少于男性顾客的概率.
【题型四】混淆互斥与独立
【例4】(23-24高一下·云南·期末)已知甲盒中有3个大小和质地相同的小球,标号为,乙盒中有3个大小和质地相同的小球,标号为,现从甲、乙两盒中分别随机摸出1个小球,记事件“摸到的两个小球标号相同”,事件“摸到的两个小球标号之和为奇数”,则( )
A.事件A和相等 B.事件A和互相对立
C.事件A和相互独立 D.事件A和互斥
【答案】D
【分析】列举出样本空间、事件和事件,即可判断A;对于BD:根据互斥事件、对立事件的概念分析判断;对于C:根据事件概率乘法公式分析判断.
【详解】用每次取球的结果,分别表示甲、乙两盒中分别随机摸出1个小球的标号,
由题意可知:样本空间;
事件;事件,;
对于选项A:因为,所以事件A和不相等,故A错误;
对于选项BD:因为事件,
所以事件A和互斥,事件A和不互相对立,故B错误,D正确;
对于选项C:因为,
则,
显然,所以事件A和不相互独立,故C错误;
故选:D.
【变式4-1】(23-24高一下·河南安阳·月考)袋子中有5个相同的球,分别标有数字1,2,3,4,5,从中随机取出两个球,设事件A=“取出的球的数字之积为奇数”,事件B=“取出的球的数字之积为偶数”,事件C=“取出的球的数字之和为偶数”,事件D=“取出的球的数字之和大于5”,则下列说法错误的是( )
A.事件A与B是互斥事件 B.事件A与B是对立事件
C.事件C与D相互独立 D.事件C与D不是互斥事件
【答案】C
【分析】首先列举样本空间,利用样本空间法,结合互斥,对立事件的定义,判断ABD,根据与的关系,判断C.
【详解】袋子中有5个相同的球,分别标有数字1,2,3,4,5,
从中随机取出两个球的试验样本空间包含的样本点为:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)共10个,
其中事件A包含的样本点为:(1,3),(1,5),(3,5)共3个,故,
事件B包含的样本点为:(1,2),(1,4),(2,3),(2,4),(2,5),(3,4),(4,5)共7个,故;
事件C包含的样本点为:(1,3),(1,5),(2,4),(3,5)共4个,故,
事件D包含的样本为:(1,5),(2,4),(2,5),(3,4),(3,5),(4,5)共6个,故,
因为事件,,故事件A与B互斥且对立,故A,B正确;
因为,所以C与D不相互独立,故C错误.
因为,所以C与D不互斥,故D正确.
故选:C.
【变式4-2】(22-23高一下·江苏扬州·期末)抛掷两枚质地均匀的硬币一次,设“第一枚硬币正面朝上”为事件A,“第二枚硬币反面朝上”为事件B,则下述正确的是( ).
A.A与B对立 B.A与B互斥
C. D.A与B相互独立
【答案】D
【分析】根据题意,列举出抛掷两枚质地均匀的硬币的所有结果,再逐一分析判断各个选项即可得到结果.
【详解】由题意可得,抛掷两枚质地均匀的硬币的所有结果是:(正,正),(正,反),(反,正),(反,反),
则事件包含的结果有:(正,正),(正,反),事件包含的结果有:(正,反),(反,反),
显然事件,事件都包含“(正,反)”这一结果,即事件,事件能同时发生,
所以,事件,事件既不互斥也不对立,故AB错误.
又因为,而,,
所以,,故C错误,D正确.
故选:D
【变式4-3】(21-22高二下·陕西咸阳·月考)已知是两个概率大于0的随机事件,则下列说法错误的是( )
A.若是对立事件,则是互斥事件
B.若事件相互独立,则与也相互独立
C.若事件相互独立,则与不互斥
D.若事件互斥,则与相互独立
【答案】D
【分析】根据互斥,对立事件的定义,以及事件的相互独立性,即可判断选项.
【详解】A.两个事件是对立事件,则一定是互斥事件,故A正确;
B.若事件相互独立,则与也相互独立,故B正确;
C.若事件相互独立,则与可以同时发生,不互斥,故C正确;
D. 若事件互斥,则与不能同时发生,即事件是否发生,对另一个事件是有影响的,所以两个事件不相互独立,故D错误.
故选:D
【题型一】求百分位数
第一步:按从小到大排列原始数据.
第二步:计算.
第三步:若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
【例1】(25-26高三上·江苏南京·期中)已知样本数据,则该组数据的第60百分位数为( )
A.6 B.7 C.8 D.9
【答案】C
【分析】根据百分位数的定义求解即可.
【详解】这组数据共8个,所以,
所以该组数据的第60百分位数为8,
故选:C
【变式1-1】(25-26高三上·云南昆明·期中)样本数据,,,,的第百分位数是( )
A. B. C. D.
【答案】B
【分析】根据百分位数计算公式计算即可.
【详解】因为,所以这组数据的第60百分位数是.
故选:B
【变式1-2】(24-25高一下·新疆阿克苏·期末)某班级的老师随机抽查了该班8名同学周末在家学习的时长(单位:h),所得数据如下:3,4,4,5,6,6,7,8,则这组数据的75%分位数为( )
A.6.5 B.6 C.5.5 D.5
【答案】A
【分析】根据百分位数的计算公式即可求解。
【详解】,故这组数据的75%分位数为,
故选:A
【变式1-3】(2026高三·全国·专题练习)某次射击比赛中,甲、乙两名运动员在决赛中14次射击环数如图,则( )
A.甲的平均射击环数超过10.6
B.乙射击环数的第80百分位数为10.65
C.甲射击环数的标准差小于乙射击环数的标准差
D.乙射击环数的极差小于甲射击环数的极差
【答案】C
【分析】通过极差、平均数、方差、第80百分位数的计算即可求解.
【详解】由题知,甲的射击环数只有2次是10.8环,5次10.6环,其余都是10.6环以下,所以甲平均射击环数低于10.6,故A错误;
由于,故第80百分位数是从小到大排列的第12个数10.7,故B错误;
由于乙的射击环数更分散,故标准差更大,故C正确;
乙射击环数的极差为10.8-9.7=1.1,甲的射击环数极差为10.8-10.3=0.5,故D错误.
故选:C
【题型二】互斥、对立事件的辨析
判断互斥事件、对立事件时,首先要明确两个事件包含的样本点,再判断两个事件的交事件是否是空集,是空集则两个事件是互斥事件;若这两个互斥事件的并事件是样本空间,则两个事件是对立事件. 注意事件对立的前提是互斥.
【例2】(25-26高三上·山西·月考)甲、乙两人玩石头、剪刀、布游戏.在一次游戏中,记事件:甲、乙两人出的都是剪刀;事件:甲、乙两人出的相同;事件:甲、乙两人至少有1人出的是布.则下列结论错误的是( )
A.与互斥 B.与互为对立事件
C. D.
【答案】B
【分析】记“石头”,“剪刀”,“布”,列举样本空间以及确定事件分别对应的样本点,利用事件的关系,结合古典概型计算概率,逐项判断得结论.
【详解】记“石头”,“剪刀”,“布”,
则样本空间,总数为,
事件包含的样本点为,事件包含的样本点为,事件包含的样本点为,
所以与互斥,与不互为对立事件,
又事件包含的样本点为,
所以,,,
所以,故ACD正确,B错误.
故选:B.
【变式2-1】(2025高二上·浙江绍兴·专题练习)抛掷两枚质地均匀的硬币,设事件“第一枚反面向上”,事件“第二枚正面向上”,则下列说法正确的是( )
A.与互斥 B.
C.与对立 D.与相互独立
【答案】D
【分析】根据互斥事件、相互独立事件的概念以及事件的概率求法判断即可.
【详解】抛掷两枚质地均匀的硬币的样本空间(正,正),(正,反),(反,正),(反,反),
对于AC,事件可以同时发生,因此事件与不互斥,不对立,AC错误;
对于B,,则,B错误;
对于D,,与相互独立,D正确.
故选:D.
【变式2-2】(25-26高二上·湖北·期中)已知,,,则事件与的关系是( )
A.与互斥但不对立 B.与对立
C.与相互独立 D.与既互斥又相互独立
【答案】A
【分析】根据概率的并集公式和独立事件的定义求解.根据且可以判断事件与互斥但不对立;根据且可以判断事件与对立;根据判断事件与独立.
【详解】,,,
,
,,
,故与互斥但不对立,选项A正确,选项B不正确;
,,故与不独立,选项C和D错误.
故选:A.
【变式2-3】(25-26高二上·福建泉州·期中)掷两枚质地均匀的骰子,设“第一枚出现偶数点”,“第二枚出现点数超过”,则事件与事件的关系为( )
A.相等 B.互斥 C.互为对立 D.相互独立
【答案】D
【分析】先计算事件的概率及,得出,满足相互独立事件定义,从而得出正确选项.
【详解】事件“第一枚出现偶数点”,则,
又事件“第二枚出现点数超过”,则,
事件“第一枚出现偶数点,第二枚出现点数超过4”,
所以,
所以事件与事件是相互独立事件,故D正确;
因为可以同时发生,故不互斥,不相等,故A,B错误;
因为“第一枚出现奇数点”,“第二枚出现点数不超过4”,且不互斥,
所以不是对立事件,故C错误.
故选:D
【题型三】求相互独立事件同时发生的概率的步骤
(1)确定各事件是相互独立的;
(2)确定各事件会同时发生;
(3)求每个事件发生的概率,再用公式求解.
【例3】(24-25高二下·上海松江·期末)为丰富学生的业余生活, 学校开展了一系列文体活动, 其中有一项是 3 对 3 篮球对抗赛. 现有甲、乙两队进行比赛,假设每局比赛结果相互独立且无平局,每局比赛甲队获胜的概率为 ,乙队获胜的概率为 .
(1)若采用三局两胜制(即先胜两局者赢得比赛,同时比赛结束)进行比赛,求甲队获胜的概率;
(2)若比赛有三局两胜制(即先胜两局者赢得比赛,同时比赛结束)和五局三胜制(即先胜三局者赢得比赛, 同时比赛结束)两种选择, 从概率角度考虑, 甲队如何选择对自己更有利? 请说明理由.
【答案】(1)
(2)选择五局三胜制对甲队更有利,理由见解析
【分析】(1)用表示事件 “第局甲队胜” , 表示事件 “第局乙队胜” ,设表示事件“三局两胜制下甲队获胜”,得到,结合相互独立事件和互斥事件的概率公式,即可求解;
(2)用表示事件 “ 局赛完,甲队胜” ,设 表示事件“五局三胜制下甲队获胜”,根据相互独立事件的概率公式,求得,即可求解.
【详解】(1)解:用表示事件 “第局甲队胜” , 表示事件 “第局乙队胜” ( ),
则 ,
设表示事件“三局两胜制下甲队获胜”,则 ,
由各局比赛结果相互独立,且事件互斥,
所以.
(2)解:用表示事件 “ 局赛完,甲队胜” ,
则 ,
设 表示事件“五局三胜制下甲队获胜”,则,
由各局比赛结果相互独立,且事件 互斥,
所以,
因为,所以选择五局三胜制对甲队更有利.
【变式3-1】(2023·上海宝山·一模)一个盒子中装有4张卡片,卡片上分别写有数字1、2、3、4.现从盒子中随机抽取卡片.
(1)若一次抽取3张卡片,事件A表示“3张卡片上数字之和大于7”,求;
(2)若第一次抽取1张卡片,放回后再抽取1张卡片,事件B表示“两次抽取的卡片上数字之和大于6”,求;
(3)若一次抽取2张卡片,事件C表示“2张卡片上数字之和是3的倍数”,事件D表示“2张卡片上数字之积是4的倍数”,验证C、D是独立的.
【答案】(1)
(2)
(3)验证过程见解析
【分析】(1)利用古典概型的概率求解;
(2)利用古典概型的概率求解;
(3)利用古典概型的概率分别求得,,判断.
【详解】(1)若一次抽取张卡片,共包含、、、共个基本事件.
其中事件包含个基本事件
所以;
(2)若第一次抽取张卡片,放回后再抽取张卡片,共包含个基本事件,
其中事件包含3个基本事件
所以
(3)一次抽取张卡片,共包含个基本事件,
事件,
所以
事件,所以
当同时发生,即张卡片上数字之和是的倍数同时积是的倍数,只有一种取法,
所以
因为,
所以事件与事件是独立的.
【变式3-2】(24-25高二上·四川成都·月考)甲、乙二人进行一次羽毛球比赛,有五局三胜制和三局两胜制两种赛制.五局三胜制中,约定先胜3局者获得这次比赛的胜利,同时比赛结束;三局两胜制中,约定先胜2局者获得这次比赛的胜利,同时比赛结束.假设在一局中,甲获胜的概率为0.6,乙获胜的概率为0.4,各局比赛结果相互独立.
(1)若采用五局三胜制,且已知前2局中,甲、乙各胜1局.
①求再赛2局结束这次比赛的概率;
②求甲获得这次比赛胜利的概率.
(2)采用五局三胜制还是三局两胜制对甲更有利,并通过计算说明理由.
【答案】(1)①0.52;②0.648
(2)五局三胜制对甲更有利,理由见解析
【分析】(1)由独立乘法公式、互斥加法公式即可求解;
(2)算出两种赛制甲获胜的概率,比较大小即可得解.
【详解】(1)①用表示事件“第局甲胜”,表示事件“第局乙胜”,
设“再赛2局结束这次比赛”为事件,则,
由于各局比赛结果相互独立,且事件与事件互斥.
所以
.
故再赛2局结束这次比赛的概率为0.52.
②记“甲获得这次比赛胜利”为事件,
因前两局中,甲、乙各胜一局,故甲成为胜方当且仅当在后面的比赛中,甲先胜2局,
从而,
由于各局比赛结果相互独立,且事件,,两两互斥,
所以.
故甲获得这次比赛胜利的概率为0.648.
(2)记“三局两胜制下甲获胜”为事件,
则
由于各局比赛结果相互独立,且事件,,互斥.
,
记“五局三胜制下甲获胜”为事件,比赛分3局赛完、4局赛完和5局赛完三种情况,
①若3局赛完,则甲获胜的情况有1种:“甲甲甲”(甲代表本局比赛甲胜);
②若4局赛完,则甲获胜的情况有3种:“甲甲乙甲”、“甲乙甲甲”、“乙甲甲甲”;
③若5局赛完,则甲获胜的情况有6种:“甲甲乙乙甲”、“甲乙甲乙甲”、“甲乙乙甲甲”、
“乙甲甲乙甲”、“乙甲乙甲甲”、“乙乙甲甲甲”;
由于各局比赛结果相互独立,且以上事件均两两互斥,
,
因为,故五局三胜制对甲更有利.
【变式3-3】(24-25高三上·上海浦东新·期末)申辉中学为期两周的高一、高二年级校园篮球赛告一段落.高一小、高二小分别荣获了高一年级和高二年级比赛的年级MVP(最有价值球员).以下是他们在各自8场比赛的二分球和三分球出手次数及其命中率.
二分球出手
二分球命中率
三分球出手
三分球命中率
小
100次
100次
小
190次
10次
现以两人的总投篮命中率(二分球+三分球)较高者评为校(总投篮命中率总命中次数÷总出手次数)
(1)小认为,目测小的二分球命中率和三分球命中率均高于小,此次必定能评为校,试通过计算判断小的想法是否准确?
(2)小是游戏爱好者,设置了一款由游戏人物小、小轮流投篮对战游戏,游戏规则如下:①游戏中小的命中率始终为0.4,小的命中率始终为0.3,②游戏中投篮总次数最多为次,且同一个游戏人物不允许连续技篮.③游戏中若投篮命中,则游戏结束,投中者获得胜利;若直至第次投篮都没有命中,则规定第二次投篮者获胜.若每次游戏对战前必须设置“第一次投篮人物”和“”的值,请解答以下两个问题.
(ⅰ)若小第一次投篮,请证明小获胜概率大;
(ⅱ)若小第一次投篮,试问谁的获胜概率大?并说明理由.
【答案】(1)不正确
(2)(ⅰ)证明见解析,(ⅱ)答案见解析,理由见解析;
【分析】(1)直接计算命中率即可判断;
(2)(ⅰ)由独立事件乘法公式及互斥事件加法公式即可求证;(ⅱ)由独立事件乘法公式及互斥事件加法公式,结合指数函数单调性即可判断.
【详解】(1)由题意小总出手200次,命中120次,命中率为:,
小总出手200次,命中136次,命中率为,
故小获校,所以小的想法不正确;
(2)(ⅰ)证明:若第一次投篮人物为小,,
小获胜的概率为,小获胜的概率为,
则,
所以若小第一次投篮,小获胜概率大,
(ⅱ)若第一次投篮人物为小,,
小获胜的概率为,小获胜的概率为,
则
,
其中
由指数函数的单调性可知:随着的增大而增大,
计算可得:,
所以当也就是时,,
当也就是时,,
综上:若小第一次投篮,时,小获胜概率大,
时,小获胜概率大.
学科网(北京)股份有限公5 / 5
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$