内容正文:
专项03 概率
内容导航
【命题解码·定方向】命题趋势+2026年预测
【解题建模·通技法】析典例,建模型,技法贯通破类题/变式
【实战刷题·冲高分】精选高考大题+名校模拟题,强化实战能力,得高分
根据近五年北京卷考情,概率是必考大题,分值约13-17分.
命题趋势:概率在解答题中地位稳固,重点考查离散型随机变量的分布列与期望,以及结合实际问题进行数据分析与决策
2026年预测:预计2026年概率模块难度加强,条件概率、全概率公式及贝叶斯公式将成为考查热点,且与数列、函数等知识交汇融合的题型值得重点关注
备考核心:备考需重点突破条件概率、全概率与贝叶斯公式,熟练掌握二项分布和超几何分布的模型识别与应用。
题型01 用样本估计总体
析典例·建模型
1.(2025·北京丰台·二模)为调查某校学生户外活动时长和视力的关系,某研究小组在该校随机选取了100名学生,记录他们的日均户外活动时长(单位:小时)及近视情况,统计得到:日均户外活动时长在区间内有70人,近视率为;日均户外活动时长在区间内有20人,近视率为;日均户外活动时长在区间内有10人,近视率为.
注:近视率是指某区间内近视人数与该区间内人数的比值.
(1)估计该校日均户外活动时长不低于1小时的学生的近视率;
(2)用频率估计概率.从该校日均户外活动时长低于1小时的学生和不低于1小时的学生中各随机选取2名,求这4名学生中恰有2名近视的概率;
(3)为响应国家降低青少年近视率的号召,该校提出“护眼有妙招,科学动起来”的口号,计划在以下2项措施中选择1项实施.
措施一:每日给全校学生增设0.5小时晨跑活动;
措施二:每日给日均户外活动时长低于1小时的学生增设1小时户外活动.假设所有学生都能按要求参加相应活动,记采取措施一后该校全体学生的日均户外活动时长的平均值为,采取措施二后该校全体学生的日均户外活动时长的平均值为.用样本估计总体,试比较与的大小.(结论不要求证明)
【答案】(1)
(2)
(3)
【分析】(1)根据题意求相应人数和频率,即可得结果;
(2)分析可知从该校日均户外活动时长低于1小时、不低于1小时的学生中随机选取1名,这名学生近视的概率为、,结合独立事件概率乘法公式运算求解;
(3)根据题意结合加权平均数公式分别求,比较大小即可得结果.
【详解】(1)由题意,样本中日均户外活动时长不低于1小时的学生有人,
其中近视的学生有人,
所以估计该校日均户外活动时长不低于1小时学生的近视率为.
(2)设事件“从该校日均户外活动时长低于1小时的学生和不低于1小时的学生中各随机选取2名,这4名学生中恰有2名近视”.
由题意,从该校日均户外活动时长低于1小时的学生中随机选取1名,这名学生近视的概率为,
从该校日均户外活动时长不低于1小时的学生中随机选取1名,这名学生近视的概率为.
则.
(3)由题意可知:日均户外活动时长在区间内的频率为;日均户外活动时长在区间内的频率为;日均户外活动时长在区间内的频率为,
则原数据的平均数为,
采取措施一后,该校全体学生的日均户外活动时长的平均值为;
采取措施二后,该校全体学生的日均户外活动时长的平均值为;
因为,所以.
研考点·通技法
总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,,,,总体平均数为,则总体方差=
.
②加权式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为,,,,其中出
现的频数为(i=1,2,,k),则总体方差为=.总体标准差:S=.
标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
破类题·提能力
1.(2025·北京·二模)网络搜索已成为人们获取信息或解决问题的重要手段.为研究某传染性疾病的未来流行趋势,收集得到该疾病某月1号至30号的网络搜索量(单位:万次)如下:
时间
1号
2号
3号
4号
5号
6号
7号
8号
9号
10号
11号
12号
13号
14号
15号
搜索量
6.2
5.1
6.1
7.2
6.1
7.4
6.2
6.3
6.4
6.3
7.1
6.3
7.3
7.6
7.9
时间
16号
17号
18号
19号
20号
21号
22号
23号
24号
25号
26号
27号
28号
29号
30号
搜索量
8.5
11.2
10.3
9.1
9.6
10.1
10.6
10.9
8.8
10.4
8.2
11.5
12.1
12.8
13.6
用频率估计概率.
(1)从2号至14号中任取1天,求该天的搜索量比其前后两日的搜索量都低的概率;
(2)假设该疾病每天的搜索量变化是相互独立的.在未来的日子里任取3天,试估计这3天该疾病搜索量的数据中既有高于10万又有低于8万的概率;
(3)记表中30天的搜索量的平均数为,去除搜索量中最大的3个和最小的3个后剩余24个搜索量的平均数为,试给出与的大小关系.(结论不要求证明)
【答案】(1)
(2)
(3)
【分析】(1)找出2号至14号中该天搜索量比其前后两日的搜索量都低的数据,再运用古典概型的概率公式计算即可;
(2)求出未来的日子里某天该疾病的搜索量高于10万的概率,低于8万的概率,再求满足题意的概率的即可;
(3)分别计算即可比较大小.
【详解】(1)记事件A为“从2号至14号中任取1天,且该天搜索量比其前后两日的搜索量都低”,
根据数据知,仅有2,5,7,10,12号这5天的搜索量比其前后两日的搜索量都低,
所以从2号至14号中任取1天,该天搜索量比其前后两日的搜索量都低的概率.
(2)记事件B为“在未来的日子里任取3天,且这3天该疾病搜索量的数据中既有高于10万又有低于8万”,
根据数据知,在未来的日子里,某天该疾病的搜索量高于10万的概率可估计为,低于8万的概率可估计为.
则.
所以在未来的日子里任取3天,估计这3天该疾病捜索量的数据中既有高于10万又有低于8万的概率为.
(3),
最大的三个数为:,最小的三个数为:,
这6个数之和为,
故,
故.
2.(2025·北京朝阳·二模)某电商平台为了解用户对配送服务的满意度,分别从A地区和B地区随机抽取了500名和100名用户进行问卷评分调查,将评分数据按,,…,分组整理得到如下频率分布直方图:
(1)从A地区抽取的500名用户中随机抽取一名,求该用户评分不低于60分的概率;
(2)从B地区评分为的样本中随机抽取两名,记评分不低于90分的用户人数为X,求X的分布列和数学期望;
(3)根据图中的样本数据,假设同组中每个数据用该组区间的中点值代替,设A地区评分的平均值估计为,A,B两地区评分的平均值估计为,比较与的大小关系.(直接写出结论)
【答案】(1)
(2)分布列见解析;期望为
(3)
【分析】(1)根据频率分布直方图计算概率即可;
(2)应用超几何分布计算概率,再写出分布列,最后计算数学期望即可;
(3)根据频率分布直方图的特征得出平均值关系即可.
【详解】(1)设事件M:从A地区抽取的500名用户中随机抽取一名,该用户评分不低于分.
由频率分布直方图可知,A地区抽取的500名用户中评分不低于的人数为,
所以.
(2)B地区评分为的样本用户共有人,
其中评分不低于分的人数为5人.
由题意可知,X的所有可能取值为0,1,2.
,
,
.
所以X的分布列为:
X
0
1
2
P
则X的数学期望.
(3).
根据频率分布直方图A地区评分的平均值为,
B地区评分的平均值为,
所以A,B两地区评分的平均值;
题型02 离散型随机变量的分布列、均值方差
析典例·建模型
1.(2026·北京延庆·一模)2024年联合国教科文组织第46届世界遗产大会上,我国申报的“北京中轴线——中国理想都城秩序的杰作”被正式列入《世界遗产名录》.北京中轴线坐落于北京老城中心,全长7.8公里,始建于13世纪,是统领老城整体规划格局的建筑与遗址的组合体.它共包含15处遗产点,可分为A、B、C、D、E五种类型,具体如下表:
类
型
A古代皇家宫苑建筑
B古代皇家
祭祀建筑
C古代城市管理设施
D国家礼仪和公共建筑
E居中道路遗存
中轴线遗产点
故宫
景山
太庙
社稷坛
天坛
先农坛
钟鼓楼
万宁桥
端门
天安门
外金水桥
天安门广场及建筑群
正阳门
永定门
中轴线南段道路遗存
某研学团队计划随机选取3处遗产点开展研学活动.
(1)若从15处遗产点中随机选取,求选取的3处遗产点均为D类的概率;
(2)若从A、B、C这三类遗产点中随机选取3处,设选取的3处遗产点的类型种数为X,求X的分布列及数学期望;
(3)该研学团队通过调查发现:所有参观北京中轴线的人群可分为老年人、中年人、青少年三个群体,其人数比值为,同时,这三个群体选择参观A类或D类遗产点的频率分布如下表:
人群
老年人
中年人
青少年
只参观A类型遗产点
60%
25%
30%
只参观D类型遗产点
20%
45%
30%
两类遗产点都参观
20%
30%
40%
用频率估计概率,若从所有参观A类或D类遗产点的人群中随机选取1人,记“只参观A类型遗产点”的概率为,“只参观D类型遗产点”的概率为,请根据表中信息,判断与的大小关系.(结论不要求证明)
【答案】(1)
(2)的分布列为:
1
2
3
(3)
【详解】(1)从15处遗产点中随机选取,选取的3处遗产点均为D类的概率为:
.
(2)由题意,的值可能为1,2,3,
且,
,
.
所以的分布列为:
1
2
3
所以.
(3)由题意,
.
所以.
研考点·通技法
1、判断分布类型
确认随机变量:明确问题中的随机变量 X 及其可能取值
识别分布类型:若为不放回抽样且关心“次品数”、“合格数”等 → 超几何分布
若为独立重复试验(每次成功概率相同) → 二项分布
若为有限等可能抽样且涉及特定计数 → 可考虑古典概型计算
2、确定参数并计算概率:根据类型选用公式,依次计算 X 取每一个可能值的概率
3、整理分布列,列成表格,验证概率和为1
4、应用与计算:求期望值或方差等。
注意:先判断类型再计算,避免公式误用,注意随机变量取值的完整性与互斥性计算后务必检查概率总和是否为 1
破类题·提能力
1.(2025·北京大兴·三模)为测试、两款人工智能软件解答数学问题的能力,将100道难度相当的数学试题从1到100编号后随机分配给这两款软件测试.每道试题只被一款软件解答一次,记录结果如下:
试题类别
软件
软件
测试试题数量
正确解答的数量
测试试题数量
正确解答的数量
函数试题
30
24
20
18
几何试题
20
16
30
20
(1)估计软件能正确解答数学问题的概率;
(2)小明决定采用这两款软件解答3道类似试题(假设其难度和测试的100道题基本相同),其中函数2道,几何1道;使用软件解答2道函数试题,使用软件解答1道几何试题;每道试题只用其中一款软件解答一次.假设用频率估计概率,且每次解答相互独立.用表示3道类似试题被正确解答的个数,求的分布列与数学期望;
(3)小明准备用这两款软件来解决某次数学测试中的第12题(假设其难度和测试的100道题基本相同),但该题内容还未知,从已往情况来看,该题是函数题的概率为,几何题的概率为.假设用频率估计概率,试说明小明用哪款软件正确解答这道试题的概率大?(结论不要求证明)
【答案】(1)
(2)分布列见解析;期望为
(3)答案见解析
【分析】(1)由古典概型概率计算公式即可求解;
(2)法一:确定的每一个取值,求得对应概率即可求解;法二:用、分别表示这2道函数试题与1道几何试题被正确解答的个数,得到,,再由即可求解;
(3)记“软件能正确解答这道题”为事件,“软件能正确解答这道题”为事件,
由全概率计算公式求得比较大小即可.
【详解】(1)记软件能正确解答数学问题为事件,
结合题中数据以及古典概型的概率公式可得.
(2)解法一:使用软件解答函数试题正确的概率为,
使用软件解答几何试题正确的概率为;
的可能取值为0、1、2、3,
,
,
,
,
则其分布列为:
0
1
2
3
其期望为:;
解法二:函数试题用软件解答,几何试题用软件解答.
用、分别表示这2道函数试题与1道几何试题被正确解答的个数,
因为,,
0
1
2
0
1
的可能取值为0、1、2、3,
,,
,,
则其分布列为:
0
1
2
3
由二项分布的期望公式可得,
因为,相互独立,则
.
(3)小明应该使用软件来解决这道试题.
记“软件能正确解答这道题”为事件,“软件能正确解答这道题”为事件,
“该题为几何题”为事件.
则,,,
,,,
由全概率公式可得
.
.
因为,所以软件能够正确解决这道试题的概率更大,
故小明应该使用软件来解决这道试题.
2.(2025·北京丰台·一模)京广高速铁路是世界上运营里程最长的高速铁路之一,也是中国客运量最大、运输最为繁忙的高速铁路之一.某日从北京西到广州南的部分G字头高铁车次情况如下表:注:以下高铁车次均能准点到达
(1)某乘客从上表中随机选取一趟高铁车次从北京西出发到广州南,求这趟列车的运行时长不超过10小时的概率;
(2)甲、乙、丙3人分别从上表中随机选取一趟高铁车次从北京西出发到广州南,其中甲必须上午出发,乙必须下午出发,丙的出发时间没有限制,且甲、乙、丙3人的选择互不影响.
(ⅰ)记随机变量为甲、乙、丙选取的列车中运行时长不超过10小时的个数,求的分布列和数学期望;
(ⅱ)甲、乙、丙3人中,谁选取的列车运行时长最短的概率最大?(结论不要求证明)
【答案】(1)
(2)(ⅰ)分布列见解析,数学期望为;(ⅱ)甲,理由见解析
【分析】(1)利用古典概率求概率公式得到答案;
(2)(ⅰ)求出的可能取值和对应的概率,得到分布列,并求出数学期望;
(ⅱ)列车运行时长最短为7小时17分,在上午,分别计算出甲,乙,丙选取此列车的概率,比较后得到结论.
【详解】(1)从北京西出发到广州南的高铁车次共7个,
运行时长不超过10小时的有4个,超过10小时的有3个,
故这趟列车的运行时长不超过10小时的概率为;
(2)(ⅰ)上午运行时长不超过10小时的列车有2个,超过10小时的列车有2个,
下午运行时长不超过10小时的列车有2个,超过10小时的列车有1个,
甲选取的列车中运行时长不超过10小时的概率为,
乙选取的列车中运行时长不超过10小时的概率为,
丙选取的列车中运行时长不超过10小时的概率为,
的可能取值为0,1,2,3,
,
,
,
,
所以的分布列为
0
1
2
3
数学期望为;
(ⅱ)甲选取的列车运行时长最短的概率最大,理由如下:
列车运行时长最短为7小时17分,在上午,甲选取此列车的概率为,
乙选取此列车的概率为0,丙选取此列车的概率为,
故甲选取的列车运行时长最短的概率最大.
题型03 条件概率、全概率和贝叶斯公式
析典例·建模型
1.(2025·北京平谷·一模)某科研团队研发了一款快速检测某种疾病的试剂盒.为了解该试剂盒检测的准确性,科研团队从某地区(人数众多)随机选取了40位患者和60位非患者,用该试剂盒分别对他们进行了一次检测,结果如下:
抽样人群
阳性人数
阴性人数
患者
36
4
非患者
2
58
(1)试估计使用该试剂盒进行一次检测结果正确的概率;
(2)若从该地区的患者和非患者中分别抽取2人进行一次检测,求恰有一人检测结果错误的概率;
(3)假设该地区有10万人,患病率为0.01.从该地区随机选取一人,用该试剂盒对其检测一次.若检测结果为阳性,能否判断此人患该疾病的概率超过0.2?并说明理由.
【答案】(1)0.94
(2)
(3)超过,理由见解析
【分析】(1)由古典概型概率计算公式求解即可;
(2)设事件:患者检测结果正确,事件:非患者检测结果正确“,事件:该地区的患者和非患者中分别抽取2人进行一次检测,恰有一人检测结果错误,由求解即可;
(3)求得检测一次结果为阳性的人数,确定其中患者人数,即可判断;
【详解】(1)由题意知,使用该试剂盒进行一次检测共有100人,其中检测结果正确的共有94人,
所以使用该试剂盒进行一次检测结果正确的概率估计为.
(2)设事件:患者检测结果正确,事件:非患者检测结果正确“,
事件:该地区的患者和非患者中分别抽取2人进行一次检测,恰有一人检测结果错误;
根据题中数据,可估计为可估计为
该地区的患者中抽取2人进行一次检测,恰有一人检测结果错误的概率为
该地区的非患者中抽取2人进行一次检测,恰有一人检测结果错误的概率为
所以,
所以.
因此恰有一人检测结果错误的概率为
(3)此人患该疾病的概率超过0.2.理由如下:
由题意得,如果该地区所有人用该试剂盒检测一次,
那么结果为阳性的人数为,其中患者人数为900.
若某人检测结果为阳性,那么他患该疾病的概率为.
研考点·通技法
用全概率公式的步骤:
1、按照确定的标准,将一个复合事件分解为若干个互斥事件;
2、求与;
3、代入全概率公式,求出目标事件的概率.
贝叶斯公式有着重要的实际意义,一件事由“因”推出“果”容易,但是贝叶斯公式是在做逆运算,它是在条件概率的基础上寻找事件发生的原因,在运用贝叶斯公式的过程如下:
1、A的多种情况发生的概率已知,即P(Ai)已知;
2、在A的每种情况发生的条件下B发生的概率已知,即已知;
3、未知,需要使用全概率公式计算得到;
4、求解的目标是用A的某种情况Ai的无条件概率求其在B发生的条件下的有条件概率P().
破类题·提能力
1.(2025·四川泸州·模拟预测)某工厂有两条生产线加工同一型号的零件,生产线加工的次品率分别为,生产出来的零件混放在一起,已知生产线加工的零件数分别占总数的.
(1)现从该厂随机抽取一个零件,计算它是次品的概率;
(2)如果取到的一个零件是次品,计算它是生产线加工的概率;(精确到小数点后第三位,采用四舍五入法)
(3)从混放在一起的零件中随机抽取3个,若取到1个次品,对责任人罚款5元;若取到1个正品则对同一责任人奖励10元,用表示该责任人由3个零件获得的金额,求的期望及方差.
【答案】(1);
(2);
(3),.
【分析】(1)由全概率公式计算求解即可;
(2)利用贝叶斯公式计算即可;
(3)设3个零件中的次品数为,则服从二项分布,再根据题意可得与的关系式,利用二项分布的期望和方差公式结合其性质计算即可.
【详解】(1)设“任取一个零件为次品”,分别表示“零件为生产线加工”,
由题设,.
由全概率公式,
(2)由题意,所求概率为.
(3)设3个零件中的次品数为,则.
因为,
所以,
.
2.(2026·陕西·模拟预测)甲、乙两人进行AI知识问答比赛,进行一轮抢答赛,比赛中有3道抢答题,每道题均有人抢答,其计分规则为:初始甲、乙双方均为0分,答对一题得1分,答错一题得分,未抢到得0分,最后累计总分最多的人获胜,假设甲、乙抢到每题的成功率相同,且两人每题答题正确的概率分别为和,求:
(1)甲在比赛中抢到的题目比乙多的概率;
(2)若比赛中3道题均被乙抢到,设乙答题得分为,求的分布列和期望;
(3)甲在比赛中获胜的概率.
【答案】(1);
(2)分布列见解析,期望为;
(3).
【分析】(1)将所求概率的事件拆成两个互斥事件的和,再结合独立重复试验的概率公式求解.
(2)求出的所有可能取值及各个值对应的概率,求出分布列并求出期望.
(3)设甲获胜为事件,甲在比赛中共抢到道题为事件,再利用条件概率公式及全概率公式计算得解.
【详解】(1)甲在比赛中抢到的题目比乙多的事件是甲抢到2个题的事件与甲抢到3个题的事件和,
其概率为.
(2)依题意,的所有可能取值为,
则,
,
所以的分布列为:
1
3
数学期望.
(3)设甲获胜为事件,甲在比赛中共抢到道题为事件,
则,
,
,
所以.
题型04 超几何分布与二项分布
析典例·建模型
1.(2025·北京通州·一模)某艺术研究中心对春节档6部影片观众满意度进行调查,评分如下
第一部
第二部
第三部
第四部
第五部
第六部
普通观众评分
87.2
85.4
84.9
84.9
84.7
83.6
专业观众评分
88.7
80.0
81.6
77.4
76.1
72.2
(1)从这6部影片中随机选取1部,恰好选到普通观众评分与专业观众评分都低于85分的影片的概率;
(2)现有4名观众,每位观众从这6部影片中各随机选取1部观看.
(ⅰ)若不同观众可选相同影片(假设每位观众的选择相互独立),记X为选到普通观众评分与专业观众评分都低于85分的影片的人数,求X的分布列及数学期望.
(ⅱ)若任意2名观众不能选看相同影片,记Y为选到普通观众评分与专业观众评分都低于85分的影片的人数,试比较这种情况下数学期望与(ⅰ)中的大小关系,(结论不要求证明)
【答案】(1)
(2)(ⅰ)分布列见解析;(ⅱ)
【分析】(1)运用古典概型概率公式计算;
(2)(ⅰ)中求的分布列就是确定的所有可能取值,结合二项分布求每个取值的概率.进而得到分布列和均值;(ⅱ)运用超几何分布求出,与比较即可.
【详解】(1)已知事件为“抽到的影片普通观众评分与专业观众评分都低于85分”,题中给出有部影片满足该条件,而影片总数为部.
根据古典概型概率公式,所以.
(2)(ⅰ)依题意,的可能取值为,,,,.因为每次抽取事件相互独立,且抽到普通观众评分与专业观众评分都低于85分的影片的概率为,共抽取次,所以服从参数,的二项分布,即.
根据二项分布概率公式可得:
,
, ,
,
,
列出的分布列:
.
(ⅱ)确定服从的分布及参数:6部影片中有4部普通观众评分与专业观众评分都低于85分的影片,4名观众任意2名观众不能选看相同影片,所以服从超几何分布,其中,,.
求:根据超几何分布的数学期望公式,可得.
比较大小:因为,,所以.
研考点·通技法
1、二项分布的解题步骤
(1)满足以下3个条件可判定为二项分布:
试验次数固定:共进行n次独立试验,每次试验只关注两个结果:“成功”与“失败”,1与0,“正确”或“错误”等,成功概率恒定:每次试验中成功概率保持不变,记作:确定参数与可能取值:明确参数n:试验总次数,p:每次试验的成功概率,确定随机变量取值:X(成功次数)的可能取值为0,1,2,…,n
(2)概率的计算:使用二项分布概率公式:列出分布列并计算期望值等。
2、超几何分布的解题步骤:
(1)确认试验符合不放回抽样特征,并确定三个参数:总体容量 N,总体中“成功”元素个数 M,抽取样本量 n,则随机变量 X 服从超几何分布 X∼H(N,M,n)。
(2)利用超几何概率公式直接计算 X=k 的概率:
(3)将 X 的所有可能取值及其对应概率整理为分布列(通常用表格形式呈现)。
破类题·提能力
1.(2025·北京昌平·二模)在探索数智技术赋能学科学习的过程中,某中学鼓励学生使用某听说平台进行英语口语自主练习.该中学有初中生1200人,高中生800人.为了解全校学生近一个月内使用此听说平台进行英语口语自主练习的次数,从全校学生中随机抽取200名学生进行问卷调查,将他们的使用次数按照,,,,,五个区间进行分组,所得样本数据如下表:
使用次数分组区间
初中生人
高中生人
4
3
38
29
48
28
17
6
3
假设每个学生是否使用此听说平台进行英语口语自主练习相互独立.用频率估计概率.
(1)估计近一个月内全校学生中使用此听说平台进行英语口语自主练习的次数不低于30次的总人数;
(2)从上面参与问卷调查且使用此听说平台进行英语口语自主练习次数不足10次的学生中随机抽取3人,记为这3人中高中生的人数,求的分布列和数学期望;
(3)从该校初中生和高中生中各随机抽取8名学生进行调查,设其中初中生和高中生使用此听说平台进行英语口语自主练习次数位于的人数分别为和,比较与的大小.(结论不要求证明)
【答案】(1)
(2)分布列见解析;期望为
(3)
【分析】(1)根据频数分布表,结合分层抽样的定义进行求解即可;
(2)根据古典型概率公式,结合数学期望的公式进行求解即可;
(3)根据二项分布求得方差判断即可.
【详解】(1)根据题中数据,,得.
样本中使用此听说平台进行英语口语自主练习的次数不低于30次的频率为.
因此近一个月内全校学生中使用此听说平台进行英语口语自主练习的次数不低于30次的总人数估计为:.
(2)参与问卷调查且使用此听说平台进行英语口语自主练习次数不足10次的学生中,初中生有4人,高中生有3人.
所以的取值范围为.
所以的分布列为
0
1
2
3
的数学期望.
(3),理由如下:
根据分层抽样定义知,随机抽取200名学生中,初中生为120名,高中生为80名,
抽到初中生使用此听说平台进行英语口语自主练习次数位于的频率为,
抽到高中生使用此听说平台进行英语口语自主练习次数位于的频率为,
该校初中生和高中生中各随机抽取8名学生中英语口语自主练习次数位于的人数服从二项分布,
即,
所以,,
因为,所以.
3.(2025·北京·三模)某老师为了解班里甲、乙两位同学的数学学习情况,从他们的数学小练习成绩中各随机抽取10份,.获得数据如下表:
甲同学
8
6.5
6
6
7.5
8
8
5.5
9
7.5
乙同学
6
7
7
7.5
7.5
8.5
9
7
9.5
9
已知数学小练习满分为10分,最低分为0分.若小练习得分不低于7.5分视为“得分达到良好”,若小练习得分不低于8.5分视为“得分达到优秀”. 假设用频率估计概率,且甲和乙小练习成绩相互独立.
(1)从甲同学的样本中随机抽取1个,求“得分达到良好”的概率;
(2)从乙同学的所有数学小练习成绩中随机抽取 3 份,记随机变量X为“得分达到优秀”的次数.估计X的分布列和期望:
(3)样本中,甲、乙两位同学小练习成绩的方差分别为记为和,试比较和的大小(结论不要求证明).
【答案】(1)
(2)分别列见详解,期望
(3)相等
【分析】(1)先算出甲同学“得分达到良好”的个数,再利用古典概型求解即可;
(2)先算出乙同学“得分达到优秀”的个数,用样本估计总体,发现X服从二项分布,计算相关情况概率,写出分布列并计算期望;
(3)分别求出甲乙样本的均值与方差比较即可.
【详解】(1)根据题意甲同学“得分达到良好”的有:8,7.5,8,8,9,7.5共6个,
所以从甲同学的样本中随机抽取1个,求“得分达到良好”的概率为.
(2)乙同学“得分达到优秀”的有:8.5,9,9.5,9共4个,
所以乙同学所以数学小练习中“得分达到优秀”的概率为,
从中随机抽取3份,随机变量X服从二项分布,
,,
,,
所以分布列为
X
0
1
2
3
P
期望.
(3)根据题意样本中甲同学成绩的均值
,
乙同学成绩的均值,
所以甲同学成绩的方差,
乙同学成绩的方差,
所以甲、乙两位同学小练习成绩的方差相等.
题型05 概率统计在决策问题中的应用
析典例·建模型
1.(2025·北京海淀·三模)某AI大模型想象力引擎处理用户问题分为“深度思考”模式,“联网搜索”模式和“兼用”模式(即同时使用“深度思考”和“联网搜索”)三种模式,用户可根据需求在提问时自由选择.为了调查用户对不同模式的使用频率和使用大模型研究问题的种类,该公司调查了不同用户最近提出的共10000个问题作为样本,得到如下表格.
问题类别模式
生活类问题
学习类问题
其他类问题
深度思考
1100
600
300
联网搜索
1200
1500
300
兼用
1500
2500
1000
假设每个用户的每个问题的模式选择与问题类别均相互独立,用频率估计概率.
(1)在样本中随机抽取一个问题,求该问题的处理模式是“兼用”模式的概率.
(2)在使用“联网搜索”模式处理的所有问题中随机选取2个,估计生活类问题个数不超过学习类问题个数的概率.
(3)不同模式处理问题的时间可以大致分为三组:,,(单位:秒).在网络正常的时候,使用三种模式处理用户问题所需时间比例统计如下图所示.假设小明已经使用该AI大模型的同一种模式解决了两个问题,其中一个问题的处理时间,另一个问题的处理时间.若不考虑其他因素干扰,判断小明在解决这两个问题时最有可能使用的是哪种模式.(结论不要求证明)
【答案】(1);
(2);
(3)小明使用兼用模式的概率最大.
【分析】(1)根据给定数据,应用频率估计概率即可;
(2)根据不同方法,综合应用独立事件乘法公式、互斥事件加法及对立事件的概率求法求概率;
(3)法一:分别求出不同模式的对应概率,比较大小,即可得结论;法二:记事件:“小明处理两个问题,其中一个用时在,另一个用时在”;事件分别表示“小明使用深度思考模式”,“小明使用联网搜索模式”,“小明使用兼用模式”,依次求出,比较大小得结论.
【详解】(1)由表,样本数量为10000,问题处理模式是“兼用”模式的样本数量为.
在样本中随机抽取一个问题,设事件:“该问题的处理模式是‘兼用’”,则;
(2)在使用“联网搜索”模式处理的所有问题中随机选取1个,该问题是生活类问题的概率估计为,是学习类问题的概率估计为,是其他类问题的概率估计为.
在使用“联网搜索”模式处理的所有问题中随机选取2个,设事件:“生活类问题的个数不超过学习类问题的个数”
方法1:事件包含两种情况:①0个生活类问题和2个非生活类问题;②1个生活类问题,1个学习类问题,0个其他类问题,
所以.
方法2:事件包含两种情况:①0个生活类问题和0个学习类问题,2个其他类问题;②0个生活类问题和1个学习类问题,1个其他类问题;③0个生活类问题和2个学习类问题,0个其他类问题;④1个生活类问题,1个学习类问题,0个其他类问题,
;
方法3:事件包含两种情况:①2个生活类问题和0个非生活类问题;②1个生活类问题,0个学习类问题,1个其他类问题,
;
(3)法一:由图可知,用深度思考模式处理两个问题分别用时在和的概率为;
用联网搜索模式处理两个问题分别用时在和的概率为;
用兼用模式处理两个问题分别用时在和的概率为.
所以用兼用模式处理两个问题分别用时在和的概率最大,故小明最有可能使用兼用模式.
法二:记事件:“小明处理两个问题,其中一个用时在,另一个用时在”;
事件分别表示“小明使用深度思考模式”,“小明使用联网搜索模式”,“小明使用兼用模式”.
则有,,,,
则,
同理,
,
所以,
即已知事件发生的条件下,小明使用兼用模式的概率最大.
研考点·通技法
根据不同的决策计算概率(有时候是期望值),判断概率大小(可以通过作差或作商)来进行选择。若概率含参的话,可以通过作差后,然后根据参数来讨论差值是否大于0,等于0,小于0 。
破类题·提能力
1.(2025·北京海淀·一模)某工厂有一组型号相同的设备,在日常维护中发现部分设备有发热的情况,经过查阅历史数据,发现设备是否发热与设备状态(完好或损坏)有较强的相关性.从发热和未发热情况的数据中各自随机抽取1000条数据,整理如下图所示:
日常维护时,对单台设备有三种可能的操作:保留观察、停机更换或检查维修.对单台设备的不同状态,这三种操作给工厂带来的经济损失如下(单位:千元):
操作
经济损失设备状态
保留观察
停机更换
检查维修
完好
0
10
5
损坏
12
5
7
假设用频率估计概率,且各设备之间的状态相互独立.
(1)已知某设备未出现发热情况,试估计该设备损坏的概率;
(2)该工厂现有2台设备出现发热情况,准备对这2台设备都进行检查维修.记检查维修这2台设备给工厂带来的总经济损失为千元,求的分布列和数学期望;
(3)该工厂的某车间现有2台设备,维护时发现其中一台出现发热情况,另一台未出现发热情况.下面有三种维护这2台设备的操作方案:
发热情况
操作方案编号
发热
未发热
①
检查维修
保留观察
②
停机更换
检查维修
③
停机更换
保留观察
直接写出使得工厂总经济损失的期望最小的方案的编号.
【答案】(1);
(2)分布列见解析,;
(3)①,理由见解析.
【分析】(1)根据题意,直接写出即可;(2)求得的取值,进而计算出其对应概率,即可写出分布列,求得数学期望;(3)计算不同方案下总经济损失的数学期望,比较大小,即可判断.
【详解】(1)设“一台设备未出现发热情况,设备损坏”为事件,则.
(2)依题意,一台设备出现发热情况,设备损坏的概率为,设备正常的概率为;
易知,,
,,,
故的分布列如下所示:
10
故.
(3)使得工厂总经济损失的期望最小的方案的编号为①,理由如下:
记采用不同方案,这2台设备给工厂带来的总经济损失为千元,
采用方案①:的取值为:,
,
故采用方案①,总经济损失的期望;
采用方案②:的取值为:,
,
故采用方案②,总经济损失的期望;
采用方案③:的取值为:,
,
故采用方案③:总经济损失的期望.
综上,,故采用方案①,可使得总经济损失的期望最小.
2.(25-26高三下·北京·开学考试)某工厂有两条生产线生产同一种产品,产品需要经过质量检测. 检测结果分为优质、合格和不合格三种. 从两条生产线上各随机抽取 120 件产品, 检测结果如下表.
优质
合格
不合格
甲生产线
80 件
40 件
0 件
乙生产线
60 件
30 件
30 件
假设各件产品的检测结果相互独立, 用频率估计概率.
(1)从甲生产线抽取的样本中随机取 2 件,求这 2 件产品均合格的概率;
(2)从甲、乙两条生产线的产品中各随机抽取 1 件,记这 2 件产品的利润总和为 元(利润标准: 优质 20 元,合格 5 元,不合格-15 元). 求 的分布列及数学期望:
(3)工厂考虑对乙生产线进行技术改造,改造后,乙生产线生产的产品优质率可提高到 0.7 , 不合格率降为 0.05 . 但改造需要一次性投入,会导致每件产品的生产成本增加 4 元. 试判断改造后乙生产线产品的平均利润是否比改造前有所提高. (直接写出结论)
【答案】(1)
(2)分布列见解析,
(3)改造后乙生产线产品的平均利润比改造前提高
【分析】(1)由古典概型的概率公式求解即可;
(2)由题意可得,求出对应的概率,列出分布列,根据期望公式求解即可;
(3)求出改造前后平均利润,即可得结论.
【详解】(1)设事件 :“从甲生产线抽取的样本中随机取 2 件,这 2 件产品均合格”,则所求概率 .
(2) .
用频率估计概率,甲生产线取到优质品概率为 ,乙生产线取到优质品概率 .
,
分布列
40
25
10
5
-10
(3)改造后乙生产线产品的平均利润比改造前提高.
改造前平均利润 .
改造后平均利润 .
,
所以改造后乙生产线产品的平均利润比改造前提高.
题型06 概率统计与数列的结合
析典例·建模型
1.(2026·云南·模拟预测)甲乙两人进行若干局乒乓球训练赛,每局比赛必须决出胜负,且每局比赛结果相互独立.已知甲每局比赛获胜的概率为,规定先达到净胜3局者获得训练赛胜利并结束训练赛(某人的净胜局数=某人胜的局数-某人负的局数).
(1)记经过n局比赛,甲获得训练赛胜利的概率为,求.
(2)经过若干局后,甲胜的局数与乙胜的局数的差为X,记事件“X=k时,甲最终获得训练赛胜利”发生的概率为,求证:是等比数列;
(3)求甲获得训练赛胜利的概率.
【答案】(1)
(2)证明见解析;
(3)
【分析】(1)利用相互独立事件的概率公式计算即可;
(2)由题意易得与,再分析当时可进行下一局比赛,根据已知条件利用全概率公式建立递推关系,可得,经过变形证明等比数列即可;
(3)利用第(2)问的等比数列结论,结合 “净胜3局(甲胜)、净胜局(乙胜)” 边界条件,求解比赛初始状态下甲的最终获胜概率即可.
【详解】(1)由题意可知经过3局比赛,甲获得训练赛胜利,需3局连胜,则;
(2)由题意,为事件“时,甲最终获得训练赛胜利”发生的概率,
由乙胜的局数即为甲负的局数,甲胜的局数与乙胜的局数的差为,
故即为甲的净胜局数,所以.
经过若干局后,假定当前,
①当时,即甲的净胜局数,
则此时甲获得训练赛胜利并结束训练赛,所以;
②当时,即甲的净胜局数,乙的净胜局数,
则此时乙获得训练赛胜利并结束训练赛,则;
③当时,
由甲的净胜局数,则乙的净胜局数为,且,
故根据比赛规则比赛并未结束,要继续下一局.
记事件“时,甲最终获得训练赛胜利”(),
事件“下一局比赛甲获胜”,
下一局若甲赢(即事件发生),则;若乙赢(即事件发生),则;
因为,,,
且,
所以由全概率公式得,,
即,
因此,整理得,
两边都减去,则可得,
又当时,,
故数列:是公比为2的等比数列.
即数列是公比为2的等比数列.
(3)由题意,甲最终获得训练赛胜利的概率即为.
记,
则,
由(2)知,数列是公比为2的等比数列,
则,解得,
所以,
又,
所以,
故甲最终获得训练赛胜利的概率为.
研考点·通技法
概率与数列结合的题中分以下两者:
1、把全概率公式与过程的马尔科夫性(无记忆性)结合: 当前状态的概率只与上一步状态有关,因此可以按上一步的所有可能情况对当前概率进行分解。
2、离散型分布列为等比数列的题型,用错位相减法求期望(或其它求和)。这类题不涉及多轮递推,而是单次试验中某个离散随机变量的概率分布呈现等比规律,求和时往往要计算形如其中是等比数列。
破类题·提能力
1.(2026·甘肃·一模)甲、乙两人各持有1张“欢”字卡片和1张“喜”字卡片,规定两人每次同时从对方手中随机抽取1张卡片交换(记为一轮操作).记轮操作后,甲手里有2张“欢”字卡片的概率为,甲手里有2张“喜”字卡片的概率为.
(1)求的值;
(2)求的值.
【答案】(1),,,
(2)
【分析】(1)利用独立事件的概率乘法公式,易得与的值,对于第二轮操作,需要分成“甲手中有2张“欢”字卡片或有2张“喜”字卡片”与“甲手中有1张“欢”字卡片和1张“喜”字卡片”两类情况分别求解即得与的值;
(2)类比(1)中的第二轮操作,可得,构造等比数列,求出其通项公式,再代值计算即得.
【详解】(1)第一轮操作,甲要抽到乙的“欢”字卡片,且同时乙要抽到甲的“喜”字卡片,甲手中才能有2张“欢”字卡片,
由独立事件的概率乘法公式,可得,同理;
第二轮操作中,若第一轮结束后,甲手中有2张“欢”字卡片或有2张“喜”字卡片,则在第二轮操作后,甲有2张“欢”字卡片的概率为0;
若第一轮结束后,甲手中有1张“欢”字卡片和1张“喜”字卡片,则甲有2张“欢”字卡片的概率为,
故,同理可得;
(2)由对称性可知,
而只有在次操作后,甲手中有1张“欢”字卡片和1张“喜”字卡片时,甲才有的概率在第次有2张“欢”字卡片,
若在次操作后,甲手中有2张“欢”字卡片或有2张“喜”字卡片,则在第轮操作后,甲有2张“欢”字卡片的概率为0,
所以当时,,化简得,
则可构造为,
所以是一个以为首项,以为公比的等比数列,
可得,所以,
所以.
2.(2026·陕西安康·一模)已知甲、乙两个盒子均装有1个白球和1个黑球,现进行如下操作:从这两个盒子中各取1个球放入对方的盒子中.重复这样的操作,第次操作后甲盒中白球的个数记为.
(1)求;
(2)证明:是等比数列;
【答案】(1)
(2)证明见解析
【分析】(1)列举第一次操作的所求情况和结果,利用古典概型概率的求法求和.
(2)先利用全概率公式探索数列的递推公式,再利用等比数列的定义证明数列是等比数列.
【详解】(1)初始时甲、乙两盒均装有1个白球和1个黑球,第一次操作时,从两盒中各取一球交换,共有4种等可能情况:
甲取白、乙取白:交换后甲盒白球数为1;
甲取白、乙取黑:交换后甲盒白球数为0;
甲取黑、乙取白:交换后甲盒白球数为2;
甲取黑、乙取黑:交换后甲盒白球数为1.
故.
(2)记,则,
由全概率公式得:
①
所以②,
③
由①和③知,结合初始值,
可得对任意有,代入中,
得:,④
将④代入②式得:
整理得,
即:,又,
所以数列是公比为的等比数列.
(建议用时:60分钟)
刷模拟
1.(2025·北京大兴·三模)某地区教育研究部门为了解当前本地区中小学教师在教育教学中运用人工智能的态度、经验、困难等情况,从该地区2000名中小学教师中随机抽取100名进行了访谈.在整理访谈结果的过程中,统计他们对“人工智能助力教学”作用的认识,得到的部分数据如下表所示:
假设用频率估计概率,且每位教师对“人工智能助力教学”作用的认识相互独立.
(1)估计该地区中小学教师中认为人工智能对于教学“没有帮助”的人数;
(2)对受访教师关于“人工智能助力教学”的观点进行赋分:“没有帮助”记0分,“有一些帮助”记2分,“很有帮助”记4分.
①从该地区男教师中抽取4名教师,求这4名教师得分总和为8分的概率;
②统计受访教师的得分,将这100名教师得分的平均值记为,其中年龄在40岁以下(含40岁)教师得分的平均值记为,年龄在40岁以上教师得分的平均值记为,请直接写出的大小关系.(结论不要求证明)
【答案】(1)140
(2)①;②
【分析】(1)首先完善表格,然后求出抽取的100人中认为人工智能对于教学“没有帮助”的频率,最后即可计算该地区中小学教师中认为人工智能对于教学“没有帮助”的人数;
(2)对于①,首先求出男教师认为人工智能对于教学“没有帮助”、“有一些帮助”、“很有帮助”的概率,然后确定4名教师得分总和为8分的情况并计算出概率;对于②,首先根据平均值公式求出,然后比较它们的关系即可.
【详解】(1)根据表格中数据,完善表格,
可以得到100名教师中,认为人工智能对于教学“没有帮助”的频率为,用频率估计概率,估计该地区中小学教师中认为人工智能对于教学“没有帮助”的人数为;
(2)①男教师认为人工智能对于教学“没有帮助”的概率为,
男教师认为人工智能对于教学“有一些帮助”的概率为,
男教师认为人工智能对于教学“很有帮助”的概率为,
因为,
所以
.
②,
,
,
因为,所以.
2.(2025·北京西城·一模)发展纯电动、插电式混合动力等新能源汽车是我国从汽车大国迈向汽车强国的必由之路.为调查研究,某地统计了辖区内从2017年至2024年这8年的新能源汽车和纯电动汽车的销量,得到如下折线图(单位:百辆):
在每一年中,记该年纯电动汽车销量占该年新能源汽车销量的比重为Q.
(1)从2017年至2024年这8年中随机抽取1年,求该年Q值超过的概率;
(2)现从2019年至2024年这6年中依次随机抽取,每次抽取1个年份,若该年的Q值过,则停止抽取,否则继续从剩余的年份中抽取,直至抽到Q值超过的年份.记抽取的次数为,求的分布列和数学期望:
(3)记2020年至 2024年这5年新能源汽车销量数据的方差为,且这5年纯电动汽车销量数据的方差为,写出与的大小关系.(结论不要求证明)
【答案】(1)
(2)分布列见解析,
(3)
【分析】(1)求出各年的值,利用古典概型概率公式求结论;
(2)确定随机变量的可能取值,再求取各值的概率,由此可得分布列,再由期望公式求期望;
(3)先求新能源汽车销量数据的平均数,纯电动汽车销量数据的平均数,再求两组数据的方差,比较大小即可.
【详解】(1)设从年至年这年中随机抽取1年,且该年的值超过为事件,
由图表知,年的值为,年的值为,
年的值为,年的值为,
年的值为,年的值为,
年的值为,年的值为,
所以在年至年这年中,有且仅有年至年这年的值超过,
所以.
(2)由图表知,在年至年这年中,值超过的有年,
所以随机变量的所有可能取值为,,.
则,,.
所以的分布列为:
故的数学期望.
(3)从年至年这年新能源汽车销量数据的平均数为,
所以从年至年这年新能源汽车销量数据的方差
,
所以
从年至年这年纯电动汽车销量数据的平均数为,
从年至年这年纯电动汽车销量数据的方差
,
所以,
所以.
3.(2025·北京门头沟·一模)不同AI大模型各有千秋,适用领域也各有所长.为了解某高校甲、乙两个学院学生对两款不同大模型是否使用,对学生进行简单随机抽样,获得数据如下表:
甲学院
乙学院
使用
不使用
使用
不使用
A款
40人
80人
60人
20人
款
70人
50人
30人
50人
假设所有学生对两款大模型是否使用相互独立,用频率估计概率.
(1)分别估计该校甲学院学生使用A款大模型的概率、该校乙学院学生使用A款大模型的概率;
(2)从该校甲学院全体学生中随机抽取2人,从乙学院全体学生中随机抽取1人,记这3人中使用款大模型的人数为,求的分布列及数学期望;
(3)从该校甲学院全体学生中随机抽取2人,记这2人中使用款大模型的人数为,其方差估计值为,从该校乙学院全体学生中随机抽取2人,记这2人中使用款大模型的人数为,其方差估计值为,比较与的大小.
【答案】(1)
(2)答案见详解
(3)
【分析】(1)利用古典概型结合表格计算即可;
(2)利用离散型随机变量的分布列及期望公式计算即可;
(3)利用二项分布的方差公式计算并比较大小即可.
【详解】(1)由表格可知:该校甲学院学生使用款大模型的概率为,
该校乙学院学生使用款大模型的概率为;
(2)由题意可知的可能取值为:,
则,
,
,
,
的分布列如下:
0
1
2
3
P
所以;
(3)同第一问,可知该校甲学院学生使用款大模型的概率为,
该校乙学院学生使用款大模型的概率为,
易知,
由二项分布的方差公式可知,
,
所以.
4.(2025·安徽合肥·三模)某城市推广垃圾分类,设置智能回收箱(方式)和传统垃圾桶(方式).统计显示,60%的居民选择方式,选择方式,若垃圾被正确分类,则垃圾被回收,不用填埋.智能回收箱的正确分类率为,错误分类后需人工处理,人工处理可将错误分类垃圾的40%重新正确分类,其余直接填埋;传统垃圾桶的正确分类率为75%,错误分类后直接填埋.
(1)求垃圾最终被填埋的概率;
(2)若某吨垃圾被填埋,求其最初通过传统垃圾桶投放的概率;
(3)现有一吨垃圾要整体处理,设为其处理成本(单位:元),正确分类无需成本,人工处理成本为200元,填埋成本为500元.求的分布列及数学期望.
【答案】(1)0.154
(2)
(3)分布列见解析,95
【分析】(1)根据全概率公式即可求解;
(2)根据条件概率公式即可求解;
(3)由题意,的可能取值为0,200,500,700,分别求得对应概率,即可得出分布列及数学期望.
【详解】(1)记为事件“垃圾按照方式分类”,为事件“垃圾最终被填埋”,
则.
(2)由题意得,.
(3)由题意,的可能取值为0,200,500,700,
且,
,
,
,
故分布列如下:
0
200
500
700
0.81
0.036
0.1
0.054
.
5.(2025·北京东城·一模)据国家相关部门统计,2023年华东地区、东北地区主要省份的水稻、小麦的播种面积和产量数据见下表:
水稻
小麦
播种面积(千公顷)
产量(万吨)
播种面积(千公顷)
产量(万吨)
华东
地区
江苏省
2221.0
2003.2
2389.5
1373.5
浙江省
649.0
485.3
152.6
66.4
安徽省
2500.7
1609.8
2862.7
1740.7
福建省
601.1
394.6
0.1
0.0
江西省
3383.9
2070.7
11.3
3.5
山东省
101.0
86.1
4008.9
2673.8
东北
地区
辽宁省
500.5
412.9
2.0
0.8
吉林省
828.8
682.1
5.0
1.7
黑龙江省
3268.5
2110.0
19.3
7.5
(1)从表1中的华东地区随机抽取1个省份,求该省水稻产量比小麦产量少的概率;
(2)从表1的9个省份中随机抽取2个,设为水稻播种面积排在前5名且属于东北地区省份的个数.求的分布列与数学期望;
(3)2023年华东地区、东北地区和华北地区主要粮食作物的播种面积及其采用新技术的播种面积占该作物总播种面积的比值(简称新技术占比率)数据见下表:
粮食
作物
播种面积
(千公顷)
新技术
占比率
粮食
作物
播种面积
(千公顷)
新技术
占比率
华东地区
水稻
9456.7
0.70
小麦
9425.1
0.60
东北地区
水稻
4597.8
0.55
玉米
13800.0
0.65
华北地区.
小麦
3184.5
0.65
玉米
9564.7
0.60
记华东地区和东北地区水稻播种总面积的新技术占比率、华东地区和华北地区小麦播种总面积的新技术占比率、东北地区和华北地区玉米播种总面积的新技术占比率分别为.依据表2中的数据比较的大小.(结论不要求证明)
【答案】(1);
(2)分布列见解析,;
(3).
【分析】(1)应用古典概型的概率求法求华东地区随机抽取1个省份,水稻产量比小麦产量少的概率;
(2)由题意可能值为,应用超几何分布的概率求法求概率,即得分布列,进而求期望;
(3)根据表格分别求出各地区作物新技术占比率,比较大小即可.
【详解】(1)由表格,华东地区6省中只有安徽省、山东省的水稻产量比小麦产量少,
所以华东地区随机抽取1个省份,水稻产量比小麦产量少的概率;
(2)由表格,水稻播种面积最大的5个省依次为江西、黑龙江、安徽、江苏、吉林,
其中华东地区有3个,东北地区有2个,若9个省份中随机抽取2个,
水稻播种面积排在前5名且属于东北地区省份的个数可能值为,
,,,
分布列如下,
0
1
2
所以;
(3)由表格知,,,
所以.
6.(2026·广东梅州·一模)(1)一个袋子中有30个大小相同的球,其中有10个红球、20个白球,从中随机放回地逐次摸一个球作为样本,5次摸球后停止,用表示停止时摸出红球的次数.
①求的分布列和数学期望;
②若用样本中红球的比例估计总体中红球的比例,求误差的绝对值不超过0.2的概率.
(2)某节目上,有三扇关闭的门,其中一扇门后面为汽车,另两扇门后面为山羊,节目参加者从这三扇门中选择一扇,然后所选之门后面的物品则归其所有.当参加者选定一扇门后,节目主持人开启了剩余两扇门中后面为山羊的一扇门,并询问节目参加者是否更换选择.问:参加者这时候更换选择会更好吗?请用概率解释.(备注:汽车的价值要远大于羊.)
【答案】(1)①分布列见解析,;②;(2)节目参加者换门更好,答案见解析
【分析】(1)①由进行求解即可;②依题意,样本比例为,现要求,得,,再由进行求解;
(2)记表示初始选择时选得汽车的事件,表示更换选择后选得汽车的事件,
则,,由全概率公式进行求解.
【详解】(1)①每次有放回的抽取,每次抽到红球的概率为,
所以,
即,,,,,,,
得到的分布列为
0
1
2
3
4
5
期望为,
②依题意,样本比例为,现要求,
得,即,,
所以用样本中红球的比例估计总体的误差绝对值不超过0.2的概率为
.
(2)记表示初始选择时选得汽车的事件,表示更换选择后选得汽车的事件,
则,,
所以,,
则,
因此不换门选中汽车的概率是,
换门选中汽车的概率是,
故而得结论:当主持人开启剩余的山羊门后,节目参加者换门更好,因为此时其获得汽车的概率是不换门的两倍.
7.(2026·河南南阳·模拟预测)甲、乙两名同学进行传统文化知识比赛,规则如下:连续胜两局者获胜,比赛结束;比赛最多五局,若五局结束时两人均未能连续获胜两局,则五局中胜局数多者获胜.在一局比赛中,若甲胜,则甲下一局胜的概率为;若甲输,则甲下一局胜的概率为.已知第一局甲胜的概率为,假设每局比赛没有平局,记比赛结束时的局数为.
(1)求第2局比赛甲胜的概率;
(2)在的条件下,求甲胜的概率;
(3)求比赛结束时甲胜的概率.
【答案】(1)
(2)
(3)
【分析】(1)先把第1局作为互斥事件,再利用全概率公式计算求解;
(2)先分别计算比赛进行3局时甲胜和乙胜的概率,求和得到,再利用条件概率公式计算求解;
(3)按结束的局数分类,可能是,分别计算每种局数下甲胜的概率,再求和.
【详解】(1)设表示第1局甲胜,表示第2局甲胜,
由全概率公式得.
(2)表示比赛在第3局结束,即前2局无连续两胜,第3局形成连续连胜:
乙胜:序列为“甲、乙、乙”,概率为,
甲胜:序列为“乙、甲、甲”,概率为,
,
甲胜的概率为.
(3)时,甲胜的概率为;
时,甲胜的概率为;
时,甲胜序列为“甲、乙、甲、甲”的概率为;
时,甲胜序列为“乙、甲、乙、甲、甲”或“甲、乙、甲、乙、甲”,
概率为,
甲胜的概率为.
7.(2026·北京平谷·一模)根据《国家学生体质健康标准》,高一男生和女生50米跑单项等级如下(单位:秒):
50米跑单项等级
高一男生
高一女生
优秀
7.3及以下
8.0及以下
良好
7.4~7.5
8.1~8.6
及格
7.6~9.5
8.7~10.6
不及格
9.6及以上
10.7及以上
从某校高一男生和女生中各随机抽取15名同学,将其50米跑测试成绩整理如下:
男生
7.0
7.1
7.2
7.3
7.3
7.4
7.5
7.5
7.5
7.5
8.6
9.6
9.7
9.7
9.8
女生
7.4
7.6
7.6
7.8
7.9
8.0
8.1
8.8
9.0
9.2
9.7
10.4
10.4
10.5
10.8
假设用频率估计概率,且每个同学的测试成绩相互独立.
(1)估计该校高一男生50米跑单项及格及以上的概率;
(2)从该校高一男生和女生中各随机抽取2人,估计4人中恰有2人50米跑单项等级是优秀的概率;
(3)通过一段时间锻炼,对该校在及格及以下成绩的学生进行再测试,结果又有的男生达到良好及以上的成绩,又有的女生达到良好及以上的成绩,记最后男女达到良好及以上的概率分别为,判断的大小.(结论不要求证明)
【答案】(1)
(2)
(3)
【分析】(1)通过求解;
(2)通过对立事件、独立事件、互斥事件概率公式求解;
(3)根据题目信息,利用古典概率的意义判断即得.
【详解】(1)样本中50米跑单项等级获得优秀的男生人数为5,获得良好的男生人数为5,获得及格的男生人数为1,
所以估计该校高一男生50米跑单项的及格及以上的概率;
(2)记4人中恰有2人50米跑单项等级是优秀的事件为
记“高一男生50米跑单项等级是优秀”为事件;
“高一女生50米跑单项等级是优秀”为事件;
其中是独立事件
由(1)得;.
记2名50米跑单项等级是优秀的人都是男同学的事件为
记2名50米跑单项等级是优秀的人都是女同学的事件为
记2名50米跑单项等级是优秀的人有1名是男同学1名是女同学的事件为
则.
(3)男生及格及以下成绩人数为5人,再次测试后良好及以上成绩约1人,
女生及格及以下成绩8人,再次测试后良好及以上成绩为2人,
两次测试后,良好及以上成绩的总人数男生多于女生,
所以.
8.(2025·北京海淀·三模)自动驾驶是依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让自动驾驶系统可以在没有人类主动的操作下,自动安全地操作机动车辆的技术,其安全性备受人们的关注.2015年起,美国加州机动车管理局要求获得自动驾驶道路测试资质的公司每年1月1日之前上交一份自动驾驶年度报告,总结道路测试总里程数,以及过程中所经历的所有自动驾驶脱离事件,脱离事件是指在自动驾驶系统遇到无法处理的情况时,由驾驶员人工干预的事件.每次脱离平均行驶里程(MPD值,Miles per Disengagement),代表自动驾驶汽车每行驶多少里程才需要人工干预一次,它由一家公司报告的总里程数除以总脱离次数得到,这是衡量一辆自动驾驶汽车“驾驶水平”的重要指标之一.从《加州2023年自动驾驶脱离报告》中选取了9家公司的数据.
公司
所属国家
测试总里程(英里)
脱离次数
MPD值
百度
中国
108300
6
18050
谷歌Waymo
美国
1454137
110
13219
通用Cruise
美国
831040
68
12221
比亚迪
中国
32054
3
10684
小马智行
中国
174845
27
6475
Nuro
美国
68762
34
2022
Zoox
美国
67015
42
1595
小米
中国
12272
8
1534
苹果
美国
7544
64
117
(1)从表中随机抽取一家中国公司和一家美国公司,求抽到的中国公司比抽到的美国公司MDP值高的概率;
(2)从表中的9家公司随机抽取3家,求至少有2家MPD值大于10000的概率;
(3)有人认为根据《加州2023年自动驾驶脱离报告》的数据,可以说明百度公司的自动驾驶技术已经全面超越谷歌公司.你是否同意此观点?并说明你的理由.
【答案】(1)
(2)
(3)不同意此观点,理由见解析
【分析】(1)由古典概型概率计算公式分析即可求解;
(2)由互斥加法概率公式、古典概型概率计算公式以及组合数的计算即可求解.
(3)不能单方面从MPD值来说明百度公司的自动驾驶技术超越谷歌公司,事实上百度公司的测试总里程108300远小于谷歌Waymo的1454137,具体说明只需言之有理即可.
【详解】(1)因为表中有4家中国公司,5家美国公司,随机抽取一家中国公司和一家美国公司共种情况.
表中所有的美国公司中,MDP值比百度低的有5家,比AutoX和小马智行低的有3家,比小米低的有1家,
所以抽到的中国公司比抽到的美国公司MDP值高的情况共有种
故抽到的中国公司比抽到的美国公司MDP值高的概率为.
(2)设“从表中的9家公司随机抽取3家,至少有2家MPD值大于10000”为事件A,
表中的9家公司中有4家MPD值大于10000.
设“恰有2家公司MPD值大于10000”为事件B,“恰有3家公司MPD值大于10000”为事件C,
则,且B,C互斥
所以
(3)我不同意此观点,理由如下:
①虽然百度公式的MPD值为18050,高于谷歌Waymo的13219,但是百度公司的测试总里程108300远小于谷歌Waymo的1454137,样本比较小,测试值与实际值偏差较大的可能性更大,所以不能确定.
②虽然百度公式的MPD值为18050,高于谷歌Waymo的13219,但是MPD值只是衡量自动驾驶汽车“驾驶水平”的重要指标之一,不能说明百度公司的自动驾驶技术在其他方面也超越了谷歌公司.
9.(2025·北京海淀·二模)某运动品牌拟推出一款青少年新品跑鞋.在前期市场调研时,从某市随机调查了200名中小学生对黑、白两种颜色的新品跑鞋的购买意愿,统计数据如下(单位:人):
颜色
小学生
初中生
高中生
愿意
不愿意
愿意
不愿意
愿意
不愿意
黑色
80
20
40
20
20
20
白色
60
40
30
30
30
10
假设所有中小学生的购买意愿相互独立,用频率估计概率.
(1)从该市全体中小学生中随机抽取1人,估计其愿意购买黑色新品跑鞋的概率;
(2)从该市的初中生、高中生两个不同群体中各自随机抽取1人,记为这2人中愿意购买白色新品跑鞋的人数,求的分布列和数学期望;
(3)假设该市学校内的小学生、初中生和高中生的人数之比为,从学校的全体中小学生中随机抽取1人,将其愿意购买黑色新品跑鞋的概率估计值记为,试比较与(1)中的的大小.(结论不要求证明)
【答案】(1)
(2)分布列见解析,;
(3).
【分析】(1)根据表中数据求出相应频率,用频率估计概率即可;
(2)的可能取值为,求出相应的概率值,即可得到分布列与期望;
(3)分别求出小学生、初中生、高中生愿意购买黑色新品跑鞋的概率,结合所占的权重求得并与的大小比较即可.
【详解】(1)由表可知200名顾客中愿意购买黑色新品跑鞋的人数为140人,
用频率估计概率,从顾客中随机抽取1人,估计该名顾客愿意购买第一款新品的概率;
(2)用频率估计概率,由表可知从初中生组中抽取1人,愿意购买白色新品跑鞋的概率为,
从高中生组中抽取1人,愿意购买白色新品跑鞋的概率为,
由题意的可能取值为,
,
,
.
所以的分布列为
.
(3)小学生愿意购买黑色新品跑鞋的概率为;
初中生愿意购买黑色新品跑鞋的概率为;
高中生愿意购买黑色新品跑鞋的概率为.
所以.
刷真题
1.(2025·北京·高考真题)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试.为了解学生对该知识点的掌握情况,随机抽查了甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立,用频率估计概率.
(1)估计甲校高一年级学生该题选择正确的概率
(2)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计的概率及X的数学期望;
(3)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识点,甲校学生选择正确的概率为,乙校学生选择正确的概率为.设甲、乙两校高一年级学生掌握该知识点的概率估计值分别为,,判断与的大小(结论不要求证明).
【答案】(1)
(2),
(3)
【分析】(1)用频率估计概率即可求解;
(2)利用独立事件乘法公式以及互斥事件的加法公式可求恰有1人做对的概率及的分布列,从而可求其期望;
(3)根据题设可得关于的方程,求出其解后可得它们的大小关系.
【详解】(1)估计甲校高一年级学生该题选择正确的概率.
(2)设为“从甲校抽取1人做对”,则,,
设为“从乙校抽取1人做对”,则,,
设为“恰有1人做对”,故
依题可知,可取,
,,,
故的分布列如下表:
故.
(3)设为 “甲校掌握这个知识点的学生做该题”,
因为甲校掌握这个知识点则有的概率做对该题目,
未掌握该知识点的同学都是从四个选项里面随机选择一个,
故,即,故,
同理有,,故,
故.
2.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数
0
1
2
3
4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
【答案】(1)
(2)(i)0.122万元;(ii) 这种情况下一份保单毛利润的数学期望估计值大于(i)中估计值
【分析】(1)根据题设中的数据可求赔偿次数不少2的概率;
(2)(ⅰ)设为赔付金额,则可取,用频率估计概率后可求的分布列及数学期望,从而可求.
(ⅱ)先算出下一期保费的变化情况,结合(1)的结果可求,从而即可比较大小得解.
【详解】(1)设为“随机抽取一单,赔偿不少于2次”,
由题设中的统计数据可得.
(2)(ⅰ)设为赔付金额,则可取,
由题设中的统计数据可得,
,,
,
故
故(万元).
(ⅱ)由题设保费的变化为,
故(万元),
从而.
3.(2023·北京·高考真题)为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“-”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.
时段
价格变化
第1天到第20天
-
+
+
0
-
-
-
+
+
0
+
0
-
-
+
-
+
0
0
+
第21天到第40天
0
+
+
0
-
-
-
+
+
0
+
0
+
-
-
-
+
0
-
+
用频率估计概率.
(1)试估计该农产品价格“上涨”的概率;
(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;
(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)
【答案】(1)
(2)
(3)不变
【分析】(1)计算表格中的的次数,然后根据古典概型进行计算;
(2)分别计算出表格中上涨,不变,下跌的概率后进行计算;
(3)通过统计表格中前一次上涨,后一次发生的各种情况进行推断第天的情况.
【详解】(1)根据表格数据可以看出,天里,有个,也就是有天是上涨的,
根据古典概型的计算公式,农产品价格上涨的概率为:
(2)在这天里,有天上涨,天下跌,天不变,也就是上涨,下跌,不变的概率分别是,,,
于是未来任取天,天上涨,天下跌,天不变的概率是
(3)由于第天处于上涨状态,从前次的次上涨进行分析,上涨后下一次仍上涨的有次,不变的有次,下跌的有次,
因此估计第次不变的概率最大.
4.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
【答案】(1)0.4
(2)
(3)丙
【分析】(1) 由频率估计概率即可
(2) 求解得X的分布列,即可计算出X的数学期望.
(3) 计算出各自获得最高成绩的概率,再根据其各自的最高成绩可判断丙夺冠的概率估计值最大.
【详解】(1)由频率估计概率可得
甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,
故答案为0.4
(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3
,
,
,
.
∴X的分布列为
X
0
1
2
3
P
∴
(3)丙夺冠概率估计值最大.
因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为,甲获得9.80的概率为,乙获得9.78的概率为.并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.
1 / 2
学科网(北京)股份有限公司
$
专项03 概率
内容导航
【命题解码·定方向】命题趋势+2026年预测
【解题建模·通技法】析典例,建模型,技法贯通破类题/变式
【实战刷题·冲高分】精选高考大题+名校模拟题,强化实战能力,得高分
根据近五年北京卷考情,概率是必考大题,分值约13-17分.
命题趋势:概率在解答题中地位稳固,重点考查离散型随机变量的分布列与期望,以及结合实际问题进行数据分析与决策
2026年预测:预计2026年概率模块难度加强,条件概率、全概率公式及贝叶斯公式将成为考查热点,且与数列、函数等知识交汇融合的题型值得重点关注
备考核心:备考需重点突破条件概率、全概率与贝叶斯公式,熟练掌握二项分布和超几何分布的模型识别与应用。
题型01 用样本估计总体
析典例·建模型
1.(2025·北京丰台·二模)为调查某校学生户外活动时长和视力的关系,某研究小组在该校随机选取了100名学生,记录他们的日均户外活动时长(单位:小时)及近视情况,统计得到:日均户外活动时长在区间内有70人,近视率为;日均户外活动时长在区间内有20人,近视率为;日均户外活动时长在区间内有10人,近视率为.
注:近视率是指某区间内近视人数与该区间内人数的比值.
(1)估计该校日均户外活动时长不低于1小时的学生的近视率;
(2)用频率估计概率.从该校日均户外活动时长低于1小时的学生和不低于1小时的学生中各随机选取2名,求这4名学生中恰有2名近视的概率;
(3)为响应国家降低青少年近视率的号召,该校提出“护眼有妙招,科学动起来”的口号,计划在以下2项措施中选择1项实施.
措施一:每日给全校学生增设0.5小时晨跑活动;
措施二:每日给日均户外活动时长低于1小时的学生增设1小时户外活动.假设所有学生都能按要求参加相应活动,记采取措施一后该校全体学生的日均户外活动时长的平均值为,采取措施二后该校全体学生的日均户外活动时长的平均值为.用样本估计总体,试比较与的大小.(结论不要求证明)
研考点·通技法
总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,,,,总体平均数为,则总体方差=
.
②加权式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为,,,,其中出
现的频数为(i=1,2,,k),则总体方差为=.总体标准差:S=.
标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
破类题·提能力
1.(2025·北京·二模)网络搜索已成为人们获取信息或解决问题的重要手段.为研究某传染性疾病的未来流行趋势,收集得到该疾病某月1号至30号的网络搜索量(单位:万次)如下:
时间
1号
2号
3号
4号
5号
6号
7号
8号
9号
10号
11号
12号
13号
14号
15号
搜索量
6.2
5.1
6.1
7.2
6.1
7.4
6.2
6.3
6.4
6.3
7.1
6.3
7.3
7.6
7.9
时间
16号
17号
18号
19号
20号
21号
22号
23号
24号
25号
26号
27号
28号
29号
30号
搜索量
8.5
11.2
10.3
9.1
9.6
10.1
10.6
10.9
8.8
10.4
8.2
11.5
12.1
12.8
13.6
用频率估计概率.
(1)从2号至14号中任取1天,求该天的搜索量比其前后两日的搜索量都低的概率;
(2)假设该疾病每天的搜索量变化是相互独立的.在未来的日子里任取3天,试估计这3天该疾病搜索量的数据中既有高于10万又有低于8万的概率;
(3)记表中30天的搜索量的平均数为,去除搜索量中最大的3个和最小的3个后剩余24个搜索量的平均数为,试给出与的大小关系.(结论不要求证明)
2.(2025·北京朝阳·二模)某电商平台为了解用户对配送服务的满意度,分别从A地区和B地区随机抽取了500名和100名用户进行问卷评分调查,将评分数据按,,…,分组整理得到如下频率分布直方图:
(1)从A地区抽取的500名用户中随机抽取一名,求该用户评分不低于60分的概率;
(2)从B地区评分为的样本中随机抽取两名,记评分不低于90分的用户人数为X,求X的分布列和数学期望;
(3)根据图中的样本数据,假设同组中每个数据用该组区间的中点值代替,设A地区评分的平均值估计为,A,B两地区评分的平均值估计为,比较与的大小关系.(直接写出结论)
题型02 离散型随机变量的分布列、均值方差
析典例·建模型
1.(2026·北京延庆·一模)2024年联合国教科文组织第46届世界遗产大会上,我国申报的“北京中轴线——中国理想都城秩序的杰作”被正式列入《世界遗产名录》.北京中轴线坐落于北京老城中心,全长7.8公里,始建于13世纪,是统领老城整体规划格局的建筑与遗址的组合体.它共包含15处遗产点,可分为A、B、C、D、E五种类型,具体如下表:
类
型
A古代皇家宫苑建筑
B古代皇家
祭祀建筑
C古代城市管理设施
D国家礼仪和公共建筑
E居中道路遗存
中轴线遗产点
故宫
景山
太庙
社稷坛
天坛
先农坛
钟鼓楼
万宁桥
端门
天安门
外金水桥
天安门广场及建筑群
正阳门
永定门
中轴线南段道路遗存
某研学团队计划随机选取3处遗产点开展研学活动.
(1)若从15处遗产点中随机选取,求选取的3处遗产点均为D类的概率;
(2)若从A、B、C这三类遗产点中随机选取3处,设选取的3处遗产点的类型种数为X,求X的分布列及数学期望;
(3)该研学团队通过调查发现:所有参观北京中轴线的人群可分为老年人、中年人、青少年三个群体,其人数比值为,同时,这三个群体选择参观A类或D类遗产点的频率分布如下表:
人群
老年人
中年人
青少年
只参观A类型遗产点
60%
25%
30%
只参观D类型遗产点
20%
45%
30%
两类遗产点都参观
20%
30%
40%
用频率估计概率,若从所有参观A类或D类遗产点的人群中随机选取1人,记“只参观A类型遗产点”的概率为,“只参观D类型遗产点”的概率为,请根据表中信息,判断与的大小关系.(结论不要求证明)
研考点·通技法
1、判断分布类型
确认随机变量:明确问题中的随机变量 X 及其可能取值
识别分布类型:若为不放回抽样且关心“次品数”、“合格数”等 → 超几何分布
若为独立重复试验(每次成功概率相同) → 二项分布
若为有限等可能抽样且涉及特定计数 → 可考虑古典概型计算
2、确定参数并计算概率:根据类型选用公式,依次计算 X 取每一个可能值的概率
3、整理分布列,列成表格,验证概率和为1
4、应用与计算:求期望值或方差等。
注意:先判断类型再计算,避免公式误用,注意随机变量取值的完整性与互斥性计算后务必检查概率总和是否为 1
破类题·提能力
1.(2025·北京大兴·三模)为测试、两款人工智能软件解答数学问题的能力,将100道难度相当的数学试题从1到100编号后随机分配给这两款软件测试.每道试题只被一款软件解答一次,记录结果如下:
试题类别
软件
软件
测试试题数量
正确解答的数量
测试试题数量
正确解答的数量
函数试题
30
24
20
18
几何试题
20
16
30
20
(1)估计软件能正确解答数学问题的概率;
(2)小明决定采用这两款软件解答3道类似试题(假设其难度和测试的100道题基本相同),其中函数2道,几何1道;使用软件解答2道函数试题,使用软件解答1道几何试题;每道试题只用其中一款软件解答一次.假设用频率估计概率,且每次解答相互独立.用表示3道类似试题被正确解答的个数,求的分布列与数学期望;
(3)小明准备用这两款软件来解决某次数学测试中的第12题(假设其难度和测试的100道题基本相同),但该题内容还未知,从已往情况来看,该题是函数题的概率为,几何题的概率为.假设用频率估计概率,试说明小明用哪款软件正确解答这道试题的概率大?(结论不要求证明)
2.(2025·北京丰台·一模)京广高速铁路是世界上运营里程最长的高速铁路之一,也是中国客运量最大、运输最为繁忙的高速铁路之一.某日从北京西到广州南的部分G字头高铁车次情况如下表:注:以下高铁车次均能准点到达
(1)某乘客从上表中随机选取一趟高铁车次从北京西出发到广州南,求这趟列车的运行时长不超过10小时的概率;
(2)甲、乙、丙3人分别从上表中随机选取一趟高铁车次从北京西出发到广州南,其中甲必须上午出发,乙必须下午出发,丙的出发时间没有限制,且甲、乙、丙3人的选择互不影响.
(ⅰ)记随机变量为甲、乙、丙选取的列车中运行时长不超过10小时的个数,求的分布列和数学期望;
(ⅱ)甲、乙、丙3人中,谁选取的列车运行时长最短的概率最大?(结论不要求证明)
题型03 条件概率、全概率和贝叶斯公式
析典例·建模型
1.(2025·北京平谷·一模)某科研团队研发了一款快速检测某种疾病的试剂盒.为了解该试剂盒检测的准确性,科研团队从某地区(人数众多)随机选取了40位患者和60位非患者,用该试剂盒分别对他们进行了一次检测,结果如下:
抽样人群
阳性人数
阴性人数
患者
36
4
非患者
2
58
(1)试估计使用该试剂盒进行一次检测结果正确的概率;
(2)若从该地区的患者和非患者中分别抽取2人进行一次检测,求恰有一人检测结果错误的概率;
(3)假设该地区有10万人,患病率为0.01.从该地区随机选取一人,用该试剂盒对其检测一次.若检测结果为阳性,能否判断此人患该疾病的概率超过0.2?并说明理由.
研考点·通技法
用全概率公式的步骤:
1、按照确定的标准,将一个复合事件分解为若干个互斥事件;
2、求与;
3、代入全概率公式,求出目标事件的概率.
贝叶斯公式有着重要的实际意义,一件事由“因”推出“果”容易,但是贝叶斯公式是在做逆运算,它是在条件概率的基础上寻找事件发生的原因,在运用贝叶斯公式的过程如下:
1、A的多种情况发生的概率已知,即P(Ai)已知;
2、在A的每种情况发生的条件下B发生的概率已知,即已知;
3、未知,需要使用全概率公式计算得到;
4、求解的目标是用A的某种情况Ai的无条件概率求其在B发生的条件下的有条件概率P().
破类题·提能力
1.(2025·四川泸州·模拟预测)某工厂有两条生产线加工同一型号的零件,生产线加工的次品率分别为,生产出来的零件混放在一起,已知生产线加工的零件数分别占总数的.
(1)现从该厂随机抽取一个零件,计算它是次品的概率;
(2)如果取到的一个零件是次品,计算它是生产线加工的概率;(精确到小数点后第三位,采用四舍五入法)
(3)从混放在一起的零件中随机抽取3个,若取到1个次品,对责任人罚款5元;若取到1个正品则对同一责任人奖励10元,用表示该责任人由3个零件获得的金额,求的期望及方差.
2.(2026·陕西·模拟预测)甲、乙两人进行AI知识问答比赛,进行一轮抢答赛,比赛中有3道抢答题,每道题均有人抢答,其计分规则为:初始甲、乙双方均为0分,答对一题得1分,答错一题得分,未抢到得0分,最后累计总分最多的人获胜,假设甲、乙抢到每题的成功率相同,且两人每题答题正确的概率分别为和,求:
(1)甲在比赛中抢到的题目比乙多的概率;
(2)若比赛中3道题均被乙抢到,设乙答题得分为,求的分布列和期望;
(3)甲在比赛中获胜的概率.
题型04 超几何分布与二项分布
析典例·建模型
1.(2025·北京通州·一模)某艺术研究中心对春节档6部影片观众满意度进行调查,评分如下
第一部
第二部
第三部
第四部
第五部
第六部
普通观众评分
87.2
85.4
84.9
84.9
84.7
83.6
专业观众评分
88.7
80.0
81.6
77.4
76.1
72.2
(1)从这6部影片中随机选取1部,恰好选到普通观众评分与专业观众评分都低于85分的影片的概率;
(2)现有4名观众,每位观众从这6部影片中各随机选取1部观看.
(ⅰ)若不同观众可选相同影片(假设每位观众的选择相互独立),记X为选到普通观众评分与专业观众评分都低于85分的影片的人数,求X的分布列及数学期望.
(ⅱ)若任意2名观众不能选看相同影片,记Y为选到普通观众评分与专业观众评分都低于85分的影片的人数,试比较这种情况下数学期望与(ⅰ)中的大小关系,(结论不要求证明)
研考点·通技法
1、二项分布的解题步骤
(1)满足以下3个条件可判定为二项分布:
试验次数固定:共进行n次独立试验,每次试验只关注两个结果:“成功”与“失败”,1与0,“正确”或“错误”等,成功概率恒定:每次试验中成功概率保持不变,记作:确定参数与可能取值:明确参数n:试验总次数,p:每次试验的成功概率,确定随机变量取值:X(成功次数)的可能取值为0,1,2,…,n
(2)概率的计算:使用二项分布概率公式:列出分布列并计算期望值等。
2、超几何分布的解题步骤:
(1)确认试验符合不放回抽样特征,并确定三个参数:总体容量 N,总体中“成功”元素个数 M,抽取样本量 n,则随机变量 X 服从超几何分布 X∼H(N,M,n)。
(2)利用超几何概率公式直接计算 X=k 的概率:
(3)将 X 的所有可能取值及其对应概率整理为分布列(通常用表格形式呈现)。
破类题·提能力
1.(2025·北京昌平·二模)在探索数智技术赋能学科学习的过程中,某中学鼓励学生使用某听说平台进行英语口语自主练习.该中学有初中生1200人,高中生800人.为了解全校学生近一个月内使用此听说平台进行英语口语自主练习的次数,从全校学生中随机抽取200名学生进行问卷调查,将他们的使用次数按照,,,,,五个区间进行分组,所得样本数据如下表:
使用次数分组区间
初中生人
高中生人
4
3
38
29
48
28
17
6
3
假设每个学生是否使用此听说平台进行英语口语自主练习相互独立.用频率估计概率.
(1)估计近一个月内全校学生中使用此听说平台进行英语口语自主练习的次数不低于30次的总人数;
(2)从上面参与问卷调查且使用此听说平台进行英语口语自主练习次数不足10次的学生中随机抽取3人,记为这3人中高中生的人数,求的分布列和数学期望;
(3)从该校初中生和高中生中各随机抽取8名学生进行调查,设其中初中生和高中生使用此听说平台进行英语口语自主练习次数位于的人数分别为和,比较与的大小.(结论不要求证明)
3.(2025·北京·三模)某老师为了解班里甲、乙两位同学的数学学习情况,从他们的数学小练习成绩中各随机抽取10份,.获得数据如下表:
甲同学
8
6.5
6
6
7.5
8
8
5.5
9
7.5
乙同学
6
7
7
7.5
7.5
8.5
9
7
9.5
9
已知数学小练习满分为10分,最低分为0分.若小练习得分不低于7.5分视为“得分达到良好”,若小练习得分不低于8.5分视为“得分达到优秀”. 假设用频率估计概率,且甲和乙小练习成绩相互独立.
(1)从甲同学的样本中随机抽取1个,求“得分达到良好”的概率;
(2)从乙同学的所有数学小练习成绩中随机抽取 3 份,记随机变量X为“得分达到优秀”的次数.估计X的分布列和期望:
(3)样本中,甲、乙两位同学小练习成绩的方差分别为记为和,试比较和的大小(结论不要求证明).
题型05 概率统计在决策问题中的应用
析典例·建模型
1.(2025·北京海淀·三模)某AI大模型想象力引擎处理用户问题分为“深度思考”模式,“联网搜索”模式和“兼用”模式(即同时使用“深度思考”和“联网搜索”)三种模式,用户可根据需求在提问时自由选择.为了调查用户对不同模式的使用频率和使用大模型研究问题的种类,该公司调查了不同用户最近提出的共10000个问题作为样本,得到如下表格.
问题类别模式
生活类问题
学习类问题
其他类问题
深度思考
1100
600
300
联网搜索
1200
1500
300
兼用
1500
2500
1000
假设每个用户的每个问题的模式选择与问题类别均相互独立,用频率估计概率.
(1)在样本中随机抽取一个问题,求该问题的处理模式是“兼用”模式的概率.
(2)在使用“联网搜索”模式处理的所有问题中随机选取2个,估计生活类问题个数不超过学习类问题个数的概率.
(3)不同模式处理问题的时间可以大致分为三组:,,(单位:秒).在网络正常的时候,使用三种模式处理用户问题所需时间比例统计如下图所示.假设小明已经使用该AI大模型的同一种模式解决了两个问题,其中一个问题的处理时间,另一个问题的处理时间.若不考虑其他因素干扰,判断小明在解决这两个问题时最有可能使用的是哪种模式.(结论不要求证明)
研考点·通技法
根据不同的决策计算概率(有时候是期望值),判断概率大小(可以通过作差或作商)来进行选择。若概率含参的话,可以通过作差后,然后根据参数来讨论差值是否大于0,等于0,小于0 。
破类题·提能力
1.(2025·北京海淀·一模)某工厂有一组型号相同的设备,在日常维护中发现部分设备有发热的情况,经过查阅历史数据,发现设备是否发热与设备状态(完好或损坏)有较强的相关性.从发热和未发热情况的数据中各自随机抽取1000条数据,整理如下图所示:
日常维护时,对单台设备有三种可能的操作:保留观察、停机更换或检查维修.对单台设备的不同状态,这三种操作给工厂带来的经济损失如下(单位:千元):
操作
经济损失设备状态
保留观察
停机更换
检查维修
完好
0
10
5
损坏
12
5
7
假设用频率估计概率,且各设备之间的状态相互独立.
(1)已知某设备未出现发热情况,试估计该设备损坏的概率;
(2)该工厂现有2台设备出现发热情况,准备对这2台设备都进行检查维修.记检查维修这2台设备给工厂带来的总经济损失为千元,求的分布列和数学期望;
(3)该工厂的某车间现有2台设备,维护时发现其中一台出现发热情况,另一台未出现发热情况.下面有三种维护这2台设备的操作方案:
发热情况
操作方案编号
发热
未发热
①
检查维修
保留观察
②
停机更换
检查维修
③
停机更换
保留观察
直接写出使得工厂总经济损失的期望最小的方案的编号.
2.(25-26高三下·北京·开学考试)某工厂有两条生产线生产同一种产品,产品需要经过质量检测. 检测结果分为优质、合格和不合格三种. 从两条生产线上各随机抽取 120 件产品, 检测结果如下表.
优质
合格
不合格
甲生产线
80 件
40 件
0 件
乙生产线
60 件
30 件
30 件
假设各件产品的检测结果相互独立, 用频率估计概率.
(1)从甲生产线抽取的样本中随机取 2 件,求这 2 件产品均合格的概率;
(2)从甲、乙两条生产线的产品中各随机抽取 1 件,记这 2 件产品的利润总和为 元(利润标准: 优质 20 元,合格 5 元,不合格-15 元). 求 的分布列及数学期望:
(3)工厂考虑对乙生产线进行技术改造,改造后,乙生产线生产的产品优质率可提高到 0.7 , 不合格率降为 0.05 . 但改造需要一次性投入,会导致每件产品的生产成本增加 4 元. 试判断改造后乙生产线产品的平均利润是否比改造前有所提高. (直接写出结论)
题型06 概率统计与数列的结合
析典例·建模型
1.(2026·云南·模拟预测)甲乙两人进行若干局乒乓球训练赛,每局比赛必须决出胜负,且每局比赛结果相互独立.已知甲每局比赛获胜的概率为,规定先达到净胜3局者获得训练赛胜利并结束训练赛(某人的净胜局数=某人胜的局数-某人负的局数).
(1)记经过n局比赛,甲获得训练赛胜利的概率为,求.
(2)经过若干局后,甲胜的局数与乙胜的局数的差为X,记事件“X=k时,甲最终获得训练赛胜利”发生的概率为,求证:是等比数列;
(3)求甲获得训练赛胜利的概率.
研考点·通技法
概率与数列结合的题中分以下两者:
1、把全概率公式与过程的马尔科夫性(无记忆性)结合: 当前状态的概率只与上一步状态有关,因此可以按上一步的所有可能情况对当前概率进行分解。
2、离散型分布列为等比数列的题型,用错位相减法求期望(或其它求和)。这类题不涉及多轮递推,而是单次试验中某个离散随机变量的概率分布呈现等比规律,求和时往往要计算形如其中是等比数列。
破类题·提能力
1.(2026·甘肃·一模)甲、乙两人各持有1张“欢”字卡片和1张“喜”字卡片,规定两人每次同时从对方手中随机抽取1张卡片交换(记为一轮操作).记轮操作后,甲手里有2张“欢”字卡片的概率为,甲手里有2张“喜”字卡片的概率为.
(1)求的值;
(2)求的值.
2.(2026·陕西安康·一模)已知甲、乙两个盒子均装有1个白球和1个黑球,现进行如下操作:从这两个盒子中各取1个球放入对方的盒子中.重复这样的操作,第次操作后甲盒中白球的个数记为.
(1)求;
(2)证明:是等比数列;
(建议用时:60分钟)
刷模拟
1.(2025·北京大兴·三模)某地区教育研究部门为了解当前本地区中小学教师在教育教学中运用人工智能的态度、经验、困难等情况,从该地区2000名中小学教师中随机抽取100名进行了访谈.在整理访谈结果的过程中,统计他们对“人工智能助力教学”作用的认识,得到的部分数据如下表所示:
假设用频率估计概率,且每位教师对“人工智能助力教学”作用的认识相互独立.
(1)估计该地区中小学教师中认为人工智能对于教学“没有帮助”的人数;
(2)对受访教师关于“人工智能助力教学”的观点进行赋分:“没有帮助”记0分,“有一些帮助”记2分,“很有帮助”记4分.
①从该地区男教师中抽取4名教师,求这4名教师得分总和为8分的概率;
②统计受访教师的得分,将这100名教师得分的平均值记为,其中年龄在40岁以下(含40岁)教师得分的平均值记为,年龄在40岁以上教师得分的平均值记为,请直接写出的大小关系.(结论不要求证明)
2.(2025·北京西城·一模)发展纯电动、插电式混合动力等新能源汽车是我国从汽车大国迈向汽车强国的必由之路.为调查研究,某地统计了辖区内从2017年至2024年这8年的新能源汽车和纯电动汽车的销量,得到如下折线图(单位:百辆):
在每一年中,记该年纯电动汽车销量占该年新能源汽车销量的比重为Q.
(1)从2017年至2024年这8年中随机抽取1年,求该年Q值超过的概率;
(2)现从2019年至2024年这6年中依次随机抽取,每次抽取1个年份,若该年的Q值过,则停止抽取,否则继续从剩余的年份中抽取,直至抽到Q值超过的年份.记抽取的次数为,求的分布列和数学期望:
(3)记2020年至 2024年这5年新能源汽车销量数据的方差为,且这5年纯电动汽车销量数据的方差为,写出与的大小关系.(结论不要求证明)
3.(2025·北京门头沟·一模)不同AI大模型各有千秋,适用领域也各有所长.为了解某高校甲、乙两个学院学生对两款不同大模型是否使用,对学生进行简单随机抽样,获得数据如下表:
甲学院
乙学院
使用
不使用
使用
不使用
A款
40人
80人
60人
20人
款
70人
50人
30人
50人
假设所有学生对两款大模型是否使用相互独立,用频率估计概率.
(1)分别估计该校甲学院学生使用A款大模型的概率、该校乙学院学生使用A款大模型的概率;
(2)从该校甲学院全体学生中随机抽取2人,从乙学院全体学生中随机抽取1人,记这3人中使用款大模型的人数为,求的分布列及数学期望;
(3)从该校甲学院全体学生中随机抽取2人,记这2人中使用款大模型的人数为,其方差估计值为,从该校乙学院全体学生中随机抽取2人,记这2人中使用款大模型的人数为,其方差估计值为,比较与的大小.
4.(2025·安徽合肥·三模)某城市推广垃圾分类,设置智能回收箱(方式)和传统垃圾桶(方式).统计显示,60%的居民选择方式,选择方式,若垃圾被正确分类,则垃圾被回收,不用填埋.智能回收箱的正确分类率为,错误分类后需人工处理,人工处理可将错误分类垃圾的40%重新正确分类,其余直接填埋;传统垃圾桶的正确分类率为75%,错误分类后直接填埋.
(1)求垃圾最终被填埋的概率;
(2)若某吨垃圾被填埋,求其最初通过传统垃圾桶投放的概率;
(3)现有一吨垃圾要整体处理,设为其处理成本(单位:元),正确分类无需成本,人工处理成本为200元,填埋成本为500元.求的分布列及数学期望.
5.(2025·北京东城·一模)据国家相关部门统计,2023年华东地区、东北地区主要省份的水稻、小麦的播种面积和产量数据见下表:
水稻
小麦
播种面积(千公顷)
产量(万吨)
播种面积(千公顷)
产量(万吨)
华东
地区
江苏省
2221.0
2003.2
2389.5
1373.5
浙江省
649.0
485.3
152.6
66.4
安徽省
2500.7
1609.8
2862.7
1740.7
福建省
601.1
394.6
0.1
0.0
江西省
3383.9
2070.7
11.3
3.5
山东省
101.0
86.1
4008.9
2673.8
东北
地区
辽宁省
500.5
412.9
2.0
0.8
吉林省
828.8
682.1
5.0
1.7
黑龙江省
3268.5
2110.0
19.3
7.5
(1)从表1中的华东地区随机抽取1个省份,求该省水稻产量比小麦产量少的概率;
(2)从表1的9个省份中随机抽取2个,设为水稻播种面积排在前5名且属于东北地区省份的个数.求的分布列与数学期望;
(3)2023年华东地区、东北地区和华北地区主要粮食作物的播种面积及其采用新技术的播种面积占该作物总播种面积的比值(简称新技术占比率)数据见下表:
粮食
作物
播种面积
(千公顷)
新技术
占比率
粮食
作物
播种面积
(千公顷)
新技术
占比率
华东地区
水稻
9456.7
0.70
小麦
9425.1
0.60
东北地区
水稻
4597.8
0.55
玉米
13800.0
0.65
华北地区.
小麦
3184.5
0.65
玉米
9564.7
0.60
记华东地区和东北地区水稻播种总面积的新技术占比率、华东地区和华北地区小麦播种总面积的新技术占比率、东北地区和华北地区玉米播种总面积的新技术占比率分别为.依据表2中的数据比较的大小.(结论不要求证明)
6.(2026·广东梅州·一模)(1)一个袋子中有30个大小相同的球,其中有10个红球、20个白球,从中随机放回地逐次摸一个球作为样本,5次摸球后停止,用表示停止时摸出红球的次数.
①求的分布列和数学期望;
②若用样本中红球的比例估计总体中红球的比例,求误差的绝对值不超过0.2的概率.
(2)某节目上,有三扇关闭的门,其中一扇门后面为汽车,另两扇门后面为山羊,节目参加者从这三扇门中选择一扇,然后所选之门后面的物品则归其所有.当参加者选定一扇门后,节目主持人开启了剩余两扇门中后面为山羊的一扇门,并询问节目参加者是否更换选择.问:参加者这时候更换选择会更好吗?请用概率解释.(备注:汽车的价值要远大于羊.)
7.(2026·河南南阳·模拟预测)甲、乙两名同学进行传统文化知识比赛,规则如下:连续胜两局者获胜,比赛结束;比赛最多五局,若五局结束时两人均未能连续获胜两局,则五局中胜局数多者获胜.在一局比赛中,若甲胜,则甲下一局胜的概率为;若甲输,则甲下一局胜的概率为.已知第一局甲胜的概率为,假设每局比赛没有平局,记比赛结束时的局数为.
(1)求第2局比赛甲胜的概率;
(2)在的条件下,求甲胜的概率;
(3)求比赛结束时甲胜的概率.
7.(2026·北京平谷·一模)根据《国家学生体质健康标准》,高一男生和女生50米跑单项等级如下(单位:秒):
50米跑单项等级
高一男生
高一女生
优秀
7.3及以下
8.0及以下
良好
7.4~7.5
8.1~8.6
及格
7.6~9.5
8.7~10.6
不及格
9.6及以上
10.7及以上
从某校高一男生和女生中各随机抽取15名同学,将其50米跑测试成绩整理如下:
男生
7.0
7.1
7.2
7.3
7.3
7.4
7.5
7.5
7.5
7.5
8.6
9.6
9.7
9.7
9.8
女生
7.4
7.6
7.6
7.8
7.9
8.0
8.1
8.8
9.0
9.2
9.7
10.4
10.4
10.5
10.8
假设用频率估计概率,且每个同学的测试成绩相互独立.
(1)估计该校高一男生50米跑单项及格及以上的概率;
(2)从该校高一男生和女生中各随机抽取2人,估计4人中恰有2人50米跑单项等级是优秀的概率;
(3)通过一段时间锻炼,对该校在及格及以下成绩的学生进行再测试,结果又有的男生达到良好及以上的成绩,又有的女生达到良好及以上的成绩,记最后男女达到良好及以上的概率分别为,判断的大小.(结论不要求证明)
8.(2025·北京海淀·三模)自动驾驶是依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让自动驾驶系统可以在没有人类主动的操作下,自动安全地操作机动车辆的技术,其安全性备受人们的关注.2015年起,美国加州机动车管理局要求获得自动驾驶道路测试资质的公司每年1月1日之前上交一份自动驾驶年度报告,总结道路测试总里程数,以及过程中所经历的所有自动驾驶脱离事件,脱离事件是指在自动驾驶系统遇到无法处理的情况时,由驾驶员人工干预的事件.每次脱离平均行驶里程(MPD值,Miles per Disengagement),代表自动驾驶汽车每行驶多少里程才需要人工干预一次,它由一家公司报告的总里程数除以总脱离次数得到,这是衡量一辆自动驾驶汽车“驾驶水平”的重要指标之一.从《加州2023年自动驾驶脱离报告》中选取了9家公司的数据.
公司
所属国家
测试总里程(英里)
脱离次数
MPD值
百度
中国
108300
6
18050
谷歌Waymo
美国
1454137
110
13219
通用Cruise
美国
831040
68
12221
比亚迪
中国
32054
3
10684
小马智行
中国
174845
27
6475
Nuro
美国
68762
34
2022
Zoox
美国
67015
42
1595
小米
中国
12272
8
1534
苹果
美国
7544
64
117
(1)从表中随机抽取一家中国公司和一家美国公司,求抽到的中国公司比抽到的美国公司MDP值高的概率;
(2)从表中的9家公司随机抽取3家,求至少有2家MPD值大于10000的概率;
(3)有人认为根据《加州2023年自动驾驶脱离报告》的数据,可以说明百度公司的自动驾驶技术已经全面超越谷歌公司.你是否同意此观点?并说明你的理由.
9.(2025·北京海淀·二模)某运动品牌拟推出一款青少年新品跑鞋.在前期市场调研时,从某市随机调查了200名中小学生对黑、白两种颜色的新品跑鞋的购买意愿,统计数据如下(单位:人):
颜色
小学生
初中生
高中生
愿意
不愿意
愿意
不愿意
愿意
不愿意
黑色
80
20
40
20
20
20
白色
60
40
30
30
30
10
假设所有中小学生的购买意愿相互独立,用频率估计概率.
(1)从该市全体中小学生中随机抽取1人,估计其愿意购买黑色新品跑鞋的概率;
(2)从该市的初中生、高中生两个不同群体中各自随机抽取1人,记为这2人中愿意购买白色新品跑鞋的人数,求的分布列和数学期望;
(3)假设该市学校内的小学生、初中生和高中生的人数之比为,从学校的全体中小学生中随机抽取1人,将其愿意购买黑色新品跑鞋的概率估计值记为,试比较与(1)中的的大小.(结论不要求证明)
刷真题
1.(2025·北京·高考真题)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试.为了解学生对该知识点的掌握情况,随机抽查了甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立,用频率估计概率.
(1)估计甲校高一年级学生该题选择正确的概率
(2)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计的概率及X的数学期望;
(3)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识点,甲校学生选择正确的概率为,乙校学生选择正确的概率为.设甲、乙两校高一年级学生掌握该知识点的概率估计值分别为,,判断与的大小(结论不要求证明).
2.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数
0
1
2
3
4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
3.(2023·北京·高考真题)为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“-”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.
时段
价格变化
第1天到第20天
-
+
+
0
-
-
-
+
+
0
+
0
-
-
+
-
+
0
0
+
第21天到第40天
0
+
+
0
-
-
-
+
+
0
+
0
+
-
-
-
+
0
-
+
用频率估计概率.
(1)试估计该农产品价格“上涨”的概率;
(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;
(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)
4.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
1 / 2
学科网(北京)股份有限公司
$