内容正文:
第13讲 统计概率大题:
条件概率、线性回归、四种分布、独立性实验
知识核心
一、条件概率
1、互斥事件:不可能同时发生;P(A+B)=P(A)+P(B).
2、对立事件:不可能同时发生,且必有一个发生
3、独立事件:一个事件的发生对另一个事件发生没有影响,两个事件相互独立不一定互斥;P(AB)= P(A)·P(B)
独立事件的性质:如果事件A与事件B相互独立,则与,与,与也都相互独立
4、条件概率定义:发生的条件下,发生的概率:(定义法、样本点数法)
5、解释:(1)表示事件和同时发生的概率;
(2)条件概率的乘法公式:
(3)设和互为对立事件,则
(4)如果和是两个互斥事件,则;
6、全概率公式:设,,是一组两两互斥的事件,,则对任意的事件,有,我们称此公式为全概率公式
二、成对数据的统计分析
1、回归方程:数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
2、相关系数
若相应于变量的取值,变量的观测值为,
则变量与的相关系数,
通常用来衡量与之间的线性关系的强弱,的范围为.
①当时,表示两个变量正相关;当时,表示两个变量负相关.
②越接近,表示两个变量的线性相关性越强;
越接近,表示两个变量间几乎不存在线性相关关系;
当时,所有数据点都在一条直线上
③通常当时,认为两个变量具有很强的线性相关关系
3、残差分析
(1)对于观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,即有.
(2)残差平方和,如果越小,则拟合效果越好
(3)相关指数:.越接近于,说明残差的平方和越小,也表示回归的效果越好.
4、独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:
总计
总计
(3)独立性检验:计算随机变量.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
统计概率:真题
1.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
2.(2025·上海·高考真题)2024年巴黎奥运会,中国获得了男子米混合泳接力金牌.以下是历届奥运会男子米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列.
206.78
207.46
207.95
209.34
209.35
210.68
213.73
214.84
216.93
216.93
(1)求这组数据的极差与中位数;
(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;
(3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2006,预测2028年冠军队的成绩(精确到0.01秒).
3.(2022·全国乙卷·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
4.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:
时间范围学业成绩
优秀
5
44
42
3
1
不优秀
134
147
137
40
27
(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?
(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)
(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?
(附:其中,.)
5.(2025·全国一卷·高考真题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:
超声波检查结果组别
正常
不正常
合计
患该疾病
20
180
200
未患该疾病
780
20
800
合计
800
200
1000
(1)记超声波检查结果不正常者患该疾病的概率为P,求P的估计值;
(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.
附,
0.050
0.010
0.001
3.841
6.635
10.828
6.(2024·全国甲卷·高考真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
7.(2022·新高考全国Ⅰ卷·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:;
(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.
附,
0.050
0.010
0.001
k
3.841
6.635
10.828
8.(2024·新课标Ⅱ卷·高考真题)某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.
(2)假设,
(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?
(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
9.(2025·北京·高考真题)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试.为了解学生对该知识点的掌握情况,随机抽查了甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立,用频率估计概率.
(1)估计甲校高一年级学生该题选择正确的概率
(2)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计的概率及X的数学期望;
(3)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识点,甲校学生选择正确的概率为,乙校学生选择正确的概率为.设甲、乙两校高一年级学生掌握该知识点的概率估计值分别为,,判断与的大小(结论不要求证明).
10.(2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
11.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数
0
1
2
3
4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
12.(2023·上海·高考真题)21世纪汽车博览会在上海2023年6月7日在上海举行,下表为某汽车模型公司共有25个汽车模型,其外观和内饰的颜色分布如下表所示:
红色外观
蓝色外观
米色内饰
8
12
棕色内饰
2
3
(1)若小明从这些模型中随机拿一个模型,记事件A为小明取到的模型为红色外观,事件B取到模型有棕色内饰,求,并据此判断事件A和事件B是否独立;
(2)为回馈客户,该公司举行了一个抽奖活动,并规定,在一次抽奖中,每人可以一次性抽取两个汽车模型。为了得到奖品类型,现作出如下假设:
假设1:每人抽取的两个模型会出现三种结果:①两个模型的外观和内饰均为同色;②两个模型的外观和内饰均为不同色;③两个模型的外观同色但内饰不同色,或内饰同色但外观不同色。
假设2:该抽奖设置三类奖,奖金金额分别为:一等奖600元,二等奖300元,三等奖150元。
假设3:每种抽取的结果都对应一类奖。出现某种结果的概率越小,奖金金额越高。
请判断以上三种结果分别对应几等奖。设中奖的奖金数是,写出的分布,并求的数学期望。
13.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
14.(2022·全国甲卷·高考真题)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
统计概率:2年模拟
1.(2026浙江金丽衢一模) 现将个黑球与个白球分装入甲、乙两袋中,通过掷骰子来决定每次操作,掷出奇数点则从甲袋中取一个球,掷出偶数点则从乙袋中取一个球,每次取出的球不放回.
(1)若,且甲袋中放有2个黑球与2个白球,求操作一次取出的球是白球的概率;
(2)若且甲袋中均为黑球,乙袋中均为白球,
(i)操作5次时,求取出白球个数的数学期望;
(ii)设事件为“当白球取完时,黑球剩余数量不少于2个”,求.
2. (2026四川泸州二模)乘着文旅融合的东风、借着线上推广的热潮,某非遗工坊生产的油纸伞销量逐年增长.该工坊为了科学规划生产,统计了2021-2025年油纸伞的销量数据如下表:
年份t/年
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
销量/万把
7
8
10
11
14
(1)统计表明销量与年份代码有较强的线性相关关系,求关于的线性回归方程,并预测该工坊油纸伞的销量最早在哪一年能超过20万把:
(2)已知该工坊2023年售出的油纸伞中,有6万把通过线上售出,用频率估计概率,现从2023年售出的油纸伞中随机抽取3把,求其中线上售出数量的分布列.
附:为回归直线方程,.
3. (2026山东潍坊一模)某人工智能实验室测试一款新型深度强化学习智能体,每次测试中,智能体会随机接受类或类任务,每次测试相互独立.已知每类任务出现的概率均为,且智能体成功完成类任务的概率为类任务的概率为.记成功完成类任务得1分,类任务得2分,不成功均得0分.
(1)求智能体经过1次测试后得2分的概率;
(2)记智能体经过次测试后的总得分为.
(i)若,求在的条件下,第1次测试得1分的概率;
(ii)求.
附:若为随机变量,则.
4. (2026山东威海一模)某医院用光电比色计检验尿汞时,得到尿汞含量(单位:)与消光系数的结果如下:
尿汞含量
2
4
6
8
10
消光系数
65
135
205
285
360
(1)求消光系数关于尿汞含量的回归直线方程;
(2)根据回归直线方程,估计尿汞含量为时消光系数值.
5. (2026山东泰安一模)某科技公司研发了一款用于医疗影像辅助诊断的AI算法,为了测试该算法的准确性,工程师准备了一组包含25张正常样本和75张异常样本的100张医学影像,算法对每张影像进行独立识别与判断,根据初步测试,算法的判断准确率如下:
当影像为正常样本时,算法判断为“正常”的概率为,
当影像为异常样本时,算法判断为“异常”的概率为.
(1)从这100张影像中随机抽取2张,求2张均为正常样本的概率;
(2)现从100张影像中随机抽取3次,每次抽取1张影像进行测试,每次抽取并测试后放回,用随机变量表示这3次测试中算法正确判断的次数,求随机变量的分布列及其数学期望.
6. (2026江西上饶一模)2025年“十一”黄金周期间,上饶市文旅局对五大热门景区(三清山、婺源、龟峰、葛仙村、望仙谷)的游客数据进行了统计.已知前五日每日总游客接待量(,单位:万人次)与全市旅游综合收入,单位:亿元的抽样数据如下:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
29
32
36
30
28
6
7
8
6.5
5.5
(1)根据数据建立旅游综合收入关于游客接待量的线性回归方程,并预测第六日游客接待量达到38万人次时,该市旅游综合收入的估计值;
(2)在“十一”黄金周期间,望仙谷景区单日客流量超过承载上限(5万人次)的概率为0.4.黄金周七天中随机抽取三天,记客流量超过承载上限的天数为,求的分布列及数学期望.
参考数据:.
参考公式:.
7. (2026江西萍乡一模)从萍乡方向登武功山有多条路线,某游客准备从其中的两条路线中选一条登顶.路线一为“从游客中心出发,乘坐中庵索道直达半山腰,随后步行经紫极宫、许愿桥、吊马桩抵达金顶”,这条路线中,该游客在紫极宫、许愿桥、吊马桩三个补给站需要补给的概率均为;路线二为“从游客中心出发,步行经紫极宫、吊马桩抵达金顶”,这条路线中,该游客在紫极宫、吊马桩两个补给站需要补给的概率分别为,.该游客在各补给站是否需要补给互不影响.
(1)若该游客走路线一,求最多需要一次补给的概率;
(2)按照“平均补给次数最少”的原则,该游客应该选择那条路线登顶,请说明理由.
8. (2026江西二调)在某次数学测试中.
(1)甲、乙两位同学回答同一道单项选择题,记他们的最终得分分别为.已知随机变量的分布列如下图.若,求;
(2)若甲同学在此次测试中取得班级第五名,且甲同学的分数处于第90百分位数(该班每位同学的分数不同),求该班人数的取值集合.
0
5
0
5
9. (2026江苏徐州一模)现有除颜色外都相同的3个红球和3个白球,随机取3个球放入一个不透明的袋中,记袋中红球的个数为.从袋中随机摸出一个球,并换入一个另一种颜色的球,经过次摸换,袋中的红球个数记为.
(1)求与;
(2)求;
(3)当时,求随机变量的数学期望.
10. (2026江苏南通一模)某地举办业余乒乓球联赛,比赛分“有缝球型”和“无缝球型”两个赛区,从该地区抽取部分选手进行调研,相关数据如下表:
喜欢用有缝球
喜欢用无缝球
直拍打法选手
18
30
横拍打法选手
20
12
(1)能否有95%以上的把握认为不同打法的选手对于有缝球和无缝球的喜好有影响?
(2)若从参加调研的“横拍打法”选手中用分层抽样的方法抽取8名选手,按照各自喜爱的球型参加相应赛区的比赛.现从8名选手中选3人,用AI监测他们的比赛数据,求两个赛区都有人被选中的概率.
附:,
0.100
0.050
0.010
2.706
3.841
6.635
11. (2026湖南株洲一模)从某社区1万余名居民中随机调查了部分居民,获得了他们的每日运动时长数据,整理得到如下频率分布直方图.
(1)求的值;
(2)假设同组中的每个数据用该组区间的中点值代替,估计该社区全体居民的每日平均运动时长;
(3)若用样本的频率估计总体的概率,现从该社区居民中随机抽取4人,用表示每日运动时长在50分钟以上的居民人数,求随机变量的数学期望.
12. (2026湖南长沙一模)社团课上,甲、乙、丙三位同学进行五子棋比赛,约定:第1局甲、乙比,甲先手(每局中先走第一颗棋),丙轮空;此后每局的胜者与轮空者进行下一局比赛,并且轮空者先手.假设甲、乙、丙三位同学先手时胜对方的概率均为,每局比赛没有平局且结果相互独立.
(1)若
(i)求前3局中甲、乙、丙三位同学均参与两局的概率;
(ii)求第2局和第4局参与的同学完全相同的概率;
(2)若前4局中甲参与的平均次数不小于,求的取值范围.
13. (2026湖南岳阳一模)甲,乙两位同学进行羽毛球比赛,每局比赛甲获胜的概率为,乙获胜的概率为,每局比赛无平局且各局比赛的结果互不影响.
(1)若两人比赛三局,求甲至少胜两局的概率;
(2)若比赛采用五局三胜制(即先胜三局的一方获胜,比赛随即结束),设比赛结束时共进行了局,求的分布列与数学期望.
14. (2026湖南湘潭一模)某工厂生产的零件分为合格品与不合格品两类.现采用一台检测仪器对零件进行检测,该仪器存在检测误差,具体检测特性如下:当零件为合格品时,单次检测判定为“合格”的概率为0.8,判定为“不合格”的概率为0.2;当零件为不合格品时,单次检测判定为“合格”的概率为0.1,判定为“不合格”的概率为0.9.对同一个零件连续检测3次,若检测结果中“合格”的次数多于“不合格”的次数,则最终判定该零件为合格品;否则判定为不合格品.假设各次检测结果相互独立.已知该批零件中合格品占80%,不合格品占20%.
(1)若某零件为不合格品,求该零件最终被误判为合格品的概率.
(2)若随机抽取1个零件进行检测,求该零件最终被判定为合格品的概率.
(3)已知生产一个零件的成本为50元,每个零件被连续检测3次的总费用为10元.若某零件最终被判定为合格品,则以每件120元的价格出厂销售;否则作销毁处理.若出厂的零件实际为不合格品,则需向客户全额退款,并赔偿客户40元.设一个零件的利润为元,若的均值小于25,则该工厂将停止生产该零件;否则继续生产,试问该工厂是否会停止生产该零件?请说明理由.
15. (2026湖南常德一模)甲、乙两人参加某高校的入学面试,入学面试有2道难度相当的题目,甲答对每道题目的概率都是,乙答对每道题目的概率都是,每位面试者共有两次机会,若答对第一次抽到的题目,则面试通过,结束答题;否则继续第2次答题,答对则面试通过,未答对则面试不通过,甲、乙两人对抽到的不同题目能否答对是独立的,且两人答题互不影响,
(1)求甲、乙两人有且只有一人通过面试的概率;
(2)设面试过程中甲、乙两人答题的次数之和为,求的分布列与期望.
16. (2026湖北孝感一模)2025年8月30日晚,以“知音湖北,与‘篮’共舞”为主题的湖北省全国百强县篮球联赛八支球队分别在汉川、仙桃、潜江、枝江同时开战.湖北省以体育赛事为纽带,推动文体旅深度融合,为县域经济高质量发展注入新动能.组委会对其中5个参赛县的宣传费用(万元)与现场观众人数(百人)进行统计,数据如下:
参赛县
A
B
C
D
E
宣传费用x(万元)
2
3
4
5
6
现场观众人数y(百人)
19
22
24
27
28
(1)从这5个参赛县中随机抽取3个,记现场观众人数不少于24百人的县的个数为,求随机变量的分布列及数学期望;
(2)利用最小二乘法求y关于x的线性回归方程,并预测宣传费用为8万元时的现场观众人数.
附:线性回归方程中斜率和截距的最小二乘估计公式分别为:
,.
17. (2026湖北荆州一模)某电商平台对其售卖的一款家电开展甲、乙两种促销活动,活动规则如下:参加活动的消费者只能在甲、乙两种活动中选择一个参加,且仅能参加一次,最多购买一台家电;活动甲设有4个不同的选择题、3个不同的填空题,活动乙设有3个不同的选择题、2个不同的填空题;参加活动的消费者在所选择的促销活动中先后抽取2个不同的题目作答,若两题都答对,则享受按2折购买的优惠,答对一题可享受按5折购买的优惠,全部答错只能享受按8折购买的优惠.小黄对该家电有购买需求,决定参加活动,其答对每道选择题的概率均为0.8,答对每道填空题的概率均为0.4,每次答题相互独立.
(1)若小黄选择参加活动乙,求第二题抽到的题目是填空题的概率;
(2)该款家电原价为a元/台,小黄应该选择参加甲、乙中的哪个活动?请说明理由.
18. (2026河南濮阳一模)某市为争创“文明城市”,现对城市的主要路口进行“文明骑车”的道路监管,为了解市民对该项目的满意度,分别从不同地区随机抽取了300名市民对该项目进行评分,绘制如下频率分布直方图.
(1)求频率分布直方图中的值,并计算这300名市民评分的平均数;
(2)用频率作为概率的估计值,现从该城市市民中随机抽取4人进一步了解情况,用表示抽到的评分在90分以上的人数,求的分布列及数学期望.
19. (2026广东湛江一模)某农作物的种植过程分为育苗与移栽两个环节.在育苗环节,每粒种子的成活率为p.在育苗成功的条件下,对幼苗进行移栽,每株幼苗移栽的成活率为q.若该农作物育苗成功且移栽成活则认为种植成功.每粒种子种植是否成功互不影响.
(1)若一粒种子种植成功的概率为,在育苗成功的条件下,移栽失败的概率为,现播撒300粒种子,设育苗成功的种子数量为,求;
(2)播撒6粒种子,设种植成功的数量为X,求的概率P,并求P的最大值.
20. (2026广东茂名一模)已知甲、乙两个盒子均装有1个白球和1个黑球,现进行如下操作:从这两个盒子中各取1个球放入对方的盒子中.重复这样的操作,第次操作后甲盒中白球的个数记为.
(1)求;
(2)证明:是等比数列;
(3)求的数学期望.
21. (2026安徽宿州一模)某数学兴趣小组为深入了解某款智能软件在社会上各年龄段人群使用情况,从某社区使用过该程序的人群中随机抽取了200名居民进行调查,并依据年龄样本数据绘制了如下频率分布直方图.
(1)根据频率分布直方图,估计年龄样本数据的分位数;
(2)为了解各年龄段居民的使用情况,需抽取居民代表召开座谈会,按照等比例分配分层随机抽样的方式从,[30,40)年龄段中随机共抽取8名居民.若从选定的这8名居民中随机再抽取3名,记3人中在年龄段的人数为,求的分布列及数学期望.
22. (2026安徽马鞍山一模)为响应“全民健身”号召,某社区统计了5名居民每周参与体育锻炼的时长(单位:小时)与身体活力指数的对应数据,结果如下表所示:
特征量
居民
居民
居民
居民
居民
2
4
6
8
10
4
5
6
8
7
(1)根据表中数据,计算样本相关系数,并推断它们的相关程度;
(2)求身体活力指数关于每周锻炼时长的一元线性回归方程,并利用该方程计算居民的身体活力指数残差.
参考公式:相关系数;回归系数.
23. (2026安徽黄山一模)2025年我国多地推广“碳普惠”体系,鼓励市民参与绿色出行获取低碳积分.某社区随机抽取100名居民调查绿色出行情况,得到如下列联表(绿色出行定义为“日常通勤采用公交、骑行、步行”):
参与绿色出行
不参与绿色出行
总计
青年群体(40岁)
35
15
50
中老年群体(40岁)
20
30
50
总计
55
45
100
(1)依据小概率值的独立性检验,分析参与绿色出行是否与年龄群体有关?
(2)若市民甲前一天参与了绿色出行,则后一天参与绿色出行的概率为;若前一天没有参与绿色出行,则后一天参与绿色出行的概率为.如果市民甲第一天参与了绿色出行的概率为,分别求出他在第二天、第三天参与了绿色出行的概率.
附:
0.100
0.050
0.010
2.706
3.841
6.635
24. (2026安徽淮南一模)甲、乙、丙、丁四人相互做传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外三人中的任何一人.设次传球后球在乙手中的概率为.
(1)求;
(2)求;
(3)求.
25. (2026安徽合肥一模)一个盒子中有5个大小相同的球,其中有2个黄球,3个白球.
(1)随机一次取出3个球,用表示取出的球为黄球的个数,求的分布列和均值;
(2)逐个不放回地随机取出5个球,在整个取球过程中,记“已取出白球的个数始终不小于黄球的个数”为事件,求.
26. (2025湖北武汉四调)13张大小质地完全相同的卡牌中有八张数字牌,正面标有1~8,此外还有五张字母牌,正面标有A~E,将这十三张牌随机排成一行.
(1)求五张字母牌互不相邻的概率;
(2)求在标有8的卡牌左侧没有数字牌的概率;
(3)对于给定的整数,记“在标有k的数字牌左侧,没有标号比k小的数字牌”为事件,求发生的概率.(结果用含k的式子表示)
27. (2025湖北武汉二调)有,,,,,,,八名运动员参加乒乓球赛事,该赛事采用预赛,半决赛和决赛三轮淘汰制决定最后的冠军、八名运动员在比赛开始前抽签随机决定各自的位置编号,已知这七名运动员互相对决时彼此间的获胜概率均为,运动员与其它运动员对决时,获胜的概率为,每场对决没有平局,且结果相互独立.
(1)求这八名运动员各自获得冠军的概率;
(2)求与对决过且最后获得冠军的概率;
(3)求与对决过且最后获得冠军的概率.
28.(2025·安徽·一模)一个不透明的盒子中装有规格完全相同的3个小球,标号分别为,现采用有放回的方式摸球两次,每次摸出1个小球,记第一次摸到的小球号码为,第二次摸到的小球号码为.
(1)记“”为事件,求;
(2)完成两次摸球后,再将与前面3个球规格相同的4号球和5号球放入盒中,并进行第三次摸球,且将第三次摸到的小球号码记为,号码中出现偶数的个数记为,求的分布列及数学期望.
1
学科网(北京)股份有限公司
$
第13讲 统计概率大题:
条件概率、线性回归、四种分布、独立性实验
知识核心
一、条件概率
1、互斥事件:不可能同时发生;P(A+B)=P(A)+P(B).
2、对立事件:不可能同时发生,且必有一个发生
3、独立事件:一个事件的发生对另一个事件发生没有影响,两个事件相互独立不一定互斥;P(AB)= P(A)·P(B)
独立事件的性质:如果事件A与事件B相互独立,则与,与,与也都相互独立
4、条件概率定义:发生的条件下,发生的概率:(定义法、样本点数法)
5、解释:(1)表示事件和同时发生的概率;
(2)条件概率的乘法公式:
(3)设和互为对立事件,则
(4)如果和是两个互斥事件,则;
6、全概率公式:设,,是一组两两互斥的事件,,则对任意的事件,有,我们称此公式为全概率公式
二、成对数据的统计分析
1、回归方程:数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
2、相关系数
若相应于变量的取值,变量的观测值为,
则变量与的相关系数,
通常用来衡量与之间的线性关系的强弱,的范围为.
①当时,表示两个变量正相关;当时,表示两个变量负相关.
②越接近,表示两个变量的线性相关性越强;
越接近,表示两个变量间几乎不存在线性相关关系;
当时,所有数据点都在一条直线上
③通常当时,认为两个变量具有很强的线性相关关系
3、残差分析
(1)对于观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,即有.
(2)残差平方和,如果越小,则拟合效果越好
(3)相关指数:.越接近于,说明残差的平方和越小,也表示回归的效果越好.
4、独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:
总计
总计
(3)独立性检验:计算随机变量.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
统计概率:真题
1.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【详解】(1),
,,
的值分别为: ,
故
(2)由(1)知:,,故有,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
2.(2025·上海·高考真题)2024年巴黎奥运会,中国获得了男子米混合泳接力金牌.以下是历届奥运会男子米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列.
206.78
207.46
207.95
209.34
209.35
210.68
213.73
214.84
216.93
216.93
(1)求这组数据的极差与中位数;
(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;
(3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2006,预测2028年冠军队的成绩(精确到0.01秒).
【详解】(1)由题意,数据的最大值为,最小值为,
则极差为;数据中间两数为与,则中位数为.
故极差为,中位数为;
(2)由题意,数据共个,以上数据共有个,故设事件“恰有个数据在以上”,
则,故恰有个数据在以上的概率为;
(3)由题意,成绩的平均数
,
由直线过,则,
故回归直线方程为.当时,.
故预测年冠军队的成绩为秒.
3.(2022·全国乙卷·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
【详解】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值,据此可估计该林区这种树木平均一棵的根部横截面积为,
平均一棵的材积量为
(2)
则
(3)设该林区这种树木的总材积量的估计值为,又已知树木的材积量与其根部横截面积近似成正比,
可得,解之得.则该林区这种树木的总材积量估计为
4.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:
时间范围学业成绩
优秀
5
44
42
3
1
不优秀
134
147
137
40
27
(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?
(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)
(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?
(附:其中,.)
【详解】(1)由表可知锻炼时长不少于1小时的人数为占比,
则估计该地区29000名学生中体育锻炼时长不少于1小时的人数为.
(2)估计该地区初中生的日均体育锻炼时长约为
.
则估计该地区初中学生日均体育锻炼的时长为0.9小时.
(3)由题列联表如下:
其他
合计
优秀
45
50
95
不优秀
177
308
485
合计
222
358
580
提出零假设:该地区成绩优秀与日均锻炼时长不少于1小时但少于2小时无关.
其中..则零假设不成立,
即有的把握认为学业成绩优秀与日均锻炼时长不小于1小时且小于2小时有关.
5.(2025·全国一卷·高考真题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:
超声波检查结果组别
正常
不正常
合计
患该疾病
20
180
200
未患该疾病
780
20
800
合计
800
200
1000
(1)记超声波检查结果不正常者患该疾病的概率为P,求P的估计值;
(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.
附,
0.050
0.010
0.001
3.841
6.635
10.828
【详解】(1)根据表格可知,检查结果不正常的人中有人患病,所以的估计值为;
(2)零假设为:超声波检查结果与患病无关,
根据表中数据可得,,
根据小概率值的独立性检验,我们推断不成立,即认为超声波检查结果与患该病有关,该推断犯错误的概率不超过.
6.(2024·全国甲卷·高考真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
【详解】(1)根据题意可得列联表:
优级品
非优级品
甲车间
26
24
乙车间
70
30
可得,因为,
所以有的把握认为甲、乙两车间产品的优级品率存在差异,没有的把握认为甲,乙两车间产品的优级品率存在差异.
(2)由题意可知:生产线智能化升级改造后,该工厂产品的优级品的频率为,
用频率估计概率可得,又因为升级改造前该工厂产品的优级品率,
则,可知,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
7.(2022·新高考全国Ⅰ卷·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:;
(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.
附,
0.050
0.010
0.001
k
3.841
6.635
10.828
【详解】(1)由已知,
又,,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为,所以
所以,
(ii) 由已知,,又,,所以
8.(2024·新课标Ⅱ卷·高考真题)某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.
(2)假设,
(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?
(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
【详解】(1)甲、乙所在队的比赛成绩不少于5分,则甲第一阶段至少投中1次,乙第二阶段也至少投中1次,比赛成绩不少于5分的概率.
(2)(i)若甲先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,
若乙先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,
,
,
,应该由甲参加第一阶段比赛.
(ii)若甲先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,
,
,
,
,
记乙先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,同理
,
因为,则,,则,应该由甲参加第一阶段比赛.
9.(2025·北京·高考真题)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试.为了解学生对该知识点的掌握情况,随机抽查了甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立,用频率估计概率.
(1)估计甲校高一年级学生该题选择正确的概率
(2)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计的概率及X的数学期望;
(3)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识点,甲校学生选择正确的概率为,乙校学生选择正确的概率为.设甲、乙两校高一年级学生掌握该知识点的概率估计值分别为,,判断与的大小(结论不要求证明).
【详解】(1)估计甲校高一年级学生该题选择正确的概率.
(2)设为“从甲校抽取1人做对”,则,,
设为“从乙校抽取1人做对”,则,,
设为“恰有1人做对”,故
依题可知,可取,
,,,故的分布列如下表:
故.
(3)设为 “甲校掌握这个知识点的学生做该题”,
因为甲校掌握这个知识点则有的概率做对该题目,
未掌握该知识点的同学都是从四个选项里面随机选择一个,
故,即,故,
同理有,,故,故.
10.(2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【详解】(1)平均年龄
(岁).
(2)设“一人患这种疾病的年龄在区间”,所以
.
(3)设“任选一人年龄位于区间[40,50)”,“从该地区中任选一人患这种疾病”,
则由已知得:,
则由条件概率公式可得,从该地区中任选一人,若此人的年龄位于区间,此人患这种疾病的概率为.
11.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数
0
1
2
3
4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
【详解】(1)设为“随机抽取一单,赔偿不少于2次”,
由题设中的统计数据可得.
(2)(ⅰ)设为赔付金额,则可取,
由题设中的统计数据可得,
,,,
故;故(万元).
(ⅱ)由题设保费的变化为,
故(万元),从而.
12.(2023·上海·高考真题)21世纪汽车博览会在上海2023年6月7日在上海举行,下表为某汽车模型公司共有25个汽车模型,其外观和内饰的颜色分布如下表所示:
红色外观
蓝色外观
米色内饰
8
12
棕色内饰
2
3
(1)若小明从这些模型中随机拿一个模型,记事件A为小明取到的模型为红色外观,事件B取到模型有棕色内饰,求,并据此判断事件A和事件B是否独立;
(2)为回馈客户,该公司举行了一个抽奖活动,并规定,在一次抽奖中,每人可以一次性抽取两个汽车模型。为了得到奖品类型,现作出如下假设:
假设1:每人抽取的两个模型会出现三种结果:①两个模型的外观和内饰均为同色;②两个模型的外观和内饰均为不同色;③两个模型的外观同色但内饰不同色,或内饰同色但外观不同色。
假设2:该抽奖设置三类奖,奖金金额分别为:一等奖600元,二等奖300元,三等奖150元。
假设3:每种抽取的结果都对应一类奖。出现某种结果的概率越小,奖金金额越高。
请判断以上三种结果分别对应几等奖。设中奖的奖金数是,写出的分布,并求的数学期望。
【详解】(1)由给定的数表知,,,,
而,因此事件相互独立,
所以,事件相互独立.
(2)设事件:外观和内饰均为同色,事件:外观内饰都异色,事件:仅外观或仅内饰同色,
依题意,;;
,则,
因此抽取的两个模型的外观和内饰均为不同色是一等奖;外观和内饰均为同色是二等奖;
外观同色但内饰不同色,或内饰同色但外观不同色是三等奖,
奖金额的可能值为:,奖金额的分布列:
600
300
150
奖金额的期望(元).
13.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
【详解】(1)由频率估计概率可得
甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,故答案为0.4
(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3
,
,
,
.∴X的分布列为
X
0
1
2
3
P
∴
(3)丙夺冠概率估计值最大.
因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为,甲获得9.80的概率为,乙获得9.78的概率为.并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.
14.(2022·全国甲卷·高考真题)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
【详解】(1)设甲在三个项目中获胜的事件依次记为,所以甲学校获得冠军的概率为
.
(2)依题可知,的可能取值为,所以,
,
,
,
.即的分布列为
0
10
20
30
0.16
0.44
0.34
0.06
期望.
统计概率:2年模拟
1.(2026浙江金丽衢一模) 现将个黑球与个白球分装入甲、乙两袋中,通过掷骰子来决定每次操作,掷出奇数点则从甲袋中取一个球,掷出偶数点则从乙袋中取一个球,每次取出的球不放回.
(1)若,且甲袋中放有2个黑球与2个白球,求操作一次取出的球是白球的概率;
(2)若且甲袋中均为黑球,乙袋中均为白球,
(i)操作5次时,求取出白球个数的数学期望;
(ii)设事件为“当白球取完时,黑球剩余数量不少于2个”,求.
【小问1详解】当时,由题意得甲袋中2黑2白,乙袋中3黑2白.
则由全概率公式得.
【小问2详解】(i)由题意得取到白球等价于选中乙袋,
设取出白球个数为,则,由二项分布的期望公式得.
(ii)由题意得事件等价于前次操作中就已经摸出所有白球,
即掷骰子至多次就出现了次偶数,不妨设掷骰子掷满次,用表示其中掷出偶数的次数,
则,由题意得,
因为,所以解得,故.
2. (2026四川泸州二模)乘着文旅融合的东风、借着线上推广的热潮,某非遗工坊生产的油纸伞销量逐年增长.该工坊为了科学规划生产,统计了2021-2025年油纸伞的销量数据如下表:
年份t/年
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
销量/万把
7
8
10
11
14
(1)统计表明销量与年份代码有较强的线性相关关系,求关于的线性回归方程,并预测该工坊油纸伞的销量最早在哪一年能超过20万把:
(2)已知该工坊2023年售出的油纸伞中,有6万把通过线上售出,用频率估计概率,现从2023年售出的油纸伞中随机抽取3把,求其中线上售出数量的分布列.
附:为回归直线方程,.
【小问1详解】,
,,
,,
所以关于的线性回归方程为;当,
所以预测该工坊油纸伞的销量最早在年能超过20万把.
【小问2详解】该工坊2023年售出的油纸伞中,有6万把通过线上售出,用频率估计概率,
所以2023年售出的油纸伞中,通过线上售出的概率为,由题意可知:,
所以,,
,,
所以其中线上售出数量的分布列为:
3. (2026山东潍坊一模)某人工智能实验室测试一款新型深度强化学习智能体,每次测试中,智能体会随机接受类或类任务,每次测试相互独立.已知每类任务出现的概率均为,且智能体成功完成类任务的概率为类任务的概率为.记成功完成类任务得1分,类任务得2分,不成功均得0分.
(1)求智能体经过1次测试后得2分的概率;
(2)记智能体经过次测试后的总得分为.
(i)若,求在的条件下,第1次测试得1分的概率;
(ii)求.
附:若为随机变量,则.
【小问1详解】记“智能体经过1次测试后得2分”为事件,由题意得;
【小问2详解】(i)记“智能体2次测试总得分至少3分”为事件,“第一次测试得1分”为事件,
智能体接受并成功完成类任务的概率为,
所以智能体2次测试总得分为3分的概率为,
2次测试总得分为4分的概率为,所以,
所以;
(ii)设第次的得分为,则的可能取值为,,
,,所以,所以.
4. (2026山东威海一模)某医院用光电比色计检验尿汞时,得到尿汞含量(单位:)与消光系数的结果如下:
尿汞含量
2
4
6
8
10
消光系数
65
135
205
285
360
(1)求消光系数关于尿汞含量的回归直线方程;
(2)根据回归直线方程,估计尿汞含量为时消光系数值.
【小问1详解】通过计算可得, ,
,
,所以,
所以, 因此回归直线方程为
【小问2详解】在回归直线方程中令,可得,
因此估计尿汞含量为时消光系数的值为173.
5. (2026山东泰安一模)某科技公司研发了一款用于医疗影像辅助诊断的AI算法,为了测试该算法的准确性,工程师准备了一组包含25张正常样本和75张异常样本的100张医学影像,算法对每张影像进行独立识别与判断,根据初步测试,算法的判断准确率如下:
当影像为正常样本时,算法判断为“正常”的概率为,
当影像为异常样本时,算法判断为“异常”的概率为.
(1)从这100张影像中随机抽取2张,求2张均为正常样本的概率;
(2)现从100张影像中随机抽取3次,每次抽取1张影像进行测试,每次抽取并测试后放回,用随机变量表示这3次测试中算法正确判断的次数,求随机变量的分布列及其数学期望.
【小问1详解】记“抽到的两张均为正常样本”为事件,则,
故2张均为正常样本的概率为;
【小问2详解】记“抽取一张抽到正常样本”为事件,“算法判断为正常”为事件,
“算法正确判断”为事件,
则“抽到异常样本”为事件,“算法判断为异常”为事件,
则,
,
则,
法一,
,
的分布列为
X
0
1
2
3
.
法二:的分布列为,.
6. (2026江西上饶一模)2025年“十一”黄金周期间,上饶市文旅局对五大热门景区(三清山、婺源、龟峰、葛仙村、望仙谷)的游客数据进行了统计.已知前五日每日总游客接待量(,单位:万人次)与全市旅游综合收入,单位:亿元的抽样数据如下:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
29
32
36
30
28
6
7
8
6.5
5.5
(1)根据数据建立旅游综合收入关于游客接待量的线性回归方程,并预测第六日游客接待量达到38万人次时,该市旅游综合收入的估计值;
(2)在“十一”黄金周期间,望仙谷景区单日客流量超过承载上限(5万人次)的概率为0.4.黄金周七天中随机抽取三天,记客流量超过承载上限的天数为,求的分布列及数学期望.
参考数据:.
参考公式:.
【小问1详解】因为所以.
所以回归方程为:,当时,当第六日游客接待量达到38.0万人次时,该市旅游综合收入的估计值为8.7亿元.
【小问2详解】由题意可知,则
所以的分布列为:
0
1
2
3
P
.
7. (2026江西萍乡一模)从萍乡方向登武功山有多条路线,某游客准备从其中的两条路线中选一条登顶.路线一为“从游客中心出发,乘坐中庵索道直达半山腰,随后步行经紫极宫、许愿桥、吊马桩抵达金顶”,这条路线中,该游客在紫极宫、许愿桥、吊马桩三个补给站需要补给的概率均为;路线二为“从游客中心出发,步行经紫极宫、吊马桩抵达金顶”,这条路线中,该游客在紫极宫、吊马桩两个补给站需要补给的概率分别为,.该游客在各补给站是否需要补给互不影响.
(1)若该游客走路线一,求最多需要一次补给的概率;
(2)按照“平均补给次数最少”的原则,该游客应该选择那条路线登顶,请说明理由.
【小问1详解】解:设“该游客走路线一最多需要一次补给”为事件,包括0次补给和1次补给两种情况,
则,所以所求的概率为;
【小问2详解】解:设“该游客走路线一需要补给的次数”为,则,故,
设“该游客走路线二需要补给的次数”为,则的可能取值为0,1,2,
,
,,
所以随机变量的分布列为:
0
1
2
所以,因为,
所以,按照“平均补给次数最少”的原则,应该选择路线二.
8. (2026江西二调)在某次数学测试中.
(1)甲、乙两位同学回答同一道单项选择题,记他们的最终得分分别为.已知随机变量的分布列如下图.若,求;
(2)若甲同学在此次测试中取得班级第五名,且甲同学的分数处于第90百分位数(该班每位同学的分数不同),求该班人数的取值集合.
0
5
0
5
【小问1详解】,
,
;
【小问2详解】记,将该班学生的成绩从小到大排列,若为整数,
则应取第个与第个数据的平均值作为第90百分位数,
而题干中说明该班每位同学的分数不同,所以上述平均值不在原始成绩中,
这与第90百分位数为第五名的成绩不符.故不为整数,
所以应选取第个数据作为第90百分位数
因此,即,解得
9. (2026江苏徐州一模)现有除颜色外都相同的3个红球和3个白球,随机取3个球放入一个不透明的袋中,记袋中红球的个数为.从袋中随机摸出一个球,并换入一个另一种颜色的球,经过次摸换,袋中的红球个数记为.
(1)求与;
(2)求;
(3)当时,求随机变量的数学期望.
【小问1详解】,.
【小问2详解】
,故.
【小问3详解】当时,,,,,且,,
则,
,
随机变量的数学期望.
10. (2026江苏南通一模)某地举办业余乒乓球联赛,比赛分“有缝球型”和“无缝球型”两个赛区,从该地区抽取部分选手进行调研,相关数据如下表:
喜欢用有缝球
喜欢用无缝球
直拍打法选手
18
30
横拍打法选手
20
12
(1)能否有95%以上的把握认为不同打法的选手对于有缝球和无缝球的喜好有影响?
(2)若从参加调研的“横拍打法”选手中用分层抽样的方法抽取8名选手,按照各自喜爱的球型参加相应赛区的比赛.现从8名选手中选3人,用AI监测他们的比赛数据,求两个赛区都有人被选中的概率.
附:,
0.100
0.050
0.010
2.706
3.841
6.635
【小问1详解】假设不同打法的选手对于有缝球和无缝球的喜好没有影响.
所以有95%以上的把握认为不同打法选手对于有缝球和无缝球的喜好有影响.
【小问2详解】根据分层抽样可知,各层的抽样比为,所以从喜欢有缝球的选手中选取人,从喜欢无缝球的选手中选取人,
记“两个赛区都有人被选中”为事件,则.答:两个赛区都有人被选中的概率为.
11. (2026湖南株洲一模)从某社区1万余名居民中随机调查了部分居民,获得了他们的每日运动时长数据,整理得到如下频率分布直方图.
(1)求的值;
(2)假设同组中的每个数据用该组区间的中点值代替,估计该社区全体居民的每日平均运动时长;
(3)若用样本的频率估计总体的概率,现从该社区居民中随机抽取4人,用表示每日运动时长在50分钟以上的居民人数,求随机变量的数学期望.
【小问1详解】根据题意得:,解得.
【小问2详解】设样本中居民的运动时长的平均数为,
所以估计该社区全体居民的每日平均运动时长为42.5分钟.
【小问3详解】从该社区居民中随机抽取一名居民,根据直方图中的信息,
估计每日运动时长在50分钟以上的概率,
随机变量服从二项分布,.
12. (2026湖南长沙一模)社团课上,甲、乙、丙三位同学进行五子棋比赛,约定:第1局甲、乙比,甲先手(每局中先走第一颗棋),丙轮空;此后每局的胜者与轮空者进行下一局比赛,并且轮空者先手.假设甲、乙、丙三位同学先手时胜对方的概率均为,每局比赛没有平局且结果相互独立.
(1)若
(i)求前3局中甲、乙、丙三位同学均参与两局的概率;
(ii)求第2局和第4局参与的同学完全相同的概率;
(2)若前4局中甲参与的平均次数不小于,求的取值范围.
【小问1详解】(i)要使三人都参与两局,则每人恰好轮空一次,这要求第1局的胜者在第2局必须输掉,
若第1局甲胜乙,则第2局丙必须胜甲,概率为;若第1局乙胜甲,则第2局丙必须胜乙,概率为,
所以前3局中甲、乙、丙三位同学均参与两局的概率为;
(ii)若第1局甲胜乙,则第2局参与的同学是甲和丙,若第4局和第2局参与的同学完全相同,则有两种情形:
①第2局甲胜丙,第3局甲胜乙;②第2局丙胜甲,第3局丙胜乙.
第①种情形概率为;第②种情形为.
若第1局乙胜甲,则第2局参与的同学是乙和丙,若第4局和第2局参与的同学完全相同,则有两种情形:
①第2局乙胜丙,第3局乙胜甲;②第2局丙胜乙,第3局丙胜甲.
第①种情形概率为;第②种情形为.
所以第2局和第4局参与的同学完全相同的概率为
;
【小问2详解】设甲在前4局的参与次数为随机变量,则,
,,
,
所以
由得,
令,则,整理得,
解得,所以,又,所以的取值范围为.
13. (2026湖南岳阳一模)甲,乙两位同学进行羽毛球比赛,每局比赛甲获胜的概率为,乙获胜的概率为,每局比赛无平局且各局比赛的结果互不影响.
(1)若两人比赛三局,求甲至少胜两局的概率;
(2)若比赛采用五局三胜制(即先胜三局的一方获胜,比赛随即结束),设比赛结束时共进行了局,求的分布列与数学期望.
【小问1详解】设事件为甲至少胜两局,则
故三局比赛中甲至少胜两局概率为;
【小问2详解】依题意,可取3,4,5,,
,
故的分布列为:
3
4
5
.
14. (2026湖南湘潭一模)某工厂生产的零件分为合格品与不合格品两类.现采用一台检测仪器对零件进行检测,该仪器存在检测误差,具体检测特性如下:当零件为合格品时,单次检测判定为“合格”的概率为0.8,判定为“不合格”的概率为0.2;当零件为不合格品时,单次检测判定为“合格”的概率为0.1,判定为“不合格”的概率为0.9.对同一个零件连续检测3次,若检测结果中“合格”的次数多于“不合格”的次数,则最终判定该零件为合格品;否则判定为不合格品.假设各次检测结果相互独立.已知该批零件中合格品占80%,不合格品占20%.
(1)若某零件为不合格品,求该零件最终被误判为合格品的概率.
(2)若随机抽取1个零件进行检测,求该零件最终被判定为合格品的概率.
(3)已知生产一个零件的成本为50元,每个零件被连续检测3次的总费用为10元.若某零件最终被判定为合格品,则以每件120元的价格出厂销售;否则作销毁处理.若出厂的零件实际为不合格品,则需向客户全额退款,并赔偿客户40元.设一个零件的利润为元,若的均值小于25,则该工厂将停止生产该零件;否则继续生产,试问该工厂是否会停止生产该零件?请说明理由.
【小问1详解】设该零件被误判为合格品是事件.连续检测3次该零件的结果中,
“合格”的次数不低于2才能被误判为合格品,
所以,所以该零件最终被误判为合格品的概率为0.028.
【小问2详解】设被检测的零件为合格品是事件,被检测的零件为不合格品是事件,
被检测的零件最终被判定为合格品是事件,则.
由(1)知,又因为,,所以由全概率公式得
,
故该零件最终被判定为合格品的概率为0.7224.
【小问3详解】的所有可能取值为,60,.,
,,
则.
因为,所以该工厂不会停止生产该零件.
15. (2026湖南常德一模)甲、乙两人参加某高校的入学面试,入学面试有2道难度相当的题目,甲答对每道题目的概率都是,乙答对每道题目的概率都是,每位面试者共有两次机会,若答对第一次抽到的题目,则面试通过,结束答题;否则继续第2次答题,答对则面试通过,未答对则面试不通过,甲、乙两人对抽到的不同题目能否答对是独立的,且两人答题互不影响,
(1)求甲、乙两人有且只有一人通过面试的概率;
(2)设面试过程中甲、乙两人答题的次数之和为,求的分布列与期望.
【小问1详解】设事件“甲通过面试”,事件为“乙通过面试”,
(或)
(或)所以甲、乙两人有且只有一人通过面试的概率
.
【小问2详解】随机变量的可能取值为2,3,4.
,,,
随机变量的分布列为
2
3
4
所以随机变量的期望为.
16. (2026湖北孝感一模)2025年8月30日晚,以“知音湖北,与‘篮’共舞”为主题的湖北省全国百强县篮球联赛八支球队分别在汉川、仙桃、潜江、枝江同时开战.湖北省以体育赛事为纽带,推动文体旅深度融合,为县域经济高质量发展注入新动能.组委会对其中5个参赛县的宣传费用(万元)与现场观众人数(百人)进行统计,数据如下:
参赛县
A
B
C
D
E
宣传费用x(万元)
2
3
4
5
6
现场观众人数y(百人)
19
22
24
27
28
(1)从这5个参赛县中随机抽取3个,记现场观众人数不少于24百人的县的个数为,求随机变量的分布列及数学期望;
(2)利用最小二乘法求y关于x的线性回归方程,并预测宣传费用为8万元时的现场观众人数.
附:线性回归方程中斜率和截距的最小二乘估计公式分别为:
,.
【小问1详解】因为观众不少于24百人的县共有3个,所以的可能取值为1,2,3,
,,,
所以分布列如下:
1
2
3
P
所以;
【小问2详解】由题意,,
,,
所以,,所以y关于x的线性回归方程为,
当时,(百人),故预测宣传费用为8万元时现场观众人数为33.2百人.
17. (2026湖北荆州一模)某电商平台对其售卖的一款家电开展甲、乙两种促销活动,活动规则如下:参加活动的消费者只能在甲、乙两种活动中选择一个参加,且仅能参加一次,最多购买一台家电;活动甲设有4个不同的选择题、3个不同的填空题,活动乙设有3个不同的选择题、2个不同的填空题;参加活动的消费者在所选择的促销活动中先后抽取2个不同的题目作答,若两题都答对,则享受按2折购买的优惠,答对一题可享受按5折购买的优惠,全部答错只能享受按8折购买的优惠.小黄对该家电有购买需求,决定参加活动,其答对每道选择题的概率均为0.8,答对每道填空题的概率均为0.4,每次答题相互独立.
(1)若小黄选择参加活动乙,求第二题抽到的题目是填空题的概率;
(2)该款家电原价为a元/台,小黄应该选择参加甲、乙中的哪个活动?请说明理由.
【小问1详解】由题意,小黄第1题抽到选择题的概率为,第1题抽到填空题的概率为,
则小黄第二题抽到的题目是填空题的概率为.
【小问2详解】由题意,小黄答对每道选择题的概率均为,答对每道填空题的概率均为,
若小黄选择参加甲活动,设答对题目数为,则的可能取值为,
所以,
,
,
则小黄参加甲活动花费金额的数学期望为;
若小黄选择参加乙活动,设答对题目数为,则的可能取值为,
所以,
,
,
则小黄参加乙活动花费金额的数学期望为.
由于,所以小黄应该选择参加乙活动.
18. (2026河南濮阳一模)某市为争创“文明城市”,现对城市的主要路口进行“文明骑车”的道路监管,为了解市民对该项目的满意度,分别从不同地区随机抽取了300名市民对该项目进行评分,绘制如下频率分布直方图.
(1)求频率分布直方图中的值,并计算这300名市民评分的平均数;
(2)用频率作为概率的估计值,现从该城市市民中随机抽取4人进一步了解情况,用表示抽到的评分在90分以上的人数,求的分布列及数学期望.
【小问1详解】解在频率分布直方图中,所有矩形的面积之和为,
则,解得.这300名市民评分的平均数为:
.
所以这300名市民评分的平均数为:.
【小问2详解】解因为评分在分以上的市民所占的频率为,由题意可知,,
所以,,,
,,,
所以,随机变量的分布列如下表所示:
所以,.
19. (2026广东湛江一模)某农作物的种植过程分为育苗与移栽两个环节.在育苗环节,每粒种子的成活率为p.在育苗成功的条件下,对幼苗进行移栽,每株幼苗移栽的成活率为q.若该农作物育苗成功且移栽成活则认为种植成功.每粒种子种植是否成功互不影响.
(1)若一粒种子种植成功的概率为,在育苗成功的条件下,移栽失败的概率为,现播撒300粒种子,设育苗成功的种子数量为,求;
(2)播撒6粒种子,设种植成功的数量为X,求的概率P,并求P的最大值.
【小问1详解】记育苗成功为事件A,移栽成活为事件B.由题意得,
因为,所以.
设播撒300粒种子时育苗成功的种子数量为,
根据题意可得,由此可得.
【小问2详解】解法一:一粒种子种植成功概率为,“”表示事件“恰好有5粒种子种植成功”,
所以.
令,设函数,.
当时,;当时,,
在上单调递增,在上单调递减,的最大值为,
综上,的概率,其最大值.
解法二:为了保证,则6粒种子中育苗成功的数量需大于或等于5.
设育苗成功的数量等于5为事件C,育苗成功的数量等于6为事件D,
则可得,则有,
从而可得.令,设函数,
.当时,;当时,,
在上单调递增,在上单调递减,的最大值为,
综上,的概率,其最大值为.
20. (2026广东茂名一模)已知甲、乙两个盒子均装有1个白球和1个黑球,现进行如下操作:从这两个盒子中各取1个球放入对方的盒子中.重复这样的操作,第次操作后甲盒中白球的个数记为.
(1)求;
(2)证明:是等比数列;
(3)求的数学期望.
【小问1详解】初始时甲、乙两盒均装有 1 个白球和 1 个黑球,第一次操作时,从两盒中各取一球交换,共有 4 种等可能情况:
甲取白、乙取白:交换后甲盒白球数为 1;
甲取白、乙取黑:交换后甲盒白球数为 0;
甲取黑、乙取白:交换后甲盒白球数为 2;
甲取黑、乙取黑:交换后甲盒白球数为 1。
故
【小问2详解】
记 ,则 ,由全概率公式得:
,
,,
所以,,
由 (1) 和(3)知 ,结合初始值 ,
可得对任意 有 ,代入中,得:,
将(4) 代入(2)式得: ,
整理得,即:,又,
所以数列是公比为的等比数列.
小问3详解】由题意知:的取值为:,分布列为:
0
1
2
,由 (2) 知 ,因此.
21. (2026安徽宿州一模)某数学兴趣小组为深入了解某款智能软件在社会上各年龄段人群使用情况,从某社区使用过该程序的人群中随机抽取了200名居民进行调查,并依据年龄样本数据绘制了如下频率分布直方图.
(1)根据频率分布直方图,估计年龄样本数据的分位数;
(2)为了解各年龄段居民的使用情况,需抽取居民代表召开座谈会,按照等比例分配分层随机抽样的方式从,[30,40)年龄段中随机共抽取8名居民.若从选定的这8名居民中随机再抽取3名,记3人中在年龄段的人数为,求的分布列及数学期望.
【小问1详解】由频率分布直方图可知,年龄在居民占的比例为,年龄在的居民所占到比例为,所以分位数位于内,设其为,则,解,
所以年龄样本数据的分位数为28.
解法2.由频率分布直方图知,年龄在的居民所占的比例,年龄在的居民所占的比例为,所以分位数位于内,
由所以年龄样本数据的分位数为28.
【小问2详解】被调查的居民年龄在,比例为1:3,按照分层随机抽样,应抽取人,应抽取人.
设从中随机抽取的3名居民中年龄在的人数记为X,X的可能取值为0,1,2.
.
所以,随机变量的分布列如下表所示:
0
1
2
所以数学期望为:.
22. (2026安徽马鞍山一模)为响应“全民健身”号召,某社区统计了5名居民每周参与体育锻炼的时长(单位:小时)与身体活力指数的对应数据,结果如下表所示:
特征量
居民
居民
居民
居民
居民
2
4
6
8
10
4
5
6
8
7
(1)根据表中数据,计算样本相关系数,并推断它们的相关程度;
(2)求身体活力指数关于每周锻炼时长的一元线性回归方程,并利用该方程计算居民的身体活力指数残差.
参考公式:相关系数;回归系数.
【小问1详解】由给定数表得,
,
,
,所以样本相关系数,与成正相关,有较强的相关性.
【小问2详解】由(1)得,
所以身体活力指数关于每周锻炼时长的一元线性回归方程为,
当时,,所以居民的身体活力指数残差为.
23. (2026安徽黄山一模)2025年我国多地推广“碳普惠”体系,鼓励市民参与绿色出行获取低碳积分.某社区随机抽取100名居民调查绿色出行情况,得到如下列联表(绿色出行定义为“日常通勤采用公交、骑行、步行”):
参与绿色出行
不参与绿色出行
总计
青年群体(40岁)
35
15
50
中老年群体(40岁)
20
30
50
总计
55
45
100
(1)依据小概率值的独立性检验,分析参与绿色出行是否与年龄群体有关?
(2)若市民甲前一天参与了绿色出行,则后一天参与绿色出行的概率为;若前一天没有参与绿色出行,则后一天参与绿色出行的概率为.如果市民甲第一天参与了绿色出行的概率为,分别求出他在第二天、第三天参与了绿色出行的概率.
附:
0.100
0.050
0.010
2.706
3.841
6.635
【小问1详解】零假设:参与绿色出行与年龄群体无关,
则,
根据小概率值的独立性检验,不成立,所以参与绿色出行与年龄群体有关.
【小问2详解】设“市民甲第天参与了绿色出行”,“市民甲第天没有参与绿色出行”,.
由题意知:,
∴,
∴,
∴.
∴市民甲第二天参与了绿色出行的概率为,第三天参与了绿色出行的概率为.
24. (2026安徽淮南一模)甲、乙、丙、丁四人相互做传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外三人中的任何一人.设次传球后球在乙手中的概率为.
(1)求;
(2)求;
(3)求.
【小问1详解】记“经过次传球后,球在乙手中”,1,2,3,…,
当时,,
当时,.
【小问2详解】由
,即,∴,
∴是首项为,公比为的等比数列,∴,∴.
【小问3详解】由(2)知,令.
所以,
从而,
将以上两式相减可得
,
所以.所以.
25. (2026安徽合肥一模)一个盒子中有5个大小相同的球,其中有2个黄球,3个白球.
(1)随机一次取出3个球,用表示取出的球为黄球的个数,求的分布列和均值;
(2)逐个不放回地随机取出5个球,在整个取球过程中,记“已取出白球的个数始终不小于黄球的个数”为事件,求.
【小问1详解】的可能取值为0,1,2.根据概率知识,可得的分布列为
用表格表示的分布列,如下表所示.
0
1
2
所以的均值为.
【小问2详解】由题意可知第一次取到的球为白球,设“第次取到白球”().
若事件发生,则后面出现情况均满足题意,所以;
若事件发生,则事件一定发生,后面出现的情况均满足题意,
则.故.
26. (2025湖北武汉四调)13张大小质地完全相同的卡牌中有八张数字牌,正面标有1~8,此外还有五张字母牌,正面标有A~E,将这十三张牌随机排成一行.
(1)求五张字母牌互不相邻的概率;
(2)求在标有8的卡牌左侧没有数字牌的概率;
(3)对于给定的整数,记“在标有k的数字牌左侧,没有标号比k小的数字牌”为事件,求发生的概率.(结果用含k的式子表示)
【小问1详解】记五张字母牌互不相邻为事件为,
则;
【小问2详解】记在标有8的卡牌左侧没有数字牌为事件,
由于标的牌都在标有的牌的右侧,有种排法,
所以;
【小问3详解】标号比小的字牌有张,比大的字牌有张,
.
27. (2025湖北武汉二调)有,,,,,,,八名运动员参加乒乓球赛事,该赛事采用预赛,半决赛和决赛三轮淘汰制决定最后的冠军、八名运动员在比赛开始前抽签随机决定各自的位置编号,已知这七名运动员互相对决时彼此间的获胜概率均为,运动员与其它运动员对决时,获胜的概率为,每场对决没有平局,且结果相互独立.
(1)求这八名运动员各自获得冠军的概率;
(2)求与对决过且最后获得冠军的概率;
(3)求与对决过且最后获得冠军的概率.
【小问1详解】夺冠即为三轮比赛都获胜,所以夺冠的概率为.
由题意,七名运动员水平相同,且八名运动各自夺冠概率之和为1.
所以七名运动员各自夺冠的概率均为.
【小问2详解】记事件"获得冠军",事件"与对决过",事件“与在第轮对决”,.不妨设在①号位,则在第1,2,3轮能与对决时其位置编号分别为②,③④,⑤⑥⑦⑧.
,
,
,
,
所以.
【小问3详解】记事件“与对决过”.
没有与对决过且最后获得冠军的概率.
由题意,六名运动员与对决过概率相同,夺冠时共与三名运动员对决.
所以.
代入得:.
28.(2025·安徽·一模)一个不透明的盒子中装有规格完全相同的3个小球,标号分别为,现采用有放回的方式摸球两次,每次摸出1个小球,记第一次摸到的小球号码为,第二次摸到的小球号码为.
(1)记“”为事件,求;
(2)完成两次摸球后,再将与前面3个球规格相同的4号球和5号球放入盒中,并进行第三次摸球,且将第三次摸到的小球号码记为,号码中出现偶数的个数记为,求的分布列及数学期望.
【详解】(1)两次摸球,摸出的小球号码的所有情况共种,
其中,满足“”的情形有:
时,;时,;时,;共5种情况,故;
(2)X的可能取值为,
则,,
,,
故X的分布列为:
X
0
1
2
3
P
故
1
学科网(北京)股份有限公司
$