内容正文:
培优专题06 概率与统计 6大重难题型
参考答案
题型01 统计案例与样本数字特征问题
🎯命题方向一 统计图表的数据分析及样本数字特征的计算与应用
1. 【答案】(1)平均数100,方差104
(2),
【分析】(1)根据频率分布直方图中平均数与方差的求法,代入数据,即可得答案.
(2)根据条件,分别求出两组数据的样本容量,平均数和方差,代入公式,整理计算,即可得答案.
【详解】(1)由频率分布直方图得,
平均数,
方差
.
(2)第一组的样本容量,,
第二组的样本容量,,
所以合并后的平均数,
则.
2. 【答案】(1); (2)公司对每件快递收取的费用的平均值可估计为15元; (3)公司将前台工作人员裁员1人对提高公司利润不利.
【分析】(1)根据样本中包裹件数在内的天数,得到频率,再根据未来3天中,包裹件数在间的天数服从二项分布求解.
(2)根据重量统计和收费标准,列出样本中快递费用的分布列,再求期望.
(3)根据题意及(2),揽件数每增加1,可使前台工资和公司利润增加(元),若不裁员,则每天可揽件的上限为450件,若裁员1人,则每天可揽件的上限为300件,根据公司随机抽取60天的揽件数的频数分布表分别列出分布列,求期望再减去员工的费用比较.
【详解】(1)样本中包裹件数在内的天数为48,频率为,
可估计概率为,未来3天中,包裹件数在间的天数服从二项分布,
即,故所求概率为;
(2)样本中快递费用的分布列如下表:
10
15
20
25
30
0.43
0.3
0.15
0.08
0.04
故样本中每件快递收取的费用的平均值为
(元),
故该公司对每件快递收取的费用的平均值可估计为15元.
(3)根据题意及(2),揽件数每增加1,可使前台工资和公司利润增加(元),
若不裁员,则每天可揽件的上限为450件,公司每日揽件数情况如下:
包裹件数(近似处理
50
150
250
350
450
实际揽件数
50
150
250
350
450
频率
0.1
0.1
0.5
0.2
0.1
故公司平均每日利润的期望值为(元);
若裁员1人,则每天可揽件的上限为300件,公司每日揽件数情况如下:
包裹件数(近似处理
50
150
250
350
450
实际揽件数
50
150
250
300
300
频率
0.1
0.1
0.5
0.2
0.1
故公司平均每日利润的期望值为(元)
因,故公司将前台工作人员裁员1人对提高公司利润不利.
3 【答案】(1)(i)0.35;(ii)
(2)7.
【分析】(1)(i)用频率代替概率即可;
(ii)先用频率代替概率得出科普过程性积分为的概率,再根据独立事件的乘法公式计算分布列,最后利用期望公式即可;
(2)先求出的最大值,再根据各分数段取最小值求得的平均分作为的最小值,根据即可求出.
【详解】(1)(i)由表知,科普过程性积分不少于3分的学生人数为,
则从该校随机抽取一名学生,这名学生的科普过程性积分不少于3分的频率为,
所以从该校随机抽取一名学生,这名学生的科普过程性积分不少于3分的概率估计为0.35.
(ii)依题意,从样本中成绩不低于80分的学生中随机抽取一名,这名学生的科普过程性积分为3分的频率为,所以从该校学生科普测试成绩不低于80分的学生中随机抽取一名,这名学生的科普过程性积分为3分的概率估计为,同理,从该校学生科普测试成绩不低于80分的学生中随机抽取一名,这名学生的科普过程性积分为4分的概率估计为,
X的所有可能值为6,7,8,
,,,
所以X的数学期望.
(20由表知,,则,
从该校科普过程性积分不高于1分的学生中随机抽取一名,其科普测试成绩记为,则的最大值为69,100名学生科普测试成绩的平均值记为,要使恒成立,当且仅当,
显然的最小值为各分数段取最小值求得的平均分,
因此,则,解得,
所以根据表中信息能推断恒成立的a的最小值是7.
🎯命题方向二 统计案例中的抽样方法与数据解读
4.【答案】(1)65
(2)(i)分布列见详解,数学期望为1;(ii).
【分析】(1)根据中位数的定义确定体重区间,进而可求得中位数的值.
(2)(i)首先确定分层抽样的比例,然后确定的可能取值,并计算相应的概率,列出分布列,计算出期望;(ii)根据方差公式求出的值.
【详解】(1)因为,,故样本的中位数落在内,
又,故中位数为
(2)(i)和的人数比为,
分层抽样抽取学生6人中,和的人数分别为和,
故这6人中随机抽取3人,的可能取值为,对应的的取值为,
所以的可能取值为,
,,,
故的分布列为
期望为,
(ii)由(i)知,所以.
5. 【答案】(1)72分 (2)分布列见详解,
【分析】(1)根据频率分布直方图中所有小矩形的面积和为1,可求得a值,分析可得选报物理方向的最低分在内,根据x值右侧面积和为,即可求得答案.
(2)求出成绩在区间和的人数,分析可得X的可能取值,求出各个取值对应的概率,列出分布列,求出期望即可.
【详解】(1)由题意,解得,
成绩在的频率为0.1,在的频率为0.25,在的频率为0.3,
因为,
所以选报物理方向的最低分在内,则,
解得,所以估计报物理方向的学生本次成绩不低于72分.
(2)由题可知,成绩在区间的频数为,
成绩在区间的频数为,
利用分层抽样,从中抽取7份,成绩在的频数为,
成绩在的频数为,
再从这7份答卷中随机抽取3份,的所有可能取值为,
,
故的分布列为:
0
1
2
所以的数学期望为:.
6. 【答案】(1)分布列见详解,
(2)84,30
【分析】(1)根据分层抽样比确定得分在人数为的所有可能取值为0,1,2,3,分别求得对应概率即可求得分布列和期望值;
(2)利用样本方差求总体方差公式代入计算即可求得结果.
【详解】(1)由,解得;
由题可知,调查问卷考核得分分值在三组内的游客人数比为
,则需在内的游客中分别抽取
人,人,人.
现从这6人中随机抽取3人,则考核得分在人数为的所有可能取值为0,1,2,3.
,,,.
所以的分布列为
0
1
2
3
所以.
(20满意度分值在的频率为,人数为20;
在的颣率为,人数为30,满意度分值在的平均数,方差,
在的平均数,方差,所以满意度分值在的平均数,
满意度分值在的方差.
题型02 二项分布、超几何分布、正态分布
🎯命题方向一 二项分布
1.【答案】(1)
(2)(i)分布列见详解,;(ii)11次
【分析】(1)第70百分位数为累计频数,第70百分位数落在区间,利用比例求解即可;
(2)(i),列出Y的所有可能取值和对应概率,得到分布列,并利用二项分布求期望公式计算出数学期望;
(ii)利用对立事件计算出抽到潜在高粘性用户的概率,解不等式得到答案
【详解】(1)将数据按时长升序排列,第70百分位数位置为,
前两组累计频数,前3组累计频数,
故第70百分位数落在区间,则第70百分位数约为;
(2)(i)潜在高粘性用户的频率为,.
易得的可能取值有0,1,2,3,
则,
,.
故的分布列为
0
1
2
3
;
(ii)设至少需抽取次,则,即,.即,
故至少需抽取11次.
2.【答案】(1)
(2)分布列见详解,
(3)
【分析】(1)用频率估计概率,结合题意求概率即可;
(2)由题意可知,随机变量的所有可能取值为0,1,2,3,结合独立重复性实验概率公式求分布列和期望;
(3)记“甲、乙比赛两场后,两队积分相等”为事件A,分析可得,结合题意运算求解.
【详解】(1)用频率估计概率,6局中甲共赢4局,则甲队每局获胜的概率为.
(2)由题意可知,随机变量的所有可能取值为0,1,2,3,
则,,
,,
可得的分布列为:
0
1
2
3
所以.
(3)记“甲、乙比赛两场后,两队积分相等”为事件A,
设第场甲、乙两队积分分别为,,则,其中,
因为两队积分相等,则,即,可得,
又因为,,,,
所以.
3. 【答案】(1)
(2)答案见详解; (3)游戏Ⅱ
【分析】(1)根据古典概型概率公式直接计算可得结果;
(2)利用二项分布直接计算即可得出分布列和期望;
(3)分别计算出参加一次游戏Ⅰ和游戏Ⅱ对应的奖金期望值,可知应选择游戏Ⅱ.
【详解】(1)由题意知,游戏Ⅰ第局获胜的概率.
(2)易知,
游戏Ⅰ第局获胜的概率为,第局获胜的概率为,则第局和第局均未获胜的概率为,因此可知,
随机变量的分布列为
0
1
2
3
随机变量的期望或.
(3)应该参加游戏Ⅱ,理由如下:记分别为一次参加游戏Ⅰ,Ⅱ所获奖金总额,
游戏Ⅰ第局获胜的概率为,第局获胜的概率为,第局获胜的概率为,
,
游戏Ⅱ第局获胜的概率为,第局获胜的概率为,第局获胜的概率为,
,
从奖金期望角度来看,应选择参加游戏Ⅱ.
4. 【答案】(1)分布列为:
0
1
2
(2)
(3),
【分析】(1)根据题意求出对应随机变量的概率,得到分布列;
(2)根据条件概率公式求解即可;
(3)利用二项分布的期望、方差公式求解即可.
【详解】(1)的可能取值为,
,,,
所以分布列为:
0
1
2
(2)由(1),,,
所以.
(3)由题意,,所以,所以,,
🎯命题方向二 超几何分布
5. 【答案】(1)
(2)分布列
0
1
2
3
【分析】(1)若有放回的抽取时,随机变量X服从二项分布,由二项分布的概率公式可得;
(2)若不放回抽取时,随机变量Y服从超几何分布,由超几何分布的概率公式可得分布列及期望.
【详解】(1)若有放回抽取时,每次抽球相互独立,每次抽到红球的概率为 ,共抽3次,
因此,根据二项分布概率公式: .
(2)若不放回抽取时,服从超几何分布,的所有可能取值为,
概率公式为:.
,,,.
的分布列为:
0
1
2
3
数学期望: .
6.【答案】(1)(2)
【详解】(1)记“该顾客恰好开出两个红色商品”为事件,.
(2)为了得到红色商品,记该顾客打开盲盒的次数为,的所有可能取值为.
,,
的分布列如下:
1
2
3
4
,则该顾客的平均花费为元.
🎯命题方向三 正态分布
7.【答案】(1),.
(2)(ⅰ)一等品率的估计值为13.59%;优等品率的估计值为2.275%;(ⅱ)不合格,理由见详解
【分析】(1)由题意列出关于的方程组即可求解;
(2)由题意,,(i)根据正态分布的对称性求概率即可;(ii)算出,然后由即可判断.
【详解】(1)由题,①,②,
由①②解得,.
(2)由题,,,
(ⅰ)因为;
,
所以一等品率的估计值为13.59%;优等品率的估计值为2.275%.
(ⅱ)不合格.理由如下:由题,,
所以,又,,
故小概率事件发生,所以该批固态电池不合格.
8. 【答案】(1)0.05;
(2)0.14.(注:和均为正确答案)
【分析】(1)根据给定条件,求出合格品概率,再利用对立事件的概率公式计算得解.
(2)由(1)可得,求出,再利用公式结合互斥事件、对立事件的概率公式求解.
【详解】(1)当,时,,则,
所以任意一件产品是不合格的概率为0.05.
(2)记为不合格产品数量,则,且,
又,且,则,,
其中,
因此
,
所以这批产品不合格的概率为0.14.
(注:最终结果为和均为正确答案)
9.【答案】(1),
(2)分布列见详解,
(3)
【详解】(1)由于在频率分布直方图可知,所有矩形的面积之和为,
由题可知:,解得,
所以,估计从该品牌芯片的生产线中随机抽取件的平均数为:
.所以,.
(2)样本中质量指标值在和的芯片数量为,
所取样本的个数为件,
质量指标值在的芯片件数为件,故可能取的值为、、、,
所以,,,
,,
随机变量的分布列为:
所以的数学期望.
(3)由(1)可知:,则,,
由题可知:.
所以:,即.
题型03 概率的独立性、条件概率与全概率公式
🎯命题方向一 概率的独立性
1. 【答案】(1);
(2)随机变量的分布列为:
.
【分析】(1)因为甲乙投篮结果相互独立,所以可利用独立事件概率乘法公式和互斥事件概率加法公式,分别计算甲获胜的每种情况的概率再求和.
先确定随机变量X的所有可能取值,利用独立事件概率乘法公式计算每个组合的概率,求出分布列.
【详解】(1)设甲、乙三轮总得分为、,且、服从二项分布,
,,,;
,,,;
=++=
所以甲获胜的概率为.
(2)X可能的取值为,
,;
;
;
;
;
;
随机变量的分布列为:
=.
2. 【答案】(1)
(2)分布列见详解,
【分析】(1)根据相互独立事件概率公式直接计算可得结果;
(2)易知随机变量的可能取值为2,3,4,分别计算出对应概率可得分布列,计算出期望值.
【详解】(1)设事件为“甲通过面试”,事件为“乙通过面试”,
(或)
(或)
所以甲、乙两人有且只有一人通过面试的概率
.
(2)随机变量的可能取值为2,3,4.
,,,
随机变量的分布列为
2
3
4
所以随机变量的期望为.
3. 【答案】(1)甲闯第一关,乙闯第二关,此时这支队伍闯过前两关的概率为
(2)
0
1
2
3
0.2
0.32
0.24
0.24
【详解】(1)若甲闯第一关,乙闯第二关,则这支队伍闯过前两关的概率为,
若乙闯第一关,甲闯第二关,则这支队伍闯过前两关的概率为,
由于,则应该安排甲闯第一关,乙闯第二关,此时这支队伍闯过前两关的概率为.
(2)由(1)知,安排甲闯第一关,乙闯第二关,而的可能取值为,
则,,
,,
所以的分布列为:
0
1
2
3
0.2
0.32
0.24
0.24
则.
4. 【答案】(1)
(2)分布列见详解,
(3),理由见详解
【分析】(1)根据全概率公式即可求解,
(2)根据概率乘法公式求解概率,即可求解分布列和期望,
(3)对和求解对应的概率,利用作差法比较大小即可求解.
【详解】(1)设“甲校友所选的题目回答正确”,“所选的题目为篮球相关知识的题目”,
“所选的题目为足球相关知识的题目”, “所选的题目为排球相关知识的题目”,
则,且两两互斥.
根据题意得,,,,
则,
所以甲校友在该题库中任选一题作答,他回答正确的概率为.
(2)的可能取值为,
,
,
,
,
则的分布列为:
-3
1
5
9
所以.
(3)当时,为甲校友答对题目的数量,
由题意可知,其中,
故当时,甲校友获得奖励的概率,
当时,甲校友获得奖励的情况可以分为如下情况:
①前8题答对题目的数量大于等于5,
②前8题答对题目的数量等于4,且最后2题至少答对1题,
③前8题答对题目的数量等于3,且最后2题全部答对,
故当时,甲校友获得奖励的概率,
所以,
因为,所以,即,所以甲校友应选.
🎯命题方向二 条件概率与全概率公式
5. 【答案】(1)
0
1
2
(2)
【分析】(1)由题意,的所有取值为,分别求出对应的概率即可得到分布列,再根据期望的公式求解即可;
(2)设事件为“选中乙袋”,事件为“从袋子中随机一次性取出的2个球都是红球”,根据全概率公式先求得,再根据条件概率公式求解即可.
【详解】(1)由题意,的所有取值为,
则,,,
所以的分布列为:
0
1
2
则.
(2)设事件为“选中乙袋”,事件为“从袋子中随机一次性取出的2个球都是红球”,
由题意得,,
则,
所以.
6. 【答案】(1)的分布列为:
0
1
2
3
0.001
0.027
0.243
0.729
数学期望为 2.7 (2)
【分析】(1)分析可知,利用二项分布求分布列和期望即可;
(2)设相应事件,利用全概率公式可得,结合条件概率公式运算求解.
【详解】(1)由题意可知:,则有:
;;
;;
则的分布列为:
0
1
2
3
0.001
0.027
0.243
0.729
数学期望为.
【详解】(2)设事件为“一个机器人空翻转体完成”,事件为“一个机器人稳准落地”.
则,,,,
由全概率公式可得:,
所以.
7. 【答案】(1)
(2)
【分析】(1)首先确定甲得3分的事件为答对2题,答错1题,根据二项分布概率公式求解;
(2)首先分别求甲和乙得分的分布列,再求甲获胜的概率,最后代入条件概率公式,求解概率.
【详解】(1)设“比赛结束后甲得3分”为事件,则;
(2)记“比赛结束后甲获胜”为事件,记“比赛结束时乙恰好得3分”为事件,
设甲的得分为,则,
,,
设乙的得分为,的可能取值为,,,,则
,,
,,
,又,
所以,解得
8. 【答案】(1),的数学期望为;
(2);
【详解】(1)由表可知,学习强度指数的概率为:
,
从该市随机选取名学生,记学习强度指数的人数为,则服从二项分布,
所以;
的数学期望为:;
(2)由题意可知,事件为“该学生学习有压力”,事件为“该学生困难应对”.
,,
因事件包含于事件中,所以,
在事件发生的条件下事件发生的概率为:,
在事件发生的条件下事件发生的概率为:,
所以在事件发生的条件下事件发生的优势为:.
9. 【答案】(1)
(2)
(3)分布列见详解,
【分析】(1)由概率乘法公式进行求解;
(2)由条件概率公式求解;
(3)记三幅作品成为成品的事件分别为,则,由可取,求出对应的概率,列出分布列即可求解数学期望.
【详解】(1)记三幅作品通过设计图案环节分别为事件,记三幅中恰有一幅作品通过设计图案环节为事件,
则.
(2).
(3)记三幅作品成为成品的事件分别为,
则,
由可取,
则,
,
,
,
则的分布列为
0
1
2
3
则数学期望.
10. 【答案】(1)
(2)分布列见详解,3,
【分析】(1)设出基本事件并求出概率,再利用全概率公式求解即可.
(2)结合题意得到,再求出对应取值概率,进而得到分布列和数学期望即可.
【详解】(1)设表示事件“智能语音客服的回答被采纳”;表示事件“语音输入的问题表达清晰”,
由题意可知,,
所以,
即智能语音客服的回答被采纳的概率为.
(2)依题意得,的所有可能取值为,且.
所以
所以的分布列为
0
1
2
3
4
11. 【答案】(1)
(2)
(3)
【分析】(1)设小组中有酶的人数为X,依题意,可知,分别求出与,利用条件概率公式即可求出恰有2人有酶的概率;
(2)设每组检测次数,则易得,求出其分布列和数学期望,进而可求得总检测次数的期望;
(3)利用(2)中若分组检测,由检测次数的期望求得总成本期望,若逐一检测,则总成本为,依题意,代值计算即得的取值范围.
【详解】(1)设小组中有酶的人数为X,则.
已知混合样本阳性,即,则恰有2人有酶的概率为
.
(2)设每组检测次数,则的分布列为
1
p
期望为
则总检测次数的期望;
(3)若分组检测,检测次数的期望为.总成本期望,
若逐一检测,则总成本.由节省50%以上得.
代入,,,得,
整理得,因此,,故的取值范围是.
12. 【答案】(1),
(2)不存在,理由见详解
【分析】(1)利用所给分布列,根据概率之和为1求出,再由条件概率公式及全概率公式求解即可;
(2)根据分布列由期望公式求出得出方程,令,再由导数判断函数的最大值小于0,即可判断方程无解.
【详解】(1)当时,,
则,解得,
由题意,得,,.
由全概率公式,得
.
(2)假设存在,使,又.
得,化简得,即
令则
因为,所以在上存在,使得
所以即
且在为正,在为负从而在为增函数,在为减函数
所以当时,,即不存在值,使得.
🎯命题方向三 贝叶斯公式的应用
13. 【答案】(1)
(2)(i);(ii)分布列见详解,数学期望为
【分析】(1)按照贝叶斯公式直接计算即可;
(2)(i)按照播放次数分情况求解;(ii)写出的所有可能取值并计算所对应的概率,然后列出分布列,计算即可.
【详解】(1)设“任选一个频道播放,该频道是A频道”为事件,“任选一个频道播放,该频道是B频道”为事件,“任选一个频道播放一次,该频道播放成功”为事件,
所以,,
在播放一次就成功的条件下,A频道成为优选频道的概率为.
(2)(i)播放1次A频道成为优选频道的概率为,
播放3次A频道成为优选频道的概率为,
所以按照约定2,两个频道共播放不超过4次时,A频道成为优选频道的概率为.
(ii)的所有可能取值为0,1,2,3,
,
,
所以的分布列为:
0
1
2
3
所以数学期望为.
14.【答案】(1)
0
1
2
3
0.343
0.441
0.189
0.027
期望
(2)
分析】(1)由题意确定服从二项分布,即可求解;
(2)设“任取一个零件为次品”“零件是从第箱取出的”,由全概率公式求得,再由贝叶斯公式即可求解.
【详解】(1)设,由题意知:
所以的分布列为
0
1
2
3
0.343
0.441
0.189
0.027
.
(2)设“任取一个零件为次品”,
“零件是从第箱取出的”,则且,
由题意知:,,
由全概率公式:,
由贝叶斯公式知:.
题型04 变量的相关关系与回归分析
🎯命题方向一 线性回归方程的求解、拟合与预测
1. 【答案】(1)
(2)预测该同学第7天的步数能达到一万步
【分析】(1)利用最小二乘估计可求得经验回归方程;
(2)令,代入回归方程求解即可.
【详解】(1),
,所以
又过,所以
所以关于的经验回归方程为
(2)令,得(千步)因为10.48千步等于1.048万步
所以由(1)中的回归方程,预测该同学第7天的步数能达到一万步
2.【答案】(1)
(2),
【分析】(1)根据条件,直接计算,即可求解;
(2)根据条件,直接求出,即可求出线性回归方程,再将代入,即可求解.
【详解】(1)相关系数.
(2)由题意得,,
所以,,
所以所求的经验回归方程是,
当时,,
故当昼夜温差为时,这种植物种子当日百粒发芽数为.
3. 【答案】(1)
(2)当门票定价为10元时,日广告费用为4千元时门票净收入最大
【分析】(1)根据公式求得,可求得y关于x的经验回归方程;
(2)设门票净收入为,结合(1)可得,进而利用,可求解.
【详解】(1)由题意得:,,
,,
,,关于x的经验回归方程为.
(2)设门票净收入为,则,由(1)时,,
故,
若要使最大,则,代入可得,又因为,故,
所以当门票定价为10元时,日广告费用为4千元时门票净收入最大.
4. 【答案】(1);8.8万人.
(2)分布列见详解,数学期望为3.
【分析】(1)利用最小二乘法公式求出回归直线方程,再估计第7天该景区接待游客的人数;
(2)由全概率公式计算,利用二项分布计算概率,列出分布列,由公式计算期望和方差可得.
【详解】(1)由题,又,,,,
所以 ,
因此关于的经验回归方程为,
将代入回归方程得,即预测第7天接待游客人数为8.8万人.
(2)设事件为“游客步行下山”,事件为“游客步行上山”,事件为“游客乘观览车上山”,
根据全概率公式可得每位游客步行下山的概率为,
所以由题意,的可能取值为
,,
,,
,
因此的分布列为:
0
1
2
3
4
所以期望为.
5. 【答案】(1)说明见详解
(2)
(3)
【分析】(1)利用相关系数的计算公式即可得解;
(2)利用已知数据和公式得到关于的线性回归方程;
(3)根据已知条件求出随机变量X的取值,利用古典概型的概率公式计算随机变量取值相应的概率,再利用离散型随机变量的期望公式即可求解.
【详解】(1)由表中的数据和参考数据得,,,,
,
,,
∴.
因为y与x的相关系数近似为0.997,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.
(2)由及(1)得,
,所以y关于x的回归方程为.
(3)X的取值依次为2,3,4,5,6,7,9,11,
,,,
,,,
,,
X的分布列
X
所以.
6. 【答案】(1),很强的线性正相关关系
(2)
X
80
150
210
P
【详解】(1)由题意,,,
则,
由,
同理,
则,
则,
由接近1且为正,故变量x与y之间有很强的线性正相关关系.
(2)由题意,X的可能取值为80、150、210,
则,,,
故X的分布列为:
X
80
150
210
P
则.
🎯命题方向二 非线性回归的转化与应用
7. 【答案】(1)选择模型为,理由见详解,
(2)(i)不能,理由见详解(ii)9km
【分析】(1)先根据定义域和单调性要求筛选出函数模型③,把已知点代入模型求出、的值,检验其余点是否在所得函数图象上确定解析式.
(2)(i)计算载重9时飞行20km能耗并与300比较判断能否完成任务.
(ii)先算出载重25时总能耗表达式,再根据能耗限制列不等式求解的最大值.
【详解】(1)选择函数模型③.理由如下:依题意可知,所选的函数模型必须满足两个条件:
一是函数定义域为;二是“每千米能耗”随着“载重”的增多而增大.
因为模型①的定义域不可能为,所以不符合:因为模型②是单调递减函数,所以不符合;
因为模型③在有意义,且当时,单调递增,符合题意,故应选择模型为.将点(0,2),(1,7)代入得,解得,
所以.经检验,点(4,12),(9,17),(16,22)都在函数的图象上,
所以所求的函数解析式为,且当时,表示空载能耗.
(2)由(1)得.(i)依题意,得,
所以该无人机不能完成本次配送任务.
(ii)依题意,得,所以,解得,
所以的最大值为9km.
8. 【答案】(1)
(2)
【分析】(1)先确定保有量大于3万辆的年份数量,用对立事件求至少1年大于3万辆的概率,再结合2年都大于3万辆的概率,通过条件概率公式计算结果;
(2)将非线性回归模型取对数转化为线性回归模型,利用给定数据计算斜率和截距,再还原得到原模型的参数.
【详解】(1)保有量大于3万辆的年份有第4,5,6年,共3年,
保有量不大于3万辆的年份有第1,2,3年,共3年,
设至少有1年保有量大于3万辆为事件,2年保有量全都大于3万辆为事件,
事件的对立事件为2年都不大于3万辆,总选法有,
两年都不大于3万辆的选法为,所以,
两年都大于3万辆的选法为,所以,则.
(2)已知模型,两边取对数得,
令,则,即转化为线性回归方程,
其中,由题意得,
则,
,
因为,所以,则.
9.【答案】(1)
(2)
【分析】(1)将原指数方程可转化为线性回归方程:,结合经验回归方程的公式求解即可;
(2) 设事件为“恰好有2人参与该活动”,利用即可求解.
【详解】(1)令,则原指数方程可转化为线性回归方程:,
即,其中,由,,,
可得,
,,
所以,,所以,
由得,则关于的指数回归方程;
(2)设事件为“恰好有2人参与该活动”,
所以.
🎯命题方向三 回归模型的拟合效果评价
10. 【答案】(1)
(2)分布列见详解,
(3)经验回归方程的拟合效果不良好
【分析】(1)求出根据回归直线必过样本中心点求解即可;
(2)可能取值,求出对应概率,进而得到分布列和期望;
(3)求出代入公式,即可得到答案.
【详解】(1),,
因为,即,解得.
(2)5组数据中,两组数据残差为正值,三组数据残差为负值,所以可能取值为,
,,,
所以X的分布列为
0
1
2
期望.
(3),
,所以经验回归方程的拟合效果是不良好.
题型05 独立性检验问题
1.【答案】(1),,能认为得高脂血症与不运动有关
(2)的分布列为:
,数学期望为
【分析】(1)利用合计数据求出,,再代入公式计算,与临界值比较判断是否有关.
(2)先确定得高脂血症总人数,根据分层抽样求出抽样比,进而求解的分布列与期望.
【详解】(1)由题意可知:总样本数为,所以非运动者合计为,
因此,运动者合计为,则,
所以 ,
因为(对应的临界值),
依据的独立性检验,能认为得高脂血症与不运动有关.
(2)由(1)可知:得高脂血症总人数为人,
分层抽样抽取13人,抽样比为,
因此抽取的非运动者高脂血症患者为人,
运动者高脂血症患者为人,
表示抽取2人中运动者的人数,的可能取值为,则
,,,
所以的分布列为:
数学期望为:.
2.【答案】(1),体质情况与爱好运动有关.
(2)的分布列为:
0
1
2
.
【分析】(1)求出参数值并完善表格,根据公式计算的值后可得正确判断;
(2)先确定的所有可能取值,根据超几何分布计算概率后结合期望公式可求.
【详解】(1)由表中数据可得,表格完善如下:
体质情况
组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
设:体质情况与爱好运动无关,则,
根据依据小概率值的独立性检验,否定,故体质情况与爱好运动有关.
(2)易知名体质情况“合格”对象中有人爱好运动,人不爱好运动,
故的所有可能取值为0,1,2,
,,,
即所求分布列为
0
1
2
所以的期望.
3.【答案】(1)
(2)有关联,证明见详解.
【分析】(1)结合题意根据全概率公式和贝叶斯公式计算求解(2)根据表格数据计算卡方,与临界值比较即可判断.
【详解】(1)设事件:任取一件产品为甲生产线加工,事件:任取一件产品为优品.
由题意得:,,,.
根据全概率公式,可得总优品概率:
根据贝叶斯公式,可得所求条件概率:
(2)由列联表得,总样本量,
代入卡方公式:
因为,所以有把握认为生产线改造与优品有关联.
4.【答案】(1)有关 (2)
【详解】(1)零假设该市中学教师是否喜欢使用技术与年龄无关,
而,
依据小概率值的独立性检验,推断不成立,
即认为该市中学教师是否喜欢使用技术与年龄有关.
(2)设事件为从所抽取的120名中学教师中随机抽取一人,抽中喜欢使用技术的教师,
事件为从所抽取的120名中学教师中随机抽取一人,此人年龄超过45岁,
由题意,,则.
5.【答案】(1),下四分位数
(2)有关
【分析】(1)利用频率分布直方图各组频率之和为的性质,列出方程求解参数值;再根据百分位数的定义,通过累计频率确定下四分位数所在的区间,并用插值法计算该分位数;
(2)根据分层抽样和条件概率完成列联表,再代入卡方公式计算检验统计量,与临界值比较以判断独立性;最后通过计算两组学生的优秀率并对比,进一步验证独立性检验的结论.
【详解】(1)根据频率分布直方图的性质,所有组频率和为,组距为,
因此:,解得:,
下四分位数即第百分位数,计算累计频率
频率,累计;频率,累计;
频率,累计;频率,累计。
,因此第百分位数在区间内,
计算得:下四分位数
(2)零假设:认真完成作业与成绩无关
认真完成作业
不认真完成作业
成绩优秀
成绩不优秀
,因为,
依据小概率值的独立性检验,零假设不成立,即认真完成作业与成绩有关,
该判断出错概率不超过0.001,
认真完成作业的学生中成绩优秀的频率为0.4,不认真完成作业的学生中成绩优秀的频率为0.1,
可以发现认真完成作业的学生成绩优秀的频率是不认真完成作业的学生的4倍,差异显著.
6.【答案】(1)列联表为
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
100
220
女性驾驶员
30
50
80
合计
150
150
300
有关联,解释见详解, (2)随机变量的分布列为
0
1
2
3
期望为
【分析】(1)根据已知数据可计算得到补全列联表所需的数据,进而补全列联表,并计算得到,由此可得结论;
(2)根据分层抽样原则可确定样本中偏好新能源汽车的人数和偏好燃油车的人数,由此可得所有可能的取值,根据超几何分布概率公式可求得每个取值对应的概率,由此可得分布列;由数学期望计算公式可求得期望值.
【详解】(1)因为样本中偏好燃油汽车的人数占样本总数的50%,故样本中偏好燃油汽车的人数为,因为样本中女性驾驶员的样本占样本总数的,故样本中女性驾驶员的人数为,由题意,列联表补充如下:
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
100
220
女性驾驶员
30
50
80
合计
150
150
300
零假设为:对燃油汽车和新能源汽车的偏好与驾驶员的性别无关联.
根据列联表数据,计算得.
根据小概率值的独立性检验,可以推断不成立,即认为对燃油汽车和新能源汽车的偏好与驾驶员的性别有关联,此推断犯错误的概率不大于0.01.
男性驾驶员中偏好新能源汽车的频率为,女性驾驶员中偏好新能源汽车的频率为,前者明显小于后者.根据频率稳定于概率的原理,我们可以认为女性驾驶员偏好新能源汽车的概率更大.
(2)由题意,抽取的8人中偏好燃油汽车的人数为人,偏好新能源汽车的人数为人.
随机变量的可能值为0,1,2,3.
,,
,.
所以,随机变量的分布列为
0
1
2
3
的数学期望.
7.【答案】(1),样本容量为
(2)
(3)列联表见详解,无
【分析】(1)由频率分布直方图中,所有矩形面积之和为可得的值,将第一组的容量除以第一组的频率可得出样本容量;
(2)将每个矩形底边的中点值乘以对应矩形的面积,相加可得出平均数;
(3)根据题意完善列联系表,结合临界值表可得出结论.
【详解】(1)由频率分布直方图中,所有矩形面积之和为可得,解得,样本容量为.
(2)所有参赛学生的平均成绩为.
(3)由题意可知,获奖人数为人,
由题意可得如下列联表
性别
奖励
合计
获奖
未获奖
男
女
合计
所以,,
所以,依据小概率值的独立性检验,男生与女生的获奖无差异.
8.【答案】(1)能 (2)(i);(ii)当时,建议挑战第3道题;当时,挑战和不挑战第3道题都可以;当时,建议不挑战第3道题.
【分析】(1)计算,根据独立性检验的思想求解即可;
(2)(i)根据重复独立事件的概率公式计算对应概率即可;
(ii)分别计算不挑战第3道题,获得奖金的期望与挑战第三道题的获得奖金的期望,进而作差比较期望的大小判断即可.
【详解】(1)零假设为:对航天工程的关注情况与学历无关,
依据小概率值的独立性检验,推断不成立,即认为对航天工程的关注情况与学历有关.
(2)(i)记甲能进入第二关答题为事件,即3道题至少答对2道题,
所以
(ii)若确定不挑战第3道题,获得奖金为,的可能取值为0,400,
,
则的分布列为:
0
400
所以;若确定挑战第3道题,获得奖金为,的可能取值为0,200,800,
,,
则的分布列为
0
200
800
所以.令,
故当时,,建议挑战第3道题;
当时,,挑战和不挑战第3道题都可以;
当时,,建议不挑战第3道题.
题型06 概率统计与其他模块的融合交汇与创新问题
🎯命题方向一 概率统计与数列的融合
1. 【答案】(1),,,
(2)
【分析】(1)利用独立事件的概率乘法公式,易得与的值,对于第二轮操作,需要分成“甲手中有2张“欢”字卡片或有2张“喜”字卡片”与“甲手中有1张“欢”字卡片和1张“喜”字卡片”两类情况分别求解即得与的值;
(2)类比(1)中的第二轮操作,可得,构造等比数列,求出其通项公式,再代值计算即得.
【详解】(1)第一轮操作,甲要抽到乙的“欢”字卡片,且同时乙要抽到甲的“喜”字卡片,甲手中才能有2张“欢”字卡片,
由独立事件的概率乘法公式,可得,同理;
第二轮操作中,若第一轮结束后,甲手中有2张“欢”字卡片或有2张“喜”字卡片,则在第二轮操作后,甲有2张“欢”字卡片的概率为0;
若第一轮结束后,甲手中有1张“欢”字卡片和1张“喜”字卡片,则甲有2张“欢”字卡片的概率为,
故,同理可得;
(2)由对称性可知,
而只有在次操作后,甲手中有1张“欢”字卡片和1张“喜”字卡片时,甲才有的概率在第次有2张“欢”字卡片,
若在次操作后,甲手中有2张“欢”字卡片或有2张“喜”字卡片,则在第轮操作后,甲有2张“欢”字卡片的概率为0,
所以当时,,化简得,
则可构造为,
所以是一个以为首项,以为公比的等比数列,
可得,所以,所以.
2. 【答案】(1)
(2)
(3)
【分析】(1)根据独立事件乘法公式计算可得结果;
(2)利用的递推关系可得,再由数列构造可得数列为等比数列,可求出;
(3)易知服从二项分布,可得,再利用等比数列前项和计算可求得结果.
【详解】(1)2轮传球后,红球回到甲手中的概率为,
由题意知,红球与绿球的传递相互独立,所以2轮传球后,绿球在甲手中的概率也是.
所以2轮传球后2个球恰好都回到甲手中的概率为.
(2)考虑红球在第轮到第轮的位置变化:
若第轮后红球在甲手中,则第轮后红球一定不在甲手中,若第轮后红球不在甲手中,无论球在乙和丙谁的手中,传回甲的概率均为,所以.
整理得,又,所以,
即(或写成);
(3)因为红球与绿球的传递相互独立,所以服从二项分布,
所以.
可得
.
3. 【答案】(1)
(2)证明见详解,
(3)1
【分析】(1)根据全概率公式可求;
(2)根据全概率公式构建递推关系后可得,利用构造法可证明是等比数列且可求的通项公式;
(3)根据题意可得,故可求.
【详解】(1)由题意得.
(2)当时,设有甲钱包恰有两枚“黑币”的概率为,
则没有“黑币”的概率为,
,
故.
又,故为等比数列,故,.
(3)由题的可能取值为0,1,2,其概率分布列为:
0
1
2
依题意,即.于是
故.
4. 【答案】(1)
(2)分布列见详解,均值为
(3)
【分析】(1)根据古典概型概率求解即可;
(2)先分析小芳投掷的次数的所有可能的取值,然后求出分布列与数学期望即可;
(3)若第1次从小芳开始,则第次对小芳投掷骰子分两种情况讨论,然后结合互斥事件性质,以及数列的递推关系式分析求解即可.
【详解】(1)设事件为“小明投掷一次骰子后,点数之和为4的倍数”,
则基本事件为:,
,
,
总数为36,事件包含的基本事件有:,
共9个基本事件,所以.
(2)由(1)知小芳投掷一次后,出现点数之和是4的倍数的概率也为,
由题意知可取值为,则:
,
,
所以的分布列为:
0
1
2
3
数学期望为:.
(3)若第一次从小芳开始,则第次由小芳投掷骰子有两种情况:
第一种情况:第次由小芳投掷,第次继续由小芳投掷,其概率为,
第二种情况:第次由小明投掷,第次由小芳投掷,其概率为,
由于这两种情况彼此互斥,所以,
所以,且,所以是以为首项,为公比的等比数列,
所以,即.
5. 【答案】(1),,,
(2)
(3)
【分析】(1)结合独立事件乘法公式求出,再利用全概率公式求;
(2)利用全概率公式求得、与、的关系,再利用构造法证明等比数列,进而求出通项公式,列出的分布列,结合通项公式求出期望即可;
(3)根据题意将问题转化为集合中子集元素相加求和,结合错位相减求和即可.
【详解】(1)依题意,,,
,
.
(2)设表示次取球后乙口袋有2个黄球,表示次取球后乙口袋有1个黄球,
表示一次操作甲乙都取的是红球,表示一次操作甲取的是红球同时乙取的是黄球,
表示一次操作甲取的是黄球同时乙取的是红球,表示一次操作甲,乙都取黄球,
当时,
则,
,
,
,
因此,即,,
所以是为首项为公比的等比数列.
故.
依题意,的分布列为
0
1
2
故期望.
(3)由(2)知,
,
而所有元素之和可以看作集合中所有子集中元素之和.
设集合为一共有个不同的元素,
而一个包含的子集,对于剩下的个元素,
每个元素可以独立地选择“放入子集”或“不放入子集”,
因此对于剩下的个元素,每个都有2种选择,由乘法原理,这样的子集个数为,
由此可知一个所有子集中元素之和为该集合各个元素之和的倍,
故所有元素之和可写为,
令
所以
故,
所以.
故所有元素之和可写为.
🎯命题方向二 概率统计与函数、导数的融合
6. 【答案】(1)分布列见详解,80.8
(2)(ⅰ);(ⅱ)证明见详解,时,商家期望利润最大,最大期望利润约为6.7元.
【分析】(1)依题意确定X的可能取值,并利用独立事件的概率乘法公式计算出对应的概率,列出分布列并计算出数学期望;
(2)(ⅰ)分别求出支付金额的期望与优惠券成本的期望,代入期望利润的公式,计算即得;(ⅱ)利用求导判断的单调性,即可证明在内存在唯一极大值点,进而求得期望利润的最大值.
【详解】(1)由题可知,X的可能取值为100,90,80,70,60,
,,
,,
.
分布列为:
X
100
90
80
70
60
P
0.2
0.24
016
0.24
0.16
数学期望为:.
(2)(ⅰ)∵期望利润=购买概率×(支付金额的期望-商品成本)-优惠券成本的期望,
则支付金额的期望为:
;
优惠券成本的期望为
.
∴
.
(ⅱ),令.解得,
当时,在上单调递增;
当时,在上单调递减;
∴在内存在唯一极大值点,又,
∴当时,商家期望利润最大,最大期望利润约为6.7元.
7. 【答案】(1);
(2)(i);(ii)所以的最大值约为0.3679,此时.
【分析】(1)合理设出事件,再根据全概率公式即可得到答案;
(2)(i)设:抽到的第张奖券金额为,再利用全概率公式求出概率通式,再代入即可;
(ii)根据估值参考公式得,再设函数,求导得其最值,从而得到的估计值,最后结合其整数范围即可得到答案.
【详解】(1)设抽到的第张奖券的金额为.
设甲获得最大金额奖励.
注意到.
则.
(2)(i)仍设:甲获得最大金额奖励,
若,则,故只需考虑的情况.
设:抽到的第张奖券金额为.
由于是随机抽取,抽到的每张奖券为最大金额的机会均等,则.
只有当是前张奖券中的最大金额,甲才会保留第张奖券,则.
则.
若,当时,.
(ii)由估值参考得,则.令,则.
当时,.当时,单调递增;
当时,单调递减,因此,当时,取得最大值.
此时,不是整数,
又,
所以最大值约为0.3679,此时.
8. 【答案】(1)
(2)分布列见详解 (3)
【分析】(1)以每组数据的区间中点值为该组数据的代表值进行估算.
(2)先根据分层抽样的概念确定第一次抽取的12人样本中第一组和第二组的人数,进而得到的可能取值,求其概率,可得的分布列.
(3)先得到答对3题的概率,设,分析函数的单调性,求最大值的值.
【详解】(1)估计平均年龄为.
(2)由题意得,这12人中,年龄在第一组内的有(人),
年龄在第二组内有(人),
则的所有可能取值为0,1,2,3,4,
所以,,
,,
则的分布列为:
0
1
2
3
4
(3)从这20个问题中随机抽取10个对该工具提问,恰好答对3个问题的概率为,
设,由,且得,
所以,
显然,,
令,
当时,有,,即,
此时;
当时,有,,即,
此时,即,所以.
9. 【答案】(1);
(2);
(3)最小值为19600,.
【分析】(1)因为单件产品检测合格包含真实合格且检测合格、真实不合格但误判合格两个互斥事件,所以用全概率公式计算,将两个事件的概率相加.
(2)因为服从二项分布,所以先写出的表达式,将其看作关于的函数,再利用求函数最值的方法,比如求导或者利用组合数的性质分析函数的单调性,找到取最大值时的值.
(3)因为近似服从正态分布,所以先将通过正态分布的标准化转化为标准正态分布的概率不等式,结合参考数据得到关于的不等式,再结合与、的关系,进而估计的最小值及相应的值.
【详解】(1)设“单件产品实际为合格品”为事件,“单件合格品检测为合格”为事件,“单件不合格品误判为合格”为事件,则由全概率公式知,
,
即单件产品的检测结果为合格的概率为.
(2)因为每件产品的检测结果相互独立,
所以件产品中检测结果为合格的件数服从二项分布.
当时,.
令,其中,则
令,得,且,
所以当时,,所以在上单调递增,
当时,,所以在上单调递减,
所以,当时,取得最大值.因此.
(3)由于为随机变量,由(2)可设.
且,所以.
因为,所以
所以,
将代入,整理得.
因为,所以,
由题知,近似服从,所以,故,
由参考数据,故,解得.
又,所以恒成立.
因为时,取得最大值19600.
所以的最小值为19600,此时.
10. 【答案】(1)(i);(ii)分布列见详解,.
(2)时,P最大.
【分析】(1)(i)利用对立事件计算概率;(ii)根据题意计算概率,再分布列和求数学期望;
(2)列出概率,设,利用导数与单调性、最值得关系求解.
【详解】(1)(i)设事件:小明4次摸球中,至少摸出1个白球,
则.
(ii)由题可知,可能的取值为,
甲口袋每次摸到红球的概率为,每次摸到白球的概率为,
乙口袋每次摸到红球的概率为,每次摸到白球的概率为,
,
,
,
,
,
分布列如下,
0
1
2
3
4
所以.
(2)小明4次摸球中,恰有3次摸出红球的概率P,
因为,
所以,
令,则,
所以当时,;当时,;
所以函数在单调递增,单调递减,
所以当,即时,P最大,最大值为.
🎯命题方向三 概率统计与立体几何的融合
11.【答案】(1);;
(2)①证明见详解;②.
【分析】(1)通过质点在不同时间的移动路径来确定回到点的概率;
(2)①利用正方体对称性以及质点移动的概率关系即可证明等式;
②通过质点到达各点的概率关系,化简可得,通过对的取值进行奇偶讨论,即可求得.
【详解】(1)质点从出发,第1次运动有3个方向,即、、,概率均为,
第2次要回到,必须从第1次到达的顶点(、、)沿原路返回,每个顶点返回的概率为,
所以;
第3次运动要回到,第二次必须在与相邻的顶点(、、),
但第2次运动质点不可能出现在顶点、、,所以;
(2)①设第次到达,其概率为,则第次一定出现在与相邻的、、,每个顶点到达的概率均为,因为质点从出发,顶点与顶点为其对称点,
所以第次到达顶点的概率与第次到达顶点的概率相同,均为,
又质点第次到达顶点的概率为,所以;
同理,设第次到达,其概率为,则第次一定出现在与相邻的、、,每个顶点到达的概率均为,因为质点从出发,顶点与顶点为其对称点,
所以第次到达顶点的概率与第次到达顶点的概率相同,均为,
又质点第次到达顶点的概率为,
所以;
②根据①的计算,可得,,与,联立,
可得,化简整理得,即,
所以,又,,,,,
所以,, ,
当为偶数时,数列是首项为,公比为等比数列,
所以,即,
所以
,
当为奇数时,,,,,,,
所以,
即,所以,
所以当为偶数时,
,
所以当为奇数时,
,
综上所述,.
🎯命题方向四 概率统计与不等式的融合
12. 【答案】(1)
(2)
(3)证明见详解
【分析】(1)根据题意,逐步对初始数列进行完整操作;
(2)分析初始排列的特点,计算出满足条件的排列种数与总排列数的比值;
(3)分析初始排列经过连续若干次完整操作后能得到的顺序排列的情况,通过对排列的构造和分析证明不等式.
【详解】(1)第一次完整操作:初始排列为,最左边的卡片标号,
可得标号小于卡片,,标号大于的卡片,
重新排列得到新排列,第二次完整操作:最左边的卡片标号,
可得标号小于的卡片, 标号大于的卡片,,,
重新排列得到新排列.连续经过两次完整操作后得到的新排列.
(2)要使初始排列经过一次完整操作后恰好能得到的顺序排列,必须满足:
,即原排列中小于的个元素已经是递增顺序;
,即原排列中大于的个元素已经是递增顺序;
首元素为时,剩余个位置由已经各自内部有序的和穿插而成,
确定中元素的位置可确定整个排列,共有种排法,又因为可以取遍中的任意整数,
所以满足条件的初始排列总数为.
又因为个元素的全排列总数为,
所以初始排列经过一次完整操作后恰好能得到的顺序排列的概率.
(3)对于任意操作所得的(,,…,k,,,…),由于后续操作取当前排列的最左侧的元素,其必然小于中的所有元素,因此作为整体,在后续操作中永远被划分在基准数的右侧,其内部元素的相对顺序不在改变.
要使排列经过连续若干次完整操作后能得到的顺序排列,必须满足:
本身必须是长度为个且能通过后续操作完成排序的排列,共有种;
必须是首次划分时已经是递增顺序;
首元素为时,穿插和的排法数为种排法,又因为可以取遍中的任意整数,
所以数列的递推公式为:,其中(规定),
根据递推公式,展开可得,
展开可得,
欲证明,即证,即,
等价于证明,对求和的任意一项,由于且,
则由组合数性质得,所以,
所以.
13. 【答案】(1)分布列见详解,
(2)
(3)证明见详解
【分析】(1)分别求出取所有可能的值时的概率,再列出分布列,求出数学期望即可;
(2)设细胞在第个周期时分裂为个细胞,之后一直有个细胞,先求出这一事件的概率,再求出的所有情况的概率,再求和即可.
(3)设细胞在第个周期时分裂为个新的细胞,这两个细胞在剩下的个周期中,其中一个分裂为个细胞,另一个一直保持分裂为个细胞,先求出这一事件的概率,再求出的所有情况的概率,再求和得到的解析式,再借助导数求出其最值即可得证.
【详解】(1)的可能取值为,
其中,,
,,
所以分布列为
;
(2)个周期结束后共有个细胞,则必在某一个周期结束后分裂成个细胞.
不妨设细胞在第个周期时分裂为个细胞,之后一直有个细胞,
此事件概率,
所以.
(3)个周期结束后共有3个细胞,设细胞在第个周期时分裂为个新的细胞,
这两个细胞在剩下的个周期中,其中一个分裂为个细胞,
另一个一直保持分裂为个细胞,此事件的概率
,
得,
,其中,.
令,,
记,,令,得.
当,,单调递增;当,,单调递减,
故,即.
🎯命题方向五 概率统计中的新定义问题
14. 【答案】(1)
(2)这1000件产品中恰有2件次品的概率为,最大时的值为2或3
【分析】(1)根据正态分布求解相应区间的概率即可;(2)(i)根据题意将已知数据代入公式即可,(ii)根据最大时列不等式组求解即可.
【详解】(1)因为,
所以泊松分布基本上就等于正态分布,此时可认为,即.
所以,
由,得
,即.
(2)(i)由题意知,且,
又,所以二项分布可近似看作泊松分布,所以,
所以,即这1000件产品中恰有2件次品的概率为.
(ii)因为最大,所以,即,解得,
又,所以最大时的值为2或3.
62 / 62
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
培优专题06 概率与统计 6大重难题型
题型 01 统计案例与样本数字特征问题
命题方向一 统计图表的数据分析及样本数字特征的计算与应用
命题方向二 统计案例中的抽样方法与数据解读
题型 02 二项分布、超几何分布、正态分布
命题方向一 二项分布
命题方向二 超几何分布
命题方向三 正态分布
题型 03 概率的独立性、条件概率与全概率公式
命题方向一 概率的独立性
命题方向二 条件概率与全概率公式
命题方向三 贝叶斯公式的应用
题型 04 变量的相关关系与回归分析
命题方向一 线性回归方程的求解、拟合与预测
命题方向二 非线性回归的转化与应用
命题方向三 回归模型的拟合效果评价
题型05 独立性检验问题
题型06 概率统计与其他模块的融合交汇与创新问题
命题方向一 概率统计与数列的融合
命题方向二 概率统计与函数、导数的融合
命题方向三 概率统计与立体几何的融合
命题方向四 概率统计与不等式的融合
命题方向五 概率统计中的新定义问题
题型01 统计案例与样本数字特征问题
抓关键·破难点
结论1:频率分布直方图中的有关数据计算方式
◎众数为最高长方形底边中点对应的横坐标.
◎平均数为每个小长方形的面积与对应小长方形底边中点的横坐标的乘积之和.
◎中位数左边和右边的直方图的面积相等,都为0.5,第百分位数的左边的直方图面积为.
结论2:根据频率分布直方图判断中位数与平均数的大小关系
一般来说,对单峰的频率分布直方图,如果直方图的形状是对称的,那么平均数和中位数差不多,如果直方图在右边“拖尾”,那么平均数>中位数,如果直方图在左边“拖尾”,那么平均数<中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
刷经典·通方法
🎯命题方向一 统计图表的数据分析及样本数字特征的计算与应用
1. (2026·河南周口3月·联考)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩分成,,,,这五组,得到如图所示的频率分布直方图.
(1)估计样本成绩的平均数及方差;(同一组中的数据用该组区间的中点值作为代表)
(2)已知落在内的平均成绩是80分,方差是4分,落在内的平均成绩是88分,方差是6分,求两组成绩合并后的平均数和方差.
附:设两组数据的样本量、样本平均数和样本方差分别为m,,;n,,,记两组数据总体的样本平均数为,则总体样本方差.
2. (2026·辽宁大连·一模)某快递公司收取快递费用的标准是:重量不超过的包裹收费10元;重量超过的包裹,除收费10元之外,超过的部分,每超出(不足时按计算)需再收5元.公司从承揽过的包裹中,随机抽取100件,其重量统计如下:
包裹重量(单位:)
包裹件数
43
30
15
8
4
公司又随机抽取了60天的揽件数,得到频数分布表如下:
揽件数
天数
6
6
30
12
6
以记录的60天的揽件数的频率作为各揽件数发生的概率
(1)计算该公司3天中恰有2天揽件数在的概率;
(2)估计该公司对每件包裹收取的快递费的平均值;
(3)公司将快递费的三分之一作为前台工作人员的工资和公司利润,剩余的用做其他费用,目前前台有工作人员3人,每人每天揽件不超过150件,每人每天工资100元,公司正在考虑是否将前台工作人员裁减1人,试计算裁员前后公司每日利润的数学期望,并判断裁员是否对提高公司利润有利?
(注:同一组中的揽件数以这组数据所在区间中点值作代表)
3 (2026·河北黄骅一模)某学校为提升学生的科学素养,要求所有学生在学年中完成规定的学习任务,并获得相应过程性积分.现从该校随机抽取100名学生,获得其科普测试成绩(百分制,且均为整数)及相应过程性积分数据,整理如下表:
科普测试成绩x
科普过程性积分
人数
4
10
3
a
2
b
1
23
0
2
(1)当a=25时,
(i)从该校随机抽取一名学生,估计这名学生的科普过程性积分不少于3分的概率;
(ii)从该校科普测试成绩不低于80分的学生中随机抽取2名,记X为这2名学生的科普过程性积分之和,估计X的数学期望;
(2)从该校科普过程性积分不高于1分的学生中随机抽取一名,其科普测试成绩记为,上述100名学生科普测试成绩的平均值记为.若根据表中信息能推断恒成立,直接写出a的最小值.
🎯命题方向二 统计案例中的抽样方法与数据解读
4.(2026·云南曲靖·模拟)某学校对高中生体质健康调研,随机抽取100名学生的体重(单位:kg)得到如下频数分布表:
分组
频数
5
25
40
20
10
(1)估计样本的中位数;
(2)从样本和中按分层抽样抽取学生6人,再从这6人中随机抽取3人,其中体重在,的人数分别为,,记.
(i)求的分布列及期望;
(ii)求.
5. (2026·重庆名校联盟第一次·联考)某地区从高一年级的物理测试中随机抽取了100名学生的物理成绩,整理得到如图所示的频率分布直方图.
(1)该地区某学校建议此次物理测试成绩在本地区前的学生选科报物理方向,试估计报物理方向的学生本次成绩不低于多少分?(结果保留整数)
(2)从成绩位于区间和的答卷中,采用分层抽样随机抽取7份,再从这7份中随机抽取3份,设成绩在的答卷份数为随机变量,求的分布列及数学期望.
6. (2026·安徽合肥第六中学阶段性·绿色评价)烧麦——在呼和浩特有着深厚的历史底蕴,2024年12月21日,呼和浩特举办了“首届烧麦美食大会”,活动持续至2025年1月3日,期间吸引了数以万计的国内外游客慕名而来.“烧麦美食大会”的举办旨在传承和弘扬烧麦文化,深入挖掘呼和浩特市的文旅资源优势,推动烧麦产业创新与发展,促进文商旅融合,提升城市形象.为了了解游客的旅游体验满意度,某研究性学习小组采用问卷调查的方式,随机调查了100名游客,并将收集到的满意度得分数据(满分100分)分成了五段:,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值,为进一步了解游客对本次“烧麦美食大会”满意度情况,从分值在,,三组满意度问卷中,按分层随机抽样的方法抽取6人,再从这6人中随机抽取3人,记满意度得分在人数为,求的分布列和期望;
(2)已知满意度分值在的平均数,方差,在的平均数为,方差,试求满意度分值在的平均数和方差.
题型02 二项分布、超几何分布、正态分布
抓关键·破难点
一、“提、定、求、列、套”五步速求随机变量的分布列、期望与方差
提:提取关键信息,分析离散型随机变量的含义.
定:确定离散型随机变量的所有取值.
求:求每一个取值对应的概率(注意).
列:根据各个取值与对应的概率列出分布列.
套:套用期望、方差计算公式求解,期望,方差.
二、二项分布、超几何分布的均值、方差公式
分布类型
均值公式
方差公式
服从参数,的二项分布
服从参数,,
的超几何分布
三、正态分布常用结论
◎对于随机变量,其正态密度曲线关于直线对称,曲线与轴之间的区域的面积为1.
,,
.
刷经典·通方法
🎯命题方向一 二项分布
1.(2026·安徽合肥·模拟)某平台为了研究用户日均观看短视频的时长,随机抽取了200名用户进行调查,得到数据如下表:
日均时长(分钟)
[40,50]
频数
30
50
80
30
10
(1)估计这200名用户日均观看时长的第70百分位数;
(2)若平台规定“日均观看时长不少于30分钟的用户为潜在高粘性用户”,现从样本中有放回地抽取次,每次抽取1人,记抽到潜在高粘性用户的人数为.
(i)当时,求的分布列和数学期望;
(ii)若平台希望至少抽到1名潜在高粘性用户的概率不低于,至少需抽取多少次?(参考数据:)
2.(2026陕西汉中·模拟)已知排球比赛的规则是:每局25分,达到24分时,比赛双方必须相差2分.才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);比赛排名采用积分制,积分规则如下:比赛中,以3:0或3:1取胜的球队积3分,负队积0分;以3:2取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两队以往6局比赛成绩:
1
2
3
4
5
6
甲
25
21
27
27
23
25
乙
18
25
25
25
25
17
假设用频率估计概率,且甲,乙每局的比赛相互独立.
(1)估计甲队每局获胜的概率;
(2)如果甲、乙两队比赛1场,求甲队的积分的概率分布列和数学期望;
(3)如果甲、乙两队约定比赛2场,求两队积分相等的概率.
3. (2026·山东临沂·一模)某人工智能公司召开年会,期间提供两个游戏供员工选择,两个游戏均有3局,每局获胜可获对应奖金,奖金可累计.具体规则如下:
游戏Ⅰ:抛掷质地均匀的相同硬币
第1局,抛两枚,向上的图案相同则获胜,得100元奖金;第2局,抛三枚,向上的图案相同则获胜,得500元奖金;第3局,抛四枚,向上的图案相同则获胜,得900元奖金;
游戏Ⅱ:抛掷质地均匀的特殊骰子(三组对面分别标记0,2,6的骰子).
第1局,抛两颗,向上数字相同则获胜,得300元奖金;第2局,抛三颗,向上的数字相同则获胜,得600元奖金;第3局,抛四颗,向上的数字是2,0,2,6(不计顺序)则获胜,得900元奖金.
(1)求游戏Ⅰ第2局获胜的概率;
(2)若销售部门3位员工均选择游戏Ⅰ,设X为前两局均未获胜的人数,求X的分布列和数学期望;
(3)从奖金期望角度,员工应选择哪个游戏?请说明理由.
4. (2026·山东枣庄·二调)某人工智能实验室要对一款新型学习智能体进行轮测试(每轮测试的结果相互独立),每轮测试中智能体会随机接受类与类任务中的一个.已知该智能体每轮成功完成类任务的概率均为,每轮成功完成类任务的概率均为.成功完成一次类任务得1分,成功完成一次类任务得2分,不成功均得0分.记智能体在第1轮测试后的得分为.
(1)求的分布列;
(2)记智能体经过2轮测试后的总得分为,求;
(3)每轮测试中智能体成功完成类或类任务就称为“过关”.记轮测试中智能体过关的次数为,求和.
🎯命题方向二 超几何分布
5. (2026·广东东莞·模拟)一个袋子中有个大小相同的球,其中有4个红球、8个绿球,分别采用有放回和不放回的方式从中随机抽取3个球,设采用有放回方式抽取时抽到红球的个数为,采用不放回方式抽取时抽到红球的个数为.
(1)求的概率;
(2)求Y的分布列与数学期望.
6.(2026·江苏南通·检测)近年来,盲盒经济在消费市场中掀起了一阵热潮,成为一种普遍的经济现象.商家通过不断变换花样吸引消费者.某商店推出一款售价为1元/个且外观相同的盲盒,每开一个盲盒,会开出3款不同颜色(分别记为红色、黄色、蓝色)的某一商品,开出红色、黄色、蓝色商品的概率分别为.
(1)若某顾客一次性购买了3个盲盒,求该顾客恰好开出两个红色商品的概率;
(2)若某顾客只想要红色商品,与老板协商一致,每次开一个盲盒,如果开出红色商品则停止,否则再开一个盲盒,若连续4次均未开出红色商品,老板就赠送一个红色商品给他为了得到红色商品,求该顾客的平均花费.
🎯命题方向三 正态分布
7.(2026·河北秦皇岛·阶段检测)固态电池是纯电动汽车搭载的新一代电池,与使用电解液的传统液态锂离子电池相比,固态电池具有安全性能高、能量密度大等特点.某公司试生产了一批新型固态电池,为了了解该批次固态电池的“循环寿命”x(循环寿命是指:电池的容量下降到初始容量的某一阈值时,完成充放电循环的次数)的情况,从这批固态电池中随机抽取了100组进行了测试,并统计绘制了下表:
循环寿命x(千次)
组数y
5
15
a
b
5
已知循环寿命x(千次)的平均值(同一组中的数据用该组区间的中点值代表).
(1)求a,b的值;
(2)根据测试数据可以认为“循环寿命”x近似服从正态分布,经计算样本标准差s的估计值为0.7.用样本数据的平均值作为的值,用样本标准差s的估计值作为的值.
(ⅰ)若规定:循环寿命的电池为一等品;的电池为优等品.求试生产的电池的一等品率和优等品率的估计值(结果用百分数表示);
(ⅱ)在该型电池的生产中,称发生概率低于0.27%的事件为小概率事件,在质量控制时,如果小概率事件未发生,则认为该批产品合格;否则可以认为该批产品不合格.若这100组电池中,循环寿命x的最大值和最小值分别为6.5和2.3.请判断该批固态电池是否合格?并说明理由.
参考数据:若随机变量,则,,.
8. (2026·山东青岛一模)某款产品的尺寸误差(单位:)服从正态分布,若一件产品的尺寸误差的绝对值不小于,则认为该件产品不合格.
(1)任取一件产品,求这件产品不合格的概率;
(2)在计算二项分布的概率时,若重复性试验的次数很多且每次试验事件发生的概率很小,则可利用泊松分布代替二项分布进行近似计算.设随机变量服从二项分布,若,且,则,,其中.现对某一批产品抽取40件进行检测,若不合格产品超过3件,则认为这批产品不合格.估算这批产品不合格的概率(精确到0.01).
附:若,则;.
9.(2026·陕西宝鸡·阶段检测)某企业对某品牌芯片开发了一条生产线进行试产.其芯片质量按等级划分为五个层级,分别对应如下五组质量指标值:、、、、.根据长期检测结果,发现芯片的质量指标值服从正态分布,现从该品牌芯片的生产线中随机抽取件作为样本,统计得到如图所示的频率分布直方图.
(1)根据检测结果,样本中芯片质量指标值的标准差的近似值为,用样本平均数作为的近似值,用样本标准差作为的估计值,可得到X服从的正态分布.求和的值;
(2)从样本中质量指标值在和的芯片中随机抽取件,记其中质量指标值在的芯片件数为,求的分布列和数学期望;
(3)将指标值不低于的芯片称为等品.通过对芯片长期检测发现,在生产线任意抽取一件芯片,它为等品的概率为,用第(1)问结果试估计的值.
(附:①同一组中的数据用该组区间的中点值代表;②参考数据:若随机变量服从正态分布,则,,.)
题型03 概率的独立性、条件概率与全概率公式
抓关键·破难点
一、条件概率模型
结论①:利用定义计算条件概率,分别求P(A)和P(AB),得.
结论②:利用缩小样本空间法求条件概率.先求事件A包含的基本事件数n( A),再在事件A发生的条件下求事件B包含的基本事件数,即n( AB),得.
二、全概率模型
结论③:一般地,设是一组两两互斥的事件,=Ω,且P(Ai)>0,i=1,2, ,n,则对任意的事件,有P(B)=.
三、贝叶斯公式
结论④:设是一组两两互斥的事件,=Ω,且,则对任意的事件,P(B)>0,有.
刷经典·通方法
🎯命题方向一 概率的独立性
1. (2026·河北部分学校·一模)甲、乙两名同学进行投篮游戏,两人各投一次称为一轮,投中记1分,投不中记0分,甲、乙每次投中的概率分别为 ,且每次投篮结果都相互独立,共进行3轮游戏,总分多者获胜,相等为平局.
(1)求甲获胜的概率;
(2)游戏结束后,记甲、乙两名同学的得分之和为随机变量X,求X的分布列与数学期望.
2. (2026·广东东莞3月·质量检测)甲、乙两人参加某高校的入学面试,入学面试有2道难度相当的题目,甲答对每道题目的概率都是,乙答对每道题目的概率都是,每位面试者共有两次机会,若答对第一次抽到的题目,则面试通过,结束答题;否则继续第2次答题,答对则面试通过,未答对则面试不通过,甲、乙两人对抽到的不同题目能否答对是独立的,且两人答题互不影响,
(1)求甲、乙两人有且只有一人通过面试的概率;
(2)设面试过程中甲、乙两人答题的次数之和为,求的分布列与期望.
3. (2026·海南部分学校·联合调研)竹竿舞又称“跳竹竿”,是人在两竹竿滑动相撞的空隙中跳动的一种娱乐活动.2005年,黎族的竹竿舞被确定为海南省非物质文化遗产,2006年,竹竿舞入选“国家级非物质文化遗产保护名录”,甲、乙两名游客组队参加了海南某文化旅游区举办的竹竿舞闯关活动,该活动总共分为三关:第一、二关均为单人独舞(第一关和第二关闯关的人不相同),第三关为两人共舞.已知甲、乙闯过第一关的概率分别为,闯过第二关的概率分别为,这支队伍闯过第三关的概率为0.5.活动规定:只有闯过前一关,才有资格闯关后一关.
(1)请以这支队伍闯过前两关的概率为依据,为甲、乙安排第一关和第二关的闯关顺序,并求此时这支队伍闯过前两关的概率;
(2)以在(1)中安排的闯关顺序为准,记这支队伍闯过的关数为,求的分布列与期望.
4. (2026·安徽临泉·模拟)某校为庆祝建校百年,学校组织建校百年校友体育赛,赛事间隙举行了一次有关三大球类运动的知识竞赛,海量题库中篮球、足球、排球三类相关知识题量占比分别为.甲校友回答篮球、足球、排球这三类问题中每个题的正确率分别为.
(1)若甲校友在该题库中任选一题作答,求他回答正确的概率;
(2)若甲校友从这三类题中各任选一题作答,每回答正确一题得3分,回答错误得分.设该校友回答三题后的总得分为分,求的分布列及数学期望;
(3)知识竞赛规则:随机从题库中抽取道题目,答对题目数不少于道,即可获得奖励.现以获得奖励的概率大小为依据,若甲校友在和之中选其一,则他应如何选择?并说明理由.
🎯命题方向二 条件概率与全概率公式
5. (2026·河南焦作一模)有甲、乙两个不透明的袋子,甲袋中有8个红球、2个黄球,乙袋中有9个红球、3个黄球.
(1)若从甲袋中随机一次性取出2个球,其中红球的个数为,求的分布列与数学期望;
(2)先从甲、乙两个袋子中任选一个袋子,再从所选的袋子中随机一次性取出2个球,若已知取出的2个球都是红球,求这2个球来自乙袋的概率.
6. (2026·陕西咸阳·模拟)2026年央视马年春晚节目《武BOT》将传统武术与现代科技完美融合,“人机共武”完成了棍术攻防、醉拳互动、双节棍对练及极限空翻等高难度表演动作,不仅展示了我国人工智能技术的飞速发展,也体现了科技赋能传统文化的实践创新,其中高空弹射空翻转体完成后,稳准落地让人震撼.研究人员将机器人极限空翻动作划分为空翻转体和稳准落地两个环节,在空翻转体环节中,每个机器人完成空翻转体的概率均为0.9;在落地环节,机器人的表现存在差异:若空翻转体完成,则稳准落地的概率为0.8;若空翻转体未完成,则稳准落地的概率为0.1.在极限空翻这个表演中,假设每个机器人完成动作互不影响.
(1)如果随机抽取3个机器人,记为完成空翻转体的机器人人数,求的分布列及数学期望;
(2)如果随机抽取一个机器人,已知其稳准落地,求其空翻转体完成的概率.
7. (2026·江西吉安3月·模拟)某校社团举行“网络安全”知识竞赛,规则如下:每位选手需要独立完成3道题目,答对一题得2分,答错一题得分,3道题目累加得分多者获胜,甲、乙两位同学报名参加比赛,两人分别独立答题,互不影响,若甲、乙正确回答每道题的概率分别为、.
(1)求比赛结束后甲得3分的概率;
(2)已知在甲获胜的前提下,乙恰好得3分的概率为,求的值.
8. (2026·安徽皖北协作区·联考)某市高三学生学习强度指数Q的概率分布情况如下表所示.
学习强度指数Q
概率
0.2
05
0.3
应对情况
轻松应对
勉强应对
困难应对
(1)从该市随机选取3名高三的学生,记学习强度指数的人数为X,求及X的数学期望.
(2)定义为在事件M发生的条件下事件N发生的优势.记事件“该学生学习有压力”(勉强应对和困难应对都被认为是学习有压力,轻松应对被认为是学习无压力),事件“该学生困难应对”,求在事件A发生的条件下事件B发生的优势.
9. (2026·广东河源3月·质量检测)湘绣,是中国优秀的民族传统工艺之一,有着两千多年的历史.湘绣的制作工艺繁杂,一幅湘绣作品要经过设计图案和刺绣两大主要环节,且只有设计图案通过后才能进行刺绣,两个环节相互独立.只有同时通过这两个环节才能成为成品.某绣坊准备制作三幅不同的湘绣作品,已知三幅作品通过设计图案环节的概率依次为,通过刺绣环节的概率依次为.
(1)求三幅中恰有一幅作品通过设计图案环节的概率;
(2)若已知三幅中恰有一幅作品通过设计图案环节,求通过的作品为的概率;
(3)经过设计图案和刺绣两个环节后,三幅作品成为成品作品的件数为.求随机变量的分布列及数学期望.
10. (2026·安徽合肥3月·质量检测)某公司研发了一种智能语音客服系统,在测试时,当语音输入的问题表达清晰时,智能语音客服的回答被采纳的概率为,当语音输入的问题表达不清晰时,智能语音客服的回答被采纳的概率为.已知语音输入的问题表达清晰的概率为,且智能语音客服每次回答是否被采纳相互没有影响.
(1)求智能语音客服的回答被采纳的概率;
(2)在某次测试中输入了4个问题,设表示智能语音客服的回答被采纳的次数,求的分布列、数学期望和方差.
11. (2026·江苏南京市六合区名校联盟第一次·调研)有N个人需要通过血液检测某种酶是否存在.假设每个人血液中含有该酶的事件是相互独立的,且含有该酶的概率均为,若血液检测始终能准确判断样本中该酶是否存在.现采用以下分组检测方法:将待检测人群分成r个小组,每组人.在每一组中,取每人的血液混合成一个样本进行检测.
若某组的混合样本检测结果呈阴性(不含酶),则该组内所有人员无需再进行后续检测.
若某组的混合样本检测结果呈阳性(含有酶),则需要对该组内的每一位成员再分别单独检测一次(不用采集血样,利用现有采集过的血样).
(1)若,,已知某小组的混合样本检测结果呈阳性,求该组内“恰有2人”血液中含有该酶的概率;
(2)用N,k,p表示该方法所需检测次数的期望值;
(3)设检测成本由两部分组成:采集处理血样成本为a元/人份,化验检测成本为b元/次.若,每组人数,且该方法的总成本期望值比“逐一检测”的总成本节省了50%以上,求的取值范围.(参考数据:)
12. (2026·山东德州·一模)在某工厂的产品质量检测中,设随机变量表示从一批产品中随机抽取的不合格产品数量.已知抽取到个不合格产品的分布列为:
0
1
2
3
每个不合格产品需要进行返工处理,返工成功(即将不合格产品修复为合格产品)的概率均为,且各个产品返工是否成功相互独立.事件表示抽取的产品中有个不合格产品(),事件表示抽取的产品中返工成功的数量比返工失败的数量多.
(1)若,求,并根据全概率公式求;
(2)是否存在值且,使得,请说明理由.
🎯命题方向三 贝叶斯公式的应用
13. (2026·辽宁大连·二调)欲从A,B两个频道中选出一个优选频道作为校园之声广播,现对这两个频道轮流播放进行测试,每次播放一个频道.已知A频道每次播放成功的概率为,B频道每次播放成功的概率为,且每次播放互不影响.
约定1:任选一个频道进行播放,若播放成功,便成为优选频道;
约定2:从A频道开始播放,先成功播放的频道为优选频道,当决定出优选频道或两频道都播放3次均失败,结束测试.
(1)按照约定1,求在播放一次就成功的条件下,A频道成为优选频道的概率;
(2)按照约定2,
(i)两个频道共播放不超过4次时,求A频道成为优选频道的概率;
(ii)测试结束时,求B频道播放次数的分布列与数学期望.
14.(2026·甘肃陇南·二诊) 托马斯.贝叶斯(ThomasBayes)在研究“逆向概率”的问题中得到了一个公式:设,是一组两两互斥的事件,,且,,则对任意的事件,有.这个公式被称为贝叶斯公式(贝叶斯定理).其中称为事件的全概率.
(1)假设这3台车床型号相同,它们各自独立工作,且发生故障的概率都是0.3,设同时发生故障的车床数为随机变量,求的分布列和数学期望;
(2)假设该车间生产了两箱零件,第一箱内装有10件,其中有2件次品;第二箱内装有20件,其中有3件次品.现从两箱中等可能地随机挑选一箱,然后从该箱中随机取一个零件.已知取出的是次品,求它是从第二箱中取出的概率.
题型04 变量的相关关系与回归分析
抓关键·破难点
当经验回归方程不是形如时的转化技法:
非线性经验回归方程
变换公式
变换后的线性经验回归方程
刷经典·通方法
🎯命题方向一 线性回归方程的求解、拟合与预测
1. (2026·安徽池州质量·监测)某同学为养成锻炼习惯,使用智能手环记录自己连续五天行走步数,设日期顺序变量x(为第一天),y(单位:千步)为对应日期的步数,具体数据如下表:
日期顺序(天)
1
2
3
4
5
步数y(千步)
6.2
6.8
7.6
8.4
9.0
(1)求y关于x的经验回归方程;
(2)利用(1)中的回归方程,预测该同学第7天的步数能否达到一万步.
附:经验回归方程,其中,
2.(2026·江苏南京·一模) 为研究昼夜温差(单位:)与某植物种子当日的百粒发芽数(单位:粒)之间的关系,实验室记录了6天的每日昼夜温差与种子当日的百粒发芽数,如下表所示:
日期编号
1
2
3
4
5
6
温差
9
13
11
15
10
14
百粒发芽数
23
28
26
31
25
29
(1)根据表中的数据,计算样本相关系数(精确到0.01);
(2)求百粒发芽数关于温差的经验回归方程,并估计昼夜温差为时,这种植物种子当日的百粒发芽数.
参考公式:相关系数,,,
参考数据:,,,.
3. (2026·浙江强基联盟·联考)2025年11月,全国多地中小学推行“秋假”政策,直接带动旅游市场热度.某景点为科学定价、吸引更多中小学生游客,选取拟定价格开展门票定价试运行,相关数据如下表所示:
门票价格x(元/人)
40
50
60
70
80
日游客人数y(千人)
18
17
13
7
5
(1)已知y与x具有线性相关关系,求出y关于x的经验回归方程;
(2)为了扩大景区知名度与客流吸引力,景区将门票定价为10(元/人),并计划做广告宣传.由前期调查可知,当日均广告费为千元时的日游客人数为千人,其中y是当门票为10(元/人)时,根据(1)中的经验回归方程所预测的日游客人数.求景区的日均广告费用为多少千元时才能使日门票净收入最大.(日门票净收入=票价×日游客人数-日均广告费)
参考公式:经验回归方程,.
4. (2026·山东聊城·一模)某景区统计了连续5天该景区接待游客的人数(单位:万人),数据如下表:
第x天
1
2
3
4
5
接待游客人数y(万人)
22
2.6
3.1
5.2
6.9
(1)根据表中数据,求y关于x的经验回归方程,并预测第7天该景区接待游客的人数;
(2)该景区上山、下山各有步行和乘观览车两种方式.调查显示,游客选择步行和乘观览车上山的概率分别为,,步行上山的游客下山时继续选择步行的概率为,乘观览车上山的游客下山时继续选择乘观览车的概率为.假设游客之间选择上山、下山的方式互不影响,现从该景区出口随机选取4位下山的游客了解其下山方式,记X为这4人中步行下山的游客人数,求X的分布列和期望.
附:参考数据:,,.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,.
5. (2026·江苏扬州适应性·调研测试)某高中数学兴趣小组,准备利用所学知识研究成年男性的臂长与身高之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:
159
165
170
176
180
67
71
73
76
78
(1)根据上表数据,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程(系数精确到0.01);
(3)从5名样本成年男性中任取2人,记这2人臂长差的绝对值为,求.
参考数据:
6. (2026·江苏扬州市第一次·调研)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
🎯命题方向二 非线性回归的转化与应用
7. (2026·江苏省南京市栖霞区名校联盟·一模)在“M型无人机”物流配送场景中,无人机的载重(单位:kg,)会直接影响其每千米能耗(单位:Wh/km,Wh为电能单位).某技术团队对该无人机进行载重测试,得到如下实验数据:
载重(kg)
0
1
4
9
16
每千米能耗(Wh/km)
2
7
12
17
22
为精准预测不同载重下的每千米能耗,现有以下三种模型供选择:
①,②,③.
(1)选出你认为最符合实际的函数模型,说明理由,并求出其函数解析式;
(2)若该无人机电池容量为300Wh,飞行环境、飞行参数控制不变.根据(1)中所得的函数模型,
(i)某单程配送任务要求该无人机飞行20km,且载重9kg,判断该无人机是否能完成本次配送任务,并说明理由;
(ii)若该无人机执行往返配送任务,去程与返程均需飞行(单位:km),去程载重25kg,返程空载,且往返总能耗不大于电池容量的,求的最大值.
8. (2026·广东深圳中学·阶段测试)某市近6年的新能源汽车保有量数据如下表
年份代号x
1
2
3
4
5
6
保有量y(万辆)
1
1.8
2.7
4
5.9
9.2
(1)从这6年中任意选取2年,在已知至少有1年的新能源汽车保有量大于3万辆的前提下,求这2年的新能源汽车保有量全都大于3万辆的概率;
(2)用函数模型对变量x,y关系进行拟合,根据表中数据求出y关于x的回归方程(参数d的估计值精确到0.01).
参考数据:,,,;
设,,
参考公式:回归直线的斜率和截距的最小二乘估计公式分别为:,
9.(2026·云南民族大学附属高级中学·适应性训练)近年来,我国新能源汽车发展势头迅猛.为支持绿色出行,某市近年来加速公共充电桩建设,研究人员记录了某品牌新型充电桩投入运营后前6周的周均单桩服务车辆数(单位:辆),数据如下所示.
第周
1
2
3
4
5
6
周均单桩服务车辆数
20
30
45
67
99
148
为分析其增长趋势,令.经初步计算,已知,,.
(1)写出关于的指数回归方程;(其中,为常数,为自然对数的底数,的计算结果保留两位小数)
(2)调查显示,使用该充电桩的车主中,随机抽取1人会参与“低碳积分”活动的概率为0.3.现随机独立抽取5名车主,求恰好有2人参与该活动的概率.
附:记一组点,…,通过最小二乘估计所得的经验回归方程为,其中,.
🎯命题方向三 回归模型的拟合效果评价
10. (2026·广东广州市天河区适应性训练·二模)某公司为了了解A商品销售收入(单位:万元)与广告支出(单位:万元)之间的关系,现收集的5组样本数据如下表所示,且经验回归方程为.
2
5
6
8
9
16
20
21
28
10.96
19.24
22
27.52
30.28
(1)求的值;
(2)现从这5组数据的残差中抽取2组进行分析(观测值减去预测值称为残差),记X表示抽到数据的残差为负的组数,求X的分布列和期望;
(3)已知,且当时,回归方程的拟合效果良好,试结合数据,判断经验回归方程的拟合效果是否良好.
题型05 独立性检验问题
抓关键·破难点
“补、提、套、比、说”五步速解独立性检验问题
补:根据题干数据信息,补全列联表;
提:提出零假设:两个分类变量不相关;
套:套用公式计算;
比:查表找到,比较和的大小;
说:说明结论:如果,则不成立,即两个分类变量相关;如果,则成立,即两个分类变量不相关;
刷经典·通方法
1. (2026·云南曲靖·模拟)血脂高(高脂血症)可能导致动脉硬化、心脑血管疾病、胰腺炎等健康问题,长期血脂高会引发全身多器官损伤.某市医疗机构为了研究运动与血脂的关系,从本市成年人中采用随机抽样的方法抽取了150名市民,调查他们是否得高脂血症和平时运动的情况(每日进行30分钟以上中等强度的运动,且每周运动5天以上的为“运动者”,否则为“非运动者”).统计的部分数据如表.
运动情况
是否得高脂血症
合计
得高脂血症
未得高脂血症
“非运动者”
45
“运动者”
55
75
合计
150
(1)计算,的值,并依据的独立性检验,判断能否认为得高脂血症与不运动有关?
(2)该医疗机构采用分层随机抽样的方法从得高脂血症的成年人中随机抽取13人,并进行饮食方面的调查,然后从这13人中随机抽取2人作饮食指导,记这2人中“运动者”的人数为,求的分布列及数学期望.
附:,.
0.10
0.01
0.001
2.706
6.635
10.828
2. (2026·四川成都二模)国民体质是国家和社会发展的重要基础.为贯彻落实《“健康中国2030”规划纲要》《体育强国建设纲要》,2025年国家体育总局开展了第六次全国国民体质监测工作,旨在提高国民体质和健康水平,促进国家经济建设和社会发展.《国民体质测定标准(2023年修订)》将体质情况综合评级为优秀、良好、合格和不合格四个等级.某地区为了解国民体质情况是否与爱好运动有关,从该地区体质达到“合格”及以上的人群中随机抽取了人进行问卷调查,得到如下列联表:
体质情况
组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
(1)求的值,并依据小概率值的独立性检验,分析体质情况是否与爱好运动有关;
(2)在体质情况综合评级为“合格”的对象中,按是否爱好运动进行分层,用比例分配的分层随机抽样方法,从样本中抽取6人作进一步调查,再从这6人中随机抽取2人线下访谈,记这2人中“爱好运动”的人数为X,求X的分布列及数学期望.
附:,其中.
3. (2026·宁夏银川·一模)某工厂有甲、乙两条生产线加工同一型号的产品,甲生产线加工的优品率为5%,乙生产线加工的优品率为6%,加工出来的产品混放在一起.已知甲、乙生产线加工的产品数分别占总数的51%,49%.
(1)任取一件产品,如果取到的产品是优品,计算它是甲生产线加工的概率;
(2)现对甲生产线升级改造,从改造前与改造后甲生产线加工的产品中分别随机抽取100件进行检验,数据如下:
优品
非优品
合计
改造前
5
95
100
改造后
15
85
100
合计
20
180
200
根据小概率值的独立性检验,能否认为生产线改造与优品有关联?
附:
0.05
0.01
0.001
4. (2026·陕西渭南中学·一模)人工智能技术(简称技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,并迅速在各行各业中得到应用和推广,教育行业也不例外.某市教体局为调查本市中学教师使用技术辅助教学的情况,随机抽取了该市120名中学教师,统计了他们一周内使用技术帮助制作课件的情况,并将一周内使用技术帮助制作课件的节次不少于4次的认定为喜欢使用技术,否则认定为不喜欢使用技术,经统计得到如下列联表.
年龄
是否喜欢使用技术
合计
是
否
不超过45岁
46
14
60
超过45岁
32
28
60
合计
78
42
120
(1)依据小概率值的独立性检验,能否认为该市中学教师是否喜欢使用技术与年龄有关;
(2)将频率视为概率,现从所抽取的120名中学教师中随机抽取一人,在抽中喜欢使用技术的教师的条件下,求此人年龄超过45岁的概率.
附:,其中.
0.1
0.01
0.001
2.706
6.635
10.828
5. (2026·黑龙江哈尔滨第三中学·一模)为了探究学生完成数学作业情况与成绩之间的联系,某学校采用按比例分层抽样的方式得到200名学生的测验成绩,样本中认真完成作业的学生成绩频率分布直方图如图1所示.若认为成绩不低于120分为优秀,且数学成绩为优秀的学生年级分布扇形图如图2所示,已知样本中高三年级有15位同学成绩为优秀,且在所有数学成绩为优秀的学生中,认真完成作业的学生占.
(1)求a的值,并且计算出样本中认真完成作业的学生成绩的下四分位数;
(2)根据样本数据完成下方列联表,依据小概率值的独立性检验,分析认真完成作业与成绩是否有关.
认真完成作业
不认真完成作业
成绩优秀
成绩不优秀
附:.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
6. (2026·东北师大附中 哈尔滨师大附中 辽宁省实验中学第一次联合模拟考试)截至2025年底,我国新能源汽车保有量达到4397万辆,占汽车总产量的12%.某城市研究小组调查了300名汽车驾驶员对新能源汽车和燃油汽车的偏好程度,将调查结果整理成如下列联表.现统计得出样本中偏好燃油汽车的人数占样本总数的50%,女性驾驶员的样本占样本总数的,偏好燃油汽车的男性驾驶员的样本有120人.
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
女性驾驶员
合计
300
(1)请根据已知条件将上述列联表补充完整,并依据小概率值的独立性检验,分析对燃油汽车和新能源汽车的偏好是否与驾驶员性别有关联.如果有关联,解释它们之间如何影响.
(2)现从女性驾驶员中按对燃油汽车和新能源汽车的偏好用分层抽样法抽取8人做进一步访谈,然后从这8人中随机抽取3人填写调查问卷,记抽取的3人中偏好新能源汽车的人数为X,求X的分布列及数学期望.
参考公式及数据:,.
0.1
0.05
0.01
0.005
0.001
7. (2026·山东省聊城市·一模)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,女生的获奖率为,填写下列列联表,并依据小概率值的独立性检验,判断男生与女生的获奖情况是否存在差异?
性别
奖励
合计
获奖
未获奖
男
女
合计
附:,
8. (2026·齐齐哈尔·一模)中国的航天事业历经数十年的发展,已经形成了完整的航天技术体系,涵盖运载火箭、载人航天、深空探测等多个领域.为了了解不同学历人群对航天工程的关注情况,某社区随机调查了200位社区居民,得到如下数据(单位:人):
学历
关注
不关注
合计
本科及以上
80
20
100
本科以下
60
40
100
合计
140
60
200
(1)依据小概率值的独立性检验,能否认为对航天工程的关注情况与学历有关?
(2)现为了激发社区居民对航天工程的关注,该社区举办了一次航天知识闯关比赛,规则如下:
第一关:设置3道必答题,参与者需至少答对2道才能参与下一关答题,否则淘汰;
第二关:设置3道题,前2道题每答对1道奖励200元,答错即结束答题,奖励清零,2道题都答对可选择放弃答题,领取奖励,也可以选择继续答题(等可能的选择),第3道题答对奖励400元,答错前2道奖励减半,答题结束.已知甲参与闯关比赛,第一关答题的3道题每道题答对的概率均为,第二关答题的前2道题每道题答对的概率均为,第3道题答对的概率为,各题答对与否相互独立.
(i)求甲能进入第二关答题的概率;
(ii)已知甲进入第二关答题,从期望的角度,帮助甲分析是否挑战第3道题,使获取的奖金更多.
参考公式及参考数据:.
0.05
0.01
3.841
6.635
题型06 概率统计与其他模块的融合交汇与创新问题
抓关键·破难点
一、概率中的状态转移问题(数列递推思想)
概率题中看到“个”“次"等,常为状态转移问题,用数列递推思想分3步求解.
第①步:找到当前状态的“前一次”状态下的所有可能情况及对应概率;
第②步:结合当前状态下事件的概率及“前一次”状态下事件的概率,得到数列递推关系;
第③步:利用数列递推关系求出数列的通项公式.
二、概率统计与数列融合
1.求通项公式:关键是找出概率或数学期望的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式;
2.求和:注意是数列中的倒序求和、错位相减、列项求和;
利用等差、等比数列性质,研究单调性、最值或者求极限。
二、概率与函数、导数融合
(1)根据题目所求或题干给出的条件确定自变量及其取值范围;
(2)根据题意构建函数模型,写出函数的解析式;
(3)对构造的函数进行求导或利用函数单调性,求解目标函数的最值或最优解.
刷经典·通方法
🎯命题方向一 概率统计与数列的融合
1. (2026·甘肃省·一模)甲、乙两人各持有1张“欢”字卡片和1张“喜”字卡片,规定两人每次同时从对方手中随机抽取1张卡片交换(记为一轮操作).记轮操作后,甲手里有2张“欢”字卡片的概率为,甲手里有2张“喜”字卡片的概率为.
(1)求的值;
(2)求的值.
2. (2026·山西晋城·一模)甲、乙、丙三名同学进行传球游戏,有1个红球和1个绿球,每一轮中,持有球的人都将手中的球传出,若某人持有1个球,就将此球等可能地传给另外两人中的一人,若某人持有2个球,就在这一轮中将2个球分别传出,每个球都等可能地传给另外两人中的一人,2个球的去向互不影响,每个球一轮中只传递一次.游戏开始时,2个球都在甲手中.
(1)求2轮后2个球恰好都回到甲手中的概率;
(2)设轮后红球在甲手中的概率为,求;
(3)设轮后甲手中球的个数为的期望为,求.
3. (2026·湖北鄂州3月·质检)在区块链技术支持的加密资产网络中,设有两个智能合约钱包(甲钱包与乙钱包).每个钱包初始配置有1枚“黑币”(代表高波动性资产)与2枚“白币”(代表稳定资产).为平衡资产风险,系统执行如下自动交换协议:每次从两个钱包中各随机抽取一币,并交换存入对方钱包.记该协议重复执行次后,甲钱包中“黑币”的数量为,甲钱包中恰好有1枚“黑币”的概率为.
(1)求;
(2)证明:数列是等比数列,并求出数列的通项公式;
(3)求.
4. (2026·江苏南京市中华中学·模拟预测)小芳、小明两人各拿两颗质地均匀的骰子(点数为)玩游戏,游戏规则如下:每次由1人投掷手中的两颗骰子,在一次投掷后,若掷出的点数之和为4的倍数,则由原来投掷人继续投掷;若掷出的点数之和不是4的倍数,则由对方接着投掷.
(1)求小明在一次投掷后,掷出的点数之和是4的倍数的概率;
(2)规定第一次从小明开始,在游戏的前4次投掷中,设小芳投掷的次数为随机变量,求的分布列和均值;
(3)若第一次从小芳开始,求第次由小芳投掷的概率.
5. (2026·山东淄博·模拟)甲口袋中装有3个红球,乙口袋中装有2个黄球和1个红球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复次这样的操作,记乙口袋中黄球个数为,恰有2个黄球的概率为,恰有1个黄球的概率为.
(1)求,和,;
(2)求的数学期望(用表示);
(3),若,有,求所有元素之和.
🎯命题方向二 概率统计与函数、导数的融合
6. (2026·江苏南京市栖霞区名校联盟·一模)为促进消费,某电商平台和生产商在本周联合推出“有奖闯关”活动.活动规则如下:消费者成功闯过第一关获得基础券(获得10元基础券的概率为0.6,获得20元基础券的概率为0.4).闯过第一关后,可进行第二关闯关,成功闯过第二关后可获得进阶券20元,且这两种优惠券可叠加使用抵扣支付商品.已知消费者闯过第一关的概率为p₀,闯过第二关的概率为p.某生产商将商品定价100元,成本41元;优惠券成本由生产商承担基础券面额的30%,进阶券面额的50%.
(1)若,,记消费者购买一件该商品的实际支付金额为X(单位:元),求X的分布列和数学期望;
(2)设所有消费者均闯过第一关获得了基础券,推出活动后商品购买概率为,记生产商销售一件该商品的期望利润为(单位:元).(期望利润=购买概率×(支付金额的期望-商品成本)-优惠券成本的期望)
(ⅰ)求关于p的函数表达式;
(ⅱ)证明:在内存在唯一极大值点,并求当p为何值时,商家期望利润最大?最大期望利润是多少?(结果保留1位小数
7. (2026·河北唐山·一模)某销售公司为了激励员工,对销售冠军——员工甲进行奖励,奖励方案为:在一个盲盒里,有n(足够多)张奖券,这些奖券的金额各不相等,其最大值为M,但金额具体是多少,并未公开.该员工甲需逐张随机抽取并查看金额,如果对抽取的奖券不满意就弃掉,继续抽奖(弃掉的奖券不能再抽取),如果对这张奖券比较满意就保留,从而停止抽奖,公司将以此奖券金额作为奖励.
(1)若甲抽取了两张,把第2张奖券保留下来,求甲获得最大金额奖励M的概率;
(2)若甲先抽取了k(,且)张奖券,记录下其中的最大金额为m,然后继续抽取,若抽到奖券的金额小于m,就继续抽,当抽到第i(,)张奖券时,其金额大于m,则保留该奖券,停止抽奖,若未抽到金额大于m的奖券,则保留第n张.
(ⅰ)若,当时,求甲获得最大金额奖励M的概率p;
(ⅱ)当调整k的取值时,甲获得最大金额奖励M的概率p也会发生变化.若,请估计p的最大值,并求此时k的值.
(估值参考:当时,,,,.)
8. (2026·黑龙江实验中学高三·联合模拟)近年来,全球数字化进程持续加速,人工智能(Artificial Intelligence,简称AI)已然成为科技变革的核心驱动力,有媒体称DeepSeek开启了我国AI新纪元.某地区随机调查了经常使用某AI工具的360名用户,统计他们的年龄,得到如下的统计表:
第一组
第二组
第三组
第四组
第五组
年龄
人数
30
150
90
60
30
(1)利用统计表中的数据试估计该AI工具用户的平均年龄;
(2)已知用分层随机抽样的方法,从上面360名用户中随机抽取了12人,现从这12人中随机抽取4人,记抽到第一组的人数为m,第二组的人数为n.设,求的分布列;
(3)已知该工具对某20个问题能准确答对其中的(,且)个.若从这20个问题中随机抽取10个对该工具提问,恰好答对3个问题的概率最大,求此时的取值.
9. (2026·山东烟台诊·断性测试)某工厂生产一批产品,其单件产品的真实合格概率为.由于质检设备存在误差,当单件产品为合格品时,被该质检设备检测为合格的概率为,当单件产品为不合格品时,被其误判为合格的概率为,且.现从该批产品中随机抽取件,并用该质检设备进行检测,设每件产品的检测结果相互独立,检测结果为合格的件数为.
(1)求单件产品的检测结果为合格的概率;
(2)若为定值,求取最大值时的值;
(3)当足够大时,(2)中的近似服从.设,当时,试估计的最小值及相应的值.
说明:若,则,其中为的正态密度函数.参考数据:.
10. (2026·福建福州·质量检测)甲、乙两个不透明的口袋内装有除颜色外大小质地完全相同的若干个小球,已知甲口袋有个红球和4个白球,乙口袋有个红球和2个白球.现在小明从甲口袋有放回地连续摸球2次,每次摸出一个球,然后再从乙口袋有放回地连续摸球2次,每次摸出一个球.
(1)当时.
(i)求小明4次摸球中,至少摸出1个白球的概率;
(ii)设小明4次摸球中,摸出白球的个数为X,求X的分布列和数学期望;
(2)当时,设小明4次摸球中,恰有3次摸出红球的概率为P,则当m为何值时,P最大?
🎯命题方向三 概率统计与立体几何的融合
11.(2026·海南儋州第一次教学质量·诊断)如图,已知一个质点每隔相等时长,按随机方向,等可能地沿着正方体的棱从1个顶点移动到另1个顶点.设一个质点从顶点出发,第次运动后,质点回到点的概率为.
(1)求和;
(2)设第次运动后,质点移动到点的概率分别为、、.
①证明:,;
②求.
🎯命题方向四 概率统计与不等式的融合
12. (2026·湖北武汉3月·调研)有张编号分别为到的卡片,横向随机排列.对于这张卡片,初始状态下卡片标号从左到右为,,…,记此时的卡片排列为(,,…).对这张卡片的排列进行如下三步操作:1.取出最左边的卡片,记其标号为;2.剩余卡片中,标号小于的卡片按照原排列中的从左到右顺序依次为,,…(若不存在则为空),标号大于的卡片按照原排列中的从左到右顺序依次为,,…(若不存在则为空);3.对这张卡片重新排列,得到新排列:(,,…,k,,,…).每进行完上述三步操作,称为一次“完整操作”.
(1)若初始排列为,写出连续经过两次完整操作后得到的新排列;
(2)求初始排列经过一次完整操作后恰好能得到的顺序排列的概率;
(3)记初始排列中有个排列种数能经过连续若干次完整操作后能得到的顺序排列,当时,证明:.
13. (2026·甘肃陇南二诊)现有一种不断分裂的细胞,每个时间周期内分裂一次,一个细胞每次分裂能生成一个或两个新的细胞,每次分裂后原细胞消失,设每次分裂成一个新细胞的概率为,分裂成两个新细胞的概率为;新细胞在下一个周期内可以继续分裂,每个细胞的分裂相互独立. 设有一个初始的细胞,在第一个周期内开始分裂,记个周期结束后,细胞的数量为,其中.
(1)若,求的分布列和数学期望;
(2)求;
(3)求证:.
🎯命题方向五 概率统计中的新定义问题
14. (2026·湖南常德·二模)泊松分布是一种统计与概率学里常见的离散型分布.若随机变量服从参数为的泊松分布(记作),则其概率分布为,其中为自然对数的底数.
(1)当时,泊松分布可以用正态分布来近似,当时,泊松分布基本上就等于正态分布,此时可认为.若,求的值;
(2)设,当且时,二项分布可近似看作泊松分布,即,其中.
某工厂生产电子元器件,次品率为,各元件是否为次品相互独立,记为产品中的次品数,按泊松分布近似计算.
(i)这1000件产品中恰有2件次品的概率;
(ii)求使得最大时的值.
(参考数据:;若,则有,,)
18 / 42
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
培优专题06 概率与统计 6大重难题型
题型 01 统计案例与样本数字特征问题
命题方向一 统计图表的数据分析及样本数字特征的计算与应用
命题方向二 统计案例中的抽样方法与数据解读
题型 02 二项分布、超几何分布、正态分布
命题方向一 二项分布
命题方向二 超几何分布
命题方向三 正态分布
题型 03 概率的独立性、条件概率与全概率公式
命题方向一 概率的独立性
命题方向二 条件概率与全概率公式
命题方向三 贝叶斯公式的应用
题型 04 变量的相关关系与回归分析
命题方向一 线性回归方程的求解、拟合与预测
命题方向二 非线性回归的转化与应用
命题方向三 回归模型的拟合效果评价
题型05 独立性检验问题
题型06 概率统计与其他模块的融合交汇与创新问题
命题方向一 概率统计与数列的融合
命题方向二 概率统计与函数、导数的融合
命题方向三 概率统计与立体几何的融合
命题方向四 概率统计与不等式的融合
命题方向五 概率统计中的新定义问题
题型01 统计案例与样本数字特征问题
抓关键·破难点
结论1:频率分布直方图中的有关数据计算方式
◎众数为最高长方形底边中点对应的横坐标.
◎平均数为每个小长方形的面积与对应小长方形底边中点的横坐标的乘积之和.
◎中位数左边和右边的直方图的面积相等,都为0.5,第百分位数的左边的直方图面积为.
结论2:根据频率分布直方图判断中位数与平均数的大小关系
一般来说,对单峰的频率分布直方图,如果直方图的形状是对称的,那么平均数和中位数差不多,如果直方图在右边“拖尾”,那么平均数>中位数,如果直方图在左边“拖尾”,那么平均数<中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
刷经典·通方法
🎯命题方向一 统计图表的数据分析及样本数字特征的计算与应用
1. (2026·河南周口3月·联考)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩分成,,,,这五组,得到如图所示的频率分布直方图.
(1)估计样本成绩的平均数及方差;(同一组中的数据用该组区间的中点值作为代表)
(2)已知落在内的平均成绩是80分,方差是4分,落在内的平均成绩是88分,方差是6分,求两组成绩合并后的平均数和方差.
附:设两组数据的样本量、样本平均数和样本方差分别为m,,;n,,,记两组数据总体的样本平均数为,则总体样本方差.
【答案】(1)平均数100,方差104
(2),
【分析】(1)根据频率分布直方图中平均数与方差的求法,代入数据,即可得答案.
(2)根据条件,分别求出两组数据的样本容量,平均数和方差,代入公式,整理计算,即可得答案.
【详解】(1)由频率分布直方图得,
平均数,
方差
.
(2)第一组的样本容量,,
第二组的样本容量,,
所以合并后的平均数,
则.
2. (2026·辽宁大连·一模)某快递公司收取快递费用的标准是:重量不超过的包裹收费10元;重量超过的包裹,除收费10元之外,超过的部分,每超出(不足时按计算)需再收5元.公司从承揽过的包裹中,随机抽取100件,其重量统计如下:
包裹重量(单位:)
包裹件数
43
30
15
8
4
公司又随机抽取了60天的揽件数,得到频数分布表如下:
揽件数
天数
6
6
30
12
6
以记录的60天的揽件数的频率作为各揽件数发生的概率
(1)计算该公司3天中恰有2天揽件数在的概率;
(2)估计该公司对每件包裹收取的快递费的平均值;
(3)公司将快递费的三分之一作为前台工作人员的工资和公司利润,剩余的用做其他费用,目前前台有工作人员3人,每人每天揽件不超过150件,每人每天工资100元,公司正在考虑是否将前台工作人员裁减1人,试计算裁员前后公司每日利润的数学期望,并判断裁员是否对提高公司利润有利?
(注:同一组中的揽件数以这组数据所在区间中点值作代表)
【答案】(1); (2)公司对每件快递收取的费用的平均值可估计为15元; (3)公司将前台工作人员裁员1人对提高公司利润不利.
【分析】(1)根据样本中包裹件数在内的天数,得到频率,再根据未来3天中,包裹件数在间的天数服从二项分布求解.
(2)根据重量统计和收费标准,列出样本中快递费用的分布列,再求期望.
(3)根据题意及(2),揽件数每增加1,可使前台工资和公司利润增加(元),若不裁员,则每天可揽件的上限为450件,若裁员1人,则每天可揽件的上限为300件,根据公司随机抽取60天的揽件数的频数分布表分别列出分布列,求期望再减去员工的费用比较.
【详解】(1)样本中包裹件数在内的天数为48,频率为,
可估计概率为,未来3天中,包裹件数在间的天数服从二项分布,
即,故所求概率为;
(2)样本中快递费用的分布列如下表:
10
15
20
25
30
0.43
0.3
0.15
0.08
0.04
故样本中每件快递收取的费用的平均值为
(元),
故该公司对每件快递收取的费用的平均值可估计为15元.
(3)根据题意及(2),揽件数每增加1,可使前台工资和公司利润增加(元),
若不裁员,则每天可揽件的上限为450件,公司每日揽件数情况如下:
包裹件数(近似处理
50
150
250
350
450
实际揽件数
50
150
250
350
450
频率
0.1
0.1
0.5
0.2
0.1
故公司平均每日利润的期望值为(元);
若裁员1人,则每天可揽件的上限为300件,公司每日揽件数情况如下:
包裹件数(近似处理
50
150
250
350
450
实际揽件数
50
150
250
300
300
频率
0.1
0.1
0.5
0.2
0.1
故公司平均每日利润的期望值为(元)
因,故公司将前台工作人员裁员1人对提高公司利润不利.
3 (2026·河北黄骅一模)某学校为提升学生的科学素养,要求所有学生在学年中完成规定的学习任务,并获得相应过程性积分.现从该校随机抽取100名学生,获得其科普测试成绩(百分制,且均为整数)及相应过程性积分数据,整理如下表:
科普测试成绩x
科普过程性积分
人数
4
10
3
a
2
b
1
23
0
2
(1)当a=25时,
(i)从该校随机抽取一名学生,估计这名学生的科普过程性积分不少于3分的概率;
(ii)从该校科普测试成绩不低于80分的学生中随机抽取2名,记X为这2名学生的科普过程性积分之和,估计X的数学期望;
(2)从该校科普过程性积分不高于1分的学生中随机抽取一名,其科普测试成绩记为,上述100名学生科普测试成绩的平均值记为.若根据表中信息能推断恒成立,直接写出a的最小值.
【答案】(1)(i)0.35;(ii)
(2)7.
【分析】(1)(i)用频率代替概率即可;
(ii)先用频率代替概率得出科普过程性积分为的概率,再根据独立事件的乘法公式计算分布列,最后利用期望公式即可;
(2)先求出的最大值,再根据各分数段取最小值求得的平均分作为的最小值,根据即可求出.
【详解】(1)(i)由表知,科普过程性积分不少于3分的学生人数为,
则从该校随机抽取一名学生,这名学生的科普过程性积分不少于3分的频率为,
所以从该校随机抽取一名学生,这名学生的科普过程性积分不少于3分的概率估计为0.35.
(ii)依题意,从样本中成绩不低于80分的学生中随机抽取一名,这名学生的科普过程性积分为3分的频率为,所以从该校学生科普测试成绩不低于80分的学生中随机抽取一名,这名学生的科普过程性积分为3分的概率估计为,同理,从该校学生科普测试成绩不低于80分的学生中随机抽取一名,这名学生的科普过程性积分为4分的概率估计为,
X的所有可能值为6,7,8,
,,,
所以X的数学期望.
(20由表知,,则,
从该校科普过程性积分不高于1分的学生中随机抽取一名,其科普测试成绩记为,则的最大值为69,100名学生科普测试成绩的平均值记为,要使恒成立,当且仅当,
显然的最小值为各分数段取最小值求得的平均分,
因此,则,解得,
所以根据表中信息能推断恒成立的a的最小值是7.
🎯命题方向二 统计案例中的抽样方法与数据解读
4.(2026·云南曲靖·模拟)某学校对高中生体质健康调研,随机抽取100名学生的体重(单位:kg)得到如下频数分布表:
分组
频数
5
25
40
20
10
(1)估计样本的中位数;
(2)从样本和中按分层抽样抽取学生6人,再从这6人中随机抽取3人,其中体重在,的人数分别为,,记.
(i)求的分布列及期望;
(ii)求.
【答案】(1)65
(2)(i)分布列见详解,数学期望为1;(ii).
【分析】(1)根据中位数的定义确定体重区间,进而可求得中位数的值.
(2)(i)首先确定分层抽样的比例,然后确定的可能取值,并计算相应的概率,列出分布列,计算出期望;(ii)根据方差公式求出的值.
【详解】(1)因为,,故样本的中位数落在内,
又,故中位数为
(2)(i)和的人数比为,
分层抽样抽取学生6人中,和的人数分别为和,
故这6人中随机抽取3人,的可能取值为,对应的的取值为,
所以的可能取值为,
,,,
故的分布列为
期望为,
(ii)由(i)知,所以.
5. (2026·重庆名校联盟第一次·联考)某地区从高一年级的物理测试中随机抽取了100名学生的物理成绩,整理得到如图所示的频率分布直方图.
(1)该地区某学校建议此次物理测试成绩在本地区前的学生选科报物理方向,试估计报物理方向的学生本次成绩不低于多少分?(结果保留整数)
(2)从成绩位于区间和的答卷中,采用分层抽样随机抽取7份,再从这7份中随机抽取3份,设成绩在的答卷份数为随机变量,求的分布列及数学期望.
【答案】(1)72分 (2)分布列见详解,
【分析】(1)根据频率分布直方图中所有小矩形的面积和为1,可求得a值,分析可得选报物理方向的最低分在内,根据x值右侧面积和为,即可求得答案.
(2)求出成绩在区间和的人数,分析可得X的可能取值,求出各个取值对应的概率,列出分布列,求出期望即可.
【详解】(1)由题意,解得,
成绩在的频率为0.1,在的频率为0.25,在的频率为0.3,
因为,
所以选报物理方向的最低分在内,则,
解得,所以估计报物理方向的学生本次成绩不低于72分.
(2)由题可知,成绩在区间的频数为,
成绩在区间的频数为,
利用分层抽样,从中抽取7份,成绩在的频数为,
成绩在的频数为,
再从这7份答卷中随机抽取3份,的所有可能取值为,
,
故的分布列为:
0
1
2
所以的数学期望为:.
6. (2026·安徽合肥第六中学阶段性·绿色评价)烧麦——在呼和浩特有着深厚的历史底蕴,2024年12月21日,呼和浩特举办了“首届烧麦美食大会”,活动持续至2025年1月3日,期间吸引了数以万计的国内外游客慕名而来.“烧麦美食大会”的举办旨在传承和弘扬烧麦文化,深入挖掘呼和浩特市的文旅资源优势,推动烧麦产业创新与发展,促进文商旅融合,提升城市形象.为了了解游客的旅游体验满意度,某研究性学习小组采用问卷调查的方式,随机调查了100名游客,并将收集到的满意度得分数据(满分100分)分成了五段:,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值,为进一步了解游客对本次“烧麦美食大会”满意度情况,从分值在,,三组满意度问卷中,按分层随机抽样的方法抽取6人,再从这6人中随机抽取3人,记满意度得分在人数为,求的分布列和期望;
(2)已知满意度分值在的平均数,方差,在的平均数为,方差,试求满意度分值在的平均数和方差.
【答案】(1)分布列见详解,
(2)84,30
【分析】(1)根据分层抽样比确定得分在人数为的所有可能取值为0,1,2,3,分别求得对应概率即可求得分布列和期望值;
(2)利用样本方差求总体方差公式代入计算即可求得结果.
【详解】(1)由,解得;
由题可知,调查问卷考核得分分值在三组内的游客人数比为
,则需在内的游客中分别抽取
人,人,人.
现从这6人中随机抽取3人,则考核得分在人数为的所有可能取值为0,1,2,3.
,,,.
所以的分布列为
0
1
2
3
所以.
(20满意度分值在的频率为,人数为20;
在的颣率为,人数为30,满意度分值在的平均数,方差,
在的平均数,方差,所以满意度分值在的平均数,
满意度分值在的方差.
题型02 二项分布、超几何分布、正态分布
抓关键·破难点
一、“提、定、求、列、套”五步速求随机变量的分布列、期望与方差
提:提取关键信息,分析离散型随机变量的含义.
定:确定离散型随机变量的所有取值.
求:求每一个取值对应的概率(注意).
列:根据各个取值与对应的概率列出分布列.
套:套用期望、方差计算公式求解,期望,方差.
二、二项分布、超几何分布的均值、方差公式
分布类型
均值公式
方差公式
服从参数,的二项分布
服从参数,,
的超几何分布
三、正态分布常用结论
◎对于随机变量,其正态密度曲线关于直线对称,曲线与轴之间的区域的面积为1.
,,
.
刷经典·通方法
🎯命题方向一 二项分布
1.(2026·安徽合肥·模拟)某平台为了研究用户日均观看短视频的时长,随机抽取了200名用户进行调查,得到数据如下表:
日均时长(分钟)
[40,50]
频数
30
50
80
30
10
(1)估计这200名用户日均观看时长的第70百分位数;
(2)若平台规定“日均观看时长不少于30分钟的用户为潜在高粘性用户”,现从样本中有放回地抽取次,每次抽取1人,记抽到潜在高粘性用户的人数为.
(i)当时,求的分布列和数学期望;
(ii)若平台希望至少抽到1名潜在高粘性用户的概率不低于,至少需抽取多少次?(参考数据:)
【答案】(1)
(2)(i)分布列见详解,;(ii)11次
【分析】(1)第70百分位数为累计频数,第70百分位数落在区间,利用比例求解即可;
(2)(i),列出Y的所有可能取值和对应概率,得到分布列,并利用二项分布求期望公式计算出数学期望;
(ii)利用对立事件计算出抽到潜在高粘性用户的概率,解不等式得到答案
【详解】(1)将数据按时长升序排列,第70百分位数位置为,
前两组累计频数,前3组累计频数,
故第70百分位数落在区间,则第70百分位数约为;
(2)(i)潜在高粘性用户的频率为,.
易得的可能取值有0,1,2,3,
则,
,.
故的分布列为
0
1
2
3
;
(ii)设至少需抽取次,则,即,.即,
故至少需抽取11次.
2.(2026陕西汉中·模拟)已知排球比赛的规则是:每局25分,达到24分时,比赛双方必须相差2分.才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);比赛排名采用积分制,积分规则如下:比赛中,以3:0或3:1取胜的球队积3分,负队积0分;以3:2取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两队以往6局比赛成绩:
1
2
3
4
5
6
甲
25
21
27
27
23
25
乙
18
25
25
25
25
17
假设用频率估计概率,且甲,乙每局的比赛相互独立.
(1)估计甲队每局获胜的概率;
(2)如果甲、乙两队比赛1场,求甲队的积分的概率分布列和数学期望;
(3)如果甲、乙两队约定比赛2场,求两队积分相等的概率.
【答案】(1)
(2)分布列见详解,
(3)
【分析】(1)用频率估计概率,结合题意求概率即可;
(2)由题意可知,随机变量的所有可能取值为0,1,2,3,结合独立重复性实验概率公式求分布列和期望;
(3)记“甲、乙比赛两场后,两队积分相等”为事件A,分析可得,结合题意运算求解.
【详解】(1)用频率估计概率,6局中甲共赢4局,则甲队每局获胜的概率为.
(2)由题意可知,随机变量的所有可能取值为0,1,2,3,
则,,
,,
可得的分布列为:
0
1
2
3
所以.
(3)记“甲、乙比赛两场后,两队积分相等”为事件A,
设第场甲、乙两队积分分别为,,则,其中,
因为两队积分相等,则,即,可得,
又因为,,,,
所以.
3. (2026·山东临沂·一模)某人工智能公司召开年会,期间提供两个游戏供员工选择,两个游戏均有3局,每局获胜可获对应奖金,奖金可累计.具体规则如下:
游戏Ⅰ:抛掷质地均匀的相同硬币
第1局,抛两枚,向上的图案相同则获胜,得100元奖金;第2局,抛三枚,向上的图案相同则获胜,得500元奖金;第3局,抛四枚,向上的图案相同则获胜,得900元奖金;
游戏Ⅱ:抛掷质地均匀的特殊骰子(三组对面分别标记0,2,6的骰子).
第1局,抛两颗,向上数字相同则获胜,得300元奖金;第2局,抛三颗,向上的数字相同则获胜,得600元奖金;第3局,抛四颗,向上的数字是2,0,2,6(不计顺序)则获胜,得900元奖金.
(1)求游戏Ⅰ第2局获胜的概率;
(2)若销售部门3位员工均选择游戏Ⅰ,设X为前两局均未获胜的人数,求X的分布列和数学期望;
(3)从奖金期望角度,员工应选择哪个游戏?请说明理由.
【答案】(1)
(2)答案见详解; (3)游戏Ⅱ
【分析】(1)根据古典概型概率公式直接计算可得结果;
(2)利用二项分布直接计算即可得出分布列和期望;
(3)分别计算出参加一次游戏Ⅰ和游戏Ⅱ对应的奖金期望值,可知应选择游戏Ⅱ.
【详解】(1)由题意知,游戏Ⅰ第局获胜的概率.
(2)易知,
游戏Ⅰ第局获胜的概率为,第局获胜的概率为,则第局和第局均未获胜的概率为,因此可知,
随机变量的分布列为
0
1
2
3
随机变量的期望或.
(3)应该参加游戏Ⅱ,理由如下:记分别为一次参加游戏Ⅰ,Ⅱ所获奖金总额,
游戏Ⅰ第局获胜的概率为,第局获胜的概率为,第局获胜的概率为,
,
游戏Ⅱ第局获胜的概率为,第局获胜的概率为,第局获胜的概率为,
,
从奖金期望角度来看,应选择参加游戏Ⅱ.
4. (2026·山东枣庄·二调)某人工智能实验室要对一款新型学习智能体进行轮测试(每轮测试的结果相互独立),每轮测试中智能体会随机接受类与类任务中的一个.已知该智能体每轮成功完成类任务的概率均为,每轮成功完成类任务的概率均为.成功完成一次类任务得1分,成功完成一次类任务得2分,不成功均得0分.记智能体在第1轮测试后的得分为.
(1)求的分布列;
(2)记智能体经过2轮测试后的总得分为,求;
(3)每轮测试中智能体成功完成类或类任务就称为“过关”.记轮测试中智能体过关的次数为,求和.
【答案】(1)分布列为:
0
1
2
(2)
(3),
【分析】(1)根据题意求出对应随机变量的概率,得到分布列;
(2)根据条件概率公式求解即可;
(3)利用二项分布的期望、方差公式求解即可.
【详解】(1)的可能取值为,
,,,
所以分布列为:
0
1
2
(2)由(1),,,
所以.
(3)由题意,,所以,所以,,
🎯命题方向二 超几何分布
5. (2026·广东东莞·模拟)一个袋子中有个大小相同的球,其中有4个红球、8个绿球,分别采用有放回和不放回的方式从中随机抽取3个球,设采用有放回方式抽取时抽到红球的个数为,采用不放回方式抽取时抽到红球的个数为.
(1)求的概率;
(2)求Y的分布列与数学期望.
【答案】(1)
(2)分布列
0
1
2
3
【分析】(1)若有放回的抽取时,随机变量X服从二项分布,由二项分布的概率公式可得;
(2)若不放回抽取时,随机变量Y服从超几何分布,由超几何分布的概率公式可得分布列及期望.
【详解】(1)若有放回抽取时,每次抽球相互独立,每次抽到红球的概率为 ,共抽3次,
因此,根据二项分布概率公式: .
(2)若不放回抽取时,服从超几何分布,的所有可能取值为,
概率公式为:.
,,,.
的分布列为:
0
1
2
3
数学期望: .
6.(2026·江苏南通·检测)近年来,盲盒经济在消费市场中掀起了一阵热潮,成为一种普遍的经济现象.商家通过不断变换花样吸引消费者.某商店推出一款售价为1元/个且外观相同的盲盒,每开一个盲盒,会开出3款不同颜色(分别记为红色、黄色、蓝色)的某一商品,开出红色、黄色、蓝色商品的概率分别为.
(1)若某顾客一次性购买了3个盲盒,求该顾客恰好开出两个红色商品的概率;
(2)若某顾客只想要红色商品,与老板协商一致,每次开一个盲盒,如果开出红色商品则停止,否则再开一个盲盒,若连续4次均未开出红色商品,老板就赠送一个红色商品给他为了得到红色商品,求该顾客的平均花费.
【答案】(1)(2)
【详解】(1)记“该顾客恰好开出两个红色商品”为事件,.
(2)为了得到红色商品,记该顾客打开盲盒的次数为,的所有可能取值为.
,,
的分布列如下:
1
2
3
4
,则该顾客的平均花费为元.
🎯命题方向三 正态分布
7.(2026·河北秦皇岛·阶段检测)固态电池是纯电动汽车搭载的新一代电池,与使用电解液的传统液态锂离子电池相比,固态电池具有安全性能高、能量密度大等特点.某公司试生产了一批新型固态电池,为了了解该批次固态电池的“循环寿命”x(循环寿命是指:电池的容量下降到初始容量的某一阈值时,完成充放电循环的次数)的情况,从这批固态电池中随机抽取了100组进行了测试,并统计绘制了下表:
循环寿命x(千次)
组数y
5
15
a
b
5
已知循环寿命x(千次)的平均值(同一组中的数据用该组区间的中点值代表).
(1)求a,b的值;
(2)根据测试数据可以认为“循环寿命”x近似服从正态分布,经计算样本标准差s的估计值为0.7.用样本数据的平均值作为的值,用样本标准差s的估计值作为的值.
(ⅰ)若规定:循环寿命的电池为一等品;的电池为优等品.求试生产的电池的一等品率和优等品率的估计值(结果用百分数表示);
(ⅱ)在该型电池的生产中,称发生概率低于0.27%的事件为小概率事件,在质量控制时,如果小概率事件未发生,则认为该批产品合格;否则可以认为该批产品不合格.若这100组电池中,循环寿命x的最大值和最小值分别为6.5和2.3.请判断该批固态电池是否合格?并说明理由.
参考数据:若随机变量,则,,.
【答案】(1),.
(2)(ⅰ)一等品率的估计值为13.59%;优等品率的估计值为2.275%;(ⅱ)不合格,理由见详解
【分析】(1)由题意列出关于的方程组即可求解;
(2)由题意,,(i)根据正态分布的对称性求概率即可;(ii)算出,然后由即可判断.
【详解】(1)由题,①,②,
由①②解得,.
(2)由题,,,
(ⅰ)因为;
,
所以一等品率的估计值为13.59%;优等品率的估计值为2.275%.
(ⅱ)不合格.理由如下:由题,,
所以,又,,
故小概率事件发生,所以该批固态电池不合格.
8. (2026·山东青岛一模)某款产品的尺寸误差(单位:)服从正态分布,若一件产品的尺寸误差的绝对值不小于,则认为该件产品不合格.
(1)任取一件产品,求这件产品不合格的概率;
(2)在计算二项分布的概率时,若重复性试验的次数很多且每次试验事件发生的概率很小,则可利用泊松分布代替二项分布进行近似计算.设随机变量服从二项分布,若,且,则,,其中.现对某一批产品抽取40件进行检测,若不合格产品超过3件,则认为这批产品不合格.估算这批产品不合格的概率(精确到0.01).
附:若,则;.
【答案】(1)0.05;
(2)0.14.(注:和均为正确答案)
【分析】(1)根据给定条件,求出合格品概率,再利用对立事件的概率公式计算得解.
(2)由(1)可得,求出,再利用公式结合互斥事件、对立事件的概率公式求解.
【详解】(1)当,时,,则,
所以任意一件产品是不合格的概率为0.05.
(2)记为不合格产品数量,则,且,
又,且,则,,
其中,
因此
,
所以这批产品不合格的概率为0.14.
(注:最终结果为和均为正确答案)
9.(2026·陕西宝鸡·阶段检测)某企业对某品牌芯片开发了一条生产线进行试产.其芯片质量按等级划分为五个层级,分别对应如下五组质量指标值:、、、、.根据长期检测结果,发现芯片的质量指标值服从正态分布,现从该品牌芯片的生产线中随机抽取件作为样本,统计得到如图所示的频率分布直方图.
(1)根据检测结果,样本中芯片质量指标值的标准差的近似值为,用样本平均数作为的近似值,用样本标准差作为的估计值,可得到X服从的正态分布.求和的值;
(2)从样本中质量指标值在和的芯片中随机抽取件,记其中质量指标值在的芯片件数为,求的分布列和数学期望;
(3)将指标值不低于的芯片称为等品.通过对芯片长期检测发现,在生产线任意抽取一件芯片,它为等品的概率为,用第(1)问结果试估计的值.
(附:①同一组中的数据用该组区间的中点值代表;②参考数据:若随机变量服从正态分布,则,,.)
【答案】(1),
(2)分布列见详解,
(3)
【详解】(1)由于在频率分布直方图可知,所有矩形的面积之和为,
由题可知:,解得,
所以,估计从该品牌芯片的生产线中随机抽取件的平均数为:
.所以,.
(2)样本中质量指标值在和的芯片数量为,
所取样本的个数为件,
质量指标值在的芯片件数为件,故可能取的值为、、、,
所以,,,
,,
随机变量的分布列为:
所以的数学期望.
(3)由(1)可知:,则,,
由题可知:.
所以:,即.
题型03 概率的独立性、条件概率与全概率公式
抓关键·破难点
一、条件概率模型
结论①:利用定义计算条件概率,分别求P(A)和P(AB),得.
结论②:利用缩小样本空间法求条件概率.先求事件A包含的基本事件数n( A),再在事件A发生的条件下求事件B包含的基本事件数,即n( AB),得.
二、全概率模型
结论③:一般地,设是一组两两互斥的事件,=Ω,且P(Ai)>0,i=1,2, ,n,则对任意的事件,有P(B)=.
三、贝叶斯公式
结论④:设是一组两两互斥的事件,=Ω,且,则对任意的事件,P(B)>0,有.
刷经典·通方法
🎯命题方向一 概率的独立性
1. (2026·河北部分学校·一模)甲、乙两名同学进行投篮游戏,两人各投一次称为一轮,投中记1分,投不中记0分,甲、乙每次投中的概率分别为 ,且每次投篮结果都相互独立,共进行3轮游戏,总分多者获胜,相等为平局.
(1)求甲获胜的概率;
(2)游戏结束后,记甲、乙两名同学的得分之和为随机变量X,求X的分布列与数学期望.
【答案】(1);
(2)随机变量的分布列为:
.
【分析】(1)因为甲乙投篮结果相互独立,所以可利用独立事件概率乘法公式和互斥事件概率加法公式,分别计算甲获胜的每种情况的概率再求和.
先确定随机变量X的所有可能取值,利用独立事件概率乘法公式计算每个组合的概率,求出分布列.
【详解】(1)设甲、乙三轮总得分为、,且、服从二项分布,
,,,;
,,,;
=++=
所以甲获胜的概率为.
(2)X可能的取值为,
,;
;
;
;
;
;
随机变量的分布列为:
=.
2. (2026·广东东莞3月·质量检测)甲、乙两人参加某高校的入学面试,入学面试有2道难度相当的题目,甲答对每道题目的概率都是,乙答对每道题目的概率都是,每位面试者共有两次机会,若答对第一次抽到的题目,则面试通过,结束答题;否则继续第2次答题,答对则面试通过,未答对则面试不通过,甲、乙两人对抽到的不同题目能否答对是独立的,且两人答题互不影响,
(1)求甲、乙两人有且只有一人通过面试的概率;
(2)设面试过程中甲、乙两人答题的次数之和为,求的分布列与期望.
【答案】(1)
(2)分布列见详解,
【分析】(1)根据相互独立事件概率公式直接计算可得结果;
(2)易知随机变量的可能取值为2,3,4,分别计算出对应概率可得分布列,计算出期望值.
【详解】(1)设事件为“甲通过面试”,事件为“乙通过面试”,
(或)
(或)
所以甲、乙两人有且只有一人通过面试的概率
.
(2)随机变量的可能取值为2,3,4.
,,,
随机变量的分布列为
2
3
4
所以随机变量的期望为.
3. (2026·海南部分学校·联合调研)竹竿舞又称“跳竹竿”,是人在两竹竿滑动相撞的空隙中跳动的一种娱乐活动.2005年,黎族的竹竿舞被确定为海南省非物质文化遗产,2006年,竹竿舞入选“国家级非物质文化遗产保护名录”,甲、乙两名游客组队参加了海南某文化旅游区举办的竹竿舞闯关活动,该活动总共分为三关:第一、二关均为单人独舞(第一关和第二关闯关的人不相同),第三关为两人共舞.已知甲、乙闯过第一关的概率分别为,闯过第二关的概率分别为,这支队伍闯过第三关的概率为0.5.活动规定:只有闯过前一关,才有资格闯关后一关.
(1)请以这支队伍闯过前两关的概率为依据,为甲、乙安排第一关和第二关的闯关顺序,并求此时这支队伍闯过前两关的概率;
(2)以在(1)中安排的闯关顺序为准,记这支队伍闯过的关数为,求的分布列与期望.
【答案】(1)甲闯第一关,乙闯第二关,此时这支队伍闯过前两关的概率为
(2)
0
1
2
3
0.2
0.32
0.24
0.24
【详解】(1)若甲闯第一关,乙闯第二关,则这支队伍闯过前两关的概率为,
若乙闯第一关,甲闯第二关,则这支队伍闯过前两关的概率为,
由于,则应该安排甲闯第一关,乙闯第二关,此时这支队伍闯过前两关的概率为.
(2)由(1)知,安排甲闯第一关,乙闯第二关,而的可能取值为,
则,,
,,
所以的分布列为:
0
1
2
3
0.2
0.32
0.24
0.24
则.
4. (2026·安徽临泉·模拟)某校为庆祝建校百年,学校组织建校百年校友体育赛,赛事间隙举行了一次有关三大球类运动的知识竞赛,海量题库中篮球、足球、排球三类相关知识题量占比分别为.甲校友回答篮球、足球、排球这三类问题中每个题的正确率分别为.
(1)若甲校友在该题库中任选一题作答,求他回答正确的概率;
(2)若甲校友从这三类题中各任选一题作答,每回答正确一题得3分,回答错误得分.设该校友回答三题后的总得分为分,求的分布列及数学期望;
(3)知识竞赛规则:随机从题库中抽取道题目,答对题目数不少于道,即可获得奖励.现以获得奖励的概率大小为依据,若甲校友在和之中选其一,则他应如何选择?并说明理由.
【答案】(1)
(2)分布列见详解,
(3),理由见详解
【分析】(1)根据全概率公式即可求解,
(2)根据概率乘法公式求解概率,即可求解分布列和期望,
(3)对和求解对应的概率,利用作差法比较大小即可求解.
【详解】(1)设“甲校友所选的题目回答正确”,“所选的题目为篮球相关知识的题目”,
“所选的题目为足球相关知识的题目”, “所选的题目为排球相关知识的题目”,
则,且两两互斥.
根据题意得,,,,
则,
所以甲校友在该题库中任选一题作答,他回答正确的概率为.
(2)的可能取值为,
,
,
,
,
则的分布列为:
-3
1
5
9
所以.
(3)当时,为甲校友答对题目的数量,
由题意可知,其中,
故当时,甲校友获得奖励的概率,
当时,甲校友获得奖励的情况可以分为如下情况:
①前8题答对题目的数量大于等于5,
②前8题答对题目的数量等于4,且最后2题至少答对1题,
③前8题答对题目的数量等于3,且最后2题全部答对,
故当时,甲校友获得奖励的概率,
所以,
因为,所以,即,所以甲校友应选.
🎯命题方向二 条件概率与全概率公式
5. (2026·河南焦作一模)有甲、乙两个不透明的袋子,甲袋中有8个红球、2个黄球,乙袋中有9个红球、3个黄球.
(1)若从甲袋中随机一次性取出2个球,其中红球的个数为,求的分布列与数学期望;
(2)先从甲、乙两个袋子中任选一个袋子,再从所选的袋子中随机一次性取出2个球,若已知取出的2个球都是红球,求这2个球来自乙袋的概率.
【答案】(1)
0
1
2
(2)
【分析】(1)由题意,的所有取值为,分别求出对应的概率即可得到分布列,再根据期望的公式求解即可;
(2)设事件为“选中乙袋”,事件为“从袋子中随机一次性取出的2个球都是红球”,根据全概率公式先求得,再根据条件概率公式求解即可.
【详解】(1)由题意,的所有取值为,
则,,,
所以的分布列为:
0
1
2
则.
(2)设事件为“选中乙袋”,事件为“从袋子中随机一次性取出的2个球都是红球”,
由题意得,,
则,
所以.
6. (2026·陕西咸阳·模拟)2026年央视马年春晚节目《武BOT》将传统武术与现代科技完美融合,“人机共武”完成了棍术攻防、醉拳互动、双节棍对练及极限空翻等高难度表演动作,不仅展示了我国人工智能技术的飞速发展,也体现了科技赋能传统文化的实践创新,其中高空弹射空翻转体完成后,稳准落地让人震撼.研究人员将机器人极限空翻动作划分为空翻转体和稳准落地两个环节,在空翻转体环节中,每个机器人完成空翻转体的概率均为0.9;在落地环节,机器人的表现存在差异:若空翻转体完成,则稳准落地的概率为0.8;若空翻转体未完成,则稳准落地的概率为0.1.在极限空翻这个表演中,假设每个机器人完成动作互不影响.
(1)如果随机抽取3个机器人,记为完成空翻转体的机器人人数,求的分布列及数学期望;
(2)如果随机抽取一个机器人,已知其稳准落地,求其空翻转体完成的概率.
【答案】(1)的分布列为:
0
1
2
3
0.001
0.027
0.243
0.729
数学期望为 2.7 (2)
【分析】(1)分析可知,利用二项分布求分布列和期望即可;
(2)设相应事件,利用全概率公式可得,结合条件概率公式运算求解.
【详解】(1)由题意可知:,则有:
;;
;;
则的分布列为:
0
1
2
3
0.001
0.027
0.243
0.729
数学期望为.
【详解】(2)设事件为“一个机器人空翻转体完成”,事件为“一个机器人稳准落地”.
则,,,,
由全概率公式可得:,
所以.
7. (2026·江西吉安3月·模拟)某校社团举行“网络安全”知识竞赛,规则如下:每位选手需要独立完成3道题目,答对一题得2分,答错一题得分,3道题目累加得分多者获胜,甲、乙两位同学报名参加比赛,两人分别独立答题,互不影响,若甲、乙正确回答每道题的概率分别为、.
(1)求比赛结束后甲得3分的概率;
(2)已知在甲获胜的前提下,乙恰好得3分的概率为,求的值.
【答案】(1)
(2)
【分析】(1)首先确定甲得3分的事件为答对2题,答错1题,根据二项分布概率公式求解;
(2)首先分别求甲和乙得分的分布列,再求甲获胜的概率,最后代入条件概率公式,求解概率.
【详解】(1)设“比赛结束后甲得3分”为事件,则;
(2)记“比赛结束后甲获胜”为事件,记“比赛结束时乙恰好得3分”为事件,
设甲的得分为,则,
,,
设乙的得分为,的可能取值为,,,,则
,,
,,
,又,
所以,解得
8. (2026·安徽皖北协作区·联考)某市高三学生学习强度指数Q的概率分布情况如下表所示.
学习强度指数Q
概率
0.2
05
0.3
应对情况
轻松应对
勉强应对
困难应对
(1)从该市随机选取3名高三的学生,记学习强度指数的人数为X,求及X的数学期望.
(2)定义为在事件M发生的条件下事件N发生的优势.记事件“该学生学习有压力”(勉强应对和困难应对都被认为是学习有压力,轻松应对被认为是学习无压力),事件“该学生困难应对”,求在事件A发生的条件下事件B发生的优势.
【答案】(1),的数学期望为;
(2);
【详解】(1)由表可知,学习强度指数的概率为:
,
从该市随机选取名学生,记学习强度指数的人数为,则服从二项分布,
所以;
的数学期望为:;
(2)由题意可知,事件为“该学生学习有压力”,事件为“该学生困难应对”.
,,
因事件包含于事件中,所以,
在事件发生的条件下事件发生的概率为:,
在事件发生的条件下事件发生的概率为:,
所以在事件发生的条件下事件发生的优势为:.
9. (2026·广东河源3月·质量检测)湘绣,是中国优秀的民族传统工艺之一,有着两千多年的历史.湘绣的制作工艺繁杂,一幅湘绣作品要经过设计图案和刺绣两大主要环节,且只有设计图案通过后才能进行刺绣,两个环节相互独立.只有同时通过这两个环节才能成为成品.某绣坊准备制作三幅不同的湘绣作品,已知三幅作品通过设计图案环节的概率依次为,通过刺绣环节的概率依次为.
(1)求三幅中恰有一幅作品通过设计图案环节的概率;
(2)若已知三幅中恰有一幅作品通过设计图案环节,求通过的作品为的概率;
(3)经过设计图案和刺绣两个环节后,三幅作品成为成品作品的件数为.求随机变量的分布列及数学期望.
【答案】(1)
(2)
(3)分布列见详解,
【分析】(1)由概率乘法公式进行求解;
(2)由条件概率公式求解;
(3)记三幅作品成为成品的事件分别为,则,由可取,求出对应的概率,列出分布列即可求解数学期望.
【详解】(1)记三幅作品通过设计图案环节分别为事件,记三幅中恰有一幅作品通过设计图案环节为事件,
则.
(2).
(3)记三幅作品成为成品的事件分别为,
则,
由可取,
则,
,
,
,
则的分布列为
0
1
2
3
则数学期望.
10. (2026·安徽合肥3月·质量检测)某公司研发了一种智能语音客服系统,在测试时,当语音输入的问题表达清晰时,智能语音客服的回答被采纳的概率为,当语音输入的问题表达不清晰时,智能语音客服的回答被采纳的概率为.已知语音输入的问题表达清晰的概率为,且智能语音客服每次回答是否被采纳相互没有影响.
(1)求智能语音客服的回答被采纳的概率;
(2)在某次测试中输入了4个问题,设表示智能语音客服的回答被采纳的次数,求的分布列、数学期望和方差.
【答案】(1)
(2)分布列见详解,3,
【分析】(1)设出基本事件并求出概率,再利用全概率公式求解即可.
(2)结合题意得到,再求出对应取值概率,进而得到分布列和数学期望即可.
【详解】(1)设表示事件“智能语音客服的回答被采纳”;表示事件“语音输入的问题表达清晰”,
由题意可知,,
所以,
即智能语音客服的回答被采纳的概率为.
(2)依题意得,的所有可能取值为,且.
所以
所以的分布列为
0
1
2
3
4
11. (2026·江苏南京市六合区名校联盟第一次·调研)有N个人需要通过血液检测某种酶是否存在.假设每个人血液中含有该酶的事件是相互独立的,且含有该酶的概率均为,若血液检测始终能准确判断样本中该酶是否存在.现采用以下分组检测方法:将待检测人群分成r个小组,每组人.在每一组中,取每人的血液混合成一个样本进行检测.
若某组的混合样本检测结果呈阴性(不含酶),则该组内所有人员无需再进行后续检测.
若某组的混合样本检测结果呈阳性(含有酶),则需要对该组内的每一位成员再分别单独检测一次(不用采集血样,利用现有采集过的血样).
(1)若,,已知某小组的混合样本检测结果呈阳性,求该组内“恰有2人”血液中含有该酶的概率;
(2)用N,k,p表示该方法所需检测次数的期望值;
(3)设检测成本由两部分组成:采集处理血样成本为a元/人份,化验检测成本为b元/次.若,每组人数,且该方法的总成本期望值比“逐一检测”的总成本节省了50%以上,求的取值范围.(参考数据:)
【答案】(1)
(2)
(3)
【分析】(1)设小组中有酶的人数为X,依题意,可知,分别求出与,利用条件概率公式即可求出恰有2人有酶的概率;
(2)设每组检测次数,则易得,求出其分布列和数学期望,进而可求得总检测次数的期望;
(3)利用(2)中若分组检测,由检测次数的期望求得总成本期望,若逐一检测,则总成本为,依题意,代值计算即得的取值范围.
【详解】(1)设小组中有酶的人数为X,则.
已知混合样本阳性,即,则恰有2人有酶的概率为
.
(2)设每组检测次数,则的分布列为
1
p
期望为
则总检测次数的期望;
(3)若分组检测,检测次数的期望为.总成本期望,
若逐一检测,则总成本.由节省50%以上得.
代入,,,得,
整理得,因此,,故的取值范围是.
12. (2026·山东德州·一模)在某工厂的产品质量检测中,设随机变量表示从一批产品中随机抽取的不合格产品数量.已知抽取到个不合格产品的分布列为:
0
1
2
3
每个不合格产品需要进行返工处理,返工成功(即将不合格产品修复为合格产品)的概率均为,且各个产品返工是否成功相互独立.事件表示抽取的产品中有个不合格产品(),事件表示抽取的产品中返工成功的数量比返工失败的数量多.
(1)若,求,并根据全概率公式求;
(2)是否存在值且,使得,请说明理由.
【答案】(1),
(2)不存在,理由见详解
【分析】(1)利用所给分布列,根据概率之和为1求出,再由条件概率公式及全概率公式求解即可;
(2)根据分布列由期望公式求出得出方程,令,再由导数判断函数的最大值小于0,即可判断方程无解.
【详解】(1)当时,,
则,解得,
由题意,得,,.
由全概率公式,得
.
(2)假设存在,使,又.
得,化简得,即
令则
因为,所以在上存在,使得
所以即
且在为正,在为负从而在为增函数,在为减函数
所以当时,,即不存在值,使得.
🎯命题方向三 贝叶斯公式的应用
13. (2026·辽宁大连·二调)欲从A,B两个频道中选出一个优选频道作为校园之声广播,现对这两个频道轮流播放进行测试,每次播放一个频道.已知A频道每次播放成功的概率为,B频道每次播放成功的概率为,且每次播放互不影响.
约定1:任选一个频道进行播放,若播放成功,便成为优选频道;
约定2:从A频道开始播放,先成功播放的频道为优选频道,当决定出优选频道或两频道都播放3次均失败,结束测试.
(1)按照约定1,求在播放一次就成功的条件下,A频道成为优选频道的概率;
(2)按照约定2,
(i)两个频道共播放不超过4次时,求A频道成为优选频道的概率;
(ii)测试结束时,求B频道播放次数的分布列与数学期望.
【答案】(1)
(2)(i);(ii)分布列见详解,数学期望为
【分析】(1)按照贝叶斯公式直接计算即可;
(2)(i)按照播放次数分情况求解;(ii)写出的所有可能取值并计算所对应的概率,然后列出分布列,计算即可.
【详解】(1)设“任选一个频道播放,该频道是A频道”为事件,“任选一个频道播放,该频道是B频道”为事件,“任选一个频道播放一次,该频道播放成功”为事件,
所以,,
在播放一次就成功的条件下,A频道成为优选频道的概率为.
(2)(i)播放1次A频道成为优选频道的概率为,
播放3次A频道成为优选频道的概率为,
所以按照约定2,两个频道共播放不超过4次时,A频道成为优选频道的概率为.
(ii)的所有可能取值为0,1,2,3,
,
,
所以的分布列为:
0
1
2
3
所以数学期望为.
14.(2026·甘肃陇南·二诊) 托马斯.贝叶斯(ThomasBayes)在研究“逆向概率”的问题中得到了一个公式:设,是一组两两互斥的事件,,且,,则对任意的事件,有.这个公式被称为贝叶斯公式(贝叶斯定理).其中称为事件的全概率.
(1)假设这3台车床型号相同,它们各自独立工作,且发生故障的概率都是0.3,设同时发生故障的车床数为随机变量,求的分布列和数学期望;
(2)假设该车间生产了两箱零件,第一箱内装有10件,其中有2件次品;第二箱内装有20件,其中有3件次品.现从两箱中等可能地随机挑选一箱,然后从该箱中随机取一个零件.已知取出的是次品,求它是从第二箱中取出的概率.
【答案】(1)
0
1
2
3
0.343
0.441
0.189
0.027
期望
(2)
分析】(1)由题意确定服从二项分布,即可求解;
(2)设“任取一个零件为次品”“零件是从第箱取出的”,由全概率公式求得,再由贝叶斯公式即可求解.
【详解】(1)设,由题意知:
所以的分布列为
0
1
2
3
0.343
0.441
0.189
0.027
.
(2)设“任取一个零件为次品”,
“零件是从第箱取出的”,则且,
由题意知:,,
由全概率公式:,
由贝叶斯公式知:.
题型04 变量的相关关系与回归分析
抓关键·破难点
当经验回归方程不是形如时的转化技法:
非线性经验回归方程
变换公式
变换后的线性经验回归方程
刷经典·通方法
🎯命题方向一 线性回归方程的求解、拟合与预测
1. (2026·安徽池州质量·监测)某同学为养成锻炼习惯,使用智能手环记录自己连续五天行走步数,设日期顺序变量x(为第一天),y(单位:千步)为对应日期的步数,具体数据如下表:
日期顺序(天)
1
2
3
4
5
步数y(千步)
6.2
6.8
7.6
8.4
9.0
(1)求y关于x的经验回归方程;
(2)利用(1)中的回归方程,预测该同学第7天的步数能否达到一万步.
附:经验回归方程,其中,
【答案】(1)
(2)预测该同学第7天的步数能达到一万步
【分析】(1)利用最小二乘估计可求得经验回归方程;
(2)令,代入回归方程求解即可.
【详解】(1),
,所以
又过,所以
所以关于的经验回归方程为
(2)令,得(千步)因为10.48千步等于1.048万步
所以由(1)中的回归方程,预测该同学第7天的步数能达到一万步
2.(2026·江苏南京·一模) 为研究昼夜温差(单位:)与某植物种子当日的百粒发芽数(单位:粒)之间的关系,实验室记录了6天的每日昼夜温差与种子当日的百粒发芽数,如下表所示:
日期编号
1
2
3
4
5
6
温差
9
13
11
15
10
14
百粒发芽数
23
28
26
31
25
29
(1)根据表中的数据,计算样本相关系数(精确到0.01);
(2)求百粒发芽数关于温差的经验回归方程,并估计昼夜温差为时,这种植物种子当日的百粒发芽数.
参考公式:相关系数,,,
参考数据:,,,.
【答案】(1)
(2),
【分析】(1)根据条件,直接计算,即可求解;
(2)根据条件,直接求出,即可求出线性回归方程,再将代入,即可求解.
【详解】(1)相关系数.
(2)由题意得,,
所以,,
所以所求的经验回归方程是,
当时,,
故当昼夜温差为时,这种植物种子当日百粒发芽数为.
3. (2026·浙江强基联盟·联考)2025年11月,全国多地中小学推行“秋假”政策,直接带动旅游市场热度.某景点为科学定价、吸引更多中小学生游客,选取拟定价格开展门票定价试运行,相关数据如下表所示:
门票价格x(元/人)
40
50
60
70
80
日游客人数y(千人)
18
17
13
7
5
(1)已知y与x具有线性相关关系,求出y关于x的经验回归方程;
(2)为了扩大景区知名度与客流吸引力,景区将门票定价为10(元/人),并计划做广告宣传.由前期调查可知,当日均广告费为千元时的日游客人数为千人,其中y是当门票为10(元/人)时,根据(1)中的经验回归方程所预测的日游客人数.求景区的日均广告费用为多少千元时才能使日门票净收入最大.(日门票净收入=票价×日游客人数-日均广告费)
参考公式:经验回归方程,.
【答案】(1)
(2)当门票定价为10元时,日广告费用为4千元时门票净收入最大
【分析】(1)根据公式求得,可求得y关于x的经验回归方程;
(2)设门票净收入为,结合(1)可得,进而利用,可求解.
【详解】(1)由题意得:,,
,,
,,关于x的经验回归方程为.
(2)设门票净收入为,则,由(1)时,,
故,
若要使最大,则,代入可得,又因为,故,
所以当门票定价为10元时,日广告费用为4千元时门票净收入最大.
4. (2026·山东聊城·一模)某景区统计了连续5天该景区接待游客的人数(单位:万人),数据如下表:
第x天
1
2
3
4
5
接待游客人数y(万人)
22
2.6
3.1
5.2
6.9
(1)根据表中数据,求y关于x的经验回归方程,并预测第7天该景区接待游客的人数;
(2)该景区上山、下山各有步行和乘观览车两种方式.调查显示,游客选择步行和乘观览车上山的概率分别为,,步行上山的游客下山时继续选择步行的概率为,乘观览车上山的游客下山时继续选择乘观览车的概率为.假设游客之间选择上山、下山的方式互不影响,现从该景区出口随机选取4位下山的游客了解其下山方式,记X为这4人中步行下山的游客人数,求X的分布列和期望.
附:参考数据:,,.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,.
【答案】(1);8.8万人.
(2)分布列见详解,数学期望为3.
【分析】(1)利用最小二乘法公式求出回归直线方程,再估计第7天该景区接待游客的人数;
(2)由全概率公式计算,利用二项分布计算概率,列出分布列,由公式计算期望和方差可得.
【详解】(1)由题,又,,,,
所以 ,
因此关于的经验回归方程为,
将代入回归方程得,即预测第7天接待游客人数为8.8万人.
(2)设事件为“游客步行下山”,事件为“游客步行上山”,事件为“游客乘观览车上山”,
根据全概率公式可得每位游客步行下山的概率为,
所以由题意,的可能取值为
,,
,,
,
因此的分布列为:
0
1
2
3
4
所以期望为.
5. (2026·江苏扬州适应性·调研测试)某高中数学兴趣小组,准备利用所学知识研究成年男性的臂长与身高之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:
159
165
170
176
180
67
71
73
76
78
(1)根据上表数据,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程(系数精确到0.01);
(3)从5名样本成年男性中任取2人,记这2人臂长差的绝对值为,求.
参考数据:
【答案】(1)说明见详解
(2)
(3)
【分析】(1)利用相关系数的计算公式即可得解;
(2)利用已知数据和公式得到关于的线性回归方程;
(3)根据已知条件求出随机变量X的取值,利用古典概型的概率公式计算随机变量取值相应的概率,再利用离散型随机变量的期望公式即可求解.
【详解】(1)由表中的数据和参考数据得,,,,
,
,,
∴.
因为y与x的相关系数近似为0.997,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.
(2)由及(1)得,
,所以y关于x的回归方程为.
(3)X的取值依次为2,3,4,5,6,7,9,11,
,,,
,,,
,,
X的分布列
X
所以.
6. (2026·江苏扬州市第一次·调研)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
【答案】(1),很强的线性正相关关系
(2)
X
80
150
210
P
【详解】(1)由题意,,,
则,
由,
同理,
则,
则,
由接近1且为正,故变量x与y之间有很强的线性正相关关系.
(2)由题意,X的可能取值为80、150、210,
则,,,
故X的分布列为:
X
80
150
210
P
则.
🎯命题方向二 非线性回归的转化与应用
7. (2026·江苏省南京市栖霞区名校联盟·一模)在“M型无人机”物流配送场景中,无人机的载重(单位:kg,)会直接影响其每千米能耗(单位:Wh/km,Wh为电能单位).某技术团队对该无人机进行载重测试,得到如下实验数据:
载重(kg)
0
1
4
9
16
每千米能耗(Wh/km)
2
7
12
17
22
为精准预测不同载重下的每千米能耗,现有以下三种模型供选择:
①,②,③.
(1)选出你认为最符合实际的函数模型,说明理由,并求出其函数解析式;
(2)若该无人机电池容量为300Wh,飞行环境、飞行参数控制不变.根据(1)中所得的函数模型,
(i)某单程配送任务要求该无人机飞行20km,且载重9kg,判断该无人机是否能完成本次配送任务,并说明理由;
(ii)若该无人机执行往返配送任务,去程与返程均需飞行(单位:km),去程载重25kg,返程空载,且往返总能耗不大于电池容量的,求的最大值.
【答案】(1)选择模型为,理由见详解,
(2)(i)不能,理由见详解(ii)9km
【分析】(1)先根据定义域和单调性要求筛选出函数模型③,把已知点代入模型求出、的值,检验其余点是否在所得函数图象上确定解析式.
(2)(i)计算载重9时飞行20km能耗并与300比较判断能否完成任务.
(ii)先算出载重25时总能耗表达式,再根据能耗限制列不等式求解的最大值.
【详解】(1)选择函数模型③.理由如下:依题意可知,所选的函数模型必须满足两个条件:
一是函数定义域为;二是“每千米能耗”随着“载重”的增多而增大.
因为模型①的定义域不可能为,所以不符合:因为模型②是单调递减函数,所以不符合;
因为模型③在有意义,且当时,单调递增,符合题意,故应选择模型为.将点(0,2),(1,7)代入得,解得,
所以.经检验,点(4,12),(9,17),(16,22)都在函数的图象上,
所以所求的函数解析式为,且当时,表示空载能耗.
(2)由(1)得.(i)依题意,得,
所以该无人机不能完成本次配送任务.
(ii)依题意,得,所以,解得,
所以的最大值为9km.
8. (2026·广东深圳中学·阶段测试)某市近6年的新能源汽车保有量数据如下表
年份代号x
1
2
3
4
5
6
保有量y(万辆)
1
1.8
2.7
4
5.9
9.2
(1)从这6年中任意选取2年,在已知至少有1年的新能源汽车保有量大于3万辆的前提下,求这2年的新能源汽车保有量全都大于3万辆的概率;
(2)用函数模型对变量x,y关系进行拟合,根据表中数据求出y关于x的回归方程(参数d的估计值精确到0.01).
参考数据:,,,;
设,,
参考公式:回归直线的斜率和截距的最小二乘估计公式分别为:,
【答案】(1)
(2)
【分析】(1)先确定保有量大于3万辆的年份数量,用对立事件求至少1年大于3万辆的概率,再结合2年都大于3万辆的概率,通过条件概率公式计算结果;
(2)将非线性回归模型取对数转化为线性回归模型,利用给定数据计算斜率和截距,再还原得到原模型的参数.
【详解】(1)保有量大于3万辆的年份有第4,5,6年,共3年,
保有量不大于3万辆的年份有第1,2,3年,共3年,
设至少有1年保有量大于3万辆为事件,2年保有量全都大于3万辆为事件,
事件的对立事件为2年都不大于3万辆,总选法有,
两年都不大于3万辆的选法为,所以,
两年都大于3万辆的选法为,所以,则.
(2)已知模型,两边取对数得,
令,则,即转化为线性回归方程,
其中,由题意得,
则,
,
因为,所以,则.
9.(2026·云南民族大学附属高级中学·适应性训练)近年来,我国新能源汽车发展势头迅猛.为支持绿色出行,某市近年来加速公共充电桩建设,研究人员记录了某品牌新型充电桩投入运营后前6周的周均单桩服务车辆数(单位:辆),数据如下所示.
第周
1
2
3
4
5
6
周均单桩服务车辆数
20
30
45
67
99
148
为分析其增长趋势,令.经初步计算,已知,,.
(1)写出关于的指数回归方程;(其中,为常数,为自然对数的底数,的计算结果保留两位小数)
(2)调查显示,使用该充电桩的车主中,随机抽取1人会参与“低碳积分”活动的概率为0.3.现随机独立抽取5名车主,求恰好有2人参与该活动的概率.
附:记一组点,…,通过最小二乘估计所得的经验回归方程为,其中,.
【答案】(1)
(2)
【分析】(1)将原指数方程可转化为线性回归方程:,结合经验回归方程的公式求解即可;
(2) 设事件为“恰好有2人参与该活动”,利用即可求解.
【详解】(1)令,则原指数方程可转化为线性回归方程:,
即,其中,由,,,
可得,
,,
所以,,所以,
由得,则关于的指数回归方程;
(2)设事件为“恰好有2人参与该活动”,
所以.
🎯命题方向三 回归模型的拟合效果评价
10. (2026·广东广州市天河区适应性训练·二模)某公司为了了解A商品销售收入(单位:万元)与广告支出(单位:万元)之间的关系,现收集的5组样本数据如下表所示,且经验回归方程为.
2
5
6
8
9
16
20
21
28
10.96
19.24
22
27.52
30.28
(1)求的值;
(2)现从这5组数据的残差中抽取2组进行分析(观测值减去预测值称为残差),记X表示抽到数据的残差为负的组数,求X的分布列和期望;
(3)已知,且当时,回归方程的拟合效果良好,试结合数据,判断经验回归方程的拟合效果是否良好.
【答案】(1)
(2)分布列见详解,
(3)经验回归方程的拟合效果不良好
【分析】(1)求出根据回归直线必过样本中心点求解即可;
(2)可能取值,求出对应概率,进而得到分布列和期望;
(3)求出代入公式,即可得到答案.
【详解】(1),,
因为,即,解得.
(2)5组数据中,两组数据残差为正值,三组数据残差为负值,所以可能取值为,
,,,
所以X的分布列为
0
1
2
期望.
(3),
,所以经验回归方程的拟合效果是不良好.
题型05 独立性检验问题
抓关键·破难点
“补、提、套、比、说”五步速解独立性检验问题
补:根据题干数据信息,补全列联表;
提:提出零假设:两个分类变量不相关;
套:套用公式计算;
比:查表找到,比较和的大小;
说:说明结论:如果,则不成立,即两个分类变量相关;如果,则成立,即两个分类变量不相关;
刷经典·通方法
1. (2026·云南曲靖·模拟)血脂高(高脂血症)可能导致动脉硬化、心脑血管疾病、胰腺炎等健康问题,长期血脂高会引发全身多器官损伤.某市医疗机构为了研究运动与血脂的关系,从本市成年人中采用随机抽样的方法抽取了150名市民,调查他们是否得高脂血症和平时运动的情况(每日进行30分钟以上中等强度的运动,且每周运动5天以上的为“运动者”,否则为“非运动者”).统计的部分数据如表.
运动情况
是否得高脂血症
合计
得高脂血症
未得高脂血症
“非运动者”
45
“运动者”
55
75
合计
150
(1)计算,的值,并依据的独立性检验,判断能否认为得高脂血症与不运动有关?
(2)该医疗机构采用分层随机抽样的方法从得高脂血症的成年人中随机抽取13人,并进行饮食方面的调查,然后从这13人中随机抽取2人作饮食指导,记这2人中“运动者”的人数为,求的分布列及数学期望.
附:,.
0.10
0.01
0.001
2.706
6.635
10.828
【答案】(1),,能认为得高脂血症与不运动有关
(2)的分布列为:
,数学期望为
【分析】(1)利用合计数据求出,,再代入公式计算,与临界值比较判断是否有关.
(2)先确定得高脂血症总人数,根据分层抽样求出抽样比,进而求解的分布列与期望.
【详解】(1)由题意可知:总样本数为,所以非运动者合计为,
因此,运动者合计为,则,
所以 ,
因为(对应的临界值),
依据的独立性检验,能认为得高脂血症与不运动有关.
(2)由(1)可知:得高脂血症总人数为人,
分层抽样抽取13人,抽样比为,
因此抽取的非运动者高脂血症患者为人,
运动者高脂血症患者为人,
表示抽取2人中运动者的人数,的可能取值为,则
,,,
所以的分布列为:
数学期望为:.
2. (2026·四川成都二模)国民体质是国家和社会发展的重要基础.为贯彻落实《“健康中国2030”规划纲要》《体育强国建设纲要》,2025年国家体育总局开展了第六次全国国民体质监测工作,旨在提高国民体质和健康水平,促进国家经济建设和社会发展.《国民体质测定标准(2023年修订)》将体质情况综合评级为优秀、良好、合格和不合格四个等级.某地区为了解国民体质情况是否与爱好运动有关,从该地区体质达到“合格”及以上的人群中随机抽取了人进行问卷调查,得到如下列联表:
体质情况
组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
(1)求的值,并依据小概率值的独立性检验,分析体质情况是否与爱好运动有关;
(2)在体质情况综合评级为“合格”的对象中,按是否爱好运动进行分层,用比例分配的分层随机抽样方法,从样本中抽取6人作进一步调查,再从这6人中随机抽取2人线下访谈,记这2人中“爱好运动”的人数为X,求X的分布列及数学期望.
附:,其中.
【答案】(1),体质情况与爱好运动有关.
(2)的分布列为:
0
1
2
.
【分析】(1)求出参数值并完善表格,根据公式计算的值后可得正确判断;
(2)先确定的所有可能取值,根据超几何分布计算概率后结合期望公式可求.
【详解】(1)由表中数据可得,表格完善如下:
体质情况
组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
设:体质情况与爱好运动无关,则,
根据依据小概率值的独立性检验,否定,故体质情况与爱好运动有关.
(2)易知名体质情况“合格”对象中有人爱好运动,人不爱好运动,
故的所有可能取值为0,1,2,
,,,
即所求分布列为
0
1
2
所以的期望.
3. (2026·宁夏银川·一模)某工厂有甲、乙两条生产线加工同一型号的产品,甲生产线加工的优品率为5%,乙生产线加工的优品率为6%,加工出来的产品混放在一起.已知甲、乙生产线加工的产品数分别占总数的51%,49%.
(1)任取一件产品,如果取到的产品是优品,计算它是甲生产线加工的概率;
(2)现对甲生产线升级改造,从改造前与改造后甲生产线加工的产品中分别随机抽取100件进行检验,数据如下:
优品
非优品
合计
改造前
5
95
100
改造后
15
85
100
合计
20
180
200
根据小概率值的独立性检验,能否认为生产线改造与优品有关联?
附:
0.05
0.01
0.001
3841
6.635
10.828
【答案】(1)
(2)有关联,证明见详解.
【分析】(1)结合题意根据全概率公式和贝叶斯公式计算求解(2)根据表格数据计算卡方,与临界值比较即可判断.
【详解】(1)设事件:任取一件产品为甲生产线加工,事件:任取一件产品为优品.
由题意得:,,,.
根据全概率公式,可得总优品概率:
根据贝叶斯公式,可得所求条件概率:
(2)由列联表得,总样本量,
代入卡方公式:
因为,所以有把握认为生产线改造与优品有关联.
4. (2026·陕西渭南中学·一模)人工智能技术(简称技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,并迅速在各行各业中得到应用和推广,教育行业也不例外.某市教体局为调查本市中学教师使用技术辅助教学的情况,随机抽取了该市120名中学教师,统计了他们一周内使用技术帮助制作课件的情况,并将一周内使用技术帮助制作课件的节次不少于4次的认定为喜欢使用技术,否则认定为不喜欢使用技术,经统计得到如下列联表.
年龄
是否喜欢使用技术
合计
是
否
不超过45岁
46
14
60
超过45岁
32
28
60
合计
78
42
120
(1)依据小概率值的独立性检验,能否认为该市中学教师是否喜欢使用技术与年龄有关;
(2)将频率视为概率,现从所抽取的120名中学教师中随机抽取一人,在抽中喜欢使用技术的教师的条件下,求此人年龄超过45岁的概率.
附:,其中.
0.1
0.01
0.001
2.706
6.635
10.828
【答案】(1)有关 (2)
【详解】(1)零假设该市中学教师是否喜欢使用技术与年龄无关,
而,
依据小概率值的独立性检验,推断不成立,
即认为该市中学教师是否喜欢使用技术与年龄有关.
(2)设事件为从所抽取的120名中学教师中随机抽取一人,抽中喜欢使用技术的教师,
事件为从所抽取的120名中学教师中随机抽取一人,此人年龄超过45岁,
由题意,,则.
5. (2026·黑龙江哈尔滨第三中学·一模)为了探究学生完成数学作业情况与成绩之间的联系,某学校采用按比例分层抽样的方式得到200名学生的测验成绩,样本中认真完成作业的学生成绩频率分布直方图如图1所示.若认为成绩不低于120分为优秀,且数学成绩为优秀的学生年级分布扇形图如图2所示,已知样本中高三年级有15位同学成绩为优秀,且在所有数学成绩为优秀的学生中,认真完成作业的学生占.
(1)求a的值,并且计算出样本中认真完成作业的学生成绩的下四分位数;
(2)根据样本数据完成下方列联表,依据小概率值的独立性检验,分析认真完成作业与成绩是否有关.
认真完成作业
不认真完成作业
成绩优秀
成绩不优秀
附:.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1),下四分位数
(2)有关
【分析】(1)利用频率分布直方图各组频率之和为的性质,列出方程求解参数值;再根据百分位数的定义,通过累计频率确定下四分位数所在的区间,并用插值法计算该分位数;
(2)根据分层抽样和条件概率完成列联表,再代入卡方公式计算检验统计量,与临界值比较以判断独立性;最后通过计算两组学生的优秀率并对比,进一步验证独立性检验的结论.
【详解】(1)根据频率分布直方图的性质,所有组频率和为,组距为,
因此:,解得:,
下四分位数即第百分位数,计算累计频率
频率,累计;频率,累计;
频率,累计;频率,累计。
,因此第百分位数在区间内,
计算得:下四分位数
(2)零假设:认真完成作业与成绩无关
认真完成作业
不认真完成作业
成绩优秀
成绩不优秀
,因为,
依据小概率值的独立性检验,零假设不成立,即认真完成作业与成绩有关,
该判断出错概率不超过0.001,
认真完成作业的学生中成绩优秀的频率为0.4,不认真完成作业的学生中成绩优秀的频率为0.1,
可以发现认真完成作业的学生成绩优秀的频率是不认真完成作业的学生的4倍,差异显著.
6. (2026·东北师大附中 哈尔滨师大附中 辽宁省实验中学第一次联合模拟考试)截至2025年底,我国新能源汽车保有量达到4397万辆,占汽车总产量的12%.某城市研究小组调查了300名汽车驾驶员对新能源汽车和燃油汽车的偏好程度,将调查结果整理成如下列联表.现统计得出样本中偏好燃油汽车的人数占样本总数的50%,女性驾驶员的样本占样本总数的,偏好燃油汽车的男性驾驶员的样本有120人.
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
女性驾驶员
合计
300
(1)请根据已知条件将上述列联表补充完整,并依据小概率值的独立性检验,分析对燃油汽车和新能源汽车的偏好是否与驾驶员性别有关联.如果有关联,解释它们之间如何影响.
(2)现从女性驾驶员中按对燃油汽车和新能源汽车的偏好用分层抽样法抽取8人做进一步访谈,然后从这8人中随机抽取3人填写调查问卷,记抽取的3人中偏好新能源汽车的人数为X,求X的分布列及数学期望.
参考公式及数据:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表为
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
100
220
女性驾驶员
30
50
80
合计
150
150
300
有关联,解释见详解, (2)随机变量的分布列为
0
1
2
3
期望为
【分析】(1)根据已知数据可计算得到补全列联表所需的数据,进而补全列联表,并计算得到,由此可得结论;
(2)根据分层抽样原则可确定样本中偏好新能源汽车的人数和偏好燃油车的人数,由此可得所有可能的取值,根据超几何分布概率公式可求得每个取值对应的概率,由此可得分布列;由数学期望计算公式可求得期望值.
【详解】(1)因为样本中偏好燃油汽车的人数占样本总数的50%,故样本中偏好燃油汽车的人数为,因为样本中女性驾驶员的样本占样本总数的,故样本中女性驾驶员的人数为,由题意,列联表补充如下:
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
100
220
女性驾驶员
30
50
80
合计
150
150
300
零假设为:对燃油汽车和新能源汽车的偏好与驾驶员的性别无关联.
根据列联表数据,计算得.
根据小概率值的独立性检验,可以推断不成立,即认为对燃油汽车和新能源汽车的偏好与驾驶员的性别有关联,此推断犯错误的概率不大于0.01.
男性驾驶员中偏好新能源汽车的频率为,女性驾驶员中偏好新能源汽车的频率为,前者明显小于后者.根据频率稳定于概率的原理,我们可以认为女性驾驶员偏好新能源汽车的概率更大.
(2)由题意,抽取的8人中偏好燃油汽车的人数为人,偏好新能源汽车的人数为人.
随机变量的可能值为0,1,2,3.
,,
,.
所以,随机变量的分布列为
0
1
2
3
的数学期望.
7. (2026·山东省聊城市·一模)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,女生的获奖率为,填写下列列联表,并依据小概率值的独立性检验,判断男生与女生的获奖情况是否存在差异?
性别
奖励
合计
获奖
未获奖
男
女
合计
附:,
【答案】(1),样本容量为
(2)
(3)列联表见详解,无
【分析】(1)由频率分布直方图中,所有矩形面积之和为可得的值,将第一组的容量除以第一组的频率可得出样本容量;
(2)将每个矩形底边的中点值乘以对应矩形的面积,相加可得出平均数;
(3)根据题意完善列联系表,结合临界值表可得出结论.
【详解】(1)由频率分布直方图中,所有矩形面积之和为可得,解得,样本容量为.
(2)所有参赛学生的平均成绩为.
(3)由题意可知,获奖人数为人,
由题意可得如下列联表
性别
奖励
合计
获奖
未获奖
男
女
合计
所以,,
所以,依据小概率值的独立性检验,男生与女生的获奖无差异.
8. (2026·齐齐哈尔·一模)中国的航天事业历经数十年的发展,已经形成了完整的航天技术体系,涵盖运载火箭、载人航天、深空探测等多个领域.为了了解不同学历人群对航天工程的关注情况,某社区随机调查了200位社区居民,得到如下数据(单位:人):
学历
关注
不关注
合计
本科及以上
80
20
100
本科以下
60
40
100
合计
140
60
200
(1)依据小概率值的独立性检验,能否认为对航天工程的关注情况与学历有关?
(2)现为了激发社区居民对航天工程的关注,该社区举办了一次航天知识闯关比赛,规则如下:
第一关:设置3道必答题,参与者需至少答对2道才能参与下一关答题,否则淘汰;
第二关:设置3道题,前2道题每答对1道奖励200元,答错即结束答题,奖励清零,2道题都答对可选择放弃答题,领取奖励,也可以选择继续答题(等可能的选择),第3道题答对奖励400元,答错前2道奖励减半,答题结束.已知甲参与闯关比赛,第一关答题的3道题每道题答对的概率均为,第二关答题的前2道题每道题答对的概率均为,第3道题答对的概率为,各题答对与否相互独立.
(i)求甲能进入第二关答题的概率;
(ii)已知甲进入第二关答题,从期望的角度,帮助甲分析是否挑战第3道题,使获取的奖金更多.
参考公式及参考数据:.
0.05
0.01
3.841
6.635
【答案】(1)能 (2)(i);(ii)当时,建议挑战第3道题;当时,挑战和不挑战第3道题都可以;当时,建议不挑战第3道题.
【分析】(1)计算,根据独立性检验的思想求解即可;
(2)(i)根据重复独立事件的概率公式计算对应概率即可;
(ii)分别计算不挑战第3道题,获得奖金的期望与挑战第三道题的获得奖金的期望,进而作差比较期望的大小判断即可.
【详解】(1)零假设为:对航天工程的关注情况与学历无关,
依据小概率值的独立性检验,推断不成立,即认为对航天工程的关注情况与学历有关.
(2)(i)记甲能进入第二关答题为事件,即3道题至少答对2道题,
所以
(ii)若确定不挑战第3道题,获得奖金为,的可能取值为0,400,
,
则的分布列为:
0
400
所以;若确定挑战第3道题,获得奖金为,的可能取值为0,200,800,
,,
则的分布列为
0
200
800
所以.令,
故当时,,建议挑战第3道题;
当时,,挑战和不挑战第3道题都可以;
当时,,建议不挑战第3道题.
题型06 概率统计与其他模块的融合交汇与创新问题
抓关键·破难点
一、概率中的状态转移问题(数列递推思想)
概率题中看到“个”“次"等,常为状态转移问题,用数列递推思想分3步求解.
第①步:找到当前状态的“前一次”状态下的所有可能情况及对应概率;
第②步:结合当前状态下事件的概率及“前一次”状态下事件的概率,得到数列递推关系;
第③步:利用数列递推关系求出数列的通项公式.
二、概率统计与数列融合
1.求通项公式:关键是找出概率或数学期望的递推关系式,然后根据构造法(一般构造等比数列),求出通项公式;
2.求和:注意是数列中的倒序求和、错位相减、列项求和;
利用等差、等比数列性质,研究单调性、最值或者求极限。
二、概率与函数、导数融合
(1)根据题目所求或题干给出的条件确定自变量及其取值范围;
(2)根据题意构建函数模型,写出函数的解析式;
(3)对构造的函数进行求导或利用函数单调性,求解目标函数的最值或最优解.
刷经典·通方法
🎯命题方向一 概率统计与数列的融合
1. (2026·甘肃省·一模)甲、乙两人各持有1张“欢”字卡片和1张“喜”字卡片,规定两人每次同时从对方手中随机抽取1张卡片交换(记为一轮操作).记轮操作后,甲手里有2张“欢”字卡片的概率为,甲手里有2张“喜”字卡片的概率为.
(1)求的值;
(2)求的值.
【答案】(1),,,
(2)
【分析】(1)利用独立事件的概率乘法公式,易得与的值,对于第二轮操作,需要分成“甲手中有2张“欢”字卡片或有2张“喜”字卡片”与“甲手中有1张“欢”字卡片和1张“喜”字卡片”两类情况分别求解即得与的值;
(2)类比(1)中的第二轮操作,可得,构造等比数列,求出其通项公式,再代值计算即得.
【详解】(1)第一轮操作,甲要抽到乙的“欢”字卡片,且同时乙要抽到甲的“喜”字卡片,甲手中才能有2张“欢”字卡片,
由独立事件的概率乘法公式,可得,同理;
第二轮操作中,若第一轮结束后,甲手中有2张“欢”字卡片或有2张“喜”字卡片,则在第二轮操作后,甲有2张“欢”字卡片的概率为0;
若第一轮结束后,甲手中有1张“欢”字卡片和1张“喜”字卡片,则甲有2张“欢”字卡片的概率为,
故,同理可得;
(2)由对称性可知,
而只有在次操作后,甲手中有1张“欢”字卡片和1张“喜”字卡片时,甲才有的概率在第次有2张“欢”字卡片,
若在次操作后,甲手中有2张“欢”字卡片或有2张“喜”字卡片,则在第轮操作后,甲有2张“欢”字卡片的概率为0,
所以当时,,化简得,
则可构造为,
所以是一个以为首项,以为公比的等比数列,
可得,所以,所以.
2. (2026·山西晋城·一模)甲、乙、丙三名同学进行传球游戏,有1个红球和1个绿球,每一轮中,持有球的人都将手中的球传出,若某人持有1个球,就将此球等可能地传给另外两人中的一人,若某人持有2个球,就在这一轮中将2个球分别传出,每个球都等可能地传给另外两人中的一人,2个球的去向互不影响,每个球一轮中只传递一次.游戏开始时,2个球都在甲手中.
(1)求2轮后2个球恰好都回到甲手中的概率;
(2)设轮后红球在甲手中的概率为,求;
(3)设轮后甲手中球的个数为的期望为,求.
【答案】(1)
(2)
(3)
【分析】(1)根据独立事件乘法公式计算可得结果;
(2)利用的递推关系可得,再由数列构造可得数列为等比数列,可求出;
(3)易知服从二项分布,可得,再利用等比数列前项和计算可求得结果.
【详解】(1)2轮传球后,红球回到甲手中的概率为,
由题意知,红球与绿球的传递相互独立,所以2轮传球后,绿球在甲手中的概率也是.
所以2轮传球后2个球恰好都回到甲手中的概率为.
(2)考虑红球在第轮到第轮的位置变化:
若第轮后红球在甲手中,则第轮后红球一定不在甲手中,若第轮后红球不在甲手中,无论球在乙和丙谁的手中,传回甲的概率均为,所以.
整理得,又,所以,
即(或写成);
(3)因为红球与绿球的传递相互独立,所以服从二项分布,
所以.
可得
.
3. (2026·湖北鄂州3月·质检)在区块链技术支持的加密资产网络中,设有两个智能合约钱包(甲钱包与乙钱包).每个钱包初始配置有1枚“黑币”(代表高波动性资产)与2枚“白币”(代表稳定资产).为平衡资产风险,系统执行如下自动交换协议:每次从两个钱包中各随机抽取一币,并交换存入对方钱包.记该协议重复执行次后,甲钱包中“黑币”的数量为,甲钱包中恰好有1枚“黑币”的概率为.
(1)求;
(2)证明:数列是等比数列,并求出数列的通项公式;
(3)求.
【答案】(1)
(2)证明见详解,
(3)1
【分析】(1)根据全概率公式可求;
(2)根据全概率公式构建递推关系后可得,利用构造法可证明是等比数列且可求的通项公式;
(3)根据题意可得,故可求.
【详解】(1)由题意得.
(2)当时,设有甲钱包恰有两枚“黑币”的概率为,
则没有“黑币”的概率为,
,
故.
又,故为等比数列,故,.
(3)由题的可能取值为0,1,2,其概率分布列为:
0
1
2
依题意,即.于是
故.
4. (2026·江苏南京市中华中学·模拟预测)小芳、小明两人各拿两颗质地均匀的骰子(点数为)玩游戏,游戏规则如下:每次由1人投掷手中的两颗骰子,在一次投掷后,若掷出的点数之和为4的倍数,则由原来投掷人继续投掷;若掷出的点数之和不是4的倍数,则由对方接着投掷.
(1)求小明在一次投掷后,掷出的点数之和是4的倍数的概率;
(2)规定第一次从小明开始,在游戏的前4次投掷中,设小芳投掷的次数为随机变量,求的分布列和均值;
(3)若第一次从小芳开始,求第次由小芳投掷的概率.
【答案】(1)
(2)分布列见详解,均值为
(3)
【分析】(1)根据古典概型概率求解即可;
(2)先分析小芳投掷的次数的所有可能的取值,然后求出分布列与数学期望即可;
(3)若第1次从小芳开始,则第次对小芳投掷骰子分两种情况讨论,然后结合互斥事件性质,以及数列的递推关系式分析求解即可.
【详解】(1)设事件为“小明投掷一次骰子后,点数之和为4的倍数”,
则基本事件为:,
,
,
总数为36,事件包含的基本事件有:,
共9个基本事件,所以.
(2)由(1)知小芳投掷一次后,出现点数之和是4的倍数的概率也为,
由题意知可取值为,则:
,
,
所以的分布列为:
0
1
2
3
数学期望为:.
(3)若第一次从小芳开始,则第次由小芳投掷骰子有两种情况:
第一种情况:第次由小芳投掷,第次继续由小芳投掷,其概率为,
第二种情况:第次由小明投掷,第次由小芳投掷,其概率为,
由于这两种情况彼此互斥,所以,
所以,且,所以是以为首项,为公比的等比数列,
所以,即.
5. (2026·山东淄博·模拟)甲口袋中装有3个红球,乙口袋中装有2个黄球和1个红球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复次这样的操作,记乙口袋中黄球个数为,恰有2个黄球的概率为,恰有1个黄球的概率为.
(1)求,和,;
(2)求的数学期望(用表示);
(3),若,有,求所有元素之和.
【答案】(1),,,
(2)
(3)
【分析】(1)结合独立事件乘法公式求出,再利用全概率公式求;
(2)利用全概率公式求得、与、的关系,再利用构造法证明等比数列,进而求出通项公式,列出的分布列,结合通项公式求出期望即可;
(3)根据题意将问题转化为集合中子集元素相加求和,结合错位相减求和即可.
【详解】(1)依题意,,,
,
.
(2)设表示次取球后乙口袋有2个黄球,表示次取球后乙口袋有1个黄球,
表示一次操作甲乙都取的是红球,表示一次操作甲取的是红球同时乙取的是黄球,
表示一次操作甲取的是黄球同时乙取的是红球,表示一次操作甲,乙都取黄球,
当时,
则,
,
,
,
因此,即,,
所以是为首项为公比的等比数列.
故.
依题意,的分布列为
0
1
2
故期望.
(3)由(2)知,
,
而所有元素之和可以看作集合中所有子集中元素之和.
设集合为一共有个不同的元素,
而一个包含的子集,对于剩下的个元素,
每个元素可以独立地选择“放入子集”或“不放入子集”,
因此对于剩下的个元素,每个都有2种选择,由乘法原理,这样的子集个数为,
由此可知一个所有子集中元素之和为该集合各个元素之和的倍,
故所有元素之和可写为,
令
所以
故,
所以.
故所有元素之和可写为.
🎯命题方向二 概率统计与函数、导数的融合
6. (2026·江苏南京市栖霞区名校联盟·一模)为促进消费,某电商平台和生产商在本周联合推出“有奖闯关”活动.活动规则如下:消费者成功闯过第一关获得基础券(获得10元基础券的概率为0.6,获得20元基础券的概率为0.4).闯过第一关后,可进行第二关闯关,成功闯过第二关后可获得进阶券20元,且这两种优惠券可叠加使用抵扣支付商品.已知消费者闯过第一关的概率为p₀,闯过第二关的概率为p.某生产商将商品定价100元,成本41元;优惠券成本由生产商承担基础券面额的30%,进阶券面额的50%.
(1)若,,记消费者购买一件该商品的实际支付金额为X(单位:元),求X的分布列和数学期望;
(2)设所有消费者均闯过第一关获得了基础券,推出活动后商品购买概率为,记生产商销售一件该商品的期望利润为(单位:元).(期望利润=购买概率×(支付金额的期望-商品成本)-优惠券成本的期望)
(ⅰ)求关于p的函数表达式;
(ⅱ)证明:在内存在唯一极大值点,并求当p为何值时,商家期望利润最大?最大期望利润是多少?(结果保留1位小数)
【答案】(1)分布列见详解,80.8
(2)(ⅰ);(ⅱ)证明见详解,时,商家期望利润最大,最大期望利润约为6.7元.
【分析】(1)依题意确定X的可能取值,并利用独立事件的概率乘法公式计算出对应的概率,列出分布列并计算出数学期望;
(2)(ⅰ)分别求出支付金额的期望与优惠券成本的期望,代入期望利润的公式,计算即得;(ⅱ)利用求导判断的单调性,即可证明在内存在唯一极大值点,进而求得期望利润的最大值.
【详解】(1)由题可知,X的可能取值为100,90,80,70,60,
,,
,,
.
分布列为:
X
100
90
80
70
60
P
0.2
0.24
016
0.24
0.16
数学期望为:.
(2)(ⅰ)∵期望利润=购买概率×(支付金额的期望-商品成本)-优惠券成本的期望,
则支付金额的期望为:
;
优惠券成本的期望为
.
∴
.
(ⅱ),令.解得,
当时,在上单调递增;
当时,在上单调递减;
∴在内存在唯一极大值点,又,
∴当时,商家期望利润最大,最大期望利润约为6.7元.
7. (2026·河北唐山·一模)某销售公司为了激励员工,对销售冠军——员工甲进行奖励,奖励方案为:在一个盲盒里,有n(足够多)张奖券,这些奖券的金额各不相等,其最大值为M,但金额具体是多少,并未公开.该员工甲需逐张随机抽取并查看金额,如果对抽取的奖券不满意就弃掉,继续抽奖(弃掉的奖券不能再抽取),如果对这张奖券比较满意就保留,从而停止抽奖,公司将以此奖券金额作为奖励.
(1)若甲抽取了两张,把第2张奖券保留下来,求甲获得最大金额奖励M的概率;
(2)若甲先抽取了k(,且)张奖券,记录下其中的最大金额为m,然后继续抽取,若抽到奖券的金额小于m,就继续抽,当抽到第i(,)张奖券时,其金额大于m,则保留该奖券,停止抽奖,若未抽到金额大于m的奖券,则保留第n张.
(ⅰ)若,当时,求甲获得最大金额奖励M的概率p;
(ⅱ)当调整k的取值时,甲获得最大金额奖励M的概率p也会发生变化.若,请估计p的最大值,并求此时k的值.
(估值参考:当时,,,,.)
【答案】(1);
(2)(i);(ii)所以的最大值约为0.3679,此时.
【分析】(1)合理设出事件,再根据全概率公式即可得到答案;
(2)(i)设:抽到的第张奖券金额为,再利用全概率公式求出概率通式,再代入即可;
(ii)根据估值参考公式得,再设函数,求导得其最值,从而得到的估计值,最后结合其整数范围即可得到答案.
【详解】(1)设抽到的第张奖券的金额为.
设甲获得最大金额奖励.
注意到.
则.
(2)(i)仍设:甲获得最大金额奖励,
若,则,故只需考虑的情况.
设:抽到的第张奖券金额为.
由于是随机抽取,抽到的每张奖券为最大金额的机会均等,则.
只有当是前张奖券中的最大金额,甲才会保留第张奖券,则.
则.
若,当时,.
(ii)由估值参考得,则.令,则.
当时,.当时,单调递增;
当时,单调递减,因此,当时,取得最大值.
此时,不是整数,
又,
所以最大值约为0.3679,此时.
8. (2026·黑龙江实验中学高三·联合模拟)近年来,全球数字化进程持续加速,人工智能(Artificial Intelligence,简称AI)已然成为科技变革的核心驱动力,有媒体称DeepSeek开启了我国AI新纪元.某地区随机调查了经常使用某AI工具的360名用户,统计他们的年龄,得到如下的统计表:
第一组
第二组
第三组
第四组
第五组
年龄
人数
30
150
90
60
30
(1)利用统计表中的数据试估计该AI工具用户的平均年龄;
(2)已知用分层随机抽样的方法,从上面360名用户中随机抽取了12人,现从这12人中随机抽取4人,记抽到第一组的人数为m,第二组的人数为n.设,求的分布列;
(3)已知该工具对某20个问题能准确答对其中的(,且)个.若从这20个问题中随机抽取10个对该工具提问,恰好答对3个问题的概率最大,求此时的取值.
【答案】(1)
(2)分布列见详解 (3)
【分析】(1)以每组数据的区间中点值为该组数据的代表值进行估算.
(2)先根据分层抽样的概念确定第一次抽取的12人样本中第一组和第二组的人数,进而得到的可能取值,求其概率,可得的分布列.
(3)先得到答对3题的概率,设,分析函数的单调性,求最大值的值.
【详解】(1)估计平均年龄为.
(2)由题意得,这12人中,年龄在第一组内的有(人),
年龄在第二组内有(人),
则的所有可能取值为0,1,2,3,4,
所以,,
,,
则的分布列为:
0
1
2
3
4
(3)从这20个问题中随机抽取10个对该工具提问,恰好答对3个问题的概率为,
设,由,且得,
所以,
显然,,
令,
当时,有,,即,
此时;
当时,有,,即,
此时,即,所以.
9. (2026·山东烟台诊·断性测试)某工厂生产一批产品,其单件产品的真实合格概率为.由于质检设备存在误差,当单件产品为合格品时,被该质检设备检测为合格的概率为,当单件产品为不合格品时,被其误判为合格的概率为,且.现从该批产品中随机抽取件,并用该质检设备进行检测,设每件产品的检测结果相互独立,检测结果为合格的件数为.
(1)求单件产品的检测结果为合格的概率;
(2)若为定值,求取最大值时的值;
(3)当足够大时,(2)中的近似服从.设,当时,试估计的最小值及相应的值.
说明:若,则,其中为的正态密度函数.参考数据:.
【答案】(1);
(2);
(3)最小值为19600,.
【分析】(1)因为单件产品检测合格包含真实合格且检测合格、真实不合格但误判合格两个互斥事件,所以用全概率公式计算,将两个事件的概率相加.
(2)因为服从二项分布,所以先写出的表达式,将其看作关于的函数,再利用求函数最值的方法,比如求导或者利用组合数的性质分析函数的单调性,找到取最大值时的值.
(3)因为近似服从正态分布,所以先将通过正态分布的标准化转化为标准正态分布的概率不等式,结合参考数据得到关于的不等式,再结合与、的关系,进而估计的最小值及相应的值.
【详解】(1)设“单件产品实际为合格品”为事件,“单件合格品检测为合格”为事件,“单件不合格品误判为合格”为事件,则由全概率公式知,
,
即单件产品的检测结果为合格的概率为.
(2)因为每件产品的检测结果相互独立,
所以件产品中检测结果为合格的件数服从二项分布.
当时,.
令,其中,则
令,得,且,
所以当时,,所以在上单调递增,
当时,,所以在上单调递减,
所以,当时,取得最大值.因此.
(3)由于为随机变量,由(2)可设.
且,所以.
因为,所以
所以,
将代入,整理得.
因为,所以,
由题知,近似服从,所以,故,
由参考数据,故,解得.
又,所以恒成立.
因为时,取得最大值19600.
所以的最小值为19600,此时.
10. (2026·福建福州·质量检测)甲、乙两个不透明的口袋内装有除颜色外大小质地完全相同的若干个小球,已知甲口袋有个红球和4个白球,乙口袋有个红球和2个白球.现在小明从甲口袋有放回地连续摸球2次,每次摸出一个球,然后再从乙口袋有放回地连续摸球2次,每次摸出一个球.
(1)当时.
(i)求小明4次摸球中,至少摸出1个白球的概率;
(ii)设小明4次摸球中,摸出白球的个数为X,求X的分布列和数学期望;
(2)当时,设小明4次摸球中,恰有3次摸出红球的概率为P,则当m为何值时,P最大?
【答案】(1)(i);(ii)分布列见详解,.
(2)时,P最大.
【分析】(1)(i)利用对立事件计算概率;(ii)根据题意计算概率,再分布列和求数学期望;
(2)列出概率,设,利用导数与单调性、最值得关系求解.
【详解】(1)(i)设事件:小明4次摸球中,至少摸出1个白球,
则.
(ii)由题可知,可能的取值为,
甲口袋每次摸到红球的概率为,每次摸到白球的概率为,
乙口袋每次摸到红球的概率为,每次摸到白球的概率为,
,
,
,
,
,
分布列如下,
0
1
2
3
4
所以.
(2)小明4次摸球中,恰有3次摸出红球的概率P,
因为,
所以,
令,则,
所以当时,;当时,;
所以函数在单调递增,单调递减,
所以当,即时,P最大,最大值为.
🎯命题方向三 概率统计与立体几何的融合
11.(2026·海南儋州第一次教学质量·诊断)如图,已知一个质点每隔相等时长,按随机方向,等可能地沿着正方体的棱从1个顶点移动到另1个顶点.设一个质点从顶点出发,第次运动后,质点回到点的概率为.
(1)求和;
(2)设第次运动后,质点移动到点的概率分别为、、.
①证明:,;
②求.
【答案】(1);;
(2)①证明见详解;②.
【分析】(1)通过质点在不同时间的移动路径来确定回到点的概率;
(2)①利用正方体对称性以及质点移动的概率关系即可证明等式;
②通过质点到达各点的概率关系,化简可得,通过对的取值进行奇偶讨论,即可求得.
【详解】(1)质点从出发,第1次运动有3个方向,即、、,概率均为,
第2次要回到,必须从第1次到达的顶点(、、)沿原路返回,每个顶点返回的概率为,
所以;
第3次运动要回到,第二次必须在与相邻的顶点(、、),
但第2次运动质点不可能出现在顶点、、,所以;
(2)①设第次到达,其概率为,则第次一定出现在与相邻的、、,每个顶点到达的概率均为,因为质点从出发,顶点与顶点为其对称点,
所以第次到达顶点的概率与第次到达顶点的概率相同,均为,
又质点第次到达顶点的概率为,所以;
同理,设第次到达,其概率为,则第次一定出现在与相邻的、、,每个顶点到达的概率均为,因为质点从出发,顶点与顶点为其对称点,
所以第次到达顶点的概率与第次到达顶点的概率相同,均为,
又质点第次到达顶点的概率为,
所以;
②根据①的计算,可得,,与,联立,
可得,化简整理得,即,
所以,又,,,,,
所以,, ,
当为偶数时,数列是首项为,公比为等比数列,
所以,即,
所以
,
当为奇数时,,,,,,,
所以,
即,所以,
所以当为偶数时,
,
所以当为奇数时,
,
综上所述,.
🎯命题方向四 概率统计与不等式的融合
12. (2026·湖北武汉3月·调研)有张编号分别为到的卡片,横向随机排列.对于这张卡片,初始状态下卡片标号从左到右为,,…,记此时的卡片排列为(,,…).对这张卡片的排列进行如下三步操作:1.取出最左边的卡片,记其标号为;2.剩余卡片中,标号小于的卡片按照原排列中的从左到右顺序依次为,,…(若不存在则为空),标号大于的卡片按照原排列中的从左到右顺序依次为,,…(若不存在则为空);3.对这张卡片重新排列,得到新排列:(,,…,k,,,…).每进行完上述三步操作,称为一次“完整操作”.
(1)若初始排列为,写出连续经过两次完整操作后得到的新排列;
(2)求初始排列经过一次完整操作后恰好能得到的顺序排列的概率;
(3)记初始排列中有个排列种数能经过连续若干次完整操作后能得到的顺序排列,当时,证明:.
【答案】(1)
(2)
(3)证明见详解
【分析】(1)根据题意,逐步对初始数列进行完整操作;
(2)分析初始排列的特点,计算出满足条件的排列种数与总排列数的比值;
(3)分析初始排列经过连续若干次完整操作后能得到的顺序排列的情况,通过对排列的构造和分析证明不等式.
【详解】(1)第一次完整操作:初始排列为,最左边的卡片标号,
可得标号小于卡片,,标号大于的卡片,
重新排列得到新排列,第二次完整操作:最左边的卡片标号,
可得标号小于的卡片, 标号大于的卡片,,,
重新排列得到新排列.连续经过两次完整操作后得到的新排列.
(2)要使初始排列经过一次完整操作后恰好能得到的顺序排列,必须满足:
,即原排列中小于的个元素已经是递增顺序;
,即原排列中大于的个元素已经是递增顺序;
首元素为时,剩余个位置由已经各自内部有序的和穿插而成,
确定中元素的位置可确定整个排列,共有种排法,又因为可以取遍中的任意整数,
所以满足条件的初始排列总数为.
又因为个元素的全排列总数为,
所以初始排列经过一次完整操作后恰好能得到的顺序排列的概率.
(3)对于任意操作所得的(,,…,k,,,…),由于后续操作取当前排列的最左侧的元素,其必然小于中的所有元素,因此作为整体,在后续操作中永远被划分在基准数的右侧,其内部元素的相对顺序不在改变.
要使排列经过连续若干次完整操作后能得到的顺序排列,必须满足:
本身必须是长度为个且能通过后续操作完成排序的排列,共有种;
必须是首次划分时已经是递增顺序;
首元素为时,穿插和的排法数为种排法,又因为可以取遍中的任意整数,
所以数列的递推公式为:,其中(规定),
根据递推公式,展开可得,
展开可得,
欲证明,即证,即,
等价于证明,对求和的任意一项,由于且,
则由组合数性质得,所以,
所以.
13. (2026·甘肃陇南二诊)现有一种不断分裂的细胞,每个时间周期内分裂一次,一个细胞每次分裂能生成一个或两个新的细胞,每次分裂后原细胞消失,设每次分裂成一个新细胞的概率为,分裂成两个新细胞的概率为;新细胞在下一个周期内可以继续分裂,每个细胞的分裂相互独立. 设有一个初始的细胞,在第一个周期内开始分裂,记个周期结束后,细胞的数量为,其中.
(1)若,求的分布列和数学期望;
(2)求;
(3)求证:.
【答案】(1)分布列见详解,
(2)
(3)证明见详解
【分析】(1)分别求出取所有可能的值时的概率,再列出分布列,求出数学期望即可;
(2)设细胞在第个周期时分裂为个细胞,之后一直有个细胞,先求出这一事件的概率,再求出的所有情况的概率,再求和即可.
(3)设细胞在第个周期时分裂为个新的细胞,这两个细胞在剩下的个周期中,其中一个分裂为个细胞,另一个一直保持分裂为个细胞,先求出这一事件的概率,再求出的所有情况的概率,再求和得到的解析式,再借助导数求出其最值即可得证.
【详解】(1)的可能取值为,
其中,,
,,
所以分布列为
;
(2)个周期结束后共有个细胞,则必在某一个周期结束后分裂成个细胞.
不妨设细胞在第个周期时分裂为个细胞,之后一直有个细胞,
此事件概率,
所以.
(3)个周期结束后共有3个细胞,设细胞在第个周期时分裂为个新的细胞,
这两个细胞在剩下的个周期中,其中一个分裂为个细胞,
另一个一直保持分裂为个细胞,此事件的概率
,
得,
,其中,.
令,,
记,,令,得.
当,,单调递增;当,,单调递减,
故,即.
🎯命题方向五 概率统计中的新定义问题
14. (2026·湖南常德·二模)泊松分布是一种统计与概率学里常见的离散型分布.若随机变量服从参数为的泊松分布(记作),则其概率分布为,其中为自然对数的底数.
(1)当时,泊松分布可以用正态分布来近似,当时,泊松分布基本上就等于正态分布,此时可认为.若,求的值;
(2)设,当且时,二项分布可近似看作泊松分布,即,其中.
某工厂生产电子元器件,次品率为,各元件是否为次品相互独立,记为产品中的次品数,按泊松分布近似计算.
(i)这1000件产品中恰有2件次品的概率;
(ii)求使得最大时的值.
(参考数据:;若,则有,,)
【答案】(1)
(2)这1000件产品中恰有2件次品的概率为,最大时的值为2或3
【分析】(1)根据正态分布求解相应区间的概率即可;(2)(i)根据题意将已知数据代入公式即可,(ii)根据最大时列不等式组求解即可.
【详解】(1)因为,
所以泊松分布基本上就等于正态分布,此时可认为,即.
所以,
由,得
,即.
(2)(i)由题意知,且,
又,所以二项分布可近似看作泊松分布,所以,
所以,即这1000件产品中恰有2件次品的概率为.
(ii)因为最大,所以,即,解得,
又,所以最大时的值为2或3.
94 / 94
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$