内容正文:
二项分布、超几何分布与正态分布
1.伯努利试验与二项分布
(1)伯努利试验:只包含 可能结果的试验叫做伯努利试验;将一个伯努利试验独立地重复进行n次所组成的随机试验称为 .
(2)二项分布:一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0<p<1),用X表示事件A发生的次数,则X的分布列为P(X=k)= ,k=0,1,2,…,n.如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布,记作 .
两个
n重伯努利试验
pk(1-p)n-k
X~B(n,p)
(3)两点分布
对于只有两个可能结果的随机试验,用A表示“成功”,表示“失败”,定义X=
如果P(A)=p,则P()=1-p,那么X的分布列如表所示,
X 0 1
P 1-p p
称随机变量X服从两点分布或0—1分布.
(4)两点分布与二项分布的均值、方差
①若随机变量X服从两点分布,则E(X)= ,D(X)= .
②若X~B(n,p),则E(X)= ,D(X)= .
p
p(1-p)
np
np(1-p)
微点拨 判断一个随机变量是否服从二项分布的两个关键点:
(1)在一次试验中,事件A发生与不发生,二者必居其一,且A发生的概率不变;
(2)试验可以独立重复进行n次.
微提醒 “恰好发生k次”与“有指定的k次发生”不同:恰好发生k次的概率为P=pk(1-p)n-k(k=0,1,2,…,n),有指定的k次发生的概率为
P=pk(1-p)n-k(k=0,1,2,…,n).
2.超几何分布
(1)一般地,假设一批产品共有N件,其中有M件次品.从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为
P(X=k)= ,k=m,m+1,m+2,…,r.其中,n,N,M∈N*,M≤N,n≤N,
m=max{0,n-N+M},r=min{n,M}.如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
(2)随机变量X服从参数为N,M,n的超几何分布,则E(X)=.
微点拨 超几何分布与二项分布的关系
不同点 联系
假设一批产品共有N件,其中有M件次品.从N件产品中随机抽取n件,用X表示抽取的n件产品中的次品数,若采用有放回抽样的方法抽取,则随机变量X服从二项分布,即X~B(n,p)(其中p=);若采用不放回抽样的方法抽取,则随机变量X服从超几何分布 二项分布和超几何分布都可以描述随机抽取n件产品中次品的分布规律,并且二者的均值相同.对于不放回抽样,当n远远小于N时,每抽取一次后,对N的影响很小,此时,超几何分布可以用二项分布近似
3.正态分布
(1)定义
若随机变量X的概率分布密度函数为f(x)=,x∈R,其中μ∈R,σ>0为参数,则称随机变量X服从 ,记为X~N(μ,σ2).
服从正态分布的随机变量是一种连续型随机变量
正态分布
(2)正态曲线的特点
①曲线是单峰的,它关于直线 对称;
②曲线在 处达到峰值;
③当|x|无限增大时,曲线无限接近x轴.
(3)3σ原则
①P(μ-σ≤X≤μ+σ)≈0.682 7;②P(μ-2σ≤X≤μ+2σ)≈0.954 5;
③P(μ-3σ≤X≤μ+3σ)≈0.997 3.
(4)正态分布的均值与方差
若X~N(μ,σ2),则E(X)= ,D(X)= .
x=μ
x=μ
μ
σ2
[自主诊断]
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)当μ取定值时,正态曲线的形状由σ确定,σ越小,曲线越“矮胖”.( )
(2)有放回地抽样试验是n重伯努利试验,且在n重伯努利试验中,各次试验的结果相互没有影响.( )
(3)如果在1次试验中某事件发生的概率是p,那么n重伯努利试验中这个事件恰好发生k次的概率P(X=k)=pk(1-p)n-k(k=0,1,…,n).( )
(4)服从二项分布、超几何分布及正态分布的随机变量是离散型随机变量.
( )
×
解析 当μ取定值时,σ越小,曲线越“瘦高”.
√
√
×
解析 正态分布是对于连续型随机变量而言的.
2.(人A选三教材习题改编)设随机变量X~B(4,),则P(X≥1)=( )
A. B.
C. D.
D
解析 因为P(X=0)=(1-)4=,所以P(X≥1)=1-P(X=0)=故选D.
3.(人A选三教材习题改编)随机变量ξ~N(4,2),若P(ξ>2a-1)=P(ξ<a),则实数a的值为( )
A.2 B.
C.3 D.4
C
解析 因为ξ~N(4,2),所以随机变量ξ的正态曲线关于直线x=4对称,故=4,则a=3.故选C.
4.(人A选三教材例题改编)在含有3件次品的10件产品中,任取4件,X表示取到的次品的个数,则P(X=2)= .
解析 由题意得P(X=2)=
5.(2021·新高考Ⅱ,6)某物理量的测量结果服从正态分布N(10,σ2),下列结论不正确的是( )
A.σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大
B.该物理量在一次测量中大于10的概率为0.5
C.该物理量在一次测量中小于9.99与大于10.01的概率相等
D.该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等
D
解析 对于A,σ2为数据的方差,所以σ越小,数据在μ=10附近越集中,所以测量结果落在(9.9,10.1)内的概率越大,故A正确;
对于B,由正态分布密度曲线的对称性可知该物理量在一次测量中大于10的概率为0.5,故B正确;
对于C,由正态分布密度曲线的对称性可知该物理量在一次测量中大于10.01的概率与小于9.99的概率相等,故C正确;
对于D,因为该物理量在一次测量中落在(9.9,10)的概率与落在(10.2,10.3)的概率不同,所以在一次测量中落在(9.9,10.2)的概率与落在(10,10.3)的概率不同,故D错误.
故选D.
常用结论
1.两点分布是当n=1时的二项分布,二项分布中的每次试验的结果都服从两点分布.
2.当X~B(n,p),且p给定时,若(n+1)p是整数,则当k=(n+1)p或k=(n+1)p-1时,P(X=k)取得最大值.
若(n+1)p不是整数,则当k=[(n+1)p](不大于(n+1)p的最大整数)时,P(X=k)取得最大值.
注:若均值为正整数,则当随机变量k=np时,概率最大.
3.超几何分布有时也记为X~H(n,M,N),其均值E(X)=,方差
D(X)=(1-)(1-).
研考点•精准突破
考点一 二项分布
例1 (2025·陕西安康模拟)小明和小红参加反应速度测试,该测试通过一个简单的视觉刺激来测试反应速度,其规则为当看到屏幕上红色圆变为绿色时,测试人员应当以最快速度敲击屏幕,若测试结果低于150毫秒,则被认定为“优秀”.已知小明和小红分别进行了m,n次测试,其中小明反应速度的优秀率为94%,小红反应速度的优秀率为98%,若将两人的测试情况进行混合,总体优秀率为97%.
(1)求的值;
(2)以频率估计概率,若从两人所有的测试结果中随机抽取3次,记其中由小明完成的测试次数为X,求X的分布列、数学期望以及方差.
考点一
考点二
考点三
解 (1)由题意,小明和小红分别进行了m,n次测试,其中小明反应速度的优秀率为94%,小红反应速度的优秀率为98%,则小明反应速度优秀的次数为94%×m,小明反应速度优秀的次数为98%×n,因为总的测试次数为m+n,所以94%+98%=97%,即0.94m+0.98n=0.97(m+n),所以0.01n=0.03m,所以=3.
考点一
考点二
考点三
(2)由n=3m可知,由小明完成的测试次数的概率为,
由小红完成的测试次数的概率为1-X表示这3次测试中由小明完成的次数,则X服从参数为n=3,p=的二项分布,即X~B(3,).
则P(X=k)=)k(1-)3-k,k=0,1,2,3.
当k=0时,P(X=0)=)0(1-)3-0=1×1×()3=;
当k=1时,P(X=1)=)1(1-)3-1=3)2=;
当k=2时,P(X=2)=)2(1-)3-2=3×()2;
当k=3时,P(X=3)=)3(1-)3-3=1×()3×1=
考点一
考点二
考点三
所以X的分布列为
X 0 1 2 3
P
所以期望为E(X)=3,方差为D(X)=3(1-)=3
考点一
考点二
考点三
规律方法 二项分布的解题策略
考点一
考点二
考点三
[对点训练1](2026·山西长治模拟)某公司对新产品进行测试,测试分两个环节,第一个环节通过后才能进入第二环节测试,第一环节测试合格的概率为p(0<p<1),若第一环节测试通过,则第二环节测试合格的概率为;若第一环节测试不合格,则无法进入第二环节,设该产品最终测试合格的概率为,且每次测试结果相互独立.
(1)求p的值;
(2)若连续2次进行测试,记X为合格的次数,求X的分布列及数学期望.
考点一
考点二
考点三
解 (1)设事件A=“第一环节测试合格”,事件B=“第二环节测试合格”,事件C=“最终测试合格”,根据题意,由条件概率公式得P(C)=P(AB)=P(A)P(B|A)=p,
已知P(C)=,则p=,故p=
考点一
考点二
考点三
(2)由(1)知,该产品测试合格的概率为,因为连续2次测试相互独立,
故X服从二项分布,即X~B(2,),由二项分布概率公式得P(X=k)=)k()2-k (k=0,1,2),当k=0时,P(X=0)=)0()2-0=;当k=1时,P(X=1)=)1()2-1=;
当k=2时,P(X=2)=)2()2-2=
所以X的分布列为
X 0 1 2
P
E(X)=2
考点一
考点二
考点三
考点二 超几何分布
例2 [一题多变]在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用.现有6名男志愿者A1,A2,A3,A4,A5,A6和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.
(1)求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率;
(2)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列与均值.
考点一
考点二
考点三
解 (1)记事件M=“接受甲种心理暗示的志愿者中包含A1但不包含B1”,则P(M)=
(2)由题意知X的可能取值为0,1,2,3,4,
则P(X=0)=,P(X=1)=,P(X=2)=,P(X=3)=, P(X=4)=
所以X的分布列为
X 0 1 2 3 4
P
(方法一)所以E(X)=0+1+2+3+4=2.
(方法二)E(X)==2.
考点一
考点二
考点三
AI变式
[变式](改变设问)若用Y表示接受乙种心理暗示的男志愿者人数,求Y的分布列.
解 由题意可知Y的可能取值为1,2,3,4,5,则P(Y=1)=,
P(Y=2)=,P(Y=3)=,P(Y=4)=,P(Y=5)=
所以Y的分布列为
Y 1 2 3 4 5
P
考点一
考点二
考点三
规律方法 求超几何分布的分布列、均值的步骤
考点一
考点二
考点三
[对点训练2](2025·四川成都模拟)年末促销是商场常用清理库存和资金回笼的一种措施.某商场对消费超过500元的消费者提供一次抽奖活动,抽奖箱中装有10个同种材质且大小相同的红球、黄球和绿球(绿球的个数最多),消费者从抽奖箱中同时抽取2个小球,若2个小球都是红球,则获得一等奖,若都是黄球,则获得二等奖,其余情况,均是不获奖.若从抽奖箱中同时抽取2个小球,其中黄球和绿球各1个的概率是,某消费者抽奖一次.
(1)求其获得一等奖的概率;
(2)记抽到的绿球个数为ξ,求ξ的分布列及其期望.
考点一
考点二
考点三
解 (1)设10个小球中黄球有m个,绿球有n个,且n>m,m∈N*,n∈N*,由题意得,,解得m=3,n=5,则红球有2个.
记事件A=“某消费者抽奖一次获得一等奖”,则P(A)=,所以该消费者获得一等奖的概率为
考点一
考点二
考点三
(2)由题意,ξ的可能取值为0,1,2,则P(ξ=0)=,P(ξ=1)=, P(ξ=2)=,
所以ξ的分布列为
ξ 0 1 2
P
期望E(ξ)=0+1+2=1.
考点一
考点二
考点三
考点三 正态分布
考向1 正态曲线及概率的计算
例3 (1)(2025·四川成都一模)已知甲、乙两批袋装食盐的质量(单位:g)分别服从正态分布N(μ甲,)和N(μ乙,),其正态曲线如图所示,则( )
A.μ甲>μ乙,σ甲>σ乙 B.μ甲>μ乙,σ甲<σ乙
C.μ甲<μ乙,σ甲>σ乙 D.μ甲<μ乙,σ甲<σ乙
C
考点一
考点二
考点三
解析 从题图中可以看出乙的对称轴在甲的对称轴的右侧,故甲的平均数小于乙的平均数,即μ甲<μ乙,且乙“高瘦”,甲“矮胖”,即乙数据更加集中,方差比甲小,即σ甲>σ乙.故选C.
考点一
考点二
考点三
(2)(多选题)(2024·新高考Ⅰ,9)为了解某种植区推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值=2.1,样本方差s2=0.01.已知该种植区以往的亩收入X服从正态分布N(1.8,0.12),假设推动出口后的亩收入Y服从正态分布N(,s2),则( )
(若随机变量Z服从正态分布N(μ,σ2),则P(Z<μ+σ)≈0.841 3)
A.P(X>2)>0.2 B.P(X>2)<0.5
C.P(Y>2)>0.5 D.P(Y>2)<0.8
BC
考点一
考点二
考点三
解析 由题意知,X~N(1.8,0.12),Y~N(2.1,0.12).∵P(X<1.8+0.1)≈0.841 3, ∴P(X>1.8+0.1)≈1-0.841 3=0.158 7. ∴P(X>2)=P(X>1.8+2×0.1)<P(X>1.8+0.1)≈0.158 7,
∴A错误.P(X>2)<P(X>1.8)=0.5,∴B正确.
∵P(Y>2)=P(Y>2.1-0.1)=P(Y<2.1+0.1)≈0.841 3,
∴C正确,D错误.故选BC.
考点一
考点二
考点三
教考衔接
(人A选三教材例题)李明上学有时坐公交车,有时骑自行车.他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时 30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1)估计X,Y的分布中的参数;
(2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
(3)如果某天有38 min可用,李明应选择哪种交通工具?如果某天只有34 min可用,又应该选择哪种交通工具?请说明理由.
考点一
考点二
考点三
解 (1)随机变量X的样本均值为30,样本标准差为6;随机变量Y的样本均值为34,样本标准差为2.用样本均值估计参数μ,用样本标准差估计参数σ,可以得到X~N(30,62),Y~N(34,22).
(2)X和Y的分布密度曲线如图所示.
(3)应选择在给定时间内不迟到的概率大的交通工具.由图可知,P(X≤38)<P(Y≤38),P(X≤34)>P(Y≤34).
所以,如果有38 min可用,那么骑自行车不迟到的概率大,应选择骑自行车;如果只有34 min可用,那么坐公交车不迟到的概率大,应选择坐公交车.
考点一
考点二
考点三
规律方法 正态分布下两类常见的概率计算
(1)利用正态密度曲线的对称性研究相关概率问题,涉及的知识主要是正态密度曲线关于直线x=μ对称,曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意将给出的区间或范围与μ,σ进行对比联系,确定它们属于[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]中的哪一个.
考点一
考点二
考点三
[对点训练3](多选题)(2025·河北秦皇岛模拟)在一次问答竞赛中,已知A组的成绩X与B组的成绩Y均服从正态分布,且X~N(130,25),Y~N(135,36),
则( )
A.E(X)=130 B.D(Y)=6
C.P(X<110)+P(X≤150)=1 D.P(X<140)>P(Y<145)
ACD
解析 因为X~N(130,52),Y~N(135,62),所以E(X)=130,D(Y)=36,故A正确,B错误;
因为P(X<110)+P(X≤150)=P(X>150)+P(X≤150)=1,故C正确;
P(X<140)=P(X<130+2×5)=P(Y<135+2×6)>P(Y<145),故D正确.故选ACD.
考点一
考点二
考点三
考向2 正态分布的实际应用
例4 (2025·江苏苏州三模)现有甲、乙两台机器生产一批零件,甲生产出的零件内径X(单位:mm)服从正态分布N(10,1),乙生产出的零件内径Y(单位:mm)服从正态分布N(8,4).
(1)若甲、乙在一天内发生故障的概率分别为0.1,0.2,且两台机器工作状态相互独立.设一天内发生故障的机器台数为Z,求Z的分布列;
(2)若生产出的零件内径小于8 mm,则每件亏损2元;若内径大于10 mm,则每件亏损8元;其余尺寸的零件,则每件获利20元.已知每天每台机器生产出1 000件零件,试比较哪一台机器每天生产出的零件的平均利润更大.
参考数据:若ξ~N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)≈0.682 7,P(μ-2σ≤ξ≤μ+2σ)≈0.954 5.
考点一
考点二
考点三
解 (1)由题可知Z的可能取值为0,1,2.
P(Z=0)=(1-0.1)×(1-0.2)=0.9×0.8=0.72,
P(Z=1)=0.1×(1-0.2)+(1-0.1)×0.2=0.1×0.8+0.9×0.2=0.08+0.18=0.26,
P(Z=2)=0.1×0.2=0.02,所以Z的分布列为
Z 0 1 2
P 0.72 0.26 0.02
考点一
考点二
考点三
(2)已知甲生产出的零件内径X~N(10,1),则μ1=10,σ1=1.
P(X<8)=P(X<10-2×1)=0.022 75,P(X>10)=0.5,
P(8≤X≤10)≈0.954 5÷2=0.477 25.
每台机器每天生产1 000件零件,则甲机器每天生产出的零件的平均利润约为1 000×[0.022 75×(-2)+0.5×(-8)+0.477 25×20]=1 000×(-0.045 5-4+9.545)=1 000×5.499 5=5 499.5(元).
已知乙生产出的零件内径Y~N(8,4),则μ2=8,σ2=2.
P(Y<8)=0.5,P(Y>10)=P(Y>8+1×2)=0.158 65,
P(8≤Y≤10)≈0.682 7÷2=0.341 35.
则乙机器每天生产出的零件的平均利润约为1 000×[0.5×(-2)+0.158 65×(-8) +0.341 35×20]=1 000×(-1-1.269 2+6.827)=1 000×4.557 8=4 557.8(元).因为5 499.5>4 557.8,所以甲机器每天生产出的零件的平均利润更大.
考点一
考点二
考点三
规律方法 解决正态分布问题的三个关键点
(1)对称轴方程x=μ.
(2)标准差σ.
(3)分布区间.利用对称性可求指定范围内的概率值,由μ,σ分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率,注意只有在标准正态分布下对称轴才为直线x=0.
考点一
考点二
考点三
[对点训练4](2025·湖南衡阳模拟)在一条生产圆钢的生产线上,出产的成品圆钢的长度(单位:m)为ξ,且ξ~N(2,0.012).
(1)若出产这样的成品圆钢10 000根,试估计长度在[1.97,2.03]内的圆钢根数;
(2)从这条生产线上出产的圆钢中随机抽取2根,求这两根圆钢其中一根的长度在区间[1.98,1.99),另一根的长度在区间[2,2.02]内的概率(精确到0.01).
参考数据:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7;P(μ-2σ≤X≤μ+2σ)≈ 0.954 5;P(μ-3σ≤X≤μ+3σ)≈0.997 3.
考点一
考点二
考点三
解 (1)由已知得,μ=2,σ=0.01,所以P(1.97≤ξ≤2.03)=P(μ-3σ≤ξ≤μ+3σ)≈0.997 3,所以长度在[1.97,2.03]内的圆钢根数约为10 000×0.997 3=9 973.
(2)圆钢的长度在区间[1.98,1.99)的概率为P1=P(1.98≤ξ<1.99)
=P(μ-2σ≤ξ<μ-σ)[P(μ-2σ≤ξ≤μ+2σ)-P(μ-σ≤ξ≤μ+σ)]≈0.135 9,圆钢的长度在区间[2,2.02]内的概率为P2=P(2≤ξ≤2.02)=P(μ≤ξ≤μ+2σ)P(μ-2σ≤ξ≤μ+2σ) ≈0.477 25,
因此这两根圆钢其中一根的长度在区间[1.98,1.99),另一根的长度在区间[2,2.02]内的概率为P=2P1P2≈2×0.135 9×0.477 25≈0.13.
考点一
考点二
考点三
$