内容正文:
课时16 二项分布、超几何分布和正态分布
[备考指南] 高考中关于概率模型的考查,主要涉及二项分布、超几何分布、正态分布等知识,在选择题、填空题、解答题中都有出现,难度中等.
基础考点1 二项分布
【母题1】 [人教A版选择性必修第三册P77练习T2节选]鸡接种一种疫苗后,有80%不会感染某种病毒.如果5只鸡接种了疫苗,则恰好有1只鸡感染病毒的概率为( )
A. B.
C. D.
D [由题意得,鸡接种一种疫苗后,感染某种病毒的概率为20%,设恰好有1只鸡感染病毒为事件A,则P(A)=×(20%)1×(80%)4=.故选D.]
【母题2】 [人教A版选择性必修第三册P81习题7.4T3]如图,一个质点在随机外力的作用下,从原点0出发,每隔1 s等可能地向左或向右移动1个单位长度,共移动6次.
(1)质点回到原点的概率为 ;
(2)质点位于4的位置的概率为 .
(1) (2) [(1)设质点向右移动的次数为X,又质点每隔1 s等可能地向左或向右移动1个单位长度,共移动6次,且每次移动相互独立,则X~B.质点回到原点,则X=3,P(X=3)==,所以质点回到原点的概率是.
(2)若质点位于4的位置,则X=5,P(X=5)==,所以质点位于4的位置的概率是.]
链接核心知识:一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0<p<1),用X表示事件A发生的次数,则X的分布列为P(X=k)=pk(1-p)n-k,k=0,1,2,…,n.E(X)=np,D(X)=np(1-p).
(2025·湖南永州三模节选)某学校为调查高三年级的体育开展情况,随机抽取了20位高三学生作为样本进行体育综合测试,体育综合测试成绩分4个等级,每个等级对应的分数和人数如表所示:
等级
不及格
及格
良
优
分数
1
2
3
4
人数
3
9
5
3
(1)若从样本中随机选取2位学生,求所选的2位学生分数不同的概率;
(2)用样本估计总体,以频率代替概率,若从高三年级学生中随机抽取3位学生,记所选学生分数不小于3的人数为X,求X的分布列与数学期望.
[解] (1)设事件M=“选取的2位学生分数不同”,则P(M)=1-P()==,
故所选的2位学生分数不同的概率为.
(2)设A=“学生分数不小于3”,则P(A)==,
X的可能取值为0,1,2,3,由题意可得X~B,
又P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以X的分布列为
X
0
1
2
3
P
由于X~B,则E(X)=3×=.
反思领悟:在根据n重伯努利试验中求二项分布的有关问题时,关键是理清事件与事件之间的关系,确定二项分布的试验次数n和变量的概率,进而求得概率.
【教用·备选题】
1.小王到某公司面试,一共要回答3道题,每道题答对得2分,答错倒扣1分,设他每道题答对的概率均为p(0<p<1),且每道题答对与否相互独立.记小王答完3道题的总得分为X,则当E(X)+D(X)取得最大值时,p=( )
A. B.
C. D.
C [设答对题的个数为Y,则 Y~B(3,p),
所以E(Y)=3p,D(Y)=3p(1-p),
由题意知,X=2Y-(3-Y)=3Y-3,
所以 E(X)=3E(Y)-3=9p-3,
D(X)=9D(Y)=27p(1-p),
所以E(X)+D(X)=-27p2+36p-3
=-27+9,
所以当p=时,E(X)+D(X) 取得最大值.
故选C.]
2.(2024·湘豫名校联考三模)甲、乙两人进行乒乓球比赛,比赛规则:每一局比赛中,胜者得1分,负者得0分,且比赛中没有平局.根据以往战绩,每局比赛甲获胜的概率为,每局比赛的结果互不影响.
(1)经过3局比赛,记甲的得分为X,求X的分布列和期望;
(2)若比赛采取3局制,试计算3局比赛后,甲的累计得分高于乙的累计得分的概率.
[解] (1)由题意,得X~B,X的所有可能取值为0,1,2,3,
则P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以X的分布列如下:
X
0
1
2
3
P
因为X~B,所以X的期望E(X)=3×=2.
(2)3局比赛后,甲的累计得分高于乙的累计得分有两种情况:甲获胜2局或甲获胜3局,所以所求概率为P=P(X=2)+P(X=3)==.
3.(2019·天津卷)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.
(1)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;
(2)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.
[解] (1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为,故X~B,从而P(X=k)=·(k=0,1,2,3),
所以随机变量X的分布列为
X
0
1
2
3
P
随机变量X的数学期望E(X)=3×=2.
(2)设乙同学上学期间的三天中7:30之前到校的天数为Y,则Y~B,且M={X=3,Y=1}∪{X=2,Y=0}.由题意知事件{X=3,Y=1}与{X=2,Y=0}互斥,且事件{X=3}与{Y=1},事件{X=2}与{Y=0}均相互独立,从而由(1)知,P(M)=P({X=3,Y=1}∪{X=2,Y=0})=P({X=3,Y=1})+P({X=2,Y=0})=P(X=3)P(Y=1)+P(X=2)·P(Y=0)==.
基础考点2 超几何分布
【母题3】 [人教A版选择性必修第三册P80练习T2]学校要从12名候选人中选4名同学组成学生会,已知有4名候选人来自甲班.假设每名候选人都有相同的机会被选到,则甲班恰有2名同学被选到的概率为 .
[从12名候选人中选4名有种选法,其中有2名甲班同学有种选法,故甲班恰有2名同学被选到的概率为=.]
【母题4】 [苏教版选择性必修第二册P132习题8.2(4)T1]已知15件同类型的零件中有2件不合格品,从中任取3件,用随机变量X表示取出的3件中不合格品的件数.求:
(1)X的概率分布列;
(2)X的均值E(X).
[解] (1)随机变量X的可能取值为0,1,2,
P(X=0)==,
P(X=1)==,
P(X=2)==.
∴X的分布列为
X
0
1
2
P
(2)法一:E(X)=0×+1×+2×=.
法二:E(X)==.
链接核心知识:一般地,假设一批产品共有N件,其中有M件次品.从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为P(X=k)=,k=m,m+1,m+2,…,r.其中n,N,M∈N*,MN,nN,m=max{0,n-N+M},r=min{n,M}.E(X)=n·.
(2025·广西模拟)某校党委在教师党员中开展“学党史”知识竞赛.甲老师从装有6个不同问题的纸盒中依次不放回地抽取4个问题作答.已知这6个问题中,甲老师能正确回答其中的4个问题,且甲老师对每个问题回答正确与否都是相互独立、互不影响的.
(1)求甲老师答对2个问题的概率;
(2)若测试过程中答对1个问题得2分,答错得0分,设随机变量X表示甲老师的得分,求E(X),D(X).
[解] (1)设甲老师答对2个问题为事件B,则P(B)==,所以甲老师答对2个问题的概率为.
(2)由题意,X的可能取值为4,6,8,P(X=4)==,P(X=6)==,P(X=8)==,则E(X)=4×+6×+8×=,D(X)=++=.
反思领悟:(1)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体数X的分布列.
(2)二项分布是有放回随机试验模型,超几何分布是无放回随机试验模型,当样本数量无限大时,超几何分布可转化为二项分布.
【教用·备选题】
1.(2024·河南名校联考)在一个不透明的密闭纸箱中装有10个大小、形状完全相同的小球,其中8个白球,2个黑球.小张每次从纸箱中随机摸出一个小球观察其颜色,连续摸4次,记随机变量X为小张摸出白球的个数.
(1)若小张每次从纸箱中随机摸出一个小球后放回纸箱,求E(X)和D(X);
(2)若小张每次从纸箱中随机摸出一个小球后不放回纸箱,求X的分布列.
[解] (1)因为小张每次从纸箱中随机摸出一个小球观察其颜色,连续摸4次,且每次从纸箱中随机摸出一个小球后放回纸箱,所以随机变量X~B(4,0.8),所以E(X)=4×0.8=3.2,D(X)=4×0.8×(1-0.8)=0.64.
(2)因为小张每次从纸箱中随机摸出一个小球观察其颜色,连续摸4次,且每次从纸箱中随机摸出一个小球后不放回纸箱,所以随机变量X服从超几何分布,
则P(X=k)=,k=2,3,4,
可得P(X=2)==,
P(X=3)==,P(X=4)==,
所以X的分布列为
X
2
3
4
P
2.(2025·吉林三模)为提高某软件的应用能力,某公司组织A,B两部门的50名员工参加软件培训.
(1)参加此次软件培训的员工中共有6名部门领导,其中恰有3人来自A部门.从这6名部门领导中随机选取2人,记X表示选取的2人中来自A部门的人数,求X的分布列和数学期望;
(2)此次软件培训分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,每轮培训结果相互独立,至少两轮培训达到“优秀”的员工才能合格.
(ⅰ)求每位员工培训合格的概率;
(ⅱ)经过预测,开展软件培训后,合格的员工每人每年平均为公司创造利润30万元,不合格的员工每人每年平均为公司创造利润20万元,且公司需每年平均为每位参加培训的员工支付3万元的其他成本和费用.试估计该公司A,B两部门培训后的年利润(公司年利润=员工创造的利润-其他成本和费用).
[解] (1)X的所有可能取值为0,1,2,且X服从超几何分布.
P(X=0)==,
P(X=1)==,
P(X=2)==,
所以X的分布列为
X
0
1
2
P
X的数学期望E(X)=0×+1×+2×=1.
(2)(ⅰ)记C=“员工培训合格”,Ai=“员工第i轮培训达到优秀”(i=1,2,3),
C=A1A2A3,
根据概率加法公式和事件相互独立的定义得,
P(C)=P(A1A2A3)+P(A2A3)+P(A1)
=P(A1)P(A2)P(A3)+P()
==,
即每位员工培训合格的概率为.
(ⅱ)记A,B两部门开展软件培训后合格的人数为Y,则Y~B,
E(Y)=50×=25,则25×30+25×20-50×3=1 100(万元),
即估计A,B两部门的员工参加软件培训后为公司创造的年利润为1 100万元.
基础考点3 正态分布
【母题5】 [人教A版选择性必修第三册P87习题7.5T4]袋装食盐标准质量为400 g,规定误差的绝对值不超过4 g就认为合格.假设误差服从正态分布,随机抽取100袋食盐,误差的样本均值为0,样本方差为4,则估计这批袋装食盐的合格率为 .(附:P(μ-σXμ+σ)≈0.682 7,P(μ-2σXμ+2σ)≈0.954 5,P(μ-3σXμ+3σ)≈0.997 3)
95.45% [设这批袋装食盐质量的误差为X,则X~N(0,4),P(|X|4)=P(-4X4)=P(μ-2σXμ+2σ)≈0.954 5,故合格率约为95.45%.]
链接核心知识:解决正态分布问题的三个关键点
(1)对称轴x=μ.
(2)样本标准差σ.
(3)分布区间.利用3σ原则求概率时,要注意利用μ,σ分布区间的特征把所求的范围转化为3σ的特殊区间.
1.(2025·贵州遵义三模)已知随机变量X服从正态分布N(3,σ2),且P(X>2)=0.7,则P(3<X<4)=( )
A.0.1 B.0.2
C.0.3 D.0.4
B [∵X~N(3,σ2),
∴P(X3)=0.5,
∴P(X>2)=P(2<X<3)+P(X3)=0.7,
∴P(2<X<3)=0.2,
∴P(3<X<4)=P(2<X<3)=0.2.
故选B.]
2.(多选)(2024·新高考Ⅰ卷)随着“一带一路”国际合作的深入,某茶叶种植区多措并举推动茶叶出口.为了解推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值=2.1,样本方差s2=0.01,已知该种植区以往的亩收入X服从正态分布N(1.8,0.12),假设推动出口后的亩收入Y服从正态分布N(,s2),则( )
(若随机变量Z服从正态分布N(μ,σ2),则P(Z<μ+σ)≈0.841 3)
A.P(X>2)>0.2 B.P(X>2)<0.5
C.P(Y>2)>0.5 D.P(Y>2)<0.8
BC [依题可知,=2.1,s2=0.01,
所以Y~N(2.1,0.12),
故P(Y>2)=P(Y>2.1-0.1)=P(Y<2.1+0.1)≈0.841 3>0.5,C正确,D错误;
因为X~N(1.8,0.12),
所以P(X>2)=P(X>1.8+2×0.1).
因为P(X<1.8+0.1)≈0.841 3,
所以P(X>1.8+0.1)≈1-0.841 3=0.158 7<0.2,
而P(X>2)=P(X>1.8+2×0.1)<P(X>1.8+0.1)<0.2,B正确,A错误.故选BC.]
3.(2025·山东菏泽二模)某区学生参加模拟大联考,假设联考的数学成绩服从正态分布,其正态密度函数为f(x)=,且P(70X100)=0.7,若参加此次联考的学生共有8 000人,则数学成绩超过100分的人数大约为 .
1 200 [因为正态密度函数为f(x)=,则μ=85,
由P(70X100)=0.7得P(X>100)==0.15,
所以超过100分的人数大约为8 000×0.15=1 200.]
反思领悟:利用正态曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称及曲线与x轴之间的面积为1,注意下面三个结论的活用:
(1)对任意的a,有P(X<μ-a)=P(X>μ+a).
(2)P(X<x0)=1-P(Xx0).
(3)P(a<X<b)=P(X<b)-P(Xa).
【教用·备选题】
1.(2025·江苏南通模拟)为推广新能源汽车,某地区决定对续航里程达到一定标准的新能源汽车进行补贴.已知某品牌新能源汽车的续航里程ξ(单位:km)服从正态分布N(400,502).补贴政策:续航里程不低于350 km的车辆补贴2万元,超过450 km的车辆额外再补贴1万元,则该品牌每辆新能源汽车的平均补贴金额约为( )
附:若X~N(μ,σ2)则P(|X-μ|σ)≈0.682 6).
A.1.52万元 B.1.68万元
C.1.84万元 D.2.16万元
C [因为续航里程ξ(单位:km)服从正态分布N(400,502),所以P(ξ350)=0.5+×0.682 6=0.841 3,P(ξ450)=×(1-0.682 6)=0.158 7,因为续航里程不低于350 km的车辆补贴2万元,超过450 km的车辆额外再补贴1万元,所以该品牌每辆新能源汽车的平均补贴金额约为2×0.841 3+1×0.158 7≈1.84(万元).故选C.]
2.某教学研究机构从参加高考适应性考试的20 000名优秀考生中随机抽取了200人对其数学成绩进行了整理分析,作出了如图所示的频率分布直方图.
(1)根据频率分布直方图,同一组数据用该组区间的中点值作代表,求得这200名考生数学成绩的平均数为=110.据此估计这20 000名优秀考生数学成绩的标准差s;
(2)根据以往经验,可以认为这20 000名优秀考生的数学成绩X近似服从正态分布N(μ,σ2),其中参数μ和σ可以分别用(1)中的和s来估计.记考生本次考试的各科总成绩为Y,若Y=5X-10,试估计这20 000名优秀考生中总成绩Y∈[600,660]的人数.
注:≈2.4;若X~N(μ,σ2),则P(μ-σXμ+σ)≈0.682 7,P(μ-2σXμ+2σ)≈0.954 5.
[解] (1)抽取200名考生数学成绩的方差估计值为s2=(80-110)2×0.02+(90-110)2×0.09+(100-110)2×0.22 +(110-110)2×0.33+(120-110)2×0.24+(130-110)2×0.08+(140-110)2×0.02=150.
故估计这20 000名考生数学成绩的方差为150,标准差s==5≈5×2.4=12.
(2)由(1)知μ可用=110来估计,σ可用s=12来估计.故X~N(110,122).
又P(μ+σXμ+2σ)
=
≈=0.135 9,
故P(122X134)≈0.135 9.
又Y=5X-10,
所以P(600Y660)=P(6005X-10660)=P(122X134)≈0.135 9.
故这20 000名考生中成绩在[600,660]的人数约为20 000×0.135 9=2 718(人).
1.(2025·天津卷)已知r为相关系数,则下列说法中错误的是( )
A.若X~N(μ,σ2),则P(Xμ-σ)=P(Xμ+σ)
B.若X~N(1,22),Y~N(2,22),则P(X<1)<P(Y<2)
C.|r|越接近1,线性相关性越强
D.|r|越接近0,线性相关性越弱
B [对于A,由正态分布的性质可知,若X~N(μ,σ2),则P(Xμ-σ)=P(Xμ+σ),故A正确;
对于B,由正态分布的性质可知,若X~N(1,22),
Y~N(2,22),则P(X<1)=P(Y<2)=,故B错误;
对于C,D,由相关系数的性质可知,当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱,故C,D正确.故选B.]
2.(2022·新高考Ⅱ卷)随机变量X服从正态分布N(2,σ2),若P(2<X2.5)=0.36,则P(X>2.5)= .
0.14 [由题意可知,P(X>2)=0.5,故P(X>2.5)=P(X>2)-P(2<X2.5)=0.14.]
1 / 15
学科网(北京)股份有限公司
$