内容正文:
高考总复习 数学
第十章 计数原理、离散型随机变量及其分布
第7节 二项分布、超几何分布
与正态分布
X~B(n,p)
np
np(1-p)
衔接教材 夯基固本
落实
衔接教材 夯基固本
落实
np
衔接教材 夯基固本
落实
X~N(μ,σ2)
衔接教材 夯基固本
落实
1
x=μ
衔接教材 夯基固本
落实
瘦高
集中
矮胖
分散
衔接教材 夯基固本
落实
μ
σ2
0.682 7
0.954 5
0.997 3
衔接教材 夯基固本
落实
衔接教材 夯基固本
落实
衔接教材 夯基固本
落实
A
衔接教材 夯基固本
落实
A
衔接教材 夯基固本
落实
衔接教材 夯基固本
落实
衔接教材 夯基固本
落实
衔接教材 夯基固本
落实
衔接教材 夯基固本
落实
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
BC
关键能力 进阶突破
提升
关键能力 进阶突破
提升
关键能力 进阶突破
提升
ABD
关键能力 进阶突破
提升
关键能力 进阶突破
提升
AC
关键能力 进阶突破
提升
关键能力 进阶突破
提升
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
微点突破14 二项分布与超几何分布的辨别
请完成:课时训练(81)
温馨提示
谢谢观看!
1.理解二项分布、超几何分布的概念,能解决一些简单的实际问题.
2.借助正态分布曲线了解正态分布的概念,并进行简单应用.
一、二项分布
1.概念
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0<p<1),用X表示事件A发生的次数,则X的分布列为P(X=k)=_________________,k=0,1,2,…,n.如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布,记作______________.
2.均值与方差
如果X~B(n,p),那么E(X)=____,D(X)=__________.
Cpk(1-p)n-k
二、超几何分布
1.概念
一般地,假设一批产品共有N件,其中有M件次品.从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为P(X=k)=,k=m,m+1,m+2,…,r.其中n,N,M∈N*,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M}.如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
2.均值
设随机变量X服从超几何分布,则X可以解释为从包含M件次品的N件产品中,不放回地随机抽取n件产品的次品数.令p=,则E(X)=______=____.
三、正态分布
1.概念
对任意的x∈R,f(x)=e>0(μ∈R,σ>0为参数),则称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线.若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为_______________.特别地,当μ=0,σ=1时,称随机变量X服从标准正态分布.
2.正态曲线的特点
(1)它的图象在x轴上方;
(2)x轴和曲线之间的区域的面积为___;
(3)曲线是单峰的,它关于直线______对称;
(4)曲线在x=μ处达到峰值_________;
(5)当|x|无限增大时,曲线无限接近x轴.
3.参数μ和σ对正态曲线形状的影响
(1)当σ较小时,峰值高,正态曲线“______”,表示随机变量X的分布比较______;
(2)当σ较大时,峰值低,正态曲线“______”,表示随机变量X的分布比较______.
4.均值与方差
若X~N(μ,σ2),则E(X)=___,D(X)=____.
5.3σ原则
P(μ-σ≤X≤μ+σ)≈_________;P(μ-2σ≤X≤μ+2σ)≈_________;P(μ-3σ≤X≤μ+3σ)≈_________.
1.“二项分布”与“超几何分布”的区别:有放回抽取问题对应二项分布,不放回抽取问题对应超几何分布,当总体容量很大时,超几何分布可近似为二项分布来处理.
2.超几何分布有时也记为 X~H(n,M,N),其均值E(X)=,方差D(X)=(1-)(1-).
一、“教考衔接”例证
高考
真题
(2022·新高考Ⅱ卷)已知随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,则P(X>2.5)=________
追根
溯源
(人教B版选择性必修第二册P99T6)已知随机变量ξ服从正态分布N(2,σ2),P(ξ≤4)=0.84,求P(ξ≤0)
发现
感悟
两题均考查正态分布的对称性的应用,求解正态分布概率问题的关键是充分利用好正态密度曲线的对称性
二、教材典题改编
1.(人教A版选择性必修第三册P77T2改编)鸡接种一种疫苗后,有90%的概率不会感染某种病毒,如果有5只鸡接种了疫苗,则恰好有4只鸡没有感染病毒的概率约为( )
A.0.33 B.0.66
C.0.5 D.0.45
2.(北师版选择性必修第一册P224T2改编)若随机变量ξ~N(μ,σ2),其分布密度函数为φ(x)=e(x∈R),则σ的值为( )
A.1 B.2
C.4 D.8
解析:因为随机变量ξ~N(μ,σ2),其分布密度函数为φ(x)=e,所以μ=2,σ2=1,所以σ=1.
3.(苏教版选择性必修第二册P146T8改编)如果随机变量X~B(6,),那么D(X)=________.
答案:
4.(人教A版必修第三册P87T2改编)已知随机变量X服从正态分布N(3,1),且P(X>2c-1)=P(X<c+3),则c=________.
答案:
解析:随机变量X服从正态分布N(3,1),
∵P(X>2c-1)=P(X<c+3),
∴=3,∴c=.
三、易误易混澄清
1.(混淆二项分布与超几何分布)在含有3件次品的10件产品中,任取4件,X表示取到的次品数,则P(X=2)=________.
答案:
解析:由题意,X服从超几何分布,其中N=10,M=3,n=4,故P(X=2)==.
2.(忽视正态曲线的对称性)已知随机变量ξ服从正态分布N(0,σ2).若P(ξ>2)=0.023,则P(-2≤ξ≤2)=________.
答案:0.954
考点一 二项分布
[例1] (2025·广东大湾区联考)某工厂车间有6台相同型号的机器,各台机器相互独立工作,工作时发生故障的概率都是,且一台机器的故障能由一个维修工处理.已知此厂共有甲、乙、丙3名维修工,现有两种配备方案,方案一:由甲、乙、丙三人维护,每人负责2台机器.方案二:由甲、乙两人共同维护6台机器.
(1)对于方案一,设X为甲维护的机器同一时刻发生故障的台数,求X的分布列与均值E(X);
(2)在两种方案下,分别计算机器发生故障时不能得到及时维修的概率,并以此为依据来判断,哪种方案能使工厂的生产效率更高?
解:(1)由题意可知,X~B(2,),
则P(X=0)=()2=,P(X=1)=C××=,P(X=2)=()2=,
所以随机变量X的分布列为
X
0
1
2
P
所以E(X)=2×=.
(2)对于方案一:“机器发生故障时不能及时维修”等价于“甲、乙、丙三人中,至少有一人负责的2台机器同时发生故障”.
其概率为P1=1-[1-P(X=2)]3=1-(1-)3=.
对于方案二:机器发生故障时不能及时维修的概率为P2=1-()6-C·×()5-C·()2×()4=1-=,所以P2<P1,即方案二能让故障机器更大概率得到及时维修,使得工厂的生产效率更高.
判断某随机变量服从二项分布的关键点
(1)在每一次试验中,事件发生的概率相同.
(2)各次试验中的事件是相互独立的.
(3)在每一次试验中,试验的结果只有两个,即发生与不发生.
训练1 (2025·衡阳模拟)为进一步加强学生的文明养成教育,推进校园文化建设,倡导真善美,用先进人物事迹来感动师生,用身边的榜样去打动师生,用真情去发现美、分享美、弘扬美,某校以争做最美青年为主题,进行“最美青年”评选活动,最终评出了10位“最美青年”,其中有6名女生,4名男生.学校准备从这10位“最美青年”中每次随机选出一人做事迹报告.
(1)若每位“最美青年”最多做一次事迹报告,记第一次抽到女生为事件A,第二次抽到男生为事件B,求P(B),P(B|A);
(2)根据不同需求,现需要从这10位“最美青年”中每次选1人,选4次,可以重复,连续4天分别为高一、高二、高三年级学生和全体教师做4场事迹报告,记这4天中做事迹报告的男生人数为X,求X的分布列和数学期望.
解:(1)由题意得,第二次抽到男生的概率P(B)==.
因为P(A)==,P(AB)==,所以P(B|A)==.
(2)由题意得,X的所有可能取值为0,1,2,3,4,且X~B(4,).
可得P(X=0)=C×()4×()0=,P(X=1)=C×()3×()1=,P(X=2)=C×()2×()2=,P(X=3)=C×()1×()3=,P(X=4)=C×()0×()4=,
所以随机变量X的分布列为
X
0
1
2
3
4
P
所以E(X)=4×=.
考点二 超几何分布
[例2] (2025·黄山模拟)某校高三年级1 000名学生的高考适应性演练数学成绩频率分布直方图如图所示,其中成绩分组区间是[30,50),[50,70),[70,90),[90,110),[110,130),[130,150].
(1)求图中a的值,并根据频率分布直方图,估计这1 000名学生的这次考试数学成绩的第85百分位数;
(2)从这次数学成绩位于[50,70),[70,90)的学生中采用比例分配的分层随机抽样的方法抽取9人,再从这9人中随机抽取3人,该3人中成绩在区间[70,90)的人数记为X,求X的分布列及数学期望.
解:(1)由频率分布直方图可得(0.002 5+0.007 5+2×0.015 0+2a)×20=1,解得a=0.005 0.
前四个矩形的面积之和为(0.002 5+0.007 5+2×0.015 0)×20=0.8,
前五个矩形的面积之和为0.8+0.005 0×20=0.9.
设这1 000名学生的这次考试数学成绩的第85百分位数为m,则0.8+(m-110)×0.005 0=0.85,解得m=120,
因此,这1 000名学生的这次考试数学成绩的第85百分位数为120.
(2)数学成绩位于[50,70),[70,90)的学生人数之比为0.007 5∶0.015=1∶2,
所以所抽取的9人中,数学成绩位于[50,70)的学生人数为9×=3,
数学成绩位于[70,90)的学生人数为9×=6.
由题意可知,随机变量X的可能取值有0,1,2,3,
则P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
所以随机变量X的分布列为
X
0
1
2
3
P
所以E(X)=0×+1×+2×+3×=2.
超几何分布的特征
(1)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征是:
①考察对象分两类;
②已知各类对象的个数;
③从中抽取若干个个体,考查某类个体数X的概率分布.
(2)超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其实质是古典概型.
训练2 (2025·安康开学考试)某农场收获的苹果按A,B,C三个苹果等级进行装箱,已知苹果的箱数非常多,且A,B,C三个等级苹果的箱数之比为6∶3∶1.
(1)现从这批苹果中随机选出3箱,若选到任何一箱苹果是等可能的,求至少选到2箱A级苹果的概率;
(2)若用分层随机抽样的方法从该农场收获的A,B,C三个等级苹果中选取10箱苹果,假设某游客要从这10箱苹果中随机购买3箱,记购买的A级苹果有X箱,求X的分布列与数学期望.
解:(1)设事件M=“至少选到2箱A级苹果”,
由题意知选到1箱A级苹果的概率为=,选到1箱非A级苹果的概率为=,所以P(M)=C()2×()1+C()3×()0==,
故至少选到2箱A级苹果的概率为.
(2)因为用分层随机抽样的方法从该农场收获的A,B,C三个等级苹果中选取10箱苹果,
所以A级苹果有6箱,B,C级苹果共有4箱,随机变量X的所有可能取值为0,1,2,3,则P(X=0)===,P(X=1)===,P(X=2)===,P(X=3)===.
所以X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=.
考点三 正态分布
[例3] (多选)(2024·新课标Ⅰ卷)随着“一带一路”国际合作的深入,某茶叶种植区多措并举推动茶叶出口.为了解推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值=2.1,样本方差s2=0.01.已知该种植区以往的亩收入X服从正态分布N(1.8,0.12),假设推动出口后的亩收入Y服从正态分布N(,s2),则(若随机变量Z服从正态分布N(μ,σ2),则P(Z<μ+σ)≈0.841 3)( )
A.P(X>2)>0.2 B.P(X>2)<0.5 C.P(Y>2)>0.5 D.P(Y>2)<0.8
解析:由题意可知,X~N(1.8,0.12),所以P(X>2)<P(X>1.8)=0.5,P(X<1.9)≈0.841 3,所以P(X>2)<P(X≥1.9)=1-P(X<1.9)≈1-0.841 3=0.158 7<0.2,所以A错误,B正确.因为Y~N(2.1,0.12),所以P(Y<2.2)≈0.841 3,P(Y>2)>P(Y>2.1)=0.5,所以P(2<Y<2.1)=P(2.1<Y<2.2)=P(Y<2.2)-P(Y≤2.1)≈0.841 3-0.5=0.341 3,所以P(Y>2)=P(2<Y<2.1)+P(Y≥2.1)≈0.341 3+0.5=0.841 3>0.8(另解:P(Y>2)=P(Y<2.2)≈0.841 3>0.8),所以C正确,D错误.综上,选BC.
解决正态分布问题的三个关键点
(1)对称轴为直线x=μ.
(2)标准差为σ.
(3)分布区间.
由μ,σ利用对称性可求指定范围内的概率值,使分布区间转化为3σ特殊区间,从而求出所求概率.
注意:只有在标准正态分布下对称轴才为直线x=0.
训练3 (1)(多选)(2025·常州调研)已知在数学测验中,某校学生的成绩服从正态分布N(110,81),其中90分为及格线,则下列结论中正确的有(附:若随机变量ξ服从正态分布N(μ,σ2),则P(μ-2σ≤ξ≤μ+2σ)≈0.954 5)( )
A.该校学生成绩的期望为110
B.该校学生成绩的标准差为9
C.该校学生成绩的标准差为81
D.该校学生成绩及格率超过95%
解析:因为该校学生的成绩服从正态分布N(110,81),则μ=110,方差σ2=81,标准差σ=9.
因为μ-2σ=110-2×9=92,P(ξ≥90)>P(ξ>92)=P(ξ>μ-2σ)=+P(μ-2σ≤ξ≤μ+2σ)≈+×0.954 5=0.977 25>0.95,所以该校学生成绩的期望为110,标准差为9,该校学生成绩及格率超过95%.所以A,B,D正确,C错误.
(2)(多选)(2025·哈尔滨模拟)某市有甲、乙两个工厂生产同一型号的汽车零件,零件的尺寸分别记为X,Y,已知X,Y均服从正态分布,X~N(μ1,σ),Y~N(μ2,σ),其正态曲线如图所示,则下列结论中正确的是( )
A.甲工厂生产零件尺寸的平均值等于乙工厂生产零件尺寸的平均值
B.甲工厂生产零件尺寸的平均值小于乙工厂生产零件尺寸的平均值
C.甲工厂生产零件尺寸的稳定性高于乙工厂生产零件尺寸的稳定性
D.甲工厂生产零件尺寸的稳定性低于乙工厂生产零件尺寸的稳定性
解析:X,Y均服从正态分布,X~N(μ1,σ),Y~N(μ2,σ),结合正态密度函数的图象可知,μ1=μ2,σ1<σ2,故甲工厂生产零件尺寸的平均值等于乙工厂生产零件尺寸的平均值,故A正确,B错误;甲工厂生产零件尺寸的稳定性高于乙工厂生产零件尺寸的稳定性,故C正确,D错误.
考题中常涉及二项分布与超几何分布,有些学生对这两种模型的定义不能很好地理解,一遇到“取”或“摸”的题型,就认为是超几何分布,不加分析,滥用公式,运算对象不明晰,事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别.
[例] 写出下列离散型随机变量的分布列,并指出其中服从二项分布的是哪些,服从超几何分布的是哪些.
(1)X1表示n次重复地抛掷1枚骰子,出现点数是3的倍数的次数;
(2)X2表示连续抛掷2枚骰子,所得的2个骰子的点数之和;
(3)有一批产品共有N件,其中次品有M件(N>M>0),采用有放回抽取方法抽取n次(n>N),抽出的次品件数为X3;
(4)有一批产品共有N件,其中M件为次品,采用不放回抽取方法抽n件,出现次品的件数为X4(N-M>n>0).
解:(1)X1的分布列为
X1
0
1
P
C()0()n
C()1()n-1
X1
…
n
P
…
C()n
X1服从二项分布,即X1~B(n,).
(2)X2的分布列为
X2
2
3
4
5
6
7
8
9
10
11
12
P
X2既不服从二项分布,也不服从超几何分布.
(3)X3的分布列为
X3
0
1
P
C()0(1-)n
C()1(1-)n-1
X3
…
n
P
…
C()n
X3服从二项分布,即X3~B(n,).
(4)X4的分布列为
X4
0
1
…
k
…
n
P
…
…
X4服从超几何分布.
超几何分布与二项分布的区别与应用
(1)有放回抽样:每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.
(2)不放回抽样:取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.
(3)区别:①最主要的区别在于是有放回抽样还是不放回抽样.超几何分布的试验是从含有m(m≤N)件次品的N件产品中任取n(n≤N)件产品,可以理解为是不放回抽样的试验;二项分布的试验就是在相同的条件下做了n次独立重复试验,可以理解为有放回抽样的试验.
②超几何分布需要知道总体容量,而二项分布不需要.
(4)应用:超几何分布的应用中,常见的模型常有较明显的两部分,如“正品”与“次品”,“男生”与“女生”,“优”与“劣”等;二项分布的应用中,常见的模型涉及试验次数,如“射击次数”“摸球次数”“几人试验”等.
训练 某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的40件产品作为样本称出它们的质量(单位:g),质量分组区间为[490,495],(495,500],…,(510,515].由此得到样本的频率分布直方图(如图所示).
(1)根据频率分布直方图,求质量超过505 g的产品数量;
(2)在上述抽取的40件产品中任取2件,设X为质量超过505 g的产品数量,求X的分布列;
(3)从该流水线上任取2件产品,设Y为质量超过505 g的产品数量,求Y的分布列.
解:(1)质量超过505 g的产品的频率为5×0.05+5×0.01=0.3,
质量超过505 g的产品数量为40×0.3=12(件).
(2)质量超过505 g的产品数量为12件,则质量未超过505 g的产品数量为28件,X的所有可能取值为0,1,2,且X服从超几何分布.
P(X=0)==,P(X=1)==,P(X=2)==,
X的分布列为
X
0
1
2
P
(3)根据样本估计总体的思想,任取一件产品,该产品的质量超过505 g的概率为=.
从流水线上任取2件产品互不影响,该问题可看成2次独立重复试验,质量超过505 g的件数Y的可能取值为0,1,2,且Y~B(2,),P(Y=k)=C×(1-)2-k×()k,所以P(Y=0)=C×()2=,P(Y=1)=C××=,P(Y=2)=C×()2=.
Y的分布列为
Y
0
1
2
P
$$