内容正文:
鉴别超几何分布与二项分布及其求法策略
超几何分布与二项分布是离散型随机变量中的两种重要概率分布.在教学过程中,发现许多学生不能准确地辨别所要解决的问题是属于超几何分布还是二项分布,对这两模型的定义不能很好地理解,特别是对于同一个具体问题而错误使用另一种分布列模型所求出的期望值却是一样的,这更加使学生感到困惑和迷惘.事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别;下面将从多个视角来辨析和鉴别它们,目的是帮助同学们区分这两种分布列及其正确求法.
知识梳理
1.超几何分布的定义
一般地,在含有件次品的件产品中,任取件产品,用表示取出的件产品中次品的件数,则事件发生的概率为:,
,其中,且均为正整数,当时
,当时;称满足上述条件的概率模型为超几何分布.如果一个随机变量的分布列为超几何分布列,则称随机变量服从参数为的超几何分布,记为;其数学期望,方差.
2.二项分布的定义
在次独立重复试验中,设事件发生的次数为,且每次试验事件发生的概率均为,则在次独立重复试验中,事件恰好发生次的概率为:,
,其中为正整数;称满足上述条件的概率模型为二项分布.如果一个随机变量的分布列为二项分布列,则称随机变量服从参数为的二项分布,也称为每次试验事件成功的概率,记为;其数学期望,方差.
3.超几何分布与二项分布的联系
超几何分布与二项分布是两种不同的分布,但当把一个分布看作是“超几何分布”或“二项分布”时,用各自的期望公式计算出的期望值是相等的.事实上,对于“超几何分布”中的各参数,可证得期望,若是“二项分布”中每次试验事件成功的概率,就易知两者的期望值是一样的,这或许是超几何分布与二项分布在期望值计算中的一种“机缘巧合”.当产品的总数很大时,超几何分布近似于二项分布;另外,这两种分布若每次试验都是从总体中取出一个个体,则每次试验只有两种可能的结果:发生(成功)或不发生(失败).
4.超几何分布与二项分布的区别
超几何分布概率模型与二项分布概率模型最主要的区别在于:是放回抽样还是不放回抽样,超几何分布是不放回抽取,而二项分布是放回抽取;超几何分布需要知道总体的容量,而二项分布不需要知道总体的容量,但需要知道每次试验的“成功率”.因此,在解有关超几何分布和二项分布的试题时,需要仔细阅题、审题并辨析题目条件是至关重要的解题环节.
典例剖析
一、从逐一抽取样本个体有无放回来区分
例1.一袋中装有个除颜色外大小与重量完全一样的球,其中白球有个、黑球有个,从中随机地连续摸取次球,每次取出个球.(1)若每次摸取球后不放回,设取出黑球的个数为随机变量,求的分布列和数学期望;(2)若每次摸取球先登记颜色后再放回,设取出黑球的次数为随机变量,求的分布列和数学期望.
【解析】(1)因每次摸取球后不放回,则取出黑球的个数为随机变量的所有可能取值为;易知随机变量服从参数的超几何分布,则有
;;.故随机变量的分布列为
则的数学期望为(个).(或由)
(2)因每次摸取球后再放回,则取出黑球的次数为随机变量的所有可能取值为;又每次取出黑球的概率均为,次摸取球可看作次独立重复试验,易知.则有;;
;.故随机变量的分布列为
则的期望为(次).(或由)
【点评】本题解答的关键点是抓住和区分每次摸出球后是有放回还是不放回的取法.第(1)问是不放回的摸球取法,则随机变量服从超几何分布;第(2)问是有放回的摸球取法,故随机变量服从二项分布;并且通过计算可确认两者的期望值是相等的.
二、从样本总数和所含次品数是否确定来区分
例2.某工厂为检验其所生产的产品的质量,从所生产的产品中随机抽取件进行抽样检验,检测出有件次品.(1)从这件产品中随机取出件,设这件产品中含次品件数为,求的分布列和期望;(2)用频率估计概率,若所生产的产品按每箱件装箱,从一箱产品中随机抽取件,设这件产品中含次品件数为,求的分布列和期望;(3)用频率估计概率,从所生产的产品中随机抽取件,设这件产品中含次品件数为,求的分布列和期望.
【解析】(1)依题意,随机变量的可能取值为;且服从参数
的超几何分布,则有(),故的分布列为
则的期望(件).
(2)依题意,随机变量的可能取值为;用频率估计概率,这表明从一箱产品中任取一件,取到该件产品是次品的概率为,从而.则有
()为所求随机变量的分布列,则的期望(件).
(3)依题意,随机变量的可能取值为;用频率估计概率,表明从所生产的产品中任取一件,取到该件产品是次品的概率为,知.则有
()为所求随机变量的分布列,则的期望(件).
【点评】对于第(1)问,由于抽取产品的总体件数,所含次品件数,且不放回抽取件数都是确定的,故该随机变量服从超几何分布.第(2)问是从一箱产品中抽取,产品的总体是确定的,而其中有多少件次品是不确定的,但要防止根据样本误确认,因其违背了题中“用频率估计概率”这一限定条件;由概率定义,“用频率估计概率”其意思应理解为“从这箱件产品中任取一件,取到该件产品是次品的概率为,且同时抽取件等同于不放回地每次抽一件共抽取次”,这其实可看作为一个独立重复试验,故随机变量服从二项分布.第(3)问是从所生产的全部产品中抽取,而全部产品有多少件题目条件没有给出,即总体是不确定的(若总体确定,就属于第(2)问情形),且所含次品件数也是不确定的,但在“用频率估计概率”这一限定条件下,随机变量同样服从二项分布.
【反思与总结】超几何分布的问题本质:一个总体(共有个)含有l类事物中的两种不同事物(有个)和(有个),从总体中任取个,则取到事物的个数为,求随机变量的分布列;在每次试验中事件发生的概率不同,是一种不放回抽样,且和的数值是确定的,特别当样本容量很大时,超几何分布近似于二项分布.二项分布的问题本质:在一次试验中试验结果只有与这两个,每次仅发生一个,要么发生,要么发生,且每次试验中事件发生的概率均为,事件发生的概率均为;是一种放回抽样,即试验可以独立重复进行,随机变量是这次独立重复试验中事件发生的次数.
【针对训练题】
1.一盒子中有大小相同的个球,其中有个红球和个黑球.(1)从中每次随机取出个球记录颜色后再放回,且连续抽取三次,求取到红球次数的分布列和期望;(2)从中随机逐个不放回地抽取出个球(效果等同于一次同时取出个球),求取到红球个数的分布列和期望.
2.从一个养有大量鱼苗的水塘中随机捕捉到条鱼苗,其中有条草鱼.(1)若从这捕捉到的条鱼苗中随机捉取条,设这条鱼苗中含草鱼条数为,求的分布列和期望;(2)用频率估计概率,若从该水塘中随机捕捉条鱼苗,设这条鱼苗中含草鱼条数为,求的分布列以及期望和方差;(3)用频率估计概率,假设该水塘中有条鱼苗,设表示水塘中含草鱼苗的条数,试估计的值.
针对训练题答案与解析
1.解:(1)因从中有放回地每次取出一个球,连续抽取三次,则每次取到红球的概率均为,依题意知随机变量,且的所有可能取值为.则;;;.故取到红球次数的分布列为:
则的期望(次).
(2)依题意知,取到红球个数服从参数的超几何分布,且的所有可能取值为.则;;.故取到红球个数的分布列为:
则的期望(个).
2.解:(1)依题意,随机变量的可能取值为;且服从参数的超几何分布,则有()为的分布列,.
(2)依题意,随机变量的可能取值为;用频率估计概率,表明从该水塘中随机捕捉任意一条鱼苗,捉到该鱼苗是草鱼的概率为,知.则有
()为的分布列,则的期望,方差
(3)依题意,用频率估计概率,知,则期望,故的估计值为,即水塘中大约有条草鱼苗.
学科网(北京)股份有限公司
$