内容正文:
7.4.2 超几何分布
知识复习
1. 二项分布:
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p (0<p<1),
用X表示事件A发生的次数,则X的分布列为
如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布, 记作X ~B(n,p).
若X~B(n, p),则有
2. 二项分布的均值与方差:
每次抽到次品的概率都是0.08,但每次抽取不是同一个试验,且各次抽取的结果不独立,故X不服从二项分布.则X的分布列是:
每次抽到次品的概率为0.08,且各次抽样的结果相互独立,此时X服从二项分布,即X~B(4,0.08).
采用有放回抽样
采用不放回抽样
解:由题意可知,X可能的取值为0, 1, 2,3,4
则X的分布列是:
X 0 1 2 3 4
P
P(X=k)=
(k=0,1,2,3,4)
问题1 已知100件产品中有8件次品,现从中分别采用有放回和不放回的方式随机抽取4件.设抽取的4件产品中次品数为X,求随机变量X的分布列.
P(X=k)=
(k=0,1,2,3,4)
3
一般地, 假设一批产品共有N件, 其中有M件次品. 从N件产品中随机抽取n件(不放回), 用X表示抽取的n件产品中的次品数, 则X的分布列为:
超几何分布:
其中n, N, M∈N*, M≤N, n≤N, m=max{0, n-(N-M)}, r=min{n, M}. 如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
P(X=k)= (k=m,m+1,m+2,……,r.)
记为X~H(N,n, M).
N—总体中的个体总数
M—总体中的特殊个体总数(如次品总数)
n—样本容量
k—样本中的特殊个体数(如次品数)
提醒:正确理解其条件以及参数的意义
总数为的产品
次品有件
正品有件
随机抽取件,其中含次品件
当,即,抽到的样本可能没有次品,则
当,即,样本中必有次品,且
的理解
总数为的产品
次品有件
正品有件
随机抽取件,其中含次品件
当抽到的产品件数不大于总体中次品的个数(即)时,
当抽到的产品件数大于总体中次品的个数(即)时,
【例1】下列问题中,哪些属于超几何分布问题,说明理由.
(1)抛掷三枚骰子,所得向上的数是6的骰子的个数记为X,求X的分布列;
(2)有一批种子的发芽率为70%,任取10颗种子做发芽实验,把实验中发芽的种子的个数记为X,求X的分布列;
(3)盒子中有红球3个,黄球4个,蓝球5个(除颜色外无区别),任取3个球,把不是红色的球的个数记为X,求X的分布列;
(4)某班级有男生25人,女生20人.选派4名学生参加学校组织的活动,其中女生人数记为X,求X的分布列.
不是
不是
是
是
判断一个变量是否服从超几何分布的方法:①总体中含有两类不同的个体;②不放回地抽取;③随机变量是从总体中抽取的n个个体中某一类个体的数量.
解:设X表示选出的5名学生中含甲的人数(只能取0或1),则X服从超几何分布,且N=50, M=1, n=5.
例2 从50 名学生中随机选出5名学生代表,求甲被选中的概率.
因此甲被选中的概率为
容易发现,每个人被抽到的概率都是 . 这个结论非常直观,上述解答过程就是这一结论的推导过程.
解:设X表示抽取10个零件中不合格品数,则X服从超几何分布,其分布列为
例3 一批零件共有30个,其中有3个不合格. 随机抽取10个零件进行检测,求至少有1件不合格的概率.
∴至少有1件不合格的概率为
(直接法)
(间接法)
超几何分布的均值
设随机变量服从超几何分布,则可以解释为从包含件次品的件产品中,不放回地随机抽取件产品中的次品数.
令,则是件产品的次品率,而是抽取的件产品的次品率,我们猜想,即.
令 ,,
由随机变量均值的定义:
当时,
. ①
因为,
所以.
当时,注意到(1)式中间求和的第一项为0,
类似可以证明结论依然成立.
练习(1)盒子里有5个球,其中3个白球,2个黑球,从中任取两球,设取出白球的个数为ξ,则E(ξ)=____.
(2)有10件产品,其中3件是次品,从中任取两件,若X表示取得次品的个数,
则P(X<2)=____,随机变量X的均值E(X)=____.
P79 例6 一个袋子中有100个大小相同的球,其中有40个黄球、60 个白球,从中随机地摸出20个球作为样本. 用X表示样本中黄球的个数.
(1) 分别就有放回摸球和不放回摸球,求X的分布列;
(2) 分别就有放回摸球和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.
解:(1) 对于有放回摸球,每次摸到黄球的概率为0.4,且各次试验之间的结果是独立的,因此X~B(20, 0.4),X的分布列为
对于不放回摸球, 各次试验的结果不独立, X服从超几何分布, X的分布列为
(2)利用统计软件计算出两个分布列的概率值(精确到0.00001),如下表所示.
样本中黄球的比例f20= 是一个随机变量, 根据表算得
|f20-0.4|≤0.1⟺ 6≤X≤10
有放回摸球:
P(|f20-0.4|≤0.1)=P(6≤X≤10) ≈ 0.7469.
不放回摸球:
P(|f20-0.4|≤0.1)=P(6≤X≤10) ≈ 0.7988.
因此,在相同的误差限制下,采用不放回摸球估计的结果更可靠些.
两种摸球方式下, 随机变量X分别服从二项分布和超几何分布. 虽然这两种分布有相等的均值(都是8), 但从两种分布的概率分布图(图7.4-4)看, 超几何分布更集中在均值附近.
二项分布和超几何分布都可以描述随机抽取的n件产品中次品数的分布规律, 并且二者的均值相同,对于不放回抽样, 当n远远小于N时, 每抽取一次后, 对N的影响很小, 此时, 超几何分布可以用二项分布近似.
二项分布、超几何分布有什么区别和联系
超几何分布 二项分布
试验类型 抽样 抽样
试验种数 有 种物品 有 种结果
总体容量 个 个
随机变量取值的概率 利用 计算 利用 计算
联系
不放回
放回
两
两
有限
无限
古典概型
独立重复试验
(1)对于同一模型,两个分布的均值相同,但超几何分布的方差较小,随机变量的取值更集中于均值附近
(2)对于不放回摸球,当N充分大,且n远远小于N时,各次抽样结果彼此影响很小,此时超几何分布近似二项分布;从方差角度看,由于,两个分布的方差也近似相等。
孔隆教育 http://mykonglong.taobao.com
孔隆教育 http://mykonglong.taobao.com
15
一般地,假设一批产品共有N件,其中有M件次品. 从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为
超几何分布及其分布列
超几何分布的均值与方差
P(X=k) = , k=m, m+1, m+2, …, r.
记为X~H(N,n,M).
E(X)=np (其中),D(X)=np(1-p)
解:(2)X表示取得次品的个数,则X服从超几何分布,
所以P(X<2)=P(X=0)+P(X=1)=+=+=,
E(X)===0.6.
解:(1)由题意得:
N=5,M=3,n=2;E(ξ)==.
$