内容正文:
回忆与展望
已知100件产品中有8件次品, 有放回随机抽取4件. 设抽取的4件产品中次品数为X,求随机变量X的分布列.
有放回抽样,X服从二项分布,即X~B(4, 0.08).
X的分布列为:
变式:已知100件产品中有8件次品, 不放回随机抽取4件. 设抽取的4件产品中次品数为X,求随机变量X的分布列.
不放回抽样,试验一次有两个不同结果,有点像二项分布,但每次抽取不是同一个试验,各次抽取的结果不独立,X 不服从二项分布
可用古典概型方法求解,但明显有独特性,X服从什么样的分布呢?
7.4.2
超几何分布
自主研读
P77~P79例6之前,梳理知识,记录疑问
超几何分布是如何定义的?它适用于什么样的实际问题?
超几何分布的概率计算公式是什么?公式中的字母各代表什么含义?
超几何分布的期望公式是什么?
超几何分布与二项分布有什么联系和区别?
关注以下问题:
问题一:随机变量X具有哪些特征、分布列具有哪种形式时,称X服从超几何分布?
超几何分布:
一般地, 假设一批产品共有N件, 其中有M件次品. 从N件产品中随机抽取n件(不放回), 用X表示抽取的n件产品中的次品数, 则X的分布列为
其中n, N, M∈N*, M≤N, n≤N, m=max{0, n―N+M}, r=min{n, M}. 如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
超几何分布的三个特征:
①总体中含有两类不同的个体; ②不放回抽样;
③随机变量是从总体中抽取的n个个体中某一类个体的数量.
记为X~H(N, n, M).
判断是否为超几何分布的依据
问题二:请解释超几何分布公式中各个参数的意义?
N—总体中的个体总数
M—总体中的特殊个体总数(如次品总数)
n—样本容量
k—样本中的特殊个体数(如次品数)(即成功元素)
m=max{0, n―N+M}
r=min{n, M}.
M
N-M
问题三:
为什么 ,而不是0, 1, …, n ?
m=max{0, n―N+M}
r=min{n, M}.
0, 1, 2, 3, 4
0, 1, 2, 3, …, 8
3, 4, …, 8
100件产品中有8件次品
抽4件:k=_____________
抽10件:k=_____________
抽95件:k=_____________
本质原因:
组合数有意义及上下标关系
上限限制:X不能超过M(次品总数),也不能超过n(抽取件数),所以最大值是 min(M, n)。
下限限制:X不能少于0,也不能少于 n―(N―M)(因为正品最多有N―M件,如果抽 n 件,最少需要抽到的次品数为 n―(N―M) ,当这个数为负时取0)
问题四:服从超几何分布的随机变量的均值是什么?怎样得到的?
猜想
N 件产品的次品率
抽取的 n 件产品的次品率
证明:
当m>0时,
当m=0时,类似可以证明结论依然成立.
与k无关的常数
雷德蒙恒等式
问题五:关于“二项分布与超几何分布”的辨析 :
从含有M件次品的N件产品中,随机抽取n件,设抽到的次品数为X
如果采取有放回抽样,X服从什么分布?如果采取不放回抽样,X服从什么分布?这两种分布的本质区别是什么?
有放回抽样:每次抽取相互独立,次品率恒定,X服从二项分布 B(n, M/N).
不放回抽样:每次抽取不独立,次品率变化,X服从超几何分布.
本质区别:
1. 二项分布描述的是独立重复试验(有放回);
2. 超几何分布描述的是有限总体不放回抽样.
但当N很大时,不放回近似于放回,超几何分布可近似为二项分布(P80)
典例精析
解:(1) 对于有放回摸球,每次摸到黄球的概率为0.4,且各次试验之间的结果是独立的,因此X~B(20, 0.4),X的分布列为
例1:一个袋子中有100个大小相同的球,其中有40个黄球、60个白球,从中随机地摸出20个球作为样本.用X表示样本中黄球的个数.
(1)分别就有放回摸球和不放回摸球,求X的分布列;
(2)分别就有放回摸球和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.并依此判断哪种方式更可靠.
对于不放回摸球, 各次试验的结果不独立, X服从超几何分布, X的分布列为
典例精析
(2)利用统计软件计算出两个分布列的概率值(精确到0.00001), 如下表所示.
样本中黄球的比例 是一个随机变量, 根据表中数据计算得
因此, 在相同的误差限制下, 采用不放回摸球估计的结果更可靠些.
不放回摸球:
有放回摸球:
典例精析
两种摸球方式下,随机变量X分别服从二项分布和超几何分布,虽然这两种分布有相等的均值(都是8),但从两种分布的概率分布图(如下图)看,超几何分布更集中在均值附近.
典例精析
二项分布和超几何分布都可以描述随机抽取的n件产品中次品数的分布规律,并且二者的均值相同. 对于不放回抽样,当n远远小于N时,每抽取一次后,对N的影响很小,此时,超几何分布可以用二项分布近似.
N较大时计算太麻烦
例2:老师要从10篇课文中随机抽3篇让学生背诵,规定至少要背出其中2篇才能及格.某同学只能背诵其中的6篇,求抽到他能背诵的课文的数量的分布列及均值
典例精析
解:设抽到他能背诵的课文的数量为,则
所以,
,,
所以的分布列为:
2 3
二项分布与超几何分布的区别与联系
超几何分布 二项分布
试验类型 抽样 抽样
试验种数 有 类物品 有 种结果
总体规模
随机变量取值的概率 利用 计算 利用 计算
联系
不放回
放回
两
两
需要总体(有限)中两类的具体数目
不关注总体大小(可视为无限),只需要一类占总体的比例
古典概型
独立重复试验
(1)对于同一模型,两个分布的均值相同,但超几何分布的方差较小,随机变量的取值更集中于均值附近
(2)对于不放回摸球,当N充分大,且n远远小于N时,各次抽样结果彼此影响很小,此时超几何分布近似二项分布
归纳总结
随堂小测
课本P80 练习 1,2,3
课后作业
课本P81 6
大本P75 右侧5
Lavf58.76.100
$