内容正文:
7.5 正态分布
第七章 随机变量及其分布
复习回顾
回顾 前面已经研究过哪些重要的离散型随机变量?
二项分布:
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p (0<p<1),用X表示事件A发生的次数,则X的分布列为
如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布, 记作X ~B(n,p).
P(X=k)=×pk×(1-p)n-k, (k=0, 1, 2, …, n).
若X~B(n, p),则有
二项分布的均值与方差:
E(X)= , D(X)= .
np
np(1-p)
复习回顾
回顾 前面已经研究过哪些重要的离散型随机变量?
一般地,假设一批产品共有N件,其中有M件次品. 从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为
超几何分布及其分布列
超几何分布的均值与方差
P(X=k) = , k=m, m+1, m+2, …, r.
E(X)=np (其中),D(X)=np(1-p)
新课导入
现实中, 还有大量问题中的随机变量不是离散的,例如
在生产中,在正常生产条件下各种产品的质量指标(如零件的尺寸、维的纤度等);
在测量中,长度测量误差,某一地区同年龄人群的身高、体重等;
在生物学中,一定条件下生长的小麦的株高、穗长、单位面积产量等;
在气象中,某地每年七月份的平均气温、平均湿度以及降雨量等;
它们的取值往往充满某个区间甚至整个实轴 , 但取一点的概率为0 , 我们称这类随机变量为连续性随机变量 , 这就是我们所要学习的正态分布。
问题1 自动流水线包装的食盐,每袋标准质量为400g. 由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量). 用X表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X (单位: g) 的观测值如下:
-0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9
-2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2
0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6 0.4
2.6 -2.0 -0.2 1.8 -0.7 -1.3 -0.5 -1.3 0.2 -2.1
2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5
3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6
-4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1 -1.7
-0.5 -0.8 1.7 1.4 4.4 1.2 -1.8 -3.1 -2.1 -1.6
2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9
-2.2 -0.7 -1.3 1.5 -1.5 -2.2 1.0 1.3 1.7 -0.9
新知探究
(1) 如何描述这100个样本误差数据的分布?
(2) 如何构建适当的概率模型刻画误差X的分布?
新知探究
根据已学的统计知识,可用频率分布直方图描述这组误差数据的分布,如图(1)所示.
(1) 如何描述这100个样本误差数据的分布?
(2) 如何构建适当的概率模型刻画误差X的分布?
频率/组距
X
-6
0
-4
-2
0
0.15
0.05
0.10
0.20
4
2
6
图 (1)
频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1.
观察图形可知: 误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁.
新知探究
追问1 随着样本数据量越来越大,让分组越来越多,组距越来越小,频率分布直方图的轮廓会发生什么变化?
n=9
n=50
n=107
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线.
新知探究
P
X
-6
0
-4
-2
0
0.15
0.05
图 (3)
0.10
0.20
4
2
6
根据频率与概率的关系,可用左图中的钟形曲线(曲线与水平轴之间的区域的面积为1)来描述袋装食盐质量误差的概率分布.