内容正文:
7.5 正态分布
1.了解正态曲线和正态分布的概念.
2.认识正态曲线的特点及曲线所表示的意义.
3.会根据正态曲线的性质求随机变量在某一区间范围内的概率.
现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续型随机变量.
下面我们看一个具体问题.
问题:自动流水线包装的食盐,每袋标准质量为400g. 由于各种不可控制的因素,任意取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量).用 X 表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差 X 的观测值如下:
-0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9
-2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2
0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6 0.4
正态分布
2.6 -2.0 -0.2 1.8 -0.7 -1.3 -0.5 -1.3 0.2 -2.1
2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5
3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6
-4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1 -1.7
-0.5 -0.8 1.7 1.4 4.4 1.2 -1.8 -3.1 -2.1 -1.6
2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9
(1)如何描述这100个样本误差数据的分布?
(2)如何构建适当的概率模型刻画误差 X 的分布?
根据已学的统计知识,可用频率分布直方图描述这组误差数据的分布. 频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1.
观察图形可知:观测误差有正有负,并大致对称地分布在 的两侧,而且小误差比大误差出现得更频繁.
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线.
根据频率与概率的关系,可用下图中的钟形曲线(曲线与水平轴之间的区域的面积为1)来描述袋装食盐质量误差的概率分布. 例如,任意抽取一袋食盐,误差落在内的概率,可用图中黄色阴影部分的面积表示.
对于上图的钟形曲线,数学家们找到了它的函数解析式
显然,对任意的 , ,它的图象在 x 轴的上方. 可以证明 x 轴和曲线之间的区域的面积为1. 我们称 为正态密度函数,称它的图象为正态密度曲线,简称正态曲线.
若随机变量 X 落的概率分布密度函数为 ,则称随机变量 X 服从正态分布,记为 . 特别地,当 , 时,称随机变量 X 服从标准正态分布.
若 ,则如图所示,X 取值不超过 x 的概率 为图中区域 A 的面积,而 为图中区域 B 的面积.
正态曲线的特点
观察正态曲线及相应的密度函数,可以发现正态曲线有以下性质:
(1)曲线位于 x 轴上方,与 x 轴不相交,当|x|无限增大时,曲线无限接近 x 轴;
(2)曲线是单峰的,它关于直线 对称;
(3)曲线在 处达到峰值(最大值) ;
(4)曲线与 x 轴之间的面积为1;
(5)当 σ 一定时,曲线的位置由 μ 确定,曲线随着 μ 的变化而沿 x 轴左右平移;
(6)当 μ 一定时,曲线的形状由 σ 确定, σ 越小,曲线越“瘦高”,表示随机变量 X 的分布越集中; σ 越大,曲线越“矮胖”,表示随机变量 X 的分布越分散;
(7)参数 μ 反映了正态分布的集中位置,σ 反映了随机变量的分布相对于均值 μ 的离散程度. 实际上,我们有
若 ,则 , .
例1 一次教学质量检测中,甲、乙、丙三科考试成绩的正态分布密度曲线如图所示,下列说法中正确的是( )
A.甲科总体的标准差最小
B