内容正文:
7.5 正态分布
安徽省太和中学
二项分布、超几何分布描述的是离散型随机变量的概率分布规律,
现实中, 还有大量问题中的随机变量不是离散的,例如:
在生产中:某电器的使用寿命;
在测量中,长度测量误差,某一地区同年龄人群的身高、体重等;
在生物学中,一定条件下生长的小麦的株高、穗长、单位面积产量等;
在气象中,某地每年七月份的平均气温、平均湿度以及降雨量等;
如果随机变量X的所有取值不可以逐个列举出来,而是充满某个区间甚至
整个实轴,但取一点的概率为0,我们称这类变量为连续型随机变量.
随机变量
离散型随机变量
连续型随机变量
二项分布
超几何分布
?分布
正态分布
安徽省太和中学
问题1 自动流水线包装的食盐,每袋标准质量为400g. 由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量). 用X表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X (单位: g) 的观测值如下:
-0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9
-2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2
0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6 0.4
2.6 -2.0 -0.2 1.8 -0.7 -1.3 -0.5 -1.3 0.2 -2.1
2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5
3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6
-4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1 -1.7
-0.5 -0.8 1.7 1.4 4.4 1.2 -1.8 -3.1 -2.1 -1.6
2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9
-2.2 -0.7 -1.3 1.5 -1.5 -2.2 1.0 1.3 1.7 -0.9
安徽省太和中学
如何描述这100个样本误差数据的分布?
观察图形可知:
频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1.
误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁.
分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定.
安徽省太和中学
根据频率与概率的关系,可用下图中的钟形曲线(曲线与水平轴之间的区域的面积为1)来描述袋装食盐质量误差的概率分布.
例如,任意抽取一袋食盐,误差落在[-2, -1]内的概率,可用图中黄色阴影部分的面积表示.
根据函数知识,下图曲线它是函数吗?若是,这个函数是否存在解析式呢?
安徽省太和中学
正态密度函数与正态分布
显然,对任意的x∈R,f(x)>0,它的图象在x轴的上方,可以证明x轴和曲线之间的区域的面积为1. 我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ, σ2).
其中μ∈R,σ>0为参数.
特别地,当μ=0, σ=1时,称随机变量X服从标准正态分布.
y
0
1
2
-1
-2
x
-3
3
μ=0
σ=1
安徽省太和中学
①非负性:对∀x∈R,f(x)>0,它的图象在x轴的.
②定值性:曲线与x轴之间的区域的面积为.
③对称性:曲线是单峰的,它关于直线对称.
④最大值:曲线在处达到峰值.
⑤渐近线:当|x|无限增大时,曲线无限接近轴.
正态密度函数与正态分布
X取值不超过x的概率P(X≤x)为图中区域A的面积,
而P(a≤X≤b)为区域B的面积.
若X~N(μ,σ2),则如图所示,
正态曲线的特点
正态分布的几何意义:
安徽省太和中学
正态曲线的特点:
(6)为位置参数:
参数μ反映了正态分布的集中位置,可以用均值来估计,故有E(X)=μ.
当一定时,正态曲线的位置由μ确定,正态曲线随着的变化而沿x轴平移.
(7)为形状参数:当μ一定时,
当μ固定时,因为正态曲线的峰值与σ成反比,而且对任意的σ>0,正态曲线与x轴之间的区域的面积总为1.σ越大,曲线越“矮胖”,表示总体的分布越“分散”;
σ越小,曲线越“瘦高”,表示总体的分布越“集中”.所以反映了随机变量的分布相对于均值μ的离散程度,故有;
安徽省太和中学
参数反映了正态分布的集中位置,反映了随机变量的分布相对于均值的离散程度. 实际上,我们有:
安徽省太和中学
例 李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到: 坐公交车平均用时30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4. 假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1) 估计X,Y的分布中的参数;
(2) 根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
(3) 如果某天有38 min可用,李明应选择哪种交通工具? 如果某天只有34 min可用,又应该选择哪种交通工具? 请说明理由.
安徽省太和中学
解:(1) 随机变量X的样本均值为30,样本标准差为6;
随机变量Y的样本均值为34,样本标准差为2.
用样本均值估计参数μ,用样本标准差估计参数σ,可以得到
X~N(30, 62),Y~N(34, 22).
(2)由(1)得X~N(30, 62),Y~N(34, 22),作出X和Y的分布密度曲线如图示.
(3) 应选择在给定时间内不迟到的概率大的交通工具.
由图可知,
P(X≤38)<P(Y≤38), P(X≤34) > P(Y≤34).
所以,如果有38 min可用,那么骑自行车不迟到的概率大,应选择骑自行车;
如果只有34 min可用,那么坐公交车不迟到的概率大,应选择坐公交车.
安徽省太和中学
【练习】(1)已知随机变量服从正态分布,其正态曲线如图所示,则总体的均值
μ= ,方差σ2= .
解析:(1)从给出的正态曲线可知,该正态曲线关于直线x=20对称,最大值是,解得σ=,
因此总体的均值μ=20,方差σ2=()2=2.
安徽省太和中学
(2)(多选)一次教学质量检测中,甲、乙、丙三科考试成绩的正态曲线如图所示,下列说法中不正确的是( )
A.甲科总体的标准差最小
B.丙科总体的平均数最小
C.乙科总体的标准差及平均数都比甲小,比丙大
D.甲、乙、丙总体的平均数不相同
BCD
解析:由题图可知三科总体的平均数(均值)相等,由正态曲线的性质,可知σ越大,正态曲线越“矮胖”,σ越小,正态曲线越“瘦高”.
故三科总体的标准差从小到大依次为甲、乙、丙.
安徽省太和中学
正态曲线下对称区域的面积相等的含义
-x1 -x2 x2 x1
= 0
a
-a
正态曲线下对称区域的面积相等,代表对应的概率也相等.
利用“对称法”求正态分布下随机变量在某个区间的概率
安徽省太和中学
假设X~N(μ, σ2),可以证明: 对给定的k∈N*,P(μ-kσ≤X≤μ+kσ)是一个只与k有关的定值.
在实际应用中, 通常认为服从于正态分布N(μ, σ2)的随机变量X只取[μ-3σ, μ+3σ]中的值, 这在统计学中称为3σ原则.
由此看到,尽管正态变量的取值范围是(-∞, +∞),但在一次试验中,X的取值几乎总是落在区间[μ-3σ, μ+3σ]内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.
正态分布的原则
安徽省太和中学
【例2】 设ξ~N(1,22),试求:
(1)P(-1≤ξ≤3);
(2)P(3<ξ≤5).
解析:∵ξ~N(1,22),∴μ=1,σ=2,
P(-1≤ξ≤3)=P(1-2≤ξ≤1+2)=P(μ-σ≤ξ≤μ+σ)≈0.682 7.
(2)∵P(3<ξ≤5)=P(-3≤ξ<-1),
∴P(3<ξ≤5)=[P(-3≤ξ≤5)-P(-1≤ξ≤3)]
=[P(1-4≤ξ≤1+4)-P(1-2≤ξ≤1+2)]
=[P(μ-2σ≤ξ≤μ+2σ)-P(μ-σ≤ξ≤μ+σ)]
≈×(0.954 5-0.682 7)=0.135 9.
安徽省太和中学
【练习1】(1)已知随机变量ξ服从正态分布N(1,σ2),且P(ξ<2)=0.6,则P(0<ξ<2)等于( )
A.0.4 B.0.3 C.0.2 D.0.1
C
解析:由已知可得正态曲线关于直线x=1对称,P(ξ<2)=0.6,
所以P(ξ≥2)=P(ξ≤0)=0.4,
故P(0<ξ<2)=1-0.4-0.4=0.2.
安徽省太和中学
【练习】(2)随机变量ξ服从正态分布N(μ,σ2),若P(ξ<2)=0.2,P(2<ξ<6)=0.6,则μ等于( )
A.3 B.4 C.5 D.6
B
解析:∵P(ξ<2)=0.2,P(2<ξ<6)=0.6,
∴P(ξ>6)=1-0.2-0.6=0.2,即P(ξ<2)=P(ξ>6),
∴μ==4.
安徽省太和中学
【例3】 在某次考试中,考生的成绩X服从正态分布,即 X~N(90,100)
(1)求考试成绩X位于区间(70,110]上的概率是多少?
(2)若这次考试共有2000名考生,试估计考试成绩在(80,100] 之间的考生大约有多少人?
[解] ∵X~N(90,100),∴μ=90,σ=10.
(1)在该正态分布中,μ-2σ=70,μ+2σ=110,
∵P(μ-2σ<X≤μ+2σ)=0.9545,
∴考试成绩X位于区间(70,110]内的概率为0.9545.
(2)μ-σ=80,μ+σ=100,
∵P(μ-σ<X≤μ+σ)=0.6827,
∴考试成绩X位于区间(80,100]内的概率为0.6827.
由共有2000名考生,知考试成绩在(80,100]间的考生大约有2000×0.6827≈1 365(人).
解析:(1)根据题意,
P≤0.045 5⇒P=P≥1-0.045 5=0.9545,
而μ=0,则P(-2σ≤Xn≤2σ)≈0.954 5,
所以2σ≤⇒σ=≤⇒n≥128.
练习 (1)现实世界中的很多随机变量遵循正态分布.例如反复测量某一个物理量,其测量误差X通常被认为服从正态分布.若某物理量做n次测量,最后结果的误差Xn ~N,则为使|Xn|>的概率控制在0.0455及以下,至少要测量的次数为( )
(附:若随机变量X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,
P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3)
A.32 B.64 C.128 D.256
C
安徽省太和中学
例4.某企业产品正常生产时,产品尺寸服从正态分布N(80,0.25),从当前生产线上随机抽取200件产品进行检测,产品尺寸汇总如下表:
根据产品质量标准和生产线的实际情况,产品尺寸在[μ一3σ,μ+3σ]以外视为小概率事件,一旦小概率事件发生,视为生产线出现异常,产品尺寸在[μ一 3σ,μ+3σ]以内为正品,以外为次品.
(1)判断生产线是否出现异常,并说明理由.
(2)用频率表示概率,若再随机从生产线上取3件产品复检,正品检测费10元/件,次品检测费15元/件.记这3件产品检测费为随机变量X,求X的数学期望及方差.
附:若X~N(μ,2) 则:
安徽省太和中学
1. 正态曲线及正态密度函数
2. 正态分布:
3. 正态曲线的性质
(1)对称性:曲线是单峰的,它关于直线x=μ对称.
(2)最值性:曲线在x=μ处达到峰值(最高点)
(3)当|x|无限增大时,曲线无限接近x轴.
4. 正态分布的3σ原则
课堂小结
安徽省太和中学
$