内容正文:
7.5正态分布
第七章 随机变量及其分布
人教A版 选择性必修 第三册
知识回顾
一般地, 假设一批产品共有N件, 其中有M件次品. 从N件产品中随机抽取n件(不放回), 用X表示抽取的n件产品中的次品数, 则X的分布列为
一、超几何分布及其分布列
其中n,N,M∈N*,M≤N, n≤N, m =max{0, n-(N-M)}, r=min{n, M}.
如果随机变量X的分布列具有上式的形式, 那么称随机变量X服从超几何分布.
二、超几何分布的均值
P(X=k) = , k=m, m+1, m+2, …, r.
E(X)
1.了解正态曲线和正态分布的意义;
2.理解正态曲线的性质;
3.明确正态分布中参数μ,σ的意义及其对正态曲线形状的影响.
学习目标
自学指导
阅读课本83--86页,完成以下问题:
问题1 正态曲线及性质。
问题2 正态分布的性质。
现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续型随机变量.
问题 自动流水线包装的食盐,每袋标准质量为400g. 由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量). 用X表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X(单位: g) 的观测值如下: -0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9 -2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2 0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6 0.4 2.6 -2.0 -0.2 1.8 -0.7 -1.3
-0.5 -1.3 0.2 -2.1 2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5 3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6-4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1-1.7 -0.5 -0.8 1.7 1.4 4.4 1.2
-1.8 -3.1 -2.1 -1.6 2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9 -2.2 -0.7 -1.3 1.5 -1.5
-2.2 1.0 1.3 1.7 -0.9
(1) 如何描述这100个样本误差数据的分布?
(2) 如何构建适当的概率模型刻画误差X的分布?
(1) 如何描述这100个样本误差数据的分布?
频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1.
观察图形可知: 误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁.
0
-6
-4
2
0
-2
频率/组距
0.05
0.10
0.15
0.20
X
4
6
(1)
(2) 如何构建适当的概率模型刻画误差X的分布?
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如图(2)所示.
0
-6
-4
2
0
-2
频率/组距
0.05
0.10
0.15
0.20
X
4
6
(2)
0
-6
-4
2
0
-2
f(x)
0.05
0.10
0.15
0.20
X
4
6
(3)
根据频率与概率的关系,可用图(3)中的钟形曲线(曲线与水平轴之间的区域的面积为1)来描述袋装食盐质量误差的概率分布. 例如,任意抽取一袋食盐,误差落在[-2, -1]内的概率,可用图中黄色阴影部分的面积表示.
思考1 由函数知识可知,图(3)中的钟形曲线是一个函数. 那么,这个函数是否存在解析式呢?
0
-6
-4
2
0
-2
f(x)
0.05
0.10
0.15
0.20
X
4
6
(3)
对任意x∈R,f(x)>0,它的图象在x轴的上方,x轴和曲线之间的区域的面积为1. 我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线.
其中μ∈R,σ>0为参数.
教师点拨
正态分布
其中μ∈R,σ>0为参数.
0
-6
-4
2
0
-2
f(x)
0.05
0.10
0.15
0.20
X
4
6
(3)
若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ, σ2).
特别地,当μ=0, σ=1时,称随机变量X服从标准正态分布.
若X~N(μ,σ2),则如图(4)所示,X取值不超过x的概率P(X ≤ x)为图中区域A的面积,而P(a ≤ X ≤ b)为区域B的面积.
(4)
思考2 观察正态曲线及相应的密度函数,你能发现正态曲线的哪些特点?
(1) 曲线是单峰的,它关于直线x=μ对称;
(2) 曲线在x=μ处达到峰值
(3) 当|x| 无限增大时,曲线无限接近x轴.
思考3 一个正态分布由参数μ和σ完全确定,这两个参数对正态曲线的形状有何影响? 它们反映正态分布的哪些特征?
参数μ反映了正态分布的集中位置,可以用均值来估计,故有
当σ较小时,峰值高,曲线“瘦高”,表示随机变量X的分布比较集中;当σ较大时,峰值低,曲线“矮胖”,表示随机变量X的分布比较分散,所以σ反映了随机变量的分布相对于均值μ的离散程度,可以用标准差来估计,故有
σ=0.5
0
1
2
-1
-2
x
-3
3
x=μ
σ=1
σ=2
(1) 曲线在x轴的上方,与x轴不相交;
(3) 曲线与x轴之间的面积为1;
(4) 当μ一定时,σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.
(2) 曲线是单峰的,它关于直线x=μ对称,且曲线在x=μ处取得最大值;
(5) 参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的离散程度.
教师点拨
正态曲线的性质
小组互助
练习:1. 若X~N(2, 3),则E(X)=______,D(X)=_______.
2. X~N(μ, σ2),若E(X)=3, σ(X)=2,则μ=______, σ=______.
2
3
2
3
例1 一个正态曲线图象如图所示,则随机变量X的样本均值μ= ,样本方差σ2= .
20
2
小组互助
小组互助
教师点拨
正态曲线下的面积规律
正态曲线下对称区域的面积相等
对应的概率也相等
利用“对称法”求正态分布下随机变量在某个区间的概率.
a
-a
-x1 -x2 x2 x1
小组互助
练习 若X~N(1, σ2),且P(X<0)=a,则
(1) P(X>1)=_________;
(2) P(X>0)=_________;
(3) P(0<X<1)=_______;
(4) P(X<2)=_________;
(5) P(0<X<2)=_______.
0
1
2
-1
-2
x
y
-3
3
4
μ=1
0.5
1-a
0.5-a
1-a
1-2a
√
小组互助
√
小组互助
√
√
√
变式2
小组互助
2. 已知η~N(1,4),若P(η>2a)=P(η<a-1),则a=( )
A. -1 B. 0 C. 1 D. 2
√
小组互助
小组互助
例3 (1)已知随机变量X服从正态分布N(0,σ2),若P(X>2)=0.023,
则P(-2<X<2)=( )
A.0.477 B.0.625 C.0.954 D.0.977
(2)随机变量Y服从正态分布N(1,4),若P(2<Y<3)=a,则
P(Y<-1)+P(1<Y<2)=( )
C
B
(2)已知随机变量X服从正态分布N(1,σ2),P(X<4)=0.84,则P(X<-2)= .
变式3 (1)已知随机变量X~N(2,σ2),若P(X<a)=0.32,则P(a≤X<4-a)= .
0.36
0.16
小组互助
特殊区间的概率:
由此看到,尽管正态变量的取值范围是(-∞, +∞),但在一次试验中,X的取值几乎总是落在区间[μ-3σ, μ+3σ]内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.
在实际应用中,通常认为服从于正态分布N(μ, σ2)的随机变量X只取[μ-3σ, μ+3σ]中的值,这在统计学中称为3σ原则.
小组互助
例4 已知X~N(0,1),则X在区间(-∞,-2)内取值的概率约为( )
A.0.954 B.0.046 C.0.977 D.0.023
D
小组互助
变式4 若X~N(1,22),求: ①P(-1≤X≤3); ②P(3≤X≤5).
1. 设随机变量X~N(0, 1),则X的密度函数为_____________________,P(X≤0)=_____ ,P( |X|≤1)=_______, P(X≤1)=________, P(X>1)=________ (精确到0.0001.)
0.5
0.6827
0.84135
0.15865
O
1
-1
x
y
μ=0
2. 设随机变量X~N(0, 22),随机变量Y~N(0, 32),画出分布密度曲线草图,并指出P(X≤-2)与P(X≤2)的关系,以及P( |X|≤1)与P( |Y|≤1)之间的大小关系.
O
1
-1
x
y
σ=3
σ=2
2
-2
例5 在某次数学考试中,考生的成绩X服从正态分布N(90,100).
(1)求考试成绩X落在区间[70,110]内的概率;
(2)若这次考试共有2 000名考生参加,试估计考试成绩落在区间(80,100)内的考生人数.
小组互助
变式5 某年级的一次信息技术测验成绩近似服从正态分布N(70,102),如果规定低于60分为不及格,求:
(1)成绩不及格的学生人数占总人数的比例;
(2)成绩在80~90分的学生人数占总人数的比例.
小组互助
若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ, σ2). 特别地,当μ=0, σ=1时,称随机变量X服从标准正态分布.
1. 正态分布:
正态密度函数:
2.特殊区间的概率:
课后反思
变式1若一个正态密度函数是一个偶函数,且该函数的最大值为,求该正态密度函数的解析式.
f(x)=,x∈(-∞,+∞).
例2 (1)甲、乙两类水果的质量(单位:kg)分别服从正态分布N(μ1,σeq \o\al(2,1)),N(μ2,σeq \o\al(2,2)),正态曲线如图所示,则下列说法错误的是( )
A.甲类水果的平均质量为0.4 kg
B.甲类水果的质量比乙类水果的质量更集中于平均质量
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从的正态分布的参数σ2=1.99
(2)已知三个正态密度函数
(x∈R,i=1, 2, 3)的图象如图所示,则( )
A. μ1<μ2=μ3,σ1=σ2>σ3 B. μ1=μ2<μ3,σ1<σ2=σ3
C. μ1>μ2=μ3,σ1=σ2<σ3 D. μ1<μ2=μ3,σ1=σ2<σ3
1.(多选)某市组织一次高三调研考试,考试后统计的数学成绩X(单位:分)服从正态分布,其正态密度函数f(x)=eq \f(1,10\r(2π))·e-eq \s\up16(\f((x-80)2,200)),则下列说法正确的是( )
A.这次考试的数学平均成绩为80分
B.分数在120分以上的人数与分数在60分以下的人数相同
C.分数在110分以上的人数与分数在50分以下的人数相同
D.这次考试的数学成绩的标准差为10
A. B.-a
C.a+0.003a D.+a
$