内容正文:
7.5 正态分布
第七章
随机变量及其分布
人教A版选择性必修第三册·高二
章节导读
条件概率与全概率公式
条件概率
全概率公式
随机变量
离散型随机变量
分布列
均值和方差
二项分布
超几何分布
连续型随机变量
正态分布
学 习 目 标
1
2
3
通过误差模型,了解服从正态分布的随机变量
通过具体实例,借助频率分布直方图,了解正态分布的特征,提升直观想象的核心素养
了解正态分布的均值、方差及其含义.
新知导入
现实中, 还有大量问题中的随机变量不是离散的,例如
在生产中,在正常生产条件下各种产品的质量指标(如零件的尺寸、维的纤度等);
在测量中,长度测量误差,某一地区同年龄人群的身高、体重等;
在生物学中,一定条件下生长的小麦的株高、穗长、单位面积产量等;
在气象中,某地每年七月份的平均气温、平均湿度以及降雨量等;
它们的取值往往充满某个区间甚至整个实轴 , 但取一点的概率为0 , 我们称这类随机变量为连续性随机变量 , 这就是我们所要学习的正态分布。
新知探究
问题1 自动流水线包装的食盐,每袋标准质量为400g. 由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量). 用X表示这种误差,则X是一个连续型随机变量. 检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X (单位: g) 的观测值如下:
-0.6 -1.4 -0.7 3.3 -2.9 -5.2 1.4 0.1 4.4 0.9
-2.6 -3.4 -0.7 -3.2 -1.7 2.9 0.6 1.7 2.9 1.2
0.5 -3.7 2.7 1.1 -3.0 -2.6 -1.9 1.7 2.6 0.4
2.6 -2.0 -0.2 1.8 -0.7 -1.3 -0.5 -1.3 0.2 -2.1
2.4 -1.5 -0.4 3.8 -0.1 1.5 0.3 -1.8 0.0 2.5
3.5 -4.2 -1.0 -0.2 0.1 0.9 1.1 2.2 0.9 -0.6
-4.4 -1.1 3.9 -1.0 -0.6 1.7 0.3 -2.4 -0.1 -1.7
-0.5 -0.8 1.7 1.4 4.4 1.2 -1.8 -3.1 -2.1 -1.6
2.2 0.3 4.8 -0.8 -3.5 -2.7 3.8 1.4 -3.5 -0.9
-2.2 -0.7 -1.3 1.5 -1.5 -2.2 1.0 1.3 1.7 -0.9
新知探究
(1)如何描述这100个样本误差数据的分布?
(2) 如何构建适当的概率模型刻画误差X的分布?
根据已学的统计知识,可用频率分布直方图描述这组误差数据的分布,如图(1)所示.
频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,
频率/组距
X
-6
0
-4
-2
0
0.15
0.05
0.10
0.20
4
2
6
图 (1)
所有小矩形的面积之和为 .
观察图形可知: 误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁.
1
新知探究
追问1 随着样本数据量越来越大,让分组越来越多,组距越来越小,频率分布直方图的轮廓会发生什么变化?
频率/组距
X
-6
0
-4
-2
0
0.15
0.05
图 (2)
0.10
0.20
4
2
6
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线.
新知探究
根据频率与概率的关系,可用下图中的钟形曲线(曲线与水平轴之间的区域的面积为1)来描述袋装食盐质量误差的概率分布.
例如,任意抽取一袋食盐,误差落在[-2, -1]内的概率,可用图中黄色阴影部分的面积表示.
追问2 根据函数知识,这个钟形曲线它是函数吗?
答案是肯定的. 在数学家的不懈努力下,找到了刻画随机误差分布的解析式.
如果是,那么,这个函数是否存在解析式呢?
新知探究
显然,对任意的x∈R,f(x)>0,它的图象在x轴的上方,可以证明x轴和曲线之间的区域的面积为1. 我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ, σ2).
其中μ∈R,σ>0为参数.
特别地,当μ=0, σ=1时,称随机变量X服从标准正态分布.
y
0
1
2
-1
-2
x
-3
3
μ=0
σ=1
新知探究
早在1733年,法国数学家棣莫弗( A . De Moivre ,1667-1754)在研究二项概率的近似计算时,已提出了正态密度函数的形式,但当时只是作为一个数学表达式.直到德国数学家高斯( C . F . Gauss ,1777-1855)提出"正态误差"的理论后,正态密度函数才取得"概率分布"的身份.因此,人们也称正态分布为高斯分布.
高斯是一个伟大的数学家,一生中的重要贡献不胜枚举,早期德国的10马克纸币上印有高斯的头像和正态分布曲线,这就传达了一个信息:在高斯的科学贡献中,对人类文明影响最大的是“正态分布”。
新知探究
追问3 正态分布曲线是如何刻画随机变量的概率分布的呢?
X取值不超过x的概率P(X≤x)为图中区域A的面积,
而P(a≤X≤b)为区域B的面积.
若X~N(μ,σ2),则如图所示,
新知探究
问题2 观察正态曲线及相应的密度函数,你能发现正态曲线的哪些特点?
(3) 当|x| 无限增大时,曲线无限接近 x 轴.
由 X 的密度函数及图象可以发现,正态曲线还有以下特点:
(1) 曲线是单峰的,它关于直线 x=μ 对称;
(2) 曲线在x=μ处达到峰值
(4) x轴和曲线之间的区域的面积为1.
新知探究
问题3 一个正态分布由参数和完全确定,这两个参数对正态曲线的形状有何影响?它们反映正态分布的哪些特征?
(1)当参数取定值时,观察对正态分布的曲线.
3
1
2
σ =0.5
μ=ᅳ1
μ=0
μ=1
由于正态曲线关于x=μ对称,因此,当参数σ固定时,正态曲线的位置由μ确定,且随着μ的变化而沿x轴平移.
μ称为位置参数.
所以参数μ反映了正态分布的集中位置,可以用均值来估计,故有E(X)=μ.
新知探究
(2)当参数取定值时,观察对正态曲线的影响
μ=0
=0.5
=1
=2
当μ固定时,因为正态曲线的峰值与σ成反比,而且对任意的σ>0,正态曲线与x轴之间的区域的面积总为1.
σ越大,曲线越“矮胖”,
表示总体的分布越分散;
σ越小,曲线越“瘦高”,
表示总体的分布越集中.
所以σ反映了随机变量的分布相对于均值μ的离散程度,可以用标准差来估计,故有D(X)=σ2.
称为形状参数.
新知探究
观察两个图象可以发现,参数反映了正态分布的集中位置,反映了随机变量的分布相对于均值的离散程度. 实际上,我们有:
典例分析
例 李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到: 坐公交车平均用时30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4. 假设坐公交车用时X和骑自行车用时Y都服从正态分布.
(1) 估计X,Y的分布中的参数;
(2) 根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;
(3) 如果某天有38 min可用,李明应选择哪种交通工具? 如果某天只有34 min可用,又应该选择哪种交通工具? 请说明理由.
分析:对于第(1)问,正态分布由参数μ和σ完全确定,根据正态分布参数的意义,可以分别用样本均值和样本标准差来估计.
对于第(3)问, 这是一个概率决策问题, 首先要明确决策的准则, 在给定的时间内选择不迟到概率大的交通工具;然后结合图形,根据概率的表示,比较概率的大小,作出判断.
典例分析
解:(1) 随机变量X的样本均值为30,样本标准差为6;
随机变量Y的样本均值为34,样本标准差为2.
用样本均值估计参数μ,用样本标准差估计参数σ,可以得到
X~N(30, 62),Y~N(34, 22).
(2)由(1)得X~N(30, 62),Y~N(34, 22),作出X和Y的分布密度曲线如图示.
(3) 应选择在给定时间内不迟到的概率大的交通工具.
由图可知,
P(X≤38)<P(Y≤38), P(X≤34) > P(Y≤34).
所以,如果有38 min可用,那么骑自行车不迟到的概率大,应选择骑自行车;
如果只有34 min可用,那么坐公交车不迟到的概率大,应选择坐公交车.
新知探究
问题4 正态曲线下对称区域的面积相等,代表什么含义?
-x1 -x2 x2 x1
= 0
a
-a
正态曲线下对称区域的面积相等,代表对应的概率也相等.
利用“对称法”求正态分布下随机变量在某个区间的概率
新知探究
假设X~N(μ, σ2),可以证明: 对给定的k∈N*,P(μ-kσ≤X≤μ+kσ)是一个只与k有关的定值.
在实际应用中, 通常认为服从于正态分布N(μ, σ2)的随机变量X只取[μ-3σ, μ+3σ]中的值, 这在统计学中称为3σ原则.
由此看到,尽管正态变量的取值范围是(-∞, +∞),但在一次试验中,X的取值几乎总是落在区间[μ-3σ, μ+3σ]内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.
巩固练习
课本87页
1. 设随机变量X~N(0, 1),
则X的密度函数为___________________,P(X≤0)=_____ ,P( |X|≤1)= _______, P(X≤1)=________, P(X>1)=________ (精确到0.0001.)
0.5
0.6827
0.8414
0.1586
O
1
-1
x
y
μ=0
巩固练习
课本87页
2. 设随机变量X~N(0, 22),随机变量Y~N(0, 32),画出分布密度曲线草图,并指出P(X≤-2)与P(X≤2)的关系,以及P( |X|≤1)与P( |Y|≤1)之间的大小关系.
O
1
-1
x
y
σ=3
σ=2
2
-2
解:
作出分布密度曲线如图示,由图可知,
正态曲线与正态分布的概念
题型一
题型探究
【例1】(1)(多选题) 一次教学质量检测,高二年级的甲、乙、丙三科的考试成绩均近
似服从正态分布,它们的分布密度曲线如图所示,下列说法正确的是( )
AD
A. 甲科成绩的标准差最小
B. 丙科成绩的平均数最小
C. 乙科成绩的标准差及平均数都比甲小,比丙大
D. 甲、乙、丙三科成绩的平均数相同
[解析] 由正态曲线的性质知,曲线的形状由参数 确定, 越大,曲
线越“矮胖”, 越小,曲线越“瘦高”,所以,又 是标
准差,所以甲科成绩的标准差最小.三条密度曲线的对称轴相同,故甲、
乙、丙三科成绩的平均数相同.故选 .
正态曲线与正态分布的概念
题型一
题型探究
(2)(多选题)某质量指标的测量结果服从正态分布 ,则在一次测量中( )
AC
A. 该质量指标大于80的概率为0.5
B. 越大,该质量指标落在 内的概率越大
C. 该质量指标小于60与大于100的概率相等
D. 该质量指标落在内与落在 内的概率相等
[解析] 由题意得,该质量指标的测量结果的密度曲线关于直线
对称,所以A,C正确,D错误;因为方差 越小,质量指标的分布越集
中,所以B错误.
正态曲线与正态分布的概念
题型一
题型探究
解题感悟
利用正态曲线研究随机变量的数字特征
(1)计算数学期望:正态曲线的顶点横坐标就是随机变量的数学期望.
(2)判断方差的大小:方差越小,正态曲线越“高瘦”;方差越大,正
态曲线越“矮胖”.
(3)计算方差:先通过顶点纵坐标是求 ,再利用 求
方差.
利用正态分布的性质求概率
题型二
题型探究
【例2】(1) 某市高三年级共有14000人参加教学质量检测,学生的数学成绩近似
服从正态分布 (试卷满分150分),且 ,据此可以估计,
这次检测数学成绩在80到90分之间的学生人数约为( )
A
A. 2 800 B. 4 200 C. 5 600 D. 7 000
[解析] 近似服从正态分布 (试卷满分150分),且 ,
, ,
估计这次检测数学成绩在80到90分之间的学生人数约为 .
利用正态分布的性质求概率
题型二
题型探究
(2)设随机变量,函数 没有零点的概率是,则
( )
附:若,则 ,
B
A. B. C. D.
[解析] 函数 没有零点,即方程 无实根,
,即,
又函数 没有零点的概率是,
,
由正态曲线的对称性可知, ,
.
故选B.
利用正态分布的性质求概率
题型二
题型探究
提分笔记
利用正态曲线的对称性研究相关概率问题,主要是应用正态曲线关于直线 <m></m> 对称,以及曲线与 <m></m> 轴之间的区域的面积为1.
正态分布的实际应用
题型三
题型探究
【例3】在某次数学考试中,考生的成绩<m></m>((单位:分)服从正态分布,即<</m>.
(1)试求考试成绩 <m></m> 位于区间 <m></m> 内的概率大约是多少;
[解析] , , .
由于正态变量在区间 内取值的概率大约是0.954 5,
而该正态分布中, , ,
于是考试成绩 (单位:分)位于区间 内的概率大约是0.954 5.
(2)若这次考试共有2000名考生,试估计考试成绩在 <m></m> 间的考生大约有多少人
[解析] 由 , ,得 , .
由于正态变量在区间 内取值的概率大约是0.682 7,
所以考试成绩 位于区间 内的概率大约是0.682 7,一共有2 000名考生,所以考试成绩在 间的考生大约有 (人).
正态分布的实际应用
题型三
题型探究
提分笔记
解决正态分布应用题的方法
(1)将实际问题与正态分布“挂钩”.
(2)掌握正态分布的性质,特别是正态曲线的对称性以及各个区间上取值概率之间的关系.
课堂达标
1. 设随机变量 的正态密度函数为 , ,则参数 , 的值分别是 ( @27@ )
A. , B. ,
C. , D. ,
D
[解析] 把正态密度函数化成标准形式,即 ,显然 , .故选D.
课堂达标
2. 若 ,且 成立,则 ( @29@ )
A. B. C. D.
B
[解析] ,且 成立,根据正态曲线的对称性得到 .故选B.
3. 已知随机变量 服从正态分布 ,且 ,则 _______.
<m></m>
[解析] 由正态分布的性质可知 .
课堂达标
4. 一批电阻的电阻值 (单位: )服从正态分布 .现从甲、乙两箱成品中各随机抽取一个电阻,测得电阻值分别为 和 ,可以认为_____.(填写正确结论的序号)
①甲、乙两箱电阻均可出厂;
②甲、乙两箱电阻均不可出厂;
③甲箱电阻可出厂,乙箱电阻不可出厂;
④甲箱电阻不可出厂,乙箱电阻可出厂.
③
[解析] 因为 ,所以 , ,所以 , .因为 , ,所以甲箱电阻可出厂,乙箱电阻不可出厂.
课堂达标
5. 已知某次数学考试的成绩 服从正态分布 ,则114分以上的成绩所占的百分比大约为_________.
(附: ,
)
<m></m>
[解析] 由已知得 ,
故 ,即114分以上的成绩所占百分比大约为 .
课堂小结
若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ, σ2). 特别地,当μ=0, σ=1时,称随机变量X服从标准正态分布.
1. 正态分布:
正态密度函数:
2. 3σ原则:
感谢聆听!
$