内容正文:
4.2.5 正态分布
课程标准
素养解读
1.利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义
2.了解变量落在区间(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)的概率大小
3.会用正态分布去解决实际问题
1.通过学习正态分布和标准正态分布,体会数学抽象与直观想象的素养
2.借助正态分布中的“3σ原则”解题及标准正态分布提升数学运算素养
[情境引入]
某钢铁加工厂生产内径为25.40 mm的钢管,为了检验产品的质量,从一批产品中任取100件检测,测得它们的实际尺寸如下:
25.39 25.36 25.34 25.42 25.45 25.38 25.39
25.42 25.47 25.35 25.41 25.43 25.44 25.48
25.45 25.43 25.46 25.40 25.51 25.45 25.40
25.39 25.41 25.36 25.38 25.31 25.56 25.43
25.40 25.38 25.37 25.44 25.33 25.46 25.40
25.49 25.34 25.42 25.50 25.37 25.35 25.32
25.45 25.40 25.27 25.43 25.54 25.39 25.45
25.43 25.40 25.43 25.44 25.41 25.53 25.37
25.38 25.24 25.44 25.40 25.36 25.42 25.39
25.46 25.38 25.35 25.31 25.34 25.40 25.36
25.41 25.32 25.38 25.42 25.40 25.33 25.37
25.41 25.49 25.35 25.47 25.34 25.30 25.39
25.35 25.46 25.29 25.40 25.37 25.33 25.40
25.35 25.41 25.37 25.47 25.39 25.42 25.47
25.38 25.39
把这批产品的内径尺寸看作一个总体,那么这100件产品的实际尺寸就是一个容量为100的样本;可得到这组样本数据的频率分布直方图
当样本容量n越来越大时,分组越来越细,那么,频率直方图将如何变化?
[知识梳理]
[知识点一] 正态曲线及其性质
1.正态曲线的定义一般地,函数φμ,σ(x)
=e-对应的图像称为正态曲线,
其中μ= E(X) ,σ=.
2.正态曲线的性质
①正态曲线关于 x=μ 对称(即 μ 决定正态曲线对称轴的位置),具有中间 高 、两边 低 的特点;
②正态曲线与x轴所围成的图形面积为 1 ;
③ σ 决定正态曲线的“胖瘦”:σ越 大 ,说明标准差越 大 ,数据的集中程度越 弱 ,所以曲线越“ 胖 ”;σ越 小 ,说明了标准差越 小 ,数据的集中程度越 强 ,所以曲线越“ 瘦 ”.
1.参数μ和σ对正态曲线的形状有什么影响?
提示:(1)μ为位置参数.
当参数σ取固定值时,正态曲线的位置由μ确定,且随着μ的变化而沿x轴平移,如图所示.根据随机变量均值的意义,有E(X)=μ.
(2)σ为形状参数
参数σ的大小决定了曲线的高低和胖瘦,因此σ的变化影响曲线的形状.σ越小,曲线越“瘦高”,表示随机变量的分布越集中;σ越大,曲线越“矮胖”,表示随机变量的分布越分散,如图所示.根据随机变量方差的意义,有D(X)=σ2.
[知识点二] 正态分布
1.一般地,如果随机变量X落在区间[a,b]内的概率,总是等于φμ,σ(x)对应的正态曲线与x轴在区间[a,b]内围成的 面积 ,则称X服从参数为μ与σ的正态分布,记作X~ N(μ,σ2) ,此时 φμ,σ(x) 称为X的概率密度函数.
2.正态分布在三个特殊区间内取值的概率值
P(μ-σ≤X≤μ+σ)≈ 68.3% .
P(μ-2σ≤X≤μ+2σ)≈ 95.4% .
P(μ-3σ≤X≤μ+3σ)≈ 99.7% .
2.如果X~N(μ,σ2),那么P(x≤μ)与P(x≥μ)之间存在怎样的数量关系?
提示:P(x≤μ)=P(x≥μ)=.
[知识点三] 标准正态分布
1.定义μ= 0 且σ= 1 的分布称为标准正态分布,记作X~ N(0,1) .如图所示:
2.概率计算方法
如果X~N(0,1),那么对于任意a,通常记Ф(a)= P(x<a), 其中Ф(a)表示N(0,1)对应的正态曲线与x轴在区间(-∞,a)内所围的面积.特别地,Ф(-a)+Ф(a)= 1 .
3.正态分布Y~N(μ,σ2)化为标准正态分布的变换是什么?
提示:借助X=实现转换.
4.若X~N(μ,σ2),怎样表示上图中阴影A,B的面积?
提示:阴影A的面积P(X≤x);阴影B的面积P(a≤X≤b).
[预习自测]
1.判断正误(正确的打“√”,错误的打“×”)
(1)正态曲线是一条钟形曲线.( )
(2)正态曲线在x轴的上方,并且关于直线x=σ对称.( )
(3)Ф(2)=0.841 3.( )
答案:(1)√.由正态分布曲线的形状可知该说法正确.
(2)×.正态曲线关于直线x=μ对称.
(3)×.Φ(2)=P(X<2)=0.5+0.341 3+0.135 9=0.977 2.
2.设X~N(10,0.64),则D(X)等于( )
A.0.8 B.0.64
C.0.642 D.6.4
解析:B [因为X~N(10,0.64),所以D(X)=0.64.]
3.已知正态总体落在区间(0.2,+∞)上的概率是0.5,那么相应的正态曲线f(x)在x=________时,达到最高点.
解析:由正态曲线关于直线x=μ对称和在区间(0.2,+∞)上的概率为0.5,得μ=0.2.
答案:0.2
正态曲线及其特点的认识
[例1] 如图是当σ取三个不同值σ1,σ2,σ3的三种正态曲线N(0,σ2)的图象,那么σ1,σ2,σ3的大小关系是( )
A.σ1>1>σ2>σ3>0 B.0<σ1<σ2<1<σ3
C.σ1<σ2>1>σ3>0 D.0<σ1<σ2=1<σ3
[思路点拨] 由正态曲线的特征①②③解题.
解析:D[当μ=0,σ=1时,正态曲线f(x)=,在x=0时,取得最大值,故σ2=1.
由正态曲线的特征,当μ一定时,曲线的形状由σ确定.σ越小,曲线越“瘦高”;σ越大,曲线越“矮胖”,于是有0<σ1<σ2=1<σ3.应选D.]
利用图象求正态分布密度函数的解析式,应抓住图象的两个实质性特点:一是对称轴为x=μ,二是最大值为.这两点确定以后,相应参数μ,σ便确定了,代入f(x)中便可求出相应的解析式.
[变式训练]
1.甲、乙两类水果的质量(单位:kg)分别服从正态分布N(μ1,σ),N(μ2,σ),正态曲线如图所示,则下列说法错误的是( )
A.甲类水果的平均质量为0.4 kg
B.甲类水果的质量比乙类水果的质量更集中于平均质量
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从的正态分布的参数σ2=1.99
解析:D [由图象可知甲曲线关于直线x=0.4对称,乙曲线关于直线x=0.8对称,∴μ1=0.4,μ2=0.8,故A,C正确;∵甲曲线比乙曲线更“高瘦”,
∴甲类水果的质量比乙类水果的质量更集中于平均质量,故B正确;
∵乙曲线的峰值为1.99,即=1.99,∴σ2≠1.99,故D错误.]
正态分布的概率计算
[例2] 设X~N(1,4),试求:
(1)P(-1≤X≤3);
(2)P(-1≤X≤1);
(3)P(3≤X≤5);
(4)P(X>5).
[思路点拨] 利用正态曲线关于x =μ对称及面积为1的性质求解
解:易知X~N(1,22),∴μ=1,σ=2.
(1)P(-1≤X≤3)=P(1-2≤X≤1+2)=P(μ-σ≤X≤μ+σ)≈0.682 7.
(2)∵该正态曲线关于直线x=1对称,结合图象可知P(-1≤X≤1)=P(-1≤X≤3)≈×0.682 7=0.341 35.
(3)P(3≤X≤5)=P(-3≤X≤-1),
∴P(3≤X≤5)=[P(-3≤X≤5)-P(-1≤X≤3)]=[P(1-4≤X≤1+4)-P(1-2≤X≤1+2)]=[P(μ-2σ≤X≤μ+2σ)-P(μ-σ≤X≤μ+σ)]≈×(0.954 5-0.682 7)=0.135 9.
(4)∵P(X>5)=P(X<-3),
∴P(X>5)=[1-P(-3≤X≤5)]=[1-P(1-4≤X≤1+4)]=[1-P(μ-2σ≤X≤μ+2σ)]≈×(1-0.954 5)=0.022 75.
求解正态分布的概率问题的思路
利用正态曲线的对称性求概率是正态分布的基本题型,解题的关键是利用对称轴x=μ确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时,可借助图形判断.常用结论如下.
(1)对于正态分布N(μ,σ2),由直线x=μ是正态曲线的对称轴知:
①对任意的实数a,P(X<μ-a)=P(X>μ+a);
②P(X<x0)=1-P(X≥x0);
③P(a<X<b)=P(X<b)-P(X≤a).特别地,当μ=0时,我们有P(X<-x0)=1-P(X≤x0).
(2)当条件中无已知概率时,则要将区间转化为三个特殊区间,利用三个特殊区间的概率求解,P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
[变式训练]
2.(1)已知随机变量ξ服从正态分布N(0,σ2),若P(ξ>2)=0.023,则P(-2<ξ<2)=( )
A.0.477 B.0.625
C.0.954 D.0.977
解析:C [P(-2<ξ<2)=1-2P(ξ>2)=1-2×0.023=0.954.]
(2)设随机变量ξ服从正态分布N(2,σ2),若P(ξ>c)=a,则P(ξ>4-c)等于( )
A.a B.1-a
C.2a D.1-2a
解析:B [对称轴x=2,∴P(ξ>4-c)=1-P(ξ>c)=1-a.]
“3σ原则”的应用
[例3] 某厂生产的产品,质量要求服从正态分布N(100,4),现从产品中抽取了10件,测得质量分别为102,92,104,103,98,96,97,99,101,108,则该生产线是否要停产检修?
[思路点拨] 由题意可知产品质量服从正态分布,又由于质量在区间[100-2,100+2],即[98,102]内的概率为68.3%,在区间[96,104]内的概率为95.4%,在区间[94,106]内的概率为99.7%,所以据此可以判断结论.
解:由题意知产品质量X服从正态分布N(100,22),产品质量在区间[100-3×2,100+3×2],即[94,106]内的概率为99.7%,而在这个区间外的概率仅为0.3%,在抽测的10件产品中有2件(分别是92,108)不在这个区间内,小概率事件竟然发生了,说明生产线有问题,故应停产检修.
假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布N(μ,σ2).
②确定一次试验中的取值a是否落入区间
[ μ-3σ,μ+3σ]内.
③作出判断:如果a∈[μ-3σ,μ+3σ],则接受统计假设.如果a∉[μ-3σ,μ+3σ],则拒绝统计假设.
[变式训练]
3.为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线在正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求p(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(i)试说明上述监控生产过程方法的合理性;
(ii)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98
10.04 10.26 9.91 10.13 10.02 9.22 10.04
10.05 9.95
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查.剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),
则P(μ-3σ<Z<μ+3σ)=0.997 4.
0.997 416≈0.959 2,≈0.09.
解:(1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X~B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望为E(X)=16×0.002 6=0.041 6.
(2)(i)如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ii)由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为
×(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
x=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为
×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
标准正态分布
[例4] 设随机变量X~N(0,1),
(1)求Φ(-3)的值;
(2)若Φ(0.42)=0.662 8,求Φ(-0.42).
[思路点拨] 找到已知数和μ与σ的关系,利用对称性求解
解:(1)因为X~N(0,1),所以Φ(-3)=P(X<-3)=[1-P(-3≤X≤3)]≈(1-0.997 3)=0.00135.
(2)因为X~N(0,1)且Φ(0.42)=0.662 8,
所以由Φ(-a)+Φ(a)=1得,
Φ(-0.42)=1-Φ(0.42)=1-0.662 8=0.337 2.
求标准正态分布的概率问题的关注点
(1)标准正态曲线特点:关于y轴对称,σ=1;
(2)Φ(a)的含义;Φ(a)=P(X<a);
(3)解题思路;
①当a=±1,±2,±3时,利用P(μ-σ≤X≤μ+σ),P(μ-2σ≤X≤μ+2σ),P(μ-3σ≤X≤μ+3σ)的概率值求解;
②当a为其他值时,可查表求解.
[变式训练]
4.设随机变量X服从正态分布N(0,1),已知Φ(-0.18)=0.428 6,求P(|X|<0.18).
解:由正态曲线的对称性知,
Φ(-0.18)=P(X<-0.18)
=P(X>0.18)=0.428 6,
所以P(|X|<0.18)=P(-0.18<X<0.18)
=1-2P(X<-0.18)=1-2×0.428 6
=0.142 8.
正态分布与其他知识的综合应用
[例5] 搪瓷是涂烧在金属底坯表面上的无机玻璃瓷釉.搪瓷制品曾经是人们不可或缺的生活必备品,如厨房用具中锅碗瓢盆、喝茶用到的杯子、洗脸用到的脸盆、婚嫁礼品等,可以说搪瓷制品浓缩了上世纪一个时代的记忆.某搪瓷设计公司新开发了一种新型复古搪瓷水杯,并交给生产水平不同的A和B两个厂生产.已知A厂生产的该种搪瓷水杯的等级系数X服从正态分布N(μ,0.25),且P(X<6)=,在电商平台上A厂生产的搪瓷水杯的零售价为36元/件,B厂生产的搪瓷水杯的零售价为30元/件.
(1)(i)求A厂生产的搪瓷水杯的等级系数的平均值;
(ii)若A厂生产了10 000件这种搪瓷水杯,记ξ表示这10 000件搪瓷水杯等级系数X位于区间[5.5,6.5]的产品件数,求E(ξ).
(2)从B厂生产的搪瓷水杯中随机抽取30件,相应的等级系数组成一个样本,数据如图所示.
设L=,若以“L的值越大,产品越具可购买性”为判断标准,根据以上数据,哪个工厂生产的搪瓷水杯更具可购买性?说明理由.
注:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
[思路点拨] 把实际问题中的数据抽象出来转化为数学问题求解.
解:(1)(i)根据题意,P(X<6)=,得μ=6,即A厂生产的搪瓷水杯的等级系数的平均值为6.
(ii)∵σ2=0.25,
∴σ=0.5,则μ+σ=6.5,μ-σ=5.5,
易知一件搪瓷水杯等级系数X位于区间[5.5,6.5]的概率约为0.682 7,依题意知ξ服从参数为10 000,0.682 7的二项分布,
∴E(ξ)=10 000×0.682 7=6 827.
(2)A厂生产的搪瓷水杯更具可购买性,理由如下:
用样本估计总体,可得B厂生产的搪瓷水杯的等级系数XB的平均值为(3.5×10+4.5×8+5.5×6+6.5×5+7.5×1)=4.8.
∵A厂生产搪瓷水杯的等级系数的平均值为6,价格为36元/件,
∴LA==≈0.17,
∵B厂生产的搪瓷水杯的等级系数的平均值为4.8,价格为30元/件,∴LB==0.16,
又0.17>0.16,故A厂生产的搪瓷水杯更具可购买性.
正态分布的应用,实质上是将实际问题抽象概括成正态分布模型,利用正态分布模型,通过对数据的理解和处理,获得和解释结论,培养了抽象概括能力和数据处理能力,提升了数学抽象和数据分析的数学核心素养.
[变式训练]
5.某市举办数学知识竞赛活动,共5 000名学生参加,竞赛分为初试和复试,复试环节共3道题,其中2道单选题,1道简答题,得分规则如下:参赛学生每答对一道单选题得2分,答错得0分,答对简答题得3分,答错得0分,答完3道题后的得分之和为参赛学生的复试成绩.
(1)通过分析可以认为学生初试成绩X(单位:分)服从正态分布N(μ,σ2),其中μ=66,σ2=144,试估计初试成绩高于90分的人数;
(2)已知小强已通过初试,他在复试中回答单选题的正确率为,回答简答题的正确率为,且每道题回答正确与否互不影响.记小强复试成绩为Y(单位:分),求Y的分布列及数学期望.
附:若X~N(μ,σ2),P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3,
解:∵学生初试成绩X服从正态分布N(μ,σ2),其中μ=66,σ2=144,∴μ+2σ=66+2×12=90,
∴P(X≥90)=P(X≥μ+2σ)≈×(1-0.954 5)=0.022 75,
∴估计不低于90分的人数为0.022 75×5 000≈114.
(2)Y的所有可能取值为0,2,3,4,5,7,
则P(Y=0)=××=,
P(Y=2)=C×××=,
P(Y=3)=××=,
P(Y=4)=××=,
P(Y=5)=C×××=,
P(Y=7)=××=,
∴Y的分布列为
Y
0
2
3
4
5
7
P
E(Y)=0×+2×+3×+4×+5×+7×=.
[当堂达标]
1.函数f(x)=e-(其中μ<0)的图象可能为( )
解析:A [函数f(x)图象的对称轴为直线x=μ,因为μ<0,所以排除B,D;又正态曲线位于x轴上方,因此排除C.]
2.已知三条正态曲线φi(x)=e-(x∈R,i=1,2,3)如图所示,则下列判断正确的是( )
A.μ1<μ2=μ3,σ1=σ2>σ3
B.μ1>μ2=μ3,σ1=σ2<σ3
C.μ1=μ2<μ3,σ1<σ2=σ3
D.μ1<μ2=μ3,σ1=σ2<σ3
解析:D [由正态曲线关于直线x=μ对称,知μ1<μ2=μ3.σ的大小决定曲线的形状,σ越大,随机变量的分布越分散,曲线越“矮胖”;σ越小,随机变量的分布越集中,曲线越“瘦高”,则σ1=σ2<σ3,实际上,由φ1(μ1)=φ2(μ2)>φ3(μ3), 得=>,即σ1=σ2<σ3.]
3.若随机变量X~N(0,1),则P(x<0)=________.
解析:由标准正态曲线关于y轴对称可知P(x<0)=.
答案:
4.在正态分布N中,数据落在(-2,2)内的概率为________.
解析:由题可得μ=0,σ=,P(-2<X<2)=P(μ-3σ<X<μ+3σ)=0.997 3.
答案:0.997 3
5.已知随机变量x~N(2,σ2),如图所示,若P(x<a)=0.32,求P(a≤x<4-a)的值.
解析:由正态分布图象的对称性可得,P(a≤x<4-a)=1-2P(x<a)=0.36.
答案:0.36
学科网(北京)股份有限公司
$$