内容正文:
7.5 正态分布
课程标准
素养解读
1.利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义
2.了解变量落在区间(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)的概率大小
3.会用正态分布去解决实际问题
1.通过学习正态分布和标准正态分布,体会数学抽象与直观想象的素养
2.借助正态分布中的“3σ原则”解题及标准正态分布提升数学运算素养
[情境引入]
某钢铁加工厂生产内径为25.40 mm的钢管,为了检验产品的质量,从一批产品中任取100件检测,测得它们的实际尺寸如下:
25.39 25.36 25.34 25.42 25.45 25.38 25.39
25.42 25.47 25.35 25.41 25.43 25.44 25.48
25.45 25.43 25.46 25.40 25.51 25.45 25.40
25.39 25.41 25.36 25.38 25.31 25.56 25.43
25.40 25.38 25.37 25.44 25.33 25.46 25.40
25.49 25.34 25.42 25.50 25.37 25.35 25.32
25.45 25.40 25.27 25.43 25.54 25.39 25.45
25.43 25.40 25.43 25.44 25.41 25.53 25.37
25.38 25.24 25.44 25.40 25.36 25.42 25.39
25.46 25.38 25.35 25.31 25.34 25.40 25.36
25.41 25.32 25.38 25.42 25.40 25.33 25.37
25.41 25.49 25.35 25.47 25.34 25.30 25.39
25.35 25.46 25.29 25.40 25.37 25.33 25.40
25.35 25.41 25.37 25.47 25.39 25.42 25.47
25.38 25.39
把这批产品的内径尺寸看作一个总体,那么这100件产品的实际尺寸就是一个容量为100的样本;可得到这组样本数据的频率分布直方图如下
当样本容量n越来越大时,分组越来越细,那么,频率直方图将如何变化呢?
[知识梳理]
[知识点一] 正态密度函数
1.正态密度函数,刻画随机误差的函数f(x)=e-,x∈R,其中μ∈R,σ>0为参数.
对任意的x∈R,f(x)>0,它的图象在x轴的上方,x轴和曲线之间的区域为面积1,我们称f(x)为正态密度函数.
2.正态密度曲线:正态密度函数的图象为正态密度曲线,简称正态曲线.
[知识点二] 正态分布
1.定义:若随机变量X的概率密度函数为f(x),则称随机变量X服从正态分布;
2.记作:X~N(μ,σ2);
3.特例:当μ=0,σ=1时,称随机变量X服从标准正态分布.
[知识点三] 正态曲线的特点
1.正态曲线关于 x=μ 对称(即 μ 决定正态曲线对称轴的位置),具有中间 高 、两边 低 的特点;
2.曲线在x=μ处达到峰值;
3.当|x|无限增大时,曲线无限接近于x轴.
4.正态曲线与x轴所围成的图形面积为 1 ;
5.σ决定正态曲线的“胖瘦”:σ越 大 ,说明标准差越 大 ,数据的集中程度越 弱 ,所以曲线越“ 胖 ”;σ越 小 ,说明了标准差越 小 ,数据的集中程度越 强 ,所以曲线越“ 瘦 ”.
1.参数μ和σ对正态曲线的形状有什么影响?
提示:(1)μ为位置参数
当参数σ取固定值时,正态曲线的位置由μ决定,且随着μ的变化而沿x轴平移,如图所示.根据随机变量均值的意义,有E(X)=μ.
(2)σ为形状参数
参数σ的大小决定了曲线的高低和胖瘦,因此σ的变化影响曲线的形状.σ越小,曲线越“瘦高”,表示随机变量的分布越集中;σ越大,曲线越“矮胖”,表示随机变量的分布越分散,如图所示.根据随机变量方差的意义,有D(X)=σ2.
[知识点四] X~N(μ,σ2)在区间[μ-kσ,μ+kσ]上的概率
1.概率:P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
2.3σ原则:通常认为服从正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]中的值.
2.如果X~N(μ,σ2),那么P(x≤μ)与P(x≥μ)之间存在怎样的数量关系?
提示:P(x≤μ)=P(x≥μ)=.
[预习自测]
1.判断正误(正确的打“√”,错误的打“×”).
(1)正态曲线是一条钟形曲线.( )
(2)正态曲线在x轴的上方,并且关于直线x=σ对称.( )
提示:(1)√ 由正态分布曲线的形状可知该说法正确.
(2)× 正态曲线关于直线x=μ对称.
2.设X~N(10,0.64),则D(X)等于( )
A.0.8 B.0.64
C.0.642 D.6.4
解析:B [因为X~N(10,0.64),所以D(X)=0.64.]
3.已知正态总体落在区间(0.2,+∞)上的概率是0.5,那么相应的正态曲线f(x)在x= ________ 时,达到最高点.
解析:由正态曲线关于直线x=μ对称和在区间(0.2,+∞)上的概率为0.5,得μ=0.2.
答案:0.2
正态曲线及其特点的认识
[例1] 如图是当σ取三个不同值σ1,σ2,σ3的三种正态曲线N(0,σ2)的图象,那么σ1,σ2,σ3的大小关系是( )
A.σ1>1>σ2>σ3>0
B.0<σ1<σ2<1<σ3
C.σ1<σ2>1>σ3>0
D.0<σ1<σ2=1<σ3
[思路点拨] 由正态曲线的特征①②③解题.
解析:D [当μ=0,σ=1时,正态曲线f(x)=e-,在x=0时,取得最大值,故σ2=1.
由正态曲线的特征,当μ一定时,曲线的形状由σ确定.σ越小,曲线越“瘦高”;σ越大,曲线越“矮胖”,于是有0<σ1<σ2=1<σ3.应选D.]
利用图象求正态分布密度函数的解析式,应抓住图象的两个实质性特点:一是对称轴为x=μ,二是最大值为.这两点确定以后,相应参数μ,σ便确定了,代入f(x)中便可求出相应的解析式.
[变式训练]
1.甲、乙两类水果的质量(单位:kg)分别服从正态分布N1(μ1,σ),N2(μ2,σ),正态曲线如图所示,则下列说法错误的是( )
A.甲类水果的平均质量为0.4 kg
B.甲类水果的质量比乙类水果的质量更集中于平均质量
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从的正态分布的参数σ2=1.99
解析:D [由图象可知甲曲线关于直线x=0.4对称,乙曲线关于直线x=0.8对称,∴μ1=0.4,μ2=0.8,故A,C正确;∵甲曲线比乙曲线更“高瘦”,
∴甲类水果的质量比乙类水果的质量更集中于平均质量,故B正确;
∵乙曲线的峰值为1.99,即=1.99,∴σ2≠1.99,故D错误.]
正态分布的概率计算
[例2] 设X~N(1,4),试求:
(1)P(-1≤X≤3);
(2)P(-1≤X≤1);
(3)P(3≤X≤5);
(4)P(X>5).
[思路点拨] 利用正态曲线关于x =μ对称及面积为1的性质求解.
解:易知X~N(1,22),∴μ=1,σ=2.
(1)P(-1≤X≤3)=P(1-2≤X≤1+2)=P(μ-σ≤X≤μ+σ)≈0.682 7.
(2)∵该正态曲线关于直线x=1对称,结合图象可知P(-1≤X≤1)=P(-1≤X≤3)≈×0.682 7=0.341 35.
(3)∵P(3≤X≤5)=P(-3≤X≤-1),
∴P(3≤X≤5)=[P(-3≤X≤5)-P(-1≤X≤3)]=[P(1-4≤X≤1+4)-P(1-2≤X≤1+2)]=
[P(μ-2σ≤X≤μ+2σ)-P(μ-σ≤X≤μ+σ)]≈×(0.954 5-0.682 7)=0.135 9.
(4)∵P(X>5)=P(X<-3),
∴P(X>5)=[1-P(-3≤X≤5)]=[1-P(1-4≤X≤1+4)]=[1-P(μ-2σ≤X≤μ+2σ)]≈×(1-0.954 5)=0.022 75.
求解正态分布的概率问题的思路
利用正态曲线的对称性求概率是正态分布的基本题型,解题的关键是利用对称轴x=μ确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时,可借助图形判断.常用结论如下:
1.对于正态分布N(μ,σ2),由直线x=μ是正态曲线的对称轴知:
①对任意的实数a,P(X<μ-a)=P(X>μ+a);
②P(X<x0)=1-P(X≥x0);
③P(a<X<b)=P(X<b)-P(X≤a).特别地,当μ=0时,我们有P(X<-x0)=1-P(X≤x0).
求解正态分布的概率问题的思路
2.当条件中无已知概率时,则要将区间转化为三个特殊区间,利用三个特殊区间的概率求解,P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
[变式训练]
2.(1)已知随机变量ξ服从正态分布N(0,σ2),若P(ξ>2)=0.023,则P(-2<ξ<2)=( )
A.0.477 B.0.625
C.0.954 D.0.977
解析:C [P(-2<ξ<2)=1-2P(ξ>2)=1-2×0.023=0.954.]
(2)设随机变量ξ服从正态分布N(2,σ2),若P(ξ>c)=a,则P(ξ>4-c)=( )
A.a B.1-a
C.2a D.1-2a
解析:B [∵对称轴x=2,∴P(ξ>4-c)=1-P(ξ>c)=1-a.]
“3σ原则”的应用
[例3] 某厂生产的产品,质量要求服从正态分布N(100,4),现从产品中抽取了10件,测得质量分别为102,92,104,103,98,96,97,99,101,108,则该生产线是否要停产检修?
[思路点拨] 由题意可知产品质量服从正态分布,又由于质量在区间[100-2,100+2],即[98,102]内的概率为68.3%,在区间[96,104]内的概率为95.4%,在区间[94,106]内的概率为99.7%,所以据此可以判断结论.
解:由题意知产品质量X服从正态分布N(100,22),产品质量在区间[100-3×2,100+3×2],即[94,106]内的概率为99.7%,而在这个区间外的概率仅为0.3%,在抽测的10件产品中有2件(分别是92,108)不在这个区间内,小概率事件竟然发生了,说明生产线有问题,故应停产检修.
假设检验是就正态总体而言的,进行假设检验可归结为如下三步:
1.提出统计假设,统计假设里的变量服从正态分布N(μ,σ2).
2.确定一次试验中的取值a是否落入区间[ μ-3σ,μ+3σ]内.
3.作出判断:如果a∈[μ-3σ,μ+3σ],则接受统计假设.如果a∉[μ-3σ,μ+3σ],则拒绝统计假设.
[变式训练]
3.为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线在正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)在一天内抽检的零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92
9.98 10.04 10.26 9.91 10.13 10.02
9.22 10.04 10.05 9.95
经计算得=xi=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查.剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ的值(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),
则P(μ-3σ<Z<μ+3σ)=0.997 3.
0.997 316≈0.962 9,≈0.09.
解:(1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 3,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 7,故X~B(16,0.002 7).
因此P(X≥1)=1-P(X=0)=1-0.997 316≈0.037 1.
X的数学期望为E(X)=16×0.002 7=0.043 2.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 7,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.037 1,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为×(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
x=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
正态分布与其他知识的综合应用
[例4] 搪瓷是涂烧在金属底坯表面上的无机玻璃瓷釉.搪瓷制品曾经是人们不可或缺的生活必备品,如厨房用具中锅碗瓢盆、喝茶用到的杯子、洗脸用到的脸盆、婚嫁礼品等,可以说搪瓷制品浓缩了上世纪一个时代的记忆.某搪瓷设计公司新开发了一种新型复古搪瓷水杯,并交给生产水平不同的A和B两个厂生产.已知A厂生产的该种搪瓷水杯的等级系数X服从正态分布N(μ,0.25),且P(X<6)=,在电商平台上A厂生产的搪瓷水杯的零售价为36元/件,B厂生产的搪瓷水杯的零售价为30元/件.
(1)①求A厂生产的搪瓷水杯的等级系数的平均值;
②若A厂生产了10 000件这种搪瓷水杯,记ξ表示这10 000件搪瓷水杯等级系数X位于区间[5.5,6.5]的产品件数,求E(ξ).
(2)从B厂生产的搪瓷水杯中随机抽取30件,相应的等级系数组成一个样本,数据如图所示.
设L=,若以“L的值越大,产品越具可购买性”为判断标准,根据以上数据,哪个工厂生产的搪瓷水杯更具可购买性?说明理由.
注:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
[思路点拨] 把实际问题中的数据抽象出来转化为数学问题求解.
解:(1)(①)根据题意,P(X<6)=,得μ=6,即A厂生产的搪瓷水杯的等级系数的平均值为6.
②∵σ2=0.25,
∴σ=0.5,则μ+σ=6.5,μ-σ=5.5,
易知一件搪瓷水杯等级系数X位于区间[5.5,6.5]内的概率约为0.682 7,依题意知ξ~(10 000,0.682 7)的二项分布,
∴E(ξ)=10 000×0.682 7=6 827.
(2)A厂生产的搪瓷水杯更具可购买性,理由如下:
用样本估计总体,可得B厂生产的搪瓷水杯的等级系数XB的平均值为×(3.5×10+4.5×8+5.5×6+6.5×5+7.5×1)=4.8.
∵A厂生产搪瓷水杯的等级系数的平均值为6,价格为36元/件,
∴LA==≈0.17,
∵B厂生产的搪瓷水杯的等级系数的平均值为4.8,价格为30元/件,∴LB==0.16,
又0.17>0.16,故A厂生产的搪瓷水杯更具可购买性.
正态分布的应用,实质上是将实际问题抽象概括成正态分布模型,利用正态分布模型,通过对数据的理解和处理,获得和解释结论,培养了抽象概括能力和数据处理能力,提升了数学抽象和数据分析的数学核心素养.
[变式训练]
4.2025年乙巳年春节来临之际,赤峰市某食品加工企业为了检查春节期间产品质量,抽查了一条自动包装流水线的生产情况.随机抽取该流水线上的40件产品作为样本并称出它们的质量(单位:克),质量的分组区间为(495,505],(505,515],…(535,545],由此得到样本的频率分布直方图,如图所示.
(1)根据频率分布直方图,求质量超过515克的产品数量和样本平均值;
(2)由样本估计总体,结合频率分布直方图,近似认为该产品的质量指标值ξ服从正态分布N(μ,1.252),其中μ近似为(1)中的样本平均值,计算该批产品质量指标值ξ≥519.75的概率;
(3)从该流水线上任取2件产品,设Y为质量超过515克的产品数量,求Y的分布列和数学期望.
附:若ξ~N(μ,σ2),则P(μ-σ<ξ≤μ+σ)≈0.682 7,P(μ-2σ<ξ≤μ+2σ)≈0.954 5,P(μ-3σ<ξ≤μ+3σ)≈0.997 3.
解:(1)由频率分布直方图可知,∵质量超过515克的产品的频率为10×0.035+10×0.025+10×0.005=0.65,
∴质量超过515克的产品数量为40×0.65=26(件).
=10×(500×0.015+510×0.020+520×0.035+530×0.025+540×0.005)=518.5.
(2)由题意可得μ=x=518.5,σ=1.25
则P(μ-σ<ξ≤μ+σ)=P(517.25<ξ≤519.75)≈0.682 7,
则该批产品质量指标值ξ≥519.75的概率:
P(ξ≥519.75)==0.158 65.
(3)根据用样本估计总体的思想,从该流水线上任取一件产品,该产品的质量超过515克的概率为==0.65.所以,从流水线上任取2件产品互不影响,该问题可看作二项分布.故质量超过515克的件数Y可能的取值为0,1,2,且Y~B2,,
∴P(Y=k)=C×k×1-2-k,k=0,1,2,
∴P(Y=0)=C×2=
P(Y=1)=C××==P(Y=2)=C×2=,∴Y的分布列为
Y
0
1
2
P
Y的均值为E(Y)=0×+1×+2×=1.3或者E(Y)=2×=1.3
[当堂达标]
1.函数f(x)=e-(其中μ<0)的图象可能为( )
解析:A [函数f(x)图象的对称轴为直线x=μ,因为μ<0,所以排除B,D;又正态曲线位于x轴上方,因此排除C.]
2.已知三条正态曲线φi(x)=e-(x∈R,i=1,2,3)如图所示,则下列判断正确的是( )
A.μ1<μ2=μ3,σ1=σ2>σ3
B.μ1>μ2=μ3,σ1=σ2<σ3
C.μ1=μ2<μ3,σ1<σ2=σ3
D.μ1<μ2=μ3,σ1=σ2<σ3
解析:D [由正态曲线关于直线x=μ对称,知μ1<μ2=μ3.σ的大小决定曲线的形状,σ越大,随机变量的分布越分散,曲线越“矮胖”;σ越小,随机变量的分布越集中,曲线越“瘦高”,则σ1=σ2<σ3,实际上,由φ1(μ1)=φ2(μ2)>φ3(μ3), 得=>,即σ1=σ2<σ3.]
3.若随机变量X~N(0,1),则P(x<0)= ________ .
解析:由标准正态曲线关于y轴对称可知P(x<0)=.
答案:
4.在正态分布N中,数据落在(-2,2)内的概率为 ________ .
解析:由题可得μ=0,σ=,P(-2<X<2)=P(μ-3σ<X<μ+3σ)=0.997 3.
答案:0.997 3
5.已知随机变量x~N(2,σ2),如图所示,若P(x<a)=0.32,求P(a≤x<4-a)的值.
解:由正态分布图象的对称性可得,P(a≤x≤4-a)=1-2P(x<a)=0.36.
[基础过关]
1.已知随机变量X~N(1,σ2),若P(0<X<3)=0.5,P(0<X<1)=0.2,则P(X<3)=( )
A.0.4 B.0.6
C.0.7 D.0.8
解析:D [由题意可得P(1<X<3)=0.5-0.2=0.3.
∵随机变量X~N(1,σ2),∴P(X<3)=0.3+0.5=0.8.]
2.巴黎奥运会期间,旅客人数(万人)为随机变量X,且X~N(30,22).记一天中旅客人数不少于26万人的概率为P0,则P0的值约为( )
(参考数据:若X~N(μ,σ2),有P(μ-σ<X≤μ+σ)≈0.683,)
P(μ-2σ<X≤μ+2σ)≈0.954,P(μ-3σ<X≤μ+3σ)≈0.997
A.0.977 B.0.972 5
C.0.954 D.0.683
解析:A [因为X~N(30,22),所以μ=30,σ=2,
∴P(26<X≤34)=0.954,
根据正态曲线的对称性可得,P0=P(X≥26)=P(26<X≤34)+P(X>34)=0.954+=0.977.]
3.某工厂生产的零件外直径(单位:cm)服从正态分布N(10,0.04),今从该厂上午、下午生产的零件中各随机取出一个,测得其外直径分别为9.75 cm和9.35 cm,则可认为( )
A.上午生产情况异常,下午生产情况正常
B.上午生产情况正常,下午生产情况异常
C.上午、下午生产情况均正常
D.上午、下午生产情况均异常
解析:B [∵零件外直径服从正态分布N(10,0.04),∴根据3σ原则,产品外直径在[10-3×0.2,10+3×0.2]
即[9.4,10.6]之外时为异常.
∵9.4<9.75<10.6,9.35<9.4,∴可认为上午生产情况正常,下午生产情况异常,故选B.]
4.某物理量的测量结果服从正态分布N(10,σ2),下列结论中不正确的是( )
A.σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大
B.该物理量在一次测量中大于10的概率为0.5
C.该物理量在一次测量中小于9.99与大于10.01的概率相等
D.该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等
解析:D [考查对正态分布概念和性质的理解,属于简单题.
因为μ=10,该物理量在一次测量中落在(9.9,10.2)的概率大于落在(10,10.3)的概率,故D不正确.]
5.(多选)某市组织一次高三调研考试,考试后统计的数学成绩X(单位:分)服从正态分布,其概率密度函数为f(x)=e-,则下列说法正确的是( )
A.这次考试的数学平均成绩为80分
B.分数在120分以上的人数与分数在60分以下的人数相同
C.分数在110分以上的人数与分数在50分以下的人数相同
D.这次考试的数学成绩的标准差为10
解析:ACD [由函数解析式知这次考试的数学平均成绩为80分,标准差为10,故A,D正确.因为函数图象关于直线x=80对称,所以分数在120分以上的人数与分数在40分以下的人数相同;分数在110分以上的人数与分数在50分以下的人数相同,故B错误,C正确.]
6.(多选)已知随机变量X服从正态分布N(μ,σ2),其正态曲线在(-∞,80)上单调递增,在(80,+∞)上单调递减,且P(72<X≤88)=0.682 7,则( )
A.μ=80
B.σ=4
C.P(X>64)=0.977 25
D.P(64<X≤72)=0.135 9
解析:ACD [因为正态曲线在(-∞,80)上单调递增,在(80,+∞)上单调递减,所以正态曲线关于直线x=80对称,所以μ=80;因为P(72<X≤88)=0.682 7,结合P(μ-σ<X≤μ+σ)≈0.682 7,可知σ=8;
因为P(μ-2σ<X≤μ+2σ)≈0.954 5,
且P(X<64)=P(X>96),
所以P(X<64)≈×(1-0.954 5)=×0.045 5
=0.022 75,所以P(X>64)=0.977 25;
因为P(X≤72)=(1-P(72<X≤88))
=×(1-0.682 7)=0.158 65,
所以P(64<X≤72)=P(X>64)-P(X>72)
=0.977 25-(1-0.158 65)=0.135 9.]
7.某种零件的尺寸X(单位:cm) 服从正态分布N(3,1),则不属于区间(1,5)这个尺寸范围的零件数约占总数的 ________ .
解析:属于区间(μ-2σ,μ+2σ),即区间(1,5)的取值概率约为95.4%,故不属于区间(1,5)这个尺寸范围的零件数约占总数的1-95.4%=4.6%.
答案:4.6%
8.设随机变量ξ服从标准正态分布N(0,1),在某项测量中,已知ξ在(-∞,-1.96]内取值的概率为0.025,则P(|ξ|<1.96)= ________
解析:因为曲线的对称轴是直线x=0,
所以由图知P(ξ>1.96)=P(ξ≤-1.96)=0.025,
∴P(|ξ|<1.96)=1-0.025-0.025=0.950.
答案:0.95
9.新高考中,某省对政治、地理、化学、生物四门选考科目进行赋分制度计分,即将每门选考科目的考生原始成绩从高分到低分划分为A、B、C、D、E共5个等级,参照正态分布原则,确定各等级人数所占比例分别为10 %,35 %,35 %,18 %,2 %,选考科目成绩计入考生总成绩时,将A至E等级内的考生原始成绩,依照等比例转换原则,分别转换到[86,100],[71,85],[56,70],[41,55],[30,40]五个分数区间,得到考生的赋分等级成绩,如果该省某次高考模拟考试政治科目的原始成绩X~N(50,256),若一名学生想取得A等的赋分等级,则他的原始分数最低为 ________ 分.(分数保留整数)
附:①若X~N(μ,σ2),Y=,则Y~N(0,1);②当Y~N(0,1)时,P(Y≤1.3)≈0.9.
解析:由题意知:从高分到低分,即A等级人数所占比例为10 %,若A等级的原始分最低为X,又原始成绩X~N(50,256),μ=50,σ=16,令Y=,则Y~N(0,1),又P(Y≤1,3)≈0.9,所以P(Y≥1.3)=1-P(Y≤1.3)≈0.1,即≥1.3,可得X≥50+1.3×16=70.8≈71分,则他的原始分数最低为71.
答案:71
10.设随机变量X~N(2,9),若P(X>c+1)=P(X<c-1).
(1)求c的值:
(2)求P(-4<x<8).
解:(1)由X~N(2,9)可知,密度函数关于直线x=2对称(如图所示),
又P(X>c+1)=P(x<c-1),故有2-(c-1)=(c+1)-2,所以c=2.
(2)P(-4<x<8)=P(2-2×3<x<2+2×3)≈95.4%.
11.在某次数学考试中,考生的成绩X服从正态分布N(90,100).
(1)试求考试成绩X位于区间(70,110)上的概率是多少?
(2)若这次考试共有2 000名考生,试估计考试成绩在(80,100)内的考生大约有多少人?
解:因为X~N(90,100),所以μ=90,σ==10.
(1)由于X在区间(μ-2σ,μ+2σ)内取值的概率是0.954 5,而该正态分布中,μ-2σ=90-2×10=70,μ+2σ=90+2×10=110,
于是考试成绩X位于区间(70,110)内的概率是0.954 5.
(2)由μ=90,σ=10,得μ-σ=80,μ+σ=100.
由于变量X在区间(μ-σ,μ+σ)内取值的概率是0.682 7,所以考试成绩X位于区间(80,100)内的概率是0.682 7,一共有2 000名考生,所以考试成绩在(80,100)内的考生大约有2 000×0.682 7≈1 365(人).
[能力提升]
12.某年级的一次信息技术测验成绩近似服从正态N(70,102),如果规定低于60分为不及格,求:
(1)成绩不及格的人数占多少?
(2)成绩在80~90分的学生占多少?
解:(1)设学生的得分情况为随机变量X,
X~N(70,102),则μ=70,σ=10.
所以成绩在60~80的学生的比为
P(70-10<X≤70+10)=0.682 6.
所以成绩不及格的学生的占比为
×(1-0.682 7)=0.158 65,
即成绩不及格的学生占15.87%.
(2)成绩在80~90的学生比为
[P(70-2×10<X≤70+2×10)-P(70-10<X≤70+10)]
=×(0.954 5-0.682 7)=0.135 9.
即成绩在80~90的学生占13.59%.
13.某大型电器企业为了解组装车间职工的工作情况,从中随机抽取100名职工进行测试,得到频数分布表如下所示.
日组装
个数
[155,165)
[165,175)
[175,185)
人数
6
12
34
日组装
个数
[185,195)
[195,205)
[205,215]
人数
30
10
8
(1)现从参与测试的日组装个数少于175的职工中任意选取3人,求至少有1人日组装个数少于165的概率.
(2)由频数分布表可以认为,此次测试得到的日组装个数Z服从正态分布N(μ,169),μ近似为这100人日组装个数的平均值(同一组数据用该组区间的中点值作为代表).
①若组装车间有20 000名职工,求日组装个数超过198的职工人数;
②为鼓励职工提高技能,企业决定对日组装个数超过185的职工日工资增加50元,若在组装车间所有职工中任意选取3人,求这三人增加的日工资总额的期望.
附:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
解:(1)设至少有1人日组装个数少于165为事件A,
则P(A)=1-=.
(2)这100人日组装个数的平均值为×(160×6+170×12+180×34+190×30+200×10+210×8)=185,所以μ=185.
因为σ2=169,所以σ=13.
①易知μ+σ=198,所以P(X>198)=P(X>μ+σ)=[1-P(μ-σ≤X≤μ+σ)]≈=0.158 65,所以日组装个数超过198的人数为0.158 65×20 000=3 173.
②因为μ=185,所以日组装个数在185以上的概率为0.5.
设这3人中日组装个数超过185的人数为ξ,这3人增加的日工资总额为η,则η=50ξ,且ξ~B(3,0.5),所以E(ξ)=3×0.5=1.5,所以E(η)=50E(ξ)=75元.
[素养培优]
14.零部件生产水平是评判一个国家高端装备制造能力的重要标准之一,其中切割加工技术是一项重要技术.某精密仪器制造商研发了一种切割设备,用来生产高精度的机械零件,经过长期生产检验,可以认为该设备生产的零件尺寸服从正态分布N(μ,σ2).某机械加工厂购买了该切割设备,在正式投入生产前进行了试生产,从试生产的零件中任意抽取10件作为样本,记样本的尺寸为xi(i=1,2,3,…,10,单位:mm),测得的数据如下表:
100.03
100.4
99.92
100.52
99.98
100.35
99.92
100.44
100.66
100.78
用样本的平均数作为μ的估计值,用样本的标准差s作为σ的估计值.
(1)按照技术标准的要求,若样本尺寸均在[μ-3σ,μ+3σ](单位:mm)范围内,则认定该设备质量合格,根据数据判断该切割设备的质量是否合格.
(2)该机械加工厂将该切割设备投入生产,对生产的零件制定了如下两种销售方案(假设每种方案对销售量没有影响).
方案1:每个零件均按70元定价销售.
方案2:若零件的实际尺寸在[99.7,100.3](单位:mm)范围内,则该零件为A级零件,每个零件定价100元,否则为B级零件,每个零件定价60元.
哪种销售方案的利润更大?请根据数据计算说明.
附:x≈100 601.8,样本方差s2=
(xi-)2=(x-n 2).
若X~N(μ,σ2),则P(μ-σ≤μ+σ)≈0.682 7,
P(μ-2σ≤X≤μ+2σ)≈0.954 5.
解:(1)根据题意知,样本的平均数=xi=×(100.03+100.4+99.92+100.52+99.98+100.35+99.92+100.44+100.66+100.78)=100.3,
方差s2= (xi-)2=(x-10 2)≈×(100 601.8-10×100.32)=0.09,所以μ=100.3,σ=0.3.因为样本尺寸xi∈[99.4,101.2],所以该切割设备的质量合格.
(2)若采用方案2,则可设生产的零件售价为随机变量ξ,则ξ可以取60,100.
由(1)知,该设备生产的零件尺寸X~N(100.3,0.32),所以P(ξ=100)=P(99.7≤X≤100.3)=P(μ-2σ≤X≤μ)≈×0.954 5=0.477 25,
P(ξ=60)=1-P(ξ=100)≈1-0.477 25=0.522 75.
所以随机变量ξ的分布列如下.
ξ
60
100
P
0.522 75
0.477 25
所以ξ的数学期望为E(ξ)≈60×0.522 75+100×0.477 25=79.09.
因为79.09>70,即采用方案2时每个零件的平均售价高于采用方案1时的定价,所以方案2的利润更大.
学科网(北京)股份有限公司
$