内容正文:
[学习目标] 1.利用实际问题的频率分布直方图,了解正态曲线的特点及正态曲线所表示的意义.2.了解变量落在区间[ μ-σ,μ+σ ],[ μ-2σ,μ+2σ ],[ μ-3σ,μ+3σ ]内的概率大小.3.会用正态分布去解决实际问题.
导语
一所学校同年级的同学的身高,特别高的同学比较少,特别矮的同学也不多,大都集中在某个高度左右;某种电子产品的使用寿命也都接近某一个数,使用期过长,或过短的产品相对较少.生活中这样的现象很多,是否可以用数学模型来刻画呢?
一、正态曲线及其特征
问题1 下列随机变量哪个是离散型随机变量:
(1)掷一枚骰子一次,用X表示所得点数;
(2)白炽灯的使用时间.
提示 (1)是,(2)不是.
问题2 教材P74例2的高尔顿板试验中,随着重复次数的增加,频率分布直方图的形状会越来越像一条钟形曲线,那么这条曲线是否存在函数解析式呢?
提示 存在.
知识梳理
1.我们称f(x)=,x∈R,其中μ∈R,σ>0为参数,为正态密度函数,称它的图象为正态密度曲线,简称正态曲线.
2.若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ,σ2).特别地,当μ=0,σ=1时,称随机变量X服从标准正态分布.
3.若X~N(μ,σ2),则E(X)=μ,D(X)=σ2.
4.正态曲线的特点:
(1)非负性:对∀x∈R,f(x)>0,它的图象在x轴的上方.
(2)定值性:曲线与x轴之间的区域的面积为1.
(3)对称性:曲线是单峰的,它关于直线x=μ对称.
(4)最大值:曲线在x=μ处达到峰值.
(5)当|x|无限增大时,曲线无限接近x轴.
(6)当σ一定时,正态曲线的位置由μ确定,正态曲线随着μ的变化而沿x轴平移,如图①.
(7)当μ一定时,正态曲线的形状由σ确定,当σ较小时,峰值高,正态曲线“瘦高”,表示随机变量X的分布比较集中;当σ较大时,峰值低,正态曲线“矮胖”,表示随机变量X的分布比较分散,如图②.
5.正态分布的几何意义:若X~N(μ,σ2),如图所示,X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.
例1 (1)已知随机变量服从正态分布,其正态曲线如图所示,则总体的均值μ=________,方差σ2=________.
答案 20 2
解析 从给出的正态曲线可知,该正态曲线关于直线x=20对称,最大值是,所以=,解得σ=,因此总体的均值μ=20,方差σ2=()2=2.
(2)某工厂有甲、乙两条生产线生产同一型号的机械零件,产品的尺寸分别记为X,Y,已知X,Y均服从正态分布,X~N(μ1,σ),Y~N(μ2,σ),其正态曲线如图所示,则下列结论中正确的是( )
A.甲生产线产品的稳定性高于乙生产线产品的稳定性
B.甲生产线产品的稳定性低于乙生产线产品的稳定性
C.甲生产线的产品尺寸平均值大于乙生产线的产品尺寸平均值
D.甲生产线的产品尺寸平均值小于乙生产线的产品尺寸平均值
答案 A
解析 由图知甲、乙两条生产线的平均值相等,甲的正态曲线较瘦高,所以甲生产线产品的稳定性高于乙生产线产品的稳定性.
反思感悟 利用正态曲线的特点求参数μ,σ
(1)正态曲线是单峰的,它关于直线x=μ对称,由此特点结合图象求出μ.
(2)正态曲线在x=μ处达到峰值,由此特点结合图象可求出σ.
跟踪训练1 (1)(多选)下面关于正态曲线的叙述中,正确的有( )
A.曲线在x轴上方,且与x轴不相交
B.当x>μ时,曲线下降,当x<μ时,曲线上升
C.当μ一定时,σ越小,总体分布越分散,σ越大,总体分布越集中
D.曲线关于直线x=μ对称,且当x=μ时,位于最高点
答案 ABD
解析 只有C错误,因为当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,总体分布越集中;σ越大,曲线越“矮胖”,总体分布越分散.
(2)(多选)甲、乙两类水果的质量(单位:kg)分别服从正态分布N(μ1,σ),N(μ2,σ),其正态密度函数f(x)=,x∈R的正态曲线如图所示,则下列说法正确的是( )
A.甲类水果的平均质量μ1=0.4 kg
B.甲类水果的质量比乙类水果的质量更集中于平均值左右
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从的正态分布的参数σ2=1.99
答案 ABC
解析 由图象可知甲图象关于直线x=0.4对称,乙图象关于直线x=0.8对称,
所以μ1=0.4,μ2=0.8,μ1<μ2,故A,C正确;
因为甲图象比乙图象更“瘦高”,所以甲类水果的质量比乙类水果的质量更集中于平均值左右,故B正确;
因为乙图象的最大值为1.99,
即=1.99,σ2≠1.99,故D错误.
二、利用正态分布的性质求概率
知识梳理
正态总体在三个特殊区间内取值的概率值
P(μ-σ≤X≤μ+σ)≈0.682 7;
P(μ-2σ≤X≤μ+2σ)≈0.954 5;
P(μ-3σ≤X≤μ+3σ)≈0.997 3.
注意点:
尽管正态变量的取值范围是(-∞,+∞),但在一次试验中,X的取值几乎总是落在区间[μ-3σ,μ+3σ]内,而在此区间以外取值的概率大约只有0.002 7,通常认为这种情况几乎不可能发生.
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]中的值,这在统计学中称为3σ原则.
例2 设ξ~N(1,22),试求:
(1)P(-1≤ξ≤3);(2)P(3≤ξ≤5).
解 ∵ξ~N(1,22),
∴μ=1,σ=2,
(1)P(-1≤ξ≤3)=P(1-2≤ξ≤1+2)
=P(μ-σ≤ξ≤μ+σ)≈0.682 7.
(2)∵P(3≤ξ≤5)=P(-3≤ξ≤-1),
∴P(3≤ξ≤5)=[P(-3≤ξ≤5)-P(-1≤ξ≤3)]
=[P(1-4≤ξ≤1+4)-P(1-2≤ξ≤1+2)]
=[P(μ-2σ≤ξ≤μ+2σ)-P(μ-σ≤ξ≤μ+σ)]
≈×(0.954 5-0.682 7)=0.135 9.
延伸探究 若本例条件不变,求P(ξ>5).
解 P(ξ>5)=P(ξ<-3)=[1-P(-3≤ξ≤5)]
=[1-P(1-4≤ξ≤1+4)]
=[1-P(μ-2σ≤ξ≤μ+2σ)]
≈×(1-0.954 5)=0.022 75.
反思感悟 利用正态分布求概率的两个方法
(1)对称法:由于正态曲线是关于直线x=μ对称的,且概率的和为1,故关于直线x=μ对称的区间概率相等.如:
①P(X<a)=1-P(X≥a);
②P(X<μ-a)=P(X>μ+a).
(2)“3σ”法:利用X落在区间[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]内的概率分别是0.682 7,0.954 5,0.997 3求解.
跟踪训练2 (1)已知随机变量ξ服从正态分布N(1,σ2),且P(ξ<2)=0.6,则P(0<ξ<2)等于( )
A.0.4 B.0.3 C.0.2 D.0.1
答案 C
解析 由已知可得曲线关于直线x=1对称,P(ξ<2)=0.6,
所以P(ξ≥2)=P(ξ≤0)=0.4,故P(0<ξ<2)=1-0.4-0.4=0.2.
(2)随机变量ξ服从正态分布N(μ,σ2),若P(ξ<2)=0.2,P(2<ξ<6)=0.6,则μ等于( )
A.3 B.4 C.5 D.6
答案 B
解析 ∵P(ξ<2)=0.2,P(2<ξ<6)=0.6,
∴P(ξ>6)=1-0.2-0.6=0.2,
即P(ξ<2)=P(ξ>6),∴μ==4.
三、正态分布的应用
例3 (1)现实世界中的很多随机变量遵循正态分布.例如反复测量某一个物理量,其测量误差X通常被认为服从正态分布.若某物理量做n次测量,最后结果的误差Xn ~N,则为使|Xn|>的概率控制在0.045 5及以下,至少要测量的次数为(附:若随机变量X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈
0.997 3)( )
A.32 B.64 C.128 D.256
答案 C
解析 根据题意,P≤0.045 5⇒P=P≥1-0.045 5=0.954 5,
而μ=0,则P(-2σ≤Xn≤2σ)≈0.954 5,
所以2σ≤⇒σ=≤⇒n≥128.
(2)某厂生产的圆柱形零件的外直径X(单位:cm)服从正态分布N(4,0.52).质检人员从该厂生产的1 000件零件中随机抽查1件,测得它的外直径为5.7 cm,试问:该厂生产的这批零件是否合格?
解 由于外直径X~N(4,0.52),
则X在[4-3×0.5,4+3×0.5]之内取值的概率为0.997 3,在[2.5,5.5]之外取值的概率为0.002 7,
而5.7∉[2.5,5.5],这说明在一次试验中,出现了几乎不可能发生的小概率事件,据此可以认为这批零件是不合格的.
反思感悟 解题时,应当注意零件尺寸应落在[μ-3σ,μ+3σ]之内,否则可以认为该批产品不合格.判断的根据是小概率事件在一次试验中几乎是不可能发生的,而一旦发生了,就可以认为这批产品不合格.
跟踪训练3 已知某平台某次促销活动期间,某小区居民网上购物的消费金额(单位:元)近似服从正态分布N(600,10 000),则该小区800名居民中,网购金额超过800元的人数大约为(附:若随机变量X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3)( )
A.16 B.18 C.20 D.25
答案 B
解析 ∵小区居民网上购物的消费金额(单位:元)近似服从正态分布N(600,10 000),
∴P=
≈=0.022 75,
∴该小区800名居民中,网购金额超过800元的人数大约为0.022 75×800=18.2≈18.
1.知识清单:
(1)正态曲线及其特征.
(2)利用正态分布的性质求概率.
(3)正态分布的应用.
2.方法归纳:转化化归、数形结合.
3.常见误区:概率区间转化不等价.
1.设有一正态总体,它的正态曲线是函数f(x)的图象,且f(x)=,则这个正态总体的均值与标准差分别是( )
A.10与8 B.10与2
C.8与10 D.2与10
答案 B
解析 由正态密度函数的定义可知,总体的均值μ=10,方差σ2=4,即σ=2.
2.某学校共1 000人参加数学测验,考试成绩ξ近似服从正态分布N(100,σ2),若P(80≤ξ≤100)=0.45,则估计成绩在120分以上的学生人数为( )
A.25 B.50 C.75 D.100
答案 B
解析 由已知可得,μ=100,所以P(ξ≥100)=0.5.
又P(80≤ξ≤100)=0.45,根据正态分布的对称性可得P(100≤ξ≤120)=0.45,
所以P(ξ>120)=P(ξ≥100)-P(100≤ξ≤120)=0.5-0.45=0.05.
所以,可估计成绩在120分以上的学生人数为1 000×0.05=50.
3.已知随机变量X服从正态分布N(10,22),则D(3X-1)等于( )
A.6 B.11 C.12 D.36
答案 D
解析 因为随机变量X服从正态分布N(10,22),
所以D(X)=22=4,
所以D(3X-1)=32D(X)=9×4=36.
4.如果ξ~N(μ,σ2),且P(ξ>3)=P(ξ<1)成立,则μ=________.
答案 2
解析 因为ξ~N(μ,σ2),故正态曲线关于直线x=μ对称,又P(ξ<1)=P(ξ>3),从而μ==2,即μ的值为2.
1.已知随机变量X~N(6,1),且P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,则P(7<X≤8)为( )
A.0.135 8 B.0.271 6
C.0.135 9 D.0.271 8
答案 C
解析 由题设可得P(5≤X≤7)≈0.682 7,
P(4≤X≤8)≈0.954 5,
则P(7<X≤8)=[P(4≤X≤8)-P(5≤X≤7)]≈=0.135 9.
2.某物理量的测量结果服从正态分布N(10,σ2),下列结论中不正确的是( )
A.σ越小,该物理量在一次测量中测量结果落在(9.9,10.1)内的概率越大
B.该物理量在一次测量中测量结果大于10的概率为0.5
C.该物理量在一次测量中测量结果小于9.99与大于10.01的概率相等
D.该物理量在一次测量中测量结果落在(9.9,10.2)内与落在(10,10.3)内的概率相等
答案 D
解析 因为某物理量的测量结果服从正态分布N(10,σ2),
所以测量结果的分布关于直线x=10对称,且方差σ2越小,分布越集中.
对于A,σ越小,测量结果的分布越集中在10左右,则该物理量在一次测量中测量结果落在(9.9,10.1)内的概率越大,故选项A正确;
对于B,不管σ取何值,测量结果大于10的概率均为0.5,故选项B正确;
对于C,由于测量结果的分布关于直线x=10对称,所以测量结果大于10.01的概率等于小于9.99的概率,故选项C正确;
对于D,由于测量结果的分布是集中在10附近的,(9.9,10.2)分布在10附近的区域大于(10,10.3)分布在10附近的区域,故测量结果落在(9.9,10.2)内的概率大于落在(10,10.3)内的概率,故选项D错误.
3.已知随机变量X~B(6,p),Y~N(μ,σ2),且P(Y≥2)=,E(X)=E(Y),则p等于( )
A. B. C. D.
答案 B
解析 因为随机变量X~B(6,p),
所以E(X)=6p,
因为Y~N(μ,σ2),P(Y≥2)=,所以μ=2,
即E(Y)=2,
又E(X)=E(Y),所以6p=2,即p=.
4.某中学抽取了1 600名同学进行身高调查,已知样本的身高(单位:cm)服从正态分布N(170,σ2).若身高在165 cm到175 cm的人数占样本总数的,则样本中不高于165 cm的人数约为( )
A.80 B.160 C.240 D.320
答案 B
解析 P(X≤165)=×=,
则样本中不高于165 cm的人数约为1 600×=160.
5.(多选)已知三个正态密度函数fi(x)=(x∈R,i=1,2,3)的图象如图所示,则下列结论正确的是( )
A.σ1=σ2 B.μ1>μ3
C.μ2=μ3 D.σ2<σ3
答案 ACD
解析 根据正态曲线关于直线x=μ对称,且μ越大,图象越靠近右边,所以μ1<μ2=μ3,故B错误,C正确;
又σ较小时,峰值高,正态曲线“瘦高”,所以σ1=σ2<σ3,故A,D正确.
6.(多选)已知若ξ~N(μ,σ2),则~N(0,1).某次数学考试满分150分,甲、乙两校各有1 000人参加考试,其中甲校成绩X~N(90,302),乙校成绩Y~N(95,202),则( )
A.甲校成绩在80分及以下的人数多于乙校
B.乙校成绩在110分及以上的人数少于甲校
C.甲、乙两校成绩在90~95分的人数占比相同
D.甲校成绩在85~95分与乙校成绩在90~100分的人数占比相同
答案 AB
解析 当X≤80时,≤-,当Y≤80时,≤-,由标准正态分布可知P(X≤80)>P(Y≤80),故A正确;
当X≥110时,≥,当Y≥110时,≥,
所以P(X≥110)>P(Y≥110),故B正确;
由于甲、乙学校成绩在90~95分转化为标准正态分布对应的概率分别为P,P,由正态分布的对称性知,P>P,甲、乙两校成绩在90~95分的人数占比不同,故C错误;
由于甲校方差大于乙校,所以在均值附近左右两侧取相同宽度的取值区间时,转化为标准正态分布,甲校对应概率小于乙校对应概率,故D错误.
7.设随机变量ξ服从正态分布N(4,3),若P(ξ<a-5)=P(ξ>a+1),则实数a=________.
答案 6
解析 由题意,随机变量ξ服从正态分布N(4,3),可得μ=4,σ2=3,又P(ξ<a-5)=P(ξ>a+1),所以a-5+a+1=8,解得a=6.
8.在某项测量中,测量结果ξ服从正态分布N(1,σ2)(σ>0).若ξ在(0,1)内取值的概率为0.4,则ξ在(0,2)内取值的概率为________.
答案 0.8
解析 因为随机变量ξ的均值为1,所以P(1<ξ<2)=P(0<ξ<1)=0.4,
所以P(0<ξ<2)=P(0<ξ<1)+P(1<ξ<2)=0.8.
9.某人骑自行车上班,第一条路线较短但拥挤,到达时间X(分钟)服从正态分布N(5,1);第二条路线较长不拥挤,X服从N(6,0.16).若有一天他出发时离点名时间还有7分钟,问他应选哪一条路线?若离点名时间还有6.5分钟,问他应选哪一条路线?
解 还有7分钟时:
若选第一条路线,即X~N(5,1),能及时到达的概率P1=P(X≤7)=P(X≤5)+P(5<X≤7)
=+P(μ-2σ≤X≤μ+2σ).
若选第二条路线,即X~N(6,0.16),能及时到达的概率
P2=P(X≤7)=P(X≤6)+P(6<X≤7)
=+P(μ-2.5σ≤X≤μ+2.5σ).
因为P1<P2,所以应选第二条路线.
同理,还有6.5分钟时,应选第一条路线.
10.某单位为了解职工对垃圾回收知识的重视情况,对本单位的200名职工进行考核,然后通过随机抽样抽取其中的50名,统计其考核成绩(单位:分),制成如图所示的频率分布直方图.
(1)求这50名职工考核成绩的平均数(同一组中的数据用该组区间的中点值为代表)及中位数t(精确到0.01);
(2)若该单位职工的考核成绩X服从正态分布N(μ,σ2),其中μ近似为50名职工考核成绩的平均数,σ2近似为样本方差s2,经计算得s2=27.68,利用该正态分布,估计该单位200名职工考核成绩高于90.06分的有多少名?(结果四舍五入保留整数)
参考数据:≈5.26,若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
解 (1)依题意,这50名职工考核成绩的平均数=74×0.04+78×0.12+82×0.28+86×0.36+90×0.10+94×0.06+98×0.04=84.80(分),
由频率分布直方图得t∈[84,88],
∴0.01×4+0.03×4+0.07×4+0.09×(t-84)=0.5,
∴中位数t≈84.67分.
(2)由题意得X~N(84.80,27.68),
μ+σ=84.80+≈90.06,
∴P(X>μ+σ)≈-≈0.158 7,
∴200×0.158 7≈32(名),
∴估计该单位200名职工考核成绩高于90.06分的有32名.
11.已知某批零件的长度X(单位:毫米)服从正态分布N(60,σ2),且P(X<62)=0.8,从中随机取一个零件,其长度落在区间(58,60)内的概率为( )
A.0.3 B.0.4 C.0.5 D.0.6
答案 A
解析 由题意知X~N(60,σ2),所以μ=60,
所以P(X<62)=0.8=P(X≤60)+P(60<X<62),又P(X≤60)=0.5,
所以P(60<X<62)=0.3,由正态曲线的对称性可得P(58<X<60)=0.3.
12.已知某节假日期间,某高速公路收费站的四个高速收费口每天通过的小汽车数Xi(i=1,2,3,4)(单位:辆)均服从正态分布N(600,σ2),若P(500<Xi<700)=(i=1,2,3,4),假设四个收费口均能正常工作,则这四个收费口每天至少有一个不低于700辆小汽车通过的概率为( )
A. B. C. D.
答案 D
解析 根据正态曲线的对称性可知,每个收费口有不低于700辆小汽车通过的概率P(Xi≥700)=×[1-P(500<Xi<700)]=×=(i=1,2,3,4),
所以这四个收费口每天至少有一个不低于700辆小汽车通过的概率P=1-4=.
13.设随机变量ξ服从正态分布N(μ,σ2),且一元二次方程x2+4x+ξ=0无实数根的概率为,则μ=______.
答案 4
解析 因为方程x2+4x+ξ=0无实数根的概率为,由Δ=16-4ξ<0,得ξ>4,即P(ξ>4)==1-P(ξ≤4),故P(ξ≤4)=,所以μ=4.
14.某工厂生产的产品的质量指标服从正态分布N(100,σ2).质量指标大于等于99且小于等于101的产品为良品,为使这种产品的良品率达到95.45%,则需调整生产工艺,使得σ至多为________.(若X~N(μ,σ2),则P(|X-μ|≤2σ)≈0.954 5)
答案
解析 依题可知,μ=100,再根据题意以及正态曲线的特征可知,|X-100|≤2σ的解集A⊆[99,101],
由|X-100|≤2σ可得,100-2σ≤X≤100+2σ,
所以解得σ≤,故σ至多为.
15.某汽车公司最近研发了一款新能源汽车,以单次最大续航里程500公里为标准进行测试,且每辆汽车是否达到标准相互独立,设每辆新能源汽车达到标准的概率为p(0<p<1),当100辆汽车中恰有80辆达到标准时的概率取最大值时,若预测该款新能源汽车的单次最大续航里程为X,且X~N(550,σ2),则预测这款汽车的单次最大续航里程不低于600公里的概率为( )
A.0.2 B.0.3 C.0.6 D.0.8
答案 A
解析 设100辆汽车中恰有80辆达到标准时的概率为f(p),则f(p)=Cp80(1-p)20(0<p<1),则f′(p)=Cp79(1-p)19(80-100p).当p∈(0,0.8)时,f′(p)>0,所以f(p)在(0,0.8)上单调递增;当p∈(0.8,1)时,f′(p)<0,所以f(p)在(0.8,1)上单调递减.所以f(p)在p=0.8处取得最大值.所以P(X≥600)=P(X≤500)=1-P(X≥500)=1-0.8=0.2.
16.已知某军区新兵50 m步枪射击个人平均成绩X(单位:环)服从正态分布N(μ,σ2),从中随机抽取100名新兵的个人平均成绩,得到如下的频数分布表:
X
4
5
6
7
8
9
频数
1
2
26
40
29
2
(1)求μ和σ2的值(用样本的均值和方差代替总体的均值和方差);
(2)从这个军区随机抽取1名新兵,求此新兵的50 m步枪射击个人平均成绩在区间(7.9,8.8]的概率.
参考数据:≈0.9.
解 (1)由题意,得随机抽取的100名新兵的个人平均成绩的分布列为(用频率估计概率):
X
4
5
6
7
8
9
P
0.01
0.02
0.26
0.40
0.29
0.02
均值E(X)=4×0.01+5×0.02+6×0.26+7×0.40+8×0.29+9×0.02=7,
方差D(X)=(4-7)2×0.01+(5-7)2×0.02+(6-7)2×0.26+(7-7)2×0.40+(8-7)2×0.29+(9-7)2×0.02=0.8.
用样本的均值和方差代替总体的均值和方差,得μ=7,σ2=0.8.
(2)由(1)知X~N(7,0.8),因为≈0.9,所以σ≈0.9,
因为P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,
所以P(7.9<X≤8.8)=×[P(5.2≤X≤8.8)-P(6.1≤X≤7.9]≈×(0.954 5-0.682 7)=0.135 9,
即从这个军区随机抽取1名新兵,此新兵的50 m步枪射击个人平均成绩在区间(7.9,8.8]的概率约为0.135 9.
学科网(北京)股份有限公司
$$