内容正文:
7.5 正态分布
第七章 随机变量及其分布
学习单元4
[学习目标] 1.通过误差模型,了解正态曲线、正态分布的概念. 2.借助具体实例的频率分布直方图,了解正态分布的特征及曲线表示的含义. 3.了解正态分布的均值、方差及其含义,会用正态分布解决实际问题.
知识点1 正态曲线的图象与性质
内容索引
知识点2 利用正态分布的性质求概率
课时作业 巩固提升
知识点3 正态分布的实际应用
课堂达标·素养提升
3
知识点1 正态曲线的图象与性质
1.我们称f(x)=,x∈R,其中μ∈R,σ>0为参数,为
,称它的图象为正态密度曲线,简称 .
2.若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为 .特别地,当μ=0,σ=1时,称随机变量X服从
.
3.若X~N(μ,σ2),则E(X)=μ,D(X)=σ2.
正态密度函数
正态曲线
X~N(μ,σ2)
标准正态分布
4.正态曲线的特点
(1)非负性:对∀x∈R,f(x)>0,它的图象在x轴的上方.
(2)定值性:曲线与x轴之间的区域的面积为1.
(3)对称性:曲线是单峰的,它关于直线 对称.
(4)最大值:曲线在 处达到峰值.
(5)当|x|无限增大时,曲线无限接近 轴.
x=μ
x=μ
x
(6)当σ一定时,正态曲线的位置由μ确定,正态曲线随着μ的变化而沿x轴平移,如图①.
(7)当μ一定时,正态曲线的形状由σ确定,当σ较小时,峰值高,正态曲线“瘦高”,表示随机变量X的分布比较集中;当σ较大时,峰值低,正态曲线“矮胖”,表示随机变量X的分布比较分散,如图②.
[例1] (1)(多选)一次教学质量检测中,甲、乙、丙三科考试成绩的正态分布密度曲线如图所示,下列说法中不正确的是( )
A.甲科总体的标准差最小
B.丙科总体的平均数最小
C.乙科总体的标准差及平均数都比甲小,比丙大
D.甲、乙、丙总体的平均数不相同
(2)已知随机变量服从正态分布,其正态曲线如图所示,则总体的均值μ= ,方差σ2= .
[分析] (1)根据正态曲线的性质即可得出结论.
(2)首先借助图象观察该函数的对称轴及最大值,然后结合f(x)=可知μ及σ的值.
[答案] (1)BCD (2)20 2
[解析] (1)由题图可知三科总体的平均数(均值)相等,由正态分布密度曲线的性质,可知σ越大,正态曲线越“矮胖”,σ越小,正态曲线越“瘦高”.
故三科总体的标准差从小到大依次为甲、乙、丙.
(2)从给出的正态曲线可知,该正态曲线关于直线x=20对称,最大值是.
所以μ=20,=,解得σ=,因此总体的均值μ=20,方差σ2=()2=2.
利用正态曲线的特点求参数μ,σ
1.正态曲线是单峰的,它关于直线x=μ对称,由此特点结合图象求出μ.
2.正态曲线在x=μ处达到峰值,由此特点结合图象可求出σ.
思维提升
1.设两个正态分布N(μ1,)(σ1>0)和N(μ2,)(σ2>0)的密度函数图象如图所示,则有( )
A.μ1<μ2,σ1<σ2 B.μ1<μ2,σ1>σ2
C.μ1>μ2,σ1<σ2 D.μ1>μ2,σ1>σ2
跟踪训练
A
解析:由正态分布N(μ,σ2)性质知,x=μ为正态密度函数图象的对称轴,故μ1<μ2.又σ越小,图象越高瘦,故σ1<σ2.
2.(多选)甲、乙两类水果的质量(单位:kg)分别服从正态分布N(μ1,),N(μ2,),其正态密度函数f(x)=,x∈R的正态曲线如图所示,则下列说法正确的是( )
A.甲类水果的平均质量μ1=0.4 kg
B.甲类水果的质量比乙类水果的质量更集中于平均值左右
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从的正态分布的参数σ2=1.99
ABC
解析:由题图可知甲图象关于直线x=0.4对称,乙图象关于直线x=0.8对称,
所以μ1=0.4,μ2=0.8,μ1<μ2,故A,C正确;
因为甲图象比乙图象更“瘦高”,所以甲类水果的质量比乙类水果的质量更集中于平均值左右,故B正确;
因为乙图象的最大值为1.99,即=1.99,σ2≠1.99,故D错误.
知识点2 利用正态分布的性质求概率
1.正态分布的几何意义
若X~N(μ,σ2),如图所示,X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.
2.正态总体在三个特殊区间内取值的概率值
P(μ-σ≤X≤μ+σ)≈ ;
P(μ-2σ≤X≤μ+2σ)≈ ;
P(μ-3σ≤X≤μ+3σ)≈ .
0.682 7
0.954 5
0.997 3
[例2] (1)某区高三年级3 200名学生参加了区统一考试.已知考试成绩X服从正态分布N(100,σ2)(试卷满分为150分).统计结果显示,考试成绩在80分到120分之间的人数约为总人数的,则此次考试中成绩不低于120分的学生人数约为( )
A.350 B.400
C.450 D.500
(2)某校高二年级对物选组合学生进行物理学科抽测,总分100分,学生的抽测结果X服从正态分布N(70,100),其中60分为及格线,90分为优秀线.若高二年级共有物选组合学生682人,则抽测结果在及格线与优秀线之间的学生人数大约为( )
(参考:P(μ-δ<ξ<μ+δ)=0.682 7,P(μ-2δ<ξ<μ+2δ)=0.954 5)
A.456 B.558
C.584 D.651
[答案] (1)B (2)B
[解析] (1)依题意,P(80<X<120)=0.75,而X服从正态分布N(100,σ2),
因此P(X≥120)=-P(80<X<120)=0.125,
所以此次考试中成绩不低于120分的学生人数约为3 200×0.125=400.
(2)抽测结果在及格线与优秀线之间的学生所占的比例为+=≈0.818 6,
故学生人数为682×0.818 6≈558.
利用正态分布求概率的两个方法
1.对称法:由于正态曲线是关于直线x=μ对称的,且概率的和为1,故关于直线x=μ对称的区间概率相等.如:
(1)P(X<a)=1-P(X≥a);
(2)P(X<μ-a)=P(X>μ+a).
2.“3σ”法:利用X落在区间[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]内的概率分别是0.682 7,0.954 5,0.997 3求解.
思维提升
3.已知正态分布N(1,σ2)的正态密度曲线如图所示,则下列选项中,不能表示图中阴影部分面积的是( )
A.-P(X≤0) B.-P(X≥2)
C.-P(1≤X≤2) D.P(X≤2)-P(X≤0)
跟踪训练
C
解析:正态分布N(1,σ2)的正态密度曲线关于直线x=1对称,可得图中阴影部分可表示为P(0≤X≤1)=P(X≤1)-P(X≤0)=-P(X≤0)=-P(X≥2),故选项A,B正确;
对C:由对称性可得-P(1≤X≤2)=P(X≥2)=P(X≤0),故选项C错误;
对D:由对称性可得P(0≤X≤1)=P(1≤X≤2),
所以图中阴影部分面积可表示为P(0≤X≤1)=[P(X≤2)-P(X≤0)],故选项D正确.
4.在某次数学测试中,学生成绩X服从正态分布N(100,σ2)(σ>0).若X在(80,120)内的概率为0.8,则X在(0,80)内的概率为( )
A.0.05 B.0.1
C.0.15 D.0.2
B
解析:由题意得,P(80<X<100)=P(100<X<120)=0.4,
P(0<X<100)=0.5,∴P(0<X<80)=0.1.
知识点3 正态分布的实际应用
[例3] 有一种精密零件,其尺寸X(单位:mm)服从正态分布,即X~N(20,4).若这批零件共有5 000个,试求:
(1)这批零件中尺寸在18~22 mm间的零件所占的百分比.
(2)若规定尺寸在24~26 mm间的零件不合格,则这批零件中不合格的零件大约有多少个?
[分析] (1)识别出P(18≤X≤22)=P(20-2≤X≤20+2)=P(μ-σ≤X≤μ+σ)即可得解.
(2)P(μ+2σ≤X≤μ+3σ)=[P(μ-3σ≤X≤μ+3σ)-P(μ-2σ<X<μ+2σ)].
[解] (1)∵X~N(20,4),
∴μ=20,σ=2,
∴P(18≤X≤22)=P(20-2≤X≤20+2)=P(μ-σ≤X≤μ+σ)≈0.682 7,
∴零件尺寸在18~22 mm间的零件所占百分比大约是68.27%.
(2)∵P(16≤X≤24)=P(20-2×2≤X≤20+2×2)=
P(μ-2σ≤X≤μ+2σ)≈0.954 5,
P(14≤X≤26)=P(20-3×2≤X≤20+3×2)=P(μ-3σ≤X≤μ+3σ)≈0.997 3,
∴P(24≤X≤26)=[P(14≤X≤26)-P(16≤X≤24)]≈×(0.997 3-0.954 5)
≈0.021 4,
∴零件尺寸在24~26 mm间的百分比大约是2.14%.
因此不合格的零件大约有5 000×2.14%=107(个).
解答这类问题的关键是:第一,能够根据正态分布的参数,判别出所提供区间与特殊区间的关系;第二,熟记正态变量的取值位于区间[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]上的概率值,同时又要根据已知的正态分布确定给定区间属于上述三个区间中的哪一个.
思维提升
5.在某校举行的一次数学竞赛中,全体参赛学生的竞赛成绩X近似服从正态分布N(70,100).已知成绩在90分以上(含90分)的学生有16名.
(1)试问此次参赛的学生总数约为多少?
(2)若该校计划奖励竞赛成绩在80分以上(含80分)的学生,试问此次竞赛获奖励的学生约为多少人?
附:P(|X-μ|<σ)≈0.683,P(|X-μ|<2σ)≈0.955,P(|X-μ|<3σ)≈0.997.
跟踪训练
解:(1)设参赛学生的成绩为X,因为X~N(70,100),所以μ=70,σ=10,
则P(X≥90)=P(X≤50)=[1-P(50<X<90)]=[1-P(μ-2σ<X<μ+2σ)]≈×(1-0.955)=0.022 5,16÷0.022 5≈711(人).
因此,此次参赛学生的总数约为711人.
(2)由P(X≥80)=P(X≤60)=[1-P(60<X<80)]=×[1-P(μ-σ<X<μ+σ)]≈×(1-0.683)=0.158 5,得711×0.158 5≈113(人).
因此,此次竞赛获奖励的学生约为113人.
〈课堂达标·素养提升〉
1.若随机变量X~N(x,y),且P(X<2)=P(X≥6)=,则( )
A.y<4 B.y=4
C.x<4 D.x=4
D
解析:因为随机变量X~N(x,y),即x=μ,y=σ2,
且P(X<2)=P(X≥6)=,
则x==4,故D正确,C错误;而y的大小无法判断,故A,B错误.
2.随机变量X服从正态分布X~N(2,σ2).若P(2≤X<4)=0.3,则P(X<0)=( )
A.0.2 B.0.3
C.0.4 D.0.6
解析:因为X~N(2,σ2),所以P(X<0)=P(X>4)=0.5-P(2≤X<4)=0.5-0.3=0.2.
A
3.已知随机变量X服从正态分布N(10,22),则D(3X-1)等于( )
A.6 B.11
C.12 D.36
解析:因为随机变量X服从正态分布N(10,22),
所以D(X)=22=4,
所以D(3X-1)=32D(X)=9×4=36.
D
4.如果X~N(μ,σ2),且P(X>3)=P(X<1)成立,则μ= .
解析:因为X~N(μ,σ2),故正态曲线关于直线x=μ对称,又P(X<1)=P(X>3),从而μ==2,即μ的值为2.
2
课时作业 巩固提升
[A组 必备知识练]
1.设随机变量X服从正态分布N(2,σ2),若P(X>c)=a,则P(X>4-c)等于( )
A.a B.1-a
C.2a D.1-2a
1
2
3
4
5
6
7
8
9
10
11
12
B
解析:因为X服从正态分布N(2,σ2),所以正态曲线关于直线x=2对称,所以P(X>4-c)=P(X<c)=1-P(X>c)=1-a.
1
2
3
4
5
6
7
8
9
10
11
12
2.已知随机变量X服从正态分布N(2,σ2),P(X>1)=0.7,则P(2<X<3)=( )
A.0.7 B.0.6
C.0.4 D.0.2
1
2
3
4
5
6
7
8
9
10
11
12
D
解析:根据题意,随机变量X服从正态分布N(2,σ2),
则P(X<2)=P(X>2)=0.5,因为P(X>1)=0.7,
所以P(1<X<2)=P(X>1)-P(X>2)=0.2,故P(2<X<3)=P(1<X<2)=0.2.
1
2
3
4
5
6
7
8
9
10
11
12
3.已知随机变量X~N(6,1),且P(μ-σ≤X≤μ+σ)≈0.682 7,
P(μ-2σ≤X≤μ+2σ)≈0.954 5,则P(7<X≤8)为( )
A.0.135 8 B.0.271 6
C.0.135 9 D.0.271 8
1
2
3
4
5
6
7
8
9
10
11
12
C
解析:由题设可得P(5≤X≤7)≈0.682 7,
P(4≤X≤8)≈0.954 5,
则P(7<X≤8)=[P(4≤X≤8)-P(5≤X≤7)]≈=0.135 9.
1
2
3
4
5
6
7
8
9
10
11
12
4.(多选)已知若ξ~N(μ,σ2),则~N(0,1).某次数学考试满分150分,甲、乙两校各有1 000人参加考试,其中甲校成绩X~N(90,302),乙校成绩Y~N(95,202),则( )
A.甲校成绩在80分及以下的人数多于乙校
B.乙校成绩在110分及以上的人数少于甲校
C.甲、乙两校成绩在90~95分的人数占比相同
D.甲校成绩在85~95分与乙校成绩在90~100分的人数占比相同
1
2
3
4
5
6
7
8
9
10
11
12
AB
解析:当X≤80时,≤-,当Y≤80时,≤-,由标准正态分布可知P(X≤80)>P(Y≤80),故A正确;
当X≥110时,≥,当Y≥110时,≥,
所以P(X≥110)>P(Y≥110),故B正确;
由于甲、乙学校成绩在90~95分转化为标准正态分布对应的概率分别为P,P,由正态分布的对称性知,P>P,甲、乙两校成绩在90~95分的人数占比不同,故C错误;
1
2
3
4
5
6
7
8
9
10
11
12
由于甲校方差大于乙校,所以在均值附近左右两侧取相同宽度的取值区间时,转化为标准正态分布,甲校对应概率小于乙校对应概率,故D错误.
1
2
3
4
5
6
7
8
9
10
11
12
5.设随机变量X服从正态分布N(3,5),若P(X<2a-1)=P(X>a+2),则实数
a= .
解析:因为随机变量X服从正态分布N(3,5),且P(X<2a-1)=P(X>a+2),所以由正态曲线的对称性可知=3,解得a=.
1
2
3
4
5
6
7
8
9
10
11
12
6.在某班的高二期末考试中,男生的数学成绩X~N(90,σ2),已知P(70<X≤90)=0.35,则从全校高二男生中任选一名学生,该学生的数学成绩小于110分的概率为 .
1
2
3
4
5
6
7
8
9
10
11
12
0.85
解析:∵X~N(90,σ2),∴μ=90.
又P(70<X≤90)=0.35,
∴P(90≤X<110)=0.35,
∴P(X≥110)==0.15,
则P(X<110)=1-0.15=0.85,
∴该学生的数学成绩小于110分的概率为0.85.
1
2
3
4
5
6
7
8
9
10
11
12
7.在一次测试中,测试结果X服从正态分布N(2,σ2),若X在区间(0,2)内取值的概率为0.2.
(1)求X在区间(0,4)内取值的概率;
(2)试求P(X>4).
1
2
3
4
5
6
7
8
9
10
11
12
解:(1)由X~N(2,σ2),知对称轴x=2,作出正态曲线的大致图象如图所示.
因为P(0<X<2)=P(2<X<4),
所以P(0<X<4)=2P(0<X<2)=2×0.2=0.4.
(2)P(X>4)=[1-P(0<X<4)]=(1-0.4)=0.3.
1
2
3
4
5
6
7
8
9
10
11
12
8.已知某种零件的尺寸X(单位:mm)服从正态分布,其正态曲线在(0,80)上是增函数,在(80,+∞)上是减函数,且f(80)=.
(1)求概率密度函数.
(2)估计尺寸在72~88 mm间的零件数大约占总数的百分之几?
1
2
3
4
5
6
7
8
9
10
11
12
解:(1)由于正态曲线在(0,80)上是增函数,在(80,+∞)上是减函数,所以正态曲线关于直线x=80对称,且在x=80处取得最大值,因此得μ=80.
=,所以σ=8.
故密度函数解析式是f(x)=.
(2)由μ=80,σ=8,得μ-σ=80-8=72,μ+σ=80+8=88,
所以零件尺寸X位于区间(72,88)内的概率约为0.682 7.
因此尺寸在72~88 mm间的零件数大约占总数的68.27%.
1
2
3
4
5
6
7
8
9
10
11
12
[B组 关键能力练]
9.(多选)为了解高三学生体能情况,某中学对所有高三男生进行了1 000米跑测试,测试结果表明所有男生的成绩X(单位:分)近似服从正态分布N(75,σ2),P(X<60)=0.1,P(X<70)=0.3,则下列说法正确的是( )
A.若从高三男生中随机挑选1人,则他的成绩在(80,90]内的概率为0.2
B.若从高三男生中随机挑选1人,则他的成绩在[70,80]内的概率为0.4
C.若从高三男生中随机挑选2人,则他们的成绩都不低于75的概率为0.25
D.σ越大,P(X≥75)的值越小
1
2
3
4
5
6
7
8
9
10
11
12
ABC
解析:根据题意,X~N(75,σ2),
则P(80<X≤90)=P(60≤X<70)=P(X<70)-P(X<60)=0.2,
P(70≤X≤80)=1-2P(X<70)=0.4,故A,B正确;
由正态分布的性质,无论σ为何值,P(X≥75)=0.5,D错误;
若从高三男生中随机挑选2人,
则他们的成绩都不低于75的概率为0.5×0.5=0.25,故C正确.
1
2
3
4
5
6
7
8
9
10
11
12
10.某校在一次测试中约有600人参加考试,数学考试的成绩X~N(100,a2)(a>0,试卷满分150分),统计结果显示数学考试成绩在80分到120分之间的人数约为总人数的,则此次测试中数学考试成绩不低于120分的学生约有 人.
1
2
3
4
5
6
7
8
9
10
11
12
120
解析:因为成绩X~N(100,a2),所以其正态曲线关于直线x=100对称,又成绩在80分到120分之间的人数约为总人数的,由对称性知:成绩在120分以上的人数约为总人数的×=,所以此次数学考试成绩不低于120分的学生约有×600=120(人).
1
2
3
4
5
6
7
8
9
10
11
12
11.某工厂生产的产品的质量指标服从正态分布N(100,σ2).质量指标大于等于99且小于等于101的产品为良品,为使这种产品的良品率达到
95.45%,则需调整生产工艺,使得σ至多为 .(若X~N(μ,σ2),则P(|X-μ|≤2σ)≈0.954 5)
1
2
3
4
5
6
7
8
9
10
11
12
解析:依题可知,μ=100,再根据题意以及正态曲线的特征可知,
|X-100|≤2σ的解集A⊆[99,101],由|X-100|≤2σ可得,100-2σ≤X≤100+2σ,所以解得σ≤,故σ至多为.
1
2
3
4
5
6
7
8
9
10
11
12
[C组 素养培优练]
12.从某工厂的一个车间抽取某种产品50件,产品尺寸(单位:cm)落在各个小组的频数分布如下表.
1
2
3
4
5
6
7
8
9
10
11
12
数据
分组 [12.5,
15.5) [15.5,
18.5) [18.5,
21.5) [21.5,
24.5) [24.5,
27.5) [27.5,
30.5) [30.5,
33.5]
频数 3 8 9 12 10 5 3
(1)根据频数分布表,求该产品尺寸落在[27.5,33.5]的概率;
(2)求这50件产品尺寸的样本平均数;
(3)根据频率分布对应的直方图,可以认为这种产品尺寸X服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2,经计算得s2=22.37,利用正态分布,求P(X≥27.43).(附:≈4.73)
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
解:(1)根据频数分布表可知,产品尺寸落在[27.5,33.5]内的概率P==0.16.
(2)样本平均数=0.06×14+0.16×17+0.18×20+0.24×23+0.20×26+0.10×29+0.06×32=22.7.
(3)依题意这种产品尺寸X服从正态分布N(μ,σ2),
而μ==22.7,σ2=s2=22.37,则σ≈4.73,
∴P(22.7-4.73<X<22.7+4.73)=0.682 7.
∴P(X≥27.43)==0.158 65.
$$