内容正文:
7.5 正态分布
目 标 素 养
1.通过误差模型,了解服从正态分布的随机变量.
2.通过具体实例,借助频率分布直方图的几何直观,了解正态分布的特征.
3.了解正态分布的均值、方差及其含义.
4.通过学习,提升数学抽象和数学运算的核心素养.
知 识 概 览
课前·基础认知
1.正态分布的有关概念
(1)随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为 0 ,我们称这类随机变量为连续型随机变量.
其中μ∈R,σ>0为参数.对任意的x∈R,f(x)>0,它的图象在x轴的上方.x轴和曲线之间的区域的面积为1.我们称f(x)为 正态密度函数 ,称它的图象为正态密度曲线,简称正态曲线.若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为 X~N(μ,σ2) .特别地,当μ=0,σ=1时,称随机变量X服从 标准正态分布 .
若X~N(μ,σ2),则如图所示,X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为图中区域B的面积.
2.正态曲线的特点
(1)曲线是单峰的,它关于直线 x=μ 对称;
(3)当|x|无限增大时,曲线无限接近x轴.
微训练 (1)若正态曲线关于y轴对称,则它所对应的正态总体均值为( )
A.1 B.-1
C.0 D.不确定
答案:C
解析:由正态曲线性质知均值为0.
(2)若正态分布N(0,1)在区间(-2,-1)和(1,2)内取值的概率为P1,P2,则二者大小关系为( )
A.P1=P2 B.P1<P2
C.P1>P2 D.不确定
答案:A
解析:根据正态曲线的特点,图象关于直线x=0对称,可得在区间(-2,-1)和(1,2)内取值的概率P1,P2相等.
3.参数μ,σ对正态曲线形状的影响
(1)在参数σ取固定值时,正态曲线的位置由μ确定,且随着μ的变化而沿 x轴 平移.
(2)当μ取定值时,因为正态曲线的峰值 与σ成反比,而且对任意的σ>0,正态曲线与x轴之间的区域的面积总为1.因此,当σ较小时,峰值高,正态曲线“ 瘦高 ”,表示随机变量X的分布比较 集中 ;当σ较大时,峰值低,正态曲线“ 矮胖 ”,表示随机变量X的分布比较 分散 .
(3)参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的离散程度.
若X~N(μ,σ2),则E(X)= μ ,D(X)= σ2 .
4.3σ原则
(1)假设X~N(μ,σ2),可以证明:对给定的k∈N*,P(μ-kσ≤X ≤μ+kσ)是一个只与k有关的定值.特别地,
P(μ-σ≤X≤μ+σ)≈ 0.682 7 ,
P(μ-2σ≤X≤μ+2σ)≈ 0.954 5 ,
P(μ-3σ≤X≤μ+3σ)≈ 0.997 3 .
(2)在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]中的值,这在统计学中称为3σ原则.
课堂·重难突破
一 正态曲线及其性质
典例剖析
1.一个正态曲线的图象如图所示,则服从该正态分布的随机变量的均值μ= ,方差σ2= .
答案:20 2
规律总结 利用正态曲线的性质求参数μ,σ
(1)正态曲线是单峰的,它关于直线x=μ对称,由此性质结合图象求μ.
学以致用
1.某市某次高三教学质量检测中,甲、乙、丙三科考试成绩的正态密度曲线如图所示(由于人数众多,成绩服从正态分布),则下列说法正确的是( )
A.甲科总体的标准差最小
B.丙科总体的平均数最小
C.乙科总体的标准差及平均数都居中
D.甲、乙、丙的总体的平均数不相同
答案:A
解析:由题中图象可知三科总体的平均数(均值)相等,由正态曲线的性质,可知当μ取定值,σ较大时,峰值低,正态曲线“矮胖”;σ较小时,峰值高,正态曲线“瘦高”,故三科总体的标准差从小到大依次为甲、乙、丙.故选A.
二 利用正态分布的性质求概率
典例剖析
2.设X~N(1,22),试求:
(1)P(-1≤X≤3);
(2)P(3≤X≤5);
(3)P(X>5);
解:因为X~N(1,22),所以μ=1,σ=2.
(1)P(-1≤X≤3)=P(1-2≤X≤1+2)=P(μ-σ≤X≤μ+σ)≈0.682 7.
(2)因为P(3≤X≤5)=P(-3≤X≤-1),
规律总结 正态变量在某个区间内取值概率的求解策略
(1)充分利用正态曲线的对称性和正态曲线与x轴之间的区域的面积为1.
(2)熟记P(μ-σ≤X≤μ+σ),P(μ-2σ≤X≤μ+2σ),P(μ-3σ≤X≤ μ+3σ)的值.
(3)注意概率值的求解转化:
①P(X<a)=1-P(X≥a);
②P(X≤μ-a)=P(X≥μ+a);
学以致用
2.已知随机变量X服从正态分布N(2,σ2),且P(X<4)=0.8,则P(0<X<2)等于( )
A.0.6 B.0.4 C.0.3 D.0.2
答案:C
解析:∵随机变量X服从正态分布N(2,σ2),
∴μ=2,对称轴为直线x=2.
∵P(X<4)=0.8,∴P(X≥4)=P(X≤0)=0.2,
∴P(0<X<4)=0.6,∴P(0<X<2)=0.3.故选C.
三 正态分布的实际应用
典例剖析
3.在某次数学考试中,考生的成绩X服从一个正态分布,即X~N(90,100).
(1)试求考试成绩X位于区间[70,110]内的概率是多少?
(2)若这次考试共有2 000名考生,试估计考试成绩落在区间[80,100]内的考生大约有多少人?
解:因为X~N(90,100),所以μ=90,σ=10.
(1)由μ=90,σ=10,得μ-2σ=90-2×10=70,μ+2σ=90+2×10=110.
由于正态变量在区间[μ-2σ,μ+2σ]内取值的概率约是0.954 5,故考试成绩X落在区间[70,110]内的概率约是0.954 5.
(2)由μ=90,σ=10,得μ-σ=80,μ+σ=100.
由于正态变量在区间[μ-σ,μ+σ]内取值的概率约是0.682 7,故考试成绩X落在区间[80,100]内的概率约是0.682 7.
这次考试共有2 000名考生参加,则考试成绩落在区间[80,100]内的考生大约有2 000×0.682 7≈1 365(人).
规律总结 利用3σ原则求某区间内取值概率的基本方法
(1)根据题目给出的条件确定μ与σ的值;
(2)将待求问题向[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]这三个区间转化;
(3)利用上述区间求出相应的概率.
学以致用
3.有一种精密零件,其尺寸X(单位:mm)服从正态分布N(20,4).若这批零件共有5 000个,试求:
(1)这批零件中尺寸在18~22 mm间的零件所占的百分比;
(2)试估计尺寸在24~26 mm间的零件大约有多少个?
解:(1)∵X~N(20,4),∴μ=20,σ=2,∴μ-σ=18,μ+σ=22,
于是尺寸在18~22 mm间的零件所占的百分比大约是68.27%.
(2)∵μ-3σ=14,μ+3σ=26,μ-2σ=16,μ+2σ=24,
∴尺寸在24~26 mm间的零件所占的百分比大约是
因此尺寸在24~26 mm间的零件大约有
5 000×2.14%=107(个).
随堂训练
1.若某校高一年级1 000名学生的某次考试成绩X服从正态分布N(90,152),则此次考试成绩在区间[60,120]上的学生大约有
( )
A.997人 B.972人
C.955人 D.683人
答案:C
解析:依题意可知μ=90,σ=15,
故P(60≤X≤120)=P(90-2×15≤X≤90+2×15)≈0.954 5,
1 000×0.954 5≈955,故大约有学生955人.
2.设离散型随机变量X~N(0,1),则P(X≤0)= .
则P(3≤X≤7)= .
答案:0.682 7
解析:由题意可知X~N(5,4),且μ=5,σ=2,
故P(3≤X≤7)=P(μ-σ≤X≤μ+σ)≈0.682 7.
4.全民健身倡导全民做到每天参加一次以上的体育健身活动,旨在全面提高国民体质和健康水平.某市的体育部门对某小区的4 000人进行了“运动参与度”统计评分,得到的频率分布直方图如图所示.
(1)求这4 000人的“运动参与度”的平均得分 (同一组数据用该组区间的中点值作代表);
(2)由频率分布直方图可认为这4 000人的“运动参与度”的得分Z服从正态分布N(μ,σ2),其中μ,σ2分别取平均得分 和方差s2,那么这4 000人中“运动参与度”得分超过84.81分的人数估计有多少人?
(3)现在用这4 000人得分的情况来估计全市所有人的得分情况,从全市随机抽取4人,记“运动参与度”的得分不超过84.81分的人数为X,求P(X≤3).
②Z~N(μ,σ2),P(μ-σ≤Z≤μ+σ)≈0.682 7,
P(μ-2σ≤Z≤μ+2σ)≈0.954 5;
③0.841 354≈0.501.
解:(1)由题意知
中点值 45 55 65 75 85 95
频率 0.1 0.15 0.2 0.3 0.15 0.1
则 =45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1
=70.5.
因此这4 000人“运动参与度”的平均得分 为70.5分.
因此,这4 000人中“运动参与度”得分超过84.81分的估计有0.158 65×4 000=634.6≈635(人).
(3)全市所有人的“运动参与度”得分不超过84.81分的概率为1-0.158 65=0.841 35.由题意知,X~B(4,0.841 35),
$