内容正文:
第四章 概率与统计
4.2.5 正态分布
人教B版 数学 选择性必修第二册
课程标准 1.通过实例,认识正态曲线的特点及曲线所表示的意义.理解3σ原则,会求随机变量在特殊区间内的概率.
2.通过本节的学习,体会函数思想、数形结合思想在实际中的运用.
基础落实·必备知识全过关
知识点一 正态曲线
1.定义
一般地,函数 对应的图象称为正态曲线(也因形状而被称“钟形曲线”,φ(x)也常常记为φμ,σ(x)).其中μ= ,即X的均值;
σ= ,即X的标准差.
E(X)
2.正态曲线的性质
(1)正态曲线关于 对称(即μ决定正态曲线对称轴的位置),具有中间高、两边低的特点;
(2)正态曲线与x轴所围成的图形面积为 ;
(3)σ决定正态曲线的“胖瘦”:σ越大,说明标准差越大,数据的集中程度越 ,所以曲线越“胖”;σ越小,说明标准差越小,数据的集中程度越 ,所以曲线越“瘦”.
x=μ
1
弱
强
名师点睛
1.正态曲线位于x轴上方,与x轴不相交.
2.曲线在x=μ时处于最高点,并由此处向左右两边延伸时,曲线逐渐降低,其图象“中间高,两边低”.
3.当σ一定时,曲线随着μ的变化而沿x轴平移.
4.正态曲线完全由变量μ和σ确定,参数μ是反映随机变量的平均水平的特征数,所以用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
过关自诊
1.关于正态曲线特点的描述:
①曲线关于直线x=μ对称,这条曲线在x轴上方;
②曲线关于直线x=σ对称,这条曲线只有当x∈(-3σ,3σ)时才在x轴上方;
③曲线关于y轴对称,曲线对应的函数是一个偶函数;
④曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低;
⑤曲线的对称轴由μ确定,曲线的形状由σ确定;
⑥σ越大,曲线越“胖”,σ越小,曲线越“瘦”.
说法正确的是( )
A.①④⑤⑥ B.②④⑤ C.③④⑤⑥ D.①⑤⑥
A
解析 参照正态曲线的性质,正态曲线位于x轴上方,只有当μ=0时,正态曲线才关于y轴对称,因此A选项正确.
2.[北师大版教材习题改编]若随机变量ξ~N(μ,σ2),其概率密度函数为
(x∈R),则σ的值为( )
A.1 B.2
C.4 D.8
B
知识点二 正态分布
1.正态分布
一般地,如果随机变量X落在区间[a,b]内的概率,总是等于φμ,σ(x)对应的正态曲线与x轴在区间[a,b]内围成的 ,则称X服从参数为μ与σ的正态分布,记作X~ .
此时φμ,σ(x)称为X的概率密度函数,此时μ是X的 ,σ是X的 ,σ2是X的 .
面积
N(μ,σ2)
均值
标准差
方差
2.随机变量X在三个特殊区间内取值的概率及3σ原则
(1)在三个特殊区间内取值的概率
若X~N(μ,σ2),则
①P(|X-μ|≤σ)= ≈ ,
②P(|X-μ|≤2σ)= ≈ ,
③P(|X-μ|≤3σ)= ≈ .
P(μ-σ≤X≤μ+σ)
68.3%
P(μ-2σ≤X≤μ+2σ)
95.4%
P(μ-3σ≤X≤μ+3σ)
99.7%
(2)3σ原则
由于随机变量X在(-∞,+∞)内取值的概率为1,又由P(μ-3σ≤X≤μ+3σ)≈99.7%知,X约有99.7%的可能会落在距均值3个标准差的范围之内,也就是说只有约0.3%的可能会落入这一范围之外(这样的事件可看成小概率事件),这一结论通常称为正态分布的“3σ原则”.
通常认为这种情况几乎不可能发生
名师点睛
X几乎都取值于区间[μ-3σ,μ+3σ]之内,而在此区间以外取值的概率是极小的,通常认为这种情况在一次试验中几乎不可能发生.这是统计中常用的检验的基本思想.
3.标准正态分布
μ=0且σ=1的正态分布称为标准正态分布,记作X~ .
过关自诊
1.如果随机变量X~N(4,1),则P(X<2)等于( )
A.0.21 B.0.023 C.0.045 D.0.021
N(0,1)
B
2.已知随机变量X服从正态分布,且X落在区间(0.2,+∞)内的概率为0.5,那么相应的正态曲线f(x)在x= 时达到最高点.
3.[人教A版教材习题改编]设随机变量X~N(0,1),则X的概率密度函数为
,P(|X|≤1)= ,P(X≤1)= ,P(X>1)= .
(精确到0.001)
0.2
解析 由正态曲线关于直线x=μ对称,且在x=μ处达到峰值和其落在区间(μ,+∞)内的概率为0.5,得μ=0.2.
0.683
0.841
0.159
重难探究·能力素养全提升
探究点一 正态曲线及其性质
【例1】 某次我市高三教学质量检测中,甲、乙、丙三科考试成绩近似服从正态分布,则由如图所示曲线可得下列说法中正确的一项是( )
A.甲科总体的标准差最小
B.丙科总体的平均数最小
C.乙科总体的标准差及平均数都居中
D.甲、乙、丙的总体的平均数不相同
A
解析 由题中图象可知三科总体的平均数(均值)相等,由正态曲线的性质,可知σ越大,正态曲线越“胖”;σ越小,正态曲线越“瘦”.
故三科总体的标准差从小到大依次为甲、乙、丙.故选A.
规律方法 利用正态曲线的性质求参数μ,σ
(1)正态曲线是单峰的,它关于直线x=μ对称,由此性质结合图象求μ.
(2)正态曲线在x=μ处达到峰值 ,由此性质结合图象可求σ.
(3)由曲线的“胖瘦”区分σ的大小.
变式训练1(多选题)甲、乙两类水果的质量(单位:kg)分别服从正态分布 ,其密度函数图象如图所示,则下列说法正确的是( )
A.甲类水果的平均质量μ1=0.4 kg
B.甲类水果的质量比乙类水果的质量更集中于平均值左右
C.甲类水果的平均质量比乙类水果的平均质量小
D.乙类水果的质量服从正态分布的参数σ2=1.99
ABC
解析 由图象可知,甲类水果的平均质量μ1=0.4 kg,乙类水果的平均质量μ2=0.8 kg,故A,C正确;甲图象比乙图象更高瘦,所以甲类水果的质量比乙类水果的质量更集中于平均值左右,故B正确;乙类水果的质量服从的正态分布的最大值为1.99,即 =1.99,σ2≠1.99,故D错误.故选ABC.
探究点二 正态分布下的概率计算
【例2】 (1)已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)=( )
A.0.6 B.0.4
C.0.3 D.0.2
C
解析 ∵随机变量ξ服从正态分布N(2,σ2),∴μ=2,其图象的对称轴是直线x=2.∵P(ξ<4)=0.8,∴P(ξ≥4)=P(ξ≤0)=0.2,∴P(0<ξ<4)=0.6,∴P(0<ξ<2)=0.3.故选C.
(2)[人教A版教材习题改编]某市高二年级男生的身高X(单位:cm)近似服从正态分布N(170,52),随机选择一名本市高二年级的男生,求下列事件的概率:
①165≤X≤175;
②X<165;
③X>175.
解 ∵X~N(170,52),∴μ=170,σ=5.
∴①P(165≤X≤175)=P(μ-σ≤X≤μ+σ)≈0.683.
②P(X<165)= [1-P(165≤X≤175)]≈ ×(1-0.683)=0.158 5.
③P(X>175)=P(X<165)=0.158 5.
规律方法 服从正态分布的随机变量在某个区间内取值概率的求解策略
(1)充分利用正态曲线的对称性和正态曲线与x轴所围成的图形面积为1.
(2)注意概率值的求解转化:
①P(X<a)=1-P(X≥a);
②P(X≤μ-a)=P(X≥μ+a);
③若b<μ,则P(X<b)=
(3)熟记P(μ-σ≤X≤μ+σ),P(μ-2σ≤X≤μ+2σ),P(μ-3σ≤X≤μ+3σ)对应的值.
变式训练2(1)如果随机变量ξ~N(0,1),且P(ξ>1)=0.3,则P(0≤ξ≤1)等于( )
A.0.4 B.0.2
C.0.3 D.0.5
B
解析 (1)由题意,随机变量ξ~N(0,1),P(ξ>1)=0.3,则P(ξ<-1)=0.3,所以,P(0≤ξ≤1)= P(-1≤ξ≤1)= (1-0.3-0.3)=0.2.故选B.
(2)某物理量的测量结果服从正态分布N(10,σ2),下列结论中不正确的是
( )
A.σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大
B.该物理量在一次测量中大于10的概率为0.5
C.该物理量在一次测量中小于9.99与大于10.01的概率相等
D.该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等
D
解析 对于A,σ2为数据的方差,所以σ越小,数据在μ=10附近越集中,所以测量结果落在(9.9,10.1)内的概率越大,故A正确;对于B,由正态曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;对于C,由正态曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C正确;对于D,因为该物理量一次测量结果落在(9.9,10.0)的概率与落在(10.2,10.3)的概率不同,所以一次测量结果落在(9.9,10.2)的概率与落在(10,10.3)的概率不同,故D错误.故选D.
探究点三 正态分布的实际应用
【例3】 (1)[北师大版教材习题]一批电阻的阻值X(单位:Ω)服从正态分布N(1 000,52),现从甲、乙两箱成品中各随机抽取一只电阻,测得阻值分别为1 011 Ω和982 Ω,可以认为 .(填写所有正确结论的序号)
①甲、乙两箱电阻均可出厂;
②甲、乙两箱电阻均不可出厂;
③甲箱电阻可出厂,乙箱电阻不可出厂;
④甲箱电阻不可出厂,乙箱电阻可出厂.
③
解析 因为X~N(1 000,52),所以μ=1 000,σ=5.所以μ-3σ=1 000-3×5=985, μ+3σ=1 000+3×5=1 015.因为1 011∈[985,1 015],982∉[985,1 015],所以甲箱电阻可出厂,乙箱电阻不可出厂.
(2)设在一次数学考试中,某班学生的分数X~N(110,202),且知试卷满分150分,这个班共54名学生,求这个班在这次数学考试中及格(即90分及90分以上)的人数和130分以上的人数.
解 由题得μ=110,σ=20,P(X≥90)=P(X-110≥-20)=P(X-μ≥-σ),
∵P(X-μ<-σ)+P(-σ≤X-μ≤σ)+P(X-μ>σ)≈2P(X-μ<-σ)+0.683=1,
∴P(X-μ<-σ)=0.158 5.
∴P(X≥90)=1-P(X-μ<-σ)=1-0.158 5=0.841 5.
∴54×0.841 5≈45(人),即及格人数约为45人.
∵P(X>130)=P(X-110>20)=P(X-μ>σ),
∴P(X-μ<-σ)+P(-σ≤X-μ≤σ)+P(X-μ>σ)≈0.683+2P(X-μ>σ)=1,
∴P(X-μ>σ)=0.158 5,即P(X>130)=0.158 5.
∴54×0.158 5≈9,即130分以上的人数约为9.
变式探究 如果例3(2)中把条件“这个班共54名学生”换成“现已知该班同学中不及格的有9人”,求相应结论.
解 ∵X~N(110,202),
∴μ=110,σ=20,
∴P(110-20≤X≤110+20)≈0.683,
∴X<90的概率约为 ×(1-0.683)=0.158 5.
设该班学生共有x人,则0.158 5x=9,
解得x≈57.
∴P(X≥90)=1-0.158 5=0.841 5,
∴这个班在这次数学考试中及格的人数为0.841 5×57≈48(人),
又P(X<90)=P(X>130),
∴130分以上的人数约为9.
规律方法 1.利用转化的思想方法,把普通的区间转化为3σ区间,由特殊区间的概率值求出.
2.解答正态分布的实际应用题,其关键是如何转化,同时应熟练掌握随机变量在[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]三个区间内的概率值.在此过程中用到归纳思想和数形结合思想.
3.利用“3σ原则”可进行合理性分析.
变式训练3[人教A版教材例题改编]小明上学有时坐公交车,有时骑自行车.他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布.如果某天有38 min可用,小明应选择哪种交通工具?如果某天只有34 min可用,又应该选择哪种交通工具?请说明理由.
解 对于随机变量X,样本的均值为30,样本的标准差为6;对于随机变量Y,样本的均值为34,样本的标准差为2.用样本的均值估计参数μ,用样本的标准差估计参数σ,可以得到X~N(30,62),Y~N(34,22).
应选择在给定时间内不迟到的概率大的交通工具.P(X≤38)<P(Y≤38),P(X≤34)>P(Y≤34).
所以,如果有38 min可用,那么骑自行车不迟到的概率大,应选择骑自行车;
如果只有34 min可用,那么坐公交车不迟到的概率大,应选择坐公交车.
成果验收·课堂达标检测
1
2
3
4
5
6
7
8
9
10
A 级 必备知识基础练
1.[探究点二]已知随机变量X服从正态分布N(1,4),P(X>2)=0.3, P(X<0)=( )
A.0.2 B.0.3 C.0.7 D.0.8
11
B
解析 ∵X~N(1,4),∴P(X<0)=P(X>2)=0.3.故选B.
1
2
3
4
5
6
7
8
9
10
2.[探究点二·2023陕西渭南高二期末]已知随机变量ξ服从正态分布N(3,σ2),若P(ξ<4)=0.78,则P(2<ξ<3)=( )
A.0.2 B.0.24 C.0.28 D.0.32
11
C
解析 由随机变量ξ服从正态分布N(3,σ2),可知正态曲线关于直线x=3对称.由P(ξ<4)=0.78,可得P(ξ≥4)=P(ξ≤2)=1-0.78=0.22.则P(2<ξ<4)=1-2×0.22= 0.56,故P(2<ξ<3)= P(2<ξ<4)= ×0.56=0.28.故选C.
1
2
3
4
5
6
7
8
9
10
3.[探究点三·2023山西太原五中高三期末]某中学高三(1)班有50名学生,在一次高三模拟考试中,经统计得:数学成绩X~N(110,100),则估计该班数学得分大于120分的学生人数为( )(参考数据:已知X~N(μ,σ2)时,有P(|X-μ|≤σ) ≈0.683,P(|X-μ|≤2σ)≈0.954)
A.16 B.10 C.8 D.2
11
C
解析 因为数学成绩X~N(110,100),所以μ=110,σ=10.因此由P(|X-110|≤10) ≈0.683⇒P(100≤X≤120)≈0.683⇒P(110≤X≤120)≈ ×0.683=0.341 5,所以有P(X>120)= -P(110≤X≤120)= -0.341 5=0.158 5,估计该班数学得分大于120分的学生人数为0.158 5×50≈8.故选C.
1
2
3
4
5
6
7
8
9
10
4.[探究点三·2023黑龙江哈尔滨高二期末]首届国家最高科学技术奖得主,杂交水稻之父袁隆平院士为全世界粮食问题和农业科学发展贡献了中国力量,某杂交水稻种植研究所调查某地水稻的株高时,发现株高X(单位:cm)服从正态分布N(100,102),若测量10 000株水稻,求株高在[80,90]的水稻数量. (附X~N(μ,σ2),P(μ-σ≤X≤μ+σ)≈0.683,P(μ-2σ≤X≤μ+2σ)≈0.954)
11
解 由X~N(100,102)知,μ=100,σ=10,所以P(80≤X≤90)=P(μ-2σ≤X≤μ-σ)
≈ (0.954-0.683)=0.135 5.
所以若测量10 000株水稻,株高在[80,90]的约有1 355株.
1
2
3
4
5
6
7
8
9
10
B 级 关键能力提升练
5.已知X~N(4,σ2),且P(X≤2)=0.3,则P(X<6)=( )
A.0.3 B.0.4 C.0.85 D.0.7
11
D
解析 因为X~N(4,σ2),正态曲线的对称轴为直线x=4,因为P(X≤2)=0.3,所以P(X≥6)=P(X≤2)=0.3,所以P(X<6)=1-P(X≥6)=1-0.3=0.7.故选D.
1
2
3
4
5
6
7
8
9
10
6.(多选题)“世界杂交水稻之父”袁隆平发明了“三系法”籼型杂交水稻,成功研究出“两系法”杂交水稻,创建了超级杂交稻技术体系.某水稻种植研究所调查某地杂交水稻的株高,得出株高X(单位:cm)服从正态分布,其概率密度
函数 ,x∈(-∞,+∞),则( )
A.该地杂交水稻的平均株高为100 cm
B.该地杂交水稻株高的方差为10
C.该地杂交水稻株高在120 cm以上的数量和株高在80 cm以下的数量一样多
D.随机测量该地的一株杂交水稻,其株高在(80,90)和在(100,110)的概率一样大
11
AC
解析 因为 ,所以μ=100,σ=10,即均值为100,标准差为10,方差为100,故A正确,B错误;根据正态曲线的特征可知函数φ(x)图象关于直线x=100对称,所以该地杂交水稻株高在120 cm以上的数量和株高在80 cm以下的数量一样多,故C正确;随机测量该地的一株杂交水稻,其株高在(80,90)和在(110,120)的概率一样大,故D错误.故选AC.
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
7.(多选题)4月23日为世界读书日,已知某高校学生每周阅读时间X服从正态分布X~N(9,4),则( )
A.该校学生每周平均阅读时间为9小时
B.该校学生每周阅读时间的标准差为4
C.该校学生每周阅读时间少于3小时的人数约占0.3%
D.若该校有10 000名学生,则每周阅读时间在3~5小时的人数约为215
(附:X~N(μ,σ2),P(μ-σ≤X≤μ+σ)≈0.683,P(μ-2σ≤X≤μ+2σ)≈0.954,
P(μ-3σ≤X≤μ+3σ)≈0.997)
11
AD
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
8.[2023黑龙江肇东高二期末]已知随机变量ξ服从正态分布N(3,σ2),
且 ,则P(3<ξ<5)= .
11
0.4
1
2
3
4
5
6
7
8
9
10
9.研究某市某种作物,其单株生长果实个数ξ服从正态分布N(90,σ2),且P(ξ<70)=0.1,从中随机抽取10株,果实个数在[90,110]的株数记作随机变量X,假设X服从二项分布,则X的方差为 .
11
2.4
解析 因为ξ~N(90,σ2),所以P(90≤ξ≤110)= -P(ξ>110),而P(ξ>110)=P(ξ<70)=0.1.
所以P(90≤ξ≤110)=0.4,
而X~B(10,0.4),
所以D(X)=10×0.4×0.6=2.4.
1
2
3
4
5
6
7
8
9
10
C 级 学科素养创新练
10.为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中尺寸在[μ-3σ,μ+3σ]之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在[μ-3σ,μ+3σ]之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,试用所学知识说明上述监控生产过程方法的合理性.
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ≤Z≤μ+3σ)≈0.997, 0.99716≈0.953 1.
11
1
2
3
4
5
6
7
8
9
10
11
解 (1)由题可知零件尺寸落在[μ-3σ,μ+3σ]之内的概率约为0.997,则落在
[μ-3σ,μ+3σ]之外的概率为1-0.997=0.003,因为
P(X=0)= ×(1-0.997)0×0.99716 ≈0.953 1,
所以P(X≥1)=1-P(X=0)=0.046 9,
又因为X~B(16,0.003),所以E(X)=16×0.003=0.048.
(2)如果生产状态正常,一个零件尺寸落在[μ-3σ,μ+3σ]之外的概率只有0.003,一天内抽取的16个零件中,出现尺寸在[μ-3σ,μ+3σ]之外的零件的概率只有0.046 9,发生的概率很小.
因此一旦发生这种状况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
1
2
3
4
5
6
7
8
9
10
11
11.某高校为了解全校学生的阅读情况,随机调查了200名学生每周阅读时间x(单位:小时)并绘制如图所示的频率分布直方图.
(1)求这200名学生每周阅读时间的样本平均数 和样本方差s2(同一组中的数据用该组区间的中间值代表);
1
2
3
4
5
6
7
8
9
10
11
(2)由直方图可以认为,目前该校学生每周的阅读时间X服从正态分布N(μ,σ2),其中μ近似为样本平均数 ,σ2近似为样本方差s2.
①一般正态分布的概率都可以转化为标准正态分布的概率进行计算:若X~N(μ,σ2),令Y= ,则Y~N(0,1),且P(X≤a)=P(Y≤ ).利用直方图得到的正态分布,求P(X≤10);
②从该高校的学生中随机抽取20名,记Z表示这20名学生中每周阅读时间超过10小时的人数,求P(Z≥2)(结果精确到0.000 1)以及Z的数学期望.
参考数据: ,0.773 419≈0.007 6.若Y~N(0,1),则P(Y≤0.75)=0.773 4.
1
2
3
4
5
6
7
8
9
10
11
解
(1) =6×0.03+7×0.1+8×0.2+9×0.35+10×0.19+11×0.09+12×0.04=9,
s2=(6-9)2×0.03+(7-9)2×0.1+(8-9)2×0.2+(9-9)2×0.35+(10-9)2×0.19+ (11-9)2 ×0.09+(12-9)2×0.04=1.78.
②由①知P(X>10)=1-P(X≤10)=0.226 6,
可得Z~B(20,0.226 6),P(Z≥2)=1-P(Z=0)-P(Z=1)=1-0.773 420- ×0.226 6×0.773 419≈1-(0.773 4+20×0.226 6)×0.007 6≈0.959 7.
∴E(Z)=20×0.226 6=4.532.
φ(x)=
φ(x)=
解析 P(X<2)=[1-P(2≤X≤6)]=[1-P(4-2≤X≤4+2)]≈×(1-0.954)=0.023.
故选B.
φ(x)=
N(μ1,),N(μ2,)
.
φ(x)=
φ(x)=
解析 因为μ=9,σ=2,所以均值是9,标准差为2,A正确,B不正确;因为P(7≤X≤11)≈0.683,P(5≤X≤13)≈0.954,P(3≤X≤15)≈0.997,结合正态曲线的对称性可得,该校学生每周阅读时间少于3小时的人数约占=0.15%,C不正确;每周阅读时间在3~5小时的人数占≈0.021 5,0.021 5×10 000=215,所以D正确.故选AD.
解析 因为ξ~N(3,σ2),所以该正态曲线关于直线x=3对称,则P(ξ<1)=1-P(ξ<5),又,得P(ξ<1)=0.1,P(ξ<5)=0.9,所以P(3<ξ<5)=[P(ξ<5)-P(ξ<1)]=0.4.
(2)①由(1)知μ=9,σ2=1.78,∴X~N(9,1.78),σ=.
∴P(X≤10)=P(Y≤)=P(Y≤0.75)=0.773 4.
$$