内容正文:
7.5 正态分布
课标要求
学法指导
1.通过误差模型,了解服从正态分布的随机变量.
2.通过具体实例,借助频率直方图的几何直观,了解正态分布的特征.
3.了解正态分布的均值、方差及其含义.
1.通过图象了解正态曲线的特征,并结合概率与面积的关系来求服从正态分布的随机变量的概率.
2.结合服从正态分布的随机变量的概率密度曲线,记住随机变量在区间[μ-σ,μ+σ], [μ-2σ,μ+2σ]和[μ-3σ,μ+3σ]上取值的概率.
3.通过了解正态分布的特征,能够利用正态曲线分析实际问题,发展数学抽象、数学建模和数据分析的核心素养.
,)
问题导入
如图是一块高尔顿板示意图.在一块木板上钉着若干排相互平行但相互错开的圆柱形小木块,小木块之间留有适当的空隙作为通道,前面挡有一块玻璃.让一个小球从高尔顿板上方的通道口落下,小球在下落的过程中与层层小木块碰撞,最后掉入高尔顿板下方的某一球槽内.
问题1:小球落在各小槽内的机会相同吗?
提示 不相同.
问题2:落在哪几个小槽内的小球多?
提示 落在中间几个小槽内的小球多.
微梳理
要点一 正态曲线
1.刻画随机误差分布的解析式为f(x)=·e-,x∈R,其中μ∈R,σ>0为参数.称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线.
2.特点
(1)曲线是单峰的,它关于直线x=μ对称;
(2)曲线在x=μ处达到峰值;
(3)当|x|无限增大时,曲线无限接近x轴.
要点二 正态分布
1.定义:若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ,σ2).当μ=0,σ=1时,称随机变量X服从标准正态分布.
2.期望与方差:若X~N(μ,σ2),则E(X)=μ,D(X)=σ2.在实际问题中,参数μ,σ可以分别用样本均值和样本标准差来估计.
3.正态变量在三个特殊区间内取值的概率
(1)P(μ-σ≤X≤μ+σ)≈0.682 7;
(2)P(μ-2σ≤X≤μ+2σ)≈0.954 5;
(3)P(μ-3σ≤X≤μ+3σ)≈0.997 3.
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]中的值,这在统计学中称为3σ原则.
思考:μ,σ取值不同对正态曲线有何影响?
提示 若参数σ取固定值,则正态曲线的位置由μ确定,且随着μ的变化而沿x轴平移;若μ取固定值,则对任意的σ>0,曲线与x轴围成的面积总为1,因此当σ较小时,峰值高,曲线“瘦高”,表示随机变量X的分布比较集中,当σ较大时,峰值低,曲线“矮胖”,表示随机变量X的分布比较分散.
判断正误,正确的画“√”,错误的画“×”.
(1)正态曲线是一条钟形曲线.( )
(2)正态曲线在x轴的上方,并且关于直线x=σ对称.( )
(3)正态曲线的对称轴的位置由μ确定,曲线形状由σ确定.( )
解析 (1)正确.由正态密度曲线的形状可知该说法正确.
(2)错误.正态曲线关于直线x=μ对称.
(3)正确.根据正态分布的概念和曲线可知该说法正确.
答案 (1)√ (2)× (3)√
,)
探究一 正态曲线及其特点
【例题1】 (1)(多选)某次我市高三教学质量检测中,甲、乙、丙三科考试成绩的直方图如图所示(由于人数众多,成绩分布的直方图可视为正态分布),则由图中的曲线可得下列说法中正确的是( )
A.甲科总体的标准差最小
B.丙科总体的平均数最小
C.乙科总体的标准差及平均数都居中
D.甲、乙、丙的总体的平均数相同
(2)如图所示是一个正态曲线,试根据该图象写出其正态分布的概率密度函数的解析式,求出总体随机变量的期望和方差.
解析 (1)由题中图象可知三科总体的平均数(均值)相等,由正态密度曲线的性质,可知σ越大,正态曲线越扁平;σ越小,正态曲线越尖陡,故三科总体的标准差从小到大依次为甲、乙、丙.故选AD项.
答案 AD
(2)从给出的正态曲线可知,该正态曲线关于直线x=20对称,最大值是,所以μ=20.由=,解得σ=.于是概率密度函数的解析式是f(x)=e-,x∈(-∞,+∞).总体随机变量的期望是μ=20,方差是σ2=()2=2.
规律总结
利用正态曲线的特点求参数μ,σ
(1)正态曲线是单峰的,它关于直线x=μ对称,由此性质结合图象可求μ.
(2)正态曲线在x=μ处达到峰值,由此性质结合图象可求σ.
[注意] 参数μ是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
【变式1】 (1)函数f(x)=e-(其中μ<0)的图象可能为( )
(2)设两个正态分布N(μ1,σ)(σ1>0)和N(μ2,σ)(σ2>0)的密度函数图象如图所示,则有( )
A.μ1<μ2,σ1<σ2 B.μ1<μ2,σ1>σ2
C.μ1>μ2,σ1<σ2 D.μ1>μ2,σ1>σ2
解析 (1)函数f(x)图象的对称轴为直线x=μ,因为μ<0,所以排除B,D项;正态曲线位于x轴上方,因此排除C项.故选A项.
(2)μ反映的是正态分布的平均水平,x=μ是正态密度曲线的对称轴,由图可知μ1<μ2;σ反映正态分布的离散程度,σ越大,越分散,曲线越“矮胖”,σ越小,越集中,曲线越“瘦高”,由图可知σ1<σ2.故选A项.
答案 (1)A (2)A
探究二 正态分布的概率计算
【例题2】 (1)(2022·新课标Ⅱ)已知随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,则P(X>2.5)=______.
(2)若随机变量ξ服从正态分布N(0,1),且P(ξ≤-1.96)=0.025,则P(|ξ|<1.96)=______.
解析 (1)由X~N(2,σ2)可知,其正态曲线如图所示,对称轴为直线x=2,则P(X>2.5)=P(X>2)-P(2<X≤2.5)=0.5-0.36=0.14.
(2)由题意得,P(ξ<1.96)=1-P(ξ≥1.96)=1-P(ξ≤-1.96),所以P(|ξ|<1.96)=P(-1.96<ξ<1.96)=P(ξ<1.96)-P(ξ≤-1.96)=1-2P(ξ≤-1.96)=1-2×0.025=0.95.
答案 (1)0.14 (2)0.95
规律总结
求正态分布下随机变量取值的概率的方法
求正态分布下随机变量取值的概率的基本方法是利用正态曲线的对称性,把待求概率的区间转化为与已知概率的区间有关的式子.
一般地,若X~N(μ,σ2),则有:
(1)P(X>μ)=P(X<μ)=;
(2)P(X>a)=1-P(X≤a);
(3)P(X<μ-a)=P(X>μ+a);
(4)P(a<X<b)=P(X<b)-P(X≤a).
而当条件中无已知概率时,则要利用随机变量X在三个特殊区间[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]上取值的概率进行计算.
【变式2】 (1)已知随机变量X~N(1,σ2),若P(0<X<3)=0.5,P(0<X<1)=0.2,则P(X<3)=( )
A.0.4 B.0.6
C.0.7 D.0.8
(2)设随机变量X服从正态分布N(4,σ2),若P(X>m)=0.3,则P(X≥8-m)=( )
A.0.2 B.0.3
C.0.7 D.与σ的值有关
解析 (1)由题意可得P(1<X<3)=0.5-0.2=0.3.因为随机变量X~N(1,σ2),所以P(X<3)=0.3+0.5=0.8.故选D项.
(2)因为随机变量X服从正态分布N(4,σ2),所以正态曲线的对称轴是直线x=4.由正态曲线的对称性得,P(X<8-m)=P(X>m)=0.3,故P(X≥8-m)=1-0.3=0.7.故选C项.
答案 (1)D (2)C
探究三 正态分布的实际应用
【例题3】 (多选)(2024·新课标Ⅰ)为了解推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值=2.1,样本方差s2=0.01,已知该种植区以往的亩收入X服从正态分布N(1.8,0.12),假设推动出口后的亩收入Y服从正态分布N(,s2),则( )
(若随机变量Z服从正态分布N(u,σ2),P(Z<u+σ)≈0.841 3)
A.P(X>2)>0.2 B.P(X>2)<0.5
C.P(Y>2)>0.5 D.P(Y>2)<0.8
答案 BC
解析 依题可知,=2.1,s2=0.01,所以Y~N(2.1,0.01),故P(Y>2)=P(Y>2.1-0.1)=P(Y<2.1+0.1)≈0.841 3>0.5,C项正确,D项错误;因为X~N(1.8,0.01),所以P(X>2)=P(X>1.8+2×0.1),因为P(X<1.8+0.1)≈0.841 3,所以P(X>1.8+0.1)≈1-0.841 3=0.158 7<0.2,而P(X>2)=P(X>1.8+2×0.1)<P(X>1.8+0.1)<0.2,B项正确,A项错误.故选BC项.
规律总结
利用正态分布估算区间上的个体数的方法
利用正态分布N(μ,σ2)的随机变量X在三个特殊区间上取值的概率可以解决一些实际问题,如估算总体在某一范围内的个体数或质量控制等.其具体方法为:先确定随机变量在某一范围内取值的概率,再乘样本容量即可.
【变式3】 某市高三学生有30 000名,在一次调研测试中,数学成绩X服从正态分布N(100,σ2),已知P(80≤X<100)=0.45,若按分层随机抽样的方式抽取200份试卷进行成绩分析,则应从120分以上的试卷中抽取( )
A.5份 B.10份
C.15份 D.20份
答案 B
解析 由题意得P(X>100)=0.5,P(100<X≤120)=P(80≤X<100)=0.45,所以P(X>120)=P(X>100)-P(100<X≤120)=0.05,所以应从120分以上的试卷中抽取200×0.05=10(份).故选B项.
,)
1.下列函数是正态密度函数的是( )
A.f(x)=e,μ,σ(σ>0)都是实数
B.f(x)=e-
C.f(x)=e-
D.f(x)=e
答案 B
解析 A项中·σ错为,指数错为正数,故A项错误;C项中从系数可得σ=2,而从指数处可得σ=,显然矛盾,故C项错误;D项中指数错为正,故D项错误.故选B项.
2.已知随机变量ξ~N(100,σ2)(σ>0),若P(80≤ξ≤120)=0.8,则P(ξ<80)=( )
A.0.05 B.0.1
C.0.15 D.0.2
答案 B
解析 由题知此正态密度曲线的对称轴是直线x=100,由正态曲线的对称性可知,P(ξ<80)=×[1-P(80≤ξ≤120)]=0.1.故选B项.
3.如图是三个正态分布X~N(0,0.25),Y~N(0,1),Z~N(0,4)的密度曲线,则三个随机变量X,Y,Z对应的曲线分别是图中的______,______,______.
解析 在密度曲线中,σ越大,曲线越“矮胖”;σ越小,曲线越“瘦高”,故X对应曲线①,Y对应曲线②,Z对应曲线③.
答案 ① ② ③
4.正态分布的概率密度函数P(x)=·e-在[3,7]内取值的概率为______.
解析 由题意可知X~N(5,4),且μ=5,σ=2,所以P(3≤X≤7)=P(μ-σ≤X≤μ+σ)≈0.682 7.
答案 0.682 7
学科网(北京)股份有限公司
$$