内容正文:
7.5正态分布
【基础知识】
一、基本概念
1.连续型随机变量
除了离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续型随机变量.
2.正态曲线的定义
我们称f(x)=,x∈R,其中μ∈R,σ>0为参数,为正态密度函数,称其图象为正态分布密度曲线,简称正态曲线.
3.正态分布的定义
若随机变量X的概率密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ,σ2).特别地,当μ=0,σ=1时,称随机变量X服从标准正态分布.
若X~N(μ,σ2),如图所示,X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.
4.正态曲线f(x)=,x∈R中的参数μ,σ的含义
:均值(数学期望),决定对称轴位置;E(X)=μ
:标准差,决定曲线胖瘦,;D(X)=σ2.
:常数,
x为自变量,x∈R.
二、正态曲线的特点
1.对∀x∈R,f(x)>0,它的图象在x轴的上方.
2.曲线与x轴之间的面积为1.
3.曲线是单峰的,它关于直线x=μ对称.
4.曲线在x=μ处达到峰值.
5.当|x|无限增大时,曲线无限接近x轴.
6.当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图①.
7.当μ一定时,曲线的形状由σ确定,σ较小时曲线“瘦高”,表示随机变量X的分布比较集中;σ较大时,曲线“矮胖”,表示随机变量X的分布比较分散,如图②.
三、正态总体在三个特殊区间内取值的概率值及3σ原则
1.P(μ-σ≤X≤μ+σ)≈0.682 7;
P(μ-2σ≤X≤μ+2σ)≈0.954 5;
P(μ-3σ≤X≤μ+3σ)≈0.997 3.
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]中的值,这在统计学中称为3σ原则.
2.对称概率公式
(1)
(2)
(3)
3.单侧概率计算
(1)
(2)
【典型例题】
例1.(2026高二·全国·课堂例题)设,试求:
(1);
(2);
(3);
(4).
【答案】(1)
(2)
(3)
(4)
【分析】(1)利用正态分布三段区间的概率值求概率;
(2)利用正态分布三段区间的概率值求概率;
(3)利用正态分布三段区间的概率值结合对称性求概率;
(4)利用正态分布三段区间的概率值结合对称性求概率.
【详解】(1),.
所以.
(2)∵该正态曲线关于直线对称,
所以.
(3)∵该正态曲线关于直线对称,
,
.
(4)因为该正态曲线关于直线对称,
,
.
变式1.(2026高二·浙江宁波·期中)已知随机变量服从正态分布,,则________.
【答案】1
【分析】根据正态分布的对称性求解即可.
【详解】由题意得,根据正态分布的对称性得
例2.(25-26高二下·全国·课后作业)(多选)某市组织一次高三调研考试,考试后统计的数学成绩(单位:分)服从正态分布,其概率密度函数为,则下列说法正确的是( )
A.这次考试的数学平均成绩为80分
B.分数在120分以上的人数与分数在60分以下的人数相同
C.分数在110分以上的人数与分数在50分以下的人数相同
D.这次考试的数学成绩的标准差为10
【答案】ACD
【分析】首先根据正态密度函数解析式确定和,判断AD,再根据对称性判断BC.
【详解】由函数解析式知这次考试的数学平均成绩为80分,标准差为10,故A,D正确.
因为函数图象关于直线对称,所以分数在120分以上的人数与分数在40分以下的人数相同;
分数在110分以上的人数与分数在50分以下的人数相同,故B错误,C正确.
故选:ACD
变式2.(2026高三·全国·课后作业)某校400名学生的某次数学考试成绩X服从正态分布,正态分布密度曲线如图所示,则成绩X位于区间的人数大约是_________.
【答案】273
【分析】由图知:,利用原则可求出成绩X位于区间的概率,进而可得出大约人数.
【详解】由题意可知:,由图象可得:,
∵,即,
∴成绩X位于区间的人数大约是.
故答案为:273.
例3.(2026·河北唐山·二模)已知随机变量,随机变量,则( )
A. B.
C. D.
【答案】D
【分析】根据正态曲线的性质逐项判断即可.
【详解】
因为,,则,
因为,,则,
对于A,,A错误;
对于B,,故,B错误,
对于CD,,
,
则,D正确;
所以,C错误.
变式3.(2026高二·河南南阳·期末)已知三个正态密度函数(,)的图像如图所示,则( )
A., B.,
C., D.,
【答案】C
【分析】由正态分布的图像中对称轴位置比较均值大小,图像胖瘦判断标准差的大小.
【详解】由题图中的对称轴知:,
与(一样)瘦高,而胖矮,
所以.
故选:C
例4.“公平正义”是社会主义和谐社会的重要特征,是社会主义法治理念的价值追求.“考试”作为一种公平公正选拔人才的有效途径,正被广泛采用.一般地,对于一次成功的考试来说,所有考生的考试成绩应服从正态分布.某单位准备通过考试(按照高分优先录取的原则)录用300人,其中275个高薪职位和25个普薪职位.实际报名人数为2000名,考试满分为400分.记考生的成绩为,且,已知所有考生考试的平均成绩,且360分及其以上的高分考生有30名.
(1)求的值.(结果保留位整数)
(2)该单位的最低录取分数约是多少?(结果保留为整数)
(3)考生甲的成绩为286分,若甲被录取,能否获得高薪职位?若不能被录取,请说明理由.
参考资料:①当时,令,则.
②当,,,,.
【答案】(1)
(2)分
(3)甲能获得高薪,理由见解析
【分析】(1)依题意,令,得到,根据及所给条件求出;
(2)由(1)可得,设最录取分数为,根据,求得,即可得到答案;
(3)考生甲的成绩为,得到甲能被录取概率为,从而推导出分以上的人数,即可得解.
【详解】(1)依题意,令,则,
所以可得,,
,
又因为,则,解得;
(2)由(1)可得,
设最录取分数为,则,
,,所以,
即最低录取分数线为分.
(3)考生甲的成绩为分分,
所以甲能被录取概率为,
表明不低于考生甲的成绩的人数约为总人数的,约有,
即考生甲大约排在第名,排在名之前,所以甲能获得高薪.
变式4:(多选题)某自动流水线生产的一种新能源汽车零配件产品的质量(单位:)服从正态分布,且,.从该流水线上随机抽取4件产品,这4件产品中质量在区间上的件数记为,则( )
A. B.
C. D.
【答案】ABD
【分析】由正态分布对称性可判断AB;由二项分布的知识判断CD.
【详解】A选项,由,得,
故,
由正态分布的对称性可知,A正确;
B选项,,B正确;
C选项,由题意得,故,C错误;
D选项,,D正确.
强化训练:
一、单选题
1.设随机变量的正态分布密度函数为,,则参数,的值分别是( )
A., B.,
C., D.,
【答案】D
【分析】由正态分布密度函数的概念即得.
【详解】由正态分布密度函数表达式知,.
故选:D.
2.随机变量服从正态分布,则标准差为( )
A.2 B.4 C.10 D.14
【答案】A
【分析】根据正态分布中的参数意义可知当差为4,进而可得标准差.
【详解】因为服从正态分布可知:方差为4,故标准差为2,
故选:A
3.小明上学有时坐公交车,有时骑自行车,他记录多次数据,分析得到:坐公交车平均用时30min,样本方差为36;骑自行车平均用时34min,样本方差为4,假设坐公交车用时,骑自行车用时,则( )
A. B.
C.如果有38分钟可用,小明应选择坐公交车 D.如果有34分钟可用,小明应选择自行车
【答案】B
【分析】利用正态分布曲线的意义以及对称性,对四个选项逐一分析判断即可.
【详解】因为,,
将化为标准正态分布,则,
因为,所以,故A错误;
又,,故B正确;
因为,所以如果有38分钟可用,小明应选择自行车,故C错误;
因为,所以如果有34分钟可用,小明应选择坐公交车,故D错误.
故选:B.
4.已知随机变量,则不正确的是( )
A.
B.随机变量的分布越集中,的值越小
C.越大,随机变量的方差越大
D.的取值在内是小概率事件
【答案】C【分析】应用正态分布性质及对称性判断各个选项即可.
【详解】对于A,因为随机变量,所以,
所以,故A正确;
对于B,,而非方差,故B错误;
对于C,随机变量的分布越集中,说明数据的波动越小,方差越小,
而,则的值越小,故C正确;
对于D,根据原则,故D正确.
故选:C.
二、多选题
5.下列说法正确的是( )
A.数据2,1,6,3,4,5,4,1,3的下四分位数是2
B.若数据的标准差为s,则数据的标准差为
C.随机变量,若,则
D.随机变量,若,则
【答案】ABC
【分析】对于A,由下四分位数为分位数可求;对于B,由数据标准差的线性关系可判断;对于C,根据正态分布的对称性可求概率;对于D,由二项分布方差公式可求,再计算期望即可.
【详解】对于A中,数据从小到大排列为,共有9个数据,
因为,所以数据的下四分位数为第3个数据,即为2,所以A正确;
对于B中,数据的标准差为,由数据方差的性质,
可得数据的标准差为,所以B正确;
对于C中,随机变量服从正态分布,且,
根据正态分布曲线的对称性,可得,所以C正确;
对于D中,随机变量服从二项分布,且,
可得,解得或,
当时,可得;
当时,可得,所以D错误.
故选:ABC.
6.设随机变量,随机变量,其正态密度曲线如图所示,则( )
A. B.
C. D.
【答案】ABD
【分析】根据正态密度曲线易得,,然后可逐项判断.
【详解】,,
两曲线分别关于直线对称,由图可知,故A正确;
又,所以,故B正确;
又的正态密度曲线比的正态密度曲线更“高瘦”,所以,故C错误;
又,所以,故D正确;
故选:ABD.
7.我国新能源汽车电驱技术世界领先,新能源汽车主要分为两大类,一种是纯电,一种是混动.某新能源汽车厂科研部对纯电类汽车和混动类汽车都使用的关键部件的某一指标进行测试,经统计纯电类部件的指标X和混动类部件的指标Y都服从正态分布,且,,.科研部规定:部件指标高于110的为优质品,部件指标低于90的为不合格品,则( )
A.
B.X对应的正态曲线比Y对应的正态曲线“瘦高”
C.混动类部件优质品率高于其不合格品率
D.纯电类部件优质品率高于其不合格品率
【答案】BC
【分析】由正态分布的性质可判断各选项.
【详解】根据正态分布的性质可知,,,所以,故A错误;
因为,所以X对应的正态曲线比Y对应的正态曲线“瘦高”,故B正确;
因为Y对应的正态曲线的对称轴方程为,所以,
又,所以,即混动类部件优质品率高于其不合格品率,故C正确;
因为X对应的正态曲线的对称轴方程为,所以,则纯电类部件优质品率等于其不合格品率,故D错误.
故选:BC.
8.李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到,假设坐公交车用时X和骑自行车用时Y都服从正态分布,,.X和Y的分布密度曲线如图所示.则下列正确的是( )
(参考数据:,,)
A.
B.
C.
D.为了保证84.135%的概率不迟到,李明不管选择哪种交通工具都需至少预留36分钟时间
【答案】BD
【分析】根据给定的正态分布密度曲线,结合正态分布的对称性和性质,逐项判定,即可求解.
【详解】对于A中,根据给定的正态分布密度曲线图像,可得随机变量,所以,所以A错误;
对于B中,根据正态分布密度曲线图像,可得时,
随机变量对应的曲线与围成的面积小于时随机变量对应的曲线与围成的面积,
所以, 所以B正确;
对于C中,根据正态分布密度曲线图像,
可得,
,
即,所以C错误;
对于D中,因为,
所以,
为了保证84.135%的概率不迟到,李明不管选择哪种交通工具都需至少预留36分钟时间,所以D正确;
故选:BD.
三、填空题
9.已知随机变量服从正态分布,若,则______.
【答案】0.8/
【详解】由可得,因,
由正态曲线对称性,得,
则.
10.若随机变量,且,则的值为______.
【答案】
【分析】设,利用正态密度曲线的对称性可得出,代入题干等式求出的值即可.
【详解】设,因为,则,
所以,解得,故.
11.随机变量服从正态分布,,则______.
【答案】/
【详解】因为随机变量服从正态分布,所以,
所以.
四、解答题
12.潮阳实验学校高二学生参加数学竞赛,成绩服从正态分布.
(1)求成绩在70分到90分之间的概率;
(2)若该校有1000名学生参加竞赛,估计成绩超过90分的学生人数;
(3)若从成绩前的学生中选2人参加省级竞赛,求选中的2人成绩都超过95分的概率.
附注:若,则,
【答案】(1)
(2)159
(3)
【分析】(1)根据正态分布原则求解;
(2)由正态分布的对称性求得,进而估计成绩超过90分的学生人数;
(3)设前分位数为,由结合正态分布表求得,进而求得,根据条件概率公式求得,得解.
【详解】(1)设学生数学竞赛成绩为,则,则,,
.
(2)因为,
所以估计成绩超过90分的学生人数为人.
(3)设前分位数为,则,所以,
由正态分布表得,解得,
又,
,
所以选中的2人成绩都超过95分的概率为.
学科网(北京)股份有限公司
$
7.5正态分布
【基础知识】
一、基本概念
1.连续型随机变量
除了离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为连续型随机变量.
2.正态曲线的定义
我们称f(x)=,x∈R,其中μ∈R,σ>0为参数,为正态密度函数,称其图象为正态分布密度曲线,简称正态曲线.
3.正态分布的定义
若随机变量X的概率密度函数为f(x),则称随机变量X服从正态分布,记为X~N(μ,σ2).特别地,当μ=0,σ=1时,称随机变量X服从标准正态分布.
若X~N(μ,σ2),如图所示,X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.
4.正态曲线f(x)=,x∈R中的参数μ,σ的含义
:均值(数学期望),决定对称轴位置;E(X)=μ
:标准差,决定曲线胖瘦,;D(X)=σ2.
:常数,
x为自变量,x∈R.
二、正态曲线的特点
1.对∀x∈R,f(x)>0,它的图象在x轴的上方.
2.曲线与x轴之间的面积为1.
3.曲线是单峰的,它关于直线x=μ对称.
4.曲线在x=μ处达到峰值.
5.当|x|无限增大时,曲线无限接近x轴.
6.当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图①.
7.当μ一定时,曲线的形状由σ确定,σ较小时曲线“瘦高”,表示随机变量X的分布比较集中;σ较大时,曲线“矮胖”,表示随机变量X的分布比较分散,如图②.
三、正态总体在三个特殊区间内取值的概率值及3σ原则
1.P(μ-σ≤X≤μ+σ)≈0.682 7;
P(μ-2σ≤X≤μ+2σ)≈0.954 5;
P(μ-3σ≤X≤μ+3σ)≈0.997 3.
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]中的值,这在统计学中称为3σ原则.
2.对称概率公式
(1)
(2)
(3)
3.单侧概率计算
(1)
(2)
【典型例题】
例1.(2026高二·全国·课堂例题)设,试求:
(1);
(2);
(3);
(4).
变式1.(2026高二·浙江宁波·期中)已知随机变量服从正态分布,,则________.
例2.(25-26高二下·全国·课后作业)(多选题)某市组织一次高三调研考试,考试后统计的数学成绩(单位:分)服从正态分布,其概率密度函数为,则下列说法正确的是( )
A.这次考试的数学平均成绩为80分
B.分数在120分以上的人数与分数在60分以下的人数相同
C.分数在110分以上的人数与分数在50分以下的人数相同
D.这次考试的数学成绩的标准差为10
变式2.(2026高三·全国·课后作业)某校400名学生的某次数学考试成绩X服从正态分布,正态分布密度曲线如图所示,则成绩X位于区间的人数大约是_________.
例3.(2026·河北唐山·二模)已知随机变量,随机变量,则( )
A. B.
C. D.
变式3.(2026高二·河南南阳·期末)已知三个正态密度函数(,)的图像如图所示,则( )
A., B.,
C., D.,
例4.“公平正义”是社会主义和谐社会的重要特征,是社会主义法治理念的价值追求.“考试”作为一种公平公正选拔人才的有效途径,正被广泛采用.一般地,对于一次成功的考试来说,所有考生的考试成绩应服从正态分布.某单位准备通过考试(按照高分优先录取的原则)录用300人,其中275个高薪职位和25个普薪职位.实际报名人数为2000名,考试满分为400分.记考生的成绩为,且,已知所有考生考试的平均成绩,且360分及其以上的高分考生有30名.
(1)求的值.(结果保留位整数)
(2)该单位的最低录取分数约是多少?(结果保留为整数)
(3)考生甲的成绩为286分,若甲被录取,能否获得高薪职位?若不能被录取,请说明理由.
参考资料:①当时,令,则.
②当,,,,.
变式4:(多选题)某自动流水线生产的一种新能源汽车零配件产品的质量(单位:)服从正态分布,且,.从该流水线上随机抽取4件产品,这4件产品中质量在区间上的件数记为,则( )
A. B.
C. D.
强化训练:
一、单选题
1.设随机变量的正态分布密度函数为,,则参数,的值分别是( )
A., B.,
C., D.,
2.随机变量服从正态分布,则标准差为( )
A.2 B.4 C.10 D.14
3.小明上学有时坐公交车,有时骑自行车,他记录多次数据,分析得到:坐公交车平均用时30min,样本方差为36;骑自行车平均用时34min,样本方差为4,假设坐公交车用时,骑自行车用时,则( )
A. B.
C.如果有38分钟可用,小明应选择坐公交车 D.如果有34分钟可用,小明应选择自行车
4.已知随机变量,则不正确的是( )
A.
B.随机变量的分布越集中,的值越小
C.越大,随机变量的方差越大
D.的取值在内是小概率事件
二、多选题
5.下列说法正确的是( )
A.数据2,1,6,3,4,5,4,1,3的下四分位数是2
B.若数据的标准差为s,则数据的标准差为
C.随机变量,若,则
D.随机变量,若,则
6.设随机变量,随机变量,其正态密度曲线如图所示,则( )
A. B.
C. D.
7.我国新能源汽车电驱技术世界领先,新能源汽车主要分为两大类,一种是纯电,一种是混动.某新能源汽车厂科研部对纯电类汽车和混动类汽车都使用的关键部件的某一指标进行测试,经统计纯电类部件的指标X和混动类部件的指标Y都服从正态分布,且,,.科研部规定:部件指标高于110的为优质品,部件指标低于90的为不合格品,则( )
A.
B.X对应的正态曲线比Y对应的正态曲线“瘦高”
C.混动类部件优质品率高于其不合格品率
D.纯电类部件优质品率高于其不合格品率
8.李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到,假设坐公交车用时X和骑自行车用时Y都服从正态分布,,.X和Y的分布密度曲线如图所示.则下列正确的是( )
(参考数据:,,)
A.
B.
C.
D.为了保证84.135%的概率不迟到,李明不管选择哪种交通工具都需至少预留36分钟时间
三、填空题
9.已知随机变量服从正态分布,若,则______.
10.若随机变量,且,则的值为______.
11.随机变量服从正态分布,,则______.
四、解答题
12.深圳高二学生参加数学竞赛,成绩服从正态分布.
(1)求成绩在70分到90分之间的概率;
(2)若该校有1000名学生参加竞赛,估计成绩超过90分的学生人数;
(3)若从成绩前的学生中选2人参加省级竞赛,求选中的2人成绩都超过95分的概率.
附注:若,则,
学科网(北京)股份有限公司
$