内容正文:
7.5 正态分布
第七章 随机变量及其分布
人教A版 数学 选择性必修第三册
基础落实·必备知识一遍过
重难探究·能力素养速提升
学以致用·随堂检测促达标
目录索引
学习单元5 正态分布
正态分布是概率论中最重要的连续型概率模型,服从正态分布的随机变量是连续型随机变量,而连续型随机变量的取值不能一一列举,而且它取任 意单点值的概率都是0.因此,需要用新的数学工具来刻画随机变量的分布规律.
由于高中阶段不要求对一般的连续型随机变量及其分布进行讨论,这也对理解正态分布产生了一定的困难.本学习单元的主要内容为正态密度曲线、正态密度函数、正态分布的特征、随机变量落入某个区域内的概率表示、正态分布的均值和方差、3σ原则及简单应用.
具体内容结构如下图所示:
学习目标 1.利用实际问题的频率分布直方图,了解正态密度曲线的特点及曲线所表示的意义.(直观想象)
2.了解随机变量落在区间[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]的概率大小.(数据分析)
3.会用正态分布去解决实际问题.(数学建模、数学运算)
基础落实·必备知识一遍过
知识点1 正态曲线
函数 ,x∈R,其中μ∈R,σ>0为参数,对任意的x∈R,f(x)>0,它的图象在x轴的上方.可以证明x轴和曲线之间的区域的面积为1.我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称 ,如图所示.
正态曲线
微思考
正态密度函数的解析式能体现什么数字特征?正态曲线与x轴之间区域的面积代表什么?
提示 正态密度函数 ,x∈R体现了期望、标准差的数字特征,正态曲线与x轴之间的区域的面积代表了概率,总面积恒定为1.
知识点2 正态分布
若随机变量X的概率分布密度函数为 (x∈R,其中μ∈R,σ>0为参数),则称随机变量X服从正态分布,记为 .特别地,当μ=0,σ=1时,称随机变量X服从 .
如图所示,X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为图中区域B的面积.
X~N(μ,σ2)
标准正态分布
微思考
1.符合正态分布的随机变量X的取值在区间[a,b]上的概率可通过什么方式直观显示?
2.参数μ,σ在正态分布中的实际意义是什么?
提示 概率可以用正态曲线与直线x=a,x=b以及x轴所围成的封闭图形的面积来显示.
提示 参数μ是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
知识点3 正态曲线的特点
1.曲线位于x轴的 ,与x轴不相交.
2.曲线是单峰的,它关于直线 对称.
3.曲线在 处达到峰值 .
但不能与x轴相交
4.当|x|无限增大时,曲线无限接近x轴.
5.曲线与x轴之间的面积为 .
上方
x=μ
x=μ
1
6.当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图1.
图1
图2
7.当μ一定时,曲线的形状由σ确定,当σ较小时,峰值高,正态曲线“ ”,表示随机变量X的分布比较集中;当σ较大时,峰值低,正态曲线“ ”,表示随机变量X的分布比较分散,如图2.
瘦高
矮胖
微思考
1.正态曲线的“胖瘦”由什么参数来决定?具体有何影响?
2.标准正态分布函数图象的对称轴是什么?从对称性来看,标准正态分布函数是什么函数?
提示 正态曲线的“胖瘦”由σ决定.σ越大,曲线越“矮胖”;σ越小,曲线越“瘦高”.
提示 标准正态分布函数图象的对称轴是直线x=0,也就是y轴,所以标准正态分布函数是偶函数.
知识点4 正态总体在三个特殊区间内取值的概率及3σ原则
1.三个特殊区间内取值的概率
若X~N(μ,σ2),则
P(μ-σ≤X≤μ+σ)≈0.682 7,
P(μ-2σ≤X≤μ+2σ)≈0.954 5,
P(μ-3σ≤X≤μ+3σ)≈0.997 3.
2.3σ原则
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取
[μ-3σ,μ+3σ]中的值,这在统计学中称为3σ原则.
名师点睛
对于正态分布N(μ,σ2)而言,随机变量X在区间[μ-3σ,μ+3σ]之外取值几乎不可能发生,它在产品检查、质量检验中起着重要的作用.
重难探究·能力素养速提升
问题1什么是连续型随机变量?与离散型随机变量有何区别?
问题2如何描述连续型样本数据的分布?
问题3如何构建适当的概率模型刻画连续型样本数据的分布?
问题4根据函数的知识,刻画连续型样本数据的概率分布的曲线是一个函数图象,该曲线是否有解析式?若有,其中参数是什么?参数对于图象有何影响?
探究点一 正态曲线的应用
问题5如何应用正态曲线来求连续型随机变量的数字特征?
【例1】 一个正态曲线如图所示,试根据该图象写出其正态密度函数的解析式,求出随机变量的均值和方差.
规律方法 利用正态曲线的特点求参数μ,σ
(1)正态曲线是单峰的,它关于直线x=μ对称,由此特点结合图象可求出μ.
(2)正态曲线在x=μ处达到峰值 ,由此特点结合图象可求出σ.
探究点二 正态分布下的概率计算
问题6如何应用正态曲线的性质来求相应区间的概率?
【例2】 已知随机变量ξ服从正态分布N(3,σ2),若P(ξ≤4)=0.78,则P(2<ξ<3)=( )
A.0.2 B.0.24 C.0.28 D.0.32
C
解析 ∵随机变量ξ服从正态分布N(3,σ2),
∴正态曲线的对称轴为直线x=3.又P(ξ≤4)=0.78,
∴P(3≤ξ≤4)=P(ξ≤4)- =0.78-0.5=0.28,
∴P(2≤ξ≤3)=P(3≤ξ≤4)=0.28.故选C.
规律方法 在正态分布下解决求随机变量在某区间上的概率问题,可利用正态曲线的对称性,将随机变量在所求区间上的概率转化为随机变量在已知区间上的概率或利用3σ原则转化为在特殊区间上的概率.
本节要点归纳
1.知识清单:(1)正态曲线及其特点;(2)正态分布的应用,3σ原则.
2.方法归纳:转化与化归、数形结合.
3.常见误区:概率区间转化不等价.
学以致用·随堂检测促达标
1
2
3
4
5
6
7
8
9
10
11
12
A 级 必备知识基础练
1.某厂生产的零件外径X~N(10,0.04),今从该厂上午、下午生产的零件中各取一件,测得其外径分别为9.9 cm,9.3 cm,则可认为( )
A.上午生产情况正常,下午生产情况异常
B.上午生产情况异常,下午生产情况正常
C.上午、下午生产情况均正常
D.上午、下午生产情况均异常
A
解析 因测量值X为随机变量,又X~N(10,0.04),所以μ=10,σ=0.2,
记I=[μ-3σ,μ+3σ]=[9.4,10.6],则9.9∈I,9.3∉I.故选A.
13
1
2
3
4
5
6
7
8
9
10
11
12
2.已知随机变量ξ服从正态分布N(1,σ2),若P(ξ≤4)=0.9,则P(-2≤ξ≤1)=( )
A.0.2 B.0.3 C.0.4 D.0.6
C
解析 由题意可知正态曲线关于直线x=1对称,P(ξ>4)=1-P(ξ≤4)=0.1,
根据对称性可知,P(ξ<-2)=P(ξ>4)=0.1,
故P(-2≤ξ≤1)=0.5-P(ξ<-2)=0.5-0.1=0.4.
13
1
2
3
4
5
6
7
8
9
10
11
12
3.已知X~N(0,1),则X在区间(-∞,-2)内取值的概率约为( )
A.0.954 5 B.0.045 5
C.0.977 3 D.0.022 75
D
13
1
2
3
4
5
6
7
8
9
10
11
12
4.某工厂生产了10 000根钢管,其钢管内径(单位:mm)近似服从正态分布N(20,σ2)(σ>0),工作人员通过抽样的方式统计出钢管内径高于20.05 mm的占钢管总数的 ,则这批钢管中,内径在19.95 mm到20 mm之间的钢管数约为( )
A.4 200 B.4 500
C.4 800 D.5 200
C
13
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
5.若随机变量X的正态分布密度函数为 ,X在(-2,-1)和(1,2)内取值的概率分别为p1,p2,则p1,p2的关系为( )
A.p1>p2 B.p1<p2
C.p1=p2 D.不确定
C
解析 由题意知μ=0,σ=1,所以正态曲线关于直线x=0对称,所以p1=p2.
13
1
2
3
4
5
6
7
8
9
10
11
12
13
6.(多选题)[2024新高考Ⅰ]为了解某种植区推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值 =2.1,样本方差s2=0.01.已知该种植区以往的亩收入X服从正态分布N(1.8,0.12),假设推动出口后的亩收入Y服从正态分布N( ,s2),则( )
(若随机变量Z服从正态分布N(μ,σ2),则P(Z<μ+σ)≈0.841 3)
A.P(X>2)>0.2 B.P(X>2)<0.5
C.P(Y>2)>0.5 D.P(Y>2)<0.8
BC
1
2
3
4
5
6
7
8
9
10
11
12
13
解析 由题意知,X~N(1.8,0.12),Y~N(2.1,0.12).∵P(X<1.8+0.1)≈0.841 3, ∴P(X>1.8+0.1)≈1-0.841 3=0.158 7. ∴P(X>2)=P(X>1.8+2×0.1)<P(X>1.8+0.1)≈0.158 7,∴A错误. P(X>2)<P(X>1.8)=0.5,∴B正确.∵P(Y>2)=P(Y>2.1-0.1)=P(Y<2.1+0.1) ≈0.841 3,∴C正确,D错误.故选BC.
1
2
3
4
5
6
7
8
9
10
11
12
13
7.已知X~N(4,σ2),且P(2≤X≤6)≈0.682 7,则σ= ,P(|X-2|≤4)≈ .
2
0.84
1
2
3
4
5
6
7
8
9
10
11
12
13
8.某班有50名学生,一次考试的数学成绩ξ服从正态分布N(100,σ2),已知P(90≤ξ≤100)=0.3,估计该班学生数学成绩在110分以上的人数为 .
10
1
2
3
4
5
6
7
8
9
10
11
12
13
9.已知某地外来务工人员年均收入X服从正态分布,其正态曲线如图所示.
(1)写出此地外来务工人员年均收入的正态密度函数解析式;
(2)估计此地外来务工人员年均收入在8 000~8 500元的人数所占的百分比.
解 设此地外来务工人员年均收入X~N(μ,σ2),
结合题图可知,μ=8 000,σ=500.
(1)此地外来务工人员年均收入的正态密度函数解析式为
(2)∵P(7 500≤X≤8 500)=P(8 000-500≤X≤8 000+500)≈0.682 7,
∴P(8 000≤X≤8 500)= P(7 500≤X≤8 500)≈0.341 35=34.135%.故此地外来务工人员年均收入在8 000~8 500元的人数所占的百分比约为34.135%.
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
B 级 关键能力提升练
10.在某市高三质量检测考试中,学生的数学成绩X服从正态分布N(98,100).已知参加本次考试的全市学生有9 455人,如果某学生在这次考试中的数学成绩是108分,那么他的数学成绩大约排在全市第( )
A.1 500名 B.1 700名 C.4 500名 D.8 000名
A
1
2
3
4
5
6
7
8
9
10
11
12
13
11.(多选题)已知随机变量X服从正态分布N(μ,σ2),其正态曲线在(-∞,80]上单调递增,在[80,+∞)内单调递减,且P(72≤X≤88)≈0.682 7,则( )
A.μ=80
B.σ=4
C.P(X>64)≈0.977 25
D.P(64<X<72)≈0.135 9
ACD
解析 因为正态曲线在(-∞,80]上单调递增,在[80,+∞)内单调递减,所以正态曲线关于直线x=80对称,所以μ=80,故A正确;
因为P(72≤X≤88)≈0.682 7,结合P(μ-σ≤X≤μ+σ)≈0.682 7,可知σ=8,故B错误;
因为P(μ-2σ≤X≤μ+2σ)≈0.954 5,且P(X<64)=P(X>96),
所以P(X>64)≈0.977 25,故C正确;
所以P(64<X<72)=P(X>64)-P(X>72)≈0.977 25-(1-0.158 65)=0.135 9,
故D正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
12.(多选题)下列说法正确的是( )
B.已知随机变量X服从正态分布N(2,σ2)且P(X≤4)=0.9,则P(0≤X≤2)=0.4
C.已知随机变量X~N(0,σ2),若P(|X|≤2)=a,则P(X>2)的值为
D.已知X是一个离散型随机变量,则E(2X+3)=2E(X)+3,D(2X+3)=2D(X)+3
AB
∵随机变量X服从正态分布N(2,σ2),
∴正态曲线的对称轴是直线x=2,
∵P(X≤4)=0.9,∴P(2≤X≤4)=0.4,
∴P(0≤X≤2)=P(2≤X≤4)=0.4,故B正确;
已知随机变量X~N(0,σ2),若P(|X|≤2)=a,则P(X>2)= [1-P(|X|≤2)]= ,故C错误;
已知X是一个离散型随机变量,则E(2X+3)=2E(X)+3,D(2X+3)=4D(X),故D错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
13.部分省份采用“3+1+2”高考模式,“3”指的是语文、数学、外语三门为必选科目,“1”指的是要在物理、历史里选一门,“2”指的是要在生物学、化学、思想政治、地理4门中选择2门.
(1)若按照“3+1+2”模式选科,求甲、乙两名学生恰有四门学科相同的选法种数.
(2)某教育部门为了调查学生语文、数学、外语三科成绩,从当地不同的学校中抽取高一学生4 000名参加语文、数学、外语的网络测试(满分450分),假设该次网络测试成绩服从正态分布N(245,552).
①估计4 000名学生中成绩介于190分到355分之间的有多少人(结果保留到个位);
②该地某校对外宣传“我校200人参与此次网络测试,有12名同学获得425分以上的高分”,请结合统计学知识分析上述宣传语是否可信.
附:P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
(2)①设此次网络测试的成绩记为X,则X~N(245,552).
由题知μ=245,σ=55,μ+2σ=245+110=355,μ-σ=245-55=190,
4 000×0.818 6=3 274.4≈3 274.
所以估计4 000名学生中成绩介于190分到355分之间的约有3 274人.
②不可信.
μ+3σ=245+3×55=410<425,
则P(X>410) =0.001 35,4 000×0.001 35=5.4,
这说明4 000名考生中,只有约5人的成绩高于410分.
所以说“我校200人参与此次网络测试,有12名同学获得425分以上的高分”的宣传语不可信.
f(x)=
f(x)=
f(x)=
解 由正态曲线可知该正态曲线关于直线x=20对称,最大值是,所以μ=20,,则σ=
所以该正态密度函数的解析式是f(x)=,x∈R.
随机变量的均值是μ=20,方差是σ2=()2=2.
解析 由题知对应的正态曲线的对称轴为直线x=0,
所以P(X<-2)=0.5-P(-2≤X≤2)≈0.5-0.954 5=0.022 75.
解析 ∵P(X<19.95)=P(X>20.05)=,
∴P(19.95≤X≤20.05)=1-,
∴P(19.95≤X≤20)=,故这批钢管内径在19.95 mm到 20 mm之间的钢管数约为10 000=4 800.
f(x)=
解析 ∵X~N(4,σ2),∴μ=4.
∵P(2≤X≤6)≈0.682 7,=2.
∴P(|X-2|≤4)=P(-2≤X≤6)=P(-2≤X≤2)+P(2≤X≤6)=[P(-2≤X≤10)-P(2≤X≤6)]+P(2≤X≤6)=P(-2≤X≤10)+P(2≤X≤6)0.997 3+0.682 7 =0.84.
解析 由题意知,P(ξ>110)==0.2,故估计该班学生数学成绩在110分以上的人数为0.2×50=10.
f(x)=,x∈R.
解析 因为学生的数学成绩X服从正态分布N(98,100),所以P(X>108)=[1-P(88≤X≤108)]=[1-P(μ-σ≤X≤μ+σ)](1-0.682 7)=0.158 65.
所以0.158 65×9 455≈1 500.
所以P(X<64)(1-0.954 5)=0.045 5=0.022 75,
因为P(X<72)=(1-P(72≤X≤88))(1-0.682 7)=0.158 65,
A.设随机变量X服从二项分布B(6,),则P(X=3)=
解析 ∵随机变量X服从二项分布B6,,
则P(X=3)=3×1-3=,故A正确;
解 (1)甲、乙两名学生必选语文、数学、外语.
若另一门相同的为物理、历史中的一门,有种选法,
在生物学、化学、思想政治、地理4门中,甲、乙选择不同的2门,则有=6种选法,故共有2×6=12种选法;
若另一门相同的为生物学、化学、思想政治、地理4门中的一门,则有=48种选法.
所以甲、乙两个学生恰有四门学科相同的选法种数为12+48=60.
则P(190≤X≤355)=0.818 6,
$$