内容正文:
8.3正态分布
主讲:
苏教版2019选择性必修第二册
第8章概率
苏教版2019选择性必修第二册
学习目标
目标
1
重点
2
1.正态分布的概念、特征和性质。
2.标准正态分布表的使用方法。
3.运用正态分布解决实际问题的方法和步骤。
难点
3
1.透彻理解正态分布的概念和性质,尤其是如何通过频率直方图和概率密度曲线理解正态分布的形态和特点。
2.针对复杂的实际问题,准确地运用正态分布进行概率计算,避免计算错误和逻辑错误。
1.使学生理解正态分布的概念,掌握正态分布的特征和性质。
2.学生能够通过频率直方图和概率密度曲线理解正态分布的形态和特点。
3.学生能够掌握标准正态分布表的使用方法,会查表求解正态分布的概率问题。
4.学生能够运用正态分布解决实际问题,如计算随机变量在特定区间内的概率。
新课导入
二项分布、超几何分布是刻画离散型随机变量分布的数学模型,在实际应用中,还有许多随机变量可以取某一区间中的一切值,例如:
在生产中,在正常生产条件下各种产品的质量指标(如零件的尺寸、维的纤度等);
在测量中,长度测量误差,某一地区同年龄人群的身高、体重等;
在生物学中,一定条件下生长的小麦的株高、穗长、单位面积产量等;
在气象中,某地每年七月份的平均气温、平均湿度以及降雨量等;
我们称这类随机变量为连续性随机变量
新课导入
新课导入
根据已学的统计知识,可用频率分布直方图来分析数据
样本数据
频率/组距
特点:这个频率分布直方图大体呈中间高、两边低、左右大致对称的特点,如果增加 更多的测量数据,那么这种趋势会更加明显。
注解:频率分布直方图中每个小矩形的面积
表示身高数据落在相应区间内的频率,
所有小矩形的面积之和为1.
新课导入
问题1:如果将数据无限增多且组距无限缩小,上述频率分布直方图有何变化?
数据无限增多,组距无限缩小
随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线.我们将此曲线称为概率密度曲线。
新课导入
问题2: 根据函数知识,这个钟形曲线它是函数吗?如果是,那么,这个函数是否存在解析式呢?
函数 的图象与上述曲线(概率密度曲线)非常吻合,我们将该函数的图象称为正态密度曲线,简称正态曲线,这里有两个参数m 和s,其中s >0,m ∈R。
O
x
y
图象特点:
中间高,两头低,
左右对称
新课讲授
新课讲授
问题3:我们都知道,在函数 中,有m 和s
两个参数,试探究随着m或s 的变化,函数 的图象(即正态密度曲线)有什么变化?请举例说明。
新课讲授
新课讲授
(1).当参数取定值时,观察对正态分布的曲线。
3
1
2
σ=0.5
μ=-1
μ=0
μ=1
由于正态曲线关于x=μ对称,因此,当参数σ固定时,正态曲线的位置由μ确定,且随着μ的变化而沿x轴平移,
规律:“-”左
“+”右
不同的m 和s 对应着不同的正态密度曲线,如:
新课讲授
新课讲授
(2).当参数取定值时,观察对正态曲线的影响
μ=0
=0.5
=1
=2
当μ固定时,因为正态曲线的峰值与σ成反比,而且对任意的σ>0,正态曲线与x轴之间的区域的面积总为1.
σ越大,曲线越“矮胖”,
表示总体的分布越分散;
σ越小,曲线越“瘦高”,
表示总体的分布越集中.
新课讲授
新课讲授
早在1733年,法国数学家棣莫弗( A . De Moivre ,1667-1754)在研究二项概率的近似计算时,已提出了正态密度函数的形式,但当时只是作为一个数学表达式.直到德国数学家高斯( C . F . Gauss ,1777-1855)提出"正态误差"的理论后,正态密度函数才取得"概率分布"的身份.因此,人们也称正态分布为高斯分布.
高斯是一个伟大的数学家,一生中的重要贡献不胜枚举,早期德国的10马克纸币上印有高斯的头像和正态分布曲线,这就传达了一个信息:在高斯的科学贡献中,对人类文明影响最大的是“正态分布”。
相关数学史
新课讲授
新课讲授
(3) 曲线与x轴之间的面积为1
(4) 当μ一定时,σ越大,曲线越“矮胖”,表示总体的分布越分散;
σ越小,曲线越“瘦高”,表示总体的分布越集中.
(2) 曲线关于直线x=μ对称,且在x=μ处取得最大值
(1)当x<m 时,曲线上升,当x>m 时,曲线下降;当曲线向左右两边无限延伸时,以x轴为渐近线
正态曲线的性质:
新课讲授
典例分析
正态分布的定义
设X是一个随机变量,若对任给区间(a,b],P(a<X≤ b)
是正态密度曲线下方和x轴上(a,b]上方所围成的图形的
面积,则称随机变量X服从参数m和s 2的正态分布,
简记为X ~ N(m,s 2)。
O
x
y
a
b
新课讲授
典例分析
问题4: 正态分布曲线是如何刻画随机变量的概率分布的呢?
若X~N(μ,σ2),则如右图所示,
X取值不超过x的概率P(X≤x)为图中区域A的面积,而P(a≤X≤b)为区域B的面积.
面积即为概率!
新课讲授
典例分析
由于正态曲线关于x=μ对称,因此,当参数σ固定时,正态曲线的位置由μ确定,且随着μ的变化而沿x轴平移,
所以参数μ反映了正态分布的集中位置,可以用均值来估计,故有E(X)=μ.
σ越大,曲线越“矮胖”,
表示总体的分布越分散;
σ越小,曲线越“瘦高”,
表示总体的分布越集中.
所以σ反映了随机变量的分布相对于均值μ的离散程度,可以用标准差来估计,故有D(X)=σ2.
问题5:如何得到正态分布的均值与方差?
新课讲授
典例分析
标准正态分布的定义
当μ=0,σ=1时,正态总体称为标准正态总体,正态分布N(0,1)称为标准正态分布,记X~N(0,1),其相应的函数表达式是
O
x
y
说明:其相应的曲线称为标 准正态曲线,标准正态总体N(0,1)在正态总体的研究中占有重要地位,任何正态分布的问题均可转化成标准总 体分布的概率问题,通过查标准正态分布表,可以确定服从标准正态分布的随机事件的有关概率。
新课讲授
典例分析
正态曲线下的面积规律
-x1 -x2 +x2 +x1
a
-a
正态曲线下对称区域的面积相等
对应的概率也相等
利用“对称法”求正态分布下随机变量在某个区间的概率
新课讲授
典例分析
若X~N(μ, σ2)
特殊区间的概率
由此看到,尽管正态变量的取值范围是(-∞, +∞),但在一次试验中,X的取值几乎总是落在区间[μ-3σ, μ+3σ]内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.
在实际应用中, 通常认为服从于正态分布N(μ, σ2)的随机变量X只取[μ-3σ, μ+3σ]中的值, 这在统计学中称为3σ原则.
新课讲授
典例分析
当X~N(μ,σ2)(μ≠0或σ2≠0)时, 服从标准正态分布N(0,1)
正态分布与标准正态分布的转换
新课讲授
典例分析
新课讲授
典例分析
新课讲授
典例分析
学以致用
一、 单项选择题(选对方法,事半功倍)
1.已知随机变量X服从正态分布N(2,7),P(X>1)=0.8,则P(X≥3)= ( )
A.0.2 B.0.3 C.0.7 D.0.8
A
由X~N(2,7),则P(X≥3)=P(X≤1)=1-P(X>1)=0.2.
【解析】
23
学以致用
2.已知随机变量X~N(3,1),且P(X<2)=0.158 7,则P(2≤X≤4)= ( )
A.0.158 6 B.0.341 3 C.0.417 7 D.0.682 6
D
因为随机变量X~N(3,1),则μ=3,σ=1,而P(X<2)=0.158 7,即P(2≤X<3)=0.5-0.158 7=0.341 3,所以P(2≤X≤4)=2P(2≤X<3)=0.682 6.
【解析】
24
学以致用
3.(2022·泰州期末) “双十二”网购狂欢节是继“双十一”之后的又一次网络促销日,在这一天,许多网商还会进行促销活动,但促销力度不及“双十一”.已知今年“双十二”期间,某小区居民网上购物的消费金额(单位:元)近似服从正态分布N(600,10 000),则该小区800名居民中,网购金额超过800元的人数大约为(参考数据:P(|X-μ|<σ)=0.683,P(|X-μ|<2σ)=0.954,P(|X-μ|<3σ)=0.997) ( )
A.16 B.18 C.20 D.25
B
【解析】
25
学以致用
26
学以致用
【解析】
【答案】B
27
学以致用
二、 多项选择题(练—逐项认证,考—选确定的)
5.(2022·深圳二调)已知随机变量X服从正态分布N(0,1),密度函数f(x)=P(X≤x),若x>0,则 ( )
A.f(-x)=1-f(x)
B.f(2x)=2f(x)
C.f(x)在(0,+∞)上是增函数
D.P(|X|≤x)=2f(x)-1
28
学以致用
因为随机变量X服从正态分布N(0,1),所以正态曲线关于直线x=0对称,f(x)在(0,+∞)上是增函数,故C正确;
因为f(x)=P(X≤x)(x>0),所以根据正态曲线的对称性可得f(-x)=P(X>x)=1-f(x),故A正确;
f(2x)=P(X≤2x),2f(x)=2P(X≤x),故B错误;
P(|X|≤x)=P(-x≤X≤x)=1-2f(-x)=1-2[1-f(x)]=2f(x)-1,故D正确.
【解析】
【答案】ACD
29
学以致用
6.(2022·连云港考前模) 医用口罩面体分为内、中、外三层,内层为亲肤材质,中层为隔离过滤层,外层为特殊材料抑菌层.根据国家质量监督检验标准,医用口罩的过滤率是重要的指标,根据长期生产经验,某企业在生产线状态正常情况下生产的医用口罩的过滤率x~N(0.94,0.012),则(参考数据:P(μ-2σ<x≤μ+2σ)=0.954,P(μ-3σ<x≤μ+3σ)=0.997,0.998 5100≈0.86) ( )
A.P(x≤0.9)<0.5
B.P(x<0.4)<P(x>1.5)
C.P(x>0.96)=0.023
D.假设生产状态正常,记X表示抽取的100只口罩中过滤率大于μ+3σ的数量,则P(X≥1)≈0.14
30
学以致用
对于A,P(x≤0.9)<P(x≤0.94)=0.5,故A正确;
对于B,因为P(x<0.4)=P(x≤0.94)-P(0.4≤x≤0.94)且P(x>1.5)=P(x<0.38),则P(x>1.5)=P(x≤0.94)-P(0.38≤x≤0.94),显然P(x<0.4)>P(x>1.5),故B错误;
【解析】
【答案】ACD
31
学以致用
7.老杨每天17:00下班回家,通常步行5分钟后乘坐公交车再步行到家,公交车有A,B两条线路可以选择.乘坐线路A所需时间(单位:分钟)服从正态分布N(44,4),下车后步行到家要5分钟;乘坐线路B所需时间(单位:分钟)服从正态分布N(33,16),下车后步行到家要12分钟.下列说法从统计角度认为合理的是 ( )
附:Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)≈0.682 7,P(μ-2σ<Z≤μ+2σ)≈0.954 5,P(μ-3σ<Z≤μ+3σ)≈0.997 3.
A.若乘坐线路B,18:00前一定能到家
B.乘坐线路A和乘坐线路B在17:58前到家的可能性一样
C.乘坐线路B比乘坐线路A在17:54前到家的可能性更大
D.若乘坐线路A,则在17:48前到家的可能性不超过1%
32
学以致用
【解析】
【答案】BCD
33
学以致用
三、 填空题(精准计算,整洁表达)
8.已知随机变量ξ服从正态分布N(μ,σ2),若P(ξ<2)=0.2,P(2<ξ<6)=0.6,则μ=________.
4
【解析】
34
学以致用
9.(2022·江苏七市三模)抽样表明,某地区新生儿体重X近似服从正态分布N(μ,σ2).假设随机抽取r个新生儿体检,记ξ表示抽取的r个新生儿体重在(μ-3σ,μ+3σ)以外的个数.若ξ的数学期望E(ξ)<0.05,则r的最大值是________.(P(μ-3σ≤X≤μ+3σ)=99.7%)
16
【解析】
35
学以致用
10.国家发展改革委、住房城乡建设部于2017年发布了《生活垃圾分类制度实施方案》,规定46个城市在2020年底实施生活垃圾强制分类,垃圾回收、利用率要达35%以上.某市在实施垃圾分类之前,从本市人口数量在两万人左右的240个社区中随机抽取50个社区,对这50个社区某天产生的垃圾量(单位:吨)进行了调查,得到如下频数分布表,并将人口数量在两万人左右的社区垃圾数量超过28吨/天的确定为“超标”社区:
垃圾量 [12.5,
15.5) [15.5,
18.5) [18.5,
21.5) [21.5,
24.5) [24.5,
27.5) [27.5,
30.5) [30.5,
33.5]
频数 5 6 9 12 8 6 4
36
学以致用
【解析】
22.8
38
37
学以致用
四、 解答题(让规范成为一种习惯)
11.2021年辽宁、广东、河北、湖北、湖南、江苏、福建、重庆等八省市将全部采用“3+1+2”的新高考模式.“3”指的是语文、数学、外语,这三门科目考试参加统一高考,由教育部考试中心统一命题,以原始成绩计入考生总成绩;“1”指的是物理和历史中的一科,考生必须从物理和历史两个科目中选择一科,由各省自主命题,以原始成绩计入考生总成绩.为了让考生更好地适应新高考模式,某省几个地市进行了统一的高考适应性考试.在所有考生中有 30 000人选考物理,考后物理成绩X(满分100分)服从正态分布N(55,102).
38
学以致用
(1) 分别估计成绩在[45,65]和75分以上的人数;(运算过程中精确到0.000 1,最后结果保留为整数)
附1:P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
【解答】
39
课堂小结
1.本节课学习了哪些新的数学知识?
2.本节课运用了哪些数学方法?
3.学习了本节课还有哪些收获?
40
课堂小结
(3) 曲线与x轴之间的面积为1
(4) 当μ一定时,σ越大,曲线越“矮胖”,表示总体的分布越分散;
σ越小,曲线越“瘦高”,表示总体的分布越集中.
(2) 曲线关于直线x=μ对称,且在x=μ处取得最大值
(1)当x<m 时,曲线上升,当x>m 时,曲线下降;当曲线向左右两边无限延伸时,以x轴为渐近线
正态曲线的性质:
41
课堂小结
若X~N(μ, σ2)
特殊区间的概率
由此看到,尽管正态变量的取值范围是(-∞, +∞),但在一次试验中,X的取值几乎总是落在区间[μ-3σ, μ+3σ]内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.
在实际应用中, 通常认为服从于正态分布N(μ, σ2)的随机变量X只取[μ-3σ, μ+3σ]中的值, 这在统计学中称为3σ原则.
42
主讲:
苏教版2019选择性必修第二册
感谢聆听
前面讨论的二项分布、超几何分布是刻画离散型随机变量的数学模型,在实际应用中,还有许多随机变量可以取某一区间中的一切值.这类随机变量就是连续型随机变量.例如,在必修“统计”一章中给出的金属棒长度的样本数据(《数学(必修第二册)》第245页习题8):
6.02 6.01 6.04 5.94 5.97 5.96 5.98 6.01 5.98 6.02
6.00 6.03 6.07 5.97 6.01 6.00 6.03 5.95 6.00 6.00
6.05 5.93 6.02 5.99 6.00 5.95 6.00 5.97 5.96 5.97
6.03 6.01 6.00 5.99 6.04 6.00 6.02 5.99 6.03 5.98
你能确定测量一次,其测量的长度在区间(5.97,6.03)上的概率吗?
例1 已知随机变量Z~N(0,1),查标准正态分布表,求:
(1)P(Z≤1.52); (2)P(Z>1.52);
(3)P(0.57<Z≤2.3); (4)P(Z≤-1.49).
解:(1)P(Z≤1.52)=0.9357.
(2)P(Z>1.52)=1-P(Z≤1.52)=1-0.9357=0.0643.
(3)P(0.57<Z≤2.3)=P(Z≤2.3)-P(Z≤0.57)=0.9893-0.7157=0.2736.
(4)P(Z≤-1.49)=P(Z≥1.49)=1-P(Z≤1.49)=1-0.9319=0.0681.
例2 某批待出口的水果罐头,每罐净重X(单位:g)服从正态分布N(184,2.52),求:
(1)随机抽取1罐,其净重超过184.5g的概率;
(2)随机抽取1罐,共净重在179g与189g之间的概率.
解:(1)
EMBED Equation.3 =1-P(Z≤0.2)
.
(2)P(179<Z≤189)=P(
<
≤
)
=P(-2<Z≤2)=P(Z≤2)-P(Z≤-2)
=P(Z≤2)-P(Z≥2)=P(Z≤2)-[1-P(Z≤2)]
=2P(Z≤2)-1=2×0.9772-1=0.9544.
答:随机抽取1罐,其净重超过184.5g的概率是0.4207,在179g与189g之间的概率是0.9544.
因为小区居民网上购物的消费金额(单位:元)近似服从正态分布N(600,10 000),所以P(X>800)===0.023,所以该小区800名居民中,网购金额超过800元的人数大约为0.023×800=18.4.
4.(2022·厦门四模)我们将服从二项分布的随机变量称为二项随机变量,服从正态分布的随机变量称为正态随机变量.概率论中有一个重要的结论是棣莫弗——拉普拉斯极限定理,它表明,若随机变量Y~B(n,p),当n充分大时,二项随机变量Y可以由正态随机变量X来近似,且正态随机变量X的期望和方差与二项随机变量Y的期望和方差相同.棣莫弗在1733年证明了p=的特殊情形,1812年,拉普拉斯对一般的p进行了证明.现抛掷一枚质地均匀的硬币100次,则利用正态分布近似估算硬币正面向上次数超过60次的概率为(附:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3) ( )
A.0.158 7 B.0.022 8 C.0.002 7 D.0.001 4
抛掷一枚质地均匀的硬币100次,设硬币正面向上次数为X,则X~B,所以E(X)=np=100×=50,D(X)=np(1-p)=100××=25.
由题意,X~N(μ,σ2),且μ=E(X)=50,σ2=D(X)=25,因为P(μ-2σ≤X≤μ+2σ)≈0.954 5,所以利用正态分布近似估算硬币正面向上次数超过60次的概率为P(X>60)=P(X>50+2×5)=≈0.022 8.
对于C,P(x>0.96)=P(x>0.94+0.02)=P(x>μ+2σ)==0.023,故C正确;
对于D,P(x>μ+3σ)==0.001 5,则P(x≤μ+3σ)=1-P(x>μ+3σ)=1-0.001 5=0.998 5,由P(X≥1)=1-P(X=0)=1-0.998 5100≈1-0.86=0.14,故D正确.
对于A,P(B≥45)==0.001 35,故A错误;
对于B,P(B≤41)=+P(25<Z<41)=0.977 25,P(A≤48)=+P(40<Z<48)=0.977 25,故B对;
对于C,P(B≤37)=+P(29<Z<37)=0.841 35,P(A≤44)=<0.841 35,故C对;
对于D,P(A≤38)==0.001 35<0.01,故D对.
因为P(ξ<2)=0.2,P(2<ξ<6)=0.6,所以P(ξ>6)=1-0.2-0.6=0.2,即P(ξ<2)=P(ξ>6),所以μ==4.
根据正态分布的3σ原则知E(ξ)=0.003r<0.05,得r<,因为r为正整数,故r的最大值为16.
通过频数分布表估算出这50个社区这一天垃圾量的平均值=________(精确到0.1);假设该市人口数量在两万人左右的社区这一天的垃圾量大致服从正态分布N(μ,σ2),其中μ近似为样本平均值,σ2近似为样本方差s2,经计算得s=5.2.请利用正态分布知识估计这240个社区中“超标”社区的个数是________.
附:P(μ-σ<X≤μ+σ)≈0.682 7;P(μ-2σ<X≤μ+2σ)≈0.954 5;P(μ-3σ<X≤μ+3σ)≈0.997 4.
=×(5×14+6×17+9×20+12×23+8×26+6×29+4×32)=22.76≈22.8,故这50个社区这一天垃圾量的平均值约为22.8吨.
设社区一天的垃圾量为X,则P(X>28)=P(X>22.8+5.2)==0.158 65,0.158 65×240=38.076≈38,故这240个社区中“超标”社区的个数大约为38.
由X~N(55,100),知均值为55,σ=10,又P(μ-σ≤X≤μ+σ)≈0.682 7,所以P(45≤X≤65)≈0.682 7,成绩在[45,65]的人数约为30 000×0.682 7=20 481,由正态分布曲线的对称性可得P(35≤X≤75)=P(μ-2σ≤X≤μ+2σ)≈0.954 5,则P(X>75)=≈0.022 8,所以估计75分以上的人数约为30 000×0.022 8=684.
$$