内容正文:
第四章 概率与统计
章末总结
知识系统整合
规律方法收藏
学科素养培优
目录
知识系统整合
知识系统整合
4
规律方法收藏
规律方法收藏
6
规律方法收藏
7
规律方法收藏
8
规律方法收藏
9
规律方法收藏
10
规律方法收藏
11
规律方法收藏
12
学科素养培优
一、条件概率、乘法公式与全概率公式
(1)计算条件概率的两种方法:定义法、缩小样本空间法.
(2)全概率公式针对的是随机试验第一阶段的各试验结果未知,求第二阶段某一结果发生的概率.
学科素养培优
14
典例1 某地开展党史知识竞赛活动,以党支部为单位参加比赛,某党支部在5道党史题中(包含3道选择题和2道填空题)不放回地依次随机抽取2道题作答,设事件A为“第1次抽到选择题”,事件B为“第2次抽到选择题”,则P(B|A)=________.
学科素养培优
15
典例2 某同学买了7个盲盒,每个盲盒中都有一支笔,总共有4支钢笔和3支圆珠笔.
(1)依次不放回地从中取出2个盲盒,求第1次、第2次取到的都是钢笔盲盒的概率;
(2)依次不放回地从中取出2个盲盒,求第2次取到的是圆珠笔盲盒的概率.
学科素养培优
16
学科素养培优
17
学科素养培优
18
学科素养培优
19
典例3 甲、乙两名跳高运动员一次试跳2米高度成功的概率分别是0.8,0.7,且每次试跳成功与否相互之间没有影响,求:
(1)甲试跳三次,第三次才成功的概率;
(2)甲、乙两人在第一次试跳中至少有一人成功的概率;
(3)甲、乙各试跳两次,甲比乙的成功次数恰好多一次的概率.
学科素养培优
20
学科素养培优
21
学科素养培优
22
三、离散型随机变量的分布列及均值、方差
均值和方差都是随机变量的重要的数字特征,方差是建立在均值的基础之上的,它表明了随机变量所取的值相对于它的均值的集中与离散程度,二者的联系密切,现实生产生活中应用广泛.
离散型随机变量的均值与方差是概率统计知识的延伸,在实际问题特别是风险决策中有着重要意义,因此在高考中是一个热点问题.求离散型随机变量X的均值与方差的步骤:
(1)理解X的意义,写出X的取值范围;
(2)求X取每个值的概率或求出函数P(X=k);
(3)写出X的分布列;
(4)由均值的定义求出E(X);
(5)由方差的定义求出D(X).
学科素养培优
23
学科素养培优
24
学科素养培优
25
学科素养培优
26
四、正态分布
正态分布是连续型随机变量的一种分布,其在概率和统计中占有重要地位,尤其统计学中的3σ原则在生产生活中有广泛的应用.
典例5 在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似地服从正态分布N(70,100).已知成绩在90分以上的学生有12人.
(1)试问此次参赛学生的总人数约为多少?
(2)若成绩在80分以上为优,试问此次竞赛成绩为优的学生约为多少人?
学科素养培优
27
学科素养培优
28
学科素养培优
29
五、一元线性回归模型
(1)分析两个变量之间的相关关系的两种方法
①散点图法:利用样本数据画散点图,如果这些点大致分布在一条直线附近,那么就说这两个变量之间具有线性相关关系.
②相关系数法:|r|越大,说明两个变量之间的线性相关性越强,得出的回归直线方程越有价值;|r|越小,说明两个变量之间的线性相关性越弱,得出的回归直线方程越没有价值.
(2)回归方程的应用:利用回归方程可以对总体进行预测.
学科素养培优
30
典例6 随着智能手机的普及,使用手机上网成为了人们日常生活的一部分,因此很多消费者对手机流量的需求越来越大.某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包,该通信公司选了5个城市(总人口数、经济发展情况、消费能力等方面比较接近)作为试点并分别对其采用不同的定价方案,经过一个月的调查统计,发现该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如下表所示:
流量包的定价x/(元/月) 30 35 40 45 50
购买人数y/万人 18 14 10 8 5
学科素养培优
31
学科素养培优
32
学科素养培优
33
学科素养培优
34
学科素养培优
35
学科素养培优
36
学科素养培优
37
典例7 某城市网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:
单位:份
支持 不支持 总计
暴雨后 x y 50
暴雨前 20 30 50
总计 A B 100
学科素养培优
38
学科素养培优
39
学科素养培优
40
学科素养培优
41
R
1.条件概率与事件的独立性
(1)条件概率的性质
①0≤P(B|A)≤1.
②P(A|A)=1.
③如果B和C是两个互斥事件,则P((B∪C)|A)=P(B|A)+P(C|A).
(2)理解全概率公式P(A)=eq \o(∑,\s\up16(n),\s\do14(i=1))P(Bi)P(A|Bi)中化整为零的计算思想.
(3)事件的相互独立性
①设A,B为两个事件,如果P(AB)=P(A)·P(B),则称事件A与事件B相互独立.
②如果事件A与B相互独立,那么A与eq \o(B,\s\up16(-)),eq \o(A,\s\up16(-))与B,eq \o(A,\s\up16(-))与eq \o(B,\s\up16(-))也都相互独立.
③当P(B)>0时,A与B独立的充要条件是P(A|B)=P(A).
2.离散型随机变量的分布列、均值与方差
(1)分布列的性质
离散型随机变量的分布列必须满足:
①pk≥0,k=1,2,…,n;②eq \o(∑,\s\up16(n),\s\do14(k=1))pk=1.
(2)均值与方差的性质
若X与Y都是离散型随机变量,且Y=aX+b(a≠0),则①E(Y)=aE(X)+b;②D(Y)=a2D(X).
(3)两点分布与二项分布的均值与方差
①若X服从两点分布,则E(X)=p,D(X)=p(1-p).
②若X~B(n,p),则E(X)=np,D(X)=np(1-p).
(4)超几何分布的均值
若X~H(N,n,M),则E(X)=eq \f(nM,N).
3.正态分布
如果X~N(μ,σ2),那么
P(X≤μ)=P(X≥μ)=50%,
P(|X-μ|≤σ)=P(μ-σ≤X≤μ+σ)≈68.3%,
P(|X-μ|≤2σ)=P(μ-2σ≤X≤μ+2σ)≈95.4%,
P(|X-μ|≤3σ)=P(μ-3σ≤X≤μ+3σ)≈99.7%.
在实际应用中,通常认为服从于正态分布N(μ,σ2)的随机变量X只取[μ-3σ,μ+3σ]之间的值,并简称之为3σ原则.
4.一元线性回归模型
求解一元线性回归模型的一般步骤:
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出);
(2)作出散点图,确定x,y具有线性相关关系;
(3)计算eq \o(x,\s\up16(-)),eq \o(y,\s\up16(-)),eq \o(∑,\s\up16(n),\s\do14(i=1))xeq \o\al(2,i),eq \o(∑,\s\up16(n),\s\do14(i=1))xiyi;
(4)代入公式计算相关系数,确定相关性的强弱;
(5)代入公式计算eq \o(b,\s\up16(^)),eq \o(a,\s\up16(^)),写出回归直线方程eq \o(y,\s\up16(^))=eq \o(b,\s\up16(^))x+eq \o(a,\s\up16(^));
(6)利用回归直线方程进行预测.
5.独立性检验
独立性检验的一般步骤:
(1)采集数据,列2×2列联表,并检查2×2列联表中的数据是否符合要求;
(2)根据公式χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))计算出χ2的值;
(3)比较上述χ2的值与相关的临界值,作出相应的判断.
解析 解法一(定义法):P(A)=1,3)eq \f(C,Ceq \o\al(1,5))
=eq \f(3,5),P(A∩B)=1,3)eq \f(CCeq \o\al(1,2),Ceq \o\al(1,5)Ceq \o\al(1,4))
=eq \f(3,10),由条件概率公式,得P(B|A)=eq \f(P(A∩B),P(A))=eq \f(\f(3,10),\f(3,5))=eq \f(1,2).
解法二(缩小样本空间法):第1次抽到选择题后,第2次再抽1道题,其样本空间有4个样本点,满足事件B的样本点有2个,所以P(B|A)=eq \f(2,4)=eq \f(1,2).
eq \f(1,2)
解 (1)设事件Ai表示“第i次取到的是钢笔盲盒”,i=1,2.
∵P(A1)=1,4)eq \f(C,Ceq \o\al(1,7))
=eq \f(4,7),P(A2|A1)=1,3)eq \f(C,Ceq \o\al(1,6))
=eq \f(1,2),
∴P(A1A2)=P(A1)P(A2|A1)=eq \f(4,7)×eq \f(1,2)=eq \f(2,7),
即第1次、第2次取到的都是钢笔盲盒的概率为eq \f(2,7).
(2)设事件Bi表示“第i次取到的是圆珠笔盲盒”,i=1,2.
∵P(B1)=1,3)eq \f(C,Ceq \o\al(1,7))
=eq \f(3,7),
P(B2|B1)=1,2)eq \f(C,Ceq \o\al(1,6))
=eq \f(1,3),
P(B2|A1)=1,3)eq \f(C,Ceq \o\al(1,6))
=eq \f(1,2),
∴由全概率公式,可知第2次取到的是圆珠笔盲盒的概率为P(B2)=P(B1)P(B2|B1)+P(A1)P(B2|A1)=eq \f(3,7)×eq \f(1,3)+eq \f(4,7)×eq \f(1,2)=eq \f(3,7).
二、相互独立事件与独立重复试验
若A,B为相互独立事件,则eq \o(A,\s\up16(-))与B,A与eq \o(B,\s\up16(-)),eq \o(A,\s\up16(-))与eq \o(B,\s\up16(-))分别相互独立,则有P(eq \o(A,\s\up16(-))B)=P(eq \o(A,\s\up16(-)))P(B),P(Aeq \o(B,\s\up16(-)))=P(A)P(eq \o(B,\s\up16(-))),P(eq \o(A,\s\up16(-))
eq \o(B,\s\up16(-)))=P(eq \o(A,\s\up16(-)))P(eq \o(B,\s\up16(-)));若A1,A2,A3,…,An相互独立,则P(A1A2A3…An)=P(A1)P(A2)…P(An).独立重复试验是相互独立事件的特例.
解 设“甲第i次试跳成功”为事件Ai,“乙第i次试跳成功”为事件Bi,
依题意,得P(Ai)=0.8,P(Bi)=0.7,
且Ai,Bi(i=1,2,3)相互独立.
(1)“甲第三次试跳才成功”为事件eq \o(A,\s\up16(-))1eq \o(A,\s\up16(-))2A3,且三次试跳相互独立,
∴P(eq \o(A,\s\up16(-))1eq \o(A,\s\up16(-))2A3)=P(eq \o(A,\s\up16(-))1)P(eq \o(A,\s\up16(-))2)P(A3)=0.2×0.2×0.8=0.032.
故甲试跳三次,第三次试跳才成功的概率为0.032.
(2)设“甲、乙两人在第一次试跳中至少有一人成功”为事件C,则eq \o(C,\s\up16(-))=eq \o(A,\s\up16(-))1eq \o(B,\s\up16(-))1,
P(C)=1-P(eq \o(C,\s\up16(-)))=1-P(eq \o(A,\s\up16(-))1)P(eq \o(B,\s\up16(-))1)=1-0.2×0.3=0.94.
故甲、乙两人在第一次试跳中至少有一人成功的概率为0.94.
(3)设“甲在两次试跳中成功i次”为事件Mi(i=0,1,2),
“乙在两次试跳中成功i次”为事件Ni(i=0,1,2),
∵事件“甲、乙各试跳两次,甲比乙的成功次数恰好多一次”可表示为M1N0+M2N1,且M1N0,M2N1为互斥事件,
∴P(M1N0+M2N1)=P(M1N0)+P(M2N1)
=P(M1)P(N0)+P(M2)P(N1)
=Ceq \o\al(1,2)×0.8×0.2×0.32+0.82×Ceq \o\al(1,2)×0.7×0.3
=0.0288+0.2688=0.2976.
故甲、乙各试跳两次,甲比乙的成功次数恰好多一次的概率为0.2976.
典例4 某投资公司在2025年年初准备将1000万元投资到“低碳”项目上,现有两个“低碳”项目供选择.项目一:新能源汽车.据市场调研,投资到该项目上,到年底可能获利40%,也可能亏损10%,且这两种情况发生的概率分别为eq \f(3,5)和eq \f(2,5);项目二:通信设备.据市场调研,投资到该项目上,到年底可能获利50%,可能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为eq \f(3,5),eq \f(1,3),eq \f(1,15).设按“项目一”和“项目二”投资的收益分别为ξ1万元和ξ2万元.
(1)试分别写出随机变量ξ1和ξ2的分布列;
(2)针对以上两个投资项目,请你从投资收益的角度,为投资公司选择一个合理的投资项目,并说明理由.
解 (1)由题意,随机变量ξ1和ξ2的分布列分别为
ξ1
400
-100
P
eq \f(3,5)
eq \f(2,5)
ξ2
500
-300
0
P
eq \f(3,5)
eq \f(1,3)
eq \f(1,15)
(2)由(1)得,E(ξ1)=400×eq \f(3,5)+(-100)×eq \f(2,5)=200(万元),
E(ξ2)=500×eq \f(3,5)+(-300)×eq \f(1,3)+0×eq \f(1,15)=200(万元),
D(ξ1)=(400-200)2×eq \f(3,5)+(-100-200)2×eq \f(2,5)=60000,
D(ξ2)=(500-200)2×eq \f(3,5)+(-300-200)2×eq \f(1,3)+(0-200)2×eq \f(1,15)=140000,
由E(ξ1)=E(ξ2),说明项目一、项目二获利的期望值相等,但D(ξ1)<D(ξ2),说明项目一的获利更稳定,所以该投资公司投资项目一更合理.
解 (1)设参赛学生的成绩为X,
因为X~N(70,100),所以μ=70,σ=10.
则P(X>90)=P(X<50)=eq \f(1,2)[1-P(50≤X≤90)]=eq \f(1,2)[1-P(μ-2σ≤X≤μ+2σ)]≈eq \f(1,2)×(1-0.954)=0.023,12÷0.023≈522(人).
所以此次参赛学生的总人数约为522.
(2)P(X>80)=P(X<60)
=eq \f(1,2)[1-P(60≤X≤80)]
=eq \f(1,2)[1-P(μ-σ≤X≤μ+σ)]
≈eq \f(1,2)×(1-0.683)
=0.1585,
522×0.1585≈83(人).
所以此次竞赛成绩为优的学生约为83人.
(1)根据表中的数据,运用相关系数分析说明是否可以用线性回归模型描述y与x的关系?并指出它们之间是正相关还是负相关;(相关系数精确到0.01)
(2)①求出y关于x的回归直线方程;
②若该通信公司在一个类似于试点的城市中将这款流量包的价格定为25元/月,请用所求回归直线方程预测该城市一个月内购买该流量包的人数能否超过20万?
参考数据:eq \r(25000)≈158,eq \r(26000)≈161,eq \r(27000)≈164.
参考公式:r=eq \f(\o(∑,\s\up16(n),\s\do14(i=1)) (xi-\o(x,\s\up16(-)))(yi-\o(y,\s\up16(-))),\r(\o(∑,\s\up16(n),\s\do14(i=1)) (xi-\o(x,\s\up16(-)))2\o(∑,\s\up16(n),\s\do14(i=1)) (yi-\o(y,\s\up16(-)))2)),
eq \o(b,\s\up16(^))=eq \f(\o(∑,\s\up16(n),\s\do14(i=1)) (xi-\o(x,\s\up16(-)))(yi-\o(y,\s\up16(-))),\o(∑,\s\up16(n),\s\do14(i=1)) (xi-\o(x,\s\up16(-)))2),eq \o(a,\s\up16(^))=eq \o(y,\s\up16(-))-eq \o(b,\s\up16(^))
eq \o(x,\s\up16(-)).
解 (1)根据题意,得eq \o(x,\s\up16(-))=eq \f(1,5)×(30+35+40+45+50)=40,
eq \o(y,\s\up16(-))=eq \f(1,5)×(18+14+10+8+5)=11.
可列表如下:
i
1
2
3
4
5
xi-eq \o(x,\s\up16(-))
-10
-5
0
5
10
yi-eq \o(y,\s\up16(-))
7
3
-1
-3
-6
(xi-eq \o(x,\s\up16(-)))(yi-eq \o(y,\s\up16(-)))
-70
-15
0
-15
-60
根据表格和参考数据,得eq \o(∑,\s\up16(5),\s\do14(i=1)) (xi-eq \o(x,\s\up16(-)))(yi-eq \o(y,\s\up16(-)))=-160,
eq \r(\o(∑,\s\up16(5),\s\do14(i=1)) (xi-\o(x,\s\up16(-)))2\o(∑,\s\up16(5),\s\do14(i=1)) (yi-\o(y,\s\up16(-)))2)=eq \r(250×104)=eq \r(26000)≈161.
所以相关系数r=eq \f(\o(∑,\s\up16(5),\s\do14(i=1)) (xi-\o(x,\s\up16(-)))(yi-\o(y,\s\up16(-))),\r(\o(∑,\s\up16(5),\s\do14(i=1)) (xi-\o(x,\s\up16(-)))2\o(∑,\s\up16(5),\s\do14(i=1)) (yi-\o(y,\s\up16(-)))2))≈eq \f(-160,161)≈-0.99.
由于|r|≈0.99很接近1,因此可以用线性回归模型描述y与x的关系.
由于r<0,故y与x负相关.
(2)①由(1)得,eq \o(b,\s\up16(^))=eq \f(\o(∑,\s\up16(5),\s\do14(i=1)) (xi-\o(x,\s\up16(-)))(yi-\o(y,\s\up16(-))),\o(∑,\s\up16(5),\s\do14(i=1)) (xi-\o(x,\s\up16(-)))2)=eq \f(-160,250)=-0.64,
eq \o(a,\s\up16(^))=eq \o(y,\s\up16(-))-eq \o(b,\s\up16(^))
eq \o(x,\s\up16(-))=11+0.64×40=36.6,
所以y关于x的回归直线方程为eq \o(y,\s\up16(^))=-0.64x+36.6.
②由①知,当x=25时,eq \o(y,\s\up16(^))=-0.64×25+36.6=20.6,20.6>20,
故若将流量包的价格定为25元/月,预测该城市一个月内购买该流量包的人数会超过20万.
六、独立性检验
独立性检验是数据统计的一种方法,是数学中的一种基本理论,是数学体系中对数据关系进行探索的一种基本思想.判断两个随机事件是否相关可以通过独立性检验来考查,利用公式χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))计算出随机变量χ2的值,通过查表确定分位数k.若χ2≥k,说明在犯错误的概率不超过一定范围的前提下,可以认为两事件有关.
已知工作人员从所有投票中任取一个,取到“支持投入”的投票的概率为eq \f(3,5).
(1)求列联表中的数据x,y,A,B的值;
(2)绘制条形统计图,通过图形判断本次
暴雨是否影响到民众对加大修建城市地下排
水设施的投入的态度?
(3)能够有多大把握认为暴雨与民众是否
支持加大对修建城市地下排水设施的投入有关?
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
α=P(χ2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
解 (1)设“从所有投票中抽取一个,取到‘支持投入’的投票”为事件C,
由已知得P(C)=eq \f(x+20,100)=eq \f(3,5),
所以x=40,A=60,y=10,B=40.
(2)由(1)知,暴雨后支持率为eq \f(40,50)=eq \f(4,5),
不支持率为1-eq \f(4,5)=eq \f(1,5),
暴雨前支持率为eq \f(20,50)=eq \f(2,5),
不支持率为1-eq \f(2,5)=eq \f(3,5).
条形统计图如图所示,
由图可以,看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度.
(3)χ2=eq \f(100×(40×30-10×20)2,50×50×60×40)=eq \f(50,3)≈16.7>10.828,
故至少有99.9%的把握认为暴雨与民众是否支持加大对修建城市地下排水设施的投入有关.
$