内容正文:
第8章 概率
章末知识点总结提升
网络构建·知识导图
要点归纳·典例提升
要点一 条件概率、全概率公式与贝叶斯公式
1.求条件概率有两种方法:一种是基于样本空间Ω,先计算P(A)和P(AB),再利用P(B|A)=求解;另一种是缩小样本空间,即以A为样本空间计算AB的概率.
2.由条件概率公式可得乘法公式P(AB)=P(A)P(B|A).
3.全概率公式:若事件A1,A2,…,An两两互斥,且它们的和Ai=Ω,且P(Ai)>0,i=1,2,…,n,则对于Ω中的任何事件B,有P(B)=P(Ai)P(B|Ai).
【典例1】 有完全相同的甲、乙两个袋子,袋子有大小、形状完全相同的小球,其中甲袋中有9个红球和1个白球;乙袋中有2个红球和8个白球.从这两个袋子中选择一个袋子,再从该袋子中等可能摸出一个球.假设试验选到甲袋或乙袋的概率都是.
(1)求从袋子中摸出红球的概率;
(2)求在摸出白球的条件下,该球来自甲袋的概率.
解 (1)设试验一次,“取到甲袋”为事件A1,“取到乙袋”为事件A2,“试验结果为红球”为事件B1,“试验结果为白球”为事件B2,因为P(A1)=P(A2)=,P(B1|A1)=,P(B1|A2)=,所以P(B1)=P(A1)P(B1|A1)+P(A2)P(B1|A2)=,所以从袋子中摸出红球的概率为.
(2)因为B1,B2是对立事件,
所以P(B2)=1-P(B1)=,
又P(B2|A1)=,
所以P(A1|B2)=,所以在摸出白球的条件下,该球来自甲袋的概率为.
题后反思 第(1)问考查了全概率公式,体现了化整为零的计算思想;第(2)问考查的是贝叶斯公式.虽然该公式不要求,但由于贝叶斯公式的本质是两个条件概率的关系,所以可以从条件概率(或乘法公式)的角度进行考查.
跟踪训练1 已知甲、乙两名大学生每天上午、下午都进行体育锻炼,近50天选择体育锻炼项目情况统计如下:
体育锻炼项目情
况(上午,下午) (足球,
足球) (足球,
羽毛球) (羽毛球,
足球) (羽毛球,
羽毛球)
甲 20天 10天
乙 10天 10天 5天 25天
假设甲、乙上午、下午选择锻炼的项目相互独立,用频率估计概率.
(1)已知甲上午选择足球的条件下,下午仍选择足球的概率为,请将表格内容补充完整;(写出计算过程)
(2)已知在这50天中上午室外温度在20度以下的概率为,并且当上午的室外温度低于20度时,甲去打羽毛球的概率为,若已知某天上午甲去打羽毛球,求这一天上午室外温度在20度以下的概率.
解 (1)设事件C为“甲上午选择足球”,事件D为“甲下午选择足球”,设甲一天中锻炼情况为(足球,羽毛球)的天数为x,则P(D|C)=,解得x=15,
所以甲一天中锻炼情况为(羽毛球,足球)的天数为50-20-10-15=5.补充表格如下.
体育锻炼项目的
情况(上午,下午) (足球,
足球) (足球,
羽毛球) (羽毛球,
足球) (羽毛球,
羽毛球)
甲 20天 15天 5天 10天
乙 10天 10天 5天 25天
(2)记事件A为“上午室外温度在20度以下”,事件B为“甲上午打羽毛球”,由题意知P(A)=,P(B)=,P(B|A)=,P(A|B)=.故若某天上午甲去打羽毛球,则这一天上午室外温度在20度以下的概率为.
跟踪训练2 有甲、乙两只不透明的袋子,其中甲袋放有3个红球,2个白球,乙袋放有2个红球,3个白球,且所有球的大小和质地均相同.
(1)先随机取一只袋子,再从该袋中随机取1个球,求取出的该球是白球的概率;
(2)先从甲袋中任取2个球放入乙袋中,再从乙袋中任取2个球,求从乙袋中取出的2个球均为红球的概率.
解 (1)先随机取一只袋子,记“取到的是甲袋”为事件A1,“取到的是乙袋”为事件A2,再从袋中随机取1个球,“取出的该球是白球”为事件B,则事件B有两类:取到的是甲袋且从中取出的是白球,取到的是乙袋且从中取出的是白球,即B=A1B+A2B,因为A1B与A2B互斥,所以P(B)=P(A1B+A2B)=P(A1B)+P(A2B),由概率的乘法公式得P(B)=P(A1)P(B|A1)+P(A2)P(B|A2),又因为P(A1)=,P(B|A1)=,P(A2)=,P(B|A2)=,
所以P(B)=,故先随机取一只袋子,再从该袋中随机取1个球,取出的该球是白球的概率为.
(2)记“从甲袋中取出2个红球”为事件C1,“从甲袋中取出2个白球”为事件C2,“从甲袋中取出1个红球和1个白球”为事件C3,“从乙袋中取出的2个球均为红球”为事件D,显然,事件C1,C2,C3两两互斥,且C1+C2+C3正好为“从甲袋中任取2个球”的样本空间Ω,由全概率公式得P(D)=P(Ci)P(D|Ci)=,故从乙袋中取出的2个球均为红球的概率为.
要点二 离散型随机变量的分布列、均值和方差
角度1分布列、均值和方差的计算
1.分布列表示概率在所有的可能发生的情况中的分布,也是指随机变量X的所有可能取值及其对应的概率所组成的表格.分布列通常与排列、组合、频率分布直方图、互斥事件或独立事件有关,无论怎样,都要先求出概率,再求出分布列.
2.E(X)=x1p1+x2p2+…+xipi+…+xnpn是随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.称D(X)=(xi-E(X))2pi为随机变量X的方差,并称其算术平方根为随机变量X的标准差.(xi-E(X))2描述了xi(i=1,2,…,n)相对于均值E(X)的偏离程度,而D(X)是上述偏离程度的加权平均,刻画了随机变量X与其均值E(X)的平均偏离程度.
【典例2】 一只蚂蚁位于数轴x=0处,这只蚂蚁每隔一秒钟向左或向右移动一个单位长度,设它向右移动的概率为,向左移动的概率为.
(1)已知蚂蚁2秒后所在位置对应的实数为非负数,求2秒后这只蚂蚁在x=0处的概率;
(2)记蚂蚁4秒后所在位置对应的实数为X,求X的分布列与期望.
解 (1)记蚂蚁2秒后所在位置对应的实数为非负数为事件A,记2秒后这只蚂蚁在x=0处的概率为事件B,则P(A)=, P(AB)=P(B)=,
故所求的概率为P(B|A)=.
(2)由题意知X可能的取值为-4,-2,0,2,4,
则P(X=-4)=,P(X=-2)=, P(X=0)=,P(X=2)=, P(X=4)=,则X的分布列为
X -4 -2 0 2 4
P
E(X)=-4×-2×+0×+2×+4×.
规律方法 求离散型随机变量的分布列及数字特征,关键是找出随机变量X的所有可能取值,并明确每一个取值所表示的意义,然后进行相应的计算即可.其一般步骤为:
(1)根据题中条件确定随机变量的可能取值;
(2)求出随机变量所有可能取值对应的概率,即可得出分布列;
(3)根据期望的概念,结合分布列,即可得出期望.
跟踪训练3 甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
解 (1)甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,可以得到乙学校每场比赛获胜的概率分别为0.5,0.6,0.2.
甲学校要获得冠军,需要在3场比赛中至少获胜2场,
①甲学校3场全胜,概率为P1=0.5×0.4×0.8=0.16,
②甲学校获胜2场败1场,概率为P2=0.5×0.4×0.2+0.5×0.6×0.8+0.5×0.4×0.8=0.44,
所以甲学校获得冠军的概率为P=P1+P2=0.6.
(2)乙学校的总得分X的可能取值为0,10,20,30,其概率分别为P(X=0)=0.5×0.4×0.8=0.16,P(X=10)=0.5×0.4×0.2+0.5×0.6×0.8+0.5×0.4×0.8=0.44,P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2
=0.34,P(X=30)=0.5×0.6×0.2=0.06,则X的分布列为
X 0 10 20 30
P 0.16 0.44 0.34 0.06
X的期望E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.
角度2二项分布与超几何分布
超几何分布与二项分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.
一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件{X=k}发生的概率为P(X=k)=(k=0,1,2,…,m),其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*,称X服从超几何分布.
一般地,在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则P(X=k)=pk(1-p)n-k,k=0,1,2,…,n.此时称随机变量X服从二项分布,记作X~B(n,p),并称p为成功概率.此时有E(X)=np,D(X)=np(1-p).
【典例3】 某校高一年级举行数学史知识竞赛,每个同学从10道题中一次性抽出4道作答.小张有7道题能答对,3道不能答对;小王每道题答对的概率均为p(0<p<1),且每道题答对与否互不影响.
(1)分别求小张、小王答对题目数的分布列;
(2)若预测小张答对题目数多于小王答对题目数,求p的取值范围.
解 (1)设小张答对的题目数为X,可知随机变量X服从超几何分布,X的可能取值分别为1,2,3,4.
有P(X=1)=,P(X=2)=,P(X=3)=,P(X=4)=,
故小张答对的题目数X的分布列为
X 1 2 3 4
P
设小王答对的题目数为Y,可知随机变量Y服从二项分布Y~B(4,p),Y的可能取值分别为0,1,2,3,4,有P(Y=0)=(1-p)4,P(Y=1)=(1-p)3p=4p(1-p)3, P(Y=2)=(1-p)2p2=6p2(1-p)2,P(Y=3)=(1-p)p3=4p3(1-p),P(Y=4)=p4.故小王答对的题目数Y的分布列为
Y 0 1 2 3 4
P (1-p)4 4p(1-p)3 6p2(1-p)2 4p3(1-p) p4
(2)由(1)可知E(X)=1×+2×+3×+4×,而Y~B(4,p),所以E(Y)=4p,若预测小张答对的题目数多于小王答对的题目数,则E(X)>E(Y),即>4p,可得0<p<.
规律方法 二项分布的本质是放回抽样问题,在每次试验中某一事件发生的概率是相同的;超几何分布的本质是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.超几何分布需要知道总体的容量,而二项分布不需要.
跟踪训练4 某种产品按照产品质量标准分为一等品、二等品、三等品、四等品四个等级,某采购商从采购的该种产品中随机抽取100件,根据产品的等级分类得到如下数据:
等级 一等品 二等品 三等品 四等品
数量 40 30 10 20
(1)根据产品等级,按分层抽样的方法从这100件产品中抽取10件,再从这10件产品中随机抽取3件,记这3件产品中一等品的数量为X,求X的分布列及数学期望;
(2)若将频率视为概率,从采购的产品中有放回地随机抽取3件产品,求恰好有1件四等品的概率;
(3)生产商提供该产品的两种销售方案供采购商选择,
方案一:产品不分类,售价均为21元/件.
方案二:分类卖出,分类后的产品售价如下:
等级 一等品 二等品 三等品 四等品
售价/(元/件) 24 22 18 16
从采购商的角度考虑,你觉得应该选择哪种销售方案?请说明理由.
解 (1)由题可得,抽取的10件产品中,一等品有4件,非一等品有6件,所以X的可能取值为0,1,2,3.
P(X=0)=,P(X=1)=,P(X=2)=,P(X=3)=,
则X的分布列为
X 0 1 2 3
P
E(X)=0×+1×+2×+3×.
(2)从采购的产品中有放回地随机抽取3件产品,记抽到四等品的数量为Y,则Y~B(3,),
所以P(Y=1)=×()2=.
(3)由题意得,方案二的产品的平均售价为24×+22×+18×+16×=21.2(元/件),因为21<21.2,所以从采购商的角度考虑,应该选择方案一.
角度3数学期望与方差在实际生活中的应用
离散型随机变量的数学期望反映的是随机变量取值的平均水平,而方差则是反映随机变量取值在其平均值附近的离散程度.在实际生活中,越来越多的决策需要应用数学期望与方差来对事件发生大小的可能性和稳定性进行评估,通过计算分析可以比较科学地得出各个方案的预期效果及出现偏差的大小,从而决定要选择的最佳方案.
【典例4】 在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉,系统就能正常工作.设三台设备的可靠度均为r(0<r<1),它们之间相互不影响.
(1)要使系统的可靠度不低于0.992,求r的最小值.
(2)当r=0.7时,求能使系统正常工作的设备数X的分布列.
(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可给该产业园带来约50万的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:
方案1,更换部分设备的硬件,使得每台设备的可靠度维持在0.8,更换设备硬件总费用为0.8万元;
方案2,花费0.5万元增加一台可靠度是0.7的备用设备,达到“一用三备”.
请从经济损失期望最小的角度判断决策部门该如何决策?并说明理由.
解 (1)要使系统的可靠度不低于0.992,设能正常工作的设备数为X,则P(X≥1)=1-P(X<1)=1-P(X=0)=1-(1-r)3≥0.992,解得r≥0.8,故r的最小值为0.8.
(2)设X为正常工作的设备数,由题意可知,X~B(3,0.7),
P(X=0)=×0.70×(1-0.7)3=0.027,P(X=1)=×0.71×(1-0.7)2=0.189,P(X=2)=×0.72×(1-0.7)1=0.441,P(X=3)=×0.73×(1-0.7)0=0.343,
所以X的分布列为
X 0 1 2 3
P 0.027 0.189 0.441 0.343
(3)设方案1、方案2的总损失分别为X1,X2,采用方案1,更换部分设备的硬件,使得每台设备的可靠度维持在0.8,可知计算机网络断掉的概率为×0.80×(1-0.8)3=0.008,
故E(X1)=0.8+0.008×50=1.2(万元).
采用方案2,花费0.5万元增加一台可靠度是0.7的备用设备,达到“一用三备”,计算机网络断掉的概率为×0.70×(1-0.7)4=0.008 1,故E(X2)=0.5+0.008 1×50=0.905(万元).
因此,从经济损失期望最小的角度,决策部门应选择方案2.
规律方法 利用随机变量的均值与方差可以帮助我们作出科学的决策,其中随机变量X的均值的意义在于描述随机变量的平均程度,而方差则描述了随机变量稳定与波动或集中与分散的状况,品种的优劣、仪器的好坏、预报的准确与否、机器的性能好坏等很多指标都与这两个特征量有关.(1)若我们希望实际的平均水平较理想时,则先求随机变量X1,X2的均值.当E(X1)=E(X2)时,不应误认为它们一样好,还需要用D(X1),D(X2)来比较这两个随机变量的偏离程度.(2)若我们希望比较稳定时,应先考虑方差,再考虑均值是否相等或者接近.
跟踪训练5 某校为了庆祝建校100周年,举行校园文化知识竞赛.某班经过层层选拔,还有最后一个参赛名额要在甲、乙两名学生中产生,该班设计了一个选拔方案:甲、乙两名学生各自从6个问题中随机抽取3个问题作答.已知这6个问题中,学生甲能正确回答其中的4个问题,而学生乙能正确回答每个问题的概率均为.甲、乙两名学生对每个问题回答正确与否都是相互独立的.
(1)分别求甲、乙两名学生恰好答对2个问题的概率;
(2)设甲答对的题数为X,乙答对的题数为Y,若让你投票决定参赛选手,你会选择哪名学生?请说明理由.
解 (1)由题意,知甲恰好答对2个问题的概率为P1=,乙恰好答对2个问题的概率为P2=.
(2)X的可能取值为1,2,3,则P(X=1)=,P(X=2)=, P(X=3)=,所以E(X)=1×+2×+3×=2,D(X)=(1-2)2×+(2-2)2 ×+(3-2)2×.易知Y~B(3,),所以E(Y)=3×,D(Y)=3××(1-)=.因为E(X)>E(Y)且D(X)<D(Y),甲的平均水平更好,也比乙更稳定,所以选择学生甲.
要点三 正态分布的实际应用
解决正态分布问题有三个关键点:(1)对称轴x=μ;(2)标准差σ;(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率.注意在标准正态分布下对称轴为x=0.
【典例5】 已知某高校共有10 000名学生,其图书馆阅览室共有994个座位,假设学生是否去自习是相互独立的,且每个学生在每天的晚自习时间去阅览室自习的概率均为0.1.
(1)将每天的晚自习时间去阅览室自习的学生人数记为X,求X的期望和方差;
(2)18世纪30年代,数学家棣莫弗发现,当n比较大时,二项分布可视为正态分布.此外,如果随机变量Y~N(μ,σ2),令Z=,则Z~N(0,1).当Z~N(0,1)时,对于任意实数a,记Φ(a)=P(Z<a).已知下表为标准正态分布表(节选),该表用于查询标准正态分布N(0,1)对应的概率值.例如当a=0.16时,由于0.16=0.1+0.06,则先在表的最左列找到数字0.1(位于第三行),然后在表的最上行找到数字0.06(位于第八列),则表中位于第三行第八列的数字0.563 6便是Φ(0.16)的值.
a 0.00 0.01 0.02 0.03 0.04
0.0 0.500 0 0.504 0 0.508 0 0.512 0 0.516 0
0.1 0.539 8 0.543 8 0.547 8 0.551 7 0.555 7
0.2 0.579 3 0.583 2 0.587 1 0.591 0 0.594 8
0.3 0.617 9 0.621 7 0.625 5 0.629 3 0.633 1
0.4 0.655 4 0.659 1 0.662 8 0.666 4 0.670 0
0.5 0.691 5 0.695 0 0.698 5 0.701 9 0.705 4
a 0.05 0.06 0.07 0.08 0.09
0.0 0.519 9 0.523 9 0.527 9 0.531 9 0.535 9
0.1 0.559 6 0.563 6 0.567 5 0.571 4 0.575 3
0.2 0.598 7 0.602 6 0.606 4 0.610 3 0.614 1
0.3 0.636 8 0.640 6 0.644 3 0.648 0 0.651 7
0.4 0.673 6 0.677 2 0.680 8 0.684 4 0.687 9
0.5 0.708 8 0.712 3 0.715 7 0.719 0 0.722 4
①求在晚自习时间阅览室座位不够用的概率;
②若要使在晚自习时间阅览室座位够用的概率高于0.7,则至少需要添加多少个座位?
解 (1)由题意可得,随机变量X服从二项分布,则
E(X)=np=10 000×0.1=1 000,
D(X)=np(1-p)=10 000×0.1×0.9=900.
(2)①由于(1)中二项分布的n值较大,故可以认为随机变量X服从正态分布,由(1)可得,μ=1 000,σ=30,可得X~N(1 000,900),则~N(0,1),则P(X<994)=P(<-0.2)=Φ(-0.2),由标准正态分布性质可得,Φ(-0.2)
=1-Φ(0.2),故P(X<994)=1-Φ(0.2),故P(X≥994)=1-P(X<994)=Φ(0.2)=0.579 3,在晚自习时间阅览室座位不够用的概率为0.579 3.
②查表可得,Φ(0.53)=0.701 9,则P(<0.53)=0.701 9,即P(X<1 015.9) =0.701 9,又P(X<1 015)=P(<0.5)=Φ(0.5)=0.691 5<0.7,故座位数至少要1 016个,1 016-994=22,故阅览室至少需要添加22个座位.
规律方法 利用服从正态分布N(μ,σ2)的随机变量X取值落在某个特殊区间内的概率,可以解决两类实际问题:一类是估计在某一范围内的数量.具体方法是先确定随机变量的取值在该范围内的概率,再乘样本容量即可;另一类是利用3σ原则作决策.决策步骤如下,①确定一次试验中取值a是否落入范围(μ-3σ,μ+3σ);②作出判断,若a∈(μ-3σ,μ+3σ),则接受统计假设,若a∉(μ-3σ,μ+3σ),则拒绝统计假设.
跟踪训练6 红松树分布在我国东北的小兴安岭到长白山一带,耐荫性强.在一森林公园内种有一大批红松树,为了研究生长了4年的红松树的生长状况,从中随机选取了12棵生长了4年的红松树,并测量了它们的树干直径xi(单位:cm),如下表:
i 1 2 3 4 5 6
xi 28.7 27.2 31.5 35.8 24.3 33.5
i 7 8 9 10 11 12
xi 36.3 26.7 28.9 27.4 25.2 34.5
计算得xi=360,=10 992.
(1)求这12棵红松树的树干直径的样本均值μ与样本方差s2.
(2)假设生长了4年的红松树的树干直径近似服从正态分布.
记事件A:在森林公园内再从中随机选取12棵生长了4年的红松树,其树干直径都位于区间[22,38].
①用(1)中所求的样本均值与样本方差分别作为正态分布的均值与方差,求P(A);
②护林员在做数据统计时,得出了如下结论:生长了4年的红松树的树干直径近似服从正态分布N(30,82).在这个条件下,求P(A),并判断护林员的结论是否正确,说明理由.
参考公式:若Y~N(μ,σ2),则P(|Y-μ|≤σ)≈0.682 7,P(|Y-μ|≤2σ)≈0.954 5,P(|Y-μ|≤3σ)≈0.997 4.
参考数据:0.682 712≈0.01,0.954 512≈0.57,0.997 412≈0.97.
解 (1)样本均值μ=xi=30,样本方差s2=-2μxi+12μ2)=×(10 992-2×30×360+12×302)=16.
(2)①由题意可得,树干直径Y(单位:cm)近似服从正态分布N(30,42).在森林公园内再随机选一棵生长了4年的红松树,其树干直径位于区间[22,38]的概率是0.954 5,
所以P(A)=0.954 512≈0.57.
②若树干直径Y近似服从正态分布N(30,82),在森林公园内再随机选一棵生长了4年的红松树,其树干直径位于区间[22,38]的概率是0.682 7,则P(A)=0.682 712≈0.01.此时事件A发生的概率远小于①中根据测量结果得出的概率估计值.事件A是一个小概率事件,但是第一次随机选取的12棵生长了4年的红松树,事件A发生了,所以认为护林员给出的结论是错误的.
高考链接
1.(多选题)(2024新高考Ⅰ)为了解某种植区推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值=2.1,样本方差s2=0.01.已知该种植区以往的亩收入X服从正态分布N(1.8,0.12),假设推动出口后的亩收入Y服从正态分布N(,s2),则( )
(若随机变量Z服从正态分布N(μ,σ2),则P(Z<μ+σ)≈0.841 3)
A.P(X>2)>0.2 B.P(X>2)<0.5
C.P(Y>2)>0.5 D.P(Y>2)<0.8
BC
解析 由题意知,X~N(1.8,0.12),Y~N(2.1,0.12).
∵P(X<1.8+0.1)≈0.841 3,
∴P(X>1.8+0.1)≈1-0.841 3=0.158 7.
∴P(X>2)=P(X>1.8+2×0.1)<P(X>1.8+0.1)≈0.158 7,
∴A错误.P(X>2)<P(X>1.8)=0.5,∴B正确.
∵P(Y>2)=P(Y>2.1-0.1)=P(Y<2.1+0.1)≈0.841 3,
∴C正确,D错误.故选BC.
2.(2024北京)已知某险种的保费为0.4万元,前3次出险每次赔付0.8万元,第4次赔付0.6万元.
赔偿次数 0 1 2 3 4
单数 800 100 60 30 10
在总体中抽样1 000单,以频率估计概率:
(1)求随机抽取一单,赔偿不少于2次的概率;
(2)(ⅰ)毛利润是保费与赔偿金额之差.设毛利润为X,估计X的数学期望;
(ⅱ)若未赔偿过的保单下一保险期的保费下降4%,已赔偿过的增加20%.估计保单下一保险期毛利润的数学期望.
解 (1)设A为“随机抽取一单,赔偿不少于2次”,
则P(A)=.
(2)(ⅰ)设ξ为赔偿金额,则ξ可取0,0.8,1.6,2.4,3.
由题意可得P(ξ=0)=,P(ξ=0.8)=,
P(ξ=1.6)=,P(ξ=2.4)=,P(ξ=3)=.
∴E(ξ)=0×+0.8×+1.6×+2.4×+3×=0.278.故E(X)=0.4-0.278=0.122(万元).
(ⅱ)由题设可知每一单保费变为0.4××96%+0.4××1.2=0.403 2,设保单下一保险期毛利润为Y,则E(Y)=0.403 2-E(ξ)=0.125 2(万元).
$