内容正文:
第6节 离散型随机变量的分布列和数字特征
第十章 计数原理、概率、随机变量及其分布
1.了解取有限个值的离散型随机变量及其分布列的概念.
2.理解并会求离散型随机变量的数字特征.
课标要求
1.离散型随机变量
一般地,对于随机试验样本空间Ω中的每个样本点ω,都有__________________与之对应,我们称X为随机变量.
可能取值为有限个或可以一一列举的随机变量称为离散型随机变量.
唯一的实数X(ω)
3
2.离散型随机变量的分布列
一般地,设离散型随机变量X的可能取值为x1,x2,…,xn,我们称X取每一个值xi的概率P(X=xi)=_________(i=1,2,…,n)为X的概率分布列,简称分布列.
3.离散型随机变量的分布列的性质
(1)pi≥0(i=1,2,…,n);
(2)________________________=1.
pi
p1+p2+…+pn
4
4.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X x1 x2 … xi … xn
P p1 p2 … pi … pn
(1)均值
E(X)=_________________________=xipi为随机变量X的均值或数学期望.它反映了离散型随机变量取值的____________.
x1p1+x2p2+…+xipi+…+xnpn
平均水平
5
(2)方差
D(X)=(x1-E(X))2p1+(x2-E(X))2p2+…+(xn-E(X))2pn=_________________为随机变
量X的方差,并称__________为随机变量X的标准差,记为σ(X),它们都可以度量随机变量取值与其均值的__________.
(3)均值与方差的性质
①E(aX+b)=_____________.
②D(aX+b)=____________ (a,b为常数).
(xi-E(X))2pi
偏离程度
aE(X)+b
a2D(X)
6
5.两点分布
(1)定义:对于只有两个可能结果的随机试验,用A表示“成功”,表示“失败”,定义X=如果P(A)=p,则P()=1-p,那么X的分布列如表所示,
X 0 1
P 1-p p
称随机变量X服从两点分布或0-1分布.
(2)均值与方差
若随机变量X服从两点分布,则E(X)=p,D(X)=p(1-p).
7
常用结论与微点提醒
1.E(b)=b,D(b)=0,b为常数(即常数的均值是这个常数本身,常数的方差为零).
2.设X1,X2是两个随机变量,则E(X1+X2)=E(X1)+E(X2);若X1,X2相互独立,则E(X1X2)=E(X1)E(X2).
3.D(X)=E(X2)-(E(X))2.
8
1.思考辨析(在括号内打“√”或“×”)
(1)离散型随机变量的分布列中,随机变量取各个值的概率之和可以小于1.( )
(2)若随机变量X的均值E(X)=2,则E(2X)=2.( )
对于(1),离散型随机变量所有取值的并事件是必然事件,
故各个概率之和等于1,故不正确.
(2)E(2X)=2E(X)=2×2=4.
诊断自测 概念思考辨析+教材经典改编
×
×
9
(3)两点分布中P(X=0)+P(X=1)=1.( )
(4)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量的平均程度越小.( )
√
√
10
2.(苏教选修二P112T2原题)下列结论中,正确的是( )
A.随机事件的个数与随机变量一一对应
B.随机变量与区间一一对应
C.随机变量的取值是实数
D.随机变量与自然数一一对应
C
对于A,随机事件可由随机变量的值来表示,但不能说随机事件的个数与随机变量一一对应;
对于B,并不是所有的随机变量的取值都是一个区间,比如离散型随机变量的取值就是一些孤立的数;
对于D,随机变量的取值并不一定是自然数,也可能是分数或无理数,故选C.
11
3.(北师大选修一P202T4改编)已知随机变量ξ的分布列如表:
ξ 0 1 2
P a
设F(x)=P(ξ≤x),则当x∈[1,2)时,F(x)的值为____________.
法一 由a+=1得a=,F(x)=P(ξ≤x)=P(ξ=0)+P(ξ=1)=.
法二 由F(x)=P(ξ≤x)=P(ξ=0)+P(ξ=1)=1-P(ξ=2)=1-.
12
4.(人教A选修三P71T3改编)随机变量X的分布列为P(X=0)=0.2,P(X=1)=a,P(X=2)=b.若E(X)=1,则a=____________,b=____________.
0.6
由题意知,分布列为
0.2
X 0 1 2
P 0.2 a b
则
解得a=0.6,b=0.2.
13
例1 (1)(多选)(2026·丽水调研)已知随机变量X的分布列如表(其中a为常数):
ABD
考点一 分布列的性质
X 0 1 2 3 4
P 0.1 0.2 0.4 0.2 a
则下列计算结果正确的是( )
A.a=0.1 B.P(X≤2)=0.7
C.P(X≥3)=0.4 D.P(X≤1)=0.3
因为0.1+0.2+0.4+0.2+a=1,
解得a=0.1,故A正确;
由分布列知P(X≤2)=P(X=0)+P(X=1)+P(X=2)=0.1+0.2+0.4=0.7,故B正确;
P(X≥3)=P(X=3)+P(X=4)=0.2+0.1=0.3,故C错误;
P(X≤1)=P(X=0)+P(X=1)=0.1+0.2=0.3,故D正确.
(2)离散型随机变量X的概率分布规律为P(X=n)=(n=1,2,3,4),其中a是常数,则P=( )
A. B. C. D.
D
因为P(X=n)=(n=1,2,3,4),
所以=1,即a=,
所以P=P(X=1)+P(X=2)=××.
感悟提升
离散型随机变量分布列的性质的应用
(1)利用“概率之和为1”可以求相关参数的值.
(2)利用“在某个范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率.
(3)可以根据性质判断所得分布列结果是否正确.
训练1 (1)设随机变量X的分布列为P(X=k)=(k=1,2,3,4,5),则P(X≥4)等于( )
A. B. C. D.
A
P(X=k)==,
∵P(X=k)=1,∴×
=×=1.
则m=,∴P(X≥4)=×.
(2)(2026·佛山调研)设随机变量ξ的分布列如表:
ξ 1 2 3 4 5 6
P a1 a2 a3 a4 a5 a6
其中a1,a2,…,a6构成等差数列,则a1+a6=____________.
因为a1,a2,…,a6构成等差数列,
所以a1+a6=a2+a5=a3+a4,
又a1+a2+a3+a4+a5+a6=1,
所以a1+a6=.
例2 (2022·全国甲卷)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
考点二 离散型随机变量的分布列及数字特征
设甲在三个项目中获胜的事件依次记为A,B,C,
所以甲学校获得冠军的概率为P=P(ABC)+P(BC)+P(AC)+P(AB)
=0.5×0.4×0.8+(1-0.5)×0.4×0.8+0.5×(1-0.4)×0.8+0.5×0.4×(1-0.8)
=0.16+0.16+0.24+0.04=0.6.
(2)用X表示乙学校的总得分,求X的分布列与期望.
依题可知,X的可能取值为0,10,20,30,
所以P(X=0)=0.5×0.4×0.8=0.16,
P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,
P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,
P(X=30)=0.5×0.6×0.2=0.06.
则X的分布列为
X 0 10 20 30
P 0.16 0.44 0.34 0.06
E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.
感悟提升
求离散型随机变量的均值与方差的步骤
(1)理解离散型随机变量X的意义,写出X的所有可能取值;
(2)求X取每个值的概率;
(3)写出X的分布列;
(4)运用均值与方差公式进行计算.
训练2 (1)(2026·南充诊断)已知随机变量X的分布列如表,且n-m=0.2,则E(3X+2)=____________.
8
由题意得m+n=1-0.1-0.2=0.7,
又n-m=0.2,所以n=0.45,m=0.25,
则E(X)=0×0.1+1×0.25+2×0.2+3×0.45=2,
所以E(3X+2)=3×2+2=8.
X 0 1 2 3
P 0.1 m 0.2 n
(2)(2025·新高考Ⅰ卷)有5个相同的球,分别标有数字1,2,3,4,5,从中有放回地随机取3次,每次取1个球.记X为这5个球中至少被取出1次的球的个数,则
X的数学期望E(X)=____________.
X的所有可能取值为1,2,3,
则P(X=1)=,
P(X=2)=×6=,
P(X=3)=××6=,
所以X的分布列为
X 1 2 3
P
所以E(X)=1×+2×+3×.
(3)编号为1,2,3的三位学生随意入座编号为1,2,3的三个座位,每位学生坐一个座位,设与座位编号相同的学生的人数是ξ,则E(ξ)=____,D(ξ)=______.
1
1
ξ的所有可能取值为0,1,3,ξ=0表示三位同学全坐错了,有2种情况,即编号为1,2,3的座位上分别坐了编号为2,3,1或3,1,2的学生,
则P(ξ=0)=;
ξ=1表示三位同学只有1位同学坐对了,
则P(ξ=1)=;
ξ=3表示三位同学全坐对了,即对号入座,
则P(ξ=3)=.所以ξ的分布列为
ξ 0 1 3
P
E(ξ)=0×+1×+3×=1.
D(ξ)=×(0-1)2+×(1-1)2+×(3-1)2=1.
例3 (2024·新高考Ⅱ卷)某投篮比赛分为两个阶段,每个参赛队由两名队员组成.比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中1次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分,该队的比赛成绩为第二阶段的得分总和.
某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若p=0.4,q=0.5,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率;
考点三 均值与方差中的决策问题
设A1=“甲、乙所在队进入第二阶段”,则P(A1)=1-(1-0.4)3=0.784.
设A2=“乙在第二阶段至少得5分”,则P(A2)=1-(1-0.5)3=0.875.
设A3=“甲、乙所在队的比赛成绩不少于5分”,则P(A3)=P(A1)·P(A2)=0.686.
(2)假设0<p<q.
①为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?
②为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
①设甲参加第一阶段比赛时甲、乙所在队得15分的概率为P甲,
则P甲=[1-(1-p)3]·q3=pq3·(3-3p+p2).
设乙参加第一阶段比赛时甲、乙所在队得15分的概率为P乙,
同理:P乙=qp3(3-3q+q2),
则P甲-P乙=pq(3q2-3pq2+p2q2-3p2+3p2q-p2q2)=3pq(q-p)(p+q-pq),
由0<p<q≤1,
得q-p>0,p+q-pq=p+q(1-p)>0,
所以P甲-P乙>0,即P甲>P乙,
故应该由甲参加第一阶段比赛.
②若甲参加第一阶段比赛,则甲、乙所在队的比赛成绩X的所有可能取值为0,5,10,15.
P(X=0)=(1-p)3+[1-(1-p)3]·(1-q)3,
P(X=5)=[1-(1-p)3]··q·(1-q)2,
P(X=10)=[1-(1-p)3]··q2·(1-q),P(X=15)=[1-(1-p)3]·q3,
所以E(X)=[1-(1-p)3]·[15q(1-q)2+30q2(1-q)+15q3]=[1-(1-p)3]·15q=15pq(p2-3p+3).
若乙参加第一阶段比赛,则甲、乙所在队的比赛成绩Y的所有可能取值为0,5,10,15.
同理,可得E(Y)=15pq(q2-3q+3).
E(X)-E(Y)=15pq(p2-3p-q2+3q)=15pq·(q-p)(3-p-q),
由0<p<q≤1,得p-q>0,3-p-q=3-(p+q)>0,所以E(X)-E(Y)>0,
即E(X)>E(Y),故应该由甲参加第一阶段比赛.
感悟提升
随机变量的均值和方差从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.
训练3 某投资公司准备在2027年年初将1 000万元投资到“低碳”项目上,现有两个项目供选择:
项目一:新能源汽车.据市场调研,投资到该项目上,到年底可能获利30%,也可能亏损15%,且这两种情况发生的概率分别为和;
项目二:通信设备.据市场调研,投资到该项目上,到年底可能获利50%,可能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为和.
针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由.
若按“项目一”投资,设获利为X1万元,X1的所有可能取值为300,-150.则X1的分布列为
X1 300 -150
P
∴E(X1)=300×+(-150)×=200(万元).
若按“项目二”投资,设获利X2万元,X2的所有可能取值为500,-300,0.
则X2的分布列为:
X2 500 -300 0
P
∴E(X2)=500×+(-300)×+0×=200(万元).
D(X1)=(300-200)2×+(-150-200)2×=35 000,
D(X2)=(500-200)2×+(-300-200)2×+(0-200)2×=140 000.
∴E(X1)=E(X2),D(X1)<D(X2),
这说明虽然项目一、项目二获利的期望值相等,但项目一更稳妥.
综上所述,建议该投资公司选择项目一投资.
一、单选题
1.已知下列随机变量:
①10件产品中有2件次品,从中任选3件,取到次品的件数X;②一位射击选手对目标进行射击,击中目标得1分,未击中目标得0分,该射击选手在一次射击中的得分X;③一天内的温度X;④在体育彩票的抽奖中,一次摇号产生的号码数X.
其中X是离散型随机变量的是( )
A.①②③ B.①②④ C.②③④ D.③④
B
①中,X的可能取值为0,1,2,符合要求;
②中,X的可能取值为0,1,符合要求;
③中,一天的温度变化是连续的,所以X不是离散型随机变量;
④中,在体育彩票的抽奖中,一次摇号产生的号码数是离散且随机的,符合要求.
2.甲、乙两人下象棋,赢了得3分,平局得1分,输了得0分,共下三局.用X表示甲的得分,则{X=3}表示( )
A.甲赢三局
B.甲赢一局输两局
C.甲、乙平局二次
D.甲赢一局输两局或甲、乙平局三次
D
因为甲、乙两人下象棋,赢了得3分,平局得1分,输了得0分,故{X=3}表示两种情况,即甲赢一局输两局或甲、乙平局三次.
3.(2026·潍坊模拟)若随机变量X的分布列为
C
X -1 0 1
P a c
则P(|X|=1)=( )
A. B. C. D.
由随机变量X的分布列得P(|X|=1)=P(X=-1)+P(X=1)=a+c=1-.
4.已知随机变量X的分布列为
C
X -1 0 1
P m n
若P(X≤0)=,且2X+Y=1,则D(Y)等于( )
A. B. C. D.
由P(X≤0)=,
得m=,n=1-P(X≤0)=,
则E(X)=-1×+0×+1×,
D(X)=E(X2)-(E(X))2=1×+0×,
由2X+Y=1,得Y=1-2X,
所以D(Y)=4D(X)=.
5.(2026·武汉调研)设θ∈,随机变量ξ的分布列如表所示,则E(ξ)( )
B
ξ 1 2 3
P sin2θ
A.有最大值,最小值 B.有最大值,最小值
C.有最大值,无最小值 D.无最大值,有最小值
因为P(ξ=3)=1-sin2θ=cos2θ,
所以E(ξ)=sin2θ+2×cos2θ=+cos2θ,
因为θ∈,所以≤cos θ≤,
从而cos2θ∈.
所以E(ξ)=+cos2θ的取值范围是,
则E(ξ)有最大值,最小值.
6.一袋中装有5个白球和3个红球,现从袋中往外取球,每次任取一个不放回,取出后记下颜色,若为红色则停止,若为白色则继续抽取,停止时从袋中抽取的白球的个数为随机变量ξ,则P(ξ≤2)等于( )
A. B. C. D.
D
依题意知,ξ=k表示前k个球为白球,第k+1个球恰为红球,则ξ的可能取值为0,1,2,3,4,5,
P(ξ=0)=,P(ξ=1)=·,P(ξ=2)=··,
所以P(ξ≤2)=P(ξ=0)+P(ξ=1)+P(ξ=2)=.
7.泊松分布是统计学里常见的离散型概率分布,由法国数学家泊松首次提出,泊松分布的概率分布列为P(X=k)=e-λ(k=0,1,2,…),其中e为自然对数的底数,λ是泊松分布的均值.已知某线路每个公交车站台的乘客候车相互独立,且每个站台候车人数X服从参数为λ(λ>0)的泊松分布,若该线路某站台的候车人数为2和3的概率相等,则该线路公交车两个站台各有1个乘客候车的概率为( )
A. B.
C. D.
D
由题意可知P(X=2)=P(X=3),
即e-λ=e-λ,解得λ=3,
所以P(X=k)=e-3(k=0,1,2,…),
所以P(X=1)=·e-3=,
故该线路公交车两个站台各有1个乘客候车的概率p=.
二、多选题
8.已知离散型随机变量X的分布列如表所示,则下列说法正确的是( )
ACD
X -2 1 3
P 2a 0.25 a
A.a=0.25
B.E(X)=1
C.D(X)=4.5
D.P(0.5<X<3.5)=0.5
由题意2a+0.25+a=1,得a=0.25,
所以E(X)=-2×0.5+1×0.25+3×0.25=0,
D(X)=(-2-0)2×0.5+(1-0)2×0.25+(3-0)2×0.25=4.5,
P(0.5<X<3.5)=P(X=1)+P(X=3)=0.25+0.25=0.5.
9.若随机变量X服从两点分布,其中P(X=0)=,则下列结论正确的是( )
A.P(X=1)=E(X) B.E(3X+2)=4
C.D(X)= D.D(3X+2)=4
AB
依题意P(X=0)=,所以P(X=1)=1-P(X=0)=,
所以E(X)=0×+1×,所以P(X=1)=E(X),
D(X)=×.E(3X+2)=3E(X)+2=3×+2=4,
D(3X+2)=32D(X)=32×=2,
所以A,B选项正确,C,D选项错误.
三、填空题
10.(2025·上海卷)已知随机变量X的分布列为
6.3
X 5 6 7
P 0.2 0.3 0.5
则数学期望E(X)= .
E(X)=5×0.2+6×0.3+7×0.5=6.3.
11.一射手打靶射击,直到命中或子弹打完为止,每次命中的概率为0.6,现有4发子弹,则停止射击后剩余子弹数目的均值为____________.
X=k表示停止射击后剩余子弹的数目,P(X=3)=0.6,P(X=2)=0.4×0.6,P(X=1)=0.42×0.6,P(X=0)=0.43×(0.6+0.4),
∴E(X)=3×0.6+2×0.4×0.6+1×0.42×0.6+0×0.43×(0.6+0.4)=2.376.
2.376
12.(2026·天津质检)袋子中装有8个球,其中6个黑球,2个白球,若从袋中每次取出1个球,取后不放回,则在第一次取到黑球的条件下,第二次取到白球的
概率为____________;若随机取出3个球,记取出的球中白球的个数为X,则X的数学期望E(X)=____________.
由题知,第一次取到黑球后,剩余7个球,其中白球有2个,从这7个球中取一个球,取到白球的概率为.
由题知,X的所有可能取值为0,1,2,
且P(X=0)=,P(X=1)=,P(X=2)=,
所以E(X)=0×+1×+2×.
四、解答题
13.(2021·新高考Ⅰ卷)某学校组织“一带一路”知识竞赛,有A,B两类问题.每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分.
已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;
由题意得X的所有可能取值为0,20,100,
P(X=0)=1-0.8=0.2,
P(X=20)=0.8×(1-0.6)=0.32,
P(X=100)=0.8×0.6=0.48,
所以X的分布列为
X 0 20 100
P 0.2 0.32 0.48
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
当小明先回答A类问题时,由(1)可得
E(X)=0×0.2+20×0.32+100×0.48=54.4.
当小明先回答B类问题时,记Y为小明的累计得分,则Y的所有可能取值为0,80,100,
P(Y=0)=1-0.6=0.4,
P(Y=80)=0.6×(1-0.8)=0.12,
P(Y=100)=0.6×0.8=0.48,
所以Y的分布列为
Y 0 80 100
P 0.4 0.12 0.48
E(Y)=0×0.4+80×0.12+100×0.48=57.6.
因为57.6>54.4,即E(Y)>E(X),
所以为使累计得分的期望最大,小明应选择先回答B类问题.
14.(2025·北京卷)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试,为了解学生对该知识点的掌握情况,随机抽查甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立.用频率估计概率.
(1)估计甲校高一年级学生该题选择正确的概率p;
用频率估计概率,从甲校随机抽取1人,做对题目的概率为p=.
(2)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计X=1的概率及X的数学期望;
设A为“从甲校抽取1人选择正确”,B为“从乙校抽取1人选择正确”,C为“恰有1人选择正确”,
则P(A)=0.8,P()=0.2,
P(B)=0.75,P()=0.25,
故P(C)=P(A)+P(B)=P(A)P()+P()P(B)=0.35,
而X可取0,1,2,
P(X=0)=P()=0.05,
P(X=1)=0.35,
P(X=2)=0.8×0.75=0.6,
故X的分布列如下表:
X 0 1 2
P 0.05 0.35 0.6
故E(X)=1×0.35+2×0.6=1.55.
(3)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识,甲校学生选择正确的概率为100%,乙校学生选择正确的概率为85%,设甲、乙两校的高一年级学生掌握该知识点的概率估计值分别为p1,p2,判断p1与p2的大小(结论不要求证明).
设D为“甲校掌握该知识的学生”,
因为甲校学生掌握这个知识点并选择正确的概率为100%,
未掌握该知识点的同学都是从四个选项里面随机选择一个,
故P(D)+(1-P(D))=0.8,
即p1+×(1-p1)=0.8,故p1=,
同理有0.85p2+×(1-p2)=0.75,故p2=,
故p1<p2.
$