内容正文:
回顾5 概率与统计
1.排列数、组合数公式,组合数的性质
(1)排列数公式:
A=n(n-1)(n-2)·…·(n-m+1)=(m≤n,m,n∈N*).
规定:0!=1.
(2)组合数公式:
C==
=(m≤n,m,n∈N*).
规定:C=1.
(3)组合数性质:C=C,C=C+C.
2.二项式定理及二项展开式的通项公式
二项式定理:
(a+b)n=Can+Can-1b1+Can-2b2+…+Can-kbk+…+Cbn,n∈N*.
二项展开式的通项:Tk+1=Can-kbk(k=0,1,…,n).
3.二项式系数的性质
C为二项式系数(区别于该项的系数),其性质:
(1)对称性:C=C(k=0,1,2,…,n).
(2)系数和:C+C+…+C=2n,C+C+C+…=C+C+C+…=2n-1.
(3)最值:n为偶数时,中间一项的二项式系数最大且二项式系数为;n为奇数时,中间两项的二项式系数最大.
4.随机事件之间的关系
(1)必然事件Ω,P(Ω)=1;
不可能事件∅,P(∅)=0.
(2)包含关系:A⊆B,“如果事件A发生则事件B一定发生”称事件B包含事件A.
(3)事件的和(并):A+B或A∪B,“事件A与事件B至少有一个发生”叫做事件A与事件B的和(并)事件.
(4)事件的积(交):AB或A∩B,“事件A与事件B同时发生”叫做事件A与事件B的积(交)事件.
(5)互斥事件:“事件A与事件B不能同时发生”叫做事件A与事件B互斥,P(AB)=0.
(6)对立事件:A∪=Ω,A∩=∅.
(7)相互独立事件:事件A发生与否对事件B发生的概率没有影响,这样的两个事件叫做相互独立事件,事件A与事件B相互独立,则A与,与B,与也相互独立.
5.概率的计算公式
(1)古典概型的概率计算公式
P(A)==.
(2)若A,B互斥,则P(A+B)=P(A)+P(B).
(3)P(A)=1-P().
(4)若A,B相互独立,则P(AB)=P(A)P(B).
(5)如果在一次试验中A发生的概率是p(0<p<1),那么在n重伯努利试验中A恰好发生k次的概率Pn(k)=Cpk(1-p)n-k,k=0,1,2,…,n.
(6)条件概率:P(B|A)=.
(7)全概率公式
一般地,设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B⊆Ω,有
P(B)=(Ai)P(B|Ai).
*(8)贝叶斯公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B⊆Ω,P(B)>0,有
P(Ai|B)=
=,i=1,2,…,n.
6.离散型随机变量的均值和方差
(1)公式:
E(X)=x1p1+x2p2+…+xnpn=ipi.
D(X)=(x1-E(X))2p1+(x2-E(X))2p2+…+(xn-E(X))2pn=(xi-E(X))2pi.
(2)均值、方差的性质:
①E(k)=k(k为常数),D(k)=0(k为常数).
②E(aX+b)=aE(X)+b,D(aX+b)=a2D(X).
(3)两点分布与二项分布的均值与方差
①若随机变量X服从两点分布,则E(X)=p,D(X)=p(1-p).
②若随机变量X服从二项分布,即X~B(n,p),则E(X)=np,D(X)=np(1-p).
7.常用的抽样方法
简单随机抽样、分层随机抽样.
8.统计中的四个数据
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:在样本数据中,将数据按大小依次排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
(3)平均数:样本数据的算术平均数=(x1+x2+…+xn).
(4)方差与标准差
方差:s2=[(x1-)2+(x2-)2+…+(xn-)2].
标准差:
s=.
9.线性回归
经验回归方程=x+一定过点(,).
10.独立性检验
利用χ2=的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
11.正态分布
如果随机变量X服从正态分布,则记为X~N(μ,σ2).X落在三个特殊区间的概率为
(1)P(μ-σ≤X≤μ+σ)≈0.682 7;
(2)P(μ-2σ≤X≤μ+2σ)≈0.954 5;
(3)P(μ-3σ≤X≤μ+3σ)≈0.997 3.
1.求解排列问题常用的方法
直接法
把符合条件的排列数直接列式计算
优先法
优先安排特殊元素或特殊位置
捆绑法
相邻问题捆绑处理,即可以把相邻元素看作一个整体与其他元素进行排列,同时注意捆绑元素的内部排列
插空法
不相邻问题插空处理,即先考虑不受限制的元素的排列,再将不相邻的元素插在前面元素的排列产生的空中
先整体,后局部
“小集团”排列问题中,先整体,后局部
除法
对于定序问题,可先不考虑顺序限制,排列后,再除以定序元素的全排列
间接法
正难则反,等价转化的方法
2.古典概型中样本点个数的确定方法
方法
适用条件
列表法
此法适合于从多个元素中选定两个元素的试验,也可看成是坐标法
树状图法
树状图是进行列举的一种常用方法,适合用于有顺序的问题及较复杂问题中样本点数的探求
3.频率分布直方图中的众数、中位数、平均数
(1)最高的小长方形底边中点的横坐标为众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,其估计值等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
4.样本相关系数r可以表示两个变量间的相关性
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.
r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.
1.(2023·海口模拟)某班举办古诗词大赛,其中一个环节要求默写《咏柳》《送元二使安西》《黄鹤楼送孟浩然之广陵》《绝句》《江畔独步寻花》五首古诗,并要求《黄鹤楼送孟浩然之广陵》《绝句》默写次序相邻,则不同的默写次序有( )
A.36种 B.48种 C.72种 D.96种
答案 B
解析 将相邻的两首诗《黄鹤楼送孟浩然之广陵》《绝句》捆绑有A=2(种)方法,
再作为一个元素,与其他3首诗作全排列有A=24(种)方法,
所以共有2×24=48(种).
2.在孟德尔豌豆试验中,子二代的基因型为DD,Dd,dd,其中D为显性基因,d为隐性基因,且这三种基因型的比为1∶2∶1.如果在子二代中任意选取2颗豌豆作为父本杂交,那么子三代中基因型为dd的概率为( )
A. B. C. D.
答案 A
解析 记事件B:子三代中基因型为dd,记事件A1:选择的是Dd,Dd,记事件A2:选择的是dd,dd,记事件A3:选择的是dd,Dd,
则P(A1)=×=,P(A2)=×=,P(A3)=2××=.
在子二代中任取2颗豌豆作为父本杂交,分以下三种情况讨论:
①若选择的是Dd,Dd,则子三代中基因型为dd的概率为P(B|A1)=;
②若选择的是dd,dd,则子三代中基因型为dd的概率为P(B|A2)=1;
③若选择的是dd,Dd,则子三代中基因型为dd的概率为P(B|A3)=.
综上所述,P(B)=P(A1)·P(B|A1)+P(A2)·P(B|A2)+P(A3)·P(B|A3)
=×+×1+×=.
因此,子三代中基因型为dd的概率是.
3.(多选)下列命题中,为真命题的是( )
A.若经验回归方程=-0.45x+0.6,则变量y与x正相关
B.在线性回归分析中,用决定系数R2来刻画回归的效果,若R2值越小,则模型的拟合效果越好
C.若样本数据x1,x2,…,x10的方差为2,则数据2x1-1,2x2-1,…,2x10-1的方差为8
D.一个人连续射击三次,则事件“至少击中两次”的对立事件是“至多击中一次”
答案 CD
解析 因为=-0.45<0,
所以变量y与x负相关,A错误;
R2值越大,模型的拟合效果越好,B错误;
数据2x1-1,2x2-1,…,2x10-1的方差为22×2=8,C正确;
事件“至少击中两次”的对立事件是“至多击中一次”,D正确.
4.(2023·广州模拟)某小区从2 000户居民中随机抽取100户进行月用电量调查,发现他们的用电量都在50~350 kW·h之间,进行适当的分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.则( )
A.该小区居民月用电量的平均数为186.5,极差为300
B.该小区居民月用电量的中位数为171,众数为175
C.可以估计该小区居民月用电量的85%分位数约为262.5
D.该小区居民月用电量不小于250 kW·h的约有380户
答案 C
解析 对于A,极差为300,小区用电量的平均数为
50×0.002 4×75+50×0.003 6×125+50×0.006 0×175+50×0.004 4×225+50×0.002 4×275+50×0.001 2×325=186,故A错误;
对于B,小区用电量众数为=175,
因为50×(0.002 4+0.003 6)=0.3,50×(0.002 4+0.003 6+0.006 0)=0.6,
故小区用电量的中位数在[150,200)内,设为m,
则0.3+(m-150)×0.006 0=0.5,解得m=,故B错误;
对于C,因为50×(0.002 4+0.003 6+0.006 0+0.004 4)=0.82<0.85,
50×(0.002 4+0.003 6+0.006 0+0.004 4+0.002 4)=0.94>0.85,
故估计小区居民月用电量的85%分位数在[250,300)内,设为x,
则0.82+(x-250)×0.002 4=0.85,解得x=262.5,故C正确;
对于D,样本中月用电量不小于250 kW·h的频率为0.002 4×50+0.001 2×50=0.18,
所以该小区居民月用电量不小于250 kW·h的约有2 000×0.18=360(户),故D错误.
5.(多选)(2023·石家庄模拟)投掷一枚质地均匀的骰子,事件A=“朝上一面点数为奇数”,事件B=“朝上一面点数不超过2”,则下列叙述正确的是( )
A.事件A,B互斥
B.事件A,B相互独立
C.P(A∪B)=
D.P(B|A)=
答案 BD
解析 对于A,若朝上一面的点数为1,则事件A,B同时发生,
∴事件A,B不互斥,A错误;
对于B,∵事件A不影响事件B的发生,
∴事件A,B相互独立,B正确;
对于C,P(A∪B)=P(A)+P(B)-P(AB)=+-=,C错误;
对于D,∵P(AB)=,P(A)==,
∴P(B|A)===,D正确.
6.橘生淮南则为橘,生于淮北则为枳,出自《晏子使楚》.意思是说,橘树生长在淮河以南的地方就是橘树,生长在淮河以北的地方就是枳树,现在常用来比喻一旦环境改变,事物的性质也可能随之改变.某科研院校培育橘树新品种,使得橘树在淮北种植成功,经过科学统计,单个果品的质量ξ(单位:g)近似服从正态分布N(90,σ2),且P(86<ξ≤90)=0.2,在1 000个橘果中,估计单个果品质量不低于94 g的橘果个数为________.
答案 300
解析 结合正态分布特征,
P(86<ξ≤90)=P(90≤ξ<94)=0.2,
P(ξ≥94)==0.3,
所以估计单个果品质量不低于94 g的橘果个数为0.3×1 000=300.
7.以正方体的顶点为顶点的三棱锥的个数是________.
答案 58
解析 首先从8个顶点中选4个,共有C=70(种)结果,
其中,有四点共面的情况,6个表面有6个四点共面情况,6个对角面有6个四点共面情况,
所以以正方体的顶点为顶点的三棱锥的个数是70-6-6=58.
8.在(1+x)3+(1+x)4+…+(1+x)n+2的展开式中,含x2项的系数是________.
答案
解析 因为(1+x)n展开式的第k+1项为Tk+1=Cxk.
所以(1+x)3中含x2项的系数是C,(1+x)4中含x2项的系数是C,…,(1+x)n+2中含x2项的系数是C.
所以(1+x)3+(1+x)4+…+(1+x)n+2的展开式中含x2项的系数为C+C+…+C=(C+C+C+…+C)-C=C-C=.
所以含x2项的系数是.
9.(2023·湛江模拟)某高中进行了一场关于高三学生课余学习时间的调查问卷,现从高三12个班级每个班随机抽取10名同学进行问卷,统计数据如下表:
课余学习时间超过两个小时
课余学习时间不超过两个小时
200名以前
40
x+10
200名以后
3x-10
40
(1)求x的值;
(2)依据上表,根据小概率值α=0.001的独立性检验,分析学生成绩与课余学习时间超过两个小时是否有关系;
(3)学校在成绩200名以前的学生中,采用按比例分配的分层随机抽样,按课余学习时间是否超过两个小时抽取6人,再从这6人中随机抽取3人,记这3人中课余学习时间超过两个小时的学生人数为X,求X的分布列和数学期望.
附:参考公式:
χ2=,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
解 (1)依题意,高三12个班级共抽取120名,则40+x+10+3x-10+40=120,解得x=10,
所以x的值为10.
(2)由(1)得2×2列联表:
课余学习时间超过两个小时
课余学习时间不超过两个小时
合计
200名以前
40
20
60
200名以后
20
40
60
合计
60
60
120
零假设为H0:学生成绩与课余学习时间超过两个小时无关,
根据列联表数据得,χ2==≈13.333>10.828=x0.001,
根据小概率值α=0.001的独立性检验,我们推断H0不成立, 即认为学生成绩与课余学习时间超过两个小时有关,此推断犯错误的概率不大于0.001.
(3)这6人中课余学习时间超过两个小时的人数为6×=4,课余学习时间不超过两个小时的人数为2,
则X的所有可能取值为1,2,3,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以X的分布列为
X
1
2
3
P
E(X)=1×+2×+3×=2.
10.(2023·长沙模拟)从甲、乙、丙等10人中随机抽取三个人去做传球训练.训练规则是确定一人第1次将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人,每次必须将球传出.
(1)记甲、乙、丙三人中被抽到的人数为随机变量X,求X的分布列;
(2)若刚好抽到甲、乙、丙三个人相互做传球训练,且第1次由甲将球传出,求n次传球后球在甲手中的概率.
解 (1)依题意,X的所有可能取值为0,1,2,3,
P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以随机变量X的分布列为
X
0
1
2
3
P
(2)若刚好抽到甲、乙、丙三个人相互做传球训练,且记An表示事件“经过n次传球后,球在甲手中”,
设n次传球后球在甲手中的概率为pn,n=1,2,3,…,
则有p1=0,An+1=nAn+1+AnAn+1,
所以pn+1=P(nAn+1+AnAn+1)
=P(nAn+1)+P(AnAn+1)
=P(n)P(An+1|n)+P(An)P(An+1|An)=(1-pn)·+pn·0=(1-pn),
即pn+1=-pn+,n=1,2,3,
所以pn+1-=-,且p1-=-,
所以数列表示以-为首项,-为公比的等比数列,
所以pn-=-×n-1,
所以pn=-×n-1+=,
即n次传球后球在甲手中的概率是.
学科网(北京)股份有限公司
$$