内容正文:
12
专题十三 概率、计数原理与统计
考点1 概率与计数原理
考点2 统计
1
历年真题大数据
1.高考在本章一般命制1道小题或者1道解答题,分值占5-17分.
2.计数原理常与古典概型综合考查,二项式定理的考查通常以填空题的形式;以实际问题为背景,考查分布列、期望等的统计案例题是高考的热点题型。
年份与卷别 考点 考查内容
2025 全国Ⅰ卷 概率 离散型随机变量及其分布
古典概型的概率计算
独立性检验
计算数据的平均数
古典概型的概率计算
离散型随机变量及其分布
概率
统计
全国Ⅱ卷 统计
概率
概率
2024 新课标Ⅰ卷 概率 正态分布的对称性
古典概型的概率计算
新课标Ⅱ卷 统计 计算数 据 的 平 均 数、 方差、极差、标准差
排列组合 全排列组合
概率 独立事件的概率公式
全国甲卷 排列组合 二项式定理的应用
概率 古典概型的概率计算
统计 独立性检验
1. 有限样本空间
把随机试验E的每个可能结果称为样本点,全部样本点的集合称为试验E的样本空间.用Ω表示样本空间,用ω表示样本点,如果一个随机试验有n个结果ω1,ω2,···,ωn,则称样本空间Ω={ω1,ω2,···,ωn}为有限样本空间.
考点1:概率与计数原理
应考核心知识
一、概率
2.随机事件的概率、古典概型、几何概型
(1)随机事件的概率与频率
①随机事件的频率与概率
概率的取值范围为0≤P(A)≤1.必然事件的概率为1,不可能事件的概率为0.
②频数与频率
在相同条件进行n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数,称事件A出现的比例fn(A)=为事件出现的频率.
③概率
对于给定的随机事件A,如果随着试验次数n的增加,事件A发生的频率fn(A)稳定在某一个常数上,则把这个常数记作P(A),称为事件A的概率.
④随机事件概率问题的求解方法
在一次试验中,等可能出现的n次结果组成一个集合I,这n个结果就是集合I的n个元素,各基本事件均对应于集合I的含有一个元素的子集.包含m个结果的事件A对应于I的含有m个元素的子集A,于是事件A的概率为P(A)=.
(2)概率的基本性质
①对任意事件A,都有p(A)≥0;
②必然事件的概率为1,不可能事件的概率为0;
③如果事件A与事件B互斥,那么P(A+B)=P(A)+P(B);
④如果事件A与事件B对立,那么P(A)+P(B)=1;
⑤如果事件B包含事件A,那么P(A)≤P(B).
(3)随机事件
设A、B为两个随机事件,且P(A)>0,则称P(B|A)=为事件A发生的条件下。事件B发生的条件概率,简称条件概率.
①当P(A)>0时,当且仅当事件A与B相互独立时,P(AB)=P(A)P(B)有P(B|A)=P(B).
(4)事件的关系
①两件事互斥:两件事不可能同时发生,A∩B=∅.若事件A,B互斥,则P(A+B)=P(A)+P(B);
②两件事相互独立:一件事发生与否与另一件事发生的概率没有影响,若事件A,B相互独立,则P(AB)=P(A)P(B);
③两件事对立:每次有且仅有其中一件事发生,若事件A,B对立,
则P(A)+P(B)=1.
(5)古典概型
①古典概型的两个特点
有限性:试验所以可能出现的基本事件只有有限个,每次试验只有出现其中一个基本事件.
等可能性:每个基本事件发生的可能性是相等的.
②古典概型的概率公式
在基本事件总数为n的古典概型中,每个基本事件发生的概率是相等的,即每个基本事件概率都是.
如果随机事件A包含的基本事件数为m,由互斥事件的概率的加分公式可得
P(A)=.
③求古典概型概率的步骤.
第一步,反复阅读题目,收集题中的各个信息,理解题意.
第二步,判断试验是否为古典概型,并用字母表示所求事件.
第三步,利用列举法求出总的基本事件个数n即事件A中包含的基本事件的个数m.
第四步,计算事件A的概率P(A)=.
考点1:概率与计数原理
(6)几何概型
①定义
如果每个事件发生的概率只与构成该事件区域的长度(面积、体积)成正比,则称这样的概率模型为几何概率模型,简称几何概型.
②几何概型的特征
无限性:即在一次试验中,基本事件的个数是无限的.
等可能性:即每个基本事件发生的可能性是相等的.
③几何概型计算公式P(A)=
考点1:概率与计数原理
④应用几何概型求概率的方法
建立相应的几何概型,将试验构成的总区域和所求事件构成的区域转化为几何图形,并加以度量.一般地,一个连续变量可建立与长度有关的几何模型,只需把这个变量放在坐标轴上即可.
若一个随机事件需要用两个变量来描述,则可用这两个变量的有序实数对来表示它的基本事件,然后利用平面直角坐标系就能顺利建立与面积有关的几何模型.
若一个随机变量需要三个连续变量来描述,则可用这三个变量组成的有序实数组来表示基本事件,利用空间直角坐标系即可建立与体积有关的几何模型.
考点1:概率与计数原理
3.离散型随机变量及其分布列
(1)随机变量
随机变量:如果随机试验可以用一个变量表示,那么这样的变量称为随机变量.用符号,η或X,Y等表示.
离散型随机变量:如果对于随机变量可能取的值,可以按照一定次序一一列出,这样的随机变量称为离散型随机变量.
(2)离散型随机变量的分布列
若离散型随机变量可能取的不同值为x1,x2,···,xi,···,xn取每一个值xi(i=1,2,···,n)的概率P(ξ=xi)=pi,以表格形式表示如下:
这个表格为离散型随机变量的概率分布,简称为的分布列,记为P(ξ=xi)=pi(i=1,2,···,n).
ξ x1 x2 ··· xi ··· xn
P p1 p2 ··· pi ··· pn
考点1:概率与计数原理
(3)离散型随机变量的性质
①pi≥0,(i=1,2,···,n).
②p1+p2+···+pn=1.
(4)求离散型随机变量分布列的步骤
①找出随机变量X的所有可能取值pi(i=1,2,···,n).
②求出各个取值的概率P(ξ=xi)=pi.
③画表填入相应的数字.
考点1:概率与计数原理
(5)部分常见的离散型随机变量的分布列
①两点分布(0-1分布)
若随机变量X的分布列具有以上形式,则称X服从两点分布,并称p=P(X=1)为成功的概率.
②超几何分布
一般地,在含有M件次品的N件产品中,任取n件,其中恰有k件次品,则
P(X=xi)=,=0,1,2,···,m,即
其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*.如果随机变量X的分布列具有上表的形式,那么称随机变量X服从超几何分布.
X 0 1
P 1-p p
X 0 1 ··· m
P ···
4.二项分布
(1)独立重复实验
在相同条件下,重复进行试验,如果每次试验的结果与其他各次试验的结果无关,那么就把这种实验称为试验.若重复进行n次试验,那么这n次重复试验称为n次独立的重复试验.
(2)二项分布
在n次独立的重复试验中,设事件A发生的次数为X.在每次试验中事件A发生的概率为p,那么在n次独立的重复试验中,设事件A发生k次的概率为
P(X=k)=(=0,1,2,···,n),此时称随机变量X服从二项分布,记作X∽B(n,p),并称p为成功概率.
如果在一次试验中某事件A发生的概率是p,随机变量ξ为n次独立的重复试验中事件A发生次数,那么随机变量ξ的概率分布为(其中0<p<1,k=0,1,2,···,n):
ξ 0 1 ··· ··· n
P ···
5.离散型随机变量的均值和方差
(1)离散型随机变量的均值
若离散型随机变量的分布列如下:
··· ···
P ··· ···
则称x1p1+x2p2+···+xnpn为离散型随机变量的均值或数学期望.用E(ξ)表示,E(ξ)=x1p1+x2p2+···+xnpn.它反映了离散型随机变量取值的平均水平.
(2)离散型随机变量的均值(或)期望的性质
①若η=a+b,则E(η)=aE(ξ)+b.
②若X服从两点分布,则E(X)=p.
③若X∽B(n,p),则E(X)=np.
ξ x1 x2 ··· xi ··· xn
P p1 p2 ··· pi ··· pn
(3)离散型随机变量的方差
设离散型随机变量的分布列如下:
··· ···
P ··· ···
则(xi-E(ξ))2描述了(xi=1,2,···,n)相对于均值E(ξ)的偏离程度.
D(ξ)=pi称为离散型随机变量的方差.离散型随机变量的方差D(ξ)的算术平方根,叫做离散型随机变量的标准差.
离散型随机变量的标准差和离散型随机变量的方差一样.反映了随机变量取值的稳定与波动集中与离散程度,方差越小,取值越集中,稳定性越高,波动越小;反之则取值越分散,稳定性越低,波动越大.
(4)方差的性质
①若η=aξ+b,则E(η)=a2D(ξ).
②若X服从两点分布,D(X)=p(1-p).
③若X∽B(n,p),则D(X)=np(1-p).
ξ x1 x2 ··· xi ··· xn
P p1 p2 ··· pi ··· pn
6.正态分布
(1)正态曲线
=,x∈(-∞,+∞),其中,是常数,且>0,称的图象为正态分布密度曲线,简称正态曲线.
(2)正态分布
一般地,如果对于任何实数a,b(a<b),随机变量满足P(a<X≤b)=,称随机变量满足,2的正态分布,简记ξ∽N(,2).若ξ∽N(,2),则E(ξ)=,D(ξ)=2.
(3)正态曲线的特点
①曲线在x轴上方,并且直线关于x=对称.
②曲线在x=时处于最高点,由这点向左右两边延伸时,曲线逐渐降低,呈“中间高,两边低”的形状.
③曲线的对称轴位置由的值确定,曲线的形状由的值确定,越大,曲线越“矮胖”,越小,曲线越“高瘦”.
(4)几个常用公式
①P(X<a)=1-P(X≥a);
②P(X<-a)=P(X≥+a);
③若b>0,则P(X<-b)=.
1.两个基本计数
(1)分类计数原理
如果完成一件事有n类办法,在第一类办法中有种不同的方法,在第二类办法中有种不同的方法,···,第n类方法中有种不同的方法,每种方法都能完成这件事,那么完成这件事共有N=m1+m2+···+mn种不同的方法(也称为加分原理).
(2)分步计数原理
如果完成一件事有n个步骤,完成第一步有k1种不同的方法,完成第二步有k2种不同的方法,···,完成第n步有kn种不同的方法,并且当且仅当完成n步后,这件事才算完成,那么完成这件事共有N=k1···kn种不同方法(也称为乘法运算).
考点1:概率与计数原理
应考核心知识
二、计数原理
(3)两个计数原理的综合应用.
用两个计数原理解决计数问题时,最重要的是在计算开始前要进行仔细分析是要分类还是要分步.
考点1:概率与计数原理
应考核心知识
二、计数原理
2.排列与组合
(1)排列
①排列的概念
从n个不同元素中任取m(m≤n)个元素,按照一定顺序排成一列,称为从n个不同元素取出m个元素的一个排列.所有这样的排列的个数称为从n个不同元素中取出m个元素的排列数,用表示.
②排列数公式
=n(n-1)(n-2)···(n-m+1)=.
③全排列
当m=n时,称为全排列.记作=n!,n!称为n的阶乘.
④排列的应用
求解排列的问题时,正确地理解题意是最关键的一步,要善于把题目中的文字翻译成排列相关的术语;正确运用两个计数原理;要注意分类时不重不漏,分步时依次完成各个步骤.解简单的排列应用问题,首先必须看能否把问题归结为排列问题,再确定n,m的具体数值,最后运用公式求值.在解有限条件的排列问题时,先分析限制条件有哪些,哪些是特殊元素,哪些是特殊位置,识别是哪种基本类型,在限制条件较多时,要通过正确的分类、分步、把复杂的问题转化为简单的问题.
(2)组合
①组合的概念
组合的概念:从n个不同元素中任取m(m≤n)个元素并成一组,称为从n个不同元素中任取m个元素的与组合,所有这样的组合的个数称为n个不同元素中任取m个元素的组合数,用表示.
②组合数公式
===.
③组合数的性质
性质1:=.
性质2:=+.
(3)排列与组合的综合问题
①遵守的原则
先分类后分步;先组合后排列;有条件限制的优先;限制条件多的优先;避免重复和遗漏.
②注意事项
第一,分清分类还是分步,主要看是“独立”完成还是“分步”完成.
第二,分清是排列还是组合,主要是看是否与“顺序”有关.
第三,分清是否有条件限制.
3.二项式定理
(1)二项式定理
(a+b)n=+b++···++···+(n∈N)这个公式称为二项式定理.
(2)二项展开式的通项公式
=(m=0,1,2,···,n)称为二项式的通项,是第m+1项.
(3)二项式系数的性质
①在二项式展开式中,与首末两项“等距离”的两项的二项是系数相等,即=.
②如果二项式的幂指数是偶数,中间一项的二项式系数最大;如果二项式的幂指数是奇数,中间两项的二项式系数最大.
③所有二项式系数和等于,即+++···+=.
④奇数项的二项式系数的和等于偶数项的二项式系数的和,即++···=++···=.
巩固训练
D
应考基础训练
巩固训练
C
应考基础训练
巩固训练
B
应考基础训练
巩固训练
C
应考基础训练
巩固训练
C
应考基础训练
巩固训练
A
应考基础训练
巩固训练
A
应考基础训练
巩固训练
应考基础训练
巩固训练
应考基础训练
考点2:统计
1.随机抽样
(1)简单随机抽样:设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体为样本,如果抽取是放回的,且每次抽样时总体内的各个个体被抽到的概率一样,称为放回简单随机抽样;如果抽取是不放回的,且每次抽样时总体内未进入样本的各个个体被抽到的概率相等,称为不放回简单随机抽样.
总体中有N个个体,它们的变量值分别为Y1,Y2,···YN ,则称
==为总体平均值;
从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,···yn,则称
==为样本均值.
应考核心知识
(2) 分层随机抽样:按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子个体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这种抽样方法称为分层随机抽样,每个子总体称为层.
(3)三种抽样方法及其应用
①三种抽样方法的比较
类别 共同点 各自特点 相互关系 适用范围
简单随机抽样 都是不放回抽样,抽样过程中,每个个体被抽到的概率相等 从总体中逐个抽样 总体中个数较少
系统抽样 将总体均分成几个部分,按事先确定的规则,在各部分抽取 在起始部分抽样时,采用简单随机抽样 总体中个数较多
分层抽样 将总体分成几层,分层进行抽样 各层抽样时,采用简单随机抽样 总体由差异明显的部分组成
2.统计图表
(1)频率分布直方图的特征
①各矩形的面积和为1.
②纵轴的含义为频率/组距,矩形的面积=组距
③样本数据的平均数的估计等于每个校矩形的面积乘矩形底边中点横坐标之和.
(1) 各个统计图表的优点和不足
优点 不足
频率分布表 表示数据较准确 分析数据分布的总体态势不方便
频率分布直方图 表示数据分布情况非常直观 原有的具体数据信息被抹除了
频率分布折线图 能反映数据的变化趋势 不能显示原有数据
茎叶图 一是所有的信息都可以从图中得到;二是便于记录和表示,能够展示数据的分布情况 样本数据较多或数据位数较多时,不方便表示数据
3.用样本数字特征估计总体
(1)众数、中位数、平均数:
数字特征 样本数据 频率分布直方图
众数 出现最多的数据 取最高的小正方形底边中部的横坐标
中位数 把数据从大到小排列,处在最中间位置的一个数据 把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标
平均数 样本数据的算术平均数 每个小矩形的面积乘小矩形底边中点的横坐标之和
(2)总体百分位数的估计:
①第p百分位数(p%分位数):一组数据的第p百分位数是这样一个值,它使这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
②求百分位数的步骤:
第一步,将n项数据按从小到大排列;
第二步,计算i=n×p%;
第三步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数
(3)总体集中趋势的估计:
对于数值型数据集中趋势的描述,可以用平均值、中位数;而对于分类型数据集中趋势的描述,可以用众数.
4.成对数据的统计分析
(1)样本相关系数:对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),···(xn,yn),可得
r=,r为变量x和变量y分样本相关系数.
当r>0时,成对样本数据正相关;当r<0时,成对样本数据负相关;
当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱.
(2)一元线性回归模型
①将称为Y关于x的一元线性回归方程,e是Y与bx+a之间的随机误差
②,将称为Y关于x的经验回归方程,,称为,的最小二乘估计.
(3)独立性检验
以Ω为样本空间的古典概型,设X和Y为定义在Ω上,取值为{0,1}的成对分类变量.通过简单随机抽样得到X和Y的抽样数据列联表.
①假设事件X与事件Y独立
②计算K2的值,K2=
③将K2与小概率的临界值xα比较,当K2≥xα时,假设不成立,事件X与事件Y不独立;当K2<xα时,可以认为事件X和事件Y独立.
X Y
Y=0 Y=1
X=0 a b
X=1 c d
巩固训练
C
应考基础训练
巩固训练
C
应考基础训练
巩固训练
B
应考基础训练
巩固训练
C
应考基础训练
巩固训练
应考基础训练
巩固训练
CD
应考基础训练
巩固训练
应考基础训练
$