内容正文:
【解答题抢分专题】备战2023年高考数学解答题典型例题+跟踪训练(新高考通用)
专题19 概率与统计解答题题型综合训练
一、梳理必备知识
1.分层抽样
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样。分层抽样适用于已知总体是由差异明显的几部分组成的。
注:①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”
2.频率分布直方图
(1)频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于 .
3.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
4.独立性检验
(1)定义:利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
(2)公式:,其中为样本容量.
(3)独立性检验的具体步骤如下:
①计算随机变量的观测值,查下表确定临界值:
0.5
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
②如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”.
5.线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
6.非线性回归
建立非线性回归模型的基本步骤
(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、指数函数、对数函数、幂函数模型等);
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
7.二项分布
(1)一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,)
于是得到的分布列
…
…
…
…
由于表中第二行恰好是二项式展开式
各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
注:
①各次试验中的事件是相互独立的;
②每次试验只有两种结果:事件要么发生,要么不发生;
③随机变量是这次独立重复试验中事件发生的次数.
④二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.
(2)若,则,.
8.超几何分布
(1)在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
0
1
…
…
超几何分布和二项分布的区别
(1)超几何分布需要知道总体的容量,而二项分布不需要;
(2)超几何分布是“不放回”抽取,在每次试验中某一事件发生的概率是不相同的;
而二项分布是“有放回”抽取(独立重复),在每次试验中某一事件发生的概率是相同的.
9.正态分布
(1)随机变量落在区间的概率为,即由正态曲线,过点和点的两条轴的垂线,及轴所围成的平面图形的面积,如下图中阴影部分所示,就是落在区间的概率的近似值.
一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为.
其中,参数是反映随机变量取值的