内容正文:
专题04 概率与统计(理)
概率统计理科题型,在大题17,18,19,20,21题型位置都出现过,大多数是常规门槛基础题,也曾经在2019年成为全国高考压轴大题之一。19年以后全国甲乙卷中概率统计题在难度上逐渐降温,回归到基础大题位置。概率统计题,是实际生活问题为背景,基础问多考察抽样方法,总体估计等统计问题或概率计算、条件概率,正态分布等概率问题,以及回归分析或独立性检验等。在重点考察处多为随机变量分布列及其期望计算,还涉及到数列递推与最值求解,难点在于阅读并能准确的把试题转化为对应数学知识,并与数列等知识结合。
常考题型:回归分析与独立性检验,下棋、设计、投篮、摸球等模型分布列,药物实验等选择最优化模型,正态分布型,数列递推型分布列,求最值型分布列
一、回归分析与独立性检验
例题、下表为2015—2021年中国数字经济规模(单位:万亿元)及2022—2024年中国数字经济规模预测统计表,记2015—2024年对应的代码分别为1~10.
年份
2015年
2016年
2017年
2018年
2019年
2020年
2021年
2022年
2023年
2024年
年份代码
1
2
3
4
5
6
7
8
9
10
中国数字经济规模/万亿元
18.6
22.6
27.2
31.3
35.8
39.2
45.5
54.3
60.6
68.3
(1)根据2015—2021年的数据知可用线性回归模型拟合中国数字经济规模y与年份代码x之间的关系,求y关于x的线性回归方程(系数精确到0.01);
(2)对于未来n年的变化,通过两种不同模型预测得到两组数据,,…,与,,,,记M为数据,,…,,,,…,中的最大值,若,则称这两组数据相吻合,利用(1)中求得的线性回归方程对2022—2024年的中国数字经济规模进行预测,判断所得预测数据与表中预测数据是否吻合.
参考数据:,.
参考公式:线性回归方程中,斜率与截距的最小二乘估计公式分别为,.
经验回归方程:
对于一组具有线性相关关系的成对样本数据,由最小二乘法得
,.
将称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计.
(2)观测值:对于响应变量Y,通过观测得到的数据称为观测值.
(3)预测值:通过经验回归方程得到的称为预测值.
(4)残差:观测值减去_预估值称为残差.
(5)的计算公式为.在表达式中,与经验回归方程无关,残差平方和与经验回归方程有关.因此越大,表示残差平方和越小,即模型的拟合效果约好;越小,表示残差平方和越大,即模型的拟合效果_越差,越接近1,拟合效果越好.
(湖北省十七所重点中学2023届高三下学期2月第一次联考数学试题)为调查某地区植被覆盖面积x(单位:公顷)和野生动物数量y的关系,某研究小组将该地区等面积划分为200个区块,从中随机抽取20个区块,得到样本数据,部分数据如下:
x
…
2.7
3.6
3.2
…
y
…
57.8
64.7
62.6
…
经计算得:.
(1)利用最小二乘估计建立y关于x的线性回归方程;
(2)该小组又利用这组数据建立了x关于y的线性回归方程,并把这两条拟合直线画在同一坐标系下,横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致,
(ⅰ)比较前者与后者的斜率大小,并证明;
(ⅱ)求这两条直线的公共点坐标.
附:y关于x的回归方程中,斜率和截距的最小二乘估计公式分别为:.
1.(安徽省合肥市2023届高三下学期第一次教学质量检测数学试题)研究表明,温度的突然变化会引起机体产生呼吸道上皮组织的生理不良反应,从而导致呼吸系统疾病的发生或恶化.某中学数学建模社团成员欲研究昼夜温差大小与该校高三学生患感冒人数多少之间的关系,他们记录了某周连续六天的温差,并到校医务室查阅了这六天中每天高三学生新增患感冒而就诊的人数,得到资料如下:
日期
第一天
第二天
第三天
第四天
第五天
第六天
昼夜温差x(℃)
4
7
8
9
14
12
新增就诊人数y(位)
参考数据:,.
(1)已知第一天新增患感冒而就诊的学生中有7位女生,从第一天新增的患感冒而就诊的学生中随机抽取3位,若抽取的3人中至少有一位男生的概率为,求的值;
(2)已知两个变量x与y之间的样本相关系数,请用最小二乘法求出y关于x的经验回归方程,据此估计昼夜温差为15℃时,该校新增患感冒的学生数(结果保留整数).
参考公式:,.
2.(河南省普高联考2022-2023学年高三下学期测评(四)理科数学试题)某公司为了解年营