内容正文:
回归教材重难点06 概率与统计
概率与统计解答题是高考数学必考内容,该考点命题相对稳定,难度中等,是考生必须突破的核心内容之一.
高考概率与统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,考查对概率事件的判断识别及其概率的计算。试题考查特点是以实际应用问题为载体,解答题部分主要考查独立性检验、统计以及概率的计算。概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活。取代了传统意义上的应用题,成为高考中的亮点。
回顾近几年的高考试题,可以看出概率统计解答题,大多紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重要载体,命题者要求考生会收集,整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模型,再应用数学原理和数学工具解决实际问题.
1.统计图表
(1)制作频率分布直方图的步骤.
第一步:求极差,决定组数和组距,组距
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表;
第四步:画频率分布直方图.
(2)解决频率分布直方图问题时要抓住3个要点.
①直方图中各小矩形的面积之和为1;
②直方图中纵轴表示,故每组样本的频率为组距
③直方图中每组样本的频数为频率总体个数.
(3)用频率分布直方图估计众数、中位数、平均数的方法.
①众数为频率分布直方图中最高矩形底边中点的横坐标;
②中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
③平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.
2.回归分析
线性回归分析的原理、方法和步骤:
(1)利用图表和数字特征可以对数据做简单的分析,但是用回归直线方程可以对数据的未来值进行预测.在选取数据观察的时候,要注意大量相对稳定的数据比不稳定的数据更有价值,近期的数据比过去久远的数据更有价值.
(2)判断两组数据是否具有线性相关关系的方法:散点图,相关系数.
(3)相关指数与相关系数在含有一个解释变量的线性回归模型中是等价的量,都是用来判断线性回归模型拟合效果好不好的量.
(4)利用换元法,可以将一元非线性回归转化为线性回归.
3.独立性检验
解独立性检验应用问题的注意事项。
(1)两个明确:①明确两类主体;②明确研究的两个问题.
(2)在列联表中注意事件的对应及相关值的确定,不可混淆.
(3)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.
(4)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他.
【真题演练】
1.(2020·全国·高考真题(文))某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)该市一天的空气质量等级分别为、、、的概率分别为、、、;(2);(3)有,理由见解析.
【解析】
【分析】
(1)根据频数分布表可计算出该市一天的空气质量等级分别为、、、的概率;
(2)利用每组的中点值乘以频数,相加后除以可得结果;
(3)根据表格中的数据完善列联表,计算出的观测值,再结合临界值表可得结论.
【详解】
(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
(3)列联表如下:
人次
人次
空气质量不好
空气质量好
,
因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
【点睛】
本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.
2