内容正文:
第十章 计数原理、概率、随机变量
及其分布
专题探究课(六) 概率与统计中的高考热点问题
常考热点 真题印证 核心素养
统计与统计案例 2018·全国卷Ⅱ,T18 2018·全国卷Ⅲ,T18
2016·全国卷Ⅲ,T18 1.数学运算
2.数据分析
离散型随机变量均值与方差的应用 2018·全国卷Ⅰ,T20 2018·全国卷Ⅰ,T19
2016·全国卷Ⅱ,T18 1.数学运算
2.数据分析
概率与统计的综合应用 2017·全国卷Ⅰ,T19 2017·全国卷Ⅱ,T18
2017·全国卷Ⅲ,T18 1.数学运算
2.数据分析
热点1 统计与统计案例(高考VS教材)
以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计、判断,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查信息提取与数据处理能力.
【例1】 (2018·全国卷Ⅱ)如图是某地区2000年到2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:eq \o(y,\s\up6(^))=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:eq \o(y,\s\up6(^))=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为eq \o(y,\s\up6(^))=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为eq \o(y,\s\up6(^))=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000年至2016年数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明
利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势,2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型eq \o(y,\s\up6(^))=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
[真题溯源] 本题第(1)问源于教材必修3P90例、P95B组T(1),第(2)问源于必修3P90T2、选修2-3P89T1,试题将教材习题有机整合,以统计图为背景,考查线性回归方程的判断和对线性回归模型的理解,考查数据处理能力、运算求解能力和应用意识,体现了直观想象、数学运算、数据分析等核心素养.
[变式训练]
某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼平均每天运动的时间(单位:分钟)进行调查,将收集的数据分成[0,10),[10,20),[20,30),[30,40),[40,50),[50,60]六组,并作出频率分布直方图(如图),将日均课外体育锻炼时间不低于40分钟的学生评价为“课外体育达标”.
分类 课外体育不达标 课外体育达标 总计
男 60
女 110
总计
(1)请根据直方图中的数据填写下面的2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”号性别有关?
(2)现按照“课外体育达标”与“课外体育不达标”进行分层抽样,抽取8人,再从这8名学生中随机抽取3人参加体育知识问卷调查,记“课外体育不达标”的人数为ξ,求ξ的分布列和数学期望.
P(K2≥k0) 0.15 0.05 0.025 0.010 0.005 0.001
k0 2.072 3.841 5.024 6.635 7.879 10.828
附:K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
解:(1)由题意得“课外体育达标”人数为200×[(0.02+0.005)×10]=50,
则“课外体育不达标”人数为150,
所以列联表如下:
分类 课外体育不达标 课外体育达标 总计
男 60 30