内容正文:
《2021年数学(理)概率统计二轮突破提升》
专题03概率统计培优
一、非线性回归问题
通过变量间的相关关系对两个变量进行统计分析是数学的重要应用.其中非线性回归问题具有十分重要的现实意义.
例 (2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【解析】 (1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).
利用模型②,可得该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
【强调】
非线性回归方程的求法
(1)根据原始数据作出散点图.
(2)根据散点图,选择恰当的拟合函数.
(3)作恰当变换,将其转化成线性函数,求线性回归方程.
(4)在(3)的基础上通过相应变换,即可得非线性回归方程.
二、概率与统计的创新题型
概率统计问题在近几年的高考中背景取自现实,题型新颖,综合性增强,难度加深,掌握此类问题的解题策略在高考中就显得非常重要.
例 (2020·江苏)甲口袋中装有2个黑球和1个白球,乙口袋中装有3个白球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复n次这样的操作,记甲口袋中黑球个数为Xn,恰有2个黑球的概率为pn,恰有1个黑球的概率为qn.
(1)求p1,q1和p2,q2;
(2)求2pn+qn与2pn-1+qn-1的递推关系式和Xn的均值E(Xn)(用n表示).
【解析】 (1)p1=·=,q1=·=,
p2=··p1+··q1+0·(1-p1-q1)
=p1+q1=,
q2=··p1+·q1+··(1-p1-q1)
=-q1+=.
(2)当n≥2时,
pn=··pn-1+··qn-1+0·(1-pn-1-qn-1)=pn-1+qn-1,①
qn=··pn-1+·qn-1+··(1-pn-1-qn-1)
=-qn-1+,②
2×①+②,得2pn+qn=pn-1+qn-1-qn-1+=(2pn-1+qn-1)+.
从而2pn+qn-1=(2pn-1+qn-1-1),
又2p1+q1-1=,
所以2pn+qn=1+n-1=1+n,n∈N*.③
由②,有qn-=-,
又q1-=,
所以qn=n-1+,n∈N*.
由③,有pn=
=n+n+,n∈N*.
故1-pn-qn=n-n+,n∈N*.
Xn的分布列为
Xn
0
1
2
P
1-pn-qn
qn
pn
则E(Xn)=0×(1-pn-qn)+1×qn+2×pn
=1+n,n∈N*.
【强调】
概率统计问题考查学生的数据分析能力,要从已知数表中经过阅读分析判断获取关键信息,搞清各数据、各事件间的关系,建立适当的数学模型.
【突破提升练习】
1.某网站的调查显示,健身操类、跑步类、拉伸运动类等健身项目在大众健康项目中是比较火热的,但是大多数人的健身科学类知识相对缺乏,尤其是在健身指导方面.从某健身房随机抽取200名会员,对其平均每天健身时间进行调查,如下表,健身之前他们的体重情况如柱状图(1)所示,该健身房的教练为他们制订了健身计划,四个月后他们的体重情况如柱状图(2)所示.
平均每天健身时间(分钟)
人数
20
36
44
50
40
10
柱状图(1