内容正文:
高频热点6 非线性回归问题
基础巩固
1. 中国是茶的故乡,也是茶文化的发源地.中国发现和利用茶已有四千七百多年的历史,且长盛不衰,传遍全球.为了弘扬中国茶文化,某商家推出特色茶饮品“××排骨茶”,为了解每壶“××排骨茶”中所放茶叶量x(g)与食客的满意率y的关系,通过调查研究,发现可选择函数模型y=aebx+c来拟合y与x的关系,根据下表数据,可求得y关于x的回归方程为 ( )
茶叶量x/g
1
2
3
4
5
ln(100y)
4.34
4.36
4.44
4.45
4.51
A. y=e0.043x+4.291 B. y=e0.043x-4.291
C. y=e0.043x+4.291 D. y=e0.043x-4.291
2. 用模型y=menx+2(m>0)拟合一组数据时,设z=lny,将其变换后得到回归方程为=3x+2,则n-m的值为 ( )
A. -1 B. 1
C. -2 D. 2
3. 下列四个命题中正确的命题是 ( )
A. 在回归模型中,预报变量y的值不能由解释变量x唯一确定
B. 若变量x,y满足关系y=-0.1x+1,且变量y与z正相关,则x与z也正相关
C. 在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D. 以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性方程z=0.3x+4,则c=e4,k=0.3
4. 在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动,经计算则实数b的值为 .
5. (2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量(木材体积),随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i
根部横截面积xi/m2
材积量yi/m3
1
0.04
0.25
2
0.06
0.40
3
0.04
0.22
4
0.08
0.54
5
0.08
0.51
6
0.05
0.34
7
0.05
0.36
8
0.07
0.46
9
0.07
0.42
10
0.06
0.40
总计
0.60
3.90
并计算得
(1) 估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
(2) 求该林区这种树木的根部横截面积与材积量的样本相关系数.(精确到0.01)
(3) 现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=参考数据:≈1.377.
6. 某电视厂家准备在国庆期间举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万台)的数据如下:
年份
2015
2016
2017
2018
2019
2020
2021
x/万元
1
2
4
6
11
13
19
y/万台
1.9
3.2
4.0
4.4
5.2
5.3
5.4
(1) 若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程.
(2) 若用y=c+d模型拟合y与x的关系,可得回归方程=1.63+0.99,经计算线性回归模型和该模型的R2分别约为0.75和0.88,请用R2说明选择哪个回归模型更好.
(3) 已知利润z与x,y的关系为z=200y-x.根据(2)的结果回答下列问题:
① 广告费x=20时,销售量及利润的预报值是多少?
② 广告费x为何值时,利润的预报值最大?(精确到0.01)
参考公式:回归直线=a+bx的斜率和截距的最小二乘估计值分别为
=
参考数据:≈2.236.
综合应用
7. 人类已进入大数据时代.目前,全球年数据产生量已经从TB级别跃升到PB,EB,乃至ZB级别(1 TB=1 024 GB,1 PB=1 024 TB,1 EB=1 024 PB,1 ZB=1 024 EB).由国际数据公司的研究结果得到2008年至2020年全球年数据产生量(单位:ZB)的散点图.根据散点图,下面四个选项中最适宜刻画2008年至2020年全球年数据产生量y(ZB)和时间x(年)的函数模型是 ( )
(第7题图)
A. y=a+bx B. y=a+b
C. y=a+blnx D. y=a+bex
8. (多选)对具有相关关系的两个变量x和y进行回归分析时,经过随机