内容正文:
高中数学单元测试 —— 第八章 成对数据的统计分析(较难版02)
学校:___________姓名:___________班级:___________考号:___________
一、单选题
1.(本题5分)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
2.(本题5分)甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性做试验,分别求得样本相关系数r,如下表:
甲
乙
丙
丁
r
则试验结果中x,y两变量有更强线性相关性的是( ).
A.甲 B.乙 C.丙 D.丁
3.(本题5分)某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高条形图,则这80名学生中喜欢国画的人数为( )
A.24 B.32 C.48 D.58
4.(本题5分)如果记录了,的几组数据分别为,,,,那么y关于x的经验回归直线必过点( )
A. B. C. D.
5.(本题5分)下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
6.(本题5分)已知变量线性相关,其一组样本数据,满足,用最小二乘法得到的经验回归方程为.若增加一个数据后,得到修正后的回归直线的斜率为2.1,则数据的残差为( )
A.0.1 B.0.2 C.-0.2 D.-0.1
7.(本题5分)为了检测某种药物对预防疾病的效果,进行了小动物试验,得到如下列联表:
药物
疾病
合计
未患病
患病
服用
18
7
25
未服用
12
8
20
合计
30
15
45
已知,.根据小概率值的独立性检验,则下列结论正确的是( )
A.药物对预防疾病有效果
B.药物对预防疾病有效果,这个结论犯错误的概率不超过0.05
C.药物对预防疾病无效果
D.药物对预防疾病无效果,这个结论犯错误的概率不超过0.05
8.(本题5分)为研究某池塘中水生植物的覆盖水塘面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,用模型去拟合与的关系,设与的数据如表格所示:得到与的线性回归方程,则( )
3
4
6
7
2
2.5
4.5
7
A.-2 B.-1 C. D.
二、多选题
9.(本题6分)某类汽车在某年1至5月的销量(单位:千辆)如下表所示(其中2月份销量未知):
月份
1
2
3
4
5
月销量
2.4
4
5
5.5
若变量与之间存在线性相关关系,用最小二乘法估计建立的线性回归方程为,则下列说法正确的是( )
A.
B.样本相关系数
C.据该模型可以预测12月份的销量为11.29千辆
D.变量每增加1,变量增加0.81
10.(本题6分)关于统计量,下列说法正确的是( )
A.统计量的值越大,两个分类变量的线性相关程度越强
B.若求出统计量,由于6.31比较接近,因此能推断两个分类变量有关系,且犯错误概率不超过0.01
C.独立性检验的本质是比较观测值与期望值之间的差异,由统计量所代表的这种差异的大小是通过确定适当的小概率值来进行判断的
D.根据统计量的构造过程可知,的值越小,零假设成立的可能性越大.
11.(本题6分)为更好地促进同学们的动手能力,某学校拟开展物理实验周活动,组织同学们到实验室中开展物理实验.在某个实验中,某同学利用自己测量得出的实验数据(已知其中含1个异常样本点),利用最小二乘法进行计算得出了经验回归方程及决定系数.并利用计算机处理得到了以下的实验结果1,实验结果2为删除该异常样本点后利用最小二乘法进行计算得到的经验回归方程及决定系数,则( )
A.可认为该实验中的自变量与因变量符合线性回归模型
B.推测实验结果1中的异常样本点的自变量的值可能为0.33
C.由于,则实验结果1相较于实验结果2拟合更好
D.实验结果1的因变量的平均值大于实验结果2的因变量的平均值
三、填空题
12.(本题5分)为了解性别因素是否对某班学生爱运动有影响,对该班50名学生进行了问卷调查,得到如表的2×2列联表:
爱运动
不爱运动
合计
男生
m
12
30
女生
8
20
合计
n
50
则m=_______,n=______.
13.(本题5分)两个相关变量的…组数据统计如下表
2
3
4
5
6
2.8
3.1
3.3
3.8
4.0
根据上表可得经验回归方程中的,据此经验回归方程,当时,的预测值为________;
14.(本题5分)为了调查A,B两个地区的观众是否喜欢娱乐节目M,某电视台随机调查了A,B两个地区的2x名观众,已知从A,B两个地区随机调查的人数相同,A地区喜欢娱乐节目M的人数占A地区参与调查的总人数的,B地区喜欢娱乐节目M的人数占B地区参与调查的总人数的,若根据独立性检验认为喜欢娱乐节目M和地区有关,且此推断犯错误的概率超过0.01但不超过0.05,则所有x构成的集合为__________.
附表:,其中.
0.050
0.010
3.841
6.635
四、解答题
15.(本题13分)某公司利润与销售总额之间有如下对应数据:
亿元
1.0
1.5
1.7
2.0
2.5
2.8
3.2
万元
1000
1300
1800
2000
2600
2700
3300
(1)画出散点图;
(2)判断与是否具有线性相关关系.
16.(本题15分)某校为了解学生喜欢足球是否与性别有关联,随机抽取了男、女同学各100名进行调查,得到如下列联表:
喜欢足球
不喜欢足球
合计
男生
40
女生
30
合计
(1)请将上面的列联表补充完整;
(2)并依据小概率值的独立性检验,能否认为该校学生喜欢足球与性别有关联?
参考公式:,其中.
参考数据:
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
17.(本题15分)众所周知,乒乓球被称为中国的“国球”,是一种世界流行的球类体育项目,包括进攻、对抗和防守.某学校为了丰富学生的课后活动内容,增强学生体质,决定组织乒乓球活动社.以下是接下来7个星期(用x=1表示第1个星期,用x=2表示第二个星期,以此类推)参加活动的累计人数y(人)的统计数据.
x
1
2
3
4
5
6
7
y
6
14
20
37
74
108
203
(1)根据表中数据可以判断y与x大致满足回归模型,试建立y与x的回归方程(精确到0.01);
(2)为了更好地开展体育类型活动,学校继续调查全校同学的身高情况.采用按比例分层抽样抽取了男生30人,其身高的平均数和方差分别为171.5和13.0;抽取了女生20人,其身高的平均数和方差分别为161.5和27.0,试求全体学生身高的平均数和方差.
参考数据:,其中;
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
18.(本题17分)中国的航天事业历经数十年的发展,已经形成了完整的航天技术体系,涵盖运载火箭、 载人航天、深空探测等多个领域. 某学校为了解学生对航天工程的关注情况,随机从该校学生中抽取男生和女生各 100 人进行调查, 调查结果如下表:
关注
不关注
合计
男生
75
25
100
女生
55
45
100
合计
130
70
200
(1)根据小概率值 的独立性检验,能否认为该校学生对航天工程的关注情况与性别有关?
(2)为了激发同学们对航天工程的关注,该校举办了一次航天知识闯关比赛,比赛有两个答题方案可供选择:
方案一:回答4个问题,至少答对3个问题才能晋级;
方案二:在4个问题中随机选择2个问题作答,都答对才能晋级.
已知该校学生甲答对这4个问题的概率分别为,学生甲回答这4个问题正确与否相互独立,则学生甲选择哪种方案晋级的可能性更大? 请说明理由. 参考公式及参考数据:
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
19.(本题17分)脑机接口,即指在人或动物大脑与外部设备之间创建的直接连接,实现脑与设备的信息交换.近日埃隆.马斯克宣布,脑机接口公司Neuralink正在接收第二位植入者申请,该试验可以实现意念控制手机和电脑.未来10到20年,我国脑机接口产业将产生数百亿元的经济价值.为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量(单位:亿元)与研发人员增量(人)的10组数据.现用模型①,②分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图.
根据收集到的数据,计算得到下表数据,其中.
7.5
2.25
82.50
4.50
12.14
2.88
(1)根据残差图,判断应选择哪个模型;(无需说明理由)
(2)根据(1)中所选模型,求出关于的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少多少人?(精确到1)
附:对于一组具有线性相关关系的数据,其经验回归直线的斜率和截距的最小二乘估计分别为
试卷第1页,共3页
答案第1页,共1页
学科网(北京)股份有限公司
$
高中数学单元测试 —— 第八章 成对数据的统计分析(较难版02)
学校:___________姓名:___________班级:___________考号:___________
一、单选题
1.(本题5分)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
【答案】D
【分析】根据相关关系的定义判断即可.
【详解】对于A:人的身高与受教育的程度不具有相关关系,故A错误;
对于B:人的体重与眼睛的近视程度不具有相关关系,故B错误;
对于C:企业员工的工号与工资不具有相关关系,故C错误.
对于D:儿子的身高与父亲的身高具有相关关系,故D正确.
故选:D
2.(本题5分)甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性做试验,分别求得样本相关系数r,如下表:
甲
乙
丙
丁
r
则试验结果中x,y两变量有更强线性相关性的是( ).
A.甲 B.乙 C.丙 D.丁
【答案】C
【分析】由相关系数的绝对值的大小判断,越接近1则有更强的线性相关性.
【详解】由已知,丙的相关系数的绝对值为,是四人中最大的且最接近1,
因此丙同学的试验结果中x,y两变量有更强的线性相关性.
故选:C.
3.(本题5分)某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高条形图,则这80名学生中喜欢国画的人数为( )
A.24 B.32 C.48 D.58
【答案】D
【分析】根据等高条形图计算直接得出结果.
【详解】由等高条形图可知,
这80名学生中喜欢国画的人数为:
.
故选:D
4.(本题5分)如果记录了,的几组数据分别为,,,,那么y关于x的经验回归直线必过点( )
A. B. C. D.
【答案】D
【分析】求出得中心点,即为所求.
【详解】由已知,,
所以回归直线必过点.
故选:D.
5.(本题5分)下列实际问题不适合用独立性检验解决的是( )
A.不良的饮食习惯是否会导致肠胃疾病
B.某公司的营业额在过去5年逐年变化的情况
C.参加课外辅导能否提高学习成绩
D.男性和女性在职业选择偏好上是否有差异
【答案】B
【分析】根据独立性检验的基本思想,即可判断选项.
【详解】独立性检验是通过统计学方法来检验两个分类变量之间是否存在关联性,
ACD满足独立性检验的基本思想,B选项只是公司的营业额这一个变量在过去5年的变化情况,不满足独立性检验的基本思想.
故选:B
6.(本题5分)已知变量线性相关,其一组样本数据,满足,用最小二乘法得到的经验回归方程为.若增加一个数据后,得到修正后的回归直线的斜率为2.1,则数据的残差为( )
A.0.1 B.0.2 C.-0.2 D.-0.1
【答案】A
【分析】先求出新增数据后的样本中心点,从而得到修正后的回归直线,得到的估计值为即可求出残差.
【详解】因,则,则,
则新增数据后,,,
因新的回归直线过点,且修正后的回归直线的斜率为2.1,
则,则修正后的回归直线为:,
则的估计值为,则数据的残差为.
故选:A
7.(本题5分)为了检测某种药物对预防疾病的效果,进行了小动物试验,得到如下列联表:
药物
疾病
合计
未患病
患病
服用
18
7
25
未服用
12
8
20
合计
30
15
45
已知,.根据小概率值的独立性检验,则下列结论正确的是( )
A.药物对预防疾病有效果
B.药物对预防疾病有效果,这个结论犯错误的概率不超过0.05
C.药物对预防疾病无效果
D.药物对预防疾病无效果,这个结论犯错误的概率不超过0.05
【答案】C
【分析】通过计算列联表的统计量,与给定的临界值比较,来判断药物对预防疾病是否有效果.
【详解】零假设:药物对预防疾病无效果,
根据列联表数据,,
根据,将数据代入可得:
,
,根据小概率值的独立性检验,,
所以我们没有充分证据拒绝原假设,即认为药物对预防疾病无效果.
故选:C.
8.(本题5分)为研究某池塘中水生植物的覆盖水塘面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,用模型去拟合与的关系,设与的数据如表格所示:得到与的线性回归方程,则( )
3
4
6
7
2
2.5
4.5
7
A.-2 B.-1 C. D.
【答案】C
【分析】根据已知条件,求得,进而代入回归方程可求得,从而得出,联立,即可求得本题答案.
【详解】由已知可得,,,
所以,有,解得,
所以,,
由,得,
所以,,则.
故选:C.
二、多选题
9.(本题6分)某类汽车在某年1至5月的销量(单位:千辆)如下表所示(其中2月份销量未知):
月份
1
2
3
4
5
月销量
2.4
4
5
5.5
若变量与之间存在线性相关关系,用最小二乘法估计建立的线性回归方程为,则下列说法正确的是( )
A.
B.样本相关系数
C.据该模型可以预测12月份的销量为11.29千辆
D.变量每增加1,变量增加0.81
【答案】AC
【分析】对于A,根据回归直线必过样本中心点可解得;对于B,根据表格和相关系数的意义,即可判断;对于C,利用回归方程可求出预测值.即可判断;对于D,经验回归直线方程的意义,即可判断.
【详解】对于A,由题意知,回归直线必过样本点的中心),由,
又,代入方程得,,
所以,解得,故A正确.
对于B,由表格可知变量与正相关,则,故B错误.
对于C,当时,,即预测12月份的销量为11.29千辆,故C正确.
对于D,线性回归模型只起到预测作用,变量每增加1,变量不一定增加,故D错误.
故选:AC.
10.(本题6分)关于统计量,下列说法正确的是( )
A.统计量的值越大,两个分类变量的线性相关程度越强
B.若求出统计量,由于6.31比较接近,因此能推断两个分类变量有关系,且犯错误概率不超过0.01
C.独立性检验的本质是比较观测值与期望值之间的差异,由统计量所代表的这种差异的大小是通过确定适当的小概率值来进行判断的
D.根据统计量的构造过程可知,的值越小,零假设成立的可能性越大.
【答案】CD
【分析】根据独立性检验的思想以及的性质逐项分析判断.
【详解】对于选项A:统计量的值越大,两个分类变量的相关的可能性越大,与线性相关程度无关,故A错误;
对于选项B:因为,
在犯错误概率不超过0.01的前提下,没有足够条件推断两个分类变量有关系,故B错误;
对于选项C:根据独立性检验思想可知:
独立性检验的本质是比较观测值与期望值之间的差异,由统计量所代表的这种差异的大小是通过确定适当的小概率值来进行判断的,故C正确;
对于选项D:根据独立性检验思想可知:的值越小,零假设成立的可能性越大,故D正确;
故选:CD.
11.(本题6分)为更好地促进同学们的动手能力,某学校拟开展物理实验周活动,组织同学们到实验室中开展物理实验.在某个实验中,某同学利用自己测量得出的实验数据(已知其中含1个异常样本点),利用最小二乘法进行计算得出了经验回归方程及决定系数.并利用计算机处理得到了以下的实验结果1,实验结果2为删除该异常样本点后利用最小二乘法进行计算得到的经验回归方程及决定系数,则( )
A.可认为该实验中的自变量与因变量符合线性回归模型
B.推测实验结果1中的异常样本点的自变量的值可能为0.33
C.由于,则实验结果1相较于实验结果2拟合更好
D.实验结果1的因变量的平均值大于实验结果2的因变量的平均值
【答案】AB
【分析】利用图即可判断AB,由决定系数的意义即可判断C,根据图象估计平均值即可判断D.
【详解】对于A:由散点图可知该实验中的自变量与因变量符合线性回归模型,故A正确;
对于B:根据实验结果1的图可知异常样本点的自变量的值可能为0.33,故B正确;
对于C:由于,则实验结果2相较于实验结果1拟合得更好,故C错误;
对于D:由于实验结果1包含了异常样本点对应的因变量值接近,比其他正常样本点对应的因变量值小得多,
故实验结果1的因变量的平均值小于实验结果2的因变量的平均值,即D错误.
故选:AB.
三、填空题
12.(本题5分)为了解性别因素是否对某班学生爱运动有影响,对该班50名学生进行了问卷调查,得到如表的2×2列联表:
爱运动
不爱运动
合计
男生
m
12
30
女生
8
20
合计
n
50
则m=_______,n=______.
【答案】 18 24
【分析】完善列联表,即可得解;
【详解】依题意可得列联表如下:
经常打篮球
不经常打篮球
合计
男生
18
12
30
女生
8
20
合计
50
故;
故答案为:;;
13.(本题5分)两个相关变量的…组数据统计如下表
2
3
4
5
6
2.8
3.1
3.3
3.8
4.0
根据上表可得经验回归方程中的,据此经验回归方程,当时,的预测值为________;
【答案】4.33
【分析】先根据表格求出的平均值,然后代入经验回归方程求出,然后得到经验回归方程的解析式,最后将代入方程即可得到预测值.
【详解】根据表格数据可得:
,.
因为经验回归方程过点,,
所以,解得.
所以经验回归方程为.
当时,.
故答案为:4.33.
14.(本题5分)为了调查A,B两个地区的观众是否喜欢娱乐节目M,某电视台随机调查了A,B两个地区的2x名观众,已知从A,B两个地区随机调查的人数相同,A地区喜欢娱乐节目M的人数占A地区参与调查的总人数的,B地区喜欢娱乐节目M的人数占B地区参与调查的总人数的,若根据独立性检验认为喜欢娱乐节目M和地区有关,且此推断犯错误的概率超过0.01但不超过0.05,则所有x构成的集合为__________.
附表:,其中.
0.050
0.010
3.841
6.635
【答案】
【分析】求出的观测值,利用给定信息,结合独立性检验列出不等式求解即得.
【详解】列联表为:
喜欢
不喜欢
合计
A地区
B地区
合计
,
由认为喜欢娱乐节目M和地区有关,且此推断犯错误的概率超过0.01但不超过0.05,
得,则,解得,又是5的倍数,
则可以取的值为,所以x构成的集合为.
故答案为:
四、解答题
15.(本题13分)某公司利润与销售总额之间有如下对应数据:
亿元
1.0
1.5
1.7
2.0
2.5
2.8
3.2
万元
1000
1300
1800
2000
2600
2700
3300
(1)画出散点图;
(2)判断与是否具有线性相关关系.
【答案】(1)散点图见解析
(2)与具有线性相关关系
【分析】(1)依据数据描点得到散点图;
(2)根据散点图判断线性相关.
【详解】(1)根据表中数据,画出散点图如图所示.
(2)根据散点图中点的分布呈带状,且在一条直线的附近,判断与具有线性相关关系.
16.(本题15分)某校为了解学生喜欢足球是否与性别有关联,随机抽取了男、女同学各100名进行调查,得到如下列联表:
喜欢足球
不喜欢足球
合计
男生
40
女生
30
合计
(1)请将上面的列联表补充完整;
(2)并依据小概率值的独立性检验,能否认为该校学生喜欢足球与性别有关联?
参考公式:,其中.
参考数据:
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
喜欢足球
不喜欢足球
合计
男生
60
40
100
女生
30
70
100
合计
90
110
200
(2)有关
【详解】(1)
喜欢足球
不喜欢足球
合计
男生
60
40
100
女生
30
70
100
合计
90
110
200
(2)零假设为:该校学生喜欢足球与性别无关,
而,
依据小概率值的独立性检验,推断不成立,
即认为该校学生喜欢足球与性别有关.
17.(本题15分)众所周知,乒乓球被称为中国的“国球”,是一种世界流行的球类体育项目,包括进攻、对抗和防守.某学校为了丰富学生的课后活动内容,增强学生体质,决定组织乒乓球活动社.以下是接下来7个星期(用x=1表示第1个星期,用x=2表示第二个星期,以此类推)参加活动的累计人数y(人)的统计数据.
x
1
2
3
4
5
6
7
y
6
14
20
37
74
108
203
(1)根据表中数据可以判断y与x大致满足回归模型,试建立y与x的回归方程(精确到0.01);
(2)为了更好地开展体育类型活动,学校继续调查全校同学的身高情况.采用按比例分层抽样抽取了男生30人,其身高的平均数和方差分别为171.5和13.0;抽取了女生20人,其身高的平均数和方差分别为161.5和27.0,试求全体学生身高的平均数和方差.
参考数据:,其中;
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)
(2)平均数为167.5,方差为42.6
【分析】(1)利用对数变换将非线性回归模型转化为线性回归模型,再根据给定的参考公式求出线性回归方程的系数,进而得到与的回归方程;
(2)根据分层抽样的性质,利用平均数和方差的计算公式来求解全体学生身高的平均数和方差.
【详解】(1)已知,两边取常用对数可得,
设,,,则回归方程变为.
先计算,,,.
根据参考公式,,将,,,代入可得:
.
.
则,
因为,,所以,则;,则.
所以与的回归方程为.
即
(2)全体学生身高的平均数.
根据方差公式(其中为各层人数,为各层方差,为各层平均数,为总平均数).
将,,,,,,代入可得:
则全体学生身高的平均数为167.5,方差为42.6.
18.(本题17分)中国的航天事业历经数十年的发展,已经形成了完整的航天技术体系,涵盖运载火箭、 载人航天、深空探测等多个领域. 某学校为了解学生对航天工程的关注情况,随机从该校学生中抽取男生和女生各 100 人进行调查, 调查结果如下表:
关注
不关注
合计
男生
75
25
100
女生
55
45
100
合计
130
70
200
(1)根据小概率值 的独立性检验,能否认为该校学生对航天工程的关注情况与性别有关?
(2)为了激发同学们对航天工程的关注,该校举办了一次航天知识闯关比赛,比赛有两个答题方案可供选择:
方案一:回答4个问题,至少答对3个问题才能晋级;
方案二:在4个问题中随机选择2个问题作答,都答对才能晋级.
已知该校学生甲答对这4个问题的概率分别为,学生甲回答这4个问题正确与否相互独立,则学生甲选择哪种方案晋级的可能性更大? 请说明理由. 参考公式及参考数据:
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)能有的把握认为该校学生对航天工程的关注与性别有关
(2)学生甲选择方案一晋级的可能性更大
【分析】(1)根据已知列联表,计算的值并作出判断;
(2)根据相互独立概率计算,求得两种方案晋级的概率,从而作出判断.
【详解】(1)零假设:设认为该校学生对航天工程的关注与性别无关,
根据列联表可得:
,
能有的把握认为该校学生对航天工程的关注与性别有关.
(2)记这4个问题为,,,,学生甲答对,,,的事件分别记为,,,,
分别记按方案一、二晋级的概率为,,
则
,
,
因为,学生甲选择方案一晋级的可能性更大.
19.(本题17分)脑机接口,即指在人或动物大脑与外部设备之间创建的直接连接,实现脑与设备的信息交换.近日埃隆.马斯克宣布,脑机接口公司Neuralink正在接收第二位植入者申请,该试验可以实现意念控制手机和电脑.未来10到20年,我国脑机接口产业将产生数百亿元的经济价值.为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量(单位:亿元)与研发人员增量(人)的10组数据.现用模型①,②分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图.
根据收集到的数据,计算得到下表数据,其中.
7.5
2.25
82.50
4.50
12.14
2.88
(1)根据残差图,判断应选择哪个模型;(无需说明理由)
(2)根据(1)中所选模型,求出关于的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少多少人?(精确到1)
附:对于一组具有线性相关关系的数据,其经验回归直线的斜率和截距的最小二乘估计分别为
【答案】(1)选择模型②
(2),10人
【分析】(1)根据残差图分析判断;
(2)令与可用线性回归来拟合,有,然后根据公式结合已知的数据求出,从而可求出关于的经验回归方程,进而可求出关于的经验回归方程,再由可求出研发人员增量.
【详解】(1)选择模型②,理由如下:
由于模型②残差点比较均匀在落在水平的带状区域中,且带状区域的宽度比模型①带状宽度窄,
所以模型②的拟合精度更高,回归方程的预报精度相应就会越高,所以模型②比较合适.
(2)根据模型②,令与可用线性回归来拟合,有.
则,所以
则关于的经验回归方程为,所以关于的经验回归方程为.
由题意,,解得,又为整数,所以.
所以,要使年收益增量超过8亿元,研发人员增量至少为10人.
试卷第1页,共3页
答案第1页,共1页
学科网(北京)股份有限公司
$