内容正文:
第八章 成对数据的统计分析(单元重点综合测试)
班级___________ 姓名___________ 学号____________ 分数____________
考试范围:全章的内容; 考试时间:120分钟; 总分:150分
一、填空题(本大题共有12题,满分54分,第1-6题每题4分,第7-12题每题5分)
1.下列关系中是相关关系的是 (填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
2.为了研究某班学生的脚步(单位厘米)和身高之间有线性相关关系,设其回归直线方程为.该班某学生的脚长为24,据此估计其身高为 .
3.在研究线性回归模型时, 样本数据(,,,,)所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则 .
4.调查某市出租车使用年限和该年支出维修费用(万元),得到数据如下表:
使用年限
2
3
4
5
6
维修费用
2.2
3.8
5.5
6.5
7.0
则线性回归方程是 .
5.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为:能否一次考试通过与是否集中培训 .(选填“有关”或“无关”)
6.已知具有线性相关关系的两个变量x、y之间的一组数据如下:
x
0
1
2
3
4
y
1
2a
5
7
若回归方程为,则 .
7.为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天的销售额的情况如下表所示:
开业天数
10
20
30
40
50
销售额/天(万元)
62
75
81
89
根据上表提供的数据,求得关于的线性回归方程为,由于表中有一个数据模糊看不清,请你推断出该数据的值为 .
8.随着工业化以及城市车辆的增加,城市的空气污染越来越严重,空气质量指数API一直居高不下,对人体的呼吸系统造成了的严重的影响.现调查了某市500名居民的工作场所和呼吸系统健康状况,得到列联表如下,则 .(结果精确到0.001)
室外工作
室内工作
总计
有呼吸系统疾病
150
无呼吸系统疾病
100
总计
200
9.对四组不同的数据进行统计,获得如题图所示的散点图,则样本相关系数从小到大依次为 .
10.通过随机询问110名不同性别的大学生是否爱好某项运动,得到如下的列联表:
男
女
爱好
40
20
不爱好
20
30
由算得,
参照附表,以下不正确的有 附表:
0.050
0.010
0.001
3.841
6.635
10.828
①在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”;
②在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”;
③有99.9%以上的把握认为“爱好该项运动与性别有关”;
④有99.9%以上的把握认为“爱好该项运动与性别无关”.
11.下列说法中正确的是 .
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程,变量增加1个单位时,平均增加5个单位;
③设具有相关关系的两个变量、的相关系数为,则越接近于0,和之间的线性相关程度越强;
④在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大.
12.已知高中学生的数学成绩,物理成绩,化学成绩两两成正相关关系,随机抽取10名同学,数学成绩和物理成绩的样本线性相关系数为,物理成绩与化学成绩的样本线性相关系数为,求的样本线性相关系数的最大值为 .
二、选择题(本题共有4题,满分18分,第13-14题每题4分,第15-16题每题5分;每题有且只有一个正确选项)
13.用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
14.如两个变量满足下表关系:
5
10
15
20
25
103
105
110
111
114
则两个变量线性相关程度( )
A.较高 B.较低 C.不相关 D.不确定.
15.为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对进行线性回归分析.若在此图中加上点后,再次对进行线性回归分析,则下列说法正确的是( )
A.不具有线性相关性 B.相关系数变大
C.相关系数变小 D.相关系数不变
16.某微生物科研团队为了研究某种细菌的繁殖情况,工作人员配制了一种适合该细菌繁殖的营养基质用以培养该细菌,通过相关设备以及分析计算后得到:该细菌在前3个小时的细菌数与时间(单位:小时,且)满足回归方程(其中为常数),若,且前3个小时与的部分数据如下表:
1
2
3
3个小时后,向该营养基质中加入某种细菌抑制剂,分析计算后得到细菌数与时间(单位:小时,且)满足关系式:,在时刻,该细菌数达到最大,随后细菌个数逐渐减少,则的值为( )
A.4 B. C.5 D.
3、 解答题(本大题共有5题,满分78分)
17.季节性流感分布广泛,儿童普遍易感.某区将去年春季该区患季节性流感的小朋友按照年龄与人数统计,得到如下数据:
年龄
2
3
4
5
6
患病人数
22
22
17
14
10
(1)求关于的线性回归方程;
(2)计算样本相关系数(计算结果精确到0.01),并回答是否可以认为该区去年春季患季节性流感人数与年龄负相关很强?(若,则、相关性很强;若,则、相关性一般;若,则、相关性较弱.)
18.为拉动消费,某市发行2亿元消费券.为了解该消费券使用人群的年龄结构情况,该市随机抽取了50人,对是否使用过消费券的情况进行调查,结果如下表所示,其中年龄低于45岁的人数占总人数的.
年龄(岁)
调查人数(人)
5
15
10
5
使用消费券人数(人)
5
10
12
7
2
1
(1)求、值;
(2)若以“年龄45岁为分界点”,由以上统计数据完成下面列联表,并判断是否有把握认为是否使用消费券与人的年龄有关.
年龄低于45岁的人数
年龄不低于45岁的人数
合计
使用消费券人数
未使用消费券人数
合计
19.某地生产队在面积相等的50000块稻田上种植一种新型水稻,从中抽取100块得到各块稻田的亩产量(单位:kg)与优质频数并部分整理成下表(最终亩产量均在900kg到1200kg之间)
亩产量
优质频数
5
10
14
18
6
普通频数
1
2
4
6
4
(1)这50000块稻田中,亩产量在的频数约为多少?
(2)估计这片稻田的平均亩产量(单位kg);
(3)已知在100块抽取稻田中亩产量在的优质稻田有25块,是否有0.95的把握认为产品是否优质与亩产量不少于1050kg且少于1200kg有关?(参考公式:,参考数据:)
20.为了检查一批零件的质量是否合格,检查员计划从中依次随机抽取零件检查:第次检查抽取号零件,测量其尺寸(单位:厘米).检查员共进行了100次检查,整理并计算得到如下数据:,,.
(1)这批零件共有1000个.若在抽查过程中,质量合格的零件共有60个,估计这批零件中质量合格的零件数量;
(2)若变量与存在线性关系,记,求回归系数的值;
(3)在抽出的100个零件中,检查员计划从中随机抽出20个零件进行进一步检查,记抽出的20个零件中有对相邻序号的零件,求的数学期望.
示例零件序号为“1、2、4、5”与“1、2、3、5”时均恰有2对相邻序号的零件.
参考公式:(1)线性回归方程:,其中,.
(2)期望的线性性质:,其中是若干随机变量.
21.云南花卉产业作为云南全力打造世界一流“绿色食品牌”的重点产业之一、从起步发展至今仅四十多年的时间,取得了令人瞩目的成绩.目前云南已成为全球公认的三大最适宜鲜切花种植的区域之一,鲜切花种植面积和产量位居全球第一,全省花卉种植面积稳定在190万亩左右.近8年云南省花卉种植面积统计数据及散点图如图
(1)经计算得下表中数据,根据散点图,在模型①:与模型②:,(均为常数)中,选择一个更适合作为云南省花卉种植面积关于年份代码的回归方程类型,求出关于的回归方程;
1.3
165.0
204
17.5
42
3.5
6448.3
1901.5
其中.
(2)运输过程中,为保证鲜切花质量,需对其存活天数进行研究.一品种鲜切花存活天数为随机变量,且最多只能存活天,研究人员发现,存活天数为的样本在存活天数超过的样本里占,存活天数为1的样本在全体样本中占.
①求;
②用表示该品种鲜切花存活天数的数学期望.
附:.
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
第八章 成对数据的统计分析(单元重点综合测试)
班级___________ 姓名___________ 学号____________ 分数____________
考试范围:全章的内容; 考试时间:120分钟; 总分:150分
一、填空题
1.下列关系中是相关关系的是 (填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
【答案】②③
【分析】根据相关关系是一种不确定的关系,是两个变量之间确实存在的关系,由此判断即可.
【解析】对于①,曲线上的点与该点的坐标之间的关系是一一对应关系,不是相关关系,是确定性关系;
对于②,苹果的产量与气候之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于③,森林中的同一种树木,其断面直径与高度之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于④,学生与他(她)的学号之间的关系是一种确定的对应关系,是映射,不是相关关系.
故答案为:②③
2.为了研究某班学生的脚步(单位厘米)和身高之间有线性相关关系,设其回归直线方程为.该班某学生的脚长为24,据此估计其身高为 .
【答案】
【分析】将代入回归直线方程即可得解.
【解析】由题意,令,则,
即该班某学生的脚长为24,据此估计其身高为厘米.
故答案为:.
3.在研究线性回归模型时, 样本数据(,,,,)所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则 .
【答案】
【分析】根据线性相关系数的定义直接得解.
【解析】由已知样本数据(,,,,)所对应的点均在直线上,
则,
又,
所以满足负相关,
即,
故答案为:.
4.调查某市出租车使用年限和该年支出维修费用(万元),得到数据如下表:
使用年限
2
3
4
5
6
维修费用
2.2
3.8
5.5
6.5
7.0
则线性回归方程是 .
【答案】
【分析】根据所给的数据,求出变量x,y的平均数,根据最小二乘法作出线性回归方程的系数b,再根据样本中心点一定在回归直线上,求出a的值;
【解析】变量x的平均数为:
变量y的平均数为: 代入公式得
,
所以回归直线方程为
故答案为:
5.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为:能否一次考试通过与是否集中培训 .(选填“有关”或“无关”)
【答案】有关
【分析】列出列联表,根据数据求得并判断.
【解析】依题意,列联表如下:
集中培训
分散培训
合计
一次考试通过
45
30
75
一次考试未通过
10
20
30
合计
55
50
105
则,
因此认为“能否一次考试通过与是否集中培训有关”的把握为97.5%,
所以能否一次考试通过与是否集中培训有关.
故答案为:有关
6.已知具有线性相关关系的两个变量x、y之间的一组数据如下:
x
0
1
2
3
4
y
1
2a
5
7
若回归方程为,则 .
【答案】2
【分析】先求样本中心点,利用回归方程一定经过样本中心点可求答案.
【解析】,,
因为回归方程为,所以,解得.
故答案为:2
7.为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天的销售额的情况如下表所示:
开业天数
10
20
30
40
50
销售额/天(万元)
62
75
81
89
根据上表提供的数据,求得关于的线性回归方程为,由于表中有一个数据模糊看不清,请你推断出该数据的值为 .
【答案】68
【分析】由样本中心在回归方程上并求出样本中心,代入求解.
【解析】设表中有一个数据模糊看不清的为m,
,,
由,得,得,
故答案为:68
8.随着工业化以及城市车辆的增加,城市的空气污染越来越严重,空气质量指数API一直居高不下,对人体的呼吸系统造成了的严重的影响.现调查了某市500名居民的工作场所和呼吸系统健康状况,得到列联表如下,则 .(结果精确到0.001)
室外工作
室内工作
总计
有呼吸系统疾病
150
无呼吸系统疾病
100
总计
200
【答案】3.968
【分析】由题意,根据列联表中所给数据补全列表,将数据代入公式得,计算即可得到答案.
【解析】补全列联表
室外工作
室内工作
总计
有呼吸系统疾病
150
200
350
无呼吸系统疾病
50
100
150
总计
200
300
500
.
故答案为:3.968.
9.对四组不同的数据进行统计,获得如题图所示的散点图,则样本相关系数从小到大依次为 .
【答案】
【分析】根据散点图直接观察比较即可.
【解析】由散点图可知图(1)与图(3)中的两个变量是正相关,故,.
图(2)与图(4)中的两个变量是负相关,故,.
又图(1)与图(2)中的样本点集中在一条直线附近,所以其相关系数的绝对值越接近1.
故答案为:.
10.通过随机询问110名不同性别的大学生是否爱好某项运动,得到如下的列联表:
男
女
爱好
40
20
不爱好
20
30
由算得,
参照附表,以下不正确的有 附表:
0.050
0.010
0.001
3.841
6.635
10.828
①在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”;
②在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”;
③有99.9%以上的把握认为“爱好该项运动与性别有关”;
④有99.9%以上的把握认为“爱好该项运动与性别无关”.
【答案】②③④
【分析】通过所给的观测值,同临界值表中的数据进行比较,发现,即可得到结论.
【解析】由列联表计算
,
参照附表知,,
所以在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”,
①正确,②错误;即有99%以上的把握认为“爱好该项运动与性别有关”,
且没有99.9%以上的把握认为“爱好该项运动与性别有关”,
也没有99.9%以上的把握认为“爱好该项运动与性别无关”,
所以③、④错误.
故答案为:②③④.
11.下列说法中正确的是 .
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程,变量增加1个单位时,平均增加5个单位;
③设具有相关关系的两个变量、的相关系数为,则越接近于0,和之间的线性相关程度越强;
④在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大.
【答案】①④
【分析】利用方差的性质判断①的正误;利用回归直线的性质判断②,相关系数判断③,独立检验判断④.
【解析】对于①,将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,满足方差的性质,①正确;
对于②,设有一个线性回归方程,变量x增加1个单位时,平均减少5个单位;所以②不正确;
对于③,设具有相关关系的两个变量x,y的相关系数为r,则越接近于0,x和y之间的线性相关程度越弱,所以③ 不正确;
对于④,在一个2×2列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大,所以④正确;
故答案为:①④.
12.已知高中学生的数学成绩,物理成绩,化学成绩两两成正相关关系,随机抽取10名同学,数学成绩和物理成绩的样本线性相关系数为,物理成绩与化学成绩的样本线性相关系数为,求的样本线性相关系数的最大值为 .
【答案】
【分析】利用相关系数公式可看成两个维向量的夹角公式,从而把相关系数问题转化为向量夹角问题,即可求解.
【解析】设,,,
则有,,,
由相关系数公式可知,
设与夹角为,与夹角为,
由和的样本相关系数为,所以,和的样本相关系数为,所以,
由这两个夹角为锐角,所以,所以与的夹角可能为,,
则与的夹角余弦最大值为.
故答案为:
二、单选题
13.用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
【答案】D
【分析】根据最小二乘法的概念和求解过程,即可求解.
【解析】根据最小二乘法的概念和求解,可得回归方程是为了使得每个数据与估计值之间的差的平方和最小.
故选:D.
14.如两个变量满足下表关系:
5
10
15
20
25
103
105
110
111
114
则两个变量线性相关程度( )
A.较高 B.较低 C.不相关 D.不确定.
【答案】A
【分析】根据表格中的数据,结合相关系数的公式,求得的值,即可得到答案.
【解析】根据表格中的数据,得,,,,
,,,
则,
所以两个变量与的相关程度较高.
故选:A
15.为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对进行线性回归分析.若在此图中加上点后,再次对进行线性回归分析,则下列说法正确的是( )
A.不具有线性相关性 B.相关系数变大
C.相关系数变小 D.相关系数不变
【答案】C
【分析】根据散点图,可判断A选项,加入点后,回归效果变差,从而可判断B,C,D选项.
【解析】对于A,加入点后,变量与预报变量相关性变弱,但不能说不具有线性相关性,故A错误;
对于B,C,D,由于点远离其他点,故加上点后,回归效果会变差,
所以相应的样本相关系数的绝对值会变小,
根据题中散点图,显然,所以会变小,故C正确,B,D错误.
故选:C.
16.某微生物科研团队为了研究某种细菌的繁殖情况,工作人员配制了一种适合该细菌繁殖的营养基质用以培养该细菌,通过相关设备以及分析计算后得到:该细菌在前3个小时的细菌数与时间(单位:小时,且)满足回归方程(其中为常数),若,且前3个小时与的部分数据如下表:
1
2
3
3个小时后,向该营养基质中加入某种细菌抑制剂,分析计算后得到细菌数与时间(单位:小时,且)满足关系式:,在时刻,该细菌数达到最大,随后细菌个数逐渐减少,则的值为( )
A.4 B. C.5 D.
【答案】A
【分析】根据给定条件,求出样本中心点求出b值,再分段讨论y的最大值情况作答.
【解析】依题意,,,由,,得,且经过点,
于是得,当时,单调递增,则当时,,
当时,,令,,
求导得:,当时,,当时,,
即函数在上单调递增,在上单调递减,当时,,
而,因此当时,细菌数取最大值,
所以的值为4.
故选:A
三、解答题
17.季节性流感分布广泛,儿童普遍易感.某区将去年春季该区患季节性流感的小朋友按照年龄与人数统计,得到如下数据:
年龄
2
3
4
5
6
患病人数
22
22
17
14
10
(1)求关于的线性回归方程;
(2)计算样本相关系数(计算结果精确到0.01),并回答是否可以认为该区去年春季患季节性流感人数与年龄负相关很强?(若,则、相关性很强;若,则、相关性一般;若,则、相关性较弱.)
【答案】(1)
(2),是
【分析】(1)根据线性回归方程的计算公式即可求解;
(2)根据相关系数的计算公式即可求解,然后判断相关系数的绝对值在哪个范围就能知道和相关性强弱.
【解析】(1)由题意可得,,
,
.
故关于的线性回归方程为;
(2),
由,可知、负相关.
又因为,所以、相关性很强.
因此,可以认为该区去年春季患季节性流感人数与年龄负相关很强.
18.为拉动消费,某市发行2亿元消费券.为了解该消费券使用人群的年龄结构情况,该市随机抽取了50人,对是否使用过消费券的情况进行调查,结果如下表所示,其中年龄低于45岁的人数占总人数的.
年龄(岁)
调查人数(人)
5
15
10
5
使用消费券人数(人)
5
10
12
7
2
1
(1)求、值;
(2)若以“年龄45岁为分界点”,由以上统计数据完成下面列联表,并判断是否有把握认为是否使用消费券与人的年龄有关.
年龄低于45岁的人数
年龄不低于45岁的人数
合计
使用消费券人数
未使用消费券人数
合计
【答案】(1),
(2)列联表见解析,有
【分析】(1)由题意可以列出方程,进而求出的值;
(2)先提出零假设: 是否使用消费券与人的年龄无关,再计算卡方值,然后与所给数据进行比较即可得出结论.
【解析】(1)由题意得解得,;
(2)由以上统计数据填写下面列联表,如下
年龄低于45岁的人数
年龄不低于45岁的人数
合计
使用消费券人数
27
10
37
未使用消费券人数
3
10
13
合计
30
20
50
零假设: 是否使用消费券与人的年龄无关
,
所以有把握认为是否使用消费券与人的年龄有关.
19.某地生产队在面积相等的50000块稻田上种植一种新型水稻,从中抽取100块得到各块稻田的亩产量(单位:kg)与优质频数并部分整理成下表(最终亩产量均在900kg到1200kg之间)
亩产量
优质频数
5
10
14
18
6
普通频数
1
2
4
6
4
(1)这50000块稻田中,亩产量在的频数约为多少?
(2)估计这片稻田的平均亩产量(单位kg);
(3)已知在100块抽取稻田中亩产量在的优质稻田有25块,是否有0.95的把握认为产品是否优质与亩产量不少于1050kg且少于1200kg有关?(参考公式:,参考数据:)
【答案】(1)块;
(2);
(3)没有.
【分析】(1)根据表格各区间的频数,结合样本容量,进而确定50000块稻田中的频数;
(2)由平均数求法求这片稻田的平均亩产量;
(3)根据表格列出列联表,应用卡方公式求卡方值,结合独立检验的基本思想得结论.
【解析】(1)由表格、、、、的亩产区间,
对应频数分别为,频数共为,故样本中亩产量在的频数约为.
所以,50000块稻田中亩产量在的频数约为块.
(2)由(1),抽取100块稻田的平均亩产量为.
所以,这片稻田的平均亩产量约为.
(3)由题意,可得如下列联表,
亩产
亩产
优质
29
49
78
普通
7
15
22
36
64
100
故,
所以,没有0.95的把握认为产品是否优质与亩产量不少于1050kg且少于1200kg有关.
20.为了检查一批零件的质量是否合格,检查员计划从中依次随机抽取零件检查:第次检查抽取号零件,测量其尺寸(单位:厘米).检查员共进行了100次检查,整理并计算得到如下数据:,,.
(1)这批零件共有1000个.若在抽查过程中,质量合格的零件共有60个,估计这批零件中质量合格的零件数量;
(2)若变量与存在线性关系,记,求回归系数的值;
(3)在抽出的100个零件中,检查员计划从中随机抽出20个零件进行进一步检查,记抽出的20个零件中有对相邻序号的零件,求的数学期望.
示例零件序号为“1、2、4、5”与“1、2、3、5”时均恰有2对相邻序号的零件.
参考公式:(1)线性回归方程:,其中,.
(2)期望的线性性质:,其中是若干随机变量.
【答案】(1)600个
(2)
(3)个
【分析】(1)利用样本质量合格的频率估计总体的概率,求总体中质量合格的零件数量.
(2)根据给出的公式可求的值.
(3)根据期望的线性性质求解.
【解析】(1)因为在这100个零件中,合格的零件为60个,
故质量合格的零件所占样本比例为.
而在这1000个零件中,质量合格的零件数为:(个).
(2)由可得,,
又因为,,
因此可得:.
代入数据可得:.
(3)用表示抽查的结果,若第个零件与第个零件被选中,则记;
若结果是其余情况,则记,.
由线性期望的性质可得:
(个).
21.云南花卉产业作为云南全力打造世界一流“绿色食品牌”的重点产业之一、从起步发展至今仅四十多年的时间,取得了令人瞩目的成绩.目前云南已成为全球公认的三大最适宜鲜切花种植的区域之一,鲜切花种植面积和产量位居全球第一,全省花卉种植面积稳定在190万亩左右.近8年云南省花卉种植面积统计数据及散点图如图
(1)经计算得下表中数据,根据散点图,在模型①:与模型②:,(均为常数)中,选择一个更适合作为云南省花卉种植面积关于年份代码的回归方程类型,求出关于的回归方程;
1.3
165.0
204
17.5
42
3.5
6448.3
1901.5
其中.
(2)运输过程中,为保证鲜切花质量,需对其存活天数进行研究.一品种鲜切花存活天数为随机变量,且最多只能存活天,研究人员发现,存活天数为的样本在存活天数超过的样本里占,存活天数为1的样本在全体样本中占.
①求;
②用表示该品种鲜切花存活天数的数学期望.
附:.
【答案】(1)更适合,
(2)①;②
【分析】(1)根据散点图,确定更适合,再利用换元法,以及题中的数据,代入公式求回归方程;
(2)①根据条件概率,以及地推关系,可证明数列是以0.18为首项,0.8为公比的等比数列,再根据分段函数的形式列出解析式;②根据①的结果,列式,再利用错位相减法,即可求解.
【解析】(1)由散点图可知,更适合作为云南省花卉种植面积y关于年份代码x的回归方程类型.
令,所以.
因为,,,,
所以.
所以,
所以.
云南省花卉种植面积y关于年份代码x的回归方程为.
(2)①由题可得,,
当时,,
又,即,
同理可得,当时,,
两式相减得,
即,,
因为,
所以当时,是以0.18为首项,0.8为公比的等比数列,
当时,,
所以
②
,
令,
则,
两式相减得,
,
所以,
则.
【点睛】关键点点睛:本题的关键是由条件概率,以及公式,从而列出数列的地推关系式时.
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$