内容正文:
10成对数据的统计相关性(人教2019A版专用)
目录
【自学概念】 2
【自学考点】 3
考点一:变量的相关关系 3
考点二:样本相关系数 8
【自学检测】 15
自学概念
1. 变量的相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2. 散点图、线性相关
(1)每一个序号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们把这样的统计图叫做散点图.
(2)如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
如果一个变量值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
(3)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
3. 样本相关系数
(1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多.
(2)r=.我们称r为变量x和变量y的样本相关系数.
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
(3)样本数据相关系数r的绝对值大小反映成对数据之间线性相关的程度.
①当|r|越接近1时,成对样本数据的线性相关程度越强;
②当|r|越接近0时,成对样本数据的线性相关程度越弱.
③当r=0时,成对样本数据间没有线性相关关系.
自学考点
考点一:变量的相关关系
一、单选题
1.(21-22高二上·宁夏银川·期末)给出下列结论:
①如果数据的平均数为3,方差为0.2,则的平均数和方差分别为14和1.8;②若两个变量的线性相关性越强,则相关系数r的值越接近于1.③对A、B、C三种个体按3:1:2的比例进行分层抽样调查,若抽取的A种个体有15个,则样本容量为30.则正确的个数是( ).
A.3 B.2
C.1 D.0
2.(23-24高二下·辽宁·期中)下列变量之间的关系不是相关关系的是( )
A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重
C.某正方形的边长与此正方形的面积 D.人的身高与体重
3.(23-24高二上·全国·课后作业)对两个变量的四组数据进行统计,获得如图所示的散点图,关于两个变量相关系数的比较,正确的是( )
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
二、多选题
4.(2020·山东济宁·二模)下列说法中正确的是( )
A.对具有线性相关关系的变量有一组观测数据,其线性回归方程是,且,则实数的值是
B.正态分布在区间和上取值的概率相等
C.若两个随机变量的线性相关性越强,则相关系数的值越接近于1
D.若一组数据的平均数是2,则这组数据的众数和中位数都是2
5.(21-22高二·全国·课后作业)下列变量间可能用直线拟合的是( )
A.光照时间与大棚内蔬菜的产量 B.某正方形的边长与此正方形的面积
C.举重运动员所能举起的最大重量与他的体重 D.某人的身高与视力
6.(2023高一上·全国·专题练习)某市7天国庆节假期期间的楼房认购量(单位:套)与成交量(单位:套)的折线图如下图所示,小明同学根据折线图对这7天的认购量与成交量作出如下判断,则下列结论错误的是( )
A.日成交量的中位数是16
B.日成交量超过日平均成交量的有2天
C.认购量与日期正相关
D.10月7日认购量的增量大于10月7日成交量的增量
三、填空题
7.(21-22高二·全国·课后作业)有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是 .
8.(23-24高一下·江西·期末)下列两个变量之间具有相关关系的是 .
①正方形的边长a和面积S;
②一个人的身高h和右手一拃长x;
③真空中的自由落体运动其下落的距离h和下落的时间t;
④一个人的身高h和体重x.
9.(23-24高一下·甘肃白银·阶段练习)下列结论:①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其中正确的是 .(将所有正确的序号填上)
参考答案
1【答案】B
【分析】对结论逐一判断
【详解】对于①,则的平均数为,方差为,故①正确
对于②,若两个变量的线性相关性越强,则相关系数r的绝对值越接近于1,故②错误
对于③,对A、B、C三种个体按3:1:2的比例进行分层抽样调查,若抽取的A种个体有15个,则样本容量为,故③正确
故正确结论为2个
故选:B
2【答案】C
【分析】根据变量间的相关关系和函数关系判断即可.
【详解】C中的两个变量之间是确定的函数关系,A,B,D中的两个变量之间的关系都是相关关系.
故选:C
3【答案】A
【分析】
根据散点图的分布与相关系数的关系判断即可.
【详解】
由相关系数及散点图反映了线性相关关系的知识,可知r2<r4<0<r3<r1.
故选:A
4【答案】ABD
【分析】由已知求出可得,代入可解得,即可判断A;根据正态分布的对称性,即可判断选项B;若两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1,可得C答案错误;由一组数据的平均数是2算出,即可判断D答案正确.
【详解】由可得
,代入可解得,故A答案正确;
因为区间和关于对称,
所以正态分布在区间和上取值的概率相等,
故B答案正确;
若两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1,
故C答案错误;
若一组数据的平均数是2,即
解得,所以这组数的众数和中位数都是2,故D答案正确
故选:ABD
【点睛】本题考查的知识点有:线性回归分析、正态分布、平均数、中位数和众数,属于基础题.
5【答案】AC
【分析】判断两个变量之间是否有线性相关性进行求解.
【详解】对于选项A,光照时间与大棚内蔬菜的产量中的两个变量之间均存在某种关系,若存在线性关系就可用直线拟合,故A正确;
对于选项B,某正方形的边长与此正方形的面积这两个变量之间是确定的函数关系,不能用直线拟合,故B错误;
对于选项C,举重运动员所能举起的最大重量与他的体重中的两个变量之间均存在某种关系,若存在线性关系就可用直线拟合,故C正确;
对于选项D,某人的身高与视力这两个变量之间无任何关系,不能用直线拟合,故D错误.
故选:AC.
6【答案】ABC
【分析】根据中位数的定义判断A,求出平均数判断B,根据正相关的概念判断C,计算认购量与成交量的增量判断D.
【详解】将成交量数据按大小顺序排列,中位数为26,所以A错;
日平均成交量为,超过的只有一天,所以B错;
由题图可以看出,数据点并不是从左下至右上分布,所以C错;
10月7日认购量的增量为,成交量的增量为,所以D对.
故选:ABC.
7【答案】②
【分析】结合已知条件,利用相关关系和函数关系的概念以及二者之间的区别即可求解.
【详解】对于①,汽车重量和汽车每小号1升汽油所行驶的平均路程是负相关的关系,故①错误;
对于②,平均日学习时间和平均学习成绩的关系是一个正相关关系,故②正确;
对于③,立方体的棱长和体积是函数关系,不是相关关系,故③错误.
故答案为:②.
8【答案】②④
【分析】根据相关关系是表示两个变量之间有一定的关系,但不是确定的关系,判断即可.
【详解】对于①,正方形的边长a和面积S是函数关系,不是相关关系;
对于②,一般情况下,一个人的身高h和右手一拃长x是正相关关系;
对于③,真空中的自由落体运动其下落的距离h和下落的时间t是函数关系,不是相关关系;
对于④,一般情况下,一个人的身高h和他的体重x是正相关关系.
故答案为:②④.
【点睛】本题考查了两个变量间的相关关系,考查了理解辨析能力,属于一般题目.
9【答案】①②④
【分析】根据函数关系、相关关系与回归分析的定义辨析即可.
【详解】根据函数关系及相关关系的定义,①函数关系是一种确定性关系.②相关关系是一种非确定性关系.是正确的;由回归分析的定义及应用可知,④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
故答案为:①②④.
【点睛】本题主要考查了回归分析的辨析,属于基础题.
考点二:样本相关系数
一、单选题
1.(24-25高三上·四川成都·开学考试)为考察两个变量的相关性,搜集数据如表,则两个变量的线性相关程度( )
5
10
15
20
25
103
105
110
111
114
(参考数据:,,,,,)
A.很强 B.很弱 C.无相关 D.不确定
2.(23-24高二下·广东珠海·阶段练习)一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
3.(24-25高三上·四川自贡·期中)根据变量和的成对样本数据,由一元线性回归模型得到经验回归模型,求得残差图.对于以下四幅残差图,满足一元线性回归模型中对随机误差假设的是( )
A. B.
C. D.
二、多选题
4.(23-24高三下·广西柳州·阶段练习)两个具有线性相关关系的变量的一组数据可建立经验回归方程,下列说法正确的是( ).
A.相关系数越接近1,变量x,y相关性越强 .
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.残差
D.决定系数越小,残差平方和越大,即模型的拟合效果越差
5.(23-24高二下·福建·期末)对具有相关关系的两个变量x和进行回归分析时,下列结论正确的是( )
A.若A,B两组成对数据的样本相关系数分别为,,则A组数据比B组数据的相关性较强
B.若所有样本点都落在一条斜率为非零实数的直线上,则决定系数的值为1
C.若样本点的经验回归方程为,则在样本点处的残差为0.3
D.以模型去拟合一组数据时,为求出回归方程,设,将其变换后得到线性方程,则c,k的值分别是和2
6.(24-25高三上·浙江·开学考试)下列说法正确的是( )
A.已知随机变量服从正态分布,越小,表示随机变量分布越集中
B.数据1,9,4,5,16,7,11,3的第75百分位数为9
C.线性回归分析中,若线性相关系数越大,则两个变量的线性相关性越弱
D.已知随机变量,则
三、填空题
7.(24-25高三上·上海·课后作业)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据可知,y与x的相关系数为 .(精确到0.01,参考数据:,,)
8.(21-22高二下·山东青岛·期中)高中女学生的身高预报体重的回归方程是(其中,的单位分别是cm,kg),则此方程在样本点处的残差是 .
9.(21-22高二下·宁夏·阶段练习)有一组统计数据和,根据数据建立了如下的两个模型:①,②.通过残差分析发现第①个线性模型比第②个线性模型拟合效果好.若分别是相关指数和残差平方和,则下列结论正确的是 .①>,②<,③<,④>.
四、解答题
10.(2024高三·全国·专题练习)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额的统计表(金额(万元)).
月份
1月
2月
3月
4月
5月
月份编号
1
2
3
4
5
金额(万元)
7
12
13
19
24
根据统计表,
(1)求该公司带货金额的平均值;
(2)求该公司带货金额与月份编号的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为与的线性相关性较强;,则认为与的线性相关性较弱);
附:相关系数公式,参考数据:,,,.
11.(2024·陕西安康·模拟预测)某乒乓球训练机构以训练青少年为主,其中有一项打定点训练,就是把乒乓球打到对方球台的指定位置(称为“准点球”),在每周末,记录每个接受训练的学员在训练时打的所有球中“准点球”的百分比(),A学员已经训练了1年,下表记录了学员最近七周“准点球”的百分比:
周次(x)
1
2
3
4
5
6
7
52
52.8
53.5
54
54.5
54.9
55.3
若.
(1)根据上表数据,计算与的相关系数,并说明与的线性相关性的强弱;
(若,则认为与线性相关性很强;若,则认为与线性相关性一般;若,则认为与线性相关性较弱)(精确到)
(2)求关于的回归方程,并预测第周“准点球”的百分比.(精确到)
参考公式和数据:
,,
.
参考答案:
题号
1
2
3
4
5
6
答案
A
D
A
AD
BD
AD
1.A
【分析】根据已知计算相关系数,再根据相关系数的值判断线性相关程度.
【详解】由题可得,
则,
因为相关系数很接近于1,故两个变量的线性相关程度很强.
故选:A.
2.D
【分析】运用相关系数公式进行求解即可.
【详解】因为,,所以,
,
故选:D.
3.A
【分析】根据一元线性回归模型中对随机误差的假定进行判断.
【详解】对于A,残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,故A正确;
对于B,残差与观测时间有线性关系,故B错误;
对于C,残差的方差不是一个常数,随着观测时间变大而变小再变大,故C错误;
对于D,残差与观测时间是非线性关系,故D错误.
故选:A.
4.AD
【分析】根据统计案例的相关知识逐项分析判断.
【详解】对于A:相关系数越接近1,相关性越强,故A正确;
对于B:回归直线方程拟合效果的强弱由决定系数,故B错误;
对于C:残差故C错误;
对于D:决定系数越小,残差平方和越大,效果越差,故D正确.
故选:AD.
5.BD
【分析】对于A,根据相关系数的性质分析判断,对于B,根据决定系数的性质分析判断,对于C,根据残差的定义计算判断,对于D,对两边取对数化简与比较可求出c,k的值.
【详解】对于A,因为相关系数的绝对值越大,数据的相关性越强,而,
所以B组数据比A组数据的相关性较强,所以A错误,
对于B,因为所有样本点都落在一条斜率为非零实数的直线上,所以两个变量x和之间是一次函数,所以决定系数的值为1,所以B正确,
对于C,因为样本点的经验回归方程为,所以当时,,
所以残差为,所以C错误,
对于D,由,得,因为,所以,
因为,所以,得,所以D正确.
故选:BD
6.AD
【分析】根据正态曲线的性质判断A;根据百分位数的定义判断B;根据相关系数与相关性的关系判断C;由二项分布均值的公式求,判断D.
【详解】对于A,随机变量服从正态分布,越小,即方差越小,
则随机变量分布越集中,因此A正确;
对于B,将数据从小到大排序为:1,3,4,5,7,9,11,16,共8个数据,由,
则第75百分位数为,因此B错误;
对于C,线性回归分析中,两个随机变量的线性相关性越强,则相关系数越接近于1,
反之越接近于0,线性相关性越弱,因此C错误;
对于D,随机变量,则,因此D正确;
故选:AD.
7.0.99/
【分析】根据表中的数据结合公式直接求解即可.
【详解】由题意,知,
所以.
所以结合参考数据知:.
所以y与x的相关系数近似为0.99.
故答案为:
8.1.5
【分析】利用回归直线方程,求出的估计值,然后求解残差的绝对值.
【详解】由样本数据得到,女大学生的身高预报体重的回归方程是,
当时,,
此方程在样本处残差为:.
故答案为:1.5.
9.①③
【分析】残差平方和越小越好,带状区域的宽度越窄,说明模型的拟合精度越高,越大,模型的拟合效果越好,相关指数越大,模型的拟合效果越好.
【详解】解:用相关指数的值判断模型的拟合效果,越大,说明残差平方和越小,模型的拟合效果越好,因为第①个线性模型比第②个线性模型拟合效果好,所以,;
故答案为:①③
10.(1)
(2),两个变量具有很强的线性相关性
【分析】(1)根据平均数的计算公式即可求解;
(2)根据相关系数公式代入求解即可;
【详解】(1)由统计表数据可得:,
(2)由于,,,
所以相关系数,
因此,两个变量具有很强的线性相关性.
11.(1), 与线性相关性很强;
(2),
【分析】(1)根据所给参考数据及相关系数公式求出,即可判断;
(2)首先求出,,即可得到与的回归方程,从而得到关于的回归方程,再代入计算可得.
【详解】(1)依题意,
又,所以与线性相关性很强;
(2)依题意,
所以,
所以,又,
所以,
当时,
所以预测第周“准点球”的百分比为.
自学检测
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(23-24高二下·河南洛阳·阶段练习)下列说法正确的是( )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
2.(24-25高二下·全国·课后作业)下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
3.(23-24高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
4.(23-24高二下·黑龙江哈尔滨·期末)已知5个成对数据的散点图如下,若去掉点,则下列说法正确的是( )
A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强
C.残差平方和变大 D.样本相关系数r变大
5.(2024·湖南·模拟预测)某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:
身体综合指标评分
1
2
3
4
5
用时小时)
9.5
8.8
7.8
7
6.1
由上表数据得到的正确结论是( )
参考数据:
参考公式:相关系数.
A.身体综合指标评分与骑行用时正相关
B.身体综合指标评分与骑行用时的相关程度较弱
C.身体综合指标评分与骑行用时的相关程度较强
D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合
6.(23-24高二下·广东中山·阶段练习)下列说法正确的是( )
A.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
B.残差平方和越小的模型,拟合的效果越好
C.正态分布的图象越瘦高,越大
D.两个随机变量的线性相关性越强,则相关系数r的值越接近于1
7.(2024·湖北襄阳·模拟预测)下列命题中,真命题的是( )
A.若回归方程,则变量与正相关
B.线性回归分析中相关指数用来刻画回归的效果,若值越小,则模型的拟合效果越好
C.若样本数据,,…,的方差为2,则数据,,…,的方差为18
D.一个人连续射击三次,则事件“至少击中两次”的对立事件是“至多击中一次”
8.(23-24高二上·全国·课后作业)某科技公司为加强研发能力,研发费用逐年增加,最近6年的研发费用y(单位:亿元)与年份编号x得到样本数据,令,并将绘制成下面的散点图.若用方程对y与x的关系进行拟合,则( )
A., B.,
C., D.,
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(21-22高二下·吉林长春·期中)下表是某城市在2022年1月份至10月份期间各月最低温度与最高温度(单位:℃)的数据一览表.
月份
1
2
3
4
5
6
7
8
9
10
最高温度/℃
5
9
9
11
17
24
27
30
31
21
最低温度/℃
1
1
7
17
19
23
25
10
已知该城市的各月最低温度与最高温度具有相关关系,根据该一览表,下列结论正确的是( )
A.最低温度与最高温度为正相关
B.每月最高温度与最低温度的平均值在前8个月逐月增加
C.月温差(最高温度减最低温度)的最大值出现在10月
D.1月至4月的月温差(最高温度减最低温度)相对于7月至10月,波动性更大
10.(2024·广东东莞·三模)下列选项中正确的有( )
A.若两个具有线性相关关系的变量的相关性越强,则线性相关系数的绝对值越接近于1
B.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
C.已知随机变量服从正态分布,则
D.若数据的方差为8,则数据的方差为2
11.(23-24高二下·山西长治·期中)已知某产品的销售额(单位:万元)与广告费用(单位:万元)的数据如表所示:
万元
1
2
3
4
5
万元
21
90
109
根据表中数据可知具有较强的线性相关关系,其经验回归方程为,则( )
A.样本相关系数在内
B.当时,残差为2
C.点一定在经验回归直线上
D.广告费用是6万元时,销售额一定为130万元
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(23-24高二下·河南三门峡·期末)下列命题:
①线性回归直线必过样本数据的中心点;
②如果两个变量的相关性越强,则相关性系数r就越接近于1;
③当相关性系数时,两个变量正相关;
④残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;
⑤甲、乙两个模型的分别约为0.88和0.80,则模型乙的拟合效果更好.
其中正确的命题有 .(填序号)
13.(2024·湖北武汉·二模)有人收集了七月份的日平均气温(摄氏度)与某次冷饮店日销售额(百元)的有关数据,为分析其关系,该店做了五次统计,所得数据如下:
日平均气温(摄氏度)
31
32
33
34
35
日销售额(百元)
5
6
7
8
10
由资料可知,关于的线性回归方程是,给出下列说法:
①;
②日销售额(百元)与日平均气温(摄氏度)成正相关;
③当日平均气温为摄氏度时,日销售额一定为百元.
其中正确说法的序号是 .
14.(23-24高二下·河南驻马店·阶段练习)以曲线拟合一组数据时,经代换后的线性回归方程为,则 , .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (22-23高二·全国·课堂例题)试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的行驶速度与耗油量;
(3)真空中自由降落的小球,位移(单位:m)与时间(单位:s);
(4)日降雨量(单位:cm)与空气中污染物浓度(单位:).
16. (15分) (2024高三·全国·专题练习)今年五一节期间,聊城百货大楼有限公司搞促销活动,下表是该公司5月1号至10号(日期简记为1,2,3,……,10)连续10天的销售情况:
日期
1
2
3
4
5
6
7
8
9
10
销售额(万元)
19
19.3
19.6
20
21.2
22.4
23.8
24.6
25
25.4
由上述数据,用最小二乘法得到销售额和日期的线性回归方程为,日期的方差约为3.02,销售额的方差约为2.59.
(1)根据线性回归方程,分析销售额随日期变化趋势的特征,并计算第4天的残差;
(2)计算相关系数,并分析销售额和日期的相关程度(精确到0.001);
参考公式:相关系数.回归方程中斜率和截距的最小二乘法估计公式分别为:,.相关数据.
17. (15分) (2024·四川自贡·三模)某公司是无人机特种装备的研发、制造与技术服务的综合型科技创新企业,产品无人机主要应用于森林消防、物流运输、航空测绘、军事侦察等领域,该公司生产的A、B两种类型无人运输机性能都比较出色.该公司分别收集了A、B两种类型无人运输机在5个不同的地点测试的某项指标数,(),数据如下表所示:
地点1
地点2
地点3
地点4
地点5
型无人运输机指标数
2
4
5
6
8
型无人运输机指标数
3
4
4
4
5
附:相关公式及数据:,.
(1)试求y与x间的相关系数,并利用说明与是否具有较强的线性相关关系;(若,则线性相关程度很高)
(2)从这5个地点中任抽2个地点,求抽到的这2个地点,型无人运输机指标数均高于型无人运输机指标数的概率.
18. (17分) (23-24高二下·上海·期末)党的十九大提出实施乡村振兴战略以来,农民收入大幅提升,2022年9月23日某市举办中国农民丰收节庆祝活动,粮食总产量有望连续十年全省第一.据统计该市2017年至2021年农村居民人均可支配收入(单位:万元)与年份代码(见下表)具有线性相关关系,计算得,,.
年份
2017
2018
2019
2020
2021
年份代码
1
2
3
4
5
(1)根据上表数据,计算与的相关系数,并判断与是否具有较高的线性相关程度(若,则线性相关程度一般,若,则线性相关程度较高,精确到;
(2)求出关于的线性回归方程.
参考公式:
相关系数,,.
19. (17分) (2024高二下·全国·专题练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面(单位:亩)与相应的管理时间(单位:月)的关系如表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
11
14
24
23
作出散点图,判断管理时间与土地使用面积是否线性相关,并根据相关系数说明相关关系的强弱.(若,认为两个变量有较强的线性相关性,的值精确到0.001)
注:亩,我国市制土地面积单位,1亩≈666.7平方米.
参考公式:.
参考数据:,,.
参考答案:
题号
1
2
3
4
5
6
7
8
9
10
答案
D
A
C
B
C
B
D
A
AD
ABD
题号
11
答案
AB
1.D
【分析】根据相关关系是一种不确定关系,函数关系是一种确定关系,可判断A;根据球的体积与半径之间的关系,可判断该关系为函数关系,可判断B;根据农作物的产量与施化肥量之间的关系可得该关系为一种相关关系,可判断C;根据学生的数学成绩与物理成绩之间是一种相关关系可判断D.
【详解】解:当两个变量之间具有确定的关系时,两个变量之间是函数关系,而不是相关关系,故A错误;
球的体积与该球的半径之间是函数关系,故B错误;
农作物的产量与施化肥量之间的关系是相关关系,是非确定性关系,故C错误;
学生的数学成绩与物理成绩之间的关系是相关关系,是非确定性关系,故D正确.
故选:D.
【点睛】关键点点睛:本题考查的知识点是变量间的相关关系,熟练掌握相关关系与函数关系之间的区别是解答的关键.
2.A
【分析】利用正相关的定义逐项判断可得答案.
【详解】对于A,一般情况下,汽车越重,则每公里耗油量越多,成正相关,故A正确;
对于B,正方形的面积与边长是函数关系,故B错误;
对于C,一般情况下,若花费在体育活动上面的时间越长,则期末考试数学成绩可能会降低,故不为正相关,故C错误;
对于D,期末考试随机编排的准考证号与期末考试成绩总分没有相关关系,故D错误.
故选:A.
3.C
【分析】根据散点图判断.
【详解】画出弹簧伸长长度x和相应所受外力F的散点图,
可以判断这两变量相关,且为正相关,故①②错误,③正确.
故选:C
4.B
【分析】根据已知条件,结合变量间的相关关系,结合图象分析判断即可.
【详解】由散点图可知,去掉点后,与的线性相关加强,且为负相关,
所以B正确,A错误;
由于与的线性相关加强,所以残差平方和变小,所以C错误,
由于与的线性相关加强,且为负相关,所以相关系数的绝对值变大,
而相关系数为负的,所以样本相关系数r变小,所以D错误.
故选:B.
5.C
【分析】求出相关系数,根据相关系数的大小确定答案即可.
【详解】因为相关系数.
即相关系数近似为与负相关,且相关程度相当高,从而可用线性回归模型拟合与的关系.
所以选项ABD错误,C正确.
故选:C.
6.B
【分析】值越大,模型的拟合效果越好可判断A;残差平方和越小的模型,拟合的效果越好,判断B;正态分布的图象越瘦高,越小可判断C;两个随机变量的线性相关性越强, 则相关系数的绝对值越接近于1,可判断D.
【详解】对于A:值越大,模型的拟合效果越好,故A错误;
对于B,残差平方和越小的模型,拟合的效果越好,故B正确.
对于C,正态分布的图象越瘦高,越小,故C错误;
对于D, 两个随机变量的线性相关性越强, 则相关系数的绝对值越接近于1 ,故D错误.
故选:B.
7.D
【分析】根据正相关、相关指数、方差、对立事件等知识对选项进行分析,从而确定正确答案.
【详解】A选项,回归方程,则变量与负相关,A选项错误.
B选项,值越小,则模型的拟合效果越差,B选项错误.
C选项,数据,,…,的方差为,C选项错误.
D选项,连续射击三次,
事件“至少击中两次”的对立事件是“至多击中一次”, D选项正确.
故选:D
8.A
【分析】根据非线性回归方程结合图象即可得到答案.
【详解】因为,令,则z与x的回归方程为.
根据散点图可知z与x正相关,所以.
从回归直线图象可知,回归直线的纵截距大于0,
即,所以.
故选:A.
9.AD
【分析】根据表格数据判断A、B;由月温差定义判断最大值出现月份判断C;求出1月至4月、7月至10月的月温差方差比较大小判断D.
【详解】A:由表格数据,最高温较高对应最低温相对也高,故最高温与最低温有正相关性,对;
B:前8个月,最高温2、3月份相同,最低温3、4月份相同,故前8个月最高、最低温度并不是逐月增加,错;
C:月温差的最大值出现在1月份为摄氏度,错;
D:1到4月份温差依次为,7到10月份温差依次为,
所以1到4月份温差均值为,7到10月份温差均值为,
1到4月份温差的方差,
7到10月份温差的方差,
故1月至4月的月温差(最高温度减最低温度)相对于7月至10月,波动性更大,对.
故选:AD
10.ABD
【分析】对于AB,结合相关系数,残差的定义,即可求解;对于C,结合正态分布的对称性,即可求解;对于D,结合方差的线性公式,即可求解.
【详解】若两个具有线性相关关系的变量的相关性越强,则线性相关系数的值越接近于1,故A正确;
在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故B正确;
随机变量服从正态分布,
则,故C错误;
设数据,,,的方差为,因为数据,,,的方差为8,
则,解得,故D正确.
故选:ABD
11.AB
【分析】根据相关系数的定义判断A;求出样本中心点,即可求出的值,再计算残差即可判断B;令、判断C、D.
【详解】对于A,因为具有较强的线性相关关系,且经验回归方程为,
所以,具有较强的正相关关系,故样本相关系数在内,故A正确;
对于B,根据题意得,,
又必过样本中心点,
所以,解得,
故当时,,残差为,故B正确;
对于C,点即点,当时,,即点不在经验回归直线上,故C错误;
对于D,当时,,即广告费用是万元时,销售额估计为130万元,故D错误.
故选:AB.
12.①③
【分析】根据回归直线方程的性质与相关系数的概念及相关指数的概念判断即可;
【详解】解:①线性回归直线必过样本数据的中心点,正确;
②如果两个变量的相关性越强,则相关性系数就越接近于1,不正确,
应为相关性系数的绝对值就越接近于1;
③当相关性系数时,两个变量正相关,正确;
④残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高,不正确;
⑤甲、乙两个模型的分别约为0.88和0.80,则模型乙的拟合效果更好,不正确,
应为模型甲的拟合效果更好.
故答案为:①③
13.①②
【分析】由计算后可判断①,由统计表可判断②,由线性回归方程的概念可判断③,即可得解.
【详解】由统计表可得,,
则,故①正确;
由统计表可得日销售额(百元)与日平均气温(摄氏度)成正相关,故②正确;
由线性回归方程的概念可得当日平均气温为摄氏度时,日销售额的预计值为,故③错误.
故答案为:①②.
【点睛】本题考查了线性相关关系及回归直线方程的应用,属于基础题.
14. 3
【分析】利用对数的运算法则结合回归方程求解即可.
【详解】因为,所以=,
令,则,
又因为,所以,则.
故答案为:.
15.(1)具有相关关系
(2)具有相关关系
(3)具有函数关系
(4)具有相关关系
【分析】(1)根据相关关系的概念判断即可;
(2)根据相关关系的概念判断即可;
(3)根据函数关系的概念判断即可;
(4)根据相关关系的概念判断即可.
【详解】(1)商品的销售价格与其供应量之间具有相关关系.一般来说,在品质相当的情况下,供应量越大,
价格就越低;供应量越小,价格就越高.某些品牌商品限量供应,就是保持较高价位的销售策略.
(2)汽车的行驶速度与耗油量之间具有相关关系.通常情况下,当速度很慢或速度很快时,耗油较多,
而在中等车速(不同的汽车范围不一定一样)时,速度稍高,耗油反而较少.
(3)根据自由落体运动方程,可知自由降落的小球,位移与时间之间是函数关系.
(4)日降雨量与空气中污染物浓度之间具有相关关系.通常情况下,降雨量越大,空气中污染物浓度就越低.
16.(1)日期每增加一天,销售额约增加万元,第4天的残差为
(2),销售额和日期的相关程度较强
【分析】(1)根据线性回归方程特点分析,再将代入回归方程计算,利用残差定义求解即可;
(2)由相关系数的公式结合题中的数据计算,然后根据相关系数与1比较即可判断;
【详解】(1)根据线性回归方程,日期每增加一天,销售额约增加万元,
把代入回归直线方程,得,
因为,所以第4天的残差为;
(2)由,得
,
比较接近于1,故销售额和日期的相关程度较强.
17.(1),与具有较强的线性相关关系
(2)
【分析】(1)根据题干所给数据及公式求出相关系数,即可判断;
(2)利用列举法列出所有可能结果,再由古典概型的概率公式计算可得.
【详解】(1)依题意,,
,
,
,
所以,
因为,所以与具有较强的线性相关关系;
(2)将地点1,2,3,4,5分别记为,,,,,
任抽2个地点的可能情况有:,,,,,,,,,共10种情况,
其中在地点3,4,5,型无人运输机指标数均高于型无人运输机指标数,
记型无人运输机指标数均高于型无人运输机指标数为事件,
则包含的基本事件为,,共3个,
所以.
18.(1),与具有较高的线性相关程度
(2)
【分析】(1)根据题意求得,利用相关系数公式求得相关系数,比较可得结论;
(2)利用回归方程的系数公式求得,继而求得,即可求得与的回归方程.
【详解】(1)由表数据可得的平均数,
所以,
所以相关系数,
由,所以与具有较高的线性相关程度;
(2)依题意可得,
,
,
所以,
所以关于的线性回归方程为.
19.散点图见解析,管理时间与土地使用面积线性相关,因为,所以管理时间与土地使用面积线性相关性较强.
【分析】根据表格数据画出散点图,即可判断线性相关性,再根据所给公式计算出相关系数即可.
【详解】根据表格数据可得散点图如图所示.
由散点图可知,管理时间与土地使用面积线性相关.
依题意,,又,
,
,
,
则.
因为,所以管理时间与土地使用面积线性相关性较强.
学科网(北京)股份有限公司
$$
10成对数据的统计相关性(人教2019A版专用)
目录
【自学概念】 2
【自学考点】 3
考点一:变量的相关关系 3
考点二:样本相关系数 5
【自学检测】 9
自学概念
1. 变量的相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2. 散点图、线性相关
(1)每一个序号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们把这样的统计图叫做散点图.
(2)如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
如果一个变量值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
(3)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
3. 样本相关系数
(1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多.
(2)r=.我们称r为变量x和变量y的样本相关系数.
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
(3)样本数据相关系数r的绝对值大小反映成对数据之间线性相关的程度.
①当|r|越接近1时,成对样本数据的线性相关程度越强;
②当|r|越接近0时,成对样本数据的线性相关程度越弱.
③当r=0时,成对样本数据间没有线性相关关系.
自学考点
考点一:变量的相关关系
一、单选题
1.(21-22高二上·宁夏银川·期末)给出下列结论:
①如果数据的平均数为3,方差为0.2,则的平均数和方差分别为14和1.8;②若两个变量的线性相关性越强,则相关系数r的值越接近于1.③对A、B、C三种个体按3:1:2的比例进行分层抽样调查,若抽取的A种个体有15个,则样本容量为30.则正确的个数是( ).
A.3 B.2
C.1 D.0
2.(23-24高二下·辽宁·期中)下列变量之间的关系不是相关关系的是( )
A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重
C.某正方形的边长与此正方形的面积 D.人的身高与体重
3.(23-24高二上·全国·课后作业)对两个变量的四组数据进行统计,获得如图所示的散点图,关于两个变量相关系数的比较,正确的是( )
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
二、多选题
4.(2020·山东济宁·二模)下列说法中正确的是( )
A.对具有线性相关关系的变量有一组观测数据,其线性回归方程是,且,则实数的值是
B.正态分布在区间和上取值的概率相等
C.若两个随机变量的线性相关性越强,则相关系数的值越接近于1
D.若一组数据的平均数是2,则这组数据的众数和中位数都是2
5.(21-22高二·全国·课后作业)下列变量间可能用直线拟合的是( )
A.光照时间与大棚内蔬菜的产量 B.某正方形的边长与此正方形的面积
C.举重运动员所能举起的最大重量与他的体重 D.某人的身高与视力
6.(2023高一上·全国·专题练习)某市7天国庆节假期期间的楼房认购量(单位:套)与成交量(单位:套)的折线图如下图所示,小明同学根据折线图对这7天的认购量与成交量作出如下判断,则下列结论错误的是( )
A.日成交量的中位数是16
B.日成交量超过日平均成交量的有2天
C.认购量与日期正相关
D.10月7日认购量的增量大于10月7日成交量的增量
三、填空题
7.(21-22高二·全国·课后作业)有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是 .
8.(23-24高一下·江西·期末)下列两个变量之间具有相关关系的是 .
①正方形的边长a和面积S;
②一个人的身高h和右手一拃长x;
③真空中的自由落体运动其下落的距离h和下落的时间t;
④一个人的身高h和体重x.
9.(23-24高一下·甘肃白银·阶段练习)下列结论:①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其中正确的是 .(将所有正确的序号填上)
考点二:样本相关系数
一、单选题
1.(24-25高三上·四川成都·开学考试)为考察两个变量的相关性,搜集数据如表,则两个变量的线性相关程度( )
5
10
15
20
25
103
105
110
111
114
(参考数据:,,,,,)
A.很强 B.很弱 C.无相关 D.不确定
2.(23-24高二下·广东珠海·阶段练习)一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
3.(24-25高三上·四川自贡·期中)根据变量和的成对样本数据,由一元线性回归模型得到经验回归模型,求得残差图.对于以下四幅残差图,满足一元线性回归模型中对随机误差假设的是( )
A. B.
C. D.
二、多选题
4.(23-24高三下·广西柳州·阶段练习)两个具有线性相关关系的变量的一组数据可建立经验回归方程,下列说法正确的是( ).
A.相关系数越接近1,变量x,y相关性越强 .
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.残差
D.决定系数越小,残差平方和越大,即模型的拟合效果越差
5.(23-24高二下·福建·期末)对具有相关关系的两个变量x和进行回归分析时,下列结论正确的是( )
A.若A,B两组成对数据的样本相关系数分别为,,则A组数据比B组数据的相关性较强
B.若所有样本点都落在一条斜率为非零实数的直线上,则决定系数的值为1
C.若样本点的经验回归方程为,则在样本点处的残差为0.3
D.以模型去拟合一组数据时,为求出回归方程,设,将其变换后得到线性方程,则c,k的值分别是和2
6.(24-25高三上·浙江·开学考试)下列说法正确的是( )
A.已知随机变量服从正态分布,越小,表示随机变量分布越集中
B.数据1,9,4,5,16,7,11,3的第75百分位数为9
C.线性回归分析中,若线性相关系数越大,则两个变量的线性相关性越弱
D.已知随机变量,则
三、填空题
7.(24-25高三上·上海·课后作业)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据可知,y与x的相关系数为 .(精确到0.01,参考数据:,,)
8.(21-22高二下·山东青岛·期中)高中女学生的身高预报体重的回归方程是(其中,的单位分别是cm,kg),则此方程在样本点处的残差是 .
9.(21-22高二下·宁夏·阶段练习)有一组统计数据和,根据数据建立了如下的两个模型:①,②.通过残差分析发现第①个线性模型比第②个线性模型拟合效果好.若分别是相关指数和残差平方和,则下列结论正确的是 .①>,②<,③<,④>.
四、解答题
10.(2024高三·全国·专题练习)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额的统计表(金额(万元)).
月份
1月
2月
3月
4月
5月
月份编号
1
2
3
4
5
金额(万元)
7
12
13
19
24
根据统计表,
(1)求该公司带货金额的平均值;
(2)求该公司带货金额与月份编号的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为与的线性相关性较强;,则认为与的线性相关性较弱);
附:相关系数公式,参考数据:,,,.
11.(2024·陕西安康·模拟预测)某乒乓球训练机构以训练青少年为主,其中有一项打定点训练,就是把乒乓球打到对方球台的指定位置(称为“准点球”),在每周末,记录每个接受训练的学员在训练时打的所有球中“准点球”的百分比(),A学员已经训练了1年,下表记录了学员最近七周“准点球”的百分比:
周次(x)
1
2
3
4
5
6
7
52
52.8
53.5
54
54.5
54.9
55.3
若.
(1)根据上表数据,计算与的相关系数,并说明与的线性相关性的强弱;
(若,则认为与线性相关性很强;若,则认为与线性相关性一般;若,则认为与线性相关性较弱)(精确到)
(2)求关于的回归方程,并预测第周“准点球”的百分比.(精确到)
参考公式和数据:
,,
.
自学检测
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(23-24高二下·河南洛阳·阶段练习)下列说法正确的是( )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
2.(24-25高二下·全国·课后作业)下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
3.(23-24高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
4.(23-24高二下·黑龙江哈尔滨·期末)已知5个成对数据的散点图如下,若去掉点,则下列说法正确的是( )
A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强
C.残差平方和变大 D.样本相关系数r变大
5.(2024·湖南·模拟预测)某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:
身体综合指标评分
1
2
3
4
5
用时小时)
9.5
8.8
7.8
7
6.1
由上表数据得到的正确结论是( )
参考数据:
参考公式:相关系数.
A.身体综合指标评分与骑行用时正相关
B.身体综合指标评分与骑行用时的相关程度较弱
C.身体综合指标评分与骑行用时的相关程度较强
D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合
6.(23-24高二下·广东中山·阶段练习)下列说法正确的是( )
A.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
B.残差平方和越小的模型,拟合的效果越好
C.正态分布的图象越瘦高,越大
D.两个随机变量的线性相关性越强,则相关系数r的值越接近于1
7.(2024·湖北襄阳·模拟预测)下列命题中,真命题的是( )
A.若回归方程,则变量与正相关
B.线性回归分析中相关指数用来刻画回归的效果,若值越小,则模型的拟合效果越好
C.若样本数据,,…,的方差为2,则数据,,…,的方差为18
D.一个人连续射击三次,则事件“至少击中两次”的对立事件是“至多击中一次”
8.(23-24高二上·全国·课后作业)某科技公司为加强研发能力,研发费用逐年增加,最近6年的研发费用y(单位:亿元)与年份编号x得到样本数据,令,并将绘制成下面的散点图.若用方程对y与x的关系进行拟合,则( )
A., B.,
C., D.,
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(21-22高二下·吉林长春·期中)下表是某城市在2022年1月份至10月份期间各月最低温度与最高温度(单位:℃)的数据一览表.
月份
1
2
3
4
5
6
7
8
9
10
最高温度/℃
5
9
9
11
17
24
27
30
31
21
最低温度/℃
1
1
7
17
19
23
25
10
已知该城市的各月最低温度与最高温度具有相关关系,根据该一览表,下列结论正确的是( )
A.最低温度与最高温度为正相关
B.每月最高温度与最低温度的平均值在前8个月逐月增加
C.月温差(最高温度减最低温度)的最大值出现在10月
D.1月至4月的月温差(最高温度减最低温度)相对于7月至10月,波动性更大
10.(2024·广东东莞·三模)下列选项中正确的有( )
A.若两个具有线性相关关系的变量的相关性越强,则线性相关系数的绝对值越接近于1
B.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
C.已知随机变量服从正态分布,则
D.若数据的方差为8,则数据的方差为2
11.(23-24高二下·山西长治·期中)已知某产品的销售额(单位:万元)与广告费用(单位:万元)的数据如表所示:
万元
1
2
3
4
5
万元
21
90
109
根据表中数据可知具有较强的线性相关关系,其经验回归方程为,则( )
A.样本相关系数在内
B.当时,残差为2
C.点一定在经验回归直线上
D.广告费用是6万元时,销售额一定为130万元
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(23-24高二下·河南三门峡·期末)下列命题:
①线性回归直线必过样本数据的中心点;
②如果两个变量的相关性越强,则相关性系数r就越接近于1;
③当相关性系数时,两个变量正相关;
④残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;
⑤甲、乙两个模型的分别约为0.88和0.80,则模型乙的拟合效果更好.
其中正确的命题有 .(填序号)
13.(2024·湖北武汉·二模)有人收集了七月份的日平均气温(摄氏度)与某次冷饮店日销售额(百元)的有关数据,为分析其关系,该店做了五次统计,所得数据如下:
日平均气温(摄氏度)
31
32
33
34
35
日销售额(百元)
5
6
7
8
10
由资料可知,关于的线性回归方程是,给出下列说法:
①;
②日销售额(百元)与日平均气温(摄氏度)成正相关;
③当日平均气温为摄氏度时,日销售额一定为百元.
其中正确说法的序号是 .
14.(23-24高二下·河南驻马店·阶段练习)以曲线拟合一组数据时,经代换后的线性回归方程为,则 , .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (22-23高二·全国·课堂例题)试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的行驶速度与耗油量;
(3)真空中自由降落的小球,位移(单位:m)与时间(单位:s);
(4)日降雨量(单位:cm)与空气中污染物浓度(单位:).
16. (15分) (2024高三·全国·专题练习)今年五一节期间,聊城百货大楼有限公司搞促销活动,下表是该公司5月1号至10号(日期简记为1,2,3,……,10)连续10天的销售情况:
日期
1
2
3
4
5
6
7
8
9
10
销售额(万元)
19
19.3
19.6
20
21.2
22.4
23.8
24.6
25
25.4
由上述数据,用最小二乘法得到销售额和日期的线性回归方程为,日期的方差约为3.02,销售额的方差约为2.59.
(1)根据线性回归方程,分析销售额随日期变化趋势的特征,并计算第4天的残差;
(2)计算相关系数,并分析销售额和日期的相关程度(精确到0.001);
参考公式:相关系数.回归方程中斜率和截距的最小二乘法估计公式分别为:,.相关数据.
17. (15分) (2024·四川自贡·三模)某公司是无人机特种装备的研发、制造与技术服务的综合型科技创新企业,产品无人机主要应用于森林消防、物流运输、航空测绘、军事侦察等领域,该公司生产的A、B两种类型无人运输机性能都比较出色.该公司分别收集了A、B两种类型无人运输机在5个不同的地点测试的某项指标数,(),数据如下表所示:
地点1
地点2
地点3
地点4
地点5
型无人运输机指标数
2
4
5
6
8
型无人运输机指标数
3
4
4
4
5
附:相关公式及数据:,.
(1)试求y与x间的相关系数,并利用说明与是否具有较强的线性相关关系;(若,则线性相关程度很高)
(2)从这5个地点中任抽2个地点,求抽到的这2个地点,型无人运输机指标数均高于型无人运输机指标数的概率.
18. (17分) (23-24高二下·上海·期末)党的十九大提出实施乡村振兴战略以来,农民收入大幅提升,2022年9月23日某市举办中国农民丰收节庆祝活动,粮食总产量有望连续十年全省第一.据统计该市2017年至2021年农村居民人均可支配收入(单位:万元)与年份代码(见下表)具有线性相关关系,计算得,,.
年份
2017
2018
2019
2020
2021
年份代码
1
2
3
4
5
(1)根据上表数据,计算与的相关系数,并判断与是否具有较高的线性相关程度(若,则线性相关程度一般,若,则线性相关程度较高,精确到;
(2)求出关于的线性回归方程.
参考公式:
相关系数,,.
19. (17分) (2024高二下·全国·专题练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面(单位:亩)与相应的管理时间(单位:月)的关系如表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
11
14
24
23
作出散点图,判断管理时间与土地使用面积是否线性相关,并根据相关系数说明相关关系的强弱.(若,认为两个变量有较强的线性相关性,的值精确到0.001)
注:亩,我国市制土地面积单位,1亩≈666.7平方米.
参考公式:.
参考数据:,,.
学科网(北京)股份有限公司
$$