内容正文:
8.1成对数据的相关分析
题型1变量间相关关系的判断
1.下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.体育锻炼与身体健康指标之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间正相关
D.人的体重与视力负相关
2.下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
3.下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
4.下列变量之间的关系不是相关关系的是( )
A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重
C.某正方形的边长与此正方形的面积 D.人的身高与体重
题型2依据散点图判别变量间的相关关系
5.对变量x,y有成对样本数据(xi,yi)(i=1,2,…,10),得散点图(如图①);对变量u,v有成对样本数据(ui,vi)(i=1,2,…,10),得散点图(如图②).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
6.下列四个散点图中,变量x与y之间具有负的线性相关关系的是( )
A. B. C. D.
7.下列四幅散点图中,所对应的成对样本数据呈现负相关的是( )
A.B.C.D.
8.观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
9.下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
题型3相关系数的意义及辨析
10.下列结论正确的是__________.
①变量间的线性相关系数的取值范围为;
②变量间的线性相关系数的绝对值越接近于0,则变量间的线性相关程度越弱:
③变量间的相关系数越小,则变量间的相关程度越弱.
11.对于相关系数,下列说法中错误的是____________.
①时,成对样本数据线性相关程度较弱;
②时,表明成对样本数据正相关;
③若线性回归方程中的回归系数,则相关系数;
④越接近1,线性相关程度越强,越接近0,线性相关程度越弱.
12.甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,,,,则这四人中,______研究的两个随机变量的线性相关程度最高.
13.已知四组成对样本数据对应的线性相关系数分别为,,则线性相关程度最强的是( )
A.A组 B.B组 C.C组 D.D组
题型4求样本的相关系数
14.已知,,,,则相关系数______.(相关系数)
15.通过随机抽样,获得某种商品消费者年需求量与该商品每千克价格之间的一组数据调查,如下表所示:
价格(百元)
4
4
4.6
5
5.2
5.6
6
6.6
7
10
需求量(千克)
3.5
3
2.7
2.4
2.5
2
1.5
1.2
1.2
1
那么线性相关系数______________.(精确到)线性相关系数公式
16.某企业不断扩大规模,提高经营收入.统计得到该企业2018-2022年产值(单位:亿元)与企业员工数(单位:千人)之间的数据如下:
年份
2018
2019
2020
2021
2022
千人
1
2
3
4
5
亿元
5
8
10
24
28
从表中数据可知与呈线性相关,根据这5年的数据计算与的相关系数______(保留三位小数).
附:.
17.近年来,随着社会对教育越来越重视,家庭的平均教育支出呈现出逐年增长的趋势,下表反映了2018-2022年某市家庭平均教育支出占家庭总支出的比例(百分比)与年份编号之间的关系:
年份
2018
2019
2020
2021
2022
1
2
3
4
5
21
26
40
49
54
则与的样本相关系数______(保留3位小数).
附:,.
题型5相关系数的实际应用
18.现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示.
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
请问:这10名学生的两次数学成绩是否具有较强的线性相关关系?
注:;
若,则我们可以认为y与x之间具有较强的线性相关关系.
19.为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示:
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
GLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度.
参考公式:
相关系数,
参考数据:,,,,,,,.
20.某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量(件)与相应的生产总成本(万元)的五组对照数据:
产量(件)
1
2
3
4
5
生产总成本(万元)
3
7
8
10
12
试求与的相关系数,并利用相关系数说明与是否高度正相关.(结果保留两位小数)
参考公式:.
参考数据:.
题型1散点图中的相关系数大小
21.下面是不同成对数据的散点图,从左到右对应的样本相关系数分别是,其中最大的是( )
A. B. C. D.
22.下列图中,相关系数最大的是( )
A. B.
C. D.
23.对四组数据进行统计,获得以下散点图,将四组数据对应的相关系数进行比较,则( )
A. B. C. D.
题型2决定系数的拟合效果
24.某同学根据一组数据作出如图所示的散点图,并对这组数据进行回归分析后发现遗漏了点,增加点后再次进行回归分析,得到的结果和原来相比( )
A.相关系数r变大
B.决定系数变小
C.残差平方和变小
D.不变
25.下列说法中正确的是( )
A.回归直线至少经过一个样本点
B.在回归分析模型中,决定系数越小,模型的拟合效果越好
C.残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越低
D.当样本相关系数时,成对样本数据正相关
26.在线性回归模型中,能说明模型的拟合效果越好的是( )
A.残差图带状区域越宽 B.残差和越小
C.决定系数越大 D.相关系数r越大
27.下列说法错误的是( )
A.若点、、…、都落在直线上,则变量、的样本相关系数
B.若,,则相应于样本点的残差为;
C.对具有线性相关关系的变量,利用最小二乘法得到的经验回归方程为,若样本点的中心为,则实数的值是3;
D.若决定系数越大,则模型的拟合效果越好
28.如图所示,有A,B,C,D,E共5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
29.观察下列散点图,有三种情况:①正相关,②负相关,③不相关.与散点图的位置相对应的序号依次是______.
30.某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数__________.(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
31.已知为随机变量X和Y的样本相关系数,为随机变量M和N的样本相关系数,则下列说法正确的是( )
A.若,则X和Y负相关
B.若,则M和N线性不相关
C.若,,则X和Y的线性相关程度比M和N的线性相关程度强
D.若越接近1,则M和N的线性相关程度越弱
32.对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
33.下面是不同成对数据的散点图,从左到右对应的样本相关系数分别是,其中最大的是( )
A. B.
C. D.
34.下列四组成对数据:①,,,,;②,,,,;③,,,,;④,,,,.其中样本相关系数最小的是( )(附:样本相关系数)
A.① B.② C.③ D.④
35.10对中国父子的身高(英寸)如下:
父亲身高()
60
62
64
65
66
67
68
70
72
74
儿子身高()
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
试根据上述资料:
(1)画出散点图;
(2)变量和之间是否具有线性关系?
(3)人们常说,父亲高,儿子肯定不矮,你赞成这种说法吗?
36.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图;
(2)判断是否具有相关关系.
37.直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,为此该公司统计了2024年前5个月的带货金额如下表(金额y/万元):
月份
1月
2月
3月
4月
5月
月份编号x
1
2
3
4
5
金额y/万元
7
12
13
19
24
并计算得,,.
(1)求该公司带货金额的平均值;
(2)求该公司带货金额y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有较强的线性相关关系(若,则线性相关性较强,否则认为线性相关性较弱).
附:相关系数,.
38.2019年11月份,全国工业生产者出厂价格同比下降,环比下降.某企业在了解市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制定相应的出厂价格.该企业统计了2019年1-10月份产品的生产数量与销售总额之间的关系,如下表所示.
万件
2.08
2.12
2.19
2.28
2.36
2.48
2.59
2.68
2.80
2.87
万元
42.5
43.7
44.0
45.5
46.4
47.5
49.2
50.3
51.4
52.6
(1)计算的值;
(2)计算样本相关系数的值,并通过的值的大小说明与之间的相关程度.
39.党的二十大报告指出绿水青山就是金山银山.某市为加快生态文明建设进程,加大生态环境保护投入力度,为祖国现代化建设增砖添瓦.现统计了该市近几年的生态环境保护投入资金,统计如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号x
1
2
3
4
5
6
投入资金y/千万
14
31
33
38
41
47
(1)根据上表作出散点图;
(2)观察散点图,判断投入资金y与年份编号x是否具有相关性.如果有,是正相关还是负相关.
1 / 10
学科网(北京)股份有限公司
$
8.1成对数据的相关分析
题型1变量间相关关系的判断
1.下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.体育锻炼与身体健康指标之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间正相关
D.人的体重与视力负相关
【答案】C
【解析】圆的面积与半径之间的关系是确定的函数关系,所以A中说法错误;体育锻炼与身体健康指标之间的关系不是函数关系,是相关关系,所以B中说法错误;人的体重与视力没有关系,所以D中说法错误;易知C中说法正确.故选C.
2.下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
【答案】A
【解析】选项B,C,D中的两个变量都具有相关性,且都是一种不确定的关系,是相关关系.
而A中判别式和变量是一种确定的表达式,是一种函数关系,即一种确定的关系,所以不是相关关系.
故选:A
3.下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
【答案】A
【解析】对于A,一般情况下,汽车越重,则每公里耗油量越多,成正相关,故A正确;
对于B,正方形的面积与边长是函数关系,故B错误;
对于C,一般情况下,若花费在体育活动上面的时间越长,则期末考试数学成绩可能会降低,故不为正相关,故C错误;
对于D,期末考试随机编排的准考证号与期末考试成绩总分没有相关关系,故D错误.
故选:A.
4.下列变量之间的关系不是相关关系的是( )
A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重
C.某正方形的边长与此正方形的面积 D.人的身高与体重
【答案】C
【解析】C中的两个变量之间是确定的函数关系,A,B,D中的两个变量之间的关系都是相关关系.
故选:C
题型2依据散点图判别变量间的相关关系
5.对变量x,y有成对样本数据(xi,yi)(i=1,2,…,10),得散点图(如图①);对变量u,v有成对样本数据(ui,vi)(i=1,2,…,10),得散点图(如图②).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
【答案】C
【解析】由这两个散点图可以判断,变量x与y负相关,u与v正相关.
6.下列四个散点图中,变量x与y之间具有负的线性相关关系的是( )
A. B. C. D.
【答案】D
【解析】观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.
故选:D.
7.下列四幅散点图中,所对应的成对样本数据呈现负相关的是( )
A.B.C.D.
【答案】D
【解析】A,B,C中各点有非线性拟合趋势,D中具有线性相关且为负相关,故选D
8.观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
【答案】D
【解析】根据散点图,由相关性可知:图a各点散布在从左下角到右上角的区域里,是正相关;
图b中各点分布不成带状,相关性不明确,所以不相关;
图c中各点分布在从左上方到右下方的区域里,是负相关.故选D
9.下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
【答案】B
【解析】从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则这两个变量为负相关.结合散点图可知,①②满足题意,即两个变量呈负相关的个数为2个.故选:B
题型3相关系数的意义及辨析
10.下列结论正确的是__________.
①变量间的线性相关系数的取值范围为;
②变量间的线性相关系数的绝对值越接近于0,则变量间的线性相关程度越弱:
③变量间的相关系数越小,则变量间的相关程度越弱.
【答案】①②
【解析】对于①,相关系数满足,即变量间的线性相关系数的取值范围为,①正确;
对于②,根据相关系数的性质,,且越接近于1,相关程度越强,越接近于0,相关程度越弱,②正确;对于③,比如时,变量间的相关系数越小,则变量间的相关程度越强,③错误.
11.对于相关系数,下列说法中错误的是____________.
①时,成对样本数据线性相关程度较弱;
②时,表明成对样本数据正相关;
③若线性回归方程中的回归系数,则相关系数;
④越接近1,线性相关程度越强,越接近0,线性相关程度越弱.
【答案】①③
【解析】根据题意,依次分析4个命题:
对于①,当时,成对样本数据之间不存在任何关系,而不是较弱,错误;
对于②,当时,表明成对样本数据正相关,正确;
对于③,若线性回归方程中的回归系数,说明成对样本数据呈负相关,则相关系数,错误;
对于④,越接近1,线性相关程度越强,越接近0,线性相关程度越弱,正确.
12.甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,,,,则这四人中,______研究的两个随机变量的线性相关程度最高.
【答案】乙
【解析】因为,所以这四人中,乙研究的两个随机变量的线性相关程度最高,
13.已知四组成对样本数据对应的线性相关系数分别为,,则线性相关程度最强的是( )
A.A组 B.B组 C.C组 D.D组
【答案】B
【解析】线性相关系数的绝对值越接近于1,相关程度就越强,
因为,
经过比较可知,最大,所以组的线性相关程度最强.
故选:B.
题型4求样本的相关系数
14.已知,,,,则相关系数______.(相关系数)
【答案】
【解析】由题设,有.
15.通过随机抽样,获得某种商品消费者年需求量与该商品每千克价格之间的一组数据调查,如下表所示:
价格(百元)
4
4
4.6
5
5.2
5.6
6
6.6
7
10
需求量(千克)
3.5
3
2.7
2.4
2.5
2
1.5
1.2
1.2
1
那么线性相关系数______________.(精确到)线性相关系数公式
【答案】
【解析】由题意可得,
,
所以
,
,
所以.
16.某企业不断扩大规模,提高经营收入.统计得到该企业2018-2022年产值(单位:亿元)与企业员工数(单位:千人)之间的数据如下:
年份
2018
2019
2020
2021
2022
千人
1
2
3
4
5
亿元
5
8
10
24
28
从表中数据可知与呈线性相关,根据这5年的数据计算与的相关系数______(保留三位小数).
附:.
【答案】
【解析】由表格中的数据,可得,,
则,
,,
故.
17.近年来,随着社会对教育越来越重视,家庭的平均教育支出呈现出逐年增长的趋势,下表反映了2018-2022年某市家庭平均教育支出占家庭总支出的比例(百分比)与年份编号之间的关系:
年份
2018
2019
2020
2021
2022
1
2
3
4
5
21
26
40
49
54
则与的样本相关系数______(保留3位小数).
附:,.
【答案】0.976
【解析】由题意可知:,
可得,
所以.
题型5相关系数的实际应用
18.现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示.
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
请问:这10名学生的两次数学成绩是否具有较强的线性相关关系?
注:;
若,则我们可以认为y与x之间具有较强的线性相关关系.
【解】由题意知,
,
,
,,.
所以样本相关系数.
,故我们可以认为与之间具有较强的线性相关关系.
即这10名学生的两次数学成绩具有较强的线性相关关系.
19.为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示:
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
GLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度.
参考公式:
相关系数,
参考数据:,,,,,,,.
【解】由题意,变量与的相关系数,
变量与的相关系数是,
可以看出TC指标值与BMI值,GLU指标值与BMI值都是高度正相关.
20.某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量(件)与相应的生产总成本(万元)的五组对照数据:
产量(件)
1
2
3
4
5
生产总成本(万元)
3
7
8
10
12
试求与的相关系数,并利用相关系数说明与是否高度正相关.(结果保留两位小数)
参考公式:.
参考数据:.
【解】,
,
,
,
,
故相关系数,
,与高度正相关.
题型1散点图中的相关系数大小
21.下面是不同成对数据的散点图,从左到右对应的样本相关系数分别是,其中最大的是( )
A. B. C. D.
【答案】A
【解析】由散点图可知,并且第一个图中的点更为集中,更贴近某条直线分布,
第三、四个图中的点的分布更为分散,
因此更接近于1,的绝对值更接近于0,
即最大的是,
故选:A
22.下列图中,相关系数最大的是( )
A. B.
C. D.
【答案】D
【解析】由图可知,AC选项的散点图呈现出一定的下降趋势,两变量为负相关,相关系数小于0,
BD选项的散点图呈现出一定的上升趋势,两变量为正相关,相关系数大于0,
而B选项的散点图,散点比较分散,D选项的散点图,散点紧密地聚集在一条直线附近,
因此D选项的相关系数最大.
故选:D.
23.对四组数据进行统计,获得以下散点图,将四组数据对应的相关系数进行比较,则( )
A. B. C. D.
【答案】A
【解析】由图知,对应的与负相关,且对应的相关性更强,即;
对应的与正相关,且对应的相关性更强,即,
所以.
故选:A
题型2决定系数的拟合效果
24.某同学根据一组数据作出如图所示的散点图,并对这组数据进行回归分析后发现遗漏了点,增加点后再次进行回归分析,得到的结果和原来相比( )
A.相关系数r变大
B.决定系数变小
C.残差平方和变小
D.不变
【答案】B
【解析】增加点,从散点图中可以看出拟合效果变差;
越接近,相关程度越强,拟合效果越好,由于两个变量成正相关,所以相关系数变小;故A错误;
决定系数越接近,拟合效果越好,所以决定系数变小,故B正确;
残差平方和越小,拟合效果越好,所以残差平方和变大;故C错误;
增加点前的的平均数为,增加点后的的平均数为,所以变大,故D错误.
故选:B
25.下列说法中正确的是( )
A.回归直线至少经过一个样本点
B.在回归分析模型中,决定系数越小,模型的拟合效果越好
C.残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越低
D.当样本相关系数时,成对样本数据正相关
【答案】D
【解析】A:回归直线过样本中心点,每个样本点不一定都在回归直线方程上,所以本选项说法不正确;
B:因为在回归分析模型中,决定系数越大,模型的拟合效果越好,所以本选项说法不正确;
C:因为残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越高,
所以本选项说法不正确,
D:当样本相关系数时,成对样本数据正相关,因此本选项说法正确,
故选:D
26.在线性回归模型中,能说明模型的拟合效果越好的是( )
A.残差图带状区域越宽 B.残差和越小
C.决定系数越大 D.相关系数r越大
【答案】C
【解析】A选项,残差图带状区域越宽,说明误差大,模型的拟合效果越差,A错误;
B选项,残差平方和越小,模型的拟合效果越好,B错误;
C选项,决定系数越大,模型的拟合效果越好,C正确;
D选项,相关系数越大,说明两个变量线性相关性越强,与模型的拟合效果无关,D错误.
故选:C
27.下列说法错误的是( )
A.若点、、…、都落在直线上,则变量、的样本相关系数
B.若,,则相应于样本点的残差为;
C.对具有线性相关关系的变量,利用最小二乘法得到的经验回归方程为,若样本点的中心为,则实数的值是3;
D.若决定系数越大,则模型的拟合效果越好
【答案】C
【解析】选项A,直线的斜率,且所有样本点都落在直线上,
所以这组样本数据负相关,且样本相关系数达到最小值,即,故A正确;
选项B,相应于样本点的残差为,故B正确;
选项C,因为回归直线过样本点的中心,
所以,解得,故C错误;
选项D,由决定系数的意义可知,越大,模型的拟合效果越好,故D正确.
故选:C.
28.如图所示,有A,B,C,D,E共5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
【答案】D
【解析】当散点图中的点分布在一条直线附近时,样本数据有较强的线性相关关系,
应去掉D组数据剩下的4组数据的线性相关性较强.
29.观察下列散点图,有三种情况:①正相关,②负相关,③不相关.与散点图的位置相对应的序号依次是______.
【答案】①③②
【解析】第一个图大体趋势从左向右上升,故是正相关,第二个图不相关,
第三个图大体趋势从左向右下降,故是负相关.
30.某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数__________.(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
【答案】
【解析】由已知可得,,
,
则,
,
所以,.
31.已知为随机变量X和Y的样本相关系数,为随机变量M和N的样本相关系数,则下列说法正确的是( )
A.若,则X和Y负相关
B.若,则M和N线性不相关
C.若,,则X和Y的线性相关程度比M和N的线性相关程度强
D.若越接近1,则M和N的线性相关程度越弱
【答案】B
【解析】A,若,则X和Y正相关,故A错误;
B,若,则M和N线性不相关,故B正确;
C,若,,则,
所以X和Y的线性相关程度比M和N的线性相关程度弱,故C错误;
D,若越接近1,则M和N的线性相关程度越强,故D错误.
故选:B
32.对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
【答案】D
【解析】对于图1,散点总体斜向上分布,故变量与呈现正相关,故排除B;
对于图2,散点总体斜向上分布,故变量与呈现负相关,故排除C;
图1中散点图分布较为集中,图2中的散点图分布较为分散,故,
故选:D.
33.下面是不同成对数据的散点图,从左到右对应的样本相关系数分别是,其中最大的是( )
A. B.
C. D.
【答案】A
【解析】由散点图可知,并且第一个图中的点更为集中,更贴近某条直线分布,
第三、四个图中的点的分布更为分散,
因此更接近于1,的绝对值更接近于0,
即最大的是,
故选:A
34.下列四组成对数据:①,,,,;②,,,,;③,,,,;④,,,,.其中样本相关系数最小的是( )(附:样本相关系数)
A.① B.② C.③ D.④
【答案】C
【解析】对于①,数据均在上,故样本相关系数为1,
对于③,数据均在上,故样本相关系数为-1,
对于②,可看出其数据为正相关,故样本相关系数大于0,
对于④,显然所有数据无法落在某一个一次函数上,故,
事实上,
,
其中,故,
故,
综上,样本相关系数最小的是③.
故选:C
35.10对中国父子的身高(英寸)如下:
父亲身高()
60
62
64
65
66
67
68
70
72
74
儿子身高()
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
试根据上述资料:
(1)画出散点图;
(2)变量和之间是否具有线性关系?
(3)人们常说,父亲高,儿子肯定不矮,你赞成这种说法吗?
【解】(1)散点图如下:
(2)观察散点图中点的分布可以看出,这些点在一条直线的附近分布,所以变量和之间具有线性关系.
(3)不赞成这种说法,因为父亲身高与儿子身高是相关关系而非绝对的因果关系,儿子身高还受营养、环境等其他因素影响.
36.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图;
(2)判断是否具有相关关系.
【解】(1)根据已知表格中的数据可得施化肥量x对产量y的散点图如下所示:
(2)根据(1)中散点图可知,各组数据对应点大致分布在一个带状区域内(一条直线附近),
故施化肥量x和产量y具有线性相关关系。
37.直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,为此该公司统计了2024年前5个月的带货金额如下表(金额y/万元):
月份
1月
2月
3月
4月
5月
月份编号x
1
2
3
4
5
金额y/万元
7
12
13
19
24
并计算得,,.
(1)求该公司带货金额的平均值;
(2)求该公司带货金额y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有较强的线性相关关系(若,则线性相关性较强,否则认为线性相关性较弱).
附:相关系数,.
【解】(1)由数据可得,
(2)由于,,,所以相关系数,
因此与具有较强的线性相关性.
38.2019年11月份,全国工业生产者出厂价格同比下降,环比下降.某企业在了解市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制定相应的出厂价格.该企业统计了2019年1-10月份产品的生产数量与销售总额之间的关系,如下表所示.
万件
2.08
2.12
2.19
2.28
2.36
2.48
2.59
2.68
2.80
2.87
万元
42.5
43.7
44.0
45.5
46.4
47.5
49.2
50.3
51.4
52.6
(1)计算的值;
(2)计算样本相关系数的值,并通过的值的大小说明与之间的相关程度.
【解】(1)依题意,
(2)依题意,,,,
所以,
因为,所以与之间具有很强的相关性.
39.党的二十大报告指出绿水青山就是金山银山.某市为加快生态文明建设进程,加大生态环境保护投入力度,为祖国现代化建设增砖添瓦.现统计了该市近几年的生态环境保护投入资金,统计如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号x
1
2
3
4
5
6
投入资金y/千万
14
31
33
38
41
47
(1)根据上表作出散点图;
(2)观察散点图,判断投入资金y与年份编号x是否具有相关性.如果有,是正相关还是负相关.
【解】(1)作出散点图如下:
(2)由散点图可知,投入资金y与年份编号x具有相关关系,且呈现正相关关系.
1 / 10
学科网(北京)股份有限公司
$
8.1成对数据的相关分析
题型1变量间相关关系的判断
1.【答案】C
【解析】圆的面积与半径之间的关系是确定的函数关系,所以A中说法错误;体育锻炼与身体健康指标之间的关系不是函数关系,是相关关系,所以B中说法错误;人的体重与视力没有关系,所以D中说法错误;易知C中说法正确.故选C.
2.【答案】A
【解析】选项B,C,D中的两个变量都具有相关性,且都是一种不确定的关系,是相关关系.
而A中判别式和变量是一种确定的表达式,是一种函数关系,即一种确定的关系,所以不是相关关系.
故选:A
3.【答案】A
【解析】对于A,一般情况下,汽车越重,则每公里耗油量越多,成正相关,故A正确;
对于B,正方形的面积与边长是函数关系,故B错误;
对于C,一般情况下,若花费在体育活动上面的时间越长,则期末考试数学成绩可能会降低,故不为正相关,故C错误;
对于D,期末考试随机编排的准考证号与期末考试成绩总分没有相关关系,故D错误.
故选:A.
4.【答案】C
【解析】C中的两个变量之间是确定的函数关系,A,B,D中的两个变量之间的关系都是相关关系.
故选:C
题型2依据散点图判别变量间的相关关系
5.【答案】C
【解析】由这两个散点图可以判断,变量x与y负相关,u与v正相关.
6.【答案】D
【解析】观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.
故选:D.
7.【答案】D
【解析】A,B,C中各点有非线性拟合趋势,D中具有线性相关且为负相关,故选D
8.【答案】D
【解析】根据散点图,由相关性可知:图a各点散布在从左下角到右上角的区域里,是正相关;
图b中各点分布不成带状,相关性不明确,所以不相关;
图c中各点分布在从左上方到右下方的区域里,是负相关.故选D
9.【答案】B
【解析】从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则这两个变量为负相关.结合散点图可知,①②满足题意,即两个变量呈负相关的个数为2个.故选:B
题型3相关系数的意义及辨析
10.【答案】①②
【解析】对于①,相关系数满足,即变量间的线性相关系数的取值范围为,①正确;
对于②,根据相关系数的性质,,且越接近于1,相关程度越强,越接近于0,相关程度越弱,②正确;对于③,比如时,变量间的相关系数越小,则变量间的相关程度越强,③错误.
11.【答案】①③
【解析】根据题意,依次分析4个命题:
对于①,当时,成对样本数据之间不存在任何关系,而不是较弱,错误;
对于②,当时,表明成对样本数据正相关,正确;
对于③,若线性回归方程中的回归系数,说明成对样本数据呈负相关,则相关系数,错误;
对于④,越接近1,线性相关程度越强,越接近0,线性相关程度越弱,正确.
12.【答案】乙
【解析】因为,所以这四人中,乙研究的两个随机变量的线性相关程度最高,
13.【答案】B
【解析】线性相关系数的绝对值越接近于1,相关程度就越强,
因为,
经过比较可知,最大,所以组的线性相关程度最强.
故选:B.
题型4求样本的相关系数
14.【答案】
【解析】由题设,有.
15.【答案】
【解析】由题意可得,
,
所以
,
,
所以.
16.【答案】
【解析】由表格中的数据,可得,,
则,
,,
故.
17.【答案】0.976
【解析】由题意可知:,
可得,
所以.
题型5相关系数的实际应用
18.【解】由题意知,
,
,
,,.
所以样本相关系数.
,故我们可以认为与之间具有较强的线性相关关系.
即这10名学生的两次数学成绩具有较强的线性相关关系.
19.【解】由题意,变量与的相关系数,
变量与的相关系数是,
可以看出TC指标值与BMI值,GLU指标值与BMI值都是高度正相关.
20.【解】,
,
,
,
,
故相关系数,
,与高度正相关.
题型1散点图中的相关系数大小
21.【答案】A
【解析】由散点图可知,并且第一个图中的点更为集中,更贴近某条直线分布,
第三、四个图中的点的分布更为分散,
因此更接近于1,的绝对值更接近于0,
即最大的是,
故选:A
22.【答案】D
【解析】由图可知,AC选项的散点图呈现出一定的下降趋势,两变量为负相关,相关系数小于0,
BD选项的散点图呈现出一定的上升趋势,两变量为正相关,相关系数大于0,
而B选项的散点图,散点比较分散,D选项的散点图,散点紧密地聚集在一条直线附近,
因此D选项的相关系数最大.
故选:D.
23.【答案】A
【解析】由图知,对应的与负相关,且对应的相关性更强,即;
对应的与正相关,且对应的相关性更强,即,
所以.
故选:A
题型2决定系数的拟合效果
24.【答案】B
【解析】增加点,从散点图中可以看出拟合效果变差;
越接近,相关程度越强,拟合效果越好,由于两个变量成正相关,所以相关系数变小;故A错误;
决定系数越接近,拟合效果越好,所以决定系数变小,故B正确;
残差平方和越小,拟合效果越好,所以残差平方和变大;故C错误;
增加点前的的平均数为,增加点后的的平均数为,所以变大,故D错误.
故选:B
25.【答案】D
【解析】A:回归直线过样本中心点,每个样本点不一定都在回归直线方程上,所以本选项说法不正确;
B:因为在回归分析模型中,决定系数越大,模型的拟合效果越好,所以本选项说法不正确;
C:因为残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越高,
所以本选项说法不正确,
D:当样本相关系数时,成对样本数据正相关,因此本选项说法正确,
故选:D
26.【答案】C
【解析】A选项,残差图带状区域越宽,说明误差大,模型的拟合效果越差,A错误;
B选项,残差平方和越小,模型的拟合效果越好,B错误;
C选项,决定系数越大,模型的拟合效果越好,C正确;
D选项,相关系数越大,说明两个变量线性相关性越强,与模型的拟合效果无关,D错误.
故选:C
27.【答案】C
【解析】选项A,直线的斜率,且所有样本点都落在直线上,
所以这组样本数据负相关,且样本相关系数达到最小值,即,故A正确;
选项B,相应于样本点的残差为,故B正确;
选项C,因为回归直线过样本点的中心,
所以,解得,故C错误;
选项D,由决定系数的意义可知,越大,模型的拟合效果越好,故D正确.
故选:C.
28.【答案】D
【解析】当散点图中的点分布在一条直线附近时,样本数据有较强的线性相关关系,
应去掉D组数据剩下的4组数据的线性相关性较强.
29.【答案】①③②
【解析】第一个图大体趋势从左向右上升,故是正相关,第二个图不相关,
第三个图大体趋势从左向右下降,故是负相关.
30.【答案】
【解析】由已知可得,,
,
则,
,
所以,.
31.【答案】B
【解析】A,若,则X和Y正相关,故A错误;
B,若,则M和N线性不相关,故B正确;
C,若,,则,
所以X和Y的线性相关程度比M和N的线性相关程度弱,故C错误;
D,若越接近1,则M和N的线性相关程度越强,故D错误.
故选:B
32.【答案】D
【解析】对于图1,散点总体斜向上分布,故变量与呈现正相关,故排除B;
对于图2,散点总体斜向上分布,故变量与呈现负相关,故排除C;
图1中散点图分布较为集中,图2中的散点图分布较为分散,故,
故选:D.
33.【答案】A
【解析】由散点图可知,并且第一个图中的点更为集中,更贴近某条直线分布,
第三、四个图中的点的分布更为分散,
因此更接近于1,的绝对值更接近于0,
即最大的是,
故选:A
34.【答案】C
【解析】对于①,数据均在上,故样本相关系数为1,
对于③,数据均在上,故样本相关系数为-1,
对于②,可看出其数据为正相关,故样本相关系数大于0,
对于④,显然所有数据无法落在某一个一次函数上,故,
事实上,
,
其中,故,
故,
综上,样本相关系数最小的是③.
故选:C
35.【解】(1)散点图如下:
(2)观察散点图中点的分布可以看出,这些点在一条直线的附近分布,所以变量和之间具有线性关系.
(3)不赞成这种说法,因为父亲身高与儿子身高是相关关系而非绝对的因果关系,儿子身高还受营养、环境等其他因素影响.
36.【解】(1)根据已知表格中的数据可得施化肥量x对产量y的散点图如下所示:
(2)根据(1)中散点图可知,各组数据对应点大致分布在一个带状区域内(一条直线附近),
故施化肥量x和产量y具有线性相关关系。
37.【解】(1)由数据可得,
(2)由于,,,所以相关系数,
因此与具有较强的线性相关性.
38.【解】(1)依题意,
(2)依题意,,,,
所以,
因为,所以与之间具有很强的相关性.
39.【解】(1)作出散点图如下:
(2)由散点图可知,投入资金y与年份编号x具有相关关系,且呈现正相关关系.
1 / 10
学科网(北京)股份有限公司
$