内容正文:
8.1.2 样本相关系数 知识归纳与试题检测(学生版)
【1】问题式教材知识归纳
【1】样本相关系数:设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示:
变量x
…
变量y
…
两组数据和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量,
其计算公式为_______,
其中,,,它们分别是这两组数据的算术平均数.
(2)相关系数r的性质
①当时,称成对样本数据正相关;
当时,成对样本数据负相关;
当时,成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为[-1,1];
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
【2】相关系数的简易推导
______.
【答案】
【3】相关系数的性质
(1)的取值范围是.当时,称变量和变量______;当时,称变量和变量______.
(2)越接近于1,变量,的线性相关程度越高,这时数据分散在一条直线附近.
(3)越接近于0,变量的线性相关程度越低.
(4)具有对称性,即.
(5)仅仅是变量与之间线性相关程度的一个度量.只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.
【4】相关系数与向量夹角
若我们把两组成对数据分别看作维空间的两个向量,,且,,从而有.
由向量知识可知,两向量夹角的取值范围为,其余弦值的取值范围为.
(1)当夹角属于时,余弦值越大表示两个向量的夹角越______,两组数据的正相关程度越______;余弦值越小表示两个向量的夹角越______,两组数据的正相关程度越______.
(2)当夹角属于时,余弦值越大表示两个向量的夹角越______,两组数据的负相关程度越______;余弦值越小表示两个向量的夹角越______,两组数据的负相关程度越______.
(3)当夹角为时,余弦值为0,这说明两组数据不存在______.
【5】【微思考】
(1)当时,成对样本数据之间具有怎样的关系呢?
_________________
(2)当时,是否表明成对数据间就不存在相关性了?
___________________
【2】基于教材的检测题
一、单选题
1.对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是( )
A. B. C. D.
2.已知,,,四组成对样本数据对应的线性相关系数分别为-0.95,-0.82,0.86,0.93,则线性相关程度最弱的是( )
A.组 B.组 C.组 D.组
3.某研究小组为了探究变量x与y之间的线性相关关系,收集了5组数据,(),并绘制成如图所示的散点图(点A,B,C,D,E).经计算,这5组数据的样本相关系数为r.若去掉点后,剩余4组数据的样本相关系数为,则下列结论正确的是( )
A. B. C. D.
4.对于变量有观测数据,得散点图1;对于变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法不正确的是( )
A. B.
C. D.
5.通过随机抽样绘制得到如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.下列说法正确的是( ).
A.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
B.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
C.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
6.为考察两个变量x,y的相关性,搜集数据如表,则两个变量的线性相关程度( )
x
5
10
15
20
25
y
103
105
110
111
114
(参考数据:,,,≈15.8,≈9.01)
A.很强 B.很弱
C.无相关 D.不确定
7.研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量.若的样本相关系数为,的样本相关系数为,则的样本相关系数的最大值为( )
附:样本相关系数
A. B. C. D.1
8.最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
9.下列四组成对数据:①,,,,;②,,,,;③,,,,;④,,,,.其中样本相关系数最小的是( )(附:样本相关系数)
A.① B.② C.③ D.④
10.一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
11.为考察两个变量,的相关性,搜集数据如表,则两个变量的线性相关程度( )
5
10
15
20
25
103
105
110
111
114
(参考数据:,,)
A.很强 B.很弱 C.无相关 D.不确定
二、多选题
12.(多选)下列关于相关系数的说法正确的是( )
A.相关系数越大两个变量间相关性越强
B.相关系数的取值范围为
C.相关系数时两个变量正相关,时两个变量负相关
D.相关系数时,样本点在同一直线上
13.通过随机抽样,得到变量和变量的7对数据,并绘制成散点图如图所示,已知变量和变量线性相关,且回归直线是图中直线,则下列说法正确的是( )
A.直线的斜率是负数
B.变量与变量正相关
C.相关系数
D.若去掉图中点后,剩余数据的相关系数变大
三、填空题
14.已知一组变量线性相关,样本相关系数,现将坐标原点平移到点,则大多数点应该落在第____象限.
15.在研究线性回归模型时,样本数据所对应的点均在直线上,则这组样本数据的样本相关系数为______.
16.已知样本相关系数,则成对样本数据,,,,的相关系数为______.
17.已知高中学生的数学成绩,物理成绩,化学成绩两两成正相关关系,随机抽取10名同学,数学成绩和物理成绩的样本线性相关系数为,物理成绩与化学成绩的样本线性相关系数为,求的样本线性相关系数的最大值为_____.
(附:相关系数
四、解答题
18.随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后18个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额数量(单位:万元),并计算得, .
求样本的相关系数(精确到0.01),并推断销售金额(单位:万元)和月份编号是否线性相关(当时,即可认为线性相关);
附:相关系数.
19.某高校快递站统计了某年度新学期前5天的取件人数y(单位:人),得到如下样本数据:
天数(序号)x
1
2
3
4
5
每日取件人数
120
100
80
70
55
计算样本相关系数r,并据此判断变量x与y之间线性相关关系的强弱(结果保留两位小数);
注: 样本的相关系数
(2)参考数据:
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
$
8.1.2 样本相关系数 知识归纳与试题检测(详解版)
【1】问题式教材知识归纳
【1】样本相关系数:设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示:
变量x
…
变量y
…
两组数据和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量,
其计算公式为_______,
其中,,,它们分别是这两组数据的算术平均数.
(2)相关系数r的性质
①当时,称成对样本数据正相关;
当时,成对样本数据负相关;
当时,成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为[-1,1];
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
【答案】
【2】相关系数的简易推导
______.
【答案】
【3】相关系数的性质
(1)的取值范围是.当时,称变量和变量______;当时,称变量和变量______.
(2)越接近于1,变量,的线性相关程度越高,这时数据分散在一条直线附近.
(3)越接近于0,变量的线性相关程度越低.
(4)具有对称性,即.
(5)仅仅是变量与之间线性相关程度的一个度量.只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.
【答案】 正相关 负相关
【4】相关系数与向量夹角
若我们把两组成对数据分别看作维空间的两个向量,,且,,从而有.
由向量知识可知,两向量夹角的取值范围为,其余弦值的取值范围为.
(1)当夹角属于时,余弦值越大表示两个向量的夹角越______,两组数据的正相关程度越______;余弦值越小表示两个向量的夹角越______,两组数据的正相关程度越______.
(2)当夹角属于时,余弦值越大表示两个向量的夹角越______,两组数据的负相关程度越______;余弦值越小表示两个向量的夹角越______,两组数据的负相关程度越______.
(3)当夹角为时,余弦值为0,这说明两组数据不存在______.
【答案】 小 高 大 低 小 低 大 高 线性相关关系
【5】【微思考】
(1)当时,成对样本数据之间具有怎样的关系呢?
_________________
(2)当时,是否表明成对数据间就不存在相关性了?
___________________
【答案】 当 |r|=1 时,成对样本数据的两个分量之间满足一种线性关系. 当 r=0 时,表明成对数据间没有线性相关关系,但不能排除它们之间有其他相关关系.
【2】基于教材的检测题
一、单选题
1.对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是( )
A. B. C. D.
【答案】B
【详解】图①,数据点呈正线性相关,且相关性很强,所以接近1;
图②,数据点呈负线性相关,且相关性很强,所以接近;
图③,数据点呈正线性相关,且相关性比图①弱,所以;
图④,数据点呈负线性相关,且相关性比图②弱,所以;
所以.
2.已知,,,四组成对样本数据对应的线性相关系数分别为-0.95,-0.82,0.86,0.93,则线性相关程度最弱的是( )
A.组 B.组 C.组 D.组
【答案】B
【分析】由线性相关系数的性质判断即可得.
【详解】因为,所以线性相关程度最弱的是组.
3.某研究小组为了探究变量x与y之间的线性相关关系,收集了5组数据,(),并绘制成如图所示的散点图(点A,B,C,D,E).经计算,这5组数据的样本相关系数为r.若去掉点后,剩余4组数据的样本相关系数为,则下列结论正确的是( )
A. B. C. D.
【答案】A
【分析】从图中可以看出点较其他点,偏离直线远,所以去掉点后,回归效果更好,结合相关系数的性质判断.
【详解】从散点图中可知,样本数据的两变量是正相关,
由于点较其他点偏离程度大,删除点后,回归效果更好,
从而相关系数的绝对值更接近于1,所以
4.对于变量有观测数据,得散点图1;对于变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法不正确的是( )
A. B.
C. D.
【答案】A
【分析】根据散点图及相关系数的性质,逐一分析各个选项,即可得答案.
【详解】由图1和图2可得,随的增大而增大,随的增大而减小,
所以,所以,故B正确;
因为图1的数据点比图2的更集中,所以,
所以,,故A错误,C正确;
,故D正确.
5.通过随机抽样绘制得到如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.下列说法正确的是( ).
A.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
B.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
C.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
【答案】B
【详解】改变变量的单位,线性相关系数不变,C、D错;
去除A点后,线性相关程度变高,
因为是负相关,所以线性相关系数变小,故A错误、B正确.
6.为考察两个变量x,y的相关性,搜集数据如表,则两个变量的线性相关程度( )
x
5
10
15
20
25
y
103
105
110
111
114
(参考数据:,,,≈15.8,≈9.01)
A.很强 B.很弱
C.无相关 D.不确定
【答案】A
【分析】先计算线性相关系数 ,再通过 ()的绝对值判断相关强度( 越接近1,线性相关程度越强).
【详解】解析:由题可知样本量 ,所以:
=15,
=108.6,
又因为:,,,,≈15.8,
所以:
=,
因为相关系数很接近于1,故两个变量的线性相关程度很强.
答案:A.
7.研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量.若的样本相关系数为,的样本相关系数为,则的样本相关系数的最大值为( )
附:样本相关系数
A. B. C. D.1
【答案】B
【分析】设,,,,,,与的夹角为,与的夹角为,再由相关系数可知,则与夹角的余弦值的最大值为,利用余弦差角公式求值即可.
【详解】设,,,
,,,
由样本相关系数公式可知,,
设与的夹角为,与的夹角为,则有,
易知均为锐角且,
与夹角的余弦值的最大值为,此时与样本相关系数最大,
,
故的样本相关系数的最大值为.
故选:B.
8.最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
【答案】A
【分析】根据相关系数公式计算即可求解.
【详解】,,
,
.
故选:A.
9.下列四组成对数据:①,,,,;②,,,,;③,,,,;④,,,,.其中样本相关系数最小的是( )(附:样本相关系数)
A.① B.② C.③ D.④
【答案】C
【分析】观察数据,对于①,样本相关系数为1,对于③,样本相关系数为-1,再对②和④进行观察和计算,最终可得答案.
【详解】对于①,数据均在上,故样本相关系数为1,
对于③,数据均在上,故样本相关系数为-1,
对于②,可看出其数据为正相关,故样本相关系数大于0,
对于④,显然所有数据无法落在某一个一次函数上,故,
事实上,
,
其中,故,
故,
综上,样本相关系数最小的是③.
故选:C
10.一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
【答案】D
【分析】运用相关系数公式进行求解即可.
【详解】因为,,所以,
,
故选:D.
11.为考察两个变量,的相关性,搜集数据如表,则两个变量的线性相关程度( )
5
10
15
20
25
103
105
110
111
114
(参考数据:,,)
A.很强 B.很弱 C.无相关 D.不确定
【答案】A
【分析】根据已知计算相关系数,再根据相关系数的值判断线性相关程度.
【详解】由题可得,,
则
,
因为相关系数很接近于1,故两个变量的线性相关程度很强.
故选:A.
二、多选题
12.(多选)下列关于相关系数的说法正确的是( )
A.相关系数越大两个变量间相关性越强
B.相关系数的取值范围为
C.相关系数时两个变量正相关,时两个变量负相关
D.相关系数时,样本点在同一直线上
【答案】BCD
【分析】根据相关系数的意义对每个结论进行分析、判断可得错误的结论.
【详解】对于相关系数,有以下结论:①当时,表明两个变量正相关;当时,表明两个变量负相关.
②的绝对值越接近于,表明两个变量的线性相关性越强;的绝对值越接近于,表明两个变量之间几乎不存在线性相关关系.
对于A,当时此结论不成立,所以A不正确.
对于B,由相关系数的性质可得,所以B正确.
对于C,由相关系数的性质可得正确.
对于D,由相关系数的性质可得正确.
故选:BCD.
13.通过随机抽样,得到变量和变量的7对数据,并绘制成散点图如图所示,已知变量和变量线性相关,且回归直线是图中直线,则下列说法正确的是( )
A.直线的斜率是负数
B.变量与变量正相关
C.相关系数
D.若去掉图中点后,剩余数据的相关系数变大
【答案】AC
【分析】根据数据的散点图,结合相关性、相关系数的概念与定义,逐项判定,即可得解.
【详解】对于A、B、C:由图可知直线的斜率是负数,所以变量与变量负相关,相关系数,故A、C正确,B错误;
对于D:若去掉图中点后,剩余的数据会更集中,相关程度会更高,相关系数的绝对值变大,又,所以相关系数变小,故D错误.
故选:AC.
三、填空题
14.已知一组变量线性相关,样本相关系数,现将坐标原点平移到点,则大多数点应该落在第____象限.
【答案】二、四
【分析】根据负相关的散点图特点,判断结果即可.
【详解】因为,所以变量负相关,则在以为坐标原点的坐标系下的散点图,大多数点应该落在第二、四象限.
15.在研究线性回归模型时,样本数据所对应的点均在直线上,则这组样本数据的样本相关系数为______.
【答案】
【分析】根据回归模型性质判断即可.
【详解】因为样本数据所对应的点都在直线上,所以,
又样本数据负相关,所以.
故答案为:.
16.已知样本相关系数,则成对样本数据,,,,的相关系数为______.
【答案】/
【分析】根据相关系数的计算公式分别计算数据即可.
【详解】因为,,
则,
,
所以.
故答案为:.
17.已知高中学生的数学成绩,物理成绩,化学成绩两两成正相关关系,随机抽取10名同学,数学成绩和物理成绩的样本线性相关系数为,物理成绩与化学成绩的样本线性相关系数为,求的样本线性相关系数的最大值为_____.
(附:相关系数
【答案】
【分析】利用相关系数公式可看成两个维向量的夹角公式,从而把相关系数问题转化为向量夹角问题,即可求解.
【详解】设,
则有,
由相关系数公式得,
设与夹角为与夹角为,
由的样本相关系数为,的样本相关系数为,所以,
由这两个夹角均为锐角且,所以与夹角的可能性是,
则与夹角余弦值的最大值为,此时与样本相关系数最大,
即,
所以的样本线性相关系数的最大值为.
故答案为:.
四、解答题
18.随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后18个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额数量(单位:万元),并计算得, .
求样本的相关系数(精确到0.01),并推断销售金额(单位:万元)和月份编号是否线性相关(当时,即可认为线性相关);
附:相关系数.
【答案】,具有很强的正相关性
【分析】由条件结合相关系数公式求出相关系数,根据相关系数性质判断结论;
【详解】样本的相关系数为:
由于相关系数,故销售金额(单位:万元)和月份编号具有很强的正相关性;
19.某高校快递站统计了某年度新学期前5天的取件人数y(单位:人),得到如下样本数据:
天数(序号)x
1
2
3
4
5
每日取件人数
120
100
80
70
55
计算样本相关系数r,并据此判断变量x与y之间线性相关关系的强弱(结果保留两位小数);
注: 样本的相关系数
【答案】;变量x与y之间具有很强的线性相关关系
【分析】使用相关系数计算公式求相关系数,根据求解结果判断线性相关关系的强弱;
【详解】,,
,
,
,
样本相关系数:
,
因为非常接近1,所以变量x与y之间具有很强的线性相关关系.
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
$