内容正文:
第13讲 成对数据的统计相关性
【人教A版2019】
模块一
变量的相关关系
1.变量的相关关系
(1)函数关系
函数关系是一种确定性关系,常用解析式来表示.
(2)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关
系.与函数关系不同,相关关系是一种非确定性关系.
2.散点图
(1)散点图
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)正相关和负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个
变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线
性相关.
【题型1 相关关系与函数关系的概念及辨析】
【例1.1】(23-24高一下·青海海东·期末)下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【解题思路】函数关系是变量之间的确定关系,相关关系是变量之间确实存在关系但不具有确定性,据此判断即可.
【解答过程】解:对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;
对于B,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B错误;
对于C,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C正确;
对于D,人的体重与视力是没有相关关系的,所以D错误.
故选:C.
【例1.2】(24-25高一下·吉林延边·阶段练习)下列两个变量之间的关系哪个不是函数关系( )
A.角度和它的正切值 B.人的右手一柞长和身高
C.正方体的棱长和表面积 D.真空中自由落体运动物体的下落距离和下落时间
【解题思路】由函数的定义可知,两个变量有确定的关系,由此进行判断.
【解答过程】选项,由于角度和正切值有确定的关系;选项,人的右手一柞长和身高不具有统一的关系;选项,正方体的棱长和表面积有关系;选项,真空中自由落体运动物体的下落距离和下落时间有确定的关系.
故选:B.
【变式1.1】(24-25高二下·河南洛阳·阶段练习)下列说法正确的是( )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
【解题思路】根据相关关系是一种不确定关系,函数关系是一种确定关系,可判断A;根据球的体积与半径之间的关系,可判断该关系为函数关系,可判断B;根据农作物的产量与施化肥量之间的关系可得该关系为一种相关关系,可判断C;根据学生的数学成绩与物理成绩之间是一种相关关系可判断D.
【解答过程】解:当两个变量之间具有确定的关系时,两个变量之间是函数关系,而不是相关关系,故A错误;
球的体积与该球的半径之间是函数关系,故B错误;
农作物的产量与施化肥量之间的关系是相关关系,是非确定性关系,故C错误;
学生的数学成绩与物理成绩之间的关系是相关关系,是非确定性关系,故D正确.
故选:D.
【变式1.2】(24-25高一下·江西南昌·阶段练习)下列两个变量具有相关关系且不是函数关系的是( )
A.圆的半径与面积
B.匀速行驶的车辆的行驶距离与时间
C.庄稼的产量与施肥量
D.人的身高与视力
【解题思路】根据函数关系与相关关系的定义判断即可.
【解答过程】解:A、由圆的半径与面积的公式知,为函数关系,故A不对;
B、匀速行驶车辆的行驶路程与时间为 其中为匀速速度为函数关系,故B不对;
C、施肥量会影响庄稼产量,但不是唯一因素,故庄稼的产量与施肥量两个变量具有相关关系且不是函数关系,故C对;
D、人的身高与视力无任何关系,故D不对.
故选:C.
【题型2 判断两个变量是否有相关关系】
【例2.1】(23-24高一下·湖南怀化·期末)下列说法中正确的是( )
A.中的,是具有相关关系的两个变量
B.正四面体的体积与其棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.某地区感染流感人数与外来流感患者人数是具有相关关系的两个变量
【解题思路】对于,,是函数关系;对于,体积与棱长的关系是确定的,属于确定性关系;对于,电脑的销售量受多种因素的影响不是确定关系,对于,两个变量是相关关系.
【解答过程】对于,,是函数关系,属于确定性关系,不是相关关系,故不正确;
对于,体积与棱长的关系是确定的,属于确定性关系,不是相关关系,故不正确;
对于,电脑的销售量除了受电脑价格的影响之外,还受电脑品牌,电脑性能,同行竞争等多种因素的影响,不是确定关系,故不正确;
对于,某地区感染流感人数与外来流感患者人数是具有相关关系的两个变量,故正确.
故选:D.
【例2.2】(23-24高二下·吉林·期末)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
【解题思路】根据相关关系的定义判断即可.
【解答过程】对于A:人的身高与受教育的程度不具有相关关系,故A错误;
对于B:人的体重与眼睛的近视程度不具有相关关系,故B错误;
对于C:企业员工的工号与工资不具有相关关系,故C错误.
对于D:儿子的身高与父亲的身高具有相关关系,故D正确.
故选:D.
【变式2.1】(2024高二下·云南曲靖·学业考试)下列两个变量之间的关系是相关关系的是( )
A.等边三角形的边长与其面积
B.匀速直线行驶的电车的位移与行驶时间
C.杂交水稻植株的高度与土壤湿润度
D.汽车在陆地上的刹车制动时间与洞庭湖湖面上的空气阻力
【解题思路】根据变量间的相关关系的定义求解.
【解答过程】解:A.等边三角形的边长与其面积的关系为,两个变量是函数关系,不符合题意;
B.匀速直线行驶的电车的位移与行驶时间的关系为,两个变量是函数关系,不符合题意;
C.杂交水稻植株的高度与土壤湿润度具有相关关系,符合题意;
D.汽车在陆地上的刹车制动时间与洞庭湖湖面上的空气阻力不具有相关关系,不符合题意.
故选:C.
【变式2.2】(23-24高二下·安徽·期末)下列两个变量之间的关系是相关关系的是( )
A.等边三角形的边长a与其面积S
B.匀速直线行驶的汽车的位移s与行驶时间t
C.杂交水稻植株的高度h与土壤湿润度r
D.某班的学生人数n与该班某次数学考试的平均分x
【解题思路】根据相关关系的定义即可逐一判断.
【解答过程】对于A选项,因为,边长a与面积S是确定的函数关系,故A错误;
对于B选项,设匀速直线行驶的汽车的速度为,,所以位移s与行驶时间t是确定的函数关系,故B错误;
对于C选项,杂交水稻植株的高度h与土壤湿润度r具有相关关系,通常情况下,土壤湿润度r会一定程度上影响杂交水稻植株的高度h值的,故C正确;
对于D选项,因为班级某次数学考试的平均分x等于班级总分除以学生人数n,所以当班级总分确定的情况下,某班的学生人数n与该班某次数学考试的平均分x是一种确定关系,故D正确;
故选:C.
【题型3 判断正、负相关】
【例3.1】(23-24高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
【解题思路】根据散点图判断.
【解答过程】画出弹簧伸长长度x和相应所受外力F的散点图,
可以判断这两变量相关,且为正相关,故①②错误,③正确.
故选:C.
【例3.2】(23-24高二下·北京丰台·期末)在一般情况下,下列各组的两个变量呈正相关的是( )
A.某商品的销售价格与销售量 B.汽车匀速行驶时的路程与时间
C.气温与冷饮的销售量 D.人的年龄与视力
【解题思路】根据相关关系的概念逐项判定,即可求解.
【解答过程】对于A,某商品的销售价格与销售量呈负相关关系,故错误;
对于B,汽车匀速行驶时的路程与时间是函数关系,故错误;
对于C,气温与冷饮的销售量呈正相关,故正确;
对于D,人的年龄与视力呈负相关,故错误.
故选:C.
【变式3.1】(2024·辽宁葫芦岛·一模)已知变量与的回归直线方程为,变量与负相关,则( )
A.与负相关,与负相关 B.与正相关,与正相关
C.与负相关,与正相关 D.与正相关,与负相关
【解题思路】根据已知条件,结合回归方程可判断与正相关,再由变量与负相关,即可判断与负相关.
【解答过程】根据回归方程可知变量与正相关,又变量与负相关,
由正相关、负相关的定义可知,与负相关.
故选:D.
【变式3.2】(23-24高二下·北京·期末)对变量、由观测数据得散点图,对变量、由观测数据得散点图.由这两个散点图可以判断( )
A.变量与负相关,与正相关
B.变量与负相关,与负相关
C.变量与正相关,与正相关
D.变量与正相关,与负相关
【解题思路】根据散点图直接判断可得出结论.
【解答过程】由散点图可知,变量与负相关,变量与正相关,所以,与负相关.
故选:B.
模块二
样本相关系数
1.样本相关系数
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为,利用
相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
(其中和的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;
当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;
当其中一个数据的值变大时,另一个数据的值通常会变小.
【题型4 样本相关系数的意义及辨析】
【例4.1】(24-25高二下·天津·阶段练习)以下散点图经过标准化后,相关系数最大的是( )
A. B.
C. D.
【解题思路】利用散点图变化趋势,判断相关系数的正负,由散点的集中程度确定大小,即可得到答案.
【解答过程】对于,散点呈上升趋势,线性相关系数为正数,这些点紧密的聚集在一条直线的附近,线性相关性强;
对于,散点分布呈曲线趋势,线性相关程度比弱;
对于,散点呈下降趋势,线性相关系数为负数;
对于,散点分布比较分散,线性相关程度比弱;
所以相关系数最大的是.
故选:.
【例4.2】(24-25高二下·江西上饶·阶段练习)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【解题思路】根据相关系数的概念即可判断.
【解答过程】由图可知图(1)和图(3)是正相关,故相关系数为正,又因为图(1)的点较图(3)的点分布密集,故相关性图(1)更好,相关系数较大,即;
图(2)和图(4)是负相关,故相关系数为负,又因为图(2)的点较图(4)的点分布密集,故相关性图(2)更好,相关系数的绝对值较大,即,故;
综上可知:,
故选:A.
【变式4.1】(24-25高三下·上海浦东新·阶段练习)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对进行线性回归分析.若在此图中加上点后,再次对进行线性回归分析,则下列说法正确的是( )
A.不具有线性相关性 B.相关系数变大
C.相关系数变小 D.相关系数不变
【解题思路】根据散点图,可判断A选项,加入点后,回归效果变差,从而可判断B,C,D选项.
【解答过程】对于A,加入点后,变量与预报变量相关性变弱,但不能说不具有线性相关性,故A错误;
对于B,C,D,由于点远离其他点,故加上点后,回归效果会变差,
所以相应的样本相关系数的绝对值会变小,
根据题中散点图,显然,所以会变小,故C正确,B,D错误.
故选:C.
【变式4.2】(24-25高二·全国·假期作业)某统计部门对四组数据进行统计分析后, 获得如图所示的散点图.
下面关于样本相关系数的比较, 正确的是 ( )
A. B.
C. D.
【解题思路】根据散点图和相关系数的概念得到,,进而得到答案.
【解答过程】由题图可知,所对应的图中的散点呈现正相关,
而且对应的散点图更接近直线,相关性比对应的相关性要强,故,
,所对应的图中的散点呈现负相关,
而且对应的散点图更接近直线,相关性比对应的相关性要强,故,
因此.
故选:C.
【题型5 相关系数的计算】
【例5.1】(24-25高二下·全国·课后作业)某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
【解题思路】根据已知数据分别计算各个量得出的值即可.
【解答过程】由题得,
所以,
故接待人数与年份的相关系数约为0.97.
故选:D.
【例5.2】(24-25高二下·江苏·单元测试)一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,,,,,则y与x的相关系数r的绝对值为( )
A.0.6 B.0.5
C.0.4 D.0.3
【解题思路】运用相关系数公式进行求解即可.
【解答过程】因为,,所以,
,
故选:D.
【变式5.1】(23-24高二下·江苏·课前预习)维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.
甲醛浓度x
18
20
22
24
26
28
30
缩醛化度(y)
26.86
28.35
28.75
28.87
29.75
30.00
30.36
求样本相关系数r并判断它们的相关程度.
【解题思路】根据题意列出表格,并结合相关系数公式求出,从而可求解.
【解答过程】列表如下
i
1
18
26.86
324
721.459 6
483.48
2
20
28.35
400
803.722 5
567
3
22
28.75
484
826.562 5
632.5
4
24
28.87
576
833.476 9
692.88
5
26
29.75
676
885.062 5
773.5
6
28
30.00
784
900
840
7
30
30.36
900
921.729 6
910.80
∑
168
202.94
4 144
5892.013 6
4 900.16
,,
则.
由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.
【变式5.2】(2024高二下·全国·专题练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面(单位:亩)与相应的管理时间(单位:月)的关系如表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
11
14
24
23
作出散点图,判断管理时间与土地使用面积是否线性相关,并根据相关系数说明相关关系的强弱.(若,认为两个变量有较强的线性相关性,的值精确到0.001)
注:亩,我国市制土地面积单位,1亩≈666.7平方米.
参考公式:.
参考数据:,,.
【解题思路】根据表格数据画出散点图,即可判断线性相关性,再根据所给公式计算出相关系数即可.
【解答过程】根据表格数据可得散点图如图所示.
由散点图可知,管理时间与土地使用面积线性相关.
依题意,,又,
,
,
,
则.
因为,所以管理时间与土地使用面积线性相关性较强.
【题型6 相关系数与其他知识的交汇问题】
【例6.1】(23-24高二下·吉林长春·期末)将保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中15个区域进行编号,统计抽取到的每个区域的某种水源指标和区域内该植物分布的数量,得到数组.已知,.
(1)求样本的样本相关系数;
(2)假设该植物的寿命为随机变量X(X可取任意正整数),研究人员统计大量数据后发现,对于任意的,寿命为的样本在寿命超过k的样本里的数量占比与寿命为1的样本在全体样本中的数量占比相同,均为0.1,这种现象被称为“几何分布的无记忆性”.用含k的式子表示,并求的值.
附:样本相关系数;当k足够大时,.
【解题思路】(1)利用相关系公式计算即可;
(2)由题意可得,进而可得,可得,最后再代入即可.
【解答过程】(1)由,,.
得样本相关系数.
(2)依题意,,
又,
则,
当时,把换成,
则,
两式相减得,
即,
又,
所以对任意都成立,
从而是首项为0.1,公比为0.9的等比数列,
所以,.
【例6.2】(2024·全国·模拟预测)中国新能源汽车企业在10余年间实现了“弯道超车”,使我国一跃成为新能源汽车产量连续7年居世界第一的全球新能源汽车强国.某新能源汽车配件企业积极加大科研力度,生产效益逐步攀升.该企业在今年1月份至5月份的生产利润(单位:亿元)关于月份的数据如下表所示:
月份
1
2
3
4
5
生产利润(亿元)
2
6
8
9
10
(1)试求y与x之间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若,则认为两个变量具有较强的线性相关性)
(2)为扩大生产,该企业在M大学启动了校园招聘,分别招聘A、B两个工程师岗位,两个岗位都各设有3门笔试科目.M大学的硕士毕业生张无忌决定参加这次应聘,且每门科目考试是否通过相互独立.若张无忌报考A岗位,每门笔试科目通过的概率依次为,,,其中;若张无忌报考B岗位,每门笔试科目通过的概率均为.且张无忌只能报考A,B两个岗位中的一个.若以笔试中通过科目数的数学期望为依据作出决策,得出张无忌更有希望通过A岗位的笔试,试求的取值范围.
附:参考数据:,,.
相关系数.
【解题思路】(1)计算相关系数r,再进行判断即可;
(2)分别计算通过A,B两个岗位的科目数学期望,再比较大小判断即可.
【解答过程】(1)由题意,,故y与x具有较强的线性相关关系.
(2)由题意,因为每门科目考试是否通过相互独立,故张无忌通过A岗位的3门笔试门数的数学期望为,
通过B岗位的3门笔试门数的数学期望为,
故若张无忌更有希望通过A岗位的笔试,则,又,解得.
即的取值范围.
【变式6.1】(2025·河南·模拟预测)某公司是一家集无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种类型无人运输机性能都比较出色,但操控水平需要十分娴熟,才能发挥更大的作用.已知在单位时间内,甲、乙两种类型的无人运输机操作成功的概率分别为和,假设每次操作能否成功相互独立.
(1)该公司分别收集了甲型无人运输机在5个不同的地点测试的两项指标数,(),数据如下表所示:
地点1
地点2
地点3
地点4
地点5
甲型无人运输机指标数
2
4
5
6
8
甲型无人运输机指标数
3
4
4
4
5
试求与间的相关系数,并利用说明与是否具有较强的线性相关关系;(若,则线性相关程度很高)
(2)操作员连续进行两次无人机的操作有两种方案:
方案一:在初次操作时,随机选择两种无人运输机中的一种,若初次操作成功,则第二次继续使用该类型设备;若初次操作不成功,则第二次使用另一类型进行操作.
方案二:在初次操作时,随机选择两种无人运输机中的一种,无论初次操作是否成功,第二次均使用初次所选择的无人运输机进行操作.
假定方案选择及操作不相互影响,试比较这两种方案的操作成功的次数的期望值.
附:参考公式及数据:,.
【解题思路】(1)利用相关系数的公式计算求解,判断即可.
(2)分析,的取值,对于方案一,利用相互独立事件的概率逐个求概率,再求期望;对于方案二,利用二项分布的概念求期望,比较即可.
【解答过程】(1),,
,,
相关系数,
因为,所以与具有较强的线性相关关系.
(2)设方案一和方案二操作成功的次数分别为,,则,的所有可能取值均为0,1,2,
方案一:,
,
,
所以.
方案二:选择其中一种操作设备后,进行2次独立重复试验,
所以,
所以,即方案一操作成功的次数的期望值大于方案二操作成功的次数的期望值.
【变式6.2】(24-25高三下·河南郑州·阶段练习)某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年)
1
2
3
4
5
6
7
8
年薪(万)
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
工龄(年)
9
10
11
12
13
14
15
16
年薪(万)
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,其中表示工龄为i年的年薪,.
(1)求年薪与工龄i()的相关系数r,并回答是否可以认为年薪与工龄具有线性相关关系(若,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差,由于人力资源部需要安抚老员工的情绪,工作繁重,现请你帮忙计算留下的员工年薪的均值和标准差.(精确到0.01)
附:样本的相关系数,,,, .
【解题思路】(1)计算出相关系数,进而与0.25比较后得到结论;
(2)计算出的范围,得到第13号员工不在此范围之内,计算出剔除离群值后,剩下的数据平均值和样本方差,进而计算出剔除离群值后样本标准差.
【解答过程】(1)计算相关系数,
因为,所以可认为年薪与工龄不具有线性相关关系.
(2)因为,,
所以在之内的范围是,
显然第13号员工不在此范围之内,所以需要对余下的员工进行计算,
剔除离群值后,剩下的数据平均值为,
因为,所以,
所以剔除离群值后样本方差为,
故剔除离群值后样本标准差为.
一、单选题
1.(23-24高二下·甘肃兰州·期末)下列各关系不属于相关关系的是( )
A.产品的样本与生产数量 B.球的表面积与体积
C.家庭的支出与收入 D.人的年龄与体重
【解题思路】根据相关关系的定义判断.
【解答过程】对于A:产品的样本与生产数量是相关关系,故A正确;
对于B:设球的半径为,球的表面积为、体积为,
则,所以,而,
所以球的表面积与体积是一种函数关系,故B错误;
对于C:家庭的支出与收入是相关关系,故C正确;
对于D:人的年龄与体重是相关关系,故D正确.
故选:B.
2.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【解题思路】由正、负相关的概念即可判断.
【解答过程】由题中数据可知,y随x的增大而增大,且不成比例关系,故y与x正相关.
故选:B.
3.(23-24高二下·贵州黔西·期末)已知变量和变量的3对随机观测数据为,则这组样本数据的样本相关系数为( )
A. B. C.1 D.
【解题思路】作出散点图,结合图形即可得解.
【解答过程】作出散点图,如图:
观察图形,得点在一条直线上,
所以这组样本数据的样本相关系数为1.
故选:C.
4.(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
【解题思路】由正、负相关的概念逐项判断即可.
【解答过程】从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则这两个变量为负相关.
结合散点图可知,①②满足题意,即两个变量呈负相关的个数为2个.
故选:B.
5.(23-24高二下·黑龙江哈尔滨·期末)已知5个成对数据的散点图如下,若去掉点,则下列说法正确的是( )
A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强
C.残差平方和变大 D.样本相关系数r变大
【解题思路】根据已知条件,结合变量间的相关关系,结合图象分析判断即可.
【解答过程】由散点图可知,去掉点后,与的线性相关加强,且为负相关,
所以B正确,A错误;
由于与的线性相关加强,所以残差平方和变小,所以C错误,
由于与的线性相关加强,且为负相关,所以相关系数的绝对值变大,
而相关系数为负的,所以样本相关系数r变小,所以D错误.
故选:B.
6.(23-24高二下·广东珠海·阶段练习)一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
【解题思路】运用相关系数公式进行求解即可.
【解答过程】因为,,所以,
,
故选:D.
7.(23-24高二下·山西长治·期中)根据变量的观测数据,绘制成散点图1;根据变量的观测数据,绘制成散点图2.若用线性回归进行分析,设表示变量的样本相关系数,表示变量的样本相关系数,则( )
A. B.
C. D.
【解题思路】根据散点图,结合相关系数知识即可得出答案.
【解答过程】由图可得随增大而减小,随增大而减小,
所以与增呈负相关关系,与呈负相关关系,故,
又由图可知图1相关性更强,故更接近,
所以.
故选:A.
8.(23-24高二下·山西大同·期中)对两个变量进行线性相关性检验,得线性相关系数,对两个变量进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
B.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
C.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
D.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
【解题思路】根据相关系数的符号的正负决定两个变量的正相关、负相关,以及相关系数绝对值越大,两个变量的线性相关性越强,进而可得出结论.
【解答过程】由线性相关系数知与正相关,
由线性相关系数知与负相关,
又,所以变量与变量的线性相关性比变量与变量的线性相关性更强.
故选:D.
二、多选题
9.(24-25高二下·全国·课堂例题)下列两个变量存在相关关系的为( )
A.扇形的半径与面积之间的关系
B.降雪量与交通事故的发生率之间的关系
C.人的身高与体重之间的关系
D.家庭的支出与收入之间的关系
【解题思路】根据相关关系的定义即可求解.
【解答过程】扇形的半径与面积之间的关系是函数关系,其余均为相关关系.
故选:BCD.
10.(24-25高二下·全国·课后作业)记变量与相对应的一组数据的样本相关系数为,变量与相对应的一组数据的样本相关系数为,则( )
A.当与不相关
B.当与呈函数关系
C.当与的相关性强于与的相关性
D.当与的相关性强弱等于与的相关性
【解题思路】根据题意,结合相关系数的含义,逐项判定,即可求解.
【解答过程】对于A中,当样本相关系数为0,只能说明两变量不是线性相关关系,不能说明两变量之间没有其他关系,所以A错误;
对于B中,当样本相关系数为1,两变量呈确定的函数关系,所以B正确;
对于C中,当与的相关性强于与的相关性,所以C错误;
对于D中,样本相关系数相等,说明相关性强弱相等,所以D正确.
故选:BD.
11.(24-25高二下·全国·课后作业)/年月日,人社部官网发布全国各地区最低工资标准情况,从月最低工资标准来看,上海、深圳、北京位列前三.某学生为了研究居民收入与幸福指数的相关关系,查询到如下数据,后来发现其中一个数据记录有误,去掉该数据,则( )
A.样本相关系数变大 B.居民收入与幸福指数呈现负相关
C.样本相关系数 D.居民收入与幸福指数的线性相关程度变强
【解题思路】根据散点图进行分析,利用相关系数的意义可得结论.、
【解答过程】由散点图知,去掉后,幸福指数与居民收入的线性相关程度变强,
且为正相关,变大,故A,D正确,B错误.
又该四组数据不在一条直线上,故,故C错误.
故选:AD.
三、填空题
12.(24-25高三·上海·课堂例题)下列关系中是相关关系的是 ②③ (填序号).
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
【解题思路】根据相关关系是一种不确定的关系,是两个变量之间确实存在的关系,由此判断即可.
【解答过程】对于①,曲线上的点与该点的坐标之间的关系是一一对应关系,不是相关关系,是确定性关系;
对于②,苹果的产量与气候之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于③,森林中的同一种树木,其断面直径与高度之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于④,学生与他(她)的学号之间的关系是一种确定的对应关系,是映射,不是相关关系.
故答案为:②③.
13.(24-25高二下·河南·阶段练习)甲、乙、丙各自研究两个随机变量的数据,若甲、乙、丙计算得到各自研究的两个随机变量的线性相关系数分别为,则这三人中, 甲 研究的两个随机变量的线性相关程度最高.
【解题思路】根据题意,得到,结合相关系数的含义,即可求解.
【解答过程】由甲、乙、丙的两个随机变量的线性相关系数分别为,
可得,所以这三人中,甲研究的两个随机变量的线性相关程度最高.
故答案为:甲.
14.(24-25高二下·全国·课后作业)某企业不断扩大规模,提高经营收入.统计得到该企业2018-2022年产值(单位:亿元)与企业员工数(单位:千人)之间的数据如下:
年份
2018
2019
2020
2021
2022
千人
1
2
3
4
5
亿元
5
8
10
24
28
从表中数据可知与呈线性相关,根据这5年的数据计算与的相关系数 (保留三位小数).
附:.
【解题思路】根据题意,结合表格中的数据,利用相关系数的计算公式,准确计算,即可求解.
【解答过程】由表格中的数据,可得,,
则,
,,
故.
故答案为:.
四、解答题
15.(24-25高二下·全国·课堂例题)自行选择标准,将下列变量之间的关系分为两类,并分别阐述每一类中变量关系的特点:
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系
【解题思路】根据变量间的相关关系判断即可.
【解答过程】(1)(4)是变量之间的关系具有确定性,当一个变量确定后,另一个变量就确定了;
(2)(3)(5)是变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性.
16.(24-25高二下·全国·课堂例题)某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量(件)与相应的生产总成本(万元)的五组对照数据:
产量(件)
1
2
3
4
5
生产总成本(万元)
3
7
8
10
12
试求与的相关系数,并利用相关系数说明与是否高度正相关.(结果保留两位小数)
参考公式:.
参考数据:.
【解题思路】根据公式代入计算即可.
【解答过程】解:,
,
,
,
,
故相关系数,
,
与高度正相关.
17.(24-25高二下·全国·课后作业)党的二十大报告指出绿水青山就是金山银山.某市为加快生态文明建设进程,加大生态环境保护投入力度,为祖国现代化建设增砖添瓦.现统计了该市近几年的生态环境保护投入资金,统计如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号x
1
2
3
4
5
6
投入资金y/千万
14
31
33
38
41
47
(1)根据上表作出散点图;
(2)观察散点图,判断投入资金y与年份编号x是否具有相关性.如果有,是正相关还是负相关.
【解题思路】(1)根据题意直接作出散点图即可;
(2)由散点图直接判断即可.
【解答过程】(1)作出散点图如下:
(2)由散点图可知,投入资金y与年份编号x具有相关关系,且呈现正相关关系.
18.(2025·河南·一模)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
【解题思路】(1)根据已知数据直接求平均值即可;
(2)分别求出和,再代入公式即可求解;
(3)根据相关系数的绝对值大于0.75且非常接近1判断即可.
【解答过程】(1)由题可知,;
(2)计算得,
故;
(3)由(2)可知,与的相关系数的绝对值近似为0.992,大于0.75且非常接近1,
说明与的线性相关性很强,从而可以用线性回归模型拟合与之间的关系.
19.(2024·广东广州·二模)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区植物覆盖面积与某种野生动物数量的关系,将其分成面积相近的若干个地块,从这些地块中随机抽取20个作为样区,调查得到样本数据,其中,和,分别表示第个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:只),并计算得.
(1)求样本的相关系数(精确到0.01),并推断这种野生动物的数量y(单位:只)和植物覆盖面积x(单位:公顷)的相关程度;
(2)已知20个样区中有8个样区的这种野生动物数量低于样本平均数,从20个样区中随机抽取2个,记抽到这种野生动物数量低于样本平均数的样区的个数为X,求随机变量X的分布列.
附:相关系数
【解题思路】(1)根据相关系数的计算公式即可代入求解,
(2)根据超几何概率的概率公式求解概率,即可得分布列.
【解答过程】(1)样本,,2,, 的相关系数为
.
由于相关系数,,则相关性很强,的值越大,相关性越强.
故,故相关性越强.
(2)由题意得:的可能取值为0,1,2,
20个样区中有8个样区的这种野生动物数量低于样本平均数,有12个样区的这种野生动物数量不低于样本平均数,
所以,
,
,
所以的分布列为:
0
1
2
第 1 页 共 28 页
学科网(北京)股份有限公司
$$
第13讲 成对数据的统计相关性
【人教A版2019】
模块一
变量的相关关系
1.变量的相关关系
(1)函数关系
函数关系是一种确定性关系,常用解析式来表示.
(2)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关
系.与函数关系不同,相关关系是一种非确定性关系.
2.散点图
(1)散点图
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)正相关和负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个
变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线
性相关.
【题型1 相关关系与函数关系的概念及辨析】
【例1.1】(23-24高一下·青海海东·期末)下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【例1.2】(24-25高一下·吉林延边·阶段练习)下列两个变量之间的关系哪个不是函数关系( )
A.角度和它的正切值 B.人的右手一柞长和身高
C.正方体的棱长和表面积 D.真空中自由落体运动物体的下落距离和下落时间
【变式1.1】(24-25高二下·河南洛阳·阶段练习)下列说法正确的是( )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
【变式1.2】(24-25高一下·江西南昌·阶段练习)下列两个变量具有相关关系且不是函数关系的是( )
A.圆的半径与面积
B.匀速行驶的车辆的行驶距离与时间
C.庄稼的产量与施肥量
D.人的身高与视力
【题型2 判断两个变量是否有相关关系】
【例2.1】(23-24高一下·湖南怀化·期末)下列说法中正确的是( )
A.中的,是具有相关关系的两个变量
B.正四面体的体积与其棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.某地区感染流感人数与外来流感患者人数是具有相关关系的两个变量
【例2.2】(23-24高二下·吉林·期末)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
【变式2.1】(2024高二下·云南曲靖·学业考试)下列两个变量之间的关系是相关关系的是( )
A.等边三角形的边长与其面积
B.匀速直线行驶的电车的位移与行驶时间
C.杂交水稻植株的高度与土壤湿润度
D.汽车在陆地上的刹车制动时间与洞庭湖湖面上的空气阻力
【变式2.2】(23-24高二下·安徽·期末)下列两个变量之间的关系是相关关系的是( )
A.等边三角形的边长a与其面积S
B.匀速直线行驶的汽车的位移s与行驶时间t
C.杂交水稻植株的高度h与土壤湿润度r
D.某班的学生人数n与该班某次数学考试的平均分x
【题型3 判断正、负相关】
【例3.1】(23-24高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
【例3.2】(23-24高二下·北京丰台·期末)在一般情况下,下列各组的两个变量呈正相关的是( )
A.某商品的销售价格与销售量 B.汽车匀速行驶时的路程与时间
C.气温与冷饮的销售量 D.人的年龄与视力
【变式3.1】(2024·辽宁葫芦岛·一模)已知变量与的回归直线方程为,变量与负相关,则( )
A.与负相关,与负相关 B.与正相关,与正相关
C.与负相关,与正相关 D.与正相关,与负相关
【变式3.2】(23-24高二下·北京·期末)对变量、由观测数据得散点图,对变量、由观测数据得散点图.由这两个散点图可以判断( )
A.变量与负相关,与正相关
B.变量与负相关,与负相关
C.变量与正相关,与正相关
D.变量与正相关,与负相关
模块二
样本相关系数
1.样本相关系数
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为,利用
相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
(其中和的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;
当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;
当其中一个数据的值变大时,另一个数据的值通常会变小.
【题型4 样本相关系数的意义及辨析】
【例4.1】(24-25高二下·天津·阶段练习)以下散点图经过标准化后,相关系数最大的是( )
A. B.
C. D.
【例4.2】(24-25高二下·江西上饶·阶段练习)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【变式4.1】(24-25高三下·上海浦东新·阶段练习)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对进行线性回归分析.若在此图中加上点后,再次对进行线性回归分析,则下列说法正确的是( )
A.不具有线性相关性 B.相关系数变大
C.相关系数变小 D.相关系数不变
【变式4.2】(24-25高二·全国·假期作业)某统计部门对四组数据进行统计分析后, 获得如图所示的散点图.
下面关于样本相关系数的比较, 正确的是 ( )
A. B.
C. D.
【题型5 相关系数的计算】
【例5.1】(24-25高二下·全国·课后作业)某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
【例5.2】(24-25高二下·江苏·单元测试)一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,,,,,则y与x的相关系数r的绝对值为( )
A.0.6 B.0.5
C.0.4 D.0.3
【变式5.1】(23-24高二下·江苏·课前预习)维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.
甲醛浓度x
18
20
22
24
26
28
30
缩醛化度(y)
26.86
28.35
28.75
28.87
29.75
30.00
30.36
求样本相关系数r并判断它们的相关程度.
【变式5.2】(2024高二下·全国·专题练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面(单位:亩)与相应的管理时间(单位:月)的关系如表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
11
14
24
23
作出散点图,判断管理时间与土地使用面积是否线性相关,并根据相关系数说明相关关系的强弱.(若,认为两个变量有较强的线性相关性,的值精确到0.001)
注:亩,我国市制土地面积单位,1亩≈666.7平方米.
参考公式:.
参考数据:,,.
【题型6 相关系数与其他知识的交汇问题】
【例6.1】(23-24高二下·吉林长春·期末)将保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中15个区域进行编号,统计抽取到的每个区域的某种水源指标和区域内该植物分布的数量,得到数组.已知,.
(1)求样本的样本相关系数;
(2)假设该植物的寿命为随机变量X(X可取任意正整数),研究人员统计大量数据后发现,对于任意的,寿命为的样本在寿命超过k的样本里的数量占比与寿命为1的样本在全体样本中的数量占比相同,均为0.1,这种现象被称为“几何分布的无记忆性”.用含k的式子表示,并求的值.
附:样本相关系数;当k足够大时,.
【例6.2】(2024·全国·模拟预测)中国新能源汽车企业在10余年间实现了“弯道超车”,使我国一跃成为新能源汽车产量连续7年居世界第一的全球新能源汽车强国.某新能源汽车配件企业积极加大科研力度,生产效益逐步攀升.该企业在今年1月份至5月份的生产利润(单位:亿元)关于月份的数据如下表所示:
月份
1
2
3
4
5
生产利润(亿元)
2
6
8
9
10
(1)试求y与x之间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若,则认为两个变量具有较强的线性相关性)
(2)为扩大生产,该企业在M大学启动了校园招聘,分别招聘A、B两个工程师岗位,两个岗位都各设有3门笔试科目.M大学的硕士毕业生张无忌决定参加这次应聘,且每门科目考试是否通过相互独立.若张无忌报考A岗位,每门笔试科目通过的概率依次为,,,其中;若张无忌报考B岗位,每门笔试科目通过的概率均为.且张无忌只能报考A,B两个岗位中的一个.若以笔试中通过科目数的数学期望为依据作出决策,得出张无忌更有希望通过A岗位的笔试,试求的取值范围.
附:参考数据:,,.
相关系数.
【变式6.1】(2025·河南·模拟预测)某公司是一家集无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种类型无人运输机性能都比较出色,但操控水平需要十分娴熟,才能发挥更大的作用.已知在单位时间内,甲、乙两种类型的无人运输机操作成功的概率分别为和,假设每次操作能否成功相互独立.
(1)该公司分别收集了甲型无人运输机在5个不同的地点测试的两项指标数,(),数据如下表所示:
地点1
地点2
地点3
地点4
地点5
甲型无人运输机指标数
2
4
5
6
8
甲型无人运输机指标数
3
4
4
4
5
试求与间的相关系数,并利用说明与是否具有较强的线性相关关系;(若,则线性相关程度很高)
(2)操作员连续进行两次无人机的操作有两种方案:
方案一:在初次操作时,随机选择两种无人运输机中的一种,若初次操作成功,则第二次继续使用该类型设备;若初次操作不成功,则第二次使用另一类型进行操作.
方案二:在初次操作时,随机选择两种无人运输机中的一种,无论初次操作是否成功,第二次均使用初次所选择的无人运输机进行操作.
假定方案选择及操作不相互影响,试比较这两种方案的操作成功的次数的期望值.
附:参考公式及数据:,.
【变式6.2】(24-25高三下·河南郑州·阶段练习)某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年)
1
2
3
4
5
6
7
8
年薪(万)
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
工龄(年)
9
10
11
12
13
14
15
16
年薪(万)
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,其中表示工龄为i年的年薪,.
(1)求年薪与工龄i()的相关系数r,并回答是否可以认为年薪与工龄具有线性相关关系(若,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差,由于人力资源部需要安抚老员工的情绪,工作繁重,现请你帮忙计算留下的员工年薪的均值和标准差.(精确到0.01)
附:样本的相关系数,,,, .
一、单选题
1.(23-24高二下·甘肃兰州·期末)下列各关系不属于相关关系的是( )
A.产品的样本与生产数量 B.球的表面积与体积
C.家庭的支出与收入 D.人的年龄与体重
2.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
3.(23-24高二下·贵州黔西·期末)已知变量和变量的3对随机观测数据为,则这组样本数据的样本相关系数为( )
A. B. C.1 D.
4.(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
5.(23-24高二下·黑龙江哈尔滨·期末)已知5个成对数据的散点图如下,若去掉点,则下列说法正确的是( )
A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强
C.残差平方和变大 D.样本相关系数r变大
6.(23-24高二下·广东珠海·阶段练习)一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
7.(23-24高二下·山西长治·期中)根据变量的观测数据,绘制成散点图1;根据变量的观测数据,绘制成散点图2.若用线性回归进行分析,设表示变量的样本相关系数,表示变量的样本相关系数,则( )
A. B.
C. D.
8.(23-24高二下·山西大同·期中)对两个变量进行线性相关性检验,得线性相关系数,对两个变量进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
B.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
C.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
D.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
二、多选题
9.(24-25高二下·全国·课堂例题)下列两个变量存在相关关系的为( )
A.扇形的半径与面积之间的关系
B.降雪量与交通事故的发生率之间的关系
C.人的身高与体重之间的关系
D.家庭的支出与收入之间的关系
10.(24-25高二下·全国·课后作业)记变量与相对应的一组数据的样本相关系数为,变量与相对应的一组数据的样本相关系数为,则( )
A.当与不相关
B.当与呈函数关系
C.当与的相关性强于与的相关性
D.当与的相关性强弱等于与的相关性
11.(24-25高二下·全国·课后作业)/年月日,人社部官网发布全国各地区最低工资标准情况,从月最低工资标准来看,上海、深圳、北京位列前三.某学生为了研究居民收入与幸福指数的相关关系,查询到如下数据,后来发现其中一个数据记录有误,去掉该数据,则( )
A.样本相关系数变大 B.居民收入与幸福指数呈现负相关
C.样本相关系数 D.居民收入与幸福指数的线性相关程度变强
三、填空题
12.(24-25高三·上海·课堂例题)下列关系中是相关关系的是 (填序号).
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
13.(24-25高二下·河南·阶段练习)甲、乙、丙各自研究两个随机变量的数据,若甲、乙、丙计算得到各自研究的两个随机变量的线性相关系数分别为,则这三人中, 研究的两个随机变量的线性相关程度最高.
14.(24-25高二下·全国·课后作业)某企业不断扩大规模,提高经营收入.统计得到该企业2018-2022年产值(单位:亿元)与企业员工数(单位:千人)之间的数据如下:
年份
2018
2019
2020
2021
2022
千人
1
2
3
4
5
亿元
5
8
10
24
28
从表中数据可知与呈线性相关,根据这5年的数据计算与的相关系数 (保留三位小数).
附:.
四、解答题
15.(24-25高二下·全国·课堂例题)自行选择标准,将下列变量之间的关系分为两类,并分别阐述每一类中变量关系的特点:
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系
16.(24-25高二下·全国·课堂例题)某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量(件)与相应的生产总成本(万元)的五组对照数据:
产量(件)
1
2
3
4
5
生产总成本(万元)
3
7
8
10
12
试求与的相关系数,并利用相关系数说明与是否高度正相关.(结果保留两位小数)
参考公式:.
参考数据:.
17.(24-25高二下·全国·课后作业)党的二十大报告指出绿水青山就是金山银山.某市为加快生态文明建设进程,加大生态环境保护投入力度,为祖国现代化建设增砖添瓦.现统计了该市近几年的生态环境保护投入资金,统计如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号x
1
2
3
4
5
6
投入资金y/千万
14
31
33
38
41
47
(1)根据上表作出散点图;
(2)观察散点图,判断投入资金y与年份编号x是否具有相关性.如果有,是正相关还是负相关.
18.(2025·河南·一模)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
19.(2024·广东广州·二模)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区植物覆盖面积与某种野生动物数量的关系,将其分成面积相近的若干个地块,从这些地块中随机抽取20个作为样区,调查得到样本数据,其中,和,分别表示第个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:只),并计算得.
(1)求样本的相关系数(精确到0.01),并推断这种野生动物的数量y(单位:只)和植物覆盖面积x(单位:公顷)的相关程度;
(2)已知20个样区中有8个样区的这种野生动物数量低于样本平均数,从20个样区中随机抽取2个,记抽到这种野生动物数量低于样本平均数的样区的个数为X,求随机变量X的分布列.
附:相关系数
第 1 页 共 28 页
学科网(北京)股份有限公司
$$