内容正文:
第15讲 成对数据的统计相关性
【人教A版】
模块一
变量的相关关系
1.变量的相关关系
(1)函数关系
函数关系是一种确定性关系,常用解析式来表示.
(2)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.与函数关系不同,相关关系是一种非确定性关系.
2.散点图
(1)散点图
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)正相关和负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.
【题型1 相关关系与函数关系的概念及辨析】
【例1】(24-25高二·全国·课后作业)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
【答案】D
【解题思路】根据相关关系的定义、函数关系的定义即可判断.
【解答过程】A,B均为函数关系,故A、B错误;C,D为相关关系,故C错,D对.
故选:D.
【变式1.1】(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
【答案】A
【解题思路】根据相关关系的定义可得.
【解答过程】选项B,C,D中的两个变量都具有相关性,且都是一种不确定的关系,是相关关系.
而A中判别式和变量是一种确定的表达式,是一种函数关系,即一种确定的关系,所以不是相关关系.
故选:A.
【变式1.2】(24-25高一下·青海海东·期末)下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【答案】C
【解题思路】函数关系是变量之间的确定关系,相关关系是变量之间确实存在关系但不具有确定性,据此判断即可.
【解答过程】解:对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;
对于B,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B错误;
对于C,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C正确;
对于D,人的体重与视力是没有相关关系的,所以D错误.
故选:C.
【变式1.3】(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
【答案】(1)函数关系
(2)相关关系
(3)相关关系
(4)函数关系
(5)相关关系
(6)相关关系
【解题思路】根据相关关系的定义、函数关系的定义,逐一判断即可得解..
【解答过程】(1)因为,所以圆的面积与半径之间的关系为函数关系;
(2)因为体重除了与身高有关系,还和性别、遗传等因素有关系,
所以16岁学生的体重与身高之间的关系为相关关系;
(3)因为销售量除了与销售价格有关系,还和是否打广告等方面有关系,
所以商品销售量与销售价格之间的关系为相关关系;
(4)设匀速运动的物体的速度为,
所以运动的路程与时间之间的关系为,
因此匀速运动的物体,其运动的路程与时间之间的关系为函数关系;
(5)因为学习成绩除了与平均学习时间有关系外,还与学习方法等因素有关系,
所以平均学习时间与学习成绩之间的关系为相关关系;
(6)因为科技创新能力除了与人才培养近亲繁殖率有关系,还有教育等因素有关系,
所以科技创新能力与人才培养近亲繁殖率之间的关系为相关关系.
【题型2 判断两个变量是否有相关关系】
【例2】(24-25高二下·吉林·期末)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
【答案】D
【解题思路】根据相关关系的定义判断即可.
【解答过程】对于A:人的身高与受教育的程度不具有相关关系,故A错误;
对于B:人的体重与眼睛的近视程度不具有相关关系,故B错误;
对于C:企业员工的工号与工资不具有相关关系,故C错误.
对于D:儿子的身高与父亲的身高具有相关关系,故D正确.
故选:D.
【变式2.1】(24-25高二下·全国·课后作业)下列语句所表示的事件中的因素不具有相关关系的是( )
A.瑞雪兆丰年 B.名师出高徒
C.吸烟有害健康 D.喜鹊叫喜
【答案】D
【解题思路】根据相关关系的概念分别判断.
【解答过程】瑞雪对农作物有好处,可能使得农作物丰收,所以瑞雪兆丰年具有相关关系,
名师出高徒也具有相关关系,吸烟有害健康也具有相关关系,
而喜鹊叫喜,没有必然的关系,所以ABC正确,D错误.
故选:D.
【变式2.2】(24-25高二下·甘肃兰州·期末)下列各关系不属于相关关系的是( )
A.产品的成本与生产数量 B.球的表面积与体积
C.家庭的支出与收入 D.人的年龄与体重
【答案】B
【解题思路】根据相关关系的定义判断.
【解答过程】对于A:产品的成本与生产数量是相关关系,故A正确;
对于B:设球的半径为,球的表面积为、体积为,
则,所以,而,
所以球的表面积与体积是一种函数关系,故B错误;
对于C:家庭的支出与收入是相关关系,故C正确;
对于D:人的年龄与体重是相关关系,故D正确.
故选:B.
【变式2.3】(24-25高二·宁夏银川·期中)给出下列关系:其中具有相关关系的是( )
①考试号与考生考试成绩; ②勤能补拙;
③水稻产量与气候; ④正方形的边长与正方形的面积.
A.①②③ B.①③④ C.②③ D.①③
【答案】C
【解题思路】根据相关关系的定义进行判断即可.
【解答过程】考试号只是确定考生考试的位置与考试成绩无关,则①错误;
勤能补拙具有相关关系,水稻产量与气候具有相关关系,则②③正确;
正方形的边长与正方形的面积是函数关系,则④错误;
故选:C.
【题型3 判断正、负相关】
【例3】(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
【答案】B
【解题思路】由正、负相关的概念逐项判断即可.
【解答过程】从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则这两个变量为负相关.
结合散点图可知,①②满足题意,即两个变量呈负相关的个数为2个.
故选:B.
【变式3.1】(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【答案】B
【解题思路】由正、负相关的概念即可判断.
【解答过程】由题中数据可知,y随x的增大而增大,且不成比例关系,故y与x正相关.
故选:B.
【变式3.2】(24-25高二下·北京东城·期末)某校学生科研兴趣小组为了解1~12岁儿童的体质健康情况,随机调查了20名儿童的相关数据,分别制作了肺活量、视力、肢体柔韧度、BMI指数和身高之间的散点图,则与身高之间具有正相关关系的是( )
A.肺活量 B.视力 C.肢体柔韧度 D.BMI指数
【答案】A
【解题思路】根据给定的散点图,结合正相关的意义判断即得.
【解答过程】对于A,儿童的身高越高,其肺活量越大,肺活量与身高具有正相关关系,A正确;
对于B,儿童的视力随身高的增大先增大,后减小,视力与身高不具有正相关关系,B错误;
对于C,肢体柔韧度随身高增大而减小,肢体柔韧度与身高不具有正相关关系,C错误;
对于D,BMI指数与身高的相关性很弱,不具有正相关关系,D错误.
故选:A.
【变式3.3】(24-25高二上·新疆和田·期末)对于变量,有以下四个散点图,由这四个散点图可以判断变量与成负相关的是( )
A. B.
C. D.
【答案】B
【解题思路】根据各图中点的分布,分析变量的相关关系即可.
【解答过程】A:各点分布没有明显相关性,不符;
B:各点分布在一条直线附近,且有负相关性,符合;
C:各点分布在一条抛物线附近,变量之间先呈正相关,后呈负相关,不符;
D:各点分布在一条直线附近,且有正相关性,不符.
故选:B.
模块二
样本相关系数
1.样本相关系数
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),利用相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
(其中x1,x2,…,xn和y1,y2,…,yn的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
【题型4 相关系数的意义及辨析】
【例4】(24-25高二下·山西吕梁·期末)下面是不同成对数据的散点图,从左到右对应的样本相关系数分别是,其中最大的是( )
A. B.
C. D.
【答案】A
【解题思路】根据散点图中点的分布,即可判断答案.
【解答过程】由散点图可知,并且第一个图中的点更为集中,更贴近某条直线分布,
第三、四个图中的点的分布更为分散,
因此更接近于1,,的绝对值更接近于0,即最大的是.
故选:A.
【变式4.1】(24-25高二下·山东济南·期末)对四组数据进行统计,获得以下散点图,将四组数据对应的相关系数进行比较,则( )
A. B.
C. D.
【答案】A
【解题思路】根据给定的散点图,结合相关系数的意义判断即得.
【解答过程】由图知,对应的与负相关,且对应的相关性更强,即;
对应的与正相关,且对应的相关性更强,即,
所以.
故选:A.
【变式4.2】(24-25高二下·山东聊城·阶段检测)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【解题思路】根据散点图和相关系数的概念和性质辨析即可.
【解答过程】由散点图可知,相关系数所在散点图呈负相关,所在散点图呈正相关,
所以都为正数,都为负数.
所在散点图近似一条直线上,线性相关性比较强,相关系数的绝对值越接近1,
而所在散点图比较分散,线性相关性比较弱,相关系数的绝对值越远离1.
综上可得:.
故选:A.
【变式4.3】(24-25高二下·天津河北·期末)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是( )
A. B.
C. D.
【答案】D
【解题思路】由相关系数的意义结合散点图即可求解.
【解答过程】由图知,都是正相关关系,都是负相关关系,
从散点密集程度看,相关性分别较更强,
所以.
故选:D.
【题型5 相关系数的计算】
【例5】(24-25高二下·全国·课后作业)某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
【答案】D
【解题思路】根据已知数据分别计算各个量得出的值即可.
【解答过程】由题得,
所以,
故接待人数与年份的相关系数约为0.97.
故选:D.
【变式5.1】(24-25高二下·湖北·月考)已知变量x和变量y的3对随机观测数据,,,则该组样本数据点的相关系数( )
(参考公式:)
A. B. C. D.1
【答案】B
【解题思路】由题目数据结合参考公式可得答案.
【解答过程】由题可得,,
则.
,
,
则.
故选:B.
【变式5.2】(24-25高二下·江苏淮安·月考)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
参考数据:.
参考公式:相关系数.
【答案】(1),
(2)
【解题思路】(1)利用平均数计算公式得到和;
(2)先计算出,利用公式计算出相关系数.
【解答过程】(1)由题可知,
;
(2)计算得,
故.
【变式5.3】(24-25高二下·广东深圳·期中)深圳欢乐谷试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值.
(2)计算与的相关系数;判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:,.
参考公式:相关系数.若,则与的线性相关性很强.
【答案】(1),
(2),可以用线性回归模型拟合与之间的关系,理由见解析
【解题思路】(1)根据已知数据直接求平均值即可;
(2)分别求出和,再代入公式即可求解,再根据相关系数的绝对值大于0.75且非常接近1判断即可.
【解答过程】(1)由题可知,;
(2)因为,
,
故;
因为与的相关系数的绝对值近似为,大于且非常接近,
说明与的线性相关性很强,从而可以用线性回归模型拟合与之间的关系.
【题型6 相关系数与其他知识综合】
【例6】(24-25高二下·江西景德镇·期中)某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人,它结合了人工智能、语音识别、互动娱乐和教育等内容,且云端内容可以持续更新,旨在通过趣味性和互动性帮助孩子学习和发展.萌宠机器人一投放市场就受到了很多家长欢迎,为了更好的服务广大家长,该公司对萌宠机器人的某个性能指数与孩子的喜爱程度进行统计调查,得到如下数据表:
5
6
7
8
9
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,通过计算变量的相关系数,回答是否可以认为该性能指数与孩子的喜爱程度相关性很强(当时,与相关性很强);
(2)该公司科技人员小李想挑战萌宠机器人,他和机器人比赛答题,他们每人答4个题,若小李答对题数不小于3,则挑战成功.已知小李答对前两道题的概率均为,答对后两道题的概率均为,假设每次答题相互独立,且互不影响,当时,求小李挑战成功的概率的最大值.
参考公式:相关系数
【答案】(1),可以认为该性能指数与孩子的喜爱程度相关性很强
(2)
【解题思路】(1)利用公式求出即可判断;
(2)根据题意表示出小李挑战成功的概率为,再结合基本不等式及二次函数的知识求解即可.
【解答过程】(1)由表知,,
,
,
,
,
则,
由此可以认为该性能指数与孩子的喜爱程度相关性很强.
(2)当小李答对题数为3时,概率为:
,
当小李答对题数为4时,概率为:,
所以小李挑战成功的概率为:,
由,,,
则,当且仅当时等号成立,
所以,由二次函数的知识可知,
当时,小李挑战成功的概率最大,最大为.
【变式6.1】(25-26高三上·贵州贵阳·月考)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
【答案】(1),很强的线性正相关关系
(2)
X
80
150
210
P
【解题思路】(1)利用公式求出即可判断;
(2)根据题意,X的可能取值为80、150、210,求出对应概率,列出分布列,即可得解.
【解答过程】(1)由题意,,,
则,
由,
同理,
则,
则,
由接近1且为正,故变量x与y之间有很强的线性正相关关系.
(2)由题意,X的可能取值为80、150、210,
则,,
,
故X的分布列为:
X
80
150
210
P
则.
【变式6.2】(24-25高二下·广东中山·月考)全面建成小康社会取得了伟大历史成就,决战脱贫攻坚取得了决定性胜利,某脱贫县实现脱贫奔小康的目标,该县经济委员会积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收.
(1)该县经济委员会为精准了解本地特产广告宣传的导向作用,在购买该县特产的客户中随机抽取300人进行广告宣传作用的调研,对因广告宣传导向而购买该县特产的客户统计结果是:客户群体中青年人约占15%,其中男性为20%;中年人约占50%,其中男性为35%;老年人约占35%,其中男性为55%.以样本估计总体,视频率为概率.
①在所有购买该县特产的客户中随机抽取一名客户,求抽取的客户是男性的概率;
②在所有购买该县特产的客户中随机抽取一名客户是男客户,求他是中年人的概率(精确到0.0001);
(2)该县经济委员会统计了某6至12月这7个月的月广告投入(单位:万元);(单位:万件)的数据如表所示:
月广告投入/万元
1
2
3
4
5
6
7
月销量/万件
28
32
35
45
49
52
60
请根据相关系数说明相关关系的强弱.(若,则认为两个变量有很强的线性相关性,值精确到0.001)
参考数据:.
参考公式:相关系数.
【答案】(1)①0.3975;②0.4403
(2)与的线性相关程度相当高
【解题思路】(1)根据全概率公式即可得出①的答案,进而根据条件概率公式可得出②的答案;
(2)由已知可求得,,,然后代入相关系数公式即可求出相关系数的值,进而得出两个变量线性相关性的强弱.
【解答过程】(1)设事件“抽取的是男性客户” “青年客户”,
“中年客户”,“老年客户”,依题设,
,
①由全概率公式
②
(2)由题意,知,所以,
所以,
又,所以相关系数
,
显然与的线性相关程度相当高.
【变式6.3】(25-26高三上·西藏拉萨·月考)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示.
年份代码
1
2
3
4
5
产量/千万吨
13.4
13.6
13.8
13.7
14.0
现规定表示年份代码,表示年份代码为的产量,经计算得,,
(1)求样本的相关系数;(精确到0.01)
(2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望.
附:相关系数,.
【答案】(1)
(2)分布列见解析,
【解题思路】(1)先求出平均值,再应用已知数据结合相关系数公式计算求解;
(2)根据超几何分布求出概率,再写出分布列应用数学期望公式计算即可.
【解答过程】(1),,
故样本相关系数
.
(2)X的取值可以为0,1,2,
则,
,
,
于是X的分布列为
X
0
1
2
P
故.
一、单选题
1.(25-26高二上·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.光照时间和果树亩产量 B.降雪量和交通事故发生率
C.每亩田施肥量和粮食亩产量 D.圆的面积和半径
【答案】D
【解题思路】利用两变量相关关系的意义判断即可.
【解答过程】列表解析
选项
是否是相关关系
原因
A
是
果树亩产量与光照时间有关,是相关关系.
B
是
降雪量的大小对交通事故发生率有影响,是相关关系.
C
是
粮食亩产量与每亩田施肥量有关,是相关关系.
D
否
圆的面积S和半径r是函数关系.
故选:D.
2.(24-25高二下·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是( )
A. B.
C. D.
【答案】C
【解题思路】根据散点图的特征得到答案.
【解答过程】A中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性;
B中呈正相关关系,C中两个变量具有负相关关系;
D中两个变量具有相关性,但不是正相关,也不是负相关.
故选:C.
3.(24-25高二下·福建莆田·期末)下列图中,相关系数最大的是( )
A. B.
C. D.
【答案】D
【解题思路】利用散点图变化趋势,判断相关系数的正负,由散点的集中程度确定大小,即可得到答案.
【解答过程】由图可知,AC选项的散点图呈现出一定的下降趋势,两变量为负相关,相关系数小于0,
BD选项的散点图呈现出一定的上升趋势,两变量为正相关,相关系数大于0,
而B选项的散点图,散点比较分散,D选项的散点图,散点紧密地聚集在一条直线附近,
因此D选项的相关系数最大.
故选:D.
4.(24-25高二下·江苏淮安·期中)已知甲、乙、丙、丁四组数据变量间对应的样本相关系数分别为-0.92,0.46,0.79,0.85,则( )
A.甲组数据变量间的线性相关程度最强 B.乙组数据变量间的线性相关程度最强
C.丙组数据变量间的线性相关程度最强 D.丁组数据变量间的线性相关程度最强
【答案】A
【解题思路】根据相关系数的性质进行判断,越接近1时,相关程度越强.
【解答过程】设变量间的线性相关系数为,当越接近1时,相关程度越强,
因为,
所以甲组数据变量间的线性相关程度最强,乙组数据变量间的线性相关程度最弱.
故选:A.
5.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
【答案】B
【解题思路】根据散点图点的变化关系确定正负相关性即可.
【解答过程】由变量,的散点图,知随增大,也增大,变量与正相关,
由变量,的散点图,知随增大,减小,与负相关.
故选:B.
6.(24-25高二下·辽宁丹东·期中)对两组数据进行统计后得到如图所示的散点图,下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数小于图2相关系数
D.图1相关系数和图2相关系数之和小于0
【答案】C
【解题思路】根据散点图及相关性判断AB,由相关系数性质判断CD.
【解答过程】对A,因为散点图都呈直线型,所以图1、图2两组数据都具有线性相关关系,A正确;
对B,图1散点从左至右呈上升趋势,所以数据正相关,图2散点从左至右呈下降趋势,所以数据负相关,故B正确;
对C,图1正相关,图2负相关,所以C不正确;
对D,因为图2相关程度更强,所以D正确.
故选:C.
7.(24-25高二下·天津西青·期末)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【答案】D
【解题思路】由散点图的特征,结合相关系数的定义即可得到答案.
【解答过程】由散点图的趋势可知,,,,
又图一的散点图比图三的散点图更为集中,则,所以,
又图二的散点图比图四的散点图更为集中,则,所以,
所以.
故选:D.
8.(24-25高二下·湖北孝感·期末)已知两个变量x和y之间存在线性相关关系,某兴趣小组收集了一组样本数据,利用最小二乘法求得的回归方程是,其相关系数是由于某种原因,其中一个数据丢失,将其记为m,具体数据如下表所示:
x
1
2
3
4
5
y
m
若去掉数据后,剩下的数据也成线性相关关系,其相关系数是,则( )
A. B.
C. D.的大小关系无法确定
【答案】A
【解题思路】由回归方程可得,设去掉数据后,新数据为,
注意到,结合相关系数计算公式可得答案.
【解答过程】由题可得原数据,因过点,
则,从而.
设去掉数据后,新数据为,则
,又因,,
则,,从而.
故选:A.
二、多选题
9.(24-25高二下·全国·课后作业)下列关系中,是相关关系的为( )
A.学生的学习态度与学习成绩之间的关系
B.教师的教学水平与学生的学习成绩之间的关系
C.学生的身高与学生的学习成绩之间的关系
D.家庭的经济条件与学生的学习成绩之间的关系
【答案】AB
【解题思路】由两个变量的相关关系的定义进行判断.
【解答过程】A中学生的学习态度与学习成绩之间不是因果关系,但具有相关性,是相关关系;
B中教师的教学水平与学生的学习成绩之间的关系是相关关系;C,D都不具备相关关系.
故选:AB.
10.(24-25高二下·河北·期中)观察下列散点图,则( )
A. B. C. D.
【答案】BD
【解题思路】根据散点图及相关系数的概念判断即可.
【解答过程】散点图①,②中y与x呈负相关,,散点图②中y与x的线性相关性更强,
即,因此;
散点图③,④中y与x呈正相关,,散点图④中y与x的线性相关性更强,
即,因此,
所以.
故选:BD.
11.(24-25高二下·山东·月考)甲、乙、丙、丁各自研究两个随机变量的数据,甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,则( )
A.这四人中,丁研究的两个随机变量的线性相关程度最高
B.这四人中,乙研究的两个随机变量的线性相关程度最低
C.这四人中,甲研究的两个随机变量的线性相关程度最高
D.这四人中,甲研究的两个随机变量的线性相关程度最低
【答案】BC
【解题思路】比较相关系数 绝对值的大小,再结合相关系数的意义判断即可.
【解答过程】因为,
所以这四人中,甲研究的两个随机变量的线性相关程度最高,
乙研究的两个随机变量的线性相关程度最低.
故选:BC.
三、填空题
12.(24-25高二下·全国·课后作业)观察下列散点图,有三种情况:①正相关,②负相关,③不相关.与散点图的位置相对应的序号依次是___________.
【答案】①③②
【解题思路】由图象分析即可得到答案.
【解答过程】第一个图大体趋势从左向右上升,故是正相关,
第二个图不相关,
第三个图大体趋势从左向右下降,故是负相关.
故答案为:①③②.
13.(24-25高二下·河南·月考)甲、乙、丙各自研究两个随机变量的数据,若甲、乙、丙计算得到各自研究的两个随机变量的线性相关系数分别为,则这三人中,__________研究的两个随机变量的线性相关程度最高.
【答案】甲
【解题思路】根据题意,得到,结合相关系数的含义,即可求解.
【解答过程】由甲、乙、丙的两个随机变量的线性相关系数分别为,
可得,所以这三人中,甲研究的两个随机变量的线性相关程度最高.
故答案为:甲.
14.(24-25高二下·河北沧州·期中)某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数__________.(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
【答案】
【解题思路】根据表中数据求出,进而得出的值,代入公式计算即可得出答案.
【解答过程】由已知可得,,
,
则 ,
,
所以, .
故答案为:.
四、解答题
15.(24-25高二·全国·课堂例题)试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的行驶速度与耗油量;
(3)真空中自由降落的小球,位移(单位:m)与时间(单位:s);
(4)日降雨量(单位:cm)与空气中污染物浓度(单位:).
【答案】(1)具有相关关系
(2)具有相关关系
(3)具有函数关系
(4)具有相关关系
【解题思路】(1)根据相关关系的概念判断即可;
(2)根据相关关系的概念判断即可;
(3)根据函数关系的概念判断即可;
(4)根据相关关系的概念判断即可.
【解答过程】(1)商品的销售价格与其供应量之间具有相关关系.一般来说,在品质相当的情况下,供应量越大,
价格就越低;供应量越小,价格就越高.某些品牌商品限量供应,就是保持较高价位的销售策略.
(2)汽车的行驶速度与耗油量之间具有相关关系.通常情况下,当速度很慢或速度很快时,耗油较多,
而在中等车速(不同的汽车范围不一定一样)时,速度稍高,耗油反而较少.
(3)根据自由落体运动方程,可知自由降落的小球,位移与时间之间是函数关系.
(4)日降雨量与空气中污染物浓度之间具有相关关系.通常情况下,降雨量越大,空气中污染物浓度就越低.
16.(24-25高二下·全国·课后作业)2023年3月6日,中华人民共和国国务院新闻办公室举行“权威部门话开局”系列主题新闻发布会,介绍“加快推进新型工业化做强做优做大实体经济”有关情况.经综合研判,今年我国新能源汽车产业将保持良好的发展态势,生产和销售将实现稳定增长.据统计,去年10月至今年2月某品牌新能源汽车的市场销售量如下表.
月份
10月
11月
12月
1月
2月
销售量万辆
0.6
0.7
1.0
1.3
1.6
(1)根据数据作出散点图;
(2)判断与之间的相关关系.
【答案】(1)作图见解析
(2)正相关关系
【解题思路】(1)根据表格中的数据即可作出散点图;
(2)由散点图即可判断与之间的相关关系.
【解答过程】(1)作出散点图如下:
(2)由散点图可知,5组样本数据呈正相关关系.
17.(24-25高二下·全国·课后作业)2019年11月份,全国工业生产者出厂价格同比下降,环比下降.某企业在了解市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制定相应的出厂价格.该企业统计了2019年1-10月份产品的生产数量与销售总额之间的关系,如下表所示.
万件
2.08
2.12
2.19
2.28
2.36
2.48
2.59
2.68
2.80
2.87
万元
42.5
43.7
44.0
45.5
46.4
47.5
49.2
50.3
51.4
52.6
(1)计算的值;
(2)计算样本相关系数的值,并通过的值的大小说明与之间的相关程度.
【答案】(1)
(2),与之间具有很强的相关性
【解题思路】(1)由平均数的计算公式得到和;
(2)由相关系数的计算公式计算,再由判断相关性.
【解答过程】(1)依题意,
(2)依题意,,,,
所以,
因为,所以与之间具有很强的相关性.
18.(25-26高三上·重庆·月考)2025年渝超联赛正如火如荼地进行,联赛分两个阶段,第一阶段为各赛区比赛,第二阶段为总决赛.联赛积分规则为:胜一场得3分,平一场得1分,负一场得0分.九龙坡区队属于中心城区赛区,该赛区共有11支球队进行单循环比赛(每支参赛队伍均与其他所有队伍恰好比赛一次).已知九龙坡区队在与赛区中任何一个对手比赛时,获胜的概率均为,平局的概率均为,失利的概率均为,且各场比赛结果相互独立.
(1)九龙坡区队教练组为研究观众人数对球队成绩的影响,用模拟了该球队在5种不同观众人数(单位:千人)下的比赛表现(每场均模拟完整的小组赛).模拟数据如下:
场均观众人数 (千人)
8
12
6
15
9
小组赛积分
10
16
8
18
13
请计算场均观众人数 (千人)与小组赛积分的样本相关系数 (精确到0.01),并说明两者之间的线性相关程度;
(2)九龙坡区队在9月13日的揭幕赛中以失利于渝中区队,积0分.根据赛事规则推算,在中心城区赛区,球队至少需要获得23分才有晋级总决赛的可能.求九龙坡区队在第一阶段未来赛事中至少获得23分的概率.
附:相关系数,
【答案】(1),具有很强的正线性相关关系;
(2).
【解题思路】(1)借助相关系数的计算公式计算即可得;
(2)分析所有可能情况并计算对应概率即可得.
【解答过程】(1),,
则,
,,
则,
因为,且接近于,
故说明场均观众人数与小组赛积分之间具有很强的正线性相关关系;
(2)九龙坡区队在第一阶段未来赛事中至少获得23分,
则设剩余场比赛中九龙坡区队比赛情况有以下几种:
一:场比赛全胜,概率为:;
二:胜场,平或负场,概率为:;
三:胜场,平场,概率为:;
故九龙坡区队在第一阶段未来赛事中至少获得23分的概率为:.
19.(2025·湖南长沙·三模)某公司是从事无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种无人机性能都很好,但对操控人员的水平要求较高.已知在单位时间内,甲、乙两种无人机操作成功的概率分别为和,假设每次操作成功与否相互独立.
(1)该公司分别收集了甲种无人机在5个不同地点测试的两项指标 ,数据如下表所示:
地点1
地点2
地点3
地点4
地点5
2
4
5
6
8
3
4
4
4
5
试求与之间的相关系数,并利用说明与的线性相关程度.
(若,则线性相关程度较高,否则线性相关程度不高)
(2)操作员连续进行两次无人机的操作,在初次操作时,随机选择这两种无人机中的一种,若初次操作成功,则第二次继续使用该种无人机,若初次操作不成功,则第二次使用另一种无人机进行操作,求操作成功的次数的数学期望.
附.
【答案】(1),线性相关程度较高
(2)
【解题思路】(1)根据相关系数公式,求出相关系数,再根据系数大小判断相关程度高不高.
(2)根据独立事件的乘法公式,求出分布列,求出期望.
【解答过程】(1)由题可知,
,
,
则相关系数,
因为,所以与的线性相关程度较高.
(2)设操作成功的次数为,则的所有可能取值为0,1,2.
,
,
,
所以.
第 1 页 共 23 页
学科网(北京)股份有限公司
$
第15讲 成对数据的统计相关性
【人教A版】
模块一
变量的相关关系
1.变量的相关关系
(1)函数关系
函数关系是一种确定性关系,常用解析式来表示.
(2)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.与函数关系不同,相关关系是一种非确定性关系.
2.散点图
(1)散点图
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)正相关和负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.
【题型1 相关关系与函数关系的概念及辨析】
【例1】(24-25高二·全国·课后作业)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
【变式1.1】(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
【变式1.2】(24-25高一下·青海海东·期末)下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【变式1.3】(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
【题型2 判断两个变量是否有相关关系】
【例2】(24-25高二下·吉林·期末)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
【变式2.1】(24-25高二下·全国·课后作业)下列语句所表示的事件中的因素不具有相关关系的是( )
A.瑞雪兆丰年 B.名师出高徒
C.吸烟有害健康 D.喜鹊叫喜
【变式2.2】(24-25高二下·甘肃兰州·期末)下列各关系不属于相关关系的是( )
A.产品的成本与生产数量 B.球的表面积与体积
C.家庭的支出与收入 D.人的年龄与体重
【变式2.3】(24-25高二·宁夏银川·期中)给出下列关系:其中具有相关关系的是( )
①考试号与考生考试成绩; ②勤能补拙;
③水稻产量与气候; ④正方形的边长与正方形的面积.
A.①②③ B.①③④ C.②③ D.①③
【题型3 判断正、负相关】
【例3】(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
【变式3.1】(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【变式3.2】(24-25高二下·北京东城·期末)某校学生科研兴趣小组为了解1~12岁儿童的体质健康情况,随机调查了20名儿童的相关数据,分别制作了肺活量、视力、肢体柔韧度、BMI指数和身高之间的散点图,则与身高之间具有正相关关系的是( )
A.肺活量 B.视力 C.肢体柔韧度 D.BMI指数
【变式3.3】(24-25高二上·新疆和田·期末)对于变量,有以下四个散点图,由这四个散点图可以判断变量与成负相关的是( )
A. B.
C. D.
模块二
样本相关系数
1.样本相关系数
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),利用相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
(其中x1,x2,…,xn和y1,y2,…,yn的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
【题型4 相关系数的意义及辨析】
【例4】(24-25高二下·山西吕梁·期末)下面是不同成对数据的散点图,从左到右对应的样本相关系数分别是,其中最大的是( )
A. B.
C. D.
【变式4.1】(24-25高二下·山东济南·期末)对四组数据进行统计,获得以下散点图,将四组数据对应的相关系数进行比较,则( )
A. B.
C. D.
【变式4.2】(24-25高二下·山东聊城·阶段检测)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【变式4.3】(24-25高二下·天津河北·期末)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是( )
A. B.
C. D.
【题型5 相关系数的计算】
【例5】(24-25高二下·全国·课后作业)某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
【变式5.1】(24-25高二下·湖北·月考)已知变量x和变量y的3对随机观测数据,,,则该组样本数据点的相关系数( )
(参考公式:)
A. B. C. D.1
【变式5.2】(24-25高二下·江苏淮安·月考)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
参考数据:.
参考公式:相关系数.
【变式5.3】(24-25高二下·广东深圳·期中)深圳欢乐谷试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值.
(2)计算与的相关系数;判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:,.
参考公式:相关系数.若,则与的线性相关性很强.
【题型6 相关系数与其他知识综合】
【例6】(24-25高二下·江西景德镇·期中)某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人,它结合了人工智能、语音识别、互动娱乐和教育等内容,且云端内容可以持续更新,旨在通过趣味性和互动性帮助孩子学习和发展.萌宠机器人一投放市场就受到了很多家长欢迎,为了更好的服务广大家长,该公司对萌宠机器人的某个性能指数与孩子的喜爱程度进行统计调查,得到如下数据表:
5
6
7
8
9
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,通过计算变量的相关系数,回答是否可以认为该性能指数与孩子的喜爱程度相关性很强(当时,与相关性很强);
(2)该公司科技人员小李想挑战萌宠机器人,他和机器人比赛答题,他们每人答4个题,若小李答对题数不小于3,则挑战成功.已知小李答对前两道题的概率均为,答对后两道题的概率均为,假设每次答题相互独立,且互不影响,当时,求小李挑战成功的概率的最大值.
参考公式:相关系数
【变式6.1】(25-26高三上·贵州贵阳·月考)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
【变式6.2】(24-25高二下·广东中山·月考)全面建成小康社会取得了伟大历史成就,决战脱贫攻坚取得了决定性胜利,某脱贫县实现脱贫奔小康的目标,该县经济委员会积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收.
(1)该县经济委员会为精准了解本地特产广告宣传的导向作用,在购买该县特产的客户中随机抽取300人进行广告宣传作用的调研,对因广告宣传导向而购买该县特产的客户统计结果是:客户群体中青年人约占15%,其中男性为20%;中年人约占50%,其中男性为35%;老年人约占35%,其中男性为55%.以样本估计总体,视频率为概率.
①在所有购买该县特产的客户中随机抽取一名客户,求抽取的客户是男性的概率;
②在所有购买该县特产的客户中随机抽取一名客户是男客户,求他是中年人的概率(精确到0.0001);
(2)该县经济委员会统计了某6至12月这7个月的月广告投入(单位:万元);(单位:万件)的数据如表所示:
月广告投入/万元
1
2
3
4
5
6
7
月销量/万件
28
32
35
45
49
52
60
请根据相关系数说明相关关系的强弱.(若,则认为两个变量有很强的线性相关性,值精确到0.001)
参考数据:.
参考公式:相关系数.
【变式6.3】(25-26高三上·西藏拉萨·月考)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示.
年份代码
1
2
3
4
5
产量/千万吨
13.4
13.6
13.8
13.7
14.0
现规定表示年份代码,表示年份代码为的产量,经计算得,,
(1)求样本的相关系数;(精确到0.01)
(2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望.
附:相关系数,.
一、单选题
1.(25-26高二上·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.光照时间和果树亩产量 B.降雪量和交通事故发生率
C.每亩田施肥量和粮食亩产量 D.圆的面积和半径
2.(24-25高二下·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是( )
A. B.
C. D.
3.(24-25高二下·福建莆田·期末)下列图中,相关系数最大的是( )
A. B.
C. D.
4.(24-25高二下·江苏淮安·期中)已知甲、乙、丙、丁四组数据变量间对应的样本相关系数分别为-0.92,0.46,0.79,0.85,则( )
A.甲组数据变量间的线性相关程度最强 B.乙组数据变量间的线性相关程度最强
C.丙组数据变量间的线性相关程度最强 D.丁组数据变量间的线性相关程度最强
5.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
6.(24-25高二下·辽宁丹东·期中)对两组数据进行统计后得到如图所示的散点图,下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数小于图2相关系数
D.图1相关系数和图2相关系数之和小于0
7.(24-25高二下·天津西青·期末)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
8.(24-25高二下·湖北孝感·期末)已知两个变量x和y之间存在线性相关关系,某兴趣小组收集了一组样本数据,利用最小二乘法求得的回归方程是,其相关系数是由于某种原因,其中一个数据丢失,将其记为m,具体数据如下表所示:
x
1
2
3
4
5
y
m
若去掉数据后,剩下的数据也成线性相关关系,其相关系数是,则( )
A. B.
C. D.的大小关系无法确定
二、多选题
9.(24-25高二下·全国·课后作业)下列关系中,是相关关系的为( )
A.学生的学习态度与学习成绩之间的关系
B.教师的教学水平与学生的学习成绩之间的关系
C.学生的身高与学生的学习成绩之间的关系
D.家庭的经济条件与学生的学习成绩之间的关系
10.(24-25高二下·河北·期中)观察下列散点图,则( )
A. B. C. D.
11.(24-25高二下·山东·月考)甲、乙、丙、丁各自研究两个随机变量的数据,甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,则( )
A.这四人中,丁研究的两个随机变量的线性相关程度最高
B.这四人中,乙研究的两个随机变量的线性相关程度最低
C.这四人中,甲研究的两个随机变量的线性相关程度最高
D.这四人中,甲研究的两个随机变量的线性相关程度最低
三、填空题
12.(24-25高二下·全国·课后作业)观察下列散点图,有三种情况:①正相关,②负相关,③不相关.与散点图的位置相对应的序号依次是___________.
13.(24-25高二下·河南·月考)甲、乙、丙各自研究两个随机变量的数据,若甲、乙、丙计算得到各自研究的两个随机变量的线性相关系数分别为,则这三人中,__________研究的两个随机变量的线性相关程度最高.
14.(24-25高二下·河北沧州·期中)某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数__________.(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
四、解答题
15.(24-25高二·全国·课堂例题)试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的行驶速度与耗油量;
(3)真空中自由降落的小球,位移(单位:m)与时间(单位:s);
(4)日降雨量(单位:cm)与空气中污染物浓度(单位:).
16.(24-25高二下·全国·课后作业)2023年3月6日,中华人民共和国国务院新闻办公室举行“权威部门话开局”系列主题新闻发布会,介绍“加快推进新型工业化做强做优做大实体经济”有关情况.经综合研判,今年我国新能源汽车产业将保持良好的发展态势,生产和销售将实现稳定增长.据统计,去年10月至今年2月某品牌新能源汽车的市场销售量如下表.
月份
10月
11月
12月
1月
2月
销售量万辆
0.6
0.7
1.0
1.3
1.6
(1)根据数据作出散点图;
(2)判断与之间的相关关系.
17.(24-25高二下·全国·课后作业)2019年11月份,全国工业生产者出厂价格同比下降,环比下降.某企业在了解市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制定相应的出厂价格.该企业统计了2019年1-10月份产品的生产数量与销售总额之间的关系,如下表所示.
万件
2.08
2.12
2.19
2.28
2.36
2.48
2.59
2.68
2.80
2.87
万元
42.5
43.7
44.0
45.5
46.4
47.5
49.2
50.3
51.4
52.6
(1)计算的值;
(2)计算样本相关系数的值,并通过的值的大小说明与之间的相关程度.
18.(25-26高三上·重庆·月考)2025年渝超联赛正如火如荼地进行,联赛分两个阶段,第一阶段为各赛区比赛,第二阶段为总决赛.联赛积分规则为:胜一场得3分,平一场得1分,负一场得0分.九龙坡区队属于中心城区赛区,该赛区共有11支球队进行单循环比赛(每支参赛队伍均与其他所有队伍恰好比赛一次).已知九龙坡区队在与赛区中任何一个对手比赛时,获胜的概率均为,平局的概率均为,失利的概率均为,且各场比赛结果相互独立.
(1)九龙坡区队教练组为研究观众人数对球队成绩的影响,用模拟了该球队在5种不同观众人数(单位:千人)下的比赛表现(每场均模拟完整的小组赛).模拟数据如下:
场均观众人数 (千人)
8
12
6
15
9
小组赛积分
10
16
8
18
13
请计算场均观众人数 (千人)与小组赛积分的样本相关系数 (精确到0.01),并说明两者之间的线性相关程度;
(2)九龙坡区队在9月13日的揭幕赛中以失利于渝中区队,积0分.根据赛事规则推算,在中心城区赛区,球队至少需要获得23分才有晋级总决赛的可能.求九龙坡区队在第一阶段未来赛事中至少获得23分的概率.
附:相关系数,
19.(2025·湖南长沙·三模)某公司是从事无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种无人机性能都很好,但对操控人员的水平要求较高.已知在单位时间内,甲、乙两种无人机操作成功的概率分别为和,假设每次操作成功与否相互独立.
(1)该公司分别收集了甲种无人机在5个不同地点测试的两项指标 ,数据如下表所示:
地点1
地点2
地点3
地点4
地点5
2
4
5
6
8
3
4
4
4
5
试求与之间的相关系数,并利用说明与的线性相关程度.
(若,则线性相关程度较高,否则线性相关程度不高)
(2)操作员连续进行两次无人机的操作,在初次操作时,随机选择这两种无人机中的一种,若初次操作成功,则第二次继续使用该种无人机,若初次操作不成功,则第二次使用另一种无人机进行操作,求操作成功的次数的数学期望.
附.
第 1 页 共 23 页
学科网(北京)股份有限公司
$