内容正文:
专题9.1 变量的相关性
教学目标
1.结合实例,体会两个变量间的相关关系;
2.掌握相关关系的判断,能根据散点图对线性相关关系进行判断;
3.通过对两个变量间的相关关系的学习,培养学生的直观想象及数据分析素养。
教学重难点
1.重点
相关关系的概念与相关系数的探求;用线性函数近似地刻画两个具有相关关系的变量之间的关系。
2.难点
利用散点图直观认识两个变量之间的线性相关关系;相关系数的探求及性质。
知识点01 变量的相关关系
1.变量的相关关系
(1)函数关系
函数关系是一种确定性关系,常用解析式来表示.
(2)相关关系
两个变量之间具有一定的联系,但又没有确定性函数关系,这种关系称为相关关系.
2.散点图
(1)散点图
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)正相关和负相关
这些散点呈从左下向右上方向发展的趋势,我们称这两个变量之间正相关.同理,如果具有相关关系的两个变量的散点图呈从左上逐渐向右下方向发展的趋势,则称这两个变量之间负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.
【即学即练】
1.下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
【答案】D
【分析】根据相关关系的定义、函数的定义即可判断
【解析】A,B均为函数关系,故A、B错误;C,D为相关关系,故C错,D对.
故选:D.
2.下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是( )
A. B.
C. D.
【答案】C
【分析】根据散点图的特征得到答案.
【解析】A中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性;
B中呈正相关关系,C中两个变量具有负相关关系;
D中两个变量具有相关性,但不是正相关,也不是负相关.
故选:C.
知识点02 样本相关系数
1.样本相关系数
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),利用相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
(其中x1,x2,…,xn和y1,y2,…,yn的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
2.相关系数的性质
相关系数r具有下列性质:
(1)-1≤r≤1;
(2)r>0时y与x呈正相关关系,r<0时y与x呈负相关关系;
(3)|r|越接近1,y与x相关的程度就越强,|r|越接近0,y与x相关的程度就越弱.
通常情况下,|r|大于0.75时,认为两个变量有很强的线性相关关系;当|r|<0.3时,认为几乎没有线性相关关系.
【即学即练】
1.对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【分析】根据散点图和相关系数的概念和性质辨析即可.
【解析】由散点图可知,相关系数所在散点图呈负相关,所在散点图呈正相关,
所以都为正数,都为负数.
所在散点图近似一条直线上,线性相关性比较强,相关系数的绝对值越接近1,
而所在散点图比较分散,线性相关性比较弱,相关系数的绝对值越远离1.
综上可得:.
故选:A.
2.某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
【答案】D
【分析】根据已知数据分别计算各个量得出的值即可.
【解析】由题得,
所以,
故接待人数与年份的相关系数约为0.97.
故选:D.
题型01 相关关系与函数关系的辨析
【典例1】下列变量之间的关系不是相关关系的是( )
A.光照时间和果树亩产量 B.降雪量和交通事故发生率
C.每亩田施肥量和粮食亩产量 D.圆的面积和半径
【答案】D
【分析】利用两变量相关关系的意义判断即可.
【解析】列表解析
选项
是否是相关关系
原因
A
是
果树亩产量与光照时间有关,是相关关系.
B
是
降雪量的大小对交通事故发生率有影响,是相关关系.
C
是
粮食亩产量与每亩田施肥量有关,是相关关系.
D
否
圆的面积S和半径r是函数关系.
故选:D.
【变式1】下面变量之间是相关关系的是( )
A.出租车费与行驶的里程
B.正方形面积与边长
C.人的身高与体重
D.铁的体积与质量
【答案】C
【分析】根据相关关系的概念逐项判断即可.
【解析】由相关关系可知C选项是相关关系,ABD选项都是函数关系.
故选:C.
【变式2】下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【答案】C
【分析】函数关系是变量之间的确定关系,相关关系是变量之间确实存在关系但不具有确定性,据此判断即可.
【解析】解:对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;
对于B,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B错误;
对于C,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C正确;
对于D,人的体重与视力是没有相关关系的,所以D错误.
故选:C.
【变式3】思考并判断下列几组变量之间有什么样的关系?
(1)商品销售量与销售价格之间的关系;
(2)匀速运动的物体,其运动的路程与时间之间的关系;
(3)平均学习时间与学习成绩之间的关系;
(4)科技创新能力与人才培养近亲繁殖率之间的关系.
【答案】(1)相关关系;(2)函数关系;(3)相关关系;(4)相关关系
【分析】根据相关关系的定义、函数关系的定义,逐项判定即可.
【解析】(1)因为销售量除了与销售价格有关系,还和是否打广告等方面有关系,
所以商品销售量与销售价格之间的关系为相关关系;
(2)设匀速运动的物体的速度为,
所以运动的路程与时间之间的关系为,
因此匀速运动的物体,其运动的路程与时间之间的关系为函数关系;
(3)因为学习成绩除了与平均学习时间有关系外,还与学习方法等因素有关系,
所以平均学习时间与学习成绩之间的关系为相关关系;
(4)因为科技创新能力除了与人才培养近亲繁殖率有关系,还有教育等因素有关系,
所以科技创新能力与人才培养近亲繁殖率之间的关系为相关关系.
题型02 判断两个变量是否有相关关系
【典例1】下图中的两个变量,具有相关关系的是( )
A. B.
C. D.
【答案】B
【分析】根据相关关系的概念逐项分析判断.
【解析】相关关系是一种非确定性关系.
对于A、C:两个变量具有函数关系,是一种确定性关系,故A、C错误;
对于D:图中的散点分布没有什么规律,故两个变量之间不具有相关关系,故D错误;
对于B:图中的散点分布在从左下角区域到右上角区域,两个变量具有相关关系,故B正确;
故选:B.
变量的相关关系散点图判断法:
根据成对样本数据绘制散点图,若点的分布从左下角到右上角,两变量为正相关;若点的分布从左上角到右下角,两变量为负相关。
【变式1】在下列各图中,两个变量具有相关关系的是( ).
A.①② B.①③ C.② D.②③
【答案】D
【分析】根据函数关系和相关关系的概念,结合图象作出判断.
【解析】对于①,所有的点都在曲线上,具有函数关系;
对于②,所有的散点分布在一条直线附近,具有相关关系:
对于③,所有的散点分布在一条曲线附近,具有相关关系;
对于④,所有的散点杂乱无章,不具有相关关系,
故选:D.
【变式2】下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
【答案】D
【分析】根据相关关系的定义判断即可.
【解析】对于A:人的身高与受教育的程度不具有相关关系,故A错误;
对于B:人的体重与眼睛的近视程度不具有相关关系,故B错误;
对于C:企业员工的工号与工资不具有相关关系,故C错误.
对于D:儿子的身高与父亲的身高具有相关关系,故D正确.
故选:D.
题型03 判断正、负相关
【典例1】对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
【答案】B
【分析】根据散点图点的变化关系确定正负相关性即可.
【解析】由变量,的散点图,知随增大,也增大,变量与正相关,
由变量,的散点图,知随增大,减小,与负相关.
故选:B.
【变式1】对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
【答案】D
【分析】根据散点图点的变化关系确定正负相关性即可.
【解析】对于图1,散点总体斜向上分布,故变量与呈现正相关,故排除B;
对于图2,散点总体斜向上分布,故变量与呈现负相关,故排除C;
图1中散点图分布较为集中,图2中的散点图分布较为分散,故,
故选:D.
【变式2】某公司2018-2023年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示.
年份
2018
2019
2020
2021
2022
2023
x/百万元
12.2
14.6
16.0
18.0
20.4
22.3
y/百万元
0.62
0.74
0.81
0.89
1.00
1.11
根据统计资料,年利润中位数( )
A.是16,x与y有正线性相关关系
B.是17,x与y有正线性相关关系
C.是17,x与y有负线性相关关系
D.是18,x与y有负线性相关关系
【答案】B
【分析】根据数据分析可直接得出结论.
【解析】由题意,利润中位数是,
而且随着利润x的增加,广告支出y也在增加,故x与y有正线性相关关系.
故选:B.
【变式3】(多选)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有线性相关关系的是( )
A. B.
C. D.
【答案】BC
【分析】根据散点图的特征逐一验证即可得到答案.
【解析】由题意,
对于A:散点杂乱无章,无规律可言,看不出两个变量有什么相关性;故A错误;
对于B:呈正相关关系,分布在一条直线附近,具有线性相关关系;故B正确;
对于C:两个变量具有负相关关系,分布在一条直线附近,具有线性相关关系;故C正确;
对于D:两个变量具有相关性,但不是正相关,也不是负相关,故D错误.
故选:BC.
题型04 样本相关系数大小对变量相关性的影响
【典例1】对四组数据进行统计,获得以下散点图,将四组数据对应的相关系数进行比较,则( )
A. B.
C. D.
【答案】A
【分析】根据给定的散点图,结合相关系数的意义判断即得.
【解析】由图知,对应的与负相关,且对应的相关性更强,即;
对应的与正相关,且对应的相关性更强,即,
所以.
故选:A.
变量的相关关系样本相关系数判断法:
样本相关系数记为,
时两变量正相关,时两变量负相关;
的取值范围为,越接近1,线性相关程度越强,越接近0,线性相关程度越弱;
时两变量无线性相关关系。
计算公式为:
【变式1】下面是不同成对数据的散点图,从左到右对应的样本相关系数分别是,其中最大的是( )
A. B.
C. D.
【答案】A
【分析】根据散点图中点的分布,即可判断答案.
【解析】由散点图可知,并且第一个图中的点更为集中,更贴近某条直线分布,
第三、四个图中的点的分布更为分散,
因此更接近于1,的绝对值更接近于0,
即最大的是,
故选:A.
【变式2】对两个变量x,y进行线性相关性检验,得线性相关系数,对两个变量u,v进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量x与变量y正相关,变量u与变量v负相关,变量x与变量y的线性相关性更强
B.变量x与变量y负相关,变量u与变量v正相关,变量x与变量y的线性相关性更强
C.变量x与变量y负相关,变量u与变量v正相关,变量u与变量v的线性相关性更强
D.变量x与变量y正相关,变量u与变量v负相关,变量u与变量v的线性相关性更强
【答案】D
【分析】根据相关系数的正负判断正负相关,并根据相关系数绝对值大小得到相关性强弱.
【解析】由线性相关系数知x与y正相关,
由线性相关系数知u与v负相关,
又,所以变量u与变量v的线性相关性比变量x与变量y的线性相关性更强.
故选:D.
【变式3】对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【分析】根据相关系数的概念即可判断.
【解析】由图可知图(1)和图(3)是正相关,故相关系数为正,又因为图(1)的点较图(3)的点分布密集,故相关性图(1)更好,相关系数较大,即;
图(2)和图(4)是负相关,故相关系数为负,又因为图(2)的点较图(4)的点分布密集,故相关性图(2)更好,相关系数的绝对值较大,即,故;
综上可知:,
故选:A.
【变式4】调研某工厂的生产投入(生产工时/天)对产量(件/天)和每件产品的平均能源消耗(千瓦时/件)的影响,得到如下数据:
(生产工时/天)
10
20
30
40
50
60
(件/天)
50
101
149
202
248
301
(千瓦时/件)
19.8
19.1
15.2
14.5
13.0
9.2
现在对与,与分别进行相关性分析,得到相关系数分别为,,则下列判断正确的是( )
A. B. C. D.
【答案】AC
【分析】根据所给数据及相关系数的概念及性质判断即可.
【解析】由表格数据可知增大也增大,即与呈正相关,所以,故A正确;
因为增大时反而越来越少,所以与呈负相关,所以,故B错误;
因为每增加,增加的量分别为,,,,,增加的量接近且偏差不大,
而每增加,减少的量分别为,,,,,偏差较大,
即与的相关性更强,所以,即,所以,故C正确,D错误.
故选:AC
【变式5】(多选)观察下列散点图,其中两个变量的相关关系判断一定不正确的是( )
A.图1中y与x呈正相关
B.图2中y与x不相关
C.图3中y与x的线性相关系数小于0
D.图1中y与x的线性相关系数小于图2中y与x的线性相关系数
【答案】ABC
【分析】根据给定的散点图,利用正负相关的意义、相关系数的意义逐项判断.
【解析】对于A,图1中随增大而减小, y与x呈负相关,A错误;
对于B,图2中各点较分散,y与x的相关性不强,不能肯定不相关,B错误;
对于C,图3中随增大而增大,y与x呈正相关,相关系数大于0,C错误;
对于D,图1与图2,y与x都呈负相关,相关系数为负,
而图1中y与x的线性相关性较图2中y与x的线性相关性强,
所以,图1中y与x的线性相关系数小于图2中y与x的线性相关系数,D正确.
故选:ABC
题型05 相关系数的计算
【典例1】最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
【答案】A
【分析】根据相关系数公式计算即可求解.
【解析】,,
,
.
故选:A.
相关系数r的计算公式:
(其中x1,x2,…,xn和y1,y2,…,yn的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
【变式1】某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
【答案】D
【分析】根据相关系数公式计算即可求解.
【解析】由题得,
所以,
故接待人数与年份的相关系数约为0.97.
故选:D.
【变式2】某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
【答案】(1)13;11;(2); (3)可以用线性回归模型拟合与之间的关系,理由见解析
【分析】(1)根据已知数据直接求平均值即可;
(2)分别求出和,再代入公式即可求解;
(3)根据相关系数的绝对值大于0.75且非常接近1判断即可.
【解析】(1)由题可知,;
(2)计算得,
故;
(3)由(2)可知,与的相关系数的绝对值近似为0.992,大于0.75且非常接近1,
说明与的线性相关性很强,从而可以用线性回归模型拟合与之间的关系.
【变式3】深圳欢乐谷试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值.
(2)计算与的相关系数;判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:,.
参考公式:相关系数.若,则与的线性相关性很强.
【答案】(1),
(2),可以用线性回归模型拟合与之间的关系,理由见解析
【分析】(1)根据已知数据直接求平均值即可;
(2)分别求出和,再代入公式即可求解,再根据相关系数的绝对值大于0.75且非常接近1判断即可.
【解析】(1)由题可知,;
(2)因为,
,
故;
因为与的相关系数的绝对值近似为,大于且非常接近,
说明与的线性相关性很强,从而可以用线性回归模型拟合与之间的关系.
题型06 变量的相关性与概率的综合应用
【典例1】某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人,它结合了人工智能、语音识别、互动娱乐和教育等内容,且云端内容可以持续更新,旨在通过趣味性和互动性帮助孩子学习和发展.萌宠机器人一投放市场就受到了很多家长欢迎,为了更好的服务广大家长,该公司对萌宠机器人的某个性能指数与孩子的喜爱程度进行统计调查,得到如下数据表:
5
6
7
8
9
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,通过计算变量的相关系数,回答是否可以认为该性能指数与孩子的喜爱程度相关性很强(当时,与相关性很强);
(2)该公司科技人员小李想挑战萌宠机器人,他和机器人比赛答题,他们每人答4个题,若小李答对题数不小于3,则挑战成功.已知小李答对前两道题的概率均为,答对后两道题的概率均为,假设每次答题相互独立,且互不影响,当时,求小李挑战成功的概率的最大值.
参考公式:相关系数
【答案】(1),可以认为该性能指数与孩子的喜爱程度相关性很强; (2)
【分析】(1)利用公式求出即可判断;
(2)根据题意表示出小李挑战成功的概率为,再结合基本不等式及二次函数的知识求解即可.
【解析】(1)由表知,,
,
,
,
,
则,
由此可以认为该性能指数与孩子的喜爱程度相关性很强.
(2)当小李答对题数为3时,概率为:
,
当小李答对题数为4时,概率为:,
所以小李挑战成功的概率为:,
由,,,
则,当且仅当时等号成立,
所以,由二次函数的知识可知,
当时,小李挑战成功的概率最大,最大为.
【变式1】全面建成小康社会取得了伟大历史成就,决战脱贫攻坚取得了决定性胜利,某脱贫县实现脱贫奔小康的目标,该县经济委员会积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收.
(1)该县经济委员会为精准了解本地特产广告宣传的导向作用,在购买该县特产的客户中随机抽取300人进行广告宣传作用的调研,对因广告宣传导向而购买该县特产的客户统计结果是:客户群体中青年人约占15%,其中男性为20%;中年人约占50%,其中男性为35%;老年人约占35%,其中男性为55%.以样本估计总体,视频率为概率.
①在所有购买该县特产的客户中随机抽取一名客户,求抽取的客户是男性的概率;
②在所有购买该县特产的客户中随机抽取一名客户是男客户,求他是中年人的概率(精确到0.0001);
(2)该县经济委员会统计了某6至12月这7个月的月广告投入(单位:万元);(单位:万件)的数据如表所示:
月广告投入/万元
1
2
3
4
5
6
7
月销量/万件
28
32
35
45
49
52
60
请根据相关系数说明相关关系的强弱.(若,则认为两个变量有很强的线性相关性,值精确到0.001)
参考数据:.
参考公式:相关系数.
【答案】(1)①0.3975;②0.4403; (2)与的线性相关程度相当高
【分析】(1)根据全概率公式即可得出①的答案,进而根据条件概率公式可得出②的答案;
(2)由已知可求得,,,然后代入相关系数公式即可求出相关系数的值,进而得出两个变量线性相关性的强弱.
【解析】(1)设事件“抽取的是男性客户” “青年客户”,
“中年客户”,“老年客户”,依题设,
,
①由全概率公式
②
(2)由题意,知,所以,
所以,
又,所以相关系数
,
显然与的线性相关程度相当高.
【变式2】近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
【答案】(1),很强的线性正相关关系
(2)
X
80
150
210
P
【分析】(1)根据样本相关系数的计算公式,进行求解即可;
(2)由题意,X的可能取值为80、150、210,求出对应概率,列出分布列,即可得解.
【解析】(1)由题意,,,
则,
由,
同理,
则,
则,
由接近1且为正,故变量x与y之间有很强的线性正相关关系.
(2)由题意,X的可能取值为80、150、210,
则,,
,
故X的分布列为:
X
80
150
210
P
则.
【变式3】某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人,它结合了人工智能、语音识别、互动娱乐和教育等内容,且云端内容可以持续更新,旨在通过趣味性和互动性帮助孩子学习和发展.萌宠机器人一投放市场就受到了很多家长欢迎,为了更好的服务广大家长,该公司对萌宠机器人的某个性能指数与孩子的喜爱程度进行统计调查,得到如下数据表:
5
6
7
8
9
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,通过计算变量的相关系数,回答是否可以认为该性能指数与孩子的喜爱程度相关性很强(当时,与相关性很强);
(2)机器人的交互性很强,孩子可以通过输入语音给机器人发布执行指令.机器人执行命令的正确率为,出错率为.当机器人正确执行命令时,使用者满意的概率为;当机器人执行出错时,使用者满意的概率为.如果使用者对某次命令执行结果表示不满意,求机器人实际正确执行命令的概率是多少?
(3)该公司科技人员小李想挑战萌宠机器人,他和机器人比赛答题,他们每人答4个题,若小李答对题数不小于3,则挑战成功.已知小李答对前两道题的概率均为,答对后两道题的概率均为.假设每次答题相互独立,且互不影响,当时,求小李挑战成功的概率的最大值.
参考公式:相关系数.
【答案】(1),可以认为该性能指数与孩子的喜爱程度相关性很强; (2); (3)
【分析】(1)利用公式求出即可判断;
(2)根据全概率公式及条件概率公式求解即可;
(3)根据题意表示出小李挑战成功的概率为,再结合基本不等式及二次函数的知识求解即可.
【解析】(1)由表知,,
,
,
,
,
则,
由此可以认为该性能指数与孩子的喜爱程度相关性很强.
(2)设事件为机器人执行命令正确”,事件为“机器人执行命令错误”,
事件为“使用者不满意”,
则,,
,,
则,
所以.
(3)当小李答对题数为3时,概率为:
,
当小李答对题数为4时,概率为:,
所以小李挑战成功的概率为:,
由,,,
则,当且仅当时等号成立,
所以,由二次函数的知识可知,
当时,小李挑战成功的概率最大,最大为.
1.下列各关系不属于相关关系的是( )
A.产品的成本与生产数量 B.球的表面积与体积
C.家庭的支出与收入 D.人的年龄与体重
【答案】B
【分析】根据相关关系的定义判断.
【解析】对于A:产品的成本与生产数量是相关关系,故A正确;
对于B:设球的半径为,球的表面积为、体积为,
则,所以,而,
所以球的表面积与体积是一种函数关系,故B错误;
对于C:家庭的支出与收入是相关关系,故C正确;
对于D:人的年龄与体重是相关关系,故D正确.
故选:B.
2.为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【答案】B
【分析】由正、负相关的概念即可判断.
【解析】由题中数据可知,y随x的增大而增大,且不成比例关系,故y与x正相关.
故选:B.
3.下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
【答案】B
【分析】由正、负相关的概念逐项判断即可.
【解析】从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则这两个变量为负相关.
结合散点图可知,①②满足题意,即两个变量呈负相关的个数为2个.
故选:B.
4.对两组数据进行统计后得到如图所示的散点图,下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数小于图2相关系数
D.图1相关系数和图2相关系数之和小于0
【答案】C
【分析】根据散点图及正负相关性判断A,B,再根据相关系数性质判断C,D.
【解析】因为散点图都呈直线型,所以图1,图2两组数据都具有线性相关关系,故A正确;
图1散点从左至右呈上升趋势,所以数据正相关,图2散点从左至右呈下降趋势,所以数据负相关,故B正确;
图1正相关,图2负相关,所以,故C不正确;
因为图2相关程度更强,所以,故D正确.
故选:C.
5.已知甲、乙、丙、丁四组数据变量间对应的样本相关系数分别为-0.92,0.46,0.79,0.85,则( )
A.甲组数据变量间的线性相关程度最强 B.乙组数据变量间的线性相关程度最强
C.丙组数据变量间的线性相关程度最强 D.丁组数据变量间的线性相关程度最强
【答案】A
【分析】根据相关系数的性质进行判断,越接近1时,相关程度越强.
【解析】设变量间的线性相关系数为,当越接近1时,相关程度越强,
因为,
所以甲组数据变量间的线性相关程度最强,乙组数据变量间的线性相关程度最弱.
故选:A.
6.(多选)调研某工厂的生产投入(生产工时/天)对产量(件/天)和每件产品的平均能源消耗(千瓦时/件)的影响,得到如下数据:
(生产工时/天)
10
20
30
40
50
60
(件/天)
50
101
149
202
248
301
(千瓦时/件)
19.8
19.1
15.2
14.5
13.0
9.2
现在对与,与分别进行相关性分析,得到相关系数分别为,,则下列判断正确的是( )
A. B. C. D.
【答案】AC
【分析】根据所给数据及相关系数的概念及性质判断即可.
【解析】由表格数据可知增大也增大,即与呈正相关,所以,故A正确;
因为增大时反而越来越少,所以与呈负相关,所以,故B错误;
因为每增加,增加的量分别为,,,,,增加的量接近且偏差不大,
而每增加,减少的量分别为,,,,,偏差较大,
即与的相关性更强,所以,即,所以,故C正确,D错误.
故选:AC
7.(多选)在以下4幅散点图中,对于图中的y和x之间的关系判断正确的是( )
A.图(2)(3)(4)中的y和x之间存在相关关系
B.图(2)(4)中的y和x之间呈现正相关关系
C.图(2)(3)中的y和x之间呈现线性相关关系且(2)的相关性一定比(3)强
D.图(4)中的y和x之间呈现非线性相关关系
【答案】ABD
【分析】根据散点图点的变化关系确定正负相关性即可.
【解析】由题图,(1)中点没有明显的变化趋势,
(2)中点有从左下向右上的线性变化趋势,y和x之间呈现正相关且为线性关系,
(3)中点有从左上向右下的线性变化趋势,y和x之间呈现负相关且为线性关系,
(4)中点有从左下向右上的非线性变化趋势,y和x之间呈现正相关且为非线性关系,
但(2)(3)相关性强弱不能从图中点的分布密度直接分析得出,故(2)的相关性不一定比(3)强,
综上,A、B、D对,C错.
故选:ABD
8.(多选)对两组数据进行统计后得到如图所示的散点图,下列结论正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数小于图2相关系数
D.图1相关系数和图2相关系数之和小于0
【答案】ABD
【分析】根据散点图及正负相关性判断A,B,再根据相关系数性质判断C,D.
【解析】因为散点图都呈直线型,所以图1,图2两组数据都具有线性相关关系,故A正确;
图1散点从左至右呈上升趋势,所以数据正相关,图2散点从左至右呈下降趋势,所以数据负相关,故B正确;
图1正相关,图2负相关,所以,故C不正确;
因为图2相关程度更强,所以,故D正确.
故选:ABD.
9.(多选)对两组数据进行统计后得到的散点图如图,关于其线性相关系数的结论正确的是( )
A. B. C. D.
【答案】AC
【分析】根据y与x成正相关或负相关可判断相关系数的正负,根据点的密集程度可比较相关性的大小,从而比较相关系数绝对值的大小.
【解析】由散点图可知,线性相关系数的图象表示y与x成负相关,故,故A正确;
线性相关系数的图象表示y与x正相关,故,故B错误;
∵线性相关系数的点较线性相关系数的点密集,故,
故,故C正确,D错误.
故选:AC.
10.为利于分层教学,某学校根据学生的情况分成了,,三类,经过一段时间的学习后在三类学生中分别随机抽取了1个学生的5次考试成绩,其统计表如下:
A类
第次
1
2
3
4
5
分数(满分150)
145
83
95
72
110
,;
B类
第次
1
2
3
4
5
分数(满分150)
85
93
90
76
101
,
C类
第次
1
2
3
4
5
分数(满分150)
85
92
101
100
112
,;
经计算已知A,B的相关系数分别为.请计算出C类学生的的相关系数,并通过数据的分析回答抽到的哪类学生学习成绩最稳定(结果保留两位有效数字,越大认为成绩越稳定).
附:相关系数.
【答案】0.98,从C类学生中抽到的学生的成绩最稳定.
【分析】根据相关数据代入相关系数公式求出,然后比较其绝对值大小即可.
【解析】由表可得,
则,
所以,
因为,所以从C类学生中抽到的学生的成绩最稳定.
11.某食品加工厂新研制出一种袋装食品(规格:500g/袋),下面是近六个月每袋的出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
1
2
3
4
5
6
每袋的出厂价格(元)
10.5
10.9
11
11.5
12
12.5
月销售量(万袋)
2.2
2
1.9
1.8
1.5
1.4
(1)计算该食品加工厂这六个月内这种袋装食品平均每袋的出厂价格、平均月销售量和平均月销售收入;
(2)求每袋的出厂价格与月销售量的样本相关系数(精确到0.01);
(3)若,则认为相关性很强,试判断该食品加工厂研制的袋装食品每袋的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数.
【答案】(1)11.4(元),(万元); (2)-0.98
(3)该食品加工厂研制的袋装食品每袋的出厂价格与月销售量有较强的相关性.
【分析】(1)由表格中的数据求相应的平均值;
(2)利用样本相关系数公式计算;
(3)由样本相关系数的值判断相关性的强弱.
【解析】(1)由题表得,该食品加工厂这六个月内这种袋装食品平均每袋的出厂价格为(元).
平均月销售量为(万袋),
平均月销售收入为(万元).
(2)由题表及(1)得,
所以样本相关系数
.
(3)因为,所以该食品加工厂研制的袋装食品每袋的出厂价格与月销售量有较强的相关性.
12.春节期间,由于调整免费,车流量逐渐增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表:
车流量/万辆
12
12.5
13
13.5
14
空气质量指数
74
76
78
77
80
(1)在下图中绘制出散点图;
(2)由(1)判断与的线性相关程度,并用相关系数加以说明.
参考公式:相关系数.
参考数据:,,.
【答案】(1)散点图见解析; (2)与的线性相关程度较高
【分析】(1)由表格中的数据作出散点图;
(2)利用样本相关系数公式计算;由样本相关系数的值判断相关性的强弱.
【解析】(1)依题意,画出散点图如图.
(2)与有较强的线性相关程度.理由如下:
因为,
,
,
,
,
所以.
所以与的线性相关程度较高.
13.某食品加工厂新研制出一种袋装食品(规格:500g/袋),下面是近六个月每袋的出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
1
2
3
4
5
6
每袋的出厂价格(元)
10.5
10.9
11
11.5
12
12.5
月销售量(万袋)
2.2
2
1.9
1.8
1.5
1.4
(1)计算该食品加工厂这六个月内这种袋装食品平均每袋的出厂价格、平均月销售量和平均月销售收入;
(2)求每袋的出厂价格与月销售量的样本相关系数(精确到0.01);
(3)若,则认为相关性很强,试判断该食品加工厂研制的袋装食品每袋的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数.
【答案】(1)11.4(元),(万元); (2)-0.98; (3)该食品加工厂研制的袋装食品每袋的出厂价格与月销售量有较强的相关性.
【分析】(1)由表格中的数据求相应的平均值;
(2)利用样本相关系数公式计算;
(3)由样本相关系数的值判断相关性的强弱.
【解析】(1)由题表得,该食品加工厂这六个月内这种袋装食品平均每袋的出厂价格为 (元).
平均月销售量为 (万袋),
平均月销售收入为 (万元).
(2)由题表及(1)得 ,
所以样本相关系数
.
(3)因为,
所以该食品加工厂研制的袋装食品每袋的出厂价格与月销售量有较强的相关性.
14.某公司是从事无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种无人机性能都很好,但对操控人员的水平要求较高.已知在单位时间内,甲、乙两种无人机操作成功的概率分别为和,假设每次操作成功与否相互独立.
(1)该公司分别收集了甲种无人机在5个不同地点测试的两项指标 ,数据如下表所示:
地点1
地点2
地点3
地点4
地点5
2
4
5
6
8
3
4
4
4
5
试求与之间的相关系数,并利用说明与的线性相关程度.
(若,则线性相关程度较高,否则线性相关程度不高)
(2)操作员连续进行两次无人机的操作,在初次操作时,随机选择这两种无人机中的一种,若初次操作成功,则第二次继续使用该种无人机,若初次操作不成功,则第二次使用另一种无人机进行操作,求操作成功的次数的数学期望.
附.
【答案】(1),线性相关程度较高;(2)
【分析】(1)根据相关系数公式,求出相关系数,再根据系数大小判断相关程度高不高.
(2)根据独立事件的乘法公式,求出分布列,求出期望.
【解析】(1)由题可知,
,
,
,
则相关系数,
因为,所以与的线性相关程度较高.
(2)设操作成功的次数为,则的所有可能取值为0,1,2.
,
,
,
所以.
2 / 19
学科网(北京)股份有限公司
$
专题9.1 变量的相关性
教学目标
1.结合实例,体会两个变量间的相关关系;
2.掌握相关关系的判断,能根据散点图对线性相关关系进行判断;
3.通过对两个变量间的相关关系的学习,培养学生的直观想象及数据分析素养。
教学重难点
1.重点
相关关系的概念与相关系数的探求;用线性函数近似地刻画两个具有相关关系的变量之间的关系。
2.难点
利用散点图直观认识两个变量之间的线性相关关系;相关系数的探求及性质。
知识点01 变量的相关关系
1.变量的相关关系
(1)函数关系
函数关系是一种确定性关系,常用解析式来表示.
(2)相关关系
两个变量之间具有一定的联系,但又没有确定性函数关系,这种关系称为相关关系.
2.散点图
(1)散点图
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)正相关和负相关
这些散点呈从左下向右上方向发展的趋势,我们称这两个变量之间正相关.同理,如果具有相关关系的两个变量的散点图呈从左上逐渐向右下方向发展的趋势,则称这两个变量之间负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.
【即学即练】
1.下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
2.下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是( )
A. B.
C. D.
知识点02 样本相关系数
1.样本相关系数
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),利用相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
(其中x1,x2,…,xn和y1,y2,…,yn的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
2.相关系数的性质
相关系数r具有下列性质:
(1)-1≤r≤1;
(2)r>0时y与x呈正相关关系,r<0时y与x呈负相关关系;
(3)|r|越接近1,y与x相关的程度就越强,|r|越接近0,y与x相关的程度就越弱.
通常情况下,|r|大于0.75时,认为两个变量有很强的线性相关关系;当|r|<0.3时,认为几乎没有线性相关关系.
【即学即练】
1.对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
2.某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
题型01 相关关系与函数关系的辨析
【典例1】下列变量之间的关系不是相关关系的是( )
A.光照时间和果树亩产量 B.降雪量和交通事故发生率
C.每亩田施肥量和粮食亩产量 D.圆的面积和半径
【变式1】下面变量之间是相关关系的是( )
A.出租车费与行驶的里程
B.正方形面积与边长
C.人的身高与体重
D.铁的体积与质量
【变式2】下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【变式3】思考并判断下列几组变量之间有什么样的关系?
(1)商品销售量与销售价格之间的关系;
(2)匀速运动的物体,其运动的路程与时间之间的关系;
(3)平均学习时间与学习成绩之间的关系;
(4)科技创新能力与人才培养近亲繁殖率之间的关系.
题型02 判断两个变量是否有相关关系
【典例1】下图中的两个变量,具有相关关系的是( )
A. B.
C. D.
变量的相关关系散点图判断法:
根据成对样本数据绘制散点图,若点的分布从左下角到右上角,两变量为正相关;若点的分布从左上角到右下角,两变量为负相关。
【变式1】在下列各图中,两个变量具有相关关系的是( ).
A.①② B.①③ C.② D.②③
【变式2】下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
题型03 判断正、负相关
【典例1】对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
【变式1】对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
【变式2】某公司2018-2023年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示.
年份
2018
2019
2020
2021
2022
2023
x/百万元
12.2
14.6
16.0
18.0
20.4
22.3
y/百万元
0.62
0.74
0.81
0.89
1.00
1.11
根据统计资料,年利润中位数( )
A.是16,x与y有正线性相关关系
B.是17,x与y有正线性相关关系
C.是17,x与y有负线性相关关系
D.是18,x与y有负线性相关关系
【变式3】(多选)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有线性相关关系的是( )
A. B.
C. D.
题型04 样本相关系数大小对变量相关性的影响
【典例1】对四组数据进行统计,获得以下散点图,将四组数据对应的相关系数进行比较,则( )
A. B.
C. D.
变量的相关关系样本相关系数判断法:
样本相关系数记为,
时两变量正相关,时两变量负相关;
的取值范围为,越接近1,线性相关程度越强,越接近0,线性相关程度越弱;
时两变量无线性相关关系。
计算公式为:
【变式1】下面是不同成对数据的散点图,从左到右对应的样本相关系数分别是,其中最大的是( )
A. B.
C. D.
【变式2】对两个变量x,y进行线性相关性检验,得线性相关系数,对两个变量u,v进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量x与变量y正相关,变量u与变量v负相关,变量x与变量y的线性相关性更强
B.变量x与变量y负相关,变量u与变量v正相关,变量x与变量y的线性相关性更强
C.变量x与变量y负相关,变量u与变量v正相关,变量u与变量v的线性相关性更强
D.变量x与变量y正相关,变量u与变量v负相关,变量u与变量v的线性相关性更强
【变式3】对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【变式4】调研某工厂的生产投入(生产工时/天)对产量(件/天)和每件产品的平均能源消耗(千瓦时/件)的影响,得到如下数据:
(生产工时/天)
10
20
30
40
50
60
(件/天)
50
101
149
202
248
301
(千瓦时/件)
19.8
19.1
15.2
14.5
13.0
9.2
现在对与,与分别进行相关性分析,得到相关系数分别为,,则下列判断正确的是( )
A. B. C. D.
【变式5】(多选)观察下列散点图,其中两个变量的相关关系判断一定不正确的是( )
A.图1中y与x呈正相关
B.图2中y与x不相关
C.图3中y与x的线性相关系数小于0
D.图1中y与x的线性相关系数小于图2中y与x的线性相关系数
题型05 相关系数的计算
【典例1】最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
相关系数r的计算公式:
(其中x1,x2,…,xn和y1,y2,…,yn的均值分别为和).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.
【变式1】某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
【变式2】某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
【变式3】深圳欢乐谷试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值.
(2)计算与的相关系数;判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:,.
参考公式:相关系数.若,则与的线性相关性很强.
题型06 变量的相关性与概率的综合应用
【典例1】某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人,它结合了人工智能、语音识别、互动娱乐和教育等内容,且云端内容可以持续更新,旨在通过趣味性和互动性帮助孩子学习和发展.萌宠机器人一投放市场就受到了很多家长欢迎,为了更好的服务广大家长,该公司对萌宠机器人的某个性能指数与孩子的喜爱程度进行统计调查,得到如下数据表:
5
6
7
8
9
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,通过计算变量的相关系数,回答是否可以认为该性能指数与孩子的喜爱程度相关性很强(当时,与相关性很强);
(2)该公司科技人员小李想挑战萌宠机器人,他和机器人比赛答题,他们每人答4个题,若小李答对题数不小于3,则挑战成功.已知小李答对前两道题的概率均为,答对后两道题的概率均为,假设每次答题相互独立,且互不影响,当时,求小李挑战成功的概率的最大值.
参考公式:相关系数
【变式1】全面建成小康社会取得了伟大历史成就,决战脱贫攻坚取得了决定性胜利,某脱贫县实现脱贫奔小康的目标,该县经济委员会积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收.
(1)该县经济委员会为精准了解本地特产广告宣传的导向作用,在购买该县特产的客户中随机抽取300人进行广告宣传作用的调研,对因广告宣传导向而购买该县特产的客户统计结果是:客户群体中青年人约占15%,其中男性为20%;中年人约占50%,其中男性为35%;老年人约占35%,其中男性为55%.以样本估计总体,视频率为概率.
①在所有购买该县特产的客户中随机抽取一名客户,求抽取的客户是男性的概率;
②在所有购买该县特产的客户中随机抽取一名客户是男客户,求他是中年人的概率(精确到0.0001);
(2)该县经济委员会统计了某6至12月这7个月的月广告投入(单位:万元);(单位:万件)的数据如表所示:
月广告投入/万元
1
2
3
4
5
6
7
月销量/万件
28
32
35
45
49
52
60
请根据相关系数说明相关关系的强弱.(若,则认为两个变量有很强的线性相关性,值精确到0.001)
参考数据:.
参考公式:相关系数.
【变式2】近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
【变式3】某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人,它结合了人工智能、语音识别、互动娱乐和教育等内容,且云端内容可以持续更新,旨在通过趣味性和互动性帮助孩子学习和发展.萌宠机器人一投放市场就受到了很多家长欢迎,为了更好的服务广大家长,该公司对萌宠机器人的某个性能指数与孩子的喜爱程度进行统计调查,得到如下数据表:
5
6
7
8
9
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,通过计算变量的相关系数,回答是否可以认为该性能指数与孩子的喜爱程度相关性很强(当时,与相关性很强);
(2)机器人的交互性很强,孩子可以通过输入语音给机器人发布执行指令.机器人执行命令的正确率为,出错率为.当机器人正确执行命令时,使用者满意的概率为;当机器人执行出错时,使用者满意的概率为.如果使用者对某次命令执行结果表示不满意,求机器人实际正确执行命令的概率是多少?
(3)该公司科技人员小李想挑战萌宠机器人,他和机器人比赛答题,他们每人答4个题,若小李答对题数不小于3,则挑战成功.已知小李答对前两道题的概率均为,答对后两道题的概率均为.假设每次答题相互独立,且互不影响,当时,求小李挑战成功的概率的最大值.
参考公式:相关系数.
1.下列各关系不属于相关关系的是( )
A.产品的成本与生产数量 B.球的表面积与体积
C.家庭的支出与收入 D.人的年龄与体重
2.为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
3.下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
4.对两组数据进行统计后得到如图所示的散点图,下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数小于图2相关系数
D.图1相关系数和图2相关系数之和小于0
5.已知甲、乙、丙、丁四组数据变量间对应的样本相关系数分别为-0.92,0.46,0.79,0.85,则( )
A.甲组数据变量间的线性相关程度最强 B.乙组数据变量间的线性相关程度最强
C.丙组数据变量间的线性相关程度最强 D.丁组数据变量间的线性相关程度最强
6.(多选)调研某工厂的生产投入(生产工时/天)对产量(件/天)和每件产品的平均能源消耗(千瓦时/件)的影响,得到如下数据:
(生产工时/天)
10
20
30
40
50
60
(件/天)
50
101
149
202
248
301
(千瓦时/件)
19.8
19.1
15.2
14.5
13.0
9.2
现在对与,与分别进行相关性分析,得到相关系数分别为,,则下列判断正确的是( )
A. B. C. D.
7.(多选)在以下4幅散点图中,对于图中的y和x之间的关系判断正确的是( )
A.图(2)(3)(4)中的y和x之间存在相关关系
B.图(2)(4)中的y和x之间呈现正相关关系
C.图(2)(3)中的y和x之间呈现线性相关关系且(2)的相关性一定比(3)强
D.图(4)中的y和x之间呈现非线性相关关系
8.(多选)对两组数据进行统计后得到如图所示的散点图,下列结论正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数小于图2相关系数
D.图1相关系数和图2相关系数之和小于0
9.(多选)对两组数据进行统计后得到的散点图如图,关于其线性相关系数的结论正确的是( )
A. B. C. D.
10.为利于分层教学,某学校根据学生的情况分成了,,三类,经过一段时间的学习后在三类学生中分别随机抽取了1个学生的5次考试成绩,其统计表如下:
A类
第次
1
2
3
4
5
分数(满分150)
145
83
95
72
110
,;
B类
第次
1
2
3
4
5
分数(满分150)
85
93
90
76
101
,
C类
第次
1
2
3
4
5
分数(满分150)
85
92
101
100
112
,;
经计算已知A,B的相关系数分别为.请计算出C类学生的的相关系数,并通过数据的分析回答抽到的哪类学生学习成绩最稳定(结果保留两位有效数字,越大认为成绩越稳定).
附:相关系数.
11.某食品加工厂新研制出一种袋装食品(规格:500g/袋),下面是近六个月每袋的出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
1
2
3
4
5
6
每袋的出厂价格(元)
10.5
10.9
11
11.5
12
12.5
月销售量(万袋)
2.2
2
1.9
1.8
1.5
1.4
(1)计算该食品加工厂这六个月内这种袋装食品平均每袋的出厂价格、平均月销售量和平均月销售收入;
(2)求每袋的出厂价格与月销售量的样本相关系数(精确到0.01);
(3)若,则认为相关性很强,试判断该食品加工厂研制的袋装食品每袋的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数.
12.春节期间,由于调整免费,车流量逐渐增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表:
车流量/万辆
12
12.5
13
13.5
14
空气质量指数
74
76
78
77
80
(1)在下图中绘制出散点图;
(2)由(1)判断与的线性相关程度,并用相关系数加以说明.
参考公式:相关系数.
参考数据:,,.
13.某食品加工厂新研制出一种袋装食品(规格:500g/袋),下面是近六个月每袋的出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
1
2
3
4
5
6
每袋的出厂价格(元)
10.5
10.9
11
11.5
12
12.5
月销售量(万袋)
2.2
2
1.9
1.8
1.5
1.4
(1)计算该食品加工厂这六个月内这种袋装食品平均每袋的出厂价格、平均月销售量和平均月销售收入;
(2)求每袋的出厂价格与月销售量的样本相关系数(精确到0.01);
(3)若,则认为相关性很强,试判断该食品加工厂研制的袋装食品每袋的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数.
14.某公司是从事无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种无人机性能都很好,但对操控人员的水平要求较高.已知在单位时间内,甲、乙两种无人机操作成功的概率分别为和,假设每次操作成功与否相互独立.
(1)该公司分别收集了甲种无人机在5个不同地点测试的两项指标 ,数据如下表所示:
地点1
地点2
地点3
地点4
地点5
2
4
5
6
8
3
4
4
4
5
试求与之间的相关系数,并利用说明与的线性相关程度.
(若,则线性相关程度较高,否则线性相关程度不高)
(2)操作员连续进行两次无人机的操作,在初次操作时,随机选择这两种无人机中的一种,若初次操作成功,则第二次继续使用该种无人机,若初次操作不成功,则第二次使用另一种无人机进行操作,求操作成功的次数的数学期望.
附.
2 / 19
学科网(北京)股份有限公司
$