专题8.1 成对数据的相关分析(高效培优讲义)数学沪教版选择性必修第二册
2026-02-28
|
2份
|
47页
|
274人阅读
|
16人下载
精品
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学沪教版选择性必修第二册 |
| 年级 | 高二 |
| 章节 | 8.1 成对数据的相关分析 |
| 类型 | 教案-讲义 |
| 知识点 | 统计,统计案例 |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 5.14 MB |
| 发布时间 | 2026-02-28 |
| 更新时间 | 2026-02-28 |
| 作者 | 热爱数学者 |
| 品牌系列 | 学科专项·举一反三 |
| 审核时间 | 2026-02-28 |
| 下载链接 | https://m.zxxk.com/soft/56598856.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
专题8.1 成对数据的相关分析
教学目标
1.了解变量间的相关关系。
2.了解样本相关系数的概念及公式。
教学重难点
1.重点
(1)能根据散点图,判断两个变量是否具有相关关系;
2.难点
(1)会判断两个变量相关性的强弱;
知识点01 成对数据间的关系
一、成对数据与相关分析
把这样来自同一对象的两组数据称为成对数据;研究成对数据相关性的方法称为相关分析.
相关关系与函数关系的异同点
函数关系
相关关系
相同点
都是两个变量间的关系
不同点
是一种确定关系
是一种非确定关系
是一种因果关系
不一定是因果关系,也可能是伴随关系
二、散点图与变量的相关关系
(1)散点图:为直观地描述成对样本数据中两个变量间的关系,用横轴表示其中的一个变量,纵轴表示另一个变量,则成对样本数据都可以用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)散点图的作用
如果散点图中变量的对应点分布在某条曲线的附近,我们就可以得出结论:这两个变量具有相关性,如图(1)(2).如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关性,如图(3).
(3)正相关与负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
(4)线性相关与曲线相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
【即学即练】
1.下列关系中,是因果关系的为( )
A.学生的学习态度与学习成绩之间的关系
B.教师的教学水平与学生的学习成绩之间的关系
C.学生的身高与学生的学习成绩之间的关系
D.家庭的经济条件与学生的学习成绩之间的关系
【答案】B
【分析】由两个变量的相关关系与因果关系的定义,结合各项描述理解判断.
【详解】A:学生的学习态度与学习成绩之间不是因果关系,但具有相关性,不是因果关系;
B:教师的教学水平与学生的学习成绩之间的关系是因果关系;
C,D:学生的身高与学生的学习成绩、家庭的经济条件与学生的学习成绩都不是因果关系.
故选:B
知识点02 相关系数
样本相关系数
(1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多.
(2)样本相关系数r=.
(3)样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
【特别提醒】 样本相关系数r是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征:
当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关;
当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系.
当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
【即学即练】
2.最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
【答案】A
【分析】根据相关系数公式计算即可求解.
【详解】,,
,
.
故选:A.
题型01 判断两个变量是否有相关关系
【典例1】下列变量之间的关系不是相关关系的是( )
A.光照时间和果树亩产量 B.降雪量和交通事故发生率
C.每亩田施肥量和粮食亩产量 D.圆的面积和半径
【答案】D
【分析】利用两变量相关关系的意义判断即可.
【详解】列表解析
选项
是否是相关关系
原因
A
是
果树亩产量与光照时间有关,是相关关系.
B
是
降雪量的大小对交通事故发生率有影响,是相关关系.
C
是
粮食亩产量与每亩田施肥量有关,是相关关系.
D
否
圆的面积S和半径r是函数关系.
故选:D.
【变式1-1】相关数据显示,截至2022年12月,全国地级以上城市PM2.5平均浓度同比下降.下表是某地区2015-2022年PM2.5年均浓度(单位:微克/立方米)的数据:
年份
2015
2016
2017
2018
2019
2020
2021
2022
年份代码
1
2
3
4
5
6
7
8
年均浓度
97
95
86.7
79
62
53
42
31
下面四个函数模型中最适宜作为年均浓度和年份代码的函数类型是( )
A. B. C. D.
【答案】B
【分析】绘制散点图,结合图象可得答案.
【详解】
根据表中数据可绘制散点图,结合选项可知最符合的函数类型为开口向下的二次函数.
故选:B.
【变式1-2】已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩散点图对应如图:
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数为 .
【答案】1
【分析】由散点图知两变量间是相关关系,不是函数关系;利用概率的知识进行预测,得到的结论有一定的随机性.
【详解】对于①,根据散点图知,各点分布在一条直线附近,两变量间是线性相关关系,①正确;
对于②,根据散点图知,两变量不是确定的一次函数关系,②错误;
对于③,利用概率的知识进行预测,得到的结论有一定的随机性,③错误,
所以正确的个数为1.
故答案为:1
【变式1-3】在下列各图中,两个变量具有相关关系的是( ).
A.①② B.①③ C.② D.②③
【答案】D
【分析】根据函数关系和相关关系的概念,结合图象作出判断.
【详解】对于①,所有的点都在曲线上,具有函数关系;
对于②,所有的散点分布在一条直线附近,具有相关关系:
对于③,所有的散点分布在一条曲线附近,具有相关关系;
对于④,所有的散点杂乱无章,不具有相关关系,
故选:D.
题型02 判断变量间正负相关性
【典例2】观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
【答案】D
【分析】根据散点图中点的分布特征,结合相关性的定义,即可得出结论.
【详解】根据散点图,由相关性可知:图a各点散布在从左下角到右上角的区域里,是正相关;
图b中各点分布不成带状,相关性不明确,所以不相关;
图c中各点分布在从左上方到右下方的区域里,是负相关.
故选:D
【变式2-1】某校地理小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图,则下列说法不正确的是( )
A.气压与海拔高度呈正相关 B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关 D.沸点与海拔高度、沸点与气压的相关性都很强
【答案】A
【分析】利用散点图的规律分析气压与高度、沸点与气压、沸点与海拔高度的相关性即可判定.
【详解】由图1知气压随海拔高度的增加而减小,由图2知沸点随气压的升高而升高,
所以气压与海拔高度呈负相关,沸点与气压呈正相关,沸点与海拔高度呈负相关.
由于两个散点图中的点都呈线性分布,
所以沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.
故选:A.
【变式2-2】对两组数据进行统计后得到如图所示的散点图,下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数小于图2相关系数
D.图1相关系数和图2相关系数之和小于0
【答案】C
【分析】根据散点图及相关性判断AB,由相关系数性质判断CD.
【详解】对A,因为散点图都呈直线型,所以图1、图2两组数据都具有线性相关关系,A正确;
对B,图1散点从左至右呈上升趋势,所以数据正相关,图2散点从左至右呈下降趋势,所以数据负相关,故B正确;
对C,图1正相关,图2负相关,所以C不正确;
对D,因为图2相关程度更强,所以D正确.
故选:C.
【变式2-3】某市居民2015~2019年家庭年平均收入(单位:万元)与年平均支出(单位:万元)的统计资料如下表所示:
年份
2015
2016
2017
2018
2019
收入
11.5
12.1
13
13.3
15
支出
6.8
8.8
9.8
10
12
根据统计资料,家庭年平均收入与年平均支出有 相关关系(选填“正”或“负”).
【答案】正
【分析】描出散点图从图上直观看直线的斜率,即可判断.
【详解】由题可得散点图,
从图上直观看出直线的斜率为正,则为正线性相关.
故答案为:正
题型03 计算相关系数
【典例3】一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
【答案】D
【分析】运用相关系数公式进行求解即可.
【详解】因为,,所以,
,
故选:D.
【变式3-1】某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数 .(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
【答案】
【分析】根据表中数据求出,进而得出的值,代入公式计算即可得出答案.
【详解】由已知可得,,
,
则,
,
所以,.
故答案为:.
【变式3-2】2025年11月份,全国工业生产者出厂价格同比下降,环比下降.某企业在了解市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制定相应的出厂价格.该企业统计了2025年1-10月份产品的生产数量与销售总额之间的关系,如下表所示.
万件
2.08
2.12
2.19
2.28
2.36
2.48
2.59
2.68
2.80
2.87
万元
42.5
43.7
44.0
45.5
46.4
47.5
49.2
50.3
51.4
52.6
(1)计算的值;
(2)计算样本相关系数的值,并通过的值的大小说明与之间的相关程度.
【答案】(1)
(2),与之间具有很强的相关性
【分析】(1)由平均数的计算公式得到和;
(2)由相关系数的计算公式计算,再由判断相关性.
【详解】(1)依题意,
(2)依题意,,,,
所以,
因为,所以与之间具有很强的相关性.
【变式3-3】直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,为此该公司统计了2024年前5个月的带货金额如下表(金额y/万元):
月份
1月
2月
3月
4月
5月
月份编号x
1
2
3
4
5
金额y/万元
7
12
13
19
24
并计算得,,.
(1)求该公司带货金额的平均值;
(2)求该公司带货金额y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有较强的线性相关关系(若,则线性相关性较强,否则认为线性相关性较弱).
附:相关系数,.
【答案】(1)15
(2),与具有较强的线性相关性
【分析】(1)由均值公式直接计算;
(2)由相关系数公式计算后可得结论.
【详解】(1)由数据可得,
(2)由于,,,所以相关系数,
因此与具有较强的线性相关性.
题型04 相关系数的意义及辨析
【典例4】对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
【答案】D
【分析】根据散点图的分布的趋势和集中程度可得正确的选项.
【详解】对于图1,散点总体斜向上分布,故变量与呈现正相关,故排除B;
对于图2,散点总体斜向上分布,故变量与呈现负相关,故排除C;
图1中散点图分布较为集中,图2中的散点图分布较为分散,故,
故选:D.
【变式4-1】对两个变量x,y进行线性相关性检验,得线性相关系数,对两个变量u,v进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量x与变量y正相关,变量u与变量v负相关,变量x与变量y的线性相关性更强
B.变量x与变量y负相关,变量u与变量v正相关,变量x与变量y的线性相关性更强
C.变量x与变量y负相关,变量u与变量v正相关,变量u与变量v的线性相关性更强
D.变量x与变量y正相关,变量u与变量v负相关,变量u与变量v的线性相关性更强
【答案】D
【分析】根据相关系数的正负判断正负相关,并根据相关系数绝对值大小得到相关性强弱.
【详解】由线性相关系数知x与y正相关,
由线性相关系数知u与v负相关,
又,所以变量u与变量v的线性相关性比变量x与变量y的线性相关性更强.
故选:D
【变式4-2】下面命题中说法正确的是 .
①设两个变量之间的线性相关系数为,则越大,的相关性越强;
②等高堆积条形图可以直观的反映一对分类变量之间是否具有关联性;
③如果散点图的散点都落在一条直线上,则;
④正方形的面积与周长是相关关系.
【答案】①②③
【分析】由相关系数、等高堆积条形图和决定系数的性质判断①②③,由相关关系的定义判断④.
【详解】越大,的相关性越强,①正确;
与表格相比,等高堆积条形图可以展示列联表数据的频率特征,能够直观地反映出两个分类变量间是否相互影响,②正确;
若散点图的散点都落在一条直线上,残差平方和为0,,③正确;
正方形的面积与周长是函数关系,④错误.
故答案为:①②③.
【变式4-3】已知为随机变量X和Y的样本相关系数,为随机变量M和N的样本相关系数,则下列说法正确的是( )
A.若,则X和Y负相关
B.若,则M和N线性不相关
C.若,,则X和Y的线性相关程度比M和N的线性相关程度强
D.若越接近1,则M和N的线性相关程度越弱
【答案】B
【分析】利用,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱,结合每个选项的条件逐项判断即可.
【详解】A,若,则X和Y正相关,故A错误;
B,若,则M和N线性不相关,故B正确;
C,若,,则,
所以X和Y的线性相关程度比M和N的线性相关程度弱,故C错误;
D,若越接近1,则M和N的线性相关程度越强,故D错误.
故选:B
题型05 相关系数与概率结合的问题
【典例5】某县博物馆国庆期间统计连续5天进入该博物馆参观的游客人数(单位:千人)如下:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
第x天
1
2
3
4
5
参观人数y
2.3
3.1
4.3
4.6
5.7
(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明(保留小数点后两位);(若,则认为y与x的线性相关性很强),并求出y关于x的线性回归方程;
(2)国庆五天假期博物馆开放1号门、2号门和3号门供游客出入,游客从1号门、2号门和3号门进入博物馆的概率分别为,且出馆与进馆选择相同门的概率为,选择与进馆不同两门的概率各为.假设游客从1号门、2号门、3号门出入博物馆互不影响,现有甲、乙、丙、丁4名游客于10月2日进馆参观,设X为4人中从2号门出馆的人数,求X的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
【答案】(1)说明见解析,
(2)分布列见解析,,.
【分析】(1)由参考公式结合题目数据可得相关系数及回归直线方程;
(2)由全概率公式可得一人从2号门出馆的概率为,据此可得,及分布列,期望,方差.
【详解】(1)依题意,,
而,,,
则.
因为时,线性相关程度高,所以与线性相关性很强,
可以用线性回归模型拟合.
因此,回归方程为.
(2)记“甲从2号门出馆”为事件A,“甲从1号门进馆”为事件B,
“甲从2号门进馆”为事件C,“甲从3号门进馆”为事件D.
由题意可得,,,
,.
由全概率公式得:
.
同理乙、丙、丁从号门出馆的概率也为,
为人中从号门出馆的人数,则,
,,
,,
,
故X的分布列为:
,.
【变式5-1】某公司是从事无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种无人机性能都很好,但对操控人员的水平要求较高.已知在单位时间内,甲、乙两种无人机操作成功的概率分别为和,假设每次操作成功与否相互独立.
(1)该公司分别收集了甲种无人机在5个不同地点测试的两项指标,数据如下表所示:
地点1
地点2
地点3
地点4
地点5
2
4
5
6
8
3
4
4
4
5
试求与之间的相关系数,并利用说明与的线性相关程度.
(若,则线性相关程度较高,否则线性相关程度不高)
(2)操作员连续进行两次无人机的操作,在初次操作时,随机选择这两种无人机中的一种,若初次操作成功,则第二次继续使用该种无人机,若初次操作不成功,则第二次使用另一种无人机进行操作,求操作成功的次数的数学期望.
附.
【答案】(1),线性相关程度较高
(2)
【分析】(1)根据相关系数公式,求出相关系数,再根据系数大小判断相关程度高不高.
(2)根据独立事件的乘法公式,求出分布列,求出期望.
【详解】(1)由题可知,
,
,
则相关系数,
因为,所以与的线性相关程度较高.
(2)设操作成功的次数为,则的所有可能取值为0,1,2.
,
,
,
所以.
【变式5-2】某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人,它结合了人工智能、语音识别、互动娱乐和教育等内容,且云端内容可以持续更新,旨在通过趣味性和互动性帮助孩子学习和发展.萌宠机器人一投放市场就受到了很多家长欢迎,为了更好的服务广大家长,该公司对萌宠机器人的某个性能指数与孩子的喜爱程度进行统计调查,得到如下数据表:
5
6
7
8
9
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,通过计算变量的相关系数,回答是否可以认为该性能指数与孩子的喜爱程度相关性很强(当时,与相关性很强);
(2)机器人的交互性很强,孩子可以通过输入语音给机器人发布执行指令.机器人执行命令的正确率为,出错率为.当机器人正确执行命令时,使用者满意的概率为;当机器人执行出错时,使用者满意的概率为.如果使用者对某次命令执行结果表示不满意,求机器人实际正确执行命令的概率是多少?
(3)该公司科技人员小李想挑战萌宠机器人,他和机器人比赛答题,他们每人答4个题,若小李答对题数不小于3,则挑战成功.已知小李答对前两道题的概率均为,答对后两道题的概率均为.假设每次答题相互独立,且互不影响,当时,求小李挑战成功的概率的最大值.
参考公式:相关系数.
【答案】(1),可以认为该性能指数与孩子的喜爱程度相关性很强
(2)
(3)
【分析】(1)利用公式求出即可判断;
(2)根据全概率公式及条件概率公式求解即可;
(3)根据题意表示出小李挑战成功的概率为,再结合基本不等式及二次函数的知识求解即可.
【详解】(1)由表知,,
,
,
,
,
则,
由此可以认为该性能指数与孩子的喜爱程度相关性很强.
(2)设事件为机器人执行命令正确”,事件为“机器人执行命令错误”,
事件为“使用者不满意”,
则,,
,,
则,
所以.
(3)当小李答对题数为3时,概率为:
,
当小李答对题数为4时,概率为:,
所以小李挑战成功的概率为:,
由,,,
则,当且仅当时等号成立,
所以,由二次函数的知识可知,
当时,小李挑战成功的概率最大,最大为.
【变式5-3】某购物平台为了吸引更多的顾客在线购物,推出了和两个套餐服务,并在购物平台上推出了优惠券活动,顾客可自由选择和两个套餐之一,下图是该购物平台7天销售优惠券的情况(单位:千张)的折线图:
(1)由折线图可看出,可用回归模型拟合与的关系,请用相关系数加以说明;
(2)假设每位顾客选择套餐的概率为,选择套餐的概率为,其中包含一张优惠券,套餐包含两张优惠券,截止某一时刻,该平台恰好销售了张优惠券,设其概率为,求;
(3)记(2)中所得概率的值构成数列,求数列的最值.
参考数据:,,,
参考公式:相关系数
【答案】(1)答案见解析
(2)
(3)最大值为,最小值为.
【分析】(1)根据折线图中数据和附注中参考数据可计算相关系数;
(2)根据题意得,由递推关系可得等比数列,利用等比数列的前项和公式计算即可;
(3)利用指数函数的单调性和极限思想可求最值.
【详解】(1)由折线图中数据和附注中参考数据得,,,
,
所以相关系数,
因为与的相关系数近似为0.9632,说明与的相关程度相当高,从而可以用线性回归模型拟合与的关系.
(2)依题意得,,其中,,
则,
所以是以首项为,公比为的等比数列,
故成立,
则有,
所以,又,
则.
(3)当为偶数时,,单调递减,最大值为,,
当为奇数时,,单调递增,最小值为,,
所以数列的最大值为,最小值为.
一、单选题
1.下列说法中正确的是( )
A.中的,是具有相关关系的两个变量
B.正四面体的体积与其棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.某地区感染流感人数与外来流感患者人数是具有相关关系的两个变量
【答案】D
【分析】对于,,是函数关系;对于,体积与棱长的关系是确定的,属于确定性关系;对于,电脑的销售量受多种因素的影响不是确定关系,对于,两个变量是相关关系.
【详解】对于,,是函数关系,属于确定性关系,不是相关关系,故不正确;
对于,体积与棱长的关系是确定的,属于确定性关系,不是相关关系,故不正确;
对于,电脑的销售量除了受电脑价格的影响之外,还受电脑品牌,电脑性能,同行竞争等多种因素的影响,不是确定关系,故不正确;
对于,某地区感染流感人数与外来流感患者人数是具有相关关系的两个变量,故正确.
故选:.
2.在下列各图中,两个变量具有线性相关关系的图是( )
A. B.
C. D.
【答案】C
【分析】根据题意结合线性相关关系的概念逐项分析判断.
【详解】对于选项A:两个变量为函数关系,不是线性相关关系,所以A错误;
对于选项B:所有点不是在一条直线附近波动,不是线性相关关系,故B错误;
对于选项C:对于两个变量x,y,y随着x的增加而减少,
且所有点都在一条直线附近波动,所以具有线性相关关系,故C正确;
对于选项D:两个变量不具有相关性,故D错误.
故选:C.
3.上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制了如下的散点图,则下述大小关系正确的为( ).
A. B. C. D.
【答案】C
【分析】根据散点图判断两变量的线性相关性,再根据线性相关性与相关系数的关系判断即可.
【详解】由散点图可知,图一两个变量成正相关,且线性相关性较强,故,
图二、图三两个变量都成负相关,且图二的线性相关性更强,
故,,,故,所以.
故选:C.
4.下列说法不正确的是( )
A.数据4,1,6,2,9,5,8的第60百分位数为6
B.设一组样本数据的方差为2,则数据的方差为32
C.设且,则
D.两个随机变量的线性相关性越强,相关系数的绝对值越接近于1
【答案】C
【分析】根据百分位数计算规则判断A,根据方差的性质判断B,根据正态分布的性质判断C,根据相关系数的定义判断D.
【详解】对于A:将数据从小到大排列为:1,2,4,5,6,8,9,
又,所以第60百分位数为,故A正确;
对于B:因为一组样本数据的方差为,
则数据的方差为,故B正确;
对于C:因为且,
所以,
则,故C错误;
对于D:两个随机变量的线性相关性越强,相关系数的绝对值越接近于,故D正确.
故选:C
5.某市环保部门研究近十年空气质量数据,得到以下结论:
结论一:PM2.5浓度与机动车保有量的样本相关系数;
结论二:绿化覆盖率与呼吸道疾病发病率的样本相关系数;
结论三:工业能耗与近地面臭氧浓度的样本相关系数.
下列说法正确的是( )
A.由结论一可知,机动车保有量增加是PM2.5浓度升高的直接原因
B.由结论二可知,绿化覆盖率与呼吸道疾病发病率无关联
C.结论三表明工业能耗与近地面臭氧浓度呈正相关,且线性相关性比结论一更强
D.结论一中接近1,说明PM2.5浓度与机动车保有量存在极强的线性相关关系
【答案】D
【分析】根据相关系数的性质即可结合选项逐一求解.
【详解】由,可知PM2.5浓度与机动车保有量存在极强的线性相关关系,但并不能说明机动车保有量增加是PM2.5浓度升高的直接原因,故A错误,D正确;
由于,,则表明工业能耗与近地面臭氧浓度呈正相关,但线性相关性没有结论一的强,故C错误,
由,可知绿化覆盖率与呼吸道疾病发病率呈负相关,相关性不是很强,但不能说绿化覆盖率与呼吸道疾病发病率无关联,故B错误,
故选:D
二、填空题
6.如题图所示,有组数据的散点图,去掉 组数据后,剩下的4组数据的相关程度可能最高.
【答案】
【分析】根据线性相关的意义,结合图形分析即得解.
【详解】、、、四点分布在一条直线附近且贴近某一直线,点离得远.
去掉点剩下的4组数据的线性相关性最大,所以应该去掉.
故答案为:
21.下列关系中是相关关系的是 (填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
【答案】②③
【分析】根据相关关系是一种不确定的关系,是两个变量之间确实存在的关系,由此判断即可.
【详解】对于①,曲线上的点与该点的坐标之间的关系是一一对应关系,不是相关关系,是确定性关系;
对于②,苹果的产量与气候之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于③,森林中的同一种树木,其断面直径与高度之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于④,学生与他(她)的学号之间的关系是一种确定的对应关系,是映射,不是相关关系.
故答案为:②③
7.已知,,,,则相关系数 .(相关系数)
【答案】
【分析】应用相关系数公式及已知数据求相关系数.
【详解】由题设,有.
故答案为:.
8.对四组不同的数据进行统计,获得如题图所示的散点图,则样本相关系数从小到大依次为 .
【答案】
【分析】根据散点图直接观察比较即可.
【详解】由散点图可知图(1)与图(3)中的两个变量是正相关,故,.
图(2)与图(4)中的两个变量是负相关,故,.
又图(1)与图(2)中的样本点集中在一条直线附近,所以其相关系数的绝对值越接近1.
故答案为:.
三、解答题
9.某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
【答案】(1)13;11
(2)
(3)可以用线性回归模型拟合与之间的关系,理由见解析
【分析】(1)根据已知数据直接求平均值即可;
(2)分别求出和,再代入公式即可求解;
(3)根据相关系数的绝对值大于0.75且非常接近1判断即可.
【详解】(1)由题可知,;
(2)计算得,
故;
(3)由(2)可知,与的相关系数的绝对值近似为0.992,大于0.75且非常接近1,
说明与的线性相关性很强,从而可以用线性回归模型拟合与之间的关系.
10.春节期间,由于高速免费,车流量逐步增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表所示:
车流量x(万辆)
12
12.5
13
13.5
14
空气质量指数y
74
76
78
77
80
(1)在下列网格纸中绘制出散点图;
(2)观察散点图的趋势,如果能看成线性关系,请在图中画出一条直线来近似地表示这种关系,并计算车流量与空气质量指数的相关系数.
【答案】(1)画图见解析
(2)画图见解析,
【分析】(1)根据表里数据标点即可;
(2)根据公式计算相关系数;
【详解】(1)
(2)可以看成线性关系,如图所示,
计算得:,
;
,
;
则.
11.某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投1的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
【答案】(1)(万元)
(2)
(3)采用分层抽样,理由见解析
【分析】(1)利用样本平均数的计算公式求解即可,(2)利用样本平均数的计算公式求解即可.(3)结合题意根据调查总体的分布特征选择分层抽样进行调查即可.
【详解】(1)该地被调查村的村户年平均收入的估计值为(万元);
(2)样本的相关系数为
;
(3)采用分层抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地更准确的验收估计.
12.为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)做好记录.下表是检验员在一天内依次抽取的16个零件的尺寸:经计算得,,
,,其中为抽取的第个零件的尺寸().
抽取次序
1
2
3
4
5
6
7
8
零件尺寸(cm)
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸(cm)
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
(1)求()的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检的零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(3)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
【答案】(1)可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小
(2)需对当天的生产过程进行检查
(3)均值;标准差.
【分析】(1)由样本数据得相关系数,验证是否成立,然后得结论;
(2)由求得,即可得到得结论;
(3)剔除离群值,求剩下数据的平均值,即求得这条生产线当天生产的零件尺寸的均值的估计值.由得,即可求出剔除第13个数据,剩下数据的样本方差,即求得这条生产线当天生产的零件尺寸的标准差的估计值.
【详解】(1)由样本数据得相关系数:
.
,可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)∵,,∴,,
抽取的第13个零件的尺寸在以外,
需对当天的生产过程进行检查.
(3)剔除离群值,即第13个数据,
剩下数据的平均数为,
即这条生产线当天生产的零件尺寸的均值的估计值为;
由得:,
剔除第13个数据,剩下数据的样本方差为,
样本标准差为,
即这条生产线当天生产的零件尺寸的标准差的估计值为.
13.随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,.
(1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度;
(2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列.
附:相关系数.
【答案】(1),相关性强
(2)分布列见解析
【分析】(1)由条件结合相关系数公式求出相关系数,根据相关系数性质判断结论;
(2)由条件确定的可能取值,再求取各值的概率,由此可得其分布列.
【详解】(1)样本的相关系数为
.
由于相关系数,则相关性很强,的值越大,相关性越强.
故,故销售金额和月份编号成很强的正相关性.
(2)由题意得:的可能取值为0,1,2,
20个月中有8个月的销售金额低于平均数,有12个月的销售金额不低于平均数,
所以,
所以的分布列为:
0
1
2
14.深圳欢乐谷试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值.
(2)计算与的相关系数;判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:,.
参考公式:相关系数.若,则与的线性相关性很强.
【答案】(1),
(2),可以用线性回归模型拟合与之间的关系,理由见解析
【分析】(1)根据已知数据直接求平均值即可;
(2)分别求出和,再代入公式即可求解,再根据相关系数的绝对值大于0.75且非常接近1判断即可.
【详解】(1)由题可知,;
(2)因为,
,
故;
因为与的相关系数的绝对值近似为,大于且非常接近,
说明与的线性相关性很强,从而可以用线性回归模型拟合与之间的关系.
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$
专题8.1 成对数据的相关分析
教学目标
1.了解变量间的相关关系。
2.了解样本相关系数的概念及公式。
教学重难点
1.重点
(1)能根据散点图,判断两个变量是否具有相关关系;
2.难点
(1)会判断两个变量相关性的强弱;
知识点01 成对数据间的关系
一、成对数据与相关分析
把这样来自同一对象的两组数据称为成对数据;研究成对数据相关性的方法称为相关分析.
相关关系与函数关系的异同点
函数关系
相关关系
相同点
都是两个变量间的关系
不同点
是一种确定关系
是一种非确定关系
是一种因果关系
不一定是因果关系,也可能是伴随关系
二、散点图与变量的相关关系
(1)散点图:为直观地描述成对样本数据中两个变量间的关系,用横轴表示其中的一个变量,纵轴表示另一个变量,则成对样本数据都可以用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)散点图的作用
如果散点图中变量的对应点分布在某条曲线的附近,我们就可以得出结论:这两个变量具有相关性,如图(1)(2).如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关性,如图(3).
(3)正相关与负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
(4)线性相关与曲线相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
【即学即练】
1.下列关系中,是因果关系的为( )
A.学生的学习态度与学习成绩之间的关系
B.教师的教学水平与学生的学习成绩之间的关系
C.学生的身高与学生的学习成绩之间的关系
D.家庭的经济条件与学生的学习成绩之间的关系
知识点02 相关系数
样本相关系数
(1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多.
(2)样本相关系数r=.
(3)样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
【特别提醒】 样本相关系数r是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征:
当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关;
当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系.
当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
【即学即练】
2.最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
题型01 判断两个变量是否有相关关系
【典例1】下列变量之间的关系不是相关关系的是( )
A.光照时间和果树亩产量 B.降雪量和交通事故发生率
C.每亩田施肥量和粮食亩产量 D.圆的面积和半径
【变式1-1】相关数据显示,截至2022年12月,全国地级以上城市PM2.5平均浓度同比下降.下表是某地区2015-2022年PM2.5年均浓度(单位:微克/立方米)的数据:
年份
2015
2016
2017
2018
2019
2020
2021
2022
年份代码
1
2
3
4
5
6
7
8
年均浓度
97
95
86.7
79
62
53
42
31
下面四个函数模型中最适宜作为年均浓度和年份代码的函数类型是( )
A. B. C. D.
【变式1-2】已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩散点图对应如图:
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数为 .
【变式1-3】在下列各图中,两个变量具有相关关系的是( ).
A.①② B.①③ C.② D.②③
题型02 判断变量间正负相关性
【典例2】观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
【变式2-1】某校地理小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图,则下列说法不正确的是( )
A.气压与海拔高度呈正相关 B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关 D.沸点与海拔高度、沸点与气压的相关性都很强
【变式2-2】对两组数据进行统计后得到如图所示的散点图,下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数小于图2相关系数
D.图1相关系数和图2相关系数之和小于0
【变式2-3】某市居民2015~2019年家庭年平均收入(单位:万元)与年平均支出(单位:万元)的统计资料如下表所示:
年份
2015
2016
2017
2018
2019
收入
11.5
12.1
13
13.3
15
支出
6.8
8.8
9.8
10
12
根据统计资料,家庭年平均收入与年平均支出有 相关关系(选填“正”或“负”).
题型03 计算相关系数
【典例3】一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
【变式3-1】某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数 .(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
【变式3-2】2025年11月份,全国工业生产者出厂价格同比下降,环比下降.某企业在了解市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制定相应的出厂价格.该企业统计了2025年1-10月份产品的生产数量与销售总额之间的关系,如下表所示.
万件
2.08
2.12
2.19
2.28
2.36
2.48
2.59
2.68
2.80
2.87
万元
42.5
43.7
44.0
45.5
46.4
47.5
49.2
50.3
51.4
52.6
(1)计算的值;
(2)计算样本相关系数的值,并通过的值的大小说明与之间的相关程度.
【变式3-3】直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,为此该公司统计了2024年前5个月的带货金额如下表(金额y/万元):
月份
1月
2月
3月
4月
5月
月份编号x
1
2
3
4
5
金额y/万元
7
12
13
19
24
并计算得,,.
(1)求该公司带货金额的平均值;
(2)求该公司带货金额y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有较强的线性相关关系(若,则线性相关性较强,否则认为线性相关性较弱).
附:相关系数,.
题型04 相关系数的意义及辨析
【典例4】对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
【变式4-1】对两个变量x,y进行线性相关性检验,得线性相关系数,对两个变量u,v进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量x与变量y正相关,变量u与变量v负相关,变量x与变量y的线性相关性更强
B.变量x与变量y负相关,变量u与变量v正相关,变量x与变量y的线性相关性更强
C.变量x与变量y负相关,变量u与变量v正相关,变量u与变量v的线性相关性更强
D.变量x与变量y正相关,变量u与变量v负相关,变量u与变量v的线性相关性更强
【变式4-2】下面命题中说法正确的是 .
①设两个变量之间的线性相关系数为,则越大,的相关性越强;
②等高堆积条形图可以直观的反映一对分类变量之间是否具有关联性;
③如果散点图的散点都落在一条直线上,则;
④正方形的面积与周长是相关关系.
【变式4-3】已知为随机变量X和Y的样本相关系数,为随机变量M和N的样本相关系数,则下列说法正确的是( )
A.若,则X和Y负相关
B.若,则M和N线性不相关
C.若,,则X和Y的线性相关程度比M和N的线性相关程度强
D.若越接近1,则M和N的线性相关程度越弱
题型05 相关系数与概率结合的问题
【典例5】某县博物馆国庆期间统计连续5天进入该博物馆参观的游客人数(单位:千人)如下:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
第x天
1
2
3
4
5
参观人数y
2.3
3.1
4.3
4.6
5.7
(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明(保留小数点后两位);(若,则认为y与x的线性相关性很强),并求出y关于x的线性回归方程;
(2)国庆五天假期博物馆开放1号门、2号门和3号门供游客出入,游客从1号门、2号门和3号门进入博物馆的概率分别为,且出馆与进馆选择相同门的概率为,选择与进馆不同两门的概率各为.假设游客从1号门、2号门、3号门出入博物馆互不影响,现有甲、乙、丙、丁4名游客于10月2日进馆参观,设X为4人中从2号门出馆的人数,求X的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
【变式5-1】某公司是从事无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种无人机性能都很好,但对操控人员的水平要求较高.已知在单位时间内,甲、乙两种无人机操作成功的概率分别为和,假设每次操作成功与否相互独立.
(1)该公司分别收集了甲种无人机在5个不同地点测试的两项指标,数据如下表所示:
地点1
地点2
地点3
地点4
地点5
2
4
5
6
8
3
4
4
4
5
试求与之间的相关系数,并利用说明与的线性相关程度.
(若,则线性相关程度较高,否则线性相关程度不高)
(2)操作员连续进行两次无人机的操作,在初次操作时,随机选择这两种无人机中的一种,若初次操作成功,则第二次继续使用该种无人机,若初次操作不成功,则第二次使用另一种无人机进行操作,求操作成功的次数的数学期望.
附.
【变式5-2】某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人,它结合了人工智能、语音识别、互动娱乐和教育等内容,且云端内容可以持续更新,旨在通过趣味性和互动性帮助孩子学习和发展.萌宠机器人一投放市场就受到了很多家长欢迎,为了更好的服务广大家长,该公司对萌宠机器人的某个性能指数与孩子的喜爱程度进行统计调查,得到如下数据表:
5
6
7
8
9
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,通过计算变量的相关系数,回答是否可以认为该性能指数与孩子的喜爱程度相关性很强(当时,与相关性很强);
(2)机器人的交互性很强,孩子可以通过输入语音给机器人发布执行指令.机器人执行命令的正确率为,出错率为.当机器人正确执行命令时,使用者满意的概率为;当机器人执行出错时,使用者满意的概率为.如果使用者对某次命令执行结果表示不满意,求机器人实际正确执行命令的概率是多少?
(3)该公司科技人员小李想挑战萌宠机器人,他和机器人比赛答题,他们每人答4个题,若小李答对题数不小于3,则挑战成功.已知小李答对前两道题的概率均为,答对后两道题的概率均为.假设每次答题相互独立,且互不影响,当时,求小李挑战成功的概率的最大值.
参考公式:相关系数.
【变式5-3】某购物平台为了吸引更多的顾客在线购物,推出了和两个套餐服务,并在购物平台上推出了优惠券活动,顾客可自由选择和两个套餐之一,下图是该购物平台7天销售优惠券的情况(单位:千张)的折线图:
(1)由折线图可看出,可用回归模型拟合与的关系,请用相关系数加以说明;
(2)假设每位顾客选择套餐的概率为,选择套餐的概率为,其中包含一张优惠券,套餐包含两张优惠券,截止某一时刻,该平台恰好销售了张优惠券,设其概率为,求;
(3)记(2)中所得概率的值构成数列,求数列的最值.
参考数据:,,,
参考公式:相关系数
一、单选题
1.下列说法中正确的是( )
A.中的,是具有相关关系的两个变量
B.正四面体的体积与其棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.某地区感染流感人数与外来流感患者人数是具有相关关系的两个变量
2.在下列各图中,两个变量具有线性相关关系的图是( )
A. B. C. D.
3.上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制了如下的散点图,则下述大小关系正确的为( ).
A. B. C. D.
4.下列说法不正确的是( )
A.数据4,1,6,2,9,5,8的第60百分位数为6
B.设一组样本数据的方差为2,则数据的方差为32
C.设且,则
D.两个随机变量的线性相关性越强,相关系数的绝对值越接近于1
5.某市环保部门研究近十年空气质量数据,得到以下结论:
结论一:PM2.5浓度与机动车保有量的样本相关系数;
结论二:绿化覆盖率与呼吸道疾病发病率的样本相关系数;
结论三:工业能耗与近地面臭氧浓度的样本相关系数.
下列说法正确的是( )
A.由结论一可知,机动车保有量增加是PM2.5浓度升高的直接原因
B.由结论二可知,绿化覆盖率与呼吸道疾病发病率无关联
C.结论三表明工业能耗与近地面臭氧浓度呈正相关,且线性相关性比结论一更强
D.结论一中接近1,说明PM2.5浓度与机动车保有量存在极强的线性相关关系
二、填空题
6.如题图所示,有组数据的散点图,去掉 组数据后,剩下的4组数据的相关程度可能最高.
21.下列关系中是相关关系的是 (填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
7.已知,,,,则相关系数 .(相关系数)
8.对四组不同的数据进行统计,获得如题图所示的散点图,则样本相关系数从小到大依次为 .
三、解答题
9.某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
10.春节期间,由于高速免费,车流量逐步增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表所示:
车流量x(万辆)
12
12.5
13
13.5
14
空气质量指数y
74
76
78
77
80
(1)在下列网格纸中绘制出散点图;
(2)观察散点图的趋势,如果能看成线性关系,请在图中画出一条直线来近似地表示这种关系,并计算车流量与空气质量指数的相关系数.
11.某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投1的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
12.为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)做好记录.下表是检验员在一天内依次抽取的16个零件的尺寸:经计算得,,
,,其中为抽取的第个零件的尺寸().
抽取次序
1
2
3
4
5
6
7
8
零件尺寸(cm)
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸(cm)
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
(1)求()的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检的零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(3)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
13.随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,.
(1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度;
(2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列.
附:相关系数.
14.深圳欢乐谷试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值.
(2)计算与的相关系数;判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:,.
参考公式:相关系数.若,则与的线性相关性很强.
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。