第12讲 成对数据的相关分析(3大知识点+5大必考题型+强化训练)-【帮课堂】2024-2025学年高二数学同步学与练(沪教版2020选择性必修第二册)
2025-03-13
|
2份
|
42页
|
328人阅读
|
49人下载
精品
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学沪教版选择性必修第二册 |
| 年级 | 高二 |
| 章节 | 8.1 成对数据的相关分析 |
| 类型 | 学案-导学案 |
| 知识点 | 统计案例 |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2025-2026 |
| 地区(省份) | 上海市 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 2.47 MB |
| 发布时间 | 2025-03-13 |
| 更新时间 | 2025-03-13 |
| 作者 | 宋老师数学图文制作室 |
| 品牌系列 | 上好课·上好课 |
| 审核时间 | 2025-03-13 |
| 下载链接 | https://m.zxxk.com/soft/50986163.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
第12讲 成对数据的相关分析
课程标准
学习目标
1.通过相关系数的学习,提升数学想象、数学建模的核心素养.
1.结合实例,了解样本相关系数的统计含义.
2.了解样本相关系数与标准化数据向量夹角的关系.
3.结合实例,会通过样本相关系数比较多组成对样本数据的相关性.
知识点01 变量间的相关关系
1、变量之间的相关关系
两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系.当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系.
2、线性相关和非线性相关:
两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系.
3、两个变量相关关系与函数关系的区别和联系
(1)相同点:两者均是两个变量之间的关系.
(2)不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
【即学即练1】(22-23高二下·上海金山·期末)如果两种证券在一段时间内收益数据的相关系数为正数,那么表明( )
A.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
B.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
C.两种证券的收益有同向变动的倾向
D.两种证券的收益有反向变动的倾向
知识点02 相关系数
两组数据和的线性相关系数是度量两个变量与之间线性相关程度的统计量,其计算公式为其中,,,它们分别是这两组数据的算术平均数。
【即学即练2】(23-24高三下·上海浦东新·期中)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是( )
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
知识点03 相关系数r的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
【即学即练3】(22-23高二下·上海奉贤·期中)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 .(计算结果精确到0.01)
6
8
10
12
6
5
3
2
题型一:判断两个变量是否有相关关系
1.(24-25高三·上海·课堂例题)下列关系中是相关关系的是 (填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
2.(2023高二·上海·专题练习)如图所示的两个变量不具有相关关系的有 .(填序号)
3.(23-24高二上·上海·课后作业)《国家学生体质健康标准(2014年修订)》中,体能监测包含身高、体重、肺活量、50米跑、坐位体前屈、引体向上(女:仰卧起坐)、立定跳远、1000米跑(女:800米跑),据此得到的每项指标都可以按照相应的单项指标评分表进行测量和计分,分别得到相应的数据.
(1)这些数据中的任意两组是否都可以作为成对数据进行相关分析?
(2)依据你的经验,哪两组数据的相关程度可能最高?哪两组数据的相关程度可能最低?如何通过统计方法检验你的判断?
4.(23-24高二上·上海·课后作业)若已知下列各组数据,它们是否可以看作成对数据?是否可以进行相关分析?判断并简要说明理由.
(1)校学生的身高与校学生的体重;
(2)人体内的脂肪含量与体重;
(3)某班学生的物理成绩与数学成绩.
题型二:判断正、负相关
1.(2023·上海·模拟预测)根据身高和体重散点图,下列说法正确的是( )
A.身高越高,体重越重 B.身高越高,体重越轻 C.身高与体重成正相关 D.身高与体重成负相关
题型三:相关系数的意义及辨析
1.(24-25高三上·上海·开学考试)已知气候温度和海水表层温度相关,且相关系数为负数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
2.(24-25高三·上海·课堂例题)某相关变量、的散点图如图所示,现对这两个变量进行回归分析,方案一:根据图中所有数据分析,可得到线性回归方程,样本相关系数为;方案二:剔除点,根据剩下数据分析,可得到线性回归方程,样本相关系数为.则( )
A. B. C. D.
3.(24-25高三·上海·随堂练习)已知表示变量x与y之间的相关系数,表示变量u与v之间的相关系数,且,,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
4.(2024·上海·模拟预测)在研究线性回归模型时,样本数据所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则( )
A. B.1 C. D.2
5.(23-24高二下·上海·阶段练习)以下说法正确的个数为( )
①两个随机变量的线性相关越强,则相关系数的绝对值越接近0;
②设是随机变量,则;
③设随机变量,若,则;
④设随机变量,则
A.0个 B.1个 C.2个 D.3个
6.(2024高二下·上海·专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
7.(2024·上海·模拟预测)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
【答案】C
【知识点】相关系数的意义及辨析
【分析】根据相关系数的性质可得正确的选项.
【详解】对于AB,当气候温度高,海水表层温度变高变低不确定,故AB错误.
对于CD,因为相关系数为正,故随着气候温度由低到高时,海水表层温度呈上升趋势,
故C正确,D错误.
故选:C.
8.(22-23高二下·上海浦东新·期末)近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
年份
1
2
3
4
5
羊只数量/万只
1.4
0.9
0.75
0.6
0.3
草地植被指数
1.1
4.3
15.6
31.3
49.7
若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则 (填,,,)
9.(21-22高二下·上海浦东新·期末)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号
根部横截面积
材积量
则该林区这种树木的根部横截面积与材积量的样本相关系数 (精确到).
题型四:相关系数的计算
1.(24-25高三·上海·课堂例题)如两个变量满足下表关系:
5
10
15
20
25
103
105
110
111
114
则两个变量线性相关程度( )
A.较高 B.较低 C.不相关 D.不确定.
2.(24-25高三·上海·课堂例题)有一散点图如图所示,在5个数据中去掉后,下列说法中正确的是( )
A.离差和变小 B.相关系数变小
C.拟合误差变小 D.解释变量与反应变量的相关性变弱
3.(2024高二下·上海·专题练习)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 .
6
8
10
12
6
5
3
2
4.(24-25高三上·上海·随堂练习)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如表:
x(年龄/岁)
26
27
39
41
49
53
56
58
60
61
y(脂肪含量/%)
14.5
17.8
21.2
25.9
26.3
29.6
31.4
33.5
35.2
34.6
根据上表的数据得到如下的散点图.
根据上表中的样本数据及其散点图,计算样本相关系数(精确到),并刻画它们的相关程度.
(参考数据:,,,)
5.(23-24高二上·上海·课后作业)下表是某国家由18支足球队参加的职业联赛(比赛采用双循环制,得分计算方法为:每场赛事胜方得3分,负方得0分,平局双方各得1分)的各队积分和射门次数,求这18支球队的积分与射门次数的相关系数.
足球队
A
B
C
D
E
F
G
H
I
积分
51
64
62
53
47
43
44
42
46
射门次数
418
509
485
425
452
425
393
350
375
足球队
J
K
L
M
N
O
P
Q
R
积分
43
50
35
40
40
32
41
26
32
射门次数
428
415
363
372
377
271
395
306
357
题型五:残差的计算
1.(2024·上海虹口·二模)给出下列4个命题:
①若事件和事件互斥,则;
②数据的第百分位数为10;
③已知关于的回归方程为,则样本点的离差为;
④随机变量的分布为,则其数学期望.
其中正确命题的序号为( )
A.①② B.①③ C.②③ D.②④
2.(24-25高三上·上海·单元测试)两个线性相关变量与的统计数据如表:
9
9.5
10
10.5
11
11
10
8
6
5
其回归直线方程是,则相对应于点的残差为 .
一、单选题
1.(2024·上海·三模)上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制了如下的散点图,则下述大小关系正确的为( ).
A. B. C. D.
2.(24-25高三上·上海·课后作业)已知变量X与Y相对应的一组数据为,,,,,变量U与V相对应的一组数据为,,,,.表示变量X与Y之间的线性相关系数,表示变量U与V之间的线性相关系数,则下列结论中正确的是( )
A. B. C. D.
3.(23-24高二下·上海·期末)下列命题为真命题的有( )个.
①若随机变量的方差为,则;
②对于随机事件A与B,若,则事件A与B独立;
③相关系数越大,两组数据的相关程度越强.
A.0 B.1 C.2 D.3
4.(24-25高三下·上海浦东新·阶段练习)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对进行线性回归分析.若在此图中加上点后,再次对进行线性回归分析,则下列说法正确的是( )
A.不具有线性相关性 B.相关系数变大
C.相关系数变小 D.相关系数不变
二、填空题
5.(24-25高三·上海·课堂例题)关于相关系数,下列说法中正确的有 (填序号).
①越大,相关程度越大;
②越小,相关程度越大;
③越大,相关程度越小,越小,相关程度越大;
④且越接近于1,相关程度越大,越接近0,相关程度越小.
6.(24-25高三·上海·随堂练习)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大,某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如下表:
x
30
35
40
45
50
y
18
14
10
8
5
计算该流量包的定价x与购买人数y的相关系数 .(结果保留3位小数)
7.(24-25高三上·上海·课前预习)相关系数r的性质:
①当时,称成对样本数据 相关;
当时,成对样本数据 相关;
当时,成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为 ;
当越接近1时,成对样本数据的线性相关程度越 ;
当越接近0时,成对样本数据的线性相关程度越 .
8.(24-25高三·上海·随堂练习)下列各组数据中,可以进行相关分析的是 .(填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系;
⑤角度和它的余弦值;
⑥正n边形的边数和内角和.
9.(24-25高三上·上海·期中)在研究线性回归模型时, 样本数据(,,,,)所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则 .
10.(24-25高三·上海·随堂练习)给出下列说法:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数|r|就越接近1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位.
其中说法正确的是 .(填写正确序号)
11.(24-25高三·上海·随堂练习)对四组不同的数据进行统计,获得如题图所示的散点图,则样本相关系数从小到大依次为 .
12.(2023·上海浦东新·三模)已知一组成对数据的回归方程为,则该组数据的相关系数 (精确到0.001).
13.(22-23高三上·上海徐汇·期中)下列命题中错误的是 .
①将一组数据中的每个数都加上或减去同一个常数后,均值与方差都不变;
②在一组样本数据(不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;
③在吸烟与患肺病这两个分类变量的计算中,若由独立性检验知,在犯错误率不超过0.01的前提下,认为吸烟与患肺病有关系.若某人吸烟,则他有的可能性患肺病.
14.(24-25高三·上海·课堂例题)下列有关线性回归的说法中,正确的是 (填序号).
①相关关系的两个变量不是因果关系;
②散点图能直观反映数据的相关程度;
③回归直线最能代表线性相关的两个变量之间的关系;
④任意一组数据都有回归方程.
15.(24-25高三上·上海·课后作业)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据可知,y与x的相关系数为 .(精确到0.01,参考数据:,,)
16.(2023·上海徐汇·模拟预测)下列说法中正确的有 (填正确说法的序号).
①若样本数据,,…,的方差为4,则数据,,…,的标准差为4;
②已知随机变量,且,则;
③若线性相关系数越接近1,则两个变量的线性相关性越弱;
④若事件A,B满足,,,则有.
三、解答题
17.(24-25高三·上海·课堂例题)下图是我国2014-2020年生活垃圾无害化处理量(单位:亿吨)的折线图.
由折线图看出,可用线性回归模型拟合与的关系,请求出相关系数,并用相关系数的大小说明与相关性的强弱.
参考数据:,,.
18.(24-25高三·上海·课堂例题)某大学生在国家提供的税收、担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数(单位:万元)与时间(单位:年)的数据,列表如下:
1
2
3
4
5
2.4
2.7
4.1
6.4
7.9
依据表中给出的数据,是否可用线性回归模型拟合与的关系,请计算相关系数并加以说明(计算结果精确到0.01).(若,则线性相关程度很高,可用线性回归模型拟合)
19.(24-25高三·上海·课堂例题)假设关于某种设备的使用年限(单位:年)与所支出的维修费用(单位:万元)有如下统计资料:
2
3
4
5
6
2.2
3.8
5.5
6.5
7.0
已知,,,.
(1)求、;
(2)对、进行线性相关性检验.(保留2位小数)
20.(25-26高三上·上海·单元测试)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投1的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
21.(25-26高三上·上海·单元测试)为了监控某种医疗物资的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数
1
2
3
4
5
6
7
8
医疗物资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,,其中为抽取的第个医疗物资的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检医疗物资中,如果出现了尺寸在之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$$
第12讲 成对数据的相关分析
课程标准
学习目标
1.通过相关系数的学习,提升数学想象、数学建模的核心素养.
1.结合实例,了解样本相关系数的统计含义.
2.了解样本相关系数与标准化数据向量夹角的关系.
3.结合实例,会通过样本相关系数比较多组成对样本数据的相关性.
知识点01 变量间的相关关系
1、变量之间的相关关系
两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系.当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系.
2、线性相关和非线性相关:
两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系.
3、两个变量相关关系与函数关系的区别和联系
(1)相同点:两者均是两个变量之间的关系.
(2)不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
【即学即练1】(22-23高二下·上海金山·期末)如果两种证券在一段时间内收益数据的相关系数为正数,那么表明( )
A.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
B.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
C.两种证券的收益有同向变动的倾向
D.两种证券的收益有反向变动的倾向
【答案】C
【分析】根据正相关的定义可得出结论.
【详解】因为两种证券在一段时间内收益数据的相关系数为正数,
那么表明两种证券的收益有同向变动的倾向,C对,ABD错.
故选:C.
知识点02 相关系数
两组数据和的线性相关系数是度量两个变量与之间线性相关程度的统计量,其计算公式为其中,,,它们分别是这两组数据的算术平均数。
【即学即练2】(23-24高三下·上海浦东新·期中)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是( )
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
【答案】D
【分析】根据相关系数的概念逐一判断.
【详解】对于A:去掉图中右下方的点后,根据图象,两个变量还是负相关,A错误;
对于BCD:去掉图中右下方的点后,相对来说数据会集中,相关程度会更高,
但因为是负相关,相关系数会更接近线性相关系数会变小,故D正确,BC错误.
故选:D.
知识点03 相关系数r的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
【即学即练3】(22-23高二下·上海奉贤·期中)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 .(计算结果精确到0.01)
6
8
10
12
6
5
3
2
【答案】
【知识点】相关系数的计算
【分析】根据相关系数公式求解即可.
【详解】根据表中数据计算可知
,
,
变量之间的相关系数,
故答案为: .
题型一:判断两个变量是否有相关关系
1.(24-25高三·上海·课堂例题)下列关系中是相关关系的是 (填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
【答案】②③
【分析】根据相关关系是一种不确定的关系,是两个变量之间确实存在的关系,由此判断即可.
【详解】对于①,曲线上的点与该点的坐标之间的关系是一一对应关系,不是相关关系,是确定性关系;
对于②,苹果的产量与气候之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于③,森林中的同一种树木,其断面直径与高度之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于④,学生与他(她)的学号之间的关系是一种确定的对应关系,是映射,不是相关关系.
故答案为:②③
2.(2023高二·上海·专题练习)如图所示的两个变量不具有相关关系的有 .(填序号)
【答案】①④
【分析】根据相关关系逐项分析判断.
【详解】对于①:图中是确定的函数关系;
对于②:图中的点大都分布在一条曲线周围,是相关关系;
对于③:中的点大都分布在一条直线周围,是相关关系;
对于④:中点的分布没有任何规律可言,x,y不具有相关关系.
故答案为:①④.
3.(23-24高二上·上海·课后作业)《国家学生体质健康标准(2014年修订)》中,体能监测包含身高、体重、肺活量、50米跑、坐位体前屈、引体向上(女:仰卧起坐)、立定跳远、1000米跑(女:800米跑),据此得到的每项指标都可以按照相应的单项指标评分表进行测量和计分,分别得到相应的数据.
(1)这些数据中的任意两组是否都可以作为成对数据进行相关分析?
(2)依据你的经验,哪两组数据的相关程度可能最高?哪两组数据的相关程度可能最低?如何通过统计方法检验你的判断?
【答案】(1)都可以
(2)肺活量和50米跑相关程度最高,身高和肺活量相关程度最低(答案不唯一)
【分析】(1)根据相关关系的定义判断即可;
(2)根据经验找到合理的案例,结合统计学知识分析即可.
【详解】(1)都可以,因为每项指标都可以按照相应的单项指标评分表进行测量和计分,
且任意两项指标之间存在一定的关系,但又没有确切到可由其中的一个精确地决定另一个的程度,
所以任意两组数据均可以作为成对数据进行相关分析,只是有些数据相关性较弱..
(2)依据经验可知肺活量和米跑相关程度最高,身高和肺活量相关程度最低,(答案不唯一),
通过测量出米成绩与肺活量的数据,作出散点图,即可判断.
通过测量出身高与肺活量的数据,作出散点图,即可判断.
4.(23-24高二上·上海·课后作业)若已知下列各组数据,它们是否可以看作成对数据?是否可以进行相关分析?判断并简要说明理由.
(1)校学生的身高与校学生的体重;
(2)人体内的脂肪含量与体重;
(3)某班学生的物理成绩与数学成绩.
【答案】(1)不可以,不可以,理由见解析
(2)可以,可以,理由见解析
(3)可以,可以,理由见解析
【分析】根据两个变量是否具有相关关系,可得答案.
【详解】(1)校学生的身高与校学生的体重毫无关系,因此不能看成成对数据,不能进行相关分析.
(2)人体内的脂肪含量与体重具有相关关系,因此可以看作成对数据,可以进行相关分析.
(3)某班学生的物理成绩与数学成绩具有相关关系,因此可以看作成对数据,可以进行相关分析.
题型二:判断正、负相关
1.(2023·上海·模拟预测)根据身高和体重散点图,下列说法正确的是( )
A.身高越高,体重越重 B.身高越高,体重越轻 C.身高与体重成正相关 D.身高与体重成负相关
【答案】C
【分析】根据给定的散点图的特征,直接判断作答.
【详解】由于身高比较高的人,其体重可能大,也可能小,则选项AB不正确;
由散点图知,身高和体重有明显的相关性,且身高增加时,体重也呈现增加的趋势,
所以身高与体重呈正相关,C正确,D错误.
故选:C
题型三:相关系数的意义及辨析
1.(24-25高三上·上海·开学考试)已知气候温度和海水表层温度相关,且相关系数为负数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
【答案】D
【分析】根据相关系数的意义判断各项的正误即可.
【详解】由于相关系数表示一个变量变化对另一个变量变化趋势的影响,
所以随着气候温度由低到高,海水表层温度呈下降趋势.
故选:D
2.(24-25高三·上海·课堂例题)某相关变量、的散点图如图所示,现对这两个变量进行回归分析,方案一:根据图中所有数据分析,可得到线性回归方程,样本相关系数为;方案二:剔除点,根据剩下数据分析,可得到线性回归方程,样本相关系数为.则( )
A. B. C. D.
【答案】A
【分析】根据相关系数的意义:其绝对值越接近1,说明两个变量越具有线性相关,以及正相关的意义作判断即可.
【详解】由散点图可知这两个变量为正相关,所以
因为剔除点后,剩下点的数据更具有线性相关性,更接近1,
所以.
故选:A.
3.(24-25高三·上海·随堂练习)已知表示变量x与y之间的相关系数,表示变量u与v之间的相关系数,且,,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
【答案】C
【分析】根据线性相关系数越接近1,表示两个变量之间的相关性越强,线性相关系数的正负表示两个变量之间呈正相关关系或负相关关系.
【详解】因为线性相关系数,,
所以变量x与y之间呈正相关关系,变量u与v之间呈负相关关系.
因为|r|越接近1,两个变量的线性相关程度越高,所以x与y之间的相关性弱于u与v之间的相关性.
故选:C.
4.(2024·上海·模拟预测)在研究线性回归模型时,样本数据所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则( )
A. B.1 C. D.2
【答案】A
【分析】结合回归方程,根据线性相关系数的性质可得结论.
【详解】因为样本数据所对应的点都在直线上,
所以变量为负相关关系,且,
故选:A.
5.(23-24高二下·上海·阶段练习)以下说法正确的个数为( )
①两个随机变量的线性相关越强,则相关系数的绝对值越接近0;
②设是随机变量,则;
③设随机变量,若,则;
④设随机变量,则
A.0个 B.1个 C.2个 D.3个
【答案】A
【分析】由相关系数的概念判断①,由相关变量的均值和方差的关系判断②,由正态分布的概率计算判断③,由两点分布方差的计算和均值不等式判断④.
【详解】两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1,故①错误;
若是随机变量,则,故②错误;
,故③错误;
设随机变量,则,当且仅当,时等号成立,故④错误;
故选:A.
6.(2024高二下·上海·专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【分析】根据题意,结合给定的散点图,结合相关性的概念,即可求解.
【详解】由给出的四组数据的散点图,可得:
图1和图3是正相关,相关系数大于0,
图2和图4是负相关,相关系数小于0,
图1和图2的点相对更加集中,所以相关性要强,所以接近于1,接近于,
由此可得.
故选:.
7.(2024·上海·模拟预测)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
【答案】C
【分析】根据相关系数的性质可得正确的选项.
【详解】对于AB,当气候温度高,海水表层温度变高变低不确定,故AB错误.
对于CD,因为相关系数为正,故随着气候温度由低到高时,海水表层温度呈上升趋势,
故C正确,D错误.
故选:C.
8.(22-23高二下·上海浦东新·期末)近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
年份
1
2
3
4
5
羊只数量/万只
1.4
0.9
0.75
0.6
0.3
草地植被指数
1.1
4.3
15.6
31.3
49.7
若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则 (填,,,)
【答案】
【分析】根据散点图可知两个量呈负相关,且去掉数据后相关性变强,结合相关系数的概念判断即可.
【详解】根据散点图可知,羊只数量与草地植被指数呈负相关,则相关系数,,
当去掉第一年数据后,数据的线性相关性变强,所以,所以.
故答案为:
9.(21-22高二下·上海浦东新·期末)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号
根部横截面积
材积量
则该林区这种树木的根部横截面积与材积量的样本相关系数 (精确到).
【答案】
【分析】根据数据计算各相关量,结合相关系数公式直接计算.
【详解】由已知得,,,,,
所以相关系数,
故答案为:.
题型四:相关系数的计算
1.(24-25高三·上海·课堂例题)如两个变量满足下表关系:
5
10
15
20
25
103
105
110
111
114
则两个变量线性相关程度( )
A.较高 B.较低 C.不相关 D.不确定.
【答案】A
【分析】根据表格中的数据,结合相关系数的公式,求得的值,即可得到答案.
【详解】根据表格中的数据,得,,,,
,,,
则,
所以两个变量与的相关程度较高.
故选:A
2.(24-25高三·上海·课堂例题)有一散点图如图所示,在5个数据中去掉后,下列说法中正确的是( )
A.离差和变小 B.相关系数变小
C.拟合误差变小 D.解释变量与反应变量的相关性变弱
【答案】C
【分析】根据离差和、相关系数、拟合误差、解释变量与反应变量的相关性逐项判断可得答案.
【详解】对于A,离差和是每个数据点与均值差值平方后的累计和,
去掉一个点后离差平方和的变化取决于该点的具体数值及其与均值的差距,
如果该点与均值相差较大,去掉它可能会导致离差平方和显著减小,
如果相差较小,则可能对离差平方和的影响不大,
因此,无法说明去掉一个点后离差平方和一定会如何变化,故A错误;
对于B,因为点离其它点较远,去掉后,相关性变强,而且是正相关,所以相关系数变大,故B错误;
对于C,点离其它点较远,是一个异常值,拟合误差减小,故C正确
对于D,解释变量与反应变量的相关性变强,故D错误.
故选:C.
3.(2024高二下·上海·专题练习)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 .
6
8
10
12
6
5
3
2
【答案】
【分析】利用相关系数公式就可以求出结果.
【详解】解:根据表中数据计算可知,,
所以变量,之间的相关系数.
故答案为:.
4.(24-25高三上·上海·随堂练习)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如表:
x(年龄/岁)
26
27
39
41
49
53
56
58
60
61
y(脂肪含量/%)
14.5
17.8
21.2
25.9
26.3
29.6
31.4
33.5
35.2
34.6
根据上表的数据得到如下的散点图.
根据上表中的样本数据及其散点图,计算样本相关系数(精确到),并刻画它们的相关程度.
(参考数据:,,,)
【答案】0.98,可以推断人体脂肪含量和年龄的相关程度很强.
【分析】根据表中数据求出,然后由相关系数公式计算,根据计算结果可下结论.
【详解】根据题表中的样本数据及其散点图知,
;
.
所以.
由此,可以推断人体脂肪含量和年龄的相关程度很强.
5.(23-24高二上·上海·课后作业)下表是某国家由18支足球队参加的职业联赛(比赛采用双循环制,得分计算方法为:每场赛事胜方得3分,负方得0分,平局双方各得1分)的各队积分和射门次数,求这18支球队的积分与射门次数的相关系数.
足球队
A
B
C
D
E
F
G
H
I
积分
51
64
62
53
47
43
44
42
46
射门次数
418
509
485
425
452
425
393
350
375
足球队
J
K
L
M
N
O
P
Q
R
积分
43
50
35
40
40
32
41
26
32
射门次数
428
415
363
372
377
271
395
306
357
【答案】
【分析】根据相关系数公式计算可得结果.
【详解】,
,
,
,
,
.
题型五:残差的计算
1.(2024·上海虹口·二模)给出下列4个命题:
①若事件和事件互斥,则;
②数据的第百分位数为10;
③已知关于的回归方程为,则样本点的离差为;
④随机变量的分布为,则其数学期望.
其中正确命题的序号为( )
A.①② B.①③ C.②③ D.②④
【答案】C
【分析】根据互斥事件的定义判断A;根据百分位数的定义判断B;根据离差的定义判断C;根据期望公式判断D.
【详解】对于①:因为事件和事件互斥,所以,故①错误;
对于②:因为,所以第百分位数为从小到大排列的第个数,即可为,故②正确;
对于③:因为,当时,
所以样本点的离差为,故③正确;
对于④:,故④错误.
故选:C
2.(24-25高三上·上海·单元测试)两个线性相关变量与的统计数据如表:
9
9.5
10
10.5
11
11
10
8
6
5
其回归直线方程是,则相对应于点的残差为 .
【答案】0.2/
【分析】根据线性回归方程一定经过样本点中心,进而求解参数,再根据残差的计算公式即可得出答案.
【详解】,
所以样本点中心为,代入回归方程得:,解得,
所以回归方程为,当时,,
所以残差为:.
故答案为:.
一、单选题
1.(2024·上海·三模)上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制了如下的散点图,则下述大小关系正确的为( ).
A. B. C. D.
【答案】C
【分析】根据散点图判断两变量的线性相关性,再根据线性相关性与相关系数的关系判断即可.
【详解】由散点图可知,图一两个变量成正相关,且线性相关性较强,故,
图二、图三两个变量都成负相关,且图二的线性相关性更强,
故,,,故,所以.
故选:C.
2.(24-25高三上·上海·课后作业)已知变量X与Y相对应的一组数据为,,,,,变量U与V相对应的一组数据为,,,,.表示变量X与Y之间的线性相关系数,表示变量U与V之间的线性相关系数,则下列结论中正确的是( )
A. B. C. D.
【答案】C
【分析】根据正负相关与相关系数的关系分析判断即可.
【详解】由变量X与Y相对应的一组数据,可得变量X与Y之间正相关,∴;
由变量U与V相对应的一组数据,可知变量U与V之间负相关,∴;
综上所述:与的大小关系是.
故选:C.
3.(23-24高二下·上海·期末)下列命题为真命题的有( )个.
①若随机变量的方差为,则;
②对于随机事件A与B,若,则事件A与B独立;
③相关系数越大,两组数据的相关程度越强.
A.0 B.1 C.2 D.3
【答案】B
【分析】①,由方差的性质计算;②,由对立事件概率公式和条件概率公式得到;③,相关系数越大,两组数据的相关程度越强.
【详解】对于①,若随机变量的方差为,则,①错误;
对于②,,故,
,即,则事件A与B独立,②正确;
对于③,相关系数越大,两组数据的相关程度越强,③错误.
故选:B
4.(24-25高三下·上海浦东新·阶段练习)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对进行线性回归分析.若在此图中加上点后,再次对进行线性回归分析,则下列说法正确的是( )
A.不具有线性相关性 B.相关系数变大
C.相关系数变小 D.相关系数不变
【答案】C
【分析】根据散点图,可判断A选项,加入点后,回归效果变差,从而可判断B,C,D选项.
【详解】对于A,加入点后,变量与预报变量相关性变弱,但不能说不具有线性相关性,故A错误;
对于B,C,D,由于点远离其他点,故加上点后,回归效果会变差,
所以相应的样本相关系数的绝对值会变小,
根据题中散点图,显然,所以会变小,故C正确,B,D错误.
故选:C.
二、填空题
5.(24-25高三·上海·课堂例题)关于相关系数,下列说法中正确的有 (填序号).
①越大,相关程度越大;
②越小,相关程度越大;
③越大,相关程度越小,越小,相关程度越大;
④且越接近于1,相关程度越大,越接近0,相关程度越小.
【答案】④
【分析】根据给定条件,利用相关系数的意义依次判断即可.
【详解】且越接近于1,相关程度越大,越接近0,相关程度越小,①②③错误,④正确.
故答案为:④
6.(24-25高三·上海·随堂练习)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大,某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如下表:
x
30
35
40
45
50
y
18
14
10
8
5
计算该流量包的定价x与购买人数y的相关系数 .(结果保留3位小数)
【答案】
【分析】根据相关系数的公式计算结果;
【详解】根据表格中的数据,
可得,.
可列表如下:
i
1
2
3
4
5
-10
-5
0
5
10
7
3
-1
-3
-6
-70
-15
0
-15
-60
则,
,
因此相关系数
.
故答案为:.
7.(24-25高三上·上海·课前预习)相关系数r的性质:
①当时,称成对样本数据 相关;
当时,成对样本数据 相关;
当时,成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为 ;
当越接近1时,成对样本数据的线性相关程度越 ;
当越接近0时,成对样本数据的线性相关程度越 .
【答案】 正 负 强 弱
【分析】略
【详解】略
8.(24-25高三·上海·随堂练习)下列各组数据中,可以进行相关分析的是 .(填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系;
⑤角度和它的余弦值;
⑥正n边形的边数和内角和.
【答案】②③
【分析】利用相关关系的概念进行判断.
【详解】由题意可知:①④⑤⑥是函数关系,是两个变量之间的关系是一种确定性关系,
比如⑤⑥可以写出它们的函数关系式,分别为,,
而②③中的两个变量之间有一定关系,但不是确定关系,所以它们具有相关关系.
故答案为:②③.
9.(24-25高三上·上海·期中)在研究线性回归模型时, 样本数据(,,,,)所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则 .
【答案】
【分析】根据线性相关系数的定义直接得解.
【详解】由已知样本数据(,,,,)所对应的点均在直线上,
则,
又,
所以满足负相关,
即,
故答案为:.
10.(24-25高三·上海·随堂练习)给出下列说法:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数|r|就越接近1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位.
其中说法正确的是 .(填写正确序号)
【答案】②③④
【分析】借助回归直线性质可得①;借助相关系数定义可得②;借助方差的性质可得③;借助回归直线方程性质可得④.
【详解】对①,回归直线恒过样本点的中心,但不一定过一个样本点,故①错误;
对②,根据相关系数的意义,可得两个变量相关性越强,则相关系数|r|就越接近1,故②正确;
对③,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,故③正确;
对④,根据回归系数的含义,可得在回归直线方程中,
当解释变量x增加一个单位时,预报变量平均减少0.5个单位,故④正确.
故答案为:②③④.
11.(24-25高三·上海·随堂练习)对四组不同的数据进行统计,获得如题图所示的散点图,则样本相关系数从小到大依次为 .
【答案】
【知识点】相关系数的意义及辨析
【分析】根据散点图直接观察比较即可.
【详解】由散点图可知图(1)与图(3)中的两个变量是正相关,故,.
图(2)与图(4)中的两个变量是负相关,故,.
又图(1)与图(2)中的样本点集中在一条直线附近,所以其相关系数的绝对值越接近1.
故答案为:.
12.(2023·上海浦东新·三模)已知一组成对数据的回归方程为,则该组数据的相关系数 (精确到0.001).
【答案】
【分析】一组成对数据的平均值一定在回归方程上,可求得,再利用相关系数的计算公式算出即可.
【详解】由条件可得,
,
,
一定在回归方程上,代入解得,
,
,
,
,
故答案为:
13.(22-23高三上·上海徐汇·期中)下列命题中错误的是 .
①将一组数据中的每个数都加上或减去同一个常数后,均值与方差都不变;
②在一组样本数据(不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;
③在吸烟与患肺病这两个分类变量的计算中,若由独立性检验知,在犯错误率不超过0.01的前提下,认为吸烟与患肺病有关系.若某人吸烟,则他有的可能性患肺病.
【答案】①②③
【分析】根据均值和方差的性质,相关系数的特点,独立性检验的相关知识,对每个选项进行逐一分析,即可判断和选择.
【详解】对于①,将一组数据中的每个数都加上或减去同一个常数后,均值改变,方差不变,所以①错误;
对于②,在散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为,所以②错误;
对于③,由独立性检验得,有的把握认为吸烟与患肺病有关系时,是指有的可能性使推断出现错误,所以③错误.
综上,错误的命题序号是①②③.
故答案为:①②③.
14.(24-25高三·上海·课堂例题)下列有关线性回归的说法中,正确的是 (填序号).
①相关关系的两个变量不是因果关系;
②散点图能直观反映数据的相关程度;
③回归直线最能代表线性相关的两个变量之间的关系;
④任意一组数据都有回归方程.
【答案】①②③
【分析】对于①,根据具有相关关系的两个变量不一定是因果关系,即可判断;对于②,根据散点图能直观的反映数据的相关程度,即可判断;对于③和④,根据回归直线最能代表线性相关的两个变量之间的关系,并不是任一组数据都有回归方程,即可判断.
【详解】具有相关关系的两个变量不一定是因果关系,故①正确;
散点图能直观的反应数据的相关程度,故②正确;
回归直线最能代表线性相关的两个变量之间的关系,故③正确;
并不是任一组数据都有回归方程,例如当一组数据的线性相关数很小时,这组数据就不会有回归方程,故④错误.
故答案为:①②③
15.(24-25高三上·上海·课后作业)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据可知,y与x的相关系数为 .(精确到0.01,参考数据:,,)
【答案】0.99/
【分析】根据表中的数据结合公式直接求解即可.
【详解】由题意,知,
所以.
所以结合参考数据知:.
所以y与x的相关系数近似为0.99.
故答案为:
16.(2023·上海徐汇·模拟预测)下列说法中正确的有 (填正确说法的序号).
①若样本数据,,…,的方差为4,则数据,,…,的标准差为4;
②已知随机变量,且,则;
③若线性相关系数越接近1,则两个变量的线性相关性越弱;
④若事件A,B满足,,,则有.
【答案】①②④
【分析】对于①,利用方差的性质求解判断,对于②,根据正态分布的性质计算,
对于③,根据相关系数的性质判断,对于④,利用独立事件和条件概率公式求解判断.
【详解】由于,所以数据,,…,的方差为16,
故标准差为4,因此①正确;
根据正态分布,,故,即,
故.3,因此②正确;
线性相关系数越接近1,则两个变量的线性相关性越强,故③错误;
由于等价于“事件A与事件B相互独立,即,
故必有,因此④正确.
故答案为:①②④
三、解答题
17.(24-25高三·上海·课堂例题)下图是我国2014-2020年生活垃圾无害化处理量(单位:亿吨)的折线图.
由折线图看出,可用线性回归模型拟合与的关系,请求出相关系数,并用相关系数的大小说明与相关性的强弱.
参考数据:,,.
【答案】0.99,与的线性相关程度比较高
【分析】计算出的值,将参考数据代入相关系数公式,求出的值,即可得出结论.
【详解】由折线图中数据和参考数据得,
,
,,
所以,
所以与的线性相关程度比较高.
18.(24-25高三·上海·课堂例题)某大学生在国家提供的税收、担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数(单位:万元)与时间(单位:年)的数据,列表如下:
1
2
3
4
5
2.4
2.7
4.1
6.4
7.9
依据表中给出的数据,是否可用线性回归模型拟合与的关系,请计算相关系数并加以说明(计算结果精确到0.01).(若,则线性相关程度很高,可用线性回归模型拟合)
【答案】,理由见解析
【分析】依次计算,,,和,代入相关系数计算公式,计算即得相关系数的值,与比较得出结论.
【详解】由题可知:,,
,
,
则,
即与的线性相关程度很高,可用线性线性回归模型拟合.
19.(24-25高三·上海·课堂例题)假设关于某种设备的使用年限(单位:年)与所支出的维修费用(单位:万元)有如下统计资料:
2
3
4
5
6
2.2
3.8
5.5
6.5
7.0
已知,,,.
(1)求、;
(2)对、进行线性相关性检验.(保留2位小数)
【答案】(1)4,5;
(2),与之间具有线性相关关系.
【分析】(1)根据表格数据直接求解即可.
(2)根据题意,结合参考数据和相关系数的计算公式,求出,即可判断与之间是否具有线性相关关系.
【详解】(1)依题意,,.
(2)又,
,,
所以.
所以有把握认为与之间具有很强的正线性相关关系.
20.(25-26高三上·上海·单元测试)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投1的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
【答案】(1)(万元)
(2)
(3)采用分层抽样,理由见解析
【分析】(1)利用样本平均数的计算公式求解即可,(2)利用样本平均数的计算公式求解即可.(3)结合题意根据调查总体的分布特征选择分层抽样进行调查即可.
【详解】(1)该地被调查村的村户年平均收入的估计值为(万元);
(2)样本的相关系数为
;
(3)采用分层抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地更准确的验收估计.
21.(25-26高三上·上海·单元测试)为了监控某种医疗物资的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数
1
2
3
4
5
6
7
8
医疗物资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,,其中为抽取的第个医疗物资的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检医疗物资中,如果出现了尺寸在之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
【答案】(1),可以认为
(2)需对当天的生产过程进行检查
【分析】(1)利用公式计算出相关系数,再根据,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小进行判断;
(2)计算出,,进一步得出的区间范围,观察样本数据看零件的尺寸在以外就需要对当天的生产过程进行检查.
【详解】(1)由样本数据得的相关系数为
.
由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;
(2)由于,,
故的区间范围为,
由样本数据可以看出抽取的第13个零件的尺寸在以外,
因此需对当天的生产过程进行检查.
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。