8.1 成对数据的统计相关性【4大题型】讲义-2025-2026学年高二下学期数学人教A版选择性必修第三册
2026-04-29
|
2份
|
36页
|
433人阅读
|
11人下载
普通
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 8.1 成对数据的统计相关性 |
| 类型 | 教案-讲义 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 3.39 MB |
| 发布时间 | 2026-04-29 |
| 更新时间 | 2026-04-29 |
| 作者 | 热爱数学者 |
| 品牌系列 | - |
| 审核时间 | 2026-04-29 |
| 下载链接 | https://m.zxxk.com/soft/57624467.html |
| 价格 | 1.50储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
8.1 成对数据的统计相关性
题型预览
题型一 判断两个变量是否有相关关系
题型二 判断正、负相关
题型三 相关系数的意义及辨析
题型四 相关系数的计算
知识清单
变量间的相关关系
相关关系的定义:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.两个变量之间的关系分为函数关系和相关关系.
【注意】相关关系与函数关系的异同点
(1)相同点:均是指两个变量的关系
(2)不同点:函数关系是一种确定的关系,而相关关系是一种非确定关系
散点图及其应用
(1)散点图:为直观地描述成对样本数据中两个变量间的关系,用横轴表示其中的一个变量,纵轴表示另一个变量,则成对样本数据都可以用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)散点图的作用
如果散点图中变量的对应点分布在某条曲线的附近,我们就可以得出结论:这两个变量具有相关性,如图(1)(2).如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关性,如图(3).
(3)正相关与负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
(4)线性相关与曲线相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
样本相关系数
(1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多.
(2)样本相关系数r=.
(3)样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
【注意】 样本相关系数r是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征:
当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关;
当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系.
当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
题型突破
题型一 判断两个变量是否有相关关系
1.(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
2.(25-26高二下·全国·课堂例题)(多选)在下列各变量之间的关系中,属于相关关系的是( )
A.汽车的重量和百公里耗油量 B.正n边形的边数与内角度数之和
C.一块农田的小麦产量与施肥量 D.家庭的经济条件与学生的学习成绩
3.(25-26高二下·全国·课堂例题)下列关系中,属于相关关系的是________.(填序号)
①扇形的半径与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系.
4.(25-26高二·全国·寒假作业)有下列关系;
①炼钢时钢水的含碳量与冶炼时间的关系;
②曲线上的点与该点的坐标之间的关系;
③柑橘的产量与气温之间的关系;
④森林的同一种树木,其横断面积直径与高度之间的关系.
其中具有相关关系的是__________.(填序号)
题型二 判断正、负相关
5.(2026·辽宁抚顺·一模)(多选)年我国粮食产量(单位:万吨)如图所示,下列结论正确的是( )
A.年我国粮食产量逐年增加
B.年我国粮食产量的中位数为万吨
C.年我国粮食产量的极差为万吨
D.年我国粮食产量与年份负相关
6.(24-25高二下·天津西青·期末)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
7.(2025高二·全国·专题练习)(多选)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有线性相关关系的是( )
A. B.
C. D.
8.(2025高三·全国·专题练习)某公司2018-2023年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示.
年份
2018
2019
2020
2021
2022
2023
x/百万元
12.2
14.6
16.0
18.0
20.4
22.3
y/百万元
0.62
0.74
0.81
0.89
1.00
1.11
根据统计资料,年利润中位数( )
A.是16,x与y有正线性相关关系
B.是17,x与y有正线性相关关系
C.是17,x与y有负线性相关关系
D.是18,x与y有负线性相关关系
9.(2026高三·全国·专题练习)(多选)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得经验回归方程,分别得到以下四个结论,其中一定错误的是( )
A.y与x负相关且
B.y与x负相关且
C.y与x正相关且
D.y与x正相关且
10.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
题型三 相关系数的意义及辨析
11.(25-26高三下·湖南长沙·月考)在研究线性回归模型时,样本数据所对应的点均在直线上,则解释变量和响应变量之间的相关系数( )
A. B. C.0 D.1
12.(25-26高二下·浙江宁波·期中)(多选)下列说法正确的是( )
A.1,2,4,5,6,12,18,20的上四分位数是15
B.样本相关系数越大,则线性相关性越强
C.随机变量X的方差,期望,则
D.若随机变量X服从正态分布,且,则
13.(25-26高三下·上海·月考)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是( )
A. B. C. D.
14.(25-26高二下·江苏南通·月考)(多选)下列结论正确的是( )
A.随机变量X 服从二项分布,Y = 2X +1 ,则D(Y) = 3
B.相关系数 r 的值越小,两个变量之间的线性相关性越弱
C.在线性回归分析中,若 值越小则模型的拟合效果越好
D.随机变量X 服从正态分布 ,且P(2 < X < 5 ) = a ,则
15.(2026·浙江嘉兴·二模)(多选)下列说法正确的是( )
A.数据9,10,10,11,12,14,16,17,19,21的第60百分位数为14
B.对于随机事件A与B,若,则事件A与B相互独立
C.已知一组样本数据的平均值为5,极差为7,中位数为6,则数据的平均值为9,极差为14,中位数为11
D.若成对样本数据的线性相关程度越强,则样本相关系数越接近1
16.(25-26高三下·上海·月考)下图是某城市在2025年元月至十月的最低气温(单位:℃)和最高气温(单位:℃)的散点图.定义各月的温差为该月的最高气温减去最低气温.若最低气温和最高气温的线性相关系数为,最低气温和温差的线性相关系数为,则下列说法正确的是( )
A.,且 B.,且
C.,且 D.,且
题型四 相关系数的计算
17.(2026·湖南岳阳·二模)某高校快递站统计了某年度新学期前5天的取件人数y(单位:人),得到如下样本数据:
天数(序号)x
1
2
3
4
5
每日取件人数
120
100
80
70
55
(1)计算样本相关系数r,并据此判断变量x与y之间线性相关关系的强弱(结果保留两位小数);
(2)从这5天中随机选取3天,记X为所选日期中取件人数小于100的天数,求X的分布列与数学期望.
注: (1)样本的相关系数
(2)参考数据:
18.(2026·江西·一模)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后18个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额数量(单位:万元),并计算得, .
(1)求样本的相关系数(精确到0.01),并推断销售金额(单位:万元)和月份编号是否线性相关(当时,即可认为线性相关);
(2)已知这18个月中有10个月的销售金额高于平均数,从这18个月中随机抽取2个月的销售金额,记抽到销售金额高于平均数的月份数为,求随机变量的分布列.
附:相关系数.
19.(2026高三·全国·专题练习)我国新能源汽车迅速崛起,成为推动绿色革命的核心引擎.某品牌新能源汽车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:
令,数据经过初步处理得:,,,,,,.现有①和②两种模型作为年销售量关于年广告费的回归分析模型,其中均为常数.请从样本相关系数的角度,分析哪一个模型拟合程度更好?
参考数据:,.
相关系数.
20.(25-26高二下·全国·课堂例题)为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示:
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
GLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度.
参考公式:
相关系数,
参考数据:,,,,,,,.
21.(25-26高二下·全国·课堂例题)现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示.
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
请问:这10名学生的两次数学成绩是否具有较强的线性相关关系?
注:;
若,则我们可以认为y与x之间具有较强的线性相关关系.
22.(25-26高三上·西藏拉萨·月考)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示.
年份代码
1
2
3
4
5
产量/千万吨
13.4
13.6
13.8
13.7
14.0
现规定表示年份代码,表示年份代码为的产量,经计算得,,
(1)求样本的相关系数;(精确到0.01)
(2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望.
附:相关系数,.
强化训练
1.(25-26高二下·全国·课堂例题)下列两个变量之间,是相关关系的有( )
①角度与它的余弦值;②人的体重与视力;③正n边形的边数和它的内角度数之和;④圆心角的大小与所对的圆弧长;⑤光照时间和果树亩产量;⑥收入水平与购买能力;⑦正方体的棱长与体积.
A.①④⑥ B.②⑤⑥⑦ C.⑤⑥ D.③⑤⑦
2.(24-25高二下·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是( )
A.B.C. D.
3.(16-17高二上·河北石家庄·月考)观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
4.(25-26高二下·辽宁沈阳·月考)下列说法中,正确的是( )
A.两个随机变量的线性相关程度越强,相关系数越接近于1
B.两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量相互独立的可能性就越大
C.随机变量服从正态分布,若,则实数
D.若随机变量的方差,则
5.(25-26高二下·安徽淮北·月考)(多选)下列结论正确的有( )
A.若随机变量,,则
B.若随机变量,则
C.样本相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱
D.如果随机变量服从,且,那么是上的增函数
6.(2026·浙江嘉兴·二模)(多选)下列命题中,正确的是( )
A.数据27,12,14,30,15,17,19,23的第70百分位数是23
B.若回归方程为,则变量y与x成负相关
C.若随机变量X服从正态分布,则
D.样本相关系数,有时也称样本线性相关系数,刻画了样本点集中于某条直线的程度,当时,则表明成对样本数据间没有线性相关关系
7.(25-26高三上·四川内江·月考)(多选)下列有关说法正确的有( )
A.设随机变量服从正态分布,若,则
B.记两个变量的样本相关系数为,若越大,线性相关程度越强
C.已知随机变量,则
D.数据1,3,9,4,5,16,7,11的中位数为7
8.(25-26高二下·全国·单元测试)若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.93,0.42,,则线性相关程度最强的一组是________.(填甲、乙、丙中的一个)
9.(25-26高二上·全国·课前预习)设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示:
变量x
…
变量y
…
两组数据和的__________是度量两个变量x与y之间线性相关程度的统计量,其计算公式为,其中,,,它们分别是这两组数据的算术平均数.
10.(25-26高三上·贵州贵阳·月考)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
11.(2025·河北沧州·模拟预测)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.我国于2020年打赢了脱贫攻坚战,其中小麦发挥了重大作用.以2020年为第1年,我国连续5年小麦产量如下:
年份
1
2
3
4
5
产量/千万吨
13.4
13.7
13.8
13.6
14.0
现规定表示第i年的年份,表示第i年的产量,经计算得,,.
(1)求样本(,2,…,5)的相关系数(精确到0.01);
(2)现从这5年中随机抽取2年,记这2年中共有X年的小麦产量不低于13.7千万吨,求X的分布列与期望.
附:样本相关系数,.
12.(25-26高三上·湖北宜昌·月考)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,.
(1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度;
(2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列.
附:相关系数.
1 / 1
学科网(北京)股份有限公司
$
8.1 成对数据的统计相关性
题型预览
题型一 判断两个变量是否有相关关系
题型二 判断正、负相关
题型三 相关系数的意义及辨析
题型四 相关系数的计算
知识清单
变量间的相关关系
相关关系的定义:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.两个变量之间的关系分为函数关系和相关关系.
【注意】相关关系与函数关系的异同点
(1)相同点:均是指两个变量的关系
(2)不同点:函数关系是一种确定的关系,而相关关系是一种非确定关系
散点图及其应用
(1)散点图:为直观地描述成对样本数据中两个变量间的关系,用横轴表示其中的一个变量,纵轴表示另一个变量,则成对样本数据都可以用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)散点图的作用
如果散点图中变量的对应点分布在某条曲线的附近,我们就可以得出结论:这两个变量具有相关性,如图(1)(2).如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关性,如图(3).
(3)正相关与负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
(4)线性相关与曲线相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
样本相关系数
(1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多.
(2)样本相关系数r=.
(3)样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
【注意】 样本相关系数r是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征:
当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关;
当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系.
当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
题型突破
题型一 判断两个变量是否有相关关系
1.(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
【答案】A
【分析】根据相关关系的定义可得.
【详解】选项B,C,D中的两个变量都具有相关性,且都是一种不确定的关系,是相关关系.
而A中判别式和变量是一种确定的表达式,是一种函数关系,即一种确定的关系,所以不是相关关系.
故选:A
2.(25-26高二下·全国·课堂例题)(多选)在下列各变量之间的关系中,属于相关关系的是( )
A.汽车的重量和百公里耗油量 B.正n边形的边数与内角度数之和
C.一块农田的小麦产量与施肥量 D.家庭的经济条件与学生的学习成绩
【答案】AC
【分析】根据相关关系与函数关系的概念,可得答案.
【详解】汽车的重量越大,百公里耗油量会越多.一般来说,农田的施肥量越大,小麦产量一般会越多.
可得A、C是相关关系.B是函数关系.D中家庭的经济条件与学生的学习成绩之间不是相关关系,也不是函数关系.
故选:AC.
3.(25-26高二下·全国·课堂例题)下列关系中,属于相关关系的是________.(填序号)
①扇形的半径与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系.
【答案】②④
【分析】利用相关关系的定义求解.
【详解】在①中,扇形的半径与面积之间的关系是函数关系;
在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;
③为确定的函数关系;
在④中,降雪量与交通事故的发生率之间具有相关关系.
故答案为:②④.
4.(25-26高二·全国·寒假作业)有下列关系;
①炼钢时钢水的含碳量与冶炼时间的关系;
②曲线上的点与该点的坐标之间的关系;
③柑橘的产量与气温之间的关系;
④森林的同一种树木,其横断面积直径与高度之间的关系.
其中具有相关关系的是__________.(填序号)
【答案】①③④
【分析】根据相关关系的定义,逐一分析每个关系是否为不确定的依存关系,从而确定具有相关关系的序号.
【详解】相关关系是变量间不确定的依存关系,非函数关系.
①炼钢时钢水含碳量与冶炼时间,存在不确定依存,是相关关系;
②曲线上点与坐标是一一对应函数关系,不是相关关系;
③柑橘产量与气温,存在不确定依存,是相关关系;
④树木横断面直径与高度,存在不确定依存,是相关关系.
故答案为:①③④
题型二 判断正、负相关
5.(2026·辽宁抚顺·一模)(多选)年我国粮食产量(单位:万吨)如图所示,下列结论正确的是( )
A.年我国粮食产量逐年增加
B.年我国粮食产量的中位数为万吨
C.年我国粮食产量的极差为万吨
D.年我国粮食产量与年份负相关
【答案】AB
【分析】利用条形图结合中位数、极差以及相关性逐项判断即可.
【详解】对于A选项,年我国粮食产量逐年增加,A正确.
对于B选项,年我国粮食产量的中位数为万吨,B正确.
对于C选项,年我国粮食产量的极差为万吨,C错误.
对于D选项,年我国粮食产量与年份正相关,D错误.
6.(24-25高二下·天津西青·期末)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【答案】D
【分析】由散点图的特征,结合相关系数的定义即可得到答案.
【详解】由散点图的趋势可知,,,,
又图一的散点图比图三的散点图更为集中,则,所以,
又图二的散点图比图四的散点图更为集中,则,所以,
所以.
故选:D.
7.(2025高二·全国·专题练习)(多选)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有线性相关关系的是( )
A. B.
C. D.
【答案】BC
【分析】根据散点图的特征逐一验证即可得到答案.
【详解】由题意,
对于A:散点杂乱无章,无规律可言,看不出两个变量有什么相关性;故A错误;
对于B:呈正相关关系,分布在一条直线附近,具有线性相关关系;故B正确;
对于C:两个变量具有负相关关系,分布在一条直线附近,具有线性相关关系;故C正确;
对于D:两个变量具有相关性,但不是正相关,也不是负相关,故D错误.
故选:BC.
8.(2025高三·全国·专题练习)某公司2018-2023年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示.
年份
2018
2019
2020
2021
2022
2023
x/百万元
12.2
14.6
16.0
18.0
20.4
22.3
y/百万元
0.62
0.74
0.81
0.89
1.00
1.11
根据统计资料,年利润中位数( )
A.是16,x与y有正线性相关关系
B.是17,x与y有正线性相关关系
C.是17,x与y有负线性相关关系
D.是18,x与y有负线性相关关系
【答案】B
【分析】根据数据分析可直接得出结论.
【详解】由题意,利润中位数是,
而且随着利润x的增加,广告支出y也在增加,故x与y有正线性相关关系.
故选:B.
9.(2026高三·全国·专题练习)(多选)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得经验回归方程,分别得到以下四个结论,其中一定错误的是( )
A.y与x负相关且
B.y与x负相关且
C.y与x正相关且
D.y与x正相关且
【答案】AD
【分析】由负相关、正相关的概念逐个判断即可;
【详解】对于A:由可知y与x正相关,错误;
对于B:由可知y与x负相关,正确;
对于C:由可知y与x正相关,正确;
对于D:由可知y与x负相关,错误;
故选:AD
10.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
【答案】B
【分析】根据散点图点的变化关系确定正负相关性即可.
【详解】由变量,的散点图,知随增大,也增大,变量与正相关,
由变量,的散点图,知随增大,减小,与负相关.
故选:B
题型三 相关系数的意义及辨析
11.(25-26高三下·湖南长沙·月考)在研究线性回归模型时,样本数据所对应的点均在直线上,则解释变量和响应变量之间的相关系数( )
A. B. C.0 D.1
【答案】D
【详解】由题意知,样本数据所对应的点均在直线上,而直线的斜率,
说明解释变量和响应变量之间正相关,即,且线性相关程度达到最强,所以.
12.(25-26高二下·浙江宁波·期中)(多选)下列说法正确的是( )
A.1,2,4,5,6,12,18,20的上四分位数是15
B.样本相关系数越大,则线性相关性越强
C.随机变量X的方差,期望,则
D.若随机变量X服从正态分布,且,则
【答案】ACD
【详解】1,2,4,5,6,12,18,20该组数据共8个数据,又,
因此上四分位数为第6个数和第7个数的平均数,即,所以A正确;
样本相关系数的绝对值越大,则线性相关性越强,所以B错误;
因为,由方差,期望,可得,所以C正确;
因为且,所以,
所以,所以D正确.
13.(25-26高三下·上海·月考)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是( )
A. B. C. D.
【答案】B
【详解】图①,数据点呈正线性相关,且相关性很强,所以接近1;
图②,数据点呈负线性相关,且相关性很强,所以接近;
图③,数据点呈正线性相关,且相关性比图①弱,所以;
图④,数据点呈负线性相关,且相关性比图②弱,所以;
所以.
14.(25-26高二下·江苏南通·月考)(多选)下列结论正确的是( )
A.随机变量X 服从二项分布,Y = 2X +1 ,则D(Y) = 3
B.相关系数 r 的值越小,两个变量之间的线性相关性越弱
C.在线性回归分析中,若 值越小则模型的拟合效果越好
D.随机变量X 服从正态分布 ,且P(2 < X < 5 ) = a ,则
【答案】AD
【详解】对于A,,A正确;
对于B,相关系数 的值越小,两个变量之间的线性相关性越弱,B错误;
对于C,在线性回归分析中,若 值越大则模型的拟合效果越好,C错误;
对于D,正态曲线关于直线对称,所以,
又,所以,D正确.
15.(2026·浙江嘉兴·二模)(多选)下列说法正确的是( )
A.数据9,10,10,11,12,14,16,17,19,21的第60百分位数为14
B.对于随机事件A与B,若,则事件A与B相互独立
C.已知一组样本数据的平均值为5,极差为7,中位数为6,则数据的平均值为9,极差为14,中位数为11
D.若成对样本数据的线性相关程度越强,则样本相关系数越接近1
【答案】BC
【分析】利用百分位数定义计算可得A;利用对立事件概率公式与相互独立事件定义计算可得B;利用平均数、极差与中位数的性质计算可得C;利用相关系数定义可得D.
【详解】对A:,故这组数据的第60百分位数为,故A错误;
对B:由,则,
故事件A与B相互独立,故B正确;
对C:新数据的平均值为,极差为,
中位数为,故C正确;
对D:若成对样本数据的线性相关程度越强,则样本相关系数的绝对值越接近,故D错误.
16.(25-26高三下·上海·月考)下图是某城市在2025年元月至十月的最低气温(单位:℃)和最高气温(单位:℃)的散点图.定义各月的温差为该月的最高气温减去最低气温.若最低气温和最高气温的线性相关系数为,最低气温和温差的线性相关系数为,则下列说法正确的是( )
A.,且 B.,且
C.,且 D.,且
【答案】D
【分析】根据线性相关系数的性质与线性相关程度判断即可.
【详解】由散点图可得,随着最低气温的升高,最高气温也升高,所以最低气温和最高气温成正相关,故.
因温差最高气温最低气温,由图知,随着最低气温不断升高,最高气温升高幅度相对较小,
故温差逐渐减小,即最低气温和温差成负相关,故.
由散点图可以看出,最低气温与最高气温的线性相关程度较强,最低气温与温差的线性相关程度较弱,
根据线性相关系数的性质,值越接近1,随机变量之间的线性相关程度越强;值越接近0,随机变量之间的线性相关程度越弱.由上分析,可得.
题型四 相关系数的计算
17.(2026·湖南岳阳·二模)某高校快递站统计了某年度新学期前5天的取件人数y(单位:人),得到如下样本数据:
天数(序号)x
1
2
3
4
5
每日取件人数
120
100
80
70
55
(1)计算样本相关系数r,并据此判断变量x与y之间线性相关关系的强弱(结果保留两位小数);
(2)从这5天中随机选取3天,记X为所选日期中取件人数小于100的天数,求X的分布列与数学期望.
注: (1)样本的相关系数
(2)参考数据:
【答案】(1);变量x与y之间具有很强的线性相关关系
(2)分布列见解析;期望:1.8
【分析】(1)使用相关系数计算公式求相关系数,根据求解结果判断线性相关关系的强弱;
(2)结合超几何分布的概率公式求分布列,再由期望公式求期望.
【详解】(1),,
,
,
,
样本相关系数:
,
因为非常接近1,所以变量x与y之间具有很强的线性相关关系.
(2)5天中取件人数小于100的天数有3天,
从这5天中随机选取3天,的可能取值为1,2,3.
,
,
,
所以的分布列为:
1
2
3
的数学期望
18.(2026·江西·一模)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后18个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额数量(单位:万元),并计算得, .
(1)求样本的相关系数(精确到0.01),并推断销售金额(单位:万元)和月份编号是否线性相关(当时,即可认为线性相关);
(2)已知这18个月中有10个月的销售金额高于平均数,从这18个月中随机抽取2个月的销售金额,记抽到销售金额高于平均数的月份数为,求随机变量的分布列.
附:相关系数.
【答案】(1),具有很强的正相关性
(2)
0
1
2
【分析】(1)由条件结合相关系数公式求出相关系数,根据相关系数性质判断结论;
(2)由条件确定的可能取值,再求取各值的概率,由此可得其分布列.
【详解】(1)样本的相关系数为:
由于相关系数,故销售金额(单位:万元)和月份编号具有很强的正相关性;
(2)由题意得:的可能取值为0,1,2,
18个月中有10个月的销售金额高于平均数,
所以,
,
,
所以的分布列为:
0
1
2
19.(2026高三·全国·专题练习)我国新能源汽车迅速崛起,成为推动绿色革命的核心引擎.某品牌新能源汽车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:
令,数据经过初步处理得:,,,,,,.现有①和②两种模型作为年销售量关于年广告费的回归分析模型,其中均为常数.请从样本相关系数的角度,分析哪一个模型拟合程度更好?
参考数据:,.
相关系数.
【答案】模型②的拟合程度更好
【分析】比较相关系数的大小即可得到结论.
【详解】设模型①和②的相关系数分别为,
由题意可得:,
,
所以,由相关系数的意义可得,模型②的拟合程度更好.
20.(25-26高二下·全国·课堂例题)为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示:
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
GLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度.
参考公式:
相关系数,
参考数据:,,,,,,,.
【答案】答案见解析
【分析】根据相关系数的计算结果来判断变量之间的相关性.
【详解】由题意,变量与的相关系数,
变量与的相关系数是,
可以看出TC指标值与BMI值,GLU指标值与BMI值都是高度正相关.
21.(25-26高二下·全国·课堂例题)现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示.
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
请问:这10名学生的两次数学成绩是否具有较强的线性相关关系?
注:;
若,则我们可以认为y与x之间具有较强的线性相关关系.
【答案】这10名学生的两次数学成绩具有较强的线性相关关系
【分析】根据线性相关关系的概念,以及相关系数计算公式,求出相关系数,判断两组数据是否具有线性相关关系即可.
【详解】由题意知,
,
,
,,.
所以样本相关系数.
,故我们可以认为与之间具有较强的线性相关关系.
即这10名学生的两次数学成绩具有较强的线性相关关系.
22.(25-26高三上·西藏拉萨·月考)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示.
年份代码
1
2
3
4
5
产量/千万吨
13.4
13.6
13.8
13.7
14.0
现规定表示年份代码,表示年份代码为的产量,经计算得,,
(1)求样本的相关系数;(精确到0.01)
(2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望.
附:相关系数,.
【答案】(1)
(2)分布列见解析,
【分析】(1)先求出平均值,再应用已知数据结合相关系数公式计算求解;
(2)根据超几何分布求出概率,再写出分布列应用数学期望公式计算即可.
【详解】(1),,
故样本相关系数
.
(2)X的取值可以为0,1,2,
则,
,
,
于是X的分布列为
X
0
1
2
P
故.
强化训练
1.(25-26高二下·全国·课堂例题)下列两个变量之间,是相关关系的有( )
①角度与它的余弦值;②人的体重与视力;③正n边形的边数和它的内角度数之和;④圆心角的大小与所对的圆弧长;⑤光照时间和果树亩产量;⑥收入水平与购买能力;⑦正方体的棱长与体积.
A.①④⑥ B.②⑤⑥⑦ C.⑤⑥ D.③⑤⑦
【答案】C
【分析】根据相关关系的概念判断即可.
【详解】①③④⑦是函数关系;②没有关系;⑤⑥是相关关系.
故选:C
2.(24-25高二下·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是( )
A.B.C. D.
【答案】C
【分析】根据散点图的特征得到答案.
【详解】A中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性;
B中呈正相关关系,C中两个变量具有负相关关系;
D中两个变量具有相关性,但不是正相关,也不是负相关.
故选:C.
3.(16-17高二上·河北石家庄·月考)观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
【答案】D
【分析】根据散点图中点的分布特征,结合相关性的定义,即可得出结论.
【详解】根据散点图,由相关性可知:图a各点散布在从左下角到右上角的区域里,是正相关;
图b中各点分布不成带状,相关性不明确,所以不相关;
图c中各点分布在从左上方到右下方的区域里,是负相关.
故选:D
4.(25-26高二下·辽宁沈阳·月考)下列说法中,正确的是( )
A.两个随机变量的线性相关程度越强,相关系数越接近于1
B.两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量相互独立的可能性就越大
C.随机变量服从正态分布,若,则实数
D.若随机变量的方差,则
【答案】C
【详解】对于A,两个随机变量的线性相关程度越强,相关系数的绝对值越接近于1,故A错误;
对于B,两个变量的2×2列联表中,对角线上数据的乘积相差越小,说明两个变量相互独立的可能性就越大,故B错误;
对于C,随机变量服从正态分布,若,
则由正态分布的对称性可得,故C正确;
对于D,若随机变量的方差,则,故D错误.
5.(25-26高二下·安徽淮北·月考)(多选)下列结论正确的有( )
A.若随机变量,,则
B.若随机变量,则
C.样本相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱
D.如果随机变量服从,且,那么是上的增函数
【答案】AD
【详解】对于选项A:因为随机变量,,
所以,故A正确;
对于选项B:因为随机变量,则,
所以,故B错误;
对于选项C:因为相关系数的绝对值的大小越接近,两个变量的线性相关性越强;反之线性相关性越弱,故C错误;
对于选项D:由正态曲线的性质可知,是上的增函数,故D正确.
6.(2026·浙江嘉兴·二模)(多选)下列命题中,正确的是( )
A.数据27,12,14,30,15,17,19,23的第70百分位数是23
B.若回归方程为,则变量y与x成负相关
C.若随机变量X服从正态分布,则
D.样本相关系数,有时也称样本线性相关系数,刻画了样本点集中于某条直线的程度,当时,则表明成对样本数据间没有线性相关关系
【答案】ABD
【详解】将已知数据排序得12,14,15,17,19,23,27,30,
由,第六个数为23,即第70百分位数是23,故A正确;
由于,所以变量y与x成负相关,故B正确;
因为,
所以,故C错误;
当越小时,相关性越弱,所以当时,则表明成对样本数据间没有线性相关关系,故D正确.
7.(25-26高三上·四川内江·月考)(多选)下列有关说法正确的有( )
A.设随机变量服从正态分布,若,则
B.记两个变量的样本相关系数为,若越大,线性相关程度越强
C.已知随机变量,则
D.数据1,3,9,4,5,16,7,11的中位数为7
【答案】AC
【详解】对A:因为,且,所以正态曲线的对称轴为,故A正确;
对B:两个变量的样本相关系数为,则越大,线性相关程度越强,故B错误;
对C:由,所以,故C正确;
对D:数据1,3,9,4,5,16,7,11从小到大顺序排列得:1,3,4,5,7,9,11,16,
其中位数是第4与第5两个数的平均数,为,故D错误.
8.(25-26高二下·全国·单元测试)若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.93,0.42,,则线性相关程度最强的一组是________.(填甲、乙、丙中的一个)
【答案】丙
【分析】利用相关系数与线性相关程度的关系可得答案.
【详解】两个变量与的回归模型中,
它们的相关系数越接近于1,这个模型的两个变量线性相关程度就越强,
在甲、乙、丙中,所给的数值中的绝对值最接近1,
所以丙的线性相关程度最强.
故答案为:丙
9.(25-26高二上·全国·课前预习)设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示:
变量x
…
变量y
…
两组数据和的__________是度量两个变量x与y之间线性相关程度的统计量,其计算公式为,其中,,,它们分别是这两组数据的算术平均数.
【答案】线性相关系数
【分析】利用线性相关系数的定义分析即可.
【详解】根据相关系数的定义,,
其中,,,它们分别是这两组数据的算术平均数.
和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量.
故答案为:线性相关系数
10.(25-26高三上·贵州贵阳·月考)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
【答案】(1),很强的线性正相关关系
(2)
X
80
150
210
P
【详解】(1)由题意,,,
则,
由,
同理,
则,
则,
由接近1且为正,故变量x与y之间有很强的线性正相关关系.
(2)由题意,X的可能取值为80、150、210,
则,,
,
故X的分布列为:
X
80
150
210
P
则.
11.(2025·河北沧州·模拟预测)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.我国于2020年打赢了脱贫攻坚战,其中小麦发挥了重大作用.以2020年为第1年,我国连续5年小麦产量如下:
年份
1
2
3
4
5
产量/千万吨
13.4
13.7
13.8
13.6
14.0
现规定表示第i年的年份,表示第i年的产量,经计算得,,.
(1)求样本(,2,…,5)的相关系数(精确到0.01);
(2)现从这5年中随机抽取2年,记这2年中共有X年的小麦产量不低于13.7千万吨,求X的分布列与期望.
附:样本相关系数,.
【答案】(1)
(2)分布列见解析,
【分析】(1)先求出平均值,再应用已知数据结合相关系数公式计算求解;
(2)根据超几何分布求出概率,再写出分布列应用数学期望公式计算即可.
【详解】(1),,
故样本相关系数.
(2)X的取值可以为0,1,2,
则,
,
,
于是X的分布列为
X
0
1
2
P
故.
12.(25-26高三上·湖北宜昌·月考)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,.
(1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度;
(2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列.
附:相关系数.
【答案】(1),相关性强
(2)分布列见解析
【分析】(1)由条件结合相关系数公式求出相关系数,根据相关系数性质判断结论;
(2)由条件确定的可能取值,再求取各值的概率,由此可得其分布列.
【详解】(1)样本的相关系数为
.
由于相关系数,则相关性很强,的值越大,相关性越强.
故,故销售金额和月份编号成很强的正相关性.
(2)由题意得:的可能取值为0,1,2,
20个月中有8个月的销售金额低于平均数,有12个月的销售金额不低于平均数,
所以,
所以的分布列为:
0
1
2
1 / 1
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。