8.1 成对数据的统计相关性【4大题型】讲义-2025-2026学年高二下学期数学人教A版选择性必修第三册

2026-04-29
| 2份
| 36页
| 433人阅读
| 11人下载
普通

资源信息

学段 高中
学科 数学
教材版本 高中数学人教A版选择性必修第三册
年级 高二
章节 8.1 成对数据的统计相关性
类型 教案-讲义
知识点 -
使用场景 同步教学-新授课
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 3.39 MB
发布时间 2026-04-29
更新时间 2026-04-29
作者 热爱数学者
品牌系列 -
审核时间 2026-04-29
下载链接 https://m.zxxk.com/soft/57624467.html
价格 1.50储值(1储值=1元)
来源 学科网

内容正文:

8.1 成对数据的统计相关性 题型预览 题型一 判断两个变量是否有相关关系 题型二 判断正、负相关 题型三 相关系数的意义及辨析 题型四 相关系数的计算 知识清单 变量间的相关关系 相关关系的定义:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.两个变量之间的关系分为函数关系和相关关系. 【注意】相关关系与函数关系的异同点 (1)相同点:均是指两个变量的关系 (2)不同点:函数关系是一种确定的关系,而相关关系是一种非确定关系 散点图及其应用 (1)散点图:为直观地描述成对样本数据中两个变量间的关系,用横轴表示其中的一个变量,纵轴表示另一个变量,则成对样本数据都可以用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图. (2)散点图的作用 如果散点图中变量的对应点分布在某条曲线的附近,我们就可以得出结论:这两个变量具有相关性,如图(1)(2).如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关性,如图(3). (3)正相关与负相关 从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关. (4)线性相关与曲线相关 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关. 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关. 样本相关系数 (1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多. (2)样本相关系数r=. (3)样本相关系数r的取值范围为[-1,1]. 当|r|越接近1时,成对样本数据的线性相关程度越强; 当|r|越接近0时,成对样本数据的线性相关程度越弱. 【注意】 样本相关系数r是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征: 当r>0时,称成对样本数据正相关; 当r<0时,称成对样本数据负相关; 当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系. 当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系. 题型突破 题型一 判断两个变量是否有相关关系 1.(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是(   ) A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式 B.光照时间和果树产量 C.降雪量和交通事故的发生率 D.土地施用肥料量和粮食产量 2.(25-26高二下·全国·课堂例题)(多选)在下列各变量之间的关系中,属于相关关系的是(    ) A.汽车的重量和百公里耗油量 B.正n边形的边数与内角度数之和 C.一块农田的小麦产量与施肥量 D.家庭的经济条件与学生的学习成绩 3.(25-26高二下·全国·课堂例题)下列关系中,属于相关关系的是________.(填序号) ①扇形的半径与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③出租车费与行驶的里程; ④降雪量与交通事故的发生率之间的关系. 4.(25-26高二·全国·寒假作业)有下列关系; ①炼钢时钢水的含碳量与冶炼时间的关系; ②曲线上的点与该点的坐标之间的关系; ③柑橘的产量与气温之间的关系; ④森林的同一种树木,其横断面积直径与高度之间的关系. 其中具有相关关系的是__________.(填序号) 题型二 判断正、负相关 5.(2026·辽宁抚顺·一模)(多选)年我国粮食产量(单位:万吨)如图所示,下列结论正确的是(   ) A.年我国粮食产量逐年增加 B.年我国粮食产量的中位数为万吨 C.年我国粮食产量的极差为万吨 D.年我国粮食产量与年份负相关 6.(24-25高二下·天津西青·期末)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是(   ) A. B. C. D. 7.(2025高二·全国·专题练习)(多选)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有线性相关关系的是(  ) A. B. C. D. 8.(2025高三·全国·专题练习)某公司2018-2023年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示. 年份 2018 2019 2020 2021 2022 2023 x/百万元 12.2 14.6 16.0 18.0 20.4 22.3 y/百万元 0.62 0.74 0.81 0.89 1.00 1.11 根据统计资料,年利润中位数(    ) A.是16,x与y有正线性相关关系 B.是17,x与y有正线性相关关系 C.是17,x与y有负线性相关关系 D.是18,x与y有负线性相关关系 9.(2026高三·全国·专题练习)(多选)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得经验回归方程,分别得到以下四个结论,其中一定错误的是(   ) A.y与x负相关且 B.y与x负相关且 C.y与x正相关且 D.y与x正相关且 10.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断(   ) A.变量与正相关,与正相关 B.变量与正相关,与负相关 C.变量与负相关,与正相关 D.变量与负相关,与负相关 题型三 相关系数的意义及辨析 11.(25-26高三下·湖南长沙·月考)在研究线性回归模型时,样本数据所对应的点均在直线上,则解释变量和响应变量之间的相关系数(  ) A. B. C.0 D.1 12.(25-26高二下·浙江宁波·期中)(多选)下列说法正确的是(   ) A.1,2,4,5,6,12,18,20的上四分位数是15 B.样本相关系数越大,则线性相关性越强 C.随机变量X的方差,期望,则 D.若随机变量X服从正态分布,且,则 13.(25-26高三下·上海·月考)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是(   ) A. B. C. D. 14.(25-26高二下·江苏南通·月考)(多选)下列结论正确的是(    ) A.随机变量X 服从二项分布,Y = 2X +1 ,则D(Y) = 3 B.相关系数 r 的值越小,两个变量之间的线性相关性越弱 C.在线性回归分析中,若 值越小则模型的拟合效果越好 D.随机变量X 服从正态分布 ,且P(2 < X < 5 ) = a ,则 15.(2026·浙江嘉兴·二模)(多选)下列说法正确的是(   ) A.数据9,10,10,11,12,14,16,17,19,21的第60百分位数为14 B.对于随机事件A与B,若,则事件A与B相互独立 C.已知一组样本数据的平均值为5,极差为7,中位数为6,则数据的平均值为9,极差为14,中位数为11 D.若成对样本数据的线性相关程度越强,则样本相关系数越接近1 16.(25-26高三下·上海·月考)下图是某城市在2025年元月至十月的最低气温(单位:℃)和最高气温(单位:℃)的散点图.定义各月的温差为该月的最高气温减去最低气温.若最低气温和最高气温的线性相关系数为,最低气温和温差的线性相关系数为,则下列说法正确的是(   ) A.,且 B.,且 C.,且 D.,且 题型四 相关系数的计算 17.(2026·湖南岳阳·二模)某高校快递站统计了某年度新学期前5天的取件人数y(单位:人),得到如下样本数据: 天数(序号)x 1 2 3 4 5 每日取件人数 120 100 80 70 55 (1)计算样本相关系数r,并据此判断变量x与y之间线性相关关系的强弱(结果保留两位小数); (2)从这5天中随机选取3天,记X为所选日期中取件人数小于100的天数,求X的分布列与数学期望. 注: (1)样本的相关系数 (2)参考数据: 18.(2026·江西·一模)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后18个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额数量(单位:万元),并计算得, . (1)求样本的相关系数(精确到0.01),并推断销售金额(单位:万元)和月份编号是否线性相关(当时,即可认为线性相关); (2)已知这18个月中有10个月的销售金额高于平均数,从这18个月中随机抽取2个月的销售金额,记抽到销售金额高于平均数的月份数为,求随机变量的分布列. 附:相关系数. 19.(2026高三·全国·专题练习)我国新能源汽车迅速崛起,成为推动绿色革命的核心引擎.某品牌新能源汽车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示: 令,数据经过初步处理得:,,,,,,.现有①和②两种模型作为年销售量关于年广告费的回归分析模型,其中均为常数.请从样本相关系数的角度,分析哪一个模型拟合程度更好? 参考数据:,. 相关系数. 20.(25-26高二下·全国·课堂例题)为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示: 人员编号 1 2 3 4 5 6 7 8 BMI值x 25 27 30 32 33 35 40 42 TC指标值y 5.3 5.4 5.5 5.6 5.7 6.5 6.9 7.1 GLU指标值z 6.7 7.2 7.3 8.0 8.1 8.6 9.0 9.1 用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度. 参考公式: 相关系数, 参考数据:,,,,,,,. 21.(25-26高二下·全国·课堂例题)现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示. 学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 请问:这10名学生的两次数学成绩是否具有较强的线性相关关系? 注:; 若,则我们可以认为y与x之间具有较强的线性相关关系. 22.(25-26高三上·西藏拉萨·月考)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示. 年份代码 1 2 3 4 5 产量/千万吨 13.4 13.6 13.8 13.7 14.0 现规定表示年份代码,表示年份代码为的产量,经计算得,, (1)求样本的相关系数;(精确到0.01) (2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望. 附:相关系数,. 强化训练 1.(25-26高二下·全国·课堂例题)下列两个变量之间,是相关关系的有(    ) ①角度与它的余弦值;②人的体重与视力;③正n边形的边数和它的内角度数之和;④圆心角的大小与所对的圆弧长;⑤光照时间和果树亩产量;⑥收入水平与购买能力;⑦正方体的棱长与体积. A.①④⑥ B.②⑤⑥⑦ C.⑤⑥ D.③⑤⑦ 2.(24-25高二下·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是(    ) A.B.C. D. 3.(16-17高二上·河北石家庄·月考)观察下列散点图,其中两个变量的相关关系判断正确的是(   )    A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关 C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关 4.(25-26高二下·辽宁沈阳·月考)下列说法中,正确的是(    ) A.两个随机变量的线性相关程度越强,相关系数越接近于1 B.两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量相互独立的可能性就越大 C.随机变量服从正态分布,若,则实数 D.若随机变量的方差,则 5.(25-26高二下·安徽淮北·月考)(多选)下列结论正确的有(    ) A.若随机变量,,则 B.若随机变量,则 C.样本相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱 D.如果随机变量服从,且,那么是上的增函数 6.(2026·浙江嘉兴·二模)(多选)下列命题中,正确的是(    ) A.数据27,12,14,30,15,17,19,23的第70百分位数是23 B.若回归方程为,则变量y与x成负相关 C.若随机变量X服从正态分布,则 D.样本相关系数,有时也称样本线性相关系数,刻画了样本点集中于某条直线的程度,当时,则表明成对样本数据间没有线性相关关系 7.(25-26高三上·四川内江·月考)(多选)下列有关说法正确的有(    ) A.设随机变量服从正态分布,若,则 B.记两个变量的样本相关系数为,若越大,线性相关程度越强 C.已知随机变量,则 D.数据1,3,9,4,5,16,7,11的中位数为7 8.(25-26高二下·全国·单元测试)若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.93,0.42,,则线性相关程度最强的一组是________.(填甲、乙、丙中的一个) 9.(25-26高二上·全国·课前预习)设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示: 变量x … 变量y … 两组数据和的__________是度量两个变量x与y之间线性相关程度的统计量,其计算公式为,其中,,,它们分别是这两组数据的算术平均数. 10.(25-26高三上·贵州贵阳·月考)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示: 年份代码x 1 2 3 4 5 App在线用户数y(单位:万) 80 150 210 260 300 (1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱: (2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望. 注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,. 11.(2025·河北沧州·模拟预测)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.我国于2020年打赢了脱贫攻坚战,其中小麦发挥了重大作用.以2020年为第1年,我国连续5年小麦产量如下: 年份 1 2 3 4 5 产量/千万吨 13.4 13.7 13.8 13.6 14.0 现规定表示第i年的年份,表示第i年的产量,经计算得,,. (1)求样本(,2,…,5)的相关系数(精确到0.01); (2)现从这5年中随机抽取2年,记这2年中共有X年的小麦产量不低于13.7千万吨,求X的分布列与期望. 附:样本相关系数,. 12.(25-26高三上·湖北宜昌·月考)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,. (1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度; (2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列. 附:相关系数. 1 / 1 学科网(北京)股份有限公司 $ 8.1 成对数据的统计相关性 题型预览 题型一 判断两个变量是否有相关关系 题型二 判断正、负相关 题型三 相关系数的意义及辨析 题型四 相关系数的计算 知识清单 变量间的相关关系 相关关系的定义:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.两个变量之间的关系分为函数关系和相关关系. 【注意】相关关系与函数关系的异同点 (1)相同点:均是指两个变量的关系 (2)不同点:函数关系是一种确定的关系,而相关关系是一种非确定关系 散点图及其应用 (1)散点图:为直观地描述成对样本数据中两个变量间的关系,用横轴表示其中的一个变量,纵轴表示另一个变量,则成对样本数据都可以用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图. (2)散点图的作用 如果散点图中变量的对应点分布在某条曲线的附近,我们就可以得出结论:这两个变量具有相关性,如图(1)(2).如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关性,如图(3). (3)正相关与负相关 从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关. (4)线性相关与曲线相关 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关. 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关. 样本相关系数 (1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多. (2)样本相关系数r=. (3)样本相关系数r的取值范围为[-1,1]. 当|r|越接近1时,成对样本数据的线性相关程度越强; 当|r|越接近0时,成对样本数据的线性相关程度越弱. 【注意】 样本相关系数r是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征: 当r>0时,称成对样本数据正相关; 当r<0时,称成对样本数据负相关; 当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系. 当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系. 题型突破 题型一 判断两个变量是否有相关关系 1.(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是(   ) A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式 B.光照时间和果树产量 C.降雪量和交通事故的发生率 D.土地施用肥料量和粮食产量 【答案】A 【分析】根据相关关系的定义可得. 【详解】选项B,C,D中的两个变量都具有相关性,且都是一种不确定的关系,是相关关系. 而A中判别式和变量是一种确定的表达式,是一种函数关系,即一种确定的关系,所以不是相关关系. 故选:A 2.(25-26高二下·全国·课堂例题)(多选)在下列各变量之间的关系中,属于相关关系的是(    ) A.汽车的重量和百公里耗油量 B.正n边形的边数与内角度数之和 C.一块农田的小麦产量与施肥量 D.家庭的经济条件与学生的学习成绩 【答案】AC 【分析】根据相关关系与函数关系的概念,可得答案. 【详解】汽车的重量越大,百公里耗油量会越多.一般来说,农田的施肥量越大,小麦产量一般会越多. 可得A、C是相关关系.B是函数关系.D中家庭的经济条件与学生的学习成绩之间不是相关关系,也不是函数关系. 故选:AC. 3.(25-26高二下·全国·课堂例题)下列关系中,属于相关关系的是________.(填序号) ①扇形的半径与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③出租车费与行驶的里程; ④降雪量与交通事故的发生率之间的关系. 【答案】②④ 【分析】利用相关关系的定义求解. 【详解】在①中,扇形的半径与面积之间的关系是函数关系; 在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系; ③为确定的函数关系; 在④中,降雪量与交通事故的发生率之间具有相关关系. 故答案为:②④. 4.(25-26高二·全国·寒假作业)有下列关系; ①炼钢时钢水的含碳量与冶炼时间的关系; ②曲线上的点与该点的坐标之间的关系; ③柑橘的产量与气温之间的关系; ④森林的同一种树木,其横断面积直径与高度之间的关系. 其中具有相关关系的是__________.(填序号) 【答案】①③④ 【分析】根据相关关系的定义,逐一分析每个关系是否为不确定的依存关系,从而确定具有相关关系的序号. 【详解】相关关系是变量间不确定的依存关系,非函数关系. ①炼钢时钢水含碳量与冶炼时间,存在不确定依存,是相关关系; ②曲线上点与坐标是一一对应函数关系,不是相关关系; ③柑橘产量与气温,存在不确定依存,是相关关系; ④树木横断面直径与高度,存在不确定依存,是相关关系. 故答案为:①③④ 题型二 判断正、负相关 5.(2026·辽宁抚顺·一模)(多选)年我国粮食产量(单位:万吨)如图所示,下列结论正确的是(   ) A.年我国粮食产量逐年增加 B.年我国粮食产量的中位数为万吨 C.年我国粮食产量的极差为万吨 D.年我国粮食产量与年份负相关 【答案】AB 【分析】利用条形图结合中位数、极差以及相关性逐项判断即可. 【详解】对于A选项,年我国粮食产量逐年增加,A正确. 对于B选项,年我国粮食产量的中位数为万吨,B正确. 对于C选项,年我国粮食产量的极差为万吨,C错误. 对于D选项,年我国粮食产量与年份正相关,D错误. 6.(24-25高二下·天津西青·期末)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是(   ) A. B. C. D. 【答案】D 【分析】由散点图的特征,结合相关系数的定义即可得到答案. 【详解】由散点图的趋势可知,,,, 又图一的散点图比图三的散点图更为集中,则,所以, 又图二的散点图比图四的散点图更为集中,则,所以, 所以. 故选:D. 7.(2025高二·全国·专题练习)(多选)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有线性相关关系的是(  ) A. B. C. D. 【答案】BC 【分析】根据散点图的特征逐一验证即可得到答案. 【详解】由题意, 对于A:散点杂乱无章,无规律可言,看不出两个变量有什么相关性;故A错误; 对于B:呈正相关关系,分布在一条直线附近,具有线性相关关系;故B正确; 对于C:两个变量具有负相关关系,分布在一条直线附近,具有线性相关关系;故C正确; 对于D:两个变量具有相关性,但不是正相关,也不是负相关,故D错误. 故选:BC. 8.(2025高三·全国·专题练习)某公司2018-2023年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示. 年份 2018 2019 2020 2021 2022 2023 x/百万元 12.2 14.6 16.0 18.0 20.4 22.3 y/百万元 0.62 0.74 0.81 0.89 1.00 1.11 根据统计资料,年利润中位数(    ) A.是16,x与y有正线性相关关系 B.是17,x与y有正线性相关关系 C.是17,x与y有负线性相关关系 D.是18,x与y有负线性相关关系 【答案】B 【分析】根据数据分析可直接得出结论. 【详解】由题意,利润中位数是, 而且随着利润x的增加,广告支出y也在增加,故x与y有正线性相关关系. 故选:B. 9.(2026高三·全国·专题练习)(多选)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得经验回归方程,分别得到以下四个结论,其中一定错误的是(   ) A.y与x负相关且 B.y与x负相关且 C.y与x正相关且 D.y与x正相关且 【答案】AD 【分析】由负相关、正相关的概念逐个判断即可; 【详解】对于A:由可知y与x正相关,错误; 对于B:由可知y与x负相关,正确; 对于C:由可知y与x正相关,正确; 对于D:由可知y与x负相关,错误; 故选:AD 10.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断(   ) A.变量与正相关,与正相关 B.变量与正相关,与负相关 C.变量与负相关,与正相关 D.变量与负相关,与负相关 【答案】B 【分析】根据散点图点的变化关系确定正负相关性即可. 【详解】由变量,的散点图,知随增大,也增大,变量与正相关, 由变量,的散点图,知随增大,减小,与负相关. 故选:B 题型三 相关系数的意义及辨析 11.(25-26高三下·湖南长沙·月考)在研究线性回归模型时,样本数据所对应的点均在直线上,则解释变量和响应变量之间的相关系数(  ) A. B. C.0 D.1 【答案】D 【详解】由题意知,样本数据所对应的点均在直线上,而直线的斜率, 说明解释变量和响应变量之间正相关,即,且线性相关程度达到最强,所以. 12.(25-26高二下·浙江宁波·期中)(多选)下列说法正确的是(   ) A.1,2,4,5,6,12,18,20的上四分位数是15 B.样本相关系数越大,则线性相关性越强 C.随机变量X的方差,期望,则 D.若随机变量X服从正态分布,且,则 【答案】ACD 【详解】1,2,4,5,6,12,18,20该组数据共8个数据,又, 因此上四分位数为第6个数和第7个数的平均数,即,所以A正确; 样本相关系数的绝对值越大,则线性相关性越强,所以B错误; 因为,由方差,期望,可得,所以C正确; 因为且,所以, 所以,所以D正确. 13.(25-26高三下·上海·月考)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是(   ) A. B. C. D. 【答案】B 【详解】图①,数据点呈正线性相关,且相关性很强,所以接近1; 图②,数据点呈负线性相关,且相关性很强,所以接近; 图③,数据点呈正线性相关,且相关性比图①弱,所以; 图④,数据点呈负线性相关,且相关性比图②弱,所以; 所以. 14.(25-26高二下·江苏南通·月考)(多选)下列结论正确的是(    ) A.随机变量X 服从二项分布,Y = 2X +1 ,则D(Y) = 3 B.相关系数 r 的值越小,两个变量之间的线性相关性越弱 C.在线性回归分析中,若 值越小则模型的拟合效果越好 D.随机变量X 服从正态分布 ,且P(2 < X < 5 ) = a ,则 【答案】AD 【详解】对于A,,A正确; 对于B,相关系数 的值越小,两个变量之间的线性相关性越弱,B错误; 对于C,在线性回归分析中,若 值越大则模型的拟合效果越好,C错误; 对于D,正态曲线关于直线对称,所以, 又,所以,D正确. 15.(2026·浙江嘉兴·二模)(多选)下列说法正确的是(   ) A.数据9,10,10,11,12,14,16,17,19,21的第60百分位数为14 B.对于随机事件A与B,若,则事件A与B相互独立 C.已知一组样本数据的平均值为5,极差为7,中位数为6,则数据的平均值为9,极差为14,中位数为11 D.若成对样本数据的线性相关程度越强,则样本相关系数越接近1 【答案】BC 【分析】利用百分位数定义计算可得A;利用对立事件概率公式与相互独立事件定义计算可得B;利用平均数、极差与中位数的性质计算可得C;利用相关系数定义可得D. 【详解】对A:,故这组数据的第60百分位数为,故A错误; 对B:由,则, 故事件A与B相互独立,故B正确; 对C:新数据的平均值为,极差为, 中位数为,故C正确; 对D:若成对样本数据的线性相关程度越强,则样本相关系数的绝对值越接近,故D错误. 16.(25-26高三下·上海·月考)下图是某城市在2025年元月至十月的最低气温(单位:℃)和最高气温(单位:℃)的散点图.定义各月的温差为该月的最高气温减去最低气温.若最低气温和最高气温的线性相关系数为,最低气温和温差的线性相关系数为,则下列说法正确的是(   ) A.,且 B.,且 C.,且 D.,且 【答案】D 【分析】根据线性相关系数的性质与线性相关程度判断即可. 【详解】由散点图可得,随着最低气温的升高,最高气温也升高,所以最低气温和最高气温成正相关,故. 因温差最高气温最低气温,由图知,随着最低气温不断升高,最高气温升高幅度相对较小, 故温差逐渐减小,即最低气温和温差成负相关,故. 由散点图可以看出,最低气温与最高气温的线性相关程度较强,最低气温与温差的线性相关程度较弱, 根据线性相关系数的性质,值越接近1,随机变量之间的线性相关程度越强;值越接近0,随机变量之间的线性相关程度越弱.由上分析,可得. 题型四 相关系数的计算 17.(2026·湖南岳阳·二模)某高校快递站统计了某年度新学期前5天的取件人数y(单位:人),得到如下样本数据: 天数(序号)x 1 2 3 4 5 每日取件人数 120 100 80 70 55 (1)计算样本相关系数r,并据此判断变量x与y之间线性相关关系的强弱(结果保留两位小数); (2)从这5天中随机选取3天,记X为所选日期中取件人数小于100的天数,求X的分布列与数学期望. 注: (1)样本的相关系数 (2)参考数据: 【答案】(1);变量x与y之间具有很强的线性相关关系 (2)分布列见解析;期望:1.8 【分析】(1)使用相关系数计算公式求相关系数,根据求解结果判断线性相关关系的强弱; (2)结合超几何分布的概率公式求分布列,再由期望公式求期望. 【详解】(1),, , , , 样本相关系数: , 因为非常接近1,所以变量x与y之间具有很强的线性相关关系. (2)5天中取件人数小于100的天数有3天, 从这5天中随机选取3天,的可能取值为1,2,3. , , , 所以的分布列为: 1 2 3 的数学期望 18.(2026·江西·一模)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后18个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额数量(单位:万元),并计算得, . (1)求样本的相关系数(精确到0.01),并推断销售金额(单位:万元)和月份编号是否线性相关(当时,即可认为线性相关); (2)已知这18个月中有10个月的销售金额高于平均数,从这18个月中随机抽取2个月的销售金额,记抽到销售金额高于平均数的月份数为,求随机变量的分布列. 附:相关系数. 【答案】(1),具有很强的正相关性 (2) 0 1 2 【分析】(1)由条件结合相关系数公式求出相关系数,根据相关系数性质判断结论; (2)由条件确定的可能取值,再求取各值的概率,由此可得其分布列. 【详解】(1)样本的相关系数为: 由于相关系数,故销售金额(单位:万元)和月份编号具有很强的正相关性; (2)由题意得:的可能取值为0,1,2, 18个月中有10个月的销售金额高于平均数, 所以, , , 所以的分布列为: 0 1 2 19.(2026高三·全国·专题练习)我国新能源汽车迅速崛起,成为推动绿色革命的核心引擎.某品牌新能源汽车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示: 令,数据经过初步处理得:,,,,,,.现有①和②两种模型作为年销售量关于年广告费的回归分析模型,其中均为常数.请从样本相关系数的角度,分析哪一个模型拟合程度更好? 参考数据:,. 相关系数. 【答案】模型②的拟合程度更好 【分析】比较相关系数的大小即可得到结论. 【详解】设模型①和②的相关系数分别为, 由题意可得:, , 所以,由相关系数的意义可得,模型②的拟合程度更好. 20.(25-26高二下·全国·课堂例题)为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示: 人员编号 1 2 3 4 5 6 7 8 BMI值x 25 27 30 32 33 35 40 42 TC指标值y 5.3 5.4 5.5 5.6 5.7 6.5 6.9 7.1 GLU指标值z 6.7 7.2 7.3 8.0 8.1 8.6 9.0 9.1 用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度. 参考公式: 相关系数, 参考数据:,,,,,,,. 【答案】答案见解析 【分析】根据相关系数的计算结果来判断变量之间的相关性. 【详解】由题意,变量与的相关系数, 变量与的相关系数是, 可以看出TC指标值与BMI值,GLU指标值与BMI值都是高度正相关. 21.(25-26高二下·全国·课堂例题)现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示. 学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 请问:这10名学生的两次数学成绩是否具有较强的线性相关关系? 注:; 若,则我们可以认为y与x之间具有较强的线性相关关系. 【答案】这10名学生的两次数学成绩具有较强的线性相关关系 【分析】根据线性相关关系的概念,以及相关系数计算公式,求出相关系数,判断两组数据是否具有线性相关关系即可. 【详解】由题意知, , , ,,. 所以样本相关系数. ,故我们可以认为与之间具有较强的线性相关关系. 即这10名学生的两次数学成绩具有较强的线性相关关系. 22.(25-26高三上·西藏拉萨·月考)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示. 年份代码 1 2 3 4 5 产量/千万吨 13.4 13.6 13.8 13.7 14.0 现规定表示年份代码,表示年份代码为的产量,经计算得,, (1)求样本的相关系数;(精确到0.01) (2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望. 附:相关系数,. 【答案】(1) (2)分布列见解析, 【分析】(1)先求出平均值,再应用已知数据结合相关系数公式计算求解; (2)根据超几何分布求出概率,再写出分布列应用数学期望公式计算即可. 【详解】(1),, 故样本相关系数 . (2)X的取值可以为0,1,2, 则, , , 于是X的分布列为 X 0 1 2 P 故. 强化训练 1.(25-26高二下·全国·课堂例题)下列两个变量之间,是相关关系的有(    ) ①角度与它的余弦值;②人的体重与视力;③正n边形的边数和它的内角度数之和;④圆心角的大小与所对的圆弧长;⑤光照时间和果树亩产量;⑥收入水平与购买能力;⑦正方体的棱长与体积. A.①④⑥ B.②⑤⑥⑦ C.⑤⑥ D.③⑤⑦ 【答案】C 【分析】根据相关关系的概念判断即可. 【详解】①③④⑦是函数关系;②没有关系;⑤⑥是相关关系. 故选:C 2.(24-25高二下·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是(    ) A.B.C. D. 【答案】C 【分析】根据散点图的特征得到答案. 【详解】A中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性; B中呈正相关关系,C中两个变量具有负相关关系; D中两个变量具有相关性,但不是正相关,也不是负相关. 故选:C. 3.(16-17高二上·河北石家庄·月考)观察下列散点图,其中两个变量的相关关系判断正确的是(   )    A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关 C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关 【答案】D 【分析】根据散点图中点的分布特征,结合相关性的定义,即可得出结论. 【详解】根据散点图,由相关性可知:图a各点散布在从左下角到右上角的区域里,是正相关; 图b中各点分布不成带状,相关性不明确,所以不相关; 图c中各点分布在从左上方到右下方的区域里,是负相关. 故选:D 4.(25-26高二下·辽宁沈阳·月考)下列说法中,正确的是(    ) A.两个随机变量的线性相关程度越强,相关系数越接近于1 B.两个变量的2×2列联表中,对角线上数据的乘积相差越大,说明两个变量相互独立的可能性就越大 C.随机变量服从正态分布,若,则实数 D.若随机变量的方差,则 【答案】C 【详解】对于A,两个随机变量的线性相关程度越强,相关系数的绝对值越接近于1,故A错误; 对于B,两个变量的2×2列联表中,对角线上数据的乘积相差越小,说明两个变量相互独立的可能性就越大,故B错误; 对于C,随机变量服从正态分布,若, 则由正态分布的对称性可得,故C正确; 对于D,若随机变量的方差,则,故D错误. 5.(25-26高二下·安徽淮北·月考)(多选)下列结论正确的有(    ) A.若随机变量,,则 B.若随机变量,则 C.样本相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱 D.如果随机变量服从,且,那么是上的增函数 【答案】AD 【详解】对于选项A:因为随机变量,, 所以,故A正确; 对于选项B:因为随机变量,则, 所以,故B错误; 对于选项C:因为相关系数的绝对值的大小越接近,两个变量的线性相关性越强;反之线性相关性越弱,故C错误; 对于选项D:由正态曲线的性质可知,是上的增函数,故D正确. 6.(2026·浙江嘉兴·二模)(多选)下列命题中,正确的是(    ) A.数据27,12,14,30,15,17,19,23的第70百分位数是23 B.若回归方程为,则变量y与x成负相关 C.若随机变量X服从正态分布,则 D.样本相关系数,有时也称样本线性相关系数,刻画了样本点集中于某条直线的程度,当时,则表明成对样本数据间没有线性相关关系 【答案】ABD 【详解】将已知数据排序得12,14,15,17,19,23,27,30, 由,第六个数为23,即第70百分位数是23,故A正确; 由于,所以变量y与x成负相关,故B正确; 因为, 所以,故C错误; 当越小时,相关性越弱,所以当时,则表明成对样本数据间没有线性相关关系,故D正确. 7.(25-26高三上·四川内江·月考)(多选)下列有关说法正确的有(    ) A.设随机变量服从正态分布,若,则 B.记两个变量的样本相关系数为,若越大,线性相关程度越强 C.已知随机变量,则 D.数据1,3,9,4,5,16,7,11的中位数为7 【答案】AC 【详解】对A:因为,且,所以正态曲线的对称轴为,故A正确; 对B:两个变量的样本相关系数为,则越大,线性相关程度越强,故B错误; 对C:由,所以,故C正确; 对D:数据1,3,9,4,5,16,7,11从小到大顺序排列得:1,3,4,5,7,9,11,16, 其中位数是第4与第5两个数的平均数,为,故D错误. 8.(25-26高二下·全国·单元测试)若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.93,0.42,,则线性相关程度最强的一组是________.(填甲、乙、丙中的一个) 【答案】丙 【分析】利用相关系数与线性相关程度的关系可得答案. 【详解】两个变量与的回归模型中, 它们的相关系数越接近于1,这个模型的两个变量线性相关程度就越强, 在甲、乙、丙中,所给的数值中的绝对值最接近1, 所以丙的线性相关程度最强. 故答案为:丙 9.(25-26高二上·全国·课前预习)设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示: 变量x … 变量y … 两组数据和的__________是度量两个变量x与y之间线性相关程度的统计量,其计算公式为,其中,,,它们分别是这两组数据的算术平均数. 【答案】线性相关系数 【分析】利用线性相关系数的定义分析即可. 【详解】根据相关系数的定义,, 其中,,,它们分别是这两组数据的算术平均数. 和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量. 故答案为:线性相关系数 10.(25-26高三上·贵州贵阳·月考)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示: 年份代码x 1 2 3 4 5 App在线用户数y(单位:万) 80 150 210 260 300 (1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱: (2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望. 注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,. 【答案】(1),很强的线性正相关关系 (2) X 80 150 210 P 【详解】(1)由题意,,, 则, 由, 同理, 则, 则, 由接近1且为正,故变量x与y之间有很强的线性正相关关系. (2)由题意,X的可能取值为80、150、210, 则,, , 故X的分布列为: X 80 150 210 P 则. 11.(2025·河北沧州·模拟预测)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.我国于2020年打赢了脱贫攻坚战,其中小麦发挥了重大作用.以2020年为第1年,我国连续5年小麦产量如下: 年份 1 2 3 4 5 产量/千万吨 13.4 13.7 13.8 13.6 14.0 现规定表示第i年的年份,表示第i年的产量,经计算得,,. (1)求样本(,2,…,5)的相关系数(精确到0.01); (2)现从这5年中随机抽取2年,记这2年中共有X年的小麦产量不低于13.7千万吨,求X的分布列与期望. 附:样本相关系数,. 【答案】(1) (2)分布列见解析, 【分析】(1)先求出平均值,再应用已知数据结合相关系数公式计算求解; (2)根据超几何分布求出概率,再写出分布列应用数学期望公式计算即可. 【详解】(1),, 故样本相关系数. (2)X的取值可以为0,1,2, 则, , , 于是X的分布列为 X 0 1 2 P 故. 12.(25-26高三上·湖北宜昌·月考)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,. (1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度; (2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列. 附:相关系数. 【答案】(1),相关性强 (2)分布列见解析 【分析】(1)由条件结合相关系数公式求出相关系数,根据相关系数性质判断结论; (2)由条件确定的可能取值,再求取各值的概率,由此可得其分布列. 【详解】(1)样本的相关系数为 . 由于相关系数,则相关性很强,的值越大,相关性越强. 故,故销售金额和月份编号成很强的正相关性. (2)由题意得:的可能取值为0,1,2, 20个月中有8个月的销售金额低于平均数,有12个月的销售金额不低于平均数, 所以, 所以的分布列为: 0 1 2 1 / 1 学科网(北京)股份有限公司 $

资源预览图

8.1  成对数据的统计相关性【4大题型】讲义-2025-2026学年高二下学期数学人教A版选择性必修第三册
1
8.1  成对数据的统计相关性【4大题型】讲义-2025-2026学年高二下学期数学人教A版选择性必修第三册
2
8.1  成对数据的统计相关性【4大题型】讲义-2025-2026学年高二下学期数学人教A版选择性必修第三册
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。