题海探秘11 成对数据的统计相关性讲义-2025-2026学年高二下学期数学《题海探秘》同步考点复习指南(人教A版选择性必修第三册)

2026-05-15
| 2份
| 39页
| 226人阅读
| 7人下载
普通
初高中数学题海探秘
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 高中数学人教A版选择性必修第三册
年级 高二
章节 8.1 成对数据的统计相关性,8.1.1 变量的相关关系,8.1.2 样本相关系数
类型 教案-讲义
知识点 -
使用场景 同步教学-新授课
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 4.99 MB
发布时间 2026-05-15
更新时间 2026-05-15
作者 初高中数学题海探秘
品牌系列 -
审核时间 2026-05-15
下载链接 https://m.zxxk.com/soft/57879351.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

2025-2026高二下学期数学《题海探秘》同步考点复习指南(人教A版2019选择性必修第三册) 题海探秘11 成对数据的统计相关性 6考点复习指南 1.变量的相关关系 (1)函数关系 函数关系是一种确定性关系,常用解析式来表示. (2)相关关系 两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关 系.与函数关系不同,相关关系是一种非确定性关系. 2.散点图 (1)散点图 成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图. (2)正相关和负相关 如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个 变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关. 3.线性相关 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线 性相关. 4.样本相关系数 (1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(,),(,),,(,),利用 相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式: (其中,,,和,,,的均值分别为和). ①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小; 当其中一个数据的值变大时,另一个数据的值通常也变大. ②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大; 当其中一个数据的值变大时,另一个数据的值通常会变小. 考点1 相关关系与函数关系的概念及辨析 1.(2026高二·河北沧州·期中)下列关系中,属于相关关系的是______(填序号). ①球的体积与该球的半径之间的关系; ②农作物的产量与施肥量之间的关系; ③一般情况下,一个人的身高和体重之间的关系. 【答案】②③ 【详解】在①中,球的体积与该球的半径之间是函数关系,不是相关关系; 在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系; 在③中,一般情况下,一个人的身高和体重是正相关关系. 2.(2026高二·全国·课后作业)下面变量之间是相关关系的是(   ) A.出租车费与行驶的里程 B.正方形面积与边长 C.人的身高与体重 D.铁的体积与质量 【答案】C 【分析】根据相关关系的概念逐项判断即可. 【详解】由相关关系可知C选项是相关关系,ABD选项都是函数关系. 故选:C. 3.【多选】(2026高二·全国·课堂例题)在下列各变量之间的关系中,属于相关关系的是(    ) A.汽车的重量和百公里耗油量 B.正n边形的边数与内角度数之和 C.一块农田的小麦产量与施肥量 D.家庭的经济条件与学生的学习成绩 【答案】AC 【分析】根据相关关系与函数关系的概念,可得答案. 【详解】汽车的重量越大,百公里耗油量会越多.一般来说,农田的施肥量越大,小麦产量一般会越多. 可得A、C是相关关系.B是函数关系.D中家庭的经济条件与学生的学习成绩之间不是相关关系,也不是函数关系. 故选:AC. 4.(2026高二·全国·课堂例题)下列两个变量之间,是相关关系的有(    ) ①角度与它的余弦值;②人的体重与视力;③正n边形的边数和它的内角度数之和;④圆心角的大小与所对的圆弧长;⑤光照时间和果树亩产量;⑥收入水平与购买能力;⑦正方体的棱长与体积. A.①④⑥ B.②⑤⑥⑦ C.⑤⑥ D.③⑤⑦ 【答案】C 【分析】根据相关关系的概念判断即可. 【详解】①③④⑦是函数关系;②没有关系;⑤⑥是相关关系. 故选:C 5.【多选】(2026高二·全国·课后作业)下列两个变量之间的关系,是函数关系的有(    ) A.球的体积和它的半径 B.人的身高和体重 C.底面积为定值的长方体的体积和高 D.城镇居民的消费水平和平均工资 【答案】AC 【分析】根据函数的概念及相关关系的特征进行判断. 【详解】球的体积公式为,长方体的体积,都是确定的关系, 因此A、C中两个变量为函数关系,而B、D中的两个变量,不是函数关系而是相关关系. 故选:AC. 考点2 判断两个变量是否有相关关系 6.(2026高二·全国·专题练习)在下列各图中,两个变量具有相关关系的是(    ). A.①② B.①③ C.② D.②③ 【答案】D 【分析】根据函数关系和相关关系的概念,结合图象作出判断. 【详解】对于①,所有的点都在曲线上,具有函数关系; 对于②,所有的散点分布在一条直线附近,具有相关关系: 对于③,所有的散点分布在一条曲线附近,具有相关关系; 对于④,所有的散点杂乱无章,不具有相关关系, 故选:D. 7.(2026高一·陕西咸阳·月考)如图,两个变量具有相关关系的是(    ) A.(1)(3) B.(1)(4) C.(2)(4) D.(2)(3) 【答案】B 【分析】根据相关关系等知识确定正确答案. 【详解】具有相关关系的是(1)(4), (2)是确定关系,(3)不具有相关关系. 故选:B 8.(2026高二·上海·课后作业)若已知下列各组数据,它们是否可以看作成对数据?是否可以进行相关分析?判断并简要说明理由. (1)校学生的身高与校学生的体重; (2)人体内的脂肪含量与体重; (3)某班学生的物理成绩与数学成绩. 【答案】(1)不可以,不可以,理由见解析 (2)可以,可以,理由见解析 (3)可以,可以,理由见解析 【分析】根据两个变量是否具有相关关系,可得答案. 【详解】(1)校学生的身高与校学生的体重毫无关系,因此不能看成成对数据,不能进行相关分析. (2)人体内的脂肪含量与体重具有相关关系,因此可以看作成对数据,可以进行相关分析. (3)某班学生的物理成绩与数学成绩具有相关关系,因此可以看作成对数据,可以进行相关分析. 考点3 利用散点图判断正、负相关 9.(2026高二·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是(    ) A.B. C.D. 【答案】C 【分析】根据散点图的特征得到答案. 【详解】A中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性; B中呈正相关关系,C中两个变量具有负相关关系; D中两个变量具有相关性,但不是正相关,也不是负相关. 故选:C. 10.(2026·天津河西·模拟预测)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断(   ) A.变量与正相关,与正相关 B.变量与正相关,与负相关 C.变量与负相关,与正相关 D.变量与负相关,与负相关 【答案】B 【分析】根据散点图点的变化关系确定正负相关性即可. 【详解】由变量,的散点图,知随增大,也增大,变量与正相关, 由变量,的散点图,知随增大,减小,与负相关. 故选:B 11.(2026高二·广西钦州·期末)变量x与y的成对样本数据的散点图如下图所示,据此可以推断变量x与y之间(    )    A.可能存在负相关B.可能存在正相关 C.一定存在正相关 D.一定存在负相关 【答案】A 【分析】根据散点图以及相关关系的定义判断即可. 【详解】解:从散点图看,这些点在一条线的附近,且从左上角到右下角呈递减的趋势,所以据此可以推断变量x与y之间可能存在负相关, 故选:A. 考点4 样本相关系数的意义及辨析 12.(2026高二·北京东城·期末)某校学生科研兴趣小组为了解1~12岁儿童的体质健康情况,随机调查了20名儿童的相关数据,分别制作了肺活量、视力、肢体柔韧度、BMI指数和身高之间的散点图,则与身高之间具有正相关关系的是(    ) A.肺活量 B.视力 C.肢体柔韧度 D.BMI指数 【答案】A 【分析】根据给定的散点图,结合正相关的意义判断即得. 【详解】对于A,儿童的身高越高,其肺活量越大,肺活量与身高具有正相关关系,A正确; 对于B,儿童的视力随身高的增大先增大,后减小,视力与身高不具有正相关关系,B错误; 对于C,肢体柔韧度随身高增大而减小,肢体柔韧度与身高不具有正相关关系,C错误; 对于D,BMI指数与身高的相关性很弱,不具有正相关关系,D错误. 故选:A 13.(2026·上海)根据身高和体重散点图,下列说法正确的是(    ) A.身高越高,体重越重 B.身高越高,体重越轻 C.身高与体重成正相关 D.身高与体重成负相关 【答案】C 【分析】根据给定的散点图的特征,直接判断作答. 【详解】由于身高比较高的人,其体重可能大,也可能小,则选项AB不正确; 由散点图知,身高和体重有明显的相关性,且身高增加时,体重也呈现增加的趋势, 所以身高与体重呈正相关,C正确,D错误. 故选:C 14.(2026高二·河南南阳·期中)已知,,,四组成对样本数据对应的线性相关系数分别为-0.95,-0.82,0.86,0.93,则线性相关程度最弱的是(    ) A.组 B.组 C.组 D.组 【答案】B 【分析】由线性相关系数的性质判断即可得. 【详解】因为,所以线性相关程度最弱的是组. 15.(2026高二·上海·阶段检测)通过随机抽样绘制得到如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.下列说法正确的是(   ). A.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变大 B.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变小 C.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变大 D.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变小 【答案】B 【详解】改变变量的单位,线性相关系数不变,C、D错; 去除A点后,线性相关程度变高, 因为是负相关,所以线性相关系数变小,故A错误、B正确. 16.(2026高三·上海虹口·月考)分别对、、三组成对数据做相关性分析,计算出其对应的相关系数分别为、,,则、、三组相关性的强弱从弱到强排序依次为________. 【答案】 【详解】已知三组相关系数的绝对值为:,,, , 、、三组相关性的强弱从弱到强排序依次为. 17.(2026·四川·模拟预测)对于变量有观测数据,得散点图1;对于变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法不正确的是(    ) A. B. C. D. 【答案】A 【分析】根据散点图及相关系数的性质,逐一分析各个选项,即可得答案. 【详解】由图1和图2可得,随的增大而增大,随的增大而减小, 所以,所以,故B正确; 因为图1的数据点比图2的更集中,所以, 所以,,故A错误,C正确; ,故D正确. 18.(2026高三·上海·阶段检测)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是(   ) A. B. C. D. 【答案】B 【详解】图①,数据点呈正线性相关,且相关性很强,所以接近1; 图②,数据点呈负线性相关,且相关性很强,所以接近; 图③,数据点呈正线性相关,且相关性比图①弱,所以; 图④,数据点呈负线性相关,且相关性比图②弱,所以; 所以. 19.(2026·天津河西·模拟预测)某研究小组为了探究变量x与y之间的线性相关关系,收集了5组数据,(),并绘制成如图所示的散点图(点A,B,C,D,E).经计算,这5组数据的样本相关系数为r.若去掉点后,剩余4组数据的样本相关系数为,则下列结论正确的是(   )    A. B. C. D. 【答案】A 【分析】从图中可以看出点较其他点,偏离直线远,所以去掉点后,回归效果更好,结合相关系数的性质判断. 【详解】从散点图中可知,样本数据的两变量是正相关, 由于点较其他点偏离程度大,删除点后,回归效果更好, 从而相关系数的绝对值更接近于1,所以 考点5 相关系数的计算 20.(2026高二·全国·单元测试)最近7年,我国生活垃圾无害处理量如下表: 年份序号 1 2 3 4 5 6 7 处理量 通过计算得,,,,则样本相关系数(    ) A.0.99 B.0.95 C.0.9 D.0.85 【答案】A 【分析】根据相关系数公式计算即可求解. 【详解】,, , . 故选:A. 21.(2026高三·全国·专题练习)我国新能源汽车迅速崛起,成为推动绿色革命的核心引擎.某品牌新能源汽车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示: 令,数据经过初步处理得:,,,,,,.现有①和②两种模型作为年销售量关于年广告费的回归分析模型,其中均为常数.请从样本相关系数的角度,分析哪一个模型拟合程度更好? 参考数据:,. 相关系数. 【答案】模型②的拟合程度更好 【分析】比较相关系数的大小即可得到结论. 【详解】设模型①和②的相关系数分别为, 由题意可得:, , 所以,由相关系数的意义可得,模型②的拟合程度更好. 22.(2026高二·全国·课堂例题)现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示. 学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 请问:这10名学生的两次数学成绩是否具有较强的线性相关关系? 注:; 若,则我们可以认为y与x之间具有较强的线性相关关系. 【答案】这10名学生的两次数学成绩具有较强的线性相关关系 【分析】根据线性相关关系的概念,以及相关系数计算公式,求出相关系数,判断两组数据是否具有线性相关关系即可. 【详解】由题意知, , , ,,. 所以样本相关系数. ,故我们可以认为与之间具有较强的线性相关关系. 即这10名学生的两次数学成绩具有较强的线性相关关系. 23.(2026高三·全国·月考)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量.若的样本相关系数为,的样本相关系数为,则的样本相关系数的最大值为(    ) 附:样本相关系数 A. B. C. D.1 【答案】B 【分析】设,,,,,,与的夹角为,与的夹角为,再由相关系数可知,则与夹角的余弦值的最大值为,利用余弦差角公式求值即可. 【详解】设,,, ,,, 由样本相关系数公式可知,, 设与的夹角为,与的夹角为,则有, 易知均为锐角且, 与夹角的余弦值的最大值为,此时与样本相关系数最大, , 故的样本相关系数的最大值为. 故选:B. 考点6 相关系数与其他知识综合 24.(2026·湖南岳阳·模拟预测)某高校快递站统计了某年度新学期前5天的取件人数y(单位:人),得到如下样本数据: 天数(序号)x 1 2 3 4 5 每日取件人数 120 100 80 70 55 (1)计算样本相关系数r,并据此判断变量x与y之间线性相关关系的强弱(结果保留两位小数); (2)从这5天中随机选取3天,记X为所选日期中取件人数小于100的天数,求X的分布列与数学期望. 注: (1)样本的相关系数 (2)参考数据: 【答案】(1);变量x与y之间具有很强的线性相关关系 (2)分布列见解析;期望:1.8 【分析】(1)使用相关系数计算公式求相关系数,根据求解结果判断线性相关关系的强弱; (2)结合超几何分布的概率公式求分布列,再由期望公式求期望. 【详解】(1),, , , , 样本相关系数: , 因为非常接近1,所以变量x与y之间具有很强的线性相关关系. (2)5天中取件人数小于100的天数有3天, 从这5天中随机选取3天,的可能取值为1,2,3. , , , 所以的分布列为: 1 2 3 的数学期望 25.(2026·江西·模拟预测)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后18个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额数量(单位:万元),并计算得, . (1)求样本的相关系数(精确到0.01),并推断销售金额(单位:万元)和月份编号是否线性相关(当时,即可认为线性相关); (2)已知这18个月中有10个月的销售金额高于平均数,从这18个月中随机抽取2个月的销售金额,记抽到销售金额高于平均数的月份数为,求随机变量的分布列. 附:相关系数. 【答案】(1),具有很强的正相关性 (2) 0 1 2 【分析】(1)由条件结合相关系数公式求出相关系数,根据相关系数性质判断结论; (2)由条件确定的可能取值,再求取各值的概率,由此可得其分布列. 【详解】(1)样本的相关系数为: 由于相关系数,故销售金额(单位:万元)和月份编号具有很强的正相关性; (2)由题意得:的可能取值为0,1,2, 18个月中有10个月的销售金额高于平均数, 所以, , , 所以的分布列为: 0 1 2 26.(2026高三·浙江·期末)某县承包了一块土地,已知土地的使用面积与相应的管理时间的关系如下表所示: 土地使用面积/亩 1 2 3 4 5 管理时间月 8 10 13 25 24 并调查了某村300位村民参与管理的意愿,得到的部分数据如下表所示: 单位:人 愿意参与管理 不愿意参与管理 男性村民 150 50 女性村民 50 50 (1)求出样本相关系数的大小,并判断管理时间与土地使用面积是否线性相关(当时,即可认为线性相关); (2)以该村村民的性别与参与管理意愿的情况估计该县的情况,从该县中任取3人,记取到不愿意参与管理的男性村民的人数为,求的分布列及数学期望. 参考公式:;参考数据:. 【答案】(1),管理时间与土地使用面积线性相关 (2)分布列见解析, 【分析】(1)根据表格中的数据,结合相关系数的计算公式,求得的值,即可得出结论; (2)根据题意,得到变量的所有可能取值,利用重复试验的概率公式,求得相应的概率,列出分布列,结合期望的公式,即可求解. 【详解】(1)由题意得,, 所以, 可得, 则, 所以管理时间与土地使用面积线性相关. (2)由题意,随机变量的所有可能取值为0,1,2,3, 从该县中随机抽取一位村民,取到不愿意参与管理的男性村民的概率为, 故, 故的分布列为 0 1 2 3 所以数学期望. 27.(2026高二·全国·课后作业)某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i名学生的成绩为,其中,分别为第i名学生的数学总评成绩和物理总评成绩.抽取的数据列表如下(按数学成绩降序整理): 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 数学总评成绩x 95 92 91 90 89 88 88 87 86 85 83 82 81 80 80 79 78 77 75 74 物理总评成绩y 96 90 89 87 92 81 86 88 83 84 81 80 82 85 80 78 79 81 80 78 (1)根据统计学知识,当相关系数时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明. 参考数据:,,. (2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀.对优秀赋分1,对不优秀赋分0.从这20名学生中随机抽取2名学生,若用X表示这2名学生两科赋分的和,求X的分布列和数学期望. 【答案】(1)“数学总评成绩”与“物理总评成绩”高度相关;说明见解析 (2)分布列见解析;期望为 【分析】(1)根据公式计算出的值后可得出结果; (2)由题意可得X的可能取值为0,1,2,3,4,然后求出概率,再用期望公式可求解. 【详解】(1)由题意,, 所以“数学总评成绩”与“物理总评成绩”高度相关. (2)由题意得:X的可能取值为0,1,2,3,4. 根据赋分规则可知,7人赋分为2,4人赋分为1,9个人赋分为0,所以 ,,, ,,所以X的分布列为: X 0 1 2 3 4 P 所以. 28.(2026·河北沧州·模拟预测)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.我国于2020年打赢了脱贫攻坚战,其中小麦发挥了重大作用.以2020年为第1年,我国连续5年小麦产量如下: 年份 1 2 3 4 5 产量/千万吨 13.4 13.7 13.8 13.6 14.0 现规定表示第i年的年份,表示第i年的产量,经计算得,,. (1)求样本(,2,…,5)的相关系数(精确到0.01); (2)现从这5年中随机抽取2年,记这2年中共有X年的小麦产量不低于13.7千万吨,求X的分布列与期望. 附:样本相关系数,. 【答案】(1) (2)分布列见解析, 【分析】(1)先求出平均值,再应用已知数据结合相关系数公式计算求解; (2)根据超几何分布求出概率,再写出分布列应用数学期望公式计算即可. 【详解】(1),, 故样本相关系数. (2)X的取值可以为0,1,2, 则, , , 于是X的分布列为 X 0 1 2 P 故. 29.(2026·河南开封·模拟预测)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示. 年份代码 1 2 3 4 5 产量/千万吨 13.4 13.6 13.8 13.7 14.0 现规定表示年份代码i,表示年份代码为i的产量,经计算得,,. (1)求样本的相关系数r;(精确到0.01) (2)现从这5年中随机抽取3年,记这3年中小麦产量大于13.6千万吨的年数为X,求X的分布列与数学期望. 附:相关系数,. 【答案】(1)0.92 (2)随机变量的分布列为 X 1 2 3 P 【分析】(1)根据统计表格中的数据,求得,,结合参考数据和相关系数的公式,即可求解; (2)根据题意,得到随机变量的取值为,利用超几何分布的概率公式,求得相应的概率,列出分布列,结合期望的公式,即可求解. 【详解】(1)解:根据统计表格中的数据,可得,, 以及,,. 可得样本相关系数. (2)解:根据题意,可得随机变量的取值为, 则,,, 所以随机变量的分布列为 X 1 2 3 P 所以期望为. 30.(2026高三·西藏拉萨·月考)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示. 年份代码 1 2 3 4 5 产量/千万吨 13.4 13.6 13.8 13.7 14.0 现规定表示年份代码,表示年份代码为的产量,经计算得,, (1)求样本的相关系数;(精确到0.01) (2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望. 附:相关系数,. 【答案】(1) (2)分布列见解析, 【分析】(1)先求出平均值,再应用已知数据结合相关系数公式计算求解; (2)根据超几何分布求出概率,再写出分布列应用数学期望公式计算即可. 【详解】(1),, 故样本相关系数 . (2)X的取值可以为0,1,2, 则, , , 于是X的分布列为 X 0 1 2 P 故. 31.(2026高三·湖北宜昌·月考)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,. (1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度; (2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列. 附:相关系数. 【答案】(1),相关性强 (2)分布列见解析 【分析】(1)由条件结合相关系数公式求出相关系数,根据相关系数性质判断结论; (2)由条件确定的可能取值,再求取各值的概率,由此可得其分布列. 【详解】(1)样本的相关系数为 . 由于相关系数,则相关性很强,的值越大,相关性越强. 故,故销售金额和月份编号成很强的正相关性. (2)由题意得:的可能取值为0,1,2, 20个月中有8个月的销售金额低于平均数,有12个月的销售金额不低于平均数, 所以, 所以的分布列为: 0 1 2 32.(2026·江西吉安·模拟预测)2023年10月国家发改委、工信部等部门联合印发了《加快“以竹代塑”发展三年行动计划》,该计划将推动“以竹代塑”高质量发展,助力减少塑料污染,并将带动竹产业新一轮的增长.下表为2019年—2023年中国竹产业产值规模(单位:千亿元),其中2019年—2023年的年份代码依次为. 1 2 3 4 5 2.89 3.22 3.82 4.34 5.41 (1)记第年与年中国竹产业产值规模差值的2倍的整数部分分别为,从中任取2个数相乘,记乘积为,求的分布列与期望; (2)根据以上数据及相关系数,判断能否用线性回归模型拟合中国竹产业产值规模与年份之间的关系. 参考数据:,,, 相关系数若,则认为与有较强的相关性. 【答案】(1)分布列见解析, (2)可以用线性回归模型拟合与的关系. 【分析】(1)根据已知条件,确定,,,的值,由此确定的取值,求出分布列及期望即可; (2)根据已知条件,利用公式求出相关系数即可. 【详解】(1)第年和第年中国竹产业产值规模差值的2倍为, 整数部分为,所以; 第年和第年中国竹产业产值规模差值的2倍为, 整数部分为,所以; 第年和第年中国竹产业产值规模差值的2倍为, 整数部分为,所以; 第年和第年中国竹产业产值规模差值的2倍为, 整数部分为,所以; 所以,, 所以的取值依次为, , 所以的分布列为: 0 1 2 所以. (2)由题意得,, , , ,, 所以, . 因为与的相关系数大于0.75,说明与的线性相关程度高, 可以用线性回归模型拟合与的关系. 学科网(北京)股份有限公司 学科网(北京)股份有限公司 $ 2025-2026高二下学期数学《题海探秘》同步考点复习指南(人教A版2019选择性必修第三册) 题海探秘11 成对数据的统计相关性 6考点复习指南 1.变量的相关关系 (1)函数关系 函数关系是一种确定性关系,常用解析式来表示. (2)相关关系 两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关 系.与函数关系不同,相关关系是一种非确定性关系. 2.散点图 (1)散点图 成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图. (2)正相关和负相关 如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个 变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关. 3.线性相关 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线 性相关. 4.样本相关系数 (1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(,),(,),,(,),利用 相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式: (其中,,,和,,,的均值分别为和). ①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小; 当其中一个数据的值变大时,另一个数据的值通常也变大. ②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大; 当其中一个数据的值变大时,另一个数据的值通常会变小. 考点1 相关关系与函数关系的概念及辨析 1.(2026高二·河北沧州·期中)下列关系中,属于相关关系的是______(填序号). ①球的体积与该球的半径之间的关系; ②农作物的产量与施肥量之间的关系; ③一般情况下,一个人的身高和体重之间的关系. 2.(2026高二·全国·课后作业)下面变量之间是相关关系的是(   ) A.出租车费与行驶的里程 B.正方形面积与边长 C.人的身高与体重 D.铁的体积与质量 3.【多选】(2026高二·全国·课堂例题)在下列各变量之间的关系中,属于相关关系的是(    ) A.汽车的重量和百公里耗油量 B.正n边形的边数与内角度数之和 C.一块农田的小麦产量与施肥量 D.家庭的经济条件与学生的学习成绩 4.(2026高二·全国·课堂例题)下列两个变量之间,是相关关系的有(    ) ①角度与它的余弦值;②人的体重与视力;③正n边形的边数和它的内角度数之和;④圆心角的大小与所对的圆弧长;⑤光照时间和果树亩产量;⑥收入水平与购买能力;⑦正方体的棱长与体积. A.①④⑥ B.②⑤⑥⑦ C.⑤⑥ D.③⑤⑦ 5.【多选】(2026高二·全国·课后作业)下列两个变量之间的关系,是函数关系的有(    ) A.球的体积和它的半径 B.人的身高和体重 C.底面积为定值的长方体的体积和高 D.城镇居民的消费水平和平均工资 考点2 判断两个变量是否有相关关系 6.(2026高二·全国·专题练习)在下列各图中,两个变量具有相关关系的是(    ). A.①② B.①③ C.② D.②③ 7.(2026高一·陕西咸阳·月考)如图,两个变量具有相关关系的是(    ) A.(1)(3) B.(1)(4) C.(2)(4) D.(2)(3) 8.(2026高二·上海·课后作业)若已知下列各组数据,它们是否可以看作成对数据?是否可以进行相关分析?判断并简要说明理由. (1)校学生的身高与校学生的体重; (2)人体内的脂肪含量与体重; (3)某班学生的物理成绩与数学成绩. 考点3 利用散点图判断正、负相关 9.(2026高二·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是(    ) A.B. C.D. 10.(2026·天津河西·模拟预测)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断(   ) A.变量与正相关,与正相关 B.变量与正相关,与负相关 C.变量与负相关,与正相关 D.变量与负相关,与负相关 11.(2026高二·广西钦州·期末)变量x与y的成对样本数据的散点图如下图所示,据此可以推断变量x与y之间(    )    A.可能存在负相关B.可能存在正相关 C.一定存在正相关 D.一定存在负相关 考点4 样本相关系数的意义及辨析 12.(2026高二·北京东城·期末)某校学生科研兴趣小组为了解1~12岁儿童的体质健康情况,随机调查了20名儿童的相关数据,分别制作了肺活量、视力、肢体柔韧度、BMI指数和身高之间的散点图,则与身高之间具有正相关关系的是(    ) A.肺活量 B.视力 C.肢体柔韧度 D.BMI指数 13.(2026·上海)根据身高和体重散点图,下列说法正确的是(    ) A.身高越高,体重越重 B.身高越高,体重越轻 C.身高与体重成正相关 D.身高与体重成负相关 14.(2026高二·河南南阳·期中)已知,,,四组成对样本数据对应的线性相关系数分别为-0.95,-0.82,0.86,0.93,则线性相关程度最弱的是(    ) A.组 B.组 C.组 D.组 15.(2026高二·上海·阶段检测)通过随机抽样绘制得到如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.下列说法正确的是(   ). A.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变大 B.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变小 C.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变大 D.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变小 16.(2026高三·上海虹口·月考)分别对、、三组成对数据做相关性分析,计算出其对应的相关系数分别为、,,则、、三组相关性的强弱从弱到强排序依次为________. 17.(2026·四川·模拟预测)对于变量有观测数据,得散点图1;对于变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法不正确的是(    ) A. B. C. D. 18.(2026高三·上海·阶段检测)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是(   ) A. B. C. D. 19.(2026·天津河西·模拟预测)某研究小组为了探究变量x与y之间的线性相关关系,收集了5组数据,(),并绘制成如图所示的散点图(点A,B,C,D,E).经计算,这5组数据的样本相关系数为r.若去掉点后,剩余4组数据的样本相关系数为,则下列结论正确的是(   )    A. B. C. D. 考点5 相关系数的计算 20.(2026高二·全国·单元测试)最近7年,我国生活垃圾无害处理量如下表: 年份序号 1 2 3 4 5 6 7 处理量 通过计算得,,,,则样本相关系数(    ) A.0.99 B.0.95 C.0.9 D.0.85 21.(2026高三·全国·专题练习)我国新能源汽车迅速崛起,成为推动绿色革命的核心引擎.某品牌新能源汽车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示: 令,数据经过初步处理得:,,,,,,.现有①和②两种模型作为年销售量关于年广告费的回归分析模型,其中均为常数.请从样本相关系数的角度,分析哪一个模型拟合程度更好? 参考数据:,. 相关系数. 22.(2026高二·全国·课堂例题)现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示. 学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 请问:这10名学生的两次数学成绩是否具有较强的线性相关关系? 注:; 若,则我们可以认为y与x之间具有较强的线性相关关系. 23.(2026高三·全国·月考)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量.若的样本相关系数为,的样本相关系数为,则的样本相关系数的最大值为(    ) 附:样本相关系数 A. B. C. D.1 考点6 相关系数与其他知识综合 24.(2026·湖南岳阳·模拟预测)某高校快递站统计了某年度新学期前5天的取件人数y(单位:人),得到如下样本数据: 天数(序号)x 1 2 3 4 5 每日取件人数 120 100 80 70 55 (1)计算样本相关系数r,并据此判断变量x与y之间线性相关关系的强弱(结果保留两位小数); (2)从这5天中随机选取3天,记X为所选日期中取件人数小于100的天数,求X的分布列与数学期望. 注: (1)样本的相关系数 (2)参考数据: 25.(2026·江西·模拟预测)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后18个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额数量(单位:万元),并计算得, . (1)求样本的相关系数(精确到0.01),并推断销售金额(单位:万元)和月份编号是否线性相关(当时,即可认为线性相关); (2)已知这18个月中有10个月的销售金额高于平均数,从这18个月中随机抽取2个月的销售金额,记抽到销售金额高于平均数的月份数为,求随机变量的分布列. 附:相关系数. 26.(2026高三·浙江·期末)某县承包了一块土地,已知土地的使用面积与相应的管理时间的关系如下表所示: 土地使用面积/亩 1 2 3 4 5 管理时间月 8 10 13 25 24 并调查了某村300位村民参与管理的意愿,得到的部分数据如下表所示: 单位:人 愿意参与管理 不愿意参与管理 男性村民 150 50 女性村民 50 50 (1)求出样本相关系数的大小,并判断管理时间与土地使用面积是否线性相关(当时,即可认为线性相关); (2)以该村村民的性别与参与管理意愿的情况估计该县的情况,从该县中任取3人,记取到不愿意参与管理的男性村民的人数为,求的分布列及数学期望. 参考公式:;参考数据:. 27.(2026高二·全国·课后作业)某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i名学生的成绩为,其中,分别为第i名学生的数学总评成绩和物理总评成绩.抽取的数据列表如下(按数学成绩降序整理): 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 数学总评成绩x 95 92 91 90 89 88 88 87 86 85 83 82 81 80 80 79 78 77 75 74 物理总评成绩y 96 90 89 87 92 81 86 88 83 84 81 80 82 85 80 78 79 81 80 78 (1)根据统计学知识,当相关系数时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明. 参考数据:,,. (2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀.对优秀赋分1,对不优秀赋分0.从这20名学生中随机抽取2名学生,若用X表示这2名学生两科赋分的和,求X的分布列和数学期望. 28.(2026·河北沧州·模拟预测)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.我国于2020年打赢了脱贫攻坚战,其中小麦发挥了重大作用.以2020年为第1年,我国连续5年小麦产量如下: 年份 1 2 3 4 5 产量/千万吨 13.4 13.7 13.8 13.6 14.0 现规定表示第i年的年份,表示第i年的产量,经计算得,,. (1)求样本(,2,…,5)的相关系数(精确到0.01); (2)现从这5年中随机抽取2年,记这2年中共有X年的小麦产量不低于13.7千万吨,求X的分布列与期望. 附:样本相关系数,. 29.(2026·河南开封·模拟预测)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示. 年份代码 1 2 3 4 5 产量/千万吨 13.4 13.6 13.8 13.7 14.0 现规定表示年份代码i,表示年份代码为i的产量,经计算得,,. (1)求样本的相关系数r;(精确到0.01) (2)现从这5年中随机抽取3年,记这3年中小麦产量大于13.6千万吨的年数为X,求X的分布列与数学期望. 附:相关系数,. 30.(2026高三·西藏拉萨·月考)粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示. 年份代码 1 2 3 4 5 产量/千万吨 13.4 13.6 13.8 13.7 14.0 现规定表示年份代码,表示年份代码为的产量,经计算得,, (1)求样本的相关系数;(精确到0.01) (2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望. 附:相关系数,. 31.(2026高三·湖北宜昌·月考)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,. (1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度; (2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列. 附:相关系数. 32.(2026·江西吉安·模拟预测)2023年10月国家发改委、工信部等部门联合印发了《加快“以竹代塑”发展三年行动计划》,该计划将推动“以竹代塑”高质量发展,助力减少塑料污染,并将带动竹产业新一轮的增长.下表为2019年—2023年中国竹产业产值规模(单位:千亿元),其中2019年—2023年的年份代码依次为. 1 2 3 4 5 2.89 3.22 3.82 4.34 5.41 (1)记第年与年中国竹产业产值规模差值的2倍的整数部分分别为,从中任取2个数相乘,记乘积为,求的分布列与期望; (2)根据以上数据及相关系数,判断能否用线性回归模型拟合中国竹产业产值规模与年份之间的关系. 参考数据:,,, 相关系数若,则认为与有较强的相关性. 学科网(北京)股份有限公司 学科网(北京)股份有限公司 $

资源预览图

题海探秘11  成对数据的统计相关性讲义-2025-2026学年高二下学期数学《题海探秘》同步考点复习指南(人教A版选择性必修第三册)
1
题海探秘11  成对数据的统计相关性讲义-2025-2026学年高二下学期数学《题海探秘》同步考点复习指南(人教A版选择性必修第三册)
2
题海探秘11  成对数据的统计相关性讲义-2025-2026学年高二下学期数学《题海探秘》同步考点复习指南(人教A版选择性必修第三册)
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。