第八章 成对数据的统计分析(能力提升卷)-2025-2026学年高二下学期数学人教A版选择性必修第三册

2026-05-23
| 2份
| 30页
| 120人阅读
| 1人下载

资源信息

学段 高中
学科 数学
教材版本 高中数学人教A版选择性必修第三册
年级 高二
章节 小结
类型 作业-单元卷
知识点 -
使用场景 同步教学-单元练习
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 1.31 MB
发布时间 2026-05-23
更新时间 2026-05-23
作者 高数精品专辑1969
品牌系列 -
审核时间 2026-05-23
下载链接 https://m.zxxk.com/soft/57999878.html
价格 1.50储值(1储值=1元)
来源 学科网

摘要:

**基本信息** 本卷为高中数学第八章“成对数据的统计分析”能力提升单元卷,精选近三年期中、模拟及真题,覆盖相关系数、回归分析、独立性检验等核心知识,通过分层题组实现基础巩固与能力提升,适配高二下单元复习或高三一轮备考。 **题型特征** |题型|题量/分值|知识覆盖|命题特色| |----|-----------|----------|----------| |单选|8/40|样本相关系数计算、残差分析、回归直线性质|结合电商利润等现实情境,考查数学眼光观察数据关联| |多选|3/18|回归方程应用、独立性检验|以软件公司利润、AI答题活动为背景,体现数学思维的逻辑推理| |填空|3/15|回归预测、残差计算|联系粉丝量增长、中学生追星问题,培养数据观念与模型意识| |解答|5/77|列联表构建、回归模型选择、概率分布|综合地区生产总值、社交平台用户行为等热点,强化数学语言表达与综合应用能力|

内容正文:

第八章 成对数据的统计分析(能力提升卷) 考试时间:120分钟;满分:150分 姓名:___________班级:___________考号:___________ 考卷信息: 本卷试题共19题,单选8题,多选3题,填空3题,解答5题,满分150分,限时120分钟,试卷紧扣教材,细分题组,精选一年好题,两年真题,练基础,提能力! 1. 选择题(共8小题,满分40分,每小题5分) 1.(25-26高二下·山西·期中)网购是现代年轻人重要的购物方式,某电商对其旗下的一家专营店近五年来每年的利润额(单位:万元)与年份代码进行了统计,得如下数据: x 1 2 3 4 5 y 2.5 3.3 4.5 6.2 8.5 则x与y的样本相关系数(   ) 参考公式:,参考数据:,. A.0.99 B.0.98 C.0.97 D.0.96 【答案】B 【分析】代入相关系数公式求解即可. 【详解】由题意,得,,, ,所以. 2.(25-26高二下·天津武清·期中)已知下列四个命题:①残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;②甲、乙两个模型的决定系数分别约为0.88和0.80,则模型乙的拟合效果更好;③回归直线恒过点,且至少过一个样本点;④在线性回归分析中,样本相关系数r的绝对值越接近1时,成对样本数据的线性相关程度越强.其中真命题的个数是(    ) A.4 B.3 C.2 D.1 【答案】D 【详解】对于①,残差图中,残差点所在水平带状区域越窄,说明残差波动越小, 即回归方程的预报精确度越高,残差点所在水平带状区域越宽,说明残差波动越大, 即回归方程的预报精确度越低,错误; 对于②,决定系数越接近1,说明模型对数据的拟合效果越好,故模型甲的拟合效果更好,错误; 对于③,回归直线过样本数据,,,的中心点, 并不一定过样本数据中的某一个点,错误; 对于④,在线性回归分析中,样本相关系数r的绝对值越接近1时,成对样本数据的线性相关程度越强,正确. 3.(25-26高二下·海南·期中)根据生物实验中的一组数据作出如图所示的散点图,并对这组数据进行回归分析后发现遗漏了点,增加点后再次进行回归分析,得到的结果和原来相比(    ) A.决定系数变小 B.残差平方和变小 C.相关系数变大 D.不变 【答案】A 【详解】增加点,从散点图中可以看出拟合效果变差; 决定系数越接近1,拟合效果越好,所以拟合效果变差后决定系数变小,故A正确; 残差平方和越小,拟合效果越好,所以残差平方和变大,故B错误; 越接近1,相关程度越强,拟合效果越好,由于两个变量成正相关,所以相关系数变小,故C错误; 增加点前的的平均数为,增加点后的的平均数为, 所以变大,故D错误. 4.(25-26高二下·江苏盐城·期中)下列说法中不正确的是(   ) A.随机变量X的方差,期望,则 B.在成对样本数据分析中相关系数,表示两个变量之间没有线性相关关系 C.根据线性回归方程得到预测值为时的观测值为34,则残差为0.009 D.为了研究某种商品的广告投入x和收益y之间的相关关系,某研究小组收集了5组样本数据如表所示,得到线性回归方程为,则当广告投入为10万元时,收益的预测值为2.68万元 x/万元 1 2 3 4 5 y/万元 0.50 0.80 1.00 1.20 1.50 【答案】A 【分析】利用方差与期望值的关系式可得A错误,相关系数表示两个变量之间没有线性相关关系,根据残差定义直接代入计算可判断C正确,求出回归方程将代入计算可得结果. 【详解】由方差,期望,则,可得,因此A错误; 当相关系数时,表示两个变量之间没有线性相关关系,即B正确; 易知残差为,所以C正确; 对于D,显然, 因此可得,解得; 当广告投入为10万元时,收益的预测值为,因此D正确. 5.(25-26高二下·河北沧州·期中)为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取男性人数与女性人数相同,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性中不喜爱钓鱼的至少有(   ) 附:,其中. A.人 B.人 C.人 D.人 【答案】C 【分析】设被调查的男性有人,则女性有人,列出列联表,根据独立性检验的基本思想可得出关于的不等式,结合可得出的值,即可得出被调查的男性中不喜爱钓鱼的人数至少为. 【详解】设被调查的男性有人,则女性有人,根据题意,可得列联表如下: 钓鱼 性别 男性 女性 总计 喜爱钓鱼 不喜爱钓鱼 总计 则, 本次调查得出“有的把握认为是否喜爱钓鱼与性别有关”的结论, 可得,解得, 又因为列联表中相关人数需为整数,则, 所以,被调查的男性中不喜爱钓鱼的至少有人. 6.(25-26高二下·福建泉州·阶段检测)某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的 若有的把握认为喜欢短视频和性别相关联,则的最小值为(    ) (附,其中.) A. B. C. D. 【答案】B 【分析】根据题意先列出列联表计算值,再根据计算出的最小值. 【详解】根据题意,列联表如下: 喜欢 不喜欢 合计 男 女 合计 ; ∵有的把握认为喜欢短视频和性别相关联,即, ,,又, 则的最小值为. 故选:B. 7.(25-26高二下·云南昭通·期中)对于变量,,经过随机抽样获得成对数据,且 ,利用最小二乘法得到关于的线性回归方程为,且与的相关系数,则下列结论正确的是(   ) A.越大,与的线性相关性越弱 B.若,则 C.若,则 D.若样本点都在回归直线上,则 【答案】D 【分析】对于A,由的绝对值大小与和的线性相关性强弱关系可判断选项正误;对于B,由与计算公式可判断选项正误.对于C,由题设可得,据此可判断选项正误;对于D,由的意义可判断选项正误; 【详解】对于A,的绝对值越接近1,由于,故的值越大,与的线性相关性越强,故A错误; 对于B,,从而,则当时,因无法确定,则无法确定,故B错误. 对于C,由于可得,则,当时,,则,故C错误; 对于D,若样本点都在回归直线上,且,则,D正确; 8.(25-26高二下·江西南昌·阶段检测)已知样本点,,……,的经验回归直线的方程为,相关系数为,样本均值分别为,.现令,.设新样本点的经验回归直线为,则下列命题为假命题的是(   ) 附:样本相关系数,经验回归方程中斜率和截距的最小二乘估计公式分别为,. A.与的相关系数为 B.过 C.的斜率为 D.的截距为 【答案】D 【分析】根据经验回归直线必过样本中心点,代入公式依次判断选项即可. 【详解】由已知样本均值性质可得新样本均值分别为与, 因为经验回归直线必过样本中心点, 所以新经验回归直线过点,故B正确; 因为且, 代入相关系数公式可得新样本的相关系数,故A正确; 代入斜率公式可得新经验回归直线的斜率 ,故C正确; 由回归截距公式可得新经验回归直线的截距,故D错误.故选D. 2. 多选题(共3小题,满分18分,每小题6分) 9.(2026·江西·模拟预测)已知某软件公司开发了一款新型智能解题软件,现将该软件上市后的月份以及当月获得的利润(单位:万元)统计如下表所示,并根据表中数据,得到经验回归方程,则(     ) 月份 1 2 3 4 5 利润 6 7 9 A. B.可以估计每增加1个月份,月利润平均提高万元 C.可以估计上市后的第7个月的利润为万元 D.上市后的第4个月的利润的残差为万元 【答案】AC 【详解】由统计表可知: ,, 则回归直线过样本中心点,代入回归方程得, ,解得,故A正确; 回归方程为,斜率为,则每增加1个月份,月利润平均提高万元, 故B错误; 时,万元,故C正确; 由统计表知,第4个月,预测值, 残差万元,故D错误. 10.(2026·河北保定·模拟预测)为了研究与的线性相关关系,收集了 10组样本数据,已知样本点的中心为,且 ,,的分位数为,若关于的经验回归方程为 则下列说法正确的是(    ) A. B.与负相关 C. D.样本相关系数必大于0 【答案】CD 【详解】选项A:样本点的中心为,关于的经验回归方程为, 所以代入可得,解得,故A错误; 选项B:因为回归系数,因此与正相关,故B错误; 选项C:的分位数为,, 即,因为,所以解得,故C正确; 选项D:因为回归系数,所以与正相关, 因此样本相关系数,故D正确. 11.(25-26高二下·辽宁朝阳·期中)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,结果得到列联表如下:则(   ) 性别 男生 女生 合计 不愿报名参加答题活动 20 60 80 愿意报名参加答题活动 80 合计 100 参考公式:,其中. 附表: 0.1 0.05 0.025 0.01 0.001 2.706 3.841 5.024 6.635 10.828 A.当时,有的把握认为参与答题意愿与性别无关. B.当时,有的把握认为参与答题意愿与性别有关. C.当时,根据小概率值的独立性检验,认为参与答题意愿与性别有关联. D.当时,根据小概率值的独立性检验,没有充分的证据推断参与答题意愿与性别有关联. 【答案】BC 【详解】对于AB,当时,, 则, 所以有的把握认为参与答题意愿与性别有关.,故A错误,B正确; 对于CD,当时,, 零假设为:参与答题意愿与性别无关, 则, 依据小概率值的独立性检验,我们推断不成立, 所以根据小概率值的独立性检验,认为参与答题意愿与性别有关联,故C正确,D错误. 3. 填空题(共3小题,满分15分,每小题5分) 12.(江苏徐州市2026届高三模拟预测数学试题)将某数学博主1—4月份的粉丝量y整理成如下表格,根据表中数据求出z关于x的经验回归方程为,则预测该数学博主6月末的粉丝量约为______. 月份x 1 2 3 4 粉丝量y 【答案】 【详解】因为,所以当时,, 所以,解得. 故预测该数学博主6月末的粉丝量约为 13.(2026·山东滨州·二模)已知变量和变量的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,经重新计算得到新回归直线的斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为__________.(残差观测值预测值) 【答案】/ 【分析】将样本中心点代入回归方程中求出,即可得出,进而得出新数据的样本中心点和回归方程,代入计算即可. 【详解】由题意得,, 则,, 当增加两个样本数据和后, 变量的平均数为,变量的平均数为, 因为新回归直线的斜率为3,所以可设其方程为, 将代入得,则, 令,则,则样本数据所对应的残差为. 14.(25-26高二下·江西·月考)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人. 参考数据及公式:,其中. 0.050 0.010 0.001 3.841 6.635 10.828 【答案】48 【分析】设男生人数为,由题可得列联表,然后由题设可得关于不等式,据此可得答案. 【详解】设男生人数为,则女生人数为,男生追星人数为,不追星人数为, 女生追星人数为,不追星人数为,据此可得列联表如下: 追星 不追星 总计 男生 女生 总计 则由独立性检验相关计算公式结合题设,可得: . 又为保证所有人数为正整数,需为的倍数,则. 4. 解答题(共5小题,第15题13分,第16、17题15分,第18、19题17分,满分77分) 15.(重庆市巴蜀教育集团2025-2026学年高二下学期5月期中考试数学试题)为了比较甲,乙两所学校学生的数学水平,采用简单随机抽样的方法抽取了100名学生,通过测验得到了如下数据:甲校50名学生中有10名数学成绩优秀,乙校50名学生中有15名数学成绩优秀. (1)请将列联表补充完整; 学校 数学成绩 合计 优秀 不优秀 甲校 10 乙校 15 合计 100 (2)依据小概率值的独立性检验,能否据此推断两校学生的数学成绩优秀率有差异. (3)用甲校数学成绩样本的优秀率作为甲校数学成绩总体的优秀率,估计甲校的3名学生中恰好有两名学生数学成绩优秀的概率. 参考数据: 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 【答案】(1) 学校 数学成绩 合计 优秀 不优秀 甲校 10 40 50 乙校 15 35 50 合计 25 75 100 (2)不能据此推断两校学生的数学成绩优秀率有差异 (3) 【分析】(1)根据题意完成列联表, (2)结合零假设、卡方公式进行运算求解判断即可; (3)利用二项分布求解即可. 【详解】(1)由已知,列联表如下: 单位:人 学校 数学成绩 合计 优秀 不优秀 甲校 10 40 50 乙校 15 35 50 合计 25 75 100 (2)零假设为:两校学生的数学成绩优秀率无差异. 根据列联表数据,计算得到 . 根据小概率值的独立性检验,没有充分证据推断不成立, 因此不拒绝原假设,即不能认为两校学生的数学成绩优秀率有差异. (3)甲校数学成绩样本的优秀率为,作为甲校数学成绩总体的优秀率, 设甲校的3名学生中成绩优秀的人数为,则, 所求概率为. 16.(25-26高二下·吉林长春·期中)我国全面二孩政策已正式实施,这次人口与生育政策的历史性调整,使得“要不要再生一个”,“生二孩能休多久产假”等问题成为千千万万个家庭在生育决策上避不开的话题.为了解针对产假的不同安排方案形成的生育意愿,某调查机构随机抽取了200户有生育二胎能力的适龄家庭进行问卷调查,得到如下数据: 产假安排(单位:周) 14 15 16 17 18 有生育意愿家庭数(单位:户) 4 8 16 20 26 (1)建立变量关于的一元线性回归模型; (2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于1时,称该对数据为一个“次数据”,现从这5个成对数据中任取3个做残差分析,求取到的数据中“次数据”个数的数学期望. 附:经验回归直线的斜率和截距的最小二乘估计公式分别为, 参考数据:. 【答案】(1) (2) 【分析】(1)由已知求出,,利用公式求出,,即可得到关于的线性回归方程; (2)由回归方程求出预测值,可得残差的绝对值,判断是否为“次数据”,可得“次数据”和非“次数据”个数,“次数据”个数为,求出对应概率,即可列出分布列求出数学期望. 【详解】(1),, 所以, 则, , 所以关于的一元线性回归方程为. (2)由(1)回归方程为,样本数据的残差的绝对值大于1时,称该对数据为一个“次数据”, 由题意,列出下表, 产假安排(单位:周) 14 15 16 17 18 有生育意愿家庭数(单位:户) 4 8 16 20 26 预测值 3.6 9.2 14.8 20.4 26 残差的绝对值 0.4 1.2 1.2 0.4 0 是否为“次数据” 否 是 是 否 否 则“次数据”共有2个,非“次数据”共有3个,从这5个数据中任取三个,“次数据”个数为, 则, , , 分布列 0 1 2 所以,数学期望为 . 17.(25-26高三·全国·一轮复习)中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响应变量的一元线性回归模型,现就2012—2016某市的地区生产总值统计如下: 年份 2012 2013 2014 2015 2016 年份编号 1 2 3 4 5 地区生产总值(亿元) 2.8 3.1 3.9 4.6 5.6 (1)求出经验回归方程,并计算2016年地区生产总值的残差; (2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持续增长,现对这11年的数据有三种经验回归模型,,,它们的分别为和,请根据的数值选择最好的回归模型预测一下2024年该市的地区生产总值; (3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为,结合(2)问中的最佳模型,预测一下在2023年以后,该市人均地区生产总值的变化趋势. 参考公式:,. 【答案】(1), (2)亿元 (3)逐年递增 【分析】(1)根据表格数据,代入公式计算即可; (2)根据决定系数确定回归模型,再代入公式计算即可; (3)列出人均地区生产总值表达式,再用定义法确定函数单调性. 【详解】(1)由数据,, , 而,, 所以,则,综上,经验回归方程为, 当时,,故2016年地区生产总值残差为; (2)根据决定系数越大拟合越好,由于,故模型较好, 因2024年对应,则亿元; (3)设该市人均地区生产总值为, , 令,且, 若,所以, 而,,则0,故, 所以在上递增,则在上递增, 所以该市人均地区生产总值逐年递增. 18.(25-26高三上·湖北黄冈·期末)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计. (1)根据已知条件,完成下列列联表,并依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关? 性别 男生 女生 合计 不愿报名参加答题活动 愿意报名参加答题活动 合计 200 (2)网络答题规则:假设甲每道题回答是否正确相互独立,且每次答对的概率均为. (i)若答题活动设置且道题,甲仅答对其中10道题的概率最大,求的值. (ii)若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望. 参考公式与数据:,其中. 0.10 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 【答案】(1)列联表见解析,认为学生报名参加答题活动与性别有关联 (2)(i);(ii)的分布列见解析, 【分析】(1)根据题设,结合条件概率的定义求出数据,进而完成列联表,再计算出的值判断即可; (2)(i)设随机变量Y为甲答对题目的个数,则,根据二项分布的概率性质建立不等式组即可求解;(ii)写出的所有可能取值,结合独立事件的概率特征求出对应的概率,从而可写出的分布列及期望. 【详解】(1)因为,所以愿意报名参加答题活动人数为, 又因为,所以愿意报名参加答题活动的男生人数为,愿意报名参加答题活动的女生人数为,则可得到列联表为: 性别 男生 女生 合计 不愿报名参加答题活动 20 60 80 愿意报名参加答题活动 80 40 120 合计 100 100 200 零假设为:学生报名参加答题活动与性别无关, 则, 依据小概率值的独立性检验,我们推断不成立, 即认为学生报名参加答题活动与性别有关联,此推断犯错误的概率不大于0.001; (2)(i)设随机变量Y为甲答对题目的个数,则. 则, 假设最有可能答对题目的数量是10次,则 即: 解得,又,则; (ii)的所有可能取值为:1,2,3,4, ,,, , 所以的分布列为: X 1 2 3 4 P 故. 19.(25-26高三上·河北·期末)某社交平台对用户行为进行分析,收集了每位用户每日的活跃时间(单位:小时)和发布内容数量(单位:条).为分析两变量间的相关性,需对数据进行标准化处理.现随机抽取名用户,得到数据,定义标准化变量与的相关系数为. (1)证明:且. (2)基于历史数据,用户活跃时间,设平台服务成本为随机变量,当时,,当时,,当时,,若在变化,且0.9544,求的期望的取值范围. (3)设维向量与的数量积定义为,模长定义为与的夹角满足.设x,y标准化变量对应的向量分别为为向量与的夹角.该平台还记录了每位用户的好友数量(单位:人),其标准化变量对应的向量,).已知活跃时间与发布内容数量的相关系数为,发布内容数量与好友数量的相关系数为,设与的夹角为与的夹角为,且,求活跃时间与好友数量的相关系数的取值范围. 附相关公式:与的相关系数. 【答案】(1)证明见解析 (2) (3) 【分析】(1)由条件提供的公式化简即可证明; (2)设,根据正态分布的概率特点求出的范围,利用离散型随机变量的期望的定义表达出的期望,从而即可求解; (3)由(1)易得,从而,活跃时间与好友数量的相关系数即为,结合条件,根据余弦函数的单调性及两角和差的余弦公式即可求解. 【详解】(1)证明:由,得, 将代入上式,得,同理得, 由,及相关系数, 得 因为,所以. (2)设,则. 因为,所以, 则. 因为,所以,故的取值范围是. (3)由(1)知, ,则,故. 因为,所以, 且均为锐角,则. 由及余弦函数在上单调递减, 可得, 即 则,即. 故活跃时间与好友数量的相关系数的取值范围是. 第 1 页 共 9 页 学科网(北京)股份有限公司 $ 第八章 成对数据的统计分析(能力提升卷) 考试时间:120分钟;满分:150分 姓名:___________班级:___________考号:___________ 考卷信息: 本卷试题共19题,单选8题,多选3题,填空3题,解答5题,满分150分,限时120分钟,试卷紧扣教材,细分题组,精选一年好题,两年真题,练基础,提能力! 1. 选择题(共8小题,满分40分,每小题5分) 1.(25-26高二下·山西·期中)网购是现代年轻人重要的购物方式,某电商对其旗下的一家专营店近五年来每年的利润额(单位:万元)与年份代码进行了统计,得如下数据: x 1 2 3 4 5 y 2.5 3.3 4.5 6.2 8.5 则x与y的样本相关系数(   ) 参考公式:,参考数据:,. A.0.99 B.0.98 C.0.97 D.0.96 2.(25-26高二下·天津武清·期中)已知下列四个命题:①残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;②甲、乙两个模型的决定系数分别约为0.88和0.80,则模型乙的拟合效果更好;③回归直线恒过点,且至少过一个样本点;④在线性回归分析中,样本相关系数r的绝对值越接近1时,成对样本数据的线性相关程度越强.其中真命题的个数是(    ) A.4 B.3 C.2 D.1 3.(25-26高二下·海南·期中)根据生物实验中的一组数据作出如图所示的散点图,并对这组数据进行回归分析后发现遗漏了点,增加点后再次进行回归分析,得到的结果和原来相比(    ) A.决定系数变小 B.残差平方和变小 C.相关系数变大 D.不变 4.(25-26高二下·江苏盐城·期中)下列说法中不正确的是(   ) A.随机变量X的方差,期望,则 B.在成对样本数据分析中相关系数,表示两个变量之间没有线性相关关系 C.根据线性回归方程得到预测值为时的观测值为34,则残差为0.009 D.为了研究某种商品的广告投入x和收益y之间的相关关系,某研究小组收集了5组样本数据如表所示,得到线性回归方程为,则当广告投入为10万元时,收益的预测值为2.68万元 x/万元 1 2 3 4 5 y/万元 0.50 0.80 1.00 1.20 1.50 5.(25-26高二下·河北沧州·期中)为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取男性人数与女性人数相同,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性中不喜爱钓鱼的至少有(   ) 附:,其中. A.人 B.人 C.人 D.人 6.(25-26高二下·福建泉州·阶段检测)某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的 若有的把握认为喜欢短视频和性别相关联,则的最小值为(    ) (附,其中.) A. B. C. D. 7.(25-26高二下·云南昭通·期中)对于变量,,经过随机抽样获得成对数据,且 ,利用最小二乘法得到关于的线性回归方程为,且与的相关系数,则下列结论正确的是(   ) A.越大,与的线性相关性越弱 B.若,则 C.若,则 D.若样本点都在回归直线上,则 8.(25-26高二下·江西南昌·阶段检测)已知样本点,,……,的经验回归直线的方程为,相关系数为,样本均值分别为,.现令,.设新样本点的经验回归直线为,则下列命题为假命题的是(   ) 附:样本相关系数,经验回归方程中斜率和截距的最小二乘估计公式分别为,. A.与的相关系数为 B.过 C.的斜率为 D.的截距为 2. 多选题(共3小题,满分18分,每小题6分) 9.(2026·江西·模拟预测)已知某软件公司开发了一款新型智能解题软件,现将该软件上市后的月份以及当月获得的利润(单位:万元)统计如下表所示,并根据表中数据,得到经验回归方程,则(     ) 月份 1 2 3 4 5 利润 6 7 9 A. B.可以估计每增加1个月份,月利润平均提高万元 C.可以估计上市后的第7个月的利润为万元 D.上市后的第4个月的利润的残差为万元 10.(2026·河北保定·模拟预测)为了研究与的线性相关关系,收集了 10组样本数据,已知样本点的中心为,且 ,,的分位数为,若关于的经验回归方程为 则下列说法正确的是(    ) A. B.与负相关 C. D.样本相关系数必大于0 11.(25-26高二下·辽宁朝阳·期中)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,结果得到列联表如下:则(   ) 性别 男生 女生 合计 不愿报名参加答题活动 20 60 80 愿意报名参加答题活动 80 合计 100 参考公式:,其中. 附表: 0.1 0.05 0.025 0.01 0.001 2.706 3.841 5.024 6.635 10.828 A.当时,有的把握认为参与答题意愿与性别无关. B.当时,有的把握认为参与答题意愿与性别有关. C.当时,根据小概率值的独立性检验,认为参与答题意愿与性别有关联. D.当时,根据小概率值的独立性检验,没有充分的证据推断参与答题意愿与性别有关联. 3. 填空题(共3小题,满分15分,每小题5分) 12.(江苏徐州市2026届高三模拟预测数学试题)将某数学博主1—4月份的粉丝量y整理成如下表格,根据表中数据求出z关于x的经验回归方程为,则预测该数学博主6月末的粉丝量约为______. 月份x 1 2 3 4 粉丝量y 13.(2026·山东滨州·二模)已知变量和变量的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,经重新计算得到新回归直线的斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为__________.(残差观测值预测值) 14.(25-26高二下·江西·月考)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人. 参考数据及公式:,其中. 0.050 0.010 0.001 3.841 6.635 10.828 4. 解答题(共5小题,第15题13分,第16、17题15分,第18、19题17分,满分77分) 15.(重庆市巴蜀教育集团2025-2026学年高二下学期5月期中考试数学试题)为了比较甲,乙两所学校学生的数学水平,采用简单随机抽样的方法抽取了100名学生,通过测验得到了如下数据:甲校50名学生中有10名数学成绩优秀,乙校50名学生中有15名数学成绩优秀. (1)请将列联表补充完整; 学校 数学成绩 合计 优秀 不优秀 甲校 10 乙校 15 合计 100 (2)依据小概率值的独立性检验,能否据此推断两校学生的数学成绩优秀率有差异. (3)用甲校数学成绩样本的优秀率作为甲校数学成绩总体的优秀率,估计甲校的3名学生中恰好有两名学生数学成绩优秀的概率. 参考数据: 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 16.(25-26高二下·吉林长春·期中)我国全面二孩政策已正式实施,这次人口与生育政策的历史性调整,使得“要不要再生一个”,“生二孩能休多久产假”等问题成为千千万万个家庭在生育决策上避不开的话题.为了解针对产假的不同安排方案形成的生育意愿,某调查机构随机抽取了200户有生育二胎能力的适龄家庭进行问卷调查,得到如下数据: 产假安排(单位:周) 14 15 16 17 18 有生育意愿家庭数(单位:户) 4 8 16 20 26 (1)建立变量关于的一元线性回归模型; (2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于1时,称该对数据为一个“次数据”,现从这5个成对数据中任取3个做残差分析,求取到的数据中“次数据”个数的数学期望. 附:经验回归直线的斜率和截距的最小二乘估计公式分别为, 参考数据:. 17.(25-26高三·全国·一轮复习)中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响应变量的一元线性回归模型,现就2012—2016某市的地区生产总值统计如下: 年份 2012 2013 2014 2015 2016 年份编号 1 2 3 4 5 地区生产总值(亿元) 2.8 3.1 3.9 4.6 5.6 (1)求出经验回归方程,并计算2016年地区生产总值的残差; (2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持续增长,现对这11年的数据有三种经验回归模型,,,它们的分别为和,请根据的数值选择最好的回归模型预测一下2024年该市的地区生产总值; (3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为,结合(2)问中的最佳模型,预测一下在2023年以后,该市人均地区生产总值的变化趋势. 参考公式:,. 18.(25-26高三上·湖北黄冈·期末)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计. (1)根据已知条件,完成下列列联表,并依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关? 性别 男生 女生 合计 不愿报名参加答题活动 愿意报名参加答题活动 合计 200 (2)网络答题规则:假设甲每道题回答是否正确相互独立,且每次答对的概率均为. (i)若答题活动设置且道题,甲仅答对其中10道题的概率最大,求的值. (ii)若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望. 参考公式与数据:,其中. 0.10 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 19.(25-26高三上·河北·期末)某社交平台对用户行为进行分析,收集了每位用户每日的活跃时间(单位:小时)和发布内容数量(单位:条).为分析两变量间的相关性,需对数据进行标准化处理.现随机抽取名用户,得到数据,定义标准化变量与的相关系数为. (1)证明:且. (2)基于历史数据,用户活跃时间,设平台服务成本为随机变量,当时,,当时,,当时,,若在变化,且0.9544,求的期望的取值范围. (3)设维向量与的数量积定义为,模长定义为与的夹角满足.设x,y标准化变量对应的向量分别为为向量与的夹角.该平台还记录了每位用户的好友数量(单位:人),其标准化变量对应的向量,).已知活跃时间与发布内容数量的相关系数为,发布内容数量与好友数量的相关系数为,设与的夹角为与的夹角为,且,求活跃时间与好友数量的相关系数的取值范围. 附相关公式:与的相关系数. 第 1 页 共 9 页 学科网(北京)股份有限公司 $

资源预览图

第八章  成对数据的统计分析(能力提升卷)-2025-2026学年高二下学期数学人教A版选择性必修第三册
1
第八章  成对数据的统计分析(能力提升卷)-2025-2026学年高二下学期数学人教A版选择性必修第三册
2
第八章  成对数据的统计分析(能力提升卷)-2025-2026学年高二下学期数学人教A版选择性必修第三册
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。