第八章 成对数据的统计分析(能力提升卷)-2025-2026学年高二下学期数学人教A版选择性必修第三册
2026-05-23
|
2份
|
30页
|
120人阅读
|
1人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 小结 |
| 类型 | 作业-单元卷 |
| 知识点 | - |
| 使用场景 | 同步教学-单元练习 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 1.31 MB |
| 发布时间 | 2026-05-23 |
| 更新时间 | 2026-05-23 |
| 作者 | 高数精品专辑1969 |
| 品牌系列 | - |
| 审核时间 | 2026-05-23 |
| 下载链接 | https://m.zxxk.com/soft/57999878.html |
| 价格 | 1.50储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
**基本信息**
本卷为高中数学第八章“成对数据的统计分析”能力提升单元卷,精选近三年期中、模拟及真题,覆盖相关系数、回归分析、独立性检验等核心知识,通过分层题组实现基础巩固与能力提升,适配高二下单元复习或高三一轮备考。
**题型特征**
|题型|题量/分值|知识覆盖|命题特色|
|----|-----------|----------|----------|
|单选|8/40|样本相关系数计算、残差分析、回归直线性质|结合电商利润等现实情境,考查数学眼光观察数据关联|
|多选|3/18|回归方程应用、独立性检验|以软件公司利润、AI答题活动为背景,体现数学思维的逻辑推理|
|填空|3/15|回归预测、残差计算|联系粉丝量增长、中学生追星问题,培养数据观念与模型意识|
|解答|5/77|列联表构建、回归模型选择、概率分布|综合地区生产总值、社交平台用户行为等热点,强化数学语言表达与综合应用能力|
内容正文:
第八章 成对数据的统计分析(能力提升卷)
考试时间:120分钟;满分:150分
姓名:___________班级:___________考号:___________
考卷信息:
本卷试题共19题,单选8题,多选3题,填空3题,解答5题,满分150分,限时120分钟,试卷紧扣教材,细分题组,精选一年好题,两年真题,练基础,提能力!
1. 选择题(共8小题,满分40分,每小题5分)
1.(25-26高二下·山西·期中)网购是现代年轻人重要的购物方式,某电商对其旗下的一家专营店近五年来每年的利润额(单位:万元)与年份代码进行了统计,得如下数据:
x
1
2
3
4
5
y
2.5
3.3
4.5
6.2
8.5
则x与y的样本相关系数( )
参考公式:,参考数据:,.
A.0.99 B.0.98 C.0.97 D.0.96
【答案】B
【分析】代入相关系数公式求解即可.
【详解】由题意,得,,, ,所以.
2.(25-26高二下·天津武清·期中)已知下列四个命题:①残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;②甲、乙两个模型的决定系数分别约为0.88和0.80,则模型乙的拟合效果更好;③回归直线恒过点,且至少过一个样本点;④在线性回归分析中,样本相关系数r的绝对值越接近1时,成对样本数据的线性相关程度越强.其中真命题的个数是( )
A.4 B.3 C.2 D.1
【答案】D
【详解】对于①,残差图中,残差点所在水平带状区域越窄,说明残差波动越小,
即回归方程的预报精确度越高,残差点所在水平带状区域越宽,说明残差波动越大,
即回归方程的预报精确度越低,错误;
对于②,决定系数越接近1,说明模型对数据的拟合效果越好,故模型甲的拟合效果更好,错误;
对于③,回归直线过样本数据,,,的中心点,
并不一定过样本数据中的某一个点,错误;
对于④,在线性回归分析中,样本相关系数r的绝对值越接近1时,成对样本数据的线性相关程度越强,正确.
3.(25-26高二下·海南·期中)根据生物实验中的一组数据作出如图所示的散点图,并对这组数据进行回归分析后发现遗漏了点,增加点后再次进行回归分析,得到的结果和原来相比( )
A.决定系数变小 B.残差平方和变小
C.相关系数变大 D.不变
【答案】A
【详解】增加点,从散点图中可以看出拟合效果变差;
决定系数越接近1,拟合效果越好,所以拟合效果变差后决定系数变小,故A正确;
残差平方和越小,拟合效果越好,所以残差平方和变大,故B错误;
越接近1,相关程度越强,拟合效果越好,由于两个变量成正相关,所以相关系数变小,故C错误;
增加点前的的平均数为,增加点后的的平均数为,
所以变大,故D错误.
4.(25-26高二下·江苏盐城·期中)下列说法中不正确的是( )
A.随机变量X的方差,期望,则
B.在成对样本数据分析中相关系数,表示两个变量之间没有线性相关关系
C.根据线性回归方程得到预测值为时的观测值为34,则残差为0.009
D.为了研究某种商品的广告投入x和收益y之间的相关关系,某研究小组收集了5组样本数据如表所示,得到线性回归方程为,则当广告投入为10万元时,收益的预测值为2.68万元
x/万元
1
2
3
4
5
y/万元
0.50
0.80
1.00
1.20
1.50
【答案】A
【分析】利用方差与期望值的关系式可得A错误,相关系数表示两个变量之间没有线性相关关系,根据残差定义直接代入计算可判断C正确,求出回归方程将代入计算可得结果.
【详解】由方差,期望,则,可得,因此A错误;
当相关系数时,表示两个变量之间没有线性相关关系,即B正确;
易知残差为,所以C正确;
对于D,显然,
因此可得,解得;
当广告投入为10万元时,收益的预测值为,因此D正确.
5.(25-26高二下·河北沧州·期中)为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取男性人数与女性人数相同,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性中不喜爱钓鱼的至少有( )
附:,其中.
A.人 B.人 C.人 D.人
【答案】C
【分析】设被调查的男性有人,则女性有人,列出列联表,根据独立性检验的基本思想可得出关于的不等式,结合可得出的值,即可得出被调查的男性中不喜爱钓鱼的人数至少为.
【详解】设被调查的男性有人,则女性有人,根据题意,可得列联表如下:
钓鱼
性别
男性
女性
总计
喜爱钓鱼
不喜爱钓鱼
总计
则,
本次调查得出“有的把握认为是否喜爱钓鱼与性别有关”的结论,
可得,解得,
又因为列联表中相关人数需为整数,则,
所以,被调查的男性中不喜爱钓鱼的至少有人.
6.(25-26高二下·福建泉州·阶段检测)某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的 若有的把握认为喜欢短视频和性别相关联,则的最小值为( )
(附,其中.)
A. B. C. D.
【答案】B
【分析】根据题意先列出列联表计算值,再根据计算出的最小值.
【详解】根据题意,列联表如下:
喜欢
不喜欢
合计
男
女
合计
;
∵有的把握认为喜欢短视频和性别相关联,即,
,,又,
则的最小值为.
故选:B.
7.(25-26高二下·云南昭通·期中)对于变量,,经过随机抽样获得成对数据,且 ,利用最小二乘法得到关于的线性回归方程为,且与的相关系数,则下列结论正确的是( )
A.越大,与的线性相关性越弱
B.若,则
C.若,则
D.若样本点都在回归直线上,则
【答案】D
【分析】对于A,由的绝对值大小与和的线性相关性强弱关系可判断选项正误;对于B,由与计算公式可判断选项正误.对于C,由题设可得,据此可判断选项正误;对于D,由的意义可判断选项正误;
【详解】对于A,的绝对值越接近1,由于,故的值越大,与的线性相关性越强,故A错误;
对于B,,从而,则当时,因无法确定,则无法确定,故B错误.
对于C,由于可得,则,当时,,则,故C错误;
对于D,若样本点都在回归直线上,且,则,D正确;
8.(25-26高二下·江西南昌·阶段检测)已知样本点,,……,的经验回归直线的方程为,相关系数为,样本均值分别为,.现令,.设新样本点的经验回归直线为,则下列命题为假命题的是( )
附:样本相关系数,经验回归方程中斜率和截距的最小二乘估计公式分别为,.
A.与的相关系数为 B.过
C.的斜率为 D.的截距为
【答案】D
【分析】根据经验回归直线必过样本中心点,代入公式依次判断选项即可.
【详解】由已知样本均值性质可得新样本均值分别为与,
因为经验回归直线必过样本中心点,
所以新经验回归直线过点,故B正确;
因为且,
代入相关系数公式可得新样本的相关系数,故A正确;
代入斜率公式可得新经验回归直线的斜率
,故C正确;
由回归截距公式可得新经验回归直线的截距,故D错误.故选D.
2. 多选题(共3小题,满分18分,每小题6分)
9.(2026·江西·模拟预测)已知某软件公司开发了一款新型智能解题软件,现将该软件上市后的月份以及当月获得的利润(单位:万元)统计如下表所示,并根据表中数据,得到经验回归方程,则( )
月份
1
2
3
4
5
利润
6
7
9
A.
B.可以估计每增加1个月份,月利润平均提高万元
C.可以估计上市后的第7个月的利润为万元
D.上市后的第4个月的利润的残差为万元
【答案】AC
【详解】由统计表可知:
,,
则回归直线过样本中心点,代入回归方程得,
,解得,故A正确;
回归方程为,斜率为,则每增加1个月份,月利润平均提高万元,
故B错误;
时,万元,故C正确;
由统计表知,第4个月,预测值,
残差万元,故D错误.
10.(2026·河北保定·模拟预测)为了研究与的线性相关关系,收集了 10组样本数据,已知样本点的中心为,且 ,,的分位数为,若关于的经验回归方程为 则下列说法正确的是( )
A. B.与负相关
C. D.样本相关系数必大于0
【答案】CD
【详解】选项A:样本点的中心为,关于的经验回归方程为,
所以代入可得,解得,故A错误;
选项B:因为回归系数,因此与正相关,故B错误;
选项C:的分位数为,,
即,因为,所以解得,故C正确;
选项D:因为回归系数,所以与正相关,
因此样本相关系数,故D正确.
11.(25-26高二下·辽宁朝阳·期中)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,结果得到列联表如下:则( )
性别
男生
女生
合计
不愿报名参加答题活动
20
60
80
愿意报名参加答题活动
80
合计
100
参考公式:,其中.
附表:
0.1
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
A.当时,有的把握认为参与答题意愿与性别无关.
B.当时,有的把握认为参与答题意愿与性别有关.
C.当时,根据小概率值的独立性检验,认为参与答题意愿与性别有关联.
D.当时,根据小概率值的独立性检验,没有充分的证据推断参与答题意愿与性别有关联.
【答案】BC
【详解】对于AB,当时,,
则,
所以有的把握认为参与答题意愿与性别有关.,故A错误,B正确;
对于CD,当时,,
零假设为:参与答题意愿与性别无关,
则,
依据小概率值的独立性检验,我们推断不成立,
所以根据小概率值的独立性检验,认为参与答题意愿与性别有关联,故C正确,D错误.
3. 填空题(共3小题,满分15分,每小题5分)
12.(江苏徐州市2026届高三模拟预测数学试题)将某数学博主1—4月份的粉丝量y整理成如下表格,根据表中数据求出z关于x的经验回归方程为,则预测该数学博主6月末的粉丝量约为______.
月份x
1
2
3
4
粉丝量y
【答案】
【详解】因为,所以当时,,
所以,解得.
故预测该数学博主6月末的粉丝量约为
13.(2026·山东滨州·二模)已知变量和变量的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,经重新计算得到新回归直线的斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为__________.(残差观测值预测值)
【答案】/
【分析】将样本中心点代入回归方程中求出,即可得出,进而得出新数据的样本中心点和回归方程,代入计算即可.
【详解】由题意得,,
则,,
当增加两个样本数据和后,
变量的平均数为,变量的平均数为,
因为新回归直线的斜率为3,所以可设其方程为,
将代入得,则,
令,则,则样本数据所对应的残差为.
14.(25-26高二下·江西·月考)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人.
参考数据及公式:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】48
【分析】设男生人数为,由题可得列联表,然后由题设可得关于不等式,据此可得答案.
【详解】设男生人数为,则女生人数为,男生追星人数为,不追星人数为,
女生追星人数为,不追星人数为,据此可得列联表如下:
追星
不追星
总计
男生
女生
总计
则由独立性检验相关计算公式结合题设,可得:
.
又为保证所有人数为正整数,需为的倍数,则.
4. 解答题(共5小题,第15题13分,第16、17题15分,第18、19题17分,满分77分)
15.(重庆市巴蜀教育集团2025-2026学年高二下学期5月期中考试数学试题)为了比较甲,乙两所学校学生的数学水平,采用简单随机抽样的方法抽取了100名学生,通过测验得到了如下数据:甲校50名学生中有10名数学成绩优秀,乙校50名学生中有15名数学成绩优秀.
(1)请将列联表补充完整;
学校
数学成绩
合计
优秀
不优秀
甲校
10
乙校
15
合计
100
(2)依据小概率值的独立性检验,能否据此推断两校学生的数学成绩优秀率有差异.
(3)用甲校数学成绩样本的优秀率作为甲校数学成绩总体的优秀率,估计甲校的3名学生中恰好有两名学生数学成绩优秀的概率.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
学校
数学成绩
合计
优秀
不优秀
甲校
10
40
50
乙校
15
35
50
合计
25
75
100
(2)不能据此推断两校学生的数学成绩优秀率有差异
(3)
【分析】(1)根据题意完成列联表,
(2)结合零假设、卡方公式进行运算求解判断即可;
(3)利用二项分布求解即可.
【详解】(1)由已知,列联表如下:
单位:人
学校
数学成绩
合计
优秀
不优秀
甲校
10
40
50
乙校
15
35
50
合计
25
75
100
(2)零假设为:两校学生的数学成绩优秀率无差异.
根据列联表数据,计算得到
.
根据小概率值的独立性检验,没有充分证据推断不成立,
因此不拒绝原假设,即不能认为两校学生的数学成绩优秀率有差异.
(3)甲校数学成绩样本的优秀率为,作为甲校数学成绩总体的优秀率,
设甲校的3名学生中成绩优秀的人数为,则,
所求概率为.
16.(25-26高二下·吉林长春·期中)我国全面二孩政策已正式实施,这次人口与生育政策的历史性调整,使得“要不要再生一个”,“生二孩能休多久产假”等问题成为千千万万个家庭在生育决策上避不开的话题.为了解针对产假的不同安排方案形成的生育意愿,某调查机构随机抽取了200户有生育二胎能力的适龄家庭进行问卷调查,得到如下数据:
产假安排(单位:周)
14
15
16
17
18
有生育意愿家庭数(单位:户)
4
8
16
20
26
(1)建立变量关于的一元线性回归模型;
(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于1时,称该对数据为一个“次数据”,现从这5个成对数据中任取3个做残差分析,求取到的数据中“次数据”个数的数学期望.
附:经验回归直线的斜率和截距的最小二乘估计公式分别为,
参考数据:.
【答案】(1)
(2)
【分析】(1)由已知求出,,利用公式求出,,即可得到关于的线性回归方程;
(2)由回归方程求出预测值,可得残差的绝对值,判断是否为“次数据”,可得“次数据”和非“次数据”个数,“次数据”个数为,求出对应概率,即可列出分布列求出数学期望.
【详解】(1),,
所以,
则, ,
所以关于的一元线性回归方程为.
(2)由(1)回归方程为,样本数据的残差的绝对值大于1时,称该对数据为一个“次数据”,
由题意,列出下表,
产假安排(单位:周)
14
15
16
17
18
有生育意愿家庭数(单位:户)
4
8
16
20
26
预测值
3.6
9.2
14.8
20.4
26
残差的绝对值
0.4
1.2
1.2
0.4
0
是否为“次数据”
否
是
是
否
否
则“次数据”共有2个,非“次数据”共有3个,从这5个数据中任取三个,“次数据”个数为,
则,
,
,
分布列
0
1
2
所以,数学期望为
.
17.(25-26高三·全国·一轮复习)中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响应变量的一元线性回归模型,现就2012—2016某市的地区生产总值统计如下:
年份
2012
2013
2014
2015
2016
年份编号
1
2
3
4
5
地区生产总值(亿元)
2.8
3.1
3.9
4.6
5.6
(1)求出经验回归方程,并计算2016年地区生产总值的残差;
(2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持续增长,现对这11年的数据有三种经验回归模型,,,它们的分别为和,请根据的数值选择最好的回归模型预测一下2024年该市的地区生产总值;
(3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为,结合(2)问中的最佳模型,预测一下在2023年以后,该市人均地区生产总值的变化趋势.
参考公式:,.
【答案】(1),
(2)亿元
(3)逐年递增
【分析】(1)根据表格数据,代入公式计算即可;
(2)根据决定系数确定回归模型,再代入公式计算即可;
(3)列出人均地区生产总值表达式,再用定义法确定函数单调性.
【详解】(1)由数据,,
,
而,,
所以,则,综上,经验回归方程为,
当时,,故2016年地区生产总值残差为;
(2)根据决定系数越大拟合越好,由于,故模型较好,
因2024年对应,则亿元;
(3)设该市人均地区生产总值为,
,
令,且,
若,所以,
而,,则0,故,
所以在上递增,则在上递增,
所以该市人均地区生产总值逐年递增.
18.(25-26高三上·湖北黄冈·期末)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计.
(1)根据已知条件,完成下列列联表,并依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关?
性别
男生
女生
合计
不愿报名参加答题活动
愿意报名参加答题活动
合计
200
(2)网络答题规则:假设甲每道题回答是否正确相互独立,且每次答对的概率均为.
(i)若答题活动设置且道题,甲仅答对其中10道题的概率最大,求的值.
(ii)若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,认为学生报名参加答题活动与性别有关联
(2)(i);(ii)的分布列见解析,
【分析】(1)根据题设,结合条件概率的定义求出数据,进而完成列联表,再计算出的值判断即可;
(2)(i)设随机变量Y为甲答对题目的个数,则,根据二项分布的概率性质建立不等式组即可求解;(ii)写出的所有可能取值,结合独立事件的概率特征求出对应的概率,从而可写出的分布列及期望.
【详解】(1)因为,所以愿意报名参加答题活动人数为,
又因为,所以愿意报名参加答题活动的男生人数为,愿意报名参加答题活动的女生人数为,则可得到列联表为:
性别
男生
女生
合计
不愿报名参加答题活动
20
60
80
愿意报名参加答题活动
80
40
120
合计
100
100
200
零假设为:学生报名参加答题活动与性别无关,
则,
依据小概率值的独立性检验,我们推断不成立,
即认为学生报名参加答题活动与性别有关联,此推断犯错误的概率不大于0.001;
(2)(i)设随机变量Y为甲答对题目的个数,则.
则,
假设最有可能答对题目的数量是10次,则
即:
解得,又,则;
(ii)的所有可能取值为:1,2,3,4,
,,,
,
所以的分布列为:
X
1
2
3
4
P
故.
19.(25-26高三上·河北·期末)某社交平台对用户行为进行分析,收集了每位用户每日的活跃时间(单位:小时)和发布内容数量(单位:条).为分析两变量间的相关性,需对数据进行标准化处理.现随机抽取名用户,得到数据,定义标准化变量与的相关系数为.
(1)证明:且.
(2)基于历史数据,用户活跃时间,设平台服务成本为随机变量,当时,,当时,,当时,,若在变化,且0.9544,求的期望的取值范围.
(3)设维向量与的数量积定义为,模长定义为与的夹角满足.设x,y标准化变量对应的向量分别为为向量与的夹角.该平台还记录了每位用户的好友数量(单位:人),其标准化变量对应的向量,).已知活跃时间与发布内容数量的相关系数为,发布内容数量与好友数量的相关系数为,设与的夹角为与的夹角为,且,求活跃时间与好友数量的相关系数的取值范围.
附相关公式:与的相关系数.
【答案】(1)证明见解析
(2)
(3)
【分析】(1)由条件提供的公式化简即可证明;
(2)设,根据正态分布的概率特点求出的范围,利用离散型随机变量的期望的定义表达出的期望,从而即可求解;
(3)由(1)易得,从而,活跃时间与好友数量的相关系数即为,结合条件,根据余弦函数的单调性及两角和差的余弦公式即可求解.
【详解】(1)证明:由,得,
将代入上式,得,同理得,
由,及相关系数,
得
因为,所以.
(2)设,则.
因为,所以,
则.
因为,所以,故的取值范围是.
(3)由(1)知,
,则,故.
因为,所以,
且均为锐角,则.
由及余弦函数在上单调递减,
可得,
即
则,即.
故活跃时间与好友数量的相关系数的取值范围是.
第 1 页 共 9 页
学科网(北京)股份有限公司
$
第八章 成对数据的统计分析(能力提升卷)
考试时间:120分钟;满分:150分
姓名:___________班级:___________考号:___________
考卷信息:
本卷试题共19题,单选8题,多选3题,填空3题,解答5题,满分150分,限时120分钟,试卷紧扣教材,细分题组,精选一年好题,两年真题,练基础,提能力!
1. 选择题(共8小题,满分40分,每小题5分)
1.(25-26高二下·山西·期中)网购是现代年轻人重要的购物方式,某电商对其旗下的一家专营店近五年来每年的利润额(单位:万元)与年份代码进行了统计,得如下数据:
x
1
2
3
4
5
y
2.5
3.3
4.5
6.2
8.5
则x与y的样本相关系数( )
参考公式:,参考数据:,.
A.0.99 B.0.98 C.0.97 D.0.96
2.(25-26高二下·天津武清·期中)已知下列四个命题:①残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;②甲、乙两个模型的决定系数分别约为0.88和0.80,则模型乙的拟合效果更好;③回归直线恒过点,且至少过一个样本点;④在线性回归分析中,样本相关系数r的绝对值越接近1时,成对样本数据的线性相关程度越强.其中真命题的个数是( )
A.4 B.3 C.2 D.1
3.(25-26高二下·海南·期中)根据生物实验中的一组数据作出如图所示的散点图,并对这组数据进行回归分析后发现遗漏了点,增加点后再次进行回归分析,得到的结果和原来相比( )
A.决定系数变小 B.残差平方和变小
C.相关系数变大 D.不变
4.(25-26高二下·江苏盐城·期中)下列说法中不正确的是( )
A.随机变量X的方差,期望,则
B.在成对样本数据分析中相关系数,表示两个变量之间没有线性相关关系
C.根据线性回归方程得到预测值为时的观测值为34,则残差为0.009
D.为了研究某种商品的广告投入x和收益y之间的相关关系,某研究小组收集了5组样本数据如表所示,得到线性回归方程为,则当广告投入为10万元时,收益的预测值为2.68万元
x/万元
1
2
3
4
5
y/万元
0.50
0.80
1.00
1.20
1.50
5.(25-26高二下·河北沧州·期中)为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取男性人数与女性人数相同,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性中不喜爱钓鱼的至少有( )
附:,其中.
A.人 B.人 C.人 D.人
6.(25-26高二下·福建泉州·阶段检测)某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的 若有的把握认为喜欢短视频和性别相关联,则的最小值为( )
(附,其中.)
A. B. C. D.
7.(25-26高二下·云南昭通·期中)对于变量,,经过随机抽样获得成对数据,且 ,利用最小二乘法得到关于的线性回归方程为,且与的相关系数,则下列结论正确的是( )
A.越大,与的线性相关性越弱
B.若,则
C.若,则
D.若样本点都在回归直线上,则
8.(25-26高二下·江西南昌·阶段检测)已知样本点,,……,的经验回归直线的方程为,相关系数为,样本均值分别为,.现令,.设新样本点的经验回归直线为,则下列命题为假命题的是( )
附:样本相关系数,经验回归方程中斜率和截距的最小二乘估计公式分别为,.
A.与的相关系数为 B.过
C.的斜率为 D.的截距为
2. 多选题(共3小题,满分18分,每小题6分)
9.(2026·江西·模拟预测)已知某软件公司开发了一款新型智能解题软件,现将该软件上市后的月份以及当月获得的利润(单位:万元)统计如下表所示,并根据表中数据,得到经验回归方程,则( )
月份
1
2
3
4
5
利润
6
7
9
A.
B.可以估计每增加1个月份,月利润平均提高万元
C.可以估计上市后的第7个月的利润为万元
D.上市后的第4个月的利润的残差为万元
10.(2026·河北保定·模拟预测)为了研究与的线性相关关系,收集了 10组样本数据,已知样本点的中心为,且 ,,的分位数为,若关于的经验回归方程为 则下列说法正确的是( )
A. B.与负相关
C. D.样本相关系数必大于0
11.(25-26高二下·辽宁朝阳·期中)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,结果得到列联表如下:则( )
性别
男生
女生
合计
不愿报名参加答题活动
20
60
80
愿意报名参加答题活动
80
合计
100
参考公式:,其中.
附表:
0.1
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
A.当时,有的把握认为参与答题意愿与性别无关.
B.当时,有的把握认为参与答题意愿与性别有关.
C.当时,根据小概率值的独立性检验,认为参与答题意愿与性别有关联.
D.当时,根据小概率值的独立性检验,没有充分的证据推断参与答题意愿与性别有关联.
3. 填空题(共3小题,满分15分,每小题5分)
12.(江苏徐州市2026届高三模拟预测数学试题)将某数学博主1—4月份的粉丝量y整理成如下表格,根据表中数据求出z关于x的经验回归方程为,则预测该数学博主6月末的粉丝量约为______.
月份x
1
2
3
4
粉丝量y
13.(2026·山东滨州·二模)已知变量和变量的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,经重新计算得到新回归直线的斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为__________.(残差观测值预测值)
14.(25-26高二下·江西·月考)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人.
参考数据及公式:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
4. 解答题(共5小题,第15题13分,第16、17题15分,第18、19题17分,满分77分)
15.(重庆市巴蜀教育集团2025-2026学年高二下学期5月期中考试数学试题)为了比较甲,乙两所学校学生的数学水平,采用简单随机抽样的方法抽取了100名学生,通过测验得到了如下数据:甲校50名学生中有10名数学成绩优秀,乙校50名学生中有15名数学成绩优秀.
(1)请将列联表补充完整;
学校
数学成绩
合计
优秀
不优秀
甲校
10
乙校
15
合计
100
(2)依据小概率值的独立性检验,能否据此推断两校学生的数学成绩优秀率有差异.
(3)用甲校数学成绩样本的优秀率作为甲校数学成绩总体的优秀率,估计甲校的3名学生中恰好有两名学生数学成绩优秀的概率.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
16.(25-26高二下·吉林长春·期中)我国全面二孩政策已正式实施,这次人口与生育政策的历史性调整,使得“要不要再生一个”,“生二孩能休多久产假”等问题成为千千万万个家庭在生育决策上避不开的话题.为了解针对产假的不同安排方案形成的生育意愿,某调查机构随机抽取了200户有生育二胎能力的适龄家庭进行问卷调查,得到如下数据:
产假安排(单位:周)
14
15
16
17
18
有生育意愿家庭数(单位:户)
4
8
16
20
26
(1)建立变量关于的一元线性回归模型;
(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于1时,称该对数据为一个“次数据”,现从这5个成对数据中任取3个做残差分析,求取到的数据中“次数据”个数的数学期望.
附:经验回归直线的斜率和截距的最小二乘估计公式分别为,
参考数据:.
17.(25-26高三·全国·一轮复习)中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响应变量的一元线性回归模型,现就2012—2016某市的地区生产总值统计如下:
年份
2012
2013
2014
2015
2016
年份编号
1
2
3
4
5
地区生产总值(亿元)
2.8
3.1
3.9
4.6
5.6
(1)求出经验回归方程,并计算2016年地区生产总值的残差;
(2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持续增长,现对这11年的数据有三种经验回归模型,,,它们的分别为和,请根据的数值选择最好的回归模型预测一下2024年该市的地区生产总值;
(3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为,结合(2)问中的最佳模型,预测一下在2023年以后,该市人均地区生产总值的变化趋势.
参考公式:,.
18.(25-26高三上·湖北黄冈·期末)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计.
(1)根据已知条件,完成下列列联表,并依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关?
性别
男生
女生
合计
不愿报名参加答题活动
愿意报名参加答题活动
合计
200
(2)网络答题规则:假设甲每道题回答是否正确相互独立,且每次答对的概率均为.
(i)若答题活动设置且道题,甲仅答对其中10道题的概率最大,求的值.
(ii)若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
19.(25-26高三上·河北·期末)某社交平台对用户行为进行分析,收集了每位用户每日的活跃时间(单位:小时)和发布内容数量(单位:条).为分析两变量间的相关性,需对数据进行标准化处理.现随机抽取名用户,得到数据,定义标准化变量与的相关系数为.
(1)证明:且.
(2)基于历史数据,用户活跃时间,设平台服务成本为随机变量,当时,,当时,,当时,,若在变化,且0.9544,求的期望的取值范围.
(3)设维向量与的数量积定义为,模长定义为与的夹角满足.设x,y标准化变量对应的向量分别为为向量与的夹角.该平台还记录了每位用户的好友数量(单位:人),其标准化变量对应的向量,).已知活跃时间与发布内容数量的相关系数为,发布内容数量与好友数量的相关系数为,设与的夹角为与的夹角为,且,求活跃时间与好友数量的相关系数的取值范围.
附相关公式:与的相关系数.
第 1 页 共 9 页
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。