第八章 成对数据的统计分析全章综合测试卷(提高篇)-2025-2026学年高二数学春季讲义(人教A版选择性必修第三册)
2026-05-27
|
2份
|
26页
|
257人阅读
|
1人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 小结 |
| 类型 | 作业-单元卷 |
| 知识点 | 统计案例 |
| 使用场景 | 同步教学-单元练习 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 337 KB |
| 发布时间 | 2026-05-27 |
| 更新时间 | 2026-05-27 |
| 作者 | 吴老师工作室 |
| 品牌系列 | - |
| 审核时间 | 2026-05-27 |
| 下载链接 | https://m.zxxk.com/soft/58072512.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
**基本信息**
本卷为高二下第八章成对数据的统计分析提高篇单元卷,以生物入侵、药物代谢等现实情境为载体,全面考查回归分析与独立性检验,适配单元复习检测。
**题型特征**
|题型|题量/分值|知识覆盖|命题特色|
|----|-----------|----------|----------|
|单选|8/40|相关系数、残差、独立性检验|结合散点图、哪吒玩具销量等情境|
|多选|3/18|决定系数、残差分析、列联表|药物浓度代谢等真实数据应用|
|填空|3/15|回归方程预测、独立性检验|学生追星调查等生活化问题|
|解答|5/77|相关系数计算、回归模型选择、分布列|电动车广告销量、数学成绩错题习惯等综合应用|
内容正文:
第八章 成对数据的统计分析全章综合测试卷(提高篇)
参考答案与试题解析
第I卷(选择题)
一、单项选择题:本题共8小题,每小题5分,共40分,在每小题给出的四个选项中,只有一项是符合要求的。
1.(5分)(24-25高二下·天津·期末)下列说法中,正确的是( )
A.经验回归直线是由成对样本数据中的两点确定的
B.如果两个变量的相关程度越强,则相关系数越接近于1
C.残差平方和越小的模型,拟合的效果越好
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验:,可判断与有关联,此推断犯错误的概率不超过0.5%
【答案】C
【解题思路】根据回归方程、相关系数的意义、残差平方和、独立性检验的知识对选项逐一判断即可.
【解答过程】对于A,经验回归直线是通过最小二乘法,使所有样本点到直线的误差平方和最小来确定的,
并非由成对样本数据中的两点确定,所有A错误;
对于B,如果两个变量的相关程度越强,当是正相关时,相关系数越接近于1;
当是负相关时,相关系数越接近于,并非只接近1,所以B错误;
对于C,残差平方和是衡量回归模型拟合效果的一个重要指标,残差平方和越小,
说明模型对数据的拟合效果越好,所以C正确;
对于D,在独立性检验中,计算得到,而,
因为,所以不能推断出犯错误的概率不超过0.5%,所以D错误.
故选:C.
2.(5分)(24-25高二下·江西·月考)对两组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】D
【解题思路】根据散点图及相关系数的概念判断即可.
【解答过程】由散点图可知,图(1)中两个变量成正相关,且散点图近似在一条直线上,所以且;
图(2)中两个变量成负相关,且散点图比较分散,所以且;
所以.
故选:D.
3.(5分)(24-25高二下·甘肃白银·期末)假设有两个分类变量X,Y,它们的可能取值分别为和,其列联表为
合计
合计
以下各组数据中,对于同一样本能说明与有关系的可能性最大的一组为( )
A. B.
C. D.
【答案】C
【解题思路】计算各选项中的值,比较大小,即可得答案.
【解答过程】计算各选项中的值,值越大,说明相应的两个分类变量有关系的可能性越大;
对于A,,
对于B,,
对于C,,
对于D,,
由于,
故选:C.
4.(5分)(24-25高二下·江苏·期末)下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对y与t的关系进行拟合,则根据该回归模型,预测第6个月该物种的繁殖数量为( )
第个月
1
2
3
繁殖数量
A.百只 B.百只 C.百只 D.百只
【答案】D
【解题思路】将回归模型两边取自然对数,并令,由此构建一个u与t的回归直线模型,根据回归直线必过中心点,可求出a值,利用所得回归模型进行预测.
【解答过程】由题意,两边取自然对数得,
令,则.
,,
∵回归直线必过样本点的中心,∴,
得,∴,则.
当时,.
故选:D.
5.(5分)(24-25高二下·湖北·月考)已知变量x和变量y的3对随机观测数据,,,则该组样本数据点的相关系数( )
(参考公式:)
A. B. C. D.1
【答案】B
【解题思路】由题目数据结合参考公式可得答案.
【解答过程】由题可得,,
则.
,
,
则.
故选:B.
6.(5分)(24-25高二下·福建泉州·期末)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个样本点和后,得到新的回归直线的斜率为3.则在新的经验回归方程下,样本的残差为( )
A. B. C.0.1 D.0.2
【答案】B
【解题思路】利用线性回归方程必过样本中心点这个性质来求解,结合残差为实际值减去预测值,即可作出判断.
【解答过程】由回归直线方程为必过点,所以,
由于去掉两个样本点和后,
得到新的样本数据的平均数为:
因为新的回归直线的斜率为3,根据必过点,
可得回归直线方程为:,即,
当时,,
在新的经验回归方程下,样本的残差为,
故选:B.
7.(5分)(24-25高二下·福建厦门·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
【答案】A
【解题思路】设总人数为,根据给定条件,求出的观测值并建立不等式,进而求出的最小整数值得解.
【解答过程】设总人数为,则男生选学生物学的人数为,女生选学生物学的人数为,
则列联表为:
男生
女生
合计
选生物学
不选生物学
合计
m
m
2m
因此,
即,又为的倍数,所以男生最少有人.
故选:A.
8.(5分)(24-25高二下·天津和平·期末)《哪吒之魔童闹海》在内地市场的票房突破了154亿大关,成为全球单一电影市场票房的最高记录.一款哪吒变脸玩具深受大家喜爱,某商家统计了最近5个月销量,如表所示:若与线性相关,且线性回归方程为,则下列说法不正确的是( )
时间
1
2
3
4
5
销售量/万只
5
4.5
4
3.5
2.5
A.由题中数据可知,变量与负相关
B.线性回归方程中
C.当时,残差为0.2
D.可以预测当时销量约为2.1万只
【答案】C
【解题思路】对于A,利用表中数据变化情况或看回归方程的正负均可求解;对于B,利用样本中心点求出线性回归方程,即可判断;对于C,利用回归方程即可求出预测值,进而可求出残差,即可判断;对于D,利用回归方程即可求出预测值即可判断.
【解答过程】对于A,从数据看,随的增大而减小,所以变量与负相关,故A正确;
对于B,由表中数据知,,
所以样本中心点为,将样本中心点代入中,
得,所以线性回归方程为,故B正确;
对于C,当时,,残差为,故C错误;
对于D,当时销量约为(万只),故D正确.
故选:C.
二、多项选择题:本题共3小题,每小题6分,共18分,在每小题给出的四个选项中,有多项符合题目的要求,全部选对的得6分,部分选对的得部分分,有选错的得0分。
9.(6分)(24-25高二下·湖北荆州·期末)下列说法正确的有( )
A.利用残差图分析模型的刻画效果,若残差比较均匀的分布在以取值为0的横轴为对称轴的水平带状区域内,则说明该模型刻画数据的效果较好
B.可以用决定系数来比较两个模型的拟合效果,越大模型拟合效果越好
C.已知样本数据的方差为4,则数据的标准差是4
D.设两个变量的样本相关系数为,则越大其线性相关程度越强
【答案】ABC
【解题思路】应用线性相关系数、残差图的意义,决定系数、方差的性质等一一检验即可.
【解答过程】对于A:在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,故A正确;
对于B:决定指数来刻画回归的效果,值越大,说明模型的拟合效果越好,故B正确;
对于C:样本数据的方差为4,则数据的方差为,故标准差为4,故C正确;
对于D:相关系数的绝对值的大小越接近于1,两个变量的线性相关性越强,反之,线性相关性越弱,因此D选项错误;
故选:ABC.
10.(6分)(24-25高二下·辽宁·期末)为了解某种药物的疗效,患者服用该药物,短时间内血液中药物浓度达到峰值,研究员统计了血液中药物浓度(单位:)与代谢时间(单位:)的数据,如下表所示:
0
1
2
3
4
5
6
150
143
132
123
114
104
95
根据表中数据可得回归方程为,则下列说法正确的是( )
附:回归直线中斜率和截距的最小二乘估计公式分别为,,相关系数.
A.
B.当时,对应样本点的残差为0.32
C.若再增加一组数据,则关于的回归直线的斜率变大
D.若删去数据,则与的相关系数不变
【答案】ABD
【解题思路】求出的平均值,即可求出,判断A;根据残差的计算判断B;根据最小二乘估计公式以及相关系数公式可判断CD.
【解答过程】由题意知,
,
所以,A项正确;
由上可知,当时,,
则残差为,B项正确;
再增加一组数据后,,,所以的值不变,
的值也不变,故关于的回归直线的斜率不变,C项错误;
删去数据后,,,所以的值不变,
的值也不变,因此与的相关系数不变,D项正确.
故选:ABD.
11.(6分)(24-25高二下·湖北襄阳·期末)炎炎夏日,许多城市发出高温预警,凉爽的某市成为众多游客旅游的热门选择.为了解来某市旅游的游客旅行方式与年龄是否有关,随机调查了100名游客,得到如下表格.零假设H0旅行方式与年龄没有关联,则下列说法中,正确的有( )
小于40岁
不小于40岁
自由行
38
19
跟团游
20
23
附:χ2=,其中.
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
A.在选择自由行的游客中随机抽取一名,其小于40岁的概率为
B.在选择自由行的游客中按年龄分层随机抽样抽取6人,再从中随机选取2人做进一步的访谈,则2人中至少有1人不小于40岁的概率为
C.根据的独立性检验,推断旅行方式与年龄没有关联,且犯错误概率不超过0.01
D.根据的独立性检验,推断旅行方式与年龄有关联,且犯错误概率不超过0.05
【答案】BD
【解题思路】对A,根据古典概型运算判断;对B,先根据分层抽样求出各层所抽取的人数,再根据古典概型结合对立事件运算判断;对于CD,根据题中数据求,并与临界值对比分析.
【解答过程】对于A,选择自由行的游客人数为,其小于40岁的概率是,故A错误;
对于B,选择自由行中小于40岁和不小于40岁的人数比为2:1,
则按年龄分层抽样抽取的6人中,有4人小于40岁,有2人不小于40岁,
设事件为“2人均小于40岁”,则2人中至少有1人不小于40岁的概率为,故B正确;
对于C,因为,
所以可推断旅行方式与年龄没有关联,但对零假设犯错误的概率是不可知的,故C错误;
对于D,因为,所以推断旅行方式与年龄有关联,且犯错误概率不超过0.05,故D正确.
故选:BD.
第II卷(非选择题)
三、填空题:本题共3小题,每小题5分,共15分。
12.(5分)(24-25高二下·贵州黔西·期末)在线性回归分析模型中,变量与相对应的四组数据为,,,,表示解释变量对于预报变量变化的贡献率,则__________.
附:,,.
【答案】1
【解题思路】根据给定条件,求出回归直线方程,进而求出.
【解答过程】依题意,
,,
则,,
因此关于的线性回归方程为,
当时,,残差;当时,,残差;
当时,,残差;当时,,残差,
因此,所以.
故答案为:1.
13.(5分)(24-25高二下·山东济南·期末)两个相关变量x,y的一组数据统计如下表
x
2
3
4
5
6
y
2.8
3.1
3.3
3.8
4.0
根据上表可得经验回归方程中的为0.31,据此经验回归方程,当时,y的预测值为_________.
【答案】
【解题思路】根据给定数表,求出样本的中心点,进而求出回归方程即可得解.
【解答过程】由数表得,
经验回归方程过点,,
即,则当时,.
故答案为:.
14.(5分)(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有__________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
【答案】
【解题思路】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.
【解答过程】因为抽取个学生,女生人数是男生人数的,
所以抽取个男生,个女生,为了便于计算,我们令,
设男生人数为,依题意可得列联表如下:
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,由,解得,
由题知应为6的整数倍,
而根据小概率值的独立性检验,判断中学生追星与性别有关,
则男生至少有30人,
故答案为:30.
四、解答题:本题共5小题,共77分,解答应写出必要的文字说明、证明过程及验算步骤。
15.(13分)(24-25高二下·广东深圳·期中)深圳欢乐谷试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值.
(2)计算与的相关系数;判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:,.
参考公式:相关系数.若,则与的线性相关性很强.
【答案】(1),
(2),可以用线性回归模型拟合与之间的关系,理由见解析
【解题思路】(1)根据已知数据直接求平均值即可;
(2)分别求出和,再代入公式即可求解,再根据相关系数的绝对值大于0.75且非常接近1判断即可.
【解答过程】(1)由题可知,;
(2)因为,
,
故;
因为与的相关系数的绝对值近似为,大于且非常接近,
说明与的线性相关性很强,从而可以用线性回归模型拟合与之间的关系.
16.(15分)(24-25高二下·天津武清·阶段检测)为加强素质教育,提升学生综合素养,某中学为学生提供了“科技”和“艺术”两门选修课.为了解选择“科技”或“艺术”是否与性别有关,现随机抽取了100人.
(1)补全下面列联表:
性别
科技
艺术
共计
男生
40
50
女生
共计
30
(2)是否有95%的把握认为选择“科技”或“艺术”与性别有关?
参考公式:,其中.
参考附表:
0.100
0.050
0.025
2.706
3.841
5.024
【答案】(1)列联表见解析;
(2)有95%的把握认为选择“科技”或“艺术”与性别有关.
【解题思路】(1)根据题意与表中数据即可完成列联表;
(2)根据公式求出,再对照临界值表,即可得出结论.
【解答过程】(1)补全列联表如下,
性别
科技
艺术
共计
男生
40
10
50
女生
30
20
50
共计
70
30
100
(2)根据列联表数据,得
,
所以有的把握认为选择“科技”或“艺术”与性别有关.
17.(15分)(24-25高二下·广东中山·月考)广东省深圳市是全国七大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示
令,数据经过初步处理得:现有①和②两种方案作为年销售量关于年广告费的回归分析模型,其中,均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(不能整除的相关系数保留2位小数)
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出关于的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
附:①相关系数,
回归直线中公式分别为,
(2)参考数据:,,,.
44
4.8
10
40.3
1.612
19.5
8.06
【答案】(1)模型②的拟合程度更好
(2),13(百万辆)
【解题思路】(1)根据公式计算模型①②的相关系数,然后进行比较即可得到答案.
(2)根据公式求出回归方程,然后将变量的值代入即可求出函数值.
【解答过程】(1)设模型①和②的相关系数分别为.
由题意可得:,
令,则,
则,
所以,由相关系数的相关性质可得,模型②的拟合程度更好;
(2)由条件得:,
又由,得,
所以,即回归方程为,
当时,,
因此当年广告费为6(百万元)时,产品的销售量大概是13(百万辆).
18.(17分)(24-25高二下·吉林长春·期末)为了研究高中学生平时的数学成缆和整理数学错题习惯的情况,某校数学建模兴趣小组的同学在本校抽取100名学生进行调查统计.数据如下:
整理数学错题习惯
数学成绩
合计
优秀
非优秀
有
20
30
50
没有
10
40
50
合计
30
70
100
(1)依据小概率值的独立性检验,是否认为数学成绩优秀与整理数学错题集习惯有关联;
(2)在调查统计有整理数学错题集习惯的50名学生中,采用比例分配的分层随机抽样的方法选取5人组建研讨小组,再从5人研讨小组中随机抽取3人进行访谈,用表示访谈时成绩优秀的人数,求的分布列及数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关;
(2)分布列见解析,期望为.
【解题思路】(1)先求卡方值,根据独立检验的基本思想得结论即可;
(2)由已知5人中有2人优秀,3人非优秀,则并求出对应概率,即可得分布列,进而求期望.
【解答过程】(1)零假设:数学成绩优秀与整理数学错题集习惯无关联
由题设,
故依据小概率值的独立性检验,不能认为零假设成立,
故认为数学成绩优秀与整理数学错题集习惯有关联;
(2)由分层抽样的等比例性质,5人中有2人优秀,3人非优秀,
所以优秀学生人数,且,,,
故分布列如下,
0
1
2
则.
19.(17分)(2025·宁夏石嘴山·一模)某人工智能公司从2018至2024年的利润情况如下表所示:
年份
2018
2019
2020
2021
2022
2023
2024
年份代码x
1
2
3
4
5
6
7
利润y(单位:亿元)
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)根据表中的数据,推断变量y与x之间是否线性相关.计算y与x之间的相关系数(精确到0.01),并推断它们的相关程度;
(2)求出y关于x的经验回归方程,并预测该人工智能公司2025年的利润;
(3)把利润不超过4(亿元)的年份叫做“试销年”,从2018年到2024年这七年中任取2年,X表示取到“试销年”的个数,求X的分布列和数学期望.
参考数据:,,,
参考公式:对于一组数据,
①相关系数为:;
②经验回归直线的斜率和截距的最小二乘估计公式分别,.
【答案】(1),可以推断变量y与x成正线性相关且相关程度很强;
(2),6.3亿元;
(3)分布列见解析,期望为.
【解题思路】(1)根据题意判断相关性,再应用相关系数公式求相关系数,即可得结论;
(2)应用最小二乘法求回归直线方程,进而估计该人工智能公司2025年的利润;
(3)由题意“试销年”的个数能取的值为并求出对应概率,即可得分布列,进而求期望.
【解答过程】(1)由题设,易知y与x线性相关,且,
,
由于,可以推断变量y与x成正线性相关且相关程度很强.
(2)由题设,,,
所以,因此关于x的回归方程为,
当时,,即预测该人工智能公司2025的利润为6.3亿元;
(3)由题意,2018年到2024年这七年的“试销年”为三个,
因此从2018年到2024年这七年中任取2个,取到“试销年”的个数能取的值为,
则,,,
因此的分布列如下:
所以其数学期望为.
第 1 页 共 10 页
学科网(北京)股份有限公司
$
第八章 成对数据的统计分析全章综合测试卷(提高篇)
【人教A版】
考试时间:120分钟;满分:150分
姓名:___________班级:___________考号:___________
考卷信息:
本卷试题共19题,单选8题,多选3题,填空3题,解答5题,满分150分,限时120分钟,本卷题型针对性
较高,覆盖面广,选题有深度,可衡量学生掌握本章内容的具体情况!
第I卷(选择题)
一、单项选择题:本题共8小题,每小题5分,共40分,在每小题给出的四个选项中,只有一项是符合要求的。
1.(5分)(24-25高二下·天津·期末)下列说法中,正确的是( )
A.经验回归直线是由成对样本数据中的两点确定的
B.如果两个变量的相关程度越强,则相关系数越接近于1
C.残差平方和越小的模型,拟合的效果越好
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验:,可判断与有关联,此推断犯错误的概率不超过0.5%
2.(5分)(24-25高二下·江西·月考)对两组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
3.(5分)(24-25高二下·甘肃白银·期末)假设有两个分类变量X,Y,它们的可能取值分别为和,其列联表为
合计
合计
以下各组数据中,对于同一样本能说明与有关系的可能性最大的一组为( )
A. B.
C. D.
4.(5分)(24-25高二下·江苏·期末)下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对y与t的关系进行拟合,则根据该回归模型,预测第6个月该物种的繁殖数量为( )
第个月
1
2
3
繁殖数量
A.百只 B.百只 C.百只 D.百只
5.(5分)(24-25高二下·湖北·月考)已知变量x和变量y的3对随机观测数据,,,则该组样本数据点的相关系数( )
(参考公式:)
A. B. C. D.1
6.(5分)(24-25高二下·福建泉州·期末)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个样本点和后,得到新的回归直线的斜率为3.则在新的经验回归方程下,样本的残差为( )
A. B. C.0.1 D.0.2
7.(5分)(24-25高二下·福建厦门·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
8.(5分)(24-25高二下·天津和平·期末)《哪吒之魔童闹海》在内地市场的票房突破了154亿大关,成为全球单一电影市场票房的最高记录.一款哪吒变脸玩具深受大家喜爱,某商家统计了最近5个月销量,如表所示:若与线性相关,且线性回归方程为,则下列说法不正确的是( )
时间
1
2
3
4
5
销售量/万只
5
4.5
4
3.5
2.5
A.由题中数据可知,变量与负相关
B.线性回归方程中
C.当时,残差为0.2
D.可以预测当时销量约为2.1万只
二、多项选择题:本题共3小题,每小题6分,共18分,在每小题给出的四个选项中,有多项符合题目的要求,全部选对的得6分,部分选对的得部分分,有选错的得0分。
9.(6分)(24-25高二下·湖北荆州·期末)下列说法正确的有( )
A.利用残差图分析模型的刻画效果,若残差比较均匀的分布在以取值为0的横轴为对称轴的水平带状区域内,则说明该模型刻画数据的效果较好
B.可以用决定系数来比较两个模型的拟合效果,越大模型拟合效果越好
C.已知样本数据的方差为4,则数据的标准差是4
D.设两个变量的样本相关系数为,则越大其线性相关程度越强
10.(6分)(24-25高二下·辽宁·期末)为了解某种药物的疗效,患者服用该药物,短时间内血液中药物浓度达到峰值,研究员统计了血液中药物浓度(单位:)与代谢时间(单位:)的数据,如下表所示:
0
1
2
3
4
5
6
150
143
132
123
114
104
95
根据表中数据可得回归方程为,则下列说法正确的是( )
附:回归直线中斜率和截距的最小二乘估计公式分别为,,相关系数.
A.
B.当时,对应样本点的残差为0.32
C.若再增加一组数据,则关于的回归直线的斜率变大
D.若删去数据,则与的相关系数不变
11.(6分)(24-25高二下·湖北襄阳·期末)炎炎夏日,许多城市发出高温预警,凉爽的某市成为众多游客旅游的热门选择.为了解来某市旅游的游客旅行方式与年龄是否有关,随机调查了100名游客,得到如下表格.零假设H0旅行方式与年龄没有关联,则下列说法中,正确的有( )
小于40岁
不小于40岁
自由行
38
19
跟团游
20
23
附:χ2=,其中.
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
A.在选择自由行的游客中随机抽取一名,其小于40岁的概率为
B.在选择自由行的游客中按年龄分层随机抽样抽取6人,再从中随机选取2人做进一步的访谈,则2人中至少有1人不小于40岁的概率为
C.根据的独立性检验,推断旅行方式与年龄没有关联,且犯错误概率不超过0.01
D.根据的独立性检验,推断旅行方式与年龄有关联,且犯错误概率不超过0.05
第II卷(非选择题)
三、填空题:本题共3小题,每小题5分,共15分。
12.(5分)(24-25高二下·贵州黔西·期末)在线性回归分析模型中,变量与相对应的四组数据为,,,,表示解释变量对于预报变量变化的贡献率,则__________.
附:,,.
13.(5分)(24-25高二下·山东济南·期末)两个相关变量x,y的一组数据统计如下表
x
2
3
4
5
6
y
2.8
3.1
3.3
3.8
4.0
根据上表可得经验回归方程中的为0.31,据此经验回归方程,当时,y的预测值为_________.
14.(5分)(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有__________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
四、解答题:本题共5小题,共77分,解答应写出必要的文字说明、证明过程及验算步骤。
15.(13分)(24-25高二下·广东深圳·期中)深圳欢乐谷试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值.
(2)计算与的相关系数;判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:,.
参考公式:相关系数.若,则与的线性相关性很强.
16.(15分)(24-25高二下·天津武清·阶段检测)为加强素质教育,提升学生综合素养,某中学为学生提供了“科技”和“艺术”两门选修课.为了解选择“科技”或“艺术”是否与性别有关,现随机抽取了100人.
(1)补全下面列联表:
性别
科技
艺术
共计
男生
40
50
女生
共计
30
(2)是否有95%的把握认为选择“科技”或“艺术”与性别有关?
参考公式:,其中.
参考附表:
0.100
0.050
0.025
2.706
3.841
5.024
17.(15分)(24-25高二下·广东中山·月考)广东省深圳市是全国七大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示
令,数据经过初步处理得:现有①和②两种方案作为年销售量关于年广告费的回归分析模型,其中,均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(不能整除的相关系数保留2位小数)
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出关于的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
附:①相关系数,
回归直线中公式分别为,
(2)参考数据:,,,.
44
4.8
10
40.3
1.612
19.5
8.06
18.(17分)(24-25高二下·吉林长春·期末)为了研究高中学生平时的数学成缆和整理数学错题习惯的情况,某校数学建模兴趣小组的同学在本校抽取100名学生进行调查统计.数据如下:
整理数学错题习惯
数学成绩
合计
优秀
非优秀
有
20
30
50
没有
10
40
50
合计
30
70
100
(1)依据小概率值的独立性检验,是否认为数学成绩优秀与整理数学错题集习惯有关联;
(2)在调查统计有整理数学错题集习惯的50名学生中,采用比例分配的分层随机抽样的方法选取5人组建研讨小组,再从5人研讨小组中随机抽取3人进行访谈,用表示访谈时成绩优秀的人数,求的分布列及数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
19.(17分)(2025·宁夏石嘴山·一模)某人工智能公司从2018至2024年的利润情况如下表所示:
年份
2018
2019
2020
2021
2022
2023
2024
年份代码x
1
2
3
4
5
6
7
利润y(单位:亿元)
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)根据表中的数据,推断变量y与x之间是否线性相关.计算y与x之间的相关系数(精确到0.01),并推断它们的相关程度;
(2)求出y关于x的经验回归方程,并预测该人工智能公司2025年的利润;
(3)把利润不超过4(亿元)的年份叫做“试销年”,从2018年到2024年这七年中任取2年,X表示取到“试销年”的个数,求X的分布列和数学期望.
参考数据:,,,
参考公式:对于一组数据,
①相关系数为:;
②经验回归直线的斜率和截距的最小二乘估计公式分别,.
第 1 页 共 10 页
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。