内容正文:
2025-2026学年高二数学单元检测卷
第八章 成对数据的统计分析 ⋅培优卷
建议用时:120分钟,满分:150分
第一部分(选择题共58分)
一、选择题(本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要
求的)
1.(2026高三·天津·专题练习)下列说法正确的是( )
的部分临界值如表:
0.1
0.05
0.025
0.01
2.706
3.841
5.024
6.635
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量,由它们的样本数据计算得到的观测值,则在犯错误的概率不超过0.025的前提下认为变量没有关系
【答案】A
【详解】对于A,根据标准差定义,一组数据的标准差时,
显然有,故A正确;
对于B,两组数据的标准差相等,这两组数据的平均数未必相等,
如都为1和都为2的两组数据,它们的标准差均为0,但它们的平均数分别为1和,故B错误;
对于C,两个变量的相关系数越接近于0,两个变量的相关性越弱,故C错误;
对于D,,根据独立性检验原理,
在犯错误的概率不超过0.025的前提下认为变量有关系,故D错误.
故选:A
2.(2026·山东青岛·一模)已知变量,的统计数据如下,若与的回归直线方程为,则( )
2.8
3.3
5.0
6.7
7.2
2.6
4.0
5.1
5.4
A.2.5 B.2.7 C.2.9 D.3.1
【答案】C
【详解】由题意,可得,,
所以样本点的中心坐标为,
代入回归直线方程,可得,
解方程得.
3.(25-26高二上·安徽淮北·期末)李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
【答案】D
【详解】由第7天的实际值是,所以预测值为35.6,得 ①,
因为回归直线经过中心点,又,,所以②,
联立①②,解得,,
所以预计第10天的营业收入(千元).
4.(25-26高二上·陕西汉中·期末)茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,已知变量和满足经验回归方程,且变量和一组相关数据统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
17
则下列说法错误的是( )
A.
B.变量和呈正相关
C.该经验回归方程必过点
D.若某户家庭人口数为8时,预测该户茶产业的年收入为万元
【答案】C
【详解】由题知,.
代入,得出,
所以,A选项正确;
,变量和呈正相关,B选项正确;
由题知,,该经验回归方程必过点,C选项错误;
当时,,
故当某户家庭人口数为8时,预测该户茶产业的年收入为25.7万元,D选项正确;
故选:C
5.(24-25高二下·广东广州·期末)随机抽取5家超市,得到其广告支出x(万元)与销售额y(万元)的数据如下:
超市
A
B
C
D
E
广告支出x
1
2
4
6
7
销售额y
20
30
40
44
46
(参考公式:,,参考数据:样本相关系数),则下列判断正确的是( )
A.y与x呈负相关关系 B.经验回归直线经过点
C.经验回归方程为 D.y与x的线性相关程度较强
【答案】D
【详解】由样本相关系数可得y与x呈正相关关系,故A错误;
由数据可得: ,
故经验回归直线经过点,故B错误;
由,
则,故经验回归方程为,故C错误;
由于样本相关系数较接近于1,则y与x的线性相关程度较强,故D正确;
故选:D.
6.(24-25高三下·福建厦门·月考)某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
【答案】D
【详解】由图可知,随着温度的增加,发芽率的增长速度越来越慢,符合对数型函数的特征.
故选:D.
7.(25-26高二下·全国·单元测试)一款短视频手机应用最近在某校学生中流行起来,某校团委对“学生性别和喜欢该手机应用是否有关”做了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该手机应用的人数占男生人数的,女生喜欢该手机应用的人数占女生人数的,若有的把握认为是否喜欢该手机应用和性别有关,则被调查的男生人数至少为( )
0.05
0.01
3.841
6.635
A.12 B.6 C.10 D.18
【答案】A
【详解】设被调查的男生人数为,则女生人数为,可得列联表如下:
喜欢
不喜欢
合计
男生
女生
合计
由公式算得,因为有的把握认为是否喜欢该手机应用和性别有关,所以,
则.而都是整数,所以的值至少为12.
故选:A.
8.(25-26高三上·天津和平·月考)下列说法错误的是( )
A.某校高一年级共有男女学生人,现按性别采用分层抽样的方法抽取容量为人的样本,若样本中男生有人,则该校高一年级女生人数是
B.已知关于的回归直线方程为,若,则
C.数据的第百分位数为
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断X与Y有关联,此推断犯错误的概率不大于
【答案】C
【详解】对于A,由抽样比为,样本中女生有人,可得该校高一年级女生人数是人,A正确;
对于B,线性回归方程中,根据回归方程经过样本中心,关于的回归直线方程为,若,则,B正确;
对于C,由,得第百分位数为,C错误;
对于D,由,可判断与有关联,此推断犯错误的概率不大于,D正确.
故选:C.
二、选择题(本题共3小题,每小题6分,共18分。在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(25-26高二下·全国·课后作业)(多选)为研究需要,统计了两个变量,的数据情况如下表:
…
…
其中数据和数据的平均数分别为和,并且计算相关系数,回归方程为,如下结论正确的为( )
A.将以上数据的每个数据都加一个相同的常数后,方差不变
B.变量的相关性强
C.当时,必有
D.
【答案】ABD
【详解】对于A.因为方差是表示数据波动大小的量,将一组数据的每个数都加一个相同的常数后,方差不变,所以A正确;
对于B.相关系数,变量的相关性强,所以B正确;
对于C.当时,不一定有,因此C错误;
对于D.因为,是负相关,所以,故D正确.
故选:ABD.
10.(2027高三·全国·专题练习)(多选)某地新开了一条夜市街,每晚平均客流量为2万人,每晚最多能接纳的客流量为10万人,主办公司决定通过微信公众号和其他软件进行广告宣传提高营销效果.通过调研,公司发现另一处同等规模的夜市街投入的广告费(单位:万元)与每晚增加的客流量(单位:千人)存在如下关系:
万元
1
2
3
4
5
6
千人
5
6
8
9
12
20
现用曲线:拟合变量与的相关关系,并利用一元线性回归模型求参数,(精确到0.01),以所求线性回归方程为预测依据,则( )
参考数据:,,,,,.
附:一元线性回归模型参数的最小二乘估计公式:,.
A.
B.曲线经过点
C.广告费每增加1万元,每晚客流量平均增加3000人
D.若广告费超过9万元,则每晚客流量会超过夜市街的接纳能力
【答案】BD
【详解】由题知,,,,,
所以,,A错误;
,令,求得,B正确;
由可知,每增加1万元,不是平均增加的,C错误;
若,则(千人),而每晚最多能接纳的客流量为10万人,故D正确.
故选:BD.
11.(2026·广东梅州·一模)近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌车商随机调查了甲、乙两地各200名消费者,得出统计图如下,根据此统计图,下列结论正确的是( )
附:,.
0.05
0.01
0.001
3.841
6.635
10.828
A.在所调查的甲地购车者中,购买燃油车的人数比新能源车的多20人
B.在所调查的乙地购车者中,若用分层随机抽样抽取20人,则其中新能源车主有12人
C.根据小概率值的独立性检验,消费者的购车类型与地域有关
D.从所调查消费者中随机选一人,在已知其为新能源车主的条件下,其来自甲地的概率为0.4
【答案】BCD
【详解】A:甲地购买燃油车人数为,购买新能源车人数为,
故购买燃油车的人数比新能源车的多人,A错误.
B:乙地购买新能源车比例为,故用分层随机抽样抽取20人时,新能源车主有人,B正确.
C:列出列联表:
甲地
乙地
总计
燃油车
120
80
200
新能源车
80
120
200
总计
200
200
400
则.
小概率值时,.
因为,所以根据小概率值的独立性检验,消费者的购车类型与地域有关,C正确.
D:所调查的新能源车主共有人,其中甲地80人,在已知其为新能源车主的条件下,其来自甲地的概率为,D正确.
第二部分(非选择题共92分)
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中横线上)
12.(2025高二·全国·专题练习)已知具有线性相关性的五个样本点,用最小二乘法得到回归直线方程,过点的直线方程给出下列4个命题:①;②直线过点;③;④.其中正确的命题有_______个.
【答案】2
【详解】由题意可得,
则,
所以直线的方程为,直线的方程为,
故,①正确;
因为,所以直线过点,②正确;
,③错误;
,④错误.
综上可得正确的命题有2个.
故答案为:2.
13.(25-26高三上·河北邢台·开学考试)一组数据组的散点图趋向于落在中间下凸且递增的某条曲线附近,现用模型拟合数据组,其中,设,变换后的线性回归方程为,则__________,__________.
【答案】
【详解】由,两边同时取对数,可得,
因为变换后的线性回归方程为,可得,
即,所以,
又因为,且,
所以,
因为,可得,所以.
故答案为:;.
14.(25-26高三上·福建莆田·月考)若变量和的4对观测数据为,两个变量满足一元线性回归模型(随机误差),请写出参数的最小二乘估计值为______
【答案】5.1
【详解】依题意,两个变量满足一元线性回归模型,随机误差,
则随机误差平方和
,
易知,随机误差平方和是一个一元二次函数,
当时,随机误差平方和取得最小值,
因此参数的最小二乘估计值为5.1.
故答案为:5.1.
14.【创新题·社会热点题】
四、解答题(本大题共5小题,共77分.解答时应写出必要的文字说明、证明过程或演算步骤)
15. (13分)
(25-26高二下·全国·课后作业)在一段时间内,某淘宝网店一种商品的销售价格(元)和日销售量(件)之间的一组数据为:
价格(元)
22
20
18
16
14
日销售量(件)
37
41
43
50
56
求出关于的经验回归方程,并说明该方程拟合效果的好坏.
参考数据:.
【详解】作出散点图如图所示,
观察散点图,可知这些点散布在一条直线的附近,故可用线性回归模型来拟合数据.
因为,,
所以,.
所以经验回归方程为.
与的值如下表:
1
0.3
1.2
4.6
10.6
计算,所以.
因为0.964很接近于1,
所以该模型的拟合效果比较好.
16. (15分)
(河南省南阳市2026届高三下学期一模考试数学试题)某小区物业为提高服务质量,随机调查了100名男业主和100名女业主,每位业主对该物业的服务给出满意或不满意的评价,得到如下列联表:
是否满意
性别
满意
不满意
合计
男业主
80
20
100
女业主
60
40
100
合计
140
60
200
(1)依据的独立性检验,能否认为该小区男、女业主对该物业服务的评价有差异?
(2)从小区的业主中任选一人,表示事件“选到的人对该物业的服务不满意”,表示事件“选到的人为男业主”,利用该调查数据,给出,的估计值.
附:.
0.05
0.01
0.005
3.841
6.635
7.879
【详解】(1)假设:小区男、女业主对该物业服务的评价无差异.
因为,
依据的独立性检验,所以假设不成立,
即认为小区男、女业主对该物业服务的评价有差异.
(2)由题意,,,
,
,
则,.
17. (15分)
(2026·河北保定·一模)某高科技制造企业致力于智能生产线的研发与应用,以提升关键精密元件的产品质量.原有甲生产线采用传统自动化技术,而新投入使用的乙生产线引入了基于物联网和大数据分析的智能调控系统,实现了生产参数的实时优化.为评估技术创新对产品质量的影响,质检部门从甲、乙两条生产线生产的同种产品中各随机抽取100件进行检测,得到如下列联表:
优等品
非优等品
合计
甲生产线
65
35
100
乙生产线
90
10
100
合计
155
45
200
(1)根据小概率值的独立性检验,判断产品的质量是否与生产线有关.
(2)以样本估计总体,以频率估计概率,现从甲、乙两条生产线生产的此种产品中各随机抽取一定数量的产品混合在一起,其中甲、乙两条生产线的产品数量之比为2:3,若从混合产品中随机抽取3件,记这3件产品中优等品的个数为X,求X的分布列和数学期望.
附 其中.
【详解】(1)零假设:产品的质量与生产线无关;
,
根据的独立性检验,拒绝零假设,并认为产品的质量与生产线有关.
(2)甲生产线优等品概率:,乙生产线优等品概率:;
混合产品中,甲乙数量比为,故甲产品占比,乙产品占比;
故总体优等品概率为:;
由题可知:,
,,
,,
故的分布列如下所示:
的数学期望.
18. (17分)
(25-26高三下·山东·月考)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解大众对新能源汽车的接受程度,某城市汽车行业协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取100名市民进行调查,并对他们选择新能源汽车还是选择传统汽车进行意向调查,得到了以下统计数据.完成列联表,根据小概率值的独立性检验,能否认为选择新能源汽车与年龄有关;
选择新能源汽车
选择传统汽车
总计
40岁以下
70
40岁及以上
60
100
总计
200
(2)某新能源汽车公司根据市场调研得到若干组数据,用最小二乘法得到该产品利润(单位:亿元)与研发投入(单位:亿元)的线性回归方程,且产品利润的方差为,研发投入的方差为.求与间的样本相关系数,并据此判断产品利润与研发投入的线性相关性强弱.
附:(ⅰ)在线性回归方程中,,;
(ⅱ)样本相关系数,若,可认为与线性相关程度较强;
(ⅲ),其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【详解】(1)根据题意补全列联表:
选择新能源汽车
选择传统汽车
总计
40岁以下
70
100
40岁及以上
60
100
总计
200
假设:选择新能源汽车与年龄无关,代入卡方公式计算可得:
,
因为,依据的独立性检验,
拒绝零假设,认为选择新能源汽车与年龄有关.
(2)因为回归系数,样本相关系数,
所以样本相关系数 ,
已知,,,
代入样本相关系数得: ,
非常接近1,因此产品利润与研发投入的线性相关性很强.
19. (17分)
(25-26高三上·广东汕尾·月考)蝗虫能对农作物造成严重伤害,每只蝗虫的平均产卵数(单位:个)和平均温度(单位:℃)有关.现收集到一只蝗虫的产卵数(个)和温度的8组观测数据,制成图1所示的散点图.现用两种模型①,②分别进行拟合.
根据收集到的数据,计算得到如下值:
24
2.9
646
179
422688
62.65
70308
表中;
(1)根据散点图,比较模型①、②的拟合效果,模型___________比较合适?(无需说明理由)
根据所选择的模型,利用上表中的参考数据,求出关于的回归方程.
(2)根据以往统计,该地每年平均温度达到以上时蝗虫会对农作物造成严重伤害,需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到以上的概率为,该地今后年恰好需要2次人工防治的概率为.
①求取得最大值时对应的概率;
②当取最大值时,设该地今后5年需要人工防治的次数为,求的均值和方差.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:
【详解】(1)由散点图知,卵数随温度的变化是按指数形式变化,而非线性变化,因此模型②更合适,
令,则,由所给参考数据得,,
,因此关于的线性回归方程为,
所以产卵数关于温度的回归方程为.
(2)①依题意,,
求导得
,
令,得,当时,,当时,,
函数在上单调递增,在上单调递减,
所以取得最大值时对应的概率;
②由①知,当时,取最大值,当时,,
每年需要人工防治的概率,且服从二项分布,
所以,.
2 / 16
1 / 16
学科网(北京)股份有限公司
$………………○………………外………………○………………装………………○………………订………………○………………线………………○………………
………………○………………内………………○………………装………………○………………订………………○………………线………………○………………
此卷只装订不密封
………………○………………内………………○………………装………………○………………订………………○………………线………………○………………
………………○………………外………………○………………装………………○………………订………………○………………线………………○………………
… 学校:______________姓名:_____________班级:_______________考号:______________________
第八章 成对数据的统计分析 ⋅培优卷
建议用时:120分钟,满分:150分
第一部分(选择题共58分)
一、选择题(本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要
求的)
1.下列说法正确的是( )
的部分临界值如表:
0.1
0.05
0.025
0.01
2.706
3.841
5.024
6.635
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量,由它们的样本数据计算得到的观测值,则在犯错误的概率不超过0.025的前提下认为变量没有关系
2.已知变量,的统计数据如下,若与的回归直线方程为,则( )
2.8
3.3
5.0
6.7
7.2
2.6
4.0
5.1
5.4
A.2.5 B.2.7 C.2.9 D.3.1
3.李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
4.【创新题·社会热点题】茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,已知变量和满足经验回归方程,且变量和一组相关数据统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
17
则下列说法错误的是( )
A.
B.变量和呈正相关
C.该经验回归方程必过点
D.若某户家庭人口数为8时,预测该户茶产业的年收入为万元
5.随机抽取5家超市,得到其广告支出x(万元)与销售额y(万元)的数据如下:
超市
A
B
C
D
E
广告支出x
1
2
4
6
7
销售额y
20
30
40
44
46
(参考公式:,,参考数据:样本相关系数),则下列判断正确的是( )
A.y与x呈负相关关系 B.经验回归直线经过点
C.经验回归方程为 D.y与x的线性相关程度较强
6.某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
7.【创新题·社会热点题】一款短视频手机应用最近在某校学生中流行起来,某校团委对“学生性别和喜欢该手机应用是否有关”做了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该手机应用的人数占男生人数的,女生喜欢该手机应用的人数占女生人数的,若有的把握认为是否喜欢该手机应用和性别有关,则被调查的男生人数至少为( )
0.05
0.01
3.841
6.635
A.12 B.6 C.10 D.18
8.下列说法错误的是( )
A.某校高一年级共有男女学生人,现按性别采用分层抽样的方法抽取容量为人的样本,若样本中男生有人,则该校高一年级女生人数是
B.已知关于的回归直线方程为,若,则
C.数据的第百分位数为
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断X与Y有关联,此推断犯错误的概率不大于
二、选择题(本题共3小题,每小题6分,共18分。在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.为研究需要,统计了两个变量,的数据情况如下表:
…
…
其中数据和数据的平均数分别为和,并且计算相关系数,回归方程为,如下结论正确的为( )
A.将以上数据的每个数据都加一个相同的常数后,方差不变
B.变量的相关性强
C.当时,必有
D.
10.某地新开了一条夜市街,每晚平均客流量为2万人,每晚最多能接纳的客流量为10万人,主办公司决定通过微信公众号和其他软件进行广告宣传提高营销效果.通过调研,公司发现另一处同等规模的夜市街投入的广告费(单位:万元)与每晚增加的客流量(单位:千人)存在如下关系:
万元
1
2
3
4
5
6
千人
5
6
8
9
12
20
现用曲线:拟合变量与的相关关系,并利用一元线性回归模型求参数,(精确到0.01),以所求线性回归方程为预测依据,则( )
参考数据:,,,,,.
附:一元线性回归模型参数的最小二乘估计公式:,.
A.
B.曲线经过点
C.广告费每增加1万元,每晚客流量平均增加3000人
D.若广告费超过9万元,则每晚客流量会超过夜市街的接纳能力
11.近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌车商随机调查了甲、乙两地各200名消费者,得出统计图如下,根据此统计图,下列结论正确的是( )
附:,.
0.05
0.01
0.001
3.841
6.635
10.828
A.在所调查的甲地购车者中,购买燃油车的人数比新能源车的多20人
B.在所调查的乙地购车者中,若用分层随机抽样抽取20人,则其中新能源车主有12人
C.根据小概率值的独立性检验,消费者的购车类型与地域有关
D.从所调查消费者中随机选一人,在已知其为新能源车主的条件下,其来自甲地的概率为0.4
第二部分(非选择题共92分)
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中横线上)
12.已知具有线性相关性的五个样本点,用最小二乘法得到回归直线方程,过点的直线方程给出下列4个命题:①;②直线过点;③;④.其中正确的命题有_______个.
13.一组数据组的散点图趋向于落在中间下凸且递增的某条曲线附近,现用模型拟合数据组,其中,设,变换后的线性回归方程为,则__________,__________.
14.若变量和的4对观测数据为,两个变量满足一元线性回归模型(随机误差),请写出参数的最小二乘估计值为______
四、解答题(本大题共5小题,共77分.解答时应写出必要的文字说明、证明过程或演算步骤)
15. (13分)
在一段时间内,某淘宝网店一种商品的销售价格(元)和日销售量(件)之间的一组数据为:
价格(元)
22
20
18
16
14
日销售量(件)
37
41
43
50
56
求出关于的经验回归方程,并说明该方程拟合效果的好坏.
参考数据:.
16.(15分)
某小区物业为提高服务质量,随机调查了100名男业主和100名女业主,每位业主对该物业的服务给出满意或不满意的评价,得到如下列联表:
是否满意
性别
满意
不满意
合计
男业主
80
20
100
女业主
60
40
100
合计
140
60
200
(1)依据的独立性检验,能否认为该小区男、女业主对该物业服务的评价有差异?
(2)从小区的业主中任选一人,表示事件“选到的人对该物业的服务不满意”,表示事件“选到的人为男业主”,利用该调查数据,给出,的估计值.
附:.
0.05
0.01
0.005
3.841
6.635
7.879
17.(15分)
某高科技制造企业致力于智能生产线的研发与应用,以提升关键精密元件的产品质量.原有甲生产线采用传统自动化技术,而新投入使用的乙生产线引入了基于物联网和大数据分析的智能调控系统,实现了生产参数的实时优化.为评估技术创新对产品质量的影响,质检部门从甲、乙两条生产线生产的同种产品中各随机抽取100件进行检测,得到如下列联表:
优等品
非优等品
合计
甲生产线
65
35
100
乙生产线
90
10
100
合计
155
45
200
(1)根据小概率值的独立性检验,判断产品的质量是否与生产线有关.
(2)以样本估计总体,以频率估计概率,现从甲、乙两条生产线生产的此种产品中各随机抽取一定数量的产品混合在一起,其中甲、乙两条生产线的产品数量之比为2:3,若从混合产品中随机抽取3件,记这3件产品中优等品的个数为X,求X的分布列和数学期望.
附 其中.
18.(17分)
随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解大众对新能源汽车的接受程度,某城市汽车行业协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取100名市民进行调查,并对他们选择新能源汽车还是选择传统汽车进行意向调查,得到了以下统计数据.完成列联表,根据小概率值的独立性检验,能否认为选择新能源汽车与年龄有关;
选择新能源汽车
选择传统汽车
总计
40岁以下
70
40岁及以上
60
100
总计
200
(2)某新能源汽车公司根据市场调研得到若干组数据,用最小二乘法得到该产品利润(单位:亿元)与研发投入(单位:亿元)的线性回归方程,且产品利润的方差为,研发投入的方差为.求与间的样本相关系数,并据此判断产品利润与研发投入的线性相关性强弱.
附:(ⅰ)在线性回归方程中,,;
(ⅱ)样本相关系数,若,可认为与线性相关程度较强;
(ⅲ),其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
19.(17分)
蝗虫能对农作物造成严重伤害,每只蝗虫的平均产卵数(单位:个)和平均温度(单位:℃)有关.现收集到一只蝗虫的产卵数(个)和温度的8组观测数据,制成图1所示的散点图.现用两种模型①,②分别进行拟合.
根据收集到的数据,计算得到如下值:
24
2.9
646
179
422688
62.65
70308
表中;
(1)根据散点图,比较模型①、②的拟合效果,模型___________比较合适?(无需说明理由)
根据所选择的模型,利用上表中的参考数据,求出关于的回归方程.
(2)根据以往统计,该地每年平均温度达到以上时蝗虫会对农作物造成严重伤害,需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到以上的概率为,该地今后年恰好需要2次人工防治的概率为.
①求取得最大值时对应的概率;
②当取最大值时,设该地今后5年需要人工防治的次数为,求的均值和方差.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:
试题 第3页(共4页) 试题 第4页(共4页)
试题 第1页(共4页) 试题 第2页(共4页)
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
2025-2026学年高二数学单元检测卷
第八章 成对数据的统计分析 ⋅培优卷(参考答案)
1、 单项选择题:本题共8小题,每小题5分,共40分.在每个小题绐岀的四个选项中,只有一项是符合题目要求的.
题号
1
2
3
4
5
6
7
8
答案
A
C
D
C
D
D
A
C
二、多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分
9
10
11
ABD
BD
BCD
三、填空题:本题共3小题,每小题5分,共15分。
12. 2 13. 14.5.1
4、 解答题:本题共5小题,共77分。解答应写出文字说明,证明过程或演算步聚。
15. (13分)
【详解】作出散点图如图所示,
(3分)
观察散点图,可知这些点散布在一条直线的附近,故可用线性回归模型来拟合数据.(4分)
因为,,
所以,.
所以经验回归方程为.(9分)
与的值如下表:
1
0.3
1.2
4.6
10.6
计算,所以.(12分)
因为0.964很接近于1,
所以该模型的拟合效果比较好. (13分)
16. (15分)
【详解】(1)假设:小区男、女业主对该物业服务的评价无差异.
因为,
依据的独立性检验,所以假设不成立,
即认为小区男、女业主对该物业服务的评价有差异.(7分)
(2)由题意,,,
,
,
则,.(15分)
17. (15分)
【详解】(1)零假设:产品的质量与生产线无关;
,
根据的独立性检验,拒绝零假设,并认为产品的质量与生产线有关.(7分)
(2)甲生产线优等品概率:,乙生产线优等品概率:;
混合产品中,甲乙数量比为,故甲产品占比,乙产品占比;
故总体优等品概率为:;(9分)
由题可知:,
,,
,,
故的分布列如下所示:
的数学期望.(15分)
18. (17分)
【详解】(1)根据题意补全列联表:
选择新能源汽车
选择传统汽车
总计
40岁以下
70
100
40岁及以上
60
100
总计
200
假设:选择新能源汽车与年龄无关,代入卡方公式计算可得:
,(6分)
因为,依据的独立性检验,
拒绝零假设,认为选择新能源汽车与年龄有关. (9分)
(2)因为回归系数,样本相关系数,
所以样本相关系数 ,
已知,,,
代入样本相关系数得: ,(15分)
非常接近1,因此产品利润与研发投入的线性相关性很强.(17分)
19. (17分)
【详解】(1)由散点图知,卵数随温度的变化是按指数形式变化,而非线性变化,
因此模型②更合适, (2分)
令,则,由所给参考数据得,,
,因此关于的线性回归方程为,(6分)
所以产卵数关于温度的回归方程为. (8分)
(2)①依题意,,(10分)
求导得
,(11分)
令,得,当时,,当时,,
函数在上单调递增,在上单调递减,
所以取得最大值时对应的概率;(14分)
②由①知,当时,取最大值,当时,,
每年需要人工防治的概率,且服从二项分布,(15分)
所以,.(17分)
2 / 16
1 / 16
学科网(北京)股份有限公司
$
2025-2026学年高二数学单元检测卷
第八章 成对数据的统计分析 ⋅培优卷
建议用时:120分钟,满分:150分
第一部分(选择题共58分)
一、选择题(本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要
求的)
1.下列说法正确的是( )
的部分临界值如表:
0.1
0.05
0.025
0.01
2.706
3.841
5.024
6.635
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量,由它们的样本数据计算得到的观测值,则在犯错误的概率不超过0.025的前提下认为变量没有关系
2.已知变量,的统计数据如下,若与的回归直线方程为,则( )
2.8
3.3
5.0
6.7
7.2
2.6
4.0
5.1
5.4
A.2.5 B.2.7 C.2.9 D.3.1
3.李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
4.【创新题·社会热点题】茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,已知变量和满足经验回归方程,且变量和一组相关数据统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
17
则下列说法错误的是( )
A.
B.变量和呈正相关
C.该经验回归方程必过点
D.若某户家庭人口数为8时,预测该户茶产业的年收入为万元
5.随机抽取5家超市,得到其广告支出x(万元)与销售额y(万元)的数据如下:
超市
A
B
C
D
E
广告支出x
1
2
4
6
7
销售额y
20
30
40
44
46
(参考公式:,,参考数据:样本相关系数),则下列判断正确的是( )
A.y与x呈负相关关系 B.经验回归直线经过点
C.经验回归方程为 D.y与x的线性相关程度较强
6.某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
7.【创新题·社会热点题】一款短视频手机应用最近在某校学生中流行起来,某校团委对“学生性别和喜欢该手机应用是否有关”做了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该手机应用的人数占男生人数的,女生喜欢该手机应用的人数占女生人数的,若有的把握认为是否喜欢该手机应用和性别有关,则被调查的男生人数至少为( )
0.05
0.01
3.841
6.635
A.12 B.6 C.10 D.18
8.下列说法错误的是( )
A.某校高一年级共有男女学生人,现按性别采用分层抽样的方法抽取容量为人的样本,若样本中男生有人,则该校高一年级女生人数是
B.已知关于的回归直线方程为,若,则
C.数据的第百分位数为
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断X与Y有关联,此推断犯错误的概率不大于
二、选择题(本题共3小题,每小题6分,共18分。在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.为研究需要,统计了两个变量,的数据情况如下表:
…
…
其中数据和数据的平均数分别为和,并且计算相关系数,回归方程为,如下结论正确的为( )
A.将以上数据的每个数据都加一个相同的常数后,方差不变
B.变量的相关性强
C.当时,必有
D.
10.某地新开了一条夜市街,每晚平均客流量为2万人,每晚最多能接纳的客流量为10万人,主办公司决定通过微信公众号和其他软件进行广告宣传提高营销效果.通过调研,公司发现另一处同等规模的夜市街投入的广告费(单位:万元)与每晚增加的客流量(单位:千人)存在如下关系:
万元
1
2
3
4
5
6
千人
5
6
8
9
12
20
现用曲线:拟合变量与的相关关系,并利用一元线性回归模型求参数,(精确到0.01),以所求线性回归方程为预测依据,则( )
参考数据:,,,,,.
附:一元线性回归模型参数的最小二乘估计公式:,.
A.
B.曲线经过点
C.广告费每增加1万元,每晚客流量平均增加3000人
D.若广告费超过9万元,则每晚客流量会超过夜市街的接纳能力
11.近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌车商随机调查了甲、乙两地各200名消费者,得出统计图如下,根据此统计图,下列结论正确的是( )
附:,.
0.05
0.01
0.001
3.841
6.635
10.828
A.在所调查的甲地购车者中,购买燃油车的人数比新能源车的多20人
B.在所调查的乙地购车者中,若用分层随机抽样抽取20人,则其中新能源车主有12人
C.根据小概率值的独立性检验,消费者的购车类型与地域有关
D.从所调查消费者中随机选一人,在已知其为新能源车主的条件下,其来自甲地的概率为0.4
第二部分(非选择题共92分)
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中横线上)
12.已知具有线性相关性的五个样本点,用最小二乘法得到回归直线方程,过点的直线方程给出下列4个命题:①;②直线过点;③;④.其中正确的命题有_______个.
13.一组数据组的散点图趋向于落在中间下凸且递增的某条曲线附近,现用模型拟合数据组,其中,设,变换后的线性回归方程为,则__________,__________.
14.若变量和的4对观测数据为,两个变量满足一元线性回归模型(随机误差),请写出参数的最小二乘估计值为______
四、解答题(本大题共5小题,共77分.解答时应写出必要的文字说明、证明过程或演算步骤)
15. (13分)
在一段时间内,某淘宝网店一种商品的销售价格(元)和日销售量(件)之间的一组数据为:
价格(元)
22
20
18
16
14
日销售量(件)
37
41
43
50
56
求出关于的经验回归方程,并说明该方程拟合效果的好坏.
参考数据:.
16.(15分)
某小区物业为提高服务质量,随机调查了100名男业主和100名女业主,每位业主对该物业的服务给出满意或不满意的评价,得到如下列联表:
是否满意
性别
满意
不满意
合计
男业主
80
20
100
女业主
60
40
100
合计
140
60
200
(1)依据的独立性检验,能否认为该小区男、女业主对该物业服务的评价有差异?
(2)从小区的业主中任选一人,表示事件“选到的人对该物业的服务不满意”,表示事件“选到的人为男业主”,利用该调查数据,给出,的估计值.
附:.
0.05
0.01
0.005
3.841
6.635
7.879
17.(15分)
某高科技制造企业致力于智能生产线的研发与应用,以提升关键精密元件的产品质量.原有甲生产线采用传统自动化技术,而新投入使用的乙生产线引入了基于物联网和大数据分析的智能调控系统,实现了生产参数的实时优化.为评估技术创新对产品质量的影响,质检部门从甲、乙两条生产线生产的同种产品中各随机抽取100件进行检测,得到如下列联表:
优等品
非优等品
合计
甲生产线
65
35
100
乙生产线
90
10
100
合计
155
45
200
(1)根据小概率值的独立性检验,判断产品的质量是否与生产线有关.
(2)以样本估计总体,以频率估计概率,现从甲、乙两条生产线生产的此种产品中各随机抽取一定数量的产品混合在一起,其中甲、乙两条生产线的产品数量之比为2:3,若从混合产品中随机抽取3件,记这3件产品中优等品的个数为X,求X的分布列和数学期望.
附 其中.
18.(17分)
随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解大众对新能源汽车的接受程度,某城市汽车行业协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取100名市民进行调查,并对他们选择新能源汽车还是选择传统汽车进行意向调查,得到了以下统计数据.完成列联表,根据小概率值的独立性检验,能否认为选择新能源汽车与年龄有关;
选择新能源汽车
选择传统汽车
总计
40岁以下
70
40岁及以上
60
100
总计
200
(2)某新能源汽车公司根据市场调研得到若干组数据,用最小二乘法得到该产品利润(单位:亿元)与研发投入(单位:亿元)的线性回归方程,且产品利润的方差为,研发投入的方差为.求与间的样本相关系数,并据此判断产品利润与研发投入的线性相关性强弱.
附:(ⅰ)在线性回归方程中,,;
(ⅱ)样本相关系数,若,可认为与线性相关程度较强;
(ⅲ),其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
19.(17分)
蝗虫能对农作物造成严重伤害,每只蝗虫的平均产卵数(单位:个)和平均温度(单位:℃)有关.现收集到一只蝗虫的产卵数(个)和温度的8组观测数据,制成图1所示的散点图.现用两种模型①,②分别进行拟合.
根据收集到的数据,计算得到如下值:
24
2.9
646
179
422688
62.65
70308
表中;
(1)根据散点图,比较模型①、②的拟合效果,模型___________比较合适?(无需说明理由)
根据所选择的模型,利用上表中的参考数据,求出关于的回归方程.
(2)根据以往统计,该地每年平均温度达到以上时蝗虫会对农作物造成严重伤害,需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到以上的概率为,该地今后年恰好需要2次人工防治的概率为.
①求取得最大值时对应的概率;
②当取最大值时,设该地今后5年需要人工防治的次数为,求的均值和方差.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:
2 / 16
1 / 16
学科网(北京)股份有限公司
$