内容正文:
专题01 成对数据的统计分析全章10大重点题型归纳(必考50题专项训练)
【人教A版】
题型归纳
题型1
判断两个变量的相关关系
1.(24-25高二下·全国·课后作业)下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
【答案】A
【解题思路】利用正相关的定义逐项判断可得答案.
【解答过程】对于A,一般情况下,汽车越重,则每公里耗油量越多,成正相关,故A正确;
对于B,正方形的面积与边长是函数关系,故B错误;
对于C,一般情况下,若花费在体育活动上面的时间越长,则期末考试数学成绩可能会降低,故不为正相关,故C错误;
对于D,期末考试随机编排的准考证号与期末考试成绩总分没有相关关系,故D错误.
故选:A.
2.(24-25高二下·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是( )
A. B.
C. D.
【答案】C
【解题思路】根据散点图的特征得到答案.
【解答过程】A中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性;
B中呈正相关关系,C中两个变量具有负相关关系;
D中两个变量具有相关性,但不是正相关,也不是负相关.
故选:C.
3.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【答案】B
【解题思路】由正、负相关的概念即可判断.
【解答过程】由题中数据可知,y随x的增大而增大,且不成比例关系,故y与x正相关.
故选:B.
4.(2025高二·全国·专题练习)如图所示的两个变量不具有相关关系的有________.(填序号)
【答案】①④
【解题思路】根据相关关系逐项分析判断.
【解答过程】对于①:图中是确定的函数关系;
对于②:图中的点大都分布在一条曲线周围,是相关关系;
对于③:中的点大都分布在一条直线周围,是相关关系;
对于④:中点的分布没有任何规律可言,x,y不具有相关关系.
故答案为:①④.
5.(24-25高二·全国·课堂例题)试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的行驶速度与耗油量;
(3)真空中自由降落的小球,位移(单位:m)与时间(单位:s);
(4)日降雨量(单位:cm)与空气中污染物浓度(单位:).
【答案】(1)具有相关关系
(2)具有相关关系
(3)具有函数关系
(4)具有相关关系
【解题思路】(1)根据相关关系的概念判断即可;
(2)根据相关关系的概念判断即可;
(3)根据函数关系的概念判断即可;
(4)根据相关关系的概念判断即可.
【解答过程】(1)商品的销售价格与其供应量之间具有相关关系.一般来说,在品质相当的情况下,供应量越大,
价格就越低;供应量越小,价格就越高.某些品牌商品限量供应,就是保持较高价位的销售策略.
(2)汽车的行驶速度与耗油量之间具有相关关系.通常情况下,当速度很慢或速度很快时,耗油较多,
而在中等车速(不同的汽车范围不一定一样)时,速度稍高,耗油反而较少.
(3)根据自由落体运动方程,可知自由降落的小球,位移与时间之间是函数关系.
(4)日降雨量与空气中污染物浓度之间具有相关关系.通常情况下,降雨量越大,空气中污染物浓度就越低.
题型2
样本相关系数
6.(25-26高三·全国·一轮复习)对两个变量x,y进行线性相关性检验,得线性相关系数,对两个变量u,v进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量x与变量y正相关,变量u与变量v负相关,变量x与变量y的线性相关性更强
B.变量x与变量y负相关,变量u与变量v正相关,变量x与变量y的线性相关性更强
C.变量x与变量y负相关,变量u与变量v正相关,变量u与变量v的线性相关性更强
D.变量x与变量y正相关,变量u与变量v负相关,变量u与变量v的线性相关性更强
【答案】D
【解题思路】根据相关系数的正负判断正负相关,并根据相关系数绝对值大小得到相关性强弱.
【解答过程】由线性相关系数知x与y正相关,
由线性相关系数知u与v负相关,
又,所以变量u与变量v的线性相关性比变量x与变量y的线性相关性更强.
故选:D.
7.(24-25高二下·山东聊城·阶段检测)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【解题思路】根据散点图和相关系数的概念和性质辨析即可.
【解答过程】由散点图可知,相关系数所在散点图呈负相关,所在散点图呈正相关,
所以都为正数,都为负数.
所在散点图近似一条直线上,线性相关性比较强,相关系数的绝对值越接近1,
而所在散点图比较分散,线性相关性比较弱,相关系数的绝对值越远离1.
综上可得:.
故选:A.
8.(24-25高二下·山东枣庄·期末)下列四组成对数据:①,,,,;②,,,,;③,,,,;④,,,,.其中样本相关系数最小的是( )(附:样本相关系数)
A.① B.② C.③ D.④
【答案】C
【解题思路】观察数据,对于①,样本相关系数为1,对于③,样本相关系数为-1,再对②和④进行观察和计算,最终可得答案.
【解答过程】对于①,数据均在上,故样本相关系数为1,
对于③,数据均在上,故样本相关系数为-1,
对于②,可看出其数据为正相关,故样本相关系数大于0,
对于④,显然所有数据无法落在某一个一次函数上,故,
事实上,
,
其中,故,
故,
综上,样本相关系数最小的是③.
故选:C.
9.(2025高三·全国·专题练习)已知样本相关系数,则成对样本数据,,,,的相关系数为___________.
【答案】
【解题思路】根据相关系数的计算公式分别计算数据即可.
【解答过程】因为,,
则,
,
所以.
故答案为:.
10.(2025·河南·一模)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
【答案】(1)13;11
(2)
(3)可以用线性回归模型拟合与之间的关系,理由见解析
【解题思路】(1)根据已知数据直接求平均值即可;
(2)分别求出和,再代入公式即可求解;
(3)根据相关系数的绝对值大于0.75且非常接近1判断即可.
【解答过程】(1)由题可知,;
(2)计算得,
故;
(3)由(2)可知,与的相关系数的绝对值近似为0.992,大于0.75且非常接近1,
说明与的线性相关性很强,从而可以用线性回归模型拟合与之间的关系.
题型3
残差的计算
11.(24-25高二下·福建泉州·阶段检测)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了次试验,收集数据如下表所示.
零件数个
加工时间
由上表数据求得关于的经验回归方程为,据此计算出样本点处的残差为( )
A. B. C. D.
【答案】D
【解题思路】利用回归方程过样本点,可求参数,然后再根残差概念即可求解.
【解答过程】由表格中数据可求得:,
,
根据关于的经验回归方程必过点得:
,故经验回归方程为,
当时,预报值,
所以在样本点处的残差为,
故选:D.
12.(24-25高二下·山东潍坊·阶段检测)已知变量线性相关,其一组样本数据,满足,用最小二乘法得到的经验回归方程为.若增加一个数据后,得到修正后的回归直线的斜率为2.1,则数据的残差为( )
A.0.1 B.0.2 C.-0.2 D.-0.1
【答案】D
【解题思路】由回归直线结合,可得,据此可得新增数据后的回归直线中心点,由此可得新的回归直线方程,然后由残差定义可得答案.
【解答过程】因,则,则.
则新增数据后,,,
因新的回归直线过点,且修正后的回归直线的斜率为2.1,
则,则修正后的回归直线为:.
则的估计值为,则数据的残差为.
故选:D.
13.(24-25高二下·广东广州·期末)为了预测某地的经济增长情况,某经济学专家根据该地2023年1~6月的GDP的数据(单位:百亿元)建立了线性回归模型,得到的经验回归方程为,其中自变量指的是月的编号,其中部分数据如表所示:
时间
1月
2月
3月
4月
5月
6月
编号
1
2
3
4
5
6
百亿元
11.1
参考数据:.则下列说法不正确的是( )
A.经验回归直线经过点
B.
C.根据该模型,该地2023年12月的GDP的预测值为14.4百亿元
D.相应于点的残差为0.1
【答案】D
【解题思路】求得数据的样本中心点,即可判断A;结合回归直线方程求出可判断B;将代入回归直线方程求得预测值,可判断C;根据残差的定义计算可判断D.
【解答过程】选项A:由题意得:,
因为,,所以,得,
因此该经验回归直线经过样本点的中心,故A正确;
选项B:由A知,,得,故B正确;
选项C:由B得,则当时,,
故该地2023年12月的GDP的预测值为百亿元,故C正确;
选项D:当时,,
相应于点的残差为,故D错误,
故选:D.
14.(24-25高二下·重庆·阶段检测)近几年,我国新能源汽车产业进入了加速发展的阶段,呈现市场规模、发展质量“双提升”的良好局面.新能源汽车的核心部件是动力电池,其中的主要成分是碳酸锂.下表是某地2025年3月1日至2025年3月5日电池级碳酸锂的价格的统计数据:
日期代码
1
2
3
4
5
电池级碳酸锂价格
4.1
3.9
3.8
3.8
3.9
根据表中数据,得出关于的经验回归方程为,根据数据计算出在样本点处的残差为___________.
【答案】
【解题思路】计算样本中心,代入回归方程计算回归方程,再根据残差定义求解即可.
【解答过程】由样本数据可得,,
所以,即经验回归方程为,
样本点处的残差为.
故答案为:.
15.(24-25高二下·重庆·期末)近年来,中国的新能源汽车产业展现出迅猛的发展势头,已然跃升为全球最大的新能源汽车市场.该产业涵盖了电动汽车、插电式混合动力汽车以及燃料电池汽车等多种类型.在电池技术、电机和电控系统等领域,中国的新能源汽车产业取得了引人瞩目的成就.现有一汽车测评栏目为了评估某品牌纯电动汽车的实际续航能力,进行了一系列试验,并收集了相应的数据,详见下表.
速度
6
7
8
9
10
续航里程
4.4
4.2
4
3.9
3.5
(1)根据最小二乘法,计算y关于x的回归方程;
(2)根据你得到的一元线性回归模型,预测速度为时,该电动汽车的续航里程;
(3)计算5组数据的残差,并计算残差之和.
参考公式:线性回归方程中,的最小二乘法估计分别为,.
参考数据:,.
【答案】(1)
(2)
(3)残差见解析,残差和为0
【解题思路】(1)根据最小二乘法即可求解,
(2)代入回归方程中即可求解,
(3)根据残差的计算公式即可求解.
【解答过程】(1)由题意,,
,
,
故y关于x的线性回归方程为;
(2)根据(1)所求的回归方程,当时,,
所以电动汽车的续航里程为;
(3)由(1)可列表
速度
6
7
8
9
10
续航里程
4.4
4.2
4
3.9
3.5
预测值
4.42
4.21
4
3.79
3.58
残差
0
0.11
残差之和为.
题型4
刻画回归效果的方式
16.(24-25高二下·安徽蚌埠·期末)在线性回归模型中,能说明模型的拟合效果越好的是( )
A.残差图带状区域越宽 B.残差和越小
C.决定系数越大 D.相关系数r越大
【答案】C
【解题思路】根据各个变量的意义作出判断,得到答案.
【解答过程】A选项,残差图带状区域越宽,说明误差大,模型的拟合效果越差,A错误;
B选项,残差平方和越小,模型的拟合效果越好,B错误;
C选项,决定系数越大,模型的拟合效果越好,C正确;
D选项,相关系数越大,说明两个变量线性相关性越强,与模型的拟合效果无关,D错误.
故选:C.
17.(24-25高二上·黑龙江哈尔滨·期中)下列命题是真命题的是( )
A.经验回归方程至少经过其样本数据点,,…,中的一个
B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强
C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
D.残差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好
【答案】D
【解题思路】根据经验回归方程、相关系数、决定系数、残差等知识确定正确答案.
【解答过程】对于A,经验回归方程是由最小二乘法计算出来的,它不一定经过其样本数据点,一定经过,所以A错误;
对于B,由相关系数的意义,当越接近1时,表示变量y与x之间的线性相关程度越强,所以B错误;
对于C,用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好,所以C是错误;
对于D,因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,
模型的拟合效果越好,故D正确.
故选:D.
18.(2025高二·全国·专题练习)某同学用收集到的6组数据对制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线的方程:,相关系数为,决定系数为;经过残差分析,确定点E为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线的方程:相关系数为,决定系数为.则以下结论中,正确的是( )
① ② ③ ④
A.①② B.①②③ C.②④ D.②③④
【答案】B
【解题思路】利用回归方程的性质,利用相关系数和相关指数分析解答.
【解答过程】由散点图可知,x,y之间是正相关关系,所以,故①正确;
由散点图可知,回归直线的斜率是正数,且的斜率大于的斜率,
所以,故②③正确:
由散点图可知,去掉“离群点”E后,相关性更强,拟合的效果更好,
所以,故④错误.
故选:B.
19.(2025高三·全国·专题练习)某公司收集了某商品销售收入(单位:万元)与相应的广告支出(单位:万元)共10组数据,绘制出散点图,如图,并利用线性回归模型进行拟合.若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法错误的是________.
①决定系数变小 ②残差平方和变小
③相关系数的值变小 ④自变量与因变量相关性变弱
【答案】①③④
【解题思路】回归效果越好,则决定系数越大,相关系数的绝对值越大,残差平方和越小.
【解答过程】从图中可以看出点较其他点,偏离直线远,故去掉点后,回归效果更好,
故决定系数会变大,更接近于1;残差平方和变小;
相关系数的绝对值,即会更接近于1,由图可得与正相关,故会更接近于1,即相关系数的值变大,自变量与因变量相关性变强,故①,③,④错误,②正确.
故答案为:①③④.
20.(24-25高二下·广东东莞·期末)在科技日新月异的今天,无人驾驶网约车正逐渐成为出行领域的新宠,根据统计数据显示,某区域过去5天的订单数如下:
日期x(天)
1
2
3
4
5
订单数y(件)
13
21
45
55
66
为了进一步了解订单数的变化情况,甲乙两个数学学习小组分别进行了研究,
(1)甲小组决定用线性回归模型进行拟合,求此时y关于x的经验回归方程;
(2)乙小组采用非线性回归模型进行拟合,求得y关于x的经验回归方程为,并计算出决定系数,
①根据回归模型的决定系数,说明哪个小组的模型拟合效果更好;
②用①中选择的模型预测该区域第10天的订单数(结果保留整数).
附:,;决定系数.参考数据:
【答案】(1)
(2)①甲小组的线性回归模型拟合效果更好 ;②138件
【解题思路】(1)根据公式求,可得回归方程.
(2)计算甲小组模型的决定系数,比较决定系数的大小,可得结论;把代入线性回归方程,可预测该区域第10天的订单数.
【解答过程】(1)由题可知:
,,
,,
关于x的回归方程为.
(2)①由(1)知,从而有.
x
1
2
3
4
5
12
26
40
54
68
,
,
,
,从来看甲小组的线性回归模型拟合效果更好.
②当时,.预测第10天的订单数为138件.
题型5
回归直线方程
21.(24-25高二下·广东广州·期末)随机抽取5家超市,得到其广告支出x(万元)与销售额y(万元)的数据如下:
超市
A
B
C
D
E
广告支出x
1
2
4
6
7
销售额y
20
30
40
44
46
(参考公式:,,参考数据:样本相关系数),则下列判断正确的是( )
A.y与x呈负相关关系 B.经验回归直线经过点
C.经验回归方程为 D.y与x的线性相关程度较强
【答案】D
【解题思路】利用正负相关的概念即可作出选项A的判断,利用经验回归直线经过样本中心点,可通过计算判断B,利用公式求参数和,即可判断C,利用相关系数接近于1可判断D.
【解答过程】由样本相关系数可得y与x呈正相关关系,故A错误;
由数据可得: ,
故经验回归直线经过点,故B错误;
由,
则,故经验回归方程为,故C错误;
由于样本相关系数较接近于1,则y与x的线性相关程度较强,故D正确;
故选:D.
22.(24-25高二下·吉林长春·期末)5天内某校当天新增感冒人数y与每日温差x(单位:℃)的数据如下表:
x
5
7
8
9
11
y
9
m
15
17
20
由于保存不善,有1个数据模糊不清,用m代替,已知y关于x的经验回归方程为,则( )
A.13 B.14 C.15 D.12
【答案】B
【解题思路】用中心点坐标代入计算.
【解答过程】由,,
所以,解得.
故选:B.
23.(2025·辽宁锦州·二模)5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升.某手机商城统计了1至5月份5G手机的实际销量,如下表所示:
月份x
1月
2月
3月
4月
5月
销售量y(千只)
0.5
0.6
1.0
1.4
1.7
若y与x线性相关,且求得线性回归方程为,则下列说法不正确的是( )
A.由题中数据可知,
B.由题中数据可知,6月份该商城5G手机的实际销量为2(千只)
C.由题中数据可知,变量x和y正相关,且相关系数一定小于1
D.若不考虑本题中的数据,回归直线可能不过,,…,中任一个点
【答案】B
【解题思路】根据题意,由回归直线方程的性质,对选项逐一判断,即可得到结果.
【解答过程】对于A,由表格可知,,,
则,故A正确;
对于B,将代入,可得,
所以6月份该商城5G手机的实际销量预测为2(千只),故B错误;
对于C,因为回归方程为,所以变量x和y正相关,
且样本点不全在回归方程上,所以相关系数一定小于1,故C正确;
对于D,回归直线可能不过样本点中的任何一个点,故D正确;
故选:B.
24.(24-25高二下·江苏镇江·期末)某小吃店的日盈利(单位:百元)与当天平均气温(单位:)之间有如下数据:由表中数据可得回归方程中.试预测当天平均气温为时,小吃店的日盈利约为__________百元.
0
1
2
百元
5
4
2
2
1
【答案】6
【解题思路】根据已知数据求出样本中心点,代入得到值,再令即可得解.
【解答过程】由已知数据可知变量的平均值,
变量的平均值,
所以样本数据的中心点为,
因为,所以,代入,得,
所以,
令,得.
故答案为:6.
25.(24-25高二下·河南·期中)某中医药企业根据市场调研与模拟,得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
研发投入(亿元)
1
2
3
4
5
产品收益(亿元)
3
7
9
10
11
(1)计算,的相关系数,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般;若,则线性相关程度较高)
(2)求出关于的线性回归方程,并预测若想收益超过20(亿元),则需研发投入至少多少亿元?(结果保留一位小数)
参考公式:回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为,,.
【答案】(1)0.95,相关程度较高
(2),9.4亿元. ,
【解题思路】(1)由公式计算出相关系数后可得;
(2)求出线性回归方程,通过线性回归方程估算即得.
【解答过程】(1)由表中数据可知,,,
,,,
则,
因为,故相关程度较高;
(2),,则,
,
故,
令,解得,故研发投入至少9.4亿元.
题型6
非线性回归分析
26.(2025·广东梅州·二模)云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2018年至2022年云计算市场规模数据,且市场规模y与年份代码x的关系可以用模型(其中e为自然对数的底数)拟合,设,得到数据统计表如下:
年份
2018年
2019年
2020年
2021年
2022年
年份代码x
1
2
3
4
5
云计算市场规模y/千万元
7.4
11
20
36.6
66.7
2
2.4
3
3.6
4
由上表可得经验回归方程,则2025年该科技公司云计算市场规模y的估计值为( )
A. B. C. D.
【答案】B
【解题思路】根据可得线性回归方程,再由回归方程求出2025年的预测值,代入即可得解.
【解答过程】因为,
所以,
即经验回归方程,
当时,,
所以,
即2025年该科技公司云计算市场规模y的估计值为,
故选:B.
27.(2025高二·全国·专题练习)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润z(单位:万元)的影响.对近8年的年宣传费和年销售量数据进行初步处理后,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①;②;③;④;⑤,则较适宜作为年销售量y关于年宣传费x的回归方程的是( )
A.①② B.②③ C.②④ D.③⑤
【答案】B
【解题思路】先根据散点图确定函数图象的趋势,再结合5个函数图象,进行判断选择.
【解答过程】从散点图知,样本点分布在抛物线上或对数型曲线上,结合所给5个的曲线类型,所以或较适宜.
故选:B.
28.(24-25高二下·河北石家庄·期末)一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间t(分钟)和答对人数y的统计表格如下:
时间t(分钟)
10
20
30
40
50
60
70
80
90
100
答对人数y
98
70
52
36
30
20
15
11
5
5
1.99
1.85
1.72
1.56
1.48
1.30
1.18
1.04
0.7
0.7
时间t与答对人数y和的散点图如下:
附:,,,,,对于一组数据,,…,,其回归直线方程的斜率和截距的最小二乘估计分别为:,.请根据表格数据回答下列问题:
(1)根据散点图判断,与哪个更适宜作为线性回归模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y与的回归方程;(a,b或c,d的计算结果均保留到小数点后三位)
(3)根据(2)请估算要想答对人数不少于75人,至多间隔多少分钟需要重新记忆一遍.(结果四舍五入保留整数)(参考数据:,).
【答案】(1)更适宜作为线性回归类型;
(2);
(3)19分钟.
【解题思路】(1)根据给定的两个散点图即可得答案.
(2)先求得的线性回归方程,再将对数式化为指数式即得与的回归方程.
(3))解不等式 即可得答案.
【解答过程】(1)观察两个散点图知,更适宜作为线性回归类型.
(2)依题意,,,
由(1)知,,根据最小二乘法得:
,
,于是,
因此y与的回归方程.
(3)依题意,,即,则,
而,于是,解得,
所以要想答对人数不少于75人,至多间隔19分钟需要重新记忆一遍.
29.(24-25高三上·福建厦门·阶段检测)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:
令,数据经过初步处理得:,,,,,,.现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
附:①相关系数,回归直线中公式分别为,;
②参考数据:,,,
【答案】(1)模型②的拟合程度更好
(2)13(百万辆)
【解题思路】(1)利用公式分别求出模型①和②的相关系数,结合相关系数的意义即可判断哪一个模型拟合程度更好;
(2)先利用最小二乘法求出关于的回归方程,再令,即可得解..
【解答过程】(1)设模型①和②的相关系数分别为,
由题意可得:,
,
所以,由相关系数的意义可得,模型②的拟合程度更好.
(2)因为,
又由,,
得,
所以,即回归方程为,
当时,,
因此当年广告费为6(百万元)时,产品的销售量大概是13(百万辆).
30.(2025·福建泉州·模拟预测)泉州少年郎团队从2024年10月份以来,通过深度整合AI算法、大数据分析和自动化技术,不断优化产品与服务,显著提升了运营效率和市场竞争力,推动团队收入持续攀升.该团队在近7个月的经济收入(单位:百万元)的数据如下表:
月份编号
1
2
3
4
5
6
7
收入(百万元)
6
11
21
34
66
101
196
(1)根据以上数据绘制散点图,并根据散点图判断,与(均为大于零的常数)哪一个适宜作为该团队经济收入y关于月份x的回归方程模型?(给出判断即可,不必说明理由)并根据你的判断结果及表中的数据,求出y关于x的回归方程;
(2)请你根据所求的回归方程,预测该团队下一个月的经济收入;
(3)试从统计学角度分析,如果用所求的回归方程预测该团队接下来1年的经济收入情况是否合理?
参考数据:
435
10.78
2535
50.12
2.82
3.47
其中设,
参考公式:,.
【答案】(1)适宜,
(2)347百万元
(3)不合理
【解题思路】(1)看到形式,通过取对数转化成的形式,把复杂形式变简单. 算出的均值、的均值和这些值. 用公式算出,再把样本中心点代入求出,进而得到回归方程.
(2)把代入回归方程,算出对应的值,得到预测收入.
(3)经验回归方程有时效性,所以判断预测不合理.
【解答过程】(1)散点图如图所示,
根据散点图判断,适宜作为5G经济收入y关于月代码x的回归方程类型,
,两边同时取常用对数得:,
设,,
,
,
,
,
把样本中心点代入,得:,
,,
,
y关于x的回归方程:.
(2)当时,,
所以预测该公司2025年5月份的经济收入估计为347百万元.
(3)不合理,经验回归方程一般具有时效性,解释变量越接近样本数据,预测值比较可信,否则会有显著误差.
题型7
回归分析与其他知识交汇
31.(2025·四川成都·一模)某校举办校刊义卖活动,学生在义卖处每领取一本校刊,便自觉向收银箱中支付至少两元钱.现统计了连续5天的售出校刊数量和收益情况,如下表:
售出校刊数量x(单位:箱)
6
5
7
5
7
收益y(单位:元)
240
220
260
230
270
(1)求收益y关于售出数量x的回归直线方程,并计算售出8箱校刊时的预计收益;
(2)学校决定将收益奖励在科技创新大赛中获奖的学生,获奖学生每人奖励100元.已知甲、乙两名学生是否获奖是相互独立的,甲获奖的概率为,乙获奖的概率为,求甲、乙两名学生获奖总金额X的分布列及数学期望.附:,.
【答案】(1);元;
(2)分布列见解析;.
【解题思路】(1)根据给出的公式求线性回归方程,再把代入求值即可.
(2)明确的取值,求出对应的概率,可得的分布列,再根据期望公式求.
【解答过程】(1)因为,,
,
,
所以,.
所以收益y关于售出数量x的回归直线方程为:.
当时,预测收益为元.
(2)由题意,的值可能为:,
且,,.
所以的分布列为:
0
100
200
所以.
32.(25-26高三上·江苏扬州·阶段检测)2025年春节假期,文旅市场火爆.文化和旅游部公布的数据显示:春节假期8天,全国国内出游5.01亿人次,同比增长;国内出游总花费6770.02亿元,同比增长.某景区的某网红饮品小店统计了春节假期前7天的营业额(单位:千元),得到与的数据如表所示:
第天
1
2
3
4
5
6
7
营业额
7
9
11
13
16
18
17
(1)已知与有较强的线性相关关系,求关于的线性回归方程,并预测春节假期第8天的营业额;
(2)如果某天营业额大于10(单位:千元),则该天“达标”,从表格中的7组数据中随机选4组,设表示“达标”的数据组数,求的分布列和数学期望.
参考公式:在线性回归方程中,,.
参考数据:,.
【答案】(1),千元
(2)分布列见解析,数学期望为
【解题思路】(1)先求,,结合题中公式求和回归直线方程,代入即可得预测结果;
(2)由题意可知的所有可能取值为:2,3,4,结合超几何分别求分布列和期望.
【解答过程】(1)由题意可得:,,
则,,
可知线性回归方程为,
当时,,
所以预测春节假期第8天的营业额为千元.
(2)由题意可知的所有可能取值为:2,3,4,
则,,,
所以的分布列为
2
3
4
的数学期望为.
33.(24-25高二下·湖南衡阳·期末)某学校校庆时统计连续5天进入学校参加活动的校友数(单位:千人)如下:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
第x天
1
2
3
4
5
参观人数y
2.2
2.6
3.1
5.2
6.9
(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明(保留小数点后两位);(若,则认为y与x的线性相关性很强),并求出y关于x的线性回归方程;
(2)校庆期间学校开放1号门、2号门和3号门供校友出入,校友从1号门、2号门和3号门进入学校的概率分别为、、,且出学校与进学校选择相同门的概率为,选择与人校不同两门的概率各为.假设校友从1号门、2号门、3号门出入学校互不影响,现有甲、乙、丙、丁4名校友于10月1日回母校参加活动,设X为4人中从2号门出学校的人数,求X的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
【答案】(1),回归方程为
(2)的分布列见解析;
【解题思路】(1)求出,将参考数据代入相关系数公式,求出的值,即可得出结论;再将数据代入最小二乘法公式,求出的值,即可得出回归直线方程;
(2)利用全概率公式求出每个人从2号门出校园的概率,由此可知,利用二项分布可得出随机变量的分布列,利用二项分布的期望、方差公式可得出的值.
【解答过程】(1)依题意,,而,,,
则.
因为时线性相关程度高,所以y与x线性相关性很强,
可以用线性回归模型拟合.
,,
因此,回归方程为.
(2)记“甲从2号门出学校”为事件A,“甲从1号门进学校”为事件B,
“甲从2号门进学校”为事件C, “甲从3号门进学校”为事件D,
由题意可得,,,
,,,
由全概率公式得:
,同理乙、丙、丁从2号门出学校的概率也为,
为4人中从2号门出学校的人数,则,
,,
,,
,
故的分布列为:
0
1
2
3
4
所以.
34.(24-25高二下·新疆喀什·期末)随着科技的进步,近年来,我国新能源汽车产业迅速发展,2006年,在国家节能减排的宏观政策指导下,科技部在“十一五”启动了“863”计划新能源汽车重大项目.自2011年起,国家相关部门重点扶持新能源汽车的发展,也逐步得到消费者的认可.各大品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升,小张同学对某品牌新能源汽车近8年出售的数量及广告费投入情况进行了统计,具体数据见下表:
年份代码
1
2
3
4
5
6
7
8
年销售量/十万辆
3
4
5
6
7
9
10
12
广告费投入/亿元
3.6
4.1
4.4
5.2
6.2
7.5
7.9
9.1
(1)求广告费投入y(亿元)与年销售量x(十万辆)之间的线性回归方程(精确到0.01);
(2)若某人随机在甲、乙两家汽车店购买一辆汽车,如果在甲汽车店购买,那么购买新能源汽车的概率为0.6;如果在乙汽车店购买,那么购买新能源汽车的概率为0.8,求这个人购买的是新能源汽车的概率.
参考数据:
附:回归直线中.
【答案】(1)
(2)0.7
【解题思路】(1)由数据求得回归方程系数,即可求解;
(2)由全概率公式即可求解.
【解答过程】(1),,
由参考数据
所以
故广告费投入y关于年销售量x的回归方程为.
(2)设“在甲汽车店购买汽车”,“在乙汽车店购买汽车”,
“购买的是新能源汽车”,
,,,
由全概率公式得,.
35.(2025·四川乐山·三模)电影《哪吒2》上映以来引起了全社会甚至全世界的关注,全球票房突破百亿.“跟着吒儿去旅游”成为热门出游方式,某景点宣传投入金额(单位:万元)与游客满意度评分(满分:100分)之间可能存在一定的关系,以下是随机抽取的6个不同线上宣传投入金额和游客满意度评分的数据:
线上宣传投入金额(万元)
20
30
40
50
60
70
游客满意度评分(分)
60
65
70
78
80
85
(1)根据表中所给数据,用相关系数加以判断,是否可用线性回归模型拟合与的关系?若可以,求出关于之间的线性回归方程;若不可以,请说明理由(精确到小数点后两位);
(2)《哪吒2》中更是蕴含着丰富的中国传统文化,某校举办中国传统文化比赛,甲、乙两人进入决赛,决赛采用“五局三胜制”,已知在每局比赛中,甲获胜的概率为,.
①若甲以获胜的概率为,求的最大值;
②在①中,若,以作为的值,设甲、乙比赛的局数为,求的分布列和期望.
参考公式:相关系数,,
参考数据:.
【答案】(1)可以,
(2)①;②分布列见解析,
【解题思路】(1)根据题意,利用公式求得,得到用线性回归模型拟合与的关系,求得回归系数,进而得到回归直线方程;
(2)①根据题意,求得, 求得,得到函数得到单调性和最大值,即可求解;
②由①得到,随机变量,求得相应的概率,列出分布列,结合期望的公式,求得期望值.
【解答过程】(1)解:由已知得,,
可得,
,
,
所以,
因为,可以推断与正两个变量正线性相关,且相关程度很强,
可用线性回归模型拟合与的关系,
则,所以,
所以关于的线性回归方程为:.
(2)解:①若甲以获胜,则前四局中甲、乙各胜两局,且第五局甲获胜,
所以,
所以 ,
令,可得,当时,;
当时,,
所以在上单调递增,在上单调递减;
所以当时,取得最大值,
②由①知,,随机变量,
可得;;
,
所以随机变量的分布列为
3
4
5
所以.
题型8
列联表的完善与分析
36.(24-25高三·全国·一轮复习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【答案】C
【解题思路】根据联表计算求参即可.
【解答过程】因为.所以.又,所以.
故选:C.
37.(24-25高二下·江苏·课后作业)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【答案】D
【解题思路】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【解答过程】依题意,解得,由解得.
补全列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D.
38.(2025高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
【答案】D
【解题思路】已知抽取的老年人、年轻人各有25名,计算各个变量的值,进而得到答案.
【解答过程】因为,,
,,,,
所以,,,,.
故选:D.
39.(24-25高二下·青海西宁·期末)第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中,___________.
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
【答案】
【解题思路】根据题意,利用志愿者的总人数为100,列出方程,即可求解.
【解答过程】根据表格中的数据,因为志愿者的总人数为100,所以,
解得.
故答案为:.
40.(24-25高二下·全国·课堂例题)2022年9月23日,以“庆丰收同心共富,迎盛会齐向未来”为主题的第五个中国农民丰收节开幕式在盐城市射阳县海河镇举行,射阳县政府同步开展以“湿地绿城庆丰收、向海图强迎盛会”为主题的农民丰收节系列活动,现从某活动现场的观众中随机抽取名(其中男性名),了解他们对该活动的满意情况,得到下表.
不满意
满意
合计
男性
女性
合计
根据统计数据完成列联表.
【答案】答案见解析
【解题思路】利用给定条件计算数据,补充列联表即可.
【解答过程】因为男性有名,一共有名观众,
所以一共有名女性观众,而有名女性观众不满意,
所以有名女性观众满意,而有名男性观众满意,
所以有名男性观众不满意,故有名观众不满意,有名观众满意,
补全的列联表如下.
不满意
满意
合计
男性
女性
合计
题型9
独立性检验
41.(24-25高二下·内蒙古巴彦淖尔·期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据:以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
P
0.10
0.05
0.01
k
2.706
3.841
6.635
A.有90%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.01的前提下,可以认为是否是篮球迷与性别有关
【答案】A
【解题思路】根据已知表格数据及卡方公式求卡方值,应用独立检验基本思想得到结论,即可得.
【解答过程】由题设,
所以有90%的把握认为是否是篮球迷与性别有关,没有95%的把握认为是否是篮球迷与性别有关,A对,B、C、D错;
故选:A.
42.(24-25高二下·浙江·期中)为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.05的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
5.635
7.879
10.828
A.35 B.36 C.37 D.38
【答案】B
【解题思路】根据题意列出二联表,即可由卡方公式求解即可.
【解答过程】设没接种只数为k,依题意,得2×2列联表如下:
发病
没发病
合计
接种
2k
没接种
k
合计
3k
则的观测值为:,因为本次调查得出“在犯错误的概率不超过0.05的前提下认为喜爱足球与性别有关的结论,
于是,即,即
∴,∴
故选:B.
43.(24-25高三上·湖北襄阳·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
【答案】D
【解题思路】列出列联表,计算即可得解.
【解答过程】列出列联表:
男生
女生
篮球迷
90
20
110
非篮球迷
60
30
90
150
50
200
,
故在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关.
故选:D.
44.(2025·上海黄浦·三模)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有__________人.
0.050
0.010
0.001
3.841
6.635
10.828
参考数据及公式如下:参考公式:,其中.
【答案】48
【解题思路】设男生人数为,依题意列出列联表,分析出根据小概率值的独立性检验,判断中学生追星与性别有关,则,再代入的公式求出的范围,再根据的实际意义即可求出男生的最少人数.
【解答过程】设男生人数为,依题意可得列联表为
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,
由,解得.
由题意知,应为6的整数倍,
所以若根据小概率值的独立性检验,
判断中学生追星与性别有关,则男生至少有48人.
故答案为:48.
45.(24-25高二下·河北·期末)某高中新开设了游泳课,为了调查学生对课程的满意度,随机抽查了150名学生,其中不喜欢与喜欢人数比为,且男生占总人数的,女生中有的人不喜欢.
性别
满意度
合计
不喜欢
喜欢
男
女
合计
(1)补全列联表;
(2)根据小概率值的独立性检验,能否认为学生对游泳课的满意度与性别有关?
附:,.
α
0.1
0.01
0.001
2.706
6.635
10.828
【答案】(1)列联表见解析;
(2)无关,理由见解析.
【解题思路】(1)利用给定条件计算出喜欢与不喜欢的人数及其中的男、女生人数,得到列联表;
(2)根据列联表所给的数据,代入求值的公式,求出值并与临界值比对,即可得出结论.
【解答过程】(1)
性别
满意度
合计
不喜欢
喜欢
男
25
25
50
女
45
55
100
合计
70
80
150
(2)零假设为:学生对游泳课的满意度与性别无关,
,
根据小概率的独立性检验,没有充分证据判断不成立,
因此可以认为成立,即认为学生对游泳课的满意度与性别无关.
题型10
独立性检验与其他知识交汇
46.(24-25高二下·山东威海·期末)在科技飞速发展的今天,人工智能(AI)领域迎来革命性的突破,各种AI工具拥有强大的解决问题的能力.某企业为了解男女员工对AI工具的使用情况,随机调查了200名员工,得到如下数据:
经常使用
不经常使用
合计
男性
80
20
100
女性
60
40
100
合计
140
60
200
(1)根据小概率值的独立性检验,分析该企业员工对AI工具的使用情况是否与性别有关;
(2)为鼓励员工使用AI工具,企业采用按性别分层抽样的方式,在被调查的经常使用AI工具的员工中,抽取了7名员工组成AI工具宣传小组.现从这7名员工中随机选出3名担任宣传组长,记选出的3名宣传组长中女员工的人数为随机变量X,求X的数学期望.
参考公式:,.
参考数据:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)企业员工对AI工具的使用情况与性别有关
(2)
【解题思路】(1)根据题意得到列联表;利用公式求得,结合附表即可得到结论;
(2)应用分层抽样的等比例性质确定男女人数,确定有X的所有可能取值集合为,求出对应概率,即可得分布列,进而求期望.
【解答过程】(1)零假设为:该企业员工对AI工具的使用情况与性别无关.
根据列联表数据计算得:
.
根据小概率值的独立性检验,我们推断不成立,
即认为“该企业员工对AI工具的使用情况与性别无关”,此推断犯错误的概率不超过.
故分析认为企业员工对AI工具的使用情况与性别有关.
(2)由题意知,抽取的7名员工中男员工有4名,女员工有3名.
则X可能的取值集合为,
因此,,
,,
所以.
47.(24-25高二下·河北沧州·期末)在某次考试中,某学校要对某年级的学习总评成绩(满分100分)和体育成绩(满分100分)进行统计分析,为研究方便,现抽取出了其中各100名学生的成绩(分为优秀和一般)进行统计.
优秀
一般
合计
学习总评成绩
体育成绩
合计
(1)若统计的数据中学习总评成绩在前十名的成绩分别为99,98,98,97,96,96,96,94,94,93,求这十个成绩的平均数和第70百分位数;
(2)统计可得,学习总评成绩优秀60人,体育成绩一般30人,填写如下列联表,依据的独立性检验,能否认为学习总评成绩优秀与体育成绩优秀有关?
参考公式:,.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)平均数为96.1,第70百分位数为97.5
(2)表格见解析,认为学习总评成绩优秀与体育成绩优秀无关.
【解题思路】(1)把成绩按照小到大排列,可算出第70百分位数和平均数;
(2)梳理成表格,找到的对应值,带入公式,找到对应判定区间,得到答案
【解答过程】(1)把学习总评成绩在前十名的成绩从小到大排列为93,94,94,96,96,96,97,98,98,99,
所以平均数为,
因为%=7,所以第70百分位数为.
(2)根据题意,填表可得,
优秀
一般
合计
学习总评成绩
60
40
100
体育成绩
70
30
100
合计
130
70
200
零假设为:学习总评成绩优秀与体育成绩优秀无关,
由表中数据可知,,
依据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为学习总评成绩优秀与体育成绩优秀无关.
48.(24-25高二下·吉林长春·期末)为了研究高中学生平时的数学成缆和整理数学错题习惯的情况,某校数学建模兴趣小组的同学在本校抽取100名学生进行调查统计.数据如下:
整理数学错题习惯
数学成绩
合计
优秀
非优秀
有
20
30
50
没有
10
40
50
合计
30
70
100
(1)依据小概率值的独立性检验,是否认为数学成绩优秀与整理数学错题集习惯有关联;
(2)在调查统计有整理数学错题集习惯的50名学生中,采用比例分配的分层随机抽样的方法选取5人组建研讨小组,再从5人研讨小组中随机抽取3人进行访谈,用表示访谈时成绩优秀的人数,求的分布列及数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关;
(2)分布列见解析,期望为.
【解题思路】(1)先求卡方值,根据独立检验的基本思想得结论即可;
(2)由已知5人中有2人优秀,3人非优秀,则并求出对应概率,即可得分布列,进而求期望.
【解答过程】(1)零假设:数学成绩优秀与整理数学错题集习惯无关联
由题设,
故依据小概率值的独立性检验,不能认为零假设成立,
故认为数学成绩优秀与整理数学错题集习惯有关联;
(2)由分层抽样的等比例性质,5人中有2人优秀,3人非优秀,
所以优秀学生人数,且,,,
故分布列如下,
0
1
2
则.
49.(24-25高二下·辽宁大连·期末)某生产线上有甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,随机抽取两台机床生产的产品,共抽取100件.产品的质量情况统计如下表:
一级品
二级品
总计
甲机床
30
乙机床
10
总计
75
100
(1)根据已知条件完成列联表,并判断能否有的把握认为甲机床的产品质量与乙机床的产品质量有差异?
(2)将上述抽样所得的频率视为概率.现从生产线上采取随机抽样的方法,每次抽取一件产品.
①若抽取3次,记抽取的3件产品中二级品件数为,求随机变量的分布列,期望及方差;
②若抽取100次,记抽取的100件产品中一级品件数为,当最大时,求的值.
附:
.
0.05
0.01
0.005
3.841
6.635
7.879
【答案】(1)列联表见解析,没有
(2)①分布列见解析,,;②
【解题思路】(1)依据题意填写表格,然后计算卡方判断;
(2)①由题可知,然后写出所有取值以及对应的概率,写出分布列,然后根据二项分布的期望和方差计算即可;②由题可知,然后列出计算即可.
【解答过程】(1)完善列联表如下,
一级品
二级品
总计
甲机床
30
15
45
乙机床
45
10
55
总计
75
25
100
根据列联表计算可得
.
所以没有的把握认为甲机床的产品质量与乙机床的产品质量有差异.
(2)①由列联表得抽到二级品的频率为,
将频率视为概率,即从生产线中抽取一件产品为二级品的概率是.
由题意可知,的取值范围是.
,,
,,
所以的分布列为
0
1
2
3
所以,.
②由列联表得抽到一级品的频率为,
将频率视为概率,即从生产线中抽取一件产品为一级品的概率是.
由题意可知,,,
所以,
因为是正整数,所以,即当最大时,.
50.(2025高二·全国·专题练习)某电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.
将日均收看该体育节目时间不低于40分的观众称为“体育迷”.
(1)根据已知条件完成下面的列联表,并据此资料判断是否有95%的把握认为“体育迷”与性别有关.
项目
非“体育迷”
体育迷
合计
男
女
10
55
合计
(2)将上述调查所得到的频率视为概率,现在从该地区大量电视观众中,采用随机抽样的方法,每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望和方差.
附:,其中.
0.05
0.010
3.841
6.635
【答案】(1)列联表见解析,没有95%的把握认为“体育迷”与性别有关
(2)分布列见解析,,
【解题思路】(1)根据频率分布直方图完善列联表,并根据卡方公式计算卡方,由独立性检验判断;
(2)由二项分布得到概率、分布列、数学期望和方差.
【解答过程】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而列联表如下.
项目
“非体育选”
“体育选”
合计
男
30
15
45
女
45
10
55
合计
75
25
100
.因为,
所以没有95%的把握认为“体育迷”与性别有关.
(2)由频率分布直方图知,抽到“体育迷”的频率为0.25,
将频率视为概率,即从观众中抽取1名“体育迷”的概率为.
由题意知,
,,
,,
从而X的分布列如下:
X
0
1
2
3
P
,
.
第 1 页 共 31 页
学科网(北京)股份有限公司
$
专题01 成对数据的统计分析全章10大重点题型归纳(必考50题专项训练)
【人教A版】
题型归纳
题型1
判断两个变量的相关关系
1.(24-25高二下·全国·课后作业)下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
2.(24-25高二下·重庆·期末)下图是两个分类变量x,y取值绘制成的散点图,则图中变量x,y具有负相关关系的是( )
A. B.
C. D.
3.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
4.(2025高二·全国·专题练习)如图所示的两个变量不具有相关关系的有________.(填序号)
5.(24-25高二·全国·课堂例题)试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的行驶速度与耗油量;
(3)真空中自由降落的小球,位移(单位:m)与时间(单位:s);
(4)日降雨量(单位:cm)与空气中污染物浓度(单位:).
题型2
样本相关系数
6.(25-26高三·全国·一轮复习)对两个变量x,y进行线性相关性检验,得线性相关系数,对两个变量u,v进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量x与变量y正相关,变量u与变量v负相关,变量x与变量y的线性相关性更强
B.变量x与变量y负相关,变量u与变量v正相关,变量x与变量y的线性相关性更强
C.变量x与变量y负相关,变量u与变量v正相关,变量u与变量v的线性相关性更强
D.变量x与变量y正相关,变量u与变量v负相关,变量u与变量v的线性相关性更强
7.(24-25高二下·山东聊城·阶段检测)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
8.(24-25高二下·山东枣庄·期末)下列四组成对数据:①,,,,;②,,,,;③,,,,;④,,,,.其中样本相关系数最小的是( )(附:样本相关系数)
A.① B.② C.③ D.④
9.(2025高三·全国·专题练习)已知样本相关系数,则成对样本数据,,,,的相关系数为___________.
10.(2025·河南·一模)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
题型3
残差的计算
11.(24-25高二下·福建泉州·阶段检测)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了次试验,收集数据如下表所示.
零件数个
加工时间
由上表数据求得关于的经验回归方程为,据此计算出样本点处的残差为( )
A. B. C. D.
12.(24-25高二下·山东潍坊·阶段检测)已知变量线性相关,其一组样本数据,满足,用最小二乘法得到的经验回归方程为.若增加一个数据后,得到修正后的回归直线的斜率为2.1,则数据的残差为( )
A.0.1 B.0.2 C.-0.2 D.-0.1
13.(24-25高二下·广东广州·期末)为了预测某地的经济增长情况,某经济学专家根据该地2023年1~6月的GDP的数据(单位:百亿元)建立了线性回归模型,得到的经验回归方程为,其中自变量指的是月的编号,其中部分数据如表所示:
时间
1月
2月
3月
4月
5月
6月
编号
1
2
3
4
5
6
百亿元
11.1
参考数据:.则下列说法不正确的是( )
A.经验回归直线经过点
B.
C.根据该模型,该地2023年12月的GDP的预测值为14.4百亿元
D.相应于点的残差为0.1
14.(24-25高二下·重庆·阶段检测)近几年,我国新能源汽车产业进入了加速发展的阶段,呈现市场规模、发展质量“双提升”的良好局面.新能源汽车的核心部件是动力电池,其中的主要成分是碳酸锂.下表是某地2025年3月1日至2025年3月5日电池级碳酸锂的价格的统计数据:
日期代码
1
2
3
4
5
电池级碳酸锂价格
4.1
3.9
3.8
3.8
3.9
根据表中数据,得出关于的经验回归方程为,根据数据计算出在样本点处的残差为___________.
15.(24-25高二下·重庆·期末)近年来,中国的新能源汽车产业展现出迅猛的发展势头,已然跃升为全球最大的新能源汽车市场.该产业涵盖了电动汽车、插电式混合动力汽车以及燃料电池汽车等多种类型.在电池技术、电机和电控系统等领域,中国的新能源汽车产业取得了引人瞩目的成就.现有一汽车测评栏目为了评估某品牌纯电动汽车的实际续航能力,进行了一系列试验,并收集了相应的数据,详见下表.
速度
6
7
8
9
10
续航里程
4.4
4.2
4
3.9
3.5
(1)根据最小二乘法,计算y关于x的回归方程;
(2)根据你得到的一元线性回归模型,预测速度为时,该电动汽车的续航里程;
(3)计算5组数据的残差,并计算残差之和.
参考公式:线性回归方程中,的最小二乘法估计分别为,.
参考数据:,.
题型4
刻画回归效果的方式
16.(24-25高二下·安徽蚌埠·期末)在线性回归模型中,能说明模型的拟合效果越好的是( )
A.残差图带状区域越宽 B.残差和越小
C.决定系数越大 D.相关系数r越大
17.(24-25高二上·黑龙江哈尔滨·期中)下列命题是真命题的是( )
A.经验回归方程至少经过其样本数据点,,…,中的一个
B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强
C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
D.残差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好
18.(2025高二·全国·专题练习)某同学用收集到的6组数据对制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线的方程:,相关系数为,决定系数为;经过残差分析,确定点E为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线的方程:相关系数为,决定系数为.则以下结论中,正确的是( )
① ② ③ ④
A.①② B.①②③ C.②④ D.②③④
19.(2025高三·全国·专题练习)某公司收集了某商品销售收入(单位:万元)与相应的广告支出(单位:万元)共10组数据,绘制出散点图,如图,并利用线性回归模型进行拟合.若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法错误的是________.
①决定系数变小 ②残差平方和变小
③相关系数的值变小 ④自变量与因变量相关性变弱
20.(24-25高二下·广东东莞·期末)在科技日新月异的今天,无人驾驶网约车正逐渐成为出行领域的新宠,根据统计数据显示,某区域过去5天的订单数如下:
日期x(天)
1
2
3
4
5
订单数y(件)
13
21
45
55
66
为了进一步了解订单数的变化情况,甲乙两个数学学习小组分别进行了研究,
(1)甲小组决定用线性回归模型进行拟合,求此时y关于x的经验回归方程;
(2)乙小组采用非线性回归模型进行拟合,求得y关于x的经验回归方程为,并计算出决定系数,
①根据回归模型的决定系数,说明哪个小组的模型拟合效果更好;
②用①中选择的模型预测该区域第10天的订单数(结果保留整数).
附:,;决定系数.参考数据:
题型5
回归直线方程
21.(24-25高二下·广东广州·期末)随机抽取5家超市,得到其广告支出x(万元)与销售额y(万元)的数据如下:
超市
A
B
C
D
E
广告支出x
1
2
4
6
7
销售额y
20
30
40
44
46
(参考公式:,,参考数据:样本相关系数),则下列判断正确的是( )
A.y与x呈负相关关系 B.经验回归直线经过点
C.经验回归方程为 D.y与x的线性相关程度较强
22.(24-25高二下·吉林长春·期末)5天内某校当天新增感冒人数y与每日温差x(单位:℃)的数据如下表:
x
5
7
8
9
11
y
9
m
15
17
20
由于保存不善,有1个数据模糊不清,用m代替,已知y关于x的经验回归方程为,则( )
A.13 B.14 C.15 D.12
23.(2025·辽宁锦州·二模)5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升.某手机商城统计了1至5月份5G手机的实际销量,如下表所示:
月份x
1月
2月
3月
4月
5月
销售量y(千只)
0.5
0.6
1.0
1.4
1.7
若y与x线性相关,且求得线性回归方程为,则下列说法不正确的是( )
A.由题中数据可知,
B.由题中数据可知,6月份该商城5G手机的实际销量为2(千只)
C.由题中数据可知,变量x和y正相关,且相关系数一定小于1
D.若不考虑本题中的数据,回归直线可能不过,,…,中任一个点
24.(24-25高二下·江苏镇江·期末)某小吃店的日盈利(单位:百元)与当天平均气温(单位:)之间有如下数据:由表中数据可得回归方程中.试预测当天平均气温为时,小吃店的日盈利约为__________百元.
0
1
2
百元
5
4
2
2
1
25.(24-25高二下·河南·期中)某中医药企业根据市场调研与模拟,得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
研发投入(亿元)
1
2
3
4
5
产品收益(亿元)
3
7
9
10
11
(1)计算,的相关系数,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般;若,则线性相关程度较高)
(2)求出关于的线性回归方程,并预测若想收益超过20(亿元),则需研发投入至少多少亿元?(结果保留一位小数)
参考公式:回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为,,.
题型6
非线性回归分析
26.(2025·广东梅州·二模)云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2018年至2022年云计算市场规模数据,且市场规模y与年份代码x的关系可以用模型(其中e为自然对数的底数)拟合,设,得到数据统计表如下:
年份
2018年
2019年
2020年
2021年
2022年
年份代码x
1
2
3
4
5
云计算市场规模y/千万元
7.4
11
20
36.6
66.7
2
2.4
3
3.6
4
由上表可得经验回归方程,则2025年该科技公司云计算市场规模y的估计值为( )
A. B. C. D.
27.(2025高二·全国·专题练习)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润z(单位:万元)的影响.对近8年的年宣传费和年销售量数据进行初步处理后,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①;②;③;④;⑤,则较适宜作为年销售量y关于年宣传费x的回归方程的是( )
A.①② B.②③ C.②④ D.③⑤
28.(24-25高二下·河北石家庄·期末)一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间t(分钟)和答对人数y的统计表格如下:
时间t(分钟)
10
20
30
40
50
60
70
80
90
100
答对人数y
98
70
52
36
30
20
15
11
5
5
1.99
1.85
1.72
1.56
1.48
1.30
1.18
1.04
0.7
0.7
时间t与答对人数y和的散点图如下:
附:,,,,,对于一组数据,,…,,其回归直线方程的斜率和截距的最小二乘估计分别为:,.请根据表格数据回答下列问题:
(1)根据散点图判断,与哪个更适宜作为线性回归模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y与的回归方程;(a,b或c,d的计算结果均保留到小数点后三位)
(3)根据(2)请估算要想答对人数不少于75人,至多间隔多少分钟需要重新记忆一遍.(结果四舍五入保留整数)(参考数据:,).
29.(24-25高三上·福建厦门·阶段检测)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:
令,数据经过初步处理得:,,,,,,.现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
附:①相关系数,回归直线中公式分别为,;
②参考数据:,,,
30.(2025·福建泉州·模拟预测)泉州少年郎团队从2024年10月份以来,通过深度整合AI算法、大数据分析和自动化技术,不断优化产品与服务,显著提升了运营效率和市场竞争力,推动团队收入持续攀升.该团队在近7个月的经济收入(单位:百万元)的数据如下表:
月份编号
1
2
3
4
5
6
7
收入(百万元)
6
11
21
34
66
101
196
(1)根据以上数据绘制散点图,并根据散点图判断,与(均为大于零的常数)哪一个适宜作为该团队经济收入y关于月份x的回归方程模型?(给出判断即可,不必说明理由)并根据你的判断结果及表中的数据,求出y关于x的回归方程;
(2)请你根据所求的回归方程,预测该团队下一个月的经济收入;
(3)试从统计学角度分析,如果用所求的回归方程预测该团队接下来1年的经济收入情况是否合理?
参考数据:
435
10.78
2535
50.12
2.82
3.47
其中设,
参考公式:,.
题型7
回归分析与其他知识交汇
31.(2025·四川成都·一模)某校举办校刊义卖活动,学生在义卖处每领取一本校刊,便自觉向收银箱中支付至少两元钱.现统计了连续5天的售出校刊数量和收益情况,如下表:
售出校刊数量x(单位:箱)
6
5
7
5
7
收益y(单位:元)
240
220
260
230
270
(1)求收益y关于售出数量x的回归直线方程,并计算售出8箱校刊时的预计收益;
(2)学校决定将收益奖励在科技创新大赛中获奖的学生,获奖学生每人奖励100元.已知甲、乙两名学生是否获奖是相互独立的,甲获奖的概率为,乙获奖的概率为,求甲、乙两名学生获奖总金额X的分布列及数学期望.附:,.
32.(25-26高三上·江苏扬州·阶段检测)2025年春节假期,文旅市场火爆.文化和旅游部公布的数据显示:春节假期8天,全国国内出游5.01亿人次,同比增长;国内出游总花费6770.02亿元,同比增长.某景区的某网红饮品小店统计了春节假期前7天的营业额(单位:千元),得到与的数据如表所示:
第天
1
2
3
4
5
6
7
营业额
7
9
11
13
16
18
17
(1)已知与有较强的线性相关关系,求关于的线性回归方程,并预测春节假期第8天的营业额;
(2)如果某天营业额大于10(单位:千元),则该天“达标”,从表格中的7组数据中随机选4组,设表示“达标”的数据组数,求的分布列和数学期望.
参考公式:在线性回归方程中,,.
参考数据:,.
33.(24-25高二下·湖南衡阳·期末)某学校校庆时统计连续5天进入学校参加活动的校友数(单位:千人)如下:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
第x天
1
2
3
4
5
参观人数y
2.2
2.6
3.1
5.2
6.9
(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明(保留小数点后两位);(若,则认为y与x的线性相关性很强),并求出y关于x的线性回归方程;
(2)校庆期间学校开放1号门、2号门和3号门供校友出入,校友从1号门、2号门和3号门进入学校的概率分别为、、,且出学校与进学校选择相同门的概率为,选择与人校不同两门的概率各为.假设校友从1号门、2号门、3号门出入学校互不影响,现有甲、乙、丙、丁4名校友于10月1日回母校参加活动,设X为4人中从2号门出学校的人数,求X的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
34.(24-25高二下·新疆喀什·期末)随着科技的进步,近年来,我国新能源汽车产业迅速发展,2006年,在国家节能减排的宏观政策指导下,科技部在“十一五”启动了“863”计划新能源汽车重大项目.自2011年起,国家相关部门重点扶持新能源汽车的发展,也逐步得到消费者的认可.各大品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升,小张同学对某品牌新能源汽车近8年出售的数量及广告费投入情况进行了统计,具体数据见下表:
年份代码
1
2
3
4
5
6
7
8
年销售量/十万辆
3
4
5
6
7
9
10
12
广告费投入/亿元
3.6
4.1
4.4
5.2
6.2
7.5
7.9
9.1
(1)求广告费投入y(亿元)与年销售量x(十万辆)之间的线性回归方程(精确到0.01);
(2)若某人随机在甲、乙两家汽车店购买一辆汽车,如果在甲汽车店购买,那么购买新能源汽车的概率为0.6;如果在乙汽车店购买,那么购买新能源汽车的概率为0.8,求这个人购买的是新能源汽车的概率.
参考数据:
附:回归直线中.
35.(2025·四川乐山·三模)电影《哪吒2》上映以来引起了全社会甚至全世界的关注,全球票房突破百亿.“跟着吒儿去旅游”成为热门出游方式,某景点宣传投入金额(单位:万元)与游客满意度评分(满分:100分)之间可能存在一定的关系,以下是随机抽取的6个不同线上宣传投入金额和游客满意度评分的数据:
线上宣传投入金额(万元)
20
30
40
50
60
70
游客满意度评分(分)
60
65
70
78
80
85
(1)根据表中所给数据,用相关系数加以判断,是否可用线性回归模型拟合与的关系?若可以,求出关于之间的线性回归方程;若不可以,请说明理由(精确到小数点后两位);
(2)《哪吒2》中更是蕴含着丰富的中国传统文化,某校举办中国传统文化比赛,甲、乙两人进入决赛,决赛采用“五局三胜制”,已知在每局比赛中,甲获胜的概率为,.
①若甲以获胜的概率为,求的最大值;
②在①中,若,以作为的值,设甲、乙比赛的局数为,求的分布列和期望.
参考公式:相关系数,,
参考数据:.
题型8
列联表的完善与分析
36.(24-25高三·全国·一轮复习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
37.(24-25高二下·江苏·课后作业)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
38.(2025高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
39.(24-25高二下·青海西宁·期末)第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中,___________.
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
40.(24-25高二下·全国·课堂例题)2022年9月23日,以“庆丰收同心共富,迎盛会齐向未来”为主题的第五个中国农民丰收节开幕式在盐城市射阳县海河镇举行,射阳县政府同步开展以“湿地绿城庆丰收、向海图强迎盛会”为主题的农民丰收节系列活动,现从某活动现场的观众中随机抽取名(其中男性名),了解他们对该活动的满意情况,得到下表.
不满意
满意
合计
男性
女性
合计
根据统计数据完成列联表.
题型9
独立性检验
41.(24-25高二下·内蒙古巴彦淖尔·期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据:以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
P
0.10
0.05
0.01
k
2.706
3.841
6.635
A.有90%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.01的前提下,可以认为是否是篮球迷与性别有关
42.(24-25高二下·浙江·期中)为了考查一种新疫苗预防某X疾病的效果,研究人员对一地区某种动物进行试验,从该试验群中随机进行了抽查,已知抽查的接种疫苗的动物数量是没接种疫苗的2倍,接种且发病占接种的,没接种且发病的占没接种的,若本次抽查得出“在犯错误的概率不超过0.05的前提下认为接种该疫苗与预防某X疾病有关”的结论,则被抽查的没接种动物至少有( )只
0.10
0.05
0.01
0.005
0.001
2.706
3.841
5.635
7.879
10.828
A.35 B.36 C.37 D.38
43.(24-25高三上·湖北襄阳·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论最准确的是( )
男生
女生
篮球迷
90
20
非篮球迷
60
30
附:
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.789
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.1的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
44.(2025·上海黄浦·三模)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有__________人.
0.050
0.010
0.001
3.841
6.635
10.828
参考数据及公式如下:参考公式:,其中.
45.(24-25高二下·河北·期末)某高中新开设了游泳课,为了调查学生对课程的满意度,随机抽查了150名学生,其中不喜欢与喜欢人数比为,且男生占总人数的,女生中有的人不喜欢.
性别
满意度
合计
不喜欢
喜欢
男
女
合计
(1)补全列联表;
(2)根据小概率值的独立性检验,能否认为学生对游泳课的满意度与性别有关?
附:,.
α
0.1
0.01
0.001
2.706
6.635
10.828
题型10
独立性检验与其他知识交汇
46.(24-25高二下·山东威海·期末)在科技飞速发展的今天,人工智能(AI)领域迎来革命性的突破,各种AI工具拥有强大的解决问题的能力.某企业为了解男女员工对AI工具的使用情况,随机调查了200名员工,得到如下数据:
经常使用
不经常使用
合计
男性
80
20
100
女性
60
40
100
合计
140
60
200
(1)根据小概率值的独立性检验,分析该企业员工对AI工具的使用情况是否与性别有关;
(2)为鼓励员工使用AI工具,企业采用按性别分层抽样的方式,在被调查的经常使用AI工具的员工中,抽取了7名员工组成AI工具宣传小组.现从这7名员工中随机选出3名担任宣传组长,记选出的3名宣传组长中女员工的人数为随机变量X,求X的数学期望.
参考公式:,.
参考数据:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
47.(24-25高二下·河北沧州·期末)在某次考试中,某学校要对某年级的学习总评成绩(满分100分)和体育成绩(满分100分)进行统计分析,为研究方便,现抽取出了其中各100名学生的成绩(分为优秀和一般)进行统计.
优秀
一般
合计
学习总评成绩
体育成绩
合计
(1)若统计的数据中学习总评成绩在前十名的成绩分别为99,98,98,97,96,96,96,94,94,93,求这十个成绩的平均数和第70百分位数;
(2)统计可得,学习总评成绩优秀60人,体育成绩一般30人,填写如下列联表,依据的独立性检验,能否认为学习总评成绩优秀与体育成绩优秀有关?
参考公式:,.
0.05
0.01
0.001
3.841
6.635
10.828
48.(24-25高二下·吉林长春·期末)为了研究高中学生平时的数学成缆和整理数学错题习惯的情况,某校数学建模兴趣小组的同学在本校抽取100名学生进行调查统计.数据如下:
整理数学错题习惯
数学成绩
合计
优秀
非优秀
有
20
30
50
没有
10
40
50
合计
30
70
100
(1)依据小概率值的独立性检验,是否认为数学成绩优秀与整理数学错题集习惯有关联;
(2)在调查统计有整理数学错题集习惯的50名学生中,采用比例分配的分层随机抽样的方法选取5人组建研讨小组,再从5人研讨小组中随机抽取3人进行访谈,用表示访谈时成绩优秀的人数,求的分布列及数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
49.(24-25高二下·辽宁大连·期末)某生产线上有甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,随机抽取两台机床生产的产品,共抽取100件.产品的质量情况统计如下表:
一级品
二级品
总计
甲机床
30
乙机床
10
总计
75
100
(1)根据已知条件完成列联表,并判断能否有的把握认为甲机床的产品质量与乙机床的产品质量有差异?
(2)将上述抽样所得的频率视为概率.现从生产线上采取随机抽样的方法,每次抽取一件产品.
①若抽取3次,记抽取的3件产品中二级品件数为,求随机变量的分布列,期望及方差;
②若抽取100次,记抽取的100件产品中一级品件数为,当最大时,求的值.
附:
.
0.05
0.01
0.005
3.841
6.635
7.879
50.(2025高二·全国·专题练习)某电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.
将日均收看该体育节目时间不低于40分的观众称为“体育迷”.
(1)根据已知条件完成下面的列联表,并据此资料判断是否有95%的把握认为“体育迷”与性别有关.
项目
非“体育迷”
体育迷
合计
男
女
10
55
合计
(2)将上述调查所得到的频率视为概率,现在从该地区大量电视观众中,采用随机抽样的方法,每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望和方差.
附:,其中.
0.05
0.010
3.841
6.635
第 1 页 共 31 页
学科网(北京)股份有限公司
$