内容正文:
第9章 统计全章十一大基础题型归纳(举一反三讲义·基础篇)
【苏教版】
题型1
相关关系与函数关系的概念及辨析
1.(25-26高二下·全国·课后作业)下面变量之间是相关关系的是( )
A.出租车费与行驶的里程
B.正方形面积与边长
C.人的身高与体重
D.铁的体积与质量
【答案】C
【解题思路】根据相关关系的概念逐项判断即可.
【解答过程】由相关关系可知C选项是相关关系,ABD选项都是函数关系.
故选:C.
2.(24-25高二·全国·课后作业)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
【答案】D
【解题思路】根据相关关系的定义、函数关系的定义即可判断.
【解答过程】A,B均为函数关系,故A、B错误;C,D为相关关系,故C错,D对.
故选:D.
3.(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
【答案】A
【解题思路】根据相关关系的定义可得.
【解答过程】选项B,C,D中的两个变量都具有相关性,且都是一种不确定的关系,是相关关系.
而A中判别式和变量是一种确定的表达式,是一种函数关系,即一种确定的关系,所以不是相关关系.
故选:A.
4.(25-26高二下·全国·课堂例题)下列关系中,属于相关关系的是__________.(填序号)
①扇形的半径与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系.
【答案】②④
【解题思路】利用相关关系的定义求解.
【解答过程】在①中,扇形的半径与面积之间的关系是函数关系;
在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;
③为确定的函数关系;
在④中,降雪量与交通事故的发生率之间具有相关关系.
故答案为:②④.
5.(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
【答案】(1)函数关系
(2)相关关系
(3)相关关系
(4)函数关系
(5)相关关系
(6)相关关系
【解题思路】根据相关关系的定义、函数关系的定义,逐项判断即可.
【解答过程】(1)因为,所以圆的面积与半径之间的关系为函数关系;
(2)因为体重除了与身高有关系,还和性别、遗传等因素有关系,
所以16岁学生的体重与身高之间的关系为相关关系;
(3)因为销售量除了与销售价格有关系,还和是否打广告等方面有关系,
所以商品销售量与销售价格之间的关系为相关关系;
(4)设匀速运动的物体的速度为,
所以运动的路程与时间之间的关系为,
因此匀速运动的物体,其运动的路程与时间之间的关系为函数关系;
(5)因为学习成绩除了与平均学习时间有关系外,还与学习方法等因素有关系,
所以平均学习时间与学习成绩之间的关系为相关关系;
(6)因为科技创新能力除了与人才培养近亲繁殖率有关系,还有教育等因素有关系,
所以科技创新能力与人才培养近亲繁殖率之间的关系为相关关系.
题型2
判断正、负相关
1.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
【答案】B
【解题思路】根据散点图点的变化关系确定正负相关性即可.
【解答过程】由变量,的散点图,知随增大,也增大,变量与正相关,
由变量,的散点图,知随增大,减小,与负相关.
故选:B.
2.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【答案】B
【解题思路】由正、负相关的概念即可判断.
【解答过程】由题中数据可知,y随x的增大而增大,且不成比例关系,故y与x正相关.
故选:B.
3.(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
【答案】B
【解题思路】由正、负相关的概念逐项判断即可.
【解答过程】从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则这两个变量为负相关.
结合散点图可知,①②满足题意,即两个变量呈负相关的个数为2个.
故选:B.
4.(24-25高二·全国·课后作业)有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是__________.
【答案】②
【解题思路】结合已知条件,利用相关关系和函数关系的概念以及二者之间的区别即可求解.
【解答过程】对于①,汽车重量和汽车每小号1升汽油所行驶的平均路程是负相关的关系,故①错误;
对于②,平均日学习时间和平均学习成绩的关系是一个正相关关系,故②正确;
对于③,立方体的棱长和体积是函数关系,不是相关关系,故③错误.
故答案为:②.
5.(24-25高二下·江苏·课后作业)某种木材体积与树木的树龄之间有如下的对应关系:
树龄
2
3
4
5
6
7
8
体积
30
34
40
60
55
62
70
(1)请作出这些数据的散点图;
(2)你能由散点图发现木材体积与树木的树龄近似成什么关系吗?
【答案】(1)答案见解析
(2)木材的体积与树龄线性近似成线性相关关系且呈正相关.
【解题思路】(1)根据数据画出散点图即可;
(2)根据散点图判断近似成线性相关关系且呈正相关.
【解答过程】(1)以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示:
(2)由散点图发现木材体积随着树龄的增加而呈增加的趋势,且散点落在一条直线附近,所以木材的体积与树龄线性近似成线性相关关系且呈正相关.
题型3
样本相关系数的意义及辨析
1.(24-25高一下·河南周口·期末)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【解题思路】由相关系数的意义结合散点图即可求解.
【解答过程】由图可知都是正线性相关关系,都是负线性相关关系,且相关性更强,
所以.
故选:A.
2.(24-25高二下·天津南开·期中)下面是不同成对数据的散点图,从左到右对应的样本相关系数是r1,r2,r3,r4,其中最小的是( )
A. B.
C. D.
【答案】D
【解题思路】根据散点图变化趋势判断样本相关系数的正负,再由散点图的集中程度大小,即可判断.
【解答过程】由散点图变化趋势可知:且D的散点图更集中,接近于一条直线,所以相对于更趋近于,所以.
故选:D.
3.(24-25高二下·江西·月考)对两组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】D
【解题思路】根据散点图及相关系数的概念判断即可.
【解答过程】由散点图可知,图(1)中两个变量成正相关,且散点图近似在一条直线上,所以且;
图(2)中两个变量成负相关,且散点图比较分散,所以且;
所以.
故选:D.
4.(24-25高二下·天津河北·期末)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是( )
A. B.
C. D.
【答案】D
【解题思路】由相关系数的意义结合散点图即可求解.
【解答过程】由图知,都是正相关关系,都是负相关关系,
从散点密集程度看,相关性分别较更强,
所以.
故选:D.
5.(25-26高二下·全国·单元测试)若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.93,0.42,,则线性相关程度最强的一组是_________.(填甲、乙、丙中的一个)
【答案】丙
【解题思路】利用相关系数与线性相关程度的关系可得答案.
【解答过程】两个变量与的回归模型中,
它们的相关系数越接近于1,这个模型的两个变量线性相关程度就越强,
在甲、乙、丙中,所给的数值中的绝对值最接近1,
所以丙的线性相关程度最强.
故答案为:丙.
题型4
根据回归方程进行数据估计
1.(24-25高二下·辽宁沈阳·期中)某人工智能公司从某年起7年的利润情况如下表所示,关于的回归直线方程是,预测该人工智能公司第8年的利润是多少亿元( )
第年
1
2
3
4
5
6
7
利润/亿元
2.9
3.3
3.6
4.4
4.8
5.2
5.9
A.6.2 B.6.3 C.6.4 D.6.5
【答案】B
【解题思路】根据已知条件,求得,,再结合线性回归方程一定经过样本中心点,可求得,进而得到关于的回归直线方程,将代入即可.
【解答过程】由题意,,,
所以,
所以关于的回归直线方程为,
当时,.
故选:B.
2.(25-26高二上·江西九江·期末)具有相关关系的变量与的一组样本数据如下,若已求得线性回归方程为,则下列选项错误的是( )
1
2
3
4
5
16
12
11
10
6
A.
B.与具有负相关关系
C.当时,的预测值为0
D.去掉其中某对样本数据,与的样本相关系数可能不变
【答案】C
【解题思路】由表格数据求出样本点的中心坐标,代入计算可判断A;由正负可判断B;代入计算可判断C;根据样本点的性质可判断D.
【解答过程】对于A,根据表中数据计算可得,,
代入线性回归方程得,得,故A正确;
对于B,因为,所以与具有负相关关系,故B正确;
对于C,当时,,故C错误;
对于D,样本点为样本中心点,去掉这个样本点,与的样本相关系数不变,故D正确.
故选:C.
3.(24-25高二下·浙江绍兴·期中)已知某一家旗舰店近五年“五一”黄金周期间的成交额如下表:
年份
2020
2021
2022
2023
2024
年份代号
1
2
3
4
5
成交额(万元)
50
60
70
80
100
若关于的线性回归方程为,则根据回归方程预测该店2025年“五一”黄金周的成交额是( )
A.84万元 B.96万元 C.108万元 D.120万元
【答案】C
【解题思路】求出,,根据回归直线方程必过样本中心点求出,即可求出回归直线方程,再代入计算可得.
【解答过程】依题意,,
又线性回归方程为必过点,
所以,解得,所以,
2025年的年份代号为,所以当时,,
所以根据回归方程预测该店2025年“五一”黄金周的成交额是108万元.
故选:C.
4.(24-25高二下·新疆乌鲁木齐·期末)某饮料店的日盈利(单位:百元)与当天平均气温(单位:℃)之间有如下数据:
x/℃
0
1
2
y/百元
5
4
2
2
1
由表中数据可得回归方程中.试预测当天平均气温为℃时,饮料店的日盈利约为_________百元.
【答案】
【解题思路】求出样本中心点,代入得到值,再令即得.
【解答过程】由已知数据
因为,则,代入,则,
则,
令,则.
故答案为:.
5.(24-25高二下·江西·期末)某饮品店统计了一天营业时间(单位:小时)与饮品销量(单位:杯)的数据如下表:
营业时间
1
2
3
4
5
饮品销量
17
36
56
77
99
已知与线性相关.
(1)根据以上数据求饮品销量关于营业时间的回归直线方程;
(2)若平均一杯饮品的纯利润为5元,某日该饮品店计划早上9点开始营业,晚上9点结束营业,中间不休息,试预测当日饮品的总利润能否超过1000元?
参考公式:回归直线方程中,,.
【答案】(1)
(2)能,理由见详解
【解题思路】(1)根据回归方程相关参数的计算公式计算即可;
(2)根据(1)中的回归方程,先估计销量即可判断总利润是否超过1000元.
【解答过程】(1)根据题意,,
,,
,
,
所以回归直线方程为.
(2)由(1)知,回归方程为,
早上9点开始营业,晚上9点结束营业,共营业12小时,
所以估计共销售杯,盈利元,
所以试预测当日饮品的总利润能超过1000元.
题型5
残差的计算
1.(24-25高二下·福建泉州·期末)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个样本点和后,得到新的回归直线的斜率为3.则在新的经验回归方程下,样本的残差为( )
A. B. C.0.1 D.0.2
【答案】B
【解题思路】利用线性回归方程必过样本中心点这个性质来求解,结合残差为实际值减去预测值,即可作出判断.
【解答过程】由回归直线方程为必过点,所以,
由于去掉两个样本点和后,
得到新的样本数据的平均数为:
因为新的回归直线的斜率为3,根据必过点,
可得回归直线方程为:,即,
当时,,
在新的经验回归方程下,样本的残差为,
故选:B.
2.(24-25高二下·福建泉州·月考)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了次试验,收集数据如下表所示.
零件数个
加工时间
由上表数据求得关于的经验回归方程为,据此计算出样本点处的残差为( )
A. B. C. D.
【答案】D
【解题思路】利用回归方程过样本点,可求参数,然后再根残差概念即可求解.
【解答过程】由表格中数据可求得:,
,
根据关于的经验回归方程必过点得:
,故经验回归方程为,
当时,预报值,
所以在样本点处的残差为,
故选:D.
3.(24-25高二下·山东潍坊·月考)已知变量线性相关,其一组样本数据,满足,用最小二乘法得到的经验回归方程为.若增加一个数据后,得到修正后的回归直线的斜率为2.1,则数据的残差为( )
A.0.1 B.0.2 C.-0.2 D.-0.1
【答案】D
【解题思路】由回归直线结合,可得,据此可得新增数据后的回归直线中心点,由此可得新的回归直线方程,然后由残差定义可得答案.
【解答过程】因,则,则.
则新增数据后,,,
因新的回归直线过点,且修正后的回归直线的斜率为2.1,
则,则修正后的回归直线为:.
则的估计值为,则数据的残差为.
故选:D.
4.(2025·江西新余·模拟预测)某无人机的研发费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如表所示:
研发费用x
3.4
4.7
5
5.6
6.3
销售量y
15
16.9
19.2
18
20.9
根据表中数据可得经验回归方程为,则第三个样本点对应的残差为________.
【答案】1.2
【解题思路】由表格中的数据,根据平均数求得样本中心,代入回归方程可得参数的值,代入第三个样本点的值,集合残差的定义,可得答案.
【解答过程】由已知,得,,
所以,于是,
当时,,
因此,第三个样本点对应的残差为.
故答案为:.
5.(24-25高二下·重庆·期末)近年来,中国的新能源汽车产业展现出迅猛的发展势头,已然跃升为全球最大的新能源汽车市场.该产业涵盖了电动汽车、插电式混合动力汽车以及燃料电池汽车等多种类型.在电池技术、电机和电控系统等领域,中国的新能源汽车产业取得了引人瞩目的成就.现有一汽车测评栏目为了评估某品牌纯电动汽车的实际续航能力,进行了一系列试验,并收集了相应的数据,详见下表.
速度
6
7
8
9
10
续航里程
4.4
4.2
4
3.9
3.5
(1)根据最小二乘法,计算y关于x的回归方程;
(2)根据你得到的一元线性回归模型,预测速度为时,该电动汽车的续航里程;
(3)计算5组数据的残差,并计算残差之和.
参考公式:线性回归方程中,的最小二乘法估计分别为,.
参考数据:,.
【答案】(1)
(2)
(3)残差见解析,残差和为0
【解题思路】(1)根据最小二乘法即可求解,
(2)代入回归方程中即可求解,
(3)根据残差的计算公式即可求解.
【解答过程】(1)由题意,,
,
,
故y关于x的线性回归方程为;
(2)根据(1)所求的回归方程,当时,,
所以电动汽车的续航里程为;
(3)由(1)可列表
速度
6
7
8
9
10
续航里程
4.4
4.2
4
3.9
3.5
预测值
4.42
4.21
4
3.79
3.58
残差
0
0.11
残差之和为.
题型6
刻画回归效果的方式
1.(24-25高二下·安徽蚌埠·期末)在线性回归模型中,能说明模型的拟合效果越好的是( )
A.残差图带状区域越宽 B.残差和越小
C.决定系数越大 D.相关系数r越大
【答案】C
【解题思路】根据各个变量的意义作出判断,得到答案.
【解答过程】A选项,残差图带状区域越宽,说明误差大,模型的拟合效果越差,A错误;
B选项,残差平方和越小,模型的拟合效果越好,B错误;
C选项,决定系数越大,模型的拟合效果越好,C正确;
D选项,相关系数越大,说明两个变量线性相关性越强,与模型的拟合效果无关,D错误.
故选:C.
2.(24-25高二上·黑龙江哈尔滨·期末)某水文站为了研究所在河段降雨量(单位:)与水位增长量(单位:)之间的关系,记录了9次相关数据,绘制出如下散点图,并利用线性回归模型进行拟合. 若将图中9个点中去掉点后再重新进行线性回归分析,则下列说法正确的是( )
A.决定系数变小 B.相关系数的值变小
C.残差平方和变小 D.解释变量与预报变量相关性变弱
【答案】C
【解题思路】结合题意,由决定系数、相关系数、残差平方和及相关性的概念和性质作出判断.
【解答过程】从图中可以看出点较其他点,偏离直线远,故去掉点后,回归效果更好,
对于A:决定系数越接近1,拟合的回归方程越优,
故去掉点后变大,越趋于1,故A错误;
对于B:相关系数越趋于1,拟合的回归方程越优,
由图可得与正相关,故会越接近1,即相关系数的值变大,故B错误;
对于C:残差平方和变小,拟合效果越好,故C正确;
对于D:解释变量与预报变量相关性增强,故D错误.
故选:C.
3.(24-25高二下·广西·期末)下列说法中正确的有( )
①线性回归方程至少经过一个样本点;
②可以用相关系数r刻画两个变量的相关程度强弱,r值越大则两个变量的相关程度越强;
③在回归分析中,决定系数的模型比的模型拟合效果要好;
④残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高.
A.1个 B.2个 C.3个 D.4个
【答案】B
【解题思路】根据线性回归方程和相关系数及残差分析即可判断正误.
【解答过程】线性回归方程可以不经过任何一个样本点,①错,
值越大则两个变量的相关程度越强,②错,
决定系数越大,模型拟合效果越好,③对,
残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高,④对.
故选:B.
4.(2025高三·全国·专题练习)某公司收集了某商品销售收入(单位:万元)与相应的广告支出(单位:万元)共10组数据,绘制出散点图,如图,并利用线性回归模型进行拟合.若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法错误的是___________.
①决定系数变小
②残差平方和变小
③相关系数的值变小
④自变量与因变量相关性变弱
【答案】①③④
【解题思路】回归效果越好,则决定系数越大,相关系数的绝对值越大,残差平方和越小.
【解答过程】从图中可以看出点较其他点,偏离直线远,故去掉点后,回归效果更好,
故决定系数会变大,更接近于1;残差平方和变小;
相关系数的绝对值,即会更接近于1,由图可得与正相关,故会更接近于1,即相关系数的值变大,自变量与因变量相关性变强,故①,③,④错误,②正确.
故答案为:①③④.
5.(2025·湖南·三模)中国的非遗项目丰富多样,涵盖广泛,体现了中华民族的智慧和独特的文化魅力.春节期间某地为充分宣扬该地非遗物质文化,加大非遗传承人的技艺展示.该地市场开发与发展机构统计了非遗传承人的技艺展示量与市场消费收入的6组数据如下表:
技艺展示量x(单位:个)
21
23
24
27
29
32
市场消费收入y(单位:万元)
6
11
20
27
57
77
(1)若用线性回归理论进行统计分析,求市场消费收入y关于技艺展示量x的回归方程(精确到0.1);
(2)若用非线性回归模型求得市场消费收入y关于技艺展示量x的回归方程为,且决定系数,与(1)中的线性回归模型相比,应用决定系数说明哪种模型的拟合效果更好.
附:一组数据,,…,,其回归直线的斜率和截距的最小二乘估计为,;决定系数
参考数据:,,,
线性回归模型的残差平方和为(其中,分别为非遗传承人的技艺展示量和市场消费收入,).
【答案】(1)
(2)用非线性回归模型拟合效果更好
【解题思路】(1)首先算出,,然后算出即可;
(2)算出线性回归模型的决定系数,然后与非线性回归模型的决定系数比较即可作出判断.
【解答过程】(1)由题意,则,
,
,,
y关于x的线性回归方程为.
(2)对于线性回归模型,,,
决定系数为,
因为,所以用非线性回归模型拟合效果更好.
题型7
求回归直线方程
1.(24-25高二下·江西赣州·期中)已知变量x和y的统计数据如下表:
x
2
4
5
6
8
y
30
40
60
50
70
若x和y线性相关,则y关于x的线性回归方程为( )
(附:线性回归方程,中斜率和截距的最小二乘估计公式分别为,
A. B.
C. D.
【答案】D
【解题思路】根据已知数据求,代入回归直线方程即可求解.
【解答过程】由题意得.
,,
所以,
故线性回归方程为.
故选:D.
2.(24-25高二下·甘肃临夏·期末)某学校一同学研究温差与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据:
x
5
6
8
9
12
y
17
a
25
28
35
已知数据的样本中心点为,经过拟合,发现基本符合回归直线方程,则下列结论错误的是( )
A. B.
C. D.时,
【答案】C
【解题思路】根据回归直线过样本中心点即可依次求出、回归方程和估计值.
【解答过程】由题,
所以,所以回归直线方程,
所以当时,.
故ABD正确,C错误.
故选:C.
3.(24-25高二下·全国·课后作业)为预测某种产品的回收率,需要研究它和原料有效成分含量之间的相关关系,若已知与之间存在线性相关关系,现取了8组观察值,计算知,,,,则关于的经验回归方程是( )
A. B.
C. D.
【答案】A
【解题思路】根据公式可求得结果.
【解答过程】由题可得,,
由,
,
所以所求经验回归方程为.
故选:A.
4.(24-25高二下·福建厦门·期中)已知变量和的统计数据如下表:
2
4
5
6
8
30
40
60
50
70
若和线性相关,则关于的经验回归方程为____________.
(附:经验回归直线方程中斜率和截距的最小二乘估计公式分别为)
【答案】
【解题思路】根据条件,利用回归直线方程系数的计算公式,直接求出、,即可求解.
【解答过程】由题意得,,
因为,,
所以,,
故回归直线方程为.
故答案为:.
5.(24-25高二下·四川雅安·期末)某超市为销售一种商品,派人统计了去年该商品的每日广告费用(百元)与当日销售量(百件)的关系,以便对今年广告方案的制定提供相关的数据参考,得到的数据如下:
日广告费用(百元)
2
3
4
5
6
日销售量(百件)
1.5
1.7
2.0
2.2
2.6
已知与线性相关.
(1)根据表中的数据,求关于的经验回归方程;
(2)利用(1)中的经验回归方程,估计当日广告费用为1000元时,日销售量为多少件?
附:参考公式:经验回归方程斜率和截距的最小二乘估计公式分别为:,
【答案】(1)
(2)件
【解题思路】(1)由统计表格中的数据,利用回归系数的公式,求得和,即可得到回归方程;
(2)由(1)知,当时,求得(百件),即可得到结论.
【解答过程】(1)解:由统计表格中的数据,可得,,
且,,
可得,则,
所以关于的经验回归方程是.
(2)解:由(1)知回归方程是,
当时,(百件),所以估计当日广告费用为元时,日销售量为件.
题型8
列联表的完善与分析
1.(24-25高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
【答案】B
【解题思路】由列联表数据,列出等式即可求解;
【解答过程】由,得.
由,得.
由,得.
由,得.
故选:B.
2.(2025高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
【答案】D
【解题思路】已知抽取的老年人、年轻人各有25名,计算各个变量的值,进而得到答案.
【解答过程】因为,,
,,,,
所以,,,,.
故选:D.
3.(24-25高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】B
【解题思路】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.
【解答过程】对于A,,
对于B,,
对于C,,
对于D,,
显然B中最大,该组数据能说明x与y有关系的可能性最大,
故选:B.
4.(24-25高二下·广西钦州·期末)如下是一个列联表,则________.
yx
总计
总计
【答案】
【解题思路】根据列联表的概念,可得答案.
【解答过程】由题意可得,则,可得,所以.
故答案为:.
5.(24-25高二下·全国·课前预习)某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病.根据这些数据能否断定:患呼吸道疾病与吸烟有关?
【答案】可以认为患呼吸道疾病与吸烟有关.
【解题思路】根据题意列出列联表,再算出在吸烟中和不吸烟中患病的频率,通过比较之间是否存在差异即可判断是否有关.
【解答过程】为了研究这个问题,我们将上述数据用表格表示如下:
患病
未患病
合计
吸烟
37
183
220
不吸烟
21
274
295
合计
58
457
515
由此表可以粗略地估计出在吸烟的人中,有的人患病;
在不吸烟的人中,有的人患病.
因此,从直观上可以得到结论:吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,
故可以认为患呼吸道疾病与吸烟有关.
题型9
等高条形图及其应用
1.(24-25高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
【答案】A
【解题思路】分析等高堆积条形图可直接得到答案.
【解答过程】原图是学校高二1、2班本期中期考试数学成绩优秀率的等高堆积条形图,
从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,BC错误;
两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误;
故选:A.
2.(24-25高二下·河北张家口·月考)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
【答案】B
【解题思路】根据题意,由等高条形图的意义分析可得答案.
【解答过程】根据题意,在等高的条形图中,当,所占比例相差越大时,越有把握认为两个分类变量,之间有关系,
由选项可得:B选项中,,所占比例相差无几,所以最有把握认为两个分类变量,之间没有关系,
故选:B.
3.(24-25高三·北京·一轮复习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
【答案】C
【解题思路】通过对等高堆积条形图的分析,结合所列列联表及不等式性质,逐一对每个选项进行推理判断即可.
【解答过程】设等高条形图对应列联表如下:
岁及以上
岁以下
总计
男性
女性
总计
根据第个等高条形图可知,岁及以上男性比岁及以上女性多,即;
岁以下男性比岁以下女性多,即.
根据第个等高条形图可知,男性中岁及以上的比岁以下的多,即;
女性中岁及以上的比岁以下的多,即,
对于A,男性人数为,女性人数为,
因为,所以,所以A正确;
对于B,岁及以上女性人数为,岁以下女性人数为,
因为,所以B正确;
对于C,岁以下男性人数为,岁及以上女性人数为,
无法从图中直接判断与的大小关系,所以C不一定正确;
对于D,岁及以上的人数为,岁以下的人数为,
因为,所以,所以D正确.
故选:C.
4.(24-25高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是___________.
【答案】乙
【解题思路】根据选项中的图形,即可直接求解.
【解答过程】等高条形图中有两个高度相同的矩形,每个矩形都有两个颜色,观察下方颜色区域的高度,如果高度差越大,则两个分类变量关系越强,观察四个选项可知,B选项中带颜色区域的高度差最大,两个分类变量、相关关系最强;
故答案为:乙.
5.(24-25高二·全国·课后作业)为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
父母吸烟
父母不吸烟
总计
子女吸烟
237
83
320
子女不吸烟
678
522
1 200
总计
915
605
1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
【答案】等高条形图见详解,有影响
【解题思路】由表格中的数据画出等高条形图,根据等高条形图的定义和性质判断即可
【解答过程】等高条形图如下:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.
题型10
独立性检验的概念及辨析
1.(25-26高二上·全国·单元测试)给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
【答案】B
【解题思路】根据独立性检验是对两个分类变量是否有关进行检验,逐个分析判断即可.
【解答过程】独立性检验主要是对两个分类变量是否有关进行检验,
对于A,喜欢参加体育锻炼有喜欢和不喜欢,性别有男和女,是对两个分类变量是否进行检验,
对于B,一个未被识别的甲骨文文字一年内被识别出来,只涉及一个变量,不可以用独立性检验解决,
对于C,购买食品有看生产日期和不看生产日期,性别有男和女,是对两个分类变量是否进行检验,
对于D,看新闻时政有喜欢和不喜欢,年龄有大有小,是对两个分类变量是否进行检验.
故不可以用独立性检验解决的问题是B.
故选:B.
2.(24-25高二下·山东烟台·期中)根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
【答案】D
【解题思路】根据给定条件,利用独立性检验的意义逐项判断即得.
【解答过程】由,得吸烟与患肺癌有关联,此推断犯错误的概率不大于1%,D正确;
卡方检验仅说明吸烟与患肺癌两个变量间的关联性,无法量化个体情况,这两个变量间也无因果关系,ABC错误.
故选:D.
3.(24-25高二下·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
【答案】A
【解题思路】根据卡方独立性检验规则,比较与临界值即可得出结论.
【解答过程】因为,所以牛的毛色与角无关.
故选:A.
4.(24-25高二下·全国·课后作业)在饮酒与患肝脏病是否有关的研究中,关于饮酒与患肝脏病这两个分类变量的计算中,下列说法正确的序号是__________.
①若的临界值是2.706,我们有的把握认为饮酒与患肝脏病有关系,那么在1000个饮酒的人中,必有900人患肝脏病;
②从独立性的检验可知有的把握认为饮酒与患肝脏病有关系时,则若某人饮酒,那么他有的可能患有肝脏病;
③若从统计量中求出有的把握认为饮酒与患肝脏病有关系,是指有的可能性使得推断错误.
【答案】③
【解题思路】根据题意,结合独立性检验的含义,逐项判定,即可求解.
【解答过程】①若的临界值,我们有的把握认为饮酒与患肝脏病有关系,
但在1000个饮酒的人中未必有900人患有肝脏病,所以①错误;
②从独立性检验可以知道99%的把握认为饮酒与患肝脏病有关系时,
是指饮酒与患肝脏病有关系的概率,而不是饮酒的人有99%的可能性有肝脏病,所以②错误:
③若从统计量中求出有99.5%的把握认为饮酒与患肝脏病有关系,
则有0.5%的可能性使得推断错误,所以③正确.
故答案为:③.
5.(24-25高二下·全国·课后作业)在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是__________(填序号).
①若,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;
③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.
【答案】③
【解题思路】由独立性检验相关概念可得答案.
【解答过程】的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.
故答案为:③.
题型11
卡方的计算
1.(24-25高二下·贵州安顺·期末)某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20,则下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.根据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
【答案】B
【解题思路】求得卡方值,比对临界值,逐个判断即可.
【解答过程】由题意,列出列联表:
接受
不接受
合计
男
40
60
100
女
20
80
100
合计
60
140
200
零假设为:是否接受去外地长时间出差与性别相互独立,即是否接受去外地长时间出差与性别无关,
所以,
根据小概率值的独立性检验,我们推断不成立,
即认为是否接受去外地长时间出差与性别有关,此推断犯错误的概率不大于0.005.
故选:B.
2.(24-25高二下·湖北武汉·期末)某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下列联表:
去年体检人数
去年未体检人数
合计
高中教师
70
m
100
初中教师
n
20
100
合计
e
f
d
根据列联表可求得( )
(附:,)
A. B. C. D.
【答案】C
【解题思路】根据表中数据完成列联表,再代入公式可得答案.
【解答过程】列联表:
去年体检人数
去年未体检人数
合计
高中教师
70
30
100
初中教师
80
20
100
合计
150
50
200
.
故选:C.
3.(24-25高二下·山东·月考)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的3倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有95%的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为( )
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
2.706
3.841
5.024
6.635
A.12 B.34 C.36 D.48
【答案】C
【解题思路】设男生人数为,则女生人数为,且,写出列联表并根据卡方计算公式,结合题意确定卡方值的范围,即可确定的取值范围,进而确定男生可能人数.
【解答过程】设男生人数为,则女生人数为,且,
可得列联表如下:
男生
女生
合计
喜欢滑冰
不喜欢滑冰
合计
则,
由有的把握认为是否喜欢滑冰和性别有关,得,解得,
由可得,所以参与调查的男生人数为.
故选:C.
4.(24-25高二下·河南南阳·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有__________人.
附:
0.100
0.050
0.010
2.706
3.841
6.635
【答案】(答案不唯一)
【解题思路】设被调查的男女生为人,写出列联表,应用卡方公式求卡方值,结合求参数范围,进而确定被调查的男生为,即可答案.
【解答过程】由题意,设被调查的男女生为人,则男生喜欢抖音有人,女生喜欢抖音有人,
所以列联表如下:
喜欢抖音
不喜欢抖音
总计
男生
女生
总计
所以,则,
所以被调查的男生为,
又,则人数是5的整数倍,
所以大于等于45的5的整数倍都符合题意,即可能有人.
故答案为:(答案不唯一).
5.(25-26高三上·湖北黄冈·月考)为了考察某种药物A对预防疾病B的效果,进行了200次动物试验,得到如下列联表:
药物A
疾病B
合计
患病
未患病
服用
100
未服用
40
60
100
合计
200
在服用药物A的动物中,患病的频率为0.2.
(1)求x,y;
(2)依据小概率值的独立性检验,是否认为服用药物A对预防疾病B有效?
附:,.
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
【答案】(1),;
(2)能认为服用药物A对预防疾病B有效.
【解题思路】(1)根据频率得到方程,求出,进而求出;
(2)零假设,计算出卡方,与6.635比较后得到结论.
【解答过程】(1)服用药物A的动物中,患病的频率为0.2,
故,解得,
故;
(2)能认为服用药物A对预防疾病B有效.理由如下:
零假设:药物A对预防疾病B无效,
由列联表可得,
根据小概率值的独立性检验,推断不成立,
即认为药物A对预防疾病B有效,该推断犯错误的概率不超过,
依据小概率值的独立性检验,能认为服用药物A对预防疾病B有效.
2 / 30
学科网(北京)股份有限公司
$
第9章 统计全章十一大基础题型归纳(举一反三讲义·基础篇)
【苏教版】
题型1
相关关系与函数关系的概念及辨析
1.(25-26高二下·全国·课后作业)下面变量之间是相关关系的是( )
A.出租车费与行驶的里程
B.正方形面积与边长
C.人的身高与体重
D.铁的体积与质量
2.(24-25高二·全国·课后作业)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
3.(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
4.(25-26高二下·全国·课堂例题)下列关系中,属于相关关系的是__________.(填序号)
①扇形的半径与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系.
5.(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
题型2
判断正、负相关
1.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
2.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
3.(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
4.(24-25高二·全国·课后作业)有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是__________.
5.(24-25高二下·江苏·课后作业)某种木材体积与树木的树龄之间有如下的对应关系:
树龄
2
3
4
5
6
7
8
体积
30
34
40
60
55
62
70
(1)请作出这些数据的散点图;
(2)你能由散点图发现木材体积与树木的树龄近似成什么关系吗?
题型3
样本相关系数的意义及辨析
1.(24-25高一下·河南周口·期末)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
2.(24-25高二下·天津南开·期中)下面是不同成对数据的散点图,从左到右对应的样本相关系数是r1,r2,r3,r4,其中最小的是( )
A. B.
C. D.
3.(24-25高二下·江西·月考)对两组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
4.(24-25高二下·天津河北·期末)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是( )
A. B.
C. D.
5.(25-26高二下·全国·单元测试)若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.93,0.42,,则线性相关程度最强的一组是_________.(填甲、乙、丙中的一个)
题型4
根据回归方程进行数据估计
1.(24-25高二下·辽宁沈阳·期中)某人工智能公司从某年起7年的利润情况如下表所示,关于的回归直线方程是,预测该人工智能公司第8年的利润是多少亿元( )
第年
1
2
3
4
5
6
7
利润/亿元
2.9
3.3
3.6
4.4
4.8
5.2
5.9
A.6.2 B.6.3 C.6.4 D.6.5
2.(25-26高二上·江西九江·期末)具有相关关系的变量与的一组样本数据如下,若已求得线性回归方程为,则下列选项错误的是( )
1
2
3
4
5
16
12
11
10
6
A.
B.与具有负相关关系
C.当时,的预测值为0
D.去掉其中某对样本数据,与的样本相关系数可能不变
3.(24-25高二下·浙江绍兴·期中)已知某一家旗舰店近五年“五一”黄金周期间的成交额如下表:
年份
2020
2021
2022
2023
2024
年份代号
1
2
3
4
5
成交额(万元)
50
60
70
80
100
若关于的线性回归方程为,则根据回归方程预测该店2025年“五一”黄金周的成交额是( )
A.84万元 B.96万元 C.108万元 D.120万元
4.(24-25高二下·新疆乌鲁木齐·期末)某饮料店的日盈利(单位:百元)与当天平均气温(单位:℃)之间有如下数据:
x/℃
0
1
2
y/百元
5
4
2
2
1
由表中数据可得回归方程中.试预测当天平均气温为℃时,饮料店的日盈利约为_________百元.
5.(24-25高二下·江西·期末)某饮品店统计了一天营业时间(单位:小时)与饮品销量(单位:杯)的数据如下表:
营业时间
1
2
3
4
5
饮品销量
17
36
56
77
99
已知与线性相关.
(1)根据以上数据求饮品销量关于营业时间的回归直线方程;
(2)若平均一杯饮品的纯利润为5元,某日该饮品店计划早上9点开始营业,晚上9点结束营业,中间不休息,试预测当日饮品的总利润能否超过1000元?
参考公式:回归直线方程中,,.
题型5
残差的计算
1.(24-25高二下·福建泉州·期末)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个样本点和后,得到新的回归直线的斜率为3.则在新的经验回归方程下,样本的残差为( )
A. B. C.0.1 D.0.2
2.(24-25高二下·福建泉州·月考)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了次试验,收集数据如下表所示.
零件数个
加工时间
由上表数据求得关于的经验回归方程为,据此计算出样本点处的残差为( )
A. B. C. D.
3.(24-25高二下·山东潍坊·月考)已知变量线性相关,其一组样本数据,满足,用最小二乘法得到的经验回归方程为.若增加一个数据后,得到修正后的回归直线的斜率为2.1,则数据的残差为( )
A.0.1 B.0.2 C.-0.2 D.-0.1
4.(2025·江西新余·模拟预测)某无人机的研发费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如表所示:
研发费用x
3.4
4.7
5
5.6
6.3
销售量y
15
16.9
19.2
18
20.9
根据表中数据可得经验回归方程为,则第三个样本点对应的残差为________.
5.(24-25高二下·重庆·期末)近年来,中国的新能源汽车产业展现出迅猛的发展势头,已然跃升为全球最大的新能源汽车市场.该产业涵盖了电动汽车、插电式混合动力汽车以及燃料电池汽车等多种类型.在电池技术、电机和电控系统等领域,中国的新能源汽车产业取得了引人瞩目的成就.现有一汽车测评栏目为了评估某品牌纯电动汽车的实际续航能力,进行了一系列试验,并收集了相应的数据,详见下表.
速度
6
7
8
9
10
续航里程
4.4
4.2
4
3.9
3.5
(1)根据最小二乘法,计算y关于x的回归方程;
(2)根据你得到的一元线性回归模型,预测速度为时,该电动汽车的续航里程;
(3)计算5组数据的残差,并计算残差之和.
参考公式:线性回归方程中,的最小二乘法估计分别为,.
参考数据:,.
题型6
刻画回归效果的方式
1.(24-25高二下·安徽蚌埠·期末)在线性回归模型中,能说明模型的拟合效果越好的是( )
A.残差图带状区域越宽 B.残差和越小
C.决定系数越大 D.相关系数r越大
2.(24-25高二上·黑龙江哈尔滨·期末)某水文站为了研究所在河段降雨量(单位:)与水位增长量(单位:)之间的关系,记录了9次相关数据,绘制出如下散点图,并利用线性回归模型进行拟合. 若将图中9个点中去掉点后再重新进行线性回归分析,则下列说法正确的是( )
A.决定系数变小 B.相关系数的值变小
C.残差平方和变小 D.解释变量与预报变量相关性变弱
3.(24-25高二下·广西·期末)下列说法中正确的有( )
①线性回归方程至少经过一个样本点;
②可以用相关系数r刻画两个变量的相关程度强弱,r值越大则两个变量的相关程度越强;
③在回归分析中,决定系数的模型比的模型拟合效果要好;
④残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高.
A.1个 B.2个 C.3个 D.4个
4.(2025高三·全国·专题练习)某公司收集了某商品销售收入(单位:万元)与相应的广告支出(单位:万元)共10组数据,绘制出散点图,如图,并利用线性回归模型进行拟合.若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法错误的是___________.
①决定系数变小
②残差平方和变小
③相关系数的值变小
④自变量与因变量相关性变弱
5.(2025·湖南·三模)中国的非遗项目丰富多样,涵盖广泛,体现了中华民族的智慧和独特的文化魅力.春节期间某地为充分宣扬该地非遗物质文化,加大非遗传承人的技艺展示.该地市场开发与发展机构统计了非遗传承人的技艺展示量与市场消费收入的6组数据如下表:
技艺展示量x(单位:个)
21
23
24
27
29
32
市场消费收入y(单位:万元)
6
11
20
27
57
77
(1)若用线性回归理论进行统计分析,求市场消费收入y关于技艺展示量x的回归方程(精确到0.1);
(2)若用非线性回归模型求得市场消费收入y关于技艺展示量x的回归方程为,且决定系数,与(1)中的线性回归模型相比,应用决定系数说明哪种模型的拟合效果更好.
附:一组数据,,…,,其回归直线的斜率和截距的最小二乘估计为,;决定系数
参考数据:,,,
线性回归模型的残差平方和为(其中,分别为非遗传承人的技艺展示量和市场消费收入,).
题型7
求回归直线方程
1.(24-25高二下·江西赣州·期中)已知变量x和y的统计数据如下表:
x
2
4
5
6
8
y
30
40
60
50
70
若x和y线性相关,则y关于x的线性回归方程为( )
(附:线性回归方程,中斜率和截距的最小二乘估计公式分别为,
A. B.
C. D.
2.(24-25高二下·甘肃临夏·期末)某学校一同学研究温差与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据:
x
5
6
8
9
12
y
17
a
25
28
35
已知数据的样本中心点为,经过拟合,发现基本符合回归直线方程,则下列结论错误的是( )
A. B.
C. D.时,
3.(24-25高二下·全国·课后作业)为预测某种产品的回收率,需要研究它和原料有效成分含量之间的相关关系,若已知与之间存在线性相关关系,现取了8组观察值,计算知,,,,则关于的经验回归方程是( )
A. B.
C. D.
4.(24-25高二下·福建厦门·期中)已知变量和的统计数据如下表:
2
4
5
6
8
30
40
60
50
70
若和线性相关,则关于的经验回归方程为____________.
(附:经验回归直线方程中斜率和截距的最小二乘估计公式分别为)
5.(24-25高二下·四川雅安·期末)某超市为销售一种商品,派人统计了去年该商品的每日广告费用(百元)与当日销售量(百件)的关系,以便对今年广告方案的制定提供相关的数据参考,得到的数据如下:
日广告费用(百元)
2
3
4
5
6
日销售量(百件)
1.5
1.7
2.0
2.2
2.6
已知与线性相关.
(1)根据表中的数据,求关于的经验回归方程;
(2)利用(1)中的经验回归方程,估计当日广告费用为1000元时,日销售量为多少件?
附:参考公式:经验回归方程斜率和截距的最小二乘估计公式分别为:,
题型8
列联表的完善与分析
1.(24-25高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
2.(2025高二·全国·专题练习)某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
合计
老年人
7
年轻人
6
合计
50
已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是( )
A. B.
C. D.
3.(24-25高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a
b
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
4.(24-25高二下·广西钦州·期末)如下是一个列联表,则________.
yx
总计
总计
5.(24-25高二下·全国·课前预习)某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病.根据这些数据能否断定:患呼吸道疾病与吸烟有关?
题型9
等高条形图及其应用
1.(24-25高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
2.(24-25高二下·河北张家口·月考)观察下图的等高条形图,其中最有把握认为两个分类变量,之间没有关系的是( )
A. B.
C. D.
3.(24-25高三·北京·一轮复习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
4.(24-25高二下·广东深圳·期中)观察下面各等高堆积条形图,其中两个分类变量、相关关系最强的是___________.
5.(24-25高二·全国·课后作业)为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
父母吸烟
父母不吸烟
总计
子女吸烟
237
83
320
子女不吸烟
678
522
1 200
总计
915
605
1 520
利用等高条形图判断父母吸烟对子女吸烟是否有影响?
题型10
独立性检验的概念及辨析
1.(25-26高二上·全国·单元测试)给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.一个未被识别的甲骨文文字一年内被识别出来的概率
C.购买食品是否看生产日期与性别是否有关
D.喜欢看新闻时政与年龄是否有关
2.(24-25高二下·山东烟台·期中)根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
3.(24-25高二下·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
4.(24-25高二下·全国·课后作业)在饮酒与患肝脏病是否有关的研究中,关于饮酒与患肝脏病这两个分类变量的计算中,下列说法正确的序号是__________.
①若的临界值是2.706,我们有的把握认为饮酒与患肝脏病有关系,那么在1000个饮酒的人中,必有900人患肝脏病;
②从独立性的检验可知有的把握认为饮酒与患肝脏病有关系时,则若某人饮酒,那么他有的可能患有肝脏病;
③若从统计量中求出有的把握认为饮酒与患肝脏病有关系,是指有的可能性使得推断错误.
5.(24-25高二下·全国·课后作业)在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是__________(填序号).
①若,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;
③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.
题型11
卡方的计算
1.(24-25高二下·贵州安顺·期末)某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20,则下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.根据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
2.(24-25高二下·湖北武汉·期末)某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下列联表:
去年体检人数
去年未体检人数
合计
高中教师
70
m
100
初中教师
n
20
100
合计
e
f
d
根据列联表可求得( )
(附:,)
A. B. C. D.
3.(24-25高二下·山东·月考)北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的3倍,有的男生喜欢滑冰,有的女生喜欢滑冰.若根据独立性检验的方法,有95%的把握认为是否喜欢滑冰和性别有关,则参与调查的男生人数可能为( )
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
2.706
3.841
5.024
6.635
A.12 B.34 C.36 D.48
4.(24-25高二下·河南南阳·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有__________人.
附:
0.100
0.050
0.010
2.706
3.841
6.635
5.(25-26高三上·湖北黄冈·月考)为了考察某种药物A对预防疾病B的效果,进行了200次动物试验,得到如下列联表:
药物A
疾病B
合计
患病
未患病
服用
100
未服用
40
60
100
合计
200
在服用药物A的动物中,患病的频率为0.2.
(1)求x,y;
(2)依据小概率值的独立性检验,是否认为服用药物A对预防疾病B有效?
附:,.
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
2 / 30
学科网(北京)股份有限公司
$