内容正文:
重难点专题4.1 统计案例十二种题型
题型一 散点图及其应用
题型二 相关系数的计算与应用
题型三 回归直线方程及其应用
题型四 根据回归方程求原数据中的值
题型五 样本中心点与回归直线
题型六 根据样本中心点求参数
题型七 根据回归方程进行数据估计
题型八:非线性回归问题
题型九:列联表的完善与分析
题型十:卡方的计算及独立性检验的基本思想
题型十一:独立性检验与线性回归
题型十二:独立性检验与概率分布
题型一 散点图及其应用
1.(24-25高二下·天津西青·期末)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【答案】D
【知识点】判断正、负相关
【分析】由散点图的特征,结合相关系数的定义即可得到答案.
【详解】由散点图的趋势可知,,,,
又图一的散点图比图三的散点图更为集中,则,所以,
又图二的散点图比图四的散点图更为集中,则,所以,
所以.
故选:D.
2.(24-25高二下·北京东城·期末)对某种动物的三项指标,,进行调查研究.现有这种动物若干只,设每只动物的这三项指标为.若与的散点图如图1和图2所示,那么关于的散点图最合理的为( )
A. B.
C. D.
【答案】A
【知识点】根据散点图判断是否线性相关、判断正、负相关
【分析】利用排除法,分析可知指标,满足负相关,结合图象指标的范围分析判断即可.
【详解】因为指标,满足正相关,指标,满足负相关,
可知指标,满足负相关,故C错误;
且,可知BD错误;
故选:A.
3.(25-26高二下·全国·课堂例题)如图所示,有A,B,C,D,E共5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
【答案】D
【知识点】根据散点图判断是否线性相关
【分析】根据散点图中的点分布在一条直线附近时,样本数据有较强的线性相关关系进行求解.
【详解】当散点图中的点分布在一条直线附近时,样本数据有较强的线性相关关系,
应去掉D组数据剩下的4组数据的线性相关性较强.
故答案为:D.
4.(24-25高二下·全国·课后作业)观察下列散点图,有三种情况:①正相关,②负相关,③不相关.与散点图的位置相对应的序号依次是______.
【答案】①③②
【知识点】判断正、负相关
【分析】由图象分析即可得到答案.
【详解】第一个图大体趋势从左向右上升,故是正相关,
第二个图不相关,
第三个图大体趋势从左向右下降,故是负相关.
故答案为:①③②.
5.(25-26高二上·全国·课后作业)山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图;
(2)判断是否具有相关关系.
【答案】(1)散点图见详解
(2)具有相关关系
【知识点】绘制散点图、判断两个变量是否有相关关系
【分析】(1)根据已知中表中7块并排、形状大小相同的试验田上,施化肥量x和产量y所得的数据,描点后可得散点图;
(2)根据(1)中散点图中的点大致分布在一个带状区域内(一条直线附近)可得两个变量具有相关关系.
【详解】(1)根据已知表格中的数据可得施化肥量x对产量y的散点图如下所示:
(2)根据(1)中散点图可知,各组数据对应点大致分布在一个带状区域内(一条直线附近),
故施化肥量x和产量y具有线性相关关系。
题型二 相关系数的计算与应用
6.(25-26高二上·全国·单元测试)最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
【答案】A
【知识点】相关系数的计算
【分析】根据相关系数公式计算即可求解.
【详解】,,
,
.
故选:A.
7.(24-25高二下·江西抚州·期末)现调查某地区某种野生动物的数量,将该地区分成面积相近的100个地块,从这些地块中用简单随机抽样的方法抽取10个作为样本,调查得到样本数据,其中分别表示第个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,分别表示这10个样本的植物覆盖面积和这种野生动物的数量的平均值,构造向量,并计算得,由选择性必修第一册教材中的知识,我们知道对数据的相关系数,则上述数据的相关系数______.
【答案】0.96/
【知识点】相关系数的计算
【分析】计算出,故.
【详解】,故,
,
.
故答案为:0.96
8.(25-26高二下·全国·课堂例题)为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示:
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
GLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度.
参考公式:
相关系数,
参考数据:,,,,,,,.
【答案】答案见解析
【知识点】相关系数的计算
【分析】根据相关系数的计算结果来判断变量之间的相关性.
【详解】由题意,变量与的相关系数,
变量与的相关系数是,
可以看出TC指标值与BMI值,GLU指标值与BMI值都是高度正相关.
9.(25-26高二下·全国·课堂例题)关于两个变量x和y的7组数据如表所示:
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
试判断y与x是否线性相关,并刻画它们的相关程度.
【答案】答案见解析
【知识点】相关系数的计算
【分析】应用已知数据先求和及样本中心点,再计算最后与比较判断相关程度.
【详解】,
,
,
,
,
所以
.
又因为,
所以与具有很强的线性相关关系.
题型三 回归直线方程与相关性判断
10.(25-26高二下·全国·课堂例题)某学校研究性学习小组在学习生物遗传学的过程中,为验证高尔顿提出的关于儿子成年后身高(单位:)与父亲身高(单位:)之间的关系及存在的遗传规律,随机抽取了5对父子的身高数据,如下表:
父亲身高
160
170
175
185
190
儿子身高
170
174
175
180
186
参考数据及公式:,,,,,.
根据表中数据,求出关于的线性回归方程.
【答案】
【知识点】求回归直线方程
【详解】,,
,,
故回归方程为:.
11.(25-26高二下·全国·课后作业)一个车间为了规定工时,需要确定加工零件所花费的时间,为此进行了5次试验,测得的数据如下:
零件数个
10
20
30
40
50
加工时间分钟
62
68
75
81
89
如果与线性相关,求回归直线方程;
附:,.
【答案】
【知识点】求回归直线方程
【详解】根据题中公式,结合表中数据进行运算求解即可;
由题中数据得,,
,
,
,.
因为,,
故所求的回归直线方程为.
12.(25-26高二下·全国·期中)某研究分析学习时间(,小时)与考试成绩(,分)的关系,数据如下:
x
2
4
5
7
8
10
11
12
y
30
40
50
60
70
80
90
100
(1)求线性回归方程;
(2)在下检验x与y的线性相关性(已知).
【答案】(1);
(2)线性相关显著.
【知识点】相关系数的计算、求回归直线方程
【分析】(1)根据给定的数表,利用最小二乘法求出线性回归方程.
(2)由(1)的信息求出相关系数并与临界值比对即得.
【详解】(1)依题意,,
,
,
因此,,
所以所求线性回归方程为.
(2)由数表得
因此相关系数,
所以线性相关显著.
题型四 根据回归方程求原数据中的值
13.(25-26高二下·河北沧州·期中)某同学为了解记忆成语的个数与花费的时间单位:秒的关系,做了次试验,收集到的数据如表所示,由最小二乘法求得的回归直线方程为 ,则的值为( )
成语个数个
记忆时间秒
A. B. C. D.
【答案】B
【知识点】求回归直线方程、计算样本的中心点、根据样本中心点求参数
【分析】利用回归直线过样本中心点的性质,将成语个数与记忆时间的平均值代入回归直线方程即可求解.
【详解】根据表中数据可得,,
将代入回归直线方程可得,
解得.
14.(25-26高二下·山东德州·期中)下表提供了某厂进行技术改造后生产产品过程中记录的产量(单位:t)与相应的生产能耗(单位:t标准煤)的几组数据:
4
5
6
7
标准煤
3.2
3.8
5.3
根据数据可得到的回归方程为,则( )
A.4.6 B.4.55 C.4.5 D.4.35
【答案】C
【知识点】根据回归方程求原数据中的值、计算样本的中心点、根据样本中心点求参数
【分析】求出,根据回归直线必过样本中心点,代入求解即可.
【详解】依题意,,,
因为回归直线必过样本中心点,
所以,解得.
15.(22-23高二上·四川广安·期末)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8
C.59 D.51
【答案】D
【知识点】根据回归方程求原数据中的值
【分析】首先根据回归直线必过样本点中心,代入方程求,即可求不清楚的数据.
【详解】回归直线必过样本点中心,其中,
所以,
所以不清楚的数值为.
故选:D
题型五 样本中心点与回归直线
16.(25-26高二下·上海·期中)已知变量和之间的一组相关数据如下表所示,设变量和满足回归方程,则下列说法错误的是( )
5
6
9
12
8
7
5
2.4
A. B.
C.变量和具有很强的线性相关性 D.该回归直线过点
【答案】D
【知识点】求回归直线方程、相关系数的意义及辨析、计算样本的中心点、根据样本中心点求参数
【详解】样本均值:,;
回归系数:,其中;;;;
;;;
.
分子和为:;分母和为.所以.
回归系数:.
回归直线方程为:.
相关系数:,
选项A:,正确;
选项B:,正确;
选项C:,接近1,具有很强的线性相关性,正确;
选项D:回归直线必过点,不过点,错误.
17.(多选)(24-25高二下·陕西西安·期末)已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是( ).
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间呈现负相关关系 B.
C.可以预测,当时,y约为2.6 D.由表格数据知,该回归直线必过点
【答案】ACD
【知识点】根据样本中心点求参数、根据回归方程进行数据估计、计算样本的中心点
【分析】根据回归直线斜率知A正确;利用回归直线必过样本中心点可构造方程求得,可知B错误,D正确;将代入回归直线知C正确.
【详解】对于A,由,得,故呈负相关关系,故A正确;
对于B,,,
,解得,故B错误;
对于C,当时,,故C正确;
对于D,由得,回归直线必过点,即必过点,故D正确.
故选:ACD.
18.(多选)(25-26高二下·四川遂宁·月考)已知变量与变量的一组观测数据如下表,根据表格数据得到经验回归直线为,则下列选项正确的是( )
1
2
3
4
5
9
8
7
6
6
A.变量与变量的中位数之和为10
B.变量与变量成正相关
C.
D.直线必过点
【答案】AC
【知识点】计算样本的中心点、判断正、负相关、计算几个数的中位数
【分析】对于A,由中位数计算方法可判断选项正误;对于B,由数据增减情况可判断选项正误;对于C,由B分析结合可判断符号;对于D,由回归直线方程必过点,可判断选项正误.
【详解】对于A,将数据从小到大排列,因数据有5个,则中位数为第三个数据,则变量与变量的中位数分别为:3,7.从而中位数之和为10,故A正确;
对于B,由题设可得随着变量增大,变量呈现减小趋势,故变量与变量负相关,故B错误;
对于C,由B分析可得,又,,,从而,故C正确;
对于D,由题可得,,从而过点,故D错误.
19.(多选)(2026·福建厦门·二模)为了研究某款新上市智能手环的直播间展示时长(单位:分钟)与即时下单量(单位:件)之间的关系,某电商平台随机记录了5场直播带货的数据,如下表所示:
直播间展示时长
1
2
3
4
5
即时下单量
12
18
25
30
34
若与的经验回归方程为,样本相关系数为,则( )
A.
B.回归直线过点
C.
D.当直播间展示时长为10分钟时,即时下单量的值估计为63
【答案】ACD
【知识点】相关系数的意义及辨析、根据回归方程进行数据估计、根据样本中心点求参数
【详解】对于A,由数据可知,即时下单量随着直播间展示时长的增大而增大,
因此直播间展示时长与即时下单量为正相关,即样本相关系数,故A正确;
对于B,由数据可知,,,
则回归直线过中心点,不过点,故B错误;
对于C,将点代入,可得,解得,故C正确;
对于D,由C知,与的经验回归方程为,
则时,,故D正确.
题型六 根据样本中心点求参数
20.(25-26高二下·山东青岛·期中)已知关于的一组数据中,,若与的回归直线方程为,则( )
A.1 B.2 C.3 D.4
【答案】B
【知识点】求回归直线方程、根据样本中心点求参数
【分析】由题意求得样本中心点,将其代入到回归直线方程即可求解.
【详解】由题意得样本中心点为,代入到回归直线方程得,
解得.
21.(25-26高二下·黑龙江大庆·期中)某商店记录2026年4月(16日至20日)每天的平均气温(单位:℃)与矿泉水日销量(单位:瓶),得到数据如下表:
气温
10
11
12
13
14
销量
65
70
75
80
85
经计算,气温与销量的样本相关系数接近1,经验回归直线方程为,其中斜率,则截距的值为( )
A.20 B.15 C.10 D.5
【答案】B
【知识点】根据样本中心点求参数
【详解】因为,且,
所以,解得.
22.(2026·江西九江·二模)已知变量与线性相关,现收集了5组样本数据如下表.
1
2
3
4
5
10
15
19
23
28
根据上表可得线性回归方程为,则( )
A.4 B.4.4 C.4.5 D.5
【答案】B
【知识点】根据样本中心点求参数
【分析】由所给数据求出,根据回归直线过中心点可求解.
【详解】由表格得,,
将样本中心代入线性回归方程得,.
题型七 根据回归方程进行数据估计
23.(25-26高二下·山东潍坊·期中)某人工智能公司从某年起5年的利润情况如下表所示.
第年
1
2
3
4
5
利润亿元
3.3
3.6
4.4
4.8
5.2
(1)求出关于的回归直线方程;
(2)根据回归直线方程,预测该人工智能公司第6年的利润.
参考公式:.
参考数据:.
【答案】(1)
(2)5.76亿元
【知识点】根据回归方程进行数据估计、求回归直线方程
【分析】(1)根据给定数表,利用最小二乘法求出回归直线方程.
(2)由(1)的结论预测利润.
【详解】(1)依题意,,,
则,,
所以关于的回归方程为.
(2)由(1)知,当时,
所以该人工智能公司第6年的利润约为5.76亿元.
24.(24-25高二下·天津静海·月考)已知某产品近5年的市场销售单价(单位:元)如下表:
年份
2020
2021
2022
2023
2024
年份编号
1
2
3
4
5
市场销售单价
2.0
2.2
2.4
3.6
4.8
(1)已知和线性相关,用最小二乘法求出关于的经验回归方程;
(2)试预测该产品2026年的市场销售单价.
附:经验回归方程中斜率和截距最小二乘估计公式分别为,.
【答案】(1)
(2)元
【知识点】根据回归方程进行数据估计、求回归直线方程
【分析】(1)根据表中数据计算出,再结合参考数据利用公式即可计算出,进而得出线性回归方程;
(2)将代入即可预测.
【详解】(1)由题意得,.
因为,
.
所以,.
故经验回归方程为.
(2)由已知2026年对应的年份编号为7,令,则.
故预测该产品2026年的市场销售单价为元.
25.(25-26高二下·全国·单元测试)某幼儿园雏鹰班的生活老师统计2024年上半年每个月的20日的昼夜差(单位:℃,)和患感冒的小朋友人数(单位:人)的数据如下:
8
11
14
20
23
26
其中,,.
(1)请用相关系数加以说明是否可用线性回归模型拟合与的关系;
(2)建立关于的经验回归方程(精确到0.01),预测当昼夜温差升高4℃时患感冒的小朋友的人数会有什么变化.(人数精确到整数,参考数据:)
【答案】(1)可用一元线性回归模型拟合与的关系.
(2),
【知识点】根据回归方程进行数据估计、相关系数的计算、求回归直线方程
【分析】(1)根据题意,利用公式,求得相关系数的值,即可得到结论;
(2)利用最小二乘法求得和的值,求得回归直线方程,结合回归方程,即可得到答案.
【详解】(1)由统计表格中的数据,可得,
,
且,,
所以,
所以可用一元线性回归模型拟合与的关系.
(2)由,可得,
则,
所以关于的经验回归方程为,
由回归方程知,昼夜温差每升高,患感冒的小朋友人数大约增加人,
所以当昼夜温差升高时,患感冒的小朋友的人数增加人.
26.(25-26高二下·辽宁铁岭·期中)近年来某App用户保持连续增长,李明收集了2021~2025年该App在线用户数y(单位:万人)的数据,如表所示.
年份
2021
2022
2023
2024
2025
年份代码x
1
2
3
4
5
App在线用户数y
80
150
210
260
300
(1)求x与y的相关系数r(结果保留两位小数);
(2)求y关于x的回归直线方程,并预测2027年该App的在线用户数.
附:回归直线方程的斜率和截距的最小二乘估计公式为,;相关系数.
参考数据:.
【答案】(1);
(2),预测2027年该App的在线用户数为420万人.
【知识点】用回归直线方程对总体进行估计、求回归直线方程、相关系数的计算
【分析】(1)先计算年份代码和用户数的均值,再计算各离差乘积及平方和,代入相关系数公式求解即可;
(2)利用最小二乘估计公式求出回归系数和截距,得回归直线方程,再将2027年对应的代码代入计算即可.
【详解】(1)由题得,,
则,.
(2)由(1)可得,
则,,
所以y关于x的回归直线方程为,
当时,,所以预测2027年该App的在线用户数为420万人.
题型八:非线性回归问题
27.(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
1
2
3
4
5
4
7
12
20
33
经计算:,,令,,,,,,经分析.与呈线性相关关系,用最小二乘法求得线性回归方程,则关于的回归方程为( )(参考公式:,)
A. B. C. D.
【答案】A
【知识点】求回归直线方程、非线性回归
【分析】根据给定数据,利用最小二乘法求出关于的线性回归方程,进而求出关于的回归方程.
【详解】令,,由与呈线性相关关系,得线性回归方程,
则,,
因此,即,所以关于的回归方程为.
28.(25-26高二下·海南·期中)椰树集团为确定下一年度投入椰树椰汁的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
298.8
1.6
1469
108.8
表中
(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?根据判断结果及表中数据,建立关于的回归方程;
(2)已知椰树椰汁的年利润与的关系为.根据(1)的结果求年宣传费时,年销售量及年利润的预报值是多少?
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
【答案】(1)
(2)644.6;258.3
【知识点】根据回归方程进行数据估计、非线性回归、求回归直线方程、用回归直线方程对总体进行估计
【分析】(1)根据散点图分析得出回归方程类型,结合非线性回归模型转化线性回归方程分析求解即可;
(2)根据(1)中的方程代入相关变量计算分析即可.
【详解】(1)由散点图可以判断,适宜作为年销售量关于年宣传费的回归方程类型,
令,先建立关于的线性回归方程,
由于 ,
则,
所以关于的线性回归方程为,
因此关于的回归方程为.
(2)当时,年销售量的预报值,
年利润的预报值.
29.(2026·山西临汾·一模)水体富营养化导致藻类大量繁殖,以2017年中国太湖蓝藻爆发为例:5月初监测发现湖体中蓝藻细胞密度为每升50万个,随着气温升高至25-30℃且氮磷营养盐浓度超标(总磷浓度达),蓝藻进入增长期.5月10日细胞密度增至每升200万个,5月15日突破每升800万个,5月20日达到每升3200万个,形成面积超150平方公里的绿色水华带.此次爆发导致湖区溶解氧骤降至以下,大量鱼类死亡,自来水厂被迫停产、所以对水资源的保护刻不容缓,现对某区域的藻类面积y(单位:平方公里)与时间x(单位:年)的关系,进行监测,得到如下数据:
x/年
1
2
3
4
5
6
7
y/平方公里
6
11
21
34
66
101
196
根据以上数据,绘制成如图所示的散点图:
观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.
(1)根据散点图判断与(a,b,c,d均为常数)哪一个更适合作为藻类面积y(单位:平方公里)与时间x(单位:年)的关系的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中的数据,求出y关于x的回归方程;
(3)若不及时保护水质,当第八年检测时,请估计藻类面积为多少平方公里.
参考数据:
62.14
1.54
2535
50.12
3.47
其中,
参考公式:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)更适宜
(2)
(3)347
【知识点】根据回归方程进行数据估计、非线性回归、求回归直线方程
【分析】(1)根据散点图的特征确定回归方程类型.
(2)利用非线性回归及最小二乘法求出回归方程.
(3)利用(2)的结论进行数据估计.
【详解】(1)由散点图得,藻类面积随时间的增加其增长速度越来越快,
所以更适宜作为藻类面积y与时间x的关系的回归方程类型.
(2)由,两边同时取常用对数得,
设,,,则,
由,,得,
则,因此,,
所以y关于x的回归方程为.
(3)当时,(平方公里)
所以若不加治理,第8次检测时,藻类面积约为347平方公里.
题型九:列联表的完善与分析
30.(多选)(24-25高二下·江西上饶·月考)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则( )
合计
合计
A.若,则可以认为与独立
B.若变量与独立,则
C.若很大,则变量与不独立
D.若变量与不独立,则很大
【答案】AC
【知识点】独立事件的判断、列联表分析
【分析】运用独立性检验的步骤原理推理判断即可.
【详解】用频率可以估计,用频率可以估计,用频率可以估计,若,则,可以认为与独立,故正确;
由于,,表示的是频率,是抽取的样本数据,故即使变量与独立,也不一定成立,故错误;
若很大,可以说明与不独立,故正确;
若变量与不独立,,但并不一定很大,故错误.
故选:AC.
31.(25-26高二下·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
【答案】
【知识点】计算条件概率、互斥事件的概率加法公式、列联表分析
【分析】根据古典概型概率公式和条件概率公式进行计算即可.
【详解】;
;
;
故答案为:;;;.
32.(24-25高二下·全国·课后作业)下表是、两班关于选择“物理”作为“加三学科”的意愿的列联表,请根据已有数据完善表格.
单位:人
类别
愿意选择“物理”
不愿意选择“物理”
总计
班
20
42
班
16
总计
44
【答案】
【知识点】完善列联表
【分析】根据已知条件补全联表即可.
【详解】根据已知条件得出,
又因为,所以,所以,
所以.
所以.
33.(23-24高二上·上海·课后作业)下表是两所中学的学生对报考某类大学的意愿的列联表:
愿意报考某类大学
不愿意报考某类大学
总计
中学
中学
总计
根据表中的数据回答:两所中学的学生对报考某类大学的态度是否有显著差异?
【答案】有显著差异,且中学更愿意报考
【知识点】列联表分析
【分析】分别计算中学报考某类大学的比例,对比即可得到结论.
【详解】中学愿意报考某类大学的比率为;
中学愿意报考某类大学的比例为;
,即中学愿意报考某类大学的比例比中学高了,
两所中学的学生对报考某类大学的态度有显著差异,且中学更愿意报考.
题型十:卡方的计算及独立性检验的基本思想
34.(25-26高二下·河北沧州·期中)为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射后天的结果如表所示:
电离辐射剂量
存活情况
合计
死亡
存活
第一种剂量
第二种剂量
合计
由表中数据算得:__________精确到 ,说明两种电离辐射剂量对小白鼠的致死作用__________填“相同”或“不相同”.(已知)
【答案】 . 不相同
【知识点】卡方的计算、独立性检验解决实际问题
【分析】根据给定的数表,求出的观测值,再与临界值表比对作答.
【详解】由列联表中数据,计算得,
所以在犯错误的概率不超过0.05的前提下认为小白鼠的死亡与使用的电离辐射剂量有关,
即两种电离辐射剂量对小白鼠的致死作用不相同.
35.(25-26高二下·江西·月考)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人.
参考数据及公式:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】48
【知识点】完善列联表、卡方的计算、独立性检验解决实际问题
【分析】设男生人数为,由题可得列联表,然后由题设可得关于不等式,据此可得答案.
【详解】设男生人数为,则女生人数为,男生追星人数为,不追星人数为,
女生追星人数为,不追星人数为,据此可得列联表如下:
追星
不追星
总计
男生
女生
总计
则由独立性检验相关计算公式结合题设,可得:
.
又为保证所有人数为正整数,需为的倍数,则.
36.(25-26高二下·河南南阳·期中)河南省三门峡市被誉为“天鹅之城”.每年秋冬季节,成千上万的白天鹅如期飞临“天鹅之城”,拉开了三门峡“白天鹅旅游季”的精彩序幕,推动三门峡市冬季旅游市场热度持续攀升.为了了解游客对天鹅的喜爱程度与性别的关系,某机构随机调查了300名现场游客(男、女游客人数相等),绘制了不完整的列联表如下:
单位:人
性别
喜爱程度
总计
一般喜爱
非常喜爱
男
女
总计
300
已知男游客中非常喜爱天鹅的频率为0.6,女游客中一般喜爱天鹅的频率为0.2.
(1)补全列联表;
(2)是否有99%的把握判断游客对天鹅的喜爱程度与性别有关?
附:,.当时,有99%的把握判断变量,有关联.
【答案】(1)答案见解析
(2)有99%的把握判断游客对天鹅的喜爱程度与性别有关.
【知识点】独立性检验解决实际问题、卡方的计算、完善列联表
【详解】(1)由题意得男、女游客的人数均为150,
男游客中非常喜爱天鹅的频数为,一般喜爱天鹅的频数为,
女游客中一般喜爱天鹅的频数为,非常喜爱天鹅的频数为
列联表如下:
性别
喜爱程度
总计
一般喜爱
非常喜爱
男
60
90
150
女
30
120
150
总计
90
210
300
(2),
因为,所以有99%的把握判断游客对天鹅的喜爱程度与性别有关.
题型十一:独立性检验与线性回归
37.(25-26高二下·河南南阳·期中)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2025年前5个月的带货金额:
月份x
1
2
3
4
5
带货金额y/万元
350
440
580
700
880
(1)求y关于x的线性回归方程,并据此预测2025年7月份该公司的直播带货金额;
(2)该公司随机抽取55人进行问卷调查,得到如下不完整的列联表:
参加过直播带货
未参加过直播带货
总计
女性
30
35
男性
10
总计
请填写上表,并判断是否有99.5%的把握认为参加直播带货与性别有关?
参考数据:,,,.
参考公式:,;
,其中.
0.025
0.010
0.005
0.001
5.024
6.635
7.879
10.828
【答案】(1),1118万元
(2)列联表见解析,有99.5%的把握认为参加直播带货与性别有关
【知识点】根据回归方程进行数据估计、独立性检验解决实际问题、完善列联表、求回归直线方程
【分析】(1)由系数公式直接计算即可求解;
(2)由计算公式,再比较临界值即可求解.
【详解】(1)因为,,
,,
所以,,
所以y关于x的线性回归方程为,
当时,(万元),
所以预测2025年7月份该公司的直播带货金额为1118万元;
(2)补全完整的列联表如下:
参加过直播带货
未参加过直播带货
总计
女性
30
5
35
男性
10
10
20
总计
40
15
55
根据以上数据,经计算得到.
因为,所以有99.5%的把握认为参加直播带货与性别有关.
38.(25-26高二下·山东德州·期中)某车企计划在A市优化无人快递车的投放量,为测试运行稳定性,并确定投放规模,进行如下调查.
(1)为了测试无人快递车的运行稳定性,随机抽取了200辆进行运行测试,得到部分数据,请完成列联表,并回答:有的把握认为无人快递车故障与是否维保有关吗?
维保
未维保
合计
故障
12
40
未故障
合计
120
200
(2)对过去的投放量(单位:百辆)与服务次数(单位:万次)的数据进行了统计,得到如下表格:
1
2
3
4
5
6
7
5
13
32
79
200
501
1259
拟用函数模型或对两个变量的关系进行拟合.请问哪个模型更适宜作为投放量与服务次数的回归方程模型(给出判断即可,不必说明理由)?并求出关于的回归方程.
参考公式:,其中..
参考数据:
0.1
0.05
0.01
2.706
3.841
6.635
.
298.4
1.9
13262
64.4
2
【答案】(1)
维保
未维保
合计
故障
12
28
40
未故障
108
52
160
合计
120
80
200
有的把握认为故障与维保有关
(2)适宜,
【知识点】求回归直线方程、完善列联表、独立性检验解决实际问题
【详解】(1)补充列联表如下:
维保
未维保
合计
故障
12
28
40
未故障
108
52
160
合计
120
80
200
则
,
有的把握认为故障与维保有关.
(2)适宜作为投放量与服务次数的回归方程模型.
由,两边同时取常用对数得,
设,则,
因为,
所以,
把代入,得,
所以.所以,
则,
故关于的回归方程为.
题型十二:独立性检验与概率分布
39.(25-26高二下·山东烟台·期中)OpenClaw(俗称“龙虾”)是一个以龙虾为图标的开源智能体平台、一种能操作电脑的执行层工具.某单位为了解员工是否喜欢使用OpenClaw,对不同年龄段的100名员工进行了调查统计,得到如下列联表:
年龄
是否喜欢使用OpenClaw
合计
是
否
不超过45岁
40
60
超过45岁
30
合计
100
(1)完成列联表,并依据小概率值的独立性检验,能否认为“是否喜欢使用OpenClaw”与年龄有关联;
(2)若以本次调查的频率估计概率,从该单位所有超过45岁和不超过45岁的员工中各随机抽取1人,求这两人中至少有1人喜欢使用OpenClaw的概率.
参考公式:,其中.
【答案】(1)列联表见解析,认为“是否喜欢使用OpenClaw”与年龄有关联.
(2)
【知识点】完善列联表、卡方的计算、利用对立事件的概率公式求概率
【分析】(1)通过列联表数据补全表格,再利用卡方检验公式计算统计量,通过与临界值对比,判断出“是否喜欢使用OpenClaw”与年龄存在显著关联,核心是卡方独立性检验的步骤应用.
(2)以调查频率估计概率,先分别算出不同年龄段员工喜欢使用OpenClaw的概率,再利用对立事件的概率公式,求出两人中至少有 1 人喜欢使用的概率,关键是对立事件思想的运用.
【详解】(1)
年龄
是否喜欢使用OpenClaw
合计
是
否
不超过45岁
40
20
60
超过45岁
10
30
40
合计
50
50
100
根据卡方检验公式 ,代入:
,
由于 ,故拒绝原假设,认为“是否喜欢使用OpenClaw”与年龄有关联.
(2)设从不超过45岁员工中抽到喜欢使用者的概率为 ,从超过45岁员工中抽到喜欢使用者的概率为 ,
则两人中至少有1人喜欢使用的概率为:.
40.(25-26高三上·河南驻马店·期末)随着双休政策落实,高中生有更多的时间进行体育锻炼.为了解高中生周末体育锻炼时长,在某高中三个年级中随机抽取50名男生和50名女生,其中男生体育锻炼时长超过两小时的有40名,女生体育锻炼时长不超过两小时的有20名.
(1)依据的独立性检验,判断周末体育锻炼时长与性别是否有关联;
(2)用样本频率作为概率,从该校学生中随机抽取10人进行调查,记周末体育锻炼时长超过两小时的人数为,求的数学期望和方差.
参考公式及数据:,其中.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)与性别无关
(2)7,2.1
【知识点】二项分布的方差、二项分布的均值、独立性检验解决实际问题、卡方的计算
【分析】(1)先进行零假设,即认为学生周末体育锻炼时长与性别无关联.据题意,可得性别与锻炼时长的列联表,计算,依据的独立性检验,进行判断即可;
(2)根据所给数据,用样本频率作为概率,计算一名学生周末体育锻炼时长超过两小时的概率,根据服从二项分布,求得的数学期望和方差.
【详解】(1)零假设为:认为学生周末体育锻炼时长与性别无关联.
列联表如下:
时长性别
锻炼时长超过2小时
锻炼时长不超过2小时
合计
男生
40
10
50
女生
30
20
50
合计
70
30
100
则,
依据的独立性检验,可以认为成立,因此认为该校学生的周末体育锻炼时长与性别无关.
(2)由(1)知,该校学生周末体育锻炼时长超过两小时的样本频率为,
用样本频率作为概率,知从该校学生中随机抽取1人进行调查,则该同学周末体育锻炼时长超过两小时的概率为.
设抽取的10名学生中体育锻炼时长超过两小时的人数为,
由题意知,随机变量,
故,.
41.(25-26高二下·浙江舟山·期中)截至2025年底,我国新能源汽车保有量达到4397万辆,占汽车总产量的。某城市研究小组调查了300名汽车驾驶员对新能源汽车和燃油汽车的偏好程度,将调查结果整理成如下列联表,现统计得出样本中偏好燃油汽车的人数占样本总数的,女性驾驶员的样本占样本总数的,偏好燃油汽车的男性驾驶员的样本有120人.
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
女性驾驶员
300
(1)请根据已知条件将上述列联表补充完整,并依据小概率值的独立性检验,分析对燃油汽车和新能源汽车的偏好是否与驾驶员性别有关联?
(2)现从女性驾驶员中按对燃油汽车和新能源汽车的偏好用分层抽样法抽取8人做进一步访谈,然后从这8人中随机抽取3人填写调查问卷,记抽取的3人中偏好新能源汽车的人数为X,求X的分布列及数学期望.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式及数据:.
【答案】(1)
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
100
220
女性驾驶员
30
50
80
合计
150
150
300
对燃油汽车和新能源汽车的偏好与驾驶员性别有关联
(2)
X
0
1
2
3
P
【知识点】完善列联表、独立性检验解决实际问题、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)根据已知数据可计算得到补全列联表所需的数据,进而补全列联表,并计算得到,由此可得结论;
(2)根据分层抽样原则可确定样本中偏好新能源汽车的人数和偏好燃油车的人数,由此可得所有可能的取值,根据超几何分布概率公式可求得每个取值对应的概率,由此可得分布列,由数学期望计算公式可求得期望值.
【详解】(1)因为样本中偏好燃油汽车的人数占样本总数的,
故样本中偏好燃油汽车的人数为,
因为样本中女性驾驶员的样本占样本总数的,
故样本中女性驾驶员的人数为,由题意,列联表补充如下:
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
100
220
女性驾驶员
30
50
80
合计
150
150
300
零假设为:对燃油汽车和新能源汽车的偏好与驾驶员的性别无关联,
根据列联表数据,计算得,
根据小概率值的独立性检验,可以推断不成立,
即认为对燃油汽车和新能源汽车的偏好与驾驶员的性别有关联,此推断犯错误的概率不大于0.01.
(2)由题意,抽取的人中偏好燃油汽车的人数为人,
偏好新能源汽车的人数为人,
随机变量的可能值为,,,,
,,
,,
所以,随机变量的分布列为:
X
0
1
2
3
P
的数学期望.
2 / 11
学科网(北京)股份有限公司
$
重难点专题4.1 统计案例十二种题型
题型一 散点图及其应用
题型二 相关系数的计算与应用
题型三 回归直线方程及其应用
题型四 根据回归方程求原数据中的值
题型五 样本中心点与回归直线
题型六 根据样本中心点求参数
题型七 根据回归方程进行数据估计
题型八:非线性回归问题
题型九:列联表的完善与分析
题型十:卡方的计算及独立性检验的基本思想
题型十一:独立性检验与线性回归
题型十二:独立性检验与概率分布
题型一 散点图及其应用
1.(24-25高二下·天津西青·期末)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
2.(24-25高二下·北京东城·期末)对某种动物的三项指标,,进行调查研究.现有这种动物若干只,设每只动物的这三项指标为.若与的散点图如图1和图2所示,那么关于的散点图最合理的为( )
A. B.
C. D.
3.(25-26高二下·全国·课堂例题)如图所示,有A,B,C,D,E共5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
4.(24-25高二下·全国·课后作业)观察下列散点图,有三种情况:①正相关,②负相关,③不相关.与散点图的位置相对应的序号依次是______.
5.(25-26高二上·全国·课后作业)山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图;
(2)判断是否具有相关关系.
题型二 相关系数的计算与应用
6.(25-26高二上·全国·单元测试)最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
7.(24-25高二下·江西抚州·期末)现调查某地区某种野生动物的数量,将该地区分成面积相近的100个地块,从这些地块中用简单随机抽样的方法抽取10个作为样本,调查得到样本数据,其中分别表示第个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,分别表示这10个样本的植物覆盖面积和这种野生动物的数量的平均值,构造向量,并计算得,由选择性必修第一册教材中的知识,我们知道对数据的相关系数,则上述数据的相关系数______.
8.(25-26高二下·全国·课堂例题)为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示:
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
GLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度.
参考公式:
相关系数,
参考数据:,,,,,,,.
9.(25-26高二下·全国·课堂例题)关于两个变量x和y的7组数据如表所示:
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
试判断y与x是否线性相关,并刻画它们的相关程度.
题型三 回归直线方程与相关性判断
10.(25-26高二下·全国·课堂例题)某学校研究性学习小组在学习生物遗传学的过程中,为验证高尔顿提出的关于儿子成年后身高(单位:)与父亲身高(单位:)之间的关系及存在的遗传规律,随机抽取了5对父子的身高数据,如下表:
父亲身高
160
170
175
185
190
儿子身高
170
174
175
180
186
参考数据及公式:,,,,,.
根据表中数据,求出关于的线性回归方程.
11.(25-26高二下·全国·课后作业)一个车间为了规定工时,需要确定加工零件所花费的时间,为此进行了5次试验,测得的数据如下:
零件数个
10
20
30
40
50
加工时间分钟
62
68
75
81
89
如果与线性相关,求回归直线方程;
附:,.
12.(25-26高二下·全国·期中)某研究分析学习时间(,小时)与考试成绩(,分)的关系,数据如下:
x
2
4
5
7
8
10
11
12
y
30
40
50
60
70
80
90
100
(1)求线性回归方程;
(2)在下检验x与y的线性相关性(已知).
题型四 根据回归方程求原数据中的值
13.(25-26高二下·河北沧州·期中)某同学为了解记忆成语的个数与花费的时间单位:秒的关系,做了次试验,收集到的数据如表所示,由最小二乘法求得的回归直线方程为 ,则的值为( )
成语个数个
记忆时间秒
A. B. C. D.
14.(25-26高二下·山东德州·期中)下表提供了某厂进行技术改造后生产产品过程中记录的产量(单位:t)与相应的生产能耗(单位:t标准煤)的几组数据:
4
5
6
7
标准煤
3.2
3.8
5.3
根据数据可得到的回归方程为,则( )
A.4.6 B.4.55 C.4.5 D.4.35
15.(22-23高二上·四川广安·期末)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8
C.59 D.51
题型五 样本中心点与回归直线
16.(25-26高二下·上海·期中)已知变量和之间的一组相关数据如下表所示,设变量和满足回归方程,则下列说法错误的是( )
5
6
9
12
8
7
5
2.4
A. B.
C.变量和具有很强的线性相关性 D.该回归直线过点
17.(多选)(24-25高二下·陕西西安·期末)已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是( ).
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间呈现负相关关系 B.
C.可以预测,当时,y约为2.6 D.由表格数据知,该回归直线必过点
18.(多选)(25-26高二下·四川遂宁·月考)已知变量与变量的一组观测数据如下表,根据表格数据得到经验回归直线为,则下列选项正确的是( )
1
2
3
4
5
9
8
7
6
6
A.变量与变量的中位数之和为10
B.变量与变量成正相关
C.
D.直线必过点
19.(多选)(2026·福建厦门·二模)为了研究某款新上市智能手环的直播间展示时长(单位:分钟)与即时下单量(单位:件)之间的关系,某电商平台随机记录了5场直播带货的数据,如下表所示:
直播间展示时长
1
2
3
4
5
即时下单量
12
18
25
30
34
若与的经验回归方程为,样本相关系数为,则( )
A.
B.回归直线过点
C.
D.当直播间展示时长为10分钟时,即时下单量的值估计为63
题型六 根据样本中心点求参数
20.(25-26高二下·山东青岛·期中)已知关于的一组数据中,,若与的回归直线方程为,则( )
A.1 B.2 C.3 D.4
21.(25-26高二下·黑龙江大庆·期中)某商店记录2026年4月(16日至20日)每天的平均气温(单位:℃)与矿泉水日销量(单位:瓶),得到数据如下表:
气温
10
11
12
13
14
销量
65
70
75
80
85
经计算,气温与销量的样本相关系数接近1,经验回归直线方程为,其中斜率,则截距的值为( )
A.20 B.15 C.10 D.5
22.(2026·江西九江·二模)已知变量与线性相关,现收集了5组样本数据如下表.
1
2
3
4
5
10
15
19
23
28
根据上表可得线性回归方程为,则( )
A.4 B.4.4 C.4.5 D.5
题型七 根据回归方程进行数据估计
23.(25-26高二下·山东潍坊·期中)某人工智能公司从某年起5年的利润情况如下表所示.
第年
1
2
3
4
5
利润亿元
3.3
3.6
4.4
4.8
5.2
(1)求出关于的回归直线方程;
(2)根据回归直线方程,预测该人工智能公司第6年的利润.
参考公式:.
参考数据:.
24.(24-25高二下·天津静海·月考)已知某产品近5年的市场销售单价(单位:元)如下表:
年份
2020
2021
2022
2023
2024
年份编号
1
2
3
4
5
市场销售单价
2.0
2.2
2.4
3.6
4.8
(1)已知和线性相关,用最小二乘法求出关于的经验回归方程;
(2)试预测该产品2026年的市场销售单价.
附:经验回归方程中斜率和截距最小二乘估计公式分别为,.
25.(25-26高二下·全国·单元测试)某幼儿园雏鹰班的生活老师统计2024年上半年每个月的20日的昼夜差(单位:℃,)和患感冒的小朋友人数(单位:人)的数据如下:
8
11
14
20
23
26
其中,,.
(1)请用相关系数加以说明是否可用线性回归模型拟合与的关系;
(2)建立关于的经验回归方程(精确到0.01),预测当昼夜温差升高4℃时患感冒的小朋友的人数会有什么变化.(人数精确到整数,参考数据:)
26.(25-26高二下·辽宁铁岭·期中)近年来某App用户保持连续增长,李明收集了2021~2025年该App在线用户数y(单位:万人)的数据,如表所示.
年份
2021
2022
2023
2024
2025
年份代码x
1
2
3
4
5
App在线用户数y
80
150
210
260
300
(1)求x与y的相关系数r(结果保留两位小数);
(2)求y关于x的回归直线方程,并预测2027年该App的在线用户数.
附:回归直线方程的斜率和截距的最小二乘估计公式为,;相关系数.
参考数据:.
题型八:非线性回归问题
27.(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
1
2
3
4
5
4
7
12
20
33
经计算:,,令,,,,,,经分析.与呈线性相关关系,用最小二乘法求得线性回归方程,则关于的回归方程为( )(参考公式:,)
A. B. C. D.
28.(25-26高二下·海南·期中)椰树集团为确定下一年度投入椰树椰汁的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
298.8
1.6
1469
108.8
表中
(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?根据判断结果及表中数据,建立关于的回归方程;
(2)已知椰树椰汁的年利润与的关系为.根据(1)的结果求年宣传费时,年销售量及年利润的预报值是多少?
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
29.(2026·山西临汾·一模)水体富营养化导致藻类大量繁殖,以2017年中国太湖蓝藻爆发为例:5月初监测发现湖体中蓝藻细胞密度为每升50万个,随着气温升高至25-30℃且氮磷营养盐浓度超标(总磷浓度达),蓝藻进入增长期.5月10日细胞密度增至每升200万个,5月15日突破每升800万个,5月20日达到每升3200万个,形成面积超150平方公里的绿色水华带.此次爆发导致湖区溶解氧骤降至以下,大量鱼类死亡,自来水厂被迫停产、所以对水资源的保护刻不容缓,现对某区域的藻类面积y(单位:平方公里)与时间x(单位:年)的关系,进行监测,得到如下数据:
x/年
1
2
3
4
5
6
7
y/平方公里
6
11
21
34
66
101
196
根据以上数据,绘制成如图所示的散点图:
观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.
(1)根据散点图判断与(a,b,c,d均为常数)哪一个更适合作为藻类面积y(单位:平方公里)与时间x(单位:年)的关系的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中的数据,求出y关于x的回归方程;
(3)若不及时保护水质,当第八年检测时,请估计藻类面积为多少平方公里.
参考数据:
62.14
1.54
2535
50.12
3.47
其中,
参考公式:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计公式分别为,.
题型九:列联表的完善与分析
30.(多选)(24-25高二下·江西上饶·月考)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则( )
合计
合计
A.若,则可以认为与独立
B.若变量与独立,则
C.若很大,则变量与不独立
D.若变量与不独立,则很大
31.(25-26高二下·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
32.(24-25高二下·全国·课后作业)下表是、两班关于选择“物理”作为“加三学科”的意愿的列联表,请根据已有数据完善表格.
单位:人
类别
愿意选择“物理”
不愿意选择“物理”
总计
班
20
42
班
16
总计
44
33.(23-24高二上·上海·课后作业)下表是两所中学的学生对报考某类大学的意愿的列联表:
愿意报考某类大学
不愿意报考某类大学
总计
中学
中学
总计
根据表中的数据回答:两所中学的学生对报考某类大学的态度是否有显著差异?
题型十:卡方的计算及独立性检验的基本思想
34.(25-26高二下·河北沧州·期中)为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射后天的结果如表所示:
电离辐射剂量
存活情况
合计
死亡
存活
第一种剂量
第二种剂量
合计
由表中数据算得:__________精确到 ,说明两种电离辐射剂量对小白鼠的致死作用__________填“相同”或“不相同”.(已知)
35.(25-26高二下·江西·月考)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有______人.
参考数据及公式:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
36.(25-26高二下·河南南阳·期中)河南省三门峡市被誉为“天鹅之城”.每年秋冬季节,成千上万的白天鹅如期飞临“天鹅之城”,拉开了三门峡“白天鹅旅游季”的精彩序幕,推动三门峡市冬季旅游市场热度持续攀升.为了了解游客对天鹅的喜爱程度与性别的关系,某机构随机调查了300名现场游客(男、女游客人数相等),绘制了不完整的列联表如下:
单位:人
性别
喜爱程度
总计
一般喜爱
非常喜爱
男
女
总计
300
已知男游客中非常喜爱天鹅的频率为0.6,女游客中一般喜爱天鹅的频率为0.2.
(1)补全列联表;
(2)是否有99%的把握判断游客对天鹅的喜爱程度与性别有关?
附:,.当时,有99%的把握判断变量,有关联.
题型十一:独立性检验与线性回归
37.(25-26高二下·河南南阳·期中)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2025年前5个月的带货金额:
月份x
1
2
3
4
5
带货金额y/万元
350
440
580
700
880
(1)求y关于x的线性回归方程,并据此预测2025年7月份该公司的直播带货金额;
(2)该公司随机抽取55人进行问卷调查,得到如下不完整的列联表:
参加过直播带货
未参加过直播带货
总计
女性
30
35
男性
10
总计
请填写上表,并判断是否有99.5%的把握认为参加直播带货与性别有关?
参考数据:,,,.
参考公式:,;
,其中.
0.025
0.010
0.005
0.001
5.024
6.635
7.879
10.828
38.(25-26高二下·山东德州·期中)某车企计划在A市优化无人快递车的投放量,为测试运行稳定性,并确定投放规模,进行如下调查.
(1)为了测试无人快递车的运行稳定性,随机抽取了200辆进行运行测试,得到部分数据,请完成列联表,并回答:有的把握认为无人快递车故障与是否维保有关吗?
维保
未维保
合计
故障
12
40
未故障
合计
120
200
(2)对过去的投放量(单位:百辆)与服务次数(单位:万次)的数据进行了统计,得到如下表格:
1
2
3
4
5
6
7
5
13
32
79
200
501
1259
拟用函数模型或对两个变量的关系进行拟合.请问哪个模型更适宜作为投放量与服务次数的回归方程模型(给出判断即可,不必说明理由)?并求出关于的回归方程.
参考公式:,其中..
参考数据:
0.1
0.05
0.01
2.706
3.841
6.635
.
298.4
1.9
13262
64.4
2
题型十二:独立性检验与概率分布
39.(25-26高二下·山东烟台·期中)OpenClaw(俗称“龙虾”)是一个以龙虾为图标的开源智能体平台、一种能操作电脑的执行层工具.某单位为了解员工是否喜欢使用OpenClaw,对不同年龄段的100名员工进行了调查统计,得到如下列联表:
年龄
是否喜欢使用OpenClaw
合计
是
否
不超过45岁
40
60
超过45岁
30
合计
100
(1)完成列联表,并依据小概率值的独立性检验,能否认为“是否喜欢使用OpenClaw”与年龄有关联;
(2)若以本次调查的频率估计概率,从该单位所有超过45岁和不超过45岁的员工中各随机抽取1人,求这两人中至少有1人喜欢使用OpenClaw的概率.
参考公式:,其中.
40.(25-26高三上·河南驻马店·期末)随着双休政策落实,高中生有更多的时间进行体育锻炼.为了解高中生周末体育锻炼时长,在某高中三个年级中随机抽取50名男生和50名女生,其中男生体育锻炼时长超过两小时的有40名,女生体育锻炼时长不超过两小时的有20名.
(1)依据的独立性检验,判断周末体育锻炼时长与性别是否有关联;
(2)用样本频率作为概率,从该校学生中随机抽取10人进行调查,记周末体育锻炼时长超过两小时的人数为,求的数学期望和方差.
参考公式及数据:,其中.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
41.(25-26高二下·浙江舟山·期中)截至2025年底,我国新能源汽车保有量达到4397万辆,占汽车总产量的。某城市研究小组调查了300名汽车驾驶员对新能源汽车和燃油汽车的偏好程度,将调查结果整理成如下列联表,现统计得出样本中偏好燃油汽车的人数占样本总数的,女性驾驶员的样本占样本总数的,偏好燃油汽车的男性驾驶员的样本有120人.
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
120
女性驾驶员
300
(1)请根据已知条件将上述列联表补充完整,并依据小概率值的独立性检验,分析对燃油汽车和新能源汽车的偏好是否与驾驶员性别有关联?
(2)现从女性驾驶员中按对燃油汽车和新能源汽车的偏好用分层抽样法抽取8人做进一步访谈,然后从这8人中随机抽取3人填写调查问卷,记抽取的3人中偏好新能源汽车的人数为X,求X的分布列及数学期望.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式及数据:.
2 / 11
学科网(北京)股份有限公司
$