专题04 统计(期末真题汇编,江苏专用)高二数学下学期
2026-05-20
|
3份
|
73页
|
107人阅读
|
2人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学苏教版选择性必修 第二册 |
| 年级 | 高二 |
| 章节 | 第9章 统计 |
| 类型 | 题集-试题汇编 |
| 知识点 | 统计 |
| 使用场景 | 同步教学-期末 |
| 学年 | 2026-2027 |
| 地区(省份) | 江苏省 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 4.21 MB |
| 发布时间 | 2026-05-20 |
| 更新时间 | 2026-05-20 |
| 作者 | 灬随遇而安灬 |
| 品牌系列 | 好题汇编·期末真题分类汇编 |
| 审核时间 | 2026-05-20 |
| 下载链接 | https://m.zxxk.com/soft/57951669.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
**基本信息**
汇集江苏多地高二期末统计真题,覆盖相关系数、线性/非线性回归、独立性检验及综合应用,以新能源汽车销量、夜间经济规模等真实情境设计问题,注重数据分析与模型应用能力考查。
**题型特征**
|题型|题量/分值|知识覆盖|命题特色|
|----|-----------|----------|----------|
|选择/填空|约15题60分|相关系数判断、回归方程求解、独立性检验基本方法|结合散点图分析相关强度,如考点01中负相关散点图识别题|
|解答题|约10题40分|线性回归方程构建、非线性模型转换(如对数/指数变换)、独立性检验与回归综合|以微短剧消费调查、共享电动车投放等情境设计综合题,如考点05中新能源汽车销量与年份相关性分析及性别购车差异检验|
内容正文:
专题04 统计
5大高频考点概览
考点01相关系数与决定系数
考点02线性回归分析
考点03非线性回归分析
考点04 独立性检验
考点05 线性回归分析与独立性检验综合
(
地
城
考点01
相关系数与决定系数
)1.(24-25高二下·江苏·期末)对四组数据进行统计,获得如图散点图,其中线性相关性比较强且负相关的是( )
A. B. C. D.
2.(24-25高二下·江苏宿迁·期末)对于变量有观测数据,得散点图1;对于变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )
A. B.
C. D.
3.(24-25高二下·江苏·期末)下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于
B.设,若,,则
C.线性回归直线一定经过样本点的中心
D.一个袋子中有个大小相同的球,其中有个黄球、个白球,从中不放回地随机摸出个球作为样本,用随机变量表示样本中黄球的个数,则服从二项分布,且
4.(24-25高二下·江苏扬州·期末)(多选)下列选项中正确的有( )
A.若随机变量分布,则X的数学期望
B.若随机变量,则X的方差
C.在线性回归分析中,相关系数r满足
D.在线性回归分析中,若相关系数r的绝对值越大,则两变量相关程度越强
5.(24-25高二下·江苏·期末)(多选)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了10组数据,绘制散点图如图所示,并进行线性回归分析,若去掉点后,下列说法正确的是( )
A.决定系数变大
B.相关系数变小
C.残差平方和变小
D.这些数据中的x的平均值变小,的平均值变大
6.(24-25高二下·江苏南京·期末)已知一组变量线性相关,样本相关系数,现将坐标原点平移到点,则大多数点应该落在第____象限.
7.(24-25高二下·江苏连云港·期末)已知x和y的散点图如图所示,在相关关系中,若用拟合时的决定系数为,用拟合时的决定系数为,则,中较大的是________.
8.(24-25高二下·江苏·期末)在线性回归分析模型中,变量与相对应的四组数据为,,,,表示解释变量对于预报变量变化的贡献率,则_____.
附:,,.
9.(24-25高二下·江苏·期末)已知一系列样本点满足,,由最小二乘法得到与的回归方程,现用决定系数来判断拟合效果(越接近1,拟合效果越好),若,则______________.(参考公式:决定系数)
10.(24-25高二下·江苏·期末)近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模稳定增长,有关部门整理了2017—2022年中国夜间经济的数据,把市场发展规模记为(单位:万亿元),并把2017—2022年对应的年份代码依次记为,经分析,判断可用函数模型拟合与的关系(为参数).令,计算得,,由最小二乘法得经验回归方程为,则的值为______.为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数______.
(参考公式:决定系数,参考数据:);
(
地
城
考点02
线性回归分析
)1.(24-25高二下·江苏泰州·期末)已知的取值如下表所示,若与有线性相关关系且与之对应的线性回归方程为,则的值为( )
1
3
5
7
5.8
6.2
6.6
A.5 B.6 C.7 D.8
2.(24-25高二下·江苏南通·期末)下表提供了某厂进行技术改造后生产产品过程中记录的产量x(单位:t)与相应的生产能耗y(单位:t标准煤)的几组数据:
3
4
5
6
标准煤
2.5
3
m
4.5
根据散点图分析知x与y线性相关,且求得经验回归方程为,则( )
A.x与y负相关 B.
C.回归直线过点 D.时的残差为0.05
3.(24-25高二下·江苏扬州·期末)已知变量x,y线性相关,其一组样本数据(,2,3,4,5),满足,用最小二乘法得到的线性回归方程是.现增加一个数据,重新计算得到的回归直线斜率是,时,y的估计值是( )
A.3 B. C. D.
4.(24-25高二下·江苏南京·期末)用模型拟合一组数据时,为了求出非线性回归方程,设,其变换后得到线性回归方程为,则c等于( )
A. B. C.2 D.
5.(24-25高二下·江苏盐城·期末)已知变量x,y的取值如下表所示,若y与x线性相关,且线性回归方程为,则等于
x
2
4
5
6
8
y
20
40
60
70
80
A.0.5 B.1.5 C.2 D.2.5
6.(24-25高二下·江苏南京·期末)某能源汽车制造公司近5年的利润情况如下表所示:
第x年
1
2
3
4
5
利润y(亿元)
2
3
4
m
7
已知变量y与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为:,则m的值为( )
A.4.5 B.4.8 C.5 D.5.4
7.(24-25高二下·江苏常州·期末)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的残差为( )
A. B. C. D.
8.(24-25高二下·江苏淮安·期末)(多选)为了探讨学生的物理成绩与数学成绩之间的关系,从某批学生中随机抽取10名学生的成绩,并计算出,物理成绩关于数学成绩的线性回归方程为,则下列说法正确的是( )
A.
B.当某学生数学成绩为100时,物理成绩一定为92.5
C.相关系数
D.现发现10位同学中有两位同学数据(70,65)和(90,100)误差较大,剔除这两对数据后,得到的线性回归方程为,则实数的值为
9.(24-25高二下·江苏·期末)(多选)下列命题正确的是( )
A.两个随机变量的线性相关性越强,则样本相关系数越接近于1
B.对具有线性相关关系的变量,,有一组观测数据,其经验回归方程是,且,则实数的值是
C.已知随机变量的方差为4,则的标准差是6
D.已知随机变量,若,则
10.(24-25高二下·江苏·期末)将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中6个区域,统计这些区域内的某种水源指标和某植物分布的数量,得到样本,且其相关系数,记关于的线性回归方程为.经计算可知:,则__________.
参考公式:.
11.(24-25高二下·江苏·期末)高质量发展是全面建设社会主义现代化国家的首要任务,创新研发是高质量发展的重要前提.某公司研发新产品的投入(单位:百万元)与该产品的收益(单位:百万元)的5组统计数据如下表所示,且经验回归方程为.
x
5
6
8
9
12
y
16
20
25
28
(1)求的值;
(2)若将图表中的点去掉,判断样本相关系数是否改变,并说明你的理由.
参考数据:样本相关系数
12.(24-25高二下·江苏徐州·期末)某研究机构测试了5款新能源汽车,电池容量与实际续航里程之间对应数据如下:
电池容量
40
50
60
70
80
实际续航里程
260
310
380
420
480
已知电池容量与实际续航里程之间具有很强的线性相关关系,求关于的经验回归方程,并估计当时对应的值.
附:经验回归方程中,,.
13.(24-25高二下·江苏南京·期末)“爱国、敬业、诚信、友善”是社会主义核心价值观个人层面的价值准则.某学校为加强对学生的教育,倡导全体学生为特困学生捐款,举行“一元钱,一片心,诚信用水”活动,学生在购水处每领取一瓶矿泉水,便自觉向捐款箱中至少投入一元钱,现统计了连续5天的售出和收益情况,如下表:
售出水量
(单位:箱)
7
6
6
5
6
收益
(单位:元)
165
142
148
125
150
(1)求收益y关于售出水量x的回归直线方程,并计算每天售出8箱水时预计收益是多少元?
(2)期中考试以后,学校决定将诚信用水的收益,以奖学金的形式奖励给品学兼优的特困生,规定:特困生考入年级前200名,获一等奖学金500元;考入年级从第201名到500名的同学,获二等奖学金300元;考入年级501名及以后的特困生不获得奖学金.甲、乙两名学生获一等奖学金的概率均为,获二等奖学金的概率均为,不获得奖学金的概率均为.如果已知甲、乙两名学生获得哪个等第的奖学金是相互独立的,求甲、乙两名学生所获得奖学金总金额X的分布列及数学期望
附:
14.(24-25高二下·江苏·期末)某旅游景点统计今年五一期间进入景区的游客人数(单位:千人)如下:
日期
5月1日
5月2日
5月3日
5月4日
5月5日
第天
1
2
3
4
5
参观人数
2.2
2.6
3.1
5.2
6.9
(1)根据上表数据,判断成对样本数据的线性相关程度,请用样本相关系数加以说明;(若,则认为与的线性相关性很强),如果与的线性相关性很强,那么求出关于的经验回归方程;
(2)五一期间景区开放南门、东门和北门供游客出入,游客从南门、东门和北门进入景区的概率分别为,且出景区与入景区选择相同门的概率为,选择与入景区不同两门的概率各为.假设游客从南门、东门、北门出入景点互不影响,现有甲、乙、丙、丁4名游客于5月1日游玩景点,设为4人中从东门出景区的人数,求的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:经验回归方程,其中,.
样本相关系数.
(
地
城
考点0
3
非线性回归分析
)1.(24-25高二下·江苏·期末)下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对y与t的关系进行拟合,则根据该回归模型,预测第6个月该物种的繁殖数量为( )
第个月
1
2
3
繁殖数量
A.百只 B.百只 C.百只 D.百只
2.(24-25高二下·江苏无锡·期末)已知随机变量,的五组观测数据如下表:
1
2
3
4
5
由表中数据通过模型得到经验回归方程为,则实数的值为______.
3.(24-25高二下·江苏·期末)中国茶文化博大精深,饮茶深受大众喜爱,茶水的口感与茶叶类型和水的温度有关,某数学建模小组为了获得茶水温度y(单位:)关于时间x(单位:min)的回归方程模型,通过实验收集在室温,用同一温度的水冲泡的条件下,茶水温度随时间变化的7组数据,并对数据做初步处理得到如图所示散点图以及如表所示数据.
73.5
3.85
表中:,
(1)根据散点图判断: ①与②哪一个更适宜作为该茶水温度y关于时间x的经验回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立该茶水温度y关于时间x的经验回归方程
(3)已知该茶水温度降至口感最佳,根据(2)中的经验回归方程,求在相同条件下,刚泡好的茶水,大约需要放置多长时间才能达到最佳饮用口感.
附:(1)对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计分别为,
(2)参考数据:,,,,.
4.(24-25高二下·江苏苏州·期末)随着科技的进步及人民生活水平的提高,人们对于智能化生活的需求逐渐增加.李明统计了他在2011年至2020年的年收入与他购买电子产品的花销的数据.
为了预测他在2021年年收入为20万元时,在电子产品上花销为多少,建立了关于的两个回归模型:
模型①:由最小二乘公式可求得与的线性回归方程:;
模型②:由样本点的分布,可以认为样本点集中在曲线:的附近,对年收入做变换,令.则,且有,,,.
(1)根据所给的统计量,求模型②中关于的回归方程;
(2)分别利用这两个回归模型,预测李明年收入为20万元时的电子产品花销为多少百元?(结果保留两位小数).
附:样本的最小二乘估计公式为,;
参考数据:,.
5.(24-25高二下·江苏·期末)混凝土具有原材料丰富、抗压强度高、耐久性好等特点,是目前使用量最大的土木建筑材料.抗压强度是混凝土质量控制的重要技术参数,也是实际工程对混凝土要求的基本指标.为了解某型号某批次混凝土的抗压强度(单位:)随龄期(单位:天)的发展规律,质检部门在标准试验条件下记录了10组混凝土试件在龄期分别为时的抗压强度的值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.
9.4
29.7
2
366
5.5
439.2
55
表中.
(1)根据散点图判断与哪一个适宜作为抗压强度关于龄期的回归方程类型?选择其中的一个模型,并根据表中数据,建立关于的回归方程;
(2)工程中常把龄期为28天的混凝土试件的抗压强度视作混凝土抗压强度标准值.已知该型号混凝土设置的最低抗压强度标准值为.
(i)试预测该批次混凝土是否达标?
(ii)由于抗压强度标准值需要较长时间才能评定,早期预测在工程质量控制中具有重要的意义.经验表明,该型号混凝土第7天的抗压强度与第28天的抗压强度具有线性相关关系,试估计在早期质量控制中,龄期为7天的试件需达到的抗压强度.
附:
参考数据:.
(
地
城
考点0
4
独立性检验
)1.(24-25高二下·江苏·期末)读万卷书,行万里路.随着我国教育模式由“应试教育”向“素质教育”转变,研学旅行作为一种传统而现代的素质教育手段被广泛关注.某校对“是否喜欢参加暑期研学旅行与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢参加暑期研学旅行的人数占男生人数的,女生中喜欢参加暑期研学旅行的人数占女生人数的.若有95%的把握认为是否喜欢参加暑期研学旅行与学生性别有关,则被调查的学生中,男生的人数不可能为( )
A.25 B.45 C.60 D.75
2.(24-25高二下·江苏连云港·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
男生
女生
合计
选生物学
不选生物学
合计
m
m
2m
3.(24-25高二下·江苏无锡·期末)(多选)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,并根据形成的2×2列联表,计算得到,根据小概率值为的独立性检验,则( )
附:
0.100
0.050
0.010
2.706
3.841
6.635
A.若,则认为“毛色”和“角”无关
B.若,则认为“毛色”和“角”有关,此推断犯错误的概率不超过10%
C.若,则认为“毛色”和“角”无关
D.若,则认为“毛色”和“角”有关,此推断犯错误的概率不超过1%
4.(24-25高二下·江苏镇江·期末)某小吃店的日盈利(单位:百元)与当天平均气温(单位:)之间有如下数据:由表中数据可得回归方程中.试预测当天平均气温为时,小吃店的日盈利约为__________百元.
0
1
2
百元
5
4
2
2
1
5.(24-25高二下·江苏连云港·期末)为了鉴定新疫苗的效力,将60只小白鼠随机地分为两组,在其中一组接种疫苗后,两组都注射了病源菌,其结果如下面的列联表.根据此列联表中的数据可以求得________.
发病
未发病
合计
接种
3
27
30
未接种
17
13
30
合计
20
40
60
参考公式:,其中.
6.(24-25高二下·江苏南通·期末)为了解高中生的体育成绩(优秀与非优秀)和性别是否有关,对某高中在校学生进行了抽样调查,调查结果如下表所示:
优秀
非优秀
合计
男
s
30
50
女
5
t
50
合计
25
75
100
(1)求的值;
(2)依据小概率值的独立性检验,能否认为体育成绩与性别有关?
附:,其中.
0.050
0.010
0.001
k
3.841
6.635
10.828
7.(24-25高二下·江苏淮安·期末)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了50人,得到如下列联表:
正常
不正常
合计
患该疾病
7
18
25
未患该疾病
19
6
25
合计
26
24
50
(1)记超声波检查结果不正常者患该疾病的概率为,求的估计值;
(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.
附:.
8.(24-25高二下·江苏徐州·期末)为了解学生对某项运动的喜欢情况,学校进行了一次抽样调查,得到如下数据:
男生
女生
合计
喜欢
65
35
100
不喜欢
50
50
100
合计
115
85
200
(1)能否有99%的把握认为是否喜欢该项运动与性别有关?
(2)若学校有甲,乙两队进行此项运动比赛,每场比赛采用“5局3胜制”(有一队先胜3局即获胜,比赛结束),甲队每局获胜的概率为().
①若比赛打满5局的概率为,求的最大值;
②若,在甲队赢得该场比赛的条件下,求比赛的局数的概率分布及数学期望.
附:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
9.(24-25高二下·江苏扬州·期末)为了解某小区居民的周末休闲方式是否与性别有关,随机抽取了该小区居民100 人进行了调查,其中女性60人,男性40人,女性中有40人休闲方式是看电视,另外20人休闲方式是运动;男性中有10人休闲方式是看电视,另外30人休闲方式是运动.
(1)根据以上数据将如下2×2列联表补充完整;
合计
40
合计
(2)请根据小概率值的独立性检验,判断休闲方式与性别是否有关.
附:,
10.(24-25高二下·江苏泰州·期末)某中学对50名学生的学习兴趣和主动预习情况进行了长期的调查,得到的统计数据如下表所示.
主动预习
不太主动预习
合计
学习兴趣高
18
学习兴趣一般
19
合计
24
50
(1)补全该表;
(2)试运用独立性检验的思想方法判断:是否有以上的把握认为,学生的学习兴趣与主动预习有关.
附:独立性检验临界值表
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中).
11.(24-25高二下·江苏南京·期末)目前,江苏省城市足球联赛简称“苏超”战火正燃.某大型企业工会为了丰富员工的业余体育文化生活,传播足球运动文化,组建了足球社团.企业为了解员工喜欢足球是否与性别有关,随机抽取了男、女员工各50名进行调查,部分数据如表所示:
喜欢足球
不喜欢足球
合计
男
m
20
女
15
n
合计
100
(1)求m,n的值,试运用独立性检验的思想方法判断,能否有99.5%的把握,认为该企业员工喜欢足球与性别有关?
(2)2025年7月5日,“苏超”联赛将在南京奥体中心体育场迎来常规赛第6轮比赛.该企业足球社团计划赛事当天组织部分“球迷”现场观赛,先从这100名参与调查且喜欢足球的员工中按性别用分层抽样的方法抽取6人,然后再从这6人中随机抽取3人担任现场观赛“球迷”,记抽出的3人中女性的人数为,求的分布列和数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
12.(24-25高二下·江苏·期末)为调查学生喜欢在食堂就餐是否和性别有关,学校随机调研了男女生各100人,经统计得到如下列联表:
男
女
喜欢
80
40
不喜欢
20
60
(1)依据的独立性检验,判断学生喜欢在食堂就餐是否与性别有关?
(2)为听取学生对食堂的建议,从学生中抽取9人召开座谈会,并给其中3名同学赠送礼品,每人1份(其余人员仅赠送餐券).已知参加座谈会的学生中有且只有4名学生来自高一,求高一这4名学生中得到礼品的人数的分布列和数学期望.
0.010
0.005
0.001
6.635
7.879
10.828
附:,其中
13.(24-25高二下·江苏·期末)随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析社区的市民是否喜欢网上买菜与年龄是否有关;
(2)社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜,如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选择平台买菜,那么周二选择平台买菜的概率为,求小张周二选择平台买菜的概率.
参考公式及数据:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
14.(24-25高二下·江苏镇江·期末)某校高二年级为研究学生数学成绩与语文成绩的关系,采取有放回的简单随机抽样,从高二学生中抽取样本容量为200的样本,将所得数学成绩与语文成绩的样本观测数据整理如下:
语文成绩
合计
优秀
不优秀
数学成绩
优秀
50
30
80
不优秀
40
80
120
合计
90
110
200
(1)根据的独立性检验,能否认为数学成绩与语文成绩有关联?
(2)现从该校学生中任选一人,A表示“选到的学生语文成绩不优秀”,B表示“选到的学生数学成绩不优秀”.请利用样本数据,估计的值.
附:.
0.05
0.01
0.001
3.841
6.635
10.828
(
地
城
考点0
5
线性回归分析与独立性检验综合应用
)1.(25-26高二上·江苏常州·期末)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解乡村居民对新能源汽车的接受程度,某乡村汽车协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取80名村民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了以下统计数据:
选择新能源汽车
选择传统汽车
总计
40岁以下
56
80
40岁及以上
36
80
总计
160
完成列联表,并判断是否有的把握认为选择新能源汽车与年龄有关;
(2)为了了解某一地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量(单位:万台)关于年份的线性回归方程,且销售量的方差为,年份的方差为.求与间的样本相关系数,并据此判断该地区新能源汽车销售量与年份的线性相关性强弱.
附:(i)在线性回归方程中,;
(ii)样本相关系数,若,则可判断与线性相关性较强;
(iii),其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
2.(24-25高二下·江苏宿迁·期末)某景区为测试并推广一款预约游览APP,上线的第1、2两天在APP上预约可获得费游览资格,第3天开始恢复为原票价,下表是该景区在该APP上前7天的预约情况
第t天
1
2
3
4
5
6
7
预约量y(万张)
9.03
9
8.58
8.7
8.76
8.74
8.79
经计算得:,,.
(1)由于前两天预约游览免费,所以剔除第1、2两天数据,求y关于t的线性回归方程及第5天的残差:
(2)为了调查该APP在不同年龄的人群中的推广情况,从第7天成人游客中随机抽取200人进行分析,所得的部分数据见下表:
50岁以下
50岁(含50)以上
合计
通过APP预约人数
70
其它方式购票人数
80
合计
100
①完成以上2×2列联表:
②如果有95%的把握认定游客通过APP预约游览与其年龄有关,就要进行针对性宣传,请你判断是否需要针对年龄超过50岁(含50)以上的人群进行宣传.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:,,
3.(24-25高二下·江苏镇江·期末)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年某地区新能源乘用车的年销售量与年份的统计表:
年份x
2020
2021
2022
2023
2024
销量y(万台)
1.00
1.40
1.70
1.90
2.00
某机构调查了该地区60位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
购置传统燃油车
购置新能源车
总计
男性车主
10
48
女性车主
2
总计
60
(1)求新能源乘用车的销量y关于x年份的线性相关系数r,并判断y与x是否线性相关;
(2)请将上述列联表补充完整,并判断是否有的把握认为购车车主是否购置新能源乘用车与性别有关.
参考公式:
相关系数;,其中.
参考数据:.
备注:若,则可判断y与x线性相关.
临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
4.(24-25高二下·江苏·期末)某公司计划对未开通共享电动车的某市进行车辆投放,为了确定车辆投放量,对过去在其他城市的投放量情况以及年使用人次进行了统计,得到了投放量(单位:千辆)与年使用人次(单位:千次)的数据如下表所示,根据数据绘制投放量与年使用人次的散点图如图所示.
1
2
3
4
5
6
7
6
11
21
34
66
101
196
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型或指数函数模型对两个变量的关系进行拟合.请问哪个模型更适宜作为投放量与年使用人次的回归方程类型(给出判断即可,不必说明理由)?并求出关于的回归方程;
(2)公司为了测试共享电动车的性能,从所有同型号共享电动车中随机抽取100辆进行等距离骑行测试,骑行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的共享电动车占比.请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为共享电动车是否报废与保养有关?
\
保养
未保养
合计
报废
20
未报废
合计
60
100
参考数据:,.
62.14
1.54
2535
50.12
3.47
参考公式:对于一组数据,,,其回归直线的斜率和截距的最小二乘估计公式分别为: ,.,
其中.
0.25
0.1
0.05
0.025
0.01
0.001
1.323
2.706
3.841
5.024
6.635
10.828
5.(24-25高二下·江苏·期末)随着互联网的高速发展和新媒体形式的不断丰富,微短剧作为一种新兴的文化载体,正逐渐成为拓展文化消费空间的重要途径.某媒体为了了解微短剧消费者的年龄分布,随机调查了200名消费者,得到如下列联表:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
45
不是微短剧消费者
合计
100
200
(1)根据小概率值的独立性检验,能否认为“是微短剧消费者”与“年龄不超过40岁”有关联?
(2)记2020~2024年的年份代码x依次为1,2,3,4,5,下表为2020~2023年中国微短剧市场规模及2024年中国微短剧预测的市场规模y(单位:亿元)与x的统计数据:
年份代码x
1
2
3
4
5
市场规模y
9.4
36.8
101.7
373.9
m
根据上表数据求得y关于x的经验回归方程为,求相关系数r,并判断该经验回归方程是否有价值.
参考公式:,其中,.
,相关系数..
若,则认为经验回归方程有价值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
1 / 4
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题04 统计
5大高频考点概览
考点01相关系数与决定系数
考点02线性回归分析
考点03非线性回归分析
考点04 独立性检验
考点05 线性回归分析与独立性检验综合
(
地
城
考点01
相关系数与决定系数
)1.【答案】B
2.【答案】C
3.【答案】D
4.【答案】ACD
5.【答案】AC
6.【答案】二、四
7.【答案】
8.【答案】1
9.【答案】0.96
10.【答案】
(
地
城
考点02
线性回归分析
)
1.【答案】C
2.【答案】C
3.【答案】B
4.【答案】B
5.【答案】B
6.【答案】C
7.【答案】C
8.【答案】ACD
9.【答案】BC
10.【答案】/1.875
11.【答案】(1);(2)不变,理由见解析.
12.【答案】,
13.【答案】(1),186(2)分布列见解析,600
14.【答案】(1),与线性相关性很强;.(2)分布列见解析,数学期望为1,方差为.
(
地
城
考点0
3
非线性回归分析
)
1.【答案】D
2【答案】
3.【答案】(1)②更适宜(2)(3)
4.【答案】(1)(2)模型①的电子产品花销的预测值为(万元),模型②的电子产品花销的预测值为(万元)
5.【答案】(1)适宜,.(2)(i)达标;(ii).
(
地
城
考点0
4
独立性检验
)
1.【答案】A
2.【答案】A
3.【答案】BC
4.【答案】6
5.【答案】14.7
6.【答案】(1)(2)成绩与性别有关
7.【答案】(1)(2)认为主场作战与比赛胜负与主场有关联
8.【答案】(1)没有99%的把握认为是否喜欢该项运动与性别有关(2)①;②分布列见解析,
9.【答案】
看电视
运动
合计
男性
10
30
40
女性
40
20
60
合计
50
50
100
(2)提出零假设:该小区居民的周末休闲方式和性别无关,
根据列联表中的数据,可得:
,
根据小概率值的独立性检验,我们推断不成立,
即认为该小区居民的周末休闲方式和性别有关,此推断犯错误的概率不大于.
10.【答案】(1)
主动预习
不太主动预习
合 计
学习兴趣高
18
7
25
学习兴趣一般
6
19
25
合计
24
26
50
(2),
所以有以上的把握认为学生的学习兴趣与主动预习有关.
11.
【答案】(1),,有99.5%的把握认为满意度与性别有关.(2)分布列见解析,1
12.【答案】(1)有的把握认为喜欢食堂就餐与性别有关.(2)分布列见解析,数学期望为.
13.【答案】(1)有关(2)
14.【答案】(1)认为数学成绩与语文成绩有关(2).
(
地
城
考点0
5
线性回归分析与独立性检验综合应用
)
1.【答案】(1)表格见解析,没有的把握认为选择新能源汽车与年龄有关;(2)0.84,与线性相关性较强.
2.【答案】(1),残差为0.046(2)①列联表见解析;②需要针对年龄超过50岁(含50)以上的人群进行宣传,理由见解析
3.【答案】(1),y与x线性相关(2)列联表见解析,有的把握认为购车车主是否购置新能源乘用车与性别有关
4.【答案】(1)适宜作为投放量与年使用人次的回归方程类型,(2)列联表见解析,认为是否报废与保养有关
5.【答案】(1)有关联(2),该经验回归方程有价值.
1 / 4
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题04 统计
5大高频考点概览
考点01相关系数与决定系数
考点02线性回归分析
考点03非线性回归分析
考点04 独立性检验
考点05 线性回归分析与独立性检验综合
(
地
城
考点01
相关系数与决定系数
)1.(24-25高二下·江苏·期末)对四组数据进行统计,获得如图散点图,其中线性相关性比较强且负相关的是( )
A. B. C. D.
【答案】B
【分析】根据散点图和相关性的关系,判断结果.
【详解】由散点图知,相关系数对应的散点图呈负相关,
且线性相关性比较强.
故选:B.
2.(24-25高二下·江苏宿迁·期末)对于变量有观测数据,得散点图1;对于变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )
A. B.
C. D.
【答案】C
【分析】根据散点图和相关系数的概念进行判断即可.
【详解】根据图1和图2可以看出,随的增大而增大,随的增大而减小,
所以.
因为图1的数据点比图2的更集中,所以.
所以.
故选:C.
3.(24-25高二下·江苏·期末)下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于
B.设,若,,则
C.线性回归直线一定经过样本点的中心
D.一个袋子中有个大小相同的球,其中有个黄球、个白球,从中不放回地随机摸出个球作为样本,用随机变量表示样本中黄球的个数,则服从二项分布,且
【答案】D
【分析】A选项,根据相关系数的定义作出判断;B选项,利用二项分布的期望和方差公式得到方程,求出答案;C选项,根据样本中心点的定义作出判断;D选项,由超几何分布和二项分布的定义得到D错误.
【详解】对于A,两个随机变量的线性相关性越强,相关系数的绝对值越接近于,A正确;
对于B,,解得,,故B正确;
对于C,线性回归直线一定经过样本点的中心,故C正确;
对于D,由于是不放回地随机摸出个球作为样本,
所以由超几何分布的定义知服从超几何分布,且,故D错误.
故选:D
4.(24-25高二下·江苏扬州·期末)(多选)下列选项中正确的有( )
A.若随机变量分布,则X的数学期望
B.若随机变量,则X的方差
C.在线性回归分析中,相关系数r满足
D.在线性回归分析中,若相关系数r的绝对值越大,则两变量相关程度越强
【答案】ACD
【分析】求出可判断A;求出可判断B;根据相关系数的意义可判断CD.
【详解】对于A, ,则,所以,故A正确;
对于B,若随机变量,则X的方差,故B错误;
对于C,在线性回归分析中,相关系数r满足,故C正确;
对于D,在线性回归分析中,若相关系数r的绝对值越大,则两变量相关程度越强,故D正确.
故选:ACD.
5.(24-25高二下·江苏·期末)(多选)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了10组数据,绘制散点图如图所示,并进行线性回归分析,若去掉点后,下列说法正确的是( )
A.决定系数变大
B.相关系数变小
C.残差平方和变小
D.这些数据中的x的平均值变小,的平均值变大
【答案】AC
【分析】由图可知:点较其他的点偏离直线最大,所以去掉点后,回归效果更好.结合相关系数、决定系数、残差平方和以及点的横纵坐标平均值逐项分析判断.
【详解】由图可知:较其他的点偏离直线最大,所以去掉点后,回归效果更好.
对于A,决定系数越接近于1,拟合效果越好,所以去掉点后,决定系数变大,故A正确;
对于B,相关系数越接近于1,线性相关性越强,因为散点图是递增的趋势,所以去掉点后,相关系数变大,故B错误;
对于C,残差平方和变大,拟合效果越差,所以去掉点后,残差平方和变小,故C正确;
对于D,由图可知,点在所有点中,横坐标较小,纵坐标较大,所以去掉点后,x的平均值变大,的平均值变小,故D错误;
故选:AC.
6.(24-25高二下·江苏南京·期末)已知一组变量线性相关,样本相关系数,现将坐标原点平移到点,则大多数点应该落在第____象限.
【答案】二、四
【分析】根据负相关的散点图特点,判断结果即可.
【详解】因为,所以变量负相关,则在以为坐标原点的坐标系下的散点图,大多数点应该落在第二、四象限.
7.(24-25高二下·江苏连云港·期末)已知x和y的散点图如图所示,在相关关系中,若用拟合时的决定系数为,用拟合时的决定系数为,则,中较大的是________.
【答案】
【分析】根据散点图的分布情况判断可得.
【详解】由散点图知,用拟合的效果比拟合的效果要好,
所以,故较大者为.
故答案为:
8.(24-25高二下·江苏·期末)在线性回归分析模型中,变量与相对应的四组数据为,,,,表示解释变量对于预报变量变化的贡献率,则_____.
附:,,.
【答案】1
【分析】根据给定条件,求出回归直线方程,进而求出.
【详解】依题意,
,,
则,,
因此关于的线性回归方程为,
当时,,残差;当时,,残差;
当时,,残差;当时,,残差,
因此,所以.
故答案为:1
9.(24-25高二下·江苏·期末)已知一系列样本点满足,,由最小二乘法得到与的回归方程,现用决定系数来判断拟合效果(越接近1,拟合效果越好),若,则______________.(参考公式:决定系数)
【答案】0.96
【分析】依据决定系数的公式计算即可.
【详解】因为.
故答案为:.
10.(24-25高二下·江苏·期末)近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模稳定增长,有关部门整理了2017—2022年中国夜间经济的数据,把市场发展规模记为(单位:万亿元),并把2017—2022年对应的年份代码依次记为,经分析,判断可用函数模型拟合与的关系(为参数).令,计算得,,由最小二乘法得经验回归方程为,则的值为______.为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数______.
(参考公式:决定系数,参考数据:);
【答案】
【分析】将两边同时取对数可得,结合所给经验回归方程求出,由所给参考数据求出,即可求出决定系数.
【详解】由,将两边同时取对数可得,
令,由最小二乘法得经验回归方程为,
所以,
又
,
所以.
故答案为:;.
(
地
城
考点02
线性回归分析
)
1.(24-25高二下·江苏泰州·期末)已知的取值如下表所示,若与有线性相关关系且与之对应的线性回归方程为,则的值为( )
1
3
5
7
5.8
6.2
6.6
A.5 B.6 C.7 D.8
【答案】C
【分析】根据线性回归方程一定过进行计算即可.
【详解】根据表中数据,,,
因为线性回归方程一定过,
所以,
解得.
故选:C.
2.(24-25高二下·江苏南通·期末)下表提供了某厂进行技术改造后生产产品过程中记录的产量x(单位:t)与相应的生产能耗y(单位:t标准煤)的几组数据:
3
4
5
6
标准煤
2.5
3
m
4.5
根据散点图分析知x与y线性相关,且求得经验回归方程为,则( )
A.x与y负相关 B.
C.回归直线过点 D.时的残差为0.05
【答案】C
【分析】由经验回归方程系数为可对A判断求解;分别求出,然后求出,从而可对B、C判断求解;利用残差知识可对D求解判断.
【详解】A:由经验回归方程为,线性系数为,则与正相关,故A错误;
B、C:由,所以,所以回归直线过点,故C正确;
又,解得,故B错误;
D:时,,则残差为:,故D错误.
故选:C.
3.(24-25高二下·江苏扬州·期末)已知变量x,y线性相关,其一组样本数据(,2,3,4,5),满足,用最小二乘法得到的线性回归方程是.现增加一个数据,重新计算得到的回归直线斜率是,时,y的估计值是( )
A.3 B. C. D.
【答案】B
【分析】根据已知求原数据的样本中心,再确定增加数据后的样本中心,进而得到修正后的回归直线方程,估计的对应值,
【详解】由题设,则,
增加数据后,,且回归直线为,
所以,得,则,
所以时,有
故选:B.
4.(24-25高二下·江苏南京·期末)用模型拟合一组数据时,为了求出非线性回归方程,设,其变换后得到线性回归方程为,则c等于( )
A. B. C.2 D.
【答案】B
【分析】由回归模型,两边取对数,得到,根据题意,得到,即可求解.
【详解】由回归模型,可得,即,
因为变换后得到线性回归方程为,可得,所以.
故选:B.
5.(24-25高二下·江苏盐城·期末)已知变量x,y的取值如下表所示,若y与x线性相关,且线性回归方程为,则等于
x
2
4
5
6
8
y
20
40
60
70
80
A.0.5 B.1.5 C.2 D.2.5
【答案】B
【分析】利用线性回归方程过样本中心点即可求解.
【详解】根据表格可得,,
因为线性回归方程过样本中心点,
所以将代入中得,.
故选:B.
6.(24-25高二下·江苏南京·期末)某能源汽车制造公司近5年的利润情况如下表所示:
第x年
1
2
3
4
5
利润y(亿元)
2
3
4
m
7
已知变量y与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为:,则m的值为( )
A.4.5 B.4.8 C.5 D.5.4
【答案】C
【分析】求出、,代入回归直线方程可得答案.
【详解】因为,,
所以,解得.
故选:C.
7.(24-25高二下·江苏常州·期末)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的残差为( )
A. B. C. D.
【答案】C
【分析】计算增加样本点后的新的样本中心点,代入经验回归方程可求得;根据经验回归方程可求得,由残差定义可得结果.
【详解】,增加两个样本点后的平均数为;
,,
增加两个样本点后的平均数为,
,解得:,新的经验回归方程为:,
则当时,,样本的残差为.
故选:C.
8.(24-25高二下·江苏淮安·期末)(多选)为了探讨学生的物理成绩与数学成绩之间的关系,从某批学生中随机抽取10名学生的成绩,并计算出,物理成绩关于数学成绩的线性回归方程为,则下列说法正确的是( )
A.
B.当某学生数学成绩为100时,物理成绩一定为92.5
C.相关系数
D.现发现10位同学中有两位同学数据(70,65)和(90,100)误差较大,剔除这两对数据后,得到的线性回归方程为,则实数的值为
【答案】ACD
【分析】对于AD:根据线性回归方程必过样本中心点运算求解;对于B:代入,结合回归方程的意义分析判断;对于C:根据正相关的定义分析判断.
【详解】对于选项A:因为线性回归方程必过样本中心点,
由题意可得:,故A正确;
对于选项B:令,可得,
但回归方程只能用于预测结果,并不一定与实际结果完全相等,
所以预测物理成绩为92.5,故B错误;
对于选项C:因为,即线性回归方程为的图象是上升的,
可知与满足正相关,所以相关系数,故C正确;
剔除这两对数据后,,
,
因为线性回归方程必过样本中心点,
所以,则,D正确.
故选:ACD
9.(24-25高二下·江苏·期末)(多选)下列命题正确的是( )
A.两个随机变量的线性相关性越强,则样本相关系数越接近于1
B.对具有线性相关关系的变量,,有一组观测数据,其经验回归方程是,且,则实数的值是
C.已知随机变量的方差为4,则的标准差是6
D.已知随机变量,若,则
【答案】BC
【分析】由相关系数的性质可得A错误;由样本中心点计算相关系数可得B正确;由方差的性质可得C正确;由正态分布的对称性可得D错误.
【详解】对于A,两个随机变量的线性相关性越强,则样本相关系数的绝对值越接近于1.所以A错误;
对于B,,,所以,所以,B正确;
对于C,已知随机变量的方差为4,则的方差是,所以标准差为,故C正确;
对于D,由,由对称性可得,
所以,所以D错误.
故选:BC.
10.(24-25高二下·江苏·期末)将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中6个区域,统计这些区域内的某种水源指标和某植物分布的数量,得到样本,且其相关系数,记关于的线性回归方程为.经计算可知:,则__________.
参考公式:.
【答案】/1.875
【分析】根据参考数据及公式先利用相关系数求出,再求即可.
【详解】因为,
所以,
由,
解得,
所以.
故答案为:
11.(24-25高二下·江苏·期末)高质量发展是全面建设社会主义现代化国家的首要任务,创新研发是高质量发展的重要前提.某公司研发新产品的投入(单位:百万元)与该产品的收益(单位:百万元)的5组统计数据如下表所示,且经验回归方程为.
x
5
6
8
9
12
y
16
20
25
28
(1)求的值;
(2)若将图表中的点去掉,判断样本相关系数是否改变,并说明你的理由.
参考数据:样本相关系数
【答案】(1);
(2)不变,理由见解析.
【分析】(1)首先求出样本中心,再由样本中心在回归直线上求参数值;
(2)根据所去掉的点,结合相关系数公式判断分子、分母各部分的值是否有变化,即可得结论.
【详解】(1)由题设,,
所以,可得;
(2)由(1)知,,故去掉点后样本中心仍然是,
去掉点前,
去掉点后,
显然前后数值没有改变,同理,的值都没有变化,
所以相关系数不变.
12.(24-25高二下·江苏徐州·期末)某研究机构测试了5款新能源汽车,电池容量与实际续航里程之间对应数据如下:
电池容量
40
50
60
70
80
实际续航里程
260
310
380
420
480
已知电池容量与实际续航里程之间具有很强的线性相关关系,求关于的经验回归方程,并估计当时对应的值.
附:经验回归方程中,,.
【答案】,
【分析】求出后根据公式可求回归方程,从而可得预测值.
【详解】,.
,,
所以.
又,,所以,
所以关于的经验回归方程为.
当时,.
13.(24-25高二下·江苏南京·期末)“爱国、敬业、诚信、友善”是社会主义核心价值观个人层面的价值准则.某学校为加强对学生的教育,倡导全体学生为特困学生捐款,举行“一元钱,一片心,诚信用水”活动,学生在购水处每领取一瓶矿泉水,便自觉向捐款箱中至少投入一元钱,现统计了连续5天的售出和收益情况,如下表:
售出水量
(单位:箱)
7
6
6
5
6
收益
(单位:元)
165
142
148
125
150
(1)求收益y关于售出水量x的回归直线方程,并计算每天售出8箱水时预计收益是多少元?
(2)期中考试以后,学校决定将诚信用水的收益,以奖学金的形式奖励给品学兼优的特困生,规定:特困生考入年级前200名,获一等奖学金500元;考入年级从第201名到500名的同学,获二等奖学金300元;考入年级501名及以后的特困生不获得奖学金.甲、乙两名学生获一等奖学金的概率均为,获二等奖学金的概率均为,不获得奖学金的概率均为.如果已知甲、乙两名学生获得哪个等第的奖学金是相互独立的,求甲、乙两名学生所获得奖学金总金额X的分布列及数学期望
附:
【答案】(1),186
(2)分布列见解析,600
【分析】(1)求出、,从而求出回归方程,将代入求出即可;
(2)计算对应的概率的值,求出其分布列和期望值即可.
【详解】(1),
,
,
当时,(元),
即某天售出8箱水的预计收益是186元.
(2)X的取值可能为0,300,500,600,800,1000,
,,
,,
,,
即X的分布列为
X
0
300
500
600
800
1000
P
X的数学期望
(元).
14.(24-25高二下·江苏·期末)某旅游景点统计今年五一期间进入景区的游客人数(单位:千人)如下:
日期
5月1日
5月2日
5月3日
5月4日
5月5日
第天
1
2
3
4
5
参观人数
2.2
2.6
3.1
5.2
6.9
(1)根据上表数据,判断成对样本数据的线性相关程度,请用样本相关系数加以说明;(若,则认为与的线性相关性很强),如果与的线性相关性很强,那么求出关于的经验回归方程;
(2)五一期间景区开放南门、东门和北门供游客出入,游客从南门、东门和北门进入景区的概率分别为,且出景区与入景区选择相同门的概率为,选择与入景区不同两门的概率各为.假设游客从南门、东门、北门出入景点互不影响,现有甲、乙、丙、丁4名游客于5月1日游玩景点,设为4人中从东门出景区的人数,求的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:经验回归方程,其中,.
样本相关系数.
【答案】(1),与线性相关性很强;.
(2)分布列见解析,数学期望为1,方差为.
【分析】(1)由题意求出相关系数并求出回归方程即可;
(2)由全概率公式计算,利用二项分布计算概率,列出分布式,由公式计算期望和方差可得.
【详解】(1)依题意,,而,,,
.
因为时线性相关程度高,所以与线性相关性很强,可以用线性回归模型拟合.
,
因此,回归方程为.
(2)“甲从东门出学校”为事件,“甲从南门进学校”为事件,“甲从东门进学校”为事件,“甲从北门进学校”为事件,
由题意可得,,,,,
由全概率公式得:
同理乙、丙、丁从东门出景区的概率也为,
为4人中从东门出景区的人数,则,
,,,,,
故的分布列为:
0
1
2
3
4
,.
(
地
城
考点0
3
非线性回归分析
)
1.(24-25高二下·江苏·期末)下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对y与t的关系进行拟合,则根据该回归模型,预测第6个月该物种的繁殖数量为( )
第个月
1
2
3
繁殖数量
A.百只 B.百只 C.百只 D.百只
【答案】D
【分析】将回归模型两边取自然对数,并令,由此构建一个u与t的回归直线模型,根据回归直线必过中心点,可求出a值,利用所得回归模型进行预测.
【详解】由题意,两边取自然对数得,
令,则.
,,
∵回归直线必过样本点的中心,∴,
得,∴,则.
当时,.
故选:D.
2.(24-25高二下·江苏无锡·期末)已知随机变量,的五组观测数据如下表:
1
2
3
4
5
由表中数据通过模型得到经验回归方程为,则实数的值为______.
【答案】
【分析】令,则,求出,再根据线性回归方程必过样本中心点即可得解.
【详解】令,
则,
因为,所以,
所以,解得.
故答案为:.
3.(24-25高二下·江苏·期末)中国茶文化博大精深,饮茶深受大众喜爱,茶水的口感与茶叶类型和水的温度有关,某数学建模小组为了获得茶水温度y(单位:)关于时间x(单位:min)的回归方程模型,通过实验收集在室温,用同一温度的水冲泡的条件下,茶水温度随时间变化的7组数据,并对数据做初步处理得到如图所示散点图以及如表所示数据.
73.5
3.85
表中:,
(1)根据散点图判断: ①与②哪一个更适宜作为该茶水温度y关于时间x的经验回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立该茶水温度y关于时间x的经验回归方程
(3)已知该茶水温度降至口感最佳,根据(2)中的经验回归方程,求在相同条件下,刚泡好的茶水,大约需要放置多长时间才能达到最佳饮用口感.
附:(1)对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计分别为,
(2)参考数据:,,,,.
【答案】(1)②更适宜
(2)
(3)
【分析】(1)根据散点图选择②;
(2)取对数,再利用最小二乘法公式求出回归直线方程即可;
(3)利用(1)中回归方程,列出关于的方程求解即得.
【详解】(1)由散点图知,点的分布呈现出曲线的趋势,因此更适宜的回归方程为②,即.
(2)由,得,对等式两边取自然对数,得,
令,则,
,
,
结合表中数据,得,
结合参考数据可得,由,得结合参考数据可得,
所以茶水温度y关于时间x的回归方程为.
(3)依题意,室温下,茶水温度降至口感最佳,
即,整理得,
于是,解得,
所以在相同条件下,刚泡好的茶水大约需要放置7.5min才能达到最佳饮用口感.
4.(24-25高二下·江苏苏州·期末)随着科技的进步及人民生活水平的提高,人们对于智能化生活的需求逐渐增加.李明统计了他在2011年至2020年的年收入与他购买电子产品的花销的数据.
为了预测他在2021年年收入为20万元时,在电子产品上花销为多少,建立了关于的两个回归模型:
模型①:由最小二乘公式可求得与的线性回归方程:;
模型②:由样本点的分布,可以认为样本点集中在曲线:的附近,对年收入做变换,令.则,且有,,,.
(1)根据所给的统计量,求模型②中关于的回归方程;
(2)分别利用这两个回归模型,预测李明年收入为20万元时的电子产品花销为多少百元?(结果保留两位小数).
附:样本的最小二乘估计公式为,;
参考数据:,.
【答案】(1)
(2)模型①的电子产品花销的预测值为(万元),模型②的电子产品花销的预测值为(万元)
【分析】(1)结合已知数据和公式求出这两个系数即可得回归方程;
(2)把代入模型①、②的回归方程,算出即可.
【详解】(1)由题意,知,,可得,
又由,
则,
所以,模型②中关于的回归方程.
(2)当时,模型①的电子产品花销的预测值为(百元),
当时,模型②的电子产品花销的预测值为
(百元).
5.(24-25高二下·江苏·期末)混凝土具有原材料丰富、抗压强度高、耐久性好等特点,是目前使用量最大的土木建筑材料.抗压强度是混凝土质量控制的重要技术参数,也是实际工程对混凝土要求的基本指标.为了解某型号某批次混凝土的抗压强度(单位:)随龄期(单位:天)的发展规律,质检部门在标准试验条件下记录了10组混凝土试件在龄期分别为时的抗压强度的值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.
9.4
29.7
2
366
5.5
439.2
55
表中.
(1)根据散点图判断与哪一个适宜作为抗压强度关于龄期的回归方程类型?选择其中的一个模型,并根据表中数据,建立关于的回归方程;
(2)工程中常把龄期为28天的混凝土试件的抗压强度视作混凝土抗压强度标准值.已知该型号混凝土设置的最低抗压强度标准值为.
(i)试预测该批次混凝土是否达标?
(ii)由于抗压强度标准值需要较长时间才能评定,早期预测在工程质量控制中具有重要的意义.经验表明,该型号混凝土第7天的抗压强度与第28天的抗压强度具有线性相关关系,试估计在早期质量控制中,龄期为7天的试件需达到的抗压强度.
附:
参考数据:.
【答案】(1)适宜,.
(2)(i)达标;(ii).
【分析】(1)先换元再根据已知数据求出即可求出回归直线;
(2)根据回归直线预测即可.
【详解】(1)由散点图可以判断,适宜作为抗压强度关于龄期的回归方程类型.
令,先建立关于的线性回归方程,
由于
所以关于的线性回归方程为,
因此关于的线性回归方程为.
(2)(i)由(1)知,当龄期为28天,即时,
抗压强度的预报值,
因为,所以预测该批次混凝土达标.
(ii)令,得.
所以估计龄期为7天的混凝土试件需达到的抗压强度为.
(
地
城
考点0
4
独立性检验
)
1.(24-25高二下·江苏·期末)读万卷书,行万里路.随着我国教育模式由“应试教育”向“素质教育”转变,研学旅行作为一种传统而现代的素质教育手段被广泛关注.某校对“是否喜欢参加暑期研学旅行与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢参加暑期研学旅行的人数占男生人数的,女生中喜欢参加暑期研学旅行的人数占女生人数的.若有95%的把握认为是否喜欢参加暑期研学旅行与学生性别有关,则被调查的学生中,男生的人数不可能为( )
A.25 B.45 C.60 D.75
【答案】A
【分析】根据条件设男生人数为,再根据条件列出列联表,计算,解不等式.
【详解】依题意,设男生的人数为,可列出2×2列联表如下所示:
是否喜欢参加暑期研学旅行
性别
总计
男生
女生
喜欢
不喜欢
总计
则=.
由题意知,即,得,所以.
又,所以结合选项知B,C,D项都可以.
2.(24-25高二下·江苏连云港·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
【答案】A
【分析】设总人数为,根据给定条件,求出的观测值并建立不等式,进而求出的最小整数值得解.
【详解】设总人数为,则男生选学生物学的人数为,女生选学生物学的人数为,
则列联表为:
男生
女生
合计
选生物学
不选生物学
合计
m
m
2m
因此,
即,又为的倍数,所以男生最少有人.
故选:A
3.(24-25高二下·江苏无锡·期末)(多选)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,并根据形成的2×2列联表,计算得到,根据小概率值为的独立性检验,则( )
附:
0.100
0.050
0.010
2.706
3.841
6.635
A.若,则认为“毛色”和“角”无关
B.若,则认为“毛色”和“角”有关,此推断犯错误的概率不超过10%
C.若,则认为“毛色”和“角”无关
D.若,则认为“毛色”和“角”有关,此推断犯错误的概率不超过1%
【答案】BC
【分析】根据独立性检验的判断原则一一分析即可.
【详解】对AB,若,因为 ,则认为“毛色”和“角”有关,此推断犯错误的概率不超过10%,故A 错,B 对;
对CD,若,因为,则认为“毛色”和“角”无关,故C正确,D错误.
故选:BC.
4.(24-25高二下·江苏镇江·期末)某小吃店的日盈利(单位:百元)与当天平均气温(单位:)之间有如下数据:由表中数据可得回归方程中.试预测当天平均气温为时,小吃店的日盈利约为__________百元.
0
1
2
百元
5
4
2
2
1
【答案】6
【分析】根据已知数据求出样本中心点,代入得到值,再令即可得解.
【详解】由已知数据可知变量的平均值,
变量的平均值,
所以样本数据的中心点为,
因为,所以,代入,得,
所以,
令,得.
故答案为:6.
5.(24-25高二下·江苏连云港·期末)为了鉴定新疫苗的效力,将60只小白鼠随机地分为两组,在其中一组接种疫苗后,两组都注射了病源菌,其结果如下面的列联表.根据此列联表中的数据可以求得________.
发病
未发病
合计
接种
3
27
30
未接种
17
13
30
合计
20
40
60
参考公式:,其中.
【答案】14.7
【分析】根据公式计算得解.
【详解】,
故答案为:14.7
6.(24-25高二下·江苏南通·期末)为了解高中生的体育成绩(优秀与非优秀)和性别是否有关,对某高中在校学生进行了抽样调查,调查结果如下表所示:
优秀
非优秀
合计
男
s
30
50
女
5
t
50
合计
25
75
100
(1)求的值;
(2)依据小概率值的独立性检验,能否认为体育成绩与性别有关?
附:,其中.
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)
(2)成绩与性别有关
【分析】(1)根据表格数据分别求出,即可得解;
(2)利用表格数据求出,与临界值比较即可判断结论.
【详解】(1)由表格数据可知,,
所以.
(2)提出零假设:成绩与性别无关.
根据列联表中的数据可以求得
.
根据小概率值的独立性检验,我们推断不成立,即认为成绩与性别有关.
7.(24-25高二下·江苏淮安·期末)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了50人,得到如下列联表:
正常
不正常
合计
患该疾病
7
18
25
未患该疾病
19
6
25
合计
26
24
50
(1)记超声波检查结果不正常者患该疾病的概率为,求的估计值;
(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.
附:.
【答案】(1)
(2)认为主场作战与比赛胜负与主场有关联
【分析】(1)根据古典概型计算求解;
(2)计算卡方,与临界值比较即可判断.
【详解】(1).
(2):假设超声波检查结果与患该疾病有关没有关联.
根据小概率值的独立性检验,认为超声波检查结果与患该疾病有关联.
8.(24-25高二下·江苏徐州·期末)为了解学生对某项运动的喜欢情况,学校进行了一次抽样调查,得到如下数据:
男生
女生
合计
喜欢
65
35
100
不喜欢
50
50
100
合计
115
85
200
(1)能否有99%的把握认为是否喜欢该项运动与性别有关?
(2)若学校有甲,乙两队进行此项运动比赛,每场比赛采用“5局3胜制”(有一队先胜3局即获胜,比赛结束),甲队每局获胜的概率为().
①若比赛打满5局的概率为,求的最大值;
②若,在甲队赢得该场比赛的条件下,求比赛的局数的概率分布及数学期望.
附:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
【答案】(1)没有99%的把握认为是否喜欢该项运动与性别有关
(2)①;②分布列见解析,
【分析】(1)计算卡方,进行独立性检验即可;
(2)①求得,结合基本不等式即可得解;②,计算出对应的概率可得分布列,进一步根据期望公式计算期望即可.
【详解】(1)提出假设:学生对该项运动的喜欢情况与性别无关,
根据列联表中的数据,得,
所以没有99%的把握认为是否喜欢该项运动与性别有关.
(2)①比赛打满5局的概率.
因为,
当且仅当,即时,取得最大值.
②设甲队赢得该场比赛为事件,该场比赛结束时,进行了局为事件(),
且,,
,
则.
在甲队赢得该场比赛的条件下,比赛的局数为(),
则,
,
所以的分布列为
3
4
5
.
9.(24-25高二下·江苏扬州·期末)为了解某小区居民的周末休闲方式是否与性别有关,随机抽取了该小区居民100 人进行了调查,其中女性60人,男性40人,女性中有40人休闲方式是看电视,另外20人休闲方式是运动;男性中有10人休闲方式是看电视,另外30人休闲方式是运动.
(1)根据以上数据将如下2×2列联表补充完整;
合计
40
合计
(2)请根据小概率值的独立性检验,判断休闲方式与性别是否有关.
附:,
【答案】(1)列联表见解析
(2)答案见解析
【分析】(1)根据题意,完善列联表;
(2)计算卡方值并与犯错概率0.001对应的临界值比较,即可得出结论.
【详解】(1)
看电视
运动
合计
男性
10
30
40
女性
40
20
60
合计
50
50
100
(2)提出零假设:该小区居民的周末休闲方式和性别无关,
根据列联表中的数据,可得:
,
根据小概率值的独立性检验,我们推断不成立,
即认为该小区居民的周末休闲方式和性别有关,此推断犯错误的概率不大于.
10.(24-25高二下·江苏泰州·期末)某中学对50名学生的学习兴趣和主动预习情况进行了长期的调查,得到的统计数据如下表所示.
主动预习
不太主动预习
合计
学习兴趣高
18
学习兴趣一般
19
合计
24
50
(1)补全该表;
(2)试运用独立性检验的思想方法判断:是否有以上的把握认为,学生的学习兴趣与主动预习有关.
附:独立性检验临界值表
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:,其中).
【答案】(1)答案见解析
(2)有以上的把握认为学生的学习兴趣与主动预习有关
【分析】(1)根据列联表性质计算即可补全;
(2)计算的值,由此作出判断.
【详解】(1)
主动预习
不太主动预习
合 计
学习兴趣高
18
7
25
学习兴趣一般
6
19
25
合计
24
26
50
(2),
所以有以上的把握认为学生的学习兴趣与主动预习有关.
11.(24-25高二下·江苏南京·期末)目前,江苏省城市足球联赛简称“苏超”战火正燃.某大型企业工会为了丰富员工的业余体育文化生活,传播足球运动文化,组建了足球社团.企业为了解员工喜欢足球是否与性别有关,随机抽取了男、女员工各50名进行调查,部分数据如表所示:
喜欢足球
不喜欢足球
合计
男
m
20
女
15
n
合计
100
(1)求m,n的值,试运用独立性检验的思想方法判断,能否有99.5%的把握,认为该企业员工喜欢足球与性别有关?
(2)2025年7月5日,“苏超”联赛将在南京奥体中心体育场迎来常规赛第6轮比赛.该企业足球社团计划赛事当天组织部分“球迷”现场观赛,先从这100名参与调查且喜欢足球的员工中按性别用分层抽样的方法抽取6人,然后再从这6人中随机抽取3人担任现场观赛“球迷”,记抽出的3人中女性的人数为,求的分布列和数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1),,有99.5%的把握认为满意度与性别有关.
(2)分布列见解析,1
【分析】(1)完善列联表,计算的观测值,并与临界值表比对判断;
(2)先求出6人中男女生人数,再求出的可能取值及对应的概率值,列出分布列并求出期望.
【详解】(1)由题意知,,.
提出假设:该企业员工喜欢足球与性别无关.
由表中的数据可得.
因为,
所以有99.5%的把握认为满意度与性别有关.
(2)由题意知,按分层抽样的方法抽取6人中,男性人数为:人,女性2人.
随机变量X的取值为0,1,2
,,,
故随机变量X的概率分布表为:
X
0
1
2
P
故.
12.(24-25高二下·江苏·期末)为调查学生喜欢在食堂就餐是否和性别有关,学校随机调研了男女生各100人,经统计得到如下列联表:
男
女
喜欢
80
40
不喜欢
20
60
(1)依据的独立性检验,判断学生喜欢在食堂就餐是否与性别有关?
(2)为听取学生对食堂的建议,从学生中抽取9人召开座谈会,并给其中3名同学赠送礼品,每人1份(其余人员仅赠送餐券).已知参加座谈会的学生中有且只有4名学生来自高一,求高一这4名学生中得到礼品的人数的分布列和数学期望.
0.010
0.005
0.001
6.635
7.879
10.828
附:,其中
【答案】(1)有的把握认为喜欢食堂就餐与性别有关.
(2)分布列见解析,数学期望为.
【分析】(1)由卡方的计算可判断;
(2)列出的可能取值,由古典概型和组合数计算相应的概率,列出分布列,计算期望可得.
【详解】(1)提出假设:喜欢食堂就餐与性别无关.
,
所以有的把握认为喜欢食堂就餐与性别有关.
(2)高一4名学生中得到礼品的人数的可能取值为,,,,
,,,,
所以的分布列为:
0
1
2
3
所以.
13.(24-25高二下·江苏·期末)随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)试根据的独立性检验,分析社区的市民是否喜欢网上买菜与年龄是否有关;
(2)社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜,如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选择平台买菜,那么周二选择平台买菜的概率为,求小张周二选择平台买菜的概率.
参考公式及数据:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关
(2)
【分析】(1)利用给出公式计算,得大于,即可认为有关;
(2)利用全概率公式计算.
【详解】(1)零假设:是否喜欢网上买菜与年龄无关(即独立).
,
因此拒绝,认为两者相关.
(2)
.
14.(24-25高二下·江苏镇江·期末)某校高二年级为研究学生数学成绩与语文成绩的关系,采取有放回的简单随机抽样,从高二学生中抽取样本容量为200的样本,将所得数学成绩与语文成绩的样本观测数据整理如下:
语文成绩
合计
优秀
不优秀
数学成绩
优秀
50
30
80
不优秀
40
80
120
合计
90
110
200
(1)根据的独立性检验,能否认为数学成绩与语文成绩有关联?
(2)现从该校学生中任选一人,A表示“选到的学生语文成绩不优秀”,B表示“选到的学生数学成绩不优秀”.请利用样本数据,估计的值.
附:.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)认为数学成绩与语文成绩有关
(2).
【分析】(1)计算出,与的临界值比较,得出结论;
(2)根据条件概率的计算公式,利用样本数据,估计的值.
【详解】(1)零假设为:数学成绩与语文成绩无关,据表中数据计算得
根据的独立性检验,我们推断不成立,认为数学成绩与语文成绩有关.
(2)A表示“选到的学生语文成绩不优秀”,
B表示“选到的学生数学成绩不优秀”,
利用样本数据,则有,,
所以,
故估计的成为是.
(
地
城
考点0
5
线性回归分析与独立性检验综合应用
)
1.(25-26高二上·江苏常州·期末)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解乡村居民对新能源汽车的接受程度,某乡村汽车协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取80名村民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了以下统计数据:
选择新能源汽车
选择传统汽车
总计
40岁以下
56
80
40岁及以上
36
80
总计
160
完成列联表,并判断是否有的把握认为选择新能源汽车与年龄有关;
(2)为了了解某一地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量(单位:万台)关于年份的线性回归方程,且销售量的方差为,年份的方差为.求与间的样本相关系数,并据此判断该地区新能源汽车销售量与年份的线性相关性强弱.
附:(i)在线性回归方程中,;
(ii)样本相关系数,若,则可判断与线性相关性较强;
(iii),其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)表格见解析,没有的把握认为选择新能源汽车与年龄有关;
(2)0.84,与线性相关性较强.
【分析】(1)根据题中数据补全列联表即可:再由表中数据以及公式进行计算求解即可;
(2)根据样本相关系数公式计算可得答案.
【详解】(1)补全列联表如下:
选择新能源汽车
选择传统汽车
总计
40岁以下
56
24
80
40岁及以上
44
36
80
总计
100
60
160
提出零假设为:选择新能源汽车与年龄无关.
则,
故认为选择新能源汽车与年龄无关;
(2)因为,
所以,又,
所以,故与线性相关性较强.
2.(24-25高二下·江苏宿迁·期末)某景区为测试并推广一款预约游览APP,上线的第1、2两天在APP上预约可获得费游览资格,第3天开始恢复为原票价,下表是该景区在该APP上前7天的预约情况
第t天
1
2
3
4
5
6
7
预约量y(万张)
9.03
9
8.58
8.7
8.76
8.74
8.79
经计算得:,,.
(1)由于前两天预约游览免费,所以剔除第1、2两天数据,求y关于t的线性回归方程及第5天的残差:
(2)为了调查该APP在不同年龄的人群中的推广情况,从第7天成人游客中随机抽取200人进行分析,所得的部分数据见下表:
50岁以下
50岁(含50)以上
合计
通过APP预约人数
70
其它方式购票人数
80
合计
100
①完成以上2×2列联表:
②如果有95%的把握认定游客通过APP预约游览与其年龄有关,就要进行针对性宣传,请你判断是否需要针对年龄超过50岁(含50)以上的人群进行宣传.
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:,,
【答案】(1),残差为0.046
(2)①列联表见解析;②需要针对年龄超过50岁(含50)以上的人群进行宣传,理由见解析
【分析】(1)计算出剔除第1、2两天数据后的相关量,代入公式计算出线性回归方程,并计算出第5天的残差;
(2)完善列联表,代入公式,计算出卡方,与3.841比较后得到结论.
【详解】(1)剔除掉第1、2两天数据后,,
,,
,
故,
,
故y关于t的线性回归方程为,
第5天的残差为;
(2)①列联表如下:
50岁以下
50岁(含50)以上
合计
通过APP预约人数
70
50
120
其它方式购票人数
30
50
80
合计
100
100
200
②需要针对年龄超过50岁(含50)以上的人群进行宣传,理由如下:
零假设认定游客通过APP预约游览与其年龄无关,
则,
根据小概率事件原理,可知零假设不成立,故认定游客通过APP预约游览与其年龄有关,
需要针对年龄超过50岁(含50)以上的人群进行宣传.
3.(24-25高二下·江苏镇江·期末)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年某地区新能源乘用车的年销售量与年份的统计表:
年份x
2020
2021
2022
2023
2024
销量y(万台)
1.00
1.40
1.70
1.90
2.00
某机构调查了该地区60位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
购置传统燃油车
购置新能源车
总计
男性车主
10
48
女性车主
2
总计
60
(1)求新能源乘用车的销量y关于x年份的线性相关系数r,并判断y与x是否线性相关;
(2)请将上述列联表补充完整,并判断是否有的把握认为购车车主是否购置新能源乘用车与性别有关.
参考公式:
相关系数;,其中.
参考数据:.
备注:若,则可判断y与x线性相关.
临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1),y与x线性相关
(2)列联表见解析,有的把握认为购车车主是否购置新能源乘用车与性别有关
【分析】(1)由题目中的数据,利用相关系数的计算公式,可得答案;
(2)根据独立性检验的解题方法,可得答案.
【详解】(1)由表格知:,,
,
有,
则y与x线性相关
(2)依题意,完善表格如下:
购置传统燃油车
购置新能源车
总计
男性车主
38
10
48
女性车主
2
10
12
总计
40
20
60
提出假设:购车车主是否购置新能源乘用车与性别无关由列联表数据得:
,因为,
故有的把握认为购车车主是否购置新能源乘用车与性别有关.
4.(24-25高二下·江苏·期末)某公司计划对未开通共享电动车的某市进行车辆投放,为了确定车辆投放量,对过去在其他城市的投放量情况以及年使用人次进行了统计,得到了投放量(单位:千辆)与年使用人次(单位:千次)的数据如下表所示,根据数据绘制投放量与年使用人次的散点图如图所示.
1
2
3
4
5
6
7
6
11
21
34
66
101
196
(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型或指数函数模型对两个变量的关系进行拟合.请问哪个模型更适宜作为投放量与年使用人次的回归方程类型(给出判断即可,不必说明理由)?并求出关于的回归方程;
(2)公司为了测试共享电动车的性能,从所有同型号共享电动车中随机抽取100辆进行等距离骑行测试,骑行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的共享电动车占比.请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为共享电动车是否报废与保养有关?
\
保养
未保养
合计
报废
20
未报废
合计
60
100
参考数据:,.
62.14
1.54
2535
50.12
3.47
参考公式:对于一组数据,,,其回归直线的斜率和截距的最小二乘估计公式分别为: ,.,
其中.
0.25
0.1
0.05
0.025
0.01
0.001
1.323
2.706
3.841
5.024
6.635
10.828
【答案】(1)适宜作为投放量与年使用人次的回归方程类型,
(2)列联表见解析,认为是否报废与保养有关
【分析】(1)由散点图可知,应选指数函数模型,根据已知条件两边同时取对数,转化为关于与的一次函数模型,结合参考数据即可求解;
(2)根据题意完成列联表,利用独立性检验公式,计算的值可判断.
【详解】(1)由散点图判断,适宜作为投放量与年使用人次的回归方程类型.
由,两边同时取常用对数得.
设,则.
因为,,,,
所以.
把代入,得,
所以,所以,
则,
故关于的回归方程为.
(2)设零假设:是否报废与是否保养无关.
由题意,报废电动车中保养过的共台,未保养的电动车共台,补充列联表如下:
\
保养
未保养
合计
报废
6
14
20
未报废
54
26
80
合计
60
40
100
则,
根据小概率值的独立性检验,我们推断不成立,即认为是否报废与保养有关.
5.(24-25高二下·江苏·期末)随着互联网的高速发展和新媒体形式的不断丰富,微短剧作为一种新兴的文化载体,正逐渐成为拓展文化消费空间的重要途径.某媒体为了了解微短剧消费者的年龄分布,随机调查了200名消费者,得到如下列联表:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
45
不是微短剧消费者
合计
100
200
(1)根据小概率值的独立性检验,能否认为“是微短剧消费者”与“年龄不超过40岁”有关联?
(2)记2020~2024年的年份代码x依次为1,2,3,4,5,下表为2020~2023年中国微短剧市场规模及2024年中国微短剧预测的市场规模y(单位:亿元)与x的统计数据:
年份代码x
1
2
3
4
5
市场规模y
9.4
36.8
101.7
373.9
m
根据上表数据求得y关于x的经验回归方程为,求相关系数r,并判断该经验回归方程是否有价值.
参考公式:,其中,.
,相关系数..
若,则认为经验回归方程有价值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关联
(2),该经验回归方程有价值.
【分析】(1)先补全列联表,再计算卡方,根据独立性检验原则即可判断;
(2)通过给出的经验回归方程公式求相关系数,再判断.
【详解】(1)2×2列联表如下:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
15
45
不是微短剧消费者
70
85
155
合计
100
100
200
零假设“是微短剧消费者”与“年龄不超过40岁”无关联,
因为,
根据小概率值的独立性检验,我们推断不成立,即认为“是微短剧消费者”与“年龄不超过40岁”有关联,此推断犯错误的概率不超过0.05.
(2)由x的取值依次为1,2,3,4,5,得,,
因为经验回归方程为,
所以,
所以,
所以.
因为,所以该经验回归方程有价值.
1 / 4
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。