专题06:成对数据的统计分析高频考点分类复习-2024-2025学年高二下学期数学沪教版(2020)选择性必修第二册
2025-05-28
|
2份
|
40页
|
262人阅读
|
12人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学沪教版选择性必修第二册 |
| 年级 | 高二 |
| 章节 | 第8章 成对数据的统计分析 |
| 类型 | 题集-专项训练 |
| 知识点 | - |
| 使用场景 | 同步教学-期末 |
| 学年 | 2025-2026 |
| 地区(省份) | 上海市 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 1.12 MB |
| 发布时间 | 2025-05-28 |
| 更新时间 | 2025-05-28 |
| 作者 | 立德树人 |
| 品牌系列 | - |
| 审核时间 | 2025-05-28 |
| 下载链接 | https://m.zxxk.com/soft/52314081.html |
| 价格 | 2.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
2024-2025学年高二数学下学期期末复习满分冲刺(培优课程)
专题06 第8章成对数据的统计分析
考点01:相关关系的概念和判断
1.(24-25高二·上海阶段练习)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
2.(23-24复兴高级中学高二期中)已知变量x与y的回归直线方程为,变量y与z负相关,则( )
A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关
C.x与y负相关,x与z正相关 D.x与y正相关,x与z负相关
3.(23-24高二下闵行校级期末)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,,,,则这四人中, 甲 研究的两个随机变量的线性相关程度最高.
4.(2024上海课时作业)对变量x,y由观测数据得散点图1;对变量u,v由观测数据得散点图2.r1表示变量x,y之间的线性相关系数,r2表示变量u,v之间的线性相关系数,则下列说法正确的是( )
A.变量x与y呈现正相关,且|r1|>|r2|
B.变量x与y呈现负相关,且|r1|<|r2|
C.变量u与v呈现正相关,且|r1|>|r2|
D.变量u与v呈现负相关,且|r1|<|r2|
5.(23-24高二下·云南曲靖·阶段练习)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
考点02:相关系数的比较和计算
6.(2025嘉定区二模)在研究线性回归模型时,若样本数据所对应的点都在直线上,则两组数据和的线性相关系数为( )
A. B.1 C. D.2
7.(2024上海课时作业)A市某个景点自从取消门票实行免费开放后,迅速成为网红打卡点,不仅带动了市淡季的旅游,而且优化了旅游产业的结构.下表是该景点免费开放后前五个月的打卡人数(万人)与第个月的数据:
1
2
3
4
5
23.1
37.0
62.1
111.6
150.8
根据表中数据可用一元线性回归模型刻画变量与变量之间的线性相关关系,且回归方程中的,则相关系数 (精确到0.01).
参考公式:相关系数.回归方程中斜率的最小二乘法估计公式为;
参考数据:,,,,.
8.(2024·上海·模拟预测)某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:
身体综合指标评分
1
2
3
4
5
用时小时)
a
b
c
d
e
由上表数据得到的正确结论是( )
参考数据:
参考公式:相关系数.
A.身体综合指标评分与骑行用时正相关
B.身体综合指标评分与骑行用时的相关程度较弱
C.身体综合指标评分与骑行用时的相关程度较强
D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合
9.(2024·上海·模拟预测)之前7年,我国生活垃圾无害处理量如下表:
序号
1
2
3
4
5
6
7
年
1
2
3
4
5
6
7
处理量
通过计算,线性相关系数则( )
A.与的线性相关性很强,用线性回归模型拟合与的关系比较好
B.与的线性相关性比较弱,可以用线性回归模型拟合与的关系
C.与不线性相关,用线性回归模型㧍合与的关系,会有很大误差
D.与不线性相关,不可以用线性回归模型拟合与的关系
10.(多选)(24-25高二·上海·单元测试)已知与之间的四组数据如下表:
2
3
4
5
1.5
3.5
上表数据中的平均值为,若某同学对赋了两个值,分别为,,得到两条回归直线的方程分别为,,对应的相关系数分别为,,则不正确的是( )
A.两条回归直线的交点为 B.
C. D.
考点03:离差及相关指数的应用
离差平方和为,离差平方和越小,模型拟合效果越好.
根据经验回归方程计算的值,仅是一个预报值,不是真实发生的值.
11.(23-24高二下上海·阶段练习)设某制造公司进行技术升级后的第x个月()的利润为y(单位:百万元),根据统计数据,求得y关于x的经验回归方程为,若时的观测值,则时的离差为( )
A. B.1 C.3 D.6
27.(2024上海课时作业)某种产品的广告支出费用(单位:万元)与销售额(单位:万元)的数据如下表:
2
4
5
6
8
30
40
60
50
70
已知关于的线性回归方程为,则当广告支出费用为万元时,离差为( )万元
A. B. C. D.
12.(多选)(23-24高二下·山西长治·期中)已知某产品的销售额(单位:万元)与广告费用(单位:万元)的数据如表所示:
万元
1
2
3
4
5
万元
21
90
109
根据表中数据可知具有较强的线性相关关系,其经验回归方程为,则( )
A.样本相关系数在内
B.当时,离差为2
C.点一定在经验回归直线上
D.广告费用是6万元时,销售额一定为130万元
13.(2024上海课时作业)已知一系列样本点的一个经验回归方程为,若样本点的离差为1,则 .
考点04:线性回归方程与样本中心
14.(2024金山中学高二期末)由数据,,…,可得关于的线性回归方程为,若,则( )
A.48 B.52 C.56 D.80
15.(24-25高二·上海阶段练习)已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和的误差较大,去除后重新求得的回归直线 l 的斜率为1.2,则下列说法正确的是 .
①变量x与y呈正相关关系;
②去除后y的估计值增加速度变快;
③去除后与去除前样本点的中心不变;
④去除后的回归直线方程为.
16.(2024上海课时作业)某机构统计了新驾驶员一年内扣除的驾照分(单位:分)及该年对应的新驾驶员数量(单位:万人),得到如下数据表格:
新驾驶员一年内扣除的驾照分(分)
3
4
5
6
7
新驾驶员数量(万人)
1
1.1
1.5
1.9
2.2
已知与线性相关.
(1)求关于的线性回归方程;
(2)求与的相关系数(精确到0.01).
参考数据:.
参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为
17.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2016
2017
2018
2019
2020
时间代号
1
2
3
4
5
储蓄存款/千亿元
5
6
7
8
10
(1)求关于的线性回归方程;
(2)用所求回归方程预测该地区2022年()的人民币储蓄存款.
考点05:线性回归方程
18.(24-25高二下·上海阶段练习)关于线性回归的描述,有下列命题:
①回归直线一定经过样本点的中心;
②相关系数r越大,线性相关程度越强;
③决定系数越接近1拟合效果越好;
④随机误差平方和越小,拟合效果越好.
其中正确的命题个数为( )
A.1 B.2 C.3 D.4
19.(23-24高二下·江苏南京·阶段练习)为了研究关于的线性相关关系,收集了组样本数据(见下表):
若已求得一元线性回归方程为,则下列选项中正确的是( )
(其中相关系数)
A.
B.当时,的预测值为
C.样本数据的第40百分位数为
D.去掉样本点后,与的样本相关系数不会改变
20.已知某一家旗舰店近五年“五一”黄金周期间的成交额如下表:
年份
2020
2021
2022
2023
2024
年份代号
1
2
3
4
5
成交额(万元)
50
60
70
80
100
若关于的线性回归方程为,则根据回归方程预测该店2025年“五一”黄金周的成交额是( )
A.84万元 B.96万元 C.108万元 D.120万元
21.(23-24高二下·陕西西安·期末)某中医药企业根据市场调研与模拟,得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
研发投入(亿元)
1
2
3
4
5
产品收益(亿元)
3
7
9
10
11
(1)计算,的相关系数,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般;若,则线性相关程度较高)
(2)求出关于的线性回归方程,并预测若想收益超过20(亿元),则需研发投入至少多少亿元?(结果保留一位小数)
参考公式:回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为,,.
参考数据:,,.
22.(24-25高二下·浙江·期中)随着电商事业的快速发展,网络购物交易额也快速提升,某网上交易平台工作人员对2020年至2024年每年的交易额(取近似值)进行统计分析,结果如下表:
年份
2020
2021
2022
2023
2024
年份代码
1
2
3
4
5
交易额(单位:百亿)
1.5
2
3.5
8
15
(1)据上表数据,计算与的相关系数(精确到0.01),并说明与的线性相关性的强弱;(若,则认为与线性相关性很强;若,则认为与线性相关性一般;若,则认为与线性相关性较弱.)
(2)利用最小二乘法建立关于的线性回归方程,并预测2025年该平台的交易额.
参考数据:,,
参考公式:相关系数;
线性回归方程中,斜率和纵截距的最小二乘估计分别为,.
考点06:列联表的完善与分析
23.(24-25高二下·江苏阶段练习)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
24.(24-25高三上·广西南宁·期末)为考查A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
考点08:独立性检验的理解
25.(24-25高三上·上海·单元测试)某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了5000人,计算发现,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是 %.参考数据:
P
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
26.(23-24高二下·上海·期末)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为 (填有或没有)的把握认为改款盲盒与性别有关.()
27.(23-24高二下·天津滨海新·阶段练习)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是(参考数据:)( )
①若的观测值满足,我们有99%的把握认为吸烟与患肺病有关系;
②若的观测值满足,那么在100个吸烟的人中约有99人患有肺病;
③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病;
④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误.
A.②③ B.②③④ C.①②④ D.①④
28.(24-25高二下·上海·单元测试)下列关于的说法不正确的是( )
A.根据列联表中的数据计算得出 ,则有的把握认为两个分类变量有关系
B.越大,认为两个分类变量有关系的把握性就越大
C.是用来判断两个分类变量有关系的可信程度的随机变量
D.,其中 为样本容量
29.通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
考点09:独立性检验的实际应用
30.(24-25高二下·河南驻马店·阶段练习)为了解学生性别与掌握消防安全知识情况的关系,某校组织了消防安全知识测试,在高二年级中随机抽取600名学生统计其测试成绩,如下表(单位:人):
测试成绩性别
良好
不够良好
总计
男生
150
300
女生
100
总计
350
600
(1)将上表中数据补充完整;
(2)从该校高二年级的学生中有放回地随机抽取2次,每次抽取1名学生,以频率作为概率,估计这2次抽取的学生的测试成绩全都良好的概率;
(3)试问是否有99.9%的把握判断消防安全知识测试成绩与性别有关?
附:,.
0.100
0.010
0.001
2.706
6.635
10.828
31.(24-25高三下·山西·阶段练习)为了解南、北方消费者对新能源汽车的认可度,随机对南、北方共500位消费者进行问卷调查,得到如下列联表:
对新能源汽车的认可度
合计
认可
不认可
南方消费者
150
150
300
北方消费者
75
125
合计
225
500
(1)求,;
(2)根据小概率值的独立性检验,能否认为南、北方消费者对新能源汽车的认可度有差异?
(3)记南、北方消费者中对新能源汽车认可的概率分别为,,给出,的估计值,并根据,求4位消费者(2位南方消费者和2位北方消费者)中认可新能源汽车的人数的分布列与期望.
附:.
0.005
0.010
0.001
3.841
6.635
10.828
32.(2025位育中学高二期末)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,女生的获奖率为,填写下列列联表,并依据小概率值的独立性检验,判断男生与女生的获奖情况是否存在差异?
性别
奖励
合计
获奖
未获奖
男
女
合计
附:,
33.(23-24高二下闵行区期末)某高中在高二年级举办创新作文比赛活动,满分100分,得分80及以上者获奖.为了解学生获奖情况与选修阅读课程之间的关系,在参赛选手中随机选取了50名学生作为样本,各分数段学生人数及其选修阅读课程情况统计如下:
成绩
学生人数
6
10
24
7
3
选修读课程人数
0
3
9
4
4
(1)根据以上统计数据完成下面的列联表,依据的独立性检验,能否认为学生获奖与选修阅读课程有关联;
获奖
没有获奖
合计
选修阅读课程
不选阅读课程
合计
(2)在上述样本的获奖学生中随机抽取3名学生,设3人中选修阅读课程人数为,求的分布列及数学期望.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
34.(24-25高二下上海·期中)近期根据中国消费者信息研究报告显示,超过40%的消费者更加频繁地使用网上购物,某网购专营店统计了2025年1月5日到9日这5天到该专营店购物的人数y和时间第x天间的数据,列表如下:
x
1
2
3
4
5
y
75
84
93
98
100
(1)由表中给出的数据判断是否可以用线性回归模型拟合人数y和时间第x天之间的关系?若可用,求出y关于x的经验回归方程,并估计1月10日到该专营店购物的人数;若不可用,请说明理由(人数用四舍五入法取整数,若相关系数,则线性相关程度很高,可以用线性回归模型拟合,r精确到0.01);
(2)该专营店为了吸引顾客,推出两种促销方案.方案一:购物金额每满100元可减5元;方案二:一次性购物金额超过800元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打9折,中奖两次打8折,中奖三次打6折.某顾客计划在此专营店购买1000元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠.
参考数据:.,,
附:相关系数,,
2 / 2
学科网(北京)股份有限公司
$$
2024-2025学年高二数学下学期期末复习满分冲刺(培优课程)
专题06 第8章成对数据的统计分析
考点01:相关关系的概念和判断
1.(24-25高二·上海阶段练习)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
【解题思路】根据相关关系的定义、函数的定义即可判断
【解答过程】A,B均为函数关系,故A、B错误;C,D为相关关系,故C错,D对.
故选:D.
2.(23-24复兴高级中学高二期中)已知变量x与y的回归直线方程为,变量y与z负相关,则( )
A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关
C.x与y负相关,x与z正相关 D.x与y正相关,x与z负相关
【解题思路】根据已知条件,结合回归方程可判断x与y正相关,再由变量y与z负相关,即可判断x与z负相关.
【解答过程】根据回归方程可知变量x与y正相关,又变量y与z负相关,
由正相关、负相关的定义可知,x与z负相关.
故选:D.
3.(23-24高二下闵行校级期末)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,,,,则这四人中, 甲 研究的两个随机变量的线性相关程度最高.
【解题思路】根据相关系数的性质即可求解.
【解答过程】因为,所以这四人中,甲研究的两个随机变量的线性相关程度最高.
故答案为:甲.
4.(2024上海课时作业)对变量x,y由观测数据得散点图1;对变量u,v由观测数据得散点图2.r1表示变量x,y之间的线性相关系数,r2表示变量u,v之间的线性相关系数,则下列说法正确的是( )
A.变量x与y呈现正相关,且|r1|>|r2|
B.变量x与y呈现负相关,且|r1|<|r2|
C.变量u与v呈现正相关,且|r1|>|r2|
D.变量u与v呈现负相关,且|r1|<|r2|
5.(23-24高二下·云南曲靖·阶段练习)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【解题思路】根据散点图和相关系数的概念和性质辨析即可.
【解答过程】由散点图可知,相关系数所在散点图呈负相关,所在散点图呈正相关,所以都为正数,都为负数.
所在散点图近似一条直线上,线性相关性比较强,相关系数的绝对值越接近,
而所在散点图比较分散,线性相关性比较弱,相关系数的绝对值越远离.
综上可得:.
故选:A.
考点02:相关系数的比较和计算
6.(2025嘉定区二模)在研究线性回归模型时,若样本数据所对应的点都在直线上,则两组数据和的线性相关系数为( )
A. B.1 C. D.2
【答案】A
【详解】若样本数据所对应的点都在直线上,
则两组数据和的线性相关系数为.
故选:A.
7.(2024上海课时作业)A市某个景点自从取消门票实行免费开放后,迅速成为网红打卡点,不仅带动了市淡季的旅游,而且优化了旅游产业的结构.下表是该景点免费开放后前五个月的打卡人数(万人)与第个月的数据:
1
2
3
4
5
23.1
37.0
62.1
111.6
150.8
根据表中数据可用一元线性回归模型刻画变量与变量之间的线性相关关系,且回归方程中的,则相关系数 (精确到0.01).
参考公式:相关系数.回归方程中斜率的最小二乘法估计公式为;
参考数据:,,,,.
【答案】0.98
【详解】由题设,,,
,
所以.
故答案为:.
8.(2024·上海·模拟预测)某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:
身体综合指标评分
1
2
3
4
5
用时小时)
a
b
c
d
e
由上表数据得到的正确结论是( )
参考数据:
参考公式:相关系数.
A.身体综合指标评分与骑行用时正相关
B.身体综合指标评分与骑行用时的相关程度较弱
C.身体综合指标评分与骑行用时的相关程度较强
D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合
【解题思路】求出相关系数,根据相关系数的大小确定答案即可.
【解答过程】因为相关系数.
即相关系数近似为与负相关,且相关程度相当高,从而可用线性回归模型拟合与的关系.
所以选项ABD错误,C正确.
故选:C.
9.(2024·上海·模拟预测)之前7年,我国生活垃圾无害处理量如下表:
序号
1
2
3
4
5
6
7
年
1
2
3
4
5
6
7
处理量
通过计算,线性相关系数则( )
A.与的线性相关性很强,用线性回归模型拟合与的关系比较好
B.与的线性相关性比较弱,可以用线性回归模型拟合与的关系
C.与不线性相关,用线性回归模型㧍合与的关系,会有很大误差
D.与不线性相关,不可以用线性回归模型拟合与的关系
【解题思路】计算出线性相关系数,判断出与的线性相关性很强,用线性回归模型拟合与的关系比较好.
【解答过程】,
,
,
所以与的线性相关性很强,用线性回归模型拟合与的关系比较好.
故选:A.
10.(多选)(24-25高二·上海·单元测试)已知与之间的四组数据如下表:
2
3
4
5
1.5
3.5
上表数据中的平均值为,若某同学对赋了两个值,分别为,,得到两条回归直线的方程分别为,,对应的相关系数分别为,,则不正确的是( )
A.两条回归直线的交点为 B.
C. D.
【解题思路】由已知数据求出样本中心点可判断A;分别求出,时的值,再由公式计算出,,,可判断BC;由公式求出和可判断D,进而可得正确选项.
【解答过程】因为,,所以两条回归直线过样本点的中心,即两条回归直线的交点为,故选项A正确;
当时,由,可得,
,
,
所以,,
当时,由,可得,
,
所以,,
所以,,故选项B错误,选项C正确;
当,时,因为,
所以,
当,时,,
所以,则,故选项D正确,
故选:B.
考点03:离差及相关指数的应用
离差平方和为,离差平方和越小,模型拟合效果越好.
根据经验回归方程计算的值,仅是一个预报值,不是真实发生的值.
11.(23-24高二下上海·阶段练习)设某制造公司进行技术升级后的第x个月()的利润为y(单位:百万元),根据统计数据,求得y关于x的经验回归方程为,若时的观测值,则时的离差为( )
A. B.1 C.3 D.6
【解题思路】利用离差的定义求解.
【解答过程】解:因为时的预测值为,
所以离差为.
故选:B.
27.(2024上海课时作业)某种产品的广告支出费用(单位:万元)与销售额(单位:万元)的数据如下表:
2
4
5
6
8
30
40
60
50
70
已知关于的线性回归方程为,则当广告支出费用为万元时,离差为( )万元
A. B. C. D.
【解题思路】将代入回归直线方程,可得出销售额的预测值,然后利用离差的定义可求得结果.
【解答过程】当时,销售额的预测值为,离差为万元.
故选:A.
12.(多选)(23-24高二下·山西长治·期中)已知某产品的销售额(单位:万元)与广告费用(单位:万元)的数据如表所示:
万元
1
2
3
4
5
万元
21
90
109
根据表中数据可知具有较强的线性相关关系,其经验回归方程为,则( )
A.样本相关系数在内
B.当时,离差为2
C.点一定在经验回归直线上
D.广告费用是6万元时,销售额一定为130万元
【解题思路】根据相关系数的定义判断A;求出样本中心点,即可求出的值,再计算离差即可判断B;令、判断C、D.
【解答过程】对于A,因为具有较强的线性相关关系,且经验回归方程为,
所以,具有较强的正相关关系,故样本相关系数在内,故A正确;
对于B,根据题意得,,
又必过样本中心点,
所以,解得,
故当时,,离差为,故B正确;
对于C,点即点,当时,,即点不在经验回归直线上,故C错误;
对于D,当时,,即广告费用是万元时,销售额估计为130万元,故D错误.
故选:AB.
13.(2024上海课时作业)已知一系列样本点的一个经验回归方程为,若样本点的离差为1,则 .
【解题思路】根据离差计算公式计算即可.
【解答过程】根据题意得,解得.
故答案为:.
考点04:线性回归方程与样本中心
14.(2024金山中学高二期末)由数据,,…,可得关于的线性回归方程为,若,则( )
A.48 B.52 C.56 D.80
【答案】A
【知识点】线性回归
【分析】根据回归直线方程必过样本中心即可求出结果.
【详解】因为,所以,所以,所以.
故选:A.
15.(24-25高二·上海阶段练习)已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和的误差较大,去除后重新求得的回归直线 l 的斜率为1.2,则下列说法正确的是 .
①变量x与y呈正相关关系;
②去除后y的估计值增加速度变快;
③去除后与去除前样本点的中心不变;
④去除后的回归直线方程为.
【解题思路】根据回归直线方程的意义可判断①②,根据回归直线方程过样本中心可判断③④.
【解答过程】因为回归直线方程为 ,所以变量 x 与 y 呈正相关关系,故①正确;
因为,所以去除后y的估计值增加速度变慢,故②错误;
当时,,所以去除前样本点的中心为,
又因为,,
所以去掉两个数据点和后,样本点的中心还是,故③正确;
因为去除后重新求得的回归直线的斜率为1.2,所以可设,
将点代入直线,得,解得,
所以去除后的回归直线方程为,故④正确.
故答案为:①③④.
16.(2024上海课时作业)某机构统计了新驾驶员一年内扣除的驾照分(单位:分)及该年对应的新驾驶员数量(单位:万人),得到如下数据表格:
新驾驶员一年内扣除的驾照分(分)
3
4
5
6
7
新驾驶员数量(万人)
1
1.1
1.5
1.9
2.2
已知与线性相关.
(1)求关于的线性回归方程;
(2)求与的相关系数(精确到0.01).
参考数据:.
参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为
【答案】(1)
(2)0.99
【详解】(1)由,
有,
故关于的线性回归方程为.
(2)与的相关系数
.
17.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2016
2017
2018
2019
2020
时间代号
1
2
3
4
5
储蓄存款/千亿元
5
6
7
8
10
(1)求关于的线性回归方程;
(2)用所求回归方程预测该地区2022年()的人民币储蓄存款.
【答案】(1)
(2)(千亿元)
【详解】(1)根据题意得:,,
,
,
,,
所以关于的线性回归方程;
(2)当时,(千亿元),
即该地区2022年()的人民币储蓄存款为12千亿元.
考点05:线性回归方程
18.(24-25高二下·上海阶段练习)关于线性回归的描述,有下列命题:
①回归直线一定经过样本点的中心;
②相关系数r越大,线性相关程度越强;
③决定系数越接近1拟合效果越好;
④随机误差平方和越小,拟合效果越好.
其中正确的命题个数为( )
A.1 B.2 C.3 D.4
【解题思路】根据回归直线方程的性质,相关系数、决定系数及随机误差平方和的意义判断各项的正误即可.
【解答过程】对于①,回归直线一定经过样本点的中心,故①正确;
对于②,相关系数r的绝对值越接近于1,线性相关性越强,故②错误;
对于③,决定系数R越接近1拟合效果越好,故③正确;
对于④,随机误差平方和越小,拟合效果越好,故④正确.
故选:C.
19.(23-24高二下·江苏南京·阶段练习)为了研究关于的线性相关关系,收集了组样本数据(见下表):
若已求得一元线性回归方程为,则下列选项中正确的是( )
(其中相关系数)
A.
B.当时,的预测值为
C.样本数据的第40百分位数为
D.去掉样本点后,与的样本相关系数不会改变
【解题思路】A项,求出,将样本中心点代入回归直线方程可求;B项,利用回归直线方程代值运算预测即可;C项,按百分位数求法步骤求解;D项,新样本平均值没有变化,由相关系数公式可知.
【解答过程】A项,,
所以样本点的中心坐标为,
将它代入得,,解得,故A错误;
B项,当时,的预测值为,故B错误;
C项,由为整数,则样本数据的第40百分位数为,故C错误;
D项,去掉样本点后,新样本数据的平均值没有变化,即仍然成立,
不妨设为第组数据,即,则,其余数据没有变化.
则由相关系数公式可知,
即新样本数据与的相关系数与原数据相关系数相等,
即与的样本相关系数不会改变,故D正确.
故选:D.
20.已知某一家旗舰店近五年“五一”黄金周期间的成交额如下表:
年份
2020
2021
2022
2023
2024
年份代号
1
2
3
4
5
成交额(万元)
50
60
70
80
100
若关于的线性回归方程为,则根据回归方程预测该店2025年“五一”黄金周的成交额是( )
A.84万元 B.96万元 C.108万元 D.120万元
【答案】C
【详解】依题意,,
又线性回归方程为必过点,
所以,解得,所以,
2025年的年份代号为,所以当时,,
所以根据回归方程预测该店2025年“五一”黄金周的成交额是108万元.
故选:C.
21.(23-24高二下·陕西西安·期末)某中医药企业根据市场调研与模拟,得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
研发投入(亿元)
1
2
3
4
5
产品收益(亿元)
3
7
9
10
11
(1)计算,的相关系数,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般;若,则线性相关程度较高)
(2)求出关于的线性回归方程,并预测若想收益超过20(亿元),则需研发投入至少多少亿元?(结果保留一位小数)
参考公式:回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为,,.
参考数据:,,.
【答案】(1),相关程度较高
(2),9.3亿元
【知识点】相关系数的计算、求回归直线方程、用回归直线方程对总体进行估计
【分析】(1)通过计算相关系数来进行判断.
(2)先计算回归直线方程,并由此作出预测.
【详解】(1)由表中数据可知,,,
,,,
则,
故相关程度较高;
(2),,
则,,
故,
令,解得,
故研发投入至少9.3亿元.
22.(24-25高二下·浙江·期中)随着电商事业的快速发展,网络购物交易额也快速提升,某网上交易平台工作人员对2020年至2024年每年的交易额(取近似值)进行统计分析,结果如下表:
年份
2020
2021
2022
2023
2024
年份代码
1
2
3
4
5
交易额(单位:百亿)
1.5
2
3.5
8
15
(1)据上表数据,计算与的相关系数(精确到0.01),并说明与的线性相关性的强弱;(若,则认为与线性相关性很强;若,则认为与线性相关性一般;若,则认为与线性相关性较弱.)
(2)利用最小二乘法建立关于的线性回归方程,并预测2025年该平台的交易额.
参考数据:,,
参考公式:相关系数;
线性回归方程中,斜率和纵截距的最小二乘估计分别为,.
【解题思路】(1)根据相关系数的计算公式可得,再判断可得答案;
(2)根据公式求线性回归方程,再将代入方程进行预测.
【解答过程】(1)由已知得,,
,,
,
故,
,所以线性相关性程度很强;
(2),,
则,
所以关于的线性回归方程为,
当时,,
所以预计2025年该平台的交易额为15.9百亿.
考点06:列联表的完善与分析
23.(24-25高二下·江苏阶段练习)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【解题思路】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【解答过程】依题意,解得,由解得.
补全列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D.
24.(24-25高三上·广西南宁·期末)为考查A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
【解题思路】根据等高条形图中的数据即可得出选项.
【解答过程】根据两个表中的等高条形图知,
药物A实验显示不服药与服药时患病差异较药物B实验显示明显大,
所以药物A的预防效果优于药物B的预防效果,
故选:B.
考点08:独立性检验的理解
25.(24-25高三上·上海·单元测试)某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了5000人,计算发现,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是 %.参考数据:
P
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】97.5
【知识点】独立性检验解决实际问题、独立性检验的基本思想
【分析】根据独立性检验知识,对照表格中的数据分析即可.
【详解】由,
可知市政府断言市民收入增减与旅游需求有关的可信度是97.5%,
故答案为:97.5
26.(23-24高二下·上海·期末)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为 (填有或没有)的把握认为改款盲盒与性别有关.()
【答案】有
【知识点】独立性检验解决实际问题、独立性检验的基本思想、卡方的计算
【分析】根据列联表数据和的计算公式求出即可根据小概率值的独立性检验得到结论.
【详解】零假设为改款盲盒与性别无关联.
由列联表数据计算得,
所以根据小概率值的独立性检验,推断不成立,故有的把握认为改款盲盒与性别有关.
故答案为:有.
27.(23-24高二下·天津滨海新·阶段练习)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是(参考数据:)( )
①若的观测值满足,我们有99%的把握认为吸烟与患肺病有关系;
②若的观测值满足,那么在100个吸烟的人中约有99人患有肺病;
③从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病;
④从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误.
A.②③ B.②③④ C.①②④ D.①④
【解题思路】由给出的数据,结合观测值的意义判定即可.
【解答过程】若的观测值满足,则我们有的把握认为吸烟与患肺病有关系,
而得知有的把握认为吸烟与患肺病有关系时,仍有的可能性使推断出现错误,
但不能说明个吸烟的人中约有人患有肺病,
也不能说明每个吸烟的人有的可能性会患肺病.
故①④正确、②③错误.
故选:D.
28.(24-25高二下·上海·单元测试)下列关于的说法不正确的是( )
A.根据列联表中的数据计算得出 ,则有的把握认为两个分类变量有关系
B.越大,认为两个分类变量有关系的把握性就越大
C.是用来判断两个分类变量有关系的可信程度的随机变量
D.,其中 为样本容量
【解题思路】根据独立性检验概念及公式分别判断各个选项.
【解答过程】根据列联表中的数据计算得出 ,则有的把握认为两个分类变量有关系,A选项正确;
越大,认为两个分类变量有关系的把握性就越大,B选项正确;
是用来判断两个分类变量有关系的可信程度的随机变量,C选项正确;
公式中分子应该是,D选项错误.
故选:D.
29.通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
【答案】A
【详解】零假设为:爱好跳绳与性别无关.
A.∵,
∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关.选项A正确.
B. ∵,
∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关,但无法判断这个结论犯错误的概率是否超过.选项B错误.
C.∵,
∴根据小概率值的独立性检验,我们认为爱好跳绳与性别有关.选项C错误.
D. ∵,
∴在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别有关.选项D错误.
故选:A.
考点09:独立性检验的实际应用
30.(24-25高二下·河南驻马店·阶段练习)为了解学生性别与掌握消防安全知识情况的关系,某校组织了消防安全知识测试,在高二年级中随机抽取600名学生统计其测试成绩,如下表(单位:人):
测试成绩性别
良好
不够良好
总计
男生
150
300
女生
100
总计
350
600
(1)将上表中数据补充完整;
(2)从该校高二年级的学生中有放回地随机抽取2次,每次抽取1名学生,以频率作为概率,估计这2次抽取的学生的测试成绩全都良好的概率;
(3)试问是否有99.9%的把握判断消防安全知识测试成绩与性别有关?
附:,.
0.100
0.010
0.001
2.706
6.635
10.828
【解题思路】(1)根据已知填写表格即可;
(2)应用独立事件概率乘积公式计算即可;
(3)先计算,再与临界值比较即可判断相关性即可.
【解答过程】(1)
测试成绩
性别
良好
不够良好
总计
男生
150
150
300
女生
200
100
300
总计
350
250
600
(2)该校高二年级600名学生中测试成绩良好的频率为,,
故估计这2次抽取的学生的测试成绩全都良好的概率为.
(3)根据表中数据,计算.
因为,所以有99.9%的把握判断消防安全知识测试成绩与性别有关.
31.(24-25高三下·山西·阶段练习)为了解南、北方消费者对新能源汽车的认可度,随机对南、北方共500位消费者进行问卷调查,得到如下列联表:
对新能源汽车的认可度
合计
认可
不认可
南方消费者
150
150
300
北方消费者
75
125
合计
225
500
(1)求,;
(2)根据小概率值的独立性检验,能否认为南、北方消费者对新能源汽车的认可度有差异?
(3)记南、北方消费者中对新能源汽车认可的概率分别为,,给出,的估计值,并根据,求4位消费者(2位南方消费者和2位北方消费者)中认可新能源汽车的人数的分布列与期望.
附:.
0.005
0.010
0.001
3.841
6.635
10.828
【解题思路】(1)根据列表计算求解;
(2)先计算,再与临界值比较即可判断;
(3)先应用频率计算,,再结合独立事件概率乘积公式计算概率再列出分布列,再应用公式计算期望即可.
【解答过程】(1)由列联表得,.
(2).
由于,所以根据小概率值的独立性检验,可以认为南,北方消费者对新能源汽车的认可度有差异.
(3)南、北方消费者中对新能源汽车认可的频率分别为,,因此,的估计值分别为,.
4位消费者(2位南方消费者和2位北方消费者)中认可新能源汽车的人数,
则,
,
,
,
.
故的分布列为:
0
1
2
3
4
故.
32.(2025·山东聊城·一模)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,女生的获奖率为,填写下列列联表,并依据小概率值的独立性检验,判断男生与女生的获奖情况是否存在差异?
性别
奖励
合计
获奖
未获奖
男
女
合计
附:,
【解题思路】(1)由频率分布直方图中,所有矩形面积之和为可得的值,将第一组的容量除以第一组的频率可得出样本容量;
(2)将每个矩形底边的中点值乘以对应矩形的面积,相加可得出平均数;
(3)根据题意完善列联系表,结合临界值表可得出结论.
【解答过程】(1)由频率分布直方图中,所有矩形面积之和为可得,解得,
样本容量为.
(2)所有参赛学生的平均成绩为.
(3)由题意可知,获奖人数为人,
由题意可得如下列联表
性别
奖励
合计
获奖
未获奖
男
女
合计
所以,,
所以,依据小概率值的独立性检验,男生与女生的获奖无差异.
33.(23-24高二下·山东烟台·期末)某高中在高二年级举办创新作文比赛活动,满分100分,得分80及以上者获奖.为了解学生获奖情况与选修阅读课程之间的关系,在参赛选手中随机选取了50名学生作为样本,各分数段学生人数及其选修阅读课程情况统计如下:
成绩
学生人数
6
10
24
7
3
选修读课程人数
0
3
9
4
4
(1)根据以上统计数据完成下面的列联表,依据的独立性检验,能否认为学生获奖与选修阅读课程有关联;
获奖
没有获奖
合计
选修阅读课程
不选阅读课程
合计
(2)在上述样本的获奖学生中随机抽取3名学生,设3人中选修阅读课程人数为,求的分布列及数学期望.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解题思路】(1)由题意可得列联表,计算的值,并与临界值表比较,可得结论;
(2)确定变量的取值,求得每个值对应的概率,即可得分布列,根据数学期望公式即可求得期望.
【解答过程】(1)根据已知条件可得
获奖
没有获奖
合计
选修阅读课程
8
12
20
不选阅读课程
2
28
30
合计
10
40
50
零假设:创新作文比赛获奖与选修阅读课程无关联;
根据列联表中数据计算可得:
,
根据小概率值的独立性检验,推断不成立,
即认为创新作文比赛获奖与选修阅读课程有关联,此推断犯错的概率不大于.
(2)由题意可知的可能取值为,
则,,
,
所以随机变量的分布列为:
1
2
3
.
34.(24-25高二下·广西柳州·期中)近期根据中国消费者信息研究报告显示,超过40%的消费者更加频繁地使用网上购物,某网购专营店统计了2025年1月5日到9日这5天到该专营店购物的人数y和时间第x天间的数据,列表如下:
x
1
2
3
4
5
y
75
84
93
98
100
(1)由表中给出的数据判断是否可以用线性回归模型拟合人数y和时间第x天之间的关系?若可用,求出y关于x的经验回归方程,并估计1月10日到该专营店购物的人数;若不可用,请说明理由(人数用四舍五入法取整数,若相关系数,则线性相关程度很高,可以用线性回归模型拟合,r精确到0.01);
(2)该专营店为了吸引顾客,推出两种促销方案.方案一:购物金额每满100元可减5元;方案二:一次性购物金额超过800元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打9折,中奖两次打8折,中奖三次打6折.某顾客计划在此专营店购买1000元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠.
参考数据:.,,
附:相关系数,,
【解题思路】(1)先计算相关系数,再结合线性回归方程的知识求解即可;
(2)首先根据二项分布的概率公式求出为的概率值,则方案二的期望可求,与方案一的950进行比较即可判断.
【解答过程】(1)由表中数据可得,,所以,所以可用线性回归模型拟合人数与天数之间的关系.而,则所以
令,可得,所以1月10日到该专营店购物的人数约为109.
(2)若选方案一、需付款元.
若选方案二、设需付款元,则的取值可能为,则,
,
所以,因此选择方案二更划算.
2 / 2
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。