内容正文:
第八章 成对数据的统计分析
模块一:本章知识思维导图
模块二:典型例题
经典题型一:线性回归方程
经典题型二:非线性回归方程
经典题型三:独立性检验
经典题型四:统计的综合应用
模块三:数学思想方法
①分类讨论思想②转化与化归思想③特殊到一般思想
模块一:本章知识思维导图
模块二:典型例题
经典题型一:线性回归方程
例1.(2024·高三·天津·期末)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x
1
2
3
4
5
6
7
一次最多答对题数y
12
15
16
18
21
24
27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),其相关系数 (结果保留两位小数)
例2.(2024·云南楚雄·一模)对具有线性相关关系的变量有一组观测数据(),其经验回归方程为,且,,则相应于点的残差为 .
例3.(2024·高三·广东汕头·期中)以下4幅散点图所对应的样本相关系数的大小关系为 .
例4.(2024·高三·浙江·开学考试)已知成对样本数据中互不相等,且所有样本点都在直线上,则这组成对样本数据的样本相关系数 .
例5.(2024·高三·上海嘉定·阶段练习)某产品的广告支出费用x(单位:万元)与销售额y(单位:万元)的数据如下表:
x
2
4
5
6
8
y
30
40
a
50
70
己知y关于x的线性回归方程为,则表格中实数a的值为 .
例6.(2024·陕西·二模)为了提高市民参观的体验感,某博物馆需要招募若干志愿者对馆藏文物进行整理.已知整理所需时长y(单位:小时)与招募的志愿者人数x(单位:人)的数据统计如下表:
志愿者人数x
1
2
3
4
5
整理时长y
70
m
50
40
35
(1)若,求y关于x的线性回归方程;
(2)根据(1)中的线性回归方程,若博物馆计划在20小时内完成对文物的整理工作,求博物馆至少需要招募的志愿者人数.
附:线性回归方程中,,.
例7.(2024·四川巴中·一模)下图是某市2016年至2022年生活垃圾无害化处理量y(单位:万吨)与年份t的散点图.
(1)根据散点图推断变量y与t是否线性相关,并用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2024年该市生活垃圾无害化处理量.
参考数据:
,,,.
参考公式:,;相关系数.
例8.(2024·全国·模拟预测)党的十八大以来,全国各地区各部门持续加大就业优先政策实施力度,促进居民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入结构不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升. 下表为重庆市 2014 2022 年全体居民人均可支配收入,将其绘制成散点图 (如图 1),发现全体居民人均可支配收入与年份具有线性相关关系. (数据来源于重庆市统计局 2023-05-06 发布).
年份
2014
2015
2016
2017
2018
2019
2020
2021
2022
全体居民人均可支配收入 (元)
18352
20110
22034
24153
26386
28920
30824
33803
35666
参考数据:.
参考公式: 对于一组数据 ,其回归直线方程 的斜率和截距的最小二乘估计分别为.
(1)设年份编号为(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为(单位:万元),求经验回归方程(结果精确到 0.01 ),并根据所求回归方程,预测2023年重庆市全体居民人均可支配收入;
(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从20142022中任取3年的数据进行分析,将选出的人均可支配收入超过3万的年数记为,求随机变量的分布列与数学期望.
经典题型二:非线性回归方程
例9.(2024·高三·重庆·开学考试)当前,人工智能技术以前所未有的速度迅猛发展,并逐步影响我们的方方面面,人工智能被认为是推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司在这个领域逐年加大投入,以下是近年来该公司对产品研发年投入额(单位:百万元)与其年销售量y(单位:千件)的数据统计表.
1
2
3
4
5
6
1
1.5
3
6
12