内容正文:
专题03 成对数据的统计分析
相关系数
1.(2023下·北京房山·高二北师大燕化附中校考期中)某统计部门对四组成对样本数据进行统计分析后,获得如图所示的散点图,关于样本相关系数的比较,其中正确的是( )
A. B.
C. D.
2.(2023下·河北邯郸·高二校联考期中)由一组样本数据,,,,利用最小二乘法得到两个变量的回归直线方程为,则下面说法正确的是( )
A.直线至少经过点,,,中的一个点
B.直线必经过点
C.相关系数r与回归系数同号
D.相关系数r越大,两个变量之间的线性相关性越强
3.(2023下·广西桂林·高二校考期中)对于相关系数,下列说法中错误的是 .
①时,成对样本数据线性相关程度较弱;
②时,表明成对样本数据正相关;
③若线性回归方程中的回归系数,则相关系数;
④越接近1,线性相关程度越强,越接近0,线性相关程度越弱.
4.(2023下·辽宁沈阳·高二校联考期中)在散点图中,若所有的样本点都落在一条斜率为非0实数的直线上,则相关系数 .
5.(2023下·河南驻马店·高二统考期中)流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.儿童相对免疫力低,在幼儿园、学校等人员密集的地方更容易被传染.某幼儿园将去年春季该园患流感的小朋友按照年龄与人数统计,得到如下数据:
年龄
2
3
4
5
6
患病人数
21
20
15
14
10
(1)求关于的线性回归方程;
(2)计算变量的相关系数(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强?
附:回归方程中,,相关系数.
6.(2023下·重庆沙坪坝·高二重庆一中校考期中)根据国家统计局统计,我国2018—2022年的新生儿数量如下:
年份编号
1
2
3
4
5
年份
2018
2019
2020
2021
2022
新生儿数量(单位:万人)
1523
1465
1200
1062
956
(1)由表中数据可以看出,可用线性回归模型拟合新生儿数量与年份编号的关系,请用相关系数说明相关关系的强弱;(,则认为与线性相关性很强)
(2)建立关于的回归方程,并预测我国2025年的新生儿数量.
参考公式及数据:.
求线性回归方程
1.(2023下·河南省直辖县级单位·高二校考期中)在一次试验中,当变量x的值取1,2,3,4时,变量y的值分别为2,3,4,5,则y与x的回归直线方程为( )
A. B.
C. D.
2.(2023下·上海杨浦·高二复旦附中校考期中)以下是一些城市的海拔高度与该城市的大气压的对照表.我们已知大气压与海拔高度是近似线性的关系.
城市
海拔高度/m
大气压/Pa
北京
31.2
99.86
哈尔滨
171.7
98.51
上海
4.5
100.53
昆明
1891.4
80.80
拉萨
3658.0
65.23
则我们可以利用一元线性回归分析(其中海拔高度为解释变量,大气压为反应变量),估计珠穆朗玛峰顶(海拔米)的大气压为 (近似到小数点后两位).
3.(2023下·陕西宝鸡·高二统考期中)某公司对2023年月份公司的盈利情况进行了数据统计,结果如下表所示:
月份
1
2
3
4
利润/万元
5
6
8
利用线性回归分析思想,预测出2023年12月份的利润为万元,则关于的线性回归方程为 .
4.(2023上·四川泸州·高二校考期中)《中华人民共和国道路交通安全法》第条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,其中第条规定:对不礼让行人的驾驶员处以扣分,罚款元的处罚.下表是某市一主干路口监控设备所抓拍的个月内驾驶员不“礼让斑马线”行为统计数据:
月份
违章驾驶员人数
参考公式:,
(1)请利用所给数据求违章人数与月份之间的回归直线方程;
(2)预测该路口月份的不“礼让斑马线”违章驾驶员人数.
5.(2023下·河南省直辖县级单位·高二校考期中)某个服装店经营某种服装,在某周内获纯利y(元)与该周每天销售这种服装件数x之间的一组数据关系见表:
x
3
4
5
6
7
8
9
y
66
69
73
81
89
90
91
已知,,
(1)求(若结果不是整