内容正文:
第6讲 成对数据的统计分析考点定位精讲讲练
相关分析和回归分析是分析两个数值变量关系的两个相互补充的方法.相关分析描述 了两个变量的相关程度,回归分析描述了因变量是怎样受自变量影响的.
1.为了得到两个变量之间是否具有一定的关系的直观印象,可以用一幅散点图来描述 这些数据.
2.度量两个数值变量的关系强度的统计量是相关系数r.相关系数r总在-1到1之 间.若相关系数r为正值,则两个变量的值多为同时增加或减少;若相关系数r为负值,则一 个变量的值通常会随着另一个变量的减少而增加.
3.回归方程代表了两个变量间的关系,线性回归直线通过散点图中数据点的中心.直线 的斜率度量了直线的倾斜度,直线的斜率越大,解释变量的单位变化所引起的反应变量的差 异就越大.回归方程可以通过最小二乘法得到.回归方程可以由一个解释变量值来预测反应 变量的值,反应变量的预测值是真实值的一个估计.
4.最小二乘法得到的回归直线能较好地反映一个变量随另一个变量的波动情况,具有 解释因果关系和预测的功能.
5.一张2×2列联表是一张频数(率)表,它描述两个分类变量所有值的组合数据是如何 分布的.判断2×2列联表中出现的相关关系是否有统计显著性的方法称为χ2 检验.χ2 检验 的一般步骤是:(1)提出原假设H。;(2)确定显著性水平α=0.05;(3)计算χ2 统计量;(4)统 计决断:当χ2 ≥3.841时,拒绝原假设, 推断两个变量显著相关,否则,接受原假设,推断两个 变量不相关(即两个变量是独立的).在实际情况下,是否完全拒绝原假设还需要考虑样本观 测值的数量
考点一:成对数据的相关分析
例1.(2021·全国·高二课时练习)已知变量与相对应的一组数据为,,,,,变量与相对应的一组数据为,,,,.表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,则下列结论中正确的是( )
A. B. C. D.
【答案】C
【分析】根据变量对应数据可确定与之间正相关,与之间负相关,由此可得相关系数的大小关系.
【详解】由变量与相对应的一组数据为,,,,,可得变量与之间正相关,;
由变量与相对应的一组数据为,,,,,可知变量与之间负相关,;
综上所述:与的大小关系是.
故选:C.
例2.(2021·全国·高二课时练习)下列两个变量间的关系,是相关关系的是( )
A.任意实数和它的平方 B.圆半径和圆的周长
C.正多边形的边数和内角度数之和 D.天空中的云量和下雨
【答案】D
【分析】根据各选项中两个变量是确定还是非确定性关系可得结论.
【详解】对于ABC,两个变量之间为确定性关系,即两个变量之间均为函数关系,ABC错误;
对于D,根据生活经验,天空中的云量和下雨之间不是确定性关系,虽然有云不一定下雨,但是如果没有云一定不下雨,说明它们之间是相关关系,D正确.
故选:D.
例3.(2019·广东·深圳市高级中学高二期末(文))某公司年的年利润(单位:百万元)与年广告支出(单位:百万元)的统计资料如表所示:
年份
2006
2007
2008
2009
2010
2011
利润
12.2
14.6
16
18
20.4
22.3
支出
0.62
0.74
0.81
0.89
1
1.11
根据统计资料,则利润中位数( )
A.是16,与有正线性相关关系
B.是17,与有正线性相关关系
C.是17,与有负线性相关关系
D.是18,与有负线性相关关系
【答案】B
【分析】根据数据分析可直接得出结论.
【详解】由题意,利润中位数是,而且随着利润的增加,支出也在增加,故与有正线性相关关系.
故选:B.
例4.(2021·江西赣州·高二阶段练习(理))如图是国家统计周公布的2020年下半年快递运输量情况,请根据图中信息选出错误的选项( )
A.2020年下半年,同城和异地快递量最高均出现在11月
B.2020年10月份异地快递增长率小于9月份的异地快递增长率(注.增长率指相对前一个月而言)
C.2020年下半年,异地快递量与月份呈正相关关系
D.2020年下半年,每个月的异地快递量都是同城快递量的6倍以上
【答案】D
【分析】根据统计图表中的数据计算可得答案.
【详解】对于A,由图可看出,同城和异地快递量最高都在11月份,故A正确;
对于B,因为,9月异地快递增长率明显高于10月异地快递增长率,故B正确;
对于C,由图可看出,除2020年12月异地快递量较11月略少,其余都有较明显增加,因此可以判断异地快递量与月份呈正相关关系,故C正确;
对于D,2020年7月的异地快递量为572812.9万件,同城快递量为105191.1万件,异地快递量不到同城快递量的6倍,故D不正确.
故选:D.
例5.(2021