内容正文:
第23讲:相关系数
【课型】复习课
【教学目标】1.了解相关系数的概念及范围
2.会用相关系数公式解决一些简单问题
【预习清单】
【基础知识梳理】
x-0,-
1相关系数:r=
2-20-列
2相关系数r范围:r∈[-1,1]
3当>0时,表明两个变量正相关;当0时,表明两个变量负相关.r的绝对值越接近于1,
表明两个变量的线性相关性越强,?的绝对值越接近于0,表明两个变量之间几乎不存在线
性相关关系。
4通常1大于075时,认为两个变量有很强的线性相关性.
【引导清单】
考向一:相关系数及其应用
例1:某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.
为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地
块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(:,=1,
2,…,20),其中和分别表示第1个样区的植物覆盖面积(单位:公顷)和这
种野生动物的数量,并计算得∑20=心=60,∑20,=y=1200,∑20=1(:一)2
=80,∑20,=10y1-)2=9000,∑20=1(6x-)-)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这
种野生动物数量的平均数乘以地块数):
(2)求样本(,)i=1,2,…,20)的相关系数(精确到0.01):
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性
以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样
方法,并说明理由.
-x0y-
附:相关系数公式:r
V2≈1.414
【解】(1)由已知得样本平均数=120∑20,=y=60,从而该地区这种野生动物数
量的估计值为60×200=12000.
2-x0-
(2)样本(,i=1,2,…,20)的相关系数r
800
2-20y-列
80×9000)=2)3≈0.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再
对200个地块进行分层抽样.
【训练清单】
【变式训练】随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收
入,促销策略越来越多样化,促销费用也不断增加,下表是某购物网站2017年1~8月促销
费用x(万元)和产品销量(万件)的具体数据
月份
2
4
5
6
>
f
促销费用x
6
0
分
21
15
伊
产品销量y
1
2
3.5
4.5
()根据数据绘制的散点图能够看出可用线性回归模型拟合y与x的关系,请用相关系数7
加以说明;(系数精确到0.001)
(2)建立y关于x的回归方程=x十(系数精确到0.01),如果该公司计划在9月份实现
产品销量超6万件,预测至少需投入促销费用多少万元.(结果精确到0.01)
参考数据:
(x-11)(y-3)=74.5,
(x-11)2=340,
N
0:-32=16.5,340
1
=1
≈18.44,165≈4.06,其中x,片分别为第i个月的促销费用和产品销量,=1,2,3,…,
8.
参考公式:(①样本,y)1=1,2,…,n)的相关系数r=∑=1》口道-加0i-0①-功
口过-xox"i=l功口i-eto加2
()对于一组数据1,),(2,2),,c,),其回归方程=x十的斜率和截距的
最小二乘估计分别为==一)一一),=一-一
【解】(1)由题可知=11,=3,将数据代入r=∑4功过-to0t一tg0①》0-
x"=1w口1-x加2,得~74.518.44X4.06=74.574.8664≈0.995.因为y与x的相关系数近
似为0.995,说明y与x的线性相关性很强,从而可以用线性回归模型拟合y与x的关系,(需
要突出“很强”,“一般”或“较弱”不给分)2)将数据代入=∑”=》一)一)∑”=》一)得
=74.5340≈0.219,则=-
≈3-0.219×11≈0.59.因为0.219≈0.22,所以y关于x
的回归方程为=0.22x十0.59.由=0.22x+0.59>6,解得x>24.59,即至少需要投入促销
费用24.59万元.
【巩固清单】
1.某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(x,)
G=1,2,…,m),用最小二乘法建立的回归方程为=一5x+150,则下列结论正确的是()
A.y与x具有正的线性相关关系
B.若r表示y与x之间的线性相关系数,则r=一5
C.当销售价格为10元时,销售量为100件
D.当销售价格为10元时,销售量为100件左右
【解析】选D.由回归直线方程知,y与x具有负的线性相关关系,A错,若r表示y与x之
间的线性相关系数,则1≤1,B错.当销售价格为10元时,=一5×10十150=100,即
销售量为100件左右,C错
2.设两个变量x和