内容正文:
[基础过关]
1.如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是( )
A.D B.E C.F D.A
解析:B [因为相关系数的绝对值越大,越接近1,则说明两个变量的相关性越强.因为点E到直线的距离最远,所以去掉点E,余下的5个点所对应的数据的相关系数最大.]
2.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的样本相关系数,r2表示变量V与U之间的样本相关系数,则( )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
解析:C [对变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,即r1>0;对变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r2<0.故r2<0<r1.]
3.在一项调查中有两个变量x和y,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为y关于x的回归方程的函数类型是( )
A.y=a+bx B.y=c+d
C.y=m+nx2 D.y=p+qcx(q>0)
解析:B [散点图呈曲线,排除A选项,且增长速度变慢,排除选项C、D,故选B.]
4.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x/万元
8.2
8.6
10.0
11.3
11.9
支出y/万元
6.2
7.5
8.0
8.5
9.8
根据上表可得经验回归方程=x+,其中=0.76,=-·.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
解析:B [由题意知==10,==8,
∴=8-0.76×10=0.4,∴当x=15时,=0.76×15+0.4=11.8(万元).]
5.(多选)为研究需要,统计了两个变量x,y的数据情况如下表:
x
x1
x2
x3
…
xn
y
y1
y2
y3
…
yn
其中数据x1,x2,x3,…,xn和数据y1,y2,y3,…,yn的平均数分别为和,并且计算相关系数r=-0.8,回归方程为=x+,如下结论正确的为( )
A.将以上数据的每个数据都加一个相同的常数后,方差不变
B.变量x,y的相关性强
C.当x=x1时,必有=y1
D.<0
解析:ABD [A.因为方差是表示数据波动大小的量,将一组数据的每个数都加一个相同的常数后,方差不变,所以A正确;B.相关系数r=-0.8,|r|>0.75,变量x,y的相关性强,所以B正确;C.当x=x1时,不一定有=y1,因此C错误;D.因为r=-0.8<0,是负相关,所以<0,故D正确.]
6.(多选)下列关于相关系数r的说法正确的是( )
A.相关系数r越大两个变量间相关性越强;
B.相关系数r的取值范围为[-1,1];
C.相关系数r>0时两个变量正相关,r<0时两个变量负相关;
D.相关系数r=1时,样本点在同一直线上.
解析:BCD [根据相关系数的意义对每个结论进行分析、判断可得错误的结论.
对于相关系数r,有以下结论:①当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.②r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.
对于A,当r<0时此结论不成立,所以A不正确.
对于B,由相关系数的性质可得-1≤r≤1,所以B正确.
对于C,由相关系数的性质可得正确.
对于D,由相关系数的性质可得正确.故选BCD.]
7.在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为________.
法二:观察四个点,发现其在一条单调递减的直线上,故y与x的相关系数为-1.
8.已知某个样本点中的变量x,y线性相关,相关系数r>0,平移坐标系,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.
解析:因为r>0,时,b>0,所以大多数的点都落在第一、三象限.
答案:一、三
9.某年一轮又一轮的寒潮席卷全国.某市场为了了解某品牌羽绒服的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:
月平均气温x/℃
17
13
8
2
月销售量y/件
24
33
40
55
由表中数据算出回归方程=x+中的=-2.气象部门预测下个月的平均气温为6℃,据此估计,该商场下个月该品牌羽绒服的销售件数为________.
解析:由表格得(,)为(10,38),又(,)在回归直线=x+上,且=-2,所以38=-2×10+,=58,所以=-2x+58,当x=6时,=-2×6+58=46.
答案:46
10.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围.令z=lny,求得线性回归方程为z=0.25x-2.58,则该模型的回归方程为________.
解析:因为z=0.25x-2.58,z=lny,
所以y=e0.25x-2.58.
答案:y=e0.25x-2.58
11.某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第X年与年销量Y(单位:万件)之间的关系如表:
X
1
2
3
4
Y
12
28
42
56
在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度.
解:作出散点图如图:
由散点图可知,各点大致分布在一条直线附近,由此推断x与y线性相关.
由题中所给表格及参考数据得:
∵y与x的相关系数近似为0.999 7,可以推断该公司的年销量y与第x年呈正线性相关,且线性相关程度很强.
[能力提升]
12.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得=
=-=1.331-0.10×4≈0.93.
所以y关于t的回归方程为=0.93+0.10t.
将2016年对应的t=9代入回归方程得=0.93+0.10×9=1.83.
所以预测2016年我国生活垃圾无害化处理量为1.83亿吨.
13.习近平总书记在党的十九大报告中指出,要在“幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶“上不断取得新进展,保证全体人民在共建共享发展中有更多获得感.现S市政府针对全市10所由市财政投资建设的敬老院进行了满意度测评,得到数据如下表:
敬老院
A
B
C
D
E
F
G
H
I
J
满意度x(%)
20
34
25
19
26
20
19
24
19
13
投资额y(万元)
80
89
89
78
75
71
65
62
60
52
(1)求投资额y关于满意度x的样本相关系数r;
(2)我们约定:投资额y关于满意度x的样本相关系数r的绝对值在0.75以上(含0.75),两者线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关关系,则采取“末位淘汰”制(即满意度最低的敬老院市财政将不再继续投资,改为区财政投资).求在剔除“末位淘汰”的敬老院后投资额y关于满意度x的回归方程.(系数精确到0.1)
(2)由(1)可知,样本相关系数r≈0.72<0.75,所以投资额y与满意度x没有达到较强线性相关关系,
所以要“末位淘汰”掉J敬老院.
此时==≈22.89,
==≈74.33,
x-92≈288.9+10×21.92-132-9×22.892≈200.43,
xiyi-9≈452.1+10×21.9×72.1-13×52-9×22.89×74.33≈253.28,
=-≈74.33-1.3×22.89≈44.6.
所以所求回归方程为=1.3x+44.6.
[素养培优]
14.某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
x
1
2
3
4
5
6
7
8
y
112
61
44.5
35
30.5
28
25
24
根据以上数据,绘制了散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型y=a+和指数函数模型y=cedx分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程为
=96.54e-0.2x,ln y与x的相关系数r1=-0.94.参考数据:
uiyi
2
u
yi
y
e-2
183.4
0.34
0.115
1.53
360
22 385.5
61.4
0.135
(1)用反比例函数模型求y关于x的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本;
(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选择100元还是90元,请说明理由.
则=-=45-100×0.34=11,
所以=11+100u,
所以y关于x的回归方程为=11+.
(2)y与的相关系数为:
=≈0.99.
因为|r1|<|r2|,所以用反比例函数模型拟合效果更好,当x=10时,y=+11=21(元),
所以当产量为10千件时,每件产品的非原料成本为21元.
(3)①当产品单价为100元,设订单数为x千件,因为签订9千件订单的概率为0.8,签订10千件订单的概率为0.2,
所以E(x)=9×0.8+10×0.2=9.2,
所以企业利润为100×9.2-9.2×=626.8(千元).
②当产品单价为90元,设订单数为y千件,因为签订10千件订单的概率为0.3,签订11千件订单的概率为0.7,
所以E(y)=10×0.3+11×0.7=10.7,
所以企业利润为
90×10.7-10.7×=638.3(千元).
故企业要想获得更高利润,产品单价应选择90元.
学科网(北京)股份有限公司
$$