内容正文:
课时测评19 一元线性回归模型
(时间:40分钟 满分:100分)
(本栏目内容,在学生用书中以独立形式分册装订!)
(1-8每小题5分,共40分)
1.对于给定的两个变量的统计数据,下列说法正确的是( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
答案:C
解析:给出一组样本数据,总可以作出相应的散点图,故C正确;但不一定能分析出两个变量的关系,故A不正确;更不一定符合线性相关,不一定用一条直线近似的表示,故B不正确;两个变量的统计数据不一定有函数关系,故D不正确.
2.两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关系数r如表,其中拟合效果最好的模型是( )
模型
模型1
模型2
模型3
模型4
相关系数r
0.48
0.15
0.96
0.30
A.模型1 B.模型2
C.模型3 D.模型4
答案:C
解析:在线性回归分析中,相关系数为r,|r|越接近于1,其相关程度越大;|r|越小,相关程度也越小;由模型3的相关系数|r|最大,所以其模拟效果最好.
3.为了规定工时定额,需要确定加工某种零件所需的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),由最小二乘法求得回归直线方程为=0.67x+54.9.若已知x1+x2+x3+x4+x5=250,则y1+y2+y3+y4+y5=( )
A.75 B.155.4
C.375 D.442
答案:D
解析:由x1+x2+x3+x4+x5=250,得==50,又=0.67x+54.9,所以=0.67+54.9=0.67×50+54.9=88.4,所以y1+y2+y3+y4+y5=5=5×88.4=442.
4.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为( )
A.1 B.-0.5
C.0 D.0.5
答案:C
解析:根据变量x,y的散点图,得:x,y之间的样本相关关系非常不明显,所以相关系数r最接近的值应为0.
5.(多选)某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
x
2
4
5
6
8
y
▲
40
60
50
70
工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且回归方程为=6.5x+17.5,则下列说法正确的是( )
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则销售额约为75万元
答案:AB
解析:由回归直线方程为=6.5x+17.5,可知b^=6.5,则销售额y与广告费支出x正相关,所以A正确;设丢失的数据为m,由表中的数据可得=5,=,把点代入回归方程,可得=6.5×5+17.5,解得m=30,所以B正确;该公司广告费支出每增加1万元,销售额不一定增加6.5万元,所以C不正确;若该公司下月广告费支出为8万元,则销售额约为=6.5×8+17.5=69.5(万元),所以D不正确.故选AB.
6.某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.
气温(℃)
14
12
8
6
用电量(度)
22
26
34
38
由表中数据得回归直线方程=x+中=-2,据此预测当气温为5 ℃时,用电量的度数约为_________.
答案:40
解析:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30,即样本中心点的坐标为:(10,30),又因为样本中心点(10,30)在回归方程=x+上且=-2,所以30=10×(-2)+a,解得:a=50,所以=-2x+50.当x=5时,y=(-2)×5+50=40.
7.给出5名同学的数学成绩和物理成绩,计算其数学成绩和物理成绩的相关系数r,
r=,判断其关系为____________________.
序号
数学
物理
A
60
50
B
70
40
C
80
70
D
90
80
E
100
80
答案:有很强的正相关关系
解析:分别令:x1=60,x2=70,x3=80,x4=90,x5=100.y1=50,y2=40,y3=70,y4=80,y5=80.
可得==80,
==64.
(xi-)(yi-)=-20×(-14)+(-10)×(-24)+0+10×16+20×16=1 000.
(xi-)2=(-20)2+(-10)2+0+102+202=1 000,(yi-)2=142+242+62+162+162=1 320.所以r=≈0.87.所以其数学成绩和物理成绩的相关关系为:有很强的正相关关系.
8.下列五个命题,正确命题的序号为________.
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.
答案:③④⑤
解析:变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的,综上可得命题①②不对,命题③④⑤正确.
9.(10分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定坐标系中画出表中数据的散点图;(3分)
(2)求y关于x的线性回归方程=x+;(3分)
(3)试预测加工10个零件需要多少时间?(=,=- .)(4分)
解析:
(1)散点图,如图所示.
(2)==3.5,
==3.5,
所以iyi=52.5,=54,
所以==0.7,
所以=3.5-0.7×3.5=1.05,
所以回归直线方程:=0.7x+1.05.
(3)当=0.7×10+1.05=8.05,预测加工10个零件需要8.05个小时.
10.(10分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据.
单价x/元
8
8.2
8.4
8.6
8.8
9
销量y/件
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20;(4分)
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)(6分)
解:(1)由于==8.5,
==80,
所以=-=80+20×8.5=250,
从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-8.25)2+361.25.
当且仅当x=8.25时,L取得最大值,
故当单价定为8.25元时,工厂可获得最大利润.
11.(5分)(多选)根据最小二乘法由一组样本点(xi,yi)(其中i=1,2,…,500),求得的回归方程是=x+,则下列说法正确的是( )
A.样本点可能全部都不在回归直线=x+上
B.若所有样本点都在回归直线=x+上,则变量间的相关系数为1
C.若所有的样本点都在回归直线=x+上,则xi+的值与yi相等
D.若回归直线=x+的斜率<0,则变量x与y呈负相关
答案:ACD
解析:回归直线一定经过样本中心点,但是样本点可能全部不在回归直线上,所以A正确;所有样本点都在回归直线=x+上,则变量间的相关系数为±1,所以B不正确;所有的样本点都在回归直线=x+上,则xi+的值与yi相等,所以C正确;回归直线=x+的斜率<0,则r<0,样本点分布应该从左到右是下降的,则变量x与y呈负相关,所以D正确.
12.(5分)(多选)为了对变量x与y的线性相关性进行检验,由样本点(x1,y1),(x2,y2),…,(x10,y10)求得两个变量的样本相关系数为r,那么下面说法中错误的有( )
A.若所有样本点都在直线y=-2x+1上,则r=1
B.若所有样本点都在直线y=-2x+1上,则r=-2
C.若|r|越大,则变量x与y的线性相关性越强
D.若|r|越小,则变量x与y的线性相关性越强
答案:ABD
解析:当所有样本点都在直线y=-2x+1上时,样本点数据完全负相关,其相关系数r=-1,所以A、B都错误;相关系数|r|值越大,则变量x与y的线性相关性越强,故C正确;
相关系数|r|值越小,则变量x与y的线性相关性越弱,故D错误.
综上知,以上错误的说法是ABD.
13.(15分)流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.儿童相对免疫力低,在幼儿园、学校等人员密集的地方更容易被传染.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:
年龄(x)
2
3
4
5
6
患病人数(y)
22
22
17
14
10
计算变量x,y的相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强?(若|r|∈[0.75,1],则x,y相关性很强;若|r|∈[0.3,0.75),则x,y相关性一般;若|r|∈[0,0.25],则x,y相关性较弱.)
参考数据:≈5.477
参考公式:==,相关系数r=.
解:由题意得:==4,
==17,
r===≈-0.97,
因为r<0,
所以说明x,y负相关,
又|r|∈[0.75,1],说明x,y相关性很强.
所以可以认为该幼儿园去年春季患流感人数与年龄负相关很强.
14.(15分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据进行初步处理,得到如图所示的散点图及一些统计量的值.
(xi-)2
(ωi-)2
(xi-)·
(yi-)
(ωi-)·
(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
表中ωi=,=i.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2分)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(4分)
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?(9分)
附:对于一组数据(u1,v),(u2,v),…,(un,v),其回归直线=+u的斜率和截距的最小二乘估计分别为β^=,=-β^·.
解:(1)由散点图可以判断,y=c+d适宜作年销售量y关于年宣传费x的回归方程类型.
(2)令ω=,建立y关于ω的经验回归方程y=c+dω.
由于d^===68,
=-=563-68×6.8=100.6,
所以y关于ω的经验回归方程为y^=100.6+68ω,因此y关于x的回归方程为y^=100.6+68.
(3)①由(2)知,当x=49时,年销售量y的预报值y^=100.6+68=576.6,
年利润z的预报值z^=0.2×576.6-49=66.32.
②根据(2)的结果知,年利润z的预报值
z^=0.2(100.6+68)-x=-x+13.6+20.12.
所以当==6.8,即x=46.24时,z^取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
学科网(北京)股份有限公司
$