内容正文:
N
高中数学选择性必修第二册人教B版
4.3统计模型
4.3.1一元线性回归模型
第1课时相关关系与回归直线方程
盒)的数据如下表所示,
效果评价
月份x
1.若回归直线方程为y=2-1.5x,则变量
产量y历盒
x增加1个单位长度时()
A.y平均增加1.5个单位长度
通过上面五组数据得到y关于x的回归
B.y平均增加2个单位长度
直线方程为y=0.7x+a,预测该制药厂今年7
C.y平均减少1.5个单位长度
月份甲胶囊的产量为()
D.y平均减少2个单位长度
A.7.3万盒
B.7.8万盒
2.为了解某商品
C.8.3万盒
D.8.8万盒
250
的销售量y(件)与销
5.已知x,y之间的一组数据如下表
售价格x(元/件)的
150
100
T0090
所示
关系,统计了(x,y)
50
2
3
4
5
6
的10组数据,并画成
246810x
第2题图
3
4
6
8
9
散点图如图所示,则y
关于x的回归直线方程可能是(
则y关于x的回归直线方程是()
A.=-10x-198B.y=-10x+198
A.y=x+1
B.y=2x-1
C.y=10x+198
D.=10x-198
cg-号
D产号41
3.具有线性相关关系的变量x,y的回
6.已知两个变量x和y之间具有线性相
归方程为y=2x,则下列选项正确的是()
关关系,经调查得到如下样本数据
A.变量x与y是函数关系
3
4
5
6
7
B.变量x与y正相关
3.5
2.4
1.1
-0.2
-1.3
C.当x=4时,y的预测值为2
根据表格中的数据求得回归直线方程为
D.若x增加1个单位长度,则y约减少
1个单位长度
y=bx+a,则下列说法中正确的是()
4.某同学在研究性学习中,收集到某制
A.a>0,b>0
B.a>0,6<0
药厂今年前5个月甲胶囊的产量(单位:万
C.a<0,b>0
D.a<0,b<0
68)练
第四章概率与统计。
7.由表中三个样本点通过最小二乘法计
10.某商品的广告费用x(万元)与销
算得到y关于x的回归直线方程为y=2x+
售额y(万元)的统计数据如下表,
且当x=10时,=23,则2m-n=(
广告费用x万元
3
6
12
13
销售额y万元
28
31
41
m
27
25
n
根据表中数据可得回归直线方程为夕=
A.6
B.-6
C.7
D.-7
5x+a,则预测当广告费用为8万元时,销售
8.(多选题)某公司为了增加某商品的
额为
万元
销售利润,调查了该商品投入的广告费用
11.某同学收集了具有线性相关关系的
x(万元)与销售利润y(万元)的统计数据
两个变量x,y的一组样本数据(x,y)(i=
如下表所示.由表中数据,得y关于x的回
1,2,…,10),经计算得到回归直线方程
0
10
归直线方程为=bx+a,则下列结论正确的是
为=-2x+a,且∑x=20,
y=-25,则a=
(
广告费用x/万元
6
12.已知由一组样本数据确定的回归直
销售利润y万元
6
10
12
线方程为y=1.5x+1,且x=2,发现有两组数
A.6>0
据(2.2,2.9)与(1.8,5.1)的误差较大,
去掉这两组数据后,重新求得的回归直线的
B.a>0
斜率为1,那么当x=4时,y的估计值为
C.回归直线必过点(5,9)》
D.回归直线必过点(3,6)
13.为加强社区居民的垃圾分类意识,
9.(多选题)已知y关于x的回归直线
推动社区垃圾正确投放,某社区在健身广场
方程为y=0.7x+1.05,且变量x,y之间的一
举办了“垃圾分类,从我做起”生活垃圾分
组相关数据如下表所示,则下列说法正确的
类大型宣传活动,号召社区居民用实际行动
是(
)
为建设绿色家园贡献一份力量,为此需征集
2
3
·部分垃圾分类志愿者.某垃圾站的日垃圾
2.5
3
4.5
分拣量y(kg)与垃圾分类志愿者人数x的
m
数据统计如下
A.m=4
志愿者人数
B.回归直线必过点(3.5,3.5)
x
C.x与y正相关
日垃圾分拣量
25
30
40
45
60
D.当x=10时,y的估计值为9.05
y/kg
练
69
N
高中数学选择性必修第二册人教B版
通过观察散点图,发现日垃圾分拣量
(1)试根据1至5月份的数据,建立y
y(kg)与垃圾分类志愿者人数x具有线性
关于x的回归直线方程.
相关关系。
(2)若由回归直线方程得到的估计数据
(1)求y关于x的回归直线方程
与剩下的检验数据的误差不超过0.65,则认
(2)预测日垃圾分拣量为80kg时,需
为所得到的回归直线方程是理想的,试问
要的垃圾分类志愿者人数,
(1)中所得到的回归直线方程是否理想,
6a-0
参考公式:6=
-,a=y-c.
参考公式:在=6x+a中,6=il
-,a=y
6元
5
5
参考数据:
∑x=392.
∑=502.5
i=
14.某科技公司研发了一项新产品A,
销售小组进行市场调研,对公司1月份至6
月份产品A的销售量及销售单价进行统计,
销售单价x(千元)和销售量y(千件)之
间的一组数据如下表所示
月份i
1
2
4
6
销售单价x/千元9
9.5
10
10.5
11
8
销售量y千件
11
10
8
6
15
70)练
第四章概率与统计。
求得的线性回归方程为=3x+à.后为稳妥起
提升练习
见,研究小组又增加了2次试验,得到2个
15.某校为了解本校高一男生身高和体
偏差较小的样本点(2,11),(6,22),根
重的相关关系,在该校高一年级随机抽取了
据这10个样本点重新求得线性回归方程为
7名男生,测量了他们的身高和体重统计得
y=nx+m
到下表.
(1)求a的值.
身高x
167
173
175
177178
180
181
(单位:cm)
(2)证明:回归直线y=x+m经过点
体重y
(4,16.5).
90
54
59
64
(单位:kg)
6
72
76
由表格制作如图所示的散点图:
↑kg
100
90
70
60
●●●
50
40
8
10
166168170172174176178180182x/cm
第15题图
由最小二乘法计算得到回归直线的方
程为=6x+a1;经过残差分析,点(167,90)
对应残差过大,把它去掉后,再用剩下的6
组数据计算得到回归直线l2的方程为y=62x+
a2,则下列选项正确的是()
A.61<62,a>a B.61<62,a<a
C.6>62,am<a2D.6>b2,a>a
16.已知两个变量y与x线性相关,某
研究小组为得到其具体的线性关系进行了
10次试验,得到10个样本点,研究小组去
掉了明显偏差较大的2个样本点,剩余的8
个样本点(x,y)(i=1,2,3,…,8)满
足三=2,立=12,根据这8个样本点
练(71N
高中数学选择性必修第二册人教B版
E(E)=200x0.20+300×0.35+400x0.30+500x0.15=340(束).设
利润为m,则m=5ξ+1.6×(500-)-500x2.5=3.4花-450,
..E(m)=3.4E(ξ)-450=3.4×340-450=706(元).
11.1.544【解析】X的取值分别为1,2,3,4.X=
1,表明此人第一次参加驾照考试就通过了,故P(X=1)
=0.6.X=2,表明此人在第一次考试未通过,第二次通过
了,故P(X=2)=(1-0.6)×0.7=0.28.X=3,表明此人在第
一、第二次考试未通过,第三次通过了,故P(X=3)=
(1-0.6)×(1-0.7)×0.8=0.096.X=4,表明此人第一、第
二、第三次考试都未通过,故P(X=4)=(1-0.6)×(1-0.7)
×(1-0.8)=0.024
∴他一年内参加考试次数X的分布列如下表.
X
1
2
3
4
0.6
0.28
0.096
0.024
.X的均值为E(X)=1×0.6+2×0.28+3×0.096+4×0.024=
1.544.
12【解析】依题意,知专的所有可能值为
2,4,6,设每两局比赛为一轮,则该轮结束时比赛停
止的概率为号+兮广号若该轮结柬时比赛还将继
续,则甲、乙在该轮中必是各得一分,此时,该轮比赛
结果对下轮比赛是否停止没有影响,从而有P=2)=5,
Γ9
P4-音×g品P-6-号放EE2
9
+446x9-265
8181
13.解:()由已知,得小明中奖的概率为子,小
红中奖的概率为号,两人中奖与否互不影响,记“这2
人的累计得分X≤3”为事件A,则事件A的对立事件
为X=5”.P=)-号x号告4)1-A5
这两人的累计得分X≤3的概率为贵
11
(2)设小明、小红都选择方案甲抽奖中奖的次数为
X,都选择方案乙抽奖中奖的次数为X2,则这两人选择
方案甲抽奖累计得分的数学期望为E(2X,),选择方案乙
抽奖累计得分的数学期望为E(3X2).
由已知,得XrB2,子),XB2,号),
92
EX-2x号号EX)-2x号=号
E2X)-2EX,);,E3,=3EX)=号
:E(2X)>E(3X2),.他们都选择方案甲进行抽奖
时,累计得分的数学期望较大
14.解:(1)方法一:设“走L,路线至少遇到一次
红灯”为事作A,则PA)-Cx号x号+Cx号x写
+Cx号x兮”走L路线至少遇到一次红灯
的概率为26
7
方法二:设“走L,路线没有遇到红灯”为事件A,
则“走L路线至少遇到一次红灯”为事件A,
放4)--号11-号1号-写×写×写7
r面1-ril79
·走L,路线至少遇到一次红灯的概率为26
27
(2)依题意,X的可能取值为0,1,2.
P0X=0=1-子x1-号)0PX=0=×1-号
-×号-易2-子×号易
随机变量X的分布列如下表.
X
0
1
2
P
1
9
9
10
20
8X000号x1+品2品
20
(3)设选择L路线遇到红灯次数为Y,随机变量Y
服从二项分布,了-B3,号,BY)=3x号2EK,
3
.应选择L2路线
>4.3统计模型
4.3.1一元线性回归模型
第1课时相关关系与回归直线方程
效果评价
1.C【解析】回归直线方程为=-1.5x+2,回归直
线的斜率为-1.5,变量x增加1个单位长度时,y平均
减少1.5个单位长度.故选C
2.B【解析】设y关于x的回归直线方程为=6x+a,
则由题图知6<0,>0.故选B.
3.D【解析】变量x与y是相关关系,不是函数关
系,故A不正确;变量x与y负相关,故B不正确;当
x=4时,y的预测值为-2,故C不正确;若x增加1个
单位长度,则y约减少1个单位长度,故D正确.故
选D.
4.D【解析】由题知1+2+3+4+5=3,=5+5+6+6+8
5
=6,将其代入=0.7x+a中,得a=6-0.7×3=3.9,故y关于
x的回归直线方程为=0.7x+3.9,当x=7时,=0.7x7+
3.9=8.8.故选D.
5.C【解析】由题得=2+345+6-4,了=3+4+6+8+9
5
6.经验证,可知=+1,-2-1,号,号+1
这四条直线巾过点(4,0的只有)令号放迹C
6.B【解析】由已知数据,可知y随着x的增大而
减小,则变量x和y负相关,6<0.=写×(3+4+5+6+
7)-5,=写×3.5+24411-02-13)1.1,1.1=56+a,则
a=1.1-5b>0.故选B.
7.D【解析】当=10时,=23,23=20+,解得
看=3,即-2+3.7=2gB-25,275
3
3
52+n,52n-2x25+3,2m-n=-7.故选D.
3
3
3
8.ABC【解析】由表格数据,得元=3+4+6+7=5,=
4
6+8+10+129,回归直线必过点(5,9),故C正确,
D错误;6=
(x-)0-)
6+1+1+6=1.4,则9=1.4×
∑x-x
4+1+1+4
5+a,解得a=2,故A,B正确.故选ABC.
9.ABC【解析】由题意,元=2+344+5-35,则=
4
参考答案。
0.7x3,5+1.05=35,又=25+3+m+4.5=10+m,10+m=
4
4
4
35,解得m=4,故A正确;回归直线必过点(3.5,3.5),
故B正确;由回归直线方程为=0.7x+1.05,知x与y正
相关,故C正确;当x=10时,y=0.7×10+1.05=8.05,故
D错误.故选ABC
10.57【解析】由题意,知元=243+5+6=4,y
4
28+31+41+48=37,.37=5x4+a,解得=17,.预测当广
4
告费用为8万元时,销售额为5x8+17=57万元.
1号限1,新品2三
,a=3+2x2
12.6【解析】x=2,=1.5×2+1=4.由题意,可知
去掉两组数据(2.2,2.9)和(1.8,5.1)后,x和y没变,
设重新求得的回归直线方程为=x+a,将(2,4)代人,
解得a=2,则=x+2,.当=4时,=4+2=6.
13.解:(1)由题意,知元=2+3+4+5+6=-4,
5
25+30+40+45+60-40,
0m=24x25-40
(3-4)×(30-40)+(4-4)×(40-40)+(5-4)×(45-40)+(6-4)×
(60-40)=85,
立3-2-4-6444454
(6-4)2=10,6=
∑(x-)0-)
3-85,可-6饭-40-
x-xP
i=1
8.5×4=6.回归直线方程为=8.5x+6.
(2)当y=80时,80=8.5x+6,解得x≈9.
.需要的垃圾分类志愿者人数为9。
14.解:(1)元=
5×9+9.5+10+10.5+11)10,☑
号x1+10+8+6+5)-8,6=200
502.5-5×102
=-3.2,∴.a=8-
(-3.2)×10=40,y关于x的回归直线方程为=-3.2x+40.
(2)当x=8时,=-3.2×8+40=14.4,则
-y=l14.4-15l=0.6<0.65,
∴.可以认为所得到的回归直线方程是理想的
93
高中数学选择性必修第二册人教B版
提升练习
15.A【解析】身高的平均数为
元=1674173+175+17+178+180+181-1231≈176,:点
7
(167,90)的横坐标167小于平均值176,纵坐标90相
对过大,∴.去掉(167,90)后回归直线的纵截距变小而
斜率变大,故6<b2,a>a.故选A
16)解:南题r5空安024了8名
8
日×132=165,则可-3=16.5-3x4=45.
(2)证明:样本点(2,11),(6,22)分别记为
(,),(x0,y),则这10个样本点横坐标的平均数
1
1
70=(+x1o+∑)=。×(2+6+32)=4,纵坐标
1
的平均数了'=02700+y+月
1
70×(1+2+
132)=16.5,
.回归直线=x+m经过点(4,16.5)
第2课时相关系数与非线性回归方程
效果评价
1.A【解析】由相关系数与回归直线的斜率之间的
关系,可知相关系数的取值范围是(0,1].故选A.
2.B【解析】散点图中的点集中在一条曲线附近,
且曲线的形状与函数y=Vx的图象相似,故选B.
3.C【解析】由题知模型3的相关系数为0.945,其
绝对值最接近于1,拟合效果最好.故选C
4.A【解析】由y,得z与x的回归直线方程为
=bx+lna.由散点图可知z与x正相关,b>0.由散点图
可知直线z=bx+na的纵截距大于0,即lna>0,.∴.a心1.故
选A.
5.D【解析】y=e1的两边取自然对数得ny=1+at,
令u=lny,则u=l+a.云=(nyr+lnya+lnyg)x写-2,i-(+te+
x写2,2=-2a+1,解得7,=1+分,则y-e"哈
当t=7时,=e5故选D.
6.D【解析】由题图,可知D(10,2)距离其他点
较远,且其他点大致分布在一条直线附近,去掉点
D(10,2)后,x与y的线性相关性变强.I越接近于1,
94
线性相关性越强,.去掉点D(10,2)后,相关系数r的
绝对值变大,故A错误,B错误;去掉点D(I0,2)后,
x与y的线性相关程度变强,∴残差平方和变小,x与y
的相关性变强,故C错误,D正确.故选D.
7.A【解析】由y0,得10y心,两边同
时取对数,得n(100y)=kx+c.由表中数据,可知元=
1+2+3+4+5-3,1n(100y)的平均数为
43436445451442对于A,由y0em
4
得ln(100y)=0.043x+4.291,将x=3代入,可得ln(100y)
=0.043×3+4.291=4.42,与题中数据吻合,故A正确;对
于B,由)7d0e,得h(10y-0434291,将
x=3代入,可得n(100y)=0.043×3-4.291=-4.162≠4.42,
故B错误;对于C,由y=eo0441,得lny=0.043x+4.291,
而表中所给数据为ln(100y)的相关量,故C错误;对于
D,由y=em842,得ny=0.043x-4.291,而表中所给数据
为n(I00y)的相关量,故D错误.故选A.
8.CD【解析】对于A,回归直线方程=6x+a对应的
回归直线有可能不经过其样本点数据中的任意一个点,
故A不正确;对于B,回归直线方程为=1.1x-5,则当
x增大1个单位长度时,增大1.1个单位长度,故B不
正确;对于C,设两个变量x,y之间的线性相关系数为
r,则=1的充要条件是成对数据构成的点都在回归直线
上,故C正确;对于D,在残差的散点图中,残差分布
的水平带状区域的宽度越窄,其模型的拟合效果越好,
故D正确.故选CD.
9.AB【解析】x=2+3+4+5+6=4,万
5
15+4.5+5.5+6.5+7=5,.直线8=1.3x+a过点(4,5),
可得a=5-1.3×4=0.2,由z=lny,y=ce“,得z=ln(cer)=kx+
nc,.k=1.3,lnc=-0.2,即c=e2.故选AB.
立6k-36-7
10.0【解析】相关系数r=
Vx-30-r
∑(x-用0y-
与6=
一的分子相同,故0.
(x-