内容正文:
练案[17] 第四章 概率与统计
4. 3 [4. 3. 1 一元线性回归模型]
A组·素养自测
一、选择题
1.(多选)下列关系中,属于相关关系的是( )
A.正方形的边长与面积之间的关系
B.生活习惯与健康状况的关系
C.人的身高与年龄之间的关系
D.降雪量与交通事故的发生率之间的关系
2.某校地理学兴趣小组在某座山测得海拔高
度、气压和沸点的六组数据绘制成散点图如
图所示,则下列说法错误的是 (A )
A.沸点与海拔高度呈正相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关
D.沸点与海拔高度、沸点与气压的相关性都
很强
3.(2023·天津卷)调查某种群花萼长度和花瓣
长度,所得数据如图所示,其中相关系数r =
0. 824 5,下列说法正确的是 (C )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈现负相关
C.花瓣长度和花萼长度呈现正相关
D.若从样本中抽取一部分,则这部分的相关
系数一定是0. 824 5
4.已知x与y之间的一组数据.
x 0 1 2 3
y m 3 5. 5 7
已求得关于y与x的线性回归方程为^y = 2. 2x
+ 0. 7,则m的值为 (D )
A. 1 B. 0. 85
C. 0. 7 D. 0. 5
5.已知x与y之间的几组数据如下表.
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归方程为^y =
b^x + a^.若某同学根据上表中的前两组数据
(1,0)和(2,2)求得的直线方程为y = b′x +
a′,则以下结论正确的是 (C )
A. b^ > b′,^a > a′ B. b^ > b′,^a < a′
C. b^ < b′,^a > a′ D. b^ < b′,^a < a′
二、填空题
6.如图所示的五组数据(x,y)中,去掉(4,10)
后,剩下的四组数据相关性增强.
7.若回归直线方程中的回归系数b^ = 0,则相关
系数r = .
8.对具有线性相关关系的变量x和Y,测得一组数
据如下表:
x 2 4 5 6 8
Y 30 40 60 50 70
若已求得它们的回归直线方程的斜率为6. 5,
则这条回归直线的方程为
.
—117—
三、解答题
9.某个服装店经营某种服装,在某周内获纯利
y(元)与该周每天销售这种服装件数x之间
的一组数据关系见表:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
已知7
i = 1
x2i = 280,
7
i = 1
xiyi = 3 487.
(1)求x,y;
(2)已知纯利y与每天销售件数x线性相关,
试求出其回归直线方程.
10.某产品的广告支出x(单位:万元)与销售收
入y(单位:万元)之间有如下数据:
广告支出x(单位:万元) 1 2 3 4
销售收入y(单位:万元) 12 28 42 56
根据以上数据算得:4
i = 1
yi = 138,
4
i = 1
xiyi = 418.
(1)求出y对x的回归直线方程^y = b^x + a^,
并判断变量y与x之间是正相关还是负
相关;
(2)若销售收入最少为144万元,则广告支
出费用至少需要投入多少万元?
B组·素养提升
一、选择题
1.(多选)某公司过去五个月的广告费支出x
(单位:万元)与销售额y(单位:万元)之间有
下列对应数据:
x 2 4 5 6 8
y ▲ 40 60 50 70
工作人员不慎将表格中y的第一个数据丢失,
已知y对x呈线性相关关系,且回归方程为
y^ = 6. 5x + 17. 5,则下列说法正确的有( )
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额
一定增加6. 5万元
D.若该公司下月广告费支出为8万元,则销
售额约为75万元
2.(多选)某同学将收集到的六组数据制作成散
点图如图所示,并得到其回归直线的方程为
l1:y = 0. 68x + a^,计算其相关系数为r1 .经过
分析确定点F为“离群点”,把它去掉后,再利
用剩下的5组数据计算得到回归直线的方程
为l2:y = b^x + 0. 68,相关系数为r2,以下结论
中,正确的是 ( )
A. r1 > 0,r2 > 0 B. r1 > r2
C. a^ = 0. 12 D. 0 < b^ < 0. 68
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,
yn)(n≥2,x1,x2,…,xn 不全相等)的散点图
中,若所有样本点(xi,yi)(i = 1,2,…,n)都在
直线y = 12 x + 1上,则这组样本数据的样本相
关系数为 (D )
A. - 1 B. 0 C. 12
D. 1
—118—
4.已知变量y关于x的回归方程为^y = ebx -0. 5,其
一组数据如下表所示:
x 1 2 3 4
y e e3 e4 e6
若x = 5,则预测y的值可能为 (D )
A. e5 B. e
11
2 C. e7 D. e
15
2
二、填空题
5.对某台机器购置后的运行年限x(x = 1,2,
3,…)与当年利润y的统计分析知x,y具备线
性相关关系,回归方程为^y = 10. 47 - 1. 3x,估
计该台机器最为划算的使用年限为
年.
6.以模型y = cekx去拟合一组数据时,为了求出
回归方程,设z = ln y,其变换后得到线性回归
方程z = 0. 3x + 4,则c = .
7.(一题两空)某品牌服装专卖店为了解保暖衬
衣的销售量(y件)与平均气温x(℃)之间的
关系,随机统计了连续四旬的销售量与当旬
平均气温,其数据如表.
时间 二月上旬
二月
中旬
二月
下旬
三月
上旬
旬平均气温x(℃) 3 8 12 17
旬销售量y(件) 55 m 33 24
由表中数据算出线性回归方程^y = bx + a中的
b = - 2,样本中心点为(10,38).
(1)表中数据m = ;
(2)气象部门预测三月中旬的平均气温约为
22 ℃,据此估计,该品牌的保暖衬衣在三月中旬
的销售量约为 件.
三、解答题
8.某工厂为了对新研发的一种产品进行合理定
价,将该产品按事先拟定的价格进行试销,得
到如下数据.
单价x(元) 8 8. 2 8. 4 8. 6 8. 8 9
销量y(件) 90 84 83 80 75 68
(1)求回归直线方程^y = b^x + a^,其中b^ = - 20;
(2)预计在今后的销售中,销量与单价仍然服
从(1)中的关系,且该产品的成本是4元/件,
为使工厂获得最大利润,该产品的单价应定
为多少元?(利润=销售收入-成本)
9.如图是某企业2017年至2023年的污水净化
量(单位:吨)的折线图.
注:年份代码1 ~7分别对应年份2017 ~2023.
(1)由折线图看出,可用线性回归模型拟合y
和t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程,预测2024年该
企业的污水净化量
.
—119—
(2)需要进一步调试. 理由如下:
如果机器正常工作,则Z服从正态分布N(105,62),则P(μ -
3σ < Z < μ + 3σ)= P(87 < Z < 123)≈0. 997,零件内径在(87,
123)之外的概率只有0. 003,
而86(87,123),根据3σ原则,机器异常,需要进一步调试.
9.(1)抽取产品的质量指标值的样本平均值x和样本方差s2 分
别为:x = 170 × 0. 02 + 180 × 0. 09 + 190 × 0. 22 + 200 × 0. 33 +
210 × 0. 24 + 220 × 0. 08 + 230 × 0. 02 = 200.
s2 =(- 30)2 × 0. 02 +(- 20)2 × 0. 09 +(- 10)2 × 0. 22 + 0 ×
0. 33 + 102 × 0. 24 + 202 × 0. 08 + 302 × 0. 02 = 150.
(2)①由(1)知,Z 服从正态分布N(200,150),从而
P(187. 8 < Z < 212. 2)= P(200 - 12. 2 < Z < 200 + 12. 2)≈
0. 683.②由①可知,一件产品的质量指标值位于区间(187. 8,
212. 2)的概率为0. 683,依题意知X ~ B(100,0. 683),所以
E(X)= 100 × 0. 683 = 68. 3.
练案[17]
A组·素养自测
1. BD 在A中,正方形的边长与面积之间的关系是函数关系;
在B中,生活习惯与健康状况不具有严格的函数关系,但具有
相关关系;在C中,人的身高与年龄之间的关系既不是函数关
系,也不是相关关系,因为人的年龄达到一定时期身高就不发
生明显变化了,因而它们不具有相关关系;在D中,降雪量与
交通事故的发生率之间具有相关关系.
2. A
3. C 根据散点图的特点可分析出相关性的问题,从而判断ABC
选项,根据相关系数的定义可以判断D选项;
根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A
选项错误;
散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现
正相关性,B选项错误,C选项正确;
由于r = 0. 824 5是全部数据的相关系数,取出来一部分数据,
相关性可能变强,可能变弱,即取出的数据的相关系数不一定
是0. 824 5,D选项错误;
故选C.
4. D x = 0 + 1 + 2 + 34 = 1. 5,y =
m + 3 + 5. 5 + 7
4 ,将其代入^y =
2. 2x + 0. 7,可得m = 0. 5,故选D.
5. C 由(1,0),(2,2)求b′,a′.
b′ = 2 - 02 - 1 = 2,a′ = 0 - 2 × 1 = - 2.
求^a,b^时,6
i = 1
xiyi = 0 + 4 + 3 + 12 + 15 + 24 = 58,
x = 72 ,y =
13
6 ,
6
i = 1
x2i = 1 + 4 + 9 + 16 + 25 + 36 = 91,
∴ b^ =
58 - 6 × 72 ×
13
6
91 - 6 × ( )72
2 =
5
7 ,
a^ = 136 -
5
7 ×
7
2 =
13
6 -
5
2 = -
1
3 ,
∴ b^ < b′,^a > a′.
6.(4,10) 去掉点(4,10)后,其余四点大致在一条直线附近,
相关性增强.
7. 0 相关系数
r =
n
i = 1
(xi - x)(yi - y)
n
i = 1
(xi - x)2
n
i = 1
(yi - y)槡 2
与b^ =
n
i = 1
(xi - x)(yi - y)
n
i = 1
(xi - x)2
的分子相同,故r = 0.
8. y^ = 6. 5x + 17. 5 设回归直线为^y = 6. 5x + a,点(x,y)在此直
线上,故a = 17. 5.
9.(1)x = 3 + 4 + 5 + 6 + 7 + 8 + 97 = 6,
y = 66 + 69 + 73 + 81 + 89 + 90 + 917 =
559
7 .
(2)因为y与x有线性相关关系,
所以b^ =
7
i = 1
xiyi - 7 x y
7
i = 1
x2i - 7 x
2
=
3 487 - 7 × 6 × 5597
280 - 7 × 36 = 4. 75,^a =
559
7 - 6
× 4. 75 = 71914 ≈51. 36.
故回归直线方程为^y = 4. 75x + 51. 36.
10.(1)由表中数据得:x = 1 + 2 + 3 + 44 = 2. 5,
y = 12 + 28 + 42 + 564 = 34. 5,
所以b^ =
4
i = 1
xiyi - 4 x y
4
i = 1
x2i - 4 x
2
= 418 - 4 × 2. 5 × 34. 5(12 + 22 + 33 + 42)- 4 × 2. 52 = 14. 6,
a^ = y - b^ x = 34. 5 - 14. 6 × 2. 5 = - 2,
所以回归直线方程为^y = 14. 6x - 2,且变量y与x之间是正
相关.
(2)依题意有:^y = 14. 6x - 2≥144,解得x≥10,
所以广告支出费用至少需要投入10万元.
B组·素养提升
1. AB 由回归方程^y = 6. 5x + 17. 5,可知b^ = 6. 5,则销售额y与
广告费支出x正相关,所以A正确;设丢失的数据为m,由表
中的数据可得x = 5,y = 220 + m5 ,把点5,
220 + m( )5 代入回归方
程,可得220 + m5 = 6. 5 × 5 + 17. 5,解得m = 30,所以B正确;该
公司广告费支出每增加1万元,销售额不一定增加6. 5万元,
所以C不正确;若该公司下月广告费支出为8万元,则销售额
约为y = 6. 5 × 8 + 17. 5 = 69. 5(万元),所以D不正确,故
选AB.
2. ACD 由图可知两变量呈现正相关,故r1 > 0,r2 > 0,且r1 <
r2,故A正确,B错误;又回归直线l1:y = 0. 68x + a^必经过样
本中心点(3. 5,2. 5),所以^a = 2. 5 - 0. 68 × 3. 5 = 0. 12,C正
确;回归直线l2:y = b^x + 0. 68必经过样本中心点(3,2),所以
2 = b^ × 3 + 0. 68,所以b^ = 0. 44,也可直接根据图像判断0 < b^ <
0. 68(比较两直线的倾斜程度),故ACD正确.
3. D 因为所有的点都在直线上,所以它就是确定的函数关系,
所以相关系数为1.
4. D 将式子两边取对数,得到lny^ = bx - 0. 5,令z = lny^,得到z
= bx - 0. 5,列出x,z的取值对应的表格
,
—170—
x 1 2 3 4
z 1 3 4 6
则x = 1 + 2 + 3 + 44 = 2. 5,z =
1 + 3 + 4 + 6
4 = 3. 5,
∵ (x,z)满足z = bx - 0. 5,∴ 3. 5 = b × 2. 5 - 0. 5,
解得b = 1. 6,∴ z = 1. 6x - 0. 5,∴ y = e1. 6x - 0. 5,当x = 5时,^y =
e1. 6 × 5 - 0. 5 = e
15
2,故选D.
5. 8 当年利润小于或等于零时应该报废该机器,当y = 0时,令
10. 47 - 1. 3x = 0,解得x≈8,故估计该台机器最为划算的使用
年限为8年.
6. e4 由题意,得ln(cekx)= 0. 3x + 4,所以lnc + kx = 0. 3x + 4,
所以lnc = 4,所以c = e4 .
7.(1)40 由y = 38,得m = 40.
(2)14 由^a = y - b^ x得^a = 58,故^y = - 2x + 58,
当x = 22时,^y = 14,
故三月中旬的销售量约为14件.
8.(1)由于x = 8 + 8. 2 + 8. 4 + 8. 6 + 8. 8 + 96 = 8. 5,
y = 90 + 84 + 83 + 80 + 75 + 686 = 80.
所以^a = y - b^ x = 80 + 20 × 8. 5 = 250,从而回归直线方程为
y^ = - 20x + 250.
(2)设工厂获得的利润为L元,依题意得L = x(-20x +250)-
4(- 20x + 250)= - 20x2 + 330x - 1 000 = - 20(x - 8. 25)2 +
361.25.
当且仅当x =8. 25时,L取得最大值,故当单价定为8.25元时,工
厂可获得最大利润.
9.(1)由折线图中的数据得,
t = 4,7
i = 1
(ti - t)2 = 28,
7
i = 1
(yi - y)2 = 18,
7
i = 1
(ti - t)(yi - y)所以
r = 21
槡28 × 18
≈0. 94.
因为y与t的相关系数近似为0. 94,说明y与t的线性相关程
度相当大,所以可以用线性回归模型拟合y与t的关系.
(2)因为y = 54,b^ =
7
i = 1
(ti - t)(yi - y)
7
i = 1
(ti - t)2
= 2128 =
3
4 ,
所以^a = y - b^ t = 54 - 34 × 4 = 51,
所以y关于t的线性回归方程为^y = b^t + a^ = 34 t + 51,将2024
年对应的t = 8代入上式,得^y = 34 × 8 + 51 = 57,
所以预测2024年该企业污水净化量约为57吨.
练案[18]
A组·素养自测
1. AB 由事件的独立性知,A选项正确;由独立性检验的意义
知,B选项正确;χ2的大小是判定事件A与B是否相关的一种
方法,不是唯一依据,C选项不正确;若事件A与B相关,则A
发生B可能发生,也可能不发生,D选项不正确.
2. D 事件A与B相互独立,则A与B,A与B,A与B也相互
独立.
3. A χ2 = 72 ×(8 × 18 - 14 × 32)
2
22 × 50 × 40 × 32 ≈4. 726 > 3. 841.
4. A χ2≈4. 762 > 3. 841,参照题中附表,可得在犯错误的概率
不超过5%的前提下,认为“是否爱好踢毽子与性别有关”.故
选A.
5. B 任取1名参赛人员,抽到对主办方表示满意的男性运动员
的概率为200500 =
2
5 ,故①错误;
χ2 = 500 ×(200 × 30 - 50 × 220)
2
420 × 80 × 250 × 250 ≈5. 952 < 6. 635,故②错误,
③正确.故选B.
6. 99% 有关 ∵ χ2 = 7. 63,∴ χ2 > 6. 635,因此,有99%的把握
说,打鼾与患心脏病是有关的.
7. 0. 999 χ2 =(5 + 15 + 40 + 10)(5 × 10 - 40 × 15)
2
(5 + 15)(40 + 10)(5 + 40)(15 + 10)≈18. 822.
∵ 18. 822 > 10. 828,
∴ x与y之间有关系的概率约为1 - 0. 001 = 0. 999.
8. 5% ∵ P(χ2≥3. 841)= 0. 05,故判断出错的可能性为5% .
9.(1)根据题表中数据知,甲机床生产的产品中一级品的频率是
150
200 = 0. 75,乙机床生产的产品中一级品的频率是
120
200 = 0. 6.
(2)根据题表中的数据可得
K2 = 400 ×(150 × 80 - 120 × 50)
2
200 × 200 × 270 × 130 =
400
39 ≈10. 256.
因为10. 256 > 6. 635,所以有99%的把握认为甲机床的产品
质量与乙机床的产品质量有差异.
10.(1)设样本中乙企业用户中满意的有x户,结合列联表知,
P = 75 + x165 =
9
11,解得x = 60;
所以,填写2 × 2列联表是:
满意 不满意 合计
甲企业用户 75 10 85
乙企业用户 60 20 80
合计 135 30 165
计算K2 = n(ad - bc)
2
(a + b)(c + d)(a + c)(b + d)
= 165(75 × 20 - 10 × 60)
2
135 × 30 × 85 × 80 =
165
34 ≈4. 853 > 3. 841
所以能判断有95%的把握认为“满意度与电信企业服务措
施有关系”.
(2)设“抽到5号或10号”为事件A,先后两次抛掷一枚骰
子,出现的点数为(m,n),则所有的基本事件的个数有6 × 6
= 36,
事件A包含的基本事件个数(m + n = 5或m + n = 10)有:
(1,4),(2,3),(3,2),(4,1),(4,6),(5,5),(6,4)共有7
个.所以所求事件的概率为P(A)= 736 .
B组·素养提升
1. C ∵在这105人中随机抽取1人,成绩优秀的概率为27 ,
∴成绩优秀的人数为105 × 27 = 30,非优秀的人数为105 - 30
=75,
∴ c = 30 - 10 = 20,b = 75 - 30 = 45,
∴ χ2 = 105 ×(10 × 30 - 20 × 45)
2
30 × 75 × 50 × 55 ≈6. 109 > 3. 841.
∴若按95%的可靠性要求,能认为成绩与班级有关系.故
选C
.
—171—