内容正文:
现行旧教材·高中新课程学习指导
由散点图可以认为样本点大致分布在某条直线的附近,因
此可以用线性回归模型来拟合. 设线性回归方程为 ŷ = â + b̂x,
列出下表:
i 1 2 3 4 5
xi(个) 10 20 30 40 50
yi(min) 62 68 75 81 89
xiyi 620 1 360 2 250 3 240 4 450
i 6 7 8 9 10
xi(个) 60 70 80 90 100
yi(min) 95 102 108 115 122
xiyi 5 700 7 140 8 640 10 350 12 200
所以 x = 55,y≈91. 7,b̂ =
∑
10
i = 1
xiyi - 10x y
∑
10
i = 1
x2i - 10x
2
=
55 950 - 10 × 55 × 91. 7
38 500 - 10 × 552
≈0. 668,â = y - b̂ x≈91. 7 - 0. 668 × 55≈
54. 96. 因此,线性回归方程为 ŷ = 0. 668x + 54. 96.
将数据代入相应公式可得如下数据表:
零件数
x(个) 10 20 30 40 50
加工时间
y(min) 62 68 75 81 89
(yi - y)
2 882. 09 561. 69 278. 89 114. 49 7. 29
ŷ = 0. 668x
+ 54. 96 61. 64 68. 32 75. 0 81. 68 88. 36
残差 0. 36 - 0. 32 0 - 0. 68 0. 64
零件数
x(个) 60 70 80 90 100
加工时间
y(min) 95 102 108 115 122
(yi - y)
2 10. 89 106. 09 265. 69 542. 89 918. 09
ŷ = 0. 668x
+ 54. 96 95. 04 101. 72 108. 4 115. 08 121. 76
残差 - 0. 04 0. 28 - 0. 4 - 0. 08 0. 24
所以总偏差平方和为 3 688. 1,残差平方和为 1. 408,相关指
数 R2 = 1 - 1. 408
3 688. 1
≈0. 999 6.
(2)作出残差图如图,横坐标为零件数的数据,纵坐标为残
差.
(3)由题中数据可得样本相关系数 r 的值为 0. 999 8,再结
合散点图可以说明 x 与 y 有很强的线性相关关系. 由 R2 的值可
以看出回归效果很好,也说明用线性回归模型拟合数据效果很
好.
由残差图也可以观察到,第 4 个样本点和第 5 个样本点的
残差比较大,需要确认在采集在这两个样本点的过程中是否有
人为的错误.
典例试做 4:∵ R2甲 = 1 -
∑
5
i = 1
(yi - ŷi)
2
5
i = 1
(yi - y)
2
= 1 - 155
1 000
= 0. 845,
R2乙 = 1 -
∑
5
i = 1
(yi - yi)
2
∑
5
i = 1
(yi - y)
2
= 1 - 180
1 000
= 0. 82,
∴ R2甲 > R
2
乙.
∴ 甲模型拟合的效果更好.
跟踪练习 4:D 根据线性相关的知识,散点图中各样本点
条状分布越均匀,同时保持殊差平方和越小,由回归分析建立的
线性回归模型的拟合效果越好,由试验结果知丁要好些,故选
D.
典例试做 5:(1) 由散点图可以判断,模型 y = c + d
x
更可
靠.
(2) 建 立 Y 关 于 w 的 线 性 回 归 方 程 ŷ = d̂ w + ĉ, 则 d̂ =
6
i = 1
wiyi - 6 w y
6
i = 1
w2i - 6 w
2
= 4. 8
0. 60
= 8,
∴ ĉ = y - d̂w = 4. 22 - 0. 377 5 × 8 = 1. 2,∴ Y 关于 w 的线性
回归方程为ŷ = 1. 2 + 8w,
因此,Y 关于 x 的回归方程为ŷ = 1. 2 + 8
x
. 当 x = 20 时,预
测该书每册的成本费为ŷ = 1. 2 + 8
20
= 1. 6(元).
课堂达标·固基础
1. A 相关指数 R2 越大,表示回归模型的效果越好.
2. C 回归方程的系数b̂ = - 2 可知,x 每增加一个单位,则 y 平
均减少 2 个单位,故选 C.
3. D 由散点图分布可知,散点图分布在一个对数函数的图象
附近,因此,最适合作为发芽率 y 和温度 x 的回归方程类型的
是 y = a + blnx.
故选 D.
4. 6. 5 当 x = 600 时,ŷ