4.3.1 一元线性回归模型-【新课程能力培养】2024-2025学年高中数学选择性必修第二册学习手册(人教B版)
2024-12-06
|
2份
|
11页
|
61人阅读
|
4人下载
教辅
北方联合出版传媒(集团)股份有限公司分公司
进店逛逛 资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教B版选择性必修第二册 |
| 年级 | 高二 |
| 章节 | 4.3.1 一元线性回归模型 |
| 类型 | 学案 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2024-2025 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 1.17 MB |
| 发布时间 | 2024-12-06 |
| 更新时间 | 2024-12-06 |
| 作者 | 北方联合出版传媒(集团)股份有限公司分公司 |
| 品牌系列 | 新课程能力培养·高中同步练习 |
| 审核时间 | 2024-10-09 |
| 下载链接 | https://m.zxxk.com/soft/47818025.html |
| 价格 | 2.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
参 考 答 案
8. AB
【解析】 根据超几何分布模型定义可知
①
中随
机变量
X
服从超几何分布
. ②
中随机变量
X
服从超几何
分布, 而
③
中显然不能看作一个不放回抽样问题, 故随
机变量
X
不服从超几何分布
.
故选
AB.
9.
5
3
-3
【解析】
E
(
X
)
=1×
1
2
+2×
1
3
+3×
1
6
=
5
3
.
∵Y=aX+3
,
∴E
(
Y
)
=aE
(
X
)
+3=
5
3
a+3=-2
, 解得
a=-3.
10. 706
【解析】 节日期间这种鲜花需求量的均值为
E
(
ξ
)
=200×0.20+300×0.35+400×0.30+500×0.15=340
(束)
.
设
利润为
η
, 则 η=5ξ+1.6×
(
500-ξ
)
-500×2.5=3.4ξ-450
,
∴E
(
η
)
=3.4E
(
ξ
)
-450=3.4×340-450=706
(元)
.
11. 1.544
【解析】
X
的取值分别为
1
,
2
,
3
,
4. X=
1
, 表明此人第一次参加驾照考试就通过了, 故
P
(
X=1
)
=0.6. X=2
, 表明此人在第一次考试未通过, 第二次通过
了, 故
P
(
X=2
)
=
(
1-0.6
)
×0.7=0.28. X=3
, 表明此人在第
一、 二次考试未通过, 第三次通过了, 故
P
(
X=3
)
=
(
1-
0.6
)
×
(
1-0.7
)
×0.8=0.096. X=4
, 表明此人第一、 二、 三次
考试都未通过, 故
P
(
X=4
)
=
(
1-0.6
)
×
(
1-0.7
)
×
(
1-0.8
)
=0.024.
∴
他一年内参加考试次数
X
的分布列为
∴X
的均值为
E
(
X
)
=1×0.6+2×0.28+3×0.096+4×0.024=
1.544.
12.
266
81
【解析 】 依题意 , 知
ξ
的所有可能值为
2
,
4
,
6
, 设每两局比赛为一轮, 则该轮结束时比赛停
止的概率为
2
3
3 "
2
+
1
3
3 "
2
=
5
9
.
若该轮结束时比赛还将继
续, 则甲、 乙在该轮中必是各得一分, 此时, 该轮比赛
结果对下轮比赛是否停止没有影响, 从而有
P
(
ξ=2
)
=
5
9
,
P
(
ξ=4
)
=
4
9
×
5
9
=
20
81
,
P
(
ξ=6
)
=
4
9
3 "
2
=
16
81
, 故
E
(
ξ
)
=2×
5
9
+4×
20
81
+6×
16
81
=
266
81
.
13.
解: (
1
) 由已知得小明中奖的概率为
2
3
, 小红
中奖的概率为
2
5
, 两人中奖与否互不影响, 记 “这
2
人
的累计得分
X≤3
” 为事件
A
, 则事件
A
的对立事件为
“
X=5
”,
∵P
(
X=5
)
=
2
3
×
2
5
=
4
15
,
∴P
(
A
)
=1-P
(
X=5
)
=
11
15
. ∴
这两人的累计得分
X≤3
的概率为
11
15
.
(
2
) 设小明、 小红都选择方案甲抽奖中奖的次数为
X
1
, 都选择方案乙抽奖中奖的次数为
X
2
, 则这两人选择
方案甲抽奖累计得分的数学期望为
E
(
2X
1
), 选择方案乙
抽奖累计得分的数学期望为
E
(
3X
2
)
.
由已知得
X
1
~B
2
,
2
3
3 "
,
X
2
~B
2
,
2
5
3 "
,
∴E
(
X
1
)
=2×
2
3
=
4
3
,
E
(
X
2
)
=2×
2
5
=
4
5
.
∴E
(
2X
1
)
=2E
(
X
1
)
=
8
3
,
E
(
3X
2
)
=3E
(
X
2
)
=
12
5
.
∵E
(
2X
1
)
>E
(
3X
2
),
∴
他们都选择方案甲进行抽奖
时, 累计得分的数学期望较大
.
14.
解: (
1
) 方法一: 设 “走
L
1
路线至少遇到一次
红灯” 为事件
A
, 则
P
(
A
)
=C
1
3
×
2
3
×
1
3
3 "
2
+C
2
3
×
2
3
3 "
2
×
1
3
+C
3
3
×
2
3
3 "
3
×
1
3
3 "
0
=
26
27
,
∴
走
L
1
路线至少遇到一次红灯
的概率为
26
27
.
方法二: 设 “走
L
1
路线没有遇到红灯” 为事件
A
,
则 “走
L
1
路线至少遇到一次红灯” 为事件
A
,
故
P
(
A
)
=
1-
2
3
3 "
1-
2
3
3 "
1-
2
3
3 "
=
1
3
×
1
3
×
1
3
=
1
27
,
∴P
(
A
)
=1-P
(
A
)
=1-
1
27
=
26
27
,
∴
走
L
1
路线至少遇到一次红灯的概率为
26
27
.
(
2
) 依题意,
X
的可能取值为
0
,
1
,
2.
P
(
X=0
)
=
1-
3
4
3 "
×
1-
3
5
3 "
=
1
10
,
P
(
X=1
)
=
3
4
×
1-
3
5
3 "
+
1-
3
4
3 "
×
3
5
=
9
20
,
P
(
X=2
)
=
3
4
×
3
5
=
9
20
.
随机变量
X
的分布列为
∴E
(
X
)
=
1
10
×0+
9
20
×1+
9
20
×2=
27
20
.
(
3
) 设选择
L
1
路线遇到红灯次数为
Y
, 随机变量
Y
服从二项分布,
Y~B
3
,
2
3
"
,
∴E
(
Y
)
=3×
2
3
=2>E
(
X
),
∴
应选择
L
2
路线
.
4.3 统计模型
4.3.1
一元线性回归模型
学习手册
变式训练
1 BC
【解析】 图
A
的两个变量具有函数关
系; 图
B
,
C
的两个变量具有相关关系; 图
D
的两个变
量之间既不是函数关系, 也不是相关关系
.
故选
BC.
变式训练
2
解: (
1
) 由题意可知,
n=5
, t
=
1
n
n
i = 1
移
t
i
=
15
5
=3
, y
=
1
n
n
i = 1
移
y
i
=
36
5
=7.2.
又
n
i = 1
移
t
2
i
=55
,
n
i = 1
移
t
i
y
i
=120
,
X 1 2
P 0.6 0.28
3
0.096
4
0.024
X 0 1 2
P
1
10
9
20
9
20
73
高中数学选择性必修 第二册 (人教 B 版) 精编版
计算得, b
赞
=
5
i = 1
移
t
i
y
i
-5 t y
5
i = 1
移
t
2
i
-5 t
2
=1.2
,
a
赞
=
y
-b
赞
t =7.2-1.2×3=3.6.
故所求回归直线方程为 y
赞
=
1.2t+3.6.
(
2
) 将
t=7
代入 y
赞
=1.2t+3.6
, 可得 y
赞
=1.2×7+3.6=12
(千亿元),
∴
预测该地区
2021
年的人民币储蓄存款为
12
千亿元
.
变式训练
3 (1
)
C
【解析】 由这两个散点图可以判断,
变量
x
与
y
负相关,
u
与
v
正相关
.
(
2
)
AD
【解析】
|r|
越大, 相关程度越大,
A
正确;
|r|
越小, 相关程度越小,
B
错误;
|r|
越趋近于
0
时, 线性
相关关系越弱,
C
错误;
|r|
越接近
1
时, 线性相关程度
越强,
D
正确
.
综上, 正确的是
AD.
变式训练
4 解: ∵
x
=
2+3+4+5+6
5
=4
,
y
=
2.2+3.8+5.5+6.5+7.0
5
=5.
5
i = 1
移
x
i
y
i
-5x
y
=112.3-5×4×5=
12.3
,
5
i = 1
移
x
2
i
-5
x
2
=90-5×4
2
=10
,
5
i = 1
移
y
2
i
-5
y
2
=140.8-125=
15.8
,
∴r=
5
i = 1
移
x
i
y
i
-5x y
(
5
i = 1
移
x
2
i
-5
x
2
)(
5
i = 1
移
y
2
i
-5
y
2
)
姨
=
12.3
10×15.8
姨
=
12.3
158
姨
=
12.3
2
姨
× 79
姨
≈
12.3
1.4×8.9
≈0.987.
变式训练
5 解: 由数值表可作散点图如下: 根据散点
图可知
y
与
x
近似地呈反比例函数关系,
设
y=
k
x
, 令
t=
1
x
, 则
y=kt
, 原数据变为
由置换后的数值表作散点图如下:
由散点图可以看出
y
与
t
呈近似的线性相关关系,
列表如下:
∴ t=1.55
, y
=7.2. ∴b
赞
=
5
i = 1
移
t
i
y
i
-5 t y
5
i = 1
移
t
2
i
-5 t
2
≈4.134 4. a
赞
=
y
-b
赞
t
≈0.791 7. ∴
y
赞
=4.134 4t+0.791 7.
∴y
与
x
的非线性回归方程是y
赞
=
4.134 4
x
+0.791 7.
随堂练习
1.
(
1
)
姨
(
2
)
×
(
3
)
姨
(
4
)
×
2. C
【解析】 判断两个变量是否有线性相关关系时,
应先画出散点图
.
若这些点大体分布在一条直线附近,
则具有线性相关关系
.
故选
C.
3. A
【解析】 由b
赞
=1.2>0
, 故选
A.
4. A
【解析】 由公式可知b
赞
与
r
的符号相同
.
故选
A.
5. D
【解析】
∵
x
=
0+1+2+3
4
=1.5
, y
=
1+3+5+7
4
=4
,
∴
回归直线必过点 (
1.5
,
4
)
.
故选
D.
6. 650
【解析】 把
x=80
代入回归直线方程可得其预
测值y
赞
=5×80+250=650
(
kg
)
.
练习手册
效果评价
1. ACD
【解析】 相关关系不同于函数关系, 它是一
种非确定的关系,
A
正确; 相关系数
|r|
越大, 两个变量的
相关性越强,
B
错误; 当两个变量相关且相关系数
r>0
时,
说明两个变量正相关,
C
正确; 相关系数
r
的绝对值越
接近
1
, 表明两个变量的相关性越强,
D
正确
.
故选
ACD.
2. BCD
【解析】 由题干图
1
知气压随海拔高度的增
加而减小, 由题干图
2
知沸点随气压的升高而升高,
∴
沸点与气压呈正相关, 沸点与海拔高度呈负相关, 由于
两个散点图中的点都成线性分布,
∴
沸点与海拔高度、
沸点与气压的相关性都很强, 故
B
,
C
,
D
正确,
A
错
误
.
故选
BCD.
3. B
【解析】 去掉
D
组数据之后, 剩下的
4
组数据
成线性相关关系
.
故选
B.
4. B
【解析】 由散点图可知, 此曲线类似对数函数
型曲线, 因此可用函数
y=a+blnx
模型进行拟合
.
故选
B.
5. ABD
【解析】 回归直线方程是一个模拟函数, 它
表示的是一系列离散的点大致所在直线的位置及其大致
t 4 2
y 16 12
0.25
1
1
5
0.5
2
t
y
O
1 2 3 4
16
14
12
10
8
6
4
2
变式训练
5
答图
3 1 5 5 1 25
4 0.5 2 1 0.25 4
5 0.25 1 0.25 0.062 5 1
移 7.75 36 94.25 21.312 5 430
i t
i
y
i
t
i
y
i
t
2
i
y
2
i
1 4 16 64 16 256
2 2 12 24 4 144
74
参 考 答 案
变化规律,
∴
有些散点不一定在回归直线上
.
故选
ABD.
6.
y
赞
=e
0.25x-2.58
【解析 】
∵ z
赞
=0.25x-2.58
, z
赞
=lny
,
∴
y
赞
=
e
0.25x-2.58
.
7. 0
【解析】 相关系数
r=
n
i = 1
移
(
x
i
-x )(y
i
-y
)
n
i = 1
移
(
x
i
-x
)
2
n
i = 1
移
(
y
i
-y
)
2
姨
与
b
赞
=
n
i = 1
移
(
x
i
-x )(y
i
-y
)
n
i = 1
移
(
x
i
-x
)
2
的分子相同, 故
r=0.
8.
(
1
)
40
(
2
)
14
【解析】 (
1
) 由y
=38
, 得
m=40.
(
2
) 由a
赞
=
y
-b
赞
x得a
赞
=58
, 故y
赞
=-2x+58
,
当
x=22
时, y
赞
=14
, 故三月中旬的销售量约为
14
件
.
9.
解: (
1
) 散点图如图所示
.
(
2
) 由图知, 所有数据点接近一条直线排列 , 因
此, 认为
y
与
x
具有线性相关关系, 且是正相关关系
.
10.
解: (
1
)
∵
5
i = 1
移
x
i
=20
,
5
i = 1
移
y
i
=25
,
∴
x
=
1
5
5
i = 1
移
x
i
=
4
, y
=
1
5
5
i = 1
移
y
i
=5
,
∴b
赞
=
5
i = 1
移
x
i
y
i
-5x
y
5
i = 1
移
x
2
i
-5x
2
=
112-5×4×5
90-5×4
2
=1.2
,
a
赞
=
y
-b
赞
x =5-1.2×4=0.2. ∴
所求回归直线方程为 y
赞
=
1.2x+0.2.
(
2
)
①
由 (
1
) 知b
赞
=1.2>0
,
∴
变量
x
与
y
之间是正
相关
. ②
由 (
1
) 知, 当
x=8
时, y
赞
=1.2×8+0.2=9.8
,
即使用年限为
8
年时, 支出的维修费约是
9.8
万元
.
提升练习
11. C
【解析】 根据题意, 画出利润率与人均销售额
的散点图, 如图所示
.
由散点图可知, 利润率与人均销售额成正相关关系
.
故选
C.
12. ABC
【解析】
A
,
B
,
C
均正确, 是回归直线方
程的性质,
D
项是错误的, 回归直线方程只能预测学生
的体重, 应为大约
58.79 kg.
故选
ABC.
13. D
【解析 】 将式子两边取对数 , 得到
ln
y
赞
=b
赞
x-
0.5
, 令z
赞
=ln
y
赞
, 得到z
赞
=b
赞
x-0.5
,
列出
x
,
z
的取值对应的表格如下:
则x
=
1+2+3+4
4
=2.5
, z
=
1+3+4+6
4
=3.5
,
∵
(x, z) 满
足z
赞
=b
赞
x-0.5
,
∴3.5=b
赞
×2.5-0.5
, 解得b
赞
=1.6
,
∴z
赞
=1.6x-0.5
,
∴
y
赞
=e
1.6x-0.5
, 当
x=5
时, y
赞
=e
1.6×5-0.5
=e
15
2
.
故选
D.
14. 185
【解析】
∵
儿子的身高与父亲的身高有关,
∴
设儿子的身高为
Y
(单位:
cm
), 父亲身高为
X
(单
位:
cm
), 根据数据列表:
由表中数据, 求得回归系数b
赞
=1
, a
赞
=3.
于是儿子身
高与父亲身高的关系式为y
赞
=x+3
, 当
x=182
时, y
赞
=185.
故预测该老师的孙子的身高为
185 cm.
15. |r |= b
赞
·
b
赞
′
姨
【解析 】 当
x
作自变量时 , 得 b
赞
=
n
i = 1
移
x
i
y
i
-nx
·y
n
i = 1
移
x
2
i
-nx
2
; 当
y
作自变量时, 得b
赞
′=
n
i = 1
移
x
i
y
i
-nx
·y
n
i = 1
移
y
2
i
-ny
2
, 而
r=
n
i = 1
移
x
i
y
i
-nx
·y
(
n
i = 1
移
x
2
i
-nx
2
)(
n
i = 1
移
y
2
i
-ny
2
)
姨
; 从而b
赞
·b
赞
′=r
2
,
∴|r|= b
赞
·b
赞
′
姨
.
16.
解: (
1
) 由折线图中数据和附注中参考数据得
t
=4
,
7
i = 1
移
(
t
i
-
t )
2
=28
,
7
i = 1
移
(
y
i
-
y )
2
姨
=0.55
,
7
i = 1
移
(
t
i
-
t )(
y
i
-
y )
=
7
i = 1
移
t
i
y
i
-
t
7
i = 1
移
y
i
=40.17-4×9.32=2.89.
r≈
2.89
0.55×2×2.646
≈0.99.
∵y
与
t
的相关系数近似为
0.99
, 说明
y
与
t
的线
性相关程度相当高 , 从而可以用线性回归模型拟合
y
与
t
的关系
.
(
2
) 由y
=
9.32
7
≈1.331
及 (
1
) 得b
赞
=
7
i = 1
移
(
t
i
-t
)(
y
i
-y
)
7
i = 1
移
(
t
i
-t
)
2
x
y
O
120
110
100
90
80
70
1 2 3 4 5 6
第
9
题答图
销售额
/
千元
利润率
20%
18%
16%
14%
12%
10%
8%
6%
4%
2%
1 2 3 4 5 6 7 8 9
O
第
11
题答图
x 1 2
z 1 3
3
4
4
6
x 173 170 176
y 170 176 182
75
高中数学选择性必修 第二册 (人教 B 版) 精编版
=
2.89
28
≈0.103
, a
赞
=y-b
赞
t≈1.331-0.103×4≈0.92.
∴y
关于
t
的回归直线方程为 y
赞
=0.92+0.10t.
将
2021
年对应的
t=9
代入回归直线方程得y
赞
=0.92+0.10×9=1.82. ∴
预测
2021
年我国生活垃圾无害化处理量将约为
1.82
亿吨
.
4.3.2
独立性检验
学习手册
变式训练
1
解: (
1
) 饮食习惯与年龄的
2×2
列联表如下:
(
2
) 由列联表得, 年龄在六十岁以上且饮食以肉类
为主的人群的概率为
27
124
.
变式训练
2
解: 由公式得
χ
2
=
540×
(
60×200-260×20
)
2
320×220×80×460
≈9.638.
∵9.638>6.635
,
∴
有
99%
的把握说
40
岁以上的人患胃病与生活是
否有规律有关, 即生活不规律的人易患胃病
.
随堂练习
1.
(
1
)
×
(
2
)
√
(
3
)
√
2. B
【解析】 独立性检验是判断两个随机事件是否
有关系的方法, 而
①③
都是求概率问题, 不能用独立性
检验
.
故选
B.
3.
男正教授人数, 女正教授人数, 男副教授人数,
女副教授人数 【解析】 由研究的问题可知, 需收集的数
据应为男正教授人数, 女正教授人数, 男副教授人数,
女副教授人数
.
4. 49
,
54
【解析 】
∵a+21=70
,
∴a=49.
又
∵a+5=b
,
∴b=54.
5. 3.685
【解析】
χ
2
=
50×
(
5×13-10×22
)
2
27×23×15×35
≈3.685.
6. 95%
【解析 】
∵χ
2
=4.013>3.841
, 查阅
χ
2
表知有
95%
的把握认为两个随机事件之间有关系
.
练习手册
效果评价
1. C
【解析】
∵a+11=63
,
b+15=23
,
∴a=52
,
b=8.
故
选
C.
2. D
【解析】
∵7.014>6.635
, 查阅
χ
2
表知有
99%
的
把握认为两个随机事件之间有关系
.
故选
D.
3. C
【解析】 根据独立性检验的思想方法, 正确选
项为
C.
4. B
【解析 】
χ
2
=
407×
(
32×213-61×101
)
2
93×314×133×274
≈0.164<
2.706
, 即没有充足的理由认为种子是否经过处理跟生病
有关
.
故选
B.
5. AB
【解析】 由事件的独立性知,
A
正确; 由独立
性检验的意义知,
B
正确;
χ
2
的大小是判定事件
A
与
B
是否相关的一种方法, 不是唯一依据,
C
不正确; 若事
件
A
与
B
相关, 则
A
发生
B
可能发生, 也可能不发生,
D
不正确
.
故选
AB.
6. 99%
有关 【解析】
∵χ
2
=7.63
,
∴χ
2
>6.635
, 因此,
有
99%
的把握说, 打鼾与患心脏病是有关的
.
7. 0.05
【解析】 根据
χ
2
>3.841
, 可判断有
95%
的把
握认为主修统计专业与性别有关系
.
故出错的概率为
0.05.
8. 47 92 88 82 53
【解析】 由列联表得
45+E=98
,
98+D=180
,
A+35=D
,
E+35=C
,
B+C=180
0
%
%
%
%
%
%
$
%
%
%
%
%
%
%
&
,
解得
A=47
,
B=92
,
C=88
,
D=82
,
E=53
0
%
%
%
%
%
%
3
%
%
%
%
%
%
%
&
.
9.
解: (
1
)
2×2
列联表如下表所示:
(
2
) 计算可知, 午休的考生及格率为
P
1
=
80
180
=
4
9
.
不午休的考生及格率为
P
2
=
65
200
=
13
40
, 由
P
1
>P
2
, 可以粗
略判断午休与考生考试及格有关系, 并且午休的及格率
高,
∴
在以后的复习中考生应尽量适当午休, 以保持最
佳的学习状态
.
10.
解: (
1
) 列联表补充如下:
(
2
) 由
χ
2
=
48×
(
220-60
)
2
28×20×32×16
≈4.286>3.841
,
∴
有
95%
的把握认为喜爱打篮球与性别有关
.
(
3
) 喜爱打篮球的女生人数
X
的可能取值为
0
,
1
,
2.
其概率分别为
年龄在六
十岁以上
年龄在六
十岁以下
总计
饮食以蔬
菜为主
43 21 64
饮食以肉
类为主
27 33 60
总计
70 54 124
及格人数 不及格人数 总计
午休
80 100 180
不午休
65 135 200
总计
145 235 380
性别 喜爱打篮球 不喜爱打篮球 总计
男生
22 6 28
女生
10 10 20
总计
32 16 48
76
高中数学选择性必修 第二册 (人教 B 版) 精编版
学
学 习 目 标
1.
了解变量间的相关关系
.
2.
能根据散点图判断两个变量是否具有
相关关系
.
3.
了解线性回归思想, 会求回归直线方程
.
4.
会判断相关性的强弱, 能根据回归直
线方程进行预测
.
要 点 精 析
要点
1
相关关系的判断
1.
两个变量的关系
2.
散点图: 一般地, 如果收集到了变量
x
和变量
y
的
n
对数据 (简称为成对数据),
则在平面直角坐标系
xOy
中描出点 (
x
i
,
y
i
),
i=1
,
2
,
3
, …,
n
, 就可以得到这
n
对数据
的散点图
.
3.
线性相关: 如果变量
x
与变量
y
之间
的关系可以近似地用一次函数来刻画, 则称
x
与
y
线性相关
.
4.
正相关与负相关
例
1
(
1
) (多选题) 下列关系中, 属
于相关关系的是 ( )
A.
正方形的边长与面积之间的关系
B.
农作物的产量与施肥量之间的关系
C.
出租车车费与行驶的里程
D.
降雪量与交通事故的发生率之间的
关系
(
2
) 某种产品的广告支出费
x
与销售
额
y
之间有如下对应数据 (单位: 百万元):
①
画出散点图;
②
从散点图中判断销售
金额与广告支出费成什么样的关系
.
解析: (
1
)
A
中, 正方形的边长与面
积之间的关系是函数关系;
B
中, 农作物的
产量与施肥量之间不具有严格的函数关系,
但具有相关关系;
C
为确定的函数关系;
D
中, 降雪量与交通事故的发生率之间具有相
关关系
.
故选
BD.
(
2
)
①
以
x
对应的数据为横坐标,
y
对
应的数据为纵坐标, 所作的散点图如图所示
.
②
从图中可以发现广告支出费与销售金
4.3 统计模型
4.3.1 一元线性回归模型
分类 函数关系 相关关系
特征 两变量关系确定 两变量关系带有不确定性
正相关 负相关
一个变量增大, 另一个
变量大致是增大的
一个变量增大, 另一个
变量大致是减少的
x 2 4 5 6 8
y 30 40 60 50 70
70
60
50
40
30
2 84 5 6
x
y
O
图
4-3-1
68
第四章 概率与统计
学
额之间具有相关关系, 并且当广告支出费由
小变大时, 销售金额也大多由小变大, 图中
的数据大致分布在某条直线的附近, 即
x
与
y
成正相关关系
.
反思感悟
两个变量是否相关的两种判断方法:
(
1
) 根据实际经验: 借助积累的经验
进行分析判断
.
(
2
) 利用散点图: 通过散点图, 观察
它们的分布是否存在一定的规律, 直观地
进行判断
.
如果发现点的分布从整体上看大
致在一条直线附近, 那么这两个变量就是
线性相关的, 注意不要受个别点的位置的
影响
.
变式训练
1
(多选题 ) 在下列所示的四个图中 ,
每个图的两个变量具有相关关系的是
( )
要点
2
回归直线方程及其应用
1.
最小二乘法
一般地, 已知变量
x
与
y
的
n
对成对数
据 (
x
i
,
y
i
),
i=1
,
2
, …,
n
, 任意给定一个
一次函数
y=bx+a
, 对每一个已知的
x
i
, 由直
线方程可以得到一个估计值
y
i
^
=bx
i
+a
, 如果一
次函数
y
^
=
b
^
x+
a
^
能使 (
y
1
^
-y
1
)
2
+
(
y
2
^
-y
2
)
2
+
…
+
(
y
n
^
-
y
n
)
2
=
n
i=1
移
(
y
i
-
y
i
^
)
2
取得最小值, 则
y
^
=
b
^
x+
a
^
称为
y
关于
x
的回归直线方程 (对应的直线称为回
归直线), 因为是使得平方和最小, 所以其
中涉及的方法称为最小二乘法
.
2.
回归直线方程的系数计算公式
3.
回归直线方程的性质
(
1
) 回归直线一定过点 (
x
,
y
)
.
(
2
) 一次函数
y
^
=
b
^
x+
a
^
的单调性由
b
^
的符
号决定, 函数递增的充要条件是
b
^
>0.
(
3
) 回归系数
b
^
的实际意义: 当
x
增大
一个单位时,
y
^
平均变化
b
^
个单位
.
思考 正相关、 负相关与
b
^
的符合有何
关系?
例
2
某研究机构对高三学生的记忆力
x
和判断力
y
进行统计分析, 得到下表数据:
(
1
) 请画出上表数据的散点图;
(
2
) 请根据上表提供的数据, 用最小二
乘法求出
y
关于
x
的回归直线方程
y
^
=
b
^
x+
a
^
;
(
3
) 试根据求出的回归直线方程, 预测
记忆力为
9
的同学的判断力
.
x
y
O
x
y
O
x
y
O
x
y
O
A B C D
回归直线
方程
回归系数
b
^
的
计算公式
a
^
的计算公式
y=bx+a
^ ^ ^
b
^
=
n
i=1
移
(
x
i
-x
)(
y
i
-y
)
n
i=1
移
(
x
i
-x
)
2
=
n
i=1
移
x
i
y
i
-nxy
n
i=1
移
x
2
i
-nx
2
a=y-bx
^ ^
x 6 8 10 12
y 2 3 5 6
69
高中数学选择性必修 第二册 (人教 B 版) 精编版
学
解: (
1
) 散点图如图所示:
(
2
)
x=
6+8+10+12
4
=9
,
y=
2+3+5+6
4
=4
,
4
i=1
移
x
2
i
=6
2
+8
2
+10
2
+12
2
=344
,
4
i=1
移
x
i
y
i
=6×2+8×3+10×5+12×6=158
,
b
^
=
158-4×9×4
344-4×9
2
=
14
20
=0.7
,
a
^
=y-
b
^
x=4-0.7×9=-2.3
,
故回归直线方程为
y
^
=0.7x-2.3.
(
3
) 由 (
2
) 中回归直线方程可知, 当
x=9
时,
y
^
=0.7×9-2.3=4
, 即预测记忆力为
9
的同学的判断力为
4.
变式训练
2
随着我国经济的发展, 居民储蓄存款逐
年增长
.
设某地区城乡居民人民币储蓄存款
(年底余额) 如下表:
(
1
) 求
y
关于
t
的回归直线方程
y
^
=
b
^
t+
a
^
;
(
2
) 用所求回归直线方程预测该地区
2021
年 (
t=7
) 的人民币储蓄存款
.
要点
3
相关系数及其应用
1.
相关系数: 统计学里一般用
r=
n
i=1
移
(
x
i
-x
)(
y
i
-y
)
n
i=1
移
(
x
i
-x
)
2
n
i=1
移
(
y
i
-y
)
2
姨
=
n
i=1
移
x
i
y
i
-nxy
n
i=1
移
x
2
i
-nx
x $
2
n
i=1
移
y
2
i
-ny
y &
2
姨
来衡量
y
与
x
的线性相关性强弱, 这里
的
r
称为线性相关系数 (简称相关系数)
.
2.
相关系数的性质
例
3
(
1
) 甲、 乙、 丙、 丁四位同学各
自对
A
,
B
两变量的线性相关性做试验 ,
并用回归分析方法分别求得相关系数
r
如
下表:
x
y
O
10 12
7
6
5
4
3
2
1
2 4 6 8
时间
2015
年
2016
年
2017
年
2018
年
2019
年
时间代号
t 1 2 3 4 5
储蓄存款
y/
千亿元
5 6 7 8 10
性质
1
|r|≤1
, 且
y
与
x
正相关的充要条件是
r>
0
,
y
与
x
负相关的充要条件是
r<0
性质
2
|r|
越小, 两个变量之间的线性相关性越
弱,
|r|
越大, 两个变量之间的线性相关
性越强
性质
3
|r|=1
的充要条件是成对数据构成的点都
在回归直线上
图
4-3-2
70
第四章 概率与统计
学
则哪位同学的试验结果体现
A
,
B
两变
量有更强的线性相关性 ( )
A.
甲
B.
乙
C.
丙
D.
丁
(
2
) 在一组数据为 (
x
1
,
y
1
), (
x
2
,
y
2
),
…, (
x
n
,
y
n
) (
n≥2
,
x
1
,
x
2
, …,
x
n
不全
相等) 的散点图中, 若这组样本数据的相关
系数为
-1
, 则所有的样本点 (
x
i
,
y
i
) (
i=
1
,
2
, …,
n
) 满足的方程可以是 ( )
A. y=-
1
2
x+1 B. y=x-1
C. y=x+1 D. y=-x
2
解析: (
1
)
|r|
越接近
1
, 相关性越强,
故选
D.
(
2
)
∵
这组样本数据的相关系数为
-1
,
∴
这一组数据 (
x
1
,
y
1
) , (
x
2
,
y
2
) , … ,
(
x
n
,
y
n
) 线性相关, 且是负相关
. ∴
可排除
B
,
C
,
D
, 故选
A.
变式训练
3
(
1
) 对变量
x
,
y
有观测数据 (
x
i
,
y
i
)
(
i=1
,
2
, …,
10
), 得散点图如图
1
; 对变
量
u
,
v
有观测数据 (
u
i
,
v
i
) (i=1
,
2
, …,
10
), 得散点图如图
2.
由这两个散点图可以
判断 ( )
A.
变量
x
与
y
正相关,
u
与
v
正相关
B.
变量
x
与
y
正相关,
u
与
v
负相关
C.
变量
x
与
y
负相关,
u
与
v
正相关
D.
变量
x
与
y
负相关,
u
与
v
负相关
(
2
) (多选题) 对两个变量的相关系数
r
, 下列说法正确的是 ( )
A. |r|
越大, 相关程度越大
B. |r|
越小, 相关程度越大
C. |r|
趋近于
0
时, 没有线性相关关系
D. |r|
越接近
1
时, 线性相关程度越强
例
4
某厂的生产原料耗费
x
(单位 :
百万元) 与销售额
y
(单位: 百万元) 之间
有如下的对应关系:
(
1
) 画出 (
x
,
y
) 的散点图;
(
2
) 计算
x
与
y
之间的相关系数, 并刻
画它们的相关程度
.
解: (
1
) 画出 (
x
,
y
) 的散点图如图
所示
.
(
2
)
x=5
,
y=47.5
,
4
i=1
移
x
2
i
=120
,
4
i=1
移
y
2
i
=
9 900
,
4
i=1
移
x
i
y
i
=1 080
,
x
y
O
1 2 3 4 5 6 7
30
25
20
15
10
5
u
v
O
1 2 3 4 5 6 7
60
50
40
30
20
10
图
1
图
2
x 2 4 6 8
y 30 40 50 70
O
2 4 6 8
70
60
50
40
30
x
y
甲 乙 丙 丁
r 0.82 0.78 0.69 0.85
图
4-3-3
图
4-3-4
71
高中数学选择性必修 第二册 (人教 B 版) 精编版
学
故相关系数
r=
4
i=1
移
x
i
y
i
-4xy
4
i=1
移
x
2
i
-4x
x #
2
4
i=1
移
y
2
i
-4y
2
x 2
姨
=
1 080-4×5×47.5
(
120-4×5
2
)(
9 900-4×47.5
2
)
姨
≈0.982 7.
由相关系数
r≈0.982 7
, 可以推断生产
原料耗费与销售额这两个变量正线性相关,
且相关程度很高
.
变式训练
4
假设关于某种设备的使用年限
x
(单位:
年) 与所支出的维修费用
y
(单位: 万元)
有如下统计资料:
计算
y
与
x
之间的相关系数
.
(精确到
0.001
, 已知
5
i=1
移
x
2
i
=90
,
5
i=1
移
y
2
i
≈140.8
,
5
i=1
移
x
i
y
i
=
112.3
,
79
姨
≈8.9
,
2
姨
≈1.4
)
要点
4
非线性回归
例
5
某地区不同身高的未成年男性的
体重平均值如下表:
(
1
) 试建立
y
与
x
之间的非线性回归方程;
(
2
) 如果一名在校男生身高为
168 cm
,
预测他的体重约为多少?
解: (
1
) 根据表中的数据画出散点图,
如图所示:
由图看出, 这些点分布在某条指数型函
数曲线的周围, 于是令
z=lny
, 列表如下:
x 2 5 6
y 2.2 6.5 7.0
3
3.8
4
5.5
x
y
O
20 40 60 80 100 120 140 160 180
60
50
40
30
20
10
身高
/cm
体重
/kg
x z x z
60 1.81 120 3.04
70 2.07 130 3.29
80 2.30 140 3.44
90 2.50 150 3.66
100 2.71 160 3.86
110 2.86 170 4.01
图
1
身高
x/cm
体重
y/kg
身高
x/cm
体重
y/kg
60 6.13 120 20.92
70 7.90 130 26.86
80 9.99 140 31.11
90 12.15 150 38.85
100 15.02 160 47.25
110 17.50 170 55.05
72
第四章 概率与统计
学
作出散点图, 如下:
由表中数据可求得
z
与
x
之间的回归直
线方程为
z
^
=0.663+0.020x
, 则有
y
^
=e
0.663+0.020x
.
(
2
) 由 (
1
) 知 , 当
x =168
时 ,
y
^
=
e
0.663+0.02×168
≈55.87
,
∴
在校男生身高为
168 cm
,
预测他的体重约为
55.87 kg.
变式训练
5
在一次抽样调查中测得样本的
5
个样本
点, 数值如下表:
试建立
y
与
x
之间的非线性回归方程
.
数 学 文 化
例 临近春节, 各商场纷纷举行大力度
的优惠活动, 某商场的 “满减促销” 活动吸
引越来越多的人前来消费, 该商场的销售团
队统计了活动刚推出
7
天内每一天进店消费
的人次, 用
x
表示活动推出的天数,
y
表示
每天进店消费的人次 (单位: 人次)
.
(
1
) 该销售团队分别用两种模型
①y=c
·
d
x
,
②y=a+bx
(
c
,
d
为大于
0
的常数) 进行
拟合, 得到相应的回归方程并进行残差分
析, 得到如图所示的残差图
.
根据残差图,
比较模型
①
与
②
的拟合效果, 应选择哪个模
型? (给出判断即可, 不必说明理由)
(
2
) 根据 (
1
) 的判断结果求
y
关于
x
的回归方程, 并预测活动推出第
10
天进店
消费的人次;
参考数据:
(
3
) 根据 (
1
) 选择的模型按照某项指
标测定, 当残差
e
^
∈
-
1
2
,
1
2
2 $
时, 则称当
天为 “消费正常日”
.
若从该影院开业的这
7
天中任选
3
天进行进一步的数据分析, 记
“消费正常日” 的天数
X
, 求
X
的分布列及
期望
.
附: 对于一组数据 (
x
1
,
y
1
), (
x
2
,
y
2
),
…, (
x
n
,
y
n
), 其回归直线
y=a+bx
的斜率
和截距的最小二乘法估计分别为
y z
7
i=1
移
x
i
z
i
10
0.77
65 1.63 50.96 5.89
7
i=1
移
x
i
y
i
2 574
x 0.25 2 4
y 16 2 1
0.5
12
1
5
x
y
O
1 2 3 4
16
14
12
10
8
6
4
2
x
z
O
20 40 60 80 100 120 140 160 180
4
3
2
1
图
2
图
4-3-5
图
4-3-6
73
高中数学选择性必修 第二册 (人教 B 版) 精编版
学
b
^
=
n
i=1
移
x
i
y
i
-nxy
n
i=1
移
x
2
i
-nx
2
,
a
^
=y-
b
^
x.
解: (
1
) 应该选择模型
①.
(
2
)
∵y=c
·
d
x
, 两边取常用对数得
lgy=
lg
(
c
·
d
x
)
=lgc+lgd
·
x
,
设
lgy=z
,
∴z=lgc+lgd
·
x.
∵
7
i=1
移
x
i
z
i
=50.96
,
x=
1+2+3+4+5+6+7
7
=4
,
7
i=1
移
x
2
i
=1
2
+2
2
+
…
+7
2
=140
,
x
2
=16
,
∴lgd =
7
i=1
移
x
i
z
i
-7xy
7
i=1
移
x
2
i
-7x
2
=
50.96-7×4×1.63
140-7×16
=
0.19.
把样本数据中心点 (
4
,
1.63
) 代入
z=
lgc+lgd
·
x
, 得
lgc=0.87
,
∴
z
^
=0.87+0.19x
,
则
lgy=0.87+0.19x
,
∴y
关于
x
的回归方程为
y
^
=10
0.87+0.19x
.
把
x=10
代入上式得
y
^
=10
0.87 +0.19x
=10
2.77
=
100×10
0.77
=589
,
故活动推出第
10
天进店消费的人次为
589.
(
3
) 从残差图易知 ,
7
天中有
5
天为
“消费正常日”,
X
的可能取值为
1
,
2
,
3.
P
(
X=1
)
=
C
1
5
·
C
2
2
C
3
7
=
1
7
,
P
(
X=2
)
=
C
2
5
·
C
1
2
C
3
7
=
4
7
,
P
(
X=3
)
=
C
3
5
C
3
7
=
2
7
,
∴X
的分布列为
故
X
的期望为
E
(
X
)
=1×
1
7
+2×
4
7
+3×
2
7
=
15
7
.
X 1 3
P
1
7
2
7
2
4
7
残差
模型
①
模型
②
活动推出天数
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
1 2 3 4 5 6 7
图
4-3-7
74
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。