内容正文:
!
"
#
$
%
&
'
(
)
*
+
,
-
!
"
#
.
#
#
#
#
#
#
#
4. 3 统计模型
4. 3. 1 一元线性回归模型
!"#$%&'(
课程标准
1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,
掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.
2.针对实际问题,会用一元线性回归模型进行预测.
3.结合实例,了解样本相关系数的统计含义,会通过相关系数比较多组成对数据的相关性.
学法解读
1.了解变量间的相关关系. (数学抽象)
2.能根据散点图,判断两个变量是否具有相关关系.
3.了解线性回归思想,会求回归直线的方程.
4.会判断相关性的强弱,能根据回归直线方程进行预测.
5.能利用回归分析解决实际问题,能解决非线性回归问题.
)*+,%-.+
相关关系
(1)两个变量的关系
分类 函数关系 相关关系
特征两变量关系具有确定性
两变量关系带有
随机性
(2)散点图:将样本中n对数据(xi,yi)(i =1,
2,…,n)描在平面直角坐标系 中得到的图形.
(3)线性相关:如果变量x与变量y之间的关
系可以近似地用一次函数 来刻画,则称x与y
线性相关.
(4)正相关与负相关
正相关 负相关
一个变量增大,另一个
变量大体上也增大
一个变量增大,另一
个变量大体上
减少
思考1:正相关与负相关是对所有具有相关
关系的两个变量而言的,对吗?
回归直线方程及其性质
(1)最小二乘法
一般地,已知变量x与y的n对成对数据(xi,
yi),i =2,3,…,n,任意给定一个一次函数y = bx +
a,对每一个已知的xi,由直线方程可以得到一个
估计值^yi = bxi + a,如果一次函数^y = b^x + a^能使
残差平方和即 取得最小值,则^y =
b^x + a^称为y关于x的回归直线方程(对应的直线
称为回归直线).因为是使得平方和最小,所以其
中涉及的方法称为最小二乘法
.
!'"
#
#
#
#
#
#
/
0
1
2
#
3
4
5
6
7
"
8
9
:
#
(2)回归直线方程的系数计算公式
回归直线方程 回归系数 a^的计算公式
y^ = b^x + a^
b^ =
=
n
i = 1
xiyi = n x y
n
i = 1
x2i - n x
2
a^ = y - b^ x
(3)回归直线方程的性质
①回归直线方程一定过点 .
②一次函数^y = b^x + a^的单调性由b^的符号
决定,函数递增的充要条件是 .
③回归系数b^的实际意义:当x增大一个单
位时,^y增大b^个单位.
思考2:求回归直线方程的目的是什么?
相关关系
(1)定义:统计学里一般用γ =
= 来衡量y与x的线
性相关性强弱,这里的γ称为线性相关系数(简称为
相关系数).
(2)性质
① | γ |≤ ,且y与x正相关的充要
条件是 ,y与x负相关的充要条件是
.
② | γ |越 ,说明两个变量之间的线
性相关性越 ,也就是得出的回归直线方
程越没有价值,即方程越不能反映真实的情况;
| γ |越 ,说明两个变量之间的线性相关性
越 ,也就是得出的回归直线方程越有
价值;
③ | γ | = 1的充要条件是成对数据构成的点
都在回归直线 上.
非线性回归方程
如果具有相关关系的两个变量x,y不是
线性相关 关系,那么称为非线性相关关系.所得到
的方程称为非线性回归方程(也简称为回归方程).
思考3:如何猜测非线性回归方程的类型
?
/012%345
题型探究
题型一 相关关系的判断
1.两对变量A和B,C和D的对应数据分别
如表1和表2所示,据此画出散点图,分别判
断它们是否具有相关关系;若具有相关关系,则说
出它们具有什么样的相关关系.
表1
A 26 18 13 10 4 - 1
B 20 24 34 38 50 64
表2
C 0 5 10 15 20 25 30 35
D 541. 67 608. 66 672. 09 704. 99 806. 71 902. 59 945. 42 1 006. 75
[分析] 画出散点图→观察各点的分布→
判断是否具有相关关系
[尝试作答
]
[规律方法] 研究两变量是否存在某种关
系的思路
在研究两个变量之间是否存在某种关系时,
必须从散点图入手.对于散点图,可以作出如下
判断
:
!'#
!
"
#
$
%
&
'
(
)
*
+
,
-
!
"
#
.
#
#
#
#
#
#
#
(1)如果所有的样本点都落在某一曲线上,
就用该曲线对应的函数来描述变量之间的关系,
即变量之间具有函数关系.
(2)如果所有的样本点都落在某一曲线附
近,那么变量之间具有相关关系.
(3)如果所有的样本点都落在某一直线附
近,那么变量之间具有线性相关关系.
对点训练? (1)对变量x,y由观测数据
(xi,yi)(i = 1,2,…,10),得散点图1;对变量u,v
由观测数据(ui,vi)(i = 1,2,…,10),得散点图2.
由这两个散点图可以判断 (C )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
(2)下列两个变量间的关系不是函数关系的是
(D )
A.圆的半径与周长
B.角的度数与它的正弦值
C.粮食亩产量为常数时,土地面积与粮食总
产量
D.日照时间与水稻的单位产量
题型二 回归直线方程及其应用
2.随着网络的普及,网上购物的方式已经受
到越来越多年轻人的青睐,某家网络店铺商品的
成交量x(单位:件)与店铺的浏览量y(单位;次)
之间的对应数据如下表所示:
x /件 2 4 5 6 8
y /次 30 40 50 60 70
(1)根据表中数据画出散点图;
(2)根据表中的数据,求出y关于x的回归直线
方程;
(3)当这种商品的成交量突破100件(含100
件)时,预测这家店铺的浏览量至少为多少.
[分析] 以横轴表示成交量,纵轴表示浏览
量,画出散点图,若散点图显示两变量线性相关,
则依据公式求解回归直线方程,再利用回归直线
方程进行估计.
[尝试作答
]
[规律方法] 线性回归分析的步骤
(1)收集样本数据,设为(xi,yi)(i = 1,2,…,
n)(数据一般由题目给出).
(2)作出散点图,确定x,y具有线性相关
关系.
(3)计算x,y,n
i = 1
x2i,
n
i = 1
xiyi .
(4)代入公式计算相关系数,确定相关性的
强弱.
(5)代入公式计算b^,^a,写出回归直线方程
y^ = b^x + a^;
(6)利用回归直线方程进行预测.
对点训练? 某厂的生产原料耗费x(单
位:百万元)与销售额y(单位:百万元)之间有如
下的对应关系:
x /百万元 2 4 6 8
y /百万元 30 40 50 70
x与y之间是否具有线性相关关系?若有,判
断相关性的强弱,并求其回归直线方程.
题型三 非线性回归方程
3.某企业新研发了一种产品,产品的成本由
原料成本及非原料成本组成.每件产品的非原料
成本y(元)与生产该产品的数量x(千件)有关,经
统计得到如下数据:
x 1 2 3 4 5 6 7 8
y 112 61 44. 5 35 30. 5 28 25
24
!'$
#
#
#
#
#
#
/
0
1
2
#
3
4
5
6
7
"
8
9
:
#
根据以上数据,绘制了散点图.
观察散点图,两个变量不具有线性相关关系,
现考虑用反比例函数模型y = a + bx和指数函数模
型y = cedx分别对两个变量的关系进行拟合.已求
得用指数函数模型拟合的回归方程为^y =
96. 54e -0. 2x,lny与x的相关系数r1 = - 0. 94.
参考数据其中ui = 1x( )i :
8
i = 1
uiyi u u2
8
i = 1
u2i
8
i = 1
yi
8
i = 1
y2i 0. 61 × 6 185.槡 5 e - 2
183. 4 0. 34 0. 115 1. 53 360 22 385. 5 61. 4 0. 135
(1)用反比例函数模型求y关于x的回归
方程;
(2)用相关系数判断上述两个模型哪一个拟
合效果更好(精确到0. 01),并用其估计产量为10
千件时每件产品的非原料成本;
(3)该企业采取订单生产模式(根据订单数量
进行生产,即产品全部售出).根据市场调研数据,
若该产品单价定为100元,则签订9千件订单的概
率为0. 8,签订10千件订单的概率为0. 2;若单价定
为90元,则签订10千件订单的概率为0. 3,签订11
千件订单的概率为0. 7.已知每件产品的原料成本
为10元,根据(2)的结果,企业要想获得更高利润,
产品单价应选择100元还是90元,请说明理由.
参考公式:对于一组数据(u1,v1),(u2,v2),…,
(un,vn),其回归直线v = α + βu的斜率和截距的最
小二乘估计分别为:^β =
n
i =1
uivi - n u v
n
i =1
u2i - n u
2
,^a = v - β^ u,
相关系数r =
n
i =1
uivi - n u v
n
i =1
u2i - n u( )
2
n
i =1
v2i - n v( )槡 2
[分析] (1)首先可令u = 1x并将y = a +
b
x
转化为y = a + bu,然后根据题目所给数据以及线
性回归方程的相关公式计算出b^以及^a,即可得出
结果.
(2)计算出反比例函数模型的相关系数r并
通过对比即可得出结果.
(3)可分别计算出单价为100元和90元时产
品的利润,通过对比即可得出结果.
[尝试作答
]
[规律方法] 非线性回归问题有时并不给
出经验公式,这时我们可以画出已知数据的散点
图,把它与学过的各种函数(幂函数、指数函数、对
数函数等)图像作比较,挑选一种跟这些散点拟合
得最好的函数,然后采用适当的变量变换,把问题
化为线性回归分析问题,使之得到解决.其一般步
骤为:
作散点图 根据原始数据(x,y)作出散点图
↓
选拟合函数 根据散点图,选择恰当的拟合函数
↓
变换求解 作恰当的变换,将其转化成线性函数, 求线性回归方程
↓
变换还原
在上面的基础上通过相应
的变换,即可得非线性回归
方程
对点训练? “绿水青山就是金山银山”
的理念推动了新能源汽车产业的迅速发展.以下
表格和图反映了近几年我国某新能源乘用车的年
销售量情况.
年份 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5
某新能源乘用车
年销售量y /万辆1. 5 5. 9 17. 7 32. 9 55.
6
!'%
!
"
#
$
%
&
'
(
)
*
+
,
-
!
"
#
.
#
#
#
#
#
#
#
(1)请根据散点图判断,y = bx + a与y = cx2 +
d中哪一个更适宜作为年销售量y关于年份代码x
的回归方程类型.(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y
关于x的回归方程,并预测2024年我国该新能源
乘用车的年销售量.(精确到0. 1)
参考数据:y = 22. 72,5
i = 1
(wi - w)2 = 374,
5
i = 1
(wi - w)(yi - y)=851. 2(其中wi = x2i).
易错警示
生搬硬套求回归直线方程的步骤致错.
4.在一次抽样调查中测得样本的5个样本点
数值如下表:
x 0. 25 0. 5 1 2 4
y 16 12 5 2 1
试建立y与x之间的回归方程.
[错解] ∵ x = 0. 25 + 0. 5 + 1 + 2 + 45 = 1. 55;
y = 16 + 12 + 5 + 2 + 15 = 7. 2,
∑
5
i =1
xiyi =0.25 ×16 +0.5 ×12 +1 ×5 +2 ×2 +4 ×1
=23.
∑
5
i = 1
x2i = 0. 25
2 + 0. 52 + 12 + 22 + 42 = 21. 312 5.
∑
5
i = 1
y2i = 16
2 + 122 + 52 + 22 + 12 = 430.
∴ b^ =
∑
5
i = 1
xiyi - 5x y
∑
5
i = 1
x2i - 5x
2
= 23 - 5 × 1. 55 × 7. 2
21. 3125 - 5 × 1. 552
= - 3. 526 9≈ -3. 53.
a^ = y - b^ x =7. 2 + 3. 53 × 1. 55≈12. 67.
∴ y^ =12. 67 - 3. 53x.
[辨析] 此题解法是错误的,原因是这两个
变量之间不是线性相关关系.此类问题的解决,应
先对两个变量间的相关关系进行相关性检验,然
后结合作出的散点图,选择适宜的回归方程.
[正解]
[点评] 只有当两变量间呈线性相关关系
时,才可以求回归系数,得到回归直线方程^y =
b^x + a^:若两变量间的关系不是线性相关关系,应
观察分析其散点图,找出拟合函数,通过变量代换
再作线性回归
.
!'&
#
#
#
#
#
#
/
0
1
2
#
3
4
5
6
7
"
8
9
:
#
6789%:;<
1.(2024·天津卷)下列图中,线性相关性系数最
大的是 ( )
A
B
C
D
2.已知x与y之间的一组数据:
x 0 1 2 3
y 1 3 5 7
若y与x线性相关,则y与x的回归直线^y =
b^x + a^必过 (D )
A.点(2,2) B.点(1.5,0)
C.点(1,2) D.点(1.5,4)
3.如图所示,给出了样本容量均为7的A,B两组
样本数据的散点图,已知A组样本数据的相关
系数为r1,B组数据的相关系数为r2,则(C )
A. r1 = r2 B. r1 < r2
C. r1 > r2 D.无法判定
4.对于线性相关系数r,叙述正确的是 (D )
A. r∈(- ∞,+ ∞),且r越大,相关程度越大
B. r∈(- ∞,+ ∞),且| r |越大,相关程度越大
C. r∈[-1,1],且r越大,相关程度越大
D. r∈[-1,1],且| r |越大,相关程度越大
5.正常情况下,年龄在18岁到38岁的人,体重y(kg)
对身高x(cm)的回归方程为^y = 0. 72x - 58. 2,
张红同学(20岁)身高为178 cm,她的体重应该
在 kg左右.
请同学们认真完成练案[17
]
4. 3. 2 独立性检验
!"#$%&'(
课程标准
1.通过实例,理解2 × 2列联表的统计意义.
2.通过实例,了解2 × 2列联表独立性检验及其应用.
学法解读
1.通过2 × 2列联表统计意义的学习,体会数学抽象的素养.
2.借助χ2计算公式进行独立性检验,培养数学运算和数据分析的素养.
!''
知识点3 (1)μ = 0且σ = 1 (3)1
关键能力·攻重难
例1:(1)证明:∵ X ~ N(10,1),
∴正态曲线φμ,σ(x)关于直线x = 10对称,而区间(1,2)和
(18,19)关于直线x = 10对称,
即P(1 < X < 2)= P(18 < X < 19).
(2)∵ P(X≤2)+ P(2 < X≤10)+ P(10 < X < 18)+
P(X≥18)= 1,μ = 10,
∴ P(X≤2)= P(X≥18)= a,P(2 < X≤10)= P(10 <
X <18),
∴ 2a + 2P(10 < X < 18)= 1,
即P(10 < X < 18)= 1 - 2a2 =
1
2 - a.
对点训练1:(1)C P(- 2 < ξ < 2)= 1 - 2P(ξ > 2)= 1 - 2
× 0. 023 = 0. 954.
(2)BC 依题可知,x = 2. 1,s2 = 0. 01,所以Y ~ N(2. 1,
0. 1),故P(Y > 2)= P(Y > 2. 1 - 0. 1)= P(Y < 2. 1 + 0. 1)≈
0. 841 3 > 0. 5,C正确,D错误;因为X ~ N(1. 8,0. 1),所以P(X
> 2)= P(X > 1. 8 + 2 × 0. 1),因为P(X < 1. 8 + 0. 1)≈0. 841 3,
所以P(X > 1. 8 + 0. 1)≈1 - 0. 841 3 = 0. 158 7 < 0. 2,而P(X >
2)= P(X > 1. 8 + 2 × 0. 1)< P(X > 1. 8 + 0. 1)< 0. 2,B正确,A
错误.故选BC.
例2:由题意可知,分数X ~ N(110,202),μ = 110,σ = 20,
P(X≥90)= P(X≥110 - 20)= P(X≥μ - σ),
因为P(X≤μ -σ)+P(μ -σ≤X≤μ +σ)+P(X≥μ +σ)
= 2P(X≤μ - σ)+ 0. 683 = 1,
所以P(X≤μ - σ)= 0. 158 5,
所以P(X≥90)=1 -P(X≤μ -σ)=1 -0.158 5 =0.841 5.
例3:由于圆柱形零件的外径尺寸X ~ N(4,0. 25),由正态
分布的特征可知,X在区间(4 - 3 × 0. 5,4 + 3 × 0. 5)(即(2. 5,
5. 5))之外取值的概率约为0. 002 7.而5. 7(2. 5,5. 5),这说
明在一次试验中,出现了几乎不可能发生的小概率事件,根据统
计中假设检验的基本思想,认为该厂生产的这批产品是不合
格的.
对点训练2:∵ ξ ~ N(90,100),∴ μ = 90,σ = 10.
(1)在该正态分布中,μ - 2σ = 70,μ + 2σ = 110,
∵ P(μ - 2σ < X≤μ + 2σ)= 0. 954 5,
∴考试成绩ξ位于区间(70,110]内的概率为0. 954 5.
(2)μ - σ = 80,μ + σ = 100,
∵ P(μ - σ < X≤μ + σ)= 0. 682 7,
∴考试成绩ξ位于区间(80,100]内的概率为0. 682 7.
由共有2000名考生,知考试成绩在(80,100]间的考生大约
有2 000 × 0. 682 7≈1 365(人).
例4:(1)设参赛学生的分数为ξ,
因为ξ ~ N(70,100),所以ξ - 7010 ~ N(0,1).
由条件知,P(ξ≥90)= 1 - P(ξ < 90)
= 1 -Φ 90 - 70( )10 = 1 -Φ(2)= 1 - 0. 977 2 = 0. 022 8.
这说明成绩在90分以上(含90分)的学生人数约占全体参
赛人数的2. 28%,
∴参赛总人数约为120. 022 8≈526(人).
(2)假定设奖的分数线为x分,则X ~ N(70,100),故x - 7010
~ N(0,1).又P(ξ≥x)= 1 - P(ξ < x)
= 1 -Φ x - 70( )10 = 50526≈0. 095 1.
即Φ x - 70( )10 ≈0. 904 9,查表得x - 7010 ≈1. 31,
解得x = 83. 1.
故设奖的分数线约为83分.
对点训练3:(1)因为X ~ N(0,1),
所以Φ(- 3)= P(X < - 3)
= 12 [1 - P(- 3≤X≤3)]≈
1
2 (1 - 0. 997)= 0. 001 5.
(2)因为X ~ N(0,1)且Φ(0. 42)= 0. 662 8,
所以由Φ(- a)+Φ(a)= 1得,Φ(- 0. 42)= 1 -Φ(0. 42)
= 1 - 0. 662 8 = 0. 337 2.
例5:0. 021 5 因为ξ - N(1,4),所以μ = 1,σ = 2,
P(5 < ξ < 7)= P(- 5 < ξ < - 3),
则P(5 < ξ < 7)
= 12 [P(- 5 < ξ < 7)- P(- 3≤ξ≤5)]
= 12 [P(1 - 6 < ξ < 1 + 6)- P(1 - 4≤ξ≤1 + 4)]
= 12 [P(μ - 3σ < ξ < μ + 3σ)- P(μ - 2σ≤ξ≤μ + 2σ)]
≈ 12 ×(0. 997 - 0. 954)
= 0. 021 5.
课堂检测·固双基
1. D 正态曲线函数的图像关于直线x = μ > 0对称,故选D.
2. B 由X ~ N - 2,( )14 ,知μ = - 2,σ = 12 ,
∴ P(- 3. 5 < X≤ - 0. 5)=
P(- 2 - 3 × 0. 5 < X≤ - 2 + 3 × 0. 5)= 0. 997 3.
3. B 随机变量X ~ N(μ,σ2),
∵ P(X≤a)= P(X > a),P(X≤a)+ P(X > a)= 1,
∴ x = a为相应正态曲线的对称轴.
∴ a = μ.
正态曲线函数的图像关于直线x =M > 0对称,故选B.
4. B 由ξ ~ N(1,4)知,μ = 1,σ = 2,
∴ μ - σ = - 1,μ + σ = 3,
∴ P(1 < ξ≤3)= 12 P(- 1 < ξ≤3)= 0. 341 3,故选B.
5. 0. 8 ∵ X ~ N(1,σ2),且P(0 < X≤1)= 0. 4,
∴ P(0 < X≤2)= 2P(0 < X≤1)= 0. 8.
4. 3 统计模型
4. 3. 1 一元线性回归模型
必备知识·探新知
知识点1 (1)确定性 随机性 (2)平面直角坐标系
(3)一次函数 (4)增大 减少
思考1:不对,正相关与负相关是针对线性相关关系而
言的.
知识点2 (1)(y1 - y^1)2 +(y2 - y^2)2 +…+(yn - y^n)2 =
∑
n
i = 1
(yi - y^i)2 (2)
∑
n
i = 1
(xi - x)(yi - y)
∑
n
i = 1
(xi - x)2
(3)①(x,y) ②b^ > 0
思考2:回归直线方程确定之后,就可用于预测.
知识点3 (1)
n
i = 1
(xi - x)(yi - y)
n
i = 1
(xi - x)2
n
i = 1
(yi - y)槡 2
n
i = 1
xiyi - n x y
(n
i = 1
x2i - n x
2)(n
i = 1
y2i - n y
2槡 )
(2)①1 γ > 0 γ < 0 ②小
弱 大 强 ③回归直线
—144—
知识点4 线性相关
思考3:可以通过作出散点图,结合已学的函数模型进行
猜测.
关键能力·攻重难
例1:散点图分别如图1和图2所示.
从图中可以看出两图中的点各自分布在一条直线附近,因
此两对变量都具有相关关系.
图1中,当A的值由小变大时,B的值却是由大变小,故A
和B成负相关;
图2中,当C的值由小变大时,D的值也是由小变大,故C
和D成正相关.
对点训练1:(1)C 由图像知,变量x与y呈负相关关系;u
与v呈正相关关系.
(2)D 函数关系与相关关系都是指两个变量之间的关系,
但是这两种关系是不同的,函数关系是指当自变量一定时,函数
值是确定的,是一种确定性的关系.因为A项C = 2πr,B项y =
sin x,C项y = ax(a > 0,a为常数),所以这三项均是函数关系;D
项是相关关系.
例2:(1)散点图如图所示.
(2)根据散点图可得,变量x与y之间具有线性相关关系.
根据数据可知,x = 5,y = 50,5
i = 1
xiyi = 1 390,
5
i = 1
x2i = 145,代入
公式得b^ =
5
i = 1
xiyi - 5x y
5
i = 1
x2i - 5x
2
= 1 390 - 5 × 5 × 50
145 - 5 × 52
= 7,^a = y - b^ x = 50 -
7 × 5 = 15.
故所求的回归直线方程是^y = 7x + 15.
(3)根据上面求出的回归直线方程,当成交量突破100件
(含100件),即x = y^ - 157 ≥100时,^y≥715,所以预测这家店铺
的浏览量至少为715次.
对点训练2:散点图如图所示,由图可知x,y有线性相关
关系.
x = 5,y = 47. 5,4
i = 1
x2i = 120,
4
i = 1
y2i = 9 900,
4
i = 1
xiyi = 1 080,
r =
4
i = 1
xiyi - 4x y
4
i = 1
x2i - 4x( )
2
4
i = 1
y2i - 4y( )槡 2
= 1 080 - 4 × 5 × 47. 5
(120 - 4 × 52)(9 900 - 4 × 47. 52槡 )
≈0. 982 7.
故x与y之间具有很强的线性相关关系.由公式得回归
系数
b^ =
4
i = 1
xiyi - 4x y
4
i = 1
x2i - 4x
2
= 1 080 - 4 × 5 × 47. 5
120 - 4 × 52
= 6. 5,
a^ = y - b^ x = 47. 5 - 6. 5 × 5 = 15.
故y对x的回归直线方程为^y = 6. 5x + 15.
例3:(1)令u = 1x ,则y = a +
b
x可转化为y = a + bu,因为y
= 3608 = 45,所以
b^ =
8
i =1
uiyi -8u y
8
i =1
u2i -8u
2
=183.4 -8 ×0.34 ×451.53 -8 ×0.115 =
61
0.61 =100,
则^a = y - b^ u = 45 - 100 × 0. 34 = 11,所以^y = 11 + 100u,
所以y关于x的回归方程为^y = 11 + 100x .
(2)y与1x的相关系数为:r2 =
8
i = 1
uiyi - 8 u y
(8
i = 1
u2i - 8u
2)(8
i = 1
y2i - 8y
2槡 )
= 61
0. 61 × 6 185.槡 5
≈0. 99.
因为| r1 | < | r2 |,所以用反比例函数模型拟合效果更好,
当x = 10时,y = 10010 + 11 = 21(元),
所以当产量为10千件时,每件产品的非原料成本为21元.
(3)①当产品单价为100元,设订单数为x千件,因为签订9
千件订单的概率为0. 8,签订10千件订单的概率为0. 2,
所以E(x)= 9 × 0. 8 + 10 × 0. 2 = 9. 2,
所以企业利润为100 × 9. 2 - 9. 2 × 1009. 2( )+ 21 =
626. 8(千元).
②当产品单价为90元,设订单数为y千件,因为签订10千件
订单的概率为0. 3,签订11千件订单的概率为0. 7,
所以E(y)=10 ×0. 3 +11 ×0. 7 =10. 7,
所以企业利润为
90 × 10. 7 - 10. 7 × 10010. 7( )+ 21 = 638. 3(千元).
故企业要想获得更高利润,产品单价应选择90元.
对点训练3:(1)根据散点图可知,y = cx2 + d更适宜作为年
销售量y关于年份代码x的回归方程类型.
(2)令w = x2,则^y = c^w + d^. 易知w = 11,c^ =
5
i = 1
(wi - w)(yi - y)
5
i = 1
(wi - w)2
= 851. 2374 ≈2. 28,
d^ = y - c^ w≈22. 72 - 2. 28 × 11 = - 2. 36,所以^y =
2. 28w - 2. 36,所以y关于x的回归方程为^y = 2. 28x2 - 2. 36.
令x = 6,得^y = 79. 72≈79. 7.
故预测2024年我国该新源乘用车的年销售量为79. 7万辆.
例4:由数值表可作散点图如图所示
:
—145—
根据散点图可知y与x近似地呈反比例函数关系,设y =
k
x ,令t =
1
x ,则y = kt,原数据变为:
t 4 2 1 0. 5 0. 25
y 16 12 5 2 1
由置换后的数值表作散点如图所示:
由散点图可以看出y与t呈近似的线性相关关系.列表
如下:
i ti yi ti yi t2i y2i
1 4 16 64 16 256
2 2 12 24 4 144
3 1 5 5 1 25
4 0. 5 2 1 0. 25 4
5 0. 25 1 0. 25 0. 0625 1
∑ 7. 75 36 94. 25 21. 3125 430
所以t = 1. 55,y = 7. 2,
所以b^ =
∑
5
i = 1
tiyi - 5t y
Σ
5
i = 1
t2i - 5t
2
≈4. 1344. a^ = y - b^ t≈0. 8.
所以^y = 4. 1344t + 0. 8.
所以y与x的回归方程是^y = 4. 1344x + 0. 8.
课堂检测·固双基
1. A 观察4幅图可知,A图散点分布比较集中,且大体接近某
一条直线,线性回归模型拟合效果比较好,呈现明显的正相
关,| r |值相比于其他3图更接近1.故选A.
2. D 因为x = 0 + 1 + 2 + 34 = 1. 5,^y =
1 + 3 + 5 + 7
4 = 4,所以回归
直线必过点(1. 5,4).
3. C
4. D
5. 69. 96 用回归方程对身高为178 cm的人的体重进行预测,
当x = 178时,^y = 0. 72 × 178 - 58. 2 = 69. 96(kg).
4. 3. 2 独立性检验
必备知识·探新知
知识点1 (2) n(ad - bc)
2
(a + b)(c + d)(a + c)(b + d) a + b + c + d
知识点2 (1)显著性水平 分位数 α 1 - α
思考:不对,若χ2 < k成立,则说明有1 - α的把握认为事件
A与B无关.
关键能力·攻重难
例1:(1)由调查数据知,男顾客对该商场服务满意的概率
的估计值为0. 8;女顾客对该商场服务满意的概率的估计值为
30
50 = 0. 6.
(2)χ2 = 100 ×(40 × 20 - 30 × 10)
2
50 × 50 × 70 × 30 ≈4. 762.
由于4. 762 > 3. 841,故有95%的把握认为男、女顾客对该
商场服务的评价有差异.
对点训练1:(1)根据题目所给数据得到如下2 × 2的列
联表:
使用寿命不高于6年使用寿命不低于7年总计
A型 30 70 100
B型 50 50 100
总计 80 120 200
所以χ2 = 200 ×(50 × 70 - 30 × 50)
2
100 × 100 × 80 × 120 ≈8. 333.
查表可得P(χ2≥6. 635)= 0. 01,
由于8. 333 > 6. 635,
所以有99%的把握认为出租车的使用寿命与汽车车型
有关.
(2)记事件A为“小李选择A型车,3年内(含3年)不换
车”,事件B为“小李选择B型车,3年内(含3年)不换车”,所以
P(A)=45 +25100 =0. 7,P(B)=
40 +10
100 = 0. 5,因为P(A)> P(B),
所以小李应选择A型车.
例2:(1)列联表补充如下:
喜爱打篮球不喜爱打篮球合计
男生 22 6 28
女生 10 10 20
合计 32 16 48
(2)由χ2 = 48 ×(220 - 60)
2
28 × 20 × 32 × 16≈4. 286.
因为4. 286 > 3. 841,所以,能在犯错误的概率不超过0. 05
的前提下认为喜爱打篮球与性别有关.
(3)喜爱打篮球的女生人数X的可能取值为0,1,2.
其概率分别为
P(X = 0)= C
2
10
C220
= 938,
P(X = 1)= C
1
10C
1
10
C220
= 1019,
P(X = 2)= C
2
10
C220
= 938,
故X的分布列为
X 0 1 2
P 938
10
19
9
38
X的均值为E(X)= 0 + 1019 +
9
19 = 1.
对点训练2:(1)根据题意可得列联表
:
—146—