内容正文:
章末复习提升
要点一 一元线性回归
1.主要考查两个变量线性相关的判定,以及利用最小二乘法求线性回归方程.
2.掌握求线性回归方程的方法和步骤,提升数学运算、数据分析的素养.
训练1 如图所示,从人体脂肪含量(单位:%)与年龄散点图中,能比较清楚的表示人体脂肪含量与年龄的相关性的回归直线为( )
A.l1 B.l2
C.l3 D.l4
解析:选A.根据线性相关的意义知,当所有的数据在一条直线附近排列时,具有很强的线性相关性.从题图中,能比较清楚的表示人体脂肪含量与年龄的相关性的回归直线是l1,题图中的散点大部分都分布在此直线两边.故选A.
训练2 某商店经营一批进价为4元/件的商品,在市场调查时发现,此商品的销售单价X(单位:元)与日销售量Y(单位:件)之间有如下关系:
X
5
6
7
8
Y
10
8
7
3
试计算X,Y之间的样本相关系数.
参考数据:(xi-)(yi-)=-11, (xi-)2=5, (yi-)2=26, ≈11.401 8.
参考公式:r=.
解:由题知r==≈-0.964 8.
训练3 已知某连锁经营公司的5个零售店某月的销售额和利润额资料如下表:
商店名称
A
B
C
D
E
销售额X/千万元
3
5
6
7
9
利润额Y/千万元
2
3
3
4
5
(1)画出散点图;
(2)根据如下的参考公式与参考数据,求利润额Y与销售额X之间的线性回归方程;
(3)若该公司还有一个零售店某月销售额为10千万元,试估计它的利润额是多少.
参考公式:=,=-.
参考数据:iyi=112,=200.
解:(1)散点图如图.
(2)由(1)中散点图可以看出,X与Y有近似的线性关系.
由已知数据计算得n=5,==6,==3.4,==0.5,=3.4-0.5×6=0.4.则线性回归方程为Y=0.5X+0.4.
(3)将X=10代入线性回归方程中得到Y=0.5×10+0.4=5.4(千万元).
即估计该零售店的利润额为5.4千万元.
解决线性回归分析问题的一般步骤
(1)画散点图.根据已知数据画出散点图.
(2)判断变量的相关性并求线性回归方程.通过观察散点图或计算样本相关系数,判断两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出线性回归方程.
(3)实际应用.依据求得的线性回归方程解决实际问题.
要点二 独立性检验
1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,分析并判断相关性结论的可信程度.
2.通过计算χ2的值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.
训练1 (多选)(2024·江西抚州检测)以下关于独立性检验的说法中,正确的是( )
A.独立性检验得到的结论一定正确
B.样本不同,独立性检验的结论可能有差异
C.独立性检验不是判断两分类变量是否相关的唯一方法
D.若随机变量χ2>6.635,我们有99%的把握判断吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病
解析:选BC.利用独立性检验时,结论与样本的选取有关,因此得到的结论可能有误,A错误;样本不同,独立性检验的结论可能有差异,B正确;可以利用频率表粗略地判断两个分类变量之间是否具有相关性,因此独立性检验不是判断两分类变量是否相关的唯一方法,C正确;若χ2>6.635,则有99%的把握判断吸烟与患肺病有关,某人吸烟,不表示他有99%的可能患有肺病,D错误.故选BC.
训练2 为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天的结果如下表所示:
电离辐射剂量
存活情况
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
n=50
由表中数据算得:χ2=________,说明两种电离辐射剂量对小白鼠的致死作用____________.(填“相同”或“不相同”)
解析:由列联表中数据,计算得
χ2=≈5.333>3.841,
所以有95%的把握判断小白鼠的死亡与使用的电离辐射剂量有关,即两种电离辐射剂量对小白鼠的致死作用不相同.
答案:5.333 不相同
训练3 为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表(单位:天):
PM2.5
SO2
[0,150]
(150,475]
总计
[0,75]
(75,115]
总计
(3)根据(2)中的列联表及独立性检验,判断该市一天空气中PM2.5浓度与SO2浓度是否有关?
解:(1)根据抽查数据,该市100天空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,所求概率的估计值为=0.64.
(2)根据抽查数据,可得2×2列联表(单位:天):
PM2.5
SO2
[0,150]
(150,475]
总计
[0,75]
64
16
80
(75,115]
10
10
20
总计
74
26
n=100
(3)根据(2)的列联表得χ2=≈7.484>6.635.
所以有99%的把握判断该市一天空气中PM2.5浓度与SO2浓度有关.
训练4 (2024·陕西西安期中)某市组织全市中小学生观看了“天宫课堂”第四课,并随机抽取1 000名中小学生进行了一次“飞天宇航梦”的调查,得到如下2×2列联表(单位:名):
性别
“飞天宇航梦”
有
无
总计
男
100
女
350
500
总计
(1)若将样本频率视为概率,求从全市中小学生中随机选择1名学生,此学生有“飞天宇航梦”的概率;
(2)完成上面的列联表,能否有99%的把握判断学生性别和有“飞天宇航梦”有关?
附:χ2=,其中n=a+b+c+d.
解:(1)由题意与列联表可知被调查的男、女学生都是500人,
其中有“飞天宇航梦”的男生有400人,女生有350人,一共750人,
因此从全市中小学生中随机选择1名学生,此学生有“飞天宇航梦”的概率为=.
(2)2×2列联表如下(单位:名):
性别
“飞天宇航梦”
有
无
总计
男
400
100
500
女
350
150
500
总计
750
250
n=1 000
根据列联表中的数据,经计算得到,
χ2=≈
13.333>6.635,
所以有99%的把握判断学生性别和有“飞天宇航梦”有关.
(1)χ2的值越大,说明判断两个分类变量有关联成立的可能性越大.因此根据列联表中数据求得χ2的值,和临界值比较,可得出结论.
(2)独立性检验和概率知识的综合问题,可结合古典概型、条件概率或随机变量的分布等求解.
学科网(北京)股份有限公司
$