内容正文:
$$\therefore b = \frac { 2 ^ { 2 } x y _ { 1 } - 5 x ^ { 2 } } { \sum _ { i } ^ { 2 } x _ { i } - 5 x ^ { 2 } } = \frac { 6 2 0 - 5 \times 1 8 \times 7 . 4 } { 1 6 6 0 - 5 \times 1 8 ^ { 4 } } = - 1 . 1 5 ,$$
[基础自测]
1.(1)√ (2)×(3)√ (4)√
2.D 由等高堆积条形图易知,D选项两个分类变量关系
$$\overrightarrow { a } = \overrightarrow { y } - \overrightarrow { b } \overline { x } = 7 . 4 + 1 . 1 5 \times 1 8 = 2 8 . 1 ,$$
最强,
∴
所求经验回归方程为
$$\hat { y } = - 1 . 1 5 x + 2 8 . 1 .$$
3.B 独立性检验只是在一定的可信度下进行判断,不一
列出残差表:
定正确,故选B.
$$y _ { i } - \hat { y } ;$$
0.3
-0.4
-0.1
0.2
4.A 根据列联表中的数据,可得
$$y _ { i } - \overline { y }$$
4.6
2.6
-0.4
-2.4
-4.4
$$x ^ { 2 } = \frac { 9 0 \times \left( 1 1 \times 3 7 - 3 4 \times 8 \right) ^ { 2 } } { 4 5 \times 4 5 \times 1 9 \times 7 1 } \approx 0 . 6 0 0 .$$
.故选A.
$$\left( y _ { i } - \overline { y } \right) ^ { 2 } = 0 . 3 , \sum _ { i = 1 } ^ { 5 }$$
$$\left( y ; - \overline { y } \right) ^ { 2 } = 5 3 . 2 ,$$
课堂案·互动探究
[例1][解析]等高条形图如图所示
$$R ^ { 2 } = 1 - \frac { 2 ^ { 3 } \left( y _ { 1 } - y _ { 2 } \right) ^ { 2 } } { \sum _ { i } ^ { 2 } \left( y _ { i } - \overline { y } \right) ^ { 2 } } \approx 0 . 9 9 4 ,$$
1
0.8
口阴性
故回归模型的拟合效果很好.
0.6
口阳性
0.4
[触类旁通]
0.2
3.解析由(1)可得
$$y _ { i } - \hat { y } ;$$
与
$$y _ { i } - \overline { y }$$
的关系如下表;
0
$$y _ { i } - \hat { y } ;$$
-0.5
-3.5
10
-6.5
0.5
铅中毒病人
对照组
其中两个浅色条的高分别代表铅中毒病人和对照组样
$$y _ { i } - \overline { y }$$
-10
10
0
20
本中尿棕色素为阳性的频率,
∴2
$$\left( y _ { i } - j _ { i } \right) ^ { 2 } = \left( - 0 . 5 \right) ^ { 2 } + \left( - 3 . 5 \right) ^ { 2 } + 1 0 ^ { 2 } +$$
由图可以直观地看出铅中毒病人与对照组相比,尿棕色
素为阳性的频率差异明显,因此铅中毒病人与尿棕色素
$$\left( - 6 . 5 \right) ^ { 2 } + 0 . 5 ^ { 2 } = 1 5 5 ,$$
为阳性有关联.
$$\left( y ; - \overline { y } \right) ^ { 2 } = \left( - 2 0 \right) ^ { 2 } + \left( - 1 0 \right) ^ { 2 } + 1 0 ^ { 2 } + 0 ^ { 2 } + 2 0 ^ { 2 } =$$
[触类旁通]
1000.
1.解析根据题目所给的数据得到如下
2×2
列联表:
$$\therefore R | = 1 - \frac { \sum _ { i = 1 } ^ { i } \left( y _ { i } - \overline { y } \right) ^ { 2 } } { \sum _ { i = 1 } ^ { - 1 } \left( y _ { i } - \overline { y } \right) ^ { 2 } } = 1 - \frac { 1 5 5 } { 1 0 0 0 } = 0 . 8 4 5 .$$
网络
期末成绩
总计
经常上网
不经常上网
由(2)可得
$$y _ { i } - \hat { y } ;$$
与
$$y _ { i } - \overline { y }$$
的关系如下表:
不及格
80
120
200
一5
8
一3
及格
120
680
800
y:一
-20
10
0
20
总计
200
800
1000
$$\left( y _ { i } - j _ { i } \right) ^ { 2 } = \left( - 1 \right) ^ { 2 } + \left( - 5 \right) ^ { 2 } + 8 ^ { 2 } + \left( - 9 \right) ^ { 2 } + \left( - 3 \right) ^ { 2 } =$$
得出等高堆积条形图如图所示;:
经常上网
180,2
$$\left( y ; - \overline { y } \right) ^ { 2 } = \left( - 2 0 \right) ^ { 2 } + \left( - 1 0 \right) ^ { 2 } + 1 0 ^ { 2 } + 0 ^ { 2 } + 2 0 ^ { 2 } =$$
不经常上网
0.8
1000.
0.7
7
0.6
$$\therefore R _ { 2 } = 1 - \frac { \sum _ { i = 1 } ^ { 1 } \left( y _ { i } - j _ { i } \right) ^ { 2 } } { \sum _ { i = 1 } ^ { \frac { 1 } { 2 } } \left( y _ { i } - \overline { y } \right) ^ { 2 } } = 1 - \frac { 1 8 0 } { 1 0 0 0 } = 0 . 8 2 .$$
0.5
0.4
0.3
0.2
0.1
由于
$$R _ { 1 } ^ { 2 } = 0 . 8 4 5 , R _ { 2 } ^ { 2 } = 0 . 8 2 , 0 . 8 4 5 > 0 . 8 2 , \therefore R _ { 1 } ^ { 2 } > R _ { 2 } ^ { 2 } .$$
0
不及格及格
∴(1)的拟合效果好于(2)的拟合效果,
比较图中阴影部分的高可以发现经常上网不及格的频
8.3 列联表与独立性检验
率明显高于经常上网及格的频率,因此可以认为经常上
8.3.1 分类变量与列联表
网与学习成绩有关联.
8.3.2 独立性检验
[例2][解析](1)年龄低于40岁的有1000×60%=
课前案·自主学习
600(人),完成2×2列联表如表所示,
[教材梳理]
头盔
导学
年龄
合计
佩戴
未佩戴
[问题][提示]可通过表格与图形进行直观分析,也可
通过统计分析定量判断.
低于40岁
540
60
600
◎结论形成
不低于40岁
340
60
400
1.不同类别
合计
880
120
1000
2.(1)频数表
23
@
(2)零假设为H。:遵守佩戴安全头盔与年龄无关,
(3)根据(2)的列联表得
由公式得X2-1000X(60X540-60×340)2-125
X-100X064X106x102≈7.484.
600×400×880×120
22
80×20×74×26
5.682<6.635=x0.01,
由于7.484>6.635=x0.010,故有99%的把握认为该市
∴.根据小概率值a=0.01的独立性检验,没有充分证据
一天空气中PM2.5浓度与SO2浓度有关.
推断H。不成立,因此可以认为H。成立,即认为遵守佩
章末整合提升
戴安全头盔与年龄无关。
[深化提升]一题组训练
[触类旁通]
1.解析(1)散点图如图:
2.B
由2=407×32x23-61X101)2≈0.164<
93×314×133×274
200
2.706=x0.1,
150
100
根据小概率值α=0.1的独立性检验,没有把握认为是
504
否经过处理跟是否生病有关
0
[例3][解析](1)列联表如下所示:
12345
(2)因为x=0+1+2+3+4=2,
态度
教师
总计
y=50+70+80+110+190-100.
5
赞同
不赞同
2xy:=0×50+1X70+2×80+3×110+4X1909
老教师
10
10
20
1320,
青年教师
24
6
30
含子=02+12+2+32+40=30,
所以6=1320-5X2X100=32,a=y-6元=36.
30-5×22
总计
34
16
50
所以经验回归方程为y=32x十36.
(2)零假设为H0:青年教师和老教师在新课程教学模式
(3)令x=11,则32×11+36=388,
的使用上没有差异,
故估计2025年该城市人口总数为388(万).
由公式得x-50X00X624X102≈4.963>3.841
2.解析
(1)z=2+4+5+6+8=5.
34×16×20×30
5
=x0.051
y=3+4+4+4+5=4,
5
我们推断H。不成立,即认为青年教师和老教师在新课
程教学模式的使用上有差异,此推断犯错误的概率不大
含x-五00-)=6
于0.05.
2(x:-)(y-)
6
[触类旁通]
相关系数r
3.解析(1)根据抽查数据,该市100天空气中的PM2.5
√②-0,-225·
浓度不超过75,且S02浓度不超过150的天数为32十
√0≈0.95,
9
18十6十8=64,因此,该市一天空气中PM2.5浓度不超
过75,且S02浓度不超过150的概率的估计值为654
因为r>0.75,所以y与x具有较强的线性相关关系,可
100
用线性回归模型拟合y与x的关系
0.64.
(2)根据抽查数据,可得2X2列联表:
(2)由(1)可知,6=
立(x:-z)(y-)
6=3
20-10,
S02
2(x-x)2
[0,150]
(150,475)
PM2.5
×5=
a=y-b证=4-i0
2
[0.75]
64
16
所以y与工之间线性回归方程为=品+受,
3
(75,115]
当x=7时,=晶×7+受=46
10
10
所以当A指标数为7时,B指标数的估计值为4.6,
24·数学·选择性必修 第三册(配RJA版)
8.3
列联表与独立性检验
8.3.1
分类变量与列联表
8.3.2
独立性检验
学业标准
素养目标
1.通过列联表和独立性检验概念的学习,培养数
1.通过实例,理解2×2列联表的统计意义.(重点)
学抽象等核心素养,
2.通过实例,了解2×2列联表独立性检验及其应用
2.在对分类变量进行独立性检验的过程中,提升
(重点、难点)
数据分析和数学运算等核心素养
课前案·自主学习
必备知识
素养初成
教材梳理
(2)抽样数据列联表
Y
导学
x
独立性检验
合计
Y-0
Y-1
2问题
山东省教育厅大力推行素质教育,
X-0
d
。
a十b
增加了高中生的课外活动时间,某校调查
x-1
d
C
c_d
了学生的课外活动方式,结果整理成下表;
合计
a十c
bd
n-a十b十c十d
活动方式
性别
合计
3.独立性检验
体育
文娱
(1)x{}的计算公式:记n=a十b十c十d,则
男生
210
230
440
n(ad-bc)2
22
女生
60
290
350
(a十b)(c十d)(a十c)(b十d)'
合计
790
(2)利用^{}的取值推断分类变量X和Y
270
520
是否独立的方法称为x{独立性检验,读作
如何判定“喜欢体育还是文娱与性别是否
“卡方独立性检验”,简称独立性检验
有联系”?
(3)应用独立性检验解决实际问题包括以
下几个环节:
①提出零假设H:X和Y相互独立,并给
出在问题中的解释;
结论形成
②根据抽样数据整理出2×2列联表,计算
1.分类变量:变量的不同“值”表示个体所属
的值,并与临界值x。比较;
的
,像这样的变量称为分类变量
③根据检验规则得出推断结论
2.列联表
④在X和Y不独立的情况下,根据需要,
(1)定义,列出的两个分类变量的
通过比较相应的频率,分析X和Y间的影
称为列联表。
响规律.
70
第八章 成对数据的统计分析
4.临界值
对。
忽略文的实际分布与该近似分布的误差
后,对于任何小概率值。,可以找到相应的
正实数x。,使得下面关系成立:P(x{}x。)
一,我们称x。为a的临界值
11 ?
C
D.
基础自测
3.以下关于独立性检验的说法中,错误的是
)
1.判断正误(正确的打“”,错误的打“×”)
A.独立性检验依据小概率原理
(1)列联表中的数据是两个事件的频数
(
B.独立性检验得到的结论一定正确
C.样本不同,独立性检验的结论可能有
(2)事件A与B的独立性检验无关,即两
差异
个事件互不影响.
(
(3)^{②}的大小是判断事件A与B是否相关
D.独立性检验不是判定两个分类变量是
的统计量.
否相关的唯一方法
(4)在独立性检验中,x的值越大,判断事
4.高二第二学期期中考试,按照甲、乙.两个班
-
件A与B有关的把握就越大.
学生的数学成绩优秀和及格统计人数后
2.用等高堆积条形图粗略估计两个分类变量
得到如下列联表
数学成绩
是否相关,观察下列各图,其中两个分类变
班别
优秀
总计
及格
量关系最强的是
(
)
甲班
3
45
22》
乙玳
(
□1
37
45
总计
#
77
90
则随机变量x2的值约为
(
A.0.600
B.0.828
1)
C.2.712
D.6.004
7
。
课堂案·互动探究
关键能力
素养提升
题型一
等高堆积条形图及应用
差别,铅中毒病人与尿棕色素为阳性是否
例
为了解铅中毒病人与尿棕色素为阳性
有关联?
是否有关联,分别对病人组和对照组的尿
[自主解答]
液作尿棕色素定性检查,结果如下
尿棕色素
组别
总计
阳性数
阴性数
7
29
铅中毒病人
36
对照组
28
37
38
35
总计
73
试画出列联表的等高堆积条形图,分析铅
中毒病人和对照组的尿棕色素阳性数有无
71
·数学·选择性必修 第三册(配RJA版)
规律万法
题型二 两个分类变量无关联的独立性检验
在等高条形图中,可以估计满足条件X一x.的
例
有关研究表明,正确佩戴安全头盎,规
个体中具有Y一y:的个体所占的比例a
烈#也可以
范使用安全带能够将交通事故死亡风险大
幅降低,对保护群众生命安全具有重要作
估计满足条件X一x。的个体中具有Y一y.的个体
用,某市针对电动自行车骑乘人员是否佩
戴安全头奋问题进行调查,在随机调查的
有关联成立的可能性就越大,
1000名骑行人员中,年龄低于40岁的占
[触类旁通]
60%,记录其年龄和是否佩戴头奋情况,得
1.网络对现代人的生活影响较大,尤其是对
到2×2列联表如表所示
青少年,为了解网络对中学生学习成绩的
头盛
年龄
影响,某地区教育主管部门从辖区初中生
合计
佩戴
未佩戴
中随机抽取了1000人调查,发现其中经常
低于40岁
540
上网的有200人,这200人中有80人期末
不低于40岁
考试不及格,而另外800人中有120人不
合计
880
1000
及格,利用图形判断学生经常上网与学习
成绩有关联吗?
(1)完成上面的列联表;
(2)依据小概率值g一0.01的独立性检验;
能否认为遵守佩戴安全头与年龄有关?
n(ad-bc)2
附:x2}-
(a+b)(c十d)(十c)(6十d),其中
n-atbtctd
0.050
0.010
0.001
3.841
6.635
).
10.828
[自主解答]
72
第八章 成对数据的统计分析·
规律万法
[自主解答]
根据题意列出2×2列联表,计算x^{②}的值,如
果x^{}的值很大,说明两个事件有关的可能性很大;
如果v的值比较小,则认为没有充分的证据显示
两个事件有关,这需要给出正确的计算,避免计算
过失误。
[触类旁通]
2.考察棉花种子经过处理跟生病之间的关系
得到下表数据;
生病
种子
总计
情况
种子处理
种子未处理
得病
32
101
133
61
不得病
213
274
总计
314
407
。
根据以上数据,依据小概率值a一0.1的独
立性检验,可得出
)
A.种子是否经过处理跟是否生病有关联
B.种子是否经过处理跟是否生病无关联
C.种子是否经过处理决定是否生病
D. 以上都是错误的
题型三 两个分类变量有关联的独立性检验
例
某省进行高中新课程改革已经四年
了,为了解教师对新课程教学模式的使用
情况,某一教育机构对某学校的教师关于
新课程教学模式的使用情况进行了问卷调
查,共调查了50人,其中有老教师20人
[素养聚焦]解决此类问题的难点在于运算,所以
青年教师30人,老教师对新课程教学模式
在解题过程中重点培养数学运算核心素养
赞同的有10人,不赞同的有10人;青年教
规律万法
师对新课程教学模式赞同的有24人,不赞
n(ad-bc)2}
同的有6人.
(1)先利用x*一
(ab)(c十d)(a)(6+d)#求出
(1)根据以上数据建立一个列联表
x{}的值,再利用小概率值a以及对应的临界值来
(2)依据小概率值g三0.05,能否推断青年
判断有多大的把握判断两个事件有关,
教师和老教师在新课程教学模式的使用上
(2)解题时应注意准确代数与计算,不可错用公式,
有差异?
准确进行比较与判断.
73
·数学·选择性必修 第三册(配RJA版)
[触类旁通]
(3)根据(2)中的列联表,判断是否有99%
3.为加强环境保护,治理空气污染,环境监测
的把握认为该市一天空气中PM。:浓度与
部门对某市空气质量进行调研,随机抽查
SO。浓度有关?
了100天空气中的PM。。和SO。浓度(单
n(ad-bc)2
附:x2-
(a十b)(c十d)(a十c)(b十d)'
位:g/m),得下表;
P(二x。)
0.050
0.010
SO.
0.001
[0,50]
(50,150]
(150,475]
3.841
6.635
2.
PM。.
10.828
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM-浓度
不超过75,且SO。浓度不超过150”的
概率;
课堂小结
(2)根据所给数据,完成下面的2×2列
知识落实
联表:
技法强化
SO
1.分类变量.
[0.150]
(150,475]
解题时常出现对独立性
PM。
2.2×2列联表.
检验的原理不理解,导
3.等高堆积条形图.
致不会用x分析问题
[0.75]
4.独立性检验,公式
(75,115]
请完成(课后案1学业评价(二十)
提示
阶段测评(三)
章末整合提升
知识网络
相关关系:利用散点图观察
一元线性回归模型
成对数据的
经验回归方程
统计相关性
非线性回归模型。
残差图
回归分析
成对数据的
残差平方和
统计分析
和关系数
分类变量
独立性检验
直观判定两个变量的和关关系
列联表、等高条形图
精确检验两个分类变量
独立性检验的基本原理
74