内容正文:
8.3 列联表与独立性检验
第八章 成对数据的统计分析
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
课前 预习学案
01
课堂 互动学案
02
课后 素养提升
03
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
课前 预习学案
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
课堂 互动学案
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
课时作业
点击进入WORD链接
下一页
上一页
返回导航
第八章 成对数据的统计相关性
数学 选择性必修 第三册
课程标准
素养解读
1.通过实例,理解2×2列联表的统计意义
2.通过实例,了解2×2列联表独立性检验及其应用
1.通过2×2列联表统计意义的学习,体会数学抽象的素养
2.借助χ2计算公式进行独立性检验,培养数学运算和数据分析的素养
[知识梳理]
[知识点一] 分类变量
用来区别不同的现象或性质的随机变量,其取值可以用实数表示.
A
eq \o(A,\s\up16(-))
合计
B
a
b
a+b
eq \o(B,\s\up16(-))
c
d
c+d
合计
a+c
b+d
a+b+c+d
[知识点二] 2×2列联表及随机事件的概率
1.2×2列联表:如果随机事件X与Y的样本数据如下面表格形式:
X
Y
合计
Y=0
Y=1
X=0
A
B
a+b
X=1
C
D
c+d
合计
a+c
b+d
n=a+b+c+d
在这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表.
2.2×2列联表中随机事件的概率;
如上表,记n=a+b+c+d,则
事件{Y=0}发生的概率可估计为 P(Y=0)=eq \f(a+c,n) ;
事件{X=1}发生的概率可估计为 P(X=1)=eq \f(c+d,n) ;
事件{X=1,Y=0}发生的概率可估计为 P(X=1,Y=0)=eq \f(c,n) ;
事件{X=1|Y=0}发生的概率可估计为
P(X=1|Y=0)=eq \f(c,a+c) .
[知识点三] 独立性检验
1.分类变量X和Y独立:如果这些性质成立,
{X=0}与{Y=0}独立;{X=0}与{Y=1}独立;
{X=1}与{Y=0}独立;{X=1}与{Y=1}独立.
我们就称X与Y独立.
2.零假设:设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互为对立事件,故要判断事件{X=1}和{Y=1}之间是否有关联,需要判断假定关系 H0:P(Y=1|X=0)=P(Y=1|X=1) 是否成立.通常称H0为零假设.
3.独立性检验:利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验.
4.公式:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d为样本容量.
5.对照表及检验规则:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
独立性检验与反证法有什么相似之处?
提示:独立性检验的基本思想与反证法的思想的相似之处
反证法
独立性检验
要证明结论A
要确认“两个分类变量有关系”
在A不成立的前提下进行推理
假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下计算χ2
[预习自测]
1.判断正误(正确的打“√”,错误的打“×”).
(1)列联表中的数据是两个分类变量的频数.( √ )
(2)若对两个分类变量X、Y进行独立性检验后判定二者无关,则一定说明X、Y互不影响.( × )
(3)χ2的大小是判断事件A与B是否相关的统计量.( √ )
2.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A与B有关系”( )
A.χ2=2.700
B.χ2=2.710
C.χ2=3.765
D.χ2=5.014
解析:D [∵5.014>3.841,故D正确.]
3.(双空题)下面是2×2列联表.
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
则表中a= ________ ,b= ________ .
解析:a=73-21=52,b=a+2=52+2=54.
答案:52 54
列联表与等高条形图
[例1]某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.
(1)根据以上数据,作出考前心情与性格的列联表,并求性格外向的学生中考前心情紧张的概率.
(2)作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.
[思路点拨] 根据2×2列联表的特点作表.
解:(1)作列联表如下:
心情
性格
合计
性格内向
性格外向
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1 020
由列联表中数据可得,性格外向的学生中考前心情紧张的概率为eq \f(213,594)=eq \f(71,198)
(2)相应的等高条形图如图所示.
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数所占的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.
1.做2×2列联表的关注点
(1)做2×2列联表时,注意应该是4行4列,计算时要准确无误.
(2)在2×2列联表中,对涉及的变量要分清类别.
2.利用等高条形图判断两个分类变量是否相关的步骤
[变式训练]
1.网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人进行调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形来判断学生经常上网与学习成绩是否有关?
解:根据题目所给的数据得到如下2×2列联表.
成绩
上网
合计
经常上网
不经常上网
不及格
80
120
200
及格
120
680
800
合计
200
800
1 000
得出等高条形图如图所示:
比较图中阴影部分的高可以发现经常上网不及格的频率明显高于不经常上网及格的频率,因此可以认为经常上网与学习成绩有关.
由χ2进行独立性检验
[例2] 为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:
是否需要
志愿者
性别
合计
男
女
需要
40
30
70
不需要
160
270
430
合计
200
300
500
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者帮助与性别有关?
[思路点拨] 独立性检验可以通过2×2列联表计算χ2的值,然后与临界值对照作出判断.
解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此在该地区老年人中,需要帮助的老年人的比例的估计值为eq \f(70,500)×100%=14%.
(2)χ2=eq \f(500×40×270-30×1602,200×300×70×430)≈9.967.
因为9.967>6.635,所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.
独立性检验的具体做法
1.根据实际问题的需要确定允许推断“事件A与B有关系”犯错误的概率的上界α,然后查表确定临界值xα.
2.利用公式χ2=eq \f(nad-bc2,a+bc+da+cb+d)计算随机变量χ2.
3.如果χ2≥xα推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
[变式训练]
2.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.
使用血
清情况
感冒情况
合计
未感冒
感冒
使用血清
258
242
500
未使用血清
216
284
500
合计
474
526
1000
解:假设感冒与是否使用该种血清没有关系.
由列联表中的数据,求得
χ2=eq \f(1 000×258×284-242×2162,474×526×500×500)≈7.075.
χ2=7.075>6.635,P(χ2≥6.635)=0.01,
故在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.
独立性检验的综合应用
[例3] 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,得到了如下的2×2列联表:
性别
打篮球
合计
喜爱
不喜爱
男生
6
女生
10
合计
48
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为eq \f(2,3).
(1)请将上面的2×2列联表补充完整(不用写计算过程);
(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.
[思路点拨] 1.由古典概型的概率求得2×2列联表.
2.计算χ2,判断P(χ2>3.841)=0.05是否成立.
3.结合超几何分布求解.
解:(1)列联表如下:
性别
打篮球
合计
喜爱
不喜爱
男生
22
6
28
女生
10
10
20
合计
32
16
48
(2)零假设H0,假设是否喜爱打篮球与性别无关
χ2=eq \f(48×220-602,28×20×32×16)≈4.286.
因为4.286>3.841,所以能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关.
(3)喜爱打篮球的女生人数X的可能取值为0,1,2.其概率分别为P(X=0)=eq \f(C\o\al(2,10),C\o\al(2,20))=eq \f(9,38),P(X=1)=eq \f(C\o\al(1,10)C\o\al(1,10),C\o\al(2,20))=eq \f(10,19),P(X=2)=eq \f(C\o\al(2,10),C\o\al(2,20))=eq \f(9,38),
故X的分布列为
X
0
1
2
P
eq \f(9,38)
eq \f(10,19)
eq \f(9,38)
X的均值为E(X)=0+eq \f(10,19)+eq \f(9,19)=1.
1.解决独立性检验问题的基本步骤
2.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质.因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.
[变式训练]
3.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
机床
级品
合计
一级品
二级品
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
解:(1)设甲机床、乙机床生产的产品中一级品的频率分别为P1、P2,则P1=eq \f(150,200)=0.75,P2=eq \f(120,200)=0.6;
(2)零假设H0,假设甲机床的产品质量与乙机床的产品质量无差异.根据列联表中数据,可得χ2的值为
χ2=eq \f(400×150×80-120×502,200×200×270×130)=eq \f(400,39)≈10.256.
∵10.256>6.635,∴有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.
[当堂达标]
1.利用独立性检验来考查两个变量A,B是否有关系,当随机变χ2的值( )
A.越大,“A与B有关系”成立的可能性越大
B.越大,“A与B有关系”成立的可能性越小
C.越小,“A与B有关系”成立的可能性越大
D.与“A与B有关系”成立的可能性无关
解析:A [用独立性检验来考查两个分类变量是否有关系时,算出的随机变量χ2的值越大,说明“A与B有关系”成立的可能性越大,由此可知A正确.故选A.]
2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得到“吸烟与患肺癌有关系”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )
A.100个吸烟者中至少有99人患肺癌
B.1个人吸烟,那么这个人有99%的概率患有肺癌
C.在100个吸烟者中一定有患有肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
解析:D [独立性检验的结论是一个数学统计量,它与实际问题中的确定性是存在差异的.]
3.某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的eq \f(4,5),女生喜欢网络游戏的人数占女生人数的eq \f(3,5).若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有 _________ 人.(请将所有可能的结果都填在横线上)
附表:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
α
0.050
0.010
xα
3.841
6.635
解析:设男生有x人,由题意可得2×2列联表如下,
喜欢
不喜欢
合计
男生
eq \f(4,5)x
eq \f(1,5)x
x
女生
eq \f(3,5)x
eq \f(2,5)x
x
合计
eq \f(7,5)x
eq \f(3,5)x
2x
若认为喜欢网络游戏和性别有关,且该推断犯错误的概率超过0.01但不超过0.05,则3.841<χ2<6.635.
∵χ2=eq \f(2x\f(4,5)x·\f(2,5)x-\f(1,5)x·\f(3,5)x2,\f(7,5)x·\f(3,5)x·x·x)=eq \f(2,21)x,
∴3.841<eq \f(2,21)x<6.635,解得40.3<x<69.7,
又x为5的整数倍,∴被调查的学生中男生可能人数为45,50,55,60,65.
答案:45,50,55,60,65.
4.若由一个2×2列联表中的数据计算得χ2=8.013,那么是否有99.5%的把握认为两个随机事件之间有关系: ________ .(填“是”或“否”)
解析:因为χ2=8.013>7.879=x0.005,查阅χ2表知有99.5%的把握认为两个随机事件之间有关系.
答案:是
5.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2列联表;
(2)判断性别与休闲方式是否有关系.
解:(1)列表如下:
性别
休闲方式
合计
看电视
运动
女
43
27
70
男
21
33
54
合计
64
60
124
(2)χ2=eq \f(124×43×33-27×212,70×54×64×60)≈6.201,
∵χ2>3.841且χ2<6.635,
∴有95%的把握认为性别与休闲方式有关.
$