内容正文:
4.3.2 独立性检验
[课标解读]1.理解独立性检验的基本思想及其实施步骤.2.能利用列联表探讨两个分类变量的关系.3.了解χ2的含义及其应用.4.通过对数据的处理,来提高解决实际问题的能力.
知识点一 2×2列联表
1.2×2列联表的概念:
将随机事件A,B的样本数据整理成如下的表格
A
总计
B
a
b
a+b
c
d
c+d
总计
a+c
b+d
a+b+c+d
上面这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表
2.列联表的统计意义:
记n=a+b+c+d,则由上表可知:
(1)事件A发生的概率可估计为P(A)=;
(2)事件B发生的概率可估计为P(B)=;
(3)事件AB发生的概率可估计为P(AB)=.
其他事件的概率类似可求.
(1)2×2列联表主要用于研究两个事件之间是相互独立的还是存在某种关联性,它适用于分析两个事件之间的关系;
(2)因为P(A),P(B),P(AB)都是根据样本数据得到的估计值,而估计是有误差的,因此直接用P(AB)=P(A)P(B)是否成立来判断A与B是否独立是不合理的.
知识点二 独立性检验
1.χ2(读作“卡方”)统计量:是统计中一个非常有用的统计量,它的表达式是
χ2=.
2.独立性检验:任意给定一个α(称为显著性水平,通常取为0.05,0.01等),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数).χ2是一个随机变量,其分布能够求出,上面的概率是可以计算的.因此,如果根据样本数据算出χ2的值后,发现χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称为A与B有关);或说有1-α的把握认为A与B有关.若χ2<k成立,就称不能得到前述结论.这一过程通常称为独立性检验.
[警示] A与B独立时,也称为A与B无关.当χ2<k成立时,一般不直接说A与B无关.也就是说,独立性检验通常得到的结果,或者是有1-α的把握认为A与B有关,或者没有1-α的把握认为A与B有关.
[知识拓展]
(1)独立性检验的基本思想:独立性检验的基本思想类似于反证法,要判断“两个分类变量有关系”,首先假设结论不成立,即“H0:两个分类变量没有关系”成立.在该假设下所构造的随机变量χ2应该很小.如果由观测数据计算得到的χ2很大,则断言H0不成立,即认为“两个分类变量有关系”;如果χ2很小,则说明在样本数据中没有发现足够证据拒绝H0.
(2)独立性检验与反证法的比较
反证法原理
在假设H0下,如果推出一个矛盾,就证明了H0不成立
独立性检验原理
在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错的概率不超过这个小概率
3.常用的显著性水平α以及对应的分位数k对照表
α=P(χ2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
1.为调查乘客晕车情况,在某一次行程中,50名男乘客中有25名晕车,30名女乘客中有5名晕车.在检验这些乘客晕车是否与性别相关时,常采用的数据分析方法是( )
A.回归分析 B.独立性检验
C.频率分布直方图 D.用样本估计总体
B [根据题意,结合题目中的数据,可列2×2列联表,
求观测值χ2,对照临界值得出概率结论;
这种数据分析的方法是独立性检验.]
2.下表是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
100
则表中a、b处的值分别为( )
A.94,96 B.52,50
C.52,54 D.54,52
C [由得]
3.(多选)以下关于独立性检验的说法中,正确的是( )
A.独立性检验依赖于小概率原理
B.独立性检验得到的结论一定准确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判断两事物是否相关的唯一方法
ACD [根据独立性检验的原理可知,得到的结论是错误的情况是小概率事件,但并不一定是准确的.]
4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2≈27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”或“无关”)
解析: 由χ2≈27.63与临界值比较,我们有99.9%的把握说打鼾与患心脏病有关.
答案: 有关
5.为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得