内容正文:
§2 独立性检验
自主整理
1.设A,B为两个变量,每一个变量都可以取两个值,
变量A:A1,A2=1;
变量B:B1,B2=1.
通过观察得到下表所示数据:
A
B
B1
B2
总计
A1
a
A2
总计
其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.
设n=a+b+c+d,用_______________估计P(A1B1), ______________估计P(A1), __________估计P(B1).
若有式子
,
则可以认为______________独立.
同理,若,则可以认为______________独立;若,则可以认为______________独立;若,则可以认为______________独立.
但是,在中,由于表示的是______________,不同于概率,即使变量之间独立,式子两边也不一定恰好相等.但是当两边相差______________时,变量之间就不独立.
2.选取χ2作统计量,用它的大小来检验变量之间是否独立.
χ2=______________________________________________________________________
当数据量较大时,在统计中,用以下结果对变量的独立性进行判断.
(1)当χ2≤______________时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;
(2)当χ2>______________时,有90%的把握判定变量A,B有关联;
(3)当χ2>______________时,有95%的把握判定变量A,B有关联;
(4)当χ2>______________时,有99%的把握判定变量A,B有关联.
高手笔记
1.独立性检验的基本思想
先假设两个分类变量X与Y无关系,即X与Y相互独立,计算χ2的观测值k,把k与临界值进行比较,可以判断X与Y有关系的程度及无关系.在该假设下,构造的随机变量χ2应该很小,如果实际计算出的χ2的观测值很大,则在一定程度上说明假设不合理,根据χ2的含义可以利用统计估算出概率P(χ2≥6.