内容正文:
1.1 独立性检验
互动课堂
疏导引导
1.独立性检验的基本思想
独立性检验的基本思想类似于数学上的反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量χ2应该很小,如果由观测数据求得的x2的值很大,则在一定程度上说明假设不合理.然后根据随机变量x2的含义,通过查阅P-值的估计表来评价假设不合理的程度,即“两个分类变量有关系”成立的可信程度.
2.检验两个分类变量是否相关的方法主要是三维柱形图法和二维条形图法及独立性检验法.
基本步骤为:
(1)找相关数据,作列联表;
(2)画三维柱形图;
(3)求χ2=的值;
(4)判断可能性.
3.独立性检验的应用
独立性检验实际上是检验两个分类变量是否相关,相关的程度有多大.其应用过程如下:
由公式χ2=(n=a+b+c+d),
根据观测数据计算出χ2的值,其值越大,说明“x与y有关系”成立的可能性越大;在假设x与y没有关系的前提下,可以通过查阅书中表格得到P-值的估计,从而得到两变量相关的程度.
案例 某聋哑研究机构,对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑.你能运用这组数据,得出相应结论吗?认真分析后,我们就是要在聋与哑有无关系上作出结论.于是运用独立性检验进行判断.
【探究】根据题目所给数据得到如下列联表
哑
不 哑
总 计
聋
416
241
657
不 聋
249
431
680
总 计
665
672
1 337
根据列联表中数据得到:
χ2=≈95.29>10.828,
所以我们有99.9%的把握说聋哑有关系.
另外,本问题也可以三维柱形图粗略估计,相应三维柱图形如图
比较来说,底面副对角线两个柱体高度的乘积大些,可以在某种程度上认为聋与哑有关.
规律总结
一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样品频数列联表为
y1
y2
总 计
x1
a
b
a+b
x1
c
d
c+d
总 计
a+c
b+d
a+b+c+d
若要推断的论述为:H1:“X与Y有关系”