内容正文:
8.3.2独立性检验
学习目标
1.通过阅读课本了解独立性检验的思想和方法.
2.能理解统计量的导出和意义.
创设情境,引入课题
星座与考试气运有关系吗?
前面我们通过2×2列联表整理成对分类变量的样本观测数据,并根据随机事件频率的稳定性推断两个分类变量之间是否有关联.
创设情境,引入课题
对于随机样本而言,因为频率具有随机性, 频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算.
创设情境,引入课题
问题1:考虑以为样本空间的古典概型.设和为定义在上,取值于的成对分类变量.我们希望判断事件和之间是否有关联.注意到 和, 和都是互为对立事件,与前面的讨论类似,我们需要判断下面的假定关系
是否成立,通常称为零假设或原假设.
阅读课本P128和P129,为什么说零假设等价于分类变量独立?
探究新知
假定我们通过简单随机抽样得到了和的抽样数据列联表
探究新知
问题2:如何基于②中的四个等式及列联表中的数据,构造适当的统计量,对成对分类变量和是否相互独立作出推断?
探究新知
在零假设成立的条件下,根据频率稳定于概率的原理,由②中的第一个等式,我们可以用概率和对应的频率的乘积估计概率,
事件发生的频数的期望值为
这样,该频数的观测值和期望值应该比较接近.
探究新知
探究新知
探究新知
统计学家建议,用随机变量取值的大小作为判断零假设是否成立的依据,当它比较大时推断 不成立,否则认为 成立.
那么,究竟大到什么程度,可以推断不成立呢?或者说,怎样确定判断大小的标准呢?
探究新知
根据小概率事件在一次试验中不大可能发生的规律,上面的想法可以通过确定一个与相矛盾的小概率事件来实现.
在假定的条件下,对于有放回简单随机抽样,当样本容量狀充分大时,统计学家得到了的近似分布.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得下面关系成立: .
探究新知
13
我们称为的临界值,这个临界值就可作为判断大小的标准.概率值越小,临界值越大.当总体很大时,抽样有、无放回对的分布影响较小.因此,在应用中往往不严格要求抽样必须是有放回的.
探究新知
14
探究新知
15
探究新知
16
例2 依据小概率值的独立性检验,分析例1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异?
例题练习,巩固理解
例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能说明其中的原因吗?
例题练习,巩固理解
例题练习,巩固理解
例3 某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
例题练习,巩固理解
例题练习,巩固理解
在表8.3-5中,若对调两种疗法的位置或对调两种疗效的位置,则表达式 (1)中的赋值都会相应地改变.这样做会影响取值的计算结果吗?
例题练习,巩固理解
例题练习,巩固理解
例题练习,巩固理解
总结提升,形成结构
总结上面的例子,应用独立性检验解决实际问题大致应包括以下几个主要环节:
(1)提出零假设: 和相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较.
(3)根据检验规则得出推断结论.
(4)在和不独立的情况下,根据需要,通过比较相应的频率,分析和间的 影响规律.
思考:独立性检验的思想类似于我们常用的反证法,你能指出二者之间的相同和不同之处吗?
总结提升,形成结构
$