内容正文:
第三章 统计案例
3.2 独立性检验的基本思想及其
初步应用
一 新课引入
变量:
是否吸烟
取值:
吸烟和不吸烟
是否健康
健康和不健康
性别
男和女
像这样的,变量的不同“值”表示个体所属的不同类别称为分类变量.
独立性检验
本节研究的是两个分类变量的独立性检验问题。
在日常生活中,我们常常关心分类变量之间是否有关系:
例如,吸烟是否与患肺癌有关系?
性别是否对于喜欢数学课程有影响?等等。
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
列联表
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。
0.54%
2.28%
探究
吸烟与肺癌列联表
不患肺癌 患肺癌 总计
不吸烟 7775 42 7817
吸烟 2099 49 2148
总计 9874 91 9965
在不吸烟者中患肺癌的比重是
在吸烟者中患肺癌的比重是
下图称为三维柱形图,它可以直观反映上述列联表中各个频数的相对大小.
Chart1
不患肺癌 不患肺癌
患肺癌 患肺癌
吸烟
不吸烟
2099
7775
49
42
Sheet1
不患肺癌 患肺癌
吸烟 2099 49
不吸烟 7775 42
Sheet1
0 0
0 0
吸烟
不吸烟
Sheet2
Sheet3
下图称为二维条形图,它可直观反映吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例,其中浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数.
为了更清晰地表达上述特征,还可以用如下等高条形图表示两种情况下患肺癌的比例,其中浅色条高表示不患肺癌的百分比,深色条高表示患肺癌的百分比.
上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢?这需要用统计观点来考察这个问题。
现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”,
为此先假设
H0:吸烟与患肺癌没有关系.
用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即