内容正文:
独立性检验
设A,B为两个事件,若P(AB)=P(A)P(B) , 则称事件A与事件B相互独立。
即一个事件的发生与否对另一个事件发生的概率没有影响。
(1)相互独立事件:
一、复习回顾
(2)相互独立事件的性质
探究!为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
在不吸烟样本中,患肺癌的频率是
在吸烟样本中,患肺癌的频率是
不患肺癌 患肺癌 总计
不吸烟 7775 42 7817
吸烟 2099 49 2148
总计 9874 91 9965
吸烟与患肺癌列联表
那么吸烟是否对患肺癌有影响?
像这样,列出两个变量的频数表,称为列联表.
二、列联表与等高条形图
探究!为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
在不吸烟样本中,患肺癌的频率是0.54% ,
在吸烟样本中,患肺癌的频率是2.28% .
因此,直观上可以得到结论:吸烟群体和不吸烟群体患肺癌的可能性存在差异 .
不患肺癌 患肺癌 总计
不吸烟 7775 42 7817
吸烟 2099 49 2148
总计 9874 91 9965
吸烟与患肺癌列联表
那么吸烟是否对患肺癌有影响?
与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.
右图就是一个
等高条形图,其中
两个浅色条的高分
别表示不吸烟和吸
烟样本中不患肺癌
的频率;两个深色
条的高分别表示不
吸烟和吸烟样本中
患肺癌的频率.
比较两个深色条的高可以发现,在吸烟样本中患肺癌的频率要高一些,因此,直观上可以认为吸烟更容易引发肺癌.
通过数据和图形分析,我们得到的直观判断是“吸烟和患肺癌有关”,这种判断是否可靠呢?我们通过统计分析回答这个问题。
为了回答上述问题,我们先假设:
H0:吸烟与患肺癌没有关系.
用A表示不吸烟,B表示不患肺癌,