内容正文:
3.1 独立性检验
高中数学 选修2-2
分类变量的取值可以用____ _表示.
知识点一 分类变量
实数
对于性别变量,其取值为男和女两种.
♂
♀
这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
生活中的分类变量
是否吸烟,宗教信仰,国籍…
两个分类变量之间是否有关系
性别
是否喜欢数学课程
吸烟
患肺癌
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965个成年人,得到如下结果(单位:人)
患肺癌 不患肺癌 总计
吸烟 49 2099 2148
不吸烟 42 7775 7817
总计 91 9874 9965
那么吸烟是否对肺癌有影响?
吸烟与患肺癌列联表
列出两个分类变量的频数表,称为列联表
知识点二 2×2列联表
1.2×2列联表给出了成对分类变量数据的 .
2.定义一对分类变量X和Y,我们整理数据如下表所示:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
像这种形式的数据统计表称为2×2列联表.
交叉分类频数
患肺癌 不患肺癌 总计
吸烟 49 2099 2148
不吸烟 42 7775 7817
总计 91 9874 9965
吸烟者与不吸烟者患肺癌的可能性存在差异
一、等高堆积条形图的应用
等高堆积条形图的优劣点:
(2)劣点:不能给出推断“两个分类变量有关系”犯错误的概率.
从上面数据和图形可以看出吸烟和患肺癌有关
从上面数据和图形可以看出吸烟和患肺癌有关
事实确是如此!
我们能够有多大的把握认为“吸烟与患肺癌有关”?
吸烟
患肺癌
若将事件“某成年人吸烟”记为 ,将事件“某成年人患肺癌”记为 ,则事件“某成年人不吸烟”为 ,事件“某成年人不患肺癌”记为 ,这样回答“患肺癌与吸烟是否有关?
其实就是需要回答“事件 与事件 是否独立?
吸烟与患肺癌列联表
患肺癌 不患肺癌 总计
吸烟 a b a+b
不吸烟 c d c+d
总计 a+c b+d a+b+c+d
假设
H0:吸烟与患肺癌没有关系
P(AB)=P(A)P(B)
假设H0:吸烟和患肺癌之间没有关系
吸烟且患肺癌人数
吸烟但未患肺癌人数