内容正文:
4.3 独立性检验 第一课时
感谢您下载平台上提供的PPT作品,为了您和以及原创作者的利益,请勿复制、传播、销售,否则将承担法律责任!将对作品进行维权,按照传播下载次数进行十倍的索取赔偿!
ibaotu.com
自主探究
PART 01
2
患肺癌与吸烟之间是否有关系?
观看吸烟者与不吸烟者肺部对比图
患肺癌与吸烟之间是否有关系?
为了了解患肺癌与吸烟之间的关系,某医疗机构调查了其他条件都基本相同的100个人,调查结果如下表,表中X表示是否吸烟,Y表示是否患肺癌
[定义]像这样,将两个或两个以上分类变量进行交叉分类得到的频数分布表称为列联表,称X,Y为分类变量,其中变量X有两个变量值:吸烟和不吸烟,变量Y有两个变量值—患肺癌和未患肺癌。由于所涉及的两个分类变量X,Y均有两个变量值,所以称其为2乘2列联表
分别计算出吸烟者中与不吸烟者中患肺癌的比例,再根据这个比例画出扇形统计图
由表可以得出,在54个吸烟的人中有39人患肺癌,患者占72.22%,在不吸烟的46人中,有21人患肺癌,患者占45.65%,吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高出约26.57个百分点
由表可以得出,在54个吸烟的人中有39人患肺癌,患者占72.22%,在不吸烟的46人中,有21人患肺癌,患者占45.65%,吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高出约26.57个百分点
这种差异似乎已经说明吸烟与患肺癌有很大关系,但仔细想想,由于这100人是随机选取的,会不会是由于随机抽样的误差,使得所抽取的60名肺癌患者中碰到了较多的吸烟者,因而40名未患肺癌者中碰到了较多的不吸烟者?这样也可能导致吸烟者中患肺癌者的比例比不吸烟者中患肺癌者的比例高
我们还需进一步用统计方法来检验,因为单凭随机抽样的误差可能还不足以造成如此大的差异
为了方便讨论,我们引入以下记号:我们设
我们将上表中数据用字母代替得到如下列联表:
在本案例中
为分析X,Y是否有关系,我们先提出假设H0,X,Y之间没有关系,也就是假设吸烟A与患肺癌B独立,这时A与B独立,与B独立,A与独立,与独立,于是
根据概率与频率的关系
因为假设X,Y独立,所以
从而认为吸烟与患肺癌之间有关系
在本案例中,
统计学家已经有明确的结论:如果2乘以2列联表中的两个分类变量X,Y是独立的,即在H0成立的情况下,且当随机调查的数据a,b,c,d都不小于5时,随机事件 ≥6.635发生的概率约为0.01,即
也就是说,在H0成立的情况下,的观测值≥6.635的概率非常小,近似于0.01,即在H0成立的情况下,观测值超过6.635的概率不大于0.01
在本案例中,有抽样数据所得到的≈7.307>6.635,这表明这一事件发生的概率不大于0.01,这是一个小概率事件.因此,我们有[1-P(6.635]×100%=99%的把握认为H0不成立,于是否定假设H0.
课堂练习
PART 02
感谢您下载平台上提供的PPT作品,为了您和以及原创作者的利益,请勿复制、传播、销售,否则将承担法律责任!将对作品进行维权,按照传播下载次数进行十倍的索取赔偿!
ibaotu.com
例1 研究者发现多看电视易使人变冷漠,下表数据(单位:人)是一个调查机构对此现象的调查结果:
冷 漠 不冷漠 合计
多看电视 68 42 110
少看电视 20 38 58
合计 88 80 168
试根据上述数据判断“多看电视”与“人变冷漠”是否有关系.解 先提出统计假设H₀:多看电视与人变冷漠没有关系.根据列联表中的数据,可以求得
由于11.377>6.635,故否定假设H₀,所以认为多看电视与人变冷漠有关系.
例2,下表是某地区的一种传染病与饮用水的调查表:
得病 不得病 总计
干净水 52 466 518
不干净水 94 218 312
总计 146 684 830
(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本您在反映总体时的差异.
例2,下表是某地区的一种传染病与饮用水的调查表:
得病 不得病 总计
干净水 52 466 518
不干净水 94 218 312
总计 146 684 830
(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本您在反映总体时的差异.
课堂小结
PART 03
我们学到了哪些新的数学知识?
①独立性检验的概念
②运用独立性检验解决实际问题的方法
作业
PART 04
教材P186练习题1,2
谢谢观看
$