内容正文:
§2.2 独立性检验
第1章:统计案例
问题1:吸烟与患肺癌是否有关?
01 新课引入
问题2:如何研究吸烟与患肺癌是否有关?
也称分类变量,这种量既无等级关系,也无数量关系,如是否吸烟,是否患肺癌、宗教信仰、国别、性别、年龄、出生月份、天气、职业、产品的型号等等。
常见变量
也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。
定量变量:
定性变量:
这种量并非真有数量上的变化,而只有性质上的差异。
没有数量关系,只有次序关系,如某种产品分为一等品、二等品、三等品等,矿石的质量分为贫矿和富矿;
有序变量:
名义变量:
02 新课讲授
本节重点:研究“两个分类变量的独立性检验”问题。
02 新课讲授
问题3:如何研究两个变量的相关关系?
定量变量:利用回归分析,如画散点图、求相关系数r、
相关指数R2、曲线拟合等等。
分类变量:独立性检验。
问题4:如果要研究吸烟与患肺癌是否有关,我们需要什么数据?可否将想要的数据列成表格便于查看?得到数据后又该如何对数据进行分析?
02 新课讲授
02 新课讲授
问题5:为了调查吸烟与患肺癌是否有关,某机构随机调查了6578人,其中吸烟且患肺癌的有56人,吸烟但不患肺癌的有1932人,不吸烟但患肺癌的有23人,不吸烟且不患肺癌的有4567人,请根据所学知识判断患肺癌跟吸烟是否有关?
吸烟与患肺癌频数表
在统计中,这种两个分类变量的频数表称为
2×2列联表
问题6:根据以上表格。能否判断吸烟对患肺癌有关?判断的标准是什么?吸烟与不吸烟,患肺癌的可能性的大小是否有差异?
患肺癌情况 患肺癌 患肺癌
吸烟情况
吸烟 56 1932
不吸烟 23 4567
02 新课讲授
患肺癌情况 患肺癌 患肺癌
吸烟情况
吸烟 56 1932
不吸烟 23 4567
如何根据表格中的数据来判断吸烟与患肺癌是否独立,这一问题称为2×2列联表的独立性检验。
为了讨论的方便,我们引入以下记号
变量A:A1=吸烟, A2==不吸烟;
变量B:B1=患肺癌, B2= =未患肺癌。
患肺癌情况 患肺癌B1 患肺癌B2
吸烟情况