内容正文:
高二数学选修1-2第一章独立性检验学案2
1、 复习回顾:
1.A、B相互独立:
2.在
列联表中,
统计量的计算公式为
=__________________________________,
二、典例分析:
例3: 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
又发作过心脏病
未发作过心脏病
合计
心脏搭桥手术
39
157
196
血管清障手术
29
167
196
合计
68[来源:学科网]
324
392[来源:Zxxk.Com]
试根据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。
例4.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得的数据如下表所示:
积极支持企业改革
不太赞成企业改革
合计
工作积极
54
40
94
工作一般
32
63[来源:Zxxk.Com]
95
合计
86
103
189
对于人力资源部的研究项目,根据上述数据能得出什么结论?
三、当堂检测:
4、在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?
未感冒
感冒
合计
使用血清
258
242
500
未使用血清
216
284
500
合计
474
526
1000
[来源:学科网ZXXK]
四、课后练习:教材第8页3、4题
$$
例2.某医疗机构为了了解患慢性支气管炎与吸烟是否有关,进行了一次抽样调查,共调查了339名50岁以上的人,其中吸烟者205人,不吸烟者134人.调查结果是:吸烟的205人中有43人患呼吸道疾病(简称患病),162人未患呼吸道疾病(简称未患病);不吸烟的134人中有13人患病,121人未患病.问题:根据这些数据能否断定“患慢性支气管炎与吸烟有关”?
(1)为了研究这个问题,将上述数据用下表来表示:
(2)估计吸烟者与不吸烟者患病的可能性差异:
在吸烟的人中,有 的人患病,
患病 未患病 合计
吸烟 43 162 205
不吸烟 13 121 134
合计 56 283 339
在不吸烟的人中,有 的人患病.
问题:由上述结论能否得出患病与吸烟有关?把握有多大?
(1)假设:患病与吸烟没有关系.
若将表中“观测值”用字母表示,则得下列2×2列联表:
不吸烟(
患病(B) 未患病
( ) 合计
吸烟A n11 n12 n1+
不吸烟 n21 n22 n2+
合计 n+1 n+2 n
上面的话的意思是指事件A与B独立,这时应该有P(AB)=P(A)P(B)成立,
我们用H0表示上式,即H0:P(AB)=P(A) P(B). 并称之为统计假设,当H0成立时,下面的三个式子也成立:
卡方χ2统计量公式:
用它的大小可以决定是否拒绝原来的统计假设H0,如果算出的χ2值较大,就拒绝H0,也就是拒绝“事件A与事件B无关”,从而就认为它们是有关的了
(3)两个临界值:3.841与6.635.
经过对χ2统计量分布的研究,已经得到了两个临界值:3.841与6.635。
当根据具体的数据算出的χ2>3.841时,有95%的把握说事件A与事件B有关;
当χ2>6.635时,有99%的把握说事件A与事件B有关;
当χ2<3.841时,认为事件A与事件B无关;
象以上这种用χ2统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.
对于例2,最理想的解决办法是向所有的50岁以上的人作调查,然后对所得的数据进行统计处理,但这花费的代价太大,实际上也是行不通的。339个人相对于全体50岁以上的人,只是一小部分回忆一下数学必修3中学过的总体与样本的关系,
当用样本平均数,样本标准差去估计总体的相应的数字特征时,由于抽样的随机性,结果并不惟一。现在的情况类似,我们用部分对全体作推断,推断可能正确,也可能错误,例如我们知道,不少的中老年烟民的身体很好,没有患慢性支气管炎;而又有很多的从不吸烟的中老年人体质很差,患有慢性支气管炎。如果抽取的339个调查对象中很多人来自上述两个群体,
试想会得出什么结论吧。我们说有95%(或99%)的把握说事件A与事件B有关,是指推断犯错误的可能性为5%(或1%),这也是常常说成是“有95%(或99%)的概率”,其含义是一样的。
解:由公式
因为7.469>6.6