内容正文:
4.3.2 独立性检验
新授课
本题中要得P(A),P(B), P(AB)的准确值需耗费巨大的人力、物力等,比较难确定,甚至是不可能的.
P(AB)=P(A)P(B)
任意抽取某市的一名学生,记A:喜欢长跑,B:是女生.
如果事件A,B独立,P(A),P(B), P(AB)满足的充要条件是什么?
P(A),P(B),P(AB)的准确值易得吗?
如何判断A、B是否独立?
1.通过实例理解2×2列联表的统计意义.
2.了解2×2列联表独立性检验及其应用.
新课讲授
学习目标
课堂总结
因为这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表.
通过调查,我们获取了下述数据:抽查了110人,其中女生有50人;且这110人中,喜欢长跑的有60人,其中女生有20人.
将数据整理成如下表格形式.
喜欢长跑 不喜欢长跑 总计
女 20 30 50
男 40 20 60
总计 60 50 110
新课讲授
学习目标
课堂总结
喜欢长跑 不喜欢长跑 总计
女 20 30 50
男 40 20 60
总计 60 50 110
喜欢长跑的概率P(A)可以估计为
是女生的概率P(B)可以估计
喜欢长跑且是女生的概率P(AB)可以估计为
由2×2列联表可知:
新课讲授
学习目标
课堂总结
因为P(A),P(B),P(AB)都是根据样本数据得到的估计值,而估计是有误差的,因此直接用是否成立来判断A与B是否独立是不合理的.
思考:由上表可得P(A),P(B),P(AB)的估计值,此时可以用P(AB) =P(A)P(B)
是否成立来判断A与B是否独立吗?为什么?
如果A与B独立,那么P(A)P(B)应该可以作为P(AB)的近似值,这是从统
计意义上做出的合理推断,即尽管随机性会对数据的准确性带来影响,但
理论上,如果A与B是独立的,则这种影响也一定不会太大.
新课讲授
学习目标
课堂总结
因此从理论上可知,如果A,B独立,喜欢长跑的女生数可以估计为
110P(A)P(B)
而实际上,喜欢长跑的女生数为 110P(AB),
不会太大.
①
因此
②
③
④
不会太大.
类似地,考虑与B,A与与,可知
新课讲授
学习目标
课堂总结
若记①+②+③+④=χ2(读作“卡方”),代入数据算得χ2=7.8.
概率学上可以证明,如果A与B独立,则χ2≥6.635的概率只有1%,即P(χ2≥6.635)=1%.
因为χ2=7.8>6.635,所以若A与B独立(即“喜欢长跑”与“是女生”独立),则此事件的概率不超过1%.
即:在犯错误的概率不超过1%的前提下,可以认为“喜欢长跑”与“是女生”不独立(也称为是否喜欢长跑与性别有关);或说有99%的把握认为是否喜欢长跑与性别有关.
新课讲授
学习目标
课堂总结
一般情况下,如果随机事件A与B的样本数据的2×2列联表如下
A 合计
B a b a+b
c d c+d
合计 a+c b+d a+b+c+d
记n=a+b+c+d,则由表可知:
(1) (2) (3)
独立性检验
概念生成
新课讲授
学习目标
课堂总结
此时P(AB)与P(A)P(B)的估计值相差不大,因此
不会太大.
类似地,考虑与B,A与与,可知
都不会太大,
也不会太大.
因此这四个数的和
提出假设H0:A与B独立.
新课讲授
学习目标
课堂总结
另外,任意给定一个α(称为显著性水平,通常取为0.05,0.01等),可以找到满足条件
的数k(称为显著性水平α对应的分位数).
若χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称为A与B有关);或说有1-α的把握认为A与B有关.即假设H0不成立.
若χ2<k成立,就称不能得到前述结论.
这一过程通常称为独立性检验.
P(χ2≥k)=α
新课讲授
学习目标
课堂总结
反证法 独立性检验
要证明结论A
在A不成立的前提下进行推理
推出矛盾,意味着结论A成立
没有找到矛盾,不能
对A下任何结论.
归纳总结
提出假设H0
在H0成立的条件下进行推理
与H0相矛盾的小概率事件发生,意味着H0不成立
H0相矛盾的小概率事件没有发生,接受原假设.
新课讲授
学习目标
课堂总结
A与B独立时,也称为A与B无关.当χ2<k成立时,一般不直接说A与B无关,
独立性检验得到的结果
或者是有1-α