内容正文:
8.3.2 独立性检验
目 录
教材分析
学情分析
教学目标
教学重难点
教学过程
01
02
03
04
05
板书设计
06
2
1
教材分析
3
本课选自高中数学人教A版选择性必修第三册第八章第三课时8.3.2《独立性检验》。
教材地位:承接列联表与频率推断,实现从“频率直观”到“概率严谨”的统计推断进阶
内容核心:独立性检验的思想、步骤及χ²统计量的应用
教材分析
5
目录
2
学情分析
6
已有基础:掌握2×2列联表分析,理解频率的随机性
学习难点:χ²统计量的构造逻辑、小概率α的理解(思维从”逻辑推理“到”概率推理“的过渡)
学情分析
目录
3
教学目标
8
【内容要求】
【教学提示】
【学业要求】
基于2x2列联表,通过实例了解独立性检验的基本思想,掌握独立性检验的基本步骤,会用独立性检验解决简单的实际问题,提升数据分析能力。
教学目标
目录
4
教学重难点
11
重 点
独立性检验的基本思想和独立性检验的基本方法
难 点
χ²统计量的构造、
小概率值α的理解
12
目录
5
教学过程
13
有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和患肺癌之间有因果关系吗?
情境创设
生活疑问
引出课题
为了研究吸烟是否与患肺癌有关,某肿瘤研究所采取有放回简单随机抽烟的方法调查了9965人,得到的结果如下,从频率的角度出发,你认为吸烟与肺癌有关吗?
不患肺癌(Y=0) 患肺癌(Y=1) 合计
不吸烟(X=0) 7775 42 7817
吸烟(X=1) 2099 49 2148
总计 9874 91 9956
(,)
情境创设
思考1:这个差异一定意味着“吸烟与患肺癌有关”吗?有没有可能是随机抽样误差造成的?
思考2:我们能否用一个量化的标准,来判断这个差异“足够大”到可以认为两者有关?
【设计意图】制造认知冲突,让学生意识到定性描述的局限性,从而产生对定量分析方法的迫切需求,自然引入课题。
【问题1】你知道法官是如何凭证据进行判案的吗?
类比
情境创设
【设计意图】以法官判案为例,形象的解释零假设的含义,可以帮助学生突破难点,通过将问题抽象以概率语言表达的数学问题,以提升学生的数学抽象素养
追问 我们是否可以类比法官判案的方式去判断两个分类变量X,Y是否有关联?
【问题2】 设X和Y为定义在以Ω为样本空间上,且取值于{0, 1} 的成对分类变量,如何判断事件{X=1}和{Y=1}之间是否有关联?(用概率语言表示)
我们需要判断下面的假定关系是否成立
H0:P(Y=1|X=0)=P(Y=1|X=1)
探究新知
(一)提出零假设H0
不患肺癌(Y=0) 患肺癌(Y=1) 合计
不吸烟(X=0) 7775 42 7817
吸烟(X=1) 2099 49 2148
总计 9874 91 9956
思考1:对于上述式子,能否利用我们所学的知识,将其化简为更易理解的形式?
由条件概率的定义可知,上式等价于:
【问题2】 设X和Y为定义在以Ω为样本空间上,且取值于{0, 1} 的成对分类变量,如何判断事件{X=1}和{Y=1}之间是否有关联?(用概率语言表示)
我们需要判断下面的假定关系是否成立
不患肺癌(Y=0) 患肺癌(Y=1) 合计
不吸烟(X=0) 7775 42 7817
吸烟(X=1) 2099 49 2148
总计 9874 91 9956
思考2: 这个条件说明零假设H0:
等价于什么?
等价于{X=1}和{Y=1}独立
探究新知
(一)提出零假设H0
H0:P(Y=1|X=0)=P(Y=1|X=1)
思考3:我们留意到{X=0}和{X=1}是对立事件, {Y=0}和{Y=1}是对立事件,在上述推导中,我们得到的“{Y=1}与{X=1}相互独立”的结论是否可以再进一步优化?
{X=0}和{Y=0}独立
{X=0}和{Y=1}独立
{X=1}和{Y=0}独立
{X=1}和{Y=1}独立
P(X=0,Y=0)=P(X=0)P(Y=0);
P(X=0,Y=1)=P(X=0)P(Y=1);
P(X=1,Y=0)=P(X=1)P(Y=0);
P(X=1,Y=1)=P(X=1)P(Y=1);
根据相互独立的性质,下面四条性质彼此等价:
H0:分类变量X和Y独立
因此,我们可以用概率语言,将零假设改述为:
探究新知
(一)提出零假设H0
探究新知
(二)构造检验的统计量
【问题3】 请根据分类变量X和Y独立的定义及等价条件,利用列联表数据,构造一个用于推断两个分类变量是否独立的统计量。
引:在统计学中,我们通常要从样本中数据中找证据,寻找证据的方法就是构造一个统计量,并且了解它的统计特征,利用样本计算这个统计量的观测值。
为了使得研究更具有代表性,我们首先将上述的列联表的数据进行一般化处理:
探究新知
(二)构造检验的统计量
追问1:你能对这个分类变量X和Y的抽样数据的2×2列联表作一个解读吗?
【设计意图】使学生了解:对于随机样本,表中a,b,c,d都是随机变量,相应数据是这些随机变量的一次观测结果,{X=0},{X=1},{Y=0},{Y=1}分别对应最后一列及最后一行前两个数。
探究新知
(二)构造检验的统计量
追问2:根据频率稳定于概率的原理,你能构造一个能对分类变量X和Y的独立性做出推断的统计量么?
X Y 合计
Y=0 Y=1
X=0 a+b
X=1 c+d
合计 a+c b+d n=a+b+c+d
将上述两个表格中的值填入下述表格,如何描述表格中实际频数和理论频数之间的差异呢?
事件 观测值 期望值 观测值与期望值差的绝对值
X=0,Y=0 a
X=0,Y=1 b
X=1,Y=0 c
X=1,Y=1 d
思考:当 过大时,变量之间不独立,但这些量究竟多大才能说明变量之间不独立呢?我们能不能选择一个量,用他的大小来检验变量之间是否独立呢?
四个量的取值不应该太大
探究新知
(二)构造检验的统计量
23
探究新知
思考1:卡方统计量有什么用?
统计学家建议:用随机变量 χ2取值的大小作为判断零假设H0是否成立的依据:
如果零假设成立,则应该很小.如果零假设不成立,则应该很大
(二)构造检验的统计量
为了平衡各式的差值的变化,构造一个方便科学的统计量:
对于任何小概率值α,可以找到相应的正实数,使得下面关系成立:
P(χ2 ≥ xα)=α
思考2:那么,究竟 χ2大到什么程度,可以推断 H0 不成立呢?或者说,怎样确定判断
χ2大小的标准呢?
探究新知
(三)确定检验规则
GeoGebra展示不同α取值下,xα对应取值
思考3:若,依据小概率值的独立性检验,X与Y是否独立;依据的检验呢?
【设计意图】让学生通过GeoGebra,直观演示卡方密度曲线来阐述统计量的统计性质,用概率语言描述一个统计推断,从而进一步理解独立性检验思想:任何一个统计推断都有可能犯错,若能将犯错控制在可接受范围内,我们就能接受这个判断。
当 χ2 ≥ xα时,我们推断 H0 不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2 < xα时,我们没有充分证据推断 H0 不成立,可以认为X和Y独立
思考4:通过上面的问题,你能总结基于小概率值α的检验规则吗?
探究新知
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值:
(三)确定检验规则
(1)当 χ2 ≥ x0.05=3.841时,我们推断 H0 不成立,即认为X和Y不独立,该推断犯错误的概率不超过0.05;
(2)当χ2 < x0.05=3.841时,我们没有充分证据推断 H0 不成立,可以认为X和Y独立
思考5:对于小概率值α=0.05,下面两个独立性检验分别说明了什么?
(1)χ2 ≥ x0.05=3.841;(2)χ2 < x0.05=3.841
探究新知
(三)确定检验规则
【设计意图】通过具体问题进一步理解独立性检验的推断规则。
典例解析
【师生活动】师生合作,借助GeoGebra软件,教师板书,使学生掌握规范表达,并总结独立性检验的基本步骤。
思考:例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能说明其中的原因吗?
【师生活动】学生分组讨论,再进行班级交流,在此基础上再让学生阅读教科书,以印证自己的想法
【师生活动】学生认真读题,分析题意,再分享自己的理解,学生利用GeoGebra,完成解答,再进行全班交流。
典例解析
【设计意图】通过具体实例,进一步熟悉独立性检验的方法和步骤,了解独立性检验不显著时的推断原理。
思考:在上表中,若对调两种疗法的位置或对调两种疗效的位置,则计算公式中 a, b, c, d 的赋值都会相应地改变.,这样做会影响 χ2 取值的计算结果吗?
【设计意图】从2×2列联表的结构特征,进一步理解 χ2 观测值计算公式的性质。
【师生活动】学生自主解题,然后让学生代表进行讲解.回答最开始情境引入提出的问题,同时通过吸烟有害健康的实例,渗透社会责任和健康意识的育人点。
典例解析
课堂小结
(1)回顾本节课的学习,请你总结应用χ2独立性检验解决实际问题时大致包括几个主要环节;
(2)独立性检验思想类似我们常用的反证法,你能指出两者之间的相同和不同之处吗?
(3)你能说一说独立性检验的本质吗
布置作业
课本P134页联系第1,2,3,4题,习题8.3第8题。
目录
6
板书设计
34
8.3.2 独立性检验
一、基本方法
(一)提出零假设H0:X和Y相互独立
(二)构造检验的统计量 χ2
(三)确定检验规则
二、基本步骤
(1)零假设
(2)计算χ2
(3)查临界值
(4)下结论
谢谢指导
36
$