内容正文:
8.3.1分类变量与列联表;8.3.2独立性检验(2课时)P114-P124
陶新军
1
1(1)
学习目标 核心素养
1.了解分类变量,理解2X2列联表,会看等高堆积条形图. 数学抽象
2.通过实例理解独立性检验的过程. 数据分析
3.应用探究:
(1)独立性检验;
(2)卡方χ2的含义解读;
(3)填2X2列联表、识别等高堆积条形图及应用; 数据分析
1分钟(读)(改)
2(3)
一.新课引入:分类变量、2X2列联表.
问题1 为了有针对性地提高学生体育锻炼的积极性, 某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响 , 为此对学生是否经常锻炼的情况进行了普查 , 全校学生的普查数据如下: 523名女生中有 331 名经常锻炼 ; 601名男生中有 473 名经常锻炼 . 你能利用这些数据 , 说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?
思考1:如何比较好的整理题目中的数据?
不经常锻炼(Y=0) 经常锻炼(Y=1) 合计
女生(X=0)
男生(X=1)
合计
192
331
523
601
473
128
320
804
1124
两个变量:性别;锻炼;
2(5)
二.概念形成:分类变量、2X2列联表.
我们经常会使用一种特殊的随机变量 , 以区别不同的现象或性质 , 这类随机变量称为分类变量.
分类变量的取值可以用实数表示 , 例如, 学生所在的班级可以用1, 2, 3等表示 , 男性、女性可以用1 , 0表示 , 等等. 在很多时候 , 这些数值只作为编号使用, 并没有通常的大小和运算意义 , 本节我们主要讨论取值于{0 , 1}的分类变量的关联性问题.
不经常锻炼(Y=0) 经常锻炼(Y=1) 合计
女生(X=0)
男生(X=1)
合计
192
331
523
601
473
128
320
804
1124
两个变量:
性别;锻炼;
形如上表这种形式的数据统计表称为2×2列联表.
2(7)
二.概念形成:等高堆积条形图.
思考2 你能利用这些数据 , 说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?
该校的男生更经常锻炼,性别在体育锻炼的经常性方面有差异.
不经常锻炼(Y=0) 经常锻炼(Y=1) 合计
女生(X=0)
男生(X=1)
合计
192
331
523
601
473
128
320
804
1124
“性别对体育锻炼的经常性有影响”即X与Y有关联
2(9)
二.概念形成:事件独立性与条件概率.
“性别对体育锻炼的经常性没有影响”即X与Y独立
问题1
变式:
不经常锻炼(Y=0) 经常锻炼(Y=1) 合计
女生(X=0) 5 20
男生(X=1) 18
合计 11
(1)补全2X2列联表,据此推断性别因素是否影响学生锻炼的经常性;
(2)说明你的推断结论是否可能犯错,并解释原因。
(2)可能犯错,样本随机抽到,频率具有随机性,因而可能犯错。
1(10)
二.概念形成:事件独立性与条件概率.
不经常锻炼(Y=0) 经常锻炼(Y=1) 合计
女生(X=0)
男生(X=1)
合计
192
331
523
601
473
128
320
804
1124
问题1:
不经常锻炼(Y=0) 经常锻炼(Y=1) 合计
女生(X=0) 5 15 20
男生(X=1) 6 18 24
合计 11 33 44
问题1
变式:
“性别对体育锻炼的经常性有影响”
即X与Y有关联
“性别对体育锻炼的经常性没有影响”即X与Y独立
问题2 寻找更合理的判断方法,同时对犯错的概率进行控制?
5(15)
{X=0}和{Y=1}独立
二.概念形成:独立性检验.
(Y=0) (Y=1) 合计
(X=0)
(X=1)
合计
思考1 补全2X2列联表,如何判断事件之间是否有关联?
问题2 寻找更合理的判断方法,同时对犯错的概率进行控制?
{X=0}和{Y=0}独立
零假设H0:分类变量独立.
下面四个等式
{X=1}和{Y=1}独立
{X=1}和{Y=0}独立
数学家构造出如下的统计量:
2(17)
二.概念形成:独立性检验.
(Y=0) (Y=1) 合计
(X=0)
(X=1)
合计
问题2 寻找更合理的判断方法,同时对犯错的概率进行控制?
上述表达式是χ2的计算公式, χ2读作“卡方”.
基于小概率值α的检验规则是:
(1)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
(2)当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,简称独立性检验.
4(21)
二.概念形成:独立性检验.
问题2 寻找更合理的判断方法,同时对犯错的概率进行控制?
思考2 怎样判断χ2大小的标准呢?
零假设H0:分类变量独立.
χ2取值较大时推断H0不成立,
χ2取值较小时推断H0成立,
P(χ2 ≥xα)=α成立. 我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准,概率值α越小,临界值xα越大.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
4(25)
三.概念深化:独立性检验.
(1)零假设H0:分类变量独立.
(3)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立,H0成立,可以认为X和Y独立.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
独立性检验步骤:
(2)算
例如,当χ2=5,我们有如下的具体检验规则:
(1)当χ2 ≥x0.05=3.841时,我们推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过0.05;
(2)当χ2 <x0.01=6.635时,我们没有充分证据推断H0不成立,H0成立,可以认为X和Y独立.
2(27)
四.应用探究:1独立性检验.课本P132
例1-1 某儿童医院用甲、乙两种疗法治疗小儿消化不良. 采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据: 抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名; 抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名. 试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
因此可以认为H0成立,即认为两种疗法效果没有差异.
疗法 疗效 合计
未治愈 治愈
甲 15 52 67
乙 6 63 69
合计 21 115 136
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
零假设H0: 疗法与疗效独立
解:
2(29)
四.应用探究:1独立性检验.
解:零假设H0:吸烟和患肺癌之间无关联.
例1-2 为研究吸烟是否与肺癌有关, 某肿瘤研究所采取有放回简单随机抽样的方法, 调查了9965人 , 得到成对样本观测数据的分类统计结果, 如表所示. 依据小概率值α=0.001的独立性检验, 分析吸烟是否会增加患肺癌的风险.
推断H0不成立,即认为吸烟与患肺癌有关联,此推断犯错误的概率不大于0.001
吸烟 肺癌 合计
非肺癌患者 肺癌患者
非吸烟者 7775 42 7817
吸烟者 2099 49 2148
合计 9874 91 9965
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
10(39)
四.应用探究:1独立性检验.
练习1(2025·高考 Ⅰ 卷)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1 000人,得到如下列联表:
组别 超声波检查结果 合计
正常 不正常
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1 000
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
10(39)
四.应用探究:1独立性检验.
练习1(2025·高考 Ⅰ 卷)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1 000人,得到如下列联表:
组别 超声波检查结果 合计
正常 不正常
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1 000
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
3(42)
四.应用探究:2卡方χ2的含义解读.
例2 (多选)(2025·聊城高二期末)某学校调查学生对神舟二十号的关注与性别是否有关,随机抽样调查了1 000名学生,进行独立性检验,计算得到χ2≈7.936,依据表中给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是 ( )
A.零假设H0:对神舟二十号的关注与性别独立
B.根据小概率值α=0.005的独立性检验,可以认为对神舟二十号的关注与性别无关
C.根据小概率值α=0.005的独立性检验,可以认为对神舟二十号的关注与性别不独立,此推断犯错误的概率不大于0.005
D.根据小概率值α=0.001的独立性检验,可以认为对神舟二十号的关注与性别独立
α 0.050 0.010 0.005 0.001
xα 3.841 6.635 7.879 10.828
ACD
解:因为χ2≈7.936,对于A选项,零假设H0:对神舟二十号的关注与性别独立,A项正确;对于B,C选项,因为χ2≈7.936>7.879=x0.005,根据小概率值α=0.005的独立性检验,可以认为对神舟二十号的关注与性别不独立,此推断犯错误的概率不大于0.005,B项错误,C项正确;对于D选项,因为χ2≈7.936<10.828=x0.001,根据小概率值α=0.001的独立性检验,可以认为对神舟二十号的关注与性别独立,D项正确.
四.应用探究:2卡方χ2的含义解读.
3(42)
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A
A.根据小概率值α=0.005的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值α=0.001的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
C.根据小概率值α=0.05的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过0.01的前提下,我们认为爱好跳绳与性别无关
零假设H0:爱好跳绳与性别无关
四.应用探究:2卡方χ2的含义解读.
3(45)
例3 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.完成2X2列联表,利用图形判断学生经常上网与学习成绩有关吗?
解:根据题目所给的数据得到如下2×2列联表:
成绩 上网 合计
经常上网 不经常上网
不及格
及格
合计
等高堆积条形图如图所示:
可以认为经常上网与学习成绩不及格有关.
成绩 上网 合计
经常上网 不经常上网
不及格 80 120 200
及格 120 680 800
合计 200 800 1 000
四.应用探究:3识别等高堆积条形图、2X2列联表
3(48)
练习3-1 某学校对高三学生做了一项调查发现:在平时的模拟考试中,性格内向的学生有426人,其中有332人在考前心情紧张,性格外向的学生有594人,其中有213人在考前心情紧张.完成2X2列联表,作出等高堆积条形图,利用图形判断考前心情紧张与性格类别是否有关系.
性格类别 合计
性格内向 性格外向
考前心情紧张
考前心情不紧张
合计
性格类别 合计
性格内向 性格外向
考前心情紧张 332 213 545
考前心情不紧张 94 381 475
合计 426 594 1 020
可以认为考前心情紧张与性格类别有关.
四.应用探究:3识别等高堆积条形图、2X2列联表
3(51)
练习3-2(2025·达州高二期末)某省将从某年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高堆积条形图,根据条形图信息,下列结论正确的是 ( )
C
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理意愿的人数较多
D.样本中男生人数少于女生人数
四.应用探究:3识别等高堆积条形图、2X2列联表
3(54)
解:根据题图1可知样本中选择物理意愿的人数较多,故C正确;
根据题图2可知样本中男生人数多于女生人数,故D错误;
样本中选择物理意愿的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低,
所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;
样本中女生选择历史意愿的人数少于男生选择历史意愿的人数,故B错误.
四.应用探究:3识别等高堆积条形图、2X2列联表
五.总结归纳:
2(80)
知识点 题型.
1.2X2列联表
2.堆积等高条形图
3.独立性检验
1.独立性检验;
2.卡方χ2的含义解读;
3.填2X2列联表、识别等高堆积条形图及应用;
六.板书设计
2(40)
1.2X2列联表
2.堆积等高条形图
3.独立性检验步骤:
(1)零假设H0:分类变量独立.
(3)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立,H0成立,可以认为X和Y独立.
(2)算
正态曲线与正态分布共用一个图形,1.P(a<x<b),P(X<x)画图
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.
附:χ2=,
解:(1)根据表格可知,检查结果不
正常的200人中有180人患病,
所以p的估计值为=.
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.
附:χ2=,
(2)零假设H0:超声波检查结果与患该疾病无关,
χ2==765.625>10.828,
我们推断H0不成立,即认为超声波检查结果与患
该疾病有关,犯错概率不超过0.001.
练习2 (2025·天津高二期中)通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由χ2=计算得χ2≈7.822,参照附表,则下列结论正确的是 ( )
$