内容正文:
回忆一下
1. 等高堆积条形图在两个分类变量之间关联性的研究中能够起到什么作用?在推断关联性时有何不足?
等高堆积条形图可以直观反映两个分类变量之间是否有关联性;但样本的随机性可能导致推断出的结论是错误的.
2. 对已获取的成对样本数据,检验结论“两个变量之间有关联”的实际含义是什么?检验结论“两个变量之间没有关联”的实际含义是什么?
“两个变量之间有关联”是“两个变量不独立”的另一种说法,在零假设“两个变量独立”之下,若算出不利于该假设的小概率事件发生了,由此推断零假设不成立,从而“两个变量不独立(有关联)”的检验结论
“两个变量之间没有关联”是“两个变量独立”的另一种说法,在零假设“两个变量独立”之下,若算出不利于该假设的小概率事件没有发生,由此不能推断零假设不成立,从而“两个变量独立(无关联)”的检验结论
(卡方)独立性检验的步骤
(1)认清分类变量,提出零假设H0:X 和 Y 独立,即…与…无关联(无差异);
(2)列表:列出2×2列联表.
(3)求值:由表中数据计算χ2的值.
(4)推断:将χ2值与临界值xα比较,根据小概率值α的独立性检验规则,得出结论
若χ2≥xα,则推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
若χ2<xα,则我们没有充分证据推断H0不成立,可认为X 和 Y独立.
P(χ2≥xα)=α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
3.2.1
双曲线及其标准方程
典例精析
例1.儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种治疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
疗法 疗效 合计
未治愈 治愈
甲 15 52 67
乙 6 63 69
合计 21 115 136
P(χ2≥xα)=α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
问题一:在上例表中,若对调两种疗法的位置或对调两种疗效的位置,则 χ2表达式中a,b,c,d的赋值都会相应地改变,这样做会影响 χ2取值的计算结果吗?
疗法 疗效 合计
未治愈 治愈
甲 15 52 67
乙 6 63 69
合计 21 115 136
典例精析
变式:儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种治疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.05的独立性检验,分析甲、乙两种疗法的效果是否有差异.
疗法 疗效 合计
未治愈 治愈
甲 15 52 67
乙 6 63 69
合计 21 115 136
P(χ2≥xα)=α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
典例精析
例2:某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学
生中随机抽取100名学生,根据他们的竞赛成绩得到如下数据:
优秀 非优秀 合计
男生 10
女生 30 50
合计 100
(2)判断在犯错误的概率不超过0.01的前提下,能否认为“竞赛成绩是否优秀与性别
有关”.
(1) 请将上面的 列联表补充完整, 求出等高堆积条形图需要的数据,并画出
等高堆积条形图(按“优秀”和“非优秀”所对应阴影画线),利用等高堆积条形图判断
竞赛成绩是否优秀与性别是否有关系.
典例精析
(1)根据题表中已知数据,可得完整的 列联表如下表所示.
优秀 非优秀 合计
男生 10 40 50
女生 20 30 50
合计 30 70 100
根据中 列联表数据可知,样本中男生优秀的频率为,男生非优秀的频率为 ,女生优秀的频率为,女生非优秀的频率为 ,
则可画出等高堆积条形图如图所示,
则可画出等高堆积条形图如图所示,根据等高堆积条形图,比较图中两个用斜纹实线所画矩形的高度可以发现,女生样本中成绩优秀的频率明显大于男生样本中成绩优秀的频率,此可以认为竞赛成绩是否优秀与性别有关.
典例精析
(2)零假设为 竞赛成绩是否优秀与性别无关.
由表中数据可知 ,
又因为,所以根据小概率值的独立性检验,我们推断
不成立,即认为“竞赛成绩是否优秀与性别有关”,此推断犯错误的概率不超过0.01.
P(χ2≥xα)=α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
典例精析
例3.(2025·全国 I 卷,有修改)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,补充下面列联表:
超声波检查结果组别 正常 不正常 合计
患该疾病 180
未患该疾病 780
合计 200 1000
20
800
200
20
800
(1)记超声波检查结果不正常者患该疾病的概率为P,求P的估计值;
(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.
P(χ2≥xα)=α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解:(1)根据表格可知,检查结果不正常的200人中有180人患病,所以p的估计值为
(2)零假设为H0:超声波检查结果与患病无关,根据表中数据可得,
根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为超声波检查结果与患该病有关,该推断犯错误的概率不超过0.001.
归纳总结
(卡方)独立性检验的步骤
(1)认清分类变量,提出零假设H0:X 和 Y 独立,即…与…无关联(无差异);
(2)列表:列出2×2列联表.
(3)求值:由表中数据计算χ2的值.
(4)推断:将χ2值与临界值xα比较,根据小概率值α的独立性检验规则,得出结论
若χ2≥xα,则推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
若χ2<xα,则我们没有充分证据推断H0不成立,可认为X 和 Y独立.
P(χ2≥xα)=α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
随堂小测
1. 同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表,
并推断说其亲属的饮食习惯与年龄有关,该推断犯错误的概率不超过 ( )
A.0.005 B.0.004 C.0.002 D.0.001
P(χ2≥xα)=α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
年龄 饮食习惯 合计
偏爱蔬菜 偏爱肉类
50岁以下 4 8 12
50岁以上 16 2 18
合计 20 10 30
课本P136 9
随堂小测
与例2中的结论不一样,原因是每个数据都扩大为原来的10倍,相当于样本量变大为原来的10倍,导致推断结论发生了变化.
课后作业
课本P135 7,8
课本P140 8
$