内容正文:
9.2 独立性检验
知识点 1
2×2列联表
必备知识 清单破
假设两个分类变量X和Y的可能取值集合分别为{x1,x2}和{y1,y2},其2×2列联表为
Y 合计
y1 y2
X x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
列联表是一个描述两个分类变量分布的频数表.
高中同步
第9章 统计
1. χ2统计量
一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B(如吸烟与不吸烟);Ⅱ也有
两类取值,即类1和类2(如患呼吸道疾病和未患呼吸道疾病).我们得到如列联表所示的抽样数
据:
知识点 2
独立性检验
高中同步
第9章 统计
Ⅱ 合计
类1 类2
Ⅰ 类A a b a+b
类B c d c+d
合计 a+c b+d a+b+c+d
记n=a+b+c+d,则χ2= .
高中同步
第9章 统计
2.独立性检验
(1)独立性检验的概念:用χ2统计量研究两类变量是否有关的方法称为独立性检验.
(2)独立性检验的步骤:
①提出假设H0:Ⅰ与Ⅱ没有关系;
②根据2×2列联表与χ2= 计算χ2的值;
③根据临界值(如下表所示),做出判断.
高中同步
第9章 统计
P(χ2≥x0) 0.50 0.40 0.25 0.15 0.10
x0 0.455 0.708 1.323 2.072 2.706
P(χ2≥x0) 0.05 0.025 0.010 0.005 0.001
x0 3.841 5.024 6.635 7.879 10.828
高中同步
第9章 统计
例如:若χ2≥10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”,否则没有充分的证据推断H0不
成立,可以认为“Ⅰ与Ⅱ没有关系”.
高中同步
第9章 统计
知识辨析
1.分类变量中的变量与函数中的变量是同一概念吗?
2.对于两个分类变量,独立性检验的样本不同,其结论是否一定相同?
3.应用独立性检验的基本思想对两个变量间的关系作出的推断一定正确吗?
4.若χ2≥6.635,则有99%的把握认为吸烟与患肺病有关,其含义是在100个吸烟的人中必有99
人患肺病吗?
5.若事件A与B经独立性检验后得到结论“A与B无关”,则这两个事件是不是互不影响?
高中同步
第9章 统计
一语破的
1.不是.变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量,有时可以
把分类变量的不同取值用数字表示,但这时的数字除了分类以外没有其他含义,而函数中的
变量分为自变量与因变量,都是数的集合,有它们各自的意义.
2.不一定.样本是随机的,由此得出的结论也具有随机性.
3.不一定.对两个变量间的关系作出的推断是在犯错误的概率不超过某个范围的前提下成立
的.
4.不是.说明“吸烟”与“患肺病”有关系的概率不低于99%,而不是患肺病的概率.
5.不是.只能说明“A与B无关”这一结论犯错误的可能性很小.
高中同步
第9章 统计
解决与独立性检验有关的统计、概率综合问题的步骤
(1)厘清题意,理解问题中的条件和所要得出的结论,尤其是图表中给定的信息,找关键量.
(2)分析数据,列出2×2列联表.
(3)利用独立性检验的步骤进行判断.
关键能力 定点破
定点
独立性检验的应用
高中同步
第9章 统计
典例 北京冬奥组委对报名参加北京冬奥会志愿者的人员开展冬奥会志愿者的培训活动,并
在培训结束后进行了一次考核.为了解这次培训活动的效果,从中随机抽取160名志愿者的考
核成绩,根据这160名志愿者的考核成绩,得到了统计图表.
男志愿者考核成绩频率分布直方图
高中同步
第9章 统计
女志愿者考核成绩频率分布表
分组 频数 频率
[75,80) 4 0.050
[80,85) 26 0.325
[85,90) a 0.3
[90,95) 20 m
[95,100] b 0.075
高中同步
第9章 统计
若参加这次考核的志愿者考核成绩在[90,100]内,则考核等级为优秀.
(1)求a,b,m的值;
(2)分别求出这次培训考核等级为优秀的男、女志愿者人数;
(3)补全下面的2×2列联表,能否有99%的把握认为考核等级是否优秀与性别有关?
高中同步
第9章 统计
优秀 非优秀 合计
男志愿者
女志愿者
合计
附: χ2= ,其中n=a+b+c+d.
高中同步
第9章 统计
P(χ2≥x0) 0.10 0.05 0.010 0.001
x0 2.706 3.841 6.635 10.828
高中同步
第9章 统计
解析 (1)因为0.050+0.325+0.3+m+0.075=1,所以m=0.25,
又女志愿者总人数为 =80,
所以a=80×0.3=24,b=80×0.075=6.
(2)这次培训考核等级为优秀的男志愿者人数为(160-80)×(0.015+0.010)×5=10;
这次培训考核等级为优秀的女志愿者人数为20+6=26.
(3)由题意得,2×2列联表如下:
高中同步
第9章 统计
优秀 非优秀 合计
男志愿者 10 70 80
女志愿者 26 54 80
合计 36 124 160
高中同步
第9章 统计
提出假设H0:考核等级是否优秀与性别无关,
根据列联表数据,得
χ2= = ≈9.176,
因为当H0成立时, χ2≥6.635的概率约为0.01,
所以有99%的把握认为考核等级是否优秀与性别有关.
高中同步
第9章 统计
解后反思
在计算χ2时,要准确把握a,b,c,d的顺序,防止搞错顺序导致计算错误.此外,独立性检验得
出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,在分
析问题时,不能对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.
高中同步
第9章 统计
学科素养 情境破
素养
通过统计知识培养数据分析的素养
素养解读
在统计的综合应用问题中,一般利用散点图、直方图等统计图表得到相应的统计信息,通过
建立相应的统计模型将实际问题数学化,再利用回归分析或独立性检验的知识求解,最后还
原成实际问题的解,进而为改善与决策提供依据.
高中同步
第9章 统计
典例呈现
例题 为推进北方地区冬季清洁取暖,国家发改委制定了煤改气、煤改电价格扶植新政策,
从而使得煤改气、煤改电用户大幅度增加.下面条形图反映了某省2023年1~7月份煤改气、
煤改电的用户总数量(单位:万户).
(1)在给定的坐标系中作出煤改气、煤改电用户总数量y随月份t变化的散点图,并判断y与t是
否具有线性相关关系.如果具有线性相关关系,那么是正相关还是负相关?
高中同步
第9章 统计
(2)求样本相关系数r,并用样本相关系数说明y与t之间线性相关的程度;
(3)建立y关于t的经验回归方程(相关计算结果精确到0.01),并估计2024年11月份该省煤改
气、煤改电的用户总数量;
(4)从这7个月的煤改气、煤改电的用户总数量数据中随机抽取2个数据,记其中煤改气、煤
高中同步
第9章 统计
改电的用户总数量低于1.3万户的数据个数为X,求X的概率分布与数学期望.
参考数据: yi=9.24, tiyi=39.75, ≈0.53, (ti- )(yi- )=2.79, ≈2.646.
高中同步
第9章 统计
解题思路 (1)作出散点图如图所示:
由图可知,各散点基本分布在一条直线附近,所以可以认为y与t具有线性相关关系,且是正相
关.
(2)由题中条形图中的数据得,
高中同步
第9章 统计
=4, =28,
又 ≈0.53, (ti- )(yi- )=2.79,
所以 r=
≈ ≈0.99,
因为y与t的样本相关系数r接近1,
所以y与t的线性相关程度很强.
(3)由(2)可设y关于t的经验回归方程为 = + t.
由 = =1.32及参考数据得
高中同步
第9章 统计
= = ≈0.10,
= - =1.32-0.10×4=0.92,
所以y关于t的经验回归方程为 =0.92+0.10t,将t=23代入经验回归方程得 =0.92+0.10×23=3.2
2,所以估计2024年11月份该省煤改气、煤改电的用户总数量为3.22万户.
(4)易知这7个月中,只有前3个月的煤改气、煤改电的用户总数量低于1.3万户,
故X的可能取值为0,1,2.
P(X=0)= = ,P(X=1)= = ,
P(X=2)= = ,
所以X的概率分布为
高中同步
第9章 统计
X 0 1 2
P
所以E(X)=0× +1× +2× = .
高中同步
第9章 统计
思维升华
在统计问题的求解中,我们要提高文字阅读、识图表的能力,以便能够快速地整合试题
条件,准确理解题意,提高解题的效率.为此,我们要掌握不同图表在呈现数据方面的作用和特
点,感知不同统计图表的适用情境,进而将统计问题转化为运算问题.
高中同步
第9章 统计
$