内容正文:
#4.3.2 独立性检验
学业标准
素养目标
1.了解独立性检验的基本思想和方法.(重点)
2.能根据条件列出联表并会由公式求x.(重点)
3.了解独立性检验的初步应用.(难点)
1.通过了解独立性检验的基本思想和方法,培养数学抽象核心素养.
2.通过独立性检验的应用,提升数据分析、数学运算等核心素养.
[教材梳理]
导学 独立性检验
任意抽取某市的一名学生,记A:喜欢长跑,B:是女生.
(1)你能得出P(A),P(B),P(AB)这三者的准确值吗?
(2)能判断A与B是否独立吗?
[提示] (1)比较困难,甚至不可能.
(2)能.
◎结论形成
2×2列联表及相关事件的概率
1.如果随机事件A与B的样本数据的2×2列联表如下
A
总计
B
a
b
a+b
c
d
c+d
总计
a+c
b+d
a+b+c+d
记n=a+b+c+d,则由表可知:
(1)事件A发生的概率估计值为P(A)=____.
(2)事件B发生的概率的估计值为P(B)=____.
(3)事件AB发生的概率的估计值为P(AB)=____.
2.独立性检验的基本思想
(1)在2×2列联表中,令χ2=,任意给定一个α(称为显著性水平,通常取0.05,0.01等)可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数).χ2是一个随机变量,其分布能够求出,上面的概率是可以计算的.
(2)如果根据样本数据算出χ2的值后,发现χ2≥k成立,就称在犯错的概率不超过α的前提下,可以认为A与B不独立(也称A与B有关);或说有1-α的把握认为A与B有关.若χ2<k成立,不能得到前述结论.
(3)统计学中,常用的显著性水平α以及对应的分位数k如下表所示:
α=P(χ2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
[基础自测]
1.判断正误(正确的打“√”,错误的打“×”)
(1)在独立性检验中,若χ2越大,则两个分类变量有关系的可能性越大.( )
(2)2×2列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系.( )
(3)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的.( )
(4)样本不同,独立性检验的结论可能有差异.( )
答案 (1)√ (2)√ (3)× (4)√
2.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
解析 判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.
答案 C
3.在一个2×2列联表中,通过数据计算χ2=8.325,则这两个变量间有关系的可能性为________.
解析 因为χ2=8.325>7.879所以两个变量之间有关系的可能性就有99.5%.
答案 99.5%
4.下面是2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
100
则a+b=________.
解析 a=73-21=52,b=100-46=54.
故a+b=106.
答案 106
题型一 2×2列联表
在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲.
(1)试作出性别与色盲的列联表.
(2)患色盲的概率估计值是多少?
(3)男的患色盲的概率估计值是多少?
[解析] (1)根据题目所给的数据作出如下的列联表:
患色盲
不患色盲
总计
男
38
442
480
女
6
514
520
总计
44
956
1 000
(2)记A为患色盲,由表可得P(A)==.
(3)记B为男的患色盲,由表可得P(B)==.
[规律方法]
(1)作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.
(2)利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,求出事件发生的概率的估计值.
[触类旁通]
1. 某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练的天数
不大于2天
3天或4天
不少于5天
人数
30
130
40
若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.
(1)经调查,该市约有2万人参