内容正文:
第八章 成对数据的统计分析》同步配套分层练习-2024-2025学年高二数学教材解读与拓展(沪教版2020)选择性必修第二册
【解析版】 8.3.2 独立性检验的具体应用
【附录】相关考点
考点一
2×2列联表独立性检验通常有如下步骤:
(1)提出两个随机变量没有关系的原假设;
(2)确定显著性水平,本书中规定,也即();
(3)计算统计量的值.
(4)统计决断:比较上述值与的大小,若值≥,则拒绝(或否定);
若 值,则不能拒绝(或否定),即接受,根据上述推断作出结论;
说明:
1、思考 独立性检验与反证法的思想类似,那么独立性检验是反证法吗?
【解析】不是;因为反证法不会出错,而独立性检验依据的是小概率事件几乎不发生;
独立性检验的基本思想类似于反证法;要判断“两个分类变量有关系”,首先假设结论不成立,即零假设H0:“两个分类变量没有关系”成立,在该假设下构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的值很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据拒绝H0.
2、独立性检验的步骤与反证法的步骤中在推导假设不成立时主要区别是什么?
【解析】其主要区别为,反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;独立性检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立;
【必做题】落实与理解教材要求的基本教学内容;
1、某班主任对全班50名学生进行了作业量的调查,数据如下表:
性别
作业量
合计
大
不大
男生
18
9
27
女生
8
15
23
合计
26
24
50
则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过( )
A.0.01 B.0.005
C.0.05 D.0.001
【答案】C
【解析】由公式得
χ2=≈5.059>3.841=x0.05.
所以,犯错误的概率不超过0.05;
2、某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算得.根据独立性检验的相关知识,对照下表,可以认为有( )把握喜欢篮球与性别有关.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A. B. C. D.
【答案】B
【解析】因为 ,所以有把握认为与性别有关,
故选:B;
3、有甲、乙两个班级共计105人进行数学考试,按照大于或等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:
χ2=
优秀
非优秀
总计
甲班
10
b
乙班
c
30
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( C )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15, b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
【答案】C;
【解析】由题意,在全部的105人中随机抽取1人,成绩优秀的概率为,
所以成绩优秀的人数为105×=30人,非优秀的人数为105-30=75人,
所以c=30-10=20,b=75-30=45,则χ2==
≈6.109>3.841,若按95%的可靠性要求,能认为“成绩与班级有关系”;
4、用旧设备和改造后的新设备冶炼某种金属,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表:
设备
杂质含量
杂质高
杂质低
旧设备
37
121
新设备
22
202
附:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
根据以上数据,则( )
A.依据小概率值α=0.001的独立性检验,认为含杂质的高低与设备改造有关
B.含杂质的高低与设备改造无关
C.新设备生产的产品中所含杂质比旧设备低
D.以上答案都错误
【答案】A
【解析】由已知数据得到如下2×2列联表:
设备
杂质含量
合计
杂质高
杂质低
旧设备
37
121
158
新设备
22
202
224
合计
59
323
382
χ2=≈13.11>10.828,则依据小概率值α=0.001的独立性检验,认为含杂质的高低与设备改造是有关的.
【标答题】掌握与体验用相关数学知识与方法规范审题、析题、答题;
5、下表是关于男婴与女婴出生时间调查的列联表:
时间
合计
晚上
白天
男婴
45
A
B
女婴
E
35
C
合计
98
D
180
那么,A=________,B=________,C=________,D=________,E=________.
【答案】47;92;88;82;53;
【解析】由列联表得解得
6、某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
性别
专业
合计
非统计专业
统计专业
男
13
10
23
女
7
20
27
合计
20
30
50
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2=≈4.844,因为χ2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为__________.
【答案】5%
【解析】因为χ2>3.841=x0.05,所以依据小概率值α=0.05的独立性检验,认为主修统计专业与性别有关,出错的可能性最大为5%.
7、某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名、治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析甲、乙两种疗法的效果,结论为
附:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【答案】两种疗法效果没有差异
【解析】由题意的两种疗法数据的列联表
疗法
疗效
合计
未治愈
治愈
甲
15
52
67
乙
6
63
69
合计
21
115
136
根据列联表中的数据,经计算得到
χ2=≈4.881<7.879=x0.005.
根据小概率值α=0.005的独立性检验,
认为两种疗法效果没有差异;
8、在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,请根据题目的条件列出2×2列联表,并由列联表估计色盲与性别是否有关.
【提示】根据性别与患不患色盲列出列联表,利用频率差值的大小得出粗略结论.
【解析】根据题目所给的数据作出如下列联表:
色盲(Y=0)
不色盲(Y=1)
合计
男(X=0)
38
442
480
女(X=1)
6
514
520
合计
44
956
1 000
男性中患有色盲的频率为==,
女性中患有色盲的频率为==,
显然>,且两个比例的值相差较大.
根据频率稳定于概率的原理,可以推断P(Y=0|X=0)>P(Y=0|X=1),
故可以粗略地估计患不患色盲与性别有关;
【自选题】提升与拓展课本知识与方法,具有知识与方法的交汇与综合,由学生自主选择尝试。
9、某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
成绩
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩 B.视力 C.智商 D.阅读量
【提示】根据数据求出χ2,再比较大小;
【答案】D;
【解析】表1中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
表2中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
表3中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
表4中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
因为<<<,所以与性别有关联的可能性最大的变量是阅读量.故选D.
10、在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
50
未注射疫苗
30
50
合计
30
100
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )
附:,.
A.0.001 B.0.05 C.0.01 D.0.005
【答案】B
【解析】完善列联表如下:
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
40
50
未注射疫苗
20
30
50
合计
30
70
100
假设:“给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果”.
因为:,而,
所以根据小概率值的独立性检验,推断不成立.
即认为“给基因编辑小鼠注射该疫苗能起到预防该病毒感染的效果”.
故选:B
11、某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)试根据小概率值α=0.05的独立性检验,分析男、女顾客对该商场服务的评价是否有差异?
附:χ2=.
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
【提示】列出列联表,求出χ2再分析变量之间的关系;
【解析】(1)由调查数据知,男顾客中对该商场服务满意的比率为=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.
女顾客中对该商场服务满意的比率为=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.
(2)零假设为H0:男、女顾客对该商场服务的评价没有差异.
根据列联表中的数据,计算得到χ2=≈4.762>3.841=x0.05.
根据小概率值α=0.05的独立性检验,推断H0不成立,即认为男、女顾客对该商场服务的评价有差异,此推断犯错误的概率不大于0.05.
【说明】解决一般的独立性检验问题的步骤
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)通过列联表确定a,b,c,d,n的值,根据问题需要的可信程度确定临界值xα;
(3)利用χ2=求出χ2;
(4)如果χ2≥xα,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.
如果χ2的值很大,说明两个分类变量有关系的可能性很大;如果χ2的值比较小,则认为没有充分的证据显示两个分类变量有关系.
12、为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
[0,150]
(150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:χ2=,
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【解析】(1)由表格中的数据可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的有32+6+18+8=64天,
所以该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为=0.64.
(2)由所给数据,可得2×2列联表为
[0,150]
(150,475]
[0,75]
64
16
(75,115]
10
10
(3)根据2×2列联表中的数据可得
χ2=
==
≈7.484>6.635,
所以有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关;
第1页
学科网(北京)股份有限公司
$$第八章 成对数据的统计分析》同步配套分层练习-2024-2025学年高二数学教材解读与拓展(沪教版2020)选择性必修第二册
【原卷版】 8.3.2 独立性检验的具体应用
【附录】相关考点
考点一
2×2列联表独立性检验通常有如下步骤:
(1)提出两个随机变量没有关系的原假设;
(2)确定显著性水平,本书中规定,也即();
(3)计算统计量的值.
(4)统计决断:比较上述值与的大小,若值≥,则拒绝(或否定);
若 值,则不能拒绝(或否定),即接受,根据上述推断作出结论;
说明:
1、思考 独立性检验与反证法的思想类似,那么独立性检验是反证法吗?
【解析】不是;因为反证法不会出错,而独立性检验依据的是小概率事件几乎不发生;
独立性检验的基本思想类似于反证法;要判断“两个分类变量有关系”,首先假设结论不成立,即零假设H0:“两个分类变量没有关系”成立,在该假设下构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的值很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据拒绝H0.
2、独立性检验的步骤与反证法的步骤中在推导假设不成立时主要区别是什么?
【解析】其主要区别为,反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;独立性检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立;
【必做题】落实与理解教材要求的基本教学内容;
1、某班主任对全班50名学生进行了作业量的调查,数据如下表:
性别
作业量
合计
大
不大
男生
18
9
27
女生
8
15
23
合计
26
24
50
则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过( )
A.0.01 B.0.005
C.0.05 D.0.001
2、某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算得.根据独立性检验的相关知识,对照下表,可以认为有( )把握喜欢篮球与性别有关.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A. B. C. D.
3、有甲、乙两个班级共计105人进行数学考试,按照大于或等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:
χ2=
优秀
非优秀
总计
甲班
10
b
乙班
c
30
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( C )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15, b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
4、用旧设备和改造后的新设备冶炼某种金属,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表:
设备
杂质含量
杂质高
杂质低
旧设备
37
121
新设备
22
202
附:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
根据以上数据,则( )
A.依据小概率值α=0.001的独立性检验,认为含杂质的高低与设备改造有关
B.含杂质的高低与设备改造无关
C.新设备生产的产品中所含杂质比旧设备低
D.以上答案都错误
【标答题】掌握与体验用相关数学知识与方法规范审题、析题、答题;
5、下表是关于男婴与女婴出生时间调查的列联表:
时间
合计
晚上
白天
男婴
45
A
B
女婴
E
35
C
合计
98
D
180
那么,A=________,B=________,C=________,D=________,E=________.
6、某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
性别
专业
合计
非统计专业
统计专业
男
13
10
23
女
7
20
27
合计
20
30
50
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2=≈4.844,因为χ2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为__________.
7、某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名、治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析甲、乙两种疗法的效果,结论为
附:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
8、在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,请根据题目的条件列出2×2列联表,并由列联表估计色盲与性别是否有关.
【自选题】提升与拓展课本知识与方法,具有知识与方法的交汇与综合,由学生自主选择尝试。
9、某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
成绩
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩 B.视力 C.智商 D.阅读量
10、在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
50
未注射疫苗
30
50
合计
30
100
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )
附:,.
A.0.001 B.0.05 C.0.01 D.0.005
11、某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)试根据小概率值α=0.05的独立性检验,分析男、女顾客对该商场服务的评价是否有差异?
附:χ2=.
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
12、为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
[0,150]
(150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:χ2=,
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
第1页
学科网(北京)股份有限公司
$$