内容正文:
8.3 列联表与独立性检验
基础过关练
题组一 分类变量与列联表
1.已知四川省从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”的模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高堆积条形图,根据条形图的信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中选择历史意愿的女生人数多于男生人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
2.为了解性别因素是否对某班学生爱运动有影响,对该班50名学生进行了问卷调查,得到下列2×2列联表:
单位:人
爱运动
不爱运动
合计
男生
m
12
30
女生
8
20
合计
n
50
则m= ,n= .
3.某学校对高三学生进行了一项调查,发现:在平时的模拟考试中,426名性格内向的学生中有332人在考前心情紧张,594名性格外向的学生中有213人在考前心情紧张.作出等高堆积条形图,并利用条形图判断该校高三学生考前心情与性格类型是否有关系.
题组二 独立性检验及其应用
4.对于独立性检验,下列说法正确的是( )
A.χ2的值可以为负值
B.χ2独立性检验的统计假设是各事件之间相互独立
C.χ2独立性检验显示“患慢性气管炎和吸烟习惯有关”即指“有吸烟习惯的人必会患慢性气管炎”
D.2×2列联表中的4个数据可为任何实数
5.某学校在一次调查“篮球迷”的活动中,获得了如下数据:
单位:人
男生
女生
篮球迷
30
15
非篮球迷
45
10
以下结论正确的是( )
附:χ2=.
α
0.10
0.05
0.01
xα
2.706
3.841
6.635
A.没有95%的把握认为是不是篮球迷与性别有关
B.有99%的把握认为是不是篮球迷与性别有关
C.在犯错误的概率不超过0.05的前提下,可以认为是不是篮球迷与性别有关
D.在犯错误的概率不超过0.01的前提下,可以认为是不是篮球迷与性别有关
6.两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表如表所示:
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
下列四组数据中,分类变量X和Y之间的关系最强的是( )
A.a=4,b=2,c=3,d=6
B.a=2,b=1,c=3,d=5
C.a=4,b=5,c=6,d=8
D.a=2,b=3,c=4,d=6
7.在一个2×2列联表中,通过数据计算χ2=8.325,则有 的把握认为这两个分类变量有关.
参考表格:
α
0.05
0.025
0.010
0.001
xα
3.841
5.024
6.635
10.828
8.(教材习题改编)某市为了解学生体育运动的时间长度是否与性别因素有关,从某几所学校中随机调查了男、女生各100名,统计他们平均每天的体育运动时间(单位:分钟),得到如下数据:
单位:人
运动时间
(0,40]
(40,60]
(60,90]
(90,120]
女生
10
30
50
10
男生
5
20
50
25
根据学生课余体育运动要求,平均每天体育运动时间(单位:分钟)在(60,120]内认定为“合格”,否则被认定为“不合格”.根据已知条件完成下面的2×2列联表,并回答能否有90%的把握认为学生体育运动时间与性别因素有关联.
单位:人
不合格
合格
合计
女生
男生
合计
附:χ2=(其中n=a+b+c+d).
α
0.15
0.10
0.05
0.025
0.010
0.005
xα
2.072
2.706
3.841
5.024
6.635
7.879
能力提升练
题组 独立性检验的综合应用
1.某省采用“3+1+2”的新高考模式,其中“3”为全国统考科目:语文、数学和外语;“1”为考生在物理和历史中选择一门作为选考科目;“2”为考生在政治、地理、化学和生物四门中选择两门作为选考科目.某中学为了解高一年级学生的选科倾向,随机抽取了200人,其中选考物理的有120人,选考历史的有80人,统计各选科人数如下表,则下列说法正确的是( )
单位:人
选考类别
选择科目
政治
地理
化学
生物
物理类
35
50
90
65
历史类
50
45
30
35
附: χ2=,其中n=a+b+c+d.
α
0.100
0.050
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
A.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
B.物理类的学生中选择生物的比例比历史类的学生中选择生物的比例低
C.有90%以上的把握认为选择生物与选考类别有关
D.没有95%以上的把握认为选择生物与选考类别有关
2.(多选题)某学校对学生性别和是否喜欢拍视频的关系进行了一次调查,其中被调查的男、女生人数相同,男生喜欢拍视频的人数占男生总人数的,女生喜欢拍视频的人数占女生总人数的,若有95%的把握认为是否喜欢拍视频和性别有关,则被调查的男生人数可能为( )
附: χ2=,其中n=a+b+c+d.
α
0.100
0.050
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
A.50 B.45 C.40 D.35
3.某大学生社团组织社会调查活动,随机调查了某市区某个路口100个工作日中每天的天气情况和当天早高峰(7点至9点)时段经过该路口的机动车车次,整理数据得到下表:
单位:天
天气
机动车车次
[0,800)
[800,1 600)
[1 600,2 400]
晴天
10
52
13
阴天
2
9
8
雨天
0
2
4
若晴天记为“天气好”,阴天或雨天记为“天气不好”,当天早高峰时段经过该路口的机动车车次小于1 600视为交通顺畅,否则视为交通拥堵,则在犯错误的概率不超过 的前提下,认为交通状况与天气情况有关.
附: χ2=,n=a+b+c+d.
α
0.05
0.01
0.005
0.001
xα
3.841
6.635
7.879
10.828
4.某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(单位:分,满分为100分),剔除平均分在30分以下的学生后,共有男生300名,女生200名,现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下频数分布表.
单位:人
分数段
[40,
50)
[50,
60)
[60,
70)
[70,
80)
[80,
90)
[90,
100]
男生
3
9
18
15
6
9
女生
6
4
5
10
13
2
(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,能否认为数学成绩与性别有关?
(2)规定80分以上(含80分)为优分,请你根据已知条件完成2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.附:χ2=,其中n=a+b+c+d.
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
5.某校对学生餐厅的就餐环境、菜品种类与质量等方面进行了改造与提升,随机抽取100名男生与100名女生对就餐满意度进行问卷评分(满分100分)调查,调查结果统计如下表:
单位:人
评分分组
70分以下
[70,80)
[80,90)
[90,100]
男生
3
27
38
32
女生
5
35
34
26
学校规定:评分大于或等于80分为满意,小于80分为不满意.
(1)由以上数据完成下面的2×2列联表,并判断是否有90%的把握认为学生的就餐满意度与性别有关联;
单位:人
满意
不满意
总计
男生
女生
总计
(2)从男生、女生中评分在70分以下的学生中任意选取3人座谈调研,记X为3人中男生的人数,求X的分布列及数学期望.
附:χ2=,其中n=a+b+c+d.
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
6.某校组织学生观看“天宫课堂”,并对其中1 000名学生进行了一次“飞天宇航梦”的调查,得到如下两个等高堆积条形图,其中被调查的男、女生比例为3∶2.
(1)求m,n的值;
(2)完成以下表格,根据小概率值α=0.001的独立性检验,能否认为“是否有‘飞天宇航梦’与学生性别有关”?
单位:人
有“飞天宇航梦”
无“飞天宇航梦”
合计
男生
女生
合计
(3)在抽取的样本女生中,按有无“飞天宇航梦”用分层随机抽样的方法抽取5人,若从这5人中随机抽取3人进一步调查,求抽到有“飞天宇航梦”的女生人数X的分布列及数学期望.
附: χ2=,其中n=a+b+c+d.
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
7.甲、乙两地教育部门到某师范大学实施“优才招聘计划”,即通过对毕业生进行笔试、面试、模拟课堂考核这3项程序后直接签约一批优秀毕业生,已知3项程序分别由3个考核组独立依次考核,当3项程序均通过后即可签约.去年,该校数学系130名毕业生参加甲地教育部门“优才招聘计划”的具体情况如下表(不存在通过3项程序考核放弃签约的情况):
性别
参加考核但
未能签约的人数
参加考核
并能签约的人数
男生
45
15
女生
60
10
今年,该校数学系毕业生小明准备参加两地的“优才招聘计划”,假定他参加各程序的结果互不影响,且他的辅导员作出较客观的估计:小明通过甲地的每项程序的概率均为,通过乙地的各项程序的概率依次为,m,其中0<m<1.
(1)判断是否有90%的把握认为去年该校数学系130名毕业生参加甲地教育部门“优才招聘计划”能否签约与性别有关;
(2)若小明能与甲、乙两地签约分别记为事件C,D,他通过甲、乙两地的程序的项数分别记为X,Y.当E(X)>E(Y)时,证明:P(C)>P(D).
参考公式与临界值表:χ2=,n=a+b+c+d.
α
0.10
0.05
0.025
0.010
xα
2.706
3.841
5.024
6.635
答案与分层梯度式解析
8.3 列联表与独立性检验
基础过关练
1.C
4.B
5.A
6.A
1.C 由题图2知,选择物理学科的男生人数较多(超过50%),选择历史学科的女生人数较少(低于50%),所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;由题图2知,样本中选择历史意愿的女生人数少于男生人数,故B错误;由题图1知,样本中选择物理学科的人数多于选择历史学科的人数,故C正确;由题图2知,样本中男生人数多于女生人数,故D错误.
2.答案 18;24
解析 依题意可得列联表为
单位:人
爱运动
不爱运动
合计
男生
18
12
30
女生
8
12
20
合计
26
24
50
因此m=18,n=24.
3.解析 由题意可作2×2列联表如下:
单位:人
性格内向
性格外向
合计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1 020
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张的学生中性格内向的学生的比例.从图中可以看出,考前心情紧张的学生中性格内向的学生占的比例比考前心情不紧张的学生中性格内向的学生占的比例高,故可以认为该校高三学生考前心情与性格类型有关系.
4.B 2×2列联表中的数据均为正整数,故χ2不可能为负值,因此A错误;
由独立性检验的检验步骤可知B正确;
χ2独立性检验显示“患慢性气管炎和吸烟习惯有关”,是指吸烟的人患慢性气管炎的概率较大,即有一定的把握说它们相关,允许有一定的出错率,因此C错误;
2×2列联表中的4个数据是对于某组特定数据的统计数据,故四个数据间有一定的关系,不能为任意实数,因此D错误.故选B.
5.A 根据题表中的数据得到2×2列联表如下:
单位:人
男生
女生
合计
篮球迷
30
15
45
非篮球迷
45
10
55
合计
75
25
100
故χ2=≈3.030<3.841,
所以没有95%的把握认为是不是篮球迷与性别有关.故选A.
6.A 对于A, χ2=≈1.607;
对于B, χ2=≈0.749;
对于C, χ2=≈0.006;
对于D, χ2==0.
因为1.607>0.749>0.006>0,
所以A中分类变量X和Y之间的关系最强.故选A.
7.答案 99%
解析 ∵6.635<8.325<10.828,
∴有1-0.01=0.99=99%的把握认为两个分类变量有关.
8.解析 由题中数据可得2×2列联表:
单位:人
不合格
合格
合计
女生
40
60
100
男生
25
75
100
合计
65
135
200
故χ2=≈5.128,
因为5.128>2.706,
所以有90%的把握认为学生体育运动时间与性别因素有关联.
能力提升练
1.D 依据题表中数据可知,物理类的学生中选择地理的比例为,历史类的学生中选择地理的比例为,因为,所以物理类的学生中选择地理的比例比历史类的学生中选择地理的比例低,故A错误;
物理类的学生中选择生物的比例为,历史类的学生中选择生物的比例为,因为,所以物理类的学生中选择生物的比例比历史类的学生中选择生物的比例高,故B错误;
由题中表格可得2×2列联表如下:
单位:人
选择生物
不选择生物
合计
物理类
65
55
120
历史类
35
45
80
合计
100
100
200
故χ2=≈2.083,
由2.083<2.706=x0.100知没有90%以上的把握认为选择生物与选考类别有关,故C错误;
由2.083<3.841=x0.050知没有95%以上的把握认为选择生物与选考类别有关,故D正确.故选D.
2.AB 设男生有x人,则女生也有x人,2×2列联表如下:
单位:人
喜欢拍视频
不喜欢拍视频
合计
男生
x
x
x
女生
x
x
x
合计
x
x
2x
由题意得χ2=x>3.841,解得x>40.330 5,
易知x>0且x是5的倍数,结合选项可知被调查的男生人数为45或50.故选AB.
3.答案 0.5%
解析 交通状况与天气情况的2×2列联表如下:
单位:天
交通顺畅
交通拥堵
合计
天气好
62
13
75
天气不好
13
12
25
合计
75
25
100
χ2=≈9.404,
因为9.404>7.879,所以在犯错误的概率不超过0.5%的前提下,认为交通状况与天气情况有关.
4.解析 (1)由题意得抽取男生人数为×100=60,抽取女生人数为100-60=40,
男生的平均分×(45×3+55×9+65×18+75×15+85×6+95×9)=71.5(分),
女生的平均分×(45×6+55×4+65×5+75×10+85×13+95×2)=71.5(分),
故,因此不能认为数学成绩与性别有关.
(2)由频数分布表可知,在抽取的100名学生中,男生中分数为优分的有15人,女生中分数为优分的有15人,据此可得2×2列联表如下:
单位:人
优分
非优分
合计
男生
15
45
60
女生
15
25
40
合计
30
70
100
则χ2=≈1.786<2.706,
故没有90%以上的把握认为“数学成绩与性别有关”.
5.解析 (1)由题意得2×2列联表为
单位:人
满意
不满意
总计
男生
70
30
100
女生
60
40
100
总计
130
70
200
χ2=≈2.198<2.706,
所以没有90%的把握认为学生的就餐满意度与性别有关联.
(2)由已知得X的所有可能取值为0,1,2,3,且X服从超几何分布,
P(X=0)=,
P(X=2)=,
所以X的分布列为
X
0
1
2
3
P
则E(X)=0×.
6.解析 (1)由题意得,被调查的学生中,男生有600人,女生有400人,
所以男生中有“飞天宇航梦”的人数为600×0.7=420,无“飞天宇航梦”的人数为600×0.3=180,
女生中有“飞天宇航梦”的人数为400×0.6=240,无“飞天宇航梦”的人数为400×0.4=160,
所以m=.
(2)2×2列联表如下:
单位:人
有“飞天宇
航梦”
无“飞天
宇航梦”
合计
男生
420
180
600
女生
240
160
400
合计
660
340
1 000
零假设H0:是否有“飞天宇航梦”和学生性别无关.
χ2=≈10.695<10.828=x0.001,
所以根据小概率值α=0.001的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为“是否有‘飞天宇航梦’与学生性别无关”.
(3)由题意得,在抽取的5名女生中,有3名有“飞天宇航梦”,有2名无“飞天宇航梦”.
X的可能取值为1,2,3,
P(X=1)=,
P(X=2)=,
P(X=3)=,
所以X的分布列为
X
1
2
3
P
E(X)=1×.
7.解析 (1)由题表数据得n=45+15+60+10=130,χ2=≈2.388<2.706=x0.1,
所以没有90%的把握认为去年该校数学系130名毕业生参加甲地教育部门“优才招聘计划”能否签约与性别有关.
(2)证明:因为小明通过甲地的每项程序的概率均为,且小明参加各程序的结果互不影响,所以X~B,则E(X)=3×,
易知Y的可能取值为0,1,2,3.
P(Y=0)=,
P(Y=1)=,
P(Y=2)=,
P(Y=3)=,
随机变量Y的分布列为
Y
0
1
2
3
P
E(Y)=0×+m.
因为E(X)>E(Y),所以+m,即0<m<,
所以P(C)-P(D)=P(X=3)-P(Y=3)=>0,所以P(C)>P(D).
学科网(北京)股份有限公司
$$