内容正文:
第9章 统计
9.2 独立性检验
基础过关练
题组一 2× 2列联表
1.(2024吉林白城通榆一中期中)已知甲、乙两个班级进行数学考试,按照大于或等于85分为优秀,85分以下为非优秀,得到如下列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
总计
105
已知在105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可以看出成绩与班级有关系
2.某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如下“性别与是否会外语”的2×2列联表中,d= .
会外语
不会外语
合计
男
a
b
20
女
6
d
合计
18
50
题组二 独立性检验及其应用
3.(2024江西九江同文中学期末)假设有两个变量X和Y,它们的取值集合分别为{x1,x2}和{y1,y2},其2×2列联表如下.
y1
y2
x1
a
b
x2
c
d
根据以下选项中的数据计算χ2的值,其中χ2的值最大的一组为( )
A.a=60,b=50,c=40,d=30
B.a=60,b=40,c=50,d=30
C.a=40,b=30,c=50,d=60
D.a=30,b=40,c=50,d=60
4.(多选题)(2024江苏南通期中)某高校有在校学生9 000名,其中男生4 000名,女生5 000名,为了解学生每天自主学习中国古典文学的时长,随机调查了40名男生和50名女生,其中每天自主学习中国古典文学的时长超过3小时的学生称为“古文迷”,否则为“非古文迷”,调查结果如下表,则( )
古文迷
非古文迷
男生
20
20
女生
40
10
参考公式及数据: χ2=,其中n=a+b+c+d.
P(χ2≥x0)
0.50
0.40
0.25
0.05
0.025
0.010
x0
0.455
0.708
1.323
3.841
5.024
6.635
A.该校某名学生为“古文迷”的概率为0.6
B.随机调查的男、女生人数符合分层抽样的抽样方法
C.有99%的把握认为学生是不是“古文迷”与性别有关系
D.没有99%的把握认为学生是不是“古文迷”与性别有关系
5.(2024黑龙江哈尔滨模拟)某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(单位:分,满分为100分),剔除平均分在30分以下的学生后,共有男生300名,女生200名,现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下频数分布表.
分数段
[40,
50)
[50,
60)
[60,
70)
[70,
80)
[80,
90)
[90,
100]
男生
3
9
18
15
6
9
女生
6
4
5
10
13
2
(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,能否认为数学成绩与性别有关?
(2)规定80分以上(含80分)为优分,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“数学成绩是否优分与性别有关”.
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
6.(2025江苏扬州调研)社会生活日新月异,看纸质书的人越来越少,更多的年轻人(35岁及以下)喜欢阅读电子书籍,而年长者(35岁以上)更喜欢阅读纸质书.现在某书店随机抽取60名顾客进行调查,得到了如下列联表:
年长者
年轻人
总计
喜欢阅读电子书
24
30
喜欢阅读纸质书
12
总计
60
(1)请将上面的列联表补充完整,并判断是否有90%的把握认为是否喜欢阅读电子书与年龄有关;
(2)若在年轻人中按照分层抽样的方法抽取7人,再从抽取的7人中随机抽取3人,求抽到喜欢阅读电子书的年轻人人数X的概率分布及数学期望.
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0)
0.10
0.05
0.010
0.005
x0
2.706
3.841
6.635
7.879
能力提升练
题组 独立性检验的综合应用
1.(多选题)(2024湖北八市联考)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽样的方式随机抽取了100名学生进行问卷调查,将调查的结果进行统计,得到如下条形图和列联表,则( )
对数学的兴趣
合计
感兴趣
不感兴趣
性别
女生
a
b
a+b
男生
c
d
c+d
合计
a+c
b+d
100
参考数据:
P(χ2≥x0)
0.1
0.05
0.01
0.005
0.001
x0
2.706
3.841
6.635
7.879
10.828
A.表中a=12,c=30
B.可以估计该校高一新生中对数学不感兴趣的女生比男生多
C.有95%的把握认为性别与对数学的兴趣有关
D.有99%的把握认为性别与对数学的兴趣有关
2.(2024山东潍坊昌邑第一中学月考)为了调查学生是否喜欢网络课程,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为20k(k∈N+),则k= .
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0)
0.1
0.05
0.01
0.005
0.001
x0
2.706
3.841
6.635
7.879
10.828
3.(2024江西吉安期末)某校对学生餐厅的就餐环境、菜品种类与质量等方面进行了改造与提升,随机抽取100名男生与100名女生对就餐满意度进行问卷评分(满分100分)调查,调查结果统计如下表:
评分分组
70分以下
[70,80)
[80,90)
[90,100]
男生
3
27
38
32
女生
5
35
34
26
学校规定:评分大于或等于80分为满意,小于80分为不满意.
(1)由以上数据完成下面的2×2列联表,并判断是否有90%的把握认为学生的就餐满意度与性别有关联;
满意
不满意
总计
男生
女生
总计
(2)从男生、女生中评分在70分以下的学生中任意选取3人进行座谈调研,记X为3人中男生的人数,求X的概率分布及数学期望.
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0)
0.1
0.05
0.01
x0
2.706
3.841
6.635
4.(2024江苏泰州兴化中学期末)为培养学生的阅读习惯,某学校规定所有学生每天在校阅读时长不得少于1小时.若认为每天在校阅读时长不少于1小时为达标,达到2小时的学生为“阅读之星”.假设该校学生每天在校阅读时长X~N(1.5,σ2)(X的单位:小时),达标学生是“阅读之星”的概率为.
(1)从该校学生中随机选出1人,求其达标的概率;
(2)为进一步了解该校学生不达标是否与性别有关,随机调查了90名学生,其中男生占,已知不达标的人数恰是其均值,且不达标的学生中男生占,是否有99%的把握认为不达标与性别有关?
参考公式: χ2=,其中n=a+b+c+d.
参考数据:
P(χ2≥x0)
0.050
0.025
0.010
0.001
x0
3.841
5.024
6.635
10.828
5.(2025江苏南京大学附属中学月考)某校举办了有关五四运动的知识竞赛活动,为了调查学生对本次活动的满意度,从该校学生中随机抽取一个容量为m(m∈N*)的样本进行调查,调查结果如下表:
满意
不满意
合计
男生
m
m
女生
合计
m
(1)完成上面的列联表,若有不少于99%的把握认为“性别与满意度有关系”,求样本容量m的最小值;
(2)假设本次知识竞赛的晋级环节设置3道必答题目,至少答对2道题目则晋级,否则被淘汰.某年级有20名同学进入晋级环节,根据统计,每人答对第1题、第2题、第3题的概率分别为,且3道题目答对与否互不影响.
(i)用X表示这20人中晋级的人数,求E(X);
(ii)记这20人中有k(k∈N)人晋级的概率为P(k),求P(k)取得最大值时的k的值.
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0)
0.1
0.05
0.01
0.001
x0
2.706
3.841
6.635
10.828
6.(2025江苏南通海安高级中学月考)为了测试一种新药对某种疾病的治疗效果,研究人员对一地区某种动物种群(数量较大)进行试验,从该试验种群中随机抽查了80只,得到如下的样本数据(单位:只):
发病
没发病
合计
使用药物
10
30
40
没使用药物
25
15
40
合计
35
45
80
(1)是否有99.9%的把握认为该药物与预防该疾病有关?
(2)从该地区此动物群中任取一只,用事件A表示此动物发病,表示此动物没发病,B表示此动物使用药物,定义事件A的优势R1=,在事件B发生的条件下A的优势R2=,证明:,并利用表中数据求出的值;
(3)若把表中的频率视为概率,现从该地区没发病的动物中抽取3只动物,记抽取的3只动物中使用药物的只数为X,求随机变量X的概率分布及数学期望.
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0)
0.050
0.010
0.001
x0
3.841
6.635
10.828
7.(2025江苏南京中华中学月考)某学校有甲、乙、丙三家餐厅,分布在生活区的南、北两个区域,其中甲、乙餐厅在南区,丙餐厅在北区,各餐厅菜品丰富多样,可以满足学生的不同口味和需求.
(1)现对学生性别与在南、北两个区域就餐的相关性进行分析,得到下表所示的抽样数据,是否有90%的把握认为在不同区域就餐与学生性别有关联?
就餐区域
南区
北区
性别
男
25
15
女
15
5
(2)张同学选择餐厅就餐时,如果前一天去甲餐厅,那么后一天去甲、乙餐厅的概率均为;如果前一天去乙餐厅,那么后一天去甲、丙餐厅的概率分别为;如果前一天去丙餐厅,那么后一天去甲、乙餐厅的概率均为.张同学第1天选择甲、乙、丙餐厅就餐的概率分别为.
(i)求张同学第2天去乙餐厅就餐的概率;
(ii)求张同学第n(n∈N*)天去甲餐厅就餐的概率pn.
附:χ2=,n=a+b+c+d.
P(χ2≥x0)
0.100
0.050
0.025
0.010
x0
2.706
3.841
5.024
6.635
答案与分层梯度式解析
基础过关练
1.D
3.C
4.BC
1.D 依题意,得,解得c=20,由10+b+20+30=105,得b=45.
补全列联表如下:
优秀
非优秀
总计
甲班
10
45
55
乙班
20
30
50
总计
30
75
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关系.
2.答案 24
解析 由题意得
3.C 对于A, ;
对于B, ;
对于C, ;
对于D, .
显然最大,故C正确.
4.BC 由题表中数据知,该校某名学生为“古文迷”的概率为≠0.6,A错误.
男生共4 000名,女生共5 000名,随机调查了40名男生和50名女生,4 000∶5 000=40∶50,符合分层抽样的抽样方法,B正确.
提出假设H0:学生是不是“古文迷”与性别无关,由题表中数据得χ2==9,因为当H0成立时, χ2≥6.635的概率约为0.01,所以我们有99%的把握认为学生是不是“古文迷”与性别有关系,故C正确,D错误.
5.解析 (1)由题意得抽取男生人数为×100=60,抽取女生人数为100-60=40,
男生的平均分×(45×3+55×9+65×18+75×15+85×6+95×9)=71.5分,
女生的平均分×(45×6+55×4+65×5+75×10+85×13+95×2)=71.5分,
故,因此不能认为数学成绩与性别有关.
(2)由频数分布表可知,在抽取的100名学生中,男生中分数为优分的有15人,女生中分数为优分的有15人,据此可得2×2列联表如下:
优分
非优分
合计
男生
15
45
60
女生
15
25
40
合计
30
70
100
提出假设H0:数学成绩是否优分与性别无关,
由表中数据得χ2=≈1.786<2.706,
所以没有90%的把握认为“数学成绩是否优分与性别有关”.
6.解析 (1)2×2列联表如下:
年长者
年轻人
总计
喜欢阅读电子书
6
24
30
喜欢阅读纸质书
12
18
30
总计
18
42
60
提出假设H0:是否喜欢阅读电子书与年龄无关,由表中数据得χ2=≈2.857>2.706,
因为当H0成立时, χ2≥2.706的概率约为0.1,
所以有90%的把握认为是否喜欢阅读电子书与年龄有关.
(2)由题意得,抽到喜欢阅读电子书的年轻人人数为4,喜欢阅读纸质书的年轻人人数为3,所以X的所有取值为0,1,2,3.
P(X=0)=,
P(X=2)=,
所以X的概率分布为
X
0
1
2
3
P
所以E(X)=0×.
能力提升练
1.AC 由题可知,抽取的男生人数为600×=60,抽取的女生人数为400×=40,由题中条形图知,抽取的男生中感兴趣的人数为60×0.5=30,不感兴趣的人数为60×0.5=30,抽取的女生中感兴趣的人数为40×0.3=12,不感兴趣的人数为40×0.7=28,
故2×2列联表如下:
对数学的兴趣
合计
感兴趣
不感兴趣
性别
女生
12
28
40
男生
30
30
60
合计
42
58
100
由此表可知,a=12,c=30,故A正确;
用样本估计总体,可知该校高一新生中,对数学不感兴趣的女生人数约为400×=280,对数学不感兴趣的男生人数约为600×=300,
所以估计该校高一新生中对数学不感兴趣的女生比男生少,故B错误;
提出假设H0:性别与对数学的兴趣无关,
易得χ2=≈3.941>3.841,
因为当H0成立时,χ2≥3.841的概率约为0.05,所以有95%的把握认为性别与对数学的兴趣有关,故C正确;
由C中分析知χ2≈3.941<6.635,
所以没有99%的把握认为性别与对数学的兴趣有关,故D错误.
2.答案 5或6
解析 根据题意,2×2列联表为
是否喜欢网络课程
合计
喜欢
不喜欢
性别
男生
8k
2k
10k
女生
6k
4k
10k
合计
14k
6k
20k
提出假设H0:喜欢网络课程与性别无关,
由表中数据得χ2=.
因为有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,
所以3.841≤<6.635,所以4.033 05≤k<6.966 75,
又k∈N*,所以k=5或k=6.
3.解析 (1)由题意得2×2列联表为
满意
不满意
总计
男生
70
30
100
女生
60
40
100
总计
130
70
200
提出假设H0:学生的就餐满意度与性别无关,
χ2=≈2.198<2.706,
所以没有90%的把握认为学生的就餐满意度与性别有关联.
(2)由已知得X的所有可能取值为0,1,2,3,
P(X=0)=,
P(X=2)=,
所以X的概率分布为
X
0
1
2
3
P
则E(X)=0×.
4.解析 (1)从该校学生中随机选出1人,记其达标为事件A,是“阅读之星”为事件B,
由题意得P(A)=P(X≥1),P(B)=P(AB)=P(X≥2),
所以P(B)=1-P(A),
又达标学生是“阅读之星”的概率为,
所以P(B|A)=,解得P(A)=,
即从该校学生中随机选出1人,其达标的概率为.
(2)依题意,随机调查的90名学生中,男生人数为40,女生人数为50.
设这90名学生中,不达标的学生人数为Y.
由(1)知,不达标的概率为,则Y~B,
所以E(Y)=90×=18,即不达标的人数为18.
因为不达标的学生中有是男生,所以不达标的男生人数为3,不达标的女生人数为15,则达标的男生人数为37,达标的女生人数为35,得到如下2×2列联表:
男生
女生
合计
达标
37
35
72
不达标
3
15
18
合计
40
50
90
提出假设H0:不达标与性别无关,
χ2==7.031 25>6.635.
因为当H0成立时, χ2≥6.635的概率约为0.01,所以有99%的把握认为不达标与性别有关.
5.解析 (1)由题意得2×2列联表如下:
满意
不满意
合计
男生
m
m
m
女生
m
m
m
合计
m
m
m
提出假设H0:性别与满意度没有关系.
易得χ2=.
由题意得χ2=≥6.635,解得m≥82.937 5.
由题意得,m为30的整数倍,所以m的最小值为90.
(2)(i)用事件A1表示答对第1题,A2表示答对第2题,A3表示答对第3题,B表示该年级的20名同学中任意一人晋级,
则P(A1)=,则P(B)=P(A1A2A3)+P()
=.
由题意得,X~B,所以E(X)=20×.
(ii)易得P(k)=,k=0,1,2,3,…,20,
由题意得
解得≤k≤,所以k=12,故P(k)取得最大值时的k的值为12.
6.解析 (1)提出假设H0:该药物与预防该疾病无关,
根据题表得χ2=≈11.429>10.828,
因为当H0成立时, χ2≥10.828的概率约为0.001,
所以有99.9%的把握认为该药物与预防该疾病有关.
(2).
由题表中数据可知,P(B|A)=,
则.
(3)从该地区没发病的动物中任取1只,其使用药物的概率为,则X~B,
X的所有可能取值为0,1,2,3,
P(X=0)=,
P(X=1)=,
P(X=2)=,
P(X=3)=,
所以X的概率分布为
X
0
1
2
3
P
E(X)=3×=2.
7.解析 (1)提出假设H0:在不同区域就餐与学生性别没有关联,
易得χ2==0.937 5<2.706,
所以没有90%的把握认为在不同区域就餐与学生性别有关联.
(2)设Ai=“第i天去甲餐厅就餐”,Bi=“第i天去乙餐厅就餐”,Ci=“第i天去丙餐厅就餐”,i=1,2,…,n,则Ai,Bi,Ci两两相互独立.
由题意得P(A1)=P(B1)=,
P(Ai+1|Ci)=.
(i)易知B2=A1B2+C1B2,
所以P(B2)=P(A1B2+C1B2)=P(A1)P(B2|A1)+P(C1)·P(B2|C1)=,
即张同学第2天去乙餐厅就餐的概率为.
(ii)设张同学第n(n∈N*)天去乙、丙餐厅就餐的概率分别为qn,rn,则p1=q1=.
当n≥2时,由全概率公式得
pn=P(An)=P(An-1An+Bn-1An+Cn-1An)
=P(An-1An)+P(Bn-1An)+P(Cn-1An)
=P(An-1)P(An|An-1)+P(Bn-1)P(An|Bn-1)+P(Cn-1)·P(An|Cn-1),
所以pn=rn-1(n≥2)①.
同理,得qn=rn-1(n≥2)②,rn=qn-1(n≥2)③,pn+qn+rn=1④.
由①②得pn=qn+qn-1(n≥2),
由④得pn-1=1-qn-1-rn-1(n≥2),代入②,得qn=qn-1(n≥2),即qn-(n≥2),
又q1-≠0,
所以数列是首项为-,公比为-的等比数列,
所以qn-,即qn=,
所以当n≥2时,pn=qn+;
当n=1时,p1=,不满足上式.
综上,pn=
25
学科网(北京)股份有限公司
$