内容正文:
专题8.3 2x2列联表
教学目标
1.通过实例,理解2×2列联表的统计意义。
2.了解随机变量χ2的意义。
教学重难点
1.重点
(1)掌握判断两个分类变量是否有关系的常用方法;
2.难点
(1)过对典型案例分析,了解独立性检验的基本思想和方法;
知识点01 2×2列联表
分类变量:这里所说的变量和值不一定是具体的数值,例如性别变量,其取值为男和女两种.我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
2×2列联表
定义一对分类变量X和Y,我们整理数据如表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
上表是关于分类变量X和Y的抽样数据的2×2列联表,最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数n是样本空间中样本点的总数.
【即学即练】
1.一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
【答案】B
【分析】由列联表数据,列出等式即可求解;
【详解】由,得.
由,得.
由,得.
由,得.
故选:B
知识点02 独立性检验
要检验两个随机变量是否有关,统计上一般先假设它们没有关系,即相互独立,再进行统计检验;这种假设称为原假设,也称为零假设;习惯上用H0表示;
独立性检验:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
独立性检验的公式:由χ2=经过变形可得到
χ2=,其中n=a+b+c+d,用随机变量χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.
临界值:对于任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)=α.称xα为α的临界值.临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大.
χ2独立性检验中五个常用的小概率值和相应的临界值.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【特别提醒】 (1)χ2越小,独立性越强,相关性越弱;χ2越大,独立性越弱,相关性越强.
(2)对于零假设H0:分类变量X和Y独立,基于小概率值α的检验规则:
①当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
②当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
【即学即练】
2.某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20.下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.有的把握认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
【答案】B
【分析】求得卡方值,比对临界值,逐个判断即可.
【详解】由题意,列出列联表:
接受
不接受
合计
男
40
60
100
女
20
80
100
合计
60
140
200
零假设为:是否接受去外地长时间出差与性别相互独立,即是否接受去外地长时间出差与性别无关,
所以,
根据小概率值的独立性检验,我们推断不成立,
即认为是否接受去外地长时间出差与性别有关,此推断犯错误的概率不大于0.005.
故选:B.
题型01 列联表完善与分析
【典例1】地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【分析】根据题意,得到如下两个列联表,再一一分析即可.
【详解】根据题意,得到如下两个列联表.
35岁以上
35岁及以下
总计
男性
女性
总计
35岁以上
35岁及以下
总计
男性
女性
总计
根据第1个列联表可知,样本中男性市民人数为,
女性市民人数为,又,即样本中男性比女性多,故A正确;
根据第2个列联表可知,样本中35岁以上女性市民人数为,
35岁及以下女性市民人数为,又,即样本中多数女性是35岁以上,故B正确;
由题意,,所以,故C不正确;
根据第2个列联表可知,样本中35岁以上市民人数为,
35岁及以下市民人数为,又,
即样本中35岁以上的市民比35岁及以下的多,故D正确.
故选:C.
【变式1-1】下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【答案】C
【分析】根据联表计算求参即可.
【详解】因为.所以.又,所以.
故选:C.
【变式1-2】第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中, .
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
【答案】
【分析】根据题意,利用志愿者的总人数为100,列出方程,即可求解.
【详解】根据表格中的数据,因为志愿者的总人数为100,所以,
解得.
故答案为:.
【变式1-3】有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【答案】D
【分析】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【详解】依题意,解得,由解得.
补全列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D
题型02 独立性检验的概念及辨析
【典例2】根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
【答案】B
【分析】根据独立性检验的概念可得正确的选项.
【详解】因为,所以在显著性水平下,
没有充分证据拒绝原假设,因此我们认为变量与是独立的,
故选:B
【变式2-1】7.为比较甲、乙两所学校学生的数学水平,采用了如下方法:
第1步,科学抽样.采用简单随机抽样方法从两所学校共抽取88名学生,且对这88名学生进行测验;
第2步,收集数据.测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生有7名学生数学成绩优秀,并做出了如下的列联表:
学校
数学成绩
合计
不优秀
优秀
甲校
33
10
43
乙校
38
7
45
合计
71
17
88
第3步,提出零假设.零假设:两校学生的数学成绩优秀率无差异,
第4步,计算.计算得到,
第5步:判断.根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为两校的数学成绩优秀率没有差异.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
若将列联表中所有数据都扩大到原来的10倍,则下列说法正确的是( )
A.根据小概率值的独立性检验,两校的数学成绩优秀率没有差异
B.根据小概率值的独立性检验,两校的数学成绩优秀率没有差异
C.有99%的把握认为学生的数学成绩是否优秀与学校有关
D.学生的数学成绩是否优秀与学校有关,该推断犯错误的概率不超过0.001
【答案】C
【分析】列出新的列联表,计算后比较即可.
【详解】由题,列出新的列联表如下:
学校
数学成绩
合计
不优秀
优秀
甲校
330
100
430
乙校
380
70
450
合计
710
170
880
代入卡方公式:
,其中,
所以,
,
所以认为 “学生的数学成绩是否优秀与学校有关”,且有的把握,
故AB错误.
且推断犯错误的概率不超过0.01,不是0.001,故错误.
故选:C.
【变式2-2】已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α= 的χ2独立性检验,分析喜欢该项体育运动与性别有关.
【答案】0.01
【分析】根据已知与临界值比较结合独立性检验的概念判断即可.
【详解】因为6.635<7.235<10.828,所以根据小概率值α=0.01的χ2独立性检验,分析喜欢该项体育运动与性别有关.
故答案为:0.01.
【变式2-3】在性别与吃零食这两个分类变量的计算中,下列说法正确的是( )
①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误.
A.①② B.①③ C.②③ D.③
【答案】D
【分析】由独立性检验相关概念可得答案.
【详解】①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性,故①不正确;
②独立性检验是用来考察两个分类变量是否具有关联性,并且能较精确地给出这种判断的可靠程度,
而不是给出事件的概率,故②不正确;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误,③正确。
故选:D
题型03 χ2的计算
【典例3】为了了解疾病是否与性别有关,在某医院随机地对入院的50人进行了问卷调查,得到了如下的列联表:则认为疾病与性别有关的把握约为( )
患疾病
不患疾病
总计
男
20
5
25
女
10
15
25
总计
30
20
50
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A. B. C. D.
【答案】C
【分析】根据所给的列联表数据计算,将其与临界值表进行比较,即可得到答案.
【详解】由公式得,
故有的把握认为疾病与性别有关,
故选:C
【变式3-1】为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取100名学生.通过测验得到如下的列联表:
单位:人
学校
数学成绩
合计
不优秀
优秀
甲
40
10
50
乙
30
20
50
合计
70
30
100
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
下列结论正确的是( )
A.依据小概率值的独立性检验,认为两校学生的数学成绩优秀率无差异
B.依据小概率值的独立性检验,认为两校学生的数学成绩优秀率有差异
C.依据小概率值的独立性检验,认为两校学生的数学成绩优秀率有差异
D.依据小概率值的独立性检验,认为两校学生的数学成绩优秀率有差异
【答案】B
【分析】根据独立性检验的基本思想,结合已知计算得,逐项进行分析即可求解.
【详解】零假设为:两校学生的数学成绩优秀率无差异,
A,若,因为,故有充分的证据推断不成立,
即两校学生的数学成绩优秀率有差异,故A错误;
B,若,因为,故有充分的证据推断不成立,
即两校学生的数学成绩优秀率有差异,故B正确;
C,若,因为,故没有充分的证据推断不成立,
即两校学生的数学成绩优秀率无差异,故C错误;
D,若,因为,故没有充分的证据推断不成立,
即两校学生的数学成绩优秀率无差异,故D错误.
故选:B
【变式3-2】为研究某新药的疗效,给100名患者服用此药,跟踪调查后得如表所示的数据:
单位:名
性别
疗效
合计
无效
有效
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
α
0.100
0.050
0.010
2.706
3.841
6.635
设:服用此药的效果与患者的性别无关,(小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的概率不大于 .
【答案】0.05
【分析】计算卡方,再由独立性检验比较可得.
【详解】由公式计算得,根据小概率值的独立性检验,认为服用此药的效果与患者的性别有关,判断出错的概率不大于0.05.
故答案为:0.05.
【变式3-3】 2025年春节期间,电影《哪吒之魔童闹海》掀起全民观影热潮,连续7天票房逆势攀升,单日最高突破8.6亿元,吸引部分家庭扶老携幼共赴影院,缔造中国影史春节档票房与观影人次双冠王的奇迹.某电影院为了解民众观影的喜欢程度,随机采访了180名观影人员,得到下表:
是否成年人
是否喜欢
合计
不喜欢
喜欢
未成年人
80
100
成年人
20
80
合计
180
依据小概率值的独立性检验,能否认为喜欢电影《哪吒之魔童闹海》与是否成年有关?
参考公式:
0.1
0.05
0.01
2.706
3.841
6.635
【答案】没有充分证据证明喜欢电影《哪吒之魔童闹海》与是否成年有关
【分析】先由题意补充完整列联表,分别算出值,再根据公式计算得值,然后根据临界值表作出判断即可.
【详解】由题意,
零假设:喜欢电影《哪吒之魔童闹海》与是否成年无关.
由题意补充完整列联表,分别算出,代入公式得:.
根据小概率值的独立性检验,没有充分证据证明喜欢电影《哪吒之魔童闹海》与是否成年有关.
题型04 独立性检验解决实际问题
【典例4】某校有高一学生1800人,高二学生1200人,学校采取按比例分配的分层抽样的方式从中抽取100人进行体育测试.测试后,统计得到高一样本的一分钟跳绳次数的均值为165,方差为61,高二样本的一分钟跳绳次数的均值为145,方差为31.
(1)计算总样本的一分钟跳绳次数的均值和方差;
(2)将一分钟跳绳次数视为及格,整理出以下列联表:
及格
不及格
合计
高一
52
8
60
高二
38
2
40
合计
90
10
100
试根据小概率值的独立性检验,分析一分钟跳绳次数及格情况是否与年级有关;(结果保留小数点后三位)
(3)如果将(2)表格中的所有数据都扩大为原来的10倍,在相同的检验标准下,再用独立性检验推断一分钟跳绳次数及格情况与年级之间的关联性,结果还一样吗?请你试着解释其中的原因.
附:,.
独立性检验中几个常用的小概率值和相应的临界值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)均值157,方差145
(2)无关
(3)不一样,结论变为有关,理由见解析
【分析】(1)根据分层抽样计算均值和方差即可;
(2)根据卡方检验,即可判断;
(3)计算出新的卡方即可进行判断.
【详解】(1)高一人数占比,故样本量为,同理高二样本量为40,
所以总样本均值为,
总样本方差为.
(2)零假设为:一分钟跳绳次数及格情况与年级无关,
根据列联表,,
所以根据小概率值的独立性检验,推断成立,即一分钟跳绳次数及格情况与年级无关.
(3)将(2)表格中的所有数据都扩大为原来的10倍,
则,
所以根据小概率值的独立性检验,推断不成立,即一分钟跳绳次数及格情况与年级有关,
所以将(2)表格中的所有数据都扩大为原来的10倍,结果不一样,
因为样本量增大使得相对差异的绝对值增大,导致卡方统计量显著上升.
【变式4-1】28.随着双休政策落实,高中生有更多的时间进行体育锻炼.为了解高中生周末体育锻炼时长,在某高中三个年级中随机抽取50名男生和50名女生,其中男生体育锻炼时长超过两小时的有40名,女生体育锻炼时长不超过两小时的有20名.
(1)依据的独立性检验,判断周末体育锻炼时长与性别是否有关联;
(2)用样本频率作为概率,从该校学生中随机抽取10人进行调查,记周末体育锻炼时长超过两小时的人数为,求的数学期望和方差.
参考公式及数据:,其中.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)与性别无关
(2)7,2.1
【分析】(1)先进行零假设,即认为学生周末体育锻炼时长与性别无关联.据题意,可得性别与锻炼时长的列联表,计算,依据的独立性检验,进行判断即可;
(2)根据所给数据,用样本频率作为概率,计算一名学生周末体育锻炼时长超过两小时的概率,根据服从二项分布,求得的数学期望和方差.
【详解】(1)零假设为:认为学生周末体育锻炼时长与性别无关联.
列联表如下:
时长性别
锻炼时长超过2小时
锻炼时长不超过2小时
合计
男生
40
10
50
女生
30
20
50
合计
70
30
100
则,
依据的独立性检验,可以认为成立,因此认为该校学生的周末体育锻炼时长与性别无关.
(2)由(1)知,该校学生周末体育锻炼时长超过两小时的样本频率为,
用样本频率作为概率,知从该校学生中随机抽取1人进行调查,则该同学周末体育锻炼时长超过两小时的概率为.
设抽取的10名学生中体育锻炼时长超过两小时的人数为,
由题意知,随机变量,
故,.
【变式4-2】30.某医院用a,b两种疗法治疗某种疾病,采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:
未治愈
治愈
合计
疗法a
15
52
67
疗法b
6
63
69
合计
21
115
136
(1)根据小概率值的独立性检验,分析b种疗法的效果是否比a种疗法效果好;
(2)为提高临床医疗安全性,提高疾病的治愈率及好转率,同时降低医疗费用,降低患者医疗负担.该医院对于a,b两种疗法进行联合改进,研究了甲、乙两种联合治疗方案,现有6位症状相同的确诊患者,平均分成A,B两组,A组用甲方案,B组用乙方案.一个疗程后,A组中每人康复的概率都为,B组3人康复的概率分别为,,.若一个疗程后,每康复1人积2分,假设认定:积分期望值越高疗法越好,请问甲、乙哪种联合治疗方案更好?
参考公式及数据:
0.05
0.025
0.010
0.005
0.001
3.841
5.024
6.635
7.879
10.828
,,.
【答案】(1)认为两种疗法效果没有差异
(2)乙种联合治疗方案更好.
【分析】(1)零假设为:a疗法与b疗法独立,即两种疗法效果没有差异,求出,对比临界值表即可;
(2)设用甲方案治疗组中康复的人数为,积分为,则,设用乙方案治疗B组中康复的人数为,积分为,分别求出与的均值,再根据均值的性质求与的均值,比较即可.
【详解】(1)零假设为:a疗法与b疗法独立,即两种疗法效果没有差异,
根据列联表中数据,经过计算得到,
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为两种疗法效果没有差异.
(2)设A组中用甲方案治疗康复的人数为,则,
所以,
设A组的积分为,则,
所以.
设B组中用乙方案治疗康复的人数为,
则的可能取值为:0,1,2,3,
,
,
,
,
故的分布列为:
0
1
2
3
P
所以,
设B组的积分为,则,所以.
因为5.5>4,所以乙种联合治疗方案更好.
【变式4-3】青岛文旅为了解天气状况对景点旅游满意度的影响,分别于晴天和阴雨天在栈桥景点共调查了100位游客,调查结果如下表.
满意
不满意
合计
晴天
40
阴雨天
20
合计
70
100
(1)完善上述表格,并根据小概率值的独立性检验,能否认为天气状况对该景点旅游满意度有影响;
(2)从这100位游客中任选两人,在两人调查当天的天气状况一致的条件下,试求他们对该景点均满意的概率;
(3)天气多变,文旅部门根据以往数据,为游客发布如下天气信息:若第1天为晴天,则第2天为晴天的概率为,为阴雨天的概率为;若第1天为阴雨天,则第2天为阴雨天的概率为,为晴天的概率为.已知第1天是晴天.求第天仍是晴天的概率,并求前天晴天的天数的期望.
附录:,.
0.05
0.010
0.005
3.841
6.635
7.879
【答案】(1)答案见解析
(2)
(3)
【分析】(1)先补全列联表,再计算最后与临界值表比较即可得解;
(2)根据条件概率公式计算求解;
(3)根据题意得到的递推关系式,根据递推关系式得到是等比数列,求出的通项公式,结合等比数列求和及两点分布性质最后求出数学期望.
【详解】(1)零假设 :天气状况与满意度独立;
列联表如下:
满意
不满意
合计
晴天
40
10
50
阴雨天
30
20
50
合计
70
30
100
,
根据小概率值的独立性检验,零假设不成立,即认为天气状况对该景点旅游满意度有影响;
(2)记事件A为两人调查当天的天气状况一致,事件B为他们对该景点均满意,
所以
(3)由题意知,
所以,
所以数列是首项为,公比为的等比数列,
所以,所以.
某一天要么是晴天,要么是阴雨天,符合两点分布,记第i天为,
所以
所以.
一、单选题
1.考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【答案】C
【分析】根据表格提供的数据作出判断.
【详解】由列联表中的数据可知,
种子经过处理,得病的比例明显降低,
种子未经过处理,得病的比例要高些,
所以可得结论:种子是否经过处理跟是否生病有关.
故选:C
2.某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
【答案】D
【分析】根据题意先得出的值,进而再得的值,进而可知的值.
【详解】因为抽取的村民中,老年人有25名,年轻人有25名,所以,
所以,A、B对;
所以,则对;
则错.
故选:.
3.某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用列联表计算得的观测值.
附表:
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )
A. B. C. D.
【答案】B
【分析】由独立性检验的原理的理解辨析可判断.
【详解】由题意知观测值,所以对照题中的附表可作出“这种血清能起到预防感冒的作用”出错的可能性不超过的结论.
故选:B
4.为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
【答案】A
【分析】根据卡方独立性检验规则,比较与临界值即可得出结论.
【详解】因为,所以牛的毛色与角无关.
故选:A.
5.某单位对员工是否愿意被外派与年龄的关系进行了一次谓查,根据独立性检验原理,处理所得数据之后发现,得到“是否愿意被外派与年龄有关”这个结论犯错误的概率大于0.001,而不大于0.01,则的值可能为( )
附表:
0.05
0.01
0.001
3.841
6.635
10.828
A.3.206 B.6.561 C.7.879 D.11.028
【答案】C
【分析】由题意,结合小概率表,可判断的值应位于与之间,得到答案.
【详解】由题意得的值应位于与之间,故C正确,ABD错误.
故选:C
6.根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
【答案】D
【分析】根据给定条件,利用独立性检验的意义逐项判断即得.
【详解】由,得吸烟与患肺癌有关联,此推断犯错误的概率不大于1%,D正确;
卡方检验仅说明吸烟与患肺癌两个变量间的关联性,无法量化个体情况,这两个变量间也无因果关系,ABC错误.
故选:D
7.校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
【答案】A
【分析】设总人数为,根据给定条件,求出的观测值并建立不等式,进而求出的最小整数值得解.
【详解】设总人数为,则男生选学生物学的人数为,女生选学生物学的人数为,
则列联表为:
男生
女生
合计
选生物学
不选生物学
合计
m
m
2m
因此,
即,又为的倍数,所以男生最少有人.
故选:A
二、填空题
8.“双减”提出要全面减负作业总量和时长,减轻学生过重作业负担,同时坚持从严治理, 全面规范校外培训行为.在“双减”颁布前,某地教育局为了解当地中学生参加校外培训的情况,随机调查了当地100名学生,得到的数据如下表:
参加校外培训
未参加校外培训
总计
初中生
30
20
50
高中生
40
10
50
总计
70
30
100
根据该表格,在“双减”颁布前, 95%的把握认为学生是否参加校外培训与年级段有关.(填“有”或“没有”)
参考临界值表:
0.10
0.05
0.010
2.706
3.841
6.635
.
【答案】有
【分析】根据公式计算出,然后对照临界值表即可作出正确判断.
【详解】由题可知,,
因为,
所以有95%的把握认为学生是否参加校外培训与年级段有关.
故答案为:有.
9.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人
0.050
0.010
0.001
3.841
6.635
10.828
参考数据及公式如下:参考公式:,其中.
【答案】48
【分析】设男生人数为,依题意列出列联表,分析出根据小概率值的独立性检验,判断中学生追星与性别有关,则,再代入的公式求出的范围,再根据的实际意义即可求出男生的最少人数.
【详解】设男生人数为,依题意可得列联表为
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,
由,解得.
由题意知,应为6的整数倍,
所以若根据小概率值的独立性检验,
判断中学生追星与性别有关,则男生至少有48人.
故答案为:48.
10.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到,因为,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为 .
【答案】
【分析】根据临界值表结合已知数据分析判断即可.
【详解】因为,
所以依据小概率值的独立性检验,认为主修统计专业与性别有关,出错的可能性最大为.
其中临界值表如下:
故答案为:.
11.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:
患慢性气管炎
未患慢性气管炎
总计
吸烟
20
20
40
不吸烟
5
55
60
总计
25
75
100
根据列联表数据,求得 (保留3位有效数字),根据下表,在犯错误的概率不超 的前提下认为患慢性气管炎与吸烟有关.
附:
0.050
0.010
0.001
3.841
6.635
10.828
【答案】 22.2 0.001
【分析】利用卡方检验公式计算统计量,再与临界值比较,得出相关性结论.
【详解】根据卡方检验公式,其中,,,,.
,
,
则.
因为,
所以在犯错误的概率不超过的前提下认为患慢性气管炎与吸烟有关.
故答案为:;
三、解答题
12.某工厂推出一款新产品,为了调查顾客对该新产品的满意程度,厂家分别对甲地的300名使用者和乙地的200名使用者进行问卷调查,统计并得到如下列联表:
甲地使用者
乙地使用者
合计
不满意
100
50
150
满意
200
150
350
合计
300
200
500
(1)根据小概率值的独立性检验,分析使用者的满意度是否与区域有关;
(2)从使用该产品不满意的顾客中,采用分层抽样的方法随机抽取9名使用者,再从这9名使用者中随机抽取4人进一步调研,记4人中乙地人数为,求的分布列和数学期望.
附录:.
0.15
0.1
0.05
0.025
0.01
0.001
2.072
2.706
3.841
5.024
6.635
10.828
【答案】(1)认为使用者的满意度与区域无关
(2)分布列见解析,
【分析】(1)提出零假设,计算卡方值,将其与小概率值对应的临界值比较即得结果.
(2)求出抽样比,确定所抽取的9名使用者中,甲地与乙地使用者的人数,依题意确定的可能值,利用超几何分布概率公式求出相应的概率,列出分布列,计算数学期望即可.
【详解】(1)零假设为:使用者的满意度与区域无关,代入列联表中的数据可得:
根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,
故可认为使用者的满意度与区域无关.
(2)从使用该产品不满意的顾客中,采用分层抽样的方法,得到甲地使用者与乙地使用者的抽样比为,
则9名使用者中甲地6人、乙地3人.
因为4人中乙地人数为,所以的可能取值为,其对应的概率分别为:
,
,
的分布列为:
0
1
2
3
故数学期望为
13.某工厂新引进了一套设备用于提高产品的质量,现将新设备生产的1000件产品的质量指标值统计如图所示.
(1)为了比较新旧设备生产的产品之间的质量是否有差异,研究人员将旧设备生产的产品情况和新设备生产的这1000件产品情况进行比较(以质量指标值是否超过75为依据),得到的数据统计如下表所示,依据小概率值的独立性检验,能否认定产品质量与设备的新旧有关联?
设备
产品质量指标值
超过75
不超过75
新设备
旧设备
100
900
(2)以频率估计概率,若从新设备生产的产品中随机抽取4件,记质量指标值在的产品数为,求的分布列以及数学期望.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【答案】(1)能认定产品质量与设备的新旧有关联
(2)分布列见解析,.
【分析】(1)根据题意产品的质量指标值超过和不超过的件数,完善列联表,计算值判断即可;
(2)先计算质量指标值在的频率为,进而根据频率估计概率得质量指标值在的产品数为,再结合二项分布求解即可.
【详解】(1)解:由频率分布直方图可知,产品的质量指标值超过的频率为,
所以产品的质量指标值超过的有件,
所以产品的质量指标值不超过的有件,
故列联表如下:
设备
产品质量指标值
合计
超过75
不超过75
新设备
250
750
1000
旧设备
100
900
1000
合计
350
1650
2000
假设:产品质量与设备的新旧无关联,
,
所以依据小概率值的独立性检验,能认定产品质量与设备的新旧有关联.
(2)解:新设备产品质量指标值在的频率为:,
故根据频率估计概率,质量指标值在的概率为,
所以随机抽取4件,记质量指标值在的产品数为,
所以;;
;;
,
所以的分布列如下表:
0
1
2
3
4
所以,数学期望.
14.目前,AI赋能语音识别技术已从实验室的“概念验证”发展为改变人类生活的基础设施,随着大模型和多模态技术的融合,英文识别将不再是单一功能,也是智能系统理解世界的“耳朵”和“眼睛”,推动人机交互从“命令执行”向“自然对话”演进.现甲、乙两名同学通过英文指令与某AI智能体人机交互共生成200篇文章.若生成的文章达到专业要求,不用进一步改良,视为合格.现已知甲同学生成的文章有80篇合格,占甲同学生成文章总数的,乙同学生成的文章有一半合格.
(1)请根据以上数据填写下面的列联表,并推断能否有95%的把握认为生成的文章是否合格与甲、乙(不同的)同学给出的指令有关?
生成的文章合格
生成的文章不合格
总计
甲同学
80
乙同学
总计
200
(2)经试验,若给出的指令够准确具体,该智能体生成文章合格的概率为,则在此条件下从该智能体生成的一批文章中随机调取3篇,请写出其中合格的篇数的分布列,并算出期望.
附:,其中(结果精确到0.001).
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,有95%的把握;
(2)分布列见解析,
【分析】(1)根据题意,得出列联表,求得的值,结合附表,即可得到结论;
(2)根据题意,得到的可能取值,得出服从二项分布,求得相应的概率,得出分布列,求得数学期望.
【详解】(1)由题意得
生成文章合格
生成文章不合格
总计
甲同学
80
40
120
乙同学
40
40
80
总计
120
80
200
零假设生成的文章是否合格与甲、乙同学给出的指令无关,
,
∵,所以我们推断不成立,
所以有95%的把握认为生成文章是否合格与甲、乙(不同的)同学给出的指令有关;
(2)合格的篇数的所有可能取值为,,,
由题意, ,
故的分布列为
0
1
2
3
故期望.
15.近期,流感病毒阳性率正快速上升,其中99%以上为甲流,流行株以甲型H3N2亚型为主.为考察某新药A预防甲流的效果,随机调查了400名居民进行了个体(单位:例)试验,(其中,患病表示患甲流)得到如下列联表:
(1)完成2×2列联表;
服用新药情况
患病情况
未患病
患病
合计
未服用新药
100
服用新药
70
合计
250
(2)根据小概率值的独立性检验,能否认为新药对预防甲流有效?
(3)若用表中的频率估计概率,流感病毒来临之前,某同学等可能的选择服用和不服用药物A,求该同学患甲流的概率.
附:,.
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)表格见解析
(2)能认为药物A对预防甲流有效.
(3).
【分析】(1)根据表格的数据进行加减计算即可.
(2)根据公式计算,然后根据独立性检验判断即可.
(3)根据全概率公式计算即可.
【详解】(1)由题意可得列联表,
服用新药情况
患病情况
未患病
患病
合计
未服用新药
100
80
180
服用新药
150
70
220
合计
250
150
400
(2)提出假设:药物A对预防甲流无效,
由列联表得到,
根据小概率值的独立性检验,推断不成立,
即认为药物A对预防甲流有效,该推断犯错误的概率不超过0.01,
所以根据小概率值的独立性检验,能认为药物A对预防甲流有效.
(3)用频率估计概率得未服用药物A的个体患甲流的概率的估计值为;
服用药物A的个体患甲流的概率的估计值为;
设事件B表示“该同学服用新药A”,事件C表示“该同学患甲流”
所以.所以该同学患甲流的概率为.
16.2025景德镇市“瓷博会”1号馆以“品牌生辉”“匠心传承”“创新创意”“器象万千”“开放包容”五大主题,吸引了世界各界人士参与、体验.为了了解人们对活动的喜爱程度,现随机抽取400人进行调查统计,得到如下列联表:
不喜爱
喜爱
合计
男性
180
240
女性
50
合计
400
(1)完成列联表,并判断是否有把握认为人们对该活动的喜爱程度与性别有关联;
(2)为宣传景德镇陶瓷文化知识,当地文化局组织了知识竞赛活动.活动规定从8道备选题中随机抽取4道题进行作答.甲乙各自独立答题,假设在8道备选题中,甲正确完成每道题的概率都是,且每道题正确完成与否互不影响;乙只能正确完成其中的6道题.
①已知甲正确完成题个数服从二项分布,求抽取4道题中甲至少正确完成其3道题的概率;
②设随机变量表示乙可以正确完成题的个数,求变量的分布列及数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)表格见解析,认为人们对该活动的喜爱程度与性别无关;
(2)①;②分布列见解析,3.
【分析】(1)根据已知完善列联表,应用卡方公式求卡方值,结合独立检验基本思想即可得结论;
(2)①应用独立重复试验的概率求法及互斥事件加法求概率;②由题意X的所有可能取值为2,3,4,依次求出对应概率即可得分布列,进而求期望.
【详解】(1)补全的列联表如下
不喜爱
喜爱
合计
男性
60
180
240
女性
50
110
160
合计
110
290
400
零假设为:人们对该活动的喜爱程度与性别无关,
根据表中数据,计算得到,
根据小概率值的独立性检验,没有充分证据推断不成立,
因此我们可以认为成立,即认为人们对该活动的喜爱程度与性别无关.
(2)①记“甲至少正确完成其中3道题”为事件A,
则;
②由题意得的所有可能取值为,
可得,,,
则的分布列如下,
X
2
3
4
P
故的数学期望为.
17.今夏,业余足球比赛江苏省城市足球联赛(简称“苏超”)刷屏,不仅点燃了全民足球热情,还成为人们争相热议的社会现象和文化符号.已知足球教练对球员的选拔使用是依据平常训练及参加比赛的大数据分析.为了考查球员甲对球队的贡献,作如下数据统计(假设球员甲参加过的比赛都决出了胜负).
甲参加
甲未参加
总计
球队胜
29
11
40
球队负
3
7
10
总计
32
18
50
(1)试问:依据小概率值的独立性检验,能否认为球队胜负与球员甲参赛有关联?
(2)根据以往的数据统计,球员乙能够胜任边锋,中锋,后腰及中后卫四个位置,且出场概率分别为0.2,0.3,0.4,0.1,当球员乙出任边锋,中锋,后腰及中后卫时,球队赢球的概率依次为0.6,0.7,0.6,0.8,则某场比赛当球员乙参加比赛时,球队赢球的概率是多少?
参考数据及公式:.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)不能认为球队胜负与球员甲是否参赛有关联;
(2)0.65.
【分析】(1)计算,与临界值比较下结论;
(2)利用条件概率和全概率公式计算所求概率.
【详解】(1)提出零假设:球队胜负与球员甲是否参赛无关,
根据小概率值的独立性检验,没有充分依据推断不成立,
推断零假设不成立,即认为球队胜负与球员甲参赛无关联.
(2)记分别为事件“球员乙出任边锋、中锋、后腰、及中后卫”,为事件“球队赢球”,
则,
,
所以
故某场比赛当球员乙参加比赛时,球队赢球的概率为0.65.
18.冬季气温骤降、空气干燥且气压变化大,慢性阻塞性肺疾病(慢阻肺),哮喘,间质性肺病、肺纤维化,肺炎、支气管炎患者等呼吸系统疾病患者对氧气需求增加,尤其需要制氧机辅助.近年来,我国制氧机产业迅速发展,下表是某地区某品牌制氧机的年销售量与年份的统计表:
年份
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
销量(万台)
2
3.5
2.5
8
9
(1)求这种品牌制氧机的销量关于年份代码的线性回归方程,并预测2027年这种品牌制氧机的销量;
(2)为了研究不同性别的学生对制氧机知识的了解情况,某校组织了一次有关制氧机知识的竞赛活动,随机抽取了男生和女生各100名,得到如下列联表.根据小概率值的独立性检验,判断该校学生对制氧机知识的了解情况与性别是否有关联.
学生
制氧机知识
合计
了解
不了解
男生
80
20
100
女生
40
60
100
合计
120
80
200
附:回归直线的斜率和截距的最小二乘估计公式分别为
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1),12.4万台.
(2)该校学生对制氧机知识的了解情况与性别有关联,男生更了解制氧机知识.
【分析】(1)首先求出的平均数,再代入公式计算求出,可得回归方程,代入可知预测值约为12.4万台;
(2)利用公式计算出的取值即可判断该校学生对制氧机知识的了解情况与性别有关联,再根据不同性别中了解制氧机知识和不了解制氧机知识的频率可得出结论.
【详解】(1)年份代码的平均数,销量的平均数,
所以,
,
所以,
所以,
所以这个地区某品牌制氧机的销量关于年份代码的线性回归方程为,
由于2027年对应的年份代码为,得,
所以预测2027年这个地区某品牌制氧机的销量约为12.4万台.
(2)零假设:该校学生对制氧机知识的了解情况与性别无关.
根据列联表中的数据可得,
根据小概率值的独立性检验,推断不成立,
即该校学生对制氧机知识的了解情况与性别有关联,此推断犯错误的概率不大于0.005.
根据表中数据,男生中了解制氧机知识和不了解制氧机知识的频率分别为
女生中了解制氧机知识和不了解制氧机知识的频率分别为
和
由可见,在被调查者中,男生了解制氧机知识的频率是女生了解制氧机知识的频率的两倍.根据频率稳定于概率的原理,可认为男生更了解制氧机知识.
19.生活中运动对人体健康非常重要,为了了解不同年龄人群篮球运动的情况,随机调查了人,得到如下数据:
年龄
篮球运动情况
合计
经常运动
不经常运动
及以上
以下
合计
(1)依据小概率值的独立性检验,能否认为篮球运动的情况与年龄有关?
(2)某同学进行投篮训练,假设他第一次投中的概率是,后续如果前一次投中,则本次投中的概率为;如果前一次没有投中,则本次投中的概率为.记该同学第次投中的概率为,问:
①求.
②求证:为等比数列,并求出的通项公式.
附:.
【答案】(1)有关;
(2)①;②证明见解析,
【分析】(1)直接根据独立性检验计算判断可得;
(2)①根据条件概率公式计算可得;②根据题意可得递推关系,再用定义证明等比数列,进而可求通项公式.
【详解】(1)零假设为:篮球运动情况与年龄无关,
由列联表数据可得,
因为,,,
所以根据小概率值的独立性检验,认为不成立,
即认为篮球运动与年龄有关,此推断犯错误的概率不超过.
(2)①;
②第一次投中的概率,
如果前一次投中,则投中的概率为;如果前一次没有投中,则投中的概率为.
所以第次投中的概率.
化简得到,所以,
计算首项,所以为首项是,公比为的等比数列.
所以,的通项公式是.
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$
专题8.3 2x2列联表
教学目标
1.通过实例,理解2×2列联表的统计意义。
2.了解随机变量χ2的意义。
教学重难点
1.重点
(1)掌握判断两个分类变量是否有关系的常用方法;
2.难点
(1)过对典型案例分析,了解独立性检验的基本思想和方法;
知识点01 2×2列联表
分类变量:这里所说的变量和值不一定是具体的数值,例如性别变量,其取值为男和女两种.我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
2×2列联表
定义一对分类变量X和Y,我们整理数据如表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
上表是关于分类变量X和Y的抽样数据的2×2列联表,最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数n是样本空间中样本点的总数.
【即学即练】
1.一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
知识点02 独立性检验
要检验两个随机变量是否有关,统计上一般先假设它们没有关系,即相互独立,再进行统计检验;这种假设称为原假设,也称为零假设;习惯上用H0表示;
独立性检验:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
独立性检验的公式:由χ2=经过变形可得到
χ2=,其中n=a+b+c+d,用随机变量χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.
临界值:对于任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)=α.称xα为α的临界值.临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大.
χ2独立性检验中五个常用的小概率值和相应的临界值.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【特别提醒】 (1)χ2越小,独立性越强,相关性越弱;χ2越大,独立性越弱,相关性越强.
(2)对于零假设H0:分类变量X和Y独立,基于小概率值α的检验规则:
①当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
②当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
【即学即练】
2.某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20.下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.有的把握认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
题型01 列联表完善与分析
【典例1】地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【变式1-1】下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【变式1-2】第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中, .
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
【变式1-3】有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
题型02 独立性检验的概念及辨析
【典例2】根据分类变量与的观测数据,计算得到,依据小概率值()的独立性检验,则( )
A.变量与不独立
B.变量与独立
C.变量与不独立,这个结论犯错误的概率不超过0.1
D.变量与独立,这个结论犯错误的概率不超过0.1
【变式2-1】7.为比较甲、乙两所学校学生的数学水平,采用了如下方法:
第1步,科学抽样.采用简单随机抽样方法从两所学校共抽取88名学生,且对这88名学生进行测验;
第2步,收集数据.测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生有7名学生数学成绩优秀,并做出了如下的列联表:
学校
数学成绩
合计
不优秀
优秀
甲校
33
10
43
乙校
38
7
45
合计
71
17
88
第3步,提出零假设.零假设:两校学生的数学成绩优秀率无差异,
第4步,计算.计算得到,
第5步:判断.根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为两校的数学成绩优秀率没有差异.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
若将列联表中所有数据都扩大到原来的10倍,则下列说法正确的是( )
A.根据小概率值的独立性检验,两校的数学成绩优秀率没有差异
B.根据小概率值的独立性检验,两校的数学成绩优秀率没有差异
C.有99%的把握认为学生的数学成绩是否优秀与学校有关
D.学生的数学成绩是否优秀与学校有关,该推断犯错误的概率不超过0.001
【变式2-2】已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α= 的χ2独立性检验,分析喜欢该项体育运动与性别有关.
【变式2-3】在性别与吃零食这两个分类变量的计算中,下列说法正确的是( )
①若的观测值为,我们有的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;
②从独立性检验可知有的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为;
③若从统计量中求出有的把握认为吃零食与性别有关系,是指有的可能性使得出的判断出现错误.
A.①② B.①③ C.②③ D.③
题型03 χ2的计算
【典例3】为了了解疾病是否与性别有关,在某医院随机地对入院的50人进行了问卷调查,得到了如下的列联表:则认为疾病与性别有关的把握约为( )
患疾病
不患疾病
总计
男
20
5
25
女
10
15
25
总计
30
20
50
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A. B. C. D.
【变式3-1】为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取100名学生.通过测验得到如下的列联表:
单位:人
学校
数学成绩
合计
不优秀
优秀
甲
40
10
50
乙
30
20
50
合计
70
30
100
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
下列结论正确的是( )
A.依据小概率值的独立性检验,认为两校学生的数学成绩优秀率无差异
B.依据小概率值的独立性检验,认为两校学生的数学成绩优秀率有差异
C.依据小概率值的独立性检验,认为两校学生的数学成绩优秀率有差异
D.依据小概率值的独立性检验,认为两校学生的数学成绩优秀率有差异
【变式3-2】为研究某新药的疗效,给100名患者服用此药,跟踪调查后得如表所示的数据:
单位:名
性别
疗效
合计
无效
有效
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
α
0.100
0.050
0.010
2.706
3.841
6.635
设:服用此药的效果与患者的性别无关,(小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的概率不大于 .
【变式3-3】 2025年春节期间,电影《哪吒之魔童闹海》掀起全民观影热潮,连续7天票房逆势攀升,单日最高突破8.6亿元,吸引部分家庭扶老携幼共赴影院,缔造中国影史春节档票房与观影人次双冠王的奇迹.某电影院为了解民众观影的喜欢程度,随机采访了180名观影人员,得到下表:
是否成年人
是否喜欢
合计
不喜欢
喜欢
未成年人
80
100
成年人
20
80
合计
180
依据小概率值的独立性检验,能否认为喜欢电影《哪吒之魔童闹海》与是否成年有关?
参考公式:
0.1
0.05
0.01
2.706
3.841
6.635
题型04 独立性检验解决实际问题
【典例4】某校有高一学生1800人,高二学生1200人,学校采取按比例分配的分层抽样的方式从中抽取100人进行体育测试.测试后,统计得到高一样本的一分钟跳绳次数的均值为165,方差为61,高二样本的一分钟跳绳次数的均值为145,方差为31.
(1)计算总样本的一分钟跳绳次数的均值和方差;
(2)将一分钟跳绳次数视为及格,整理出以下列联表:
及格
不及格
合计
高一
52
8
60
高二
38
2
40
合计
90
10
100
试根据小概率值的独立性检验,分析一分钟跳绳次数及格情况是否与年级有关;(结果保留小数点后三位)
(3)如果将(2)表格中的所有数据都扩大为原来的10倍,在相同的检验标准下,再用独立性检验推断一分钟跳绳次数及格情况与年级之间的关联性,结果还一样吗?请你试着解释其中的原因.
附:,.
独立性检验中几个常用的小概率值和相应的临界值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式4-1】28.随着双休政策落实,高中生有更多的时间进行体育锻炼.为了解高中生周末体育锻炼时长,在某高中三个年级中随机抽取50名男生和50名女生,其中男生体育锻炼时长超过两小时的有40名,女生体育锻炼时长不超过两小时的有20名.
(1)依据的独立性检验,判断周末体育锻炼时长与性别是否有关联;
(2)用样本频率作为概率,从该校学生中随机抽取10人进行调查,记周末体育锻炼时长超过两小时的人数为,求的数学期望和方差.
参考公式及数据:,其中.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【变式4-2】30.某医院用a,b两种疗法治疗某种疾病,采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:
未治愈
治愈
合计
疗法a
15
52
67
疗法b
6
63
69
合计
21
115
136
(1)根据小概率值的独立性检验,分析b种疗法的效果是否比a种疗法效果好;
(2)为提高临床医疗安全性,提高疾病的治愈率及好转率,同时降低医疗费用,降低患者医疗负担.该医院对于a,b两种疗法进行联合改进,研究了甲、乙两种联合治疗方案,现有6位症状相同的确诊患者,平均分成A,B两组,A组用甲方案,B组用乙方案.一个疗程后,A组中每人康复的概率都为,B组3人康复的概率分别为,,.若一个疗程后,每康复1人积2分,假设认定:积分期望值越高疗法越好,请问甲、乙哪种联合治疗方案更好?
参考公式及数据:
0.05
0.025
0.010
0.005
0.001
3.841
5.024
6.635
7.879
10.828
,,.
【变式4-3】青岛文旅为了解天气状况对景点旅游满意度的影响,分别于晴天和阴雨天在栈桥景点共调查了100位游客,调查结果如下表.
满意
不满意
合计
晴天
40
阴雨天
20
合计
70
100
(1)完善上述表格,并根据小概率值的独立性检验,能否认为天气状况对该景点旅游满意度有影响;
(2)从这100位游客中任选两人,在两人调查当天的天气状况一致的条件下,试求他们对该景点均满意的概率;
(3)天气多变,文旅部门根据以往数据,为游客发布如下天气信息:若第1天为晴天,则第2天为晴天的概率为,为阴雨天的概率为;若第1天为阴雨天,则第2天为阴雨天的概率为,为晴天的概率为.已知第1天是晴天.求第天仍是晴天的概率,并求前天晴天的天数的期望.
附录:,.
0.05
0.010
0.005
3.841
6.635
7.879
一、单选题
1.考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
2.某村庄对该村内50名村民每年是否体检的情况进行了调查,统计数据如下表所示:
每年体检(人)
每年未体检(人)
合计(人)
老年人
7
年轻人
6
合计
50
已知抽取的村民中老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A. B. C. D.
3.某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用列联表计算得的观测值.
附表:
0.15
0.10
0.05
0.025
0.010
2.072
2.706
3.841
5.024
6.635
则作出“这种血清能起到预防感冒的作用”出错的可能性不超过( )
A. B. C. D.
4.为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
5.某单位对员工是否愿意被外派与年龄的关系进行了一次谓查,根据独立性检验原理,处理所得数据之后发现,得到“是否愿意被外派与年龄有关”这个结论犯错误的概率大于0.001,而不大于0.01,则的值可能为( )
附表:
0.05
0.01
0.001
3.841
6.635
10.828
A.3.206 B.6.561 C.7.879 D.11.028
6.根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
7.校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
二、填空题
8.“双减”提出要全面减负作业总量和时长,减轻学生过重作业负担,同时坚持从严治理, 全面规范校外培训行为.在“双减”颁布前,某地教育局为了解当地中学生参加校外培训的情况,随机调查了当地100名学生,得到的数据如下表:
参加校外培训
未参加校外培训
总计
初中生
30
20
50
高中生
40
10
50
总计
70
30
100
根据该表格,在“双减”颁布前, 95%的把握认为学生是否参加校外培训与年级段有关.(填“有”或“没有”)
参考临界值表:
0.10
0.05
0.010
2.706
3.841
6.635
.
9.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人
0.050
0.010
0.001
3.841
6.635
10.828
参考数据及公式如下:参考公式:,其中.
10.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到,因为,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为 .
11.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:
患慢性气管炎
未患慢性气管炎
总计
吸烟
20
20
40
不吸烟
5
55
60
总计
25
75
100
根据列联表数据,求得 (保留3位有效数字),根据下表,在犯错误的概率不超 的前提下认为患慢性气管炎与吸烟有关.
附:
0.050
0.010
0.001
3.841
6.635
10.828
三、解答题
12.某工厂推出一款新产品,为了调查顾客对该新产品的满意程度,厂家分别对甲地的300名使用者和乙地的200名使用者进行问卷调查,统计并得到如下列联表:
甲地使用者
乙地使用者
合计
不满意
100
50
150
满意
200
150
350
合计
300
200
500
(1)根据小概率值的独立性检验,分析使用者的满意度是否与区域有关;
(2)从使用该产品不满意的顾客中,采用分层抽样的方法随机抽取9名使用者,再从这9名使用者中随机抽取4人进一步调研,记4人中乙地人数为,求的分布列和数学期望.
附录:.
0.15
0.1
0.05
0.025
0.01
0.001
2.072
2.706
3.841
5.024
6.635
10.828
13.某工厂新引进了一套设备用于提高产品的质量,现将新设备生产的1000件产品的质量指标值统计如图所示.
(1)为了比较新旧设备生产的产品之间的质量是否有差异,研究人员将旧设备生产的产品情况和新设备生产的这1000件产品情况进行比较(以质量指标值是否超过75为依据),得到的数据统计如下表所示,依据小概率值的独立性检验,能否认定产品质量与设备的新旧有关联?
设备
产品质量指标值
超过75
不超过75
新设备
旧设备
100
900
(2)以频率估计概率,若从新设备生产的产品中随机抽取4件,记质量指标值在的产品数为,求的分布列以及数学期望.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
14.目前,AI赋能语音识别技术已从实验室的“概念验证”发展为改变人类生活的基础设施,随着大模型和多模态技术的融合,英文识别将不再是单一功能,也是智能系统理解世界的“耳朵”和“眼睛”,推动人机交互从“命令执行”向“自然对话”演进.现甲、乙两名同学通过英文指令与某AI智能体人机交互共生成200篇文章.若生成的文章达到专业要求,不用进一步改良,视为合格.现已知甲同学生成的文章有80篇合格,占甲同学生成文章总数的,乙同学生成的文章有一半合格.
(1)请根据以上数据填写下面的列联表,并推断能否有95%的把握认为生成的文章是否合格与甲、乙(不同的)同学给出的指令有关?
生成的文章合格
生成的文章不合格
总计
甲同学
80
乙同学
总计
200
(2)经试验,若给出的指令够准确具体,该智能体生成文章合格的概率为,则在此条件下从该智能体生成的一批文章中随机调取3篇,请写出其中合格的篇数的分布列,并算出期望.
附:,其中(结果精确到0.001).
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
15.近期,流感病毒阳性率正快速上升,其中99%以上为甲流,流行株以甲型H3N2亚型为主.为考察某新药A预防甲流的效果,随机调查了400名居民进行了个体(单位:例)试验,(其中,患病表示患甲流)得到如下列联表:
(1)完成2×2列联表;
服用新药情况
患病情况
未患病
患病
合计
未服用新药
100
服用新药
70
合计
250
(2)根据小概率值的独立性检验,能否认为新药对预防甲流有效?
(3)若用表中的频率估计概率,流感病毒来临之前,某同学等可能的选择服用和不服用药物A,求该同学患甲流的概率.
附:,.
0.050
0.010
0.001
k
3.841
6.635
10.828
16.2025景德镇市“瓷博会”1号馆以“品牌生辉”“匠心传承”“创新创意”“器象万千”“开放包容”五大主题,吸引了世界各界人士参与、体验.为了了解人们对活动的喜爱程度,现随机抽取400人进行调查统计,得到如下列联表:
不喜爱
喜爱
合计
男性
180
240
女性
50
合计
400
(1)完成列联表,并判断是否有把握认为人们对该活动的喜爱程度与性别有关联;
(2)为宣传景德镇陶瓷文化知识,当地文化局组织了知识竞赛活动.活动规定从8道备选题中随机抽取4道题进行作答.甲乙各自独立答题,假设在8道备选题中,甲正确完成每道题的概率都是,且每道题正确完成与否互不影响;乙只能正确完成其中的6道题.
①已知甲正确完成题个数服从二项分布,求抽取4道题中甲至少正确完成其3道题的概率;
②设随机变量表示乙可以正确完成题的个数,求变量的分布列及数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
17.今夏,业余足球比赛江苏省城市足球联赛(简称“苏超”)刷屏,不仅点燃了全民足球热情,还成为人们争相热议的社会现象和文化符号.已知足球教练对球员的选拔使用是依据平常训练及参加比赛的大数据分析.为了考查球员甲对球队的贡献,作如下数据统计(假设球员甲参加过的比赛都决出了胜负).
甲参加
甲未参加
总计
球队胜
29
11
40
球队负
3
7
10
总计
32
18
50
(1)试问:依据小概率值的独立性检验,能否认为球队胜负与球员甲参赛有关联?
(2)根据以往的数据统计,球员乙能够胜任边锋,中锋,后腰及中后卫四个位置,且出场概率分别为0.2,0.3,0.4,0.1,当球员乙出任边锋,中锋,后腰及中后卫时,球队赢球的概率依次为0.6,0.7,0.6,0.8,则某场比赛当球员乙参加比赛时,球队赢球的概率是多少?
参考数据及公式:.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
18.冬季气温骤降、空气干燥且气压变化大,慢性阻塞性肺疾病(慢阻肺),哮喘,间质性肺病、肺纤维化,肺炎、支气管炎患者等呼吸系统疾病患者对氧气需求增加,尤其需要制氧机辅助.近年来,我国制氧机产业迅速发展,下表是某地区某品牌制氧机的年销售量与年份的统计表:
年份
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
销量(万台)
2
3.5
2.5
8
9
(1)求这种品牌制氧机的销量关于年份代码的线性回归方程,并预测2027年这种品牌制氧机的销量;
(2)为了研究不同性别的学生对制氧机知识的了解情况,某校组织了一次有关制氧机知识的竞赛活动,随机抽取了男生和女生各100名,得到如下列联表.根据小概率值的独立性检验,判断该校学生对制氧机知识的了解情况与性别是否有关联.
学生
制氧机知识
合计
了解
不了解
男生
80
20
100
女生
40
60
100
合计
120
80
200
附:回归直线的斜率和截距的最小二乘估计公式分别为
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
19.生活中运动对人体健康非常重要,为了了解不同年龄人群篮球运动的情况,随机调查了人,得到如下数据:
年龄
篮球运动情况
合计
经常运动
不经常运动
及以上
以下
合计
(1)依据小概率值的独立性检验,能否认为篮球运动的情况与年龄有关?
(2)某同学进行投篮训练,假设他第一次投中的概率是,后续如果前一次投中,则本次投中的概率为;如果前一次没有投中,则本次投中的概率为.记该同学第次投中的概率为,问:
①求.
②求证:为等比数列,并求出的通项公式.
附:.
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$