内容正文:
专题12 独立性检验
【题型归纳目录】
题型一:列联表
题型二:等高条形图
题型三:独立性检验的基本思想
题型四:独立性检验解决实际问题
【知识点梳理】
1、列联表
设,为两个变量,它们的取值分别为和,其样本频数列联表(列联表)如下:
总计
总计
2、独立性检验
基于小概率值的检验规则是:
当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(test of independence).
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
3、应用独立性检验解决实际问题的大致步骤
(1)提出零假设:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
【典型例题】
题型一:列联表
【典例1-1】(2025·高三·全国·专题练习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【答案】C
【解析】因为.所以.又,所以.
故选:C.
【典例1-2】(2025·高三·四川成都·期末)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
50
未注射疫苗
30
50
合计
30
100
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )
附:,.
A.0.001 B.0.05 C.0.01 D.0.005
【答案】B
【解析】完善列联表如下:
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
40
50
未注射疫苗
20
30
50
合计
30
70
100
假设:“给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果”.
因为:,而,
所以根据小概率值的独立性检验,推断不成立.
即认为“给基因编辑小鼠注射该疫苗能起到预防该病毒感染的效果”.
故选:B
【变式1-1】(2025·高二·全国·专题练习)下面是一个列联表,其中a、b处填的值分别为( )
总计
a
21
73
2
25
27
总计
b
46
100
A.52、54
B.54、52
C.94、146
D.146、94
【答案】A
【解析】由题意可得,解得,
所以a、b值分别为52、54.
故选:A.
【变式1-2】(2025·高一·江苏苏州·期末)为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人数的,女性喜爱足球的人数占女性人数的,若本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,则被调查的男性至少有( )人
0.10
0.05
0.01
0.005
0.001
2.706
3.841
5.635
7.879
10.828
A.11 B.12 C.13 D.14
【答案】B
【解析】设男性人数为,依题意,得列联表如下:
喜爱足球
不喜爱足球
合计
男性
女性
合计
则的观测值为,
因为本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,
于是,即,解得,而,因此
故选:B
【变式1-3】(2025·高二·山东·期中)已知随机事件与的样本数据的2×2列联表如下:
总计
12
30
总计
10
32
42
其中,均为大于4的整数,若在犯错误的概率不超过0.01的前提下“判断和之间有关系”时,则( )
附:
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
A.6 B.7 C.8 D.9
【答案】B
【解析】依题意, ,即m只能取5,6,7,
根据所提供的列联表有: ,
解得 ,所以m=7;
故选:B.
题型二:等高条形图
【典例2-1】(2025·高二·山东枣庄·期末)学校开设了游泳选修课.某教练为了解学生对游泳运动的喜好和性别是否有关,在全校学生中选取了男、女生各人进行调查,并绘制如下图所示的等高堆积条形图.则( )
参考公式及数据:,其中.
0.1
0.01
0.001
2.706
6.635
10.828
A.参与调查的女生中喜欢游泳运动的人数比不喜欢游泳运动的人数多
B.全校学生中喜欢游泳运动的男生人数比喜欢游泳运动的女生人数多
C.若,依据的独立性检验,可以认为游泳运动的喜好和性别有关
D.若,依据的独立性检验,可以认为游泳运动的喜好和性别有关
【答案】D
【解析】对于A,由等高堆积条形图可知,参与调查的女生中喜欢游泳运动的人数比不喜欢游泳运动的人数少,故A错误;
对于B,全校学生中男生和女生人数比不确定,故不能确定全校学生中喜欢游泳运动的男生人数比喜欢游泳运动的女生人数多,故B错误;
对于C,结合等高堆积条形图可得:
性别
游泳
合计
喜欢
不喜欢
男生
0.6n
0.4n
n
女生
0.4n
0.6n
n
合计
n
n
2n
故,
若,则,
故依据的独立性检验,不可以认为游泳运动的喜好和性别有关,故C错误;
对于D,若,则,
依据的独立性检验,可以认为游泳运动的喜好和性别有关,故D正确.
故选:D
【典例2-2】(2025·高二·吉林长春·阶段练习)观察下面频率等高条形图,其中两个分类变量x,y之间的随机变量的观测值最小的是( )
A. B.
C. D.
【答案】B
【解析】等高的条形图中所占比例相差越小,随机变量的观测值越小.
故选:B.
【变式2-1】(2025·高三·福建厦门·期末)某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高条形图,则这80名学生中喜欢国画的人数为( )
A.24 B.32 C.48 D.58
【答案】D
【解析】由等高条形图可知,
这80名学生中喜欢国画的人数为:
.
故选:D
【变式2-2】(2025·吉林长春·三模)观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
【答案】D
【解析】观察等高条形图发现与相差很大,就判断两个分类变量之量关系最强.
故选:D
【变式2-3】(2025·高三·广西南宁·期末)为考查A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
【答案】B
【解析】根据两个表中的等高条形图知,
药物A实验显示不服药与服药时患病差异较药物B实验显示明显大,
所以药物A的预防效果优于药物B的预防效果,
故选:B.
题型三:独立性检验的基本思想
【典例3-1】(2025·高二·宁夏银川·期中)某生产工厂生产优质钢索,现需要通过不同场次进行钢索检索抽查.现从机器内随机选取了40组(各20组),记录了他们不同米数,并将数据整理如下表:
米数组别
0~20
21~50
51~80
81~100
A
1
2
3
8
6
B
0
3
7
8
2
米数超过被系统评定为“优质”,否则被系统评定为“备选”.
(1)利用样本估计总体的思想,试估计工厂中米数超过的概率;
(2)根据题意完成下面的列联表,并依据的独立性检验,能否认为“评定类型”与“组别”有关?
优质
备选
总计
A
B
总计
附:,其中.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解析】(1)由题可得,样本米数超过的频率为,
根据样本估计总体的思想,估计工厂中米数超过的概率为.
(2)根据题意,列联表完成如下,
优质
备选
总计
A
14
6
20
B
10
10
20
总计
24
16
40
零假设:“评定类型”与“组别”无关,
则,
所以零假设成立,即“评定类型”与“组别”无关,
所以没有充分证据认为“评定类型”与“组别”有关.
【典例3-2】(2025·高二·四川南充·期末)为了研究学生数学成绩与整理数学错题是否有关,某课题组在某市中学生中随机抽取了100名学生调查了他们本期期中考试的数学成绩和平时整理数学错题情况,将所得数据整理如下表:
数学成绩优秀
数学成绩不优秀
合计
经常整理错题
40
20
60
不经常整理错题
20
20
40
合计
60
40
100
(1)依据的独立性检验,能否认为该市中学生数学成绩优秀与经常整理数学错题有关?
(2)用频率估计概率,在该市中学生中按“经常整理错题”与“不经常整理错题”用等比例分层抽样随机抽取5名学生,再从这5名学生中随机抽取2人进行座谈.
①用表示抽取的2人中经常整理错题的人数,求的分布列和数学期望及方差;
②求抽取的这2名学生中恰有1名学生经常整理错题且数学成绩优秀的概率.
附:.其中.
独立性检验中5个常用的小概率值和相应的临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解析】(1)零假设为该市中学生数学成绩优秀与经常整理数学错题无关.
根据列联表中数据,经计数得到
根据小概率值的独立性检验,我们推断零假设不成立,所以能认为数学成绩优秀与经常整理数学错题有关联.
(2)①由等比例的分层抽样知,随机抽取的5名学生中经常整理错题的有3人,不经常整理错题的有2人.
的可能取值为.
,
则的分布列为
0
1
2
数学期望.
方差;
②设“这2名学生中经常整理错题的人数为i人”(),
“这2 名学生中恰有1名次同学经常整理错题且数学成绩优秀”
则
,
据全概率公式得:.
所以这2名同学中恰有1名同学经常整理错题且数学成绩优秀的概率为.
【变式3-1】(2025·高二·广西玉林·期末)2023年8月8日是我国第15个“全民健身日”,设立全民健身日(FitnessDay)是适应人民群众体育的需求,促进全民健身运动开展的需要.某学校为了提高学生的身体素质,举行了跑步竞赛活动,活动分为长跑、短跑两类项目,该班级所有同学均参加活动,且男女同学人数比为,每位同学选择一项活动参加.统计数据如下表:
长跑
短跑
男同学
a
10
女同学
10
10
(1)求的值并依据小概率值的独立性检验,能否推断选择跑步项目的类别与其性别相关;
(2)赛后校记者团对参加长跑比赛的同学按性别采用分层随机抽样的方法抽取8名同学,再从这8名同学中抽取2名同学接受采访,记随机变量X表示抽到的2人中女生的人数,求X的布列与数学期望.
附:,其中.
0.05
0.01
0.001
3.841
6.635
10.828
【解析】(1)依题意男女同学人数的比例为,所以,故,
零假设:选择跑步项目类别与学生性别无关,
.
根据小概率值的独立性检验,没有充分证据推断出不成立,
因此可以认为成立,即认为选择跑步项目类别与学生性别无关.
(2)抽取8名同学中有6名男生,2名女生,
则的所有可能取值为0,1,2,
则,,,
则的分布列为:
0
1
2
【变式3-2】(2025·高二·上海·期末)为了研究某种疾病的治愈率,某医院从过往病例中随机抽取了名患者,其中一部分患者采用了外科疗法,另一部分患者采用了化学疗法,并根据两种治疗方法的治愈情况绘制了等高堆积条形图,如图.
(1)根据图表完善以下关于治疗方法和治愈情况的列联表:
疗法
疗效
合计
未治愈
治愈
外科疗法
化学疗法
合计
(2)依据小概率值的独立性检验,分析此种疾病治愈率是否与治疗方法有关.
附:,
【解析】(1)
疗法
疗效
合计
未治愈
治愈
外科疗法
化学疗法
合计
(2)假设此种疾病治愈率是否与治疗方法无关,
则根据列联表中的数据计算,
所以依据小概率值的独立性检验,认为此种疾病治愈与治疗方法有关,此推断犯错误的概率不大于.
题型四:独立性检验解决实际问题
【典例4-1】(2025·高二·福建南平·期末)为全面推进“五育”并举,提升学生的综合素质,着力培养德智体美劳全面发展的社会主义建设者和接班人.某学校鼓励学生在学好文化知识的同时也要锻炼好身体,每天运动1小时,养成爱运动的良好习惯.随机抽查了100名学生,统计他们每天参加体育运动的时间,并把他们之中每天参加体育运动时间大于或等于60分钟的记为“达标”,运动时间小于60分钟的记为“不达标”,统计情况如下图:
(1)完成列联表,并运动依据小概率值的独立性检验,能否认为“运动达标”与“性别”有关?
运动达标
运动不达标
总计
男生
女生
总计
(2)现从“不达标”的学生中按性别用分层随机抽样的方法抽取6人,再从这6人中任选2人进行体育运动指导,求选中的2人中至少有1名是女生的概率.
参考数据:
0.25
0.10
0.05
0.025
0.010
0.001
1.323
2.706
3.841
5.024
6.635
10.828
【解析】(1)列联表为:
运动达标
运动不达标
总计
男生
38
12
50
女生
26
24
50
总计
64
36
100
零假设为:“运动达标”与“性别”无关,
根据列联表中的数据,计算得到,
根据小概率值的的独立性检验,我们推断不成立,
即认为“运动达标”与“性别”有关联.
(2)记从这6人中任选2人进行体育运动指导,选中的2人中至少有1名是女生的事件为A,
由(1)知“运动不达标”的男生、女生分别有12人和24人,按分层抽样的方法从中抽取6人,则男生、女生分别抽到2人和4人,
所以,
所以选中的2人中至少有1名是女生的概率为.
【典例4-2】(2025·高二·福建泉州·期末)受疫情影响,某校实行线上教学,为了监控学生的学习情况,每周进行一次线上测评,连续测评5周,得到均分数据见图.
优秀数
非优秀数
合计
某校
46
54
100
联谊校
56
44
100
合计
102
98
200
(1)请你根据数据利用相关系数判定均分与线上教学周数是否具有显著相关关系,若有,求出线性回归方程,若没有,请说明理由;
(2)为了对比研究,该校和其水平相当的线下教学的联谊校进行同步测评,从两校分别随机抽取100名同学成绩进行优秀学生数统计见上表,试依据的独立性检验,分析优秀学生数与线上学习是否有关联?
附:相关系数:
回归系数:
临界值表:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【解析】(1)根据表格中的数据,可得,
,
则均分与线上教学周数负相关很强,
,
则,
则线性回归方程为;
(2)零假设为:优秀数与线上学习相互独立,即优秀数与线上学习之间无关联,
,
依据小概率值的独立性检验,没有充分证据推断零假设不成立,
因此可以认为成立,即认为优秀数与线上学习之间无关联.
【变式4-1】(2025·海南海口·模拟预测)2022年9月23日,延期后的杭州亚运会迎来倒计时一周年,杭州亚组委发布宣传片《亚运+1》和主办城市推广曲《最美的风景》.杭州某大学从全校学生中随机抽取了1200名学生,对是否收看宣传片的情况进行了问卷调查,统计数据如下,
收看
未收看
男生
600
200
女生
200
200
(1)根据以上数据说明,依据小概率值的独立性检验,能否认为学生是否收看宣传片与性别有关?
(2)现从参与问卷调查且收看了宣传片的学生中,按性别采用分层抽样的方法选取8人,参加杭州2023年第19届亚运会志愿者宣传活动.若从这8人中随机选取2人到校广播站开展亚运会比赛项目宣传介绍.记为人选的2人中女生的人数,求随机变量的分布列及数学期望.
参考公式和数据:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解析】(1)(1)零假设:学生是否收看宣传片与性别无关.
由题中数据可知,,
依据小概率值的独立性检验,我们推断不成立,
所以,可以认为学生是否收看宣传片与性别有关.
(2)根据分层抽样方法,选取的8人中,男生有人,女生有人,
根据题意,所有可能取值为0,1,2.
,,,
所以的分布列为
0
1
2
所以.
【变式4-2】(2025·高二·浙江宁波·期中)在十余年的学习生活中,部分学生养成了上课转笔的习惯某研究小组为研究学生上课是否转笔与学习成绩好差的关系,从全市若干所学校的全部学生中随机抽取名学生进行调查,其中上课转笔的有人经调查,得到这名学生近期考试的成绩分数均在内的频率分布直方图如图所示分组区间为记总成绩不低于分的为优秀,其余为合格.
成绩
转笔
合计
上课转笔
上课不转笔
合格
25
优秀
10
合计
100
(1)请完成上面的列联表,依据小概率值的独立性检验,能否认为学生的成绩是否优秀与上课是否转笔有关联.(单位:人)
(2)现按成绩采用比例分配的分层随机抽样的方法从这人中抽取人,再从这人中随机抽取人进行进一步调查,记抽到的人中成绩合格的人数为,求的分布列和均值;
(3)若将频率视作概率,从全市所有在校学生中随机抽取人进行调查,记人中上课转笔的人数为,求的均值和方差.
附:参考公式:,其中.
参考数据:
【解析】(1)由频率分布直方图可知,抽取的名学生中成绩合格的有人,
则成绩优秀的有人.
列联表如下表所示单位:人
成绩
转笔
合计
上课转笔
上课不转笔
合格
优秀
合计
零假设为:学生成绩是否优秀与上课是否转笔无关联,
计算得,
依据小概率值的独立性检验,
我们推断不成立,可以认为学生成绩是否优秀与上课是否转笔有关联;
(2)根据频率分布直方图可知,这名学生中成绩优秀的频率为,
成绩合格的频率为,
故从这名学生中抽取的人中,成绩合格的有人,成绩优秀的有人,
则的可能取值为,
,
故的分布列为
.
(3)由题意知,从全市所有在校学生中随机抽取人,其上课转笔的概率为,
故,
所以.
【强化训练】
1.(2025·辽宁·模拟预测)某医疗研究机构为了解某种地方性疾病与当地居民的生活习惯(生活习惯分良好和不够良好)的关系,现从该地区随机抽取名居民,统计数据如下:
生活习惯
合计
良好
不够良好
患有该疾病居民
0.6n
1.4n
2n
未患有该疾病居民
1.2n
0.8n
2n
合计
1.8n
2.2n
4n
若根据小概率值的独立性检验,分析发现居民是否患有该疾病与生活习惯有关联,则从该地区抽取居民人数至少为( )
附:,.
A.60 B.76 C.80 D.100
【答案】C
【解析】,又,所以,且,,,均为整数,所以的最小值为20,则从该地区抽取居民人数至少为80.
故选:C
2.(2025·高二·河南南阳·阶段练习)在一次独立性检验中,得出2×2列联表如下:
A
合计
B
200
800
1000
180
a
180+a
合计
380
800+a
1180+a
且最后发现,两个分类变量A和B没有任何关系,则a的可能值是( )
A.200 B.720 C.100 D.180
【答案】B
【解析】两个分类变量A和B没有任何关系,
,
代入选项验证可知满足条件.
故选:B
3.(2025·高二·全国·单元测试)在对某小学的学生进行性别与吃零食的调查中,得到下表数据:
吃零食
不吃零食
合计
男学生
24
31
55
女学生
8
26
34
合计
32
57
89
根据上述数据分析可得出的结论是( )
A.认为男女学生与吃零食与否有关系
B.认为男女学生与吃零食与否没有关系
C.性别不同决定了吃零食与否
D.以上都是错误的
【答案】A
【解析】
有90%的把握认为男女学生与吃零食与否有关系.
故选:A
4.(2025·高二·全国·单元测试)某工科院校对,两个专业的男、女生人数进行调查统计,得到以下列联表:
专业类型
性别
专业
专业
总计
女
12
男
46
84
总计
50
100
则该工科院校,两个专业中性别与专业有关的把握为( )
A.99.5% B.99% C.99.9% D.95%
【答案】D
【解析】根据题意,填写列联表,得到以下表格:
专业类型
性别
专业
专业
总计
女
12
4
16
男
38
46
84
总计
50
50
100
计算得,且,
所以有95%的把握认为该工科院校,两个专业中性别与专业有关.
故选:D
5.(2025·高二·河南周口·期中)某校对学生进行心理障碍测试,得到的数据如下表:
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( )
A.焦虑 B.说谎 C.懒惰 D.以上都不对
【答案】B
【解析】对于焦虑,说谎,懒惰三种心理障碍,设它们观测值分别为,
由表中数据可得:
,
,
,
因为的值最大,所以说谎与性别关系最大.
故选:B.
6.(2025·高二·河南新乡·期末)某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中( )
表1
表2
表3
语文
性别
不及格
及格
总计
数学
性别
不及格
及格
总计
英语
性别
不及格
及格
总计
男
14
36
50
男
10
40
50
男
25
25
50
女
16
34
50
女
20
30
50
女
5
45
50
总计
30
70
100
总计
30
70
100
总计
30
70
100
A.语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
B.数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
C.英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
D.英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
【答案】C
【解析】因为,所以英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小.
故选C
7.(2025·河南·模拟预测)某校学生会为研究该校学生的性别与语文、数学、英语成绩这个变量之间的关系,随机抽查了名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中
A.语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
B.数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
C.英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
D.英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
【答案】C
【解析】因为,所以英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小.故选C.
8.(2025·高二·全国·课后作业)某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( )
患心脏病情况秃发情况
患心脏病
无心脏病
秃发
20
300
不秃发
5
450
A.0.1 B.0.05
C.0.01 D.0.99
【答案】C
【解析】列出联表如下图所示:
患心脏病情况
秃发情况
患心脏病
无心脏病
小计
秃发
20
300
320
不秃发
5
450
455
小计
25
750
775
,故判断错误的概率不超过,故选.
9.(多选题)(2025·高二·辽宁·期中)统计学中,常用的显著性水平以及对应的分位数如下表所示.
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.若,则在犯错误的概率不超过的前提下认为与有关
B.若,则在犯错误的概率不超过的前提下认为与无关
C.若,则有的把握认为与有关
D.若,,则
【答案】ACD
【解析】对于A,因为,,,
所以根据小概率值的独立性检验,推断零假设不成立,
即在犯错误的概率不超过的前提下认为与有关,A正确;
对于B,因为,,,
所以根据小概率值的独立性检验,推断零假设不成立,
即在犯错误的概率不超过的前提下认为与有关,B错误;
对于C,因为,,,
所以根据小概率值的独立性检验,推断零假设不成立,
即在犯错误的概率不超过的前提下认为与有关,C正确;
对于D,因为分布是单调递增的累积分布函数,所以,
所以,D正确;
故选:ACD.
10.(多选题)(2025·广东汕头·二模)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”进行调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的.若根据小概率值的独立性检验,可以推断追星和性别有关,则调查样本中男生人数可以是( )
(参考公式及数据:,临界值)
A.10 B.11 C.12 D.18
【答案】CD
【解析】设样本中男生人数为,得列联表
追
不追
合计
男
女
合计
所以,即,又,故C、D正确.
故选:CD.
11.(多选题)(2025·高二·河南驻马店·阶段练习)在研究某个特殊的路口闯红灯与发生交通事故的关系时,同学甲向有关部门申请并分别调取了2024年7月份至2024年12月份该路口行人是否闯红灯以及经过的汽车是否发生交通事故的有关数据,随机抽取了经过该路口的1000个行人是否闯红灯以及1000辆汽车是否发生交通事故的相关数据.同学甲针对自己获得的数据,利用列联表计算出卡方的值,经查表知.同学甲同时发现每月行人闯红灯次数与汽车发生交通事故次数具有线性相关的关系,并分别求出了相关系数的值以及线性回归方程,则下列说法正确的是( )
A.有95%的把握认为“发生交通事故与闯红灯有关”
B.行人如果不闯红灯,该路口就不会发生交通事故
C.越大时,每月行人闯红灯次数与汽车发生交通事故次数相关程度越高
D.每月行人闯红灯次数与汽车发生交通事故次数具有正相关关系
【答案】ACD
【解析】因为卡方的值,同学有95%的把握认为“发生交通事故与闯红灯有关”,A选项正确;
行人如果不闯红灯,该路口就不会发生交通事故,B选项错误;
越大时,每月行人闯红灯次数与汽车发生交通事故次数相关程度越高,C选项正确;
每月行人闯红灯次数与汽车发生交通事故次数具有正相关关系,D选项正确;
故选:ACD.
12.(2025·上海长宁·二模)为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设:患慢性气管炎与吸烟没有关系,并通过计算得到统计量,则可推断 原假设.(填“拒绝”或“接受”,规定显著性水平.)
【答案】拒绝
【解析】已知显著性水平,,即临界值为,
因为,所以可推断拒绝原假设.
故答案为:拒绝.
13.(2025·上海徐汇·二模)如下是一个列联表,则 .
y1
y2
总计
x1
a
35
45
x2
7
b
n
总计
m
73
s
【答案】90
【解析】由表格有,
故答案为:.
14.(2025·高二·山东·期中)为了调查A,B两个地区的观众是否喜欢娱乐节目M,某电视台随机调查了A,B两个地区的2x名观众,已知从A,B两个地区随机调查的人数相同,A地区喜欢娱乐节目M的人数占A地区参与调查的总人数的,B地区喜欢娱乐节目M的人数占B地区参与调查的总人数的,若根据独立性检验认为喜欢娱乐节目M和地区有关,且此推断犯错误的概率超过0.01但不超过0.05,则所有x构成的集合为 .
附表:,其中.
0.050
0.010
3.841
6.635
【答案】
【解析】列联表为:
喜欢
不喜欢
合计
A地区
B地区
合计
,
由认为喜欢娱乐节目M和地区有关,且此推断犯错误的概率超过0.01但不超过0.05,
得,则,解得,又是5的倍数,
则可以取的值为,所以x构成的集合为.
故答案为:
15.(重庆市沙坪坝区部分学校2024-2025学年高三5月模拟数学试题)为考察某种药物预防和治疗流感的效果,某药物研究所用100只小白鼠进行了分组试验,该分组试验分两个阶段:第一阶段为5天的观察预防期,第二阶段为10天的观察治疗期.第一阶段结束时,统计数据如下:患病小白鼠的比例为,未服药小白鼠的比例为,未服药且未患病的小白鼠有20只.
(1)完成下面列联表,并依据小概率值的独立性检验,推断该药物对预防流感是否有效.
药物
流感
合计
未患病
患病
未服用
服用
合计
(2)第一阶段结束时,若在患病的小白鼠中随机抽取2只,用表示服药的只数,求的分布列和数学期望.
(3)第二阶段结束时,针对第一阶段结束时的服药且患病的小白鼠中有16%被治愈,未服药患病的小白鼠中有5%自愈,服药未患病的小白鼠中有20%患病,未服药未患病的小白鼠中有15%患病.用频率估计概率,试验结束后,从这100只小白鼠中任选1只,检测是否患病后放回,若该操作进行5次,求选出的5只小白鼠中至少有2只患病的概率.
附:,其中.
0.1
0.05
0.01
2.706
3.841
6.635
【解析】(1)因为患病小白鼠的比例为,所以患病小白鼠有只,
则不患病的小白鼠有只,又未服药小白鼠的比例为,
所以未服药小白鼠有,从而完善列联表,如下表:
药物
流感
合计
未患病
患病
未服用
20
20
40
服用
35
25
60
合计
55
45
100
零假设为:该药物对预防流感无关联.
因为,显然,
根据小概率值的独立性检验,推断成立,
没有充分证据表明该药物对预防流感有效.
(2)由题意X的所有可能取值为,
则,,
,
所以的分布列为:
0
1
2
所以的数学期望为.
(3)第二阶段结束后,服药且患病的小白鼠中有16%被治愈,
那么服药且患病后仍患病的小白鼠的数量为,
未服药患病的小白鼠中有5%自愈,
那么未服药患病后仍患病的小白鼠的数量为,
服药未患病的小白鼠中有20%患病,那么服药未患病后患病的小白鼠的数量为,
未服药未患病的小白鼠中有15%患病,那么未服药未患病后患病的小白鼠的数量为,
所以第二阶段结束后患病的小白鼠的总数量为,
所以从这100只小白鼠中任选1只,患病的概率为,
设表示选出的5只小白鼠中患病的只数,则,
“至少有2只患病”的对立事件为“0只患病”或“1只患病”,
所以.
16.(四川省攀枝花市2025届高三第三次统一考试数学试卷)一家调查机构在某地随机抽查800名成年居民对新能源车与燃油车的购买倾向,得到如下列联表:
倾向于购买新能源车
倾向于购买燃油车
合计
女性居民
80
男性居民
400
合计
800
已知从这800名居民中随机抽取1人,这个人倾向于购买燃油车的概率为0.8
(1)完成列联表;
(2)依据小概率值的独立性检验,分析对新能源车与燃油车的购买倾向是否存在性别差异;
(3)从上述倾向于购买燃油车的居民中用分层随机抽样的方法抽取8人,再从这8人中抽取3人调查其倾向于购买燃油车的原因,用表示3人中女性居民的人数,求的分布列及数学期望.
附:,
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
【解析】(1)由从这800名居民中随机抽取1人,这个人倾向于购买燃油车的概率为0.8,
可知道倾向于购买燃油车的人数为人
倾向于购买新能源车
倾向于购买燃油车
合计
女性居民
80
240
320
男性居民
80
400
480
合计
160
640
800
(2)零假设:对新能源车与燃油车的购买倾向相互独立,不存在性别差异,
则
根据小概率值的独立性检验,我们推断不成立,即认为对新能源车与燃油车的购买倾向存在性别差异,且该推断犯错误的概率不超过;
(3)从上述倾向于购买燃油车的居民中用分层随机抽样的方法抽取8人,
则女性居民有3人,男性居民有5人,再从这8人中抽取3人调查其倾向于购买燃油车的原因,
用表示3人中女性居民的人数,则的可能取值有,
,,
,,
则的分布列为:
0
1
2
3
所以.
17.(2025·重庆·三模)随机询问80名不同职业的人在购买食品时是否看营养说明,得到如下调查结果:
职业
买食品时是否看营养说明
合计
不看营养说明
看营养说明
从事与医疗相关行业
12
28
40
从事与医疗无关行业
18
22
40
合计
30
50
80
(1)从这80名受访者中随机抽出1人,已知此人在购买食品时要看营养说明,求这名受访者从事与医疗无关行业的概率;
(2)依据小概率的独立性检验,能否推断两个群体在购买食品时是否看营养说明存在差异?
参考公式:
独立性检验中常用小概率值和相应临界值:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解析】(1)用A表示事件“受访者在购买食品是要看营养说明”,
B表示事件“受访者从事医疗无关行业”,“已知此人在购买食品时要看营养说明,
求这名受访者从事与医疗无关行业”的概率就是在“在事件A发生的条件下,事件B发生”的概率,记为,
,,所以;
(2)零假设为:职业与看营养说明相互独立,即两个群体在购买食品时是否看营养说明无差异,
根据表中数据,计算得到,
根据小概率值的独立性检验,没有充分证据推断不成立,
所以可以认为成立,
即认为两个群体在购买食品时是否看营养说明无差异.
18.(2025·高三·浙江湖州·阶段练习)中国春节档电影《哪吒之魔童闹海》票房突破百亿,是中国第一部冲入全球影史票房前5的作品.同学小华在某影院用简单随机抽样的方法调查了200位观影人观看该电影的次数,并对他们的观影次数作出统计,具体如下:
年龄(岁)
少年组(18及以下)
青年组(19-35)
中年组(36-60)
老年组(61及以上)
调查人数
70
80
30
20
少年组、青年组、中年组、老年组分别有,,,的人看了2次该电影,其余的人都只看了1次.
(1)求这200位观众观看该电影的平均次数;
(2)小华记少年组与青年组为“组”,记中年组和老年组为“组”.请完成以下列联表,依据小概率值的独立性检验,能否认为观影次数与年龄层次有关联?
观影次数
年龄层次
合计
组
组
1次
2次
合计
附表:
0.1
0.05
0.01
2.706
3.841
6.635
参考公式:,.
【解析】(1)70人的群体中观看2次电影的人数为人;
80人的群体中观看2次电影的人数为人;
30人的群体中观看2次电影的人数为人;
20人的群体中观看2次电影的人数为人.
将这些人数相加,可得观看2次该电影总人数为人.
已知观看1次电影的总人数为200-72=128人,观看2次电影的总人数为72人,总人数为200人.
这200位观众观看该电影的平均次数为.
(2)零假设:观影次数与年龄层次无关联.
从题目中可知,A组观看1次电影的有90人,B组观看1次电影的有38人,所以观看1次电影的合计128人;
A组观看2次电影的有60人,B组观看2次电影的有12人,所以观看2次电影的合计72人;
A组合计150人,B组合计50人,总人数200人.
整理数据得到列联表:
观影次数
年龄层次
合计
A组
B组
1次
90
38
128
2次
60
12
72
合计
150
50
200
计算卡方统计量:代入可得.
根据小概率值的独立性检验,我们推断不成立,即认为观影次数与年龄层次有关联,此推断犯错误的概率不大于0.05.
19.(2025·高二·浙江绍兴·期中)为了解某班学生喜爱打篮球是否与性别有关,对本班45人进行了问卷调查得到了如下的列联表:
性别
打篮球
合计
喜爱
不喜爱
男生
5
女生
8
合计
45
已知在全班45人中随机抽取1人,抽到喜爱打篮球的学生的概率为.
(1)请将上面的列联表补充完整(不用写计算过程);
(2)根据小概率值的独立性检验,能否据此推断喜爱打篮球与性别有关?
(3)现从女生中抽取2人做进一步调查,设其中喜爱打篮球的女生人数为,求的分布列与均值.
附:,.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解析】(1)因为全班45人中随机抽取1人,抽到喜爱打篮球的学生的概率为,
则喜爱打篮球的有人,则不喜爱打篮球的有人,
所以列联表补充如下:
喜爱打篮球
不喜爱打篮球
合计
男生
22
5
27
女生
8
10
18
合计
30
15
45
(2)零假设为:喜爱打篮球与性别无关,
计算得,
根据小概率值的独立性检验,我们推断不成立,
即认为喜爱打篮球与性别有关,此推断犯错误的概率不大于0.05.
(3)喜爱打篮球的女生人数的可能取值为0,1,2.
所以,,,
故的分布列为:
0
1
2
所以的期望值.
14
学科网(北京)股份有限公司
$$
专题12 独立性检验
【题型归纳目录】
题型一:列联表
题型二:等高条形图
题型三:独立性检验的基本思想
题型四:独立性检验解决实际问题
【知识点梳理】
1、列联表
设,为两个变量,它们的取值分别为和,其样本频数列联表(列联表)如下:
总计
总计
2、独立性检验
基于小概率值的检验规则是:
当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(test of independence).
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
3、应用独立性检验解决实际问题的大致步骤
(1)提出零假设:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
【典型例题】
题型一:列联表
【典例1-1】(2025·高三·全国·专题练习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【典例1-2】(2025·高三·四川成都·期末)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):
被某病毒感染
未被某病毒感染
合计
注射疫苗
10
50
未注射疫苗
30
50
合计
30
100
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果” ( )
附:,.
A.0.001 B.0.05 C.0.01 D.0.005
【变式1-1】(2025·高二·全国·专题练习)下面是一个列联表,其中a、b处填的值分别为( )
总计
a
21
73
2
25
27
总计
b
46
100
A.52、54
B.54、52
C.94、146
D.146、94
【变式1-2】(2025·高一·江苏苏州·期末)为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人数的,女性喜爱足球的人数占女性人数的,若本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,则被调查的男性至少有( )人
0.10
0.05
0.01
0.005
0.001
2.706
3.841
5.635
7.879
10.828
A.11 B.12 C.13 D.14
【变式1-3】(2025·高二·山东·期中)已知随机事件与的样本数据的2×2列联表如下:
总计
12
30
总计
10
32
42
其中,均为大于4的整数,若在犯错误的概率不超过0.01的前提下“判断和之间有关系”时,则( )
附:
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
A.6 B.7 C.8 D.9
题型二:等高条形图
【典例2-1】(2025·高二·山东枣庄·期末)学校开设了游泳选修课.某教练为了解学生对游泳运动的喜好和性别是否有关,在全校学生中选取了男、女生各人进行调查,并绘制如下图所示的等高堆积条形图.则( )
参考公式及数据:,其中.
0.1
0.01
0.001
2.706
6.635
10.828
A.参与调查的女生中喜欢游泳运动的人数比不喜欢游泳运动的人数多
B.全校学生中喜欢游泳运动的男生人数比喜欢游泳运动的女生人数多
C.若,依据的独立性检验,可以认为游泳运动的喜好和性别有关
D.若,依据的独立性检验,可以认为游泳运动的喜好和性别有关
【典例2-2】(2025·高二·吉林长春·阶段练习)观察下面频率等高条形图,其中两个分类变量x,y之间的随机变量的观测值最小的是( )
A. B.
C. D.
【变式2-1】(2025·高三·福建厦门·期末)某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高条形图,则这80名学生中喜欢国画的人数为( )
A.24 B.32 C.48 D.58
【变式2-2】(2025·吉林长春·三模)观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
【变式2-3】(2025·高三·广西南宁·期末)为考查A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
题型三:独立性检验的基本思想
【典例3-1】(2025·高二·宁夏银川·期中)某生产工厂生产优质钢索,现需要通过不同场次进行钢索检索抽查.现从机器内随机选取了40组(各20组),记录了他们不同米数,并将数据整理如下表:
米数组别
0~20
21~50
51~80
81~100
A
1
2
3
8
6
B
0
3
7
8
2
米数超过被系统评定为“优质”,否则被系统评定为“备选”.
(1)利用样本估计总体的思想,试估计工厂中米数超过的概率;
(2)根据题意完成下面的列联表,并依据的独立性检验,能否认为“评定类型”与“组别”有关?
优质
备选
总计
A
B
总计
附:,其中.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【典例3-2】(2025·高二·四川南充·期末)为了研究学生数学成绩与整理数学错题是否有关,某课题组在某市中学生中随机抽取了100名学生调查了他们本期期中考试的数学成绩和平时整理数学错题情况,将所得数据整理如下表:
数学成绩优秀
数学成绩不优秀
合计
经常整理错题
40
20
60
不经常整理错题
20
20
40
合计
60
40
100
(1)依据的独立性检验,能否认为该市中学生数学成绩优秀与经常整理数学错题有关?
(2)用频率估计概率,在该市中学生中按“经常整理错题”与“不经常整理错题”用等比例分层抽样随机抽取5名学生,再从这5名学生中随机抽取2人进行座谈.
①用表示抽取的2人中经常整理错题的人数,求的分布列和数学期望及方差;
②求抽取的这2名学生中恰有1名学生经常整理错题且数学成绩优秀的概率.
附:.其中.
独立性检验中5个常用的小概率值和相应的临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式3-1】(2025·高二·广西玉林·期末)2023年8月8日是我国第15个“全民健身日”,设立全民健身日(FitnessDay)是适应人民群众体育的需求,促进全民健身运动开展的需要.某学校为了提高学生的身体素质,举行了跑步竞赛活动,活动分为长跑、短跑两类项目,该班级所有同学均参加活动,且男女同学人数比为,每位同学选择一项活动参加.统计数据如下表:
长跑
短跑
男同学
a
10
女同学
10
10
(1)求的值并依据小概率值的独立性检验,能否推断选择跑步项目的类别与其性别相关;
(2)赛后校记者团对参加长跑比赛的同学按性别采用分层随机抽样的方法抽取8名同学,再从这8名同学中抽取2名同学接受采访,记随机变量X表示抽到的2人中女生的人数,求X的布列与数学期望.
附:,其中.
0.05
0.01
0.001
3.841
6.635
10.828
【变式3-2】(2025·高二·上海·期末)为了研究某种疾病的治愈率,某医院从过往病例中随机抽取了名患者,其中一部分患者采用了外科疗法,另一部分患者采用了化学疗法,并根据两种治疗方法的治愈情况绘制了等高堆积条形图,如图.
(1)根据图表完善以下关于治疗方法和治愈情况的列联表:
疗法
疗效
合计
未治愈
治愈
外科疗法
化学疗法
合计
(2)依据小概率值的独立性检验,分析此种疾病治愈率是否与治疗方法有关.
附:,
题型四:独立性检验解决实际问题
【典例4-1】(2025·高二·福建南平·期末)为全面推进“五育”并举,提升学生的综合素质,着力培养德智体美劳全面发展的社会主义建设者和接班人.某学校鼓励学生在学好文化知识的同时也要锻炼好身体,每天运动1小时,养成爱运动的良好习惯.随机抽查了100名学生,统计他们每天参加体育运动的时间,并把他们之中每天参加体育运动时间大于或等于60分钟的记为“达标”,运动时间小于60分钟的记为“不达标”,统计情况如下图:
(1)完成列联表,并运动依据小概率值的独立性检验,能否认为“运动达标”与“性别”有关?
运动达标
运动不达标
总计
男生
女生
总计
(2)现从“不达标”的学生中按性别用分层随机抽样的方法抽取6人,再从这6人中任选2人进行体育运动指导,求选中的2人中至少有1名是女生的概率.
参考数据:
0.25
0.10
0.05
0.025
0.010
0.001
1.323
2.706
3.841
5.024
6.635
10.828
【典例4-2】(2025·高二·福建泉州·期末)受疫情影响,某校实行线上教学,为了监控学生的学习情况,每周进行一次线上测评,连续测评5周,得到均分数据见图.
优秀数
非优秀数
合计
某校
46
54
100
联谊校
56
44
100
合计
102
98
200
(1)请你根据数据利用相关系数判定均分与线上教学周数是否具有显著相关关系,若有,求出线性回归方程,若没有,请说明理由;
(2)为了对比研究,该校和其水平相当的线下教学的联谊校进行同步测评,从两校分别随机抽取100名同学成绩进行优秀学生数统计见上表,试依据的独立性检验,分析优秀学生数与线上学习是否有关联?
附:相关系数:
回归系数:
临界值表:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【变式4-1】(2025·海南海口·模拟预测)2022年9月23日,延期后的杭州亚运会迎来倒计时一周年,杭州亚组委发布宣传片《亚运+1》和主办城市推广曲《最美的风景》.杭州某大学从全校学生中随机抽取了1200名学生,对是否收看宣传片的情况进行了问卷调查,统计数据如下,
收看
未收看
男生
600
200
女生
200
200
(1)根据以上数据说明,依据小概率值的独立性检验,能否认为学生是否收看宣传片与性别有关?
(2)现从参与问卷调查且收看了宣传片的学生中,按性别采用分层抽样的方法选取8人,参加杭州2023年第19届亚运会志愿者宣传活动.若从这8人中随机选取2人到校广播站开展亚运会比赛项目宣传介绍.记为人选的2人中女生的人数,求随机变量的分布列及数学期望.
参考公式和数据:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式4-2】(2025·高二·浙江宁波·期中)在十余年的学习生活中,部分学生养成了上课转笔的习惯某研究小组为研究学生上课是否转笔与学习成绩好差的关系,从全市若干所学校的全部学生中随机抽取名学生进行调查,其中上课转笔的有人经调查,得到这名学生近期考试的成绩分数均在内的频率分布直方图如图所示分组区间为记总成绩不低于分的为优秀,其余为合格.
成绩
转笔
合计
上课转笔
上课不转笔
合格
25
优秀
10
合计
100
(1)请完成上面的列联表,依据小概率值的独立性检验,能否认为学生的成绩是否优秀与上课是否转笔有关联.(单位:人)
(2)现按成绩采用比例分配的分层随机抽样的方法从这人中抽取人,再从这人中随机抽取人进行进一步调查,记抽到的人中成绩合格的人数为,求的分布列和均值;
(3)若将频率视作概率,从全市所有在校学生中随机抽取人进行调查,记人中上课转笔的人数为,求的均值和方差.
附:参考公式:,其中.
参考数据:
【强化训练】
1.(2025·辽宁·模拟预测)某医疗研究机构为了解某种地方性疾病与当地居民的生活习惯(生活习惯分良好和不够良好)的关系,现从该地区随机抽取名居民,统计数据如下:
生活习惯
合计
良好
不够良好
患有该疾病居民
0.6n
1.4n
2n
未患有该疾病居民
1.2n
0.8n
2n
合计
1.8n
2.2n
4n
若根据小概率值的独立性检验,分析发现居民是否患有该疾病与生活习惯有关联,则从该地区抽取居民人数至少为( )
附:,.
A.60 B.76 C.80 D.100
2.(2025·高二·河南南阳·阶段练习)在一次独立性检验中,得出2×2列联表如下:
A
合计
B
200
800
1000
180
a
180+a
合计
380
800+a
1180+a
且最后发现,两个分类变量A和B没有任何关系,则a的可能值是( )
A.200 B.720 C.100 D.180
3.(2025·高二·全国·单元测试)在对某小学的学生进行性别与吃零食的调查中,得到下表数据:
吃零食
不吃零食
合计
男学生
24
31
55
女学生
8
26
34
合计
32
57
89
根据上述数据分析可得出的结论是( )
A.认为男女学生与吃零食与否有关系
B.认为男女学生与吃零食与否没有关系
C.性别不同决定了吃零食与否
D.以上都是错误的
4.(2025·高二·全国·单元测试)某工科院校对,两个专业的男、女生人数进行调查统计,得到以下列联表:
专业类型
性别
专业
专业
总计
女
12
男
46
84
总计
50
100
则该工科院校,两个专业中性别与专业有关的把握为( )
A.99.5% B.99% C.99.9% D.95%
5.(2025·高二·河南周口·期中)某校对学生进行心理障碍测试,得到的数据如下表:
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( )
A.焦虑 B.说谎 C.懒惰 D.以上都不对
6.(2025·高二·河南新乡·期末)某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中( )
表1
表2
表3
语文
性别
不及格
及格
总计
数学
性别
不及格
及格
总计
英语
性别
不及格
及格
总计
男
14
36
50
男
10
40
50
男
25
25
50
女
16
34
50
女
20
30
50
女
5
45
50
总计
30
70
100
总计
30
70
100
总计
30
70
100
A.语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
B.数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
C.英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
D.英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
7.(2025·河南·模拟预测)某校学生会为研究该校学生的性别与语文、数学、英语成绩这个变量之间的关系,随机抽查了名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中
A.语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
B.数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
C.英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
D.英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
8.(2025·高二·全国·课后作业)某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( )
患心脏病情况秃发情况
患心脏病
无心脏病
秃发
20
300
不秃发
5
450
A.0.1 B.0.05
C.0.01 D.0.99
9.(多选题)(2025·高二·辽宁·期中)统计学中,常用的显著性水平以及对应的分位数如下表所示.
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.若,则在犯错误的概率不超过的前提下认为与有关
B.若,则在犯错误的概率不超过的前提下认为与无关
C.若,则有的把握认为与有关
D.若,,则
10.(多选题)(2025·广东汕头·二模)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”进行调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的.若根据小概率值的独立性检验,可以推断追星和性别有关,则调查样本中男生人数可以是( )
(参考公式及数据:,临界值)
A.10 B.11 C.12 D.18
11.(多选题)(2025·高二·河南驻马店·阶段练习)在研究某个特殊的路口闯红灯与发生交通事故的关系时,同学甲向有关部门申请并分别调取了2024年7月份至2024年12月份该路口行人是否闯红灯以及经过的汽车是否发生交通事故的有关数据,随机抽取了经过该路口的1000个行人是否闯红灯以及1000辆汽车是否发生交通事故的相关数据.同学甲针对自己获得的数据,利用列联表计算出卡方的值,经查表知.同学甲同时发现每月行人闯红灯次数与汽车发生交通事故次数具有线性相关的关系,并分别求出了相关系数的值以及线性回归方程,则下列说法正确的是( )
A.有95%的把握认为“发生交通事故与闯红灯有关”
B.行人如果不闯红灯,该路口就不会发生交通事故
C.越大时,每月行人闯红灯次数与汽车发生交通事故次数相关程度越高
D.每月行人闯红灯次数与汽车发生交通事故次数具有正相关关系
12.(2025·上海长宁·二模)为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设:患慢性气管炎与吸烟没有关系,并通过计算得到统计量,则可推断 原假设.(填“拒绝”或“接受”,规定显著性水平.)
13.(2025·上海徐汇·二模)如下是一个列联表,则 .
y1
y2
总计
x1
a
35
45
x2
7
b
n
总计
m
73
s
14.(2025·高二·山东·期中)为了调查A,B两个地区的观众是否喜欢娱乐节目M,某电视台随机调查了A,B两个地区的2x名观众,已知从A,B两个地区随机调查的人数相同,A地区喜欢娱乐节目M的人数占A地区参与调查的总人数的,B地区喜欢娱乐节目M的人数占B地区参与调查的总人数的,若根据独立性检验认为喜欢娱乐节目M和地区有关,且此推断犯错误的概率超过0.01但不超过0.05,则所有x构成的集合为 .
附表:,其中.
0.050
0.010
3.841
6.635
15.(重庆市沙坪坝区部分学校2024-2025学年高三5月模拟数学试题)为考察某种药物预防和治疗流感的效果,某药物研究所用100只小白鼠进行了分组试验,该分组试验分两个阶段:第一阶段为5天的观察预防期,第二阶段为10天的观察治疗期.第一阶段结束时,统计数据如下:患病小白鼠的比例为,未服药小白鼠的比例为,未服药且未患病的小白鼠有20只.
(1)完成下面列联表,并依据小概率值的独立性检验,推断该药物对预防流感是否有效.
药物
流感
合计
未患病
患病
未服用
服用
合计
(2)第一阶段结束时,若在患病的小白鼠中随机抽取2只,用表示服药的只数,求的分布列和数学期望.
(3)第二阶段结束时,针对第一阶段结束时的服药且患病的小白鼠中有16%被治愈,未服药患病的小白鼠中有5%自愈,服药未患病的小白鼠中有20%患病,未服药未患病的小白鼠中有15%患病.用频率估计概率,试验结束后,从这100只小白鼠中任选1只,检测是否患病后放回,若该操作进行5次,求选出的5只小白鼠中至少有2只患病的概率.
附:,其中.
0.1
0.05
0.01
2.706
3.841
6.635
16.(四川省攀枝花市2025届高三第三次统一考试数学试卷)一家调查机构在某地随机抽查800名成年居民对新能源车与燃油车的购买倾向,得到如下列联表:
倾向于购买新能源车
倾向于购买燃油车
合计
女性居民
80
男性居民
400
合计
800
已知从这800名居民中随机抽取1人,这个人倾向于购买燃油车的概率为0.8
(1)完成列联表;
(2)依据小概率值的独立性检验,分析对新能源车与燃油车的购买倾向是否存在性别差异;
(3)从上述倾向于购买燃油车的居民中用分层随机抽样的方法抽取8人,再从这8人中抽取3人调查其倾向于购买燃油车的原因,用表示3人中女性居民的人数,求的分布列及数学期望.
附:,
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
17.(2025·重庆·三模)随机询问80名不同职业的人在购买食品时是否看营养说明,得到如下调查结果:
职业
买食品时是否看营养说明
合计
不看营养说明
看营养说明
从事与医疗相关行业
12
28
40
从事与医疗无关行业
18
22
40
合计
30
50
80
(1)从这80名受访者中随机抽出1人,已知此人在购买食品时要看营养说明,求这名受访者从事与医疗无关行业的概率;
(2)依据小概率的独立性检验,能否推断两个群体在购买食品时是否看营养说明存在差异?
参考公式:
独立性检验中常用小概率值和相应临界值:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
18.(2025·高三·浙江湖州·阶段练习)中国春节档电影《哪吒之魔童闹海》票房突破百亿,是中国第一部冲入全球影史票房前5的作品.同学小华在某影院用简单随机抽样的方法调查了200位观影人观看该电影的次数,并对他们的观影次数作出统计,具体如下:
年龄(岁)
少年组(18及以下)
青年组(19-35)
中年组(36-60)
老年组(61及以上)
调查人数
70
80
30
20
少年组、青年组、中年组、老年组分别有,,,的人看了2次该电影,其余的人都只看了1次.
(1)求这200位观众观看该电影的平均次数;
(2)小华记少年组与青年组为“组”,记中年组和老年组为“组”.请完成以下列联表,依据小概率值的独立性检验,能否认为观影次数与年龄层次有关联?
观影次数
年龄层次
合计
组
组
1次
2次
合计
附表:
0.1
0.05
0.01
2.706
3.841
6.635
参考公式:,.
19.(2025·高二·浙江绍兴·期中)为了解某班学生喜爱打篮球是否与性别有关,对本班45人进行了问卷调查得到了如下的列联表:
性别
打篮球
合计
喜爱
不喜爱
男生
5
女生
8
合计
45
已知在全班45人中随机抽取1人,抽到喜爱打篮球的学生的概率为.
(1)请将上面的列联表补充完整(不用写计算过程);
(2)根据小概率值的独立性检验,能否据此推断喜爱打篮球与性别有关?
(3)现从女生中抽取2人做进一步调查,设其中喜爱打篮球的女生人数为,求的分布列与均值.
附:,.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
14
学科网(北京)股份有限公司
$$