内容正文:
专题4.3 独立性检验
教学目标
1.通过实例,理解2×2 列联表的统计意义,能准确构建列联表。
2.了解独立性检验(卡方检验)的基本思想、统计量χ2的含义及计算公式。
3.掌握独立性检验的实施步骤,会用临界值表作出统计推断,并能解释实际问题。
教学重难点
1.重点:
(1)2×2 列联表的结构与编制方法。
(2)独立性检验的基本思想与实施步骤。
(3)卡方统计量χ2的计算与临界值对比。
(4)常见临界值的理解与应用。
2.难点:
(1)独立性检验的统计思想:理解零假设H0(两变量独立)、小概率事件与反证法的区别及联系。
(2)卡方统计量χ2的含义:χ2值越大,拒绝H0的把握越大,两变量关联性越强。
(3)统计推断的严谨表述:正确写出 “有 ××% 的把握认为…… 有关” 或 “没有充分证据显示…… 有关”,避免绝对化结论。
(4)适用条件:列联表中a,b,c,d≥5且样本容量n足够大。
知识点01 分类变量与列联表
1. 分类变量:取值为离散类别(如性别:男 / 女;吸烟:是 / 否),数值仅表分类、无大小意义。
2.列联表:将两个(或两个以上)分类变量进行交叉分类得到的频数分布表称为列联表。
3.2×2 列联表:由于所涉及的两个分类变量X,Y均有两个变量值,所以称之为2×2列联表。
Y1
Y2
合计
X1
a
b
a+b
X2
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
【即学即练】(24-25高二下·江西上饶·月考)(多选)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则( )
合计
合计
A.若,则可以认为与独立
B.若变量与独立,则
C.若很大,则变量与不独立
D.若变量与不独立,则很大
知识点02 独立性检验(卡方检验)
1.定义:利用统计量χ2判断两个分类变量是否有关的假设检验方法。
2.核心公式:
3.基本思想(假设检验):
(1)提出零假设H0:两分类变量X,Y独立(无关)。
(2)计算χ2观测值。
(3)对比临界值x0,作出推断:若χ2≥x0:拒绝H0,有(1−α)×100%把握认为X,Y有关(犯错概率≤α)。
若χ2<x0:不拒绝H0,无充分证据显示X,Y有关。
【即学即练】(20-21高二下·福建泉州·期中)某高校“统计初步"”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,计算得到______(保留三位小数),所以判定_______(填“能”或“不能”)在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系.
附:
α
0.10
0.05
0.010
0.005
0.001
2.706
3.841
60.35
7.879
10.828
知识点03 常用临界值表
χ2 >3.841:95% 把握认为有关。
χ2 >6.635:99% 把握认为有关。
χ2 >10.828:99.9% 把握认为有关。
【即学即练】(2025高二·全国·专题练习) 2025年春节期间,电影《哪吒之魔童闹海》掀起全民观影热潮,连续7天票房逆势攀升,单日最高突破8.6亿元,吸引部分家庭扶老携幼共赴影院,缔造中国影史春节档票房与观影人次双冠王的奇迹.某电影院为了解民众观影的喜欢程度,随机采访了180名观影人员,得到下表:
是否成年人
是否喜欢
合计
不喜欢
喜欢
未成年人
80
100
成年人
20
80
合计
180
依据小概率值的独立性检验,能否认为喜欢电影《哪吒之魔童闹海》与是否成年有关?
参考公式:
0.1
0.05
0.01
2.706
3.841
6.635
知识点04 独立性检验步骤
1.提出问题,确定两个分类变量,收集数据并编制2×2 列联表。
2.提出统计假设H0:x与y之间没关系(两变量独立)。
3.根据2×2列联表与公式计算χ2 观测值 。
4.查临界值表,确定临界值x0,比较χ2与x0。
5.作出统计推断并解释实际意义。
【即学即练】(25-26高三下·江西·月考)有媒体称开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.现从这200名学生中随机选1名学生,设事件为“选到的学生愿意报名参加答题活动”,事件为“选到的学生为男生”,且.
(1)根据已知条件,完成下列列联表.从不愿意报名参加答题活动的学生中随机选择1人,设选到女生的概率为,求的值;
性别
男生
女生
合计
不愿报名参加答题活动
愿意报名参加答题活动
合计
(2)依据小概率值的独立性检验,分析该校学生报名参加答题活动是否与性别有关.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
题型01 完善列联表
【典例1】(22-23高二下·广东深圳·期中)下面是一个2×2列联表:
合计
合计
则表中a,b处的值分别为__________;__________.
【变式1-1】(22-23高二下·青海西宁·期末)第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中,_______________.
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
【变式1-2】(25-26高二下·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
【变式1-3】(21-22高二上·河南开封·期末)某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的列联表中,______.
会外语
不会外语
合计
男
a
b
20
女
6
d
合计
18
50
题型02 列联表分析
【典例2】(21-22高二下·河南·期中)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:
了解
不了解
总计
年龄不小于60岁
a
b
a+b
年龄小于60岁
c
d
c+d
总计
a+c
b+d
a+b+c+d
给出下列4组数据:
① ;② ;
③ ;④ .
则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是______.(填序号)
【变式2-1】(24-25高二下·河南·月考)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【变式2-2】(17-18高二下·陕西咸阳·期中)下面是列联表,则表中的值为______.
合计
21
63
22
35
57
合计
120
【变式2-3】(25-26高二下·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
题型03 独立性检验的概念及辨析
【典例3】(2026·辽宁大连·模拟预测)如图的列联表中,定义,易知越大越有利于结论“与有关系”.若当值大于常数时,有的把握认为与有关系,那么的值为( )
(已知,其中,)
总计
总计
A. B.
C. D.
【变式3-1】(24-25高二下·山东烟台·期中)根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
【变式3-2】(24-25高二下·天津和平·期末)某单位对员工是否愿意被外派与年龄的关系进行了一次谓查,根据独立性检验原理,处理所得数据之后发现,得到“是否愿意被外派与年龄有关”这个结论犯错误的概率大于0.001,而不大于0.01,则的值可能为( )
附表:
0.05
0.01
0.001
3.841
6.635
10.828
A.3.206 B.6.561 C.7.879 D.11.028
【变式3-3】(24-25高二下·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
题型04 卡方计算及应用
【典例4】(25-26高二下·上海·期中)学校对社团展演活动满意度进行调研,随机抽取高一高二学生各50名,每位同学给出满意或不满意的评价,得到列联表.依据,若没有95%的把握认为年级会对满意度评价有差异,则的最小值为__________.附:,
满意
不满意
高一
高二
【变式4-1】(25-26高二下·内蒙古呼和浩特·月考)某校调查学生参加体育锻炼与性别的关系,得到如下列联表(单位:人):
经常锻炼
不经常锻炼
合计
男生
35
55
90
女生
65
45
110
合计
100
100
200
参照公式(其中),计算得______.(保留两位小数)
【变式4-2】(25-26高三下·安徽滁州·开学考试)考察棉花种子经过处理与是否生病之间的关系得到如下表所示的数据:
经处理的种子数粒
未经处理的种子数粒
合计粒
得病
不得病
合计
根据以上数据,则统计量的观测值是__________.
【变式4-3】(25-26高二上·宁夏银川·期末)“双减”提出要全面减负作业总量和时长,减轻学生过重作业负担,同时坚持从严治理, 全面规范校外培训行为.在“双减”颁布前,某地教育局为了解当地中学生参加校外培训的情况,随机调查了当地100名学生,得到的数据如下表:
参加校外培训
未参加校外培训
总计
初中生
30
20
50
高中生
40
10
50
总计
70
30
100
根据该表格,在“双减”颁布前,______95%的把握认为学生是否参加校外培训与年级段有关.(填“有”或“没有”)
参考临界值表:
0.10
0.05
0.010
2.706
3.841
6.635
.
题型05 独立性检验解决实际问题
【典例5】(25-26高二下·海南·期中)为加强素质教育,提升学生综合素养,高二年级提供了“书法”和“剪纸”两门选修课.为了了解选择“书法”或“剪纸”是否与性别有关,调查了高二年级1500名学生的选择倾向,随机抽取了100人,统计选择两门课程人数如下表:
(1)补全列联表;
选书法
选剪纸
共计
男生
40
50
女生
共计
30
(2)根据小概率值的独立性检验,分析选择“书法”或“剪纸”是否与性别有关?(计算结果保留到小数点后三位)
参考附表:
0.100
0.050
0.025
2.706
3.841
5.024
参考公式:,其中.
【变式5-1】(24-25高三上·江苏南通·月考)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据通过计算有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为_________ .
支持
不支持
男生
女生
附:,其中.
【变式5-2】(24-25高二下·全国·课前预习)某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病.根据这些数据能否断定:患呼吸道疾病与吸烟有关?
【变式5-3】(25-26高二下·河北沧州·期中)近年来,食品添加剂泛滥引起消费者关注,某媒体对消费者在购买预包装食品时是否关注配料表进行调查,调查了名男性消费者与名女性消费者,关注配料表的消费者共有人,其中女性人.
(1)用列联表表示上述数据;
(2)依据小概率值的独立性检验,能否据此推断消费者购买预包装食品时是否关注配料表与性别有关?
附:,其中.
题型06 独立性检验与概率的综合问题
【典例6】(25-26高二下·湖南衡阳·期中)(13分《国民体质测定标准(2023年修订)》将体质情况综合评级为优秀、良好、合格和不合格四个等级.某地区为了解国民体质情况是否与爱好运动有关,从该地区体质达到“合格”及以上的人群中随机抽取了人进行问卷调查,得到如下列联表:
体质情况组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
(1)求的值,并依据小概率值的独立性检验,分析体质情况是否与爱好运动有关;
(2)在体质情况综合评级为“合格”的对象中,按是否爱好运动进行分层,用比例分配的分层随机抽样方法,从样本中抽取6人作进一步调查,再从这6人中随机抽取2人线下访谈,记这2人中“爱好运动”的人数为X,求X的分布列及数学期望.
附:,其中.
【变式6-1】(25-26高二下·云南昭通·期中)为探究学生完成数学作业情况与成绩之间的联系,某学校从高一,高二,高三三个年级采用按比例分层抽样的方式得到400名学生的测验成绩,得到如下列联表:
成绩优秀
成绩不优秀
总计
不认真完成作业
认真完成作业
总计
(1)求;
(2)记不认真完成作业的学生中,成绩不优秀的概率为,给出的估计值;
(3)能否有的把握认真完成作业对成绩优秀有效?
附:.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式6-2】(25-26高三上·江西南昌·期末)为研究高中生自主刷题与数学成绩提升的关联性,某教研机构随机抽取200名高三学生开展调查,统计数据如下表(单位:人):
成绩显著提升
成绩未显著提升
合计
坚持自主刷题
90
30
120
未坚持自主刷题
20
60
80
合计
110
90
200
根据上述数据,解答下列问题:
(1)依据小概率值的独立性检验,判断能否认为高中生坚持自主刷题与数学成绩显著提升有关?
(2)已知在坚持自主刷题的学生中,数学成绩达到优秀的概率为0.6;在未坚持自主刷题的学生中,数学成绩达到优秀的概率为0.3.现从这200名学生中随机抽取1人,发现其数学成绩为优秀,求该学生坚持自主刷题的概率.
附:,其中.
【变式6-3】(25-26高三下·云南楚雄·月考)某校为调查学生对“大语言模型”的了解程度,随机抽取70名男生和30名女生参加“大语言模型”相关知识问卷调查(满分100分),若分数为80分及以上的为了解,其他为不了解,统计并得到如下列联表:
男生
女生
合计
了解
50
15
65
不了解
20
15
35
合计
70
30
100
(1)根据小概率值的独立性检验,能否认为对“大语言模型”的了解程度与性别有关联?
(2)从样本中的70名男生中,按对“大语言模型”的了解程度,通过分层随机抽样抽取7人,再从这7人中抽取2人进行调研,记抽出的2人中对“大语言模型”了解的人数为,求的分布列和数学期望.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
题型07 独立性检验与回归分析的综合问题
【典例7】(25-26高二下·湖南长沙·月考)为研究高中生每周自主整理错题时长与数学学科成绩的关联性,某高中数学教研组从本校高二年级随机抽取了100名学生进行调查,统计其每周整理错题时长(单位:小时)及期末数学成绩,按照“整理错题时长小时”和“整理错题时长小时”将学生分为时长充足组和时长不足组,再按照数学成绩是否不低于120分(满分150分)分为成绩优秀和成绩一般,得到如下列联表:
成绩优秀
成绩一般
合计
时长充足组
30
10
40
时长不足组
20
40
60
合计
50
50
100
同时,从样本中随机选取6名学生,记录其每周整理错题时长(记为变量x,单位:小时)与对应数学成绩(记为变量y,单位:分),得到如下数据:
学生编号
1
2
3
4
5
6
x
0
1
2
2
3
4
y
91
105
116
119
125
140
(1)根据表中数据,依据的独立性检验,能否认为高中生数学成绩与每周整理错题时长充足与否有关联?并解释所得结论的实际含义;
(2)请你结合第(1)问得出的独立性检验结论,根据选取的6组数据,建立y关于x的经验回归方程,并预测某名学生每周整理错题时长为4.5小时,其数学成绩大约为多少分?该结果是否一定与实际情况相符合,原因是什么?
参考数据与公式:,.
0.050
0.010
0.001
3.841
6.635
10.828
经验回归方程中斜率和截距的最小二乘估计公式分别为:,.
【变式7-1】(25-26高二下·广西柳州·期中)下表是某品牌净化器的年销售量与年份的统计表.
年份
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
年销售量(万台)
2
3.5
2.5
8
9
(1)计算净化器的年销售量关于年份代码的线性回归方程;
(2)为了调查两地区人群对该品牌净化器的了解情况,调查机构在两地区的人群中分别进行品牌知晓情况的问卷调查.统计知晓与不知晓的人数,得到如下列联表.根据小概率值的独立性检验,判断两地区的人群对该品牌净化器的知晓情况是否有显著差异.
知晓
不知晓
合计
地区
80
20
100
地区
40
60
100
合计
120
80
200
附:关于回归方程,回归系数的计算公式,其中为样本点的中心, ;的计算公式;
0.05
0.01
0.001
3.841
6.635
10.828
【变式7-2】(25-26高二下·湖南长沙·期中)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解大众对新能源汽车的接受程度,某城市汽车行业协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取100名市民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了如下列联表:
选择新能源汽车
选择传统汽车
总计
40岁以下
70
30
100
40岁及以上
40
60
100
总计
110
90
200
(i)记选择新能源汽车者中年龄在40岁以下的概率为,求的估计值;
(ii)依据小概率值的独立性检验,分析选择新能源汽车是否与年龄有关.
(2)为了了解该地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量(单位:万台)关于年份的线性回归方程,且销售量的方差为,年份的方差为.求与间的样本相关系数,并据此判断该地区新能源汽车销售量与年份的线性相关性强弱.
附:(i)在线性回归方程中,,;
(ii)样本相关系数,若,则可判断与线性相关性很强;
(iii),其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【变式7-3】(25-26高二下·安徽合肥·期中)为研究高中生每周自主整理错题时长与数学学科成绩的关联性,某高中数学教研组从本校高二年级随机抽取了100名学生进行调查,统计其每周整理错题时长(单位:小时)及期末数学成绩,按照“整理错题时长≥2小时”和“整理错题时长<2小时”将学生分为时长充足组和时长不足组,再按照数学成绩是否不低于120分(满分150分)分为成绩优秀和成绩一般,得到如下列联表:
成绩优秀
成绩一般
合计
时长充足组
30
10
40
时长不足组
20
40
60
合计
50
50
100
同时,从样本中随机选取6名学生,记录其每周整理错题时长(记为变量,单位:小时)与对应数学成绩(记为变量,单位:分),得到如下数据:
学生编号
1
2
3
4
5
6
0
1
2
2
3
4
91
105
116
119
125
140
(1)根据表中数据,依据的独立性检验,能否认为高中生数学成绩与每周整理错题时长充足与否有关联?
(2)请你结合第(1)问得出的独立性检验结论,根据选取的6组数据,建立关于的经验回归方程,并预测某名学生每周整理错题时长为4.5小时,其数学成绩大约为多少分?
参考数据与公式:.
0.050
0.010
0.001
3.841
6.635
10.828
经验回归方程中斜率和截距的最小二乘估计公式分别为:,
一、单选题
1.(25-26高二下·辽宁·开学考试)统计学中,常用的显著性水平以及对应的分位数如下表所示.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.在犯错误的概率不超过1的前提下,可以认为与有关
B.在犯错误的概率不超过的前提下,可以认为与有关
C.有的把握认为与有关
D.有的把握认为与有关
2.(24-25高二下·湖北武汉·期末)某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下列联表:
去年体检人数
去年未体检人数
合计
高中教师
70
m
100
初中教师
n
20
100
合计
e
f
d
根据列联表可求得( )
(附:,)
A. B. C. D.
3.(25-26高二下·全国·单元测试)根据下面的列联表判断患肝病与嗜酒有关系的把握有( )
肝病
酒性
合计
嗜酒
不嗜酒
患肝病
7775
42
7817
未患肝病
2099
49
2148
合计
9874
91
9965
A. B. C. D.
4.(25-26高二下·全国·单元测试)春节期间,“厉行节约,反对浪费”之风悄然兴起,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
性别
“光盘”行动
合计
做不到“光盘”
能做到“光盘”
男
45
10
55
女
30
15
45
合计
75
25
100
附:
0.10
0.05
0.025
2.706
3.841
5.024
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有以上的把握认为”该市居民能否做到‘光盘’与性别无关”
5.(24-25高二下·甘肃白银·期末)假设有两个分类变量X,Y,它们的可能取值分别为和,其列联表为
合计
合计
以下各组数据中,对于同一样本能说明与有关系的可能性最大的一组为( )
A. B.
C. D.
6.(25-26高二上·安徽淮北·期末)读万卷书,行万里路.随着我国教育模式由“应试教育”向“素质教育”转变,研学旅行作为一种传统而现代的素质教育手段被广泛关注.某校对“是否喜欢参加暑期研学旅行与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢参加暑期研学旅行的人数占男生人数的,女生中喜欢参加暑期研学旅行的人数占女生人数的.若有95%的把握认为是否喜欢参加暑期研学旅行与学生性别有关,则被调查的学生中,男生的人数不可能为( )
A.25 B.45 C.60 D.75
7.(25-26高二上·黑龙江齐齐哈尔·期末)某校对“学生性别和喜欢刷视频是否有关”作了一次调查,得到如下列联表:
不喜欢刷视频
喜欢刷视频
总计
男生
女生
总计
若通过计算,可得根据小概率值的独立性检验,认为学生是否喜欢刷视频与性别有关联,则正整数的最小值为( )
附:,.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A.80 B.100 C.120 D.150
8.(24-25高二下·福建厦门·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
二、多选题
9.(25-26高二下·浙江温州·期中)某实验室为了研究荧光抗体法与常规培养法在沙门氏菌检验结果中是否存在差异,用以上两种检验方法对某种食品做了沙门氏菌检验,结果得到列联表如下:
阳性
阴性
合计
荧光抗体法
150
200
常规培养法
80
200
合计
270
130
400
参考公式:,其中.
附:
0.050
0.010
0.001
3.841
6.635
10.828
下列表述正确的是( )
A.
B.零假设:在沙门氏菌检验中荧光抗体法与常规培养法有差异
C.依据小概率值的独立性检验,认为荧光抗体法与常规培养法在沙门氏菌检验中有差异
D.常规培养法检测沙门氏菌阳性的频率为
10.(24-25高二上·江苏常州·期末)为了探究某次数学测试中成绩达到优秀等级是否与性别存在关联,小华进行了深入的调查,并绘制了下侧所示的列联表(个别数据暂用字母表示):
数学成绩
性别
合计
男
女
优秀
27
70
非优秀
58
110
合计
180
经计算得:,参照下表:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
则下列选项正确的为( )
A.
B.
C.可以在犯错误的概率不超过5%的前提下认为“数学达到优秀等级与性别有关”
D.没有充分的证据显示“数学达到优秀等级与性别有关”
11.(25-26高二下·河南南阳·期中)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得到如下列联表:(单位:人),则( )
性别
晕机
合计
晕机者
未晕机者
男
女
合计
附:,其中.
A.
B.
C.依据小概率值的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别有关
D.依据小概率值的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别无关
三、填空题
12.(25-26高二下·全国·单元测试)在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算,根据这一数据分析,有________的把握认为打鼾与患心脏病是________(填“有关”或“无关”)的.
13.(25-26高二下·全国·课堂例题)下面是列联表.
合计
21
73
2
25
27
合计
46
100
则表中________,________.
14.(25-26高二下·全国·课后作业)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
患者性别
药效
合计
无效
有效
男
15
35
50
女
6
44
50
合计
21
79
100
设:服用此药的效果与患者的性别无关.则______(精确到小数点后3位),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为______.
四、解答题
15.(25-26高二下·河南焦作·期中)为研究居民体质情况是否与爱好运动有关,现从某地区随机抽取了名居民进行问卷调查,得到如下列联表(单位人):
体质情况组别
良好
非良好
合计
爱好运动
不爱好运动
合计
(1)补全上述列联表;
(2)根据小概率值的独立性检验,分析该地区的居民体质情况是否与爱好运动有关.
附:,其中.
k
16.(25-26高二下·黑龙江大庆·期中)某学校有A、B两家餐厅,王同学第1天午餐时随机选择一家餐厅用餐,如果第1天去A餐厅,那么第2天去A餐厅的概率为0.6;如果第1天去B餐厅,那么第2天去A餐厅的概率为0.8.
(1)求王同学第2天去A餐厅用餐的概率;
(2)A餐厅对就餐环境、菜品种类与品质等方面进行了改造与提升.改造提升后,A餐厅对就餐满意程度进行了调查,统计了100名学生的数据,如下表(单位:人).
就餐满意程度
A餐厅改造提升情况
合计
改造提升前
改造提升后
满意
28
57
85
不满意
12
3
15
合计
40
60
100
依据小概率值的独立性检验,能否认为学生对于A餐厅的就餐满意程度与餐厅的改造提升有关联?附:,其中.
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
17.(24-25高二下·江苏镇江·期末)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年某地区新能源乘用车的年销售量与年份的统计表:
年份x
2020
2021
2022
2023
2024
销量y(万台)
1.00
1.40
1.70
1.90
2.00
某机构调查了该地区60位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
购置传统燃油车
购置新能源车
总计
男性车主
10
48
女性车主
2
总计
60
(1)求新能源乘用车的销量y关于x年份的线性相关系数r,并判断y与x是否线性相关;
(2)请将上述列联表补充完整,并判断是否有的把握认为购车车主是否购置新能源乘用车与性别有关.
参考公式:
相关系数;,其中.
参考数据:.
备注:若,则可判断y与x线性相关.
临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
1 / 17
学科网(北京)股份有限公司
$
专题4.3 独立性检验
教学目标
1.通过实例,理解2×2 列联表的统计意义,能准确构建列联表。
2.了解独立性检验(卡方检验)的基本思想、统计量χ2的含义及计算公式。
3.掌握独立性检验的实施步骤,会用临界值表作出统计推断,并能解释实际问题。
教学重难点
1.重点:
(1)2×2 列联表的结构与编制方法。
(2)独立性检验的基本思想与实施步骤。
(3)卡方统计量χ2的计算与临界值对比。
(4)常见临界值的理解与应用。
2.难点:
(1)独立性检验的统计思想:理解零假设H0(两变量独立)、小概率事件与反证法的区别及联系。
(2)卡方统计量χ2的含义:χ2值越大,拒绝H0的把握越大,两变量关联性越强。
(3)统计推断的严谨表述:正确写出 “有 ××% 的把握认为…… 有关” 或 “没有充分证据显示…… 有关”,避免绝对化结论。
(4)适用条件:列联表中a,b,c,d≥5且样本容量n足够大。
知识点01 分类变量与列联表
1. 分类变量:取值为离散类别(如性别:男 / 女;吸烟:是 / 否),数值仅表分类、无大小意义。
2.列联表:将两个(或两个以上)分类变量进行交叉分类得到的频数分布表称为列联表。
3.2×2 列联表:由于所涉及的两个分类变量X,Y均有两个变量值,所以称之为2×2列联表。
Y1
Y2
合计
X1
a
b
a+b
X2
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
【即学即练】(24-25高二下·江西上饶·月考)(多选)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则( )
合计
合计
A.若,则可以认为与独立
B.若变量与独立,则
C.若很大,则变量与不独立
D.若变量与不独立,则很大
【答案】AC
【知识点】独立事件的判断、列联表分析
【分析】运用独立性检验的步骤原理推理判断即可.
【详解】用频率可以估计,用频率可以估计,用频率可以估计,若,则,可以认为与独立,故正确;
由于,,表示的是频率,是抽取的样本数据,故即使变量与独立,也不一定成立,故错误;
若很大,可以说明与不独立,故正确;
若变量与不独立,,但并不一定很大,故错误.
故选:AC.
知识点02 独立性检验(卡方检验)
1.定义:利用统计量χ2判断两个分类变量是否有关的假设检验方法。
2.核心公式:
3.基本思想(假设检验):
(1)提出零假设H0:两分类变量X,Y独立(无关)。
(2)计算χ2观测值。
(3)对比临界值x0,作出推断:若χ2≥x0:拒绝H0,有(1−α)×100%把握认为X,Y有关(犯错概率≤α)。
若χ2<x0:不拒绝H0,无充分证据显示X,Y有关。
【即学即练】(20-21高二下·福建泉州·期中)某高校“统计初步"”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,计算得到______(保留三位小数),所以判定_______(填“能”或“不能”)在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系.
附:
α
0.10
0.05
0.010
0.005
0.001
2.706
3.841
60.35
7.879
10.828
【答案】 4.844 能
【知识点】卡方的计算
【分析】根据表中数据以及公式计算判断即可.
【详解】解:根据提供的表格得:,
可以在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系,
故答案为: 4.844;能.
知识点03 常用临界值表
χ2 >3.841:95% 把握认为有关。
χ2 >6.635:99% 把握认为有关。
χ2 >10.828:99.9% 把握认为有关。
【即学即练】(2025高二·全国·专题练习) 2025年春节期间,电影《哪吒之魔童闹海》掀起全民观影热潮,连续7天票房逆势攀升,单日最高突破8.6亿元,吸引部分家庭扶老携幼共赴影院,缔造中国影史春节档票房与观影人次双冠王的奇迹.某电影院为了解民众观影的喜欢程度,随机采访了180名观影人员,得到下表:
是否成年人
是否喜欢
合计
不喜欢
喜欢
未成年人
80
100
成年人
20
80
合计
180
依据小概率值的独立性检验,能否认为喜欢电影《哪吒之魔童闹海》与是否成年有关?
参考公式:
0.1
0.05
0.01
2.706
3.841
6.635
【答案】没有充分证据证明喜欢电影《哪吒之魔童闹海》与是否成年有关
【知识点】独立性检验解决实际问题、卡方的计算、独立性检验的概念及辨析、完善列联表
【分析】先由题意补充完整列联表,分别算出值,再根据公式计算得值,然后根据临界值表作出判断即可.
【详解】由题意,
零假设:喜欢电影《哪吒之魔童闹海》与是否成年无关.
由题意补充完整列联表,分别算出,代入公式得:.
根据小概率值的独立性检验,没有充分证据证明喜欢电影《哪吒之魔童闹海》与是否成年有关.
知识点04 独立性检验步骤
1.提出问题,确定两个分类变量,收集数据并编制2×2 列联表。
2.提出统计假设H0:x与y之间没关系(两变量独立)。
3.根据2×2列联表与公式计算χ2 观测值 。
4.查临界值表,确定临界值x0,比较χ2与x0。
5.作出统计推断并解释实际意义。
【即学即练】(25-26高三下·江西·月考)有媒体称开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.现从这200名学生中随机选1名学生,设事件为“选到的学生愿意报名参加答题活动”,事件为“选到的学生为男生”,且.
(1)根据已知条件,完成下列列联表.从不愿意报名参加答题活动的学生中随机选择1人,设选到女生的概率为,求的值;
性别
男生
女生
合计
不愿报名参加答题活动
愿意报名参加答题活动
合计
(2)依据小概率值的独立性检验,分析该校学生报名参加答题活动是否与性别有关.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
性别
男生
女生
合计
不愿报名参加答题活动
20
60
80
愿意报名参加答题活动
80
40
120
合计
100
100
200
;
(2)该校学生报名参加答题活动是否与性别有关.
【知识点】计算条件概率、独立性检验解决实际问题、卡方的计算、完善列联表
【分析】(1)根据给定条件,利用条件概率的定义求出数据并完善列联表,再求出.
(2)求出的观测值,再与临界值比对即可得解.
【详解】(1)由,得愿意报名参加答题活动人数为,
由,得愿意报名参加答题活动的男生人数为,
愿意报名参加答题活动的女生人数为,
所以列联表为:
性别
男生
女生
合计
不愿报名参加答题活动
20
60
80
愿意报名参加答题活动
80
40
120
合计
100
100
200
.
(2)零假设为:学生报名参加答题活动与性别无关,
则,
依据小概率值的独立性检验,推断不成立,
即认为学生报名参加答题活动与性别有关联,此推断犯错误的概率不大于0.001.
题型01 完善列联表
【典例1】(22-23高二下·广东深圳·期中)下面是一个2×2列联表:
合计
合计
则表中a,b处的值分别为__________;__________.
【答案】 52 60
【知识点】完善列联表
【分析】第一空利用直接求出即可;第二空利用,结合的值求得即可.
【详解】根据已知条件,结合列联表之间的数据关系,由表中数据可知,
,所以;
.
故答案为:
【变式1-1】(22-23高二下·青海西宁·期末)第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中,_______________.
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
【答案】
【知识点】列联表分析
【分析】根据题意,利用志愿者的总人数为100,列出方程,即可求解.
【详解】根据表格中的数据,因为志愿者的总人数为100,所以,
解得.
故答案为:.
【变式1-2】(25-26高二下·全国·课后作业)博鳌亚洲论坛2024年年会于3月26日至29日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了30名记者担任对外翻译工作,在下面“性别与是否会俄语”的列联表中,______.
性别
是否会俄语
合计
会
不会
男
20
女
6
合计
18
30
【答案】8
【知识点】完善列联表、列联表分析
【分析】根据列联表的性质,求出a,b,d的值,即可得答案.
【详解】由列联表的性质,可得:,可得,
所以.
故答案为:8
【变式1-3】(21-22高二上·河南开封·期末)某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的列联表中,______.
会外语
不会外语
合计
男
a
b
20
女
6
d
合计
18
50
【答案】24
【知识点】完善列联表
【分析】根据题意列方程组求解即可
【详解】由题意得所以,,.
故答案为:24
题型02 列联表分析
【典例2】(21-22高二下·河南·期中)2022年3月,我国疫情发生频次明显增加.为了防止奥密克戎变异株的传播,各地方政府都采取了有效防治措施.社区志愿者小王参加了防止奥密克戎变异株传播的科普宣传活动,并随机调查了100名居民对防止奥密克戎变异株传播知识的了解情况,得到如下的2×2列联表:
了解
不了解
总计
年龄不小于60岁
a
b
a+b
年龄小于60岁
c
d
c+d
总计
a+c
b+d
a+b+c+d
给出下列4组数据:
① ;② ;
③ ;④ .
则居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是______.(填序号)
【答案】③
【知识点】列联表分析
【分析】根据当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,计算每组的值,比较大小可得答案。
【详解】当的值越大时,居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性越大,
在①中,,在②中,,在③中,,在④中,,
故居民对防止奥密克戎变异株传播知识的了解情况与年龄有关系的可能性最大的是③,
故答案为:③
【变式2-1】(24-25高二下·河南·月考)地铁的开通,在一定程度上缓解了市内交通的拥堵状况.某条地铁线路开通后,某调查机构抽取了部分乘坐该线路地铁的市民作为样本,分析其年龄和性别结构,得到如下信息:35岁及以下的市民中,男性约占;35岁以上的市民中,男性约占;男性市民中,35岁及以下的约占;女性市民中,35岁及以下的约占.根据以上信息,下列结论不一定正确的是( )
A.样本中男性比女性多
B.样本中多数女性是35岁以上
C.样本中35岁及以下的男性人数比35岁以上的女性人数多
D.样本中35岁以上的市民比35岁及以下的多
【答案】C
【知识点】列联表分析、完善列联表
【分析】根据题意,得到如下两个列联表,再一一分析即可.
【详解】根据题意,得到如下两个列联表.
35岁以上
35岁及以下
总计
男性
女性
总计
35岁以上
35岁及以下
总计
男性
女性
总计
根据第1个列联表可知,样本中男性市民人数为,
女性市民人数为,又,即样本中男性比女性多,故A正确;
根据第2个列联表可知,样本中35岁以上女性市民人数为,
35岁及以下女性市民人数为,又,即样本中多数女性是35岁以上,故B正确;
由题意,,所以,故C不正确;
根据第2个列联表可知,样本中35岁以上市民人数为,
35岁及以下市民人数为,又,
即样本中35岁以上的市民比35岁及以下的多,故D正确.
故选:C.
【变式2-2】(17-18高二下·陕西咸阳·期中)下面是列联表,则表中的值为______.
合计
21
63
22
35
57
合计
120
【答案】64
【知识点】列联表分析
【分析】结合列联表的数据分析处理即可得解.
【详解】解:由列联表可得,
又,
即,
故答案为:64.
【变式2-3】(25-26高二下·全国·课堂例题)列联表中随机事件的概率;如表,记,则
合计
合计
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________;
事件发生的概率可估计为________.
【答案】
【知识点】计算条件概率、互斥事件的概率加法公式、列联表分析
【分析】根据古典概型概率公式和条件概率公式进行计算即可.
【详解】;
;
;
故答案为:;;;.
题型03 独立性检验的概念及辨析
【典例3】(2026·辽宁大连·模拟预测)如图的列联表中,定义,易知越大越有利于结论“与有关系”.若当值大于常数时,有的把握认为与有关系,那么的值为( )
(已知,其中,)
总计
总计
A. B.
C. D.
【答案】A
【知识点】独立性检验解决实际问题、卡方的计算、独立性检验的概念及辨析
【分析】根据以及即可求解.
【详解】当有的把握认为与有关系,则,故,
此时临界条件为,此时对应的刚好为,
即此时,即,
故,则,
故,
故选:A
【变式3-1】(24-25高二下·山东烟台·期中)根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
【答案】D
【知识点】独立性检验的概念及辨析
【分析】根据给定条件,利用独立性检验的意义逐项判断即得.
【详解】由,得吸烟与患肺癌有关联,此推断犯错误的概率不大于1%,D正确;
卡方检验仅说明吸烟与患肺癌两个变量间的关联性,无法量化个体情况,这两个变量间也无因果关系,ABC错误.
故选:D
【变式3-2】(24-25高二下·天津和平·期末)某单位对员工是否愿意被外派与年龄的关系进行了一次谓查,根据独立性检验原理,处理所得数据之后发现,得到“是否愿意被外派与年龄有关”这个结论犯错误的概率大于0.001,而不大于0.01,则的值可能为( )
附表:
0.05
0.01
0.001
3.841
6.635
10.828
A.3.206 B.6.561 C.7.879 D.11.028
【答案】C
【知识点】独立性检验的概念及辨析
【分析】由题意,结合小概率表,可判断的值应位于与之间,得到答案.
【详解】由题意得的值应位于与之间,故C正确,ABD错误.
故选:C
【变式3-3】(24-25高二下·四川雅安·期末)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
【答案】A
【知识点】独立性检验的概念及辨析
【分析】根据卡方独立性检验规则,比较与临界值即可得出结论.
【详解】因为,所以牛的毛色与角无关.
故选:A.
题型04 卡方计算及应用
【典例4】(25-26高二下·上海·期中)学校对社团展演活动满意度进行调研,随机抽取高一高二学生各50名,每位同学给出满意或不满意的评价,得到列联表.依据,若没有95%的把握认为年级会对满意度评价有差异,则的最小值为__________.附:,
满意
不满意
高一
高二
【答案】21
【知识点】独立性检验解决实际问题、卡方的计算
【分析】根据定义算出的表达式,由题意得,可得出的最小值.
【详解】由题意得,并令,即,近似解得,即,注意到,故的最小值为.
【变式4-1】(25-26高二下·内蒙古呼和浩特·月考)某校调查学生参加体育锻炼与性别的关系,得到如下列联表(单位:人):
经常锻炼
不经常锻炼
合计
男生
35
55
90
女生
65
45
110
合计
100
100
200
参照公式(其中),计算得______.(保留两位小数)
【答案】
【知识点】卡方的计算
【详解】根据题意有:.
【变式4-2】(25-26高三下·安徽滁州·开学考试)考察棉花种子经过处理与是否生病之间的关系得到如下表所示的数据:
经处理的种子数粒
未经处理的种子数粒
合计粒
得病
不得病
合计
根据以上数据,则统计量的观测值是__________.
【答案】
【知识点】卡方的计算
【分析】由的公式计算.
【详解】,
故答案为:0.164
【变式4-3】(25-26高二上·宁夏银川·期末)“双减”提出要全面减负作业总量和时长,减轻学生过重作业负担,同时坚持从严治理, 全面规范校外培训行为.在“双减”颁布前,某地教育局为了解当地中学生参加校外培训的情况,随机调查了当地100名学生,得到的数据如下表:
参加校外培训
未参加校外培训
总计
初中生
30
20
50
高中生
40
10
50
总计
70
30
100
根据该表格,在“双减”颁布前,______95%的把握认为学生是否参加校外培训与年级段有关.(填“有”或“没有”)
参考临界值表:
0.10
0.05
0.010
2.706
3.841
6.635
.
【答案】有
【知识点】独立性检验解决实际问题、卡方的计算
【分析】根据公式计算出,然后对照临界值表即可作出正确判断.
【详解】由题可知,,
因为,
所以有95%的把握认为学生是否参加校外培训与年级段有关.
故答案为:有.
题型05 独立性检验解决实际问题
【典例5】(25-26高二下·海南·期中)为加强素质教育,提升学生综合素养,高二年级提供了“书法”和“剪纸”两门选修课.为了了解选择“书法”或“剪纸”是否与性别有关,调查了高二年级1500名学生的选择倾向,随机抽取了100人,统计选择两门课程人数如下表:
(1)补全列联表;
选书法
选剪纸
共计
男生
40
50
女生
共计
30
(2)根据小概率值的独立性检验,分析选择“书法”或“剪纸”是否与性别有关?(计算结果保留到小数点后三位)
参考附表:
0.100
0.050
0.025
2.706
3.841
5.024
参考公式:,其中.
【答案】(1)列联表见解析
(2)有
【知识点】完善列联表、卡方的计算、独立性检验解决实际问题
【分析】(1)完善列联表;
(2)利用独立性检验来计算并作出判断.
【详解】(1)根据题意补全列联表,如下:
选书法
选剪纸
共计
男生
40
10
50
女生
30
20
50
共计
70
30
100
(2)零假设:选择“书法”或“剪纸”与性别无关
根据列联表中数据,得,
依据小概率值的独立性检验,有充分的证据推断不成立,认为选“书法”或“剪纸”与性别有关.
【变式5-1】(24-25高三上·江苏南通·月考)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据通过计算有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为_________ .
支持
不支持
男生
女生
附:,其中.
【答案】
【知识点】卡方的计算
【分析】根据临界值表可得出关于的不等式,结合可得出的最小值,即可得出答案.
【详解】因为有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,
所以,即,
因为函数在时单调递增,
且,,,所以的最小值为,
所以在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为.
故答案为:.
【变式5-2】(24-25高二下·全国·课前预习)某医疗机构为了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中,有37人患呼吸道疾病(以下简称患病),183人未患呼吸道疾病(以下简称未患病);不吸烟的295人中,有21人患病,274人未患病.根据这些数据能否断定:患呼吸道疾病与吸烟有关?
【答案】可以认为患呼吸道疾病与吸烟有关.
【知识点】列联表分析
【分析】根据题意列出列联表,再算出在吸烟中和不吸烟中患病的频率,通过比较之间是否存在差异即可判断是否有关.
【详解】为了研究这个问题,我们将上述数据用表格表示如下:
患病
未患病
合计
吸烟
37
183
220
不吸烟
21
274
295
合计
58
457
515
由此表可以粗略地估计出在吸烟的人中,有的人患病;
在不吸烟的人中,有的人患病.
因此,从直观上可以得到结论:吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,
故可以认为患呼吸道疾病与吸烟有关.
【变式5-3】(25-26高二下·河北沧州·期中)近年来,食品添加剂泛滥引起消费者关注,某媒体对消费者在购买预包装食品时是否关注配料表进行调查,调查了名男性消费者与名女性消费者,关注配料表的消费者共有人,其中女性人.
(1)用列联表表示上述数据;
(2)依据小概率值的独立性检验,能否据此推断消费者购买预包装食品时是否关注配料表与性别有关?
附:,其中.
【答案】(1)
性别
配料表
合计
关注
不关注
男性
女性
合计
(2)认为消费者购买预包装食品时是否关注配料表与性别有关.
【知识点】完善列联表、卡方的计算、独立性检验解决实际问题
【分析】(1)直接由题中所给的数据可得列联表;
(2)直接由独立性检验计算可得.
【详解】(1)依题意,列联表如下: 单位:人
性别
配料表
合计
关注
不关注
男性
女性
合计
(2)零假设为:消费者购买预包装食品时是否关注配料表与性别无关,
则,
依据小概率值的独立性检验,因此可以认为不成立,
所以认为消费者购买预包装食品时是否关注配料表与性别有关.
题型06 独立性检验与概率的综合问题
【典例6】(25-26高二下·湖南衡阳·期中)(13分《国民体质测定标准(2023年修订)》将体质情况综合评级为优秀、良好、合格和不合格四个等级.某地区为了解国民体质情况是否与爱好运动有关,从该地区体质达到“合格”及以上的人群中随机抽取了人进行问卷调查,得到如下列联表:
体质情况组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
(1)求的值,并依据小概率值的独立性检验,分析体质情况是否与爱好运动有关;
(2)在体质情况综合评级为“合格”的对象中,按是否爱好运动进行分层,用比例分配的分层随机抽样方法,从样本中抽取6人作进一步调查,再从这6人中随机抽取2人线下访谈,记这2人中“爱好运动”的人数为X,求X的分布列及数学期望.
附:,其中.
【答案】(1),体质情况与爱好运动有关.
(2)的分布列为:
0
1
2
.
【知识点】卡方的计算、独立性检验解决实际问题、写出简单离散型随机变量分布列、求离散型随机变量的均值
【详解】(1)由表中数据可得,表格完善如下:
体质情况组别
合格
良好及以上
合计
爱好运动
不爱好运动
合计
设:体质情况与爱好运动无关,
则,
依据小概率值的独立性检验,否定,故体质情况与爱好运动有关.
(2)易知名体质情况“合格”对象中有人爱好运动,人不爱好运动,
故的所有可能取值为0,1,2,
,,,
即所求分布列为
0
1
2
所以的期望.
【变式6-1】(25-26高二下·云南昭通·期中)为探究学生完成数学作业情况与成绩之间的联系,某学校从高一,高二,高三三个年级采用按比例分层抽样的方式得到400名学生的测验成绩,得到如下列联表:
成绩优秀
成绩不优秀
总计
不认真完成作业
认真完成作业
总计
(1)求;
(2)记不认真完成作业的学生中,成绩不优秀的概率为,给出的估计值;
(3)能否有的把握认真完成作业对成绩优秀有效?
附:.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1),
(2)
(3)有的把握认为认真完成作业对成绩优秀有效
【知识点】完善列联表、卡方的计算、计算古典概型问题的概率
【详解】(1)由列联表知,
(2)由列联表知,不认真完成作业的有人,不认真完成作业且成绩不优秀的有人,所以在不认真完成作业的学生中,成绩不优秀的频率为,
所以不认真完成作业且成绩不优秀的概率的估计值为.
(3)零假设:假设认真完成作业与成绩优秀无关;
由列联表得到,
所以有的把握认为认真完成作业对成绩优秀有效.
【变式6-2】(25-26高三上·江西南昌·期末)为研究高中生自主刷题与数学成绩提升的关联性,某教研机构随机抽取200名高三学生开展调查,统计数据如下表(单位:人):
成绩显著提升
成绩未显著提升
合计
坚持自主刷题
90
30
120
未坚持自主刷题
20
60
80
合计
110
90
200
根据上述数据,解答下列问题:
(1)依据小概率值的独立性检验,判断能否认为高中生坚持自主刷题与数学成绩显著提升有关?
(2)已知在坚持自主刷题的学生中,数学成绩达到优秀的概率为0.6;在未坚持自主刷题的学生中,数学成绩达到优秀的概率为0.3.现从这200名学生中随机抽取1人,发现其数学成绩为优秀,求该学生坚持自主刷题的概率.
附:,其中.
【答案】(1)有关
(2)
【知识点】利用全概率公式求概率、计算条件概率、独立性检验解决实际问题、卡方的计算
【分析】(1)由题意可得,根据独立性检验知识即可得结论;
(2)定义事件:设“该学生坚持自主刷题”,则“该学生未坚持自主刷题”,“该学生数学成绩优秀”,根据题意求出的值,结合,求出的值,再由条件概率公式,求解即可.
【详解】(1)假设 :高中生坚持自主刷题与数学成绩显著提升无关联;
经计算因为,
故依据小概率值的独立性检验,我们推断假设不成立,
即认为高中生坚持自主刷题与数学成绩显著提升有关联,该推断犯错误概率不超过0.001;
(2)定义事件:设“该学生坚持自主刷题”,
则“该学生未坚持自主刷题”,“该学生数学成绩优秀”,
则,
所以,
所以
故该学生坚持自主刷题的概率为.
【变式6-3】(25-26高三下·云南楚雄·月考)某校为调查学生对“大语言模型”的了解程度,随机抽取70名男生和30名女生参加“大语言模型”相关知识问卷调查(满分100分),若分数为80分及以上的为了解,其他为不了解,统计并得到如下列联表:
男生
女生
合计
了解
50
15
65
不了解
20
15
35
合计
70
30
100
(1)根据小概率值的独立性检验,能否认为对“大语言模型”的了解程度与性别有关联?
(2)从样本中的70名男生中,按对“大语言模型”的了解程度,通过分层随机抽样抽取7人,再从这7人中抽取2人进行调研,记抽出的2人中对“大语言模型”了解的人数为,求的分布列和数学期望.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【答案】(1)认为对“大语言模型”的了解程度与性别有关联.
(2)
0
1
2
数学期望.
【知识点】超几何分布的分布列、卡方的计算
【分析】(1)使用的计算公式求解;
(2)使用超几何分布概率公式求解.
【详解】(1)零假设:对“大语言模型”的了解程度与性别无关联.
根据表中数据,计算得到,
根据小概率值的独立性检验,推断不成立,所以认为对“大语言模型”的了解程度与性别有关联.
(2)由题知抽取的7名男生中,对“大语言模型”了解的有人,
对“大语言模型”不了解的有人,
则再从这7人中选取2人,的可能取值为,
,
所以的分布列为
0
1
2
数学期望.
题型07 独立性检验与回归分析的综合问题
【典例7】(25-26高二下·湖南长沙·月考)为研究高中生每周自主整理错题时长与数学学科成绩的关联性,某高中数学教研组从本校高二年级随机抽取了100名学生进行调查,统计其每周整理错题时长(单位:小时)及期末数学成绩,按照“整理错题时长小时”和“整理错题时长小时”将学生分为时长充足组和时长不足组,再按照数学成绩是否不低于120分(满分150分)分为成绩优秀和成绩一般,得到如下列联表:
成绩优秀
成绩一般
合计
时长充足组
30
10
40
时长不足组
20
40
60
合计
50
50
100
同时,从样本中随机选取6名学生,记录其每周整理错题时长(记为变量x,单位:小时)与对应数学成绩(记为变量y,单位:分),得到如下数据:
学生编号
1
2
3
4
5
6
x
0
1
2
2
3
4
y
91
105
116
119
125
140
(1)根据表中数据,依据的独立性检验,能否认为高中生数学成绩与每周整理错题时长充足与否有关联?并解释所得结论的实际含义;
(2)请你结合第(1)问得出的独立性检验结论,根据选取的6组数据,建立y关于x的经验回归方程,并预测某名学生每周整理错题时长为4.5小时,其数学成绩大约为多少分?该结果是否一定与实际情况相符合,原因是什么?
参考数据与公式:,.
0.050
0.010
0.001
3.841
6.635
10.828
经验回归方程中斜率和截距的最小二乘估计公式分别为:,.
【答案】(1)认为高中生数学成绩与每周自主整理错题时长有关,答案见解析
(2),145.5分,该结果与实际得分不一定相符合,原因见解析
【知识点】根据回归方程进行数据估计、独立性检验解决实际问题、求回归直线方程
【分析】(1)根据独立性检验的概念,求出,判断假设是否成立即可;
(2)根据最小二乘估计公式求出经验回归方程,进而计算估计结果,判断其是否符合事实即可.
【详解】(1)零假设为:高中生数学成绩与每周自主整理错题时长无关,
根据表中数据可得,,
根据小概率值的独立性检验,我们推断不成立,
即认为高中生数学成绩与每周自主整理错题时长有关,该推断犯错误的概率不超过0.001.
(2)由数据得,,,
,
,
得,,
所以y关于x的经验回归方程为.
将代入经验回归方程得,
所以预测某名学生每周整理错题时长为4.5小时,其数学成绩大约为145.5分.
该结果与实际得分不一定相符合,原因是把每周整理错题时长为4.5小时的学生数学成绩作为一个子总体,数学成绩为145.5分是这个子总体的均值的估计值,影响数学成绩还有其他的因素(言之合理即可).
【变式7-1】(25-26高二下·广西柳州·期中)下表是某品牌净化器的年销售量与年份的统计表.
年份
2021
2022
2023
2024
2025
年份代码
1
2
3
4
5
年销售量(万台)
2
3.5
2.5
8
9
(1)计算净化器的年销售量关于年份代码的线性回归方程;
(2)为了调查两地区人群对该品牌净化器的了解情况,调查机构在两地区的人群中分别进行品牌知晓情况的问卷调查.统计知晓与不知晓的人数,得到如下列联表.根据小概率值的独立性检验,判断两地区的人群对该品牌净化器的知晓情况是否有显著差异.
知晓
不知晓
合计
地区
80
20
100
地区
40
60
100
合计
120
80
200
附:关于回归方程,回归系数的计算公式,其中为样本点的中心, ;的计算公式;
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)
(2)两地区的人群对该品牌净化器的知晓情况有显著差异.
【知识点】独立性检验解决实际问题、求回归直线方程
【分析】(1)先计算出代入公式计算出系数和;
(2)先假设无关,将列联表中数据代入公式计算值,与临界值进行比较判断是否相关.
【详解】(1)由表可知,样本中心为:
,
,
则,.
可得净化器的年销售量关于年份代码的线性回归方程为:
(2)设零假设两地区的人群对该品牌净化器的知晓情况没有显著差异
.
因为,
所以,在犯错误的概率不超过0.05的前提下,认为不成立,即两地区的人群对该品牌净化器的知晓情况有显著差异.
【变式7-2】(25-26高二下·湖南长沙·期中)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解大众对新能源汽车的接受程度,某城市汽车行业协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取100名市民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了如下列联表:
选择新能源汽车
选择传统汽车
总计
40岁以下
70
30
100
40岁及以上
40
60
100
总计
110
90
200
(i)记选择新能源汽车者中年龄在40岁以下的概率为,求的估计值;
(ii)依据小概率值的独立性检验,分析选择新能源汽车是否与年龄有关.
(2)为了了解该地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量(单位:万台)关于年份的线性回归方程,且销售量的方差为,年份的方差为.求与间的样本相关系数,并据此判断该地区新能源汽车销售量与年份的线性相关性强弱.
附:(i)在线性回归方程中,,;
(ii)样本相关系数,若,则可判断与线性相关性很强;
(iii),其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【答案】(1)(i)(ii)可以认为选择新能源汽车与年龄有关系
(2),与线性相关性很强
【知识点】独立性检验解决实际问题、卡方的计算、相关系数的计算、线性回归
【分析】(1)(i)根据古典概型计算公式计算求解;(ii)计算根据临界值表判断即可;
(2)根据最小二乘法结合题中参考公式计算求解即可判断.
【详解】(1)(i)由题可知,样本中选择新能源汽车者中年龄在40岁以下的频率为,
由样本估计总体可得选择新能源汽车者中年龄在40岁以下的概率.
(ii)零假设为:选择新能源汽车与年龄无关,
由列联表中数据代入计算得:,
所以依据小概率值的独立性检验,推断不成立,
即可以认为选择新能源汽车与年龄有关系,此推断犯错误的概率不超过.
(2)因为,,
所以,
故与线性相关性很强.
【变式7-3】(25-26高二下·安徽合肥·期中)为研究高中生每周自主整理错题时长与数学学科成绩的关联性,某高中数学教研组从本校高二年级随机抽取了100名学生进行调查,统计其每周整理错题时长(单位:小时)及期末数学成绩,按照“整理错题时长≥2小时”和“整理错题时长<2小时”将学生分为时长充足组和时长不足组,再按照数学成绩是否不低于120分(满分150分)分为成绩优秀和成绩一般,得到如下列联表:
成绩优秀
成绩一般
合计
时长充足组
30
10
40
时长不足组
20
40
60
合计
50
50
100
同时,从样本中随机选取6名学生,记录其每周整理错题时长(记为变量,单位:小时)与对应数学成绩(记为变量,单位:分),得到如下数据:
学生编号
1
2
3
4
5
6
0
1
2
2
3
4
91
105
116
119
125
140
(1)根据表中数据,依据的独立性检验,能否认为高中生数学成绩与每周整理错题时长充足与否有关联?
(2)请你结合第(1)问得出的独立性检验结论,根据选取的6组数据,建立关于的经验回归方程,并预测某名学生每周整理错题时长为4.5小时,其数学成绩大约为多少分?
参考数据与公式:.
0.050
0.010
0.001
3.841
6.635
10.828
经验回归方程中斜率和截距的最小二乘估计公式分别为:,
【答案】(1)能认为有关联,理由见解析
(2)经验回归方程为 ,预测数学成绩约为分
【知识点】求回归直线方程、卡方的计算、独立性检验解决实际问题、根据回归方程进行数据估计
【分析】(1)根据列联表数据代入卡方检验公式计算统计量,将结果与显著性水平0.001对应的临界值对比,判断高中生数学成绩与整理错题时长是否有关联;
(2)先计算变量和的样本均值,再根据最小二乘法公式求出回归系数与截距得到经验回归方程,代入给定时长预测对应的数学成绩.
【详解】(1)零假设为:高中生数学成绩与每周自主整理错题时长无关,
由列联表得: ,
代入卡方公式: ,
因为 (对应的临界值),
因此依据的独立性检验,推断不成立,
即能认为高中生数学成绩与每周整理错题时长充足与否有关联,该推断犯错误的概率不超过0.001.
(2)由于第(1)问的独立性检验表明数学成绩与整理错题时长有关联,
由已知6组数据计算得: , ,
,
,
因此 , ,
所以关于的经验回归方程为 ,
当时, ,即其数学成绩大约是分.
一、单选题
1.(25-26高二下·辽宁·开学考试)统计学中,常用的显著性水平以及对应的分位数如下表所示.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.在犯错误的概率不超过1的前提下,可以认为与有关
B.在犯错误的概率不超过的前提下,可以认为与有关
C.有的把握认为与有关
D.有的把握认为与有关
【答案】C
【知识点】独立性检验解决实际问题
【分析】根据独立性检验的应用判断选项.
【详解】因为,所以,
所以在犯错误的概率不超过的前提下,
可以认为与有关或有的把握认为与有关.
2.(24-25高二下·湖北武汉·期末)某市准备安排该市所有中学教师进行体检,同时调查去年该市教师体检情况,并随机抽取100名高中教师与100名初中教师,经过统计得到如下列联表:
去年体检人数
去年未体检人数
合计
高中教师
70
m
100
初中教师
n
20
100
合计
e
f
d
根据列联表可求得( )
(附:,)
A. B. C. D.
【答案】C
【知识点】卡方的计算、完善列联表
【分析】根据表中数据完成列联表,再代入公式可得答案.
【详解】列联表:
去年体检人数
去年未体检人数
合计
高中教师
70
30
100
初中教师
80
20
100
合计
150
50
200
.
故选:C.
3.(25-26高二下·全国·单元测试)根据下面的列联表判断患肝病与嗜酒有关系的把握有( )
肝病
酒性
合计
嗜酒
不嗜酒
患肝病
7775
42
7817
未患肝病
2099
49
2148
合计
9874
91
9965
A. B. C. D.
【答案】D
【知识点】独立性检验解决实际问题、卡方的计算
【分析】由列联表中的数据,求得,即可得到答案.
【详解】由列联表中的数据,计算得,
故有的把握认为患肝病与嗜酒有关系.
故选:D.
4.(25-26高二下·全国·单元测试)春节期间,“厉行节约,反对浪费”之风悄然兴起,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
性别
“光盘”行动
合计
做不到“光盘”
能做到“光盘”
男
45
10
55
女
30
15
45
合计
75
25
100
附:
0.10
0.05
0.025
2.706
3.841
5.024
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有以上的把握认为”该市居民能否做到‘光盘’与性别无关”
【答案】C
【知识点】独立性检验解决实际问题、卡方的计算
【分析】根据统计表格中的数据,求得,结合附表,即可得到答案.
【详解】由统计表格中的数据,可得,
所以有以上的把握认为“该市居民能否做到‘光盘’与性别有关”.
故选:C.
5.(24-25高二下·甘肃白银·期末)假设有两个分类变量X,Y,它们的可能取值分别为和,其列联表为
合计
合计
以下各组数据中,对于同一样本能说明与有关系的可能性最大的一组为( )
A. B.
C. D.
【答案】C
【知识点】独立性检验的基本思想
【分析】计算各选项中的值,比较大小,即可得答案.
【详解】计算各选项中的值,值越大,说明相应的两个分类变量有关系的可能性越大;
对于A,,
对于B,,
对于C,,
对于D,,
由于,
故选:C
6.(25-26高二上·安徽淮北·期末)读万卷书,行万里路.随着我国教育模式由“应试教育”向“素质教育”转变,研学旅行作为一种传统而现代的素质教育手段被广泛关注.某校对“是否喜欢参加暑期研学旅行与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢参加暑期研学旅行的人数占男生人数的,女生中喜欢参加暑期研学旅行的人数占女生人数的.若有95%的把握认为是否喜欢参加暑期研学旅行与学生性别有关,则被调查的学生中,男生的人数不可能为( )
A.25 B.45 C.60 D.75
【答案】A
【知识点】独立性检验解决实际问题、卡方的计算
【分析】根据条件设男生人数为,再根据条件列出列联表,计算,解不等式.
【详解】依题意,设男生的人数为,可列出2×2列联表如下所示:
是否喜欢参加暑期研学旅行
性别
总计
男生
女生
喜欢
不喜欢
总计
则=.
由题意知,即,得,所以.
又,所以结合选项知B,C,D项都可以.
7.(25-26高二上·黑龙江齐齐哈尔·期末)某校对“学生性别和喜欢刷视频是否有关”作了一次调查,得到如下列联表:
不喜欢刷视频
喜欢刷视频
总计
男生
女生
总计
若通过计算,可得根据小概率值的独立性检验,认为学生是否喜欢刷视频与性别有关联,则正整数的最小值为( )
附:,.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A.80 B.100 C.120 D.150
【答案】B
【知识点】卡方的计算
【分析】完成列联表,计算,即可求出正整数的最小值.
【详解】完成列联表如下:
不喜欢刷视频
喜欢刷视频
总计
男生
女生
总计
则,解得.
又为正整数,且是5的倍数,可得的最小值为100.
故选:B.
8.(24-25高二下·福建厦门·期末)校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数的.若依据小概率值的独立性检验认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,,.
A.20 B.30 C.35 D.40
【答案】A
【知识点】独立性检验解决实际问题、卡方的计算
【分析】设总人数为,根据给定条件,求出的观测值并建立不等式,进而求出的最小整数值得解.
【详解】设总人数为,则男生选学生物学的人数为,女生选学生物学的人数为,
则列联表为:
男生
女生
合计
选生物学
不选生物学
合计
m
m
2m
因此,
即,又为的倍数,所以男生最少有人.
故选:A
二、多选题
9.(25-26高二下·浙江温州·期中)某实验室为了研究荧光抗体法与常规培养法在沙门氏菌检验结果中是否存在差异,用以上两种检验方法对某种食品做了沙门氏菌检验,结果得到列联表如下:
阳性
阴性
合计
荧光抗体法
150
200
常规培养法
80
200
合计
270
130
400
参考公式:,其中.
附:
0.050
0.010
0.001
3.841
6.635
10.828
下列表述正确的是( )
A.
B.零假设:在沙门氏菌检验中荧光抗体法与常规培养法有差异
C.依据小概率值的独立性检验,认为荧光抗体法与常规培养法在沙门氏菌检验中有差异
D.常规培养法检测沙门氏菌阳性的频率为
【答案】ACD
【知识点】用频率估计概率、独立性检验解决实际问题、卡方的计算、独立性检验的概念及辨析
【详解】A,根据表格数据可知,,A正确;
B,为了研究荧光抗体法与常规培养法在沙门氏菌检验结果中是否存在差异,
零假设:在沙门氏菌检验中荧光抗体法与常规培养法无差异,B错误;
C,由题意得,
零假设不成立,依据小概率值的独立性检验,认为荧光抗体法与常规培养法在沙门氏菌检验中有差异,C正确;
D,
D,由表格数据知,常规培养法检测沙门氏菌阳性的频率为,D正确.
10.(24-25高二上·江苏常州·期末)为了探究某次数学测试中成绩达到优秀等级是否与性别存在关联,小华进行了深入的调查,并绘制了下侧所示的列联表(个别数据暂用字母表示):
数学成绩
性别
合计
男
女
优秀
27
70
非优秀
58
110
合计
180
经计算得:,参照下表:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
则下列选项正确的为( )
A.
B.
C.可以在犯错误的概率不超过5%的前提下认为“数学达到优秀等级与性别有关”
D.没有充分的证据显示“数学达到优秀等级与性别有关”
【答案】ABD
【知识点】独立性检验解决实际问题、完善列联表
【分析】利用列联表中数据计算判断AB;结合的观测值及临界值表判断CD.
【详解】对于AB,由列联表知,,AB正确;
对于CD,由知,C错误,D正确.
故选:ABD.
11.(25-26高二下·河南南阳·期中)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得到如下列联表:(单位:人),则( )
性别
晕机
合计
晕机者
未晕机者
男
女
合计
附:,其中.
A.
B.
C.依据小概率值的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别有关
D.依据小概率值的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别无关
【答案】AC
【知识点】卡方的计算、独立性检验解决实际问题、完善列联表
【分析】根据题中信息完善列联表,可判断AB选项;利用独立性检验的基本思想可判断CD选项.
【详解】由题中列联表数据,知,解得,
所以得到如下列联表:
性别
晕机
合计
晕机者
未晕机者
男
女
合计
所以,即A正确;
在恶劣天气的飞行航程中,是否晕机与性别无关,
由列联表中的数据,得,
依据小概率值的独立性检验,可以推断不成立,
即在恶劣天气的飞行航程中,是否晕机与性别有关,所以B、D错误,A、C正确.
三、填空题
12.(25-26高二下·全国·单元测试)在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算,根据这一数据分析,有________的把握认为打鼾与患心脏病是________(填“有关”或“无关”)的.
【答案】 有关
【知识点】独立性检验解决实际问题、独立性检验的概念及辨析
【分析】根据题意,结合独立性检验的数据,即可得到答案.
【详解】由题意知,经过计算,可得,
所以有的把握认为打鼾与患心脏病是有关的.
故答案为:;有关.
13.(25-26高二下·全国·课堂例题)下面是列联表.
合计
21
73
2
25
27
合计
46
100
则表中________,________.
【答案】 52 54
【知识点】完善列联表
【分析】利用 2×2 列联表中 “行合计 = 该行各单元格频数之和”“列合计 = 该列各单元格频数之和” 的关系,依次计算出 和 的值.
【详解】由列联表:.
故答案为:①;②.
14.(25-26高二下·全国·课后作业)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
患者性别
药效
合计
无效
有效
男
15
35
50
女
6
44
50
合计
21
79
100
设:服用此药的效果与患者的性别无关.则______(精确到小数点后3位),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为______.
【答案】 4.882 5%
【知识点】独立性检验解决实际问题
【分析】计算,再由独立性检验得出结论.
【详解】由公式计算得.
因为,所以我们有的把握认为服用此药的效果与患者的性别有关,从而出错的可能性为.
故答案为:4.882;5%
四、解答题
15.(25-26高二下·河南焦作·期中)为研究居民体质情况是否与爱好运动有关,现从某地区随机抽取了名居民进行问卷调查,得到如下列联表(单位人):
体质情况组别
良好
非良好
合计
爱好运动
不爱好运动
合计
(1)补全上述列联表;
(2)根据小概率值的独立性检验,分析该地区的居民体质情况是否与爱好运动有关.
附:,其中.
k
【答案】(1)答案见解析
(2)该地区居民体质情况与爱好运动有关.
【知识点】完善列联表、独立性检验解决实际问题、卡方的计算
【分析】(1)根据已知信息补全列联表;
(2)根据已知数据进行卡方计算,结合附表信息判断相关性.
【详解】(1)
体质情况组别
良好
非良好
合计
爱好运动
400
200
600
不爱好运动
200
200
400
合计
600
400
1000
(2)假设该地区居民体质情况与爱好运动无关,根据表中数据得,
,
根据小概率值的独立性检验,有充分理由推断假设不成立,
故该地区居民体质情况与爱好运动有关.
16.(25-26高二下·黑龙江大庆·期中)某学校有A、B两家餐厅,王同学第1天午餐时随机选择一家餐厅用餐,如果第1天去A餐厅,那么第2天去A餐厅的概率为0.6;如果第1天去B餐厅,那么第2天去A餐厅的概率为0.8.
(1)求王同学第2天去A餐厅用餐的概率;
(2)A餐厅对就餐环境、菜品种类与品质等方面进行了改造与提升.改造提升后,A餐厅对就餐满意程度进行了调查,统计了100名学生的数据,如下表(单位:人).
就餐满意程度
A餐厅改造提升情况
合计
改造提升前
改造提升后
满意
28
57
85
不满意
12
3
15
合计
40
60
100
依据小概率值的独立性检验,能否认为学生对于A餐厅的就餐满意程度与餐厅的改造提升有关联?附:,其中.
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
【答案】(1)0.7
(2)认为学生对于A餐厅的就餐满意程度与餐厅的改造提升有关联.
【知识点】卡方的计算、利用全概率公式求概率、独立性检验解决实际问题
【分析】(1)应用全概率公式计算求解;
(2)先计算得出,再与临界值比较,进而判断学生对于A餐厅的就餐满意程度与餐厅的改造提升的相关性.
【详解】(1)设表示第1天去A餐厅,表示第2天去A餐厅.
,.
,.
由全概率公式:
(2)零假设:学生对于A餐厅的就餐满意程度与餐厅的改造提升无关.
根据表格数据计算的观测值:
因为,
所以依据小概率值的独立性检验,我们推断不成立,
即认为学生对于A餐厅的就餐满意程度与餐厅的改造提升有关联.
17.(24-25高二下·江苏镇江·期末)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年某地区新能源乘用车的年销售量与年份的统计表:
年份x
2020
2021
2022
2023
2024
销量y(万台)
1.00
1.40
1.70
1.90
2.00
某机构调查了该地区60位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
购置传统燃油车
购置新能源车
总计
男性车主
10
48
女性车主
2
总计
60
(1)求新能源乘用车的销量y关于x年份的线性相关系数r,并判断y与x是否线性相关;
(2)请将上述列联表补充完整,并判断是否有的把握认为购车车主是否购置新能源乘用车与性别有关.
参考公式:
相关系数;,其中.
参考数据:.
备注:若,则可判断y与x线性相关.
临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1),y与x线性相关
(2)列联表见解析,有的把握认为购车车主是否购置新能源乘用车与性别有关
【知识点】卡方的计算、相关系数的意义及辨析、独立性检验解决实际问题、相关系数的计算
【分析】(1)由题目中的数据,利用相关系数的计算公式,可得答案;
(2)根据独立性检验的解题方法,可得答案.
【详解】(1)由表格知:,,
,
有,
则y与x线性相关
(2)依题意,完善表格如下:
购置传统燃油车
购置新能源车
总计
男性车主
38
10
48
女性车主
2
10
12
总计
40
20
60
提出假设:购车车主是否购置新能源乘用车与性别无关由列联表数据得:
,因为,
故有的把握认为购车车主是否购置新能源乘用车与性别有关.
1 / 17
学科网(北京)股份有限公司
$