8.3 列联表与独立性检验-【金版新学案】2025-2026学年高中数学选择性必修第三册同步课堂高效讲义配套课件PPT(人教A版)
2026-03-25
|
92页
|
73人阅读
|
4人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 8.3 列联表与独立性检验 |
| 类型 | 课件 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | PPTX |
| 文件大小 | 7.56 MB |
| 发布时间 | 2026-03-25 |
| 更新时间 | 2026-03-25 |
| 作者 | 山东正禾大教育科技有限公司 |
| 品牌系列 | 金版新学案·高中同步导学 |
| 审核时间 | 2026-02-15 |
| 下载链接 | https://m.zxxk.com/soft/56471693.html |
| 价格 | 4.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中数学课件聚焦“列联表与独立性检验”,通过问题导思(如吸烟与肺癌关系调查)引入,从分类变量定义、2×2列联表构建,到等高条形图直观分析,再到独立性检验的思想与方法,形成递进式学习支架,结合典例解析与分层练习。
其亮点是以真实情境实例(如疫苗实验、电商消费分析)驱动教学,通过数学抽象(分类变量概念)、数据分析(χ²统计量计算)、数学建模(实际问题转化)提升核心素养,采用数形结合与表格小结,帮助学生系统掌握,教师使用可高效落实重难点,培养学生统计思维与应用能力。
内容正文:
8.3 列联表与独立性检验
第八章 成对数据的统计分析
单元学习八 2×2列联表
[单元整体设计] 本单元主要学习处理定性数据的统计方法.学习内容为分类变量与列联表、独立性检验.本单元内容难度较大,涉及的基础知识较多,涉及的统计思想方法主要是假设检验的思想方法.学习计划2
课时.
本单元内容重点是2×2列联表、独立性检验的思想和方法.难点是χ2统计量的导出和意义、独立性检验的思想和方法.在研究的过程中,提升数学抽象、数学建模、数据分析、数学运算的核心素养.
学习目标
1.通过实例,理解2×2列联表的统计意义,培养数学抽象的核
心素养.
2.理解判断两个分类变量是否有关系的常用方法.
3.了解随机变量χ2的意义.
4.通过实例,了解2×2列联表、独立性检验及其应用,提升数
据分析、数学建模、数学运算的核心素养.
任务一 分类变量与列联表
1
任务二 等高堆积条形图
2
任务三 独立性检验
3
课时分层评价
6
内容索引
随堂评价
5
任务四 列联表与独立性检验的综合应用
4
任务一 分类变量与列联表
返回
(阅读教材P124-125,完成探究问题1、2)
问题1.下列变量:人的身高,直尺的长度,民族,有什么不同?
提示:人的身高,直尺的长度都是数值变量;民族有汉族,回族等“值”,不同“值”表示个体所属的不同类别.
问题导思
问题2.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人,其中,不吸烟的7 817人中42人患肺癌,吸烟的2 148人中49人患肺癌,我们在研究“吸烟与患肺癌的关系”时,需要关注哪一些量呢?并填表说明.
(1)在不吸烟者中患肺癌的比例为__________;
(2)在吸烟者中患肺癌的比例为__________.
行为 疾病 合计
不患肺癌 患肺癌
不吸烟 42 7 817
吸烟 49 2 148
合计 9 965
0.54%
2.28%
提示:吸烟患肺癌的人数;不吸烟患肺癌的人数;吸烟不患肺癌的人数;不吸烟不患肺癌的人数. 列表如下:
(1)0.54% (2)2.28%
行为 疾病 合计
不患肺癌 患肺癌
不吸烟 7 775 42 7 817
吸烟 2 099 49 2 148
合计 9 874 91 9 965
1.数值变量与分类变量
数值变量:数值变量的取值为______,其大小和运算都有实际含义.
分类变量:为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为__________,分类变量的取值可以用实数表示,例如:性别变量,其取值男和女可以用1和0表示.
新知构建
实数
分类变量
2.2×2列联表
定义一对分类变量X和Y,我们整理数据如表所示:
上表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的______;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个格中的数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是__________.
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
频数
样本容量
(1)分类变量的取值可以用实数来表示,例如:学生所在的班级可以用1,2,3来表示.这些数值只作为编号使用,并没有通常的大小和运算意义.分类变量是相对于数值变量来说的.(2)列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅研究两个分类变量的列联表,并且每个分类变量只取两个值.
微提醒
(链教材P126例1)下表是A,B两所中学的学生对报考某类大学的意愿的列联表:
根据表中的数据回答:A,B两所中学的学生对报考某类大学的态度是否有显著差异?
典例
1
学校 意愿 合计
愿意报考某类大学 不愿意报考某类大学
A中学 18 37 55
B中学 38 57 95
合计 56 94 150
解:A中学愿意报考某类大学的比例为fA= ≈0.327;
B中学愿意报考某类大学的比例为fB= =0.4;
因为fB-fA≈0.4-0.327=0.073,即B中学愿意报考某类大学的比例比A中学高了7.3%,所以A,B两所中学的学生对报考某类大学的态度有显著差异,且B中学更愿意报考.
学校 意愿 合计
愿意报考某类大学 不愿意报考某类大学
A中学 18 37 55
B中学 38 57 95
合计 56 94 150
规律方法
利用2×2列联表分析两分类变量间关系的步骤
第1步: 根据题中数据获得2×2列联表;
第2步: 根据频率特征,将(或) 的值比较,直观地反映出两个分类变量间是否相互影响.
对点练1.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
则当X与Y的关系最弱时,整数m的取值为
A.8 B.9
C.14 D.19
Y
X y1 y2 总计
x1 10 18 28
x2 m 26 m+26
总计 m+10 44 m+54
√
在两个分类变量的列联表中,当|ad-bc|的值越小时,认为两个分类变量有关的可能性越小.令|ad-bc|=0,得10×26=18m,解得m≈14.4,又m为整数,所以当m=14时,X与Y的关系最弱.故选C.
返回
Y
X y1 y2 总计
x1 10 18 28
x2 m 26 m+26
总计 m+10 44 m+54
任务二 等高堆积条形图
返回
(阅读教材P126-127,完成探究问题3)
问题3.结合问题2,我们能不能从图形中直观地看出吸烟与患肺癌之间的关系呢?
提示:可建立如下图形:
问题导思
等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的______特征,依据________
_________的原理,我们可以推断结果.
新知构建
频率
频率稳
定于概率
等高堆积条形图在两个分类变量之间关联性的研究中能够起到什么作用?
提示:能够通过等高堆积条形图给出两个分类变量关联性的直观表示,数形结合更易帮助理解变量的关联性问题.
微思考
(多选)某市地铁2号线的开通,缓解了市内交通的拥堵状况,为了了解市民对地铁2号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论正确的是
A.样本中男性比女性更关注地铁2号线开通
B.样本中多数女性是35岁及以上
C.样本中35岁以下的男性人数比35岁及以上的女性人数多
D.样本中35岁及以上的人对地铁2号线的开通关注度更高
典例
2
√
√
√
设等高条形图对应2×2列联表如下:
根据第1个等高条形图可知,35岁及以上男性比35岁及以上女性多,即a>b;35岁以下男性比35岁以下女性多,即c>d.根据第2个等高条形图可知,男性中35岁及以上的比35岁以下的多,即a>c;
35岁及以上 35岁以下 总计
男性 a c a+c
女性 b d b+d
总计 a+b c+d a+b+c+d
女性中35岁及以上的比35岁以下的多,即b>d,对于A,男性人数为a+c,女性人数为b+d,因为a>b,c>d,所以a+c>b+d,故A正确;对于B,35岁及以上女性人数为b,35岁以下女性人数为d,因为b>d,故B正确;对于C,35岁以下男性人数为c,35岁及以上女性人数为b,无法从图中直接判断b与c的大小关系,故C不一定正确;对于D,35岁及以上的人数为a+b,35岁以下的人数为c+d,因为a>c,b>d,所以a+b>c+d,故D正确.故选ABD.
规律方法
利用等高堆积条形图判断两个分类变量是否相关的步骤
对点练2.某校为研究该校学生性别与体育锻炼的经常性之间的联系,随机抽取100名学生(其中男生60名,女生40名),并绘制得到如图所示的等高堆积条形图,则这100名学生中经常锻炼的人数为____.
返回
68
由等高堆积条形图进行数据分析,这100名学生中经常锻炼的人数为60×0.8+40×0.5=68.
任务三 独立性检验
返回
(阅读教材P128-131,完成探究问题4)
问题4.在如下的2×2列联表中:
(1)假设分类变量X与Y相互独立,则{X=0,
Y=0}与{Y=0}、{X=0}有什么关系?并能
得到什么结论?
提示:若X与Y相互独立,P(X=0,Y=0)=P(X=0)P(Y=0).则 - · ≈0,即ad≈bc;
(2)如何判断事件{X=1}和{Y=1}之间是否关联?
提示:判断P(X=1)P(Y=1)=P(X=1,Y=1)是否成立.
问题导思
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
1.定义:利用χ2的取值推断分类变量X和Y__________的方法称为χ2独立性检验,读作“卡方独立性检验”,简称____________.
2.公式:χ2= ,其中n=____________.
3.小概率值α的检验规则
对于任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)=α成立,我们称xα为α的临界值.
(1)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
(2)当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
新知构建
是否独立
独立性检验
a+b+c+d
4.临界值表
5.应用独立性检验解决实际问题包括的主要环节
(1)提出零假设H0:X和Y__________,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算___的值,并与_________比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
相互独立
χ2
临界值xα
列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不能对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.
微提醒
在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表:
依据小概率值α=0.05的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.
附:χ2=,n=a+b+c+d.
参考附表:
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 40 50
未注射疫苗 20 30 50
合计 30 70 100
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
典例
3
解:零假设为H0:给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果.
根据列联表中的数据,经计算得到,χ2=≈4.762>3.841=x0.05,
根据小概率值α=0.05的独立性检验,推断H0不成立,即认为给基因编辑小鼠注射该疫苗能起到预防该病毒感染的效果,此推断犯错误的概率不大于0.05.
被某病毒感染 未被某病毒感染 合计
注射疫苗 10 40 50
未注射疫苗 20 30 50
合计 30 70 100
1.(变条件)本例“依据小概率值α=0.05的独立性检验”变为“依据小概率值α=0.01的独立性检验”,得到的结论如何?
解:根据列联表中的数据,经计算得到,χ2=≈4.762<6.635=x0.01,
根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果.
变式探究
2.(变条件)若将2×2列联表中的数据都缩小原来的一半,依据小概率值α=0.05的独立性检验,能得到什么结论?
解:根据列联表中的数据,经计算得到,χ2=≈2.381<3.841=x0.05,
根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果.
规律方法
解决独立性检验问题的基本步骤
对点练3.(1)对于独立性检验,下列说法中错误的是
A.χ2的值越大,说明两变量相关程度越大
B.χ2的值越小,说明两变量相关程度越小
C.χ2≤3.841时,则在犯错误的概率不超过0.05的前提下认为变量X与Y有关
D.χ2>3.841时,则可以大概率认为变量X与Y有关
√
对于A,B,因为χ2=,χ2的值越大,|ad-bc|越大,变量X与变量Y关系越强;反之,变量X与变量Y关系越弱,故A、B均正确;对于C,D,因为只有P(χ2≥3.841)≈0.05时,说明在犯错误的概率不超过0.05的前提下认为变量X与Y有关,而χ2≤3.841,故C错误;D正确.故选C.
(2)(双空题)随着国家三孩政策的放开,为了调查一线城市和非一线城市的三孩生育意愿,某机构用简单随机抽样的方法从不同地区调查了100位育龄妇女,结果如下表:
由表中数据得χ2=_______(结果保留3位小数).根据小概率值α=0.01的独立性检验,可以得到的结论是______________________________.(附:x0.01=6.635)
非一线 一线 合计
愿生 45 20 65
不愿生 13 22 35
合计 58 42 100
9.616
三孩生育意愿与城市级别有关
由表中数据得χ2=≈9.616≥6.635=x0.01.根据小概率值α=0.01的独立性检验,可以得到的结论是:三孩生育意愿与城市级别有关.
非一线 一线 合计
愿生 45 20 65
不愿生 13 22 35
合计 58 42 100
返回
任务四 列联表与独立性检验的综合应用
返回
爬虫软件是一种自动抓取互联网信息的程序,它能够模拟浏览器行为,自动化地获取网页源代码,并从中提取出所需数据.爬虫软件在互联网上爬行并采集目标数据,这个过程类似于一只大蜘蛛在互联网上爬行,因此得名“爬虫”.现有某电商运营部门为分析消费能力与性别的关系,使用爬虫软件了解到,2024年第4季度在本店网购的消费者共12 000名,现随机抽取100名消费者,其中男女各半.若消费者总消费金额不低于3 000元,则称其为网购达人.男性消费者中,网购达人占.网购达人中,男性消费者占.
典例
4
(1)请完成如下2×2列联表;
性别 网购达人 非网购达人 合计
男性
女性
合计
解:依题意,得男性消费者50人,女性消费者50人,男性消费者网购达人有50×=20人,则男性消费者中非网购达人有50-20=30人,则网购达人共有20×=50人,
则女性消费者中网购达人有50-20=30人,女性消费者中非网购达人有50-30=20人,
故得2×2列联表如下:
性别 网购达人 非网购达人 合计
男性 20 30 50
女性 30 20 50
合计 50 50 100
(2)认为是否为网购达人与性别有关犯错误的概率不超过P,那么根据临界值表最精确的P的值应为多少?请说明理由.
参考公式:χ2=,其中n=a+b+c+d
参考数据:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:零假设为H0:网购达人与性别无关.
由(1)的2×2列联表中的数据可得,χ2==4,
因为3.841<4<6.635,认为是否为网购达人与性别有关系犯错的概率不超过5%,即P的值为5%.
规律方法
1.解答此类题目的关键在于正确利用χ2= 计算χ2的值,再用它与临界值xα的大小作比较来判断假设是否成立,从而使问题得到解决.
2.此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.
对点练4.为调查某城市居民对冰雪运动的了解情况,随机抽取了该市120名市民进行统计,得到如下2×2列联表:
已知从参与调查的男性市民中随机选取1名,抽到了解冰雪运动的概率
为.
(1)直接写出m,n,p,q的值;
男 女 合计
了解冰雪运动 m p 70
不了解冰雪运动 n q 50
合计 60 60 120
解:依题意,知m=60× =40,所以n=60-m=20,p=70-m=30,q=50-n=30.
所以m=40,n=20,p=30,q=30.
男 女 合计
了解冰雪运动 m p 70
不了解冰雪运动 n q 50
合计 60 60 120
(2)能否根据小概率值α=0.1的独立性检验,认为该市居民了解冰雪运动与性别有关?请说明理由.
附:χ2=.
解:能.理由如下:零假设为H0:该市居民了解冰雪运动与性别无关.
根据列联表中的数据,经计算得到,χ2= = ≈3.429>2.706=x0.1,
根据小概率值α=0.1的独立性检验,可以推断H0不成立,即认为该市居民了解冰雪运动与性别有关,此推断犯错误的概率不大于0.1.
α 0.100 0.050 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
返回
课堂小结
任务再现 1.分类变量及2×2列联表.2.等高堆积条形图.3.独立性检验.4.列联表与独立性检验的综合应用
方法提炼 反证法、代入法、数形结合思想
易错警示 χ2公式结构不清,独立性检验的原理不理解,导致不会用χ2分析问题
随堂评价
返回
1.在一项中学生近视情况的调查中,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时最有说服力的方法是
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
近视与性别是两个分类变量,在检验两个随机事件是否有关时,最有说服力的方法是独立性检验.故选C.
√
2.(多选)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下所示的2×2列联表(个别数据暂用字母表示):
计算得:χ2≈12.981,参照下表:
对于下面的选项,正确的是
A.m=54
B.n=52
C.根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”
D.根据小概率值α=0.010的独立性检验,可以认为“阅读量多少与幸福感强弱无关”
√
√
幸福感强 幸福感弱 合计
阅读量多 m 18 72
阅读量少 36 n 78
合计 90 60 150
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
因为m+36=90,18+n=60,所以m=54,n=42,故A正确,B错误;因为χ2≈12.981>7.879>6.635=x0.010,所以根据小概率值α=0.010的独立性检验,可以在犯错误的概率不超过1%的前提下认为“阅读量多少与幸福感强弱有关”,根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”,故C正确,D错误.故选AC.
幸福感强 幸福感弱 合计
阅读量多 m 18 72
阅读量少 36 n 78
合计 90 60 150
3.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为___.
15
根据等高堆积条形图可知:喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为300+160=460,按分层抽样的方法抽取23人,则抽取的男生人数为 ×23=15人.
4.(双空题)某制药公司为了验证一种药物对治疗“抑郁症”是否有效,随机选取了100名抑郁症患者进行试验,并根据试验数据得到下列2×2列联表:
根据表中数据,计算可得χ2=______(结果精确到0.001),依据小概率值α=______(填临界值表中符合条件的最小值)的独立性检验,可以认为该药物对治疗“抑郁症”是有效的.
附:χ2=.
用药 未用药 合计
症状明显减轻 37 33 70
症状没有减轻 8 22 30
合计 45 55 100
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
5.820
0.05
返回
由2×2列联表中数据得χ2= = ≈5.820,因为5.820>3.841=x0.05,所以α=0.05.
用药 未用药 合计
症状明显减轻 37 33 70
症状没有减轻 8 22 30
合计 45 55 100
课时分层评价
返回
1.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验
A.统计假设H0:男性喜欢参加体育活动
B.统计假设H0:女性不喜欢参加体育活动
C.统计假设H0:喜欢参加体育活动与性别有关
D.统计假设H0:喜欢参加体育活动与性别无关
独立性检验是一种假设性检验,假设有反证法的意味,应假设两类变量无关,所以应该检验统计假设H0:喜欢参加体育活动与性别无关.故
选D.
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2. 对于独立性检验,下列说法中正确的是
A. χ2独立性检验的统计假设是各事件之间相互独立
B. χ2的值可以为负值
C. χ2独立性检验显示“患慢性气管炎和吸烟习惯有关联”即指“有吸烟习惯的人必会患慢性气管炎”
D. 2×2列联表中的4个数据可为任何实数
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
对于A,根据χ2独立性检验的方法,首先保证各事件之间相互独立,故A正确;对于B,根据χ2= 可知,该值为非负值,故B错误;对于C,根据χ2独立性检验的基本思想,两个事件有关,但不是一个事件发生,另一事件必发生,故C错误;对于D,2×2列联表中的4个数据应为非负数,故D错误.故选A.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
3.已知两个分类变量X,Y的数据列联表如下,则下列能说明X与Y有关联的是
A.b=2a B.2c=3b
C.a=2b D.e=2d
√
X Y 合计
Y=0 Y=1
X=0 100 a d
X=1 200 b e
合计 300 c n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
同一个样本中,越小,说明两个变量的关系越弱,越大,说明两个变量的关系越强,对于A,当b=2a时,=0;对于B,当2c=3b时,可得b=2a,则=0;对于C,当a=2b时,=;对于D,当e=2d时,200+b=200+2a,即b=2a,此时=0.由以上分析可知,选项C能说明X与Y有关联.故选C.
X Y 合计
Y=0 Y=1
X=0 100 a d
X=1 200 b e
合计 300 c n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
4.根据分类变量X与Y的成对样本数据,计算得到χ2=3.122.已知P(χ2≥3.841)=0.05,依据小概率值α=0.05的独立性检验,则
A.X与Y不独立
B.X与Y不独立,这个结论犯错误的概率不超过0.05
C.X与Y独立
D.X与Y独立,这个结论犯错误的概率不超过0.05
因为χ2=3.122<3.841,而P(χ2≥3.841)=0.05,根据小概率值α=0.05的独立性检验知:X与Y独立,故C正确.故选C.
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
5.有甲、乙两个班级共计105人进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
已知在全部105人中随机抽取1人,成绩优秀的概率为 ,则下列说法正确的是
A.列联表中c的值为30,b的值为45
B.列联表中c的值为20,b的值为35
C.若算得χ2≈6.109,依据α=0.05的独立性检验,认为“成绩与班级没有关系”
D.若算得χ2≈6.109,依据α=0.05的独立性检验,认为“成绩与班级有关系”
√
优秀 非优秀
甲班 10 b
乙班 c 30
α 0.10 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
因为在105人中随机抽取1人,成绩优秀的概率为 ,所以成绩优秀的人数为105× =30,非优秀人数为105-30=75,所以c=30-10=20,b=75-30=45,故A、B错误;因为χ2≈6.109>3.841=x0.05,所以依据α=0.05的独立性检验,能认为“成绩与班级有关系”,故C错误,D正确.故选D.
优秀 非优秀
甲班 10 b
乙班 c 30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
6.(多选)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如图等高条形图:
根据图中的信息,下列结论中正确的是
A.样本中多数男生喜欢手机支付
B.样本中的女生数量少于男生数量
C.样本中多数女生喜欢现金支付
D.样本中喜欢现金支付的数量少于喜欢手机支付的数量
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
对于A,由右图可知,样本中多数男生喜欢手机支付,故A正确;对于B,由左图可知,样本中的男生数量多于女生数量,故B正确;对于C,由右图可知,样本中多数女生喜欢手机支付,故C错误;对于D,由右图可知,样本中喜欢现金支付的数量少于喜欢手机支付的数量,故D正确.故选ABD.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
7.幸福感是个体的一种主观情感体验,生活中的多种因素都会影响人的幸福感受.为研究男生与女生的幸福感是否有差异,一位老师在某大学进行了随机抽样调查,由调查数据计算得到χ2≈7.022,已知P(χ2≥6.635)=0.01,P(χ2≥7.879)=0.005.根据小概率值α=0.005的χ2独立性检验,______认为男生与女生的幸福感有差异.(填“可以”或“不能”)
不能
由于χ2≈7.022<7.879,根据小概率值α=0.005的χ2独立性检验,不能认为男生与女生的幸福感有差异.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
8.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如表:
单位:名
在犯错误的概率不超过_____的前提下认为性别与休闲方式有关联.
参考公式:χ2=.
性别 休闲方式 合计
读书 健身
女 24 31 55
男 8 26 34
合计 32 57 89
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
0.1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
由列联表中的数据得χ2=≈3.689>2.706=x0.1,因此,在犯错误的概率不超过0.1的前提下认为性别与休闲方式有关联.
性别 休闲方式 合计
读书 健身
女 24 31 55
男 8 26 34
合计 32 57 89
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
9.(开放题)为落实五育并举,同时增强高中生的综合素质,某校领导计划利用课间时间开展足球社团活动,为了使该活动的开展顺利,了解学生是否对足球感兴趣与性别的相关关系,现对某年级的学生随机抽取了男、女同学各50名整理得到下列2×2联表:
使得“有95%但没有99%的把握认为男女同学对足球感兴趣有差异”的a的一个值为_______________________________.
附:χ2=,其中n=a+b+c+d.
感兴趣 不感兴趣 总计
男 a 50-a 50
女 80-a a-30 50
总计 80 20 100
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
35或36或44或45(写出一个即可)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
χ2==,依题意,知3.841≤<6.635,解得40-<a≤40-或40+≤a<40+,故a的可能取值为35,36,44,45.
感兴趣 不感兴趣 总计
男 a 50-a 50
女 80-a a-30 50
总计 80 20 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
10.(13分)为考察某种药物A对预防疾病B的效果,进行了动物试验,根据40个有放回简单随机样本的数据,得到如下列联表:
依据α=0.05的独立性检验,分析药物A对预防疾病B的有效性.
参考公式:χ2=,其中n=a+b+c+d.
参考附表:
药物A 疾病B 合计
未患病 患病
未服用 14 7 21
服用 8 11 19
合计 22 18 40
α 0.100 0.050 0.025
xα 2.706 3.841 5.024
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
药物A 疾病B 合计
未患病 患病
未服用 14 7 21
服用 8 11 19
合计 22 18 40
解:零假设为H0:药物A对预防疾病B无效.
根据列联表中的数据,经计算得到
χ2==≈2.431<3.841,
根据小概率值α=0.05的独立性检验,我们没有充分证据推断H0不成立,所以可以推断H0成立,即认为药物A对预防疾病B无效.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
11.某传媒公司针对“社交电商用户是否存在性别差异”进行调查,共调查了40n(n∈N*)个人,得到如下列联表:
已知x0.05=3.841,若根据α=0.05的独立性检验认为“社交电商用户存在性别差异”,则n的最小值为
A.2 B.3
C.4 D.5
√
是社交电商用户 不是社交电商用户 合计
男性 8n 12n 20n
女性 12n 8n 20n
合计 20n 20n 40n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
χ2==n≥x0.05=3.841,n≥3.841×=2.400 625,所以根据α=0.05的独立性检验认为是不是社交电商用户与性别有关,则n的最小值为3.故选B.
是社交电商用户 不是社交电商用户 合计
男性 8n 12n 20n
女性 12n 8n 20n
合计 20n 20n 40n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
12.(多选)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则
参考数据:本题中χ2=
A.表中a=12,c=30
B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多
C.根据小概率值α=0.05的χ2独立性检验,可以认为性别与对数学的兴趣有差异
D.根据小概率值α=0.01的χ2独立性检验,可以认为性别与对数学的兴趣没有差异
√
√
性别 数学兴趣 合计
感兴趣 不感兴趣
女生 a b a+b
男生 c d c+d
合计 a+c b+d 100
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
依题意,知抽取男生人数为600×=60人,女生抽取的人数400×=40人,由等高条形图知,抽取男生感兴趣的人数为60×0.5=30人,抽取男生不感兴趣的人数为60×0.5=30人,抽取女生感兴趣的人数为40×0.3=12人,抽取女生不感兴趣的人数为40×0.7=28人,2×2列联表如下:
性别 数学兴趣 合计
感兴趣 不感兴趣
女生 12 28 40
男生 30 30 60
合计 42 58 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
由此表可知,a=12,c=30,故A正确;女生不感兴趣的人数约为400×=280人,男生不感兴趣的人数约为600×=300人,所以估计该校高一新生中对数学不感兴趣的女生人数比男生少,故B错误;零假设为H0:性别与对数学的兴趣没有差异.所以χ2=≈3.941>3.841.依据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,因此可以认为H0不成立,即可以认为性别与对数学的兴趣有差异,故C正确;
性别 数学兴趣 合计
感兴趣 不感兴趣
女生 12 28 40
男生 30 30 60
合计 42 58 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
零假设为H0:性别与对数学的兴趣没有差异.所以χ2=≈3.941<6.635,依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即可以认为性别与对数学的兴趣没有差异,故D正确.故选ACD.
性别 数学兴趣 合计
感兴趣 不感兴趣
女生 12 28 40
男生 30 30 60
合计 42 58 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
13.(双空题)有甲、乙两个班级共计100人进行物理考试,按照大于等于80分为优秀,80分以下为非优秀统计成绩,得到如下所示的列联表:
已知在全部100人中随机抽取1人,成绩非优秀的概率为,则b+c=____;根据小概率值α的χ2独立性检验,能认为“成绩与班级有关系”,则依据下列附表α的最小值是_______.
优秀 非优秀 总计
甲班 10 b
乙班 c 30
α 0.15 0.1 0.05 0.025 0.01 0.001
xα 2.072 2.706 3.841 5.024 6.635 10.828
60
0.05
附:χ2=,其中n=a+b+c+d.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
依题意,知成绩非优秀的学生数是100×=70,所以c=20,b=40,b+c=60.根据列联表中的数据,得χ2=≈4.762>3.841,因此依据附表α的最小值为0.05.
优秀 非优秀 总计
甲班 10 b
乙班 c 30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
14.(15分)某网购平台为了解某市居民在该平台的消费情况,从该市使用其平台且每周平均消费额超过100元的人员中随机抽取了100名,并绘制如图所示频率分布直方图,已知中间三组的人数可构成等差数列.
(1)求m,n的值;
解:由频率分布直方图可知,m+n=0.01-0.0015×2-0.001=0.006,
由中间三组的人数成等差数列可知m+0.0015=2n,
可解得m=0.0035,n=0.0025.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)分析人员对100名调查对象的性别进行统计发现,消费金额不低于300元的男性有20人,低于300元的男性有25人,根据统计数据完成下列2×2列联表,并依据小概率值α=0.010的独立性检验,能否认为该网购平台的消费金额与性别有关?
2×2列联表
男性 女性 合计
消费金额≥300元
消费金额<300元
合计
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
临界值表:
χ2=,其中n=a+b+c+d
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解:周平均消费不低于300元的频率为(0.0035+0.0015+0.001)×100=0.6,因此100人中,周平均消费不低于300元的人数为100×0.6=60人.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
零假设为H0:该网购平台的消费金额与性别相互独立(即无关联).
根据列联表中的数据,经计算得到,χ2=≈8.249>6.635=x0.010,
根据小概率值α=0.010的独立性检验,我们推断H0不成立,即认为消费金额与性别有关,此推断犯错误的概率不大于0.010.
男性 女性 合计
消费金额≥300元 20 40 60
消费金额<300元 25 15 40
合计 45 55 100
所以2×2列联表为
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
15.(5分)为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关.已知被调查的男、女学生的总人数为20k (k∈N*),则k=_________.
附:χ2=.临界值表:
α 0.050 0.010 0.005 0.001
xα 3.841 6.635 7.879 10.828
5或6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
设男、女学生的总人数为2n,则2n=20k(k∈N*),并把列联表的数据补充完整:
所以χ2==,又因为有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,所以3.841≤<6.635⇒80.661≤2n<139.335,又2n=20k(k∈N*),所以4.033≤k<6.966,所以k=5或k=6.
喜欢 不喜欢 合计
男生 0.8n 0.2n n
女生 0.6n 0.4n n
合计 1.4n 0.6n 2n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
16.(17分)从石墨中通过化学气相沉积法分离出石墨
烯,升华后附着在材料上再结晶制成石墨烯发热膜,
广泛应用于冬装衣服.现在有A材料、B材料可供选择,
人员对附着在A材料、B材料上的石墨烯各做了100次
再结晶试验,得到如下等高堆积条形图.
(1)根据等高堆积条形图,完成如下2×2列联表,并依据小概率值α=0.005的独立性检验,分析试验结果与材料是否有关:
A材料 B材料 合计
试验成功(单位:次)
试验失败(单位:次)
合计
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解:由等高堆积条形图得2×2列联表:
零假设为H0:试验结果与材料无关.
根据列联表中的数据,经计算得到χ2==≈9.524>7.879=x0.005,
依据小概率值α=0.005的独立性检验,推断假设不成立,即试验结果与材料有关,此推断犯错误的概率不超过0.005.
A材料 B材料 合计
试验成功(单位:次) 80 60 140
试验失败(单位:次) 20 40 60
合计 100 100 200
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)定义分类变量X,Y如下:X=Y=以频率估计概率,求条件概率P(X=1|Y=0)和P(Y=0|X=0)的值.
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解:依题意,n(Y=0)=100,n(X=1,Y=0)=20,
所以P(X=1|Y=0)===;
n(X=0)=140,n(Y=0,X=0)=80,
所以P(Y=0|X=0)===.
返回
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
谢 谢 观 看 !
第
八
章
成
对
数
据
的
统
计
分
析
返回
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。