4.3.2 独立性检验-【金版新学案】2024-2025学年新教材高二数学选择性必修第二册同步课堂高效讲义教师用书word(人教B版2019)
2025-02-25
|
23页
|
94人阅读
|
3人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教B版选择性必修第二册 |
| 年级 | 高二 |
| 章节 | 4.3.2 独立性检验 |
| 类型 | 教案-讲义 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2024-2025 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | DOCX |
| 文件大小 | 319 KB |
| 发布时间 | 2025-02-25 |
| 更新时间 | 2025-02-25 |
| 作者 | 山东正禾大教育科技有限公司 |
| 品牌系列 | 金版新学案·高中同步课堂高效讲义 |
| 审核时间 | 2024-11-13 |
| 下载链接 | https://m.zxxk.com/soft/48639304.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
4.3.2 独立性检验
知识
层面
1.通过实例,理解2×2列联表的统计意义. 2.通过实例,了解独立性检验及其应用.
素养
层面
通过2×2列联表统计意义的学习,体会数学抽象的素养;借助χ2计算公式进行独立性检验,培养数学运算和数据分析的素养.
问题.在如图的2×2列联表中:
X
Y
Y=0
Y=1
合计
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
(1)如何判断事件{X=1}和{Y=1}之间是否关联?
(2)假设分类变量X与Y相互独立,则{X=0}与{Y=0}、{X=0}与{Y=1}、{X=1}与{Y=0}、{X=1}与{Y=1}有什么关系?并能得到什么结论?
(3)零假设H0:P(Y=1|X=0)=P(Y=1|X=1),用概率的语言如何表述?
提示:(1)判断P(Y=1|X=0)=P(Y=1|X=1)是否成立或P(X=1)P(Y=1)=P(X=1,Y=1)是否成立.
(2)相互独立.
-·≈0;
-·≈0;
-·≈0;
-·≈0.
(3)H0:分类变量X和Y相互独立.
学生用书↓第87页
知识点一 2×2列联表
1.2×2列联表的概念:
将随机事件A,B的样本数据整理成如下的表格
A
总计
B
a
b
a+b
c
d
c+d
总计
a+c
b+d
a+b+c+d
上面这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表
2.列联表的统计意义:
记n=a+b+c+d,则由上表可知:
(1)事件A发生的概率可估计为P(A)=;
(2)事件B发生的概率可估计为P(B)=;
(3)事件AB发生的概率可估计为P(AB)=.
其他事件的概率类似可求.
[微提醒] 1.2×2列联表主要用于研究两个事件之间是相互独立的还是存在某种关联性,它适用于分析两个事件之间的关系.
2.因为P(A),P(B),P(AB)都是根据样本数据得到的估计值,而估计是有误差的,因此直接用P(AB)=P(A)P(B)是否成立来判断A与B是否独立是不合理的.
知识点二 独立性检验
1.χ2(读作“卡方”)统计量:是统计中一个非常有用的统计量,它的表达式是
χ2=.
2.独立性检验:任意给定一个α(称为显著性水平,通常取为0.05,0.01等),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数).χ2是一个随机变量,其分布能够求出,上面的概率是可以计算的.因此,如果根据样本数据算出χ2的值后,发现χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称为A与B有关);或说有1-α的把握认为A与B有关.若χ2<k成立,就称不能得到前述结论.这一过程通常称为独立性检验.
[警示] A与B独立时,也称为A与B无关.当χ2<k成立时,一般不直接说A与B无关.也就是说,独立性检验通常得到的结果,或者是有1-α的把握认为A与B有关,或者没有1-α的把握认为A与B有关.
[知识拓展]
(1)独立性检验的基本思想:独立性检验的基本思想类似于反证法,要判断“两个分类变量有关系”,首先假设结论不成立,即“H0:两个分类变量没有关系”成立.在该假设下所构造的随机变量χ2应该很小.如果由观测数据计算得到的χ2很大,则断言H0不成立,即认为“两个分类变量有关系”;如果χ2很小,则说明在样本数据中没有发现足够证据拒绝H0.
(2)独立性检验与反证法的比较
反证法原理
在假设H0下,如果推出一个矛盾,就证明了H0不成立
独立性检验原理
在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错的概率不超过这个小概率
3.常用的显著性水平α以及对应的分位数k对照表
α=P(χ2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
学生用书↓第88页
1.为调查乘客晕车情况,在某一次行程中,50名男乘客中有25名晕车,30名女乘客中有5名晕车.在检验这些乘客晕车是否与性别相关时,常采用的数据分析方法是( )
A.回归分析 B.独立性检验
C.频率分布直方图 D.用样本估计总体
答案:B
解析:根据题意,结合题目中的数据,可列2×2列联表,
求观测值χ2,对照临界值得出概率结论;
这种数据分析的方法是独立性检验.
2.下表是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
100
则表中a、b处的值分别为( )
A.94,96 B.52,50
C.52,54 D.54,52
答案:C
解析:由得
3.(多选)以下关于独立性检验的说法中,正确的是( )
A.独立性检验依赖于小概率原理
B.独立性检验得到的结论一定准确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判断两事物是否相关的唯一方法
答案:ACD
解析:根据独立性检验的原理可知,得到的结论是错误的情况是小概率事件,但并不一定是准确的.
4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2≈27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”或“无关”)
答案:有关
解析:由χ2≈27.63与临界值比较,我们有99.9%的把握说打鼾与患心脏病有关.
5.为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:
男
女
总计
爱好
a
b
73
不爱好
c
25
总计
74
则a-b-c等于________.
答案:9
解析:根据题意,可得:c=120-73-25=22,
a=74-22=52,b=73-52=21,
即2×2列联表为:
男
女
总计
爱好
52
21
73
不爱好
22
25
47
总计
74
46
120
所以a-b-c=52-21-22=9.
题型一 利用列联表分析两变量的关系
例1 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系.
解:2×2列联表如下:
年龄在六
十岁以上
年龄在六
十岁以下
总计
饮食以蔬菜为主
43
21
64
饮食以肉类为主
27
33
60
总计
70
54
124
将表中数据代入公式得==0.671 875.==0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.
利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
对点练1.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1
y2
x1
10
18
x2
m
26
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9
C.14 D.19
答案:C
解析:由10×26=18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.
学生用书↓第89页
题型二 由χ2进行独立性检验
例2 节目《最强大脑》中,有一个游戏叫做盲拧魔方,就是玩家先观察魔方状态并进行记忆,记住后蒙住眼睛快速还原魔方,盲拧在外人看来很神奇,其实原理是十分简单的,要学会盲拧也是很容易的.根据调查显示,是否喜欢盲拧魔方与性别有关.为了验证这个结论,某兴趣小组随机抽取了50名魔方爱好者进行调查,得到的情况如表1所示:
表1
喜欢盲拧
不喜欢盲拧
总计
男
22
30
女
12
总计
50
现邀请这30名男生参加盲拧三阶魔方比赛,其完成情况如表2所示:
表2
成功完成
时间/min
[0,10)
[10,20)
[20,30)
[30,40]
人数
10
10
5
5
(1)将表1补充完整,判断是否在犯错误的概率不超过0.025的前提下认为是否喜欢盲拧与性别有关;
(2)根据表2中的数据,求这30名男生成功完成盲拧的平均时间;(以频率作为概率,以区间的中点值作为本组的完成时间)
(3)现从表2中成功完成时间在[0,10)内的10名男生中任意抽取3人对他们的盲拧情况进行视频记录,记成功完成时间在[0,10)内的甲、乙、丙3人中被抽到的人数为X,求X的分布列.
附:
P(χ2≥k)
0.10
0.05
0.025
0.010
0.005
0.001
k
2.706
3.841
5.024
6.635
7.879
10.828
[思路点拨] (1)依统计数据填写列联表,代入公式计算χ2的估计值,查表下结论.
(2)由表格计算出各段上的概率,并求所用平均时间.
(3)分别计算出P(Z=0),P(Z=1),P(Z=2),P(Z=3),列出分步列.
解:(1)依题意,补充完整的表如下:
喜欢盲拧
不喜欢盲拧
总计
男
22
8
30
女
8
12
20
总计
30
20
50
由表中数据计算得χ2==≈5.556>5.024,因此能在犯错误的概率不超过0.025的前提下认为是否喜欢盲拧与性别有关.
(2)依题意,所求平均时间为5×+15×+25×+35×=+10=(min).
(3)依题意,X的取值范围是{0,1,2,3},P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==,故X的分布列为
X
0
1
2
3
P
解决独立性检验问题的基本步骤
第一步:根据已知的数据作出列联表;
第二步:作出相应的等高条形图,可以利用图形做出相应判断;
第三步:求χ2的观测值;
第四步:判断可能性:与临界值比较,得出事件有关的可能性大小.
学生用书↓第90页
对点练2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”.
解:根据题目所给的数据得到如下联系:
理科
文科
总计
有兴趣
138
73
211
无兴趣
98
52
150
总计
236
125
361
根据列联表中数据由公式计算得χ2=≈1.871×10-4.
因为1.871×10-4<2.706,
所以,在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、理科与对外语的兴趣有关”.
题型三 独立性检验的综合应用
例3 某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样的方法(按A类、B类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表:
表1:A类工人生产能力的频数分布表
生产能力分组
[110,120)
[120,130)
[130,140)
[140,150)
人数
8
x
3
2
表2:B类工人生产能力的频数分布表
生产能力分组
[110,120)
[120,130)
[130,140)
[140,150)
人数
6
y
27
18
(1)确定x,y的值;
(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系.
生产能力分组
工人类别
[110,130)
[130,150)
总计
A类工人
B类工人
总计
附:χ2=,
α
0.050
0.010
0.001
χα
3.841
6.635
10.828
[思路点拨] (1)确定x、y的值,可用分层抽样解决;(2)判断在规定条件下工人的生产能力与工人的类别是否有关系可通过独立性检验解决.
解:(1)因为从该工厂的工人中抽取100名工人,且该工厂中有250名A类工人,750名B类工人,
所以要从A类工人中抽取25名,从B类工人中抽取75名,
所以x=25-8-3-2=12,y=75-6-27-18=24.
(2)根据所给的数据可以完成列联表,如下表所示:
生产能力分组
工人类别
[110,130)
[130,150)
总计
A类工人
20
5
25
B类工人
30
45
75
总计
50
50
100
由列联表中的数据,χ2==12>10.828=χ0.001,
因此,在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系.
解独立性检验的应用问题的关注点
1.两个明确:①明确两类主体;②明确研究的两个问题.
2.两个关键:①准确画出2×2列联表;②准确理解χ2.
学生用书↓第91页
对点练3.目前,浙江和上海已经成为新高考综合试点的“排头兵”,有关其他省份新高考改革的实施安排,教育部部长在十九大上做出明确表态:到2020年,我国将全面建立起新的高考制度.新高考规定:语文、数学和英语是考生的必考科目,考生还需从物理、化学、生物、历史、地理和政治六个科目中选取三个科目作为选考科目.若一个学生从六个科目中选出了三个科目作为选考科目,则称该学生的选考方案确定;否则,称该学生选考方案待确定.例如,学生甲选择“物理、化学和生物”三个选考科目,则学生甲的选考方案确定,“物理、化学和生物”为其选考方案.
某校为了解高一年级840名学生选考科目的意向,随机选取60名学生进行了一次调查,统计选考科目人数如表:
性别
选考方案确定情况
物理
化学
生物
历史
地理
政治
男生
选考方案确定的有16人
16
16
8
4
2
2
选考方案待确定的有12人
8
6
0
2
0
0
女生
选考方案确定的有20人
6
10
20
16
2
6
选考方案待确定的有12人
2
8
10
0
0
2
(1)估计该学校高一年级选考方案确定的学生中选考生物的学生有多少人.
(2)将列联表填写完整,并通过计算,判定能否有99.9%把握认为选历史与性别有关.
选历史
不选历史
总计
选考方案确定的男生
选考方案确定的女生
总计
(3)从选考方案确定的16名男生中随机选出2名,设随机变量ξ=求ξ的分布列及数学期望E(ξ).
附:χ2=,n=a+b+c+d.
P(χ2≥k)
0.05
0.01
0.005
0.001
k
3.841
6.635
7.879
10.828
解:(1)由题可知,选考方案确定的男生中确定选考生物的学生有8人,选考方案确定的女生中确定选考生物的学生有20人,则该学校高一年级选考方案确定的学生中选考生物的学生有××840=392(人).
(2)补充列联表如下:
选历史
不选历史
总计
选考方案确定的男生
4
12
16
选考方案确定的女生
16
4
20
总计
20
16
36
由列联表中数据得χ2====10.89>10.828,
所以有99.9%的把握认为选历史与性别有关.
(3)由数据可知,选考方案确定的男生中有8人选择物理、化学和生物;有4人选择物理、化学和历史;有2人选择物理、化学和地理;有2人选择物理、化学和政治,由已知ξ的取值为0,1.
P(ξ=1)==,P(ξ=0)=1-P(ξ=1)=,所以ξ的分布列为
ξ
0
1
P
E(ξ)=0×+1×=.
易错点 因对独立性检验的基本思想不理解而致错
已知两个分类变量X和Y的取值分别为{x1,x2},{y1,y2},若其列联表为
y1
y2
x1
5
15
x2
40
10
则( )
A.X与Y之间有关系的概率为0.001
B.X与Y之间有关系的概率为0.999
C.认为X与Y有关系,犯错误的概率为0.999
D.认为X与Y有关系,犯错误的概率不超过0.001
学生用书↓第92页
[易错分析] 1.在求X2的过程中,弄混a,b,c,d而致错或者因运算量大而致错.
2.没有理解好独立性检验的基本思想而致错.
[误区警示] 独立性检验的基本思想是指某件事发生在犯错概率不超过某个非常小的数据的前提下,我们有把握认为有关.理解有误会致误.
[正解] χ2=≈18.822≥10.828,
所以在犯错误的概率不超过0.001的前提下,我们认为X与Y有关.
[答案] D
1.(多选)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的2×2列联表中,由列联表中的数据计算得χ2≈9.616.参照附表,下列结论正确的是( )
附表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
A.根据小概率值α=0.001的独立性检验,分析认为“药物有效”
B.根据小概率值α=0.001的独立性检验,分析认为“药物无效”
C.根据小概率值α=0.005的独立性检验,分析认为“药物有效”
D.根据小概率值α=0.005的独立性检验,分析认为“药物无效”
答案:BC
解析:因为χ2≈9.616,所以7.879<χ2<10.828,所以根据小概率值α=0.001的独立性检验,分析认为“药物无效”;根据小概率值α=0.005的独立性检验,分析认为“药物有效”.故选BC.
2.
如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为________.
答案:15
解析:根据等高堆积条形图可知:喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×
400=160,所以喜欢徒步的总人数为300+160=460,按分层抽样的方法抽取23人,则抽取的男生人数为×23=15人.
3.某制药公司为了验证一种药物对治疗“抑郁症”是否有效,随机选取了100名抑郁症患者进行试验,并根据试验数据得到下列2×2列联表:
用药
未用药
合计
症状明显减轻
37
33
70
症状没有减轻
8
22
30
合计
45
55
100
根据表中数据,计算可得χ2=________(结果精确到0.001),依据小概率值α=________(填临界值表中符合条件的最小值)的独立性检验,可以认为该药物对治疗“抑郁症”是有效的.
附:χ2=.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
答案:5.820 0.05
解析:由2×2列联表中数据得χ2==≈5.820,因为5.820>3.841=x0.05,所以α=0.05.
课时测评20 独立性检验
(时间:40分钟 满分:100分)
(本栏目内容,在学生用书中以独立形式分册装订!)
(1-8每小题5分,共40分)
1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
答案:C
解析:判断两个分类变量是否有关的最有效方法是进行独立性检验.故选C.
2.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:
心脏病
无心脏病
秃发
20
300
不秃发
5
450
根据表中数据得到χ2=≈15.968,因为χ2>6.635,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( )
A.0.1 B.0.05
C.0.025 D.0.01
答案:D
解析:χ2>6.635=x0.01.故选D.
3.(多选)经过对χ2的统计量的研究,得到了若干个临界值,当χ2的临界值xα>3.841时,我们( )
A.在犯错误的概率不超过0.05的前提下可认为A与B有关
B.在犯错误的概率不超过0.05的前提下可认为A与B无关
C.有99%的把握说A与B有关
D.有95%的把握说A与B有关
答案:AD
解析:根据独立性检验原理知,当χ2的临界值xα>3.841时,我们有以下结论:在犯错误的概率不超过0.05的前提下可认为A与B有关;即有95%的把握说A与B有关;所以选项A、D正确.
4.给出下列实际问题:
①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.
其中用独立性检验可以解决的问题有( )
A.①②③ B.②④⑤
C.②③④⑤ D.①②③④⑤
答案:B
解析:独立性检验是判断两个分类变量是否有关系的方法,而①③都是概率问题,不能用独立性检验.故选B.
5.(多选)有两个分类变量X,Y,其列联表如下所示,
Y1
Y2
X1
a
20-a
X2
15-a
30+a
其中a,15-a均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值可以为( )
A.6 B.7
C.8 D.9
答案:CD
解析:根据公式,得χ2==>3.841,
根据a>5且15-a>5,a∈Z,求得当a=8或9时满足题意.
6.某高校有10 000名学生,其中女生3 000名,男生7 000名.为调查爱好体育运动是否与性别有关,用分层抽样的方法抽取120名学生,制成独立性检验的2×2列联表,如表,则a-b=________.(用数字作答)
男
女
合计
爱好体育运动
a
9
####
不爱好体育运动
28
b
####
合计
####
####
120
答案:29
解析:根据分层抽样原理,计算抽取男生120×=84(人),女生120×=36(人),所以a=84-28=56(人),b=36-9=27(人),所以a-b=56-27=29(人).
7.为了解某次考试中语文成绩是否优秀与性别的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
语文成绩优秀
语文成绩非优秀
总计
男生
10
20
30
女生
20
10
30
总计
30
30
60
经过计算,χ2≈6.667,根据这一数据分析,有______%的把握认为“语文成绩是否优秀与性别有关系”.
下面的临界值表供参考
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
答案:99
解析:由图表可知:χ2≈6.667>6.635,即有99%的把握认为“语文成绩是否优秀与性别有关系”.
8.吃零食是中学生中普遍存在的现象.长期吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表
男
女
总计
喜欢吃零食
5
12
17
不喜欢吃零食
40
28
68
合计
45
40
85
根据下面χ2的计算结果,试回答,有________的把握认为“吃零食与性别有关”.
参考数据与参考公式:χ2===≈4.722
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
答案:95%
解析:根据题意知χ2≈4.722>3.841,所以有95%的把握认为“吃零食与性别有关”.
9.(10分)江苏省新高考方案要求考生在物理、历史科目中选择一科,我市在对某校高一年级学生的选科意愿调查中,共调查了100名学生,其中男、女生各50人,男生中选历史15人,女生中选物理10人.
(1)请根据以上数据建立一个2×2列联表;(4分)
(2)判断性别与选科是否相关.(6分)
附:χ2=.
P(χ2≥x0)
0.010
0.005
0.001
x0
6.635
7.879
10.828
解:(1)由题意可得,
选物理
选历史
合计
男生
35
15
50
女生
10
40
50
合计
45
55
100
(2)提出假设:
学生选科与性别没有关系.
根据列联表中的数据,可以求得χ2=
≈25.253.
因为当H0成立时,χ2≥10.828的概率约为0.001,
所以我们有99.9%的把握认为,学生选科与性别有关.
10.(10分)黑人乔治·弗洛伊德被残杀死亡事件,引发了全世界的抗议.近期某校高二年级A班班主任对该班进行了一次调查,发现全班50名同学中,对此事关注的占,他们在本学期期末考试中的政治成绩(满分100分)如下面的频率分布直方图:
(1)根据频率分布直方图,求对此事关注的学生政治成绩的中位数的估计值(精确到0.1 );(4分)
(2)若政治成绩不低于80分的为优秀,请以是否优秀为分类变量,(6分)
①补充下面的2×2列联表:
政治成绩优秀
政治成绩不优秀
合计
对此事关注
对此事不关注
合计
②是否有90%以上的把握认为“对此事是否关注”与政治期末成绩是否优秀有关系?
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α
0.15
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解:(1)根据频率分布直方图知,0.005×10+0.005×10+0.020×10=0.3,0.3+0.030×10=0.6,
所以中位数在第4组,设中位数为70+x,
则0.3+0.030×x=0.5,解得x≈6.7,
所以数据的中位数为70+x=76.7;
即对此事关注的学生政治成绩的中位数估计值为76.7;
(2)①由50×=20,且20×(0.3+0.1)=8,
30×(0.15+0.05)=6,补充列联表如下;
政治成绩优秀
政治成绩不优秀
合计
对此事关注
8
12
20
对此事不关注
6
24
30
合计
14
36
50
②由表中数据,计算χ2==≈2.381<2.706,
所以没有90%以上的把握认为“对此事是否关注”与政治期末成绩是否优秀有关系.
11.(5分)(多选)为考察某种药物预防疾病的效果,进行动物试验,得到如下药物效果与动物试验列联表:
患病
未患病
总计
服用药
10
45
55
没服用药
20
30
50
总计
30
75
105
由上述数据给出下列结论,其中正确的是( )
附:χ2=.
α
0.05
0.025
0.010
0.005
xα
3.841
5.024
6.635
7.879
A.能在犯错误的概率不超过0.05的前提下认为药物有效
B.不能在犯错误的概率不超过0.025的前提下认为药物有效
C.能在犯错误的概率不超过0.010的前提下认为药物有效
D.不能在犯错误的概率不超过0.005的前提下认为药物有效
答案:AD
解析:根据列联表,计算χ2==≈6.109>5.024,所以能在犯错误的概率不超过0.05的前提下认为药物有效,故A正确;能在犯错误的概率不超过0.025的前提下认为药物有效,故B错误;不能在犯错误的概率不超过0.010的前提下认为药物有效,故C错误;不能在犯错误的概率不超过0.005的前提下认为药物有效,故D正确.
12.(5分)为了了解中学生戴眼镜与性别的相关性,某研究机构分别调查了A,B,C三个地区的100名中学生是否戴眼镜的情况,得到三个列联表如表所示.
A地区
戴眼镜
不戴眼镜
合计
男
21
29
50
女
19
31
50
合计
40
60
100
B地区
戴眼镜
不戴眼镜
合计
男
25
25
50
女
15
35
50
合计
40
60
100
C地区
戴眼镜
不戴眼镜
合计
男
23
27
50
女
17
33
50
合计
40
60
100
根据列联表的数据,可以得到的结论为( )
A.在这三个地区中,A地区的中学生戴眼镜与性别关联性最强
B.在这三个地区中,B地区的中学生戴眼镜与性别关联性最强
C.在这三个地区中,B地区的中学生戴眼镜与性别关联性最弱
D.在这三个地区中,C地区的中学生戴眼镜与性别关联性最弱
答案:B
解析:根据χ2=可知,只需比较三个地区的|ad-bc|的大小即可,
对于A地区,|ad-bc|=|21×31-29×19|=100;
对于B地区,|ad-bc|=|25×35-25×15|=500;
对于C地区,|ad-bc|=|23×33-27×17|=300.
因为100<300<500,所以χ<χ<χ,所以B地区的中学生戴眼镜与性别关联性最强.
13.(15分)某土特产超市为预估2024年元旦期间游客购买土特产的情况,对2023年元旦期间的90位游客购买情况进行统计,得到如下人数分布表.
购买金额(元)
[0,15)
[15,30)
[30,45)
[45,60)
[60,75)
[75,90]
人数
10
15
20
15
20
10
(1)根据以上数据完成2×2列联表,并判断是否有95%的把握认为购买金额是否少于60元与性别有关.(5分)
不少于60元
少于60元
总计
男
40
女
18
总计
(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为p(每次抽奖互不影响,且p的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15.若游客甲计划购买80元的土特产,请列出实际付款数X(元)的分布列并求其数学期望.(10分)
解:(1)2×2列联表如下:
不少于60元
少于60元
总计
男
12
40
52
女
18
20
38
总计
30
60
90
χ2==>5>3.841,
因此有95%的把握认为购买金额是否少于60元与性别有关.
(2)X取值范围是{65,70,75,80},且p==.
P(X=65)=C×=.
P(X=70)=C××=,
P(X=75)=C××=,
P(X=80)=C×=.
所以X的分布列为
X
65
70
75
80
P
E(X)=65×+70×+75×+80×=75.
14.(15分)某次考试中500名学生的物理(满分为150分)成绩服从正态分布N(100,17.52),数学成绩的频率分布直方图如图所示.
(1)如果成绩大于135分的为特别优秀,那么本次考试中物理、数学特别优秀的大约各有多少人?(2分)
(2)如果物理和数学两科都特别优秀的共有6人,从(1)中的这些学生中随机抽取3人,设三人中两科都特别优秀的有X人,求X的分布列和数学期望;(5分)
(3)根据以上数据,是否有99.9%的把握认为物理特别优秀的学生,数学也特别优秀?(8分)
附:①若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)≈0.683,P(μ-2σ<X≤μ+2σ)≈0.954;
②χ2=;
③
P(χ2≥k)
0.5
0.4
…
0.01
0.005
0.001
k
0.455
0.708
…
6.635
7.879
10.828
解:(1)因为物理成绩(记为Y)服从正态分布N(100,17.52),所以物理特别优秀的概率为P(Y>135)≈(1-0.954)×=0.023,
数学特别优秀的概率为0.001 6×20×=0.024,
故物理特别优秀的学生大约有500×0.023≈12(人),
数学特别优秀的学生大约有500×0.024=12(人).
(2)物理和数学两科都特别优秀的学生有6人,则由(1)可知单科特别优秀的学生有12人.
X的所有可能取值为0,1,2,3,
P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
所以X的分布列为
X
0
1
2
3
P
X的数学期望E(X)=0×+1×+2×+3×=1.
(3)填写2×2列联表如下:
物理特别优秀
物理不特别优秀
总计
数学特别优秀
6
6
12
数学不特别优秀
6
482
488
总计
12
488
500
根据列联表中数据,得
χ2=≈118.928>10.828,
又因为查表可得P(χ2≥10.828)=0.001,
所以有99.9%的把握认为物理特别优秀的学生,数学也特别优秀.
学生用书↓第93页
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。