内容正文:
第4章 统计
4.3 独立性检验
(教师独具内容)
课程标准:1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解独立性检验及其应用.
教学重点:1.掌握作2×2列联表的方法.2.理解独立性检验的基本思想及实施步骤.
教学难点:1.独立性检验的基本思想和χ2的含义.2.利用独立性检验解决简单实际问题.
核心素养:1.通过学习2×2列联表,提升数学抽象素养、直观想象素养和数据分析素养.2.通过利用独立性检验解决实际问题培养数学建模素养和数学运算素养.
核心概念掌握
核心素养形成
随堂水平达标
目录
课后课时精练
核心概念掌握
知识点一 2×2列联表及分类变量
核心概念掌握
5
列联表
分类变量
核心概念掌握
6
a+b+c+d
核心概念掌握
7
这种利用统计量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.
常用的临界值如下表:
[注意] 查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的x0值与求得的χ2相比较.
P(χ2≥x0) 0.50 0.40 0.25 0.15 0.10
x0 0.455 0.708 1.323 2.072 2.706
P(χ2≥x0) 0.05 0.025 0.010 0.005 0.001
x0 3.841 5.024 6.635 7.879 10.828
核心概念掌握
8
核心概念掌握
9
反证法原理与独立性检验原理的比较
反证法原理 在假设H0下,如果推出一个矛盾结果,就证明了H0不成立
独立性检验原理 在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率
核心概念掌握
10
1.判一判(正确的打“√”,错误的打“×”)
(1)2×2列联表只有4个格子.( )
(2)事件X与Y的独立性检验无关联,即两个事件互不影响.( )
(3) χ2是判断事件A与B是否相关的统计量.( )
√
×
×
核心概念掌握
11
2.做一做(请把正确的答案写在横线上)
(1)为了调查高中生的性别与是否喜欢踢足球之间有无关系,一般需要收集以下数据:_____________________________________.
(2)若χ2≈7.8,得到的正确结论是在犯错误的概率不超过____的前提下认为“爱好该项运动与性别有关”.
(3)某校为了检验高中数学新课程改革的成果,在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下面2×2列联表所示(单位:人),则其中m=____,n=____.
男、女生中喜欢和不喜欢踢足球的人数
1%
26
100
80分及以上 80分以下 合计
试验班 32 18 50
对照班 24 m 50
合计 56 44 n
核心概念掌握
12
核心素养形成
题型一 绘制2×2列联表
解 作2×2列联表如下:
在一项有关医疗保健的社会调查中,调查的男性为530人,女性为670人,发现其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.
喜欢吃甜食 不喜欢吃甜食 合计
男 117 413 530
女 492 178 670
合计 609 591 1200
核心素养形成
14
【感悟提升】 作2×2列联表的关注点
(1)作2×2列联表时,注意应该是4行4列,计算时要准确无误.
(2)作2×2列联表时,关键是对涉及的变量分清类别.
核心素养形成
15
【跟踪训练】
1. 某电视公司为了研究体育迷是否与性别有关,在调查的100人中,体育迷75人,其中女生30人,非体育迷25人,其中男生15人.请作出性别与体育迷的列联表.
解 2×2列联表如下:
体育迷 非体育迷 合计
男 45 15 60
女 30 10 40
合计 75 25 100
核心素养形成
16
在吸烟与患肺病这两个随机事件中,下列说法正确的是( )
A.若χ2=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个人患有肺病
B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指不超过5%的可能性使得推断出现错误
D.以上三种说法都不正确
题型二 独立性检验的基本思想
解析 独立性检验的结果是一种相关关系,不是确定性关系,反映的是有关或无关的概率的大小,故A错误,B错误,C正确.
核心素养形成
17
【感悟提升】 本例考查独立性检验的基本思想,相关性检验的结果是一种相关关系,而不是确定性关系,是反映有关和无关的概率.
核心素养形成
18
【跟踪训练】
2.(1)给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.喝酒者得胃病的概率
C.喜欢喝酒与性别是否有关
D.青少年犯罪与上网成瘾是否有关
解析 独立性检验主要是对两个随机事件是否有关进行检验,故不可用独立性检验解决的问题是B.故选B.
核心素养形成
19
(2)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 合计
爱好 40 20 60
不爱好 20 30 50
合计 60 50 110
核心素养形成
20
附表:
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为爱好该项运动与性别有关
B.在犯错误的概率不超过0.1%的前提下,认为爱好该项运动与性别无关
C.有99%的把握认为爱好该项运动与性别有关
D.有99%的把握认为爱好该项运动与性别无关
P(χ2≥x0) 0.05 0.01 0.001
X0 3.841 6.635 10.828
解析 根据独立性检验的定义,由χ2≈7.8>6.635可知在犯错误的概率不超过0.01的前提下,认为爱好该项运动与性别有关,即有99%的把握认为爱好该项运动与性别有关.故选C.
核心素养形成
21
题型三 独立性检验的实际应用
某校对学生课外活动进行调查,结果整理成下表:
单位:人
试分析喜欢体育还是文娱是否与性别有关联.
课外活动
性别 体育 文娱 合计
男生 21 23 44
女生 6 29 35
合计 27 52 79
核心素养形成
22
课外活动
性别 体育 文娱 合计
男生 21 23 44
女生 6 29 35
合计 27 52 79
核心素养形成
23
【感悟提升】 独立性检验的一般步骤
核心素养形成
24
【跟踪训练】
3.某出租汽车公司决定更换一批小汽车以代替原来报废的出租车,现有A,B两款车型的使用寿命(单位:年)频数表如下:
使用寿命/年 5 6 7 8 合计
A型出租车/辆 10 20 45 25 100
B型出租车/辆 15 35 40 10 100
核心素养形成
25
(1)填写下表,并分析出租车的使用寿命与汽车车型是否有关联.
单位:辆
(2)司机师傅小李准备在一辆开了4年的A型车和一辆开了4年的B型车中选择,为了尽最大可能实现3年内(含3年)不换车,试通过计算说明他应如何选择.
使用寿命
车型 不高于6年 不低于7年 合计
A型
B型
合计
核心素养形成
26
解 (1)统计假设为H0:出租车的使用寿命与汽车车型之间无关联.
根据题目所给数据得到如下2×2列联表:
单位:辆
使用寿命
车型 不高于6年 不低于7年 合计
A型 30 70 100
B型 50 50 100
合计 80 120 200
核心素养形成
27
使用寿命/年 5 6 7 8 合计
A型出租车/辆 10 20 45 25 100
B型出租车/辆 15 35 40 10 100
核心素养形成
28
随堂水平达标
1.给出下列实际问题:
①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟是否与性别有关系.
其中用独立性检验可以解决的问题有( )
A.①②③ B.②③
C.② D.①②
解析:独立性检验是判断两个分类变量是否有关系的方法,而①是概率问题,不能用独立性检验解决.
随堂水平达标
1
2
3
4
5
30
2.在考察儿童出生月份X与学习成绩Y是否优秀的独立性检验中,得出如图的列联表.如果最后发现,这两个分类变量X与Y没有任何关系,则表中正数a的值最有可能是( )
A.200 B.720 C.100 D.690
X
Y 上半年出生 下半年出生 合计
学习成绩优秀 200 800 1000
学习成绩非优秀 180 a 180+a
合计 380 800+a 1180+a
随堂水平达标
1
2
3
4
5
31
X
Y 上半年出生 下半年出生 合计
学习成绩优秀 200 800 1000
学习成绩非优秀 180 a 180+a
合计 380 800+a 1180+a
随堂水平达标
1
2
3
4
5
32
3.(多选)下列关于χ2统计量的说法正确的是( )
A.可以为负值
B.χ2的值越大,认为两个事件有关系的把握越大
C.当χ2的值很小时,不能推定两个事件不相关
D.χ2的值越大,认为两个事件有关系的把握越小
解析 χ2的值不可能为负值,故A错误;易知B正确,D错误;χ2的值很小时,只能说两个事件的相关程度低,不能推定两个事件不相关,故C正确.故选BC.
随堂水平达标
1
2
3
4
5
33
4.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下2×2列联表:
则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关(请用百分数表示).
喜爱打篮球 不喜爱打篮球 合计
男生 20 5 25
女生 10 15 25
合计 30 20 50
0.5%
随堂水平达标
1
2
3
4
5
34
喜爱打篮球 不喜爱打篮球 合计
男生 20 5 25
女生 10 15 25
合计 30 20 50
随堂水平达标
1
2
3
4
5
35
5.某数学兴趣小组为了探究参与某项老年运动是否与性别有关的问题,对城区60岁以上老人进行了随机走访调查,得到的数据如下表:
男性 女性 合计
参与该项老年运动 p 8 x
不参与该项老年运动 q 32 y
合计 60 40 100
随堂水平达标
1
2
3
4
5
36
P(χ2≥x0) 0.1 0.05 0.01 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
随堂水平达标
1
2
3
4
5
37
男性 女性 合计
参与该项老年运动 p 8 x
不参与该项老年运动 q 32 y
合计 60 40 100
随堂水平达标
1
2
3
4
5
38
课后课时精练
解析 由事件的独立性知,A正确;由独立性检验的意义知,B正确;χ2的大小是判定事件A与B是否相关的一种方法,不是唯一依据,C不正确;若事件A与B相关,则A发生B可能发生,也可能不发生,D不正确.
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
40
2.利用独立性检验对两个随机事件是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是( )
A.χ2≥6.635 B.χ2<6.635
C.χ2≥7.879 D.χ2<7.879
解析 有99.5%的把握认为事件A和B有关系,即犯错误的概率不超过0.5%,对应的x0的值为7.879,由独立性检验的思想可知应为χ2≥7.879.
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
41
3.某高校《统计》课程的教师随机给出了选修该课程的一些情况,具体数据如下:
为了判断选修统计专业是否与性别有
关,根据表中数据,得χ2≈4.844,因为χ2
>3.841,所以可以判定选修统计专业与性别有关.那么这种判断出错的可能性不超过( )
A.5% B.95% C.1% D.99%
解析 因为χ2>3.841,P(χ2≥3.841)=0.05,所以认为“选修统计课程与性别有关”出错的可能性不超过5%.
非统计专业 统计专业
男 13 10
女 7 20
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
42
4.利用独立性检验的方法调查高中生的写作水平与喜好阅读是否有关,通过随机询问120名高中生是否喜好阅读,利用2×2列联表,由计算可得χ2=4.236.
参照附表,可得正确的
结论是( )
A.有95%的把握认为写作水平与喜好阅读有关
B.有97.5%的把握认为写作水平与喜好阅读有关
C.有95%的把握认为写作水平与喜好阅读无关
D.有97.5%的把握认为写作水平与喜好阅读无关
P(χ2≥x0) 0.1 0.05 0.025 0.01 0.001
x0 2.706 3.841 5.024 6.635 10.828
解析 ∵3.841<4.236<5.024,∴有95%的把握认为写作水平与喜好阅读有关.故选A.
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
43
5.某单位为了了解员工喜欢户外运动是否与性别有关,随机抽取了50人进行调查,数据如下表:
则认为喜欢户外运动与性别有关系的把握
大约为( )
A.99% B.97.5%
C.90% D.无充分依据
喜欢户外运动 不喜欢户外运动 合计
男性 18 9 27
女性 8 15 23
合计 26 24 50
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
44
二、填空题
6.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
由表中数据直观分析,收看新闻节目的观众是否与年龄有关?_____(填“是”或“否”).
文艺节目 新闻节目 合计
20至40岁 40 18 58
大于40岁 15 27 42
合计 55 45 100
是
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
45
文艺节目 新闻节目 合计
20至40岁 40 18 58
大于40岁 15 27 42
合计 55 45 100
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
46
7.在2×2列联表中,若每个数据变为原来的2倍,则χ2的值变为原来的___倍.
2
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
47
8.某销售部门为了研究具有相关工作经验和能按时完成销售任务的关系,对本部门200名销售人员进行调查,所得数据如下表所示:
单位:人
根据上述数据_____ (填“能”或“不能”)得出结论:在犯错误的概率不超过0.01的前提下认为“销售人员具有相关工作经验与能按时完成销售任务是有关联的”.
销售任务
工作经验 能按时完成销售任务 不能按时完成销售任务 合计
具有相关工作经验 57 42 99
不具有相关工作经验 36 65 101
合计 93 107 200
能
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
48
销售任务
工作经验 能按时完成销售任务 不能按时完成销售任务 合计
具有相关工作经验 57 42 99
不具有相关工作经验 36 65 101
合计 93 107 200
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
49
三、解答题
9.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
50
根据已知条件完成下面的2×2列联表,并判断能否认为“体育迷”与性别有关联?
单位:人
观众
性别 非体育迷 体育迷 合计
男
女 10 55
合计
P(χ2≥x0) 0.1 0.05 0.025 0.01 0.001
x0 2.706 3.841 5.024 6.635 10.828
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
51
解 由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25.
“非体育迷”人数为75,则据题意完成2×2列联表如下:
单位:人
观众
性别 非体育迷 体育迷 合计
男 30 15 45
女 45 10 55
合计 75 25 100
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
52
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
53
10.(全国甲卷)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
(1)填写如下列联表:
优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙车间 70 28 2 100
合计 96 52 2 150
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
54
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
55
解 (1)根据题意可得列联表如下:
优级品 非优级品
甲车间 26 24
乙车间 70 30
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
56
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
57
1.(多选)有两个变量X与Y,其2×2列联表如下所示:
其中a为正整数,若在犯错误的概率不超过0.05的前提下认为X与Y之间有关联,则a的值可以为( )
A.7 B.8 C.9 D.10
Y
X Y=0 Y=1 合计
X=0 a 20-a 20
X=1 15-a 30+a 45
合计 15 50 65
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
58
Y
X Y=0 Y=1 合计
X=0 a 20-a 20
X=1 15-a 30+a 45
合计 15 50 65
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
59
2.甲、乙两台机床生产同一型号零件.记生产的零件的尺寸为t(cm),相关行业质检部门规定:若t∈(2.9,3.1],则该零件为优等品;若t∈(2.8,2.9]∪(3.1,3.2],则该零件为中等品;其余零件为次品.现分别从甲、乙机床生产的零件中各随机抽取50件,经质量检测得到下表数据:
尺寸 [2.7,2.8] (2.8,2.9] (2.9,3.0] (3.0,3.1] (3.1,3.2] (3.2,3.3]
甲机床零件频数 2 3 20 20 4 1
乙机床零件频数 3 5 17 13 8 4
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
60
(1)设生产每件产品的利润为:优等品3元,中等品1元,次品亏本1元.若将频率视为概率,试根据样本估计总体的思想,估算甲机床生产一件零件的利润的数学期望;
(2)对于这两台机床生产的零件,在排除其他因素影响的情况下,判断零件优等与否和所用机床是否有关联.如果有关联,请解释它们之间如何相互影响.
参考数据:
P(χ2≥x0) 0.25 0.15 0.10 0.05 0.025 0.010
x0 1.323 2.072 2.706 3.841 5.024 6.635
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
61
解 (1)设甲机床生产一件零件获得的利润为X元,它的分布列为
则有E(X)=3×0.8+1×0.14+(-1)×0.06=2.48(元).
所以甲机床生产一件零件的利润的数学期望为2.48元.
X 3 1 -1
P 0.8 0.14 0.06
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
62
机床
零件 甲 乙 合计
优等品 40 30 70
非优等品 10 20 30
合计 50 50 100
(2)由表中数据可知,甲机床生产优等品40件,非优等品10件;乙机床生产优等品30件,非优等品20件.
统计假设为H0:零件优等与否和所用机床无关联.
作2×2列联表如下: 单位:件
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
63
课后课时精练
1
2
3
4
5
6
7
8
9
10
A级
B级
1
2
64
R
Y
X
B
eq \o(B,\s\up12 (-))
合计
A
a
b
a+b
eq \o(A,\s\up12(-))
c
d
c+d
合计
a+c
b+d
a+b+c+d
像上表这样,将两个(或两个以上)分类变量进行交叉分类得到的频数分布表称为__________;称X,Y为____________,其中变量X有两个变量值——A和eq \o(A,\s\up12(-)),变量Y有两个变量值——B和eq \o(B,\s\up12(-)).由于所涉及的两个分类变量X,Y均有两个变量值,所以称上表为2×2列联表.
知识点二 独立性检验
要研究“两个分类变量有关系”这一结论的可靠程度,首先假设该结论不成立,即假设“H0:两个分类变量没有关系(指独立)”成立.
在该假设下构造统计量χ2(读作“卡方”),由抽样数据计算得到χ2的观测值为χ2=
___________________________________,其中n=________________.
查临界值表确定临界值x0,当χ2的观测值<x0时,表示假设H0成立.当χ2的观测值≥x0时,我们有[1-P(χ2≥x0)]×100%的把握认为H0不成立,于是否定假设H0,由此推断犯错误的概率不会超过P(χ2≥x0).
eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))
知识点三 独立性检验的应用步骤
利用独立性检验推断“X与Y有关系”,可按下面的步骤进行:
(1)提出统计假设H0:X与Y之间没有关系;
(2)根据2×2列联表与公式χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))计算χ2的观测值;
(3)查临界值表确定临界值x0,然后作出判断.
由χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))算得,
χ2=eq \f(110×(40×30-20×20)2,60×50×60×50)≈7.8.
解 统计假设为H0:喜欢体育还是文娱与性别无关联.
∵a=21,b=23,c=6,d=29,n=79,
∴χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))
=eq \f(79×(21×29-23×6)2,44×35×27×52)≈8.106,
由于7.879<8.106<10.828,所以
至少有99.5%的把握认为喜欢体育还是
文娱与性别有关联.
(1)提出统计假设H0:X与Y之间没有关系;
(2)根据2×2列联表与公式χ2=
eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))计算χ2的观测值;
(3)查临界值表确定临界值x0,然后作出判断.
所以χ2=eq \f(200×(30×50-70×50)2,100×100×80×120)≈8.333,
由于7.879<8.333<10.828,所以至少有99.5%的把握认为出租车的使用寿命与汽车车型有关联.
(2)记事件A为“小李选择A型车,3年内(含3年)不换车”,事件B为“小李选择B型车,3年内(含3年)不换车”,所以P(A)=eq \f(45+25,100)=0.7,P(B)=eq \f(40+10,100)=0.5.因为P(A)>P(B),所以小李应选择A型车.
解析 ∵X与Y没有任何关系,∴上半年出生的优秀率与下半年出生的优秀率近似相等,∴eq \f(200,380)≈eq \f(800,800+a),∴a≈720,即正数a的值最有可能是720.
解析 χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))=eq \f(50×(20×15-5×10)2,25×25×30×20)≈8.333>7.879,所以在犯错误的概率不超过0.5%的前提下认为喜爱打篮球与性别有关.
从参与该项老年运动的被调查者中随机抽取1人,这个人是男性的概率是eq \f(2,3).
(1)求2×2列联表中p,q,x,y的值;
(2)是否有90%的把握认为参与该项老年运动与性别有关?
参考公式及数据:
χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.
解 (1)由已知可得eq \f(p,p+8)=eq \f(2,3),所以p=16,q=44,x=24,y=76.
(2)因为χ2=eq \f(100×(16×32-8×44)2,24×76×60×40)≈0.585<2.706,
所以没有90%的把握认为参与该项老年运动与性别有关.
一、选择题
1.(多选)下列说法正确的是( )
A.事件A与B独立,即两个事件互不影响
B.事件A与B关系越密切,则χ2就越大
C.χ2的大小是判定事件A与B是否相关的唯一根据
D.若判定两事件A与B相关,则A发生B一定发生
解析 由表中数据得χ2=eq \f(50×(18×15-9×8)2,27×23×26×24)≈5.059>5.024,所以约有97.5%的把握认为喜欢户外运动与性别有关系.
解析 因为在20岁至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即eq \f(b,a+b)=eq \f(18,58),eq \f(d,c+d)=eq \f(27,42),两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.
解析 公式χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))中所有值变为原来的2倍,则eq \f(2n(2a·2d-2b·2c)2,(2a+2b)(2c+2d)(2a+2c)(2b+2d))=2χ2,故χ2也变为原来的2倍.
解析 统计假设为H0:销售人员具有相关工作经验与能按时完成销售任务之间无关联.由公式χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),得χ2=eq \f(200×(57×65-42×36)2,99×101×93×107)≈9.667.因为9.667>6.635,所以能在犯错误的概率不超过0.01的前提下认为“销售人员具有相关工作经验与能按时完成销售任务是有关联的”.
参考数据及公式如下:
χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
统计假设为H0:“体育迷”与性别无关联.
将2×2列联表的数据代入公式计算:
χ2=eq \f(100×(30×10-15×45)2,45×55×75×25)≈3.030,
因为3.030<3.841,所以没有充分的证据显示“体育迷”与性别有关联.
(2)已知升级改造前该工厂产品的优级品率p=0.5,设eq \o(p,\s\up6(-))为升级改造后抽取的n件产品的优级品率.如果eq \o(p,\s\up6(-))>p+1.65eq \r(\f(p(1-p),n)),则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(eq \r(150)≈12.247)
附:K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
提出统计假设H0:甲、乙两车间产品的优级品率不存在差异.
由表中数据可得K2=eq \f(150×(26×30-24×70)2,50×100×96×54)=eq \f(75,16)=4.6875,
因为3.841<4.6875<6.635,
所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题意可知,生产线智能化升级改造后,该工厂产品的优级品的频率为eq \f(96,150)=0.64,
用频率估计概率可得eq \o(p,\s\up6(-))=0.64,
又因为升级改造前该工厂产品的优级品率p=0.5,
则p+1.65eq \r(\f(p(1-p),n))
=0.5+1.65×eq \r(\f(0.5×(1-0.5),150))≈0.5+1.65×eq \f(0.5,12.247)≈0.57,
可知eq \o(p,\s\up6(-))>p+1.65eq \r(\f(p(1-p),n)),
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
解析 令χ2=eq \f(65[a(30+a)-(20-a)(15-a)]2,20×45×15×50)=3.841,解得a≈7.688或a≈1.543.由题意知χ2≥3.841,所以只要a≥7.688或a≤1.543,就可以在犯错误的概率不超过0.05的前提下认为X与Y之间有关联,又a∈N+,故选BCD.
参考公式:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
计算χ2=eq \f(100×(40×20-30×10)2,70×30×50×50)=eq \f(100,21)≈4.762,
因为3.841<4.762<5.024,所以至少有95%的把握认为零件优等与否和所用机床有关联.甲机床生产的优等品的频率为eq \f(40,50)=0.8;乙机床生产的优等品的频率为eq \f(30,50)=0.6.根据频率稳定于概率的原理,可以认为用乙机床生产的零件是优等品的概率小于用甲机床生产的零件是优等品的概率,即用甲机床更容易生产出优等品.
$