内容正文:
数学选择性必修
第三册
系,通过调查研究发现可选择函数模型y=
可求得y关于x的非线性经验回归方程为(
cr+c来拟合y与x的关系,根据以下数据
A.y=100
0043+4.291B.2=100e0.048x-4.291
茶叶量x/克
2
5
C.y=e0.043x+4.291
D.y=e0.043x-4.291
ln(100y)
4.34
4.36
4.44
4.45
4.51
温馨提示
请做课时分层检测(十九)
8.3
列联表与独立性检验
8.3.1&8.3.2分类变量与列联表
独立性检验
【素养要求】通过学习2×2列联表并运用列联表进行独立性检验,发展数学抽象及数据分析素养
必备知识·自主梳理
预习新知夯实基础
1.分类变量与列联表
则x2=
(1)分类变量
(2)利用x2的取值推断分类变量X和Y是否
为了表述方便,我们经常会使用一种特殊的随机
的方法称为x独立性检验,读作“卡方
变量,以区别不同的现象或性质,这类随机变量
独立性检验”,简称独立性检验
称为分类变量.分类变量的取值可以用实数
表示
(3)x2独立性检验中几个常用的小概率值和相应
(2)列联表
的临界值
假设两个分类变量X和Y,它们的可能取值分别
0.1
0.05
0.01
0.005
0.001
为{x1,x2}和{y1y2},其2×2列联表为
2.706
3.841
6.635
7.879
10.828
X
合计
y1
y2
即学即练]
a
atb
判断正误
2
d
c+d
(1)分类变量中的变量与函数中的变量是同一
合计
a-c
b+d
a+b+c+d
概念
2×2列联表给出了成对分类变量数据的交叉分
类频数
(2)2×2列联表中的数据是两个分类变量的
2.独立性检验
频数
(
(1)假定通过简单随机抽样得到了X和Y的抽
(3)事件A和B的独立性检验无关,即两个事件
样数据列联表,如表所示。
互不影响,
()
(4)x2的大小是判断事件A和B是否相关的统
合计
Y=0
Y=1
计量
X=0
b
a+b
(5)若计算得x2=7.197,则认为两个变量间有关
X=1
c+d
系的出错概率不超过0.01
C
(6)在2×2列联表中,若|ad-bc越小,则说明
合计
atc
b+d
n=a+b+c+d
两个分类变量之间关系越强,
62
第八章成对数据的统计分析
关键能力·合作探究
讲练设计探究重,点
题点一列联表与等高堆积条形图
:2.用等高堆积条形图粗略估计两个分类变量是否
[典例]为了解铅中毒病人与尿棕色素为阳性是
相关.观察下列各图,其中两个分类变量相关关
否有关系,分别对病人组和对照组的尿液作尿棕
系最强的是
(
)
色素定性检查,结果如下:
8
8
尿液定性
分组
合计
阳性(Y=0)阴性(Y=1)
6542
病人组(X=0)》
29
7
36
0.0
对照组(X=1)
9
28
37
合计
38
35
73
☐x2
☐x2
试画出列联表的等高堆积条形图,分析铅中毒病
人和对照组的尿棕色素阳性数有无差别,铅中毒
病人与尿棕色素为阳性是否有关系?
8品
听课记录
题点二
独立性检验的计算
[典例门佩戴头盔是一项对家庭与社会负责的表
现,某市对此不断进行安全教育.交警统计2018
~2021年通过某路口的开电瓶车出事故的50
人,分析不戴头盔行为与事故是否伤亡的关系,
得到下表,根据小概率值α=0.05的独立性检
验,判断戴头盔与事故是否伤亡之间是否有关?
/方法技巧/…
参考公式:
列联表与等高堆积条形图的应用:
0.10
0.05
0.025
0.010
0.005
(1)理解列联表的定义及表格中的数据之间的
Ta
2.706
3.841
5.024
6.635
7.879
关系
n(ad-bc)2
(2)等高堆积条形图两种颜色的高度的差别大:
X=(a+b)(c+d)(a+c)(b+d)'
其中n=a十b
小,差别越大,关联性越强,
+c+d.
对点训练
不戴头盔
戴头盔
伤亡
2
3
1.某学校对高三学生作了一项调查,发现:在平时
不伤亡
13
27
的模拟考试中,性格内向的学生426人中有332
听课记录
人在考前心情紧张,性格外向的学生594人中有
213人在考前心情紧张.作出等高堆积条形图,利
用图形判断考前心情紧张与性格类别是否有
关系
63
数学选择性必修
第三册
…/方法技巧/
题点三独立性检验的综合应用
独立性检验的一般方法:
[典例]某网站的调查显示,健身操类、跑步类、拉
(1)根据题目信息,完善列联表.
伸运动类等健身项目在大众健康项目中是比较
(2)提出零假设:假设两个变量相互独立,并给
火热的,但是大多数人的健身科学类知识相对缺
出在问题中的解释.
乏,尤其是在健身指导方面.从某健身房随机抽
(3)根据列联表中的数据及计算公式x2=
取200名会员,对其平均每天健身时间进行调
n(ad-bc)2
查,如下表,健身之前他们的体重情况如柱状图
(a+b)(c+d)(a+c)(6+d)求出X2的值.
(1)所示,该健身房的教练为他们制订了健身计
(4)根据需要确定两个分类变量有关系犯错误:
划,四个月后他们的体重情况如柱状图(2)所示
概率的上界值a,查表确定临界值x。
平均每天健
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)[80,90
(5)当X≥xa时,我们就推断H0不成立,即认为
身时间/分钟
两个变量不独立,该推断犯错误的概率不超过α:
人数
36
44
40
10
(6)当X<x。时,我们没有充分证据推断H。不
百分比
百分比
50%
50%
成立,可以认为两个变量相互独立
40%
40%
30%
30%
20%
20%
对点训练
10%
10%
[90,100)100,110)0110,120)体重/kg
[80,90[90,100100,110)体重/kg
1.(多选)某机构通过抽样调查,利用2×2列联表:
柱状图(1)
柱状图(2)
和x统计量研究患肺病是否与吸烟有关,计算
(1)若这200名会员的平均体重减少不低于5kg,就
得x2=3.305,经查对临界值表知P(x2≥2.706)
认为该计划有效,根据上述柱状图,试问:该计划是
≈0.10,P(x2≥3.841)≈0.05,现给出四个结论,
否有效?(每组数据用该组区间的中点值作代表)
其中正确的是
(
(2)请根据图中数据填写下面的2×2列联表,试
A.因为x2>2.706,故依据小概率值a=0.1的
问:依据小概率值α=0.010的独立性检验,判断
独立性检验,我们认为“患肺病与吸烟有关”
平均每天健身时间与会员健身前的体重是否
B.因为x2<3.841,故依据小概率值a=0.05的
有关?
独立性检验,认为“患肺病与吸烟有关”
平均每天健身时
平均每天健身时
C.因为x2>2.706,故依据小概率值a=0.1的独
合计
间低于60分钟
间不低于60分钟
立性检验,我们认为“患肺病与吸烟无关”
健身前体重低于
D.因为x2<3.841,故依据小概率值a=0.05的
100kg
独立性检验,认为“患肺病与吸烟无关”
健身前体重不低
2.(多选)某研究所为了检验新开发的疫苗的预防
80
于100kg
作用,对1000名注射了疫苗的人与另外1000
合计
200
名未注射疫苗的人的一年的健康记录进行比较,
(3)以这200名会员平均每天健身时间的频率,
并提出假设:这种疫苗不能起到预防该疾病的作:
代替该健身房1名会员平均每天健身时间发生
用,并计算出P(≥6.635)≈0.01,则下列说法
的概率,若在该健身房随机调查12名会员,则其
不正确的是
(
)
中平均每天的健身时间不低于70分钟的人数最
A.这种疫苗能起到预防该疾病的作用的有效率!
有可能(即概率最大)是多少?
为1%
n(ad-bc)2
B.若某人未使用该疫苗,则他在半年内有99%:
参考公式:X2=a+b)C十ac6+D,其
的可能性得该疾病
中n=a+b+c+d.
C.依据小概率值α=0.01的独立性检验,认为这
参考数据:
种疫苗能起到预防该疾病的作用
P(x2≥xa)
0.10
0.05
0.025
0.010
0.005
0.001
D.在犯错误的概率不超过0.01的前提下,认为
这种疫苗能起到预防该疾病的作用
2.706
3.841
5.024
6.635
7.879
10.828
64
第八章成对数据的统计分析
听课记录
(1)根据以上数据完成以下2×2列联表:
喜爱运动
不喜爱运动
合计
男
10
16
女
6
14
合计
30
(2)根据列联表的独立性检验,能否在犯错误的
概率不超过0.10的前提下认为性别与喜爱运动
有关?
附表:
a
0.10
0.05
0.010
/方法技巧/
2.706
3.841
6.635
统计概率与独立性检验的综合应用:
(1)根据柱状图进行平均值计算.
(2)根据表格中的信息完善列联表.
(3)根据x2计算公式计算值,
(4)根据临界值表进行比对,做出判断.
(5)利用二项分布计算概率求解不等式,
对点训练
学校举行运动会,为了搞好接待工作,组委会招
募了16名男志愿者和14名女志愿者,调查发
现,男、女志愿者中分别有10人和6人喜爱运
动,其余人不喜爱运动
素养演练·提升技能
达标训练素养提高
1.假设有两个变量x与y的2×2列联表如下:
经计算X2=10,则下列选项正确的是()
y2
A.有99%的把握认为使用智能手机对学习有
a
6
影响
B.有99%的把握认为使用智能手机对学习无
对于以下数据,对同一样本能说明x与y有关系
影响
的可能性最大的一组为
(
C.有95%的把握认为使用智能手机对学习有
A.a=2,b=3,c=4,d=5
影响
B.a=5,b=3,c=3,d=4
D.有95%的把握认为使用智能手机对学习无
C.a=3,b=6,c=2,d=5
影响
D.a=5,b=3,c=4,d=3
3.对两个分类变量A,B的下列说法中正确的个
2.某研究型学习小组调查研究学生使用智能手机:
数为
()
对学习的影响.部分统计数据如下表:
①A与B无关,即A与B互不影响;
使用智能手机
不使用智能手机
总计
②A与B关系越密切,则x的值就越大;
学习成绩优秀
4
8
12
③x的大小是判定A与B是否相关的唯一
学习成绩不优秀
16
2
18
依据
总计
20
10
30
A.0
B.1
C.2
D.3
65
数学选择性必修
第三册
4.高二第二学期期中考试,按照甲、乙两个班学生
了解所学专业
不了解所学专业
合计
的数学成绩优秀和及格统计人数后,得到如下列:
男生
63
117
180
联表:
女生
42
82
124
优秀
及格
合计
合计
105
199
304
甲班
11
34
45
根据表中数据,则下列说法正确的是
乙班
8
37
45
(填序号)
合计
19
71
90
①性别与了解所学专业有关;
则x2约为
②性别与了解所学专业无关;
A.0.600
B.0.828
C.2.712
D.6.004
③女生比男生更了解所学专业
5.下表是某届某校本科志愿报名时,对其中304名
温馨提示
请做课时分层检测(二十)
学生进入高校时是否了解所学专业的调查表:
章末综合提升
一、系统认知·形成数学思维
(一)贯通知识体系和联系
的两个变量之间是否具有线性相关性,体现了数
散点图
形结合思想.
成对数据
数值变量
相关性
样本性相关系数
2.在本章经验回归方程的求解中,相关系数的计算
y=bxta
一元线性回归
列差分析
等体现了函数与方程思想,
模型
误差分析
统计分析
决定系数
3.回归分析是对抽取的样本进行分析,确定两个变
分类
独立性
量的相关关系,并用一个变量的变化去推测另一
2×2列
变量
联表
检验
判定依据x。
个变量的变化.如果两个变量非线性相关,我们
可以通过对变量进行变换,转化为线性相关问
(二)把握数学思想和方法
题,体现了转化与化归的思想
1.本章在回归分析中,利用散点图可以判断所考查:
二、把握重点·常考题型集训
题型一经验回归方程及其应用
:3.流行性感冒(简称流感)是流感病毒引起的急性
l.为了研究某班学生的脚长x(单位:cm)和身高y:
呼吸道感染,是一种传染性强、传播速度快的疾
(单位:cm)的关系,从该班随机抽取10名学生,
病.其主要通过空气中的飞沫、人与人之间的接
根据测量数据的散点图可以看出y与x之间有
触与被污染物品的接触传播.流感每年在世界各
线性关系,设其经验回归方程为y=x十a.已知
地均有传播,在我国北方通常呈冬春流行,南方
之x=225,之:=160,6=4.该班某学生的脚
有冬春季和夏季两个流行高峰.儿童相对免疫力
低,在幼儿园、学校等人员密集的地方更容易被
长为24,据此估计其身高为
(
传染.某幼儿园将去年春季该园患流感小朋友按
A.160 cm B.163 cm C.166 cm D.170 cm
照年龄与人数统计,得到如下数据:
2.已知表中数据y与x有较好的线性关系,通过计
算得到y关于x的经验回归方程为=1.05.x+
年龄x
2
34
5
6
a,则相应于点(8,10)的残差e
患病人数y22
22171410
2
8
10
(1)求y关于x的经验回归方程:
10
12.5
(2)计算变量x,y的相关系数r(计算结果精确到
0.01),并回答是否可以认为该幼儿园去年春季
66题点三
对数可得1n(100y)=0.043.x-4.291,将x=3代入可得1n(100y)
典例解(1)由散点图知,成对样本数据散点在曲线附近,
0.043×3-4.291=一4.162≠4.42,所以选项B错误:对于C,v
因此利用D=a2十b2lgI模型更适合.
e.018+1.21,两边同时取对数可得1ny=0.043.x十4.291,而表中所
(2)令W:=lgI:,先建立D关于W的经验回归方程
给数据为1n(100)的相关量,所以C错误;对于D,y=e.01r-1.291
两边同时取对数可知1ny=0.043.x一4.291,而表中所给数据为
由统计表格知.公(w,-0(D,-D1=5.1,5(w,-0=0.51,
1n(100y)的相关量,所以D错误.]
10
8.3列联表与独立性检验
(W,-W)(D,-D)
则6-1
5.1
8.3.1&8.3.2分类变量与列联表独立性检验
∑(W,-W)2
0.57-10,
必备知识·自主梳理
n(ad-bc)2
.a=D-bW=45.7-10×(-11.5)=160.7,
;2.(1)a+b)(c+d0(a+c)(b+dD
(2)独立
即学即练
'.D关于W的经验回归方程是D=10W十160.7,
(1)×(2)/(3)×(4)W(5)√(6)×
故D关于声音能量的非线性经验回归方程是D=101gI十160.7.
:关键能力·合作探究
对点训练
!题点一
解(1)根据表中的数据画出散点图,如下:
!典例解病人组中尿液为阳性和阴性的频率分别为:
29
1体重/kg
36
≈0.8056
36≈0.1944.
60
50
对照组中尿液为阳性和阴性的频率分别为:
40
9
30
≈0.2182和器≈0.7568
20
等高堆积条形图如图所示:
10
身高/cn
I
0
20406080100120140160180
0.8
口阴性
由图可知,这些点分布在某条指数型函数曲线y=(12的周围,于
0.6
☑阳性
是令x=lny,列表如下:
0.4
0.2
60
70
80
90
100
110
1.81
2.07
2.30
2.50
2.71
2.86
0铅中毒病人对照组
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色
120
130
140
150
160
170
素为阳性的频率.
由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的
3.04
3.29
3.44
3.66
3.86
4.01
频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系,
·对点训练
作出散点图,如下:
1解作列联表如下:
4
性格
3队
考前心情
合计
内向
外向
2
紧张
332
213
545
020406080100120140160180元
不紧张
94
381
475
由表中数据可求得x与工之间的经验回归直线方程为
-=0.693十0.020x,则有y=e0,93+0.020x
合计
426
594
1020
(2)由(1)知,当x=168时,y=e.63+0020×1路≈57.57,所以在校男
相应的等高堆积条形图如图所示
生身高为168cm,预测他的体重约为57.57kg.
18
素养演练·提升技能
1,D[用光滑的曲线把图中各点连接起来,由图象的大致走向判断,
☐性格外向
☐性格内向
此函数应该是对数函数类型的,故应该选用的函数模型为y=a十
bin x.]
8
考前心
考前心
2.C[由题意得x=号(2+4+5+6+8)=5,5=号(30+40+50+
情紧张情不紧张
60十70)=50,∴.样本中心点为(5,50).,经验回归直线y=7x十a
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的
比例,
过样本中心点(5,50),.50=7×5十a,解得a=15,∴经验回归方程
从图中可以看出考前心情紧张的样本中性格内向占的比例比考前
为y=7x十15.当x=12时,销售额的预报值为99万元.故选C.]
心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与
3.0.29[对y=e.+r取对数,得lny=bz十0.38,所以lny与x为线性
性格类别有关.
相关关系.因为(川·边·为·…·%)=89.7,所以!2.D[在等高堆积条形图中,深色条的高度相差越大,相关性越强.]
hy十h十h十…十n些=3.9,所以3.9=12b十0,38,所以典例解零假设为H。:或头盔与事故伤亡之间无关,根据列联表中
!题点二
23
b≈0.29.]
的数据计算得X=50X7X273×13》=4.6875>3.841,根据
4.C[样本点(r,1)的残差为1-2r一a,样本点(1,s)的残差为一a
10×40×20×30
小概率值a=0.05的独立性检验,我们推断H。不成立,该推断犯错
2.依题意得1-2r一a=s-a-2,故s=-2r十3.]
误的概率不超过0.05,即戴头盔与否与伤亡之间是有关系的,
5.A[由表中数据可知-1+2++4什5=3,431+436+444+445+45对点训练
25
2
:1.AD[因为X=3.305,且3.305>2.706,由临界值表知,P(X≥2.706)
=42对于A少-e0+11化简变形可得1Og=心,两边同时日
≈0.10,
所以依据小概率值。=0.1的独立性检验,认为“患肺病与吸烟有
取对数可得1n(100y)=0.043x十4.291,将x=3代入可得ln(100y):
关”,则A正确,C不正确:
=0.043X3十4.291=4.42,与题中数据吻合;故选项A正确:对于!
因为临界值3.841>3.305,则依据小概率值a=0.05的独立性检
B.=e0化简支衫可得10=e-,两边同时聚2.ABL西P(76,850.01可知CD正境,AB部不正确.]
验,认为“患肺病与吸烟无关”,即B不正确,D正确.]
174
题点三
章末综合提升
典例解(1)柱状图(1)中的体重平均值为95X0.3十105×0.5十!二、把握重点·常考题型集训
115×0.2=104(kg).柱状图(2)中的体重平均值为85×0.1十95×1.C[由已知x=22.5,y=160,.a=160一4×22.5=70,当x=24
0.4十105×0.5=99(kg).因为104一99=5,所以该计划有效.
时,y=4×24十70=166,故选C.]
(2)2X2列联表如下:
!2.-0.4[由题目数据表,知=6,=8.3,.8.3=1.05×6十a,得
a=2.
平均每天健身时
平均每天健身时
因此=1.05.x十2,当x=8,0=10.4,.相应于点(8,10)的残差e=
合计
间低于60分钟
间不低于60分钟
10-10.4=-0.4.
3.解
(1)由题意得,x=2+3+4+5十6=4,
健身前体重低
5
20
于100kg
40
22+22+17+14+10=17,
5
健身前体重不
80
2(x-x)(y一)
60
140
低于100kg
2(x,一x)2
2=1
合计
100
100
200
(-2)×5+(-1)×5+0×0+1×(-3)十2×(-7)
X-200X40X8020×6012
(-2)2+(-1)2+02+12+2
100×100×60×140
9.524>6.635.
=-3.2,a=y-6x=17+3.2×4=29.8,
依据小概率值《=0.010的独立性检验,认为平均每天健身时间与
故y关于x的经验回归方程为y=一3.2x十29.8.
会员健身前的体重是有关系的
-32
(3)由题意可知,该健身房每名会员平均每天的健身时间不低于70:
(2).r
分钟的概率为品片
1
2(x-)2
V-)
√/10×108
-16
设抽取的12人中平均每天的健身时间不低于70分钟的人数为X,:
≈-0.97,.<0,说明x,y负相关。
3√/30
2一
剥X~B(12,)P(X=)=C()广()
,k=0,1,2,1
又|r|∈[0.75,1],说明x,y相关性很强,
因此,可以认为该幼儿园去年春季流感人数与年龄负相关很强
…,12.
得PCX=)≥P(X=+1.
4B[由公式得X2=50X18×15-8X9)
26×24×27×23
≈5.059>5.024=x0.025.
,P(X=k)≥P(X=k-1)
.犯错误的概率不超过0.025.]
(仔)广())()()"。
:5.C[对于A,两个变量的2X2列联表中,对角线上数据的乘积之差
的绝对值越大,说明两个变量有关系成立的可能性就越大,所以A
()广()'()()
正确;对于B,对分类变量X与Y的随机变量x来说,X越小,认为
“X与Y有关系”的犯错误的概率越大,所以B正确:对于C,由独立
化简得号<≤9,又kEN所以=,
性检验可知:在犯错误的概率不超过5%的前提下,认为秃顶与患心
脏病有关,不是说某人秃顶,那么他有95%的可能患有心脏病,所以
即12名会员中平均每天的健身时间不低于70分钟的人数最有可:
C错误:对于D,依据小概率值α=0.01的独立性检验,认为吸烟与
能是3人
患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与
对点训练
患肺癌有关,所以D正确.]
解(1)
16.解(1)完成列联表如下:
喜爱运动
不喜爱运动
合计
是否满意
班别
合计
男
10
6
16
满意
不满意
女
6
8
14
甲班
39
6
45
合计
16
14
30
乙班
30
15
45
(2)零假设为H。:喜爱运动与性别无关,由已知数据可得
合计
69
21
90
X-30x10X86X6
零假设为H。:评价与班级没有关系
16×14×16×14
≈1.1575,因为1.1575<2.706=z0.1,
由表中数据得
根据小概率值α=0.1的独立性检验,没有充分证据推断H。不成
立,因此可以以为H。成立,即认为性别与喜爱运动无关
X_90X(39×15-30X6)
45×45×69×21
素养演练·提升技能
=5.031>3.841=x6.05
l.B[根据y2的公式可知,当|ad一bc的值越大,两个变量有关的可!
根据小概率值a=0.05的独立性检验,我们推断H。不成立,即在犯
能性就越大,检验四个选项中所给的|ad-bc|的值.
错误的概率不超过5%的前提下,认为评价与班级有关.
7
A:ad-bc|=|10-12|=2,
(2)抽样比==了,甲班选取2人,乙班选取5人,
B:ad-bc|=|20-91=11,
C:ad-bc=|15-121=3,
则P
CiC+C6
C
7
D:lad-bc|=|15-12|=3,
:7.解(1)由题意得随机抽取的6件合格产品中,有3件为优等品,3
显然B中ad一bc|的值最大.故选B.]
件为非优等品,现从抽取的6件合格产品中再任选2件,选中的2件
2.A[因为x2=10>6.635,所以有99%的把握认为使用智能手机对
学习有影响,故选A.]
均为优等品的概率为己20
C3
3.B[①正确,A与B无关即A与B相互独立;②不正确,的值的
(2)对y=cx两边取自然对数得lny=lnc十blnx,令u=lnx,o
大小只是用来检验A与B是否相互独立:③不正确,例如借助三维
lny,a=lnc,则o=bw十a,由所给统计量及最小二乘估计公式有b
柱形图、二维条形图等.故选B.]
4.A[根据列联表中的数据,可得x=0X1X3734X8
2u,心,-6u元
45×45×19×71
75.3-24.6×18.3÷6=0.5,a=-
bu≈
2u-6u2
101.4-24.62÷6
0.600.]
5.②[7=304X53X8212X)≈0.041<2.706=1,所以
180×124×105×199
18.3-0.5X24.6=1,由a=1nc得c=e,所以y关于x的回归方程
6
性别与了解所学专业无关,」
为y=er0
175