内容正文:
1
12
10
6
42
01234x
根据散点图可知y与x近似地呈反比例函数关系,设y=
上,令t=,则y=,原数据变为:
3
1
0.50.25
y
16
12
52
由置换后的数值表作散点如图所示:
6
品
8
6
2·
01
2347
由散点图可以看出y与t呈近似的线性相关关系.列表
如下:
tiyi
4
16
64
16
256
2
2
12
24
4
144
3
1
5
1
25
4
0.5
2
1
0.25
4
50.25
1
0.250.0625
∑7.753694.2521.3125
430
所以t=1.55,y=7.2
∑ty:-5ty
所以6=
≈4.1344.a=y-bt≈0.8.
-5
所以y=4.1344t+0.8.
所以y与x的回归方程是=4.1344+0.8,
课堂检测固双基
1.A观察4幅图可知,A图散点分布比较集中,且大体接近某
一条直线,线性回归模型拟合效果比较好,呈现明显的正相
关,1rl值相比于其他3图更接近1.故选A.
2D因为x=0+1+2+3=1.5,=1+3+5+7=4,所以▣归
4
4
直线必过点(1.5,4)
3.C
4.D
5.69.96用回归方程对身高为178cm的人的体重进行预测
当x=178时,y=0.72×178-58.2=69.96(kg).
4.3.2独立性检验
必备知识探新知
n(ad-bc)2
知识点一(2)(a+b)(c+d)(a+c)(b+d)
a+b+c+d
-17
知识点二(1)显著性水平分位数a1-
思考:不对,若X<k成立,则说明有1-α的把握认为事件
A与B无关
关键能力攻重难
例1:(1)由调查数据知,男顾客对该商场服务满意的概率
的估计值为0.8:女顾客对该商场服务满意的概率的估计值为
-06
(2)X=-100×40x20-:30x10Y≈4.762
50×50×70×30
由于4.762>3.841,故有95%的把握认为男、女顾客对该
商场服务的评价有差异
对点训练1:(1)根据题目所给数据得到如下2×2的列
联表:
使用寿命不高于6年使用寿命不低于7年总计
A型
30
70
100
B型
50
50
100
总计
80
120
200
所以X=200×(50×70-30×50)2
≈8.333
100×100×80×120
查表可得P(x≥6.635)=0.01
由于8.333>6.635,
所以有99%的把握认为出租车的使用寿命与汽车车型
有关
(2)记事件A为“小李选择A型车,3年内(含3年)不换
车”,事件B为“小李选择B型车,3年内(含3年)不换车”,所以
P(A)=45+25=0.7,P(B)=40+10=0.5,因为P(A)>P(B),
100
100
所以小李应选择A型车
例2:(1)列联表补充如下:
喜爱打篮球
不喜爱打篮球合计
男生
22
6
28
女生
10
10
20
合计
32
16
48
(2)由X=28×20×32×16
48×(220-60)2
≈4.286.
因为4.286>3.841,所以,能在犯错误的概率不超过0.05
的前提下认为喜爱打篮球与性别有关
(3)喜爱打篮球的女生人数X的可能取值为0,1,2.
其概率分别为
P(X=0)=
Ci09
38,
P(X=1)=
CioCio10
C
-199
P(X=2)=C=9
ΓC3
-38
故X的分布列为
0
1
2
9
10
9
38
19
38
X的均值为E(X)=0+
10.9
19+19=1
0
对点训练2:(1)根据题意可得列联表:
优级品
非优级品
甲车间
26
24
乙车间
70
30
可得K=150×(26×30-24×70)2-75
=4.6875,
50×100×96×54
16
因为3.841<4.6875<6.635
所以有95%的把握认为甲、乙两车间产品的优级品率存在
差异,没有99%的把握认为甲,乙两车间产品的优级品率存在
差异
(2)由题意可知:生产线智能化升级改造后,该工厂产品的
优级品的颜率为总-064,
用频率估计概率可得p=0.64
又因为升级改造前该工厂产品的优级品率p=0.5,
则p+1.65。
D-05+1.6、5a5=0.5+
n
150
1.65×0.5
12247≈0.568,
可知p>p+1.65
e(1-p)
所以可以认为生产线智能化升级改造后,该工厂产品的优
级品率提高了.
例3X=90x10×38:7x35)2=0.653,
17×73×45×45
0.653<3.841
所以没有充分证据认为成绩与班级有关
课堂检测固双基
1.C根据独立性检验的思想方法,正确选项为C.
2.B由a+35=45,得a=10.由a+7=m,得m=17.由m+73
=3,得8=90.由45+n=s,得n=45.
3.CX越大,“事件A,B有关”的可信度越大,“事件A,B无
关”的可信度越小X越小,“事件A,B有关”的可信度越小,
“事件A,B无关”的可信度越大.
4.A易知当x≥6.635时,有99%的把握认为事件A和B有
关.故选A
5.0.01因为7.353>6.635,所以这种判断出错的最大可能性
为0.01.
章末知识梳理
核心知识归纳
思考1:不是.这是对全概率公式的形式主义的认识,完全
把它作为一个“公式”来理解是不对的.其实,我们没有必要去
背这个公式,根据B=B2=BA1+BA2+…+BA.,应着眼于A1,
A2,…,A的结构.事实上,对于具体问题,若能设出n个事件A
=1,2,m),使之清足A+,+A。=(任意两个事
1A,4=0
件互斥,i,J=1,2,…,n,i≠j).(1)就可得B=B2=BA1+BA2+
…+BA·(2)这样就便于应用概率的加法公式和乘法公式.
因此,能否使用全概率公式,关键在于(2),而要有(2),关
键又在于适当地对2进行一个分割,即有(1).
思考2:①两点分布是一种特殊的二项分布,即n=1时的二
项分布.
②超几何分布与二项分布之间的关系:n次试验中,X为事
件A出现的次数,当这n次试验是独立重复试验时,X服从二项
分布;当这n次试验是不放回摸球,事件A为摸到某种特性(如
某种颜色)的球时,X服从超几何分布.但是当袋子中的球的数
目N很大时,超几何分布近似于二项分布,并且随着N的增加
-17
这种近似的精确度也增加:
③二项分布与超几何分布的区别:有放回抽样,每次抽取时
的总体没有改变,因而每次抽到某物的概率都是相同的,可以看
成是独立重复试验,此种抽样是二项分布模型.而不放回抽样,
取出一个则总体中就少一个,因此每次取到某物的概率是不同
的,此种抽样为超几何分布模型.因此,二项分布模型和超几何
分布模型最主要的区别在于是有放回抽样还是不放回抽样
思考3:散点图可以形象直观地展示两个变量的关系,通过
散点图判断两个变量更近似于什么样的函数关系,以确定是否
能直接用线性回归模型来拟合原始数据。
要点专项突破
例1:13
解法一:记“至少出现2枚正面朝上”为事件A,
“恰好出现3枚正面朝上”为事件B,所求概率为P(B1A),事件A
包含的基本事件的个数为n(A)=C:+C+C:+C=26
事件B包含的基本事件的个数为n(B)=C=10,
.P(BIA)=n(AB)=n(B)10 5
n(A)n(A)26=13
解法二:事件A,B同上,则P(A)=G兮+CG+C+C_26
25
32
A8=)-号-品
所以P(B1A)=PAB=P(B-5
P(A)P(A)=3
例2:(1)P(2张都没有中奖)=
C6_15=1
即该顾客2张都没中奖的概率为了
(2)X的所有可能值为0,10,20,50,60
且PX0e9-Px=0:Gg
C=子,P(x=20)=
C
5P(X=50)
CiC2P(X=60)=1
C
C。
-151
故X的分布列为
X
10
20
50
60
1
2
1
1
15
15
从而期望E(X)=0x分+10×号+20×古+50×名+0×
2
516
例3:(1)甲、乙所在队的比赛成绩不少于5分,则甲第一阶
段至少投中1次,乙第二阶段也至少投中1次,
.比赛成绩不少于5分的概率P=(1-0.63)(1-0.53)=
0.686.
(2)(i)若甲先参加第一阶段比赛,则甲、乙所在队的比赛
成绩为15分的概率为P甲=[1-(1-p)3]g3,
若乙先参加第一阶段比赛,则甲、乙所在队的比赛成绩为
15分的概率为P,=[1-(1-g)3]·p,
0<p<9,
∴.P甲-Pz=q3-(g-pq)3-p3+(p-p9)3
=(g-p)(g+pg+p2)+(p-q)·[(p-pg)2+(q-p9)2
+(p-pg)(9-pg)]
=(p-q)(3p2q2-3p2q-3pg2)
=3pg(p-9)(p9-p-q)=3pg(p-q)[(1-p)(1-9)-1]
>0.
∴.P甲>P乙,应该由甲参加第一阶段比赛。
(ⅱ)若甲先参加第一阶段比赛,比赛成绩X的所有可能取
值为0,5,10,15,086
课堂检测
固双基
1.(2024·天津卷)下列图中,线性相关性系数最
系数为r1,B组数据的相关系数为r2,则
大的是
●
A组数
B组数
A
A.1=r2
B.r<r2
C.r>r2
D.无法判定
4.对于线性相关系数r,叙述正确的是(
A.r∈(-,+o),且r越大,相关程度越大
B.r∈(-∞,+∞),且Irl越大,相关程度
C
D
越大
2.已知x与y之间的一组数据:
C.r∈[-1,1],且r越大,相关程度越大
01
D.r∈[-1,1],且rl越大,相关程度越大
2
5.正常情况下,年龄在18岁到38岁的人,体重y
若y与x线性相关,则y与x的回归直线y=
(kg)对身高x(cm)的回归方程为y=0.72x-
58.2,张红同学(20岁)身高为178cm,她的体
bx+a必过
重应该在
kg左右.
A.点(2,2)
B.点(1.5,0)
C.点(1,2)
D.点(1.5,4)
3.如图所示,给出了样本容量均为7的A,B两组
夯基提能作业
请同学们认真完成练案[17]
样本数据的散点图,已知A组样本数据的相关
4.3.2
独立性检验
素养目标定方向
课程标准
学法解读
1.通过2×2列联表统计意义的学习,体会数学抽
1.通过实例,理解2×2列联表的统计意义.
象的素养。
2.通过实例,了解2×2列联表独立性检验及
2.借助x2计算公式进行独立性检验,培养数学运
其应用
算和数据分析的素养.
087
必备知识探新知
知识点一2×2列联表
(1)定义:如果随机事件A与B的样本数据整理成如下的表格形式
A
总计
B
b
a+b
B
c
d
c+d
总计
a+c
b+d
a+b+c+d
因为这个表格中,核心数据是中间4个格子,所以这样的表格通常称为
思考:若X<k成立,
2×2列联表。
则说明事件A与B无
(2)x2计算公式:X=
,其中n=
关,对吗?
知识点二独立性检验
(1)任意给定一个α(称为
通常取为0.05,0.01等),可以
找到满足条件P(X≥)=α:的数k(称为显著性水平α对应的
),
就称在犯错误的概率不超过
的前提下,可以认为A与B不独立(也
称为A与B有关);或说有
的把握认为A与B有关.若X<k成立,
就称不能得到前述结论.这一过程通常称为独立性检验,
(2)统计学中,常用的显著性水平α以及对应的分位数k如表所示.
a=P(X≥k)
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
D[思考]
关键能力
攻重难
●题型探究
题型一由X进行独立检验
例某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务
给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
n(ad-be)2
附:x=(a+b)(c+d)(a+c)(b+d)
P(X2≥k)
0.050
0.010
0.001
3.841
6.635
10.828
088
[分析]((1)根据列联表,用频率代替概率,可分别估计男、
女顾客对该商场服务满意的概率;(2)求出X的值,与临界值表对
比可得结论,
规律方法:
解决独立性检验问题的基本步骤
认真读题,根据相关数据列
列表
·[规律方法]
出2×2列联表
》对点训练1
将2x2列联表中的数据代入
计算
2024年春季,某出租汽车公司决定更换一批小汽车以代替原
公式求X2的值
来报废的出租车,现有A,B两款车型的使用寿命(单位:年)频数
将求得的X2的值与临界值
比较
表如下:
进行比较
使用寿命/年
6
7
8
总计
结论→由比较结果得出相应结论
A型出租车/辆
10
20
45
25
100
B型出租车/辆
15
35
40
100
(1)填写下表,并判断是否有99%的把握认为出租车的使用
寿命与汽车车型有关;
使用寿命
使用寿命不
总计
不高于6年
低于7年
A型
B型
总计
(2)司机师傅小李准备在一辆开了4年的A型车和一辆开了
4年的B型车中选择,为了尽最大可能实现3年内(含3年)不换
车,试通过计算说明,他应如何选择
●089
题型二独立性检验的综合应用
例2为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问
卷调查,得到了如下的2×2列联表:
喜爱打篮球
不喜爱打篮球
合计
男生
6
女生
0
合计
48
已知在全斑48人中随机辑取1人,抽到客爱打釜球的学生的概率为号
(1)请将上面的2×2列联表补充完整(不用写计算过程);
(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别
有关?说明你的理由;
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为
规律方法:
X,求X的分布列与均值,
1.检验两个变量是否
[分析](1)由古典概型的概率求得2×2列联表.
相互独立,主要依据
(2)计算X,判断P(X2>3.841)=0.05是否成立.
是计算X2的值再利
用该值与分位数飞进
(3)结合超几何分布求解
行比较作出判断.
2.X2计算公式较复
杂,一是公式要清楚;
二是代入数值时不能
张冠李戴;三是计算
时要细心
3.统计的基本思维模
式是归纳,它的特征
[规律方法]
之一是通过部分裁据
的性质来推测全部裁
》对点训练2
据的性质,因此,统计
(2024·全国甲卷理科)某工厂进行生产线智能化升级改造,升级改造
推断是可能犯锆误
后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
的,即从数据上体现
优级品
合格品
不合格品
总计
的只是统计关系,而
甲车间
26
24
0
50
不是因果关系
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
090
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲,
乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率p=0.5,设p为升级改造后抽取的n件产品的优级
品率.如果p>p+1.65
(1-卫,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的
n
数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(√150≈12.247)
n(ad-be)2
附:K=(a+b)(c+d)(a+c)(b+d
P(K2≥k)
0.050
0.010
0.001
3.841
6.635
10.828
●易错警示
没有准确掌握公式中参数的含义致误
例3.有甲,乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列
联表
班级与成绩列联表
优秀
不优秀
总计
甲班
10
35
45
乙班
>
38
45
总计
17
73
90
试问能有多大把握认为“成绩与班级有关系”?
[错解]
由公式得X_90×(10x7-35×38)
17×73×45×45
=5686,
56.86>6.635所以有99%的把握认为“成绩与班级有关系”.
[辨析]由于对2×2列联表中α,b,c,d的位置不清楚,在代入公式时代错了数值导致计算结
果的错误。
[正解]
[点评]独立性检验中,参数X公式复杂计算量大,要弄清公式特点熟记公式,小心计算避免
粗心致误
091
课堂检测
固双基
1.通过随机询问110名性别不同的大学生是否4.利用独立性检验对事件A和B是否有关进行
爱好某项运动,得到如下的列联表:
研究时,若有99%的把握认为事件A和B有
男
女
总计
关,则计算出的X的取值范围是
爱好
40
20
60
P(X≥k)
0.050
0.010
0.001
不爱好
20
30
50
k
3.841
6.635
10.828
总计
60
50
110
A.X2≥6.635
B.X2<6.635
经计算得X=
110×(40×30-20×20)2
C.X≥3.841
D.X2<3.841
60×50×60×50
5.某企业有2个分厂生产某种零件,为了研究两
7.8.
个分厂生产零件的质量是否有差异,随机从2
则正确的结论是
(
个分厂生产的零件中各抽取了500件,具体数
A.在犯错误的概率不超过0.1%的前提下,认
据如表所示:
为“爱好该项运动与性别有关”
甲广
B.在犯错误的概率不超过0.1%的前提下,认
乙厂
总计
优质品
360
320
680
为“爱好该项运动与性别无关”
非优质品
140
180
320
C.有99%以上的把握认为“爱好该项运动与
总计
500
500
1000
性别有关”
根据表中数据得
D.有99%以上的把握认为“爱好该项运动与
性别无关”
X-1000x360×180-320x140)2≈7.353.
680×320×500×500
2.一个2×2列联表如下:
从而断定两个分厂生产零件的质量有差异,那
y
总计
么这种判断出错的最大可能性为
1
a
35
子
附:
7
6
之
P(X≥k)
0.1
0.05
0.01
0.001
总计
m
73
k
2.706
3.841
6.635
10.828
则表中m,n的值分别是
(
A.10,38
B.17,45
C.10,45
D.17,38
3.下列关于X的说法中正确的是
(
AX越大,“事件A,B有关”的可信度越小
BX越大,“事件A,B无关”的可信度越大
CX越小,“事件A,B有关”的可信度越小
夯基提能作业
请同学们认真完成练案[18
D.X越小,“事件A,B无关”的可信度越小