内容正文:
由样本方差计算总体方差公式,得总
方差为s2=
{10×7+(56
10+20
62)2]+20×[4+(65-62)2]}=23.
聚焦学科素养
题目呈现1ABD2024年第一季度全市
居民人均消费支出为2084十453十
1435+356+791+583+528+163=
6393(元),故A正确;易知居住及食品
烟酒两项的人均消费支出总和为
2084+1435=3519(元),占总人均
消竟支出的3519
×100%≈55.0%>
6393
50%,故B正确:依题意可得2023年第
一季度城乡居民人均消费支出的差额
为79244388」
1.0441.078≈3520(元),2024年
第一季度城乡居民人均消费支出的差
额为7924-4388=3536(元),由于
3520<3536,故C错误;医疗保健与
教育文化娱乐两项人均消费支出总和
占总人均消费支出的528+791
×100%≈
6393
20.6%,故D正确.故选ABD
题目呈现2AB亲子阅读占比71.08%,
为最大,A正确:由于71.08%十
52.66%-1=23.74%>20%,B正
确;题图中各类亲子活动占比的中位数
为
27.77%+40.14%
=33.955%,
2
C错误:题图中10类亲子活动占比的
极差为71.08%-13.32%=57.76%,
D错误.故选AB.
题目呈现3D①由题图可得这13个月
的PMI的最大值为52.6%,最小值为
47.0%,所以极差为52.6%一47.0%
5.6%,故①正确;②由题图可得2023
年1月到2023年3月的PMI分别为
50.1%,52.6%,51.9%,均大于50%,
故②正确:③从2023年1月到2023年
7月的PMI的值从小到大排列为48.8%,
49.0%,49.2%,49.3%,50.1%,51.9%,
52.6%,因为7×75%=5.25,所以这
7个月的PMI的第75百分位数为第六
个数51.9%,故③正确:④2023年7月
的PMI为49.3%,6月的PMI为
49.0%,所以比上月上升0.3个百分点,
故④正确.所以正确的个数为4.故选D.
题目呈现4C由题图可知,2024年母
亲周末陪伴孩子日均时长超过8小时
的占比为38.7%>3,A说法正确,
2024年父亲周末陪伴孩子日均时长超
过6小时的占比为31.5%+24.2%=
55.7%>2,B说法正确:2024年母亲
周末陪伴孩子日均时长的5个时段占
比的极差为38.7%一2.5%=36.2%,
C说法错误;2024年父母周末陪伴孩子
日均时长的10个时段占比的中位数为
21.4%十19.0%
=20.2%,D说法正
2
确.故选C.
题目呈现5D2021一2024年该国星级
酒店数量依次为8920,8423,7676,
7337,逐年减少,故A正确:2021—2024
年该国星级酒店营业收入最高为
1907.77亿元,故B正确:2021一2024
年该国星级酒店餐饮收入比重最高的
是2022年,故C正确:2021一2024年该
国星级酒店餐饮收入比重的极差是
41.63%一38.19%=3.44%,故D错
误.故选D.
9.9
成对数据的统计分析
》回顾·必备知识《
知识梳理
1.(1)有关系(2)增加减小
(3)一条直线
2.(2)正相关负相关(3)强
弱
3.(2)预测值
4.(2)是否独立
基础检测
1.(1)/(2)×(3)X
2.y=c·dr(c,d>0)
解析:根据散点图判断,用y=c·
d严(c,d>0)的拟合效果更好.
3.97.5
解析:由已知可得X2=6.109
5.024,所以市政府断言市民收入增减
与旅游需求有关的可信度是97.5%.
4.12
解析:设被调查的男性人数为k,依题
意,得2×2列联表如下:
足球
性别
合计
喜爱
不喜爱
5k
男性
k
6
6
女性
2k
4k
2k
3
3
合计
3k
3k
3k
2
2
4k
6
则X”=
3
6
3k 3k
k·2k·2
·2
,因为本次调查得出“在犯错误的概
2k
率不超过0.005的前提下认为喜爱足
球与性别有关”的结论,于是X≥
7.879,即2
≥7.879,解得k≥11.8185,
而k=61,m∈N,因此km=12.
5.BC对于A,样本相关系数r的绝对
值越大,则成对样本数据的线性相关
程度越强,故A错误:对于B,经验回归
直线一定经过点(x,y),故B正确;对
于C,决定系数R的值越接近1,则经
验回归方程拟合效果越好,故C正确;
对于D,残差平方和越小,表示经验回
归方程拟合效果越好,故D错误.故
选BC.
》提升·关键能力《…
例1D第一个散,点图中的,点是从左下
角区域分布到右上角区域,则是正相
关:第三个散点图中的点是从左上角
区域分布到右下角区域,则是负相关;
第二个散点图中的点的分布没有什么
规律,则是不相关,所以应该是
①③②.故选D.
对点训练1A由题中散,点图可以看
出,题图1和题图3是正相关,样本相
关系数大于0,题图2和题图4是负相
关,样本相关系数小于0,题图1和题图
2的,点相对更加集中,所以线性相关性
更强,所以r1更接近1,r2更接近一1,由
此可得r2<r1<0<r3<r1.故选A
例2(1)C因为沿海地区气温和海水表
层温度相关,且样本相关系数为正数,
故随着沿海地区气温由低到高时,海
水表层温度呈上升趋势,故选C
(2)B残差图越宽,说明模型的拟合
效果越差,故A错误;残差平方和越
小,说明模型的拟合效果越好,故B正
确;决定系数R2越小,说明模型的拟合
效果越差,故C错误:样本相关系数”
的绝对值越大,两个变量的线性相关
性越强,故D错误.故选B.
对点训练2(1)DR越大,则回归模型
的拟合效果越好,因为0.56>0.45>
0.23>一0.79,所以拟合效果最好的是
模型丁.故选D.
(2)BD由r越接近1,数据的线性
相关关系越强知,A错误,B正确:由残
差平方和越小,则数据的线性回归模
型拟合效果越好知,C错误;由决定系
数越大,则数据的线性回归模型拟合
效果越好知,D正确.故选BD.
例3解:(1)由统计图的数据,可得x
2士3+4十6+8+10+8-5≈7,
y=18+22+31+42+50+56+58-
7
222≈39:
7
又由∑(x,-x)(y,-y)=395,
∑x,-=97,
所以6-
≈4,a=y-bx≈39-
4×7=11,
所以y关于x的经验回归方程为y=
4x+11.
(2)由统计图中的数据以及(1)中的经
验回归方程,可得统计表如下:
x
2
3
4
6
81013
y
13
22
37
42
50
56
58
19
23
27
35
51
63
残差一
6
-5
所以该组数据残差的平方和为(一6)+
(-1)2+42+72+72+52+(-5)2=
201.
对点训练3解:(1)由表中数据可知,
x-
5×(1+2+3+4+5)=3,y=
5×(3+7+9+10+11)=8
∑(x,-x)2=10,∑0y,-y)2=
=1
i=1
40,∑(x,-元)(y,-)=19,
i=1
则x=
∑(x,-x)(0y,-
=1
(y,-y)
N=1
19
=0.95>0.75,
√10×2√/10
故研发投入与产品收益的相关程度
较强.
参考答案505
22(x,-)=10.
=1
x)(y,-y)=19,
19
则6=10=1.9,8=8-1.9×3=23,
故y=1.9x十2.3,
17≈9.3
令1.9r+2.3>20,解得x>
故研发投入至少9.3亿元.
例4解:(1)由散点图可以判断,随平均
温度升高,平均产卵数增长速度变快,
符合指数函数模型的增长,
所以y=ce更适合作为平均产卵数
y关于平均温度x的回归模型,
(2)将y=cer两边同时取自然对数,
可得lny=lnc十dx,又之=lny,则
关于x的经验回归方程为之=lnc十dz,
由题中的数据可得∑x,一7江
=1
33.6,∑(x,-x)=∑x-72
7=1
112,
x2,-z
所以d=
i=1
33.6
∑x-
112
i=1
0.3,则lnc=-dx=3.6-0.3×
27=-4.5,
所以之关于x的经验回归方程为交
0.3x一4.5,故y关于x的经验回归方
程为y=e-1s
对点训练4解:(1)令之=bi十a,而i=
12=5.5,2=0∑2,=1,28,
10-1
iz4-10i
则b=
2-107
60-10×5.5×1.28
≈-0.13,=
385-10×5.52
-bi=1.28+0.13×5.5≈2.00,
因此之=2-0.13i,即y=e2-0.13,
所以所求经验回归方程为y=e21」
(2)由(1)知,y=e2-o131<0.08,即2
0.13i<1n0.08,解得i>2-ln0.08≈
0.13
34.85,
所以i=35,即在新房装修完第35天
开始达到此标准.
第一章
集合、常用逻辑
用语与不等式
训练1集合
1.C由题意得A∩B={0,1}.故选C.
2.C由题意得MUN={x-3<
x<4}.故选C
506红对构·讲与练·高三数学·
例5(1)A在判断两个分类变量之间是
否有关联时,需要判断假定关系H。:
P(Y=1X=0)=P(Y=1X=1)
是否成立,通常称H。为零假设或原假
设,零假设H。:分类变量X和Y独立
故选A.
(2)B独立性检验取决于样本,X2来
确定是否有把握认为“两个分类变量”
有关系,样本不同,所得结果会有差
异,不会犯错误的说法太绝对,A错误;
用X独立性检验推断的每个结论都会
犯随机性错误,B正确;根据普查数据,
我们可以通过相关的比率给出准确回
答,不需要用X2独立性检验,依据小概
率值推断两个分类变量的关联性,所
以X独立性检验的方法不适用于普查
数据,C错误;对于不同的小概率值,结
论可能不相同,D错误.故选B.
对点训练5(1)DX2
n(ad-bc)
《a士b(c十d)(a+c)(6+0,则分
类变量X和Y有关系时,ad与bc差距
会比较大,由
a+b c+d
三
ac+ad-ac-bc
ad-bc
(a+b)(c+d)
(a+b)(c+d)
故。千6与。十a的值相差应该大,即
a
c
a+b c+d
的大小可以判断X,Y
之间有无关系,故选D.
(2)AC对于A,饭前服药的100名患
者中,药效强的有80人,所以频率为
4
,故A正确;对于B,饭前服药的有
20人药效弱,饭后服药的有70人药效
弱,所以药效弱的有90名患者,饭后服
药的频率为子,故B错误:时于C,D,因
为X”=
200×(80×70-20×30)
100×100×110×90
5000
99
≈50.505>6.635,故在犯错误
的概率不超过0.01的条件下,可以认
为这种药物饭前和饭后服用的药效有
差异,故C正确,D错误.故选AC.
例6(1)21
解析:由题意得X=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
100[(60-m)(40-m)-(m-10)(m+10)]2
50X50X70×30
(2500-100m)
-,并令X2=
30×50×35
练习手册
3.D由题意可得,A∩B={x1<
x3}.故选D
4.D由题意得B={xlog2x<1}=
(0,2),A∩B有2个子集,∴A∩B
中的元素个数为1,1∈A∩B,
a任A∩B,即a任B,a≤0或
a≥2,即实数a的取值范围为(一∞,
0]U[2,十o∞).故选D.
基础版
(2500-100m)
3.841,即(2500
30×50×35
100m)2<201652.5,近似解得
-4502500-100m450,即
20.5<m29.5,注意到m≤25
m∈N”,故m的最小值为21.
(2)解:①由所给数据,得该市一天的
空气质量等级为1,2,3,4的概率的估
计值如下表:
空气质量等级1
23
4
概率的估计值0.430.270.210.09
②一天中到该公园锻炼的平均人次的
估计值为10
×(100×20+300×35+
500×45)=350.
③根据所给数据,可得2×2列联表如下
项目
人次≤400人次>400
空气质量好
33
37
空气质量不好
22
8
根据列联表得
X”=
100×(33×8-22×37)2
55×45×70X30
5.820>3.841.
故有95%的把握认为一天中到该公园
锻炼的人次与该市当天的空气质量
有关
对点训练6解:(1)试验组样本平均数为
20×(7.8+9.2+11.4+12.4+13.2+
15.5+16.5+18.0+18.8+19.2+
19.8+20.2+21.6+22.8+23.6
23.9+25.1+28.2+32.3+36.5)=
396
20=19.8.
(2)(1)依题意,可知这40只小白鼠体
重的增加量的中位数是将两组数据合
在一起,从小到大排序后第20位与第
21位数据的平均数,由原数据可得第
20位数据为23.2,第21位数据为23.6,
所以m=
23.2+23.6
=23.4,故列联
2
表为
项目
m
≥m
对照组
6
14
试验组
14
6
(i)由(i)可得X
40×(6×6-14×14)
=6.4>3.841,
20×20×20×20
所以能有95%的把握认为小白鼠在高
浓度臭氧环境中与在正常环境中体重
的增加量有差异.
5.C因为A={1,4},B={一1,2},当
a=1,b=-1时,x=b2-a=0,当
a=1,b=2时,x=b2-a=3,当a=
4,b=一1时,x=b2-a=-3,当
Q=4,b=2时,x=b2-a=0,所以
A☒B={0,-3,3},故A☒B中的元
素个数为3.故选C.
6.D因为A={xx2-2x-3<0=
{z-1<x<3,故CRA=(-o∞,第九章概率与统计
253
C.2024年母亲周末陪伴孩子日均时长的5个
A.2021一2024年该国星级酒店数量逐年
时段占比的极差为28.8%
减少
D.2024年父母周末陪伴孩子日均时长的10
B.2021一2024年该国星级酒店营业收人最高
个时段占比的中位数为20.2%
不超过2000亿元
学生试答:
C.2021一2024年该国星级酒店餐饮收入比重
最高的是2022年
第
D.2021一2024年该国星级酒店餐饮收入比
重的极差是1.54%
章
学生试答:
【题目呈现5】如图为2021一-2024年某国星
级酒店数量、营业收入及餐饮收入比重,根据该
图,下列结论错误的是
(
)
10000
.41.63%
+42009%
.41.13%
8423
41.00%
39.3%
40.009%
67
39.00%
38.19%
337
38.0%
1907.71
1221.53
379.4
1177.68
37.00%
》温馨提示
36.00%
2021
2022
2023
2024
学习至此,请完成训练66
☐星级酒店营业收入亿元
门星级酒店数量/家
一餐饮收入比重/%
9.9
成对数据的统计分析
考试
1.了解样本相关系数的统计含义.2.理解一元线性回归模型和2×2列联表,会运用这些方法解决简单
要求
的实际问题。
回顾>必备知识
》知识梳理《
(2)当r>0时,称成对样本数据
;当
1.变量的相关关系
r<0时,称成对样本数据
(1)相关关系:两个变量
,但又没有确
(3)r≤1;当|r|越接近1时,成对样本数据
切到可由其中的一个去精确地决定另一个的程
的线性相关程度越
;当|r|越接近0
度,这种关系称为相关关系.
时,成对样本数据的线性相关程度越
(2)正相关、负相关:从整体上看,当一个变量的值
3.一元线性回归模型
增加时,另一个变量的相应值也呈现
(1)我们将y=bx十a称为Y关于x的经验回
的趋势,就称这两个变量正相关;当一个变量的
值增加时,另一个变量的相应值呈现
的趋势,则称这两个变量负相关.
归方程,其中
(3)线性相关:一般地,如果两个变量的取值呈
x,-)
=1
现正相关或负相关,而且散点落在
附
a =y-bx.
近,我们称这两个变量线性相关。
(2)残差:观测值减去
所得的差称为
2.样本相关系数
残差
∑(x-x)(y,-y)
4.列联表与独立性检验
(1)r=
(1)关于分类变量X和Y的抽样数据的2×2列
空-2-0
联表:
254
红构·讲与练·高三数学·基础版
根据散点图,判断y=bx十a(a,b>0)和y=c·
合计
y=0
Y=1
dr(c,d>0)函数模型中,
模
X=0
型的拟合效果更好,
a
b
a+b
3.(教材改编题)某市政府调查市民收入增减与旅
X=1
d
c+d
游需求的关系时,采用独立性检验法抽查了
合计
a+c
b+d
n=a+b+c+d
5000人,计算发现X=6.109,根据这一数据,
九
(2)计算X2
n (ad-bc)2
市政府断言市民收入增减与旅游需求有关的可
(a+b)(c+d)(a+c)(b+d)'
信度是
%
利用X2的取值推断分类变量X和Y
附:
的方法称为X2独立性检验.
0.1
0.05
0.01
0.005
0.001
0.15
0.10
0.05
0.0250.010
0.001
2.706
3.841
6.635
7.879
10.828
2.0722.7063.841
5.0246.635
10.828
○常用结论与知识拓展
4.(教材改编题)为了解喜爱足球是否与性别有
1.经验回归直线一定经过点(x,y).
关,随机抽取了若干人进行调查,抽取女性人数
是男性的2倍,男性喜爱足球的人数占男性人
xy:一n.xy
2.求b时,常用公式b=
x-n
数的骨,女性客爱足球的人数占女性人数的了,
若本次调查得出“在犯错误的概率不超过0.005
3.回归分析和独立性检验都是基于成对样本观测
数据进行估计或推断,得出的结论都可能犯错误.
的前提下认为喜爱足球与性别有关”的结论,则
被调查的男性至少有
人
》基础检测《
1.判断下列命题是否正确,正确的在括号内画
附:X2
n (ad-bc)2
(a+b)(c+d)(a+c)(b+d)
“√”,错误的画“X”,
0.10
0.05
0.01
0.005
0.001
(1)“名师出高徒”可以解释为教师的教学水平
与学生的水平成正相关关系.
()
2.706
3.841
6.6357.879
10.828
(2)经验回归直线y=bx十a至少经过点(x1,
5.(多选题)(教材改编题)已知变量x,y经过随
y1),(x2y2),…,(xmy)中的一个点.(
机抽样获得的成对样本数据为(x1y1),(x2,
(3)两个变量的样本相关系数越小,它们的线性
相关性越弱
y2),…,(xwyn),其经验回归方程为y=bx十
2.(教材改编题)已知关于(x,y)的一组有序数对
a,下列说法正确的是
(
分别为(1,6),(2,11),(3,21),(4,34),(5,66),
A.若样本相关系数r的值越大,则成对样本数
(6,101),(7,196),对应的散点图如下
据的线性相关程度越强
200
180
B若元=∑x,y=1∑y,则点(y)一
n
n
160
140
定在经验回归直线y=bx十a上
120
100
C.决定系数R的值越接近1,表示经验回归方
60
程拟合效果越好
40
D.残差平方和越大,表示经验回归方程拟合效
20
0
果越好
第九章
概率与统计
255
提升>关键能力
考点1成对数据的统计相关性
A.r2<r<r3<r
B.r4<r2<r3<r1
命题角度1依据散点图进行相关性的判断
C.r4<r2<r1<r3
【例1】两个变量的相关关系有①正相关,②负
D.r2<r4<r1<r3
第
相关,③不相关,则下列散点图从左到右分别
命题角度2
依据样本相关系数、决定系数、残差
九
反映的变量间的相关关系是
判断相关性
章
【例2】(1)(2024·上海卷)已知沿海地区气温和
海水表层温度相关,且样本相关系数为正数,
0
0
对此描述正确的是
(
A.①②③
B.②③①
A.沿海地区气温高,海水表层温度就高
C.②①③
D.①③②
B.沿海地区气温高,海水表层温度就低
学生试答:
C.随着沿海地区气温由低到高,海水表层温度
呈上升趋势
D.随着沿海地区气温由低到高,海水表层温度
呈下降趋势
(2)在线性回归模型中,能说明模型的拟合效
果越好的是
(
A.残差图越宽
B.残差平方和越小
规律总结
C.决定系数R2越小D.样本相关系数r越大
依据散点图判断相关性的基本策略:①观察点
学生试答:
的分布趋势,若点的分布从左下角到右上角,两个变
量正相关;点的分布从左上角到右下角,两个变量负
相关.②观察点的分布状态(形状),若点的分布成
密集型带状区域且带状区域越“狭窄”,线性相关性
越强:反之,线性相关性越弱.
【对点训练1】对四组数据进行统计,获得如下散
规律总结
点图,将四组数据相应的样本相关系数进行比
1.根据样本相关系数r判断相关性:当r>0
较,正确的是
(
)
时,正相关;当r<0时,负相关;r|越接近1,线性
25
25
相关性越强。
20
20
2.根据决定系数R来刻画拟合效果:决定系数
15
10
10
5
R2=1
越接近1,一元线性回归模型
0510152025
0510152025
样本相关系数r
样本相关系数r
∑(y-)
=
图1
图2
25
25·
的拟合效果越好,即R越大,说明模型拟合的效果
20
15
越好
15
3.根据残差来刻画拟合效果:在回归分析中,对
一组给定的样本数据(x1y1),(x2y2),,(xm,
0510152025
0510152025
y)而言,若残差平方和越大,则模型的拟合效果越
样本相关系数
样本相关系数,
差;反之,则模型的拟合效果越好」
图3
图4
256对沟·讲与练·高三数学·基础版
【对点训练2】(1)某团队尝试用回归模型甲、乙、
∑xy,-nry
丙、丁描述人的1000米跑步成绩与肺活量的
=1
,a =y-bx.
关系,已知模型甲、乙、丙、丁对应的决定系数
R2分别为-0.79,0.23,0.45,0.56,则拟合效
学生试答
果最好的模型是
第
A.甲B.乙
C.丙
D.丁
(2)(多选题)对两组线性相关成对数据进行回
章
归分析,得到不同的统计结果,第一组和第二
组成对数据的样本相关系数、残差平方和、决
定系数分别为r1,S,R和r2,S,R,则
A.若r1>r2,则第一组成对数据的线性相关
关系比第二组的强
B.若r>r,则第一组成对数据的线性相关
关系比第二组的强
C.若S<S,则第二组成对数据的线性回归
模型拟合效果比第一组的好
D.若R<R?,则第二组成对数据的线性回归
模型拟合效果比第一组的好
规律总结
考点2回归模型及应用
1.经验回归方程的重要应用是进行估计.
命题角度1一元线性回归模型
2.牢记求经验回归方程的步骤:第一步,列表;第
【例3】某公司过去七年在芯片技术上的研发投
二步,计算正,∑x,∑x或∑(,-)(y
入x(单位:亿元)与收益y(单位:亿元)的数
据统计如图所示
y),∑(x-x);第三步,代入公式求6,再利用a
↑收益亿元
7
y一bx求a:第四步,写出经验回归方程.
60
(13,58)
.
8,50)10,56)
0
【对点训练3】某中医药企业根据市场调研与模
0
(4,31).6,42)
拟,得到研发投入x(单位:亿元)与产品收益
20
(3,22)
10
(2,13)
y(单位:亿元)的数据统计如下:
012345678910111213研发投入/亿元
研发投入x/亿元
12345
(1)由折线图可知y与x的关系可以用一元线
产品收益y/亿元
3791011
性回归模型拟合,请根据折线图的数据,求出y
关于x的经验回归方程;(数据均保留整数)
(1)计算x,y的样本相关系数r,并判断是否
(2)利用(1)中经验回归方程,求折线图中数据
可以认为研发投人与产品收益具有较强的线
残差的平方和.
性相关程度;(若0.3<r<0.75,则线性相
关程度一般;若|r>0.75,则线性相关程度
附:经验回归直线y=bx十a中,斜率和截距的
较强)
最小二乘估计公式分别为
(2)求出y关于x的经验回归方程,并预测若
6
想收益超过20亿元,则需研发投入至少多少亿
元.(结果保留一位小数)
参考公式:经验回归直线y=bx十a中,斜率和
第九章概率与统计
257
截距的最小二乘估计公式、样本相关系数r的
参考数据(x=lny)
Gy
公式分别为b=
,a=y
∑x,y
∑x
=
i-
5215
17713
714
27
81.33.6
x-)(y.-
(1)根据散点图判断y=bx+a与y=ce(其
ba,r
中e=2.718…为自然对数的底数)哪一个更适
第
空x,-∑,-可
九
合作为平均产卵数y(单位:个)关于平均温度
章
x(单位:℃)的回归模型;(给出判断即可,不
参考数据:∑(x,-x)2=10,∑(0,-)2
必说明理由)
40,22,-x)y,-)=19.
(2)由(1)的判断结果及表中数据,求出y关于
x的经验回归方程.(计算结果精确到0.1)
附:经验回归直线y=bx十a中,斜率和截距的
最小二乘估计公式分别为
6
2x,-0y,-y
∑xy,-ny
=
=1
-a
a=y-bx,
幻学生试答
命题角度2非线性回归模型
【例4】红蜘蛛是柚子的主要害虫之一,能对柚子
树造成严重伤害,每只红蜘蛛的平均产卵数
y(单位:个)和平均温度x(单位:℃)有关,现
·规律总结
收集了以往某地的7组数据,得到下面的散点
对于非线性回归模型的处理策略:①基本的解
图及一些统计量的值.
题思想是转化与化归思想,即将“非线性”模型转化
↑平均产卵数/个
400L
为“线性”模型;②观察题目中参考数据的“形式特
350
征”,结合题目所给拟合函数的特征分析,通常采用
300
的方法是“换元法”和“取对数法”等
250
200
【对点训练4】某人新房刚装修完,为了监测房屋
150
100
内空气质量的情况,每天在固定的时间测一次
50
甲醛浓度(单位:mg/m3),连续测量了10天,
202224262830323436平均温度x/℃
将所得数据绘制成散点图如下:
258亿对构·讲与练·高三数学·基础版
↑甲醛浓度y/(mgm)
考点3列联表与独立性检验
命题角度1独立性检验的基本原理
【例5】(1)对分类变量X和Y进行独立性检验的
零假设为
()
012345678910天数i
A.H。:分类变量X和Y独立
用y,表示第i(i=1,2,…,10)天测得的甲醛
B.H。:分类变量X和Y不独立
九
浓度,令,=lny,经计算得之=12.8,
C.H:P(Y=1|X=0)≠P(Y=1|X=1)
D.H。:分类变量X和Y相关联
=85,i=60.
(2)下列关于X独立性检验的说法正确的是
()
(1)由散点图可知,y与i可用指数型回归模型
A.用X2独立性检验推断的结论可靠,不会犯
进行拟合,请利用所给条件求出经验回归方
错误
程;(系数精确到0.01)
B.用X2独立性检验推断的结论可靠,但会犯
(2)已知房屋内空气中的甲醇浓度的安全范围
随机性错误
是低于0.08mg/m3,则根据(1)中所得回归模
C.X2独立性检验的方法适用于普查数据
型,该新房装修完第几天开始达到此标准?
D.对于不同的小概率值α,用X独立性检验推
(参考数据:ln0.08≈-2.53)
断的结论相同
附:经验回归直线y=bx十a中,斜率和截距的
学生试答:
最小二乘估计公式分别为
∑x,-ny
2x-
规律总结
a =y-bx.
1.独立性检验的基本原理是根据观测值与期望
值的差异的大小作出推断,这种差异由X2统计量进
行刻画,其大小的标准根据推理有关联时犯错误的
概率确定.
2.独立性检验的依据是小概率原理,即小概率
事件在一次试验中几乎不可能发生.在零假设成立
的条件下,若一个不利于零假设的小概率事件在一
次试验中发生了,则有理由拒绝零假设;若在一次试
验中,此小概率事件没有发生,则没有充足的理由拒
绝零假设,通常会接受零假设.
【对点训练5】(1)在下列两个分类变量X,Y的
样本频数列联表中,可以判断X,Y之间有无关
系的是
Y
X
合计
Y-Y
Y-Y2
X=X
a
b
a+b
X=X2
d
c+d
合计
a+c
b+d
a+b+c+d
第九章
概率与统计259
阅读大会的评价有差异,则m的最小值为
A.
c.
b
a c
n(ad-bc)2
a+b c+d
D.
atb c+d
附:X2=
(a+b)(c+d)(a+c)(6+d其中
(2)(多选题)某制药公司为了研究某种治疗高
n=a+b+c+d.
血压的药物在饭前和饭后服用的药效差异,随
0.10
0.05
0.005
机抽取了200名高血压患者开展试验,其中
2.706
3.841
7.879
九
100名患者饭前服药,另外100名患者饭后服
药,随后观察药效,将试验数据绘制成如图所
(2)(2020·全国Ⅲ卷)某学生兴趣小组随机调
示的等高堆积条形图,已知X2=
查了某市100天中每天的空气质量等级和当天
n(ad-bc)2
到某公园锻炼的人次,整理数据得到下表(单
(a+b)(c+d)(a+c)b+d,且P(X2≥
位:天)
6.635)=0.01,则下列说法正确的是(
锻炼人次
人数
空气质量等级
100
0,200
(200,400]
(400,600
80H
1(优)
2
16
25
60
口药效弱
2(良)
5
10
12
40
口药效强
20H
3(轻度污染)
6
2
8
0
饭前饭后
4(中度污染)
7
2
0
A饭前服药的患者中,药效强的频率为青
①分别估计该市一天的空气质量等级为1,2,
3,4的概率
B.药效弱的患者中,饭后服药的频率为
7
②求一天中到该公园锻炼的平均人次的估计
值.(同一组中的数据用该组区间的中点值为
C.在犯错误的概率不超过0.01的条件下,可
代表)
以认为这种药物饭前和饭后服用的药效有
③若某天的空气质量等级为1或2,则称这天
差异
“空气质量好”;若某天的空气质量等级为3或
D.在犯错误的概率不超过0.01的条件下,不
4,则称这天“空气质量不好”.根据所给数据,
能认为这种药物饭前和饭后服用的药效有
完成下面的2×2列联表,并根据列联表,判断
差异
是否有95%的把握认为一天中到该公园锻炼
命题角度2独立性检验的实际应用
的人次与该市当天的空气质量有关,
【例6】(1)某市举行了首届阅读大会,为调查市
项目
人次≤400
人次>400
民对阅读大会的满意度,相关部门随机抽取
空气质量好
男、女市民各50名,每位市民对大会给出满意
空气质量不好
或不满意的评价,得到下面列联表:
评价
附:X2=
n(ad-bc)2
性别
合计
a+b)c+dDa+c)6+)其中
满意
不满意
n=a+b+c+d.
男
60-m
m-10
50
a
0.05
0.01
0.001
女
50
3.841
6.635
10.828
m+10
40-m
合计
70
30
100
学生试答
当m≤25,m
N时,若在a=0.05的情
况下,我们没有充分的证据推断男、女市民对
260沟·讲与练·高三数学·基础版
试验组的小白鼠体重的增加量从小到大排
序为
7.8
9.211.412.413.215.5
16.518.018.819.219.820.2
21.622.823.623.925.128.2
32.336.5
(1)计算试验组的样本平均数;
章
(2)(ⅰ)求40只小白鼠体重的增加量的中位
数m,再分别统计两样本中小于m与不小于m
的数据的个数,完成如下列联表:
项目
≥m
对照组
试验组
(ⅱ)根据(ⅰ)中的列联表,能否有95%的把
规律总结
1.在2×2列联表中,如果两个变量没有关系,
握认为小白鼠在高浓度臭氧环境中与在正常
则应满足ad一bc≈0;|ad-bc|越小,说明两个变
环境中体重的增加量有差异?
量之间关系越弱;ad一bc|越大,说明两个变量之
附:X2=
n(ad-be)2
间关系越强
(a+b)(c+d)(a+c)(b+d)
2.解决独立性检验的应用问题,一定要按照独
0.100
0.050
0.010
立性检验的步骤得出结论.独立性检验的一般步骤:
2.706
3.841
6.635
(1)根据样本数据制成2×2列联表.
(2)根据公式X2=
n(ad-bc)2
(a+b)(c+d)(a+c)(6+团计算X,
(3)通过比较X2与临界值的大小关系来作统计
推断.
【对点训练6】(2023·全国甲卷文)一项试验旨
在研究臭氧效应,试验方案如下:选40只小白
鼠,随机地将其中20只分配到试验组,另外20
只分配到对照组,试验组的小白鼠饲养在高浓
度臭氧环境,对照组的小白鼠饲养在正常环
境,一段时间后统计每只小白鼠体重的增加量
(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排
序为
15.218.820.221.322.523.2
25.826.527.530.132.634.3
34.835.635.635.836.237.3
》温馨提示
40.543.2
学习至此,请完成训练67