内容正文:
小题查验
1.C 2.C 3.946
跃升关键能力 考点一
1.C [根据频率分布直方图 得,(0.01+a+b+0.018+
0.012)×10=1,解得a+b=0.06.故选 C.]
2.AC [依题意,(0.015+0.025+0.035+0.005+2a)×
10=1,解得a=0.010,选项 A,∵最高小矩形的中点横
坐标为75,∴众 数 是 75,故 A 正 确.选 项 B,设 样 本 的
71%分位数为x,又10×(0.010+0.015+0.025)=0.5,
∴0.5+(x-70)×0.035=0.71,解得x=76,故B错误.
选项C,平均数为45×0.1+55×0.15+65×0.25+75×
0.35+85×0.1+95×0.05=68.5,故 C正确.选项 D,样
本中得分低于60分的占(0.010+0.015)×10=25%,
∴该校学生中得分低于60分的约占25%,故 D错误.]
考点二
1.D [由小到大排列的结果:6,7,15,36,39,40,41,42,
43,47,49,一共11项.
下四分位数即第25百分位数,由11×25%=275,得下
四分位数是第3项数据15.]
2.A [由直方图得,从左到右的第一、二、三、四小组的频
率分别是010、020、040、030.
第一、二、三 小 组 的 频 率 之 和 为 010+020+040=
070<090,所以第90百分位数处在第四组[80,100]
内,为80+20×0.90-0.701.00-0.70≈93.
]
3.解析:把数据从小到大排序为12,15,24,25,31,32,34,
36,36,37,39,42,48,50共14个数,
14×25%=35,14×75%=105,所以第25,75百分位
数分别是第4,11项数据,即是25,39.
答案:25 39
考点三
[典例1] 解:(1)根据题意有
16+24+x+y+16+14=200,
16+24+x
y+16+14=
3
2
,{
解得 x=80,
y=50,{ ∴p=040,q=025.
补全频率分布直方图如图所示.
(2)根据题意,抽取网购金额在(1,2]内的人数为
24
24+16×5=3
(人).
抽取网购金额在(4,5]内的人数为 1624+16×5=2
(人).
故此2人来自不同群体的概率P=C
1
3C12
C25
=35.
[典例2] [解] (1)x=110
(545+533+551+522+575+
544+541+568+596+548)=552.3,
y=110
(536+527+543+530+560+533+522+550+
576+536)=541.3,
z=x-y=552.3-541.3=11,
zi=xi -yi 的 值 分 别 为:9,6,8,-8,15,11,19,18,
20,12,
故s2=110
[(9-11)2+(6-11)2+(8-11)2+(-8-
11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-
11)2+(12-11)2]=61.
(2)由(1)知:z=11,2 s
2
10=2 6.1= 24.4
,故有z≥
2 s
2
10
,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理
后的橡胶产品的伸缩率有显著提高.
跟踪训练
解:(1)由表中的数据可得:x= 110×
[9.8+10.3+10.0
+10.2+9.9+9.8+10.0+10.1+10.2+9.7]=10.0,
y=110×
[10.1+10.4+10.1+10.0+10.1+10.3+10.6+
10.5+10.4+10.5]=10.3,
s21=
1
10
[(9.8-10.0)2 + (10.3-10.0)2 + (10.0-
10.0)2+(10.2-10.0)2 + (9.9-10.0)2 + (9.8-
10.0)2+(10.0-10.0)2+(10.1-10.0)2+(10.2-
10.0)2+(9.7-10.0)2]=0.036,
s22=
1
10
[(10.1-10.3)2 +(10.4-10.3)2 +(10.1-
10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-
10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-
10.3)2+(10.5-10.3)2]=0.04;
(2)由(1)中的数据可得y-x=10.3-10.0=0.3,
2
s21+s22
10 =2
0.036+0.04
10 =2 0.0076
,
则0.3= 0.09>2 0.0076= 0.0304,
所以可判断新设备生产产品的该项指标的均值较旧设
备有显著提高.
第3节
夯实必备知识 必备知识
一、1.相关关系 3.增加 增加 增加 减少
二、1.正相关 负相关 一条直线 2.相关性 不是
三、2.正相关 负相关 3.(1)[-1,1] |r|≤1 (2)越强
(3)越弱 4.线性相关程度 正负性 程度 越大 越好
七、2.实数 3.{0,1}
八、总数
九、4.χ
2≥xα 不成立 不独立 不超过α χ
2<xα
没有 独立 卡方独立性检验
思考辨析 (1)√ (2)× (3)× (4)√ (5)√ (6)×
小题查验
1.A 2.A 3.C
跃升关键能力 考点一
1.C [由散点图可知身高与体重成正相关.]
2.A [由题意不妨设,z=ky+b(k>0),
∵y=-0.1x+1,∴z=-0.1kx+(k+b),
∵-0.1<0,-0.1k<0,∴x与y负相关,x与z负相关.]
3.AB [x=3,代入ŷ=1.5x+0.5,y=5.
因为重新求得的回归直线l的斜率为1.2,所以正相关.
设新的横坐标的平均值为x′,则(n-2)x′=nx-(1.2+
4.8)=3n-6=3(n-2),x′=3;
纵坐标的平均数为y′,则(n-2)y′=ny-(2.2+7.8)=
ny-10=5n-10=5(n-2),y′=5.
设新的线性回归方程为ŷ=1.2x+b,把(3,5)代入5=
12×3+b,得b=14,
所以新的线性回归方程为ŷ=12x+14.故 A,B正确.
因为斜率 为 12 变 小,所 以 y 的 增 加 速 度 变 慢,故 C
错误.
把x=2代入,得y=38,375-38=-005,故 D 错
误.故选 AB.]
153
参考答案
考点二
1.解:(1)由题 意,得x= 15 ×
(1+2+3+4+5)=3,y=
1
5×
(0.3+0.3+0.5+0.9+1)=0.6,
5
i=1
x2i =1+4+9
+16+25=55.
所以b̂=
5
i=1
xiyi-5xy
5
i=1
x2i-5x2
=11-5×3×0.6
55-5×32
=0.2,
â=y-̂bx=0.6-0.2×3=0,
所以线性回归方程为ŷ=0.2x.
线 性 相 关 系 数 r=
5
i=1
xiyi-5xy
(
5
i=1
x2i-5x2)(
5
i=1
y2i-5y2)
=
11-5×3×0.6
(55-5×32)(2.24-5×0.62)
= 2
4.4
≈0.9524>
0.95,
这说明投资金额x 与所获利润y 之间的线性相关性较
强,用线性 回 归 方 程 ŷ=0.2x 对 该 组 数 据 进 行 拟 合
合理.
(2)若对项目B 投资x′(1≤x′≤6)百万元,则对项目 A
投资(7-x′)百万元,
所以所获得的总利润L=0.16x′-0.49x′+1+0.49+0.2
(7
-x′)= 1.93 - 0.04(x′+1)+0.49x′+1[ ] ≤ 1.93-
2 0.04(x′+1)×0.49x′+1=1.65
,
当且仅当0.04(x′+1)=0.49x′+1
,即x′=2.5时取等号,
(一定要求出等号成立的条件)
所以对A,B 项目分别投资4.5百万元,2.5百万元时,
所获得的总利润最大.
2.解:(1)由 Wi =lgIi,则 D̂ =â+b̂W,由 表 得 b̂=
∑
10
i=1
(Wi-W)(Di-D)
∑
10
i=1
(Wi-W)2
=5.10.51=10.
所以â=D-̂bW=45.7-10×(-11.5)=160.7,所以D
关于W 的回归方程是D̂=10W+160.7.
即D 关于I的回归方程是D̂=10lgI+160.7.
(2)点P的声音能量I=I1+I2,因为
1
I1
+4I2
=1010,
所以I=I1+I2=10-10
1
I1
+4I2( )(I1+I2)=
10-10 5+
I2
I1
+
4I1
I2( ) ≥9×10
-10(当且仅当I2
I1
=
4I1
I2
即I2
=2I1 时等号成立).
根据(1)中的回归方程,点P的声音强度D的预报值:
D̂=10lg(9×10-10)+160.7=10lg9+60.7>60,所以
点P 会受到噪声污染的干扰.
考点三
[典例] 解:(1)580人中体育锻炼时长不小于1小时人数占
比P=42+3+1+137+40+27580 =
25
58
,该地区29000名初中
学生中体育锻炼时长不小于1小时的人数约为29000×2558
=12500人.
(2)该地区初中学生锻炼平均时长约为:
1
580
0.5
2 ×
(5+134)+0.5+12 ×
(44+147)[
+1+1.52 ×
(42+137)+1.5+22 ×
(3+40)
+2+2.52 ×
(1+27)]=2729≈0.9h.
(3)列联表
成绩
时长
时长[1,2) 其他时长
总计
优秀 45 50 95
不优秀 177 308 485
总计 222 358 580
提出零假设 H0:成绩优秀与日均体育锻炼时长不小于1
小时且小于2小时无关.
χ
2=580×
(45×308-177×50)2
95×485×222×358 ≈3.976>3.841.
有95%的把握认为学业成绩优秀与日均体育锻炼时长
不小于1小时且小于2小时有关.
跟踪训练
解:(1)在1000个样本中,超声波检查结果不正常的人
中患有该疾病的频率为180
200=0.9
,
以样本频率估计总体概率,p的估计值为0.9.
(2)H0:超声波检查结果与是否患病无关,
χ
2= n
(ad-bc)2
(a+b)(c+d)(a+c)(b+d)=
1000×(20×20-780×180)2
800×200×200×800 =
12250
16 >10.828
,
概率小概率值α=0.001的独立性检验,应拒绝零假设
H0,即超声波检查结果与是否患病有关.
第九章 第1节
夯实必备知识 必备知识
m+n m×n 独立 依存
思考辨析 (1)× (2)√ (3)√ (4)× (5)√
小题查验
1.D 2.C 3.D 4.480 5.9
跃升关键能力 考点一
1.C [分为以下两类:
第一类,从一个村庄出发向其他三个村庄各修一条路,
共有4种方法;
第二类,一个村最多修两条路,但是象下面这样的两个排列
对应一种修路方法,A-B-C-D,D-C-B-A,要去掉重
复的这样,因此共有有1
2A
4
4=12(种)方法.
根据分类加法计数原理,知道共有4+12=16(种),故
选 C.]
2.C [(1)对子集A 分类讨论.当A 是二元集{1,2},B 可
以为{1,2,3,4},{1,2,4},{1,2,3},{1,2}共4种情况;当
A 是三元集{1,2,3},B 可以取{1,2,4},{1,2}共有2种
情况;当A 是三元集{1,2,4},B 可以取{1,2,3},{1,2},
共有2种情况;当A 是四元集{1,2,3,4},此时B 取{1,
2}有1种情况,根据分类加法加法计数原理得4+2+2
+1=9(种),故 符 合 此 条 件 的“理 想 配 集”有 9 个.故
选 C.]
3.C [由题意知正方形ABCD(边长为3个单位)的周长
是12,
抛掷三次骰子后棋子恰好又回到点A 处表示三次骰子
的点数之和是12,
列举出在点数中三个数字能够使得和为12的有1,5,6;
2,4,6;3,4,5;3,3,6;5,5,2;4,4,4;共有6种组合,
前三种组合1,5,6;2,4,6;3,4,5;又可以排列出 A33=
6(种)结果,
3,3,6;5,5,2;有6种结果,4,4,4;有1种结果.
根据分类加法计数原理知共有24+1=25(种)结果,故
选 C.]
考点二
[典例] [解析] (1)从E 到G 最短路径条数为 C24C29
=18.故选B.
(2)有两个年级选择甲博物馆共有 C26 种情况,其余四个
年级每个年级各有5种选择情况,故有且只有两个年级
选择甲博物馆的情况有 C26×54 种,故选 D.
[答案] (1)B (2)D
253
艺考生文化课百日冲关数学
第3节 成对数据的统计分析
课程标准 核心素养 考情聚焦
1.结合实例,了解样本相关系数的统计含义,了解样本
相关系数与标准化数据向量夹角的关系,会通过相
关系数比较多组成对样本数据的相关性.
2.结合具体实例,了解一元线性回归模型的含义,了解
模型参数的统计意义,了解最小二乘法原理,掌握一
元线性回归模型参数的最小二乘估计方法.
3.针对实际问题,会用一元线性回归模型进行预测.
4.通过实例,理解2×2列联表的统计意义,了解2×2
列联表独立性检验及其应用.
1.相关关系的判断,达
成直观想象和数据
分析的素养.
2.回归方程的求法及
回归分析,增强逻辑
推理、数据分析和数
学运算的素养.
3.独立性检验,增强逻
辑推理、数据分析和
数学运算的素养.
预计 2026年的高考
将以选择题、填空题的形
式考查线性回归系数或利
用线 性 回 归 方 程 进 行 预
测;在给出临界值的情况
下判 断 两 个 变 量 是 否 相
关;在解答题中与频率分
布相结合,考察线性回归
方程的建立及应用和独立
性检验的应用,难度中等
[必备知识]
一、相关关系
1.两个变量有关系,但又没有确切到由其中的一个
去精确 地 决 定 另 一 个 的 程 度,这 种 关 系 称 为
.
2.散点图
将成对样本数据用直角坐标系中的点表示出来,
由这些点组成的统计图叫做散点图.
3.正相关、负相关
如果从整体上看,当一个变量的值 时,
另一个变量的相应值也呈现 的趋势,我
们就称这两个变量正相关;如果当一个变量的值
时,另一个变量的相应值呈现
的趋势,则称这两个变量负相关.
二、线性相关与非线性相关(或曲线相关)
1.线性相关
一般地,如果两个变量的取值呈现 或
,而且散点落在 附近,我
们就称这两个变量线性相关.
2.非线性相关(或曲线相关)
一般地,如果两个变量具有 ,但
线性相关,那么我们就称这两个变量非线性相关或
曲线相关.
三、样本相关系数
1.样本相关系数
对于变量x和变量y,设经过随机抽样获得的成
对样本数据为(x1,y1),(x2,y2),,(xn,yn),其
中x1,x2,,xn 和y1,y2,,yn 的均值分别为
x 和y,记r=
∑
n
i=1
(xi-x)(yi-y)
∑
n
i=1
(xi-x)2 ∑
n
i=1
(yi-y)2
=
∑
n
i=1
xiyi-nxy
∑
n
i=1
x2i-nx2 ∑
n
i=1
y2i-ny2
.
我们称r为变量x 和变量y 的样本相关系数.
2.样本相关系数的意义
样本相关系数r是一个描述成对样本数据的数
字特征,它的正负性和绝对值的大小可以反映成
对样本数据的变化特征:当r>0时,称成对样本
数据 ;当 r<0 时,称 成 对 样 本 数
据 .
3.相关系数r具有的性质
(1)样本相关系数r的取值样本范围为 ,
即 ;
(2)当|r|越接近1时,成对样本数据的线性相关程
度 ;
(3)当|r|越接近0时,成对样本数据的线性相关程
度 .
271
艺考生文化课百日冲关数学
4.两个随机变量的相关性与样本相关系数r之间
的关系
两个随机变量的相关性可以通过成对样本数据
进行分析,而样本相关系数r可以反映两个随机
变量之间的 :r的符号反映了
相关关系的 ;|r|的大小反映了两个变
量线性相关的 ,即散点集中于一条直线
的程度.一般地,样本容量 ,用样本相关
系数估计两个变量的相关系数的效果 .
四、一元线性回归模型
称下式为Y 关于x 的一元线性回归模型.
Y=bx+a+e,
E(e)=0,D(e)=σ2.{
其中,Y 称为因变量或响应变量,x 称为自变量
或解释变量;a和b为模型的未知参数,a称为截
距参数,b称为斜率参数;e是Y 与bx+a之间的
随机误差.
说明:
(1)模型中的Y 也是随机变量,其值虽然不能由变
量x的值确定,但是却能表示为bx+a与e的
和(叠加),前一部分由x所确定,后一部分是随
机的.
(2)如果e=0,那么Y 与x 之间的关系就可用一元
线性函数模型来描述.
五、一元线性回归模型参数的最小二乘法
我们将ŷ=̂bx+̂a称为Y 关于x 的经验回归方
程,也称经验回归函数或经验回归公式,其图形
称为经验回归直线,这种求经验回归方程的方法
叫做最小二乘法,求得的b̂,̂a叫做b,a的最小二
乘估计.其中:
b̂=
∑
n
i=1
(xi-x)(yi-y)
∑
n
i=1
(xi-x)2
=
∑
n
i=1
xiyi-nxy
∑
n
i=1
x2i-nx2
,
â=y-̂bx
ì
î
í
ï
ï
ï
ï
六、刻画回归效果的方式———残差分析
残差
对于响应变量Y,通过观测得到的数据
称为观测值,通过经验回归方程得到的
ŷ称为预测值,观测值减去预测值称为
残差.
残差图
利用图形来分析残差特性,作图时纵坐
标为残差,横坐标可以选为样本编号,或
身高数据,或体重估计值等,这样作出的
图形称为残差图.
残差
图法
残差点比较均匀地落在水平的带状区域
内,说明选用的模型比较适合,这样的带
状区域的宽度越窄,说明模型拟合精度
越高.
意义
一般地,建立经验回归方程后,通常需要
对模型刻画数据的效果进行分析,借助
残差分析还可以对模型进行改进,使我
们能根据改进模型作出更符合实际的预
测与决策.
残差平
方和
残差平方和为∑
n
i=1
(yi-̂yi)2,残差平方和
越小,模型拟合效果越好.
决定系
数R2
R2=1-
∑
n
i=1
(yi-̂yi)2
∑
n
i=1
(yi-y)2
,R2 越大,残差平
方和越小,模型的拟合效果越好;R2 越
小,残差平方和越大,即模型的拟合效果
越差.
1.相关关系与函数关系的异同
共同点:二者都是指两个变量间的关系;
不同点:函数关系是一种确定性关系,体现的是因
果关系,而相关关系是一种非确定性关系,体现的
不一定是因果关系,也可能是伴随关系.
2.相关系数:r=
n
i=1
xiyi-nxy
(
n
i=1
x2i-nx2)(
n
i=1
y2i-ny2)
,当
r>0时,两变量正相关,当r<0时,两变量负相关,
当|r|≤1且|r|越接近于1,相关程度越高,当|r|
≤1且|r|越接近于0,相关程度越低.
七、分类变量
1.分类变量:用一种特殊的随机变量,以区别不同
的现象或性质,这类随机变量称为分类变量.
2.取值:分类变量的取值可以用 表示.
3.范围:本节主要讨论取值于 的分类变量的
关联性问题.
八、2×2列联表
将如下表所示这种形式的数据统计表称为2×
2列联表,它给出了成对分类变量数据的交叉
分类频数.
371
上篇:第八章 统计与成对数据的统计分析
性别
锻炼
不经常(Y=0) 经常(Y=1)
合计
女生
(X=0)
192 331 523
男生
(X=1)
128 473 601
合计 320 804 1124
它包含了X 和Y 如下信息:最后一行的前两个
数分别是事件{Y=0}和{Y=1}中样本点的个
数;最后一列的前两个数分别是事件{X=0}和
{X=1}中样本点的个数;中间的四个格中的数
是表格的核心部分,给出了事件{X=x,Y=y}
(x,y=0,1)中样本点的个数;右下角格中的数
是样本空间中样本点的 .
九、独立性检验
1.零假设H0:分类变量X 和Y 独立.
2.公式:χ2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d).
3.临界值:忽略χ2 的实际分布与该近似分布的误
差后,对于任何小概率值α,可以找到相应的正实
数xα,使下面关系式成立:P(χ2≥xα)=α.
我们称xα 为α的临界值,这个临界值可作为判断
χ2 大小的标准.概率值α越小,临界值xα 越大.
4.独立性检验
基于小概率值α的检验规则是:
当 时,我们就推断H0 ,即认为X
和Y ,就推断犯错误的概率 ;
当 时,我们 充分证据推断 H0
不成立,可以认为X 和Y .
这种利用χ2 的取值推断分类变量 X 和Y 是否
独立的方法称为χ2 独立性检验,读作“
”,简称独立性检验.
[自主诊断]
[思考辨析]
判断下列说法是否正确,正确的在它后面的括号
里打“√”,错误的打“×”.
(1)利用样本点的散点图可以直观判断两个变量
的关系是否可以用线性关系去表示. ( )
(2)经验回归直线ŷ=̂bx+̂a恒过样本中心点(x,
y),且至少过一个样本点. ( )
(3)在一元线性回归模型中,e是bx+a与y 的随
机误差,它是一个可观测的量. ( )
(4)事件X,Y 关系越密切,则由观测数据计算得
到的χ2 的观测值越大. ( )
(5)在残差图中,残差点分布的带状区域的宽度
越窄,其模型拟合的精度越高. ( )
(6)由独立性检验可知,在犯错误的概率不超过1%
的前提下认为物理成绩优秀与数学成绩有关,某人
数学成绩优秀,则他有99%的可能物理优秀.
( )
[小题查验]
1.(2024天津卷)下列图中,线性相关系数最大
的是 ( )
2.(2025济宁三模)根据变量Y1 和x的成对样本
数 据, 由 一 元 线 性 回 归 模 型 ①
Y1=b1x+a1+e1
E(e1)=0,D(e1)=σ21{ ,得到经验回归模型ŷ=
b̂1x+̂a1,对应的残差如图(1)所示.根据变量Y2
和x的成对样本数据,由一元线性回归模型②
Y2=b2x+a2+e2
E(e2)=0,D(e2)=σ22{ ,得到经验回归模型ŷ=
b̂2x+̂a2,对应的残差如图(2)所示,则 ( )
A.模型 ① 的 误 差 满 足 一 元 线 性 回 归 模 型 的
E(e1)=0的假设,不满足D(e1)=σ21 的假设
B.模型①的误差不满足一元线性回归模型的
E(e1)=0的假设,满足D(e1)=σ21 的假设
C.模型②的误差满足一元线性回归模型的 E
(e2)=0的假设,不满足D(e2)=σ22 的假设
D.模型②的误差不满足一元线性回归模型的
E(e2)=0的假设,满足D(e2)=σ22 的假设
3.(2024上海卷)已知沿海地区气温和海水表层
温度相关,且样本相关系数为正数,对此描述正
确的是 ( )
A.沿海地区气温高,海水表层温度就高
B.沿海地区气温高,海水表层温度就低
C.随着沿海地区气温由低到高,海水表层温度
呈上升趋势
D.随着沿海地区气温由低到高,海水表层温度
呈下降趋势
471
艺考生文化课百日冲关数学
考点一 相关关系的判断(自主练透)
1.(2025扬州三模)某校50名学生的身高与体重
的散点图如下:根据身高和体重散点图,下列说法
正确的是 ( )
A.身高越高,体重越重
B.身高越高,体重越轻
C.身高与体重成正相关
D.身高与体重成负相关
2.已知变量x和y 满足关系y=-0.1x+1,变量y
与z正相关.下列结论中正确的是 ( )
A.x与y 负相关,x与z负相关
B.x与y 正相关,x与z正相关
C.x与y 正相关,x与z负相关
D.x与y 负相关,x与z正相关
3.(多选题)已知由样本数据点集合{(xi,yi)|i=1,
2,,n},求得的回归直线方程为 ŷ=15x+
05,且 x=3,现发现两个数据点(12,22)和
(48,78)误差较大,去除后重新求得的回归直
线l的斜率为12,则 ( )
A.变量x与y 具有正相关关系
B.去除后的回归方程为ŷ=1.2x+1.4
C.去除后y的估计值增加速度变快
D.去除后相应于样本点(2,3.75)的残差为0.05
(1)画散点图:点的分布从左下角到右上角,两个
变量正相关;点的分布从左上角到右下角,两
个变量负相关.
(2)相 关 系 数:r>0 时,正 相 关;r<0 时,负
相关.
(3)线性回归方程中:̂b>0时,正相关;̂b<0时,
负相关.
考点二 回归分析(多维探究)
[命题角度1] 线性回归分析
1.(2025盐城市二模)某公司对项目A 进行生产
投资,所获得的利润有如下统计数据表:
项目A 投资
金额x/百万元
1 2 3 4 5
所获利润
y/百万元
0.3 0.3 0.5 0.9 1
(1)请用线性回归模型拟合y与x 的关系,并用
相关系数加以说明;
(2)该公司计划用7百万元对A,B 两个项目进
行投资,若公司对项目B投资x′(1≤x′≤6)百万
元所获 得 的 利 润 y′近 似 满 足:y′=0.16x′-
0.49
x′+1+0.49
,求A,B两个项目投资金额分别为
多少时,所获得的总利润最大?
附:①对于一组数据(x1,y1),(x2,y2),,(xn,yn),
其回归直线ŷ=̂bx+̂a的斜率和截距的最小二乘估
计公式分别为̂b=
n
i=1
xiyi-nxy
n
i=1
x2i-nx2
,̂a=y-̂bx.
②线性相关系数r=
n
i=1
xiyi-nxy
(
n
i=1
x2i-nx2)(
n
i=1
y2i-ny2
.一
般地,相关系数r的绝对值在0.95以上(含0.95)认
为线性相关性较强;否则,线性相关性较弱.
参考数据:对项目A 投资的统计数据表中
5
i=1
xiyi
=11,
5
i=1
y2i=2.24,4.4≈2.1.
571
上篇:第八章 统计与成对数据的统计分析
(1)在分析实际中两个变量的相关关系时,可根
据样本数据作出散点图来确定两个变量之
间是否具有相关关系,也可计算相关系数r
进行判断.若具有线性相关关系,则可通过
线性回归方程估计和预测变量的值.
(2)正确运用计算b̂,̂a的公式和准确的计算,是
求线性回归方程的关键.并充分利用回归直
线ŷ=̂bx+̂a必过样本点的中心(x,y)进行
求值.
[命题角度2]非线性回归分析
2.噪声污染已经成为影响
人们身体健康和生活质
量的严重问题.为了了解
声音强度 D 与声音能量
I之间的关系,将测量得
到的声音强度Di 和声音能量Ii(i=1,2,,10)
数据做初步处理,得到下面的散点图及一些统计
量的值.
I D W ∑
10
i=1
(Ii-I)2
1.04×10-11 45.7 -11.5 1.56×10-21
∑
10
i=1
(Wi-W)2 ∑
10
i=1
(Ii-I)(Di-D)
∑
10
i=1
(Wi-W)
(Di-D)
0.51 6.88×10-11 5.1
表中Wi=lgIi,W=
1
10∑
10
i=1
Wi.
(1)根据表中数据,求声音强度D 关于声音能量
I的回归方程D̂=̂a+̂blgI;
(2)当声音强度大于60分贝时属于噪音,会产生
噪声污染.城市中某点 P 共受到两个声源的影
响,这两个声源的声音能量分别是I1 和I2,且
1
I1
+4I2
=1010.已知点P 的声音能量等于声音能量
I1 与I2 之和,请根据(1)中的回归方程,判断P
点是否受到噪声污染的干扰,并说明理由.
附:对于一组数据 (u1,v1),(u2,v2),,(un,
vn),其回归直线v̂=̂α+̂βu的斜率和截距的最小
二乘估计分别为β̂=
∑
n
i=1
(ui-u)(vi-v)
∑
n
i=1
(ui-u)2
,̂α=̂v-
β̂u.
非线性回归分析问题的处理方法
(1)描点,选模.画出已知数据的散点图,把它与
已经学过的各种函数(幂函数、指数函数、对
数函数等)图象作比较,挑选一种跟这些散
点拟合最好的函数.
(2)解模.先对变量进行适当地变换,再利用线
性回归模型来解模.
(3)比较检验.通过回归分析比较所建模型的
优劣.
671
艺考生文化课百日冲关数学
考点三 独立性检验(师生共研)
[典例] (2024上海卷)为了解某地初中学生体
育锻炼时长与学业成绩的关系,从该地区29000
名学生中随机抽取580人,得到日均体育锻炼时
长(单位:小时)与学业成绩的数据如表所示:
时间范围 [0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)
学业
成绩
优秀 5 44 42 3 1
不优秀 134 147 137 40 27
(1)该地区29000名学生中日均体育锻炼时长
不小于1小时的人数约为多少?
(2)估计该地区初中学生日均体育锻炼时长(精
确到0.1小时).
(3)是否有95%的把握认为学业成绩优秀与日
均体育锻炼时长不小于1小时且小于 2小时
有关?
附:χ2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
,n=a+b+
c+d.P(χ2≥3.841)≈0.05.
[尝试解答]
(1)在2×2列联表中,如果两个变量没有关系,
则应满足ad-bc≈0.|ad-bc|越小,说明两
个变量之间关系越弱;|ad-bc|越大,说明两
个变量之间关系越强.
(2)解决独立性检验的应用问题,一定要按照独
立性检验的步骤得出结论.独立性检验的一
般步骤:
①根据样本数据制成2×2列联表;
②根据公式2= n
(ad-bc)2
(a+b)(a+c)(b+d)(c+d)
计算χ2 的观测值xα;
③比较x0 与临界值的大小关系,作统计推断.
提醒:准确计算2 的值是正确判断的前提.
[跟踪训练]
(2025全国一卷)为研究某疾病与超声波检查
结果的关系,从做过超声波检查的人群中随机调
查了1000人,得到如下列联表:
组别
超声波检查结果
正常 不正常
合计
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1000
(1)记超声波检查结果不正常者患有该疾病的概
率为p,求p的估计值;
(2)根据小概率值α=0.001的独立性检验,分析
超声波检查结果是否与患该疾病有关.
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
附:χ2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
学习至此,请完成配套训练 课时冲关五十
771
上篇:第八章 统计与成对数据的统计分析