内容正文:
2s,x+2s),即(160-2√J15,160+
215),约为(152.2,167.8),由样本
数据知,169任(160-2√/15,160
2√15),为离群值,
剔除169后,女生样本(9人)数据的
平均数为了=
1
×(160×10
169)=159:
由s2=
6(x-1)
1
(之-25600)=15可得
1
10
10
x:=256150,
则剔除169后,女生样本(9人)数据
的方差为s”=
=1
9×(256150-28561
1
9x2)=
9×25281)=
20
3
训练67成对数据的
统计分析
1.B对于A,散点图上所有点都在一条
斜率小于0的直线上,所以样本相关系
数r=
一1,A正确;对于B,散点图上
所有点都在一条斜率大于0的直线上,
所以样本相关系数r=1,B错误;对于
C,散,点图上所有点从左到右是向下的
带状分布,所以样本相关系数一1<
r<0,C正确:对于D,散点图中,xy
之间的线性相关关系非常不明显,所
以样本相关系数r=0,D正确.故选B.
2.C根据散点的集中程度可知,花瓣长
度和花萼长度有相关性,A错误;散,点
的分布是从左下到右上,从而花瓣长
度和花萼长度呈现正相关性,B错误;
把x=7代入y=0.7501x+0.6105
可得y=5.8612cm,C正确;由于r=
0.8642是全部数据的相关系数,取出
来一部分数据,相关性可能变强,也可
能变弱,即取出的数据的相关系数不
一定是0.8642,D错误.故选C
3.B根据题意,在等高堆积条形图中,
当X1,X。所占比例相差越大时,越有
把握认为两个分类变量X,Y之间有关
系,对于B,X1,X2所占比例相差无几,
所以最有把握认为两个分类变量X,Y
之间没有关系.故选B.
4.Ax=5,y=50,代入经验回归方
程,得ā=20,将x=5代入经验回归
方程,得y=6×5十20=50,残差为
60一50=10(万元).故选A.
5.C因为X2=3.122<3.841,P(X2≥
3.841)=0.05,根据小概率值a=
0.05的独立性检验知,X与Y独立,C
正确.故选C.
6.ABC样本相关系数是用来衡量两个
变量之间的线性相关程度的,样本相
关系数是一个绝对值小于或等于1的
量,并且它的绝对值越大就说明线性
相关程度越强,所以不正确的只有D.
故选ABC.
580红对闪·讲与练·高三数学·
7.AB对于A,因为∑,=490,所以
=1
y=70,又x=4,代入y=-5x+a,
得到70=一5×4十a,解得a=90,故
A正确;对于B,因为模型一为y=
-5x十90,故解释变量x增加1个单
位,响应变量y则大致减少5个单位,
故B正确;对于C,令x=7,则y
一5×7十90=55,则残差为50-
55=一5,故C错误;对于D,因为R?=
0.7325<R号=0.9183,故模型二拟
合效果更好,故D错误.故选AB.
8.CD设男、女大学生各有m(m>0)
人,根据题意列出2×2列联表,如下:
是否看营养说明
性别
合计
看
不看
乡
5
6
6m
32
1
32
1
合计
2m
2m
所以X2
1
2
2m(5mX了m号
3m
3
1
,因为有99%的把握认为性别与是
27
否看营养说明之间有关,所以织≥
6.635,解得2m≥179.145,又m=6k,
∈N”,结合选项,可知C,D符合题
意.故选CD.
9.4.514
解析:由题意得2X2列联表如下:
是否看电视
性别
合计
不看电视看电视
男
37
85
122
女
35
143
178
合计
72
228
300
则X=
300×(37×143-35×85)
122×178×72×228
4.514.
10.0.105
解析:根据y=20x十12,分别将x
1,2,3,4代入求得y分别为32,52,
72,92,则4个残差分别为一0.4,0.5,
0,一0.1,残差的平均数为0,故残差
的方差为s=×[(-0.4-0)2十
(0.5-0)2十(0-0)2十(-0.1
0)2]=0.105.
11.0.1e
解析:因为y=a·e,两边取自然对
数可得lny=ln(a·er)=kx十
lna,令之=lny,可得之=kx十lna,
又经验回归方程之=0.1x十3,所以
基础版
k=0.1,lna=3,所以a=e,所以
a·k=0.1e3.
12.解:(1)因为折线图更接近直线,所以
y=bx十a更适合作为回归模型.
1
(2)因为2=7×(1+2+3+4+5+
6十7)=4,
∑(x:-x)2=(1-4)+(2-4)+
(3-4)2+(4-4)2+(5-4)2+(6
4)2+(7-4)2=28,
所以样本相关系数r
∑x,-x)(y,-
1=1
/∑x,-∑0y,-)
i=1
133
133
2W7×25.8≈2X2.65X25.8≈
0.97.
根据题意,可得b=
∑(x,-x)y-y)
133
=4.75,
∑x,-x)
28
=1
=13y,=38,à=y-bx=
y=7白
38-4.75×4=19,
所以种植药材收入y关于年份代码x
的经验回归方程为y=4.75x十19.
(3)①间作:药材和草的间作一方面
可以同时发展畜牧业来增加居民收
入,另一方面可以提高土地的利用
率,实现单位面积内经济效益的最大
化;②轮作:一方面牛羊粪等有机肥
可以用来供给药材的生长,从而提高
乡镇居民收入,另一方面可以调节土
壤的肥沃能力,形成良性循环,进一
步提高土地的生态效益和经济效益.
(答案不唯一,合理即可)
13.解:(1)由列联表知s=100十80=
180,t=80十70=150.
(2)由列联表知,未服用药物A的动
物有180只,
未服用药物A且患疾病B的动物有
80只,
所以未服用药物A的动物患疾病B
80二g
的频率为18
4
所以未服用药物A的动物患疾病B
的概率的估计值为P=g
4
(3)零假设为H。:药物A对预防疾病
B无效,由列联表得到X=
400×(100×70-150×80)2
180×220×250×150
297≈6.734>6.635,
2000
根据小概率值α=0.01的独立性检
验,推断H。不成立,
即认为药物A对预防疾病B有效,该
推断犯错误的概率不超过0.01,
所以根据小概率值a=0.01的独立
性检验,能认为药物A对预防疾病B
有效.班级:
姓名:
训练67
成对数据的统计分析
(总分:100分)
一、单项选择题(每小题5分,共25分)
1.下面各图中,散点图与样本相关系数r不符合的是
X
□X
(
V
r=-1
r=0.5
A
☐X
X
□X
X
0
B
Y
Y
C
D
-1<r<0
r=0
4.某种产品的广告支出费用x(单位:万元)与销售
额y(单位:万元)的数据如下表:
0
6
8
C
30
40
60
50
70
2.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万
已知y关于x的经验回归方程为y=6.x十a,则当
里、前途无量.通过随机抽样,收集了若干朵某品种
广告支出费用为5万元时,残差为
鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散
A.10万元
B.14万元
点图如图2,计算得样本相关系数为r=0.8642,
C.23万元
D.24万元
利用最小二乘法求得相应的经验回归方程为夕
5.根据分类变量X与Y的成对样本数据,计算得到
0.7501x十0.6105,根据以上信息,如下判断正确
X2=3.122.已知P(X2≥3.841)=0.05,依据小概
的为
(
率值a=0.05的独立性检验,则
()
7.2
A.X与Y不独立
6.8
花6.4
B.X与Y不独立,这个结论犯错误的概率不超
瓣6.0
长5.6
过0.05
度5.2
C.X与Y独立
4.8
D.X与Y独立,这个结论犯错误的概率不超
04.85.25.66.06.46.87.27.68.08.4
花萼长度
过0.05
图1
图2
二、多项选择题(每小题6分,共18分)》
A.花瓣长度和花萼长度不存在相关关系
6.下列有关样本相关系数r的说法正确的是()
B.花瓣长度和花萼长度负相关
A.样本相关系数r可用来衡量x与y之间的线性
C.花萼长度为7cm的该品种鸢尾花的花瓣长度
相关程度
的平均值为5.8612cm
B.|r≤1,且|r|越接近O,线性相关程度越弱
D.若从样本中抽取一部分,则这部分的相关系数
C.|r|≤1,且|r|越接近1,线性相关程度越强
一定是0.8642
D.|r|≤1,且|r|越接近1,线性相关程度越弱
3.观察如图所示的等高堆积条形图,其中最有把握
7.近年来,人工智能技术不断发展,各种AI应用也不
认为两个分类变量X,Y之间没有关系的是
断普及.随着人工智能的加入,各类传媒、影视、游
(
戏行业迎来了高速的发展,A虹技术降低了这些行
红对勾·讲与练
394
高三数学·基础版
班级:
姓名:
业的人力成本,提高了效率.如图是某公司近年来
10.根据下面的数据:
在人力成本上的投入资金变化情况的散点图,其
2
3
4
中x为年份代号(第1年至第7年),y(单位:万元)
31.6
52.5
72
91.9
为人力成本的投入资金,小明选用2个模型来拟
求得y关于x的经验回归方程为y=20x+12,则
合,模型一:y=-5x十a,已知∑y,=490,其中决
这组数据相对于所求的经验回归方程的4个残差
定系数R=0.7325,模型二:y=c1十c2lnx(c2<
的方差为
得分
0),其中决定系数R=0.9183,则下列说法正确
11.用模型y=a·er拟合一组数据,令之=lny,由数
的有
据得到的经验回归方程=0.1x十3,则a·k=
得分
四、解答题(共42分)
12.(20分)(2024·江西吉安质检)某乡镇为了提高
50----..-·.-.(7,50)
乡镇居民收入,指导农民种植黄芪、党参、当归等
药材,同时在种植药材附近种植草,让牛羊吃,发
01234567x
展畜牧业,第二年将种植药材的地改种草让牛羊
A.模型一拟合得到的a=90
吃,将牛羊吃过的草地改种药材,这样药材的生
B.模型一中解释变量增加1个单位,响应变量则大
长主要依靠牛羊粪等有机肥来供给,提高药效,
致减少5个单位
同时增加农民的经济收入.现将该乡镇某农户近
C.模型一中第7年的残差为5
7年(2018年至2024年对应年份代码1~7)种植
D.模型一的拟合效果更好
药材的收入金额绘成折线图(如图),同时统计出
8.通过随机询问相同数量的不同性别的大学生在购
相关数据:
得分
买食物时是否看营养说明,得知有。的男大学生
√7≈2.65,
=266,
xy=1197,
“不看”有号的女大学生“不看”,若有99%的把握
(y-y)2=25.8,(x-x)(y-y)=
认为性别与是否看营养说明之间有关,则调查的
133
总人数可能为
(
↑种植药材收入/千元
55----1---r---r--1---1-
n (ad-bc)2
50
附:X2
(a+b)(c+d)(a+c)(b+d)
,其中n=
45
40
a+b+c+d.
35A
3
a
0.10
0.010
0.001
25
20
2.706
6.635
10.828
01234567年份代码x
A.150
B.170
(1)根据图中所给出的折线图,判断y=bx十a和
C.192
D.216
y=me十n哪一个更适合作为回归模型;(给出
三、填空题(每小题5分,共15分)
判断即可,不必说明理由)
9.根据下表计算:
(2)求样本相关系数r(保留两位小数),并求种植
项目
不看电视
看电视
药材收入y关于年份代码x的经验回归方程;
男
(3)若在生物学上将在药材附近同时种植草称作
37
85
间作,将药材和草每年轮流种植称作轮作,根据
女
35
143
题目所给信息,分析这两种种植方式对当地居民
.(结果保留3位小数)得分
收入的影响,
(横线下方不可作答)
395
第九章概率与统计
附:样本相关系数r=
13.(22分)(2025·八省联考)为考察某种药物A对
x,-7)0,-y)
预防疾病B的效果,进行了动物(单位:只)试验,
i-1
,经验回归直线y=
得到如下列联表:
得分
,2
患病情况
1
服药情况
合计
bx十ā中,斜率和截距的最小二乘估计公式分别
未患病
患病
x,-0g,
未服用
100
80
为b=
-1
a=y-bx
服用
150
70
220
合计
250
t
400
(1)求s,t;
(2)记未服用药物A的动物患疾病B的概率为
P,给出P的估计值;
(3)根据小概率值α=0.01的独立性检验,能否认
为药物A对预防疾病B有效?
附:X2
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
a
0.05
0.01
0.001
3.841
6.635
10.828
红对勾·讲与练
396
高三数学·基础版
■