内容正文:
世五维课堂
数学·选择性必修第三册
数
课时
第八章
成对数据的统计分析
学
作业
8.1
成对数据的统计相吴性
纠错空间
基础过关]
A.变量x与y正相关,变量u与v负相
1.下面变量之间是相关关系的是(
关,变量x与y的线性相关性较强
A.出租车费与行驶的里程
B.变量x与y负相关,变量u与v正相
B.房屋面积与房屋价格
关,变量x与y的线性相关性较强
C.人的身高与体重
C.变量x与y正相关,变量u与o负相
D.铁的体积与质量
关,变量u与v的线性相关性较强
2.某校学生科研兴趣小组为了解1~12
D.变量x与y负相关,变量u与v正相
岁儿童的体质健康情况,随机调查了20
名儿童的相关数据,分别制作了肺活
关,变量u与v的线性相关性较强
量、视力、肢体柔韧度、BMI指数和身高
5.(多选)以下各对变量成正相关的是
之间的散点图,则与身高之间具有正相
(
关关系的是
A.学生的学籍号与学生的数学成绩
B.坚持每天吃早餐的人数与患胃病的
人数
方法总结
%
C.气温与冷饮销售量
0
身高
0
身高
D.电瓶车的质量和行驶每千米的耗
BMI
体柔
电量
度
6.(多选)下列关于相关系数x的说法正
身高
身高
确的是
()
A.肺活量
B.视力
A.相关系数r越大两个变量间相关性
C.肢体柔韧度
D.BMI指数
越强
3.两个变量负相关时,散点图的特征是
B.相关系数r的取值范围为[-1,1]
(
)
C.相关系数r>0时两个变量正相关,
A.点散布在从左下角到右上角的区
r<0时两个变量负相关
域内
D.相关系数r=1时,样本点在同一直
B.点散布在某带形区域内
线上
C.点散布在某圆形区域内
7.下列两个变量之间具有相关关系的是
D.点散布在从左上角到右下角的区
(填序号)
域内
4.对两个变量x,y进行线性相关检验,得
①正方形的边长a和面积S;
到线性相关系数r1=0.7859,对两个变
②一个人的身高h和右手一柞长x;
量u,v进行线性相关检验,得线性相关系
③真空中的自由落体运动其下落的距
数r2=一0.9568,则下列判断正确的是
离h和下落的时间t;
④一个的身高h和他的体重x.
·200·
第八章成对数据的统计分析
课时作业乡
8.已知求得甲、乙、丙3组不同数据的线
11.某厂的生产原料耗费x(单位:百万元)
性相关系数分别为0.81,一0.98,0.63,
与销售额y(单位:百万元)之间有如下
其中
(填甲、乙、丙中的一个)
的对应关系:
纠错空间
组数据的线性相关性最强,
2
2
4
6
8
9.在一次试验中,测得(x,y)的四组值分
y
30
40
50
70
别为(1,2),(2,0),(4,-4),(-1,6),
则y与x的相关系数为
x与y之间是否具有线性相关关系?
10.近年来,“共享汽车”在我国各城市迅
若有,判断相关性的强弱,
猛发展,为人们的出行提供了便利,但
也给城市交通管理带来了一些困难.
为了解“共享汽车”在M省的发展情
况,M省某调查机构从该省随机抽取
了5个城市,分别收集和分析了“共享
汽车”的A,B,C三项指标数据x:,y:,
之(i=1,2,3,4,5),数据如表所示:
城市编号i
1
2
3
5
A指标x
4
6
P
8
5
方法总结
B指标y
4
3
4
C指标之
3
6
2
5
4
利用向量夹角来分析y与x之间及之
与x之间的相关关系.
[能力提升]
12.广阳岛,作为长江上游最大的江心岛,
其面积在枯水期约为10平方公里.自
2017年起,重庆市开始对广阳岛进行
系统的生态修复,摒弃了曾经的商业
开发计划,转而建设“长江风景眼,重
庆生态岛”.经过数年的努力,广阳岛
的生态得到了显著的改善,不仅植被
丰富,生物多样性也得到了极大的提
升据监测,岛上的鸟类从生态修复前
的124种增加到213种,其中包括中
华秋沙鸭、游隼、白琵鹭等珍稀鸟类.
为调查广阳岛某种鸟的数量,将其分
成面积相近的50个地块,从这些地块
·201
世五维课堂
数学·选择性必修第三册
中用简单随机抽样的方法抽取5个作
13.现随机抽取了某校10名学生在入学
为样区,调查得到样本数据(x:,y:)(i
考试中的数学成绩(x)与入学后的第
间
=1,2,…,5),其中x和y:分别表示
次考试数学成绩(y),数据如表:
纠错空间
第i个样区的植被覆盖面积(单位:平
学生号12345678910
方公里)和这种鸟的数量
x
12010811710410311010410599108
y
84648468696869465771
2
2
3
5
请问:这10名学生的两次数学考试成
xi
0.1710.152
0.192
0.189
0.196
绩是否具有显著的线性相关关系?
y
12
10
16
14
18
(1)求广阳岛这种鸟数量的估计值(这
种鸟数量的估计值等于样区这种鸟数
量的平均数乘以地块数);
(2)求样本(x,y:)(i=1,2,…,5)的相
关系数(精确到0.01);
(3)根据统计资料,各地块间植物覆盖
面积差异较大.为提高样本的代表性
以获得广阳岛这种鸟数量更准确的估
方法总结
计,请给出一种你认为更合理的抽样
方法,并说明理由.
附:相关系数,r=
2(x,-d(y-3)
,x=0.18,
含(x-a)2含-0≈0.232
·202·
第八章成对数据的统计分析
课时作业乡
[素养培优]
(2)一天内抽检医疗物资中,如果出现
14.为了监控某种医疗物资的一条生产线
了尺寸在(x一3s,x+3s)之外的医疗
间
的生产过程,检验员每隔30min从该
物资,就认为这条生产线在这一天的
纠错空间
生产线上随机抽取一个医疗物资,并
生产过程中可能出现了异常情况,需
测量其尺寸(单位:cm).下面是检验员
对当天的生产过程进行检查.从这一
在一天内依次抽取的16个医疗物资
天抽检的结果看,是否需对当天的生
的尺寸:
产过程进行检查?
抽取
附:样本(x:,y:)(i=1,2,…,n)的相关
次数
医疗物
(x,-00y一D
=1
9.95
10.129.96
9.96
10.01
9.92
9.98
10.04
系数r
资尺寸
抽取
2x,-含y-
9
10
12
15
16
次数
医疗物
10.269.9110.1310.029.22
10.0410.059.95
资尺寸
经计算得。兰-9.97
方法总结
≈0.212,2-8.5P≈18.489,
2x≈1591.137,2(z,-x(i-8.5)
=一2.78,其中x:为抽取的第i个医
疗物资的尺寸,i=1,2,3,…,16,
(1)求(x:,i)(i=1,2,…,16)的相关系
数r,并回答是否可以认为这一天生产
的医疗物资尺寸不随生产过程的进行
而系统地变大或变小(若r|<0.25,
则可以认为医疗物资尺寸不随生产过
程的进行而系统地变大或变小)」
·203·巴五维课堂
(2)这100人日组装个数的平均值为0×(160×6+
170×12+180×34+190×30+200×10+210×8)=
185,所以=185.
因为。2=169,所以。=13.
①易知μ十。=198,所以P(X>198)=P(X>4十σ)=
2[1-Pg-≤X≤r+o]≈1-0,6827-0.15865,
2
所以日组装个数超过198的人数为0.15865×20000
=3173.
②因为4=185,所以日组装个数在185以上的概率为
0.5.
设这3人中日组装个数超过185的人数为,这3人增加的
日工资总额为,则7=505,且一B(3,0.5),所以E()=
3×0.5=1.5,所以E()=50E()=75元.
4,解:)根据题意知,样本的平均数工三0言x:
(100.03+100.4+99.92+100.52+99.98+100.35+
99.92+100.44+100.66+100.78)=100.3,
方差子=品x-)=品(鸡£-107)
0×(10601.8-10×10.3)=0.09,所以u
100.3,o=0.3.因为样本尺寸x∈[99.4,101.2],所以
该切割设备的质量合格.
(2)若采用方案2,则可设生产的零件售价为随机变量
ξ,则ξ可以取60,100:
由(1)知,该设备生产的零件尺寸X一N(100.3,0.32),
所以P(=100)=P(99.7≤X≤100.3)=P(-2G≤
X≤)≈2×0.9545=0.47725,
P(=60)=1-P(=100)≈1-0.47725=0.52275.
所以随机变量的分布列如下.
60
100
P
0.52275
0.47725
所以的数学期望为E()≈60×0.52275十100×
0.47725=79.09.
因为79.09>70,即采用方案2时每个零件的平均售价
高于采用方案1时的定价,所以方案2的利润更大.
第八章成对数据的统计分折
8.1成对数据的统计相吴性
1.C[C是相关关系,A,B,D是函数关系.]
2.A[对于A,儿童的身高越高,其肺活量越大,肺活量与
身高具有正相关关系,A正确;
对于B,儿童的视力随身高的增大先增大,后减小,视力
与身高不具有正相关关系,B错误;
·28
数学·选择性必修第三册
对于C,肢体柔韧度随身高增大而减小,肢体柔韧度与身
高不具有正相关关系,C错误;
对于D,BMI指数与身高的相关性很弱,不具有正相关
关系,D错误.]
3.D[有负相关关系的各点整体呈递减趋势,因此点应该
散布在从左上角到右下角的区域内.]
4.C[由线性相关系数r1=0.7859>0知x与y正相关,
由线性相关系数r2=-0.9568<0知u,v负相关,又|n
<|r2|,所以变量u与v的线性相关性比x与y的线性
相关性强.门
5.CD[对于A,学生的学籍号与学生的数学成绩没有相
关关系:对于B,一般情况下,坚持每天吃早餐的人数与
患胃病的人数成负相关关系;对于C,一般情况下,气温
与冷饮销售量成正相关关系;对于D,一般情况下,电瓶
车的质量和行驶每千米的耗电量成正相关关系.]
6.BCD[根据相关系数的意义对每个结论进行分析、判断
可得错误的结论.
对于相关系数r,有以下结论:①当>0时,表明两个变
量正相关;当r<0时,表明两个变量负相关.②r的绝对
值越接近于1,表明两个变量的线性相关性越强;r的绝
对值越接近于0,表明两个变量之间几乎不存在线性相
关关系.
对于A,当r<0时此结论不成立,所以A不正确
对于B,由相关系数的性质可得一1≤r≤1,所以B正确.
对于C,由相关系数的性质可得正确.
对于D,由相关系数的性质可得正确,故选BCD.门]
7.解析:对于①,正方形的边长a和面积S是函数关系,不
是相关关系;对于②,一般情况下,一个人的身高h和右
手一柞长x是正相关关系;对于③,真空中的自由落体
运动其下落的距离h和下落的时间t是函数关系,不是
相关关系;对于④,一般情况下,一个人的身高h和他的
体重x是正相关关系.
答案:②④
8.解析:两个变量y与x的相关系数的绝对值越接近于1,
它的线性相关性越强.在甲、乙、丙中,所给的数值中
|一0.98|是最大的值,即乙的线性相关性最强,
答案:乙
9.解:法-x=1.5y=1,2=22,立=56,xy.=-20,
=1
=1
1=1
相关系数r=
-20-4×1.5×1
=一1.
W(22-4×1.5)(56-4×1)
法二:观察四个,点,发现其在一条单调递减的直线上,故
y与x的相关系数为一1.
10.解析:由已知得元=4+6+2+8+5=5,y=
5
4+4十3+5+4=4,2=3+6+2+5+4=4,将题表中
5
5
2
参考答案
x,y,x的相关数据分别减去x,y,z,记a=(x1一x,x2
-I,x3-E,x-,x;-x),b=(y-y,y2-y,y3-y,
y4一y,y5一y),C=(z1一2,22-2,23-,24-2,-
z).则a=(-1,1,-3,3,0),b=(0,0,-1,1,0),c=
(-1,2,-2,1,0).于是c0sa,b)
-1×0+1×0+(-3)×(-1)+3×1+0×0
√(-1)2+12+(-3)2+32+02×√02+02+(-1)2+12+02
25X2V0.9≈0.95,
6
-1×(-1)+1×2+(-3)×(-2)+3×1+0×0
o0s(a,c〉=
√(-1)2+12+(-3》2+32+0×√/(-102+2+(-22+12+02
12
25×√105
=3y2≈0.85,所以y与x,z与x正相
关,又cos(a,b)>cos(a,c),则y与x之间的相关性比
x与x之间的相关性强
11.解:画出散点图如图所示,由图可知x,y有线性相关
关系
70
60
50
40
30·
0
2468x
=5,y=47.5,2x=120,2=9900,
i=1
2x:=1080,
四
√宫-)2-4)
1080-4×5×47.5
≈0.9827.
√(120-4×5)(9900-4×47.5)
故x与y之间具有很强的正相关关系.
12.解析:(1)由已知得样本平均数y=12+10+16+14+18
5
14,从而广阳岛这种鸟数量的估计值为14×50=700.
(2)x=0.18,y=14,∑(x:-x)(y:-y)=0.009×2+
▣1
0.028×4+0.012×2+0.016×4=0.218,
故样本的相关系数,0218≈0.94
0.232
(3)分层抽样:根据植物覆盖面积的大小对地块分层,
再对50个地块进行分层抽样,
理由如下:由(2)知各样区的这种鸟数量与植物覆盖面
积有很强的正相关,由于各地块间植物覆盖面积差异
很大,从而各地块间这种鸟数量差异也很大,采用分层
抽样的方法较好地保持了样本结构与总体结构的一致
性,提高了样本的代表性,从而可以获得广阳岛这种鸟
数量更准确的估计.
答案:(1)700
(2)0.94
·23
课时作业乡
(3)分层抽样:根据植物覆盖面积的大小对地块分层,
再对50个地块进行分层抽样,理由见解析
13.解:2=0(120+108+…十99+108)=107.8,
y=0(84+64+…+57+71)=68,
2d=120+108g+…+99+1o8=16584
2=84+64+…叶57+71=47384,
2x,=120×84+108X64+…+108X71=73796
所以,相关系数为
73796-10×107.8×68
r=
W√(116584-10×107.82)(47384-10×682)
≈0.7506,
故两次数学考试成绩有显著的线性相关关系,
14.解:(1)由样本数据得(x,i)(i=1,2,3,…,16)的相关系
数为
(x,-D)(i-8.5)
=1
②x-√/-8.
-2.78
≈-0.18;
0.212×√16×18.439
由于|r<0.25,因此可以认为这一天生产的医疗物资
尺寸不随生产过程的进行而系统地变大或变小
(2)由于x=9.97,s≈0.212,
由样本数据可以看出抽取的第13个零件的尺寸在
(元-35,x十3s)以外,因此需对当天的生产过程进行
检查
8.2一元线性回扭模型及其应用
1.D[:2=0+1+2+3=1.5,
4
y=1+3+5+7=4,
4
回归直线必过点(1.5,4).故选D.]
2.A[决定系数R越大,表示回归模型的拟合效果
越好.]
3.C[花样本中心点的坐标(仔,43)代入回归方程得
a=5.9,所以广告费用为10万元时,估计销售额约为
10.6×10+5.9=111.9(万元).]
4.D[2=1.125×8=9,增加两个样本点后x的
平均数为9-2+1=0.8
10
y=2×1.125+0.75=3…含%=3×8=24,增加两
个样本点后y的平均数为24+5+3=3.2,
10
3