内容正文:
2024一2025学年度单元过关检测(十八)
数学·成对数据的统计分析
(考议时简120分铃,惑分150分》
一,选择照本丽共8小用,誓小丽5分,共0分.在每小哪台出的四个选项中,只有一项是
符合整目要求的1
题号
1
4
6
7
签案
1.关于《¥)的一相样本数据(1,一1),2,一3),(3,5,一6),《5:-9),+,30.5,-60)
航点图中,所有样本点均在直线y=一2:十1上,雨这组样本数据的样本相关系数为
(
A.-2
且.=1
C.1
D.2
2.中茶文化裤大精保,茶水的口够与茶叶的黄程和水的酒度有关,某数学建顾小组建立
了茶水冷掉时间x和茶水黑度y的一组数据红,),经过分析,摄出了四种国阳模型
①吻8④四种慎覆的我差平方和之(y,一)的值分别是0.9,0.11】.2经,1.6,湘拟
合效果最好的板型是
A,模显①
且,模数
C,模型③
山,模到④
3,对变量xy有观测数据(xy,》行=12一10,得数点旧1:对变量m甲有现满数据
《m:,,)(一1,2,“,10),得散点图生.1表示变量¥,y之可的样本相关系数,:表示
变量:,心之间的种本相关系数,则
(
。
11
国:
A.-1<r<1<0
C.0<r<r<1
D.0<r<r1<1
单元过关松潮(十八)数学第1面(热8夏)
衡水直
4,在某幽毒度商的得发过程中,需要利用据因编氧小鼠进行动物实验,珑随机拍取10只
基因编氧小服对该确毒疫度苗进行实验,得到如下?×2列联表(军分数据缺失1:
载某利海感果来皱某现毒感果合计
名
住射痉萄
10
50
表生射疫菌
50
合计
30
180
得分
计算可知,取据小假零值▣=
的x玖立性检验,分析粉基因细(小佩往射流
种疫言值起到预防该我毒感染的效果“
n(@d-k)时
附:X=a+b+a)a十r6+dn=+b+e+d
0.1
0.05
0.01
0.006
0.601
427T06
黑841
6.685
7.879
10.529
A,0,001
且005
C0,01
D.0.c05
5,用最小二采法得到一组数据(x4…y:)《i一【,2,3,4,5,5)约线性叫归方程为y一2x十3:
若2江-0,则之
A,11
且13
C63
D.78
6,某校数学建慎兴想小组为研究木地区儿予身高y(m)与父潮身高x(m》之列的关系,
靠样调查后得雷y与x提性相关,且经验间归方程为y=0,85x十9,5,到查所得的都
分特本数据如下:
父第身高x(a116416所10123
178
1741
儿子身高y(m)165368
120
178
1761T8
侧下列说法正确的是
A.儿子身高y(m)是关于父亲身高x〈em的函数
B.当父亲身高增加1em时,儿,子身高带知0.85c田
C.儿子身高为172em时,父亲身高一定为167.6em
D.父第身高为10m时,几子身高结计为174心m
花卷
单元过关检测十八》数学第2页(共5页1
A
7,用模型y=a”拟合一组数据组(1y,)行=1,2,3,,7),其中1十3十十x=14。
设:一1出y,得变换后的线性国白方程为王一g+1,期y1y:“y,”
A.el
且
C.5
1D.21
8.某骑行爱好着在专业人土期母下对近段时间的骑行餐缩情况遗行线计分析,统计每次
骑行期间的身体等合指标评分x与前行用时y(单位:小时)如下表:
身格始合指标评分)1284车
用时/小时)
我5第478761
由上表数据得到的正确结论是
参考数,2士,-11-10,(y-)一7.06,,-2(y-习)=-47视,684位
2(x,-2g-)
餐考公式:相关系数F
x-x2y,-)
A.身体棕合指标摔分x与骑行用时y正相美
弘身体等合指标评分士与骑行用时y的相关程度较霸
C身体擦合指标评分x与骑行用时y的相美程度较氢
D.身体绵合指标评分工与隋行用时y的关系不请合用线性回归模督数合
二、这择题本题共3小题,每小题6分,共18分,在每小驱输出的透项中,有多项杆合题日
要求.全部张对的得6分,部分器对的得部分分,有选错的得0分】
路号
9
10
容案
9.有一散点国如图断乐,在5个(ry)数据中去掉D(3,10)后,则
+0120
A,变量x与变量y的相关灶变强
且相关系数,变大
C.相关指数R:变小
D.残差平方和变小
10,某学校一可学研究遇差x(单位:℃)与本校当天新增路冒人数y(单位:人)的关系,核
间学记谦了5天的数暴
y1629252816
由上表中数据米得画整x与新增感日人数y阔足经种回归方程y一:+2.8,雨《)
A.x与y有正相关美系
B经验间归直线经过点(8,25》
C.6-生4
D.立=9时,我差为0.2
单元过关松潮(十八)数学第3面(热8夏)
衡水直
11,为了解高二学生是否喜爱物理学科与性别的关联性,某学校随机轴取了200名学生进
行统计.初到如图所示的列联表,则
性利
物理学科
宾爱不得爱
男
40
女
25
A前爱物丑学和的学生中,男生的毅率为足
B女生中膏爱物到学科的规率为】
C,根据小恒率雀==©01的x集立性检羚,可以摆断学生是香喜爱物理学科与性别有关
D在更精误的概率不画过0.1%的前握下,认为竿生基否喜爱物夏学科与性别无关
nad一c)3
参考公式xa+功C十)a十0Xb+万其中na十6+c+d.
附表:
610
0.05
L01
L.005
001
20641
6.635
7.879
1.24
三,填空道(本题共3小题.每小显5分,共15分}
12,某市2018年至2022年新能源汽车年筒量y(单位:百台)与年份代号x的数据如下表:
年020182019.203120211022
年代号。1
4
年量y101520
若根据表中的数据用最小二希法求得y关于x的同日直线方程为方=6,5x十G,据此
计算样本点(1,15)的瘦为
13.某单使为了倒查性别与对工作的虎宣程度是香具有相关性,随机拍取了若干名员工,所得数
貂旋计如下表所示,其中x长N”,且r<0,若依暴小概率值▣■0,n的X线立性检验,可
以认为性联与对工作的裤意程度具有橱关性,测士的所有可能意值个数是
对工作调意对工作不满意
5:
5r
r
6ir
n(ad-be)
附:ra十6r十2a十r6千D就中n=8++c+d.
4.100.05a.0250.010005我001
2063415.0246.635元87B10.82
题密蓉
单元过关检测十八)数学第4页(共5页
14,学习于才干售抑,北如运动于健康体愧,持之意久,行之愈运愈受益,为实现中华民熊
伟大复兴,全国各行各业策尽了学习强国”的热需.某老箱很喜欢学习强国”中“挑截
答整”模块,抛记康了自己违候七天棒天一次最多暮对的题数如下表:
天数上
t23457
比最多答对超最)这移161的47
参考数据正-4可-19,之-10,2-2,2以,-6006e2.6,
含,-)一0
相关系数P一
1
2(x-·②y,-y)
由表中数据可知该老师每天一次最多容对瑟数y与天数:之间是
相关〈填
“正“发“鱼”),其相美系数r✉
,〔结果保留两位小数)
西.解答越{本题共5小题,共行分.解答应写出文字便明、任明过塑或澳算步骤引
15.《13分)某高中为了了解学生很期间阅读古典名著的时间x(小时/每周)和核门的语
文成绩y《分)的关系,做了调液,得到一阵数暴(表一)
表
细号
2
4
5
学习时用:
10
路文试坡y
6238950g122
《1)请根据所给数据求出语文成绩y的平均数和方差:
《2》基于上连调查,学校为了晓认学生喜欢图读古奥名著与语义战桃的关系,轴样调查
了20心位学生.控凰是否真玫阅读古典名著与语文域蜡是香优秀统计,寻到下列数
都(表二),清依据表中数暴及小假率值α一0.01的x2段立挂校验,分所·喜意阅读
古鼻名著与丽文或绩优秀“是否有关
表二
讲文成精优序
卧文收靖不优秀
叠计
客食离请
75
25
1o0
不喜★阅演
6
100
食计
130
7
280
6.10
0.05
0.010
206
34组
5.65
单元过关松潮(十八)数学第3面(黄8互》
衡水真
16,〔15分)为比较甲,乙两所学校学生的数学水平,采用简单随机轨样的方祛前取0名学
生,通过测验御到了如表数据
数学或铜
不北秀
优男
学校
合计
甲校
10
40
乙整
20
40
合计
30
(1)依据小概率值:=Q.01的y硅文鞋检魔,分析学校和数学或绩优秀率之司是否存
在关联,如果表中所有数摆都扩大为拟来的10倍.在相同的检顾标座下,再用鞋立
性检险静断学校和数学或馈优秀率之网的关联性,结论还一样吗?请你试着解释
其中的原因
(2)据调直,丙校学生数学成續的优秀率为0%,且将朝率税为概率,观根据甲,乙,丙
三质学总人数比例依次壮取了24人,30人,30人进行倒春访谈,如果已知从中
轴到了一名优秀学生,求该学生米自丙校的短率.
附表:
量0.10.050.010006.001
五4270m3,316.657.87910.824
17.〔15分)下图是某市从2016年至2022年生活垃圾无害亿处理量y(单位:方照)与年命
1的散点图,
(们)酸据散点图推所变量y与:是杏线性相炎,并用相关系数相以说明:
(2)建文y关于:的回日方程(系数精确司U.01》,孩离2024年该市生话蚁吸无害化处
理量。
参考数据
点y-线00含-貌.20--3672846
4-0-列
参考公式:b一
-5
8一y一对,相关系散r
2-n
含-02w.-9
11J45677
什横轴为好代壳1一计州时
21-是俱输为生话按
反无老乾注弹量)
密鞋
单元过关检测I十八》数学第6页(共8页引
A
18,(17分)红碑蛛是怕子的主要害虫之一,能对怕千树置成严重伤害,每只红数蛛的平均
产用数y(个)种草均围度r(℃》有关,税收集了以往某
4
地的7组数据,得到下面的酸点图及一些统计量的值
(1)限据散点图判斯,y一b如十a与y=业《其中e一
名7们…为自然对数的底数)哪一个更近合作为平均
产哪数,(个)关于平均祖度上(℃》的同归方程类回
罩?(给出判断即可,不必说明理由)》
(2)山(1)的判断结果及表中数据,求出y关于:的回
日方程.(计算结果精确到0.1)
(x,-)y,-D
附,回日方程中y=标十4.b=
=y一好
-
参考数新(红=y)
J
21517713
714
27
13
(3)根据对以往每年平均气祖以及果园年产值的统计,得到以下数据:平均气在
2℃以下的年数占60%,对柱子产量影响不大,不需要采取动虫情随:平均气画在
22℃至28℃的年数占30%,m子产量会下降20%:平均气星在28无以上的年数
占10%,怕予产量会下网50%,为了更好的防渝红蜘蛛虫害,发科所研爱出各种萄
害精临供果农选释
在每年价格不变,无虫害的情况下,某果网年产植为20阳万元,根据以上数据,以得
到最高枚按(收接一产值一防害费用》为日标,清为果农从以下几个方案中核荐量
住防害方案,并说明理由
方案1:透择尊害拾南A,可以防治各种气围的红魏蛛虫害,费用是18万:
方案2:选举防害推随B,可以翡油22℃至28C的售能虫害,但无法背治28℃以
上的红袋虫素,壹用是10万:
方案3:不果收防虫害推蓝
A
单元过关松潮(十八)数学第7面(黄8夏
衡水真
19,(17分)某校20名学生的数学成續x,G=1,2,,20》和知识竟赛成镜y:《=1,2,,
20)如下表:
学生编号
3
4
】
810
数学成绩工
18099
36
9
99
58
072
如秋典赛设绩少
29016022020
0
030060270
学生编号
13141516
1711g29
数学规填4分7472m6860503935
细买觉赛线绩y53形00350的510多
计算可得数学成镜的平均值是云=75,知识竟赛成镜的平均值是)=0,并且
a,--6464,(y,--14940,x,-Py,-9-2150,
(1)求这组学生的数学成靖和知识竞赛度领钓样本相关系数(精丽到0.01).
(2)设N∈N",变量z和变量y的-组样本数据为(xy,i一1,2,m,N1,其中x
(行=1,2,…,N)两两不相同y.(■1,2,…,N)两两不相同.记,在{x,期=1,2,
,N1中的格名是第R,2,y,在{y。e一1,2,…,N)中的排名是第5,位,1一1,2,
·,N,定义变量x和变量广的断皮尔曼相关系数(记为·)为变量x的排名和变
量y的排名的样本相关承数。
①记d-R,3.1-1,2…,N.证明e-1-NN-万之
否用①的公式求这妇学生的数学成端和日识竟赛成镜的“斯皮尔曼相美系数”(精
确到Q01).
(3)比较1)和(2》由的计算结果,算述“斯皮尔曼相关系数”在分析线性相美性时的
优势
2x,-y,y)
生:参考公式与参考数据:r
Sn+D(2n+1
6441×14950¥31000
密鞋
单元过关检测I十八》数学第8页(共8页引·数学·
14、3,15、4
53
则P(=0)=2××亏+2×8×7=140
12、4,142,13
P(-1)=z×6×5+2×
十
.51..5.3449
×7+2×8×7=840'
1
2.11、3273
P(g=2)=2×6×+2×8×7=840
故随机变量:的分布列为:
0
2
53
449
73
140
840
840
所以Ee0-品x0+铝×1+品×2-品
53
19.解:(1)因为购买单程上山票、单程下山票和双
程票的人数之比为3:5:2,所以这10人中,购
买单程上山票、单程下山票和双程票的人数分
别为:10×品-3,10×品-5,10×品-2,
3
5
故随机抽取的4人中恰有2人购买单程上山票
的概率P=
CC号3
C。101
(2)①从m+2人中任选2人,有C+2种选法,
其中购票类型相同的有C十C竖种选法,则询问
的某组被标为B的概率p=1
c+C3-1-
Ch+:
2024一2025学年度单元过关检测(十
一、选择题
1.B【解析】因为所有样本,点均在直线y=一2x+
1上,所以回归直线方程是y=一2x十1,可得这
两个变量是负相关,故这组样本数据的样本相关
系数为负值,且所有样本,点都在直线上,则有|
=1,所以样本相关系数r=一1.
2,B【解析】对于回归模型,残差平方和越小,回归
模型的椒合效果越好,故拟合效果最好的模型是
模型②.
3.A【解析】从图象中看出y随x增大而减小(图
象下降),v随u增大而减小(图象下降),则y与
x呈负相关关系,v与M呈负相关关系,即r1<0,
rg<0,故C,D错误;另外对比两图,容易看出y
·29
参考答案及解析
m2-m十2
Am
m2+3m+2m2+3m+2
②由题意,5组中恰有3组被标为B的概率
g(p)=Cgp3(1-p)2=10p3(1-2p+p2)=
10(p3-2p+p5),
所以g'(p)=10(3p2-8p3+5p‘)=10p*(p
1)(5p-3),0<p<1,
所以当p∈(0,)时g'(p)>0,函数g(p)单
调递增,
当p∈(后,1)时,g(p)<0,函数g(p)单调递
减,
3
所以当p=亏时,g(p)取得最大值,且最大值为
()-x(》八x1-}'-器
m3+3m+25,m>2且m∈N·,得m
4m
3
由p
=3.
当m=3时,5组中恰有3组被标为B的概率最
大,且g(p)的最大值为25
216
八)
数学·成对数据的统计分析
与x相关性更强,故r1更接近一1,所以得一1<
r1<r2<0,故A正确,B错误.
B【解析】完善2X2列联表如下:
被某病幸
未赦某病
合计
感柒
毒感荣
注射疫苗
10
40
50
未注射瘦苗
20
0
50
合计
30
70
100
零假设H。:给基因编辑小鼠注射该疫苗不能起
到预防孩病毒感柒的效果.
X=
100(10×30-20×40)2
≈4.762,而3.841
30×70×50×50
A
衡水真题密卷
4.7626.635
所以根据小概率值a=0.05的x2独立性检验,
推断H。不成立
即认为给基因编辑小鼠注射孩疫苗能起到预防
该病毒感染的效果
5D【解析】依题意,因为之x,=30,所以x=
30
6
=5,因为线性回归方程为y=2x十3一定过
点(x,y),所以y=2x+3=2×5+3=13,所
以2,=6×13=78,
6.D【解析】由题意知父亲身高x(cm)与儿子身
高y(cm)具有线性相关关系,不是函数关系,故
A错误:当父亲身高增加1cm时,儿子身高约增
加0.85cm,故B错误;当儿子身高为172cm时,
代入y=0.85x+29.5,可得x≈167.6,父亲身高
可能为167.6cm,故C错误;父亲身高为170cm
时,其儿于的身高估计为0.85×170十29.5=
174cm,故D正确
7.B【解析】由题意得z=十2十十五=2,
7
故x=x+1=3,即lny1+lnya+…+lny,=3×7
=21,故ln(y1y…y,)=21,解得y1y2“y,=e”.
8.C【解析】因为相关系数r=
2--刀
-8.4
≈一1,
√2红-2,-列
V10X7.06
4-1
即相关系数近似为一1,所以y与x负相关,且相
关程度相当高,从而可用线性回归模型拟合y与
x的关系.所以A,B,D错误,C正确」
二、选择题
9.ABD【解析】根据题意,散点图在5个(x,y)数
据中去掉D(3,10),可得y与x的相关性变强,
并且是正相关,所以相关系数?变大,相关指数
R变大,残差的平方和变小,所以A,B,D正确,
C错误.
1O.ABD【解析】由表格可知,x越大,y越大,所
以x与y有正相关关系,故A正确;x
5+6+8+9+12-8,y-16+20+25+28+36
5
=25,样本点中心为(8,25),经验回归直线经过
点(8,25),故B正确;将样本点中心代入经验回
归方程,得25=86十2.6,所以b=2.8,故C错
3
单元过关检测
误;y=2.8x十2.6,当x=9时,y=27.8,y-y
=28-27.8=0.2,故D正确.
11.AC【解析】对于A,喜爱物理学科的学生共有
60十20一80名,故喜爱物理学科的学生中,男生
603
的频率为80?,放A正确:对于B,女生共有
100名,喜爱物理的女生有20名,故女生中喜爱
201
物理学科的频率为1005,故B错误:对于C,
D,x2=
200×(60×80-20×40)_100
3
≈33.333
100×100×80×120
>10.828,故根据小概率值a=0.001的X2独
立性检验,可以推断学生是否喜爱物理学科与
性别有关,即在犯错误的概率不超过0.1%的前
提下,认为学生是否喜爱物理学科与性别有关,
C正确,D错误」
三、填空题
12.一0,5【解析】依题意,z-0+1+2+3+4_
5
2,y=10+15+20+30+35=22,代入回归支线
5
y=6.5x十a,解得a=9,所以回归直线为y=
6.5x+9,当x=1时,y=15.5,图此残差为15
-15.5=-0.5.
16【标1x-->
2.706,解得x>13.3947,因为x∈N°且x<20,
所以x=14或15或16或17或18或19,共6
个取值
14.正0.99【解析】由表中数据得y随x的增大
而增大,所以该老师每天一次最多答对题数y
Bxo-Tzy
与天数x之间是正相关,r=
-
1
600-7×4×19
1
②-
√140-7×4W
√2695-7×19
68
1
17
27×2夜^7×2.50.9.
四、解答题
15,解:1)由题意得y=82+93+95+108+122_
5
100,
5[(82-100)2+(93-100)2+(95-100)2
1
52=
+(108-100)2+(122-100)=189.2,
·数学·
所以语文成绩y的平均数为100,方差为189.2.
(2)零假设H。:喜欢阅读古典名著与语文成绩
优秀无关。
根据表中数据,可得x2
200×(75×45-55×25)2800
130×100×70×100
9T≈8.791>
6.635=x0.01
所以根据小概率值a=0.01的x2独立性检验,
H。不成立,
故可以认为“喜欢阅读古典名著与语文成绩优
秀”有关。
16.解:1)因为x-80X30×20-10×20
-≈5.33
40×40×30×50
<6.635,
所以学校和数学成绩优秀率之间没有关系,
所有数据都扩大10倍后:
800×(300×200-100×200)2
53.3>6.635,
400×400×300×500
这时学校和数学成绩优秀率之间有关系,
所以在相同的检验标准下,再用独立性检验推断学
校和数学成绩优秀率之间的关联性,结论不一样,
主要是因为样本容量的不同,当样本容量越大
时,用样本估计总体的准确性会越高.
(2)抽取甲、乙、丙三所学校优秀学生人数分别为
24x
406,30x20
×40-15,30%×30=9,
记A1,A2,A,分别为事件“抽到的学生来自甲、
乙、丙学校”,B为事件“抽到一名优秀学生”,
24
2
则P(A1)=
24+30+30=7,P(A2)=P(A,)
30
5
-24+30+3014'
61
151
P(BA)=2TP(BA:)-302
93
P(BA,)=3010'
所以P(B)=P(B|A1)P(A1)+P(B|A:)·
P(A2)+P(BIA)P(A)
=×号+×+品×-品
所以从中抽到了一名优秀学生,该学生来自丙
P(A B)
校的概率为P(A,|B)=
P(B)
3.5
P(B|A3)P(A)10143
P(B)
6
101
14
3
参考答案及解析
17.解:(1)根据散点图推断变量y与t线性相关,说
明如下:
由题意得7-1+2+3+4+5+6+7_28
7
4,
2,-0=(-3》+(-2+(1+0+1
+22+32=28,
2,-0D(0y,-y=2y,-7iy=39.33-4×
=1
9.06=3.09,
故r=
3.09
3.09
28X0.362×2.646X0.6≈0.97,
y与t的相关系数约为0.97,所以y与t线性相
关,相关程度高。
9.06
(2)由y=
7
≈1.29以及(1)可得i=
24,-i0(y-y3.09
0.11,
(t:-t)
28
1
则a=y-6t≈1.29-0.11×4≈0.85,
故y关于t的回归方程为y=0.85+0.11t,
将2024年对应的年份代码:=9代人回归方程
得y=0.85+0.11×9=1.84,
故预测2024年该市生活垃圾无害化处理量约
为1.84万吨
18.解:(1)由散点图可以判断,y=ce“更适合作为
平均产卵数y关于平均温度x的回归方程类型。
(2)将y=ce两边同时取自然对数,可得lny=
In c+dx,
由题中的数据可得,多x2,一7z2=33.6,
2(x,-x)2-2x-7x-112,
1
所以a-
2x,一7x8
33.6
x-7x2
112
=0.3,
-1
则lnc=g-dx=3.6-0.3×27=-4.5,
所以之关于x的线性回归方程为之=0.3x一4.5,
故y关于x的回归方程为y=e-45
(3)用X1,X。和X,分别表示选择三种方案的
收益
采用第1种方案,无论气温如何,产值不受影
响,收益为200一18=182万,即X1=182:
A
衡水真题密卷
采用第2种方案,不发生28℃以上的红蜘蛛虫
害,收益为200一10=190万,
如果发生,则收益为100一10=90万,即
190,不发生28℃以上的红蜘蛛虫害,
X2=
90,发生28℃以上的红蜘蛛虫害,
同样,采用第3种方案,有
200,不发生虫害,
X。=160,只发生22一28℃的红蜘蛛虫害,
100,发生28℃以上的红蜘蛛虫害,
所以E(X,)=182,
E(X:)=190×P(X:=190)+90×P(X2=90)
=190×0.9+90×0.1=171+9=180,
E(X,)=200×P(X,=200)+160×P(X,=
160)+100×P(X1=100)=200×0.6+160×
0.3+100×0.1=178.
E(X1)>E(X)>E(X,),所以选择方案1最佳.
19.解:(1)由题意,这组学生数学成绩和知识竞赛
2x,-30-D
成绩的样本相关系数为r=
21650
21650
√6464×149450
31000
≈0.70.
(2)①证明:因为{R:}和{S:}都是1,2,…,N的
一个排列,所以
=s,=
N(N+1)
1
2
之R:-含sg=NCN+12N+D
从而R:}和S,)的平均数都是R=5=N+出
2
因此,之(R,-F=之R-2R含R,+之R
R:-NR:-N(N+1)(2N+1)
6
N(N+1)2N(N+1)(N-1)
12
同理可得含(S,-S)=NN+1DW-1D
由于之d-之R,-S,)-2[R,-)-(S
-5)]
A
·32
单元过关检测
=(R:-R)+(S,-S)2-22(R,-R)·
4=1
4=1
4=
(S:-5)=2·
N(N+1)(N-1)
12
-22(R
-F)(S:-S),
(R:-R)(S,-S)
所以P=
=1
2R,-S,-S
N(N+D(N-D_1d
12
26
6
NN+1D(N-1)
=1-
NAN-D
②
②由题目数据,可写出R,与S,的值如下:
同学编号:
7
9
10
数学成绩
2
3
45
678
9
10
排名R,
知识竞赛
5
3
9
8
7
6
10
2
成绩排名S
同学编号i11121314151617181920
数学成绩
11121314151617181920
排名R
知识竞赛成
12141311161517181920
绩排名S
所以N=20,并且之d?=9×02+4×12+3×2
i=1
+2×3+1×42+1×82-114.
因此这组学生的数学成绩和知识竞赛成绩的斯
皮尔曼相关系数是
6
p=1-20×(20-D×114≈0.91.
(3)答案①:斯皮尔曼相关系数对于异常值不太
敏感,如果数据中有明显的异常值,那么用斯皮
尔曼相关系数比用样本相关系数更能刻画某种
线性关系:
答案②:斯皮尔曼相关系数刻画的是样本数据
排名的样本相关系数,与具体的数值无关,只与
排名有关.如果一组数据有异常值,但排名依然
符合一定的线性关系,则可以采用斯皮尔曼相
关系数刻画线性关系。