内容正文:
湘教版高中数学选择性必修第二册
第四章:统计单元测试卷
命题人:李文元
(考试时间:120分钟试卷满分:150分)
班级:
姓名:
成绩:
注意事项:
1.答卷前,考生务必将自己的姓名、准考证号等填写在答题卡和试卷指定位置上。
2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。
如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答
题卡上。写在本试卷上无效。
3.考试结束后,将本试卷和答题卡一并交回。
4.考试范围:湘教版(2019)选择性必修第二册第四章:统计
第一部分(选择题共58分)
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只
有一项是符合题目要求的,
1.观察下列散点图,其中两个变量的相关关系判断正确的是()
w…
●
a
b
A.a为正相关,b为负相关,c为不相关B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关D.a为正相关,b为不相关,c为负相关
【答案】D
【分析】根据散点图中点的分布特征,结合相关性的定义,即可得出结论
【详解】根据散点图,由相关性可知:图α各点散布在从左下角到右上角的区域里,是正相
关
图b中各点分布不成带状,相关性不明确,所以不相关:
图c中各点分布在从左上方到右下方的区域里,是负相关,
故选:D
2.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()
05101520253035
05101520253035
样本相关系数为
样本相关系数为r2
0
。。·。
0
5101520253035
0
5101520253035
样本相关系数为
样本相关系数为r4
A.53<<0<5<片
B.4<2<0<1<3
C.r<2<0<5<I
D.1<14<0<1<53
【答案】A
【分析】由相关系数的意义结合散点图即可求解
【详解】由图可知,5都是正线性相关关系,1,4都是负线性相关关系,且,相关性更强,
所以5>5>0>T4>5.故选:A
3.某公司根据近几年经营经验,得到广告支出X(单位:万元)与获得利润Y(单位:万
元)的数据如下:
广告支出X/万元
2
J
8
11
15
19
利润Y/万元
33
45
50
53
58
64
根据表中数据可得利润Y关于广告支出X的线性回归方程为y=x+34.据此线性回归方
程,若计划利润达到100万元,估计需要支出广告费()
A.30万元
B.32万元
C.36万元
D.40万元
【答案】D
【分析】先求得样本点的中心点坐标,代入Y=x+34求出)得回归直线,再由Y求得X
【详解1x=2+5+8+11+15+19=10,=33+45+50+53+58+64-50.5,
6
6
因为回归直线Y=X+34过点(c,),所以50.5=b×10+34,得b=1.65,
故当Y=100时,1.65X+34=100,得X=40.故选:D.
4.某产品的研发费用x万元与销售利润y万元的统计数据如表所示,
研发费用x(万元)
4
2
3
5
利润y(万元)
49
26
39
仙
根据上表可得回归方程.)=bx+à中的b=9.4.据此模型预计研发费用为6万元时,利润为
65.5,则a,m=()
A.a=9.4,m=52
B.à=9.1,m=53
C.a=9.1,m=54
D.à=9.2,=54
【答案】C
【分析】将(6,65.5)代入=bx+à可求à,再根据回归方程经过样本中心点,可求m
【详解】由题意:9.4x6+a=65.5→a=9.1
所以y=9.4x+9.1.
又由已知数据,x=4+2+3+57
4
子-9+26+39+加14+m
4
4
又=94x+9.1经过(,可),所以94×7+
)+9.1=114+"22=54
4
所以a=9.1,m=54.
故选:C
5.某班主任对全班50名学生进行了作业量的调查,数据如下表:
作业量
性别
大
不大
总计
男
18
9
27
女
8
15
23
总计
26
24
50
则推断学生的性别与认为作业量大有关”的把握为()
附表
P(x2≥k)
0.050
0.010
3.841
6.635
A.95%
B.5%
C.99%
D.100%
【答案】A
【分析】由独立性检验知识可判断选项正误,
【详解】由独立性检验公式得才-50x18x15-8x9-5059>3.841,
27×23×26×24
所以推断“学生的性别与认为作业量大有关的把握为95%.
故选:A
6.甲、乙、丙、丁四位同学各自对,A,B两变量的线性相关性做试验,并用回归分析方法
分别求得相关系数r与残差平方和如下表:
甲
丙
丁
0.82
0.78
0.69
0.85
L
106
115
124
103
则能体现A,B两变量有更强的线性相关性的是()
A.甲
B.乙
C.丙
D.丁
【答案】D
【分析】在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于1,相关性越
强,残差平方和越小,相关性越强,得到结果。
【详解】在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于1,相关性越
强,
在四个选项中只有丁的相关系数最大,
残差平方和越小,相关性越强,只有丁的残差平方和最小,
综上可知丁的试验结果体现A、B两变量有更强的线性相关性,故选:D.
7.已知随机变量x,y(x>O,y>O)呈现非线性关系.为了进行线性回归分析,设u=3ny,
v=(4x-5,利用最小二乘法,得到线性回归方程!=-+3,则变量y的估计值有()
4
A.最大值为eB.最小值为e
C.最大值为e
D.最小值为e
【答案】A
【分析】先根据已知条件将=3y,v=(4x-5)代入线性回归方程,然后通过对数函数
的性质求出y的最值。
【详解】已知u=-二v+3,把u=3ny,v=(4x-5)2代入可得:
4
3ny=--(4x-5)2+3.
得到lhy=-
4-1
因为4-≥0,所以-方4r-c0,影么立4x-+1s1,即ny≤1.
因为对数函数y=lnx在(0,+o)上单调递增,且lny≤l=lhme,所以y≤e,即y有最大值为e
变量y的估计值有最大值为e.
故选:A
8.为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取女
性人数是男性人数的2倍,男性客爱钓鱼的人数占男性人数的?,女性喜爱的鱼的人数古女
性人数的},
若有95%的把握认为是否喜爱钓鱼与性别有关,则被调查的男性至少有()
(参考数据:
363
≈0.82)
442
A.8人
B.10人
C.15人
D.20人
【答案】B
【分析】设被调查的男性有x人,由题可得列联表,由卡方计算公式可得x>4.68,然后结
合选项及x可被10整除可得答案
【详解】设被调查的男性有x人,则女性有2x人,根据题意,可得2×2列联表如下:
性别
钓鱼
男性
女性
总计
喜欢钓鱼
13x
5
10
不喜欢钓鱼
17x
5
2
10
总计
2x
3x
3xx
4x 3x xx
则X2=
225
363x
≈0.82x,本次调查得出“有95%的把握认为是否喜爱钓
13x、17x
442
1010
鱼与性别有关”的结论,可得0.82x>3.841,解得x>4.68,
又因为列联表中相关人数需为整数,则x=10m,n∈N,
所以结合选项,被调查的男性至少有10人.故选:B
二、多项选择题:本题共3小题,每小题6分,共18分。在每小题给出的选项中,有多项
符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分
9.下列关于变量间的线性相关系数?说法正确的是()
A.相关系数r的取值范围为[-1,]
B.|r=1的充要条件是成对数据构成的点都在回归直线上
C.两个变量正相关的充要条件是r>0
D.相关系数r越小,则变量间的线性相关性越弱
【答案】ABC
【分析】利用相关系数r的取值范围判断选项A;利用r=1的充要条件判断选项B:利用
两个变量正相关的充要条件判断选项C;利用变量间的线性相关性与r的关系判断选项D.
【详解】选项A:相关系数r的取值范围为[-1,1]判断正确
选项B:|r=1的充要条件是成对数据构成的点都在回归直线上判断正确:
选项C:两个变量正相关的充要条件是r>0.判断正确:
选项D:相关系数r的绝对值越小,则变量间的线性相关性越弱.判断错误故选:ABC
10.某类汽车在某年1至5月的销量Y(单位:千辆)如下表所示(其中2月份销量未知):
月份X
1
2
3
4
5
月销量Y
2.4
m
4
U
5.5
若变量Y与X之间存在线性相关关系,用最小二乘法估计建立的线性回归方程为
Y=0.81X+1.57,则下列说法正确的是()
A.m=3.1
B.样本相关系数r<0
C.据该模型可以预测12月份的销量为11.29千辆D.变量X每增加1,变量Y增加0.81
【答案】AC
【分析】对于A,根据回归直线必过样本中心点(,)可解得;对于B,根据表格和相关
系数的意义,即可判断:对于C,利用回归方程可求出预测值即可判断:对于D,经验回
归直线方程的意义,即可判断
【详解】对于A,由题意知,回归直线必过样本点的中心(,)),由Y=0.81X+1.57,
又x=1+2+3+4+5=3,代入方程得y=0.81×3+157=4,
5
所以24+m+4+5+55=4,解得m=31,故A正确。
5
对于B,由表格可知变量Y与X正相关,则r>0,故B错误.
对于C,当X=12时,Y=0.81×12+1.57=11.29,即预测12月份的销量为11.29千辆,故C
正确.对于D,线性回归模型只起到预测作用,变量X每增加1,变量Y不一定增加0.81,
故D错误,故选:AC.
11.电动车的安全问题越来越引起广大消费者的关注,目前电动车的常用电池有锂电池与铅
酸电池两种.某公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500
名市民,其中被调查的女性市民中偏好铅酸电池电动车的占
并得到下表.则下列说法正
确的是()
偏好情况
性别
偏好锂电池电动车
偏好铅酸电池电动车
男性
200
100
女性
Q
b
A.b-a=40
B.该市大约有65%的市民偏好锂电池电动车
C.有95%的把握认为市民对这两种电池的电动车的偏好与性别有关
D.若采用分层随机抽样的方法从偏好锂电池电动车的市民中随机抽取7人,再从这7
名市民中抽取2人进行座谈,则有女性市民参加座谈的概率为
21
【答案】AC
【分析】完成2×2列联表可判断A:根据样本中偏好锂电池电动车的比例估计总体可判断B:
求出x2可判断C:采用分层随机抽样的方法抽取的7人中,男性市民有5人,女性市民有2
人,利用古典概型求出概率可判断D错误。
【详解】对于A,被调查的女性市民人数为500-200-100=200,
其中偏好铅酸电池电动车的女性市民人数为200×3=120,
偏好锂电池电动车的女性市民人数为200-120=80,所以2×2列联表为:
偏好情况
性别
偏好锂电池电动车
偏好铅酸电池电动车
总计
男性
200
100
300
女性
80
120
200
总计
280
220
500
故a=80,b=120,b-a=40,故A正确:
对于B,由A选项中的列联表,知样本中偏好锂电池电动车的比例
为280
500x1006=566,故由样本估计总体,该市大约有56%的市民偏好
锂电池电动车,故B错误;对于C,根据列联表中的数据可以求得
元=50020x120,80x100=34.632>3841,
300×200×280×220
故有95%的把握认为市民对这两种电池的电动车的偏好与性别有关,故C正确:
2005
对于D,因为偏好锂电池电动车的市民中,男性市民与女性市民的比值为
80-2
所以采用分层随机抽样的方法抽取的7人中,男性市民有5人,女性市民有2人.
方法一设有女性市民参加座谈为事件A,则P(4=CC+C=马
C
21
方法二设这5名男性市民和2名女性市民分别为A,B,C,D,E,a,b,
则从这7人中抽取2人的基本事件有(A,B),(A,C),(A,D),(A,E),(A,a),(A,b),(B,C),(B,D)
(B,E),(B,a),(B,b),(C,D),(C,E),(C,a,(C,b),(D,E),(D,a),(D,b),(E,a),(E,b),(a,b),
共21件精况,共中有交性市民参加库读的有1种情况,放所求既率为分故D信误。
故选:AC
第二部分(非选择题共92分)
三、填空题:本题共3小题,每小题5分,共15分
12.己知变量Y与X线性相关,由样本点(x,y)(x=i,i=1,2,3,4,5)求得的线性回归方程为
立专+a,若点(化火)在国归直线上.且头=2,则立g-
【答案】6
【分析】依题意,可得点(5,2)在回归直线上,求得ā,将条件代入回归方程求出y,利用
平均数公式即可求得
【详解】由题意,点(6,2)在回归直线上,代入9=专+à可得:2-1+a:解得a=1.
又x=1+2+3+4+5-3,且样本点的中心(区,列)在回归直线上,
5
故代入得=x3+1=
,最后得结果,则2+2=5×88,解得必y=6
8
5
=
故答案为:6
13.近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,
如图所示:
年份
2
3
4
5
羊只数量/万只
1.4
0.9
0.75
0.6
0.3
草地植被指数
1.1
4.3
15.6
31.3
49.7
草地植被指数
60H
50
4
30
●
20
10
0.5
11.5羊只数量/万只
若利用这五组数据得到的两变量间的相关系数为5,去掉第一年数据(14,1.1)后得到的相关
系数为2,则1(填≥,≤,<,>)
【答案】>
【分析】根据散点图可知两个量呈负相关,且去掉数据(1.4,11)后相关性变强,结合相关系
数的概念判断即可
【详解】根据散点图可知,羊只数量与草地植被指数呈负相关,则相关系数<0,?2<0
当去掉第一年数据(1.4,1.1)后,数据的线性相关性变强,所以<,所以5>?.
故答案为:>
14.下列说法中正确的是
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程)=3-5x,变量x增加1个单位时,)平均增加5个单位;
③设具有相关关系的两个变量x、y的相关系数为?,则越接近于0,x和y之间的线性
相关程度越强:
④在一个2×2列联表中,由计算得x的值,则x的值越大,判断两个变量间有关联的把握
就越大。
【答案】①④
【分析】利用方差的性质判断①的正误;利用回归直线的性质判断②,相关系数判断③,独
立检验判断④
【详解】对于①,将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,满足
方差的性质,①正确:
对于②,设有一个线性回归方程)=3-5x,变量x增加1个单位时,少平均减少5个单位:
所以②不正确:
对于③,设具有相关关系的两个变量x,y的相关系数为r,则越接近于0,x和y之间的
线性相关程度越弱,所以③不正确:
对于④,在一个2×2列联表中,由计算得x的值,则x的值越大,判断两个变量间有关联
的把握就越大,所以④正确:故答案为:①④.
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤
15.(13分)2019年11月份,全国工业生产者出厂价格同比下降1.4%,环比下降0.1%.某
企业在了解市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制
定相应的出厂价格.该企业统计了2019年1一10月份产品的生产数量x与销售总额y之间
的关系,如下表所示
湘教版高中数学选择性必修第二册
第四章:统计 单元测试卷
命题人:李文元
(考试时间:120分钟 试卷满分:150分)
班级: 姓名: 成绩:
注意事项:
1.答卷前,考生务必将自己的姓名、准考证号等填写在答题卡和试卷指定位置上。
2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无效。
3.考试结束后,将本试卷和答题卡一并交回。
4.考试范围:湘教版(2019)选择性必修第二册第四章:统计
第一部分(选择题 共58分)
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的.
1.观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
2.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B. C. D.
3.某公司根据近几年经营经验,得到广告支出(单位:万元)与获得利润(单位:万元)的数据如下:
广告支出万元
2
5
8
11
15
19
利润万元
33
45
50
53
58
64
根据表中数据可得利润关于广告支出的线性回归方程为.据此线性回归方程,若计划利润达到100万元,估计需要支出广告费( )
A.30万元 B.32万元 C.36万元 D.40万元
4.某产品的研发费用x万元与销售利润y万元的统计数据如表所示,
研发费用x (万元)
4
2
3
5
利润y (万元)
49
26
39
m
根据上表可得回归方程.中的 .据此模型预计研发费用为6万元时,利润为65.5, 则( )
A. B.
C. D.
5.某班主任对全班50名学生进行了作业量的调查,数据如下表:
性别
作业量
大
不大
总计
男
18
9
27
女
8
15
23
总计
26
24
50
则推断“学生的性别与认为作业量大有关”的把握为( )
附表:
A. B. C. D.
6.甲、乙、丙、丁四位同学各自对,A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则能体现A,B两变量有更强的线性相关性的是( )
A.甲 B.乙 C.丙 D.丁
7.已知随机变量呈现非线性关系.为了进行线性回归分析,设,,利用最小二乘法,得到线性回归方程,则变量的估计值有( )
A.最大值为 B.最小值为 C.最大值为 D.最小值为
8.为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取女性人数是男性人数的2倍,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性至少有( )(参考数据:)
A.8人 B.10人 C.15人 D.20人
2、 多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.下列关于变量间的线性相关系数说法正确的是( )
A.相关系数的取值范围为
B.| r |=1的充要条件是成对数据构成的点都在回归直线上
C.两个变量正相关的充要条件是
D.相关系数r越小,则变量间的线性相关性越弱
10.某类汽车在某年1至5月的销量(单位:千辆)如下表所示(其中2月份销量未知):
月份
1
2
3
4
5
月销量
2.4
4
5
5.5
若变量与之间存在线性相关关系,用最小二乘法估计建立的线性回归方程为,则下列说法正确的是( )
A. B.样本相关系数
C.据该模型可以预测12月份的销量为11.29千辆 D.变量每增加1,变量增加0.81
11.电动车的安全问题越来越引起广大消费者的关注,目前电动车的常用电池有锂电池与铅酸电池两种.某公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500名市民,其中被调查的女性市民中偏好铅酸电池电动车的占,并得到下表.则下列说法正确的是( )
性别
偏好情况
偏好锂电池电动车
偏好铅酸电池电动车
男性
200
100
女性
A.
B.该市大约有65%的市民偏好锂电池电动车
C.有95%的把握认为市民对这两种电池的电动车的偏好与性别有关
D.若采用分层随机抽样的方法从偏好锂电池电动车的市民中随机抽取7人,再从这7名市民中抽取2人进行座谈,则有女性市民参加座谈的概率为
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分.
12.已知变量与线性相关,由样本点求得的线性回归方程为,若点在回归直线上,且,则 .
13.近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
年份
1
2
3
4
5
羊只数量/万只
1.4
0.9
0.75
0.6
0.3
草地植被指数
1.1
4.3
15.6
31.3
49.7
若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则 (填,,,)
14.下列说法中正确的是 .
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程,变量增加1个单位时,平均增加5个单位;
③设具有相关关系的两个变量、的相关系数为,则越接近于0,和之间的线性相关程度越强;
④在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大.
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤.
15.(13分)2019年11月份,全国工业生产者出厂价格同比下降,环比下降.某企业在了解市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制定相应的出厂价格.该企业统计了2019年1-10月份产品的生产数量与销售总额之间的关系,如下表所示.
万件
2.08
2.12
2.19
2.28
2.36
2.48
2.59
2.68
2.80
2.87
万元
42.5
43.7
44.0
45.5
46.4
47.5
49.2
50.3
51.4
52.6
(1)计算的值;
(2)计算样本相关系数的值,并通过的值的大小说明与之间的相关程度.
16.(15分)某公司销售的3D卡通纪念章很受欢迎,国庆长假第一天每件售价为20元,卖出了100百件.为了缓解进货压力,同时保证销售额不下降,决定从第二天起开始涨价.根据往年的市场调研得出的规律,该种商品涨价会导致销量下降,具体数据如下:
每件涨价元
1
2
3
4
5
销量下降百件
1
2
8
14
15
(1)由统计表看出,可用线性回归模型拟合与的关系,试建立与的回归方程.
(2)由(1)中的回归方程预测,当售价为多少元时,该款商品的日销售额最大,最大销售额是多少百元?
参考公式:对于一组具有线性相关关系的数据,其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
17.(15分)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区随机抽取200人进行调查,得到如下列联表:
学业成绩
日均体育锻炼时长(单位:小时)
其它
合计
优秀
40
60
100
不优秀
25
75
100
合计
65
135
200
(1)记学业成绩优秀的学生中日均体育锻炼时长为1至2小时的概率为,给出的估计值;
(2)是否有95%的把握认为学业成绩优秀与日均体育锻炼时长为1至2小时有关?
附:.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
18.(17分)某学术平台引入智能检测系统对所收集的文本进行筛查.检测系统对AI生成文本的识别准确率为98%,对人类撰写文本的识别准确率为96.5%.检测系统对所收集的文本进行筛查时,会对每篇文本输出一个“AI生成概率”得分y(分).y与文本长度x(字)可以用一元线性回归模型来刻画,其线性回归方程为,且,,已知该平台中15%的文本由AI生成.
(1)求回归系数;
(2)从该平台随机选取一篇文本,求该文本被检测系统识别为人类撰写文本的概率(精确到0.001);
(3)现从平台中随机抽取200篇文本进行统计分析,填写列联表(篇数四舍五入取整数):
文本真实性
检测结果
总计
识别为AI生成(篇)
识别为人类撰写(篇)
真实AI生成(篇)
真实人类撰写(篇)
总计
200
依据小概率值的独立性检验,能否判断“检测结果”与“文本真实性”有差异?
参考公式:
提示:独立性检验中常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
19.(17分)某研发团队实现了从单点光谱仪到超光谱成像芯片的跨越.为制定下一年的研发投入计划,该研发团队需要了解年研发资金投入(单位:亿元)对年销售额(单位:亿元)的影响.结合近12年的年研发资金投入和年销售额,该团队建立了两个函数模型:①,②,其中均为常数,e为自然对数的底数.经对数据的初步处理,得到散点图如图.令,,计算得到如下数据.
20
66
770
200
14
460
4.20
3125000
0.308
21500
(1)设变量和变量的样本相关系数为,变量和变量的样本相关系数为,请从样本相关系数的角度,选择一个与相关性较强的模型.
(2)(ⅰ)根据(1)的选择及表中数据,建立关于的回归方程(系数精确到0.01);
(ⅱ)若下一年销售额需达到80亿元,预测下一年的研发资金投入.
附:,.
学科网(北京)股份有限公司
$
湘教版高中数学选择性必修第二册
第四章:统计 单元测试卷
命题人:李文元
(考试时间:120分钟 试卷满分:150分)
班级: 姓名: 成绩:
注意事项:
1.答卷前,考生务必将自己的姓名、准考证号等填写在答题卡和试卷指定位置上。
2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无效。
3.考试结束后,将本试卷和答题卡一并交回。
4.考试范围:湘教版(2019)选择性必修第二册第四章:统计
第一部分(选择题 共58分)
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的.
1.观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
【答案】D
【分析】根据散点图中点的分布特征,结合相关性的定义,即可得出结论.
【详解】根据散点图,由相关性可知:图a各点散布在从左下角到右上角的区域里,是正相关;
图b中各点分布不成带状,相关性不明确,所以不相关;
图c中各点分布在从左上方到右下方的区域里,是负相关.
故选:D
2.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【分析】由相关系数的意义结合散点图即可求解.
【详解】由图可知都是正线性相关关系,都是负线性相关关系,且相关性更强,
所以.故选:A
3.某公司根据近几年经营经验,得到广告支出(单位:万元)与获得利润(单位:万元)的数据如下:
广告支出万元
2
5
8
11
15
19
利润万元
33
45
50
53
58
64
根据表中数据可得利润关于广告支出的线性回归方程为.据此线性回归方程,若计划利润达到100万元,估计需要支出广告费( )
A.30万元 B.32万元 C.36万元 D.40万元
【答案】D
【分析】先求得样本点的中心点坐标,代入求出得回归直线,再由求得.
【详解】,,
因为回归直线过点,所以,得,
故当时,,得.故选:D.
4.某产品的研发费用x万元与销售利润y万元的统计数据如表所示,
研发费用x (万元)
4
2
3
5
利润y (万元)
49
26
39
m
根据上表可得回归方程.中的 .据此模型预计研发费用为6万元时,利润为65.5, 则( )
A. B.
C. D.
【答案】C
【分析】将代入可求,再根据回归方程经过样本中心点,可求.
【详解】由题意:.
所以.
又由已知数据,,.
又经过,所以.
所以,.
故选:C
5.某班主任对全班50名学生进行了作业量的调查,数据如下表:
性别
作业量
大
不大
总计
男
18
9
27
女
8
15
23
总计
26
24
50
则推断“学生的性别与认为作业量大有关”的把握为( )
附表:
A. B. C. D.
【答案】A
【分析】由独立性检验知识可判断选项正误.
【详解】由独立性检验公式得,
所以推断“学生的性别与认为作业量大有关”的把握为.
故选:A
6.甲、乙、丙、丁四位同学各自对,A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则能体现A,B两变量有更强的线性相关性的是( )
A.甲 B.乙 C.丙 D.丁
【答案】D
【分析】在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于1,相关性越强,残差平方和越小,相关性越强,得到结果.
【详解】在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于1,相关性越强,
在四个选项中只有丁的相关系数最大,
残差平方和越小,相关性越强,只有丁的残差平方和最小,
综上可知丁的试验结果体现、两变量有更强的线性相关性,故选:D.
7.已知随机变量呈现非线性关系.为了进行线性回归分析,设,,利用最小二乘法,得到线性回归方程,则变量的估计值有( )
A.最大值为 B.最小值为 C.最大值为 D.最小值为
【答案】A
【分析】先根据已知条件将,代入线性回归方程,然后通过对数函数的性质求出的最值.
【详解】已知,把,代入可得:
.
得到.
因为,所以,那么,即.
因为对数函数在上单调递增,且,所以,即有最大值为.
变量的估计值有最大值为.
故选:A.
8.为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取女性人数是男性人数的2倍,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性至少有( )(参考数据:)
A.8人 B.10人 C.15人 D.20人
【答案】B
【分析】设被调查的男性有人,由题可得列联表,由卡方计算公式可得,然后结合选项及可被10整除可得答案.
【详解】设被调查的男性有人,则女性有人,根据题意,可得列联表如下:
钓鱼
性别
男性
女性
总计
喜欢钓鱼
不喜欢钓鱼
总计
则,本次调查得出“有的把握认为是否喜爱钓鱼与性别有关”的结论,可得,解得,
又因为列联表中相关人数需为整数,则,,
所以结合选项,被调查的男性至少有10人.故选:B
2、 多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.下列关于变量间的线性相关系数说法正确的是( )
A.相关系数的取值范围为
B.| r |=1的充要条件是成对数据构成的点都在回归直线上
C.两个变量正相关的充要条件是
D.相关系数r越小,则变量间的线性相关性越弱
【答案】ABC
【分析】利用相关系数的取值范围判断选项A;利用| r |=1的充要条件判断选项B;利用两个变量正相关的充要条件判断选项C;利用变量间的线性相关性与r的关系判断选项D.
【详解】选项A:相关系数的取值范围为.判断正确;
选项B:| r |=1的充要条件是成对数据构成的点都在回归直线上.判断正确;
选项C:两个变量正相关的充要条件是.判断正确;
选项D:相关系数r的绝对值越小,则变量间的线性相关性越弱.判断错误.故选:ABC
10.某类汽车在某年1至5月的销量(单位:千辆)如下表所示(其中2月份销量未知):
月份
1
2
3
4
5
月销量
2.4
4
5
5.5
若变量与之间存在线性相关关系,用最小二乘法估计建立的线性回归方程为,则下列说法正确的是( )
A. B.样本相关系数
C.据该模型可以预测12月份的销量为11.29千辆 D.变量每增加1,变量增加0.81
【答案】AC
【分析】对于A,根据回归直线必过样本中心点可解得;对于B,根据表格和相关系数的意义,即可判断;对于C,利用回归方程可求出预测值.即可判断;对于D,经验回归直线方程的意义,即可判断.
【详解】对于A,由题意知,回归直线必过样本点的中心),由,
又,代入方程得,,
所以,解得,故A正确.
对于B,由表格可知变量与正相关,则,故B错误.
对于C,当时,,即预测12月份的销量为11.29千辆,故C正确.对于D,线性回归模型只起到预测作用,变量每增加1,变量不一定增加,故D错误.故选:AC.
11.电动车的安全问题越来越引起广大消费者的关注,目前电动车的常用电池有锂电池与铅酸电池两种.某公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500名市民,其中被调查的女性市民中偏好铅酸电池电动车的占,并得到下表.则下列说法正确的是( )
性别
偏好情况
偏好锂电池电动车
偏好铅酸电池电动车
男性
200
100
女性
A.
B.该市大约有65%的市民偏好锂电池电动车
C.有95%的把握认为市民对这两种电池的电动车的偏好与性别有关
D.若采用分层随机抽样的方法从偏好锂电池电动车的市民中随机抽取7人,再从这7名市民中抽取2人进行座谈,则有女性市民参加座谈的概率为
【答案】AC
【分析】完成列联表可判断A;根据样本中偏好锂电池电动车的比例估计总体可判断B;求出可判断C;采用分层随机抽样的方法抽取的7人中,男性市民有5人,女性市民有2人,利用古典概型求出概率可判断D错误.
【详解】对于A,被调查的女性市民人数为,
其中偏好铅酸电池电动车的女性市民人数为,
偏好锂电池电动车的女性市民人数为,所以列联表为:
性别
偏好情况
偏好锂电池电动车
偏好铅酸电池电动车
总计
男性
200
100
300
女性
80
120
200
总计
280
220
500
故,,,故A正确;
对于B,由A选项中的列联表,知样本中偏好锂电池电动车的比例
为,故由样本估计总体,该市大约有的市民偏好
锂电池电动车,故B错误;对于C,根据列联表中的数据可以求得
,
故有的把握认为市民对这两种电池的电动车的偏好与性别有关,故C正确;
对于D,因为偏好锂电池电动车的市民中,男性市民与女性市民的比值为,
所以采用分层随机抽样的方法抽取的7人中,男性市民有5人,女性市民有2人.
方法一 设“有女性市民参加座谈”为事件,则.
方法二 设这5名男性市民和2名女性市民分别为,
则从这7人中抽取2人的基本事件有
,,
共21种情况,其中“有女性市民参加座谈”的有11种情况,故所求概率为,故D错误.
故选:AC.
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分.
12.已知变量与线性相关,由样本点求得的线性回归方程为,若点在回归直线上,且,则 .
【答案】6
【分析】依题意,可得点在回归直线上,求得,将条件代入回归方程求出,利用平均数公式即可求得
【详解】由题意,点在回归直线上,代入可得,,解得.
又,且样本点的中心在回归直线上,
故代入得,最后得结果,则,解得.
故答案为:.
13.近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
年份
1
2
3
4
5
羊只数量/万只
1.4
0.9
0.75
0.6
0.3
草地植被指数
1.1
4.3
15.6
31.3
49.7
若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则 (填,,,)
【答案】
【分析】根据散点图可知两个量呈负相关,且去掉数据后相关性变强,结合相关系数的概念判断即可.
【详解】根据散点图可知,羊只数量与草地植被指数呈负相关,则相关系数,,
当去掉第一年数据后,数据的线性相关性变强,所以,所以.
故答案为:
14.下列说法中正确的是 .
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程,变量增加1个单位时,平均增加5个单位;
③设具有相关关系的两个变量、的相关系数为,则越接近于0,和之间的线性相关程度越强;
④在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大.
【答案】①④
【分析】利用方差的性质判断①的正误;利用回归直线的性质判断②,相关系数判断③,独立检验判断④.
【详解】对于①,将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,满足方差的性质,①正确;
对于②,设有一个线性回归方程,变量x增加1个单位时,平均减少5个单位;所以②不正确;
对于③,设具有相关关系的两个变量x,y的相关系数为r,则越接近于0,x和y之间的线性相关程度越弱,所以③ 不正确;
对于④,在一个2×2列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大,所以④正确;故答案为:①④.
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤.
15.(13分)2019年11月份,全国工业生产者出厂价格同比下降,环比下降.某企业在了解市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制定相应的出厂价格.该企业统计了2019年1-10月份产品的生产数量与销售总额之间的关系,如下表所示.
万件
2.08
2.12
2.19
2.28
2.36
2.48
2.59
2.68
2.80
2.87
万元
42.5
43.7
44.0
45.5
46.4
47.5
49.2
50.3
51.4
52.6
(1)计算的值;
(2)计算样本相关系数的值,并通过的值的大小说明与之间的相关程度.
【答案】(1) (2),与之间具有很强的相关性
【分析】(1)由平均数的计算公式得到和;
(2)由相关系数的计算公式计算,再由判断相关性.
【详解】(1)依题意,
(2)依题意,,,,
所以,
因为,所以与之间具有很强的相关性.
16.(15分)某公司销售的3D卡通纪念章很受欢迎,国庆长假第一天每件售价为20元,卖出了100百件.为了缓解进货压力,同时保证销售额不下降,决定从第二天起开始涨价.根据往年的市场调研得出的规律,该种商品涨价会导致销量下降,具体数据如下:
每件涨价元
1
2
3
4
5
销量下降百件
1
2
8
14
15
(1)由统计表看出,可用线性回归模型拟合与的关系,试建立与的回归方程.
(2)由(1)中的回归方程预测,当售价为多少元时,该款商品的日销售额最大,最大销售额是多少百元?
参考公式:对于一组具有线性相关关系的数据,其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1); (2)售价为23元时,日销售额最大,为2116百元.
【分析】(1)计算出,,再代入线性回归方程公式即可;
(2)设涨价元,再写出,最后利用二次函数性质即可求出最值.
【详解】(1),,
,
,则.
(2)设涨价元时,每日的销售额为百元,则
,则当时,销售额最大为2116百元,
此时售价为23元,日销售额最大,为2116百元.
17.(15分)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区随机抽取200人进行调查,得到如下列联表:
学业成绩
日均体育锻炼时长(单位:小时)
其它
合计
优秀
40
60
100
不优秀
25
75
100
合计
65
135
200
(1)记学业成绩优秀的学生中日均体育锻炼时长为1至2小时的概率为,给出的估计值;
(2)是否有95%的把握认为学业成绩优秀与日均体育锻炼时长为1至2小时有关?
附:.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1) (2)有的把握认为学业成绩优秀与日均体育锻炼时长为1至2小时有关
【分析】(1)根据列联表中的数据,结合古典摡型的概率计算公式,即可求解;
(2)根据列联表中的数据,利用公式求得,结合附表,即可得到答案.
【详解】(1)解:由列联表知,学业成绩优秀的学生共有100人,
其中日均体育锻炼时长为1至2小时的有40人,
根据古典摡型的概率计算公式,可得概率为,
所以的估计值为.
(2)解:零假设,学业成绩优秀与日均体育锻炼时长为1至2小时无关,
由的列联表中的数据,可得:,
因为,
所以零假设不成立,故有的把握认为学业成绩优秀与日均体育锻炼时长为1至2小时有关.
18.(17分)某学术平台引入智能检测系统对所收集的文本进行筛查.检测系统对AI生成文本的识别准确率为98%,对人类撰写文本的识别准确率为96.5%.检测系统对所收集的文本进行筛查时,会对每篇文本输出一个“AI生成概率”得分y(分).y与文本长度x(字)可以用一元线性回归模型来刻画,其线性回归方程为,且,,已知该平台中15%的文本由AI生成.
(1)求回归系数;
(2)从该平台随机选取一篇文本,求该文本被检测系统识别为人类撰写文本的概率(精确到0.001);
(3)现从平台中随机抽取200篇文本进行统计分析,填写列联表(篇数四舍五入取整数):
文本真实性
检测结果
总计
识别为AI生成(篇)
识别为人类撰写(篇)
真实AI生成(篇)
真实人类撰写(篇)
总计
200
依据小概率值的独立性检验,能否判断“检测结果”与“文本真实性”有差异?
参考公式:
提示:独立性检验中常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1) (2) (3)判断“检测结果”与“文本真实性”有差异
【分析】(1)利用回归直线过样本中心可求回归系数;
(2)利用全概率公式可求概率;
(3)完善列联表,再根据公式计算卡方,结合临界值表判断即可.
【详解】(1)因为,且,,
故,故.
(2)记事件为 “由AI生成的文本”, 为“由人类撰写的文本”,
为“被检测系统识别为人类撰写的文本”,
由题意知,,,,,
由全概率公式知:,
即该文本被检测系统识别为人类撰写文本的概率约为.
(3)AI生成的篇数为,人类撰写的篇数为,
真实AI生成且被识别为AI生成的篇数,
真实人类撰写且被识别为人类撰写的篇数,
故列联表为:
文本真实性
检测结果
总计
识别为AI生成(篇)
识别为人类撰写(篇)
真实AI生成(篇)
29
1
30
真实人类撰写(篇)
6
164
170
总计
35
165
200
零假设为:分类变量相互独立,即“检测结果”与“文本真实性”无差异.
由列联表数据计算得,,
所以依据小概率值的独立性检验,可以判断“检测结果”与“文本真实性”有差异.
19.(17分)某研发团队实现了从单点光谱仪到超光谱成像芯片的跨越.为制定下一年的研发投入计划,该研发团队需要了解年研发资金投入(单位:亿元)对年销售额(单位:亿元)的影响.结合近12年的年研发资金投入和年销售额,该团队建立了两个函数模型:①,②,其中均为常数,e为自然对数的底数.经对数据的初步处理,得到散点图如图.令,,计算得到如下数据.
20
66
770
200
14
460
4.20
3125000
0.308
21500
(1)设变量和变量的样本相关系数为,变量和变量的样本相关系数为,请从样本相关系数的角度,选择一个与相关性较强的模型.
(2)(ⅰ)根据(1)的选择及表中数据,建立关于的回归方程(系数精确到0.01);
(ⅱ)若下一年销售额需达到80亿元,预测下一年的研发资金投入.
附:,.
【答案】(1)模型中与的相关性较强
(2)(ⅰ);(ⅱ)27.1亿元.
【分析】(1)分别将表中数据代入样本相关系数公式求出,比较大小即可判断;
(2)(ⅰ)由两边取对数,换元得,由表中数据分别求和,得线性回归方程,利用指数式和对数式的互化,即得;
(ⅱ)将代入回归方程,利用题设条件,即可预测下一年的研发资金投入.
【详解】(1)由题意知,
.
因为,所以,
故从样本相关系数的角度,模型中与的相关性较强.
(2)(ⅰ)由,得,即.
因为,
所以,故关于的线性回归方程为,
即,所以.
(ⅱ)将代入,得,又,
故得,解得,故预测下一年的研发资金投入是27.1亿元.
学科网(北京)股份有限公司
$湘教版高中数学选择性必修第二册
第四章:统计单元测试卷
命题人:李文元
(考试时间:120分钟试卷满分:150分)
班级:
姓名:
成绩:
注意禀项:
1.答卷前,考生务必将自己的姓名、准考证号等填写在答题卡和试卷指定位置上。
2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。如需改动,
用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无
效。
3.考试结束后,将本试卷和答题卡一并交回。
4.考试范围:湘教版(2019)选择性必修第二册第四章:统计
第一部分(选择题共58分)
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合
题目要求的:
1.观察下列散点图,其中两个变量的相关关系判断正确的是()
8g
b
A.a为正相关,b为负相关,c为不相关B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关D.α为正相关,b为不相关,c为负相关
2.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()
0
5101520253035
0
5101520253035
样本相关系数为r
样本相关系数为2
35A
35。
●
。”。”。
。。·。·
10
5·…
05101520253035
05101520253035
样本相关系数为r3
样本相关系数为4
A.52<<0<5<片B.4<h<0<1<3C.4<3<0<5<1D.2<4<0<1<3
3.某公司根据近几年经营经验,得到广告支出X(单位:万元)与获得利润Y(单位:万元)的数据如
下:
广告支出X/万元
2
5
8
11
15
19
利润Y1万元
33
45
50
53
58
64
根据表中数据可得利润Y关于广告支出X的线性回归方程为Y=X+34.据此线性回归方程,若计划利
润达到100万元,估计需要支出广告费()
A.30万元
B.32万元
C.36万元
D.40万元
4.某产品的研发费用x万元与销售利润y万元的统计数据如表所示,
研发费用x(万元)
3
5
利润y(万元)
49
26
39
根据上表可得回归方程.)=bx+à中的b=9.4.据此模型预计研发费用为6万元时,利润为65.5,则a,m=
()
A.a=9.4,m=52
B.à=9.1,m=53
C.à=9.1,m=54
D.à=9.2,l=54
5.某班主任对全班50名学生进行了作业量的调查,数据如下表:
作业量
性别
大
不大
总计
男
18
9
27
女
8
15
23
总计
26
24
50
则推断学生的性别与认为作业量大有关的把握为()
附表:
P(x2≥k)
0.050
0.010
k
3.841
6.635
A.95%
B.5%
C.99%
D.100%
6.甲、乙、丙、丁四位同学各自对,A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关
系数r与残差平方和m如下表:
甲
乙
丙
丁
0.82
0.78
0.69
0.85
106
115
124
103
则能体现A,B两变量有更强的线性相关性的是()
A.甲
B.乙
C.丙
D.丁
7.已知随机变量x,y(x>0,y>0)呈现非线性关系.为了进行线性回归分析,设u=3y,v=(4x-5)2,
利用最小二乘法,得到线性回归方程u=-v+3,则变量y的估计值有()
A.最大值为eB.最小值为e
C.最大值为e3
D.最小值为e
8.为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取女性人数是男性
人数的2倍,男性喜爱钓鱼的人数占男性人数的?,女性喜爱钓鱼的人数占女性人数的},若有95%的
把握认为是否喜爱钓鱼与性别有关,则被调查的男性至少有()(参考数据:
363
≈0.82)
442
A.8人
B.10人
C.15人
D.20人
二、多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全
部选对的得6分,部分选对的得部分分,有选错的得0分
9.下列关于变量间的线性相关系数?说法正确的是()
A.相关系数r的取值范围为[-1,]
B.r=1的充要条件是成对数据构成的点都在回归直线上
C.两个变量正相关的充要条件是r>0
D.相关系数r越小,则变量间的线性相关性越弱
10.某类汽车在某年1至5月的销量Y(单位:千辆)如下表所示(其中2月份销量未知):
月份X
2
3
5
月销量Y
2.4
2
4
5
5.5
若变量Y与X之间存在线性相关关系,用最小二乘法估计建立的线性回归方程为Y=0.81X+1.57,则下
列说法正确的是()
A.m=3.1
B.样本相关系数r<0
C.据该模型可以预测12月份的销量为11.29千辆D.变量X每增加1,变量Y增加0.81
11.电动车的安全问题越来越引起广大消费者的关注,目前电动车的常用电池有锂电池与铅酸电池两种.某
公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500名市民,其中被调查的女性
市民中偏好铅酸电池电动车的占
,并得到下表.则下列说法正确的是()
偏好情况
性别
偏好锂电池电动车
偏好铅酸电池电动车
男性
200
100
女性
d
b
A.b-a=40
B.该市大约有65%的市民偏好锂电池电动车
C.有95%的把握认为市民对这两种电池的电动车的偏好与性别有关
D.若采用分层随机抽样的方法从偏好锂电池电动车的市民中随机抽取7人,再从这7名市民中抽取
2人进行座谈,则有女性市民参加座谈的概率为
2
第二部分(非选择题共92分)
三、壤空题:本题共3小题,每小题5分,共15分.
12.已知变量r与x线性相关。山样本点,)=:-L234列求得的线任曰白方程为-兮+反,
若点(x,y)在回归直线上,且为=2,则∑y=·
13.近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
年份
1
2
3
羊只数量/万只
1.4
0.9
0.75
0.6
0.3
草地植被指数
1.1
4.3
15.6
31.3
49.7
草地植被指数
60
50
40L
30
●
2
10
●,
0.511.5羊只数量/万只
若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据(1.4,1.1)后得到的相关系数为5,则
2(填≥,≤,<,>)
14.下列说法中正确的是
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变:
②设有一个线性回归方程=3-5x,变量x增加1个单位时,)平均增加5个单位:
③设具有相关关系的两个变量x、y的相关系数为”,则越接近于0,x和y之间的线性相关程度越强:
④在一个2×2列联表中,由计算得x的值,则x的值越大,判断两个变量间有关联的把握就越大.
四、解答题:本题共5小题,共77分。解窖应写出文字说明、证明过程或演算步骤,
15.(13分)2019年11月份,全国工业生产者出厂价格同比下降1.4%,环比下降0.1%.某企业在了解
市场动态之后,决定根据市场动态及时做出相应调整,并结合企业自身的情况制定相应的出厂价格.该
企业统计了2019年1一10月份产品的生产数量x与销售总额y之间的关系,如下表所示.
x/万件
2.08
2.12
2.19
2.28
2.36
2.48
2.59
2.68
2.80
2.87
y/万元
42.5
43.7
44.0
45.5
46.4
47.5
49.2
50.3
51.4
52.6
(1)计算x,下的值:
(2)计算样本相关系数r的值,并通过r的值的大小说明y与x之间的相关程度.
16.(15分)某公司销售的3D卡通纪念章很受欢迎,国庆长假第一天每件售价为20元,卖出了100百件
为了缓解进货压力,同时保证销售额不下降,决定从第二天起开始涨价根据往年的市场调研得出的规律,
该种商品涨价会导致销量下降,具体数据如下:
每件涨价x元
2
3
5
销量下降y百
2
8
14
15
件
()由统计表看出,可用线性回归模型拟合y与x的关系,试建立y与x的回归方程
(2)由(1)中的回归方程预测,当售价为多少元时,该款商品的日销售额最大,最大销售额是多少百元?
参考公式:对于一组具有线性相关关系的数据(x,y)(i=1,2,,),其经验回归直线)=r+à的斜率和截
审的最小三估计公式分别为6三-可)
a=y-bx
2x-对
17.(15分)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区随机抽取200人进行调查,
得到如下列联表:
日均体育锻炼时长t(单位:小时)
学业成绩
[1,2)
其它
合计
优秀
40
60
100
不优秀
25
75
100
合计
65
135
200
(1)记学业成绩优秀的学生中日均体育锻炼时长为1至2小时的概率为P,给出p的估计值;
(2)是否有95%的把握认为学业成绩优秀与日均体育锻炼时长为1至2小时有关?
n(ad-be)2
附:X2=
(a+b)(c+d)(a+c)(b+d)
P(x2≥k)
0.050
0.010
0.005
0.001
k
3.841
6.635
7.879
10.828
18.(17分)某学术平台引入智能检测系统对所收集的文本进行筛查.检测系统对AI生成文本的识别准确
率为98%,对人类撰写文本的识别准确率为96.5%.检测系统对所收集的文本进行筛查时,会对每篇文本
输出一个“AI生成概率”得分y(分)y与文本长度x(字)可以用一元线性回归模型来刻画,其线性回归
方程为y=bx+0.95,且x=480,y=0.35,已知该平台中15%的文本由AI生成。
(1)求回归系数b:
(2)从该平台随机选取一篇文本,求该文本被检测系统识别为人类撰写文本的概率(精确到0.001):
(3)现从平台中随机抽取200篇文本进行统计分析,填写列联表(篇数四舍五入取整数):
检测结果
文本真实性
总计
识别为AI生成(篇)
识别为人类撰写(篇)
真实AI生成(篇)
真实人类撰写(篇)
总计
200
依据小概率值=0.01的x独立性检验,能否判断“检测结果”与“文本真实性有差异?
参考公式:X
n(ad-be)'
(a+b)(c+d)(a+c)(b+d)
提示:x独立性检验中常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
Xa
2.706
3.841
6.635
7.879
10.828
19.(17分)某研发团队实现了从单点光谱仪到超光谱成像芯片的跨越.为制定下一年的研发投入计划,
该研发团队需要了解年研发资金投入X(单位:亿元)对年销售额Y(单位:亿元)的影响.结合近12
年的年研发资金投入X和年销售额Y,该团队建立了两个函数模型:①Y=α+BX,②y=er#,其中
a,B,,t均为常数,e为自然对数的底数.经对数据的初步处理,得到散点图如图.令4=x2,
y=1ny(i=1,2,,12),计算得到如下数据
x
y
6野
总6-时
$-g可
20
66
770
200
14
u
a时
c-可
空a-w-可
460
4.20
3125000
0.308
21500
y/亿元
80
75
70
65
60
01015202530x/亿元
(1)设变量U和变量Y的样本相关系数为,变量X和变量V的样本相关系数为2,请从样本相关系数的
角度,选择一个Y与X相关性较强的模型,
(2)(i)根据(1)的选择及表中数据,建立Y关于X的回归方程(系数精确到0.01):
()若下一年销售额需达到80亿元,预测下一年的研发资金投入.
附:√237.16=15.4,e4382≈80.