内容正文:
高中数学单元测试 —— 第八章 成对数据的统计分析(较易版02)
学校:___________姓名:___________班级:___________考号:___________
一、单选题
1.(本题5分)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
2.(本题5分)若甲、乙、丙、丁四组数据的相关系数分别为,,0.23,0.88,则在这四组数据中,线性相关性最强的是( )
A.甲组 B.乙组 C.丙组 D.丁组
3.(本题5分)在统计中,研究两个分类变量之间的关联性时常用的图是( )
A.散点图 B.残差图 C.频率分布直方图 D.等高堆积条形图
4.(本题5分)根据成对样本数据建立变量y关于x的经验回归方程为.若y的均值为6.2,则x的均值为( )
A.1.5 B.2 C.2.5 D.3
5.(本题5分)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
6.(本题5分)某智能机器人公司从某年起7年的利润情况如下表所示,y关于x的回归直线方程是,则该智能机器人公司第4年利润的残差是( )
第x年
1
2
3
4
5
6
7
利润y/亿元
m
A.亿元 B.亿元 C.亿元 D.亿元
7.(本题5分)某高校为研究学生每周平均体育运动时间进行了一次抽样调查,已知被抽取的男、女生人数相同.调查显示:抽取的男生中每周平均体育运动时间超过4小时的人数占比为,抽取的女生中每周平均体育运动时间超过4小时的人数占比为,若在犯错误的概率不超过1%的前提下,可以认为该校学生每周平均体育运动时间与性别有关,则被抽取的男生人数至少为( )
附:
0.050
0.010
0.005
0.001
k
3.841
6.635
7.879
10.828
A.60 B.65 C.70 D.75
每周平均体育运动时间超过4小时的人数
每周平均体育运动时间不超过4小时
合计
男生人数
女生人数
合计
8.(本题5分)为研究某池塘中水生植物的覆盖水塘面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,用模型去拟合与的关系,设与的数据如表格所示:得到与的线性回归方程,则( )
3
4
6
7
2
2.5
4.5
7
A.-2 B.-1 C. D.
二、多选题
9.(本题6分)已知由样本数据得到的回归直线方程为,且,剔除一个偏离回归直线较远的异常点后,得到的新回归直线经过点,则( )
A.变量x,y负相关
B.剔除异常点后;样本相关系数的绝对值变大
C.新回归直线经过点
D.新回归直线的斜率是
10.(本题6分)某市为了研究该市空气中的浓度和浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的浓度和浓度(单位:),得到如下所示的列联表:
64
16
10
10
经计算,则可以推断出( )
附:
0.050
0.010
0.001
3.841
6.635
10.828
A.该市一天空气中浓度不超过,且浓度不超过的概率估计值是0.64
B.若列联表中的天数都扩大到原来的10倍,的观测值不会发生变化
C.在犯错的概率不超过的条件下,认为该市一天空气中浓度与浓度有关
D.有超过99%的把握认为该市一天空气中浓度与浓度有关
合计
64
16
80
10
10
20
合计
74
26
100
11.(本题6分)某校研究学生每周自习时间(小时)与数学成绩(分)的关系,计算得相关系数,并建立线性回归模型,得到决定系数.对残差进行分析时,发现残差与预测值的散点图(是以预测值为横轴,残差为纵轴)呈现明显的先负后正的分布趋势,则( )
A.,说明该模型的拟合效果较差
B.残差平方和等于0.64
C.相关系数为负,说明自习时间与成绩无关
D.残差图显示模型可能不符合线性假设,建议改用非线性模型
三、填空题
12.(本题5分)为了解性别因素是否对某班学生爱运动有影响,对该班50名学生进行了问卷调查,得到如表的2×2列联表:
爱运动
不爱运动
合计
男生
m
12
30
女生
8
20
合计
n
50
则m=_______,n=______.
经常打篮球
不经常打篮球
合计
男生
18
12
30
女生
8
20
合计
50
13.(本题5分)已知两个变量和之间具有较强的线性相关关系,且关于的经验回归方程为,由它计算出成对样本数据对应的残差为0.12(残差观测值预测值),则______.(保留两位小数)
14.(本题5分)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得如表所示的数据:
单位:名
性别
疗效
合计
无效
有效
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
α
0.100
0.050
0.010
2.706
3.841
6.635
设:服用此药的效果与患者的性别无关,(小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的概率不大于___________.
四、解答题
15.(本题13分)某市104路公交车上午7:05—8:55时段在起点站每9分钟发一班次.公交公司为了了解早高峰时段各班次上客情况,某日上午7:14—8:35记录了在起点站各班次车辆上客的人数:
发车时刻
7:14
7:23
7:32
7:41
7:50
7:59
8:08
8:17
8:26
8:35
上车乘客数/人
10
13
13
18
17
15
12
9
3
3
请绘制这组成对数据的散点图,并通过观察散点图大致判断客车发车时刻与上车乘客人数之间的相关性.
16.(本题15分)某航天材料实验室要对比两种新型高温合金材料的性能稳定性,现有合金部件样本900件,合金部件样本500件,采用分层抽样抽取140件做耐热疲劳测试,以部件能承受1000次热循环不失效为合格标准,得到以下部分列联表:
单位:件
材料配方类型
耐热疲劳性能
合计
测试合格
测试不合格
配方材料试样
75
配方材料试样
20
合计
140
(1)请完成上述列联表;
(2)依据的独立性检验,能否认为不同的材料配方与耐热疲劳性能有关联?
附:,其中.
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
17.(本题15分)某地区因其独特的地理位置和生态环境,对气候变化较为敏感.地理研究小组为了研究该地区生态情况,对该地区年平均气温x(单位:℃)与年降水量y(单位:mm)之间的关系进行了探究.小组收集了过去10年该地区的相关数据,如下表所示:
平均气温
12.1
12.5
11.3
12.4
13.1
11.5
11.0
11.3
12.6
12.2
年降水量
850
880
820
860
895
840
800
830
865
860
附:,,,,相关系数经验回归方程:,其中.
(1)求样本的相关系数(精确到0.01);
(2)建立y关于x的经验回归方程(a,b的计算结果均精确到1),预测年平均气温为13.5℃时的年降水量.
18.(本题17分)某商场为了解顾客对某款坚果礼盒的满意程度,随机调研了200名购买过该款坚果礼盒的顾客,得到如下列联表.
性别
满意
不满意
合计
男性
40
40
80
女性
80
40
120
合计
120
80
200
(1)根据小概率值的独立性检验,分析顾客对该款坚果礼盒的满意度是否与性别有关联;
(2)从样本中对该款坚果礼盒满意的顾客中随机抽取2人,求这2人至少有1名女性的概率
附:.
0.1
0.05
0.01
2.706
3.841
6.635
19.(本题17分)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10场为一个周期)与产品销售额y(千元)的数据统计如下:
直播周期数x
1
2
3
4
5
产品销售额y(千元)
3
7
15
30
40
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
3.7
55
382
65
978
101
其中
(1)请根据表中数据,建立y关于x的回归方程;
(2)乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(精确到0.01)
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,相关指数:.
试卷第1页,共3页
答案第1页,共1页
学科网(北京)股份有限公司
$
高中数学单元测试 —— 第八章 成对数据的统计分析(较易版02)
学校:___________姓名:___________班级:___________考号:___________
一、单选题
1.(本题5分)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
【答案】D
【分析】根据相关关系的定义判断即可.
【详解】对于A:人的身高与受教育的程度不具有相关关系,故A错误;
对于B:人的体重与眼睛的近视程度不具有相关关系,故B错误;
对于C:企业员工的工号与工资不具有相关关系,故C错误.
对于D:儿子的身高与父亲的身高具有相关关系,故D正确.
故选:D
2.(本题5分)若甲、乙、丙、丁四组数据的相关系数分别为,,0.23,0.88,则在这四组数据中,线性相关性最强的是( )
A.甲组 B.乙组 C.丙组 D.丁组
【答案】A
【分析】根据相关系数的含义,其绝对值越接近1,线性相关性越强.
【详解】根据题意,线性相关系数的绝对值越大,线性相关性越强.
因为,
故线性相关性最强的是甲组.
故选:A.
3.(本题5分)在统计中,研究两个分类变量之间的关联性时常用的图是( )
A.散点图 B.残差图 C.频率分布直方图 D.等高堆积条形图
【答案】D
【分析】根据统计图的适用对象即可求解.
【详解】在统计中,研究两个分类变量之间的关联性时常用的图是等高堆积条形图,
散点图是研究两个变量之间相关关系时用,残差是研究拟合效果时用到的,频率分布直方图是研究频率分布时用到的,
故选:D
4.(本题5分)根据成对样本数据建立变量y关于x的经验回归方程为.若y的均值为6.2,则x的均值为( )
A.1.5 B.2 C.2.5 D.3
【答案】B
【分析】利用经验在归方程经过点,即可求出结果.
【详解】将代入方程,解得.
故选:B.
5.(本题5分)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一次数据统计,根据形成的列联表,计算得到,根据小概率值的独立性检验(已知独立性检验中),下列结论正确的是( )
A.牛的毛色与角无关
B.牛的毛色与角无关,此推断犯错误的概率不超过0.05
C.牛的毛色与角有关
D.牛的毛色与角有关,此推断犯错误的概率不超过0.05
【答案】A
【分析】根据卡方独立性检验规则,比较与临界值即可得出结论.
【详解】因为,所以牛的毛色与角无关.
故选:A.
6.(本题5分)某智能机器人公司从某年起7年的利润情况如下表所示,y关于x的回归直线方程是,则该智能机器人公司第4年利润的残差是( )
第x年
1
2
3
4
5
6
7
利润y/亿元
m
A.亿元 B.亿元 C.亿元 D.亿元
【答案】A
【分析】计算出,根据回归方程,得到,从而得到方程,求出,再计算出当时,,求出残差.
【详解】由题意,,关于的回归直线方程为,
所以,故,解得,
所以当时,,则.
故选:A
7.(本题5分)某高校为研究学生每周平均体育运动时间进行了一次抽样调查,已知被抽取的男、女生人数相同.调查显示:抽取的男生中每周平均体育运动时间超过4小时的人数占比为,抽取的女生中每周平均体育运动时间超过4小时的人数占比为,若在犯错误的概率不超过1%的前提下,可以认为该校学生每周平均体育运动时间与性别有关,则被抽取的男生人数至少为( )
附:
0.050
0.010
0.005
0.001
k
3.841
6.635
7.879
10.828
A.60 B.65 C.70 D.75
【答案】C
【分析】设男生总人数为,写出列联表,根据题意列出卡方不等式即可求解.
【详解】设男生总人数为,依题意可得列联表如下:
每周平均体育运动时间超过4小时的人数
每周平均体育运动时间不超过4小时
合计
男生人数
女生人数
合计
若在犯错误的概率不超过1%的前提下,可以认为该校学生每周平均体育运动时间与性别有关,
则,
解得,则被抽取的男生人数至少为70人.
故选:C.
8.(本题5分)为研究某池塘中水生植物的覆盖水塘面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,用模型去拟合与的关系,设与的数据如表格所示:得到与的线性回归方程,则( )
3
4
6
7
2
2.5
4.5
7
A.-2 B.-1 C. D.
【答案】C
【分析】根据已知条件,求得,进而代入回归方程可求得,从而得出,联立,即可求得本题答案.
【详解】由已知可得,,,
所以,有,解得,
所以,,
由,得,
所以,,则.
故选:C.
二、多选题
9.(本题6分)已知由样本数据得到的回归直线方程为,且,剔除一个偏离回归直线较远的异常点后,得到的新回归直线经过点,则( )
A.变量x,y负相关
B.剔除异常点后;样本相关系数的绝对值变大
C.新回归直线经过点
D.新回归直线的斜率是
【答案】ABD
【分析】由回归直线方程的斜率判断A,由样本相关系数的性质判断B,求出剔除异常点后的回归直线方程,过样本点中心,计算斜率,即可判断CD
【详解】对于A,由回归直线的斜率为,可知变量x,y负相关,故A正确;
对于B,剔除异常点后,拟合精度变好,故样本相关系数的绝对值变大,故B正确;
对于C,因为原回归直线方程为,且,
所以,
则剔除异常点后,,,
故新回归直线经过点,故C错误;
对于D,因为新回归直线经过点和,
所以新回归直线的斜率为,故D正确.
10.(本题6分)某市为了研究该市空气中的浓度和浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的浓度和浓度(单位:),得到如下所示的列联表:
64
16
10
10
经计算,则可以推断出( )
附:
0.050
0.010
0.001
3.841
6.635
10.828
A.该市一天空气中浓度不超过,且浓度不超过的概率估计值是0.64
B.若列联表中的天数都扩大到原来的10倍,的观测值不会发生变化
C.在犯错的概率不超过的条件下,认为该市一天空气中浓度与浓度有关
D.有超过99%的把握认为该市一天空气中浓度与浓度有关
【答案】ACD
【分析】对于A选项,根据表格,进行数据分析,直接求概率;对于B,C,D选项,进行独立性检验,计算后对照参数下结论.
【详解】补充完整列联表如下:
合计
64
16
80
10
10
20
合计
74
26
100
对于A选项,该市一天中,空气中浓度不超过,且浓度不超过的概率估计值为,故A正确;
对于B选项,由,显然观测值也扩大十倍,故B不正确;
因为,根据临界值表可知,在犯错的概率不超过的条件下,
即有超过的把握认为该市一天空气中浓度与浓度有关,故C、D正确.
故选:ACD
11.(本题6分)某校研究学生每周自习时间(小时)与数学成绩(分)的关系,计算得相关系数,并建立线性回归模型,得到决定系数.对残差进行分析时,发现残差与预测值的散点图(是以预测值为横轴,残差为纵轴)呈现明显的先负后正的分布趋势,则( )
A.,说明该模型的拟合效果较差
B.残差平方和等于0.64
C.相关系数为负,说明自习时间与成绩无关
D.残差图显示模型可能不符合线性假设,建议改用非线性模型
【答案】AD
【分析】A 根据决定系数的意义可判断;B利用可判断;C 根据相关系数正负性的意义即可判断;D若符合线性模型,则残差与预测值的散点图应该在零周围随机分布从而可判断.
【详解】决定系数的取值范围在0到1之间,其值越接近1拟合效果越好,其值远小于1,故其拟合效果较差,故A正确;
因,则,但因未给出总平方和,故无从得知残差的平方和,故B错误;
相关系数为负,说明随着自习时间的增加,数学成绩有下降趋势,但不意味着它们无关,故C错误;
若符合线性模型,则残差与预测值的散点图应该在零周围随机分布,而残差与预测值的散点图呈现先负后正的分布趋势,这表明残差不是随机分布的,而是遵循某种模式,故不符合线性回归模型,因此建议改用非线性模型,故D正确.
故选:AD
三、填空题
12.(本题5分)为了解性别因素是否对某班学生爱运动有影响,对该班50名学生进行了问卷调查,得到如表的2×2列联表:
爱运动
不爱运动
合计
男生
m
12
30
女生
8
20
合计
n
50
则m=_______,n=______.
【答案】 18 24
【分析】完善列联表,即可得解;
【详解】依题意可得列联表如下:
经常打篮球
不经常打篮球
合计
男生
18
12
30
女生
8
20
合计
50
故;
故答案为:;;
13.(本题5分)已知两个变量和之间具有较强的线性相关关系,且关于的经验回归方程为,由它计算出成对样本数据对应的残差为0.12(残差观测值预测值),则______.(保留两位小数)
【答案】
【分析】先根据回归直线估计得出预测值,再残差计算求解计算求参.
【详解】因为y关于x的经验回归方程为,
所以预测值为,又因为残差=观测值-预测值,
所以,
所以.
故答案为:
14.(本题5分)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得如表所示的数据:
单位:名
性别
疗效
合计
无效
有效
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
α
0.100
0.050
0.010
2.706
3.841
6.635
设:服用此药的效果与患者的性别无关,(小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的概率不大于___________.
【答案】0.05
【分析】计算卡方,再由独立性检验比较可得.
【详解】由公式计算得,根据小概率值的独立性检验,认为服用此药的效果与患者的性别有关,判断出错的概率不大于0.05.
故答案为:0.05.
四、解答题
15.(本题13分)某市104路公交车上午7:05—8:55时段在起点站每9分钟发一班次.公交公司为了了解早高峰时段各班次上客情况,某日上午7:14—8:35记录了在起点站各班次车辆上客的人数:
发车时刻
7:14
7:23
7:32
7:41
7:50
7:59
8:08
8:17
8:26
8:35
上车乘客数/人
10
13
13
18
17
15
12
9
3
3
请绘制这组成对数据的散点图,并通过观察散点图大致判断客车发车时刻与上车乘客人数之间的相关性.
【答案】图表见解析
【分析】
根据题意,直接绘制散点图即可,结合散点图即可判断.
【详解】
绘制散点图如图所示,观察散点图可知,之前客车发车时刻与上车乘客人数之间正相关,之后客车发车时刻与上车乘客人数之间负相关.
16.(本题15分)某航天材料实验室要对比两种新型高温合金材料的性能稳定性,现有合金部件样本900件,合金部件样本500件,采用分层抽样抽取140件做耐热疲劳测试,以部件能承受1000次热循环不失效为合格标准,得到以下部分列联表:
单位:件
材料配方类型
耐热疲劳性能
合计
测试合格
测试不合格
配方材料试样
75
配方材料试样
20
合计
140
(1)请完成上述列联表;
(2)依据的独立性检验,能否认为不同的材料配方与耐热疲劳性能有关联?
附:,其中.
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析
(2)有关联
【分析】(1)根据题干表格,完善列联表即可;
(2)计算出卡方,即可判断.
【详解】(1)由已知合金部件应抽取件,合金部件应抽取件,
由此可得列联表如下:
材料配方类型
耐热疲劳性能
合计
测试合格
测试不合格
配方材料试样
75
15
90
配方材料试样
30
20
50
合计
105
35
140
(2)零假设为:材料配方与耐热疲劳性能无关联,
根据列联表数据,经计算得,
根据小概率值的独立性检验,我们推断不成立,
即认为材料配方与耐热疲劳性能有关联,此推断犯错误的概率不大于.
17.(本题15分)某地区因其独特的地理位置和生态环境,对气候变化较为敏感.地理研究小组为了研究该地区生态情况,对该地区年平均气温x(单位:℃)与年降水量y(单位:mm)之间的关系进行了探究.小组收集了过去10年该地区的相关数据,如下表所示:
平均气温
12.1
12.5
11.3
12.4
13.1
11.5
11.0
11.3
12.6
12.2
年降水量
850
880
820
860
895
840
800
830
865
860
附:,,,,相关系数经验回归方程:,其中.
(1)求样本的相关系数(精确到0.01);
(2)建立y关于x的经验回归方程(a,b的计算结果均精确到1),预测年平均气温为13.5℃时的年降水量.
【答案】(1)
(2),
【分析】(1)根据相关系数公式,代入参考数据,即可求解;
(2)根据参考数据,求,再代入求,最后根据回归方程求预测值.
【详解】(1)样本的相关系数为
,
其中,
.
(2)易得,
,
,
,
关于的经验回归方程为,
将13.5摄氏度代入方程,得
故预测年平均气温为13.5℃时的年降水量为.
18.(本题17分)某商场为了解顾客对某款坚果礼盒的满意程度,随机调研了200名购买过该款坚果礼盒的顾客,得到如下列联表.
性别
满意
不满意
合计
男性
40
40
80
女性
80
40
120
合计
120
80
200
(1)根据小概率值的独立性检验,分析顾客对该款坚果礼盒的满意度是否与性别有关联;
(2)从样本中对该款坚果礼盒满意的顾客中随机抽取2人,求这2人至少有1名女性的概率
附:.
0.1
0.05
0.01
2.706
3.841
6.635
【答案】(1)与性别有关
(2)
【分析】(1)提出零假设,结合所给卡方公式进行运算判断即可;
(2)根据古典概型运算公式,结合组合的定义进行求解即可.
【详解】(1)零假设为:顾客对该款坚果礼盒的满意度与性别无关.
经计算得,
依据小概率值的独立性检验,推断零假设不成立,
即顾客对该款坚果礼盒的满意度与性别有关,此推断犯错误的概率不大于0.05.
(2)(2)由题意,从样本中对该款坚果礼盒满意的顾客中随机抽取2人,
结合列联表可得,对该款坚果礼盒满意的顾客共120人,其中男性有40人,女性有80人,
抽取2人至少有1名女性的概率为.
19.(本题17分)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10场为一个周期)与产品销售额y(千元)的数据统计如下:
直播周期数x
1
2
3
4
5
产品销售额y(千元)
3
7
15
30
40
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
3.7
55
382
65
978
101
其中
(1)请根据表中数据,建立y关于x的回归方程;
(2)乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(精确到0.01)
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,相关指数:.
【答案】(1);
(2)乙建立的回归模型拟合效果更好.
【分析】(1)对两边取对数得,令,利用最小二乘法可求得,由此可得回归方程;
(2)根据公式计算可得相关指数,由此可得结论;
【详解】(1)将两边取对数得:,
令,则,
因为,
所以根据最小二乘估计可知:,
所以,
所以回归方程为,即.
(2)甲建立的回归模型的.
所以乙建立的回归模型拟合效果更好.
试卷第1页,共3页
答案第1页,共1页
学科网(北京)股份有限公司
$