内容正文:
(
密 ○ 封 ○ 装 ○ 订 ○ 线 密 ○ 封 ○ 装 ○ 订 ○ 线
密 封 线 内 不 要 答 题
)
(
姓名 班级 考号
密 ○ 封 ○ 装 ○ 订 ○ 线 密 ○ 封 ○ 装 ○ 订 ○ 线
密 封 线 内 不 要 答 题
)
第七章 统计案例
全卷满分150分 考试用时120分钟
一、单项选择题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下图是2011~2021年全国城镇人口、乡村人口的折线图(数据来自国家统计局).
根据该折线图,下列说法错误的是( )
A.城镇人口与年份呈正相关关系
B.乡村人口与年份的相关系数r接近1
C.城镇人口逐年增长率大致相同
D.可预测未来几年乡村人口仍呈现下降趋势
2.某村庄对该村内的50名老年人和年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
每年未体检
总计
老年人
a
7
c
年轻人
6
b
d
总计
e
f
50
已知抽取的老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A.a=18 B.b=19
C.c+d=50 D.f-e=-2
3.已知变量x,y之间具有线性关系,其散点图如图所示,则其线性回归方程可能为( )
A.=-1.5x+2
C.=-1.5x-2
4.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X
Y
y1
y2
合计
x1
10
18
28
x2
m
26
m+26
合计
10+m
44
m+54
则当整数m取 时,X与Y的关系最弱( )
A.8 B.9
C.14 D.19
5.为了调查高一学生在分班选科时是否选择物理与性别的关系,随机调查了100名高一学生,得到2×2列联表如下:
选择物理
不选择物理
总计
男
35
20
55
女
15
30
45
总计
50
50
100
由此得出的正确结论是( )
A.有99%的把握认为“是否选择物理与性别有关”
B.有99%的把握认为“是否选择物理与性别无关”
C.有95%的把握认为“是否选择物理与性别有关”
D.有95%的把握认为“是否选择物理与性别无关”
6.某手机商城统计了1~5月某品牌手机的实际销售量,如下表所示:
时间x/月
1
2
3
4
5
销售量y/万部
0.5
0.8
1.0
1.2
1.5
若y与x线性相关,且线性回归方程为,则下列说法不正确的是( )
A.样本点的中心为(3,1.0)
B.由表中数据可知,变量y与x正相关
C.=0.28
D.预测x=7时该品牌手机的销售量为1.86万部
7.下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型y=e1+at(a∈R)对y与t的关系进行拟合,则根据该回归模型,预测第7个月该物种的繁殖数量为( )
第t个月
1
2
3
繁殖数量y/百只
e1.4
e2.2
e2.4
A.e3百只 B.e3.5百只
C.e4百只 D.e4.5百只
8.在对具有线性相关关系的两个变量x和y进行统计分析时,得到如表所示的数据:
x
4
m
8
10
12
y
1
2
3
5
6
由表中数据求得y关于x的回归方程为=0.65x-1.8,则(4,1),(m,2),(8,3)这三个样本点中,距离回归直线最近的点是( )
A.(4,1) B.(m,2)
C.(8,3) D.(4,1)或(m,2)
二、多项选择题(本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.由相关变量x,y之间的一组数据(xi,yi)(i=1,2,…,10),得到y关于x的线性回归方程为=1.4x+0.8,且=3,去除两个歧义点(1.2,2.4)和(4.8,7.6)后,得到y关于x的新线性回归方程的回归系数=1.5,则去除这两个歧义点后,( )
A.xj(j=1,2,…,8)的均值变大
B.yj(j=1,2,…,8)的均值不变
C.新线性回归方程为=1.5x+0.5
D.当x增加1个单位时,y增加1.5个单位
10.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每名学生对食堂的服务给出满意或不满意的评价,得到如下2×2列联表.经计算χ2≈4.762,则可以推断出( )
满意
不满意
男
30
20
女
40
10
A.该学校男生对食堂服务满意的概率为
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.有95%的把握认为男、女生对该食堂服务的评价有差异
D.有99%的把握认为男、女生对该食堂服务的评价有差异
11.某中学为了研究高三年级学生的身高和性别的相关性问题,从高三年级800名学生中随机抽取200名学生测量身高,测量数据的列联表如下:
性别
身高
低于170 cm
不低于170 cm
总计
女
80
16
96
男
20
84
104
总计
100
100
200
下列说法正确的有( )
A.该样本是由分层随机抽样而得
B.该中学高三年级学生身高最高的是男生
C.有99.9%的把握认为该中学高三年级学生的身高与性别有关
D.若该样本中男生身高h(单位:cm)服从正态分布N(175,25),则该样本中身高在区间(175,180]内的男生超过30人
附:① χ2=,其中n=a+b+c+d.
②若X~N(μ,σ2),则随机变量X的取值落在区间(μ-σ,μ+σ]上的概率约为68.3%.
临界值表:
P(χ2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
三、填空题(本题共3小题,每小题5分,共15分)
12.某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了5 000人,计算发现χ2=3.109,根据这一数据,市政府断言市民收入增减与旅游需求有关的可信度是 %.
附:
P(χ2≥k)
0.15
0.10
0.05
0.025
0.01
0.001
k
2.072
2.706
3.841
5.024
6.635
10.828
13.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:
性别
休闲方式
读书
健身
总计
女
24
31
55
男
8
26
34
总计
32
57
89
则有 的把握认为性别与休闲方式有关.
14.某网购公司统计了近5年在本公司网购的人数,得到如下的相关数据:(其中“x=1”表示2018年,“x=2”表示2019年,且x为整数,依次类推;y表示人数)
x
1
2
3
4
5
y/万人
20
50
100
150
180
根据表中的数据,可以求出=42,若预测该公司的网购人数能超过300万,则x的最小值为 .
四、解答题(本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤)
15.(13分)某校团委对男女生是否喜欢韩剧进行了一次调查,其中女生人数是男生人数的,若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人?
16.(15分)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇.
(1)为了更好了解大众对新能源汽车的接受程度,某城市汽车行业协会依据年龄采用按比例分层随机抽样的方式抽取了200名市民,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了以下统计数据:
选择新能源汽车
选择传统汽车
总计
40岁以下
70
40岁及以上
60
100
总计
200
完成2×2列联表,并判断是否有 99.9%的把握认为选择新能源汽车与年龄有关;
(2)为了了解某一地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量y(单位:万台)关于年份x的线性回归方程=4.7x-9 495.2,且销售量y的方差为=50,年份x的方差为=2.求y与x间的样本相关系数r,并据此判断该地区新能源汽车销售量y与年份x的线性相关性强弱.
附:(i)在线性回归方程中,;
(ii)样本相关系数r=,若|r|>0.9,则可判断y与x线性相关性较强;
(iii)χ2=,其中n=a+b+c+d.
P(χ2≥k)
0.10
0.05
0.01
0.001
k
2.706
3.841
6.635
10.828
17.(15分)共享单车在我国的许多城市已相当普及,共享单车为人们的出行提供了便利,但也给城市的交通管理带来了一些困难,为掌握共享单车在C省的发展情况,某调查机构从该省抽取了5个城市,并统计了共享单车的A指标x和B指标y,得到的数据如下表所示:
城市1
城市2
城市3
城市4
城市5
A指标x
2
4
5
6
8
B指标y
3
4
4
4
5
(1)试求y与x间的样本相关系数r,并说明y与x是否具有较强的线性相关关系(若|r|≥0.75,则认为y与x具有较强的线性相关关系,否则认为没有较强的线性相关关系);
(2)建立y关于x的线性回归方程,并预测当A指标为7时,B指标的值;
(3)若某城市的共享单车的A指标x在区间(+3s)的右侧,则认为该城市共享单车数量过多,对城市的交通管理有较大的影响,交通管理部门将对其进行治理,直至A指标x在区间(+3s)内.现已知C省某城市共享单车的A指标为13,则该城市的交通管理部门是否需要对共享单车进行治理?试说明理由.
参考公式:线性回归方程中,.
参考数据:s=≈0.95.
18.(17分)电机与变压器中绕组常用的绝缘材料耐热等级根据绝缘耐温(绝缘材料的极限允许工作温度)分为如下7个级别:
耐热等级
Y
A
E
B
F
H
C
绝缘耐温(℃)
[90,
105)
[105,
120)
[120,
130)
[130,
155)
[155,
180)
[180,
200)
[200,
230)
某绝缘材料生产企业为测试甲、乙两种生产工艺对绝缘耐温的影响,分别从采用两种工艺生产的产品中各随机抽取50件,测量各件产品的绝缘耐温(单位:℃),其频率分布直方图如下:
甲
乙
(1)若10月份该企业采用甲工艺生产的产品为65万件,估计其中耐热等级达到C级的产品数;
(2)若规定产品耐热等级达到C级为合格,除此之外均为不合格.完成以下表格,并判断是否有95%的把握认为测试结果与不同的生产工艺有关.
合格
不合格
甲
乙
附:χ2=,其中n=a+b+c+d.
P(χ2≥k)
0.25
0.15
0.10
0.05
k
1.323
2.072
2.706
3.841
19.(17分)抽球试验规则如下:盒子中初始装有1个白球和2个红球,每次有放回地任取1个,连续取两次,将以上过程记为一轮.如果每一轮取到的2个球都是白球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此继续下去,直至成功.
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量X,求X的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,则有1 500名数学爱好者独立进行该抽球试验,记t表示成功时抽球试验的轮次数,y表示对应的人数,部分统计数据如表所示:
t
1
2
3
4
5
y
256
100
66
48
30
求y关于t的回归方程,并预测成功的总人数(精确到1).
参考公式:在线性回归方程中,.
参考数据:≈1.46,≈0.46,xi.
答案与解析
第七章 统计案例
1.B
2.D 由已知得a+7=c=25,6+b=d=25,a+6=e,7+b=f,e+f=50,c+d=50,
所以a=18,b=19,e=24,f=26,f-e=2.故选D.
3.B 因为题中散点图由左上方向右下方成带状分布,所以线性回归直线的斜率为负数,所以排除A,C,
又散点图的带状区域经过y轴的正半轴,所以线性回归直线在y轴上的截距为正数,所以排除D.故选B.
4.C 在两个分类变量的列联表中,当|ad-bc|的值越小时,认为两个分类变量有关的可能性越小.令|ad-bc|=0,得10×26=18m,解得m≈14.4,又m为整数,所以当m=14时,X与Y的关系最弱.故选C.
5.A 因为χ2=≈9.09>6.635,所以有99%的把握认为“是否选择物理与性别有关”.
6.D 由题表中的数据得,=1.0,则样本点的中心为(3,1.0),故A中说法正确;
从题表中的数据可得,y随着x的增大而增大,所以变量y与x正相关,故B中说法正确;
将(3,1.0)代入,得=0.28,故C中说法正确;
由选项C可知线性回归方程为=0.24x+0.28,
将x=7代入=0.24x+0.28,得=0.24×7+0.28=1.96,故D中说法不正确.
故选D.
7.D y=e1+at两边取自然对数,得ln y=1+at,
令u=ln y,则u=1+at,
=2,
∵回归直线必过样本点的中心,
∴2=2a+1,
解得a=,则y=,
当t=7时,y=e4.5.
故选D.
8.B 由题表中的数据,可得×(1+2+3+5+6)=3.4,
将代入-1.8,解得m=6.
当x=4时,=0.65×4-1.8=0.8,1-0.8=0.2;
当x=6时,=0.65×6-1.8=2.1,2.1-2=0.1;
当x=8时,=0.65×8-1.8=3.4,3.4-3=0.4.
因为0.1<0.2<0.4,所以(4,1),(6,2),(8,3)这三个样本点中距离回归直线最近的点是(6,2),即(m,2).
故选B.
9.BC 将=3代入=1.4x+0.8可得=5,故去除两个歧义点后,数据xj,yj(j=1,2,…,8)的均值不变,故A错误,B正确;
设新线性回归方程为,将(3,5)代入得=0.5,故C正确;
去除两个歧义点后,当x增加1个单位时,y平均增加1.5个单位,故D错误.
故选BC.
10.AC 以频率估计概率,该学校男生对食堂服务满意的概率为,故A正确;
该学校女生对食堂服务满意的概率为,故B错误;
因为χ2≈4.762>3.841,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错误.
故选AC.
11. CD 对于A,由已知信息不能确定样本是不是由分层随机抽样而得,故A错误;对于B,没有给出具体的身高数据,所以不能推出高三年级学生身高最高的是男生,故B错误;对于C, χ2=
×
68.3%=34.15%,所以104×34.15%=35.516≈36(人),即该样本中身高在区间(175,180]内的男生超过30人,故D正确.
12.答案 90
解析 由χ2=3.109>2.706,知市政府断言市民收入增减与旅游需求有关的可信度是90%.
13.答案 90%
解析 由题表中的数据,得χ2=≈3.689>2.706,
因此,有90%的把握认为性别与休闲方式有关.
14.答案 8
解析 由已知得,=100,
将(3,100)代入线性回归方程,得100=42×3+,解得=-26,则=42x-26,
令≈7.76,
因为x为整数,所以x的最小值为8.
15.解析 设男生人数为x,依题意可得列联表如下:
喜欢韩剧
不喜欢韩剧
总计
男生
x
女生
总计
x
(6分)
若有95%的把握认为是否喜欢韩剧和性别有关,则χ2>3.841,(8分)
由χ2=.(10分)
易知x为6的整数倍,且x∈N+,则男生至少有12人.(13分)
16.解析 (1)补全2×2列联表如下:
选择新能源汽车
选择传统汽车
总计
40岁以下
70
30
100
40岁及以上
40
60
100
总计
110
90
200
(4分)
则χ2=≈18.182>10.828,(6分)
故有99.9%的把握认为选择新能源汽车与年龄有关.(7分)
(2)r=,(10分)
又=2,
所以r=4.7×=0.94>0.9,(14分)
故y与x线性相关性较强.(15分)
17.解析 (1)由题表得=4.(2分)
所以)2=2.
所以r=≈0.95.(6分)
因为0.95>0.75,所以y与x具有较强的线性相关关系. (8分)
(2)由(1)得=4-0.3×5=2.5,
所以线性回归方程为=0.3x+2.5.(11分)
当x=7时,=0.3×7+2.5=4.6,
即当A指标为7时,B指标的估计值为4.6. (13分)
(3)该城市的交通管理部门需要对共享单车进行治理.理由如下:
由题意得(+3s)=(-1,11),
因为13>11,所以该城市的交通管理部门需要对共享单车进行治理. (15分)
18.解析 (1)由题中的频率分布直方图知,采用甲工艺生产的产品中,耐热等级达到C级的频率为(0.06+0.02)×10=0.8,
∴估计10月份采用甲工艺生产的产品中,耐热等级达到C级的产品为65×0.8=52(万件).(6分)
(2)由题中的频率分布直方图知,采用甲工艺生产的产品中,耐热等级达到C级的为50×0.8=40(件),则未达到C级的为10件;(9分)
采用乙工艺生产的产品中,耐热等级达到C级的为50×(0.02+0.04)×10=30(件),则未达到C级的为20件.(12分)
由此可得表格如下:
合格
不合格
甲
40
10
乙
30
20
∴χ2=≈4.762>3.841,(15分)
∴有95%的把握认为测试结果与不同的生产工艺有关.(17分)
19.解析 (1)记事件A1表示“第一轮成功”,事件A2表示“第一轮失败”,
则P(A1)=;
记事件B1表示“第二轮成功”,事件B2表示“第二轮失败”,
则P(B1)=;
记事件C1表示“第三轮成功”,事件C2表示“第三轮失败”,
则P(C1)=,(4分)
由题意可知X的可能取值为1,2,3,
则P(X=1)=P(A1)=,
P(X=3)=P(A2)P(B2)P(C1)+P(A2)P(B2)P(C2)=,(6分)
所以X的分布列为
X
1
2
3
P
EX=1×.(8分)
(2)xi=(i=1,2,3,4,5),由题知,=100,
×30=346,
=290,
≈100-290×0.46=-33.4,(11分)
所以=290x-33.4,则 -33.4.
当t=6时,-33.4≈15;当t=7时,-33.4≈8;
当t=8时,- -33.4≈3;
当t=9时, -33.4≈-1<0,
根据反比例函数的单调性,易知当t≥9时,<0,(15分)
而256+100+66+48+30+15+8+3=526,
故预测成功的总人数为526.(17分)
学科网(北京)股份有限公司
$$