内容正文:
[阶段质量评价] 第4章 统 计
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题所给的四个选项中,只有一项是符合题目要求的)
1.下列两个变量之间的关系是相关关系的为 ( )
A.匀速直线运动的物体时间与位移的关系
B.学生的成绩和体重
C.路上酒后驾驶的人数和交通事故发生的多少
D.水的体积和重量
解析:选C A选项,匀速直线运动的物体时间与位移的关系是函数关系;B选项,成绩与体重之间不具有相关性;C选项,路上酒后驾驶的人数和交通事故发生的多少是相关关系;D选项,水的体积与重量是函数关系.
2.如图2×2列联表中a,b的值分别为 ( )
Y1
Y2
合计
X1
c
a
e
X2
23
d
48
合计
b
78
121
A.54,43 B.53,43
C.53,42 D.54,42
解析:选B 由2×2列联表可知,b=121-78=43,d=48-23=25,
所以a=78-d=78-25=53.
3.(2025·天津高考)下列说法中错误的是 ( )
A.若X~N(μ,σ2),则P(X≤μ-σ)=P(X≥μ+σ)
B.若X~N(1,22),Y~N(2,22),则P(X<1)<P(Y<2)
C.|r|越接近1,相关性越强
D.|r|越接近0,相关性越弱
解析:选B 对于A,根据正态分布对称性可知,P(X≤μ-σ)=P(X≥μ+σ),A说法正确;对于B,根据正态分布对称性可知,P(X<1)=P(Y<2)=0.5,B说法错误;对于C和D,样本相关系数|r|越接近0,相关性越弱,越接近1,相关性越强,故C和D说法正确.
4.如果有95%的把握说事件A和B有关系,那么具体计算出的数据为 ( )
A.χ2>3.841 B.χ2<3.841
C.χ2>6.635 D.χ2<6.635
解析:选A 由独立性判断的方法可知,如果有95%的把握,则χ2>3.841.
5.观察两个变量(存在相关关系)得如下数据:
x
-10
-6.99
-5.01
-2.98
3.98
5
7.99
8.01
y
-9
-7
-5
-3
4.01
4.99
7
8
则两变量间的回归直线方程为 ( )
A.=x+1 B.=x
C.=2x+ D.=x+1
解析:选B 根据表中数据得=×(-10-6.99-5.01-2.98+3.98+5+7.99+8.01)=0,=×(-9-7-5-3+4.01+4.99+7+8)=0,所以两变量x,y的回归直线方程过样本点的中心(0,0),可以排除A、C、D选项,故选B.
6.为调查某企业环境污染整治情况,得到了7组成对数据如下表所示:
第x年
1
2
3
4
5
6
7
污染指数y
6.1
5.2
4.5
4.7
3.8
3.4
3.1
由上表中数据求得y关于x的回归直线方程为=-0.475x+,据此计算样本点(2,5.2)处的残差(残差=实际值-预测值)为 ( )
A.-0.25 B.0.25
C.0.15 D.-0.15
解析:选D 由题表中数据可得=(1+2+3+4+5+6+7)=4,=(6.1+5.2+4.5+4.7+3.8+3.4+3.1)=4.4.将样本中心(4,4.4)代入=-0.475x+得=6.3,=-0.475x+6.3.因此当x=2时,=-0.475×2+6.3=5.35,所以样本点(2,5.2)处的残差为5.2-5.35=-0.15.
7.某大学为了了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每名学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表,经计算χ2≈4.762,则下列说法正确的是 ( )
满意
不满意
男
30
20
女
40
10
A.该学校男生对食堂服务满意的概率的估计值为
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.有95%的把握判断男、女生对该食堂服务的评价有差异
D.有99%的把握判断男、女生对该食堂服务的评价有差异
解析:选C 对于A,该学校男生对食堂服务满意的概率的估计值为=,故A错误;对于B,该学校女生对食堂服务满意的概率的估计值为=>,故B错误;因为3.841<χ2≈4.762<6.635,所以有95%的把握判断男、女生对该食堂服务的评价有差异,故C正确,D错误.
8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归直线方程为=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为 ( )
A.83% B.72%
C.67% D.66%
解析:选A 将=7.675代入回归直线方程,可计算得≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83,即约为83%.
二、多项选择题(本大题共3小题,每小题6分,共18分.在每小题给出的四个选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.
以下关于线性回归分析的判断中,正确的是 ( )
A.若散点图中所有点都在一条直线附近,则这条直线为回归直线
B.散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点
C.已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69
D.线性回归方程的意义是它反映了样本整体的变化趋势
解析:选BCD 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线=x+才是回归直线,所以A错误,B正确;将x=25代入=0.50x-0.81,得=11.69,所以C正确,D正确.
10.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的线性回归方程为=0.85x-85.71,则下列结论正确的是 ( )
A.y与x具有正的线性相关关系
B.线性回归方程过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可判定其体重必为58.79 kg
解析:选ABC A、B、C均正确,是回归直线方程的性质,D项是错误的,回归直线方程只能预测学生的体重,应为大约58.79 kg.
11.某校团委对“学生性别和喜欢某个APP是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢的人数占男生人数的,女生喜欢的人数占女生人数的,若有95%的把握认为是否喜欢和性别有关,则调查人数中男生可能有 ( )
临界值表:
P(χ2≥x0)
0.050
0.010
x0
3.841
6.635
附:χ2=.
A.30人 B.54人
C.60人 D.75人
解析:选BC 设男生的人数为6n(n∈N+),
根据题意列出2×2列联表如下表所示:
男生
女生
合计
喜欢
5n
4n
9n
不喜欢
n
2n
3n
合计
6n
6n
12n
则χ2==,
由于有95%的把握认为是否喜欢和性别有关,则3.841<χ2≤6.635,
即3.841<≤6.635,得8.642 3<n≤14.929,
因为n∈N+,则n的可能取值有9,10,11,12,13,14,因此,调查人数中男生人数的可能值为54,60,66,72,78,84.
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中的横线上)
12.(5分)为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:
不超过40岁
超过40岁
合计
不多于20支/天
50
15
65
多于20支/天
10
25
35
合计
60
40
100
则χ2= (保留到小数点后两位有效数字).
解析:由列联表知χ2
=≈22.16.
答案:22.16
13.(5分)已知样本容量为11,计算得xi=510,yi=214,线性回归方程为=0.3x+,则≈ ,≈ .(精确到0.01)
解析:由题意得=xi=≈46.36,=·yi=,因为=0.3+,所以=0.3×+,可得≈5.55.
答案:46.36 5.55
14.(5分)为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如表所示:
患慢性气管炎
未患慢性气管炎
合计
吸烟
20
m
40
不吸烟
n
55
60
合计
25
75
100
根据列联表数据,求得χ2= (保留3位有效数字),根据下表,有 的把握认为患慢性气管炎与吸烟有关.
参考公式:χ2=(其中n=a+b+c+d).
附表:
P(χ2≥x0)
0.050
0.010
0.001
x0
3.841
6.635
10.828
解析:由20+m=40,得m=20.
由20+n=25,得n=5.
故χ2=≈22.2>10.828.
所以有99.9%的把握认为患慢性气管炎与吸烟有关.
答案:22.2 99.9%
四、解答题(本大题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤)
15.(13分)一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数,现观测得到(x,y)的4组观测值为(8,5),(12,8),(14,9),(16,11).
(1)假定y与x之间有线性相关关系,求y关于x的回归直线方程;(8分)
(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1转/秒)(5分)
解:(1)设回归直线方程为=x+,
易知=12.5,=8.25,=660,
xiyi=438.
于是==,
=-=8.25-×12.5=-.
所以所求的回归直线方程为=x-.
(2)由=x-≤10,得x≤.
因为≈14.9,所以机器的速度不得超过14转/秒.
16.(15分)在统计学中,偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差,班主任为了了解个别学生的偏科情况,对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行学科偏差分析,决定从全班56位同学中随机抽取一个容量为8的样本进行分析,得到他们的两科成绩偏差数据如表:
学生序号
1
2
3
4
5
6
7
8
数学偏差
x(分)
20
15
13
3
2
-5
-10
-18
物理偏差
y(分)
6.5
3.5
3.5
1.5
0.5
-0.5
-2.5
-3.5
(1)已知x与y之间具有线性相关关系,求y关于x的回归直线方程;(9分)
(2)若这次考试该班数学平均分为118分,物理平均分为90.5,试预测数学成绩126分的同学的物理成绩.(6分)
参考数据:xiyi=324,=1 256.
解:(1)由题意,=×[20+15+13+3+2+(-5)+(-10)+(-18)]=,=×[6.5+3.5+3.5+1.5+0.5+(-0.5)+(-2.5)+(-3.5)]=,
===,
所以=-=-×=,
故回归直线方程为=x+.
(2)由题意,设该同学的物理成绩为ω,
则物理偏差为ω-90.5.
而数学偏差为126-118=8,
由(1)的结论可得,ω-90.5=×8+,解得ω=93,
所以可以预测这位同学的物理成绩为93分.
17.(15分)已知某区组建了一支120人的志愿者队伍,并由其中72人组成“志愿模范队”.经过一年的实践,全队共有72人的周平均服务时长超过2小时,其中有54人来自“志愿模范队”,如下表所示.
是“志愿模
范队”成员
不是“志愿
模范队”成员
合计
周平均服务时
长超过2小时
54
72
周平均服务时长
不超过2小时
合计
72
120
(1)已知一名志愿者是“志愿模范队”成员,求其周平均服务时长超过2小时的概率.(8分)
(2)请完成2×2列联表,并根据表中数据回答:是否有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系?(7分)
解:(1)设事件A表示志愿者是“志愿模范队”成员,事件B表示志愿者周平均服务时长超过2小时.
由题可知n(Ω)=120,n(A)=72,n(A∩B)=54,因为每个志愿者被抽到的可能性相等,
根据古典概型的概率公式得,P(A)===,P(A∩B)===.
由条件概率公式可得,P(B|A)===.故一名志愿者是“志愿模范队”成员的条件下其周平均服务时长超过2小时的概率为.
(2)由题可得如下2×2列联表:
是“志愿
模范队”
成员
不是“志愿
模范队”
成员
合计
周平均服务时
长超过2小时
54
18
72
周平均服务时
长不超过2小时
18
30
48
合计
72
48
120
提出统计假设H0:“是‘志愿模范队’成员”与“周平均服务时长超过2小时”无关,
因为χ2===16.875,由于χ2>10.828,故否定假设H0,
故有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系.
18.(17分)某学校举办了“课外阅读知识竞赛”,为了调查学生对这次活动的满意程度,在所有参加“课外阅读知识竞赛”的学生中抽取容量为300的样本进行调查,并得到如下2×2列联表:(单位:人)
满意程度
性别
合计
男生
女生
满意
120
30
150
不满意
80
70
150
合计
200
100
300
(1)是否有99.9%的把握认为满意程度与性别有关系?(5分)
(2)有20名学生进入竞赛的某环节,该环节共设置3道试题,且每一道试题必须依次作答,至少答对2道才能进入下一环节.若每人答对这3道试题的概率分别为,,,3道试题答对与否互不影响.用X表示能进入下一环节的人数,求X的数学期望.(12分)
附:χ2=,其中n=a+b+c+d.
P(χ2≥x0)
0.1
0.05
0.01
0.001
x0
2.706
3.841
6.635
10.828
解:(1)提出统计假设H0:满意程度与性别无关.
根据列联表中的数据,计算得χ2==24>10.828.
所以否定假设H0,所以有99.9%的把握认为满意程度与性别有关系.
(2)依题意,设事件Ai=“某学生答对第i道题”(i=1,2,3),B=“某学生进入下一环节”,
则P(A1)=,P(A2)=,P(A3)=.
因为B=A1A2A3+A1A2+A1A3+A2A3,所以P(B)=P(A1A2A3)+P(A1A2)+P(A1A3)+P(A2A3)=××+××+××+××=.依题意,X~B,所以E(X)=20×=.
19.(17分)某乡政府为提高当地农民收入,指导农民种植药材,并在种植药材的土地附近种草放牧发展畜牧业.牛粪、羊粪等有机肥可以促进药材的生长,发展生态循环农业.如图所示为某农户近7年种植药材的平均收入y(单位:千元)与年份代码x的折线图.并计算得到yi=480,xiyi=2 052,≈25,(xi-)(yi-)=132,
wi=140,(wi-)(yi-)=1 048,
≈43.3,其中wi=.
(1)根据折线图判断,=+x与=+x2哪一个适宜作为平均收入y关于年份代码x的回归方程类型?并说明理由;(9分)
(2)根据(1)的判断结果及数据,建立y关于x的回归方程,并预测2026年该农户种植药材的平均收入.(8分)
附:相关系数r=,
回归直线的斜率和截距的最小二乘法公式分别为=,=-,≈2.65.
解:(1)因为=(1+2+3+4+5+6+7)=4,所以(xi-)2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28.
对于模型=+x,
相关系数r=≈≈0.996.
对于模型=+x2,
相关系数r'=≈≈0.968.
因为0.996>0.968,所以=+x适宜作为平均收入y关于年份代码x的回归方程.
(2)由(1)可知回归方程类型为=+x.
由已知数据及公式可得===≈4.71,=-=-×4≈49.71.
所以y关于x的回归直线方程为=4.71x+49.71.
又年份代码1~7分别对应年份2018~2024,所以2026年对应年份代码为9,
代入可得=4.71×9+49.71=92.1.
所以预测2026年该农户种植药材的平均收入为92.1千元.
学科网(北京)股份有限公司
$