内容正文:
专题四 概率与统计
第1练 统计与成对数据的分析专项训练
一、单选题:
1.(2025·福建省龙岩市·模拟)某市智能机器人比赛项目有位同学参赛,他们在预赛中所得的积分互不相同,只有积分在前名的同学才能进入决赛.若某同学知道自己的积分后,要判断自己能否进入决赛,则他只需要知道这位同学的预赛积分的( )
A. 中位数 B. 众数 C. 平均数 D. 极差
2.(2025·山东省济宁市·模拟)下列各组数据中方差最大的一组是( )
A. ,,,, B. ,,,,
C. ,,,, D. ,,,,
3.(2025·湖南省郴州市·模拟)马拉松爱好者小丽月份每个月的跑步里程单位:公里如下表所示,则小丽月份每个月的跑步里程的分位数为( )
月份
月
月
月
月
月
月
跑步里程
A. 公里 B. 公里 C. 公里 D. 公里
4.(2025·河北省保定市·联考)某车间主任为了预估该车间一天加工零件的个数,需要测试加工零件所花费的时间,为此进行了次试验,这次试验的数据如下表:
零件数个
加工时间分钟
若用最小二乘法求得回归直线方程为,则估计加工这样的零件个需要的时间是( )
A. 分钟 B. 分钟 C. 分钟 D. 分钟
5.(2025·安徽省芜湖市·模拟)已知个样本数据的平均值为,方差为,则这个数据的分位数的最大值为( )
A. B. C. D.
6.(2025·山西省·模拟)正悄然改变着我们的生活某在线平台利用技术为学生提供个性化学习路径,为了解学生对平台的满意程度,随机抽取使用该平台的学生进行打分,将收集到的分数数据按照分组,画出频率分布直方图如图所示,则这些数据的中位数约为( )
A. B. C. D.
7.(2025·内蒙古自治区呼和浩特市·模拟题)给定一组数据:,,,,下列说法正确的是 .
A. 这组数据的极差为 B. 这组数据的中位数小于
C. 这组数据的平均数 D. 这组数据的方差为
二、多选题:
8.(2025·福建省泉州市·模拟)某地种植的新品种哈密瓜获得了丰收,随机从采摘好的哈密瓜中挑选了个称重单位:,并整理数据,得到如下频率分布直方图根据此频率分布直方图,下面结论正确的是( )
A.
B. 估计该哈密瓜的质量不低于的比例为
C. 估计有一半以上的该哈密瓜的质量介于至之间
D. 估计该哈密瓜的质量的中位数介于至之间
9.(2025·湖北省十堰市·模拟)至年我国快递业务量及其增长速度如图所示,则
A. 至年我国快递业务量逐年增长
B. 至年我国快递业务量的中位数是亿件
C. 至年我国快递业务量增长速度的极差是
D. 估计我国年的快递业务量大于亿件
10.(2025·广西壮族自治区柳州市·模拟)某人工智能公司近年的利润情况如下表所示:
第年
利润亿元
已知变量与之间具有线性相关关系,设用最小二乘法建立的回归直线方程为,则下列说法正确的是( )
A.
B. 变量与之间的线性相关系数
C. 预测该人工智能公司第年的利润约为亿元
D. 残差绝对值的最大值为
三、填空题:
11.(2025·陕西省咸阳市·模拟)某地气象局测得该地连续天的最高气温分别为,,,,,,,,,单位:,若该组数据的平均数与众数相等,则 .
12.(2025·福建省·模拟)红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数个和温度的组观测数据,制成图所示的散点图.现用两种模型,,分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图所示的残差图.
根据收集到的数据,计算得到如下值:
表中,,,;
根据残差图,比较模型、的拟合效果,模型 比较合适?
根据中所选择的模型,求出关于的回归方程是 附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,.
四、解答题:
13.(2025·山东省济宁市·模拟)近年来,户外运动越来越受到人们的重视,某市对高中学生是否喜欢户外运动进行了一个随机调查,调查的数据如下表所示:
喜欢
不喜欢
合计
男生
女生
合计
求,;
依据该统计数据,能否有的把握认为该市高中学生是否喜欢户外运动与性别有关?
以样本频率估计概率,在全市高中学生中抽取名同学,记其中不喜欢户外运动的学生数为求随机变量的数学期望和方差.
附:,其中.
14.(2025·湖南省长沙市·模拟)某市统计了年月的空气质量指数,将其分为,,,的组,画出频率分布直方图如图所示.
若,称当天空气质量达标若,称当天空气质量不达标.
求
从月的天中任取天,求至少有天空气质量达标的概率
若年月的天中有天空气质量达标,请完成下面列联表,根据小概率值的独立性检验,能否认为空气质量是否达标与月份有关联
月份
空气质量
合计
达标
不达标
月
月
合计
附:,,
学科网(北京)股份有限公司
$
专题四 概率与统计
第1练 统计与成对数据的分析专项训练
一、单选题:
1.(2025·福建省龙岩市·模拟)某市智能机器人比赛项目有位同学参赛,他们在预赛中所得的积分互不相同,只有积分在前名的同学才能进入决赛.若某同学知道自己的积分后,要判断自己能否进入决赛,则他只需要知道这位同学的预赛积分的( )
A. 中位数 B. 众数 C. 平均数 D. 极差
【答案】A
【解析】解:因为位同学的积分,中位数是第名的预赛积分,所以知道中位数即可判断是否在前.
故选:.
2.(2025·山东省济宁市·模拟)下列各组数据中方差最大的一组是( )
A. ,,,, B. ,,,,
C. ,,,, D. ,,,,
【答案】D
【解析】解:四个选项的数据平均数都是;
选项A的方差为;
选项B的方差为;
选项C的方差为;
选项D的方差为.
故选D.
3.(2025·湖南省郴州市·模拟)马拉松爱好者小丽月份每个月的跑步里程单位:公里如下表所示,则小丽月份每个月的跑步里程的分位数为( )
月份
月
月
月
月
月
月
跑步里程
A. 公里 B. 公里 C. 公里 D. 公里
【答案】C
【解析】解:将小丽月份每个月的跑步里程从小到大排列:,,,,,.
因为,
所以小丽月份每个月的跑步里程的分位数为公里.
故选:.
4.(2025·河北省保定市·联考)某车间主任为了预估该车间一天加工零件的个数,需要测试加工零件所花费的时间,为此进行了次试验,这次试验的数据如下表:
零件数个
加工时间分钟
若用最小二乘法求得回归直线方程为,则估计加工这样的零件个需要的时间是( )
A. 分钟 B. 分钟 C. 分钟 D. 分钟
【答案】A
【解析】解:由已知,
所以,
当时,分钟.
故选:.
5.(2025·安徽省芜湖市·模拟)已知个样本数据的平均值为,方差为,则这个数据的分位数的最大值为( )
A. B. C. D.
【答案】C
【解析】解:设这个样本数据分别为,且.
因为,所以这个数据的分位数为.
设的平均值为,方差为,的平均值为,方差为,
由题意知,则;
,
所以,整理得,解得,
所以,
当且仅当时等号成立,
即,时,取到最大值.
故选:.
6.(2025·山西省·模拟)正悄然改变着我们的生活某在线平台利用技术为学生提供个性化学习路径,为了解学生对平台的满意程度,随机抽取使用该平台的学生进行打分,将收集到的分数数据按照分组,画出频率分布直方图如图所示,则这些数据的中位数约为( )
A. B. C. D.
【答案】C
【解析】解:由于,,
因此中位数落在区间内,设中位数为,
由,得,因此,中位数约为.
故选:.
7.(2025·内蒙古自治区呼和浩特市·模拟题)给定一组数据:,,,,下列说法正确的是 .
A. 这组数据的极差为 B. 这组数据的中位数小于
C. 这组数据的平均数 D. 这组数据的方差为
【答案】D
【解析】解:对于,因这组数据间的大小关系不清楚,故无法确定极差,故A错误;
对于,若这组数据,,,,是从大到小排列,则这组数据的中位数必不小于,故B错误;
对于,若这组数据为,则这组数据的平均数为,
而,此时有,故C错误;
对于,这组数据的方差为
,故D正确.
故选:.
二、多选题:
8.(2025·福建省泉州市·模拟)某地种植的新品种哈密瓜获得了丰收,随机从采摘好的哈密瓜中挑选了个称重单位:,并整理数据,得到如下频率分布直方图根据此频率分布直方图,下面结论正确的是( )
A.
B. 估计该哈密瓜的质量不低于的比例为
C. 估计有一半以上的该哈密瓜的质量介于至之间
D. 估计该哈密瓜的质量的中位数介于至之间
【答案】BCD
【解析】对于:,
解得,故 A错误;
对于:估计该哈密瓜的质量不低于的比例为,故 B正确;
对于因为,所以估计有一半以上的该哈密瓜的质量介于至之间,故C正确;
对于因为哈密瓜的质量在的频率为 ,在的频率为 ,
所以估计该哈密瓜的质量的中位数介于至之间,故D正确.
故选:.
9.(2025·湖北省十堰市·模拟)至年我国快递业务量及其增长速度如图所示,则
A. 至年我国快递业务量逐年增长
B. 至年我国快递业务量的中位数是亿件
C. 至年我国快递业务量增长速度的极差是
D. 估计我国年的快递业务量大于亿件
【答案】ABD
【解析】解:对于选项A,至年我国快递业务量分别为,,,,单位:亿件,
根据数据可以看出至年我国快递业务量逐年增长,A正确;
对于选项B,根据选项A可以看到,至年我国快递业务量的中位数是亿件,B正确;
对于选项C,增长速度的极差为增长速度的最大值减增长速度的最小值,则增长速度的极差为,
故至年我国快递业务量增长速度的极差是, C错误;
对于选项D,设我国年的快递业务量为亿件,则根据增长率可知,
得,D正确.
故选:.
10.(2025·广西壮族自治区柳州市·模拟)某人工智能公司近年的利润情况如下表所示:
第年
利润亿元
已知变量与之间具有线性相关关系,设用最小二乘法建立的回归直线方程为,则下列说法正确的是( )
A.
B. 变量与之间的线性相关系数
C. 预测该人工智能公司第年的利润约为亿元
D. 残差绝对值的最大值为
【答案】ACD
【解析】解:依题意,,
因为回归直线方程为必过样本中心点,
则,解得,故A正确;
回归直线方程为,
则与成正相关,即相关系数,故B错误;
当时,,
即该人工智能公司第年的利润约为亿元,故C正确;
当时,,残差绝对值为,
当时,,残差绝对值为,
当时,,残差绝对值为,
当时,,残差绝对值为,
当时,,残差绝对值为,
所以残差绝对值的最大值为,故D正确;
故选:.
三、填空题:
11.(2025·陕西省咸阳市·模拟)某地气象局测得该地连续天的最高气温分别为,,,,,,,,,单位:,若该组数据的平均数与众数相等,则 .
【答案】
【解析】解:因为出现次,其余出现次数不超过次,可知众数为,
由题意可得:,解得.
故答案为.
12.(2025·福建省·模拟)红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数个和温度的组观测数据,制成图所示的散点图.现用两种模型,,分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图所示的残差图.
根据收集到的数据,计算得到如下值:
表中,,,;
根据残差图,比较模型、的拟合效果,模型 比较合适?
根据中所选择的模型,求出关于的回归方程是 附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,.
【答案】
【解析】解:模型更合适,理由如下:
模型残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型带状宽度窄,
所以模型的拟合精度更高,回归方程的预报精度相应就会越高,故选模型比较合适;
令,与温度可以用线性回归方程来拟合,则,
由所给的参考数据可得,,
所以,
所以关于的线性回归方程为,即,
所以产卵数关于温度的回归方程为.
故答案为:;.
四、解答题:
13.(2025·山东省济宁市·模拟)近年来,户外运动越来越受到人们的重视,某市对高中学生是否喜欢户外运动进行了一个随机调查,调查的数据如下表所示:
喜欢
不喜欢
合计
男生
女生
合计
求,;
依据该统计数据,能否有的把握认为该市高中学生是否喜欢户外运动与性别有关?
以样本频率估计概率,在全市高中学生中抽取名同学,记其中不喜欢户外运动的学生数为求随机变量的数学期望和方差.
附:,其中.
【答案】,;
有的把握认为高中学生是否喜欢户外运动与性别有关;
.
【解析】解:由题意知,,,
所以,;
零假设:该市高中学生是否喜欢户外运动与性别无关,
由知,列联表如下:
喜欢
不喜欢
合计
男生
女生
合计
,
所以有的把握认为高中学生是否喜欢户外运动与性别有关;
由题意得,不喜欢户外运动的学生的概率为,
所以在全市高中学生中抽取名同学,不喜欢户外运动的学生数有,
所以,
.
14.(2025·湖南省长沙市·模拟)某市统计了年月的空气质量指数,将其分为,,,的组,画出频率分布直方图如图所示.
若,称当天空气质量达标若,称当天空气质量不达标.
求
从月的天中任取天,求至少有天空气质量达标的概率
若年月的天中有天空气质量达标,请完成下面列联表,根据小概率值的独立性检验,能否认为空气质量是否达标与月份有关联
月份
空气质量
合计
达标
不达标
月
月
合计
附:,,
【答案】.
.
没有充分证据推断不成立,因此可以认为成立,即认为空气质量是否达标与月份无关.
【解析】解:由图可得,,解得.
月空气质量达标的频率为,
天数为,
设“从月的天中任取天,至少有天空气质量达标”,
则.
补全列联表如下:
月份
空气质量
合计
达标
不达标
月
月
合计
零假设为空气质量是否达标与月份无关,根据表中数据,
计算得,
根据小概率值的独立性检验,
没有充分证据推断不成立,因此可以认为成立,即认为空气质量是否达标与月份无关.
学科网(北京)股份有限公司
$