内容正文:
第14章 统计(单元重点综合测试)
班级___________ 姓名___________ 学号____________ 分数____________
考试范围:全章的内容; 考试时间:120分钟; 总分:150分
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.(24-25高二上·黑龙江哈尔滨·期末)某学校高一、高二、高三年级的学生人数分别为、、,该校采用分层抽样的方法,从这三个年级中抽取名学生进行座谈( )
A.、、 B.、、 C.、、 D.、、
2.(24-25高三上·江西赣州·期末)某普通高中高二年级学生参加体育学业水平考试立定跳远项目模拟测试,甲、乙两位同学连续5次的测试数据如下表单位:
甲
210
220
216
220
230
乙
215
212
216
223
249
下列说法错误的是( )
A.甲同学测试数据的众数为220 B.乙同学测试数据的极差为37
C.甲同学测试数据的分位数为220 D.乙同学测试数据的平均数为223
3.(24-25高三上·辽宁·期末)某厂质检员利用随机数表对生产的600个产品进行抽样调查,先将这600个产品进行编号:001,002,003,…,600.从中抽取120个样本,下图是随机数表的第2行到第3行,若从随机数表的第2行第5列开始从左向右读取数据,则得到的第5个编号是( )
32 12 67 12 31 02 37 02 14 72 31 09 81 47 80 25 13 25 46 08
71 20 34 51 19 72 01 38 47 18 04 92 51 28 02 31 27 46 51 30
A.098 B.147 C.513 D.310
4.(江西省景德镇市2024-2025学年高一上学期1月期末质量检测数学试题)已知一组数,,,的平均数是,方差,则数据,,,的平均数和方差分别为( )
A.11,4 B.8,8 C.11,8 D.4,2
5.(24-25高三上·湖北武汉·阶段练习)某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价,即确定一户居民月均用水量标准,用水量不超过的部分按平价收费,超出的部分按议价收费.通过抽样获得了100户居民的月均用水数据(单位:t),制成如下频率分布表.
分组
频率
0.23
0.32
0.13
0.09
0.09
0.05
0.03
0.04
0.02
如果以居民月均用水量不超过的占,大于的占20%为标准,根据频率分布表估计,下列最接近的数是( )
A.15 B.14 C.13 D.12
6.(24-25高一上·江西赣州·期末)为深入学习宣传党的二十大精神,某校开展了“奋进新征程,强国伴我行”二十大主题知识竞赛.其中高一年级选派了10名同学参赛,且该10名同学的成绩依次是71,73,80,85,90,92,94,95,98,100,则分位数为( )
A.92 B.93 C.94 D.
7.(24-25高一上·河南南阳·阶段练习)已知一个样本容量为10的样本平均数为5,方差为1.6.现将样本中的3个数据去掉,则去掉后剩余样本容量为7的样本平均数和是( )
A.5,1 B.5,2 C.5,3 D.4,3
8.(24-25高二上·四川绵阳·期末)哈希表(HashTable)是一种利用键值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是“除留余数法”.例如,当除数为时,键值为的数据因余,应存放于位置中,从而可直接依据键值快速定位数据位置,多个数据可映射到同一位置(如键值和均映射到同一位置).现有一个容量为个位置(编号)的哈希表,以除留余数法(除数为)进行映射,需要存储个数据.设这个位置存放的数据个数分别为、、、、、、,则下列说法中正确的是( )
A.至少有个位置存放了不少于个数据
B.若这个数据的键值恰好是间的所有奇数,则的中位数为
C.若的方差为,则的最小值为,最大值为
D.若的极差为,则最多有个位置没有存放数据
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.(江西省景德镇市2024-2025学年高一上学期1月期末质量检测数学试题)高一上学期某高一班进行了6次数学测验,甲乙两同学6次测验成绩情况如下表:
场次
1
2
3
4
5
6
甲成绩
90
106
80
115
120
109
乙成绩
90
88
98
101
95
93
则下列说法正确的是( )
A.甲成绩的极差小于乙成绩的极差
B.甲、乙成绩的中位数分别为107.5和94
C.甲成绩的平均值大于乙成绩的平均值
D.甲的成绩比乙的成绩稳定
10.(2025高三·全国·专题练习)南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔(Florence Nightingale)设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年中国知识付费用户数量(单位:亿人次,数据为年末数据),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法正确的是( )
A.2016年至2023年,知识付费用户数量逐年增加
B.2017年至2023年,知识付费用户数量逐年增加量2018年最多
C.2017年至2023年,知识付费用户数量的逐年增加量逐年递增
D.2023年知识付费用户数量超过2016年知识付费用户数量的10倍
11.(24-25高三上·河北邯郸·阶段练习)现有甲、乙、丙三位篮球运动员连续5场篮球比赛得分情况的记录数据,已知三位球员得分情况的数据满足以下条件:
甲球员:5个数据的中位数是25,众数是23;
乙球员:5个数据的中位数是28,平均数是26;
丙球员:5个数据有1个是30,平均数是25,方差是10;
根据以上统计数据,下列统计结论一定正确的是( )
A.甲球员连续5场比赛得分都不低于23分
B.乙球员连续5场比赛得分都不低于23分
C.丙球员连续5场比赛得分都不低于23分
D.丙球员连续5场比赛得分的第60百分位数大于23
三、填空题:本题共3小题,每小题5分,共15分.
12.(24-25高一上·江西南昌·期末)某车间10名工人生产某产品的数量(单位:件)分别为32,35,38,39,40,42,44,44,45,x,若所给数据的第50百分位数与第25百分位数的差为2,且,则 .
13.(2024高三·全国·专题练习)教育部为实施学生体质强健计划,特别指出要保障中小学生每天综合体育活动时间不低于2小时,让孩子们动起来,多见阳光,多呼吸新鲜空气.为此,某中学对高中三个年级进行了调研,采用分层随机抽样对高一、高二、高三按照的比例抽取550名学生,经统计,高一每天综合体育活动时间平均为3.5小时,高二每天综合体育活动时间平均为2.5小时,高三每天综合体育活动时间平均为2.1小时,则该校的每天综合体育活动时间平均为 小时.
14.(23-24高一下·江苏常州·期末)设x,y,z都是正整数,且,,,当x,y,z的取值依次为 时,x,y,z这三个数的方差最小.(若存在多组取值符合条件,只需写出其中一组取值)
四、解答题:本题共5小题,其中第15题13分,第16,17题15分,第18,19题17分,共77分.解答应写出文字说明、证明过程或演算步骤.
15.(24-25高二上·四川绵阳·期末)电力公司从某小区抽取100户居民用户进行12月用电量调查,发现他们的月用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1)求的值及这100户的用电量的平均数;
(2)力公司拟对用电量超过的家庭的电器进行检测,若恰好为第71百分位数,求.
16.(24-25高一上·贵州·期末)王老师从所教两个班的100名学生中随机抽取40名学生,记录他们期中考试的数学成绩(满分100分),根据所得数据,按分成五组,得到如图所示的频率分布直方图.
(1)估计这40名学生期中考试数学成绩的平均分和方差(各组数据用该组区间的中点值作代表);
(2)已知剩余60名学生期中考试数学成绩的平均分为82,方差为101,结合(1)中求得的结果,估计王老师所教两个班的学生期中考试数学成绩的平均分和方差.
17.(23-24高一下·广东广州·阶段练习)某公司为了解用户对其产品的满意程度,从地区随机抽取了名用户,从地区随机抽取了名用户,请用户根据满意程度对该公司产品评分,该公司将收集到的数据按照、、、分组,绘制成评分频率分布直方图如图.
(1)从地区满意程度评分的第百分位数;
(2)根据频率分布直方图,假设同组中的每个数据用该区间的中点值代替,估计地区抽取的名用户对该公司产品的评分的平均值为,地区抽取的名用户对该公司产品的评分的平均值为,以及两地区抽取的名用户对该公司产品的评分的平均值为,试比较和的大小.
18.(24-25高二上·四川成都·期中)为了检验同学们高二以来的学习效果,某市在期末的时候将组织调研考试.在某次调研考试中学校为了解同学们的调考情况,从所有同学中随机抽取某学科的100份答卷作为样本,将样本成绩按从低到高依次分为第组(如下图所示,成绩满分为100分且成绩均为不低于40分的整数),得到如图所示的频率分布直方图.
(1)根据频率分布直方图求样本成绩的上四分位数;(上四分位数即75百分位数)
(2)已知第2组的平均成绩是54,方差是4,第3组的平均成绩为66,方差是4,
①分别求第2组和第3组的人数;
②求这两组成绩的总平均数和总方差.
参考公式或数据:
方差:.
19.(23-24高一下·福建南平·期末)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本量为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据:
抽取次序
1
2
3
4
5
6
7
8
9
10
身高
155
158
156
157
160
161
159
162
169
163
记抽取的第i个女生的身高为,样本平均数,方差.
参考数据:,,.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在范围内的人数;
(2)如果女生样本数据在之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的平均数与方差;
(3)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数和标准差,求,的值.
/
学科网(北京)股份有限公司
$$
第14章 统计(单元重点综合测试)
班级___________ 姓名___________ 学号____________ 分数____________
考试范围:全章的内容; 考试时间:120分钟; 总分:150分
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.(24-25高二上·黑龙江哈尔滨·期末)某学校高一、高二、高三年级的学生人数分别为、、,该校采用分层抽样的方法,从这三个年级中抽取名学生进行座谈( )
A.、、 B.、、 C.、、 D.、、
【答案】A
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】利用分层抽样的性质直接求解.
【详解】某学校高一、高二、高三年级的学生人数分别为、、,
该校采用分层抽样的方法,从这三个年级中抽取名学生进行座谈,
则高一年级抽取人数是:,
高二年级抽取人数是:,
高三年级抽取人数是:.
故选:A.
2.(24-25高三上·江西赣州·期末)某普通高中高二年级学生参加体育学业水平考试立定跳远项目模拟测试,甲、乙两位同学连续5次的测试数据如下表单位:
甲
210
220
216
220
230
乙
215
212
216
223
249
下列说法错误的是( )
A.甲同学测试数据的众数为220 B.乙同学测试数据的极差为37
C.甲同学测试数据的分位数为220 D.乙同学测试数据的平均数为223
【答案】C
【知识点】计算几个数的众数、计算几个数的平均数、计算几个数据的极差、方差、标准差、总体百分位数的估计
【分析】根据众数、极差、百分位数及平均数的计算方法计算即可判断.
【详解】对于A,220出现的次数最多,所以为众数,故A正确;
对于B,因为,所以极差为37,故B正确;
对于C,将甲同学测试数据从小到大排列:.
因为,所以分位数为,故C错误;
对于D,因为,故D正确.
故选:C
3.(24-25高三上·辽宁·期末)某厂质检员利用随机数表对生产的600个产品进行抽样调查,先将这600个产品进行编号:001,002,003,…,600.从中抽取120个样本,下图是随机数表的第2行到第3行,若从随机数表的第2行第5列开始从左向右读取数据,则得到的第5个编号是( )
32 12 67 12 31 02 37 02 14 72 31 09 81 47 80 25 13 25 46 08
71 20 34 51 19 72 01 38 47 18 04 92 51 28 02 31 27 46 51 30
A.098 B.147 C.513 D.310
【答案】C
【知识点】随机数表法
【分析】根据随机数表的读法读出前5个符合的编号即可得解.
【详解】由题意可知得到的编号依次为231,023,147,098,513,…,则得到的第5个编号是513.
故选:C.
4.(江西省景德镇市2024-2025学年高一上学期1月期末质量检测数学试题)已知一组数,,,的平均数是,方差,则数据,,,的平均数和方差分别为( )
A.11,4 B.8,8 C.11,8 D.4,2
【答案】C
【知识点】各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】根据数据()的平均数、方差分别、求解.
【详解】根据题意,数,,,的平均数是,方差,
则,,,的平均数为,
方差为.
故选:C
5.(24-25高三上·湖北武汉·阶段练习)某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价,即确定一户居民月均用水量标准,用水量不超过的部分按平价收费,超出的部分按议价收费.通过抽样获得了100户居民的月均用水数据(单位:t),制成如下频率分布表.
分组
频率
0.23
0.32
0.13
0.09
0.09
0.05
0.03
0.04
0.02
如果以居民月均用水量不超过的占,大于的占20%为标准,根据频率分布表估计,下列最接近的数是( )
A.15 B.14 C.13 D.12
【答案】B
【知识点】总体百分位数的估计
【分析】根据百分位数计算规则求出分位数,即可判断.
【详解】由表格数据可知用水量在的频率为;
用水量在的频率为,
所以分位数位于,设为,
则,解得,
所以,则选项中与最接近的为.
故选:B
6.(24-25高一上·江西赣州·期末)为深入学习宣传党的二十大精神,某校开展了“奋进新征程,强国伴我行”二十大主题知识竞赛.其中高一年级选派了10名同学参赛,且该10名同学的成绩依次是71,73,80,85,90,92,94,95,98,100,则分位数为( )
A.92 B.93 C.94 D.
【答案】B
【知识点】总体百分位数的估计
【分析】利用百分位数概念计算即可.
【详解】解:数据从小到大排序71,73,80,85,90,92,94,95,98,100,
因为,
故分位数为.
故选:B.
7.(24-25高一上·河南南阳·阶段练习)已知一个样本容量为10的样本平均数为5,方差为1.6.现将样本中的3个数据去掉,则去掉后剩余样本容量为7的样本平均数和是( )
A.5,1 B.5,2 C.5,3 D.4,3
【答案】B
【知识点】计算几个数据的极差、方差、标准差、计算几个数的平均数
【分析】根据平均数与方差的计算公式,分别表示出去掉前后两组数据的平均数与方差,将条件等式整体代入计算即可.
【详解】由均值得.
方差
得.
不妨设设,则
,
,
故选:B.
8.(24-25高二上·四川绵阳·期末)哈希表(HashTable)是一种利用键值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是“除留余数法”.例如,当除数为时,键值为的数据因余,应存放于位置中,从而可直接依据键值快速定位数据位置,多个数据可映射到同一位置(如键值和均映射到同一位置).现有一个容量为个位置(编号)的哈希表,以除留余数法(除数为)进行映射,需要存储个数据.设这个位置存放的数据个数分别为、、、、、、,则下列说法中正确的是( )
A.至少有个位置存放了不少于个数据
B.若这个数据的键值恰好是间的所有奇数,则的中位数为
C.若的方差为,则的最小值为,最大值为
D.若的极差为,则最多有个位置没有存放数据
【答案】D
【知识点】计算几个数的中位数、计算几个数据的极差、方差、标准差
【分析】设为数据除以的余数为的数的个数,利用特例法可判断A选项;求出这个数的值,结合中位数的定义可判断B选项;利用方差的定义可求出的最大值和最小值,可判断C选项;对个位置是否存在空位进行讨论,结合极差的定义可判断D选项.
【详解】设为数据除以的余数为的数的个数,
对于A选项,,
不妨假设这个位置存放的数据个数分别为、、、、、、,A错;
对于B选项,由题意可知,这些奇数分别为、、、、、、、、、
、、、、、、、、、、、、,
这些数据除的余数分别为:、、、、、、、、、、、、、、
、、、、、、、,
所以,,,,,,,,
将这个数由小到大排列依次为、、、、、、,中位数为,B错;
对于C选项,由题意可知,这个数的平均数为,
且,,
因为,,
当这个数中有个,个时,取最小值,
即,
当这个数中有个,个时,取最大值,
即,C错;
对于D选项,不妨这个数依次为:、、、、、、,
满足极差为,此时,所有位置都有数据,
若存在一些位置没有数据,则这个数据中的最大值为,最小值为,
因为,此时,至少需要个位置存放数据,则至多有个位置没有存放数据,D对.
故选:D.
【点睛】关键点点睛:解决本题D选项,主要要对个位置是否存在空位进行讨论,利用特例法结合极差的定义进行判断.
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.(江西省景德镇市2024-2025学年高一上学期1月期末质量检测数学试题)高一上学期某高一班进行了6次数学测验,甲乙两同学6次测验成绩情况如下表:
场次
1
2
3
4
5
6
甲成绩
90
106
80
115
120
109
乙成绩
90
88
98
101
95
93
则下列说法正确的是( )
A.甲成绩的极差小于乙成绩的极差
B.甲、乙成绩的中位数分别为107.5和94
C.甲成绩的平均值大于乙成绩的平均值
D.甲的成绩比乙的成绩稳定
【答案】BC
【知识点】计算几个数的中位数、用方差、标准差说明数据的波动程度、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】分别根据极差,中位数和平均数,以及数据的稳定性,即可判断选项.
【详解】A.甲成绩的极差是,乙成绩的极差是,故A错误;
B.甲成绩按照由小到大排列为80,90,106,109,115,120,中位数是,乙成绩按照由小到大排列为88,90,93,95,98,101,中位数是,故B正确;
C.甲成绩的平均数是,乙成绩的平均数是,故C正确;
D.分别对比数据可知,甲的成绩极差比较大,并且比较分散,而乙的成绩极差小,而且比较集中,所以乙的成绩比甲的成绩稳定,故D错误.
故选:BC
10.(2025高三·全国·专题练习)南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔(Florence Nightingale)设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年中国知识付费用户数量(单位:亿人次,数据为年末数据),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法正确的是( )
A.2016年至2023年,知识付费用户数量逐年增加
B.2017年至2023年,知识付费用户数量逐年增加量2018年最多
C.2017年至2023年,知识付费用户数量的逐年增加量逐年递增
D.2023年知识付费用户数量超过2016年知识付费用户数量的10倍
【答案】AB
【知识点】根据扇形统计图解决实际问题
【分析】利用题中所给的南丁格尔玫瑰图逐一考查所给选项,即可得解.
【详解】对于A,由图可知,2016年至2023年,知识付费用户数量逐年增加,故A正确.
对于B和C,知识付费用户数量的逐年增加量分别为:2017年,;2018年,;2019年,;2020年,;2021年,;2022年,;2023年:.则知识付费用户数量逐年增加量2018年最多,知识付费用户数量的逐年增加量不是逐年递增,故B正确,C错误.
对于D,由,则2023年知识付费用户数量未超过2016年知识付费用户数量的10倍,故D错误.
故选:AB.
11.(24-25高三上·河北邯郸·阶段练习)现有甲、乙、丙三位篮球运动员连续5场篮球比赛得分情况的记录数据,已知三位球员得分情况的数据满足以下条件:
甲球员:5个数据的中位数是25,众数是23;
乙球员:5个数据的中位数是28,平均数是26;
丙球员:5个数据有1个是30,平均数是25,方差是10;
根据以上统计数据,下列统计结论一定正确的是( )
A.甲球员连续5场比赛得分都不低于23分
B.乙球员连续5场比赛得分都不低于23分
C.丙球员连续5场比赛得分都不低于23分
D.丙球员连续5场比赛得分的第60百分位数大于23
【答案】AD
【知识点】根据平均数求参数、根据方差、标准差求参数、计算几个数的中位数、总体百分位数的估计
【分析】A由中位数,众数定义可判断选项正误;
B由中位数,平均数定义举特例可判断选项正误;
C由平均数,方差定义结合题意举特例可判断选项正误;
D.由题意结合方差平均数定义可得最大数据为30,后由百分位数结合反证法可判断选项正误.
【详解】A选项,设甲球员的5场篮球比赛得分按从小到大排列为、、、、,由题则,,
且23至少出现2次,故,故A正确;
B选项,设乙球员的5场篮球比赛得分按从小到大排列为,、,,,则,由题.
取,,,,可得其平均数为26满足条件,但有2场得分低于23,故B错误,
C选项,设丙球员的5场篮球比赛得分按从小到大排列为、、、、,
由已知,
所以.
取.因为、、、、的平均数为25,
所以.取,,,,
满足要求,但有一场得分低于23分,故C错误;
D选项,若,此时,与题意不符;
同理可得均不合题意.则.
因为,所以丙球员连续5场比赛得分的第60百分位数为.
若,则,故,与矛盾.
所以,所以丙球员连续5场比赛得分的第60百分位数大于23,故D正确.
故选:AD.
三、填空题:本题共3小题,每小题5分,共15分.
12.(24-25高一上·江西南昌·期末)某车间10名工人生产某产品的数量(单位:件)分别为32,35,38,39,40,42,44,44,45,x,若所给数据的第50百分位数与第25百分位数的差为2,且,则 .
【答案】40
【知识点】总体百分位数的估计
【分析】分类讨论确定第50百分位数与第25百分位数,列式求解即可.
【详解】已知数据有10个,所以第50百分位数为第5项和第6项数据的平均值,第25百分位数为第3项数据,
若,则这组数据的第50百分位数与第25百分位数分别为和35,
则,不合题意;
若,则这组数据的第50百分位数与第25百分位数分别为和x,
则,解得,不合题意;
若,则这组数据的第50百分位数与第25百分位数分别为和38,
则,不合题意;
若,则这组数据的第50百分位数与第25百分位数分别为和38,
则,解得,不合题意;
若,则这组数据的第50百分位数与第25百分位数分别为和38,
则,解得;
若,则这组数据的第50百分位数与第25百分位数分别为41和38,它们的差为3,不符合条件.
故答案为:40
13.(2024高三·全国·专题练习)教育部为实施学生体质强健计划,特别指出要保障中小学生每天综合体育活动时间不低于2小时,让孩子们动起来,多见阳光,多呼吸新鲜空气.为此,某中学对高中三个年级进行了调研,采用分层随机抽样对高一、高二、高三按照的比例抽取550名学生,经统计,高一每天综合体育活动时间平均为3.5小时,高二每天综合体育活动时间平均为2.5小时,高三每天综合体育活动时间平均为2.1小时,则该校的每天综合体育活动时间平均为 小时.
【答案】2.5/
【知识点】抽样比、样本总量、各层总数、总体容量的计算、计算几个数的平均数
【分析】利用分层抽样的理论,根据比例求得每个年级的人数,结合平均数的计算公式,可得答案.
【详解】因为按照的比例抽取550名学生,
则高一、高二、高三抽取的学生分别为(人),(人),(人),
则该校的每天综合体育活动时间平均为(小时).
故答案为:.
14.(23-24高一下·江苏常州·期末)设x,y,z都是正整数,且,,,当x,y,z的取值依次为 时,x,y,z这三个数的方差最小.(若存在多组取值符合条件,只需写出其中一组取值)
【答案】(或)
【知识点】计算几个数据的极差、方差、标准差
【分析】根据方差定义计算方差,再由方差最小,确定后转化为关于的二次函数,利用二次函数求最小值即可得解.
【详解】设,
则
,
要使方差最小,三个数据应尽量靠近,故,
则,
关于的二次函数的对称轴为,又且为正整数,
所以当或时,方差最小,最小值为.
故满足条件的为或.
故答案为:(或).
四、解答题:本题共5小题,其中第15题13分,第16,17题15分,第18,19题17分,共77分.解答应写出文字说明、证明过程或演算步骤.
15.(24-25高二上·四川绵阳·期末)电力公司从某小区抽取100户居民用户进行12月用电量调查,发现他们的月用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1)求的值及这100户的用电量的平均数;
(2)力公司拟对用电量超过的家庭的电器进行检测,若恰好为第71百分位数,求.
【答案】(1),平均数为322
(2)400
【知识点】由频率分布直方图估计平均数、总体百分位数的估计、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】根据频率分布直方图中长方形的面积之和为1得到,然后根据平均数的计算公式即可求解,
(2)根据百分位数的概念计算即可.
【详解】(1),解得,
平均数为
(2)在这组数据中对应的频率为,
对应的频率为,
所以这组数据第71百分位数在中,
设第71百分位数为,则,解得.
16.(24-25高一上·贵州·期末)王老师从所教两个班的100名学生中随机抽取40名学生,记录他们期中考试的数学成绩(满分100分),根据所得数据,按分成五组,得到如图所示的频率分布直方图.
(1)估计这40名学生期中考试数学成绩的平均分和方差(各组数据用该组区间的中点值作代表);
(2)已知剩余60名学生期中考试数学成绩的平均分为82,方差为101,结合(1)中求得的结果,估计王老师所教两个班的学生期中考试数学成绩的平均分和方差.
【答案】(1)平均分,方差
(2)平均分分,方差
【知识点】频率分布直方图的实际应用、由频率分布直方图估计平均数
【分析】(1)利用平均数的估计计算公式计算即可,利用方差的定义计算即可;
(2)根据分层抽样的平均数公式与方差公式计算可得结论.
【详解】(1)这40名学生期中考试数学成绩的平均分为:
,
这40名学生期中考试数学成绩的方差为:
(2)两个班的学生期中考试数学成绩的平均分为,
两个班的学生期中考试数学成绩的方差为:
.
17.(23-24高一下·广东广州·阶段练习)某公司为了解用户对其产品的满意程度,从地区随机抽取了名用户,从地区随机抽取了名用户,请用户根据满意程度对该公司产品评分,该公司将收集到的数据按照、、、分组,绘制成评分频率分布直方图如图.
(1)从地区满意程度评分的第百分位数;
(2)根据频率分布直方图,假设同组中的每个数据用该区间的中点值代替,估计地区抽取的名用户对该公司产品的评分的平均值为,地区抽取的名用户对该公司产品的评分的平均值为,以及两地区抽取的名用户对该公司产品的评分的平均值为,试比较和的大小.
【答案】(1)75
(2)
【知识点】由频率分布直方图估计平均数、总体百分位数的估计
【分析】(1)根据百分位数的定义结合频率分布直方图求解即可;
(2)由每组区间的中点值乘对应的频率再求和得到,再由求出,比较大小即可.
【详解】(1)因为前2组的频率和为,
前3组的频率和为,
所以第百分位数在第3组,设第百分位数为,
则,解得,
所以地区满意程度评分的第百分位数为75;
(2)由频率分布直方图可得
,
,
所以,
因为地区和地区所抽取的用户人数之比为,
所以地区抽取用户人数占总数的,地区抽取用户人数占总数的,
所以两地区抽取的名用户对该公司产品的评分的平均值,
所以.
18.(24-25高二上·四川成都·期中)为了检验同学们高二以来的学习效果,某市在期末的时候将组织调研考试.在某次调研考试中学校为了解同学们的调考情况,从所有同学中随机抽取某学科的100份答卷作为样本,将样本成绩按从低到高依次分为第组(如下图所示,成绩满分为100分且成绩均为不低于40分的整数),得到如图所示的频率分布直方图.
(1)根据频率分布直方图求样本成绩的上四分位数;(上四分位数即75百分位数)
(2)已知第2组的平均成绩是54,方差是4,第3组的平均成绩为66,方差是4,
①分别求第2组和第3组的人数;
②求这两组成绩的总平均数和总方差.
参考公式或数据:
方差:.
【答案】(1)84;
(2)①10,20;②总平均数是62,总方差是36
【知识点】计算频率分布直方图中的方差、标准差、总体百分位数的估计、由频率分布直方图计算频率、频数、样本容量、总体容量、计算几个数的平均数
【分析】(1)根据频率分布直方图结合百分位数的定义计算即可;
(2)①利用频率分布直方图直接计算可得;②利用平均数与方差的计算公式计算即可.
【详解】(1)上四分位数即75百分位数,
成绩落在内的频率为
成绩落在内的频率为,
设第75百分位数为,则其位于区间,
则,解得,
所以上四分位数为84;
(2)①由图可知,成绩在的人数为,
成绩在的人数为,
②两组成绩的总平均数为,
设成绩在中10人的分数分别为;
成绩在中20人的分数分别为,
则由题意可得,,,
即,
所以,
所以两组成绩的总平均数是62,总方差是36.
19.(23-24高一下·福建南平·期末)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本量为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据:
抽取次序
1
2
3
4
5
6
7
8
9
10
身高
155
158
156
157
160
161
159
162
169
163
记抽取的第i个女生的身高为,样本平均数,方差.
参考数据:,,.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在范围内的人数;
(2)如果女生样本数据在之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的平均数与方差;
(3)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数和标准差,求,的值.
【答案】(1);
(2)剩余女生样本身高的平均数与方差分别为,;
(3),.
【知识点】抽样比、样本总量、各层总数、总体容量的计算、估计总体的方差、标准差
【分析】(1)先求得抽取的女生身高在[160,165]之内的频率,进而可求解;
(2)求得,从而可知为离群值,进而可求得平均数和方差;
(3)先推导,代入数据即可求解.
【详解】(1)因为抽取的女生身高在[160,165]之内的频率为,
所以估计该校女生身高在[160,165]之内的人数为;
(2)因为,所以,
故,则为离群值.
则剔除离群值剩下数据的平均数为:,
故剩余女生样本身高的平均数为159,
又,
则剔除169,剩余女生样本身高的方差为:;
(3)采用分层抽样的方法抽取一个容量为30的样本,则男生20个,女生10个,
男生身高样本记为,均值,方差,
女生身高样本为,均值,方差
则总样本均值,
又因为,所以,同理可得,
故总样本方差
,
所以,估计学生总体身高的平均数,标准差.
【点睛】易错点点睛:解答此类统计类题目,因为牵涉到很多数据的计算,并且数据基本都是小数,因此很容易出现计算错误,需要十分细心.
/
学科网(北京)股份有限公司
$$