内容正文:
2025新高考高一统计易错培优竞赛试题
【专题目录】
专题一:名校统计易错题精选
专题二:名校统计培优题精选
专题三:统计全国高中数学联赛强基计划精选试题
【精选练习】
专题一:名校统计易错题精选
1.在高三某次调研考试时,某学习小组对本组6名同学的考试成绩进行统计,其中数学试卷上有一道满分为12分的解答题,6名同学的得分按从低到高的顺序排列为,若该组数据的中位数是这组数据极差,则该组数据的第60百分位数是( )
A.7 B.7 C.9 D.10
2.已知四个不同的实数,,,,其中,,的方差为,,,的方差为,若,则( )
A. B.
C. D.
3.在高三一次调研考试时,某学习小组对本组6名同学的考试成绩进行统计,其中数学试卷上有一道满分为15分的解答题,6名同学的得分为,统计结果为:,已知这6名同学该解答题得分的第80%分位数和平均得分均为12分,则该解答题得分的极差为( )
A.3 B.4 C.5 D.6
4.已知一个样本容量为10的样本平均数为5,方差为1.6.现将样本中的3个数据去掉,则去掉后剩余样本容量为7的样本平均数和是( )
A.5,1 B.5,2 C.5,3 D.4,3
5.某校有学生500人,其中男生320人,女生180人.某人想了解该校全体学生的身高(单位:cm)信息,从男生、女生中分别随机抽取人进行测量.如果已知男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03,但原始测量数据已丢失.设总体均值与方差分别为与,则下列说法正确的是( ).
A.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
B.若,无法算出总样本的均值与方差
C.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
D.若,无法算出总样本的均值与方差
6.(多选题)有一组样本数据1,2,3,4,5,现加入两个正整数,构成新样本数据,与原样本数据比较,下列说法正确的是( )
A.若平均数不变,则 B.若极差不变,则
C.若,则中位数不变 D.若,则方差不变
7.(多选题)天道酬勤,主动学习方能追求卓越.高三年级的小艾同学决定对函数、三角、数列、立几这四个内容的复习效果进行一次自我检测,每个内容各准备了10道典型题目.做完后对照答案记录每道题的失分(均为非负整数)情况,若某内容每道题失分都不超过7分,则认定该内容为“复习效果达标内容”,已知四个内容失分情况的相关数据信息如下,则一定为“复习效果达标内容”的是( )
A.函数内容的10道题失分记录的中位数为3,极差为4
B.三角内容的10道题失分记录的平均数为2,众数为2
C.数列内容的10道题失分记录的平均数为3,方差为2.4
D.立几内容的10道题失分记录的平均数为3,第65百分位数为6
8.(多选题)已知数据的平均数为10,方差为1,且,则下列说法正确的是( )
A.数据的方差为4
B.数据的平均数为17
C.数据的平均数为10,方差大于1
D.若数据的中位数为分位数为,则
9.(多选题)设甲样本的平均数、中位数、方差,极差分别为,,,,乙样本的平均数、中位数、方差、极差分别为,,,,则下列结论正确的是( )
A.若,则
B.若,则
C.若,则
D.若,则
10.(多选题)已知数据,满足:,若去掉后组成一组新数据,则新数据与原数据相比,下列说法正确的是( )
A.中位数不变 B.若,则数据的第75百分位数为7.5
C.平均数不变 D.方差变小
11.(多选题)根据气象学上的标准,从冬季进入春季的标志为连续天的日平均温度均超过.现将连续天的日平均气温的记录数据(记录数据都是自然数)作为一组样本,则下列样本中一定符合入春指标的有( )
A.平均数为,极差为 B.中位数为,众数为
C.众数为,极差为 D.平均数为,方差为
12.(多选题)一组样本数据,,,…的平均数为,方差为,由,,,组成的样本的平均数为,方差为,由,,,,,组成的样本的平均数为,方差为,若,则( )
A.,,,…,的中位数等于,,,,,的中位数
B.,,,…,的30%分位数等于,,,,,的20%分位数
C.
D.
13.(多选题)某射击运动员在一次训练中一共进行了10次射击,成绩依次为6,5,7,8,6,7,9,7,9,单位:环,则下列说法中正确的是( )
A.这组数的众数为7
B.这组数的第80百分位数为8
C.若每个数都减去2,则这组数的均值也会减去2
D.若每个数都乘以2,则这组数的方差也会乘以2
14.(多选题)已知样本数据,其中,由这组数据得到新样本数据,,则( )
A.两组样本数据的极差一定相等
B.两组样本数据的平均数一定相等
C.两组样本数据的第80百分位数一定相等
D.两组样本数据的方差可能相等
15.(多选题)已知一组数据为,另一组数据为,则下列结论正确的是( )
A.若这2组数据的平均数、中位数、极差均相等,则这2组数据的方差也一定相等
B.若这2组数据的平均数、中位数、极差均相等,则这2组数据的方差不一定相等
C.若这2组数据的平均数、方差、极差均相等,则这2组数据的中位数也一定相等
D.若这2组数据的平均数、方差、极差均相等,则这2组数据的中位数不一定相等
16.(多选题)设的极差为,平均值为,中位数为,方差为.,其中,.的极差为,平均值为,中位数为,方差为,则( )
A. B. C. D.
17.甲、乙、丙、丁四人各掷骰子5次(骰子每次出现的点数可能为1,2,3,4,5,6),并分别记录每次出现的点数,四人根据统计结果对各自的试验数据分别做了如下描述:①中位数为3,众数为5;②中位数为3,极差为3;③中位数为1,平均数为2;④平均数为3,方差为2;可以判断一定没有出现6点的描述共有 人.
18.在某次活动中,登记的8个数据的平均数为8,方差为16,其中.后来发现应该为10,并且漏登记了一个数据14,则修正后的9个数据的平均数为 ,方差为 .
19.已知一组样本数据共有9个数,其平均数为8,方差为12.将这组样本数据增加一个数据后,所得新的样本数据的平均数为9,则新的样本数据的方差为 .
20.研究小组经过研究发现某种病毒的感染者与未感染者的某项医学指标有明显差异,经过大量调查,得到感染者和未感染者该指标的频率分布直方图如下:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将感染者判定为阴性的概率,记为;误诊率是将未感染者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)求频率分布直方图中的值及未感染者该指标的中位数;
(2)当漏诊率时,求临界值和误诊率;
(3)设函数,当时,求的解析式,并求在上的最小值.
21.黔西一中为了提高学生对“黔西一中校史”的了解,举办了“知史爱校守初心”的知识竞赛活动,现从所有竞答试卷的卷面成绩中随机抽取100份作为样本数据,将样本答卷中分数(40)的整数分成六段:,并作出如图所示的频率分布直方图.
(1)求频率分布直方图中的值.
(2)求样本数据的第59百分位数.
(3)已知样本数据落在的平均数是52,方差是6;落在的平均数是64,方差是3.求这两组数据的总平均数和总方差.
22.若从某市甲、乙两所高中分别抽取样本量为m、n的两个样本,经计算得它们的平均数和方差分别为:与,记总的样本平均数为,样本方差为,证明:
(1);
(2).
23.某中学举行了一次“垃圾分类知识竞赛”,全校学生参加了这次竞赛,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩x(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求的值;
(2)某老师在此次竞赛成绩中抽取了10名学生的分数:,已知这10个分数的平均数,标准差,若剔除其中的95和85两个分数,求剩余8个分数的平均数与方差;
附:方差计算公式:或
(3)已知总体分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:;.记总样本的平均数为,样本方差为.试证明:.
24.某公司生产A、B两种型号电动汽车电机,为了了解电机的某项指标,从这两种电机中各抽取100台进行检测,获得该项指标的频率分布直方图,如图所示:
假设数据在组内均匀分布,以样本估计,以事件发生的频率作为相应事件发生的概率.
(1)估计B型电机该项指标的平均值(同一组数据用该组区间中点值为代表);
(2)从A型电机指标在内采用分层抽样方式抽取2件,B型电机指标在内采用分层抽样方式抽取4件,再从这6件中任意抽取2件,求指标在和内各抽取1件的概率;
(3)根据检测结果确定该项指标的一个临界值m,且,某汽车厂准备用A、B两种型号电机生产C牌和D牌汽车各1万辆,有以下两种方案可供选择:
方案一:将A型电机用于生产C牌汽车,其中该指标小于等于临界值m的电机会导致每台汽车损失7000元;将B型电机用于生产D牌汽车,其中该指标大于等于临界值m的电机会导致每台汽车损失3000元;
方案二:重新检测所用的电机,会避免方案一的损失费用,但检测费用共需1010万元.请从汽车厂节约成本的角度考虑,选择合理的方案,并说明理由.
25.某校高二年级500名学生的学考适应性演练数学成绩频率分布直方图如图所示,其中成绩分组区间是,,,,,.
(1)求图中a的值;
(2)估计这500名学生的这次考试数学成绩的中位数,第80百分位数;
(3)估计这500名学生的这次考试数学成绩的平均数.
专题二:名校统计培优压轴试题精选
1.哈希表(HashTable)是一种利用键值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是“除留余数法”.例如,当除数为时,键值为的数据因余,应存放于位置中,从而可直接依据键值快速定位数据位置,多个数据可映射到同一位置(如键值和均映射到同一位置).现有一个容量为个位置(编号)的哈希表,以除留余数法(除数为)进行映射,需要存储个数据.设这个位置存放的数据个数分别为、、、、、、,则下列说法中正确的是( )
A.至少有个位置存放了不少于个数据
B.若这个数据的键值恰好是间的所有奇数,则的中位数为
C.若的方差为,则的最小值为,最大值为
D.若的极差为,则最多有个位置没有存放数据
2.在一组样本数据中,正整数,,,出现的频率分别为,,,,且,,且,则下面四种情形中,对应样本的标准差最大的一组是( )
A., B.,
C., D.,
3.在一组数3,3,8,11,28中插入两个整数,,使得新的一组数极差为原来极差的两倍,且众数和中位数保持不变,则的最大值为( )
A.57 B.58 C.60 D.61
4.某校积极开展“戏曲进校园”活动,为了解该校各班参加戏曲兴趣小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本标准差为2,且样本数据互不相等,则该样本数据的极差为( )
A.3 B.4 C.5 D.6
5.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
6.根据气象学上的标准,连续5天的日平均气温低于即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:
①平均数;
②平均数且极差小于或等于3;
③平均数且标准差;
④众数等于5且极差小于或等于4.
则4组样本中一定符合入冬指标的共有( )
A.1组 B.2组 C.3组 D.4组
7.(多选题)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中可能出现点数6的有( )
A.平均数为3,中位数为4
B.中位数为4,众数为3
C.平均数为2,方差为2.1
D.中位数为3,方差为0.85
8.(多选题)设一组样本数据满足,则( )
A.拿走,这组数据的方差变大 B.拿走,这组数据的方差变大
C.拿走,这组数据的方差减小 D.拿走,这组数据的方差减小
9.(多选题)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为3,众数为5;
乙:中位数为4,极差为3;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是( )
A.甲 B.乙 C.丙 D.丁
10.(多选题)记男生样本的平均数为,方差为;女生样本的平均数为,方差为;男女总样本的平均数记为,方差为,则下列说法正确的是( )
A.若,则
B.若,则
C.若,,则
D.
11.(多选题)已知互不相同的30个样本数据,若去掉其中最大和最小的数据,设剩下的28个样本数据的方差为,平均数为;去掉的两个数据的方差为,平均数为﹔原样本数据的方差为,平均数为,若=,则下列说法正确的是( )
A.
B.
C.剩下28个数据的中位数大于原样本数据的中位数
D.剩下28个数据的22%分位数不等于原样本数据的22%分位数
12.(多选题)已知采用分层抽样得到的样本数据由两部分组成,第一部分样本数据的平均数为,方差为;第二部分样本数据的平均数为,方差为,设,则以下命题正确的是( )
A.设总样本的平均数为,则 B.设总样本的平均数为,则
C.设总样本的方差为,则 D.若,则
13.已知某中学高一有学生人,其中男生人,现采用分层抽样的方法从中抽取人,对他们的身高进行了统计.若男生身高的平均数和方差分别为和,女生身高的平均数和方差分别为和,据此可以估计该校高一年级学生的平均身高是 ,总体方差为 .(答案保留一位小数)
14.对于没有重复数据的样本、、…、,记这m个数的第k百分位数为.若不在这组数据中,且在区间中的数据有且只有5个,则m的所有可能值组成的集合为 .
15.若一组样本数据的平均数为10,另一组样本数据的方差为8,则两组样本数据合并为一组样本数据后的平均数是 ,方差是 .
16.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为,第j层的样本平均数为,样本方差为,,.记,则所有数据的样本方差为 .
17.在一组数据0,3,5,7,10中加入一个整数a得到一组新数据,这组新数据与原数据相比平均数不增大且方差减小,则a的一个取值为 .
18.已知一组数据,,,…,的平均数为,方差为.若,,,…,的平均数比方差大4,则的最大值为 .
19.已知样本:、、、、,该样本的平均数为7,样本的方差为4,且样本的数据互不相同,则样本数据中的最大值是 .
20.机器模型预测常常用于只有正确与错误两种结果的问题.表1为根据模型预测结果与真实情况的差距的情形表格,定义真正例率,假正例率.概率阈值为自行设定的用于判别正(反)例的值,若分类器(分类模型)对该样例的预测正例概率大于等于设定的概率阈值,则记分类器预测为正例,反之预测为反例.
总例
预测结果
正例
反例
真实
情况
正例
真正例
假反例
反例
假正例
真反例
表1分类结果样例划分
利用这些指标绘制出的ROC曲线可衡量模型的评价效果:将各样例的预测正例概率与从大到小排序并依次作为概率阈值,分别计算相应概率阈值下的与.以为横坐标,为纵坐标,得到标记点.依次连接各标记点得到的折线就是ROC曲线.图1为甲分类器对于8个样例的ROC曲线,表2为甲,乙分类器对于相同8个样例的预测数据.
样例数据
甲分
类器
乙分
类器
样例
标号
样例
属性
预测正
例概率
预测正
例概率
1
正例
0.23
0.34
2
正例
0.58
0.53
3
反例
0.15
0.13
4
反例
0.62
0.39
5
正例
0.47
0.87
6
反例
0.47
0.53
7
反例
0.33
0.11
8
正例
0.77
0.63
表2甲,乙分类器对于相同8个样例的预测数据
(1)当概率阈值为0.47时,求甲分类器的ROC曲线中的对应点;
(2)在图2中绘制乙分类器对应的ROC曲线(无需说明绘图过程),并直接写出甲,乙两分类器的ROC曲线与轴,直线所围封闭图形的面积;
(3)按照上述思路,比较甲,乙两分类器的预测效果,并直接写出理想分类器的ROC曲线与轴,直线所围封闭图形的面积为1的充要条件.
21.某校有高一学生1000人,其中男女生比例为,为获得该校高一学生的身高(单位:)信息,采用随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的均值为172,标准差为3,女生样本的均值为162,标准差为4.
(1)计算总样本均值,并估计该校高一全体学生的平均身高;
(2)计算总样本方差.
22.《中国制造2025》是中国实施制造强国战略第一个十年的行动纲领,制造业是国民经济的主体,是立国之本、兴国之器、强国之基.发展制造业的基本方针为质量为先,坚持把质量作为建设制造强国的生命线某电子产品制造企业为了提升生产效率,对现有的一条电子产品生产线进行技术升级改造,为了分析改造的效果,该企业质检人员从该条生产线所生产的电子产品中随机抽取了1000件,检测产品的某项质量指标值,根据检测数据得到下表(单位:件).
质量指标值
产品
60
100
160
300
200
100
80
(1)估计这组样本的质量指标值的平均数和方差(同一组中的数据用该组区间中点值作代表);
(2)设表示不大于x的最大整数,表示不小于x的最小整数,s精确到个位,,,,根据检验标准,技术升级改造后,若质量指标值有落在内,则可以判断技术改造后的产品质量初级稳定;若有落在内,则可以判断技术改造后的产品质量稳定,可认为生产线技术改造成功.请问:根据样本数据估计,是否可以判定生产线的技术改造是成功的?
专题三:统计全国高中数学联赛强基计划精选试题
1.(2024高三下·全国·竞赛)数据7,8,9,2,5,9,0,3,6,0的第60百分位数是( )
A. B.5 C. D.7
2.(2013高二·全国·竞赛)某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,则更正后平均分和方差分别是( ).
A.70,50 B.70,75 C.70,72.5 D.65,70
3.(2011高二·全国·竞赛)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过8人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为4,中位数为4 B.乙地:总体均值为2,总体方差大于0
C.丙地:总体均值为2,总体方差为3 D.丁地:中位数为2,众数为3
4.(2011高二·全国·竞赛)5个相异自然数的平均数为10,中位数为15,这5个自然数中最大的数最大可能是( )
A.16 B.17 C.18 D.19
5.(2024高三上·全国·竞赛)设锐角满足,则数据的极差是( )
A. B. C. D.
6.(2024高一上·湖南邵阳·竞赛)如果将一组数据5、4、6、5、4、13、5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数、平均数,下列说法正确的是( )
A.中位数和众数都是5 B.众数是10
C.中位数是4 D.中位数、平均数都是5
7.(2024高一上·山东潍坊·竞赛)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为( )
随机数表如下0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
A.13 B.32 C.44 D.36
8.(2023高三下·全国·竞赛(多选题))某学习小组(共18位同学)在一次数学周测中的成绩(单位:分)如下:
87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
若是这组数据的上四分位数,则可能为( )
A.126 B.127 C.128 D.129
9.(16-17高三·北京·强基计划(多选题))某校共2017名学生,其中每名学生至少要选A,B两门课中的一门,也有些学生选了两门课.已知选A的人数占全校人数的百分比在到之间,选B的人数占全校人数的百分比在到之间.则下列结论中正确的是( )
A.同时选A,B的可能有200人 B.同时选A,B的可能有300人
C.同时选A,B的可能有400人 D.同时选A,B的可能有500人
10.(17-18高三·北京·强基计划(多选题))已知5个数据恰为互不相同的质数,且平均值为13,则它们的中位数( )
A.最小为5 B.最小为7
C.最大为13 D.最大为17
11.(2014高二·全国·竞赛)已知数据的平均数为6,标准差为,则数据的平均数的取值范围是 .
12.(2011高二·全国·竞赛)一组数据共有50个数,其中7个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这50个数中,且平均数大于中位数,那么这组数据中小于平均数的数据占这50个数据的百分比是 .
13.(2013高二·全国·竞赛)有一组数据共有100个数,其中有20个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这100个数中,那么这组数据中小于平均数的数据占这100个数据的百分比是 .
14.(2014高二·全国·竞赛)7个相异自然数的平均数为12,中位数为18,这7个自然数中最大的数最大可能是 .
15.(2015高二上·河北保定·竞赛)假设要抽查某种品牌的850颗种子的发芽率,抽取60粒进行实验.利用随机数表抽取种子时,先将850颗种子按001,002,…,850进行编号,如果从随机数表第8行第7列的数7开始向右读,请你依次写出最先检测的4颗种子的编号 , , , .
(下面摘取了随机数表第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
16.(20-21高一·安徽芜湖·强基计划)中医药,是包括汉族和少数民族医药在内的我国各民族医药的统称,反映了中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系.某科研机构研究发现,某品种中医药的药物成分甲的含量(单位:克)与药物功效(单位:药物单位)之间具有关系.检测这种药品一个批次的5个样本,得到成分甲的平均值为4克,标准差为克,则估计这批中医药的药物功效的平均值为 药物单位.(提示:标准差为方差的算术平方根.)
17.(21-22高一·安徽芜湖·强基计划)设是正整数,且,当数据的方差最小时,的值为 .
18.(22-23高二上·北京·强基计划)某学校初、高中共有学生4800人,现采用分层抽样的方法从中抽取800人进行体能测试.若这800人中有300人是初中生,则该校高中生共有 人.
2 / 2
学科网(北京)股份有限公司
$$
2025新高考高一统计易错培优竞赛试题
【专题目录】
专题一:名校统计易错题精选
专题二:名校统计培优题精选
专题三:统计全国高中数学联赛强基计划精选试题
【精选练习】
专题一:名校统计易错题精选
1.在高三某次调研考试时,某学习小组对本组6名同学的考试成绩进行统计,其中数学试卷上有一道满分为12分的解答题,6名同学的得分按从低到高的顺序排列为,若该组数据的中位数是这组数据极差,则该组数据的第60百分位数是( )
A.7 B.7 C.9 D.10
【答案】D
【分析】根据中位数是极差求出的值,再计算第60百分位数即可.
【详解】已知数据,,,,10,12,数据个数为偶数,所以中位数是中间两个数和的平均数,即中位数为.
极差是最大值12减去最小值,即极差为.
因为该组数据的中位数是这组数据的极差,所以.可得:.
此时这组数据为,,,10,10,12.
计算,所以第60百分位数是第个数,即10.
故选:D.
2.已知四个不同的实数,,,,其中,,的方差为,,,的方差为,若,则( )
A. B.
C. D.
【答案】B
【分析】利用方差的定义,带字母进行运算,再利用相等关系进行变形化简即可得结果.
【详解】
,
同理,
由题意得,
即,整理可得,
因为,所以.
故选:B.
3.在高三一次调研考试时,某学习小组对本组6名同学的考试成绩进行统计,其中数学试卷上有一道满分为15分的解答题,6名同学的得分为,统计结果为:,已知这6名同学该解答题得分的第80%分位数和平均得分均为12分,则该解答题得分的极差为( )
A.3 B.4 C.5 D.6
【答案】C
【分析】由百分位数和平均数的计算得到的值可能取值,再分的值可能是13,14,15讨论即可;
【详解】因为,所以,又,
所以,即,
因为,所以的值可能是13,14,15,
当时,,
因为,且,为整数,所以不可能;
当时,,因为,
且,为整数,所以不可能;
当时,,
因为,且,为整数,
所以当且仅当,时,,
所以所求极差为.
故选:C.
4.已知一个样本容量为10的样本平均数为5,方差为1.6.现将样本中的3个数据去掉,则去掉后剩余样本容量为7的样本平均数和是( )
A.5,1 B.5,2 C.5,3 D.4,3
【答案】B
【分析】根据平均数与方差的计算公式,分别表示出去掉前后两组数据的平均数与方差,将条件等式整体代入计算即可.
【详解】由均值得.
方差
得.
不妨设设,则
,
,
故选:B.
5.某校有学生500人,其中男生320人,女生180人.某人想了解该校全体学生的身高(单位:cm)信息,从男生、女生中分别随机抽取人进行测量.如果已知男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03,但原始测量数据已丢失.设总体均值与方差分别为与,则下列说法正确的是( ).
A.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
B.若,无法算出总样本的均值与方差
C.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
D.若,无法算出总样本的均值与方差
【答案】C
【分析】根据已知,分层抽样分析数据的前提及样本特征与总体特征的关系判断A、C、D;对于总体数据各层中的数据差异非常小的情况下也可分析总体特征判断B.
【详解】由于男生、女生总人数不相等,需要用分层抽样的方式估计出样本的均值和方差,
此时所得样本特征可作为总体特征的估计值,故不合适、合适,A、D错,C对;
在情况下,只有所有男生、女生身高都在各自身高均值附近波动且幅度很小时,可以算出总样本的均值与方差,B错;
故选:C.
6.(多选题)有一组样本数据1,2,3,4,5,现加入两个正整数,构成新样本数据,与原样本数据比较,下列说法正确的是( )
A.若平均数不变,则 B.若极差不变,则
C.若,则中位数不变 D.若,则方差不变
【答案】AC
【分析】根据平均数、极差、中位数和方差的定义判断.
【详解】若平均数不变,则,解得,故A正确;
当时,极差不变,但,故B错;
若,则为或或,每一种情况对应的中位数都是3,故C正确;
原数据的平均数为3,原数据的方差为,
新数据的平均数为3,新数据的方差为,当且仅当时等号成立,所以方差有可能改变,故D错.
故选:AC.
7.(多选题)天道酬勤,主动学习方能追求卓越.高三年级的小艾同学决定对函数、三角、数列、立几这四个内容的复习效果进行一次自我检测,每个内容各准备了10道典型题目.做完后对照答案记录每道题的失分(均为非负整数)情况,若某内容每道题失分都不超过7分,则认定该内容为“复习效果达标内容”,已知四个内容失分情况的相关数据信息如下,则一定为“复习效果达标内容”的是( )
A.函数内容的10道题失分记录的中位数为3,极差为4
B.三角内容的10道题失分记录的平均数为2,众数为2
C.数列内容的10道题失分记录的平均数为3,方差为2.4
D.立几内容的10道题失分记录的平均数为3,第65百分位数为6
【答案】AC
【分析】根据中位数、极差、平均数、众数、方差、百分位数等知识对选项进行分析,从而确定正确答案.
【详解】对于选项A,假设函数内容有一道题失分大于等于8分,
则由极差为4可知,函数内容失分最少的题的失分数据大于等于4,
则失分记录的中位数不可能为3,与题设中位数为3矛盾,故假设不成立,
所以函数内容每一道题失分都不超过7分,
故函数内容为“复习效果达标内容”,所以A正确;
对于选项B,设三角内容这10道题失分记录为0,0,1,1,2,2,2,2,8,
满足题设失分记录的平均数为2,众数为2的条件,
由定义知三角内容不是“复习效果达标内容”,所以B错误;
对于选项C,设数列内容这10道题失分记录从小到大依次为
,
则由平均数为3,方差为2.4可知,,
从而,若,则,
所以,故数列内容为“复习效果达标内容”,所以C正确;
对于选项D,设立几内容这10道题失分记录为0,0,0,0,0,0,6,6,6,12,
满足题设平均数为3,第65百分位数为6的条件,
由定义知立几内容不是“复习效果达标内容”,所以D错误;
故选:AC
8.(多选题)已知数据的平均数为10,方差为1,且,则下列说法正确的是( )
A.数据的方差为4
B.数据的平均数为17
C.数据的平均数为10,方差大于1
D.若数据的中位数为分位数为,则
【答案】AB
【分析】根据方差性质计算判断A,根据平均数及方差计算求解判断B,C,特例法,先从小到大排列,计算中位数及分位数判断D.
【详解】对于A:数据的方差为,A选项正确;
对于B:数据的平均数为,B选项正确;
对于C:数据的平均数为,
方差,C选项错误;
对于D:若取数据,平均数为10,方差为1,
则中位数为,因为,所以第5个数为分位数,
所以,D选项错误.
故选:AB.
9.(多选题)设甲样本的平均数、中位数、方差,极差分别为,,,,乙样本的平均数、中位数、方差、极差分别为,,,,则下列结论正确的是( )
A.若,则
B.若,则
C.若,则
D.若,则
【答案】BC
【分析】由方差的性质可得A错误;由极差的性质可得B正确;由平均数的计算可得C正确;举反例可得D错误.
【详解】选项A:由方差的性质知,所以A错误;
选项B:若分别是的最大值、最小值,
则对应的也分别是的最大值、最小值,
所以,所以B正确;
选项C:由题知,所以C正确;
选项D:若甲样本为,则乙样本应为,所以,,此时,所以D错误.
故选:BC
10.(多选题)已知数据,满足:,若去掉后组成一组新数据,则新数据与原数据相比,下列说法正确的是( )
A.中位数不变 B.若,则数据的第75百分位数为7.5
C.平均数不变 D.方差变小
【答案】ACD
【分析】由中位数、百分位数、平均数、方差的计算公式逐个判断即可;
【详解】原来的中位数与现在的中位数均为,故中位数不变,故A正确;
当时,数据按从小到大顺序排列:1,2,3,4,5,6,7,8,9,10.
因为,所以该组数据的第75百分位数是第8个数8,故B错误;
由于,故,
原来的平均数为,
去掉后的平均数为,平均数不变,故C正确;
原来的方差为,
去掉后的方差为,
方差变小,故D正确.
故选:ACD
11.(多选题)根据气象学上的标准,从冬季进入春季的标志为连续天的日平均温度均超过.现将连续天的日平均气温的记录数据(记录数据都是自然数)作为一组样本,则下列样本中一定符合入春指标的有( )
A.平均数为,极差为 B.中位数为,众数为
C.众数为,极差为 D.平均数为,方差为
【答案】ABD
【分析】分析每个选项数据是否有可能大于,选出符合题意选项.
【详解】“连续天的日平均温度均超过”,将天数据从小到大排序为:、、、、,
A选项,因为这五个数据的平均数为,
则,
又因为这五个数据的极差为,则,可得,
若,则,则,所以A选项正确;
B选项,因为这五个数据的中位数是,众数是,
所以将数据从小到大排序后,第个数是,第、个数为,
所以个数据都超过,所以B选项正确.
C选项,因为这五个数据的众数是,极差为,
如、、、、,第天低于,不符合,所以C选项错误.
D选项,因为这五个数据的平均数为,
则
方差为,
所以,,
若,则,矛盾,所以D选项正确.
故选:ABD.
12.(多选题)一组样本数据,,,…的平均数为,方差为,由,,,组成的样本的平均数为,方差为,由,,,,,组成的样本的平均数为,方差为,若,则( )
A.,,,…,的中位数等于,,,,,的中位数
B.,,,…,的30%分位数等于,,,,,的20%分位数
C.
D.
【答案】ACD
【分析】由中位数的概念,百分位数的计算公式、平均数的计算及方差计算公式逐个判单即可;
【详解】的中位数为的中位数为,A正确;
,所以的分位数为,所以的分位数为,B错误;
因为,所以,C正确;
由,化简可得,D正确.
故选:ACD
13.(多选题)某射击运动员在一次训练中一共进行了10次射击,成绩依次为6,5,7,8,6,7,9,7,9,单位:环,则下列说法中正确的是( )
A.这组数的众数为7
B.这组数的第80百分位数为8
C.若每个数都减去2,则这组数的均值也会减去2
D.若每个数都乘以2,则这组数的方差也会乘以2
【答案】AC
【分析】分别求出运动员成绩的众数,均值,方差、以及第80百分位,再用均值,方差性质,判断四个选项即可.
【详解】解:将成绩从小到大排列为:5,5,6,6,7,7,7,8,9,9,
对于A、这组数的众数为7,故A正确;
对于B、因为,则这组数的第80百分位数为,故B错误;
对于C、若每个数都减去2,则这组数的均值也会减去2,故C正确;
对于D、若每个数都乘以2,则这组数的方差会乘以4,故D错误.
故选:AC.
14.(多选题)已知样本数据,其中,由这组数据得到新样本数据,,则( )
A.两组样本数据的极差一定相等
B.两组样本数据的平均数一定相等
C.两组样本数据的第80百分位数一定相等
D.两组样本数据的方差可能相等
【答案】BD
【分析】对于ACD:举例说明即可;对于B:根据平均数公式分析判断即可.
【详解】对于选项A:例如原数据为,则极差为2,
新数据为,极差为,
两者不相等,故A错误;
对于选项B:原数据的平均数为,
新数据的平均数为,
所以两组样本数据的平均数一定相等,故B正确;
对于选项C:因为,可知第80百分位数为第4位数,
例如原数据为,则第80百分位数为,
新数据为,则第80百分位数为,
两者不相等,故C错误;
对于选项D:例如原数据为,
则新数据为,
两组数据完全相同,故方差相同,故D正确;
故选:BD.
15.(多选题)已知一组数据为,另一组数据为,则下列结论正确的是( )
A.若这2组数据的平均数、中位数、极差均相等,则这2组数据的方差也一定相等
B.若这2组数据的平均数、中位数、极差均相等,则这2组数据的方差不一定相等
C.若这2组数据的平均数、方差、极差均相等,则这2组数据的中位数也一定相等
D.若这2组数据的平均数、方差、极差均相等,则这2组数据的中位数不一定相等
【答案】AD
【分析】对于选项AB,应用已知条件计算得出数据相同即可判断;应用平均数、中位数、极差定义取特殊值分别判断CD选项即可.
【详解】对于AB,不妨设,
因为这2组数据的中位数相同,所以,
因为这2组数据的平均数相同,所以①,
因为这2组数据的极差相同,所以②,
由①②可得,所以这2组数据相同,
这2组数据的方差也一定相等,A正确,B错误;
对于CD,若这2组数据分别为1,2,6和0,4,5,
则这2组数据的平均数、方差、极差均相等,中位数不相等,C错误;D正确.
故选:AD.
16.(多选题)设的极差为,平均值为,中位数为,方差为.,其中,.的极差为,平均值为,中位数为,方差为,则( )
A. B. C. D.
【答案】BC
【分析】根据方差及标准差的性质判断A,D,应用平均数及中位数性质判断B,C.
【详解】不妨设,
则知,故A不正确,,D不正确;
由平均值、中位数定义可知,B,C正确.
故选:BC.
17.甲、乙、丙、丁四人各掷骰子5次(骰子每次出现的点数可能为1,2,3,4,5,6),并分别记录每次出现的点数,四人根据统计结果对各自的试验数据分别做了如下描述:①中位数为3,众数为5;②中位数为3,极差为3;③中位数为1,平均数为2;④平均数为3,方差为2;可以判断一定没有出现6点的描述共有 人.
【答案】2
【分析】根据中位数,极差,平均数,方差,众数等定义分别判断计算各个选项即可.
【详解】①5出现两次,又中位数为3,则数据从小到大为,一定没有6;
②中位数为3,极差为3,则数据从小到大为符合题意,故可能出现6;
③中位数为1,平均数为2,则设数据从小到大为符合题意,故可能出现6;
④平均数为3,方差为2,则满足要求且含6的数据从小到大为,
故且,
因为,满足题意的至少有3个3,一个2或4,
不符合,所以不能同时满足,故一定没有6.
综上,①④一定没有6.
故答案为:2
18.在某次活动中,登记的8个数据的平均数为8,方差为16,其中.后来发现应该为10,并且漏登记了一个数据14,则修正后的9个数据的平均数为 ,方差为 .
【答案】 9 /
【分析】由题意可求出,,再利用平均数以及方差公式即可求出修正后的平均值以及方差.
【详解】由题意知修正前,则,
修正后,故修正后的9个数据的平均数为;
修正前,
即得,
故修正后的方差为
,
故答案为:9;
19.已知一组样本数据共有9个数,其平均数为8,方差为12.将这组样本数据增加一个数据后,所得新的样本数据的平均数为9,则新的样本数据的方差为 .
【答案】
【分析】先求得新的样本,然后根据方差的计算公式求得正确答案.
【详解】设增加的数为,原来的个数分别为,
则,,
所以,
又因为,即,
所以
.
故答案为:
20.研究小组经过研究发现某种病毒的感染者与未感染者的某项医学指标有明显差异,经过大量调查,得到感染者和未感染者该指标的频率分布直方图如下:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将感染者判定为阴性的概率,记为;误诊率是将未感染者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)求频率分布直方图中的值及未感染者该指标的中位数;
(2)当漏诊率时,求临界值和误诊率;
(3)设函数,当时,求的解析式,并求在上的最小值.
【答案】(1),未感梊者该指标的中位数为
(2),
(3)
【分析】(1)根据第一个频率分布直方图面积之和为1求出a,利用第二个频率分布直方图中的中位数公式计算即可.
(2)根据题意由第一个频率分布直方图可先求出,再根据第二个频率分布直方图求出的矩形面积即可解出;
(3)根据题意确定分段点,即可得出的解析式,再根据分段函数的最值求法即可解出.
【详解】(1)在感染者该指标的频率分布直方图中,各矩形的面积之和为1,
所以,解得,
在未感染者该指标的频率分布直方图中,前两个小矩形的面积之和为,
前三个小矩形的面积之和为,
所以未感染者该指标的中位数在第三组,且为;
(2)依题可知,第一个小矩形的面积为,所以,
所以,解得,
.
(3)当时,
;
当时,
,
故,
所以在区间的最小值为.
21.黔西一中为了提高学生对“黔西一中校史”的了解,举办了“知史爱校守初心”的知识竞赛活动,现从所有竞答试卷的卷面成绩中随机抽取100份作为样本数据,将样本答卷中分数(40)的整数分成六段:,并作出如图所示的频率分布直方图.
(1)求频率分布直方图中的值.
(2)求样本数据的第59百分位数.
(3)已知样本数据落在的平均数是52,方差是6;落在的平均数是64,方差是3.求这两组数据的总平均数和总方差.
【答案】(1);
(2)78
(3)总平均数是60,总方差是36.
【分析】(1)由直方图中频率和为1求解;
(2)求出直方图中频率为对应的分数;
(3)根据平均数和方差公式计算.
【详解】(1)由题意,解得;
(2)由直方图知前3组数的频率为
前4组数的频率为,
因此第59百分位数在第4组即区间上,设第59百分位数为,
则,解得;
(3)样本数据在区间的个数为,在区间上的个数为,
所以,
总方差为.
22.若从某市甲、乙两所高中分别抽取样本量为m、n的两个样本,经计算得它们的平均数和方差分别为:与,记总的样本平均数为,样本方差为,证明:
(1);
(2).
【答案】(1)证明见解析
(2)证明见解析
【分析】(1)根据题意可得,结合平均数公式分析证明即可;
(2)根据题意可得,结合方差公式分析证明即可.
【详解】(1)设甲高中抽取样本为,乙高中抽取样本为,
则,可得,
所以总的样本平均数为.
(2)因为,则,
可得
,
同理可得,
所以.
23.某中学举行了一次“垃圾分类知识竞赛”,全校学生参加了这次竞赛,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩x(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求的值;
(2)某老师在此次竞赛成绩中抽取了10名学生的分数:,已知这10个分数的平均数,标准差,若剔除其中的95和85两个分数,求剩余8个分数的平均数与方差;
附:方差计算公式:或
(3)已知总体分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:;.记总样本的平均数为,样本方差为.试证明:.
【答案】(1),.
(2)平均数:90;方差:38.75.
(3)证明见解析
【分析】(1)由频率分布直方图面积和为1,列出等式求解即可;
(2)由平均数、方差计算公式代入数据求解即可;
(3)由方差的计算过公式即可求证;
【详解】(1)由题意知,,且,
所以,.
(2)解:,故:.
又,,
剔除其中的95和85两个分数,设剩余8个数为,
平均数与标准差分别为,,
则剩余8个分数的平均数:;
方差:.
(3)证明:已知总体分为2层,通过分层随机抽样,
各层抽取的样本量、样本平均数和样本方差分别为:;.
记总样本的平均数为,样本方差为,
由,得,
所以
.
24.某公司生产A、B两种型号电动汽车电机,为了了解电机的某项指标,从这两种电机中各抽取100台进行检测,获得该项指标的频率分布直方图,如图所示:
假设数据在组内均匀分布,以样本估计,以事件发生的频率作为相应事件发生的概率.
(1)估计B型电机该项指标的平均值(同一组数据用该组区间中点值为代表);
(2)从A型电机指标在内采用分层抽样方式抽取2件,B型电机指标在内采用分层抽样方式抽取4件,再从这6件中任意抽取2件,求指标在和内各抽取1件的概率;
(3)根据检测结果确定该项指标的一个临界值m,且,某汽车厂准备用A、B两种型号电机生产C牌和D牌汽车各1万辆,有以下两种方案可供选择:
方案一:将A型电机用于生产C牌汽车,其中该指标小于等于临界值m的电机会导致每台汽车损失7000元;将B型电机用于生产D牌汽车,其中该指标大于等于临界值m的电机会导致每台汽车损失3000元;
方案二:重新检测所用的电机,会避免方案一的损失费用,但检测费用共需1010万元.请从汽车厂节约成本的角度考虑,选择合理的方案,并说明理由.
【答案】(1)
(2)
(3)答案见解析
【分析】(1)根据频率分布直方图结合平均数的定义求解;
(2)根据分层抽样的定义分别求出来自A型电机指标在和及来自B型电机指标在和的台数,然后利用列举法结合古典概型的概率公式求解;
(3)设将A、B两种型号电机应用C牌、D牌汽车时,该汽车厂损失y(万元),然后根据题意表示出,分,,三种情况讨论即可.
【详解】(1)由频率分布直方图得B型电机该项指标的平均值为:
.
(2)根据分层抽样得,来自A型电机指标在和的各1台,分别记为x,y,来自B型电机指标在和分别为3台和1台,分别记为,,和p.
从中任意抽取两件,样本空间可记为
共15个样本点,
记事件M:指标在和内各抽取1件,
则共含3个样本点,
所以.
(3)设将A、B两种型号电机应用C牌、D牌汽车时,该汽车厂损失y(万元),
,,
所以当时,,当时,,
当时,.
综上所述,当临界值时,选择方案二;
当临界值时,选择方案一或二都行;
当临界值时,选择方案一.
25.某校高二年级500名学生的学考适应性演练数学成绩频率分布直方图如图所示,其中成绩分组区间是,,,,,.
(1)求图中a的值;
(2)估计这500名学生的这次考试数学成绩的中位数,第80百分位数;
(3)估计这500名学生的这次考试数学成绩的平均数.
【答案】(1)0.0050
(2)90,122
(3)94
【分析】(1)根据频率之和为1列方程可求出的值.
(2)计算中位数及第80百分位数所在的区间,利用中位数和百分位数的定义建立等量关系可计算出结果.
(3)根据平均数的概念列式计算可得结果.
【详解】(1)根据频率之和为1可得,,
解得.
(2)∵成绩在区间内的频率为:,
∴估计这500名学生的这次考试数学成绩的中位数为90.
∵成绩在区间内的频率为:,
成绩在区间内的频率为:,
∴第80百分位数在区间内,设第80百分位数为,
则,解得,
综上得,中位数为90,第80百分位数为.
(3)设这500名学生的这次考试数学成绩的平均数为,
则.
专题二:名校统计培优压轴试题精选
1.哈希表(HashTable)是一种利用键值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是“除留余数法”.例如,当除数为时,键值为的数据因余,应存放于位置中,从而可直接依据键值快速定位数据位置,多个数据可映射到同一位置(如键值和均映射到同一位置).现有一个容量为个位置(编号)的哈希表,以除留余数法(除数为)进行映射,需要存储个数据.设这个位置存放的数据个数分别为、、、、、、,则下列说法中正确的是( )
A.至少有个位置存放了不少于个数据
B.若这个数据的键值恰好是间的所有奇数,则的中位数为
C.若的方差为,则的最小值为,最大值为
D.若的极差为,则最多有个位置没有存放数据
【答案】D
【分析】设为数据除以的余数为的数的个数,利用特例法可判断A选项;求出这个数的值,结合中位数的定义可判断B选项;利用方差的定义可求出的最大值和最小值,可判断C选项;对个位置是否存在空位进行讨论,结合极差的定义可判断D选项.
【详解】设为数据除以的余数为的数的个数,
对于A选项,,
不妨假设这个位置存放的数据个数分别为、、、、、、,A错;
对于B选项,由题意可知,这些奇数分别为、、、、、、、、、
、、、、、、、、、、、、,
这些数据除的余数分别为:、、、、、、、、、、、、、、
、、、、、、、,
所以,,,,,,,,
将这个数由小到大排列依次为、、、、、、,中位数为,B错;
对于C选项,由题意可知,这个数的平均数为,
且,,
因为,,
当这个数中有个,个时,取最小值,
即,
当这个数中有个,个时,取最大值,
即,C错;
对于D选项,不妨这个数依次为:、、、、、、,
满足极差为,此时,所有位置都有数据,
若存在一些位置没有数据,则这个数据中的最大值为,最小值为,
因为,此时,至少需要个位置存放数据,则至多有个位置没有存放数据,D对.
故选:D.
【点睛】关键点点睛:解决本题D选项,主要要对个位置是否存在空位进行讨论,利用特例法结合极差的定义进行判断.
2.在一组样本数据中,正整数,,,出现的频率分别为,,,,且,,且,则下面四种情形中,对应样本的标准差最大的一组是( )
A., B.,
C., D.,
【答案】B
【分析】由条件证明,根据方差公式求方差,再求其最大值,根据方差与标准差关系确定结论.
【详解】样本数据的平均数,
结合选项可知,且,
所以,
样本数据的方差
.
因为,,则,
所以,所以,故,
所以最大时,方差最大,即标准差最大,故B正确.
故选:B.
3.在一组数3,3,8,11,28中插入两个整数,,使得新的一组数极差为原来极差的两倍,且众数和中位数保持不变,则的最大值为( )
A.57 B.58 C.60 D.61
【答案】C
【分析】由题意可得插入的两个数不可能都是;可得一个为,另一个数不小于8,由极差加倍,则另一个数为,若插入的两个数是不等的且不是,,,,且极差为,进而可得,进而可求的最大值.
【详解】若插入两个整数后众数不变,则插入的数可以是“两个都是”,或是“一个为,另一个不是”,
或是“两个不等的且不是,,”.
①因为新的一组数极差加倍,所以插入的两个数不可能都是;
②因为中位数保持不变,若插入的数“一个为,另一个不是”,则一个为,另一个数不小于,
又因为极差加倍,则另一个数为,此时;
③若插入的两个数是不等的且不是,,,,且极差为,中位数保持不变,
则两个数可以为
,,,,,,,
所以,的最大值为.
故选:C.
4.某校积极开展“戏曲进校园”活动,为了解该校各班参加戏曲兴趣小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本标准差为2,且样本数据互不相等,则该样本数据的极差为( )
A.3 B.4 C.5 D.6
【答案】D
【分析】根据样本的平均数、标准差及极差的定义分类讨论计算即可.
【详解】不妨设该五个班级的样本数据分别为,且,
则依题意有,
化简得
易知,
又易知五个数据减7的平方数为整数,五个数的绝对值不超过4,
当时,,由数据为整数且均不相同得不成立,
当时,,由数据为整数且均不相同得该四个平方数只能为,则,符合题意,此时极差为6;
当时,,由数据为整数且均不相同得不成立;
综上,五组数据的极差为6.
故选:D
【点睛】本题关键在于对五组数据减7的平方数进行讨论,排除.
5.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
【答案】D
【分析】利用平均数和方差公式可求得新数据的方差.
【详解】设甲组数据分别为、、、,乙组数据分别为、、、,
甲组数据的平均数为,可得,方差为,可得,
乙组数据的平均数为,可得,方差为,可得,
混合后,新数据的平均数为,
方差为
.
故选:D.
6.根据气象学上的标准,连续5天的日平均气温低于即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:
①平均数;
②平均数且极差小于或等于3;
③平均数且标准差;
④众数等于5且极差小于或等于4.
则4组样本中一定符合入冬指标的共有( )
A.1组 B.2组 C.3组 D.4组
【答案】B
【分析】举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.
【详解】①举反例:,,,,,其平均数.但不符合入冬指标;
②假设有数据大于或等于10,由极差小于或等于3可知,
则此组数据中的最小值为,此时数据的平均数必然大于7,
与矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;
③举反例:1,1,1,1,11,平均数,且标准差.但不符合入冬指标;
④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.
故选:B.
7.(多选题)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中可能出现点数6的有( )
A.平均数为3,中位数为4
B.中位数为4,众数为3
C.平均数为2,方差为2.1
D.中位数为3,方差为0.85
【答案】ABD
【分析】ABD举例,C用反证法证明不能出现6.
【详解】对于A:10次点数为符合题意,故A正确;
对于B:10次点数为符合题意,故B正确;
对于C:设10次点数为且,平均数为,
假设有一次点数为,不妨设,由方差公式,代入相关数据得:
,即,显然最大只能取,
不妨设得,此时方程无解,所以,
当时得:,最大只能取,
不妨设得,此时方程有唯一解,,
即10次点数为,但此时平均数为不合题意,所以,
当得取得,
此时方程无解(其余情况也均无解),所以,
当时,平均数为不合题意.
综上所述,假设有一次点数为不成立,故C错误;
对于D:10次点数为符合题意,故D正确.
故选:ABD
8.(多选题)设一组样本数据满足,则( )
A.拿走,这组数据的方差变大 B.拿走,这组数据的方差变大
C.拿走,这组数据的方差减小 D.拿走,这组数据的方差减小
【答案】AD
【分析】对于A,直接证明即可;对于B,C,构造反例即可;对于D可直接用拿走后的方差为零说明结论.
【详解】熟知对一组数据,其方差等于各个数据的平方的算术平均值与算术平均值的平方之差,即.
将拿走前后的方差分别记为.
对于A,给五个元素同时加上或减去同一个数,不影响方差,所以可以适当平移,使得剩下的4个元素:的平均值为0,
不妨设,则,,所以.
故
,
所以A正确;
对于B,考虑,则,,所以B错误;
对于C,考虑,则,,所以C错误;
对于D,由于这组数据不全相等,所以,而,所以D正确.
故选:AD.
【点睛】关键点点睛:本题的关键点在于方差的计算.
9.(多选题)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为3,众数为5;
乙:中位数为4,极差为3;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是( )
A.甲 B.乙 C.丙 D.丁
【答案】ACD
【分析】利用中位数,众数,平均数,极差的意义结合举反例判断ABC,计算方差并且讨论求解.
【详解】对于A,因为中位数为3,众数为5,所以这7个数从小到大排列后,第4个数是3,所
以中一定有一个数出现2次,5出现3次,所以这7个数中一定没有出现7,则正确.
对于B,因为中位数为4,极差为3,所以这7个数可以是,则B错误.
对于C,若出现1个7,则这7个数从小到大排列后,后4个数之和最小为19,前3个数之和最小为3,
从而这7个数的平均数最小为,即这7个数的平均数不可能为3,故C正确.
对于,设这7个数分别为,则,
.
若7,则
,
从而这6个数可能是或或
或或或或或
或或,这与矛盾,
即这7个数中一定没有出现7,故D正确.
故选:ACD
【点睛】关键点睛,本题考查数据的数字特征,关键是对D选项列举所有可能值推出矛盾.
10.(多选题)记男生样本的平均数为,方差为;女生样本的平均数为,方差为;男女总样本的平均数记为,方差为,则下列说法正确的是( )
A.若,则
B.若,则
C.若,,则
D.
【答案】BCD
【分析】利用均值公式、方差公式逐项判断正误即可.
【详解】对A,,可得,则或,A不正确.
对B,,所以,若,则,B正确.
对C,因为,所以,
则.
又,
所以,C正确.
对D,
,
所以,D正确.
故选:BCD
11.(多选题)已知互不相同的30个样本数据,若去掉其中最大和最小的数据,设剩下的28个样本数据的方差为,平均数为;去掉的两个数据的方差为,平均数为﹔原样本数据的方差为,平均数为,若=,则下列说法正确的是( )
A.
B.
C.剩下28个数据的中位数大于原样本数据的中位数
D.剩下28个数据的22%分位数不等于原样本数据的22%分位数
【答案】ABD
【分析】对于A选项,求出剩下的28个样本数据的和、去掉的两个数据和、原样本数据和,列出方程即可;
对于B选项,写出和的表达式即可;
对于C选项,根据中位数定义判断即可;
对于D选项,根据分位数定义判断即可.
【详解】A. 剩下的28个样本数据的和为,去掉的两个数据和为,原样本数据和为,所以,因为=,所以,故A选项正确;
B.设,,
因为,所以,所以,
所以,故B选项正确;
C. 剩下28个数据的中位数等于原样本数据的中位数,故C选项错误;
D. ,所以原数据的22%分位数为从小到大的第7个;
,所以剩下28个数据的22%分位数为从小到大的第7个;
因为去掉了最小值,则剩下28个数据的22%分位数不等于原样本数据的22%分位数,故D正确.
故选:ABD.
12.(多选题)已知采用分层抽样得到的样本数据由两部分组成,第一部分样本数据的平均数为,方差为;第二部分样本数据的平均数为,方差为,设,则以下命题正确的是( )
A.设总样本的平均数为,则
B.设总样本的平均数为,则
C.设总样本的方差为,则
D.若,则
【答案】AD
【分析】对于A选项,因为,由放缩可得;
对于B选项,举例说明B不正确;
对于C选项,举例说明C不正确;
对于D选项,若,代入总体方差计算公式,可得.
【详解】对于A选项,因为,所以
,即,A正确;
对于B选项,取第一部分数据为,则,,取第二部分数据为,则,,则,B不正确;
对于C选项,取第一部分数据为,则,,
取第二部分数据为,则,,则,
,C不正确;
对于D选项,若,则,D正确.
故选:AD.
13.已知某中学高一有学生人,其中男生人,现采用分层抽样的方法从中抽取人,对他们的身高进行了统计.若男生身高的平均数和方差分别为和,女生身高的平均数和方差分别为和,据此可以估计该校高一年级学生的平均身高是 ,总体方差为 .(答案保留一位小数)
【答案】 165.2 51.5
【分析】利用男、女生身高的平均数计算总体身高的平均数,利用方差的定义推导出总体方差公式,代入数据可得结果.
【详解】由题意得,高一男生人,女生人,男、女生人数比为:,所以样本中男生23人,女生27人.
记男生身高为,平均数为,方差为,
女生身高为,平均数为,方差为,
记总体平均数为,方差为,
则,
根据方差的定义,总体方差为:
由可得,
同理可得:,
所以
.
故答案为:165.2,51.5.
14.对于没有重复数据的样本、、…、,记这m个数的第k百分位数为.若不在这组数据中,且在区间中的数据有且只有5个,则m的所有可能值组成的集合为 .
【答案】
【分析】就是否为正整数分类讨论,若为正整数,则5个数分别为;若不为整数,则5个数分别为,就的范围分类计算后可得m的所有可能值组成的集合.
【详解】不妨设,因为不在这组数据,故为正整数,
若为正整数,故,其中为正整数,
故,,
因为在区间中的数据有且只有5个,
故这个5个数分别为,故即,
但当时,,此时至少有6个,
故,
当时,即为,共5个,符合;
当时,即为,共6个,不符合;
当时,即为,共7个,不符合;
若为不是整数,故,其中为正奇数,
设,其中为正整数,
则,且,故,
故,,
因为在区间中的数据有且只有5个,
故这个5个数分别为,故即,
但当,,此时至少有6个,
故,
当时,即为,共5个,符合;
当时,即为,共6个,不符合;
当时,即为,共7个,不符合;
综上,符合条件的为,,
故答案为:.
【点睛】思路点睛:与不等式有关的整数解问题,可先根据区间中含有的整数的个数初步确定参数的范围,再逐个讨论后舍去矛盾的情况即可.
15.若一组样本数据的平均数为10,另一组样本数据的方差为8,则两组样本数据合并为一组样本数据后的平均数是 ,方差是 .
【答案】
【分析】计算出、的值,再利用平均数和方差公式可求得合并后的新数据的平均数和方差.
【详解】由题意可知,数据的平均数为,
所以,则,
所以数据、、、的平均数为,
方差为,
所以,
将两组数据合并后,得到新数据,
则其平均数为,
方差为.
故答案为:;.
【点睛】关键点睛:本题解决的关键是充分理解平均数与方差的计算公式,并进行计算.
16.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为,第j层的样本平均数为,样本方差为,,.记,则所有数据的样本方差为 .
【答案】
【分析】
在分层抽样中先计算第层抽取的样本均值,再计算总体k层的样本均值,即可得出;同理,计算第j层抽取的样本方差,进行一系列整理得到,再计算总体k层的样本方差,由此得答案.
【详解】解:.
∴样本均值为.
又.
计算总体
又.
.
.
故答案为:
【点睛】本题主要考查用分层抽样的方法求样本的均值和方差,属于中档题.
17.在一组数据0,3,5,7,10中加入一个整数a得到一组新数据,这组新数据与原数据相比平均数不增大且方差减小,则a的一个取值为 .
【答案】2(答案不唯一,中任取一个都正确)
【分析】根据平均数,方差的计算公式计算即可.
【详解】解:由题意得,原数据的平均数
原数据的方差为
新数据的平均数,解得,
新数据的方差为
,
将代入得,,
解得:,
,,所以,
故答案为:2(答案不唯一,中任取一个都正确)
18.已知一组数据,,,…,的平均数为,方差为.若,,,…,的平均数比方差大4,则的最大值为 .
【答案】-1
【分析】设新数据的平均数为,方差为,可得,,由新数据的平均数比方差大4可得,可得,代入可得其最大值.
【详解】解:设新数据,,,…,的平均数为,方差为,
可得:,,由新数据平均数比方差大4,
可得,可得,
可得:,
由,可得,
可得当时,可得的最大值为:,
故答案为:.
【点睛】本题主要考查数据的平均数、方差及其计算,属于中档题.
19.已知样本:、、、、,该样本的平均数为7,样本的方差为4,且样本的数据互不相同,则样本数据中的最大值是 .
【答案】10
【分析】:利用图像先推算出最大数为11,再根据样本的数据互不相同,排除最大数为11,再推算最大数为10时,存在这样的5个数,最后得出答案.
【详解】:由题意,、、、、 ,该样本的平均数为7,则.样本的方差为4,则.如图,表示1,2,3,4,5个点分别位于7的上下两侧,那么,所以,
设,那么,必然存在样本数据相等,不满足题意.
设,那么,不妨设,,,,且满足.所以在最大值为10时存在5个数都为整数满足题意.
【点睛】:本题主要考查了平均数的求法以及方差的求法,可以把平均数看作中位数,依次推导数字的大小,题目要求每个数都为整数,且各不相同,所以解题时可以采用排除法从大到小分类讨论. ‘’
20.机器模型预测常常用于只有正确与错误两种结果的问题.表1为根据模型预测结果与真实情况的差距的情形表格,定义真正例率,假正例率.概率阈值为自行设定的用于判别正(反)例的值,若分类器(分类模型)对该样例的预测正例概率大于等于设定的概率阈值,则记分类器预测为正例,反之预测为反例.
总例
预测结果
正例
反例
真实
情况
正例
真正例
假反例
反例
假正例
真反例
表1分类结果样例划分
利用这些指标绘制出的ROC曲线可衡量模型的评价效果:将各样例的预测正例概率与从大到小排序并依次作为概率阈值,分别计算相应概率阈值下的与.以为横坐标,为纵坐标,得到标记点.依次连接各标记点得到的折线就是ROC曲线.图1为甲分类器对于8个样例的ROC曲线,表2为甲,乙分类器对于相同8个样例的预测数据.
样例数据
甲分
类器
乙分
类器
样例
标号
样例
属性
预测正
例概率
预测正
例概率
1
正例
0.23
0.34
2
正例
0.58
0.53
3
反例
0.15
0.13
4
反例
0.62
0.39
5
正例
0.47
0.87
6
反例
0.47
0.53
7
反例
0.33
0.11
8
正例
0.77
0.63
表2甲,乙分类器对于相同8个样例的预测数据
(1)当概率阈值为0.47时,求甲分类器的ROC曲线中的对应点;
(2)在图2中绘制乙分类器对应的ROC曲线(无需说明绘图过程),并直接写出甲,乙两分类器的ROC曲线与轴,直线所围封闭图形的面积;
(3)按照上述思路,比较甲,乙两分类器的预测效果,并直接写出理想分类器的ROC曲线与轴,直线所围封闭图形的面积为1的充要条件.
【答案】(1)
(2)答案见解析,,
(3)乙分类器的预测效果更好,答案见解析
【分析】(1)由已知数据得真正例、假反例、假正例、真反例的个数,再由已知公式计算可得;
(2)由已知数据分别计算概率阈值为时的真正例、假反例、假正例、真反例个数,并求出相应值,描点作图;再根据已知甲曲线与乙曲线分别求出所围面积即可;
(3)先比较面积大小分析预测结果;再根据面积为,转化为标记点横坐标为或纵坐标为即或可得充要条件.
【详解】(1)概率阈值为0.47时,
真正例为,假反例为,假正例为,真反例为,
则.
所以横坐标,纵坐标,
故当概率阈值为0.47时,求甲分类器的ROC曲线中的对应点对应点为.
(2)乙分类器对应的ROC曲线如下图所示.
由已知题意可得,甲、乙分类器的ROC曲线都经过,
作如下图所示的辅助线,每个小直角三角形的面积都等于,
大直角三角形的面积都等于,故所求面积为.
所以,甲分类器的ROC曲线与轴,直线所围封闭图形的面积为.
作如下图所示的辅助线,同理可得所求面积为.
所以,乙分类器的ROC曲线与轴,直线所围封闭图形的面积为.
(3)乙分类器的预测效果更好.
由(2)分析可知,
乙分类器的ROC曲线与轴,直线所围封闭图形的面积较甲的大些,
故可认为乙分类器的预测效果更好.
充要条件:所有真实属性为正例的样例的预测正例概率的最小值大于所有真实属性为反例的样例的预测正例概率的最大值.
21.某校有高一学生1000人,其中男女生比例为,为获得该校高一学生的身高(单位:)信息,采用随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的均值为172,标准差为3,女生样本的均值为162,标准差为4.
(1)计算总样本均值,并估计该校高一全体学生的平均身高;
(2)计算总样本方差.
【答案】(1)167;168
(2)37.5
【分析】(1)根据男女生的样本均值计算样本均值;根据男女生的平均身高得到全校所有学生的身高总和,再求学生身高的平均值;
(2)根据男女生的样本均值和方差,直接计算样本总体的方差即可.
【详解】(1)把男生样本记为,平均数记为,方差记为;
把女生样本记为,平均数记为,方差记为;
把样本数据的平均数记为,方差记为;高一全体学生的身高均值记为.
根据平均数的定义,总样本均值为:;
高一全体学生的身高均值为:;
(2)根据方差的定义,总样本方差为:
,
由,可得:,
同理,.
因此,
所以,总的样本方差为.
22.《中国制造2025》是中国实施制造强国战略第一个十年的行动纲领,制造业是国民经济的主体,是立国之本、兴国之器、强国之基.发展制造业的基本方针为质量为先,坚持把质量作为建设制造强国的生命线某电子产品制造企业为了提升生产效率,对现有的一条电子产品生产线进行技术升级改造,为了分析改造的效果,该企业质检人员从该条生产线所生产的电子产品中随机抽取了1000件,检测产品的某项质量指标值,根据检测数据得到下表(单位:件).
质量指标值
产品
60
100
160
300
200
100
80
(1)估计这组样本的质量指标值的平均数和方差(同一组中的数据用该组区间中点值作代表);
(2)设表示不大于x的最大整数,表示不小于x的最小整数,s精确到个位,,,,根据检验标准,技术升级改造后,若质量指标值有落在内,则可以判断技术改造后的产品质量初级稳定;若有落在内,则可以判断技术改造后的产品质量稳定,可认为生产线技术改造成功.请问:根据样本数据估计,是否可以判定生产线的技术改造是成功的?
【答案】(1)61,241;
(2)可以判断技术改造后的产品质量初级稳定,但不能判定生产线技术改造成功.
【分析】(1)利用表格中的数据,根据平均数和方差的计算公式计算即可;
(2)根据题中公式,计算出区间并判段数据落在该区间的概率,计算出区间并判段数据落在该区间的概率,与题中条件比较即可得出结论.
【详解】(1)由题,可知
.
.
(2)由知,,
则,,
该抽样数据落在内的频率约为;
又,,
该抽样数据落在内的频率约为,
∴可以判断技术改造后的产品质量初级稳定,但不能判定生产线技术改造成功.
专题三:统计全国高中数学联赛强基计划精选试题
1.(2024高三下·全国·竞赛)数据7,8,9,2,5,9,0,3,6,0的第60百分位数是( )
A. B.5 C. D.7
【答案】C
【分析】将这组数据从小到大排列,根据百分位数的定义计算即得.
【详解】将这组数据从小到大排列为0,0,2,3,5,6,7,8,9,9,
由,故这组数据的第60百分位数是.
故选:C.
2.(2013高二·全国·竞赛)某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,则更正后平均分和方差分别是( ).
A.70,50 B.70,75 C.70,72.5 D.65,70
【答案】A
【分析】根据题意可得平均分不变,再利用方差公式列出更改前后的式子,从而作差即可得解.
【详解】因为甲少记了30分,乙多记了30分,故平均分不变,
不妨设登记正确的46人成绩依次为,更正后的方差为,
则,
又,
两式相减,得,
解得.
故选:A.
3.(2011高二·全国·竞赛)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过8人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为4,中位数为4 B.乙地:总体均值为2,总体方差大于0
C.丙地:总体均值为2,总体方差为3 D.丁地:中位数为2,众数为3
【答案】C
【分析】根据平均数、中位数、方差、众数等知识对选项进行分析,从而确定正确答案.
【详解】A选项,总体均值为4,中位数为4,
数据可能为:,不符合.
B选项,总体均值为,总体方差大于,
数据可能为:,不符合.
C选项,总体均值为2,总体方差为3,
根据方差的计算公式可知,若丙地有一天超过8人,则方差必大于3,
所以C选项符合.
D选项,中位数为2,众数为3,
数据可能为,不符合.
故选:C
4.(2011高二·全国·竞赛)5个相异自然数的平均数为10,中位数为15,这5个自然数中最大的数最大可能是( )
A.16 B.17 C.18 D.19
【答案】C
【分析】根据平均数公式,结合中位数的定义,即可求解.
【详解】若5个不同自然数从小到大依次为,要使最大的数最大,
又中位数为15,只需,
所以最大.
故选:C
5.(2024高三上·全国·竞赛)设锐角满足,则数据的极差是( )
A. B. C. D.
【答案】B
【分析】根据条件得到,从而有,再利用极差的定义即可求出结果.
【详解】因为,并且是锐角,所以,
得到,又对应四个数据(应用诱导公式)分别可写为,
所以极差为,
故选:B.
6.(2024高一上·湖南邵阳·竞赛)如果将一组数据5、4、6、5、4、13、5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数、平均数,下列说法正确的是( )
A.中位数和众数都是5 B.众数是10
C.中位数是4 D.中位数、平均数都是5
【答案】A
【分析】根据平均数,众数,中位数的定义和性质即可求解.
【详解】将这组数据从小到大的顺序排列为4,4,5,5,5,6,13,处于中间位置的那个数是5,
每个数字重复写10次,5依然处于中间位置,由中位数的定义可知,这组新数据的中位数是5,
这组新数据中出现次数最多的数是5,出现了30次,所以众数为5,故A正确,BC错误.
平均数,故D错误.
故选:A
7.(2024高一上·山东潍坊·竞赛)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为( )
随机数表如下0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
A.13 B.32 C.44 D.36
【答案】C
【分析】根据已知条件,依次写出满足题意的号码,即可求解.
【详解】根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,如下:
32,58,65,74,13,36,98,32,44;其中58,65,74, 98不在编号范围内,舍去,
再去除重复的,剩下的号码为:32, 13,36,44;
所以选取的第四个号码为44.
故选:C.
8.(2023高三下·全国·竞赛(多选题))某学习小组(共18位同学)在一次数学周测中的成绩(单位:分)如下:
87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
若是这组数据的上四分位数,则可能为( )
A.126 B.127 C.128 D.129
【答案】BCD
【分析】根据上四分位数的定义计算即可求解.
【详解】将所给的数据除外按从小到大的顺序排列为:87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
由上四分位数的定义可得:该组数据的上四分位数位于第个,
即该组数据的上四分位数位于第13个和第14个数之间,
而该组数据从小到大的顺序排列后第13个和第14个数分别为127 ,129,
所以,结合选项可能为127,128,129,
故选:BCD.
9.(16-17高三·北京·强基计划(多选题))某校共2017名学生,其中每名学生至少要选A,B两门课中的一门,也有些学生选了两门课.已知选A的人数占全校人数的百分比在到之间,选B的人数占全校人数的百分比在到之间.则下列结论中正确的是( )
A.同时选A,B的可能有200人 B.同时选A,B的可能有300人
C.同时选A,B的可能有400人 D.同时选A,B的可能有500人
【答案】BC
【分析】根据换算关系可得同时选A,B的人数的范围,故可得正确的选项.
【详解】根据题意,同时选A,B的人数在到之间,换算成人数为即202到403之间,
因此符合题意的选项有B,C.
故选:BC.
10.(17-18高三·北京·强基计划(多选题))已知5个数据恰为互不相同的质数,且平均值为13,则它们的中位数( )
A.最小为5 B.最小为7
C.最大为13 D.最大为17
【答案】BC
【分析】由题设条件可得符号条件的两组解,故可得正确的选项.
【详解】这5个质数的和为65,考虑质数表
2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,…
显然这5个数都为奇数,因此它们的中位数不可能为5,故A错误;
是符合题意的解,于是中位数的最小值为7.故B正确;
又,于是中位数小于17,故D错误;
又是符合题意的解,于是中位数的最大值为13.
如果把5个数由小到大排列,
若13为第二个数,则第一个数最大为11,13后面第小的三个数为17,19,23,这五个数之和大于65,矛盾,故13不可能为第2个数,
同理13也不可能为倒数第二个或最后一个数,否则与平均数为13矛盾,
故符合条件的5个数只有两个故C正确.
故选:BC.
11.(2014高二·全国·竞赛)已知数据的平均数为6,标准差为,则数据的平均数的取值范围是 .
【答案】
【分析】根据平均数的定义,设的平均数为,的平均数为,得,,再根据方差定义得:,再根据方差定义得到,最后将问题转化为解不等式的问题求解.
【详解】根据已知条件有:,得:,即,
设的平均数为,的平均数为,则,
结合方差定义:,
展开得:,
即,;
同理可得,,
即得,即,
化简有:,解得,
则数据的平均数的取值范围是,
故答案为:
12.(2011高二·全国·竞赛)一组数据共有50个数,其中7个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这50个数中,且平均数大于中位数,那么这组数据中小于平均数的数据占这50个数据的百分比是 .
【答案】
【分析】由题意可得小于平均数的数有个,即可得解.
【详解】小于平均数的数有个,占.
故答案为:.
13.(2013高二·全国·竞赛)有一组数据共有100个数,其中有20个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这100个数中,那么这组数据中小于平均数的数据占这100个数据的百分比是 .
【答案】或
【分析】分平均数大于和小于中位数两种情况求解.
【详解】如果平均数小于中位数,那么小于平均数的数据有30个;
如果平均数大于中位数,那么小于平均数的数据就有70个,
所以这组数中小于平均数的数据占这100个数据的百分比是或.
故答案为:或.
14.(2014高二·全国·竞赛)7个相异自然数的平均数为12,中位数为18,这7个自然数中最大的数最大可能是 .
【答案】24
【分析】根据平均数和中位数的概念计算即可.
【详解】设这7个自然数从小到大排列依次为,,,,,,,
则,,
当这7个自然数中最大的一个的可能值最大时,
其他5个自然数必取最小的可能值,,,,,,
此时,则.
故答案为:24.
15.(2015高二上·河北保定·竞赛)假设要抽查某种品牌的850颗种子的发芽率,抽取60粒进行实验.利用随机数表抽取种子时,先将850颗种子按001,002,…,850进行编号,如果从随机数表第8行第7列的数7开始向右读,请你依次写出最先检测的4颗种子的编号 , , , .
(下面摘取了随机数表第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
【答案】
【分析】从指定位置开始读取数据,每位数字读取一次,数字的范围要在到之间且不能重复,则依次读取的前个编号即为所求.
【详解】第行第列的数开始,第一个数为,依次三位数读取一次,只要落在到之间且不重复即可,
显然读取结果依次为.
故答案为:;;;.
16.(20-21高一·安徽芜湖·强基计划)中医药,是包括汉族和少数民族医药在内的我国各民族医药的统称,反映了中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系.某科研机构研究发现,某品种中医药的药物成分甲的含量(单位:克)与药物功效(单位:药物单位)之间具有关系.检测这种药品一个批次的5个样本,得到成分甲的平均值为4克,标准差为克,则估计这批中医药的药物功效的平均值为 药物单位.(提示:标准差为方差的算术平方根.)
【答案】
【分析】根据平均数和标准差得到,,进而利用平均数定义得到答案.
【详解】由题意得,,
,
则,
故,
因为,所以
故答案为:22
17.(21-22高一·安徽芜湖·强基计划)设是正整数,且,当数据的方差最小时,的值为 .
【答案】253或254
【分析】设,根据数据的方差为可化简为,推出要取到最小值,需最小且最小值为11,即可结合二次函数性质确定此时的值,求得答案.
【详解】设,则数据的方差为
,
显然且,
故要取到最小值,需最小,最小值为,
设,则,
则,
当或时,取到最小值,
即或时,取到最小值,
故当数据的方差最小时,即或,
的值为253或254,
故答案为:253或254
18.(22-23高二上·北京·强基计划)某学校初、高中共有学生4800人,现采用分层抽样的方法从中抽取800人进行体能测试.若这800人中有300人是初中生,则该校高中生共有 人.
【答案】3000
【分析】根据分层抽样的抽样比即可求解.
【详解】抽取的样本中初中生与高中生的人数之比为,所以该校高中生的人数为,
故答案为:3000
2 / 2
学科网(北京)股份有限公司
$$