专题08 统计(竞赛培优专项训练,8大考点+强基竞赛)高一数学人教A版全国通用

2026-03-21
| 2份
| 63页
| 559人阅读
| 8人下载

资源信息

学段 高中
学科 数学
教材版本 高中数学人教A版必修第二册
年级 高一
章节 第 九 章 统计
类型 题集-专项训练
知识点 统计
使用场景 竞赛
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 7.56 MB
发布时间 2026-03-21
更新时间 2026-03-21
作者 高中数学教辅专家孙小明
品牌系列 学科专项·竞赛
审核时间 2026-03-21
下载链接 https://m.zxxk.com/soft/56933995.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

专题08统计 目录概览 A考点精研・竞赛考点专项攻坚 考点一 获取数据的途径 5 考点二 抽样方法 5 考点三 统计图表 6 考点四 样本数据特征的计算 8 考点五 样本数据特征与统计图表的综合 10 考点六 分层随机抽样中的平均数或方差 12 考点七 统计中的决策问题 13 考点八 统计与函数的综合 16 考点九 统计知识的综合应用 16 B实战进阶・竞赛选拔模拟特训(精选各地竞赛、强基试题14道) 【归纳重点知识】 知识点01 获取数据的途径 1.直接获取与间接获取 (1)直接获取是指通过社会调查或观察、试验等途径获取数据,直接获取的数据称为直接数据或一手数据. (2)间接获取是指借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据,间接获取的数据称为间接数据或二手数据. 2.普查与抽样调查 (1)普查是为了掌握调查对象的整体情况。 (2)一般地说,在调查过程中,有两种获取数据的方法:普查和抽样调查.从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况.这种抽取一部分对象的调查方式叫作抽样调查,简称抽查. 3.总体与样本 (1)总体:所考察问题涉及的对象全体. (2)个体:总体中的每个对象. (3)样本:抽取的部分对象. (4)样本容量∶一个样本中包含的个体数且. (5)普查∶对总体中每个个体都进行考察的方法(也称为全面调查) (6)抽样调查∶只抽取样本进行考察的方法. 知识点02 抽样方法 1.简单随机抽样 (1)概念:一般地,从元素个数为N的总体中逐个不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数法 (3)适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小. 2.分层抽样 (1)概念:当总体由有明显差别的几部分组成时,为使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. (2)总体由差异明显的几部分组成的情况; 分层后,在每一层抽样时可采用简单随机抽样或系统抽样. (3)特征:等比例抽样 知识点03 用样本估计总体 1.频率分布表 (1)定义:频率分布表是对大量数值型数据进行整理与分析的统计表格,通过将数据按 “等距区间” 分组,统计每组内数据的出现次数(频数),并计算每组频数占总数据的比例(频率),以此清晰呈现数据的分布特征. (2).频率分布表的核心构成 分组区间:将数据划分的等距范围; 频数:每组区间内包含的原始数据个数; 频率:每组频数与总数据个数的比值(公式:频率 = 频数 ÷ 总数据数). 2.频率分布直方图 (1)频率分布直方图的画法:求极差;决定组距和组数;将数据分组;列频率分布表;画频率分布直方图:纵轴表示, (2).频率分布直方图基础概念:①纵轴表示:,②频率:小长方形面积=频率. 3..频率、频数、样本容量的计算方法 (1)×组距=频率.(2)=频率,(3)=样本容量,(4)样本容量×频率=频数. 4.频率分布直方图性质 (1)最高的小长方形底边中点的横坐标即是众数. (2)频率分布直方图中各个小方形的面积总和等于1. (3)中位数左边和右边的小长方形的面积和是相等的. 设中位数为,利用左(右)侧矩形面积之和等于,即可求出. (4)平均数是频率分布直方图的“重心”, ,其中为每个小长方形底边的中点,为每个小长方形的面积. 5.频率分布折线图 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律. 知识点04 用样本估计总体的数字特征 1.众数、中位数、平均数. (1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平. (2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平. 若有奇数个数,则最中间的数是中位数; 若有偶数个数,则中间两数的平均数是中位数. (3)平均数:个样本数据的平均数为,反映了一组数据的平均水平. 公式变形:. 2.总体百分位数的估计 (1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. (2)计算一组个数据的的第百分位数的步骤 ①按从小到大排列原始数据. ②计算. ③若i不是整数而大于i的比邻整数j,则第p百分位数为第j项数据; 若i是整数,则第p百分位数为第i项与第i+1项数据的平均数. (3)四分位数 第25、50、75百分位数称为四分位数.它们把一组由小到大排列后的数据分成四等份. 3.标准差和方差 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示. 假设样本数据是,表示这组数据的平均数, 则标准差:. (2)方差:方差就是标准差的平方,即:s2=. 显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差. (3)数据特征 标准差、方差描述了一组数据围绕平均数波动程度的大小. 标准差、方差越大,则数据的离散程度越大; 标准差、方差越小,数据的离散程度越小. 反之亦可由离散程度的大小推算标准差、方差的大小. 4.平均数、方差的运算性质:如果数据的平均数为,方差为,标准差为,那么一组新数据: 的平均数为,方差是,标准差为. 5.分层抽样的平均数 (1)一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的平均数为,设上述两层构成的新样本中每层的平均数分别为 和于是, =+=+ 记,,,称为权重,则+ (2)推广:设样本中不同层的平均数和相应权重分别为,,…和,,…则这个样本的平均数为 +…为了简化表示,引进求和符号,记作 6.分层抽样的方差 (1).定义:一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的方差为,设 上述两层构成的新样本中每层的方差分别为,,于是,[+]+[+], 记,,,称为权重,则[+]+[+] 2)推广:设样本中不同层的方差和相应权重,及平均数分别为,,…和,,…,,,…则这个样本的方差为 [+]+[+]+[+]为了简化表示,引进求和符号,记作 【熟记重要结论(二级结论)】 1.频率分布直方图中的常见结论 ①众数的估计值为最高矩形底边的中点对应的横坐标. ②平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的和. ③中位数的估计值的左边和右边的小矩形的面积之和是相等的. 2.平均数、方差的公式推广 若数据x1,x2,…,xn的平均数为,方差为s2,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a,方差为m2s2. 考点一 获取数据的途径 1.下列调查中最适合采用全面调查(普查)的是(   ) A.了解某市小麦的根部生长情况 B.了解某品牌手机的防摔功能 C.了解某省高一学生坚持晨读的情况 D.对我国最新研发的“玄龙08战斗机”的各零部件质量情况的调查 2.下列调查中,适合采用抽样调查的是(   ) A.调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况 B.重庆西站对乘坐高铁的旅客进行安检 C.为保证飞机飞行安全,工人对其零部件进行检查 D.调查重庆市中学生的周末作业完成时间 3.(多选)从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是(   ) A.总体指的是该市参加升学考试的全体学生的数学成绩 B.样本是指1000名学生的数学成绩 C.样本量指的是1000名学生 D.个体指的是该市参加升学考试的每一名学生的数学成绩 考点二 抽样方法 4.在孟德尔两对相对性状的豌豆杂交实验中,子二代豌豆性状表现型及理论比例为:黄色圆粒:黄色皱粒:绿色圆粒:绿色皱粒.现研究人员计划从大量该代豌豆种子中,随机抽取n粒豌豆作为样本进行研究.若希望样本中黄色皱粒豌豆的理论(期望)数量为30粒,则样本量n应为(   ) A.160 B.190 C.220 D.250 5.某工厂生产A,B两种型号的零件共10000件,其中A型号的零件6000件.质检员为了解这两种型号的零件的合格率,采用分层抽样的方法从这批零件中抽取500件进行质检,则B型号的零件被抽到的数量是(    ) A.240 B.200 C.300 D.100 6.(多选)某社团有男生名,女生名,从中抽取一个容量为5的样本,恰好抽到2名男生和3名女生,则下列说法正确的为(   ) A.该抽样一定不是系统抽样 B.该抽样可能是随机抽样 C.该抽样不可能是分层抽样 D.男生被抽到的概率大于女生被抽到的概率 7.某校高一年级共有500名学生参加学校组织的活动(每人只参加一项活动),其中参加“党团队一体化公益实践活动”的有125人,参加“心理健康游园活动”的有人、参加“湿地奔跑活动”的有人,现用分层抽样的方法,从中抽取100名学生了解他们的健康情况;如果已知参加“心理健康游园活动”的学生抽取了56人,则参加“湿地奔跑活动”的学生要抽取的人数为________. 8.2025年9月3日,以“铭记历史,开创未来”为核心的纪念中国人民抗日战争暨世界反法西斯战争胜利80周年阅兵在天安门广场隆重举行,已知从11000名甲校大学生,10000名乙校大学生和4000名丙校大学生中采用分层抽样方法抽取名大学生组成志愿者,若乙校大学生比丙校大学生多抽取60人,则_____. 考点三 统计图表 9.某实验室从“芯片算力,功耗控制,集成度,兼容性,稳定性”五个维度,对自研芯片,进行性能测评,评分结果的雷达图如下,则下列说法中正确的是(   ) A.在“稳定性”维度,芯片的评分为4分 B.在“功耗控制”维度,芯片的评分高于芯片的评分 C.在“芯片算力”维度,芯片的评分低于芯片的评分 D.芯片的性能评分的波动性低于芯片的性能评分的波动性 10.为了加强学生身体素质,一学校拟开展篮球、乒乓球、足球三个项目的体育活动.经调查得知全年级有1000人参与该活动,且选择这三个活动项目的学生占比的饼状图如图①所示,各项目中男女生占比的条形图如图②所示,则下列结论正确的是(    )    A.选择足球的女生比选择篮球的女生多 B.选择篮球的女生比选择足球的男生多 C.选择足球的男生和选择乒乓球的男生一样多 D.选择乒乓球的同学比选择篮球的男生多 11.为深入学习贯彻习近平新时代中国特色社会主义思想,某校于2026年1月组织高一、高二、高三三个年级共400名学生参加“青春心向党·奋进新征程”党史知识竞赛.如图,结合参赛学生的年级分布饼图与高一学生的排名分布频率条形图,下列命题中错误的是() A.这400名学生中,高一人数比高二人数多40 B.成绩前200名的高一学生有90人 C.成绩前100名的学生中,高三学生人数不超过64 D.成绩第101名到第200名的学生中,高二人数比高一人数多 12.(多选)某校高一年级开设了文学社、科创社、体育社、艺术社、辩论社五类社团,每名同学最多参加一个社团,对参加社团活动的情况进行统计调查,统计信息如图(1),(2),其中参加体育社和艺术社的人数相等,为了解社团活动开展情况,采用分层抽样的方法在参加社团活动的学生中任意抽取20名学生做问卷调查. 根据以上信息,下列说法正确的是(    ) A.艺术社的学生人数有120人 B.文学社和辩论社参加问卷调查的学生人数共有5人 C.从参加社团的学生中任选1人,已知该学生不是文学社成员,则该学生是科创社成员的概率为 D.调查结果显示文学社、科创社的满意率均为0.7,其他社团的满意率均为0.9,则社团活动总体满意率为0.81 13.为了了解某校高三年级学生的体育成绩,随机选取名学生参加考核,将考核的成绩(满分分,成绩均为不低于分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.    (1)求频率分布直方图中的值; (2)在考核成绩为,,的三组学生中,用分层抽样的方法抽取人,则考核成绩在中的学生应抽取多少人? 考点四 样本数据特征的计算 14.已知一组数据的方差为,甲同学将这组数据错看成,并求得错误数据的方差为,则正确数据的方差(    ) A.80 B.60 C.40 D.20 15.现有一组数据:1,1,3,7,若在这组数据中添加一个数据3,则不会发生变化的统计量是(   ) A.平均数 B.中位数 C.众数 D.方差 16.若个数据的平均值为,方差为,现加入数据和,则这个数据的方差为(    ) A. B. C. D. 17.已知4个互不相等的正整数的平均数为3,极差为4,则这四个数的方差为(    ) A. B. C.3 D.2 18.设样本数据的平均数为,方差为,设,样本数据的平均数为,方差为,则下列选项错误的是(    ) A. B. C. D. 19.已知样本数据的各项均不为0,这组样本数据的方差为,,样本数据的方差为.设甲:,乙:全为正数,或全为负数.则甲是乙的(   ) A.充分必要条件 B.充分不必要条件 C.必要不充分条件 D.既不充分也不必要条件 20.某药品企业研发了一个新药,其药效(单位:药物单位)与某活性成分AHH的含量(单位:mg)近似满足函数关系,为检查其质量,现抽查了8个样本,得到某活性成分AHH的含量的平均为4mg,标准差为2mg,则药效的平均值为(    ) A.8 B.6 C.5 D.4 21.在一组数3,3,8,11,28中插入两个整数,,使得新的一组数极差为原来极差的两倍,且众数和中位数保持不变,则的最大值为(    ) A.57 B.58 C.60 D.61 22.已知成对样本数据中互不相等,且所有样本点都在曲线上.若的平均值与方差均为5,则的平均值为__________.(其中) 23.设为方程的任意一组正整数解,分别为的平均数和中位数,记所有正整数解对应的值的算术平均数为,某班的数学老师张老师拟对全班35名学生进行奖励,取的几何平均值作为金额数给每个学生买同样的一件小礼品,则张老师需要付出的总金额数约为__________.(注:,结果保留一位小数) 24.给定素数(仅有1与本身是约数的数)p,若(即,且.其意为整除n,且不能整除n),记为,称是给定素数p的一个数论函数.则___________.当a,,且,则形如所有结果形成的样本数据的分位数是_________. 25.一组单调不减的数据(即),满足.记这组数据的方差为;数据的方差为,数据的方差为;数据的方差为.给出下列四个结论: ①存在单调不减的数据,使得; ②存在单调不减的数据,使得; ③存在单调不减的数据,使得; ④对任意单调不减的数据,都有. 其中正确结论的序号是_____. 26.在大数据时代,由于整合不同来源的数据需要以及在数据量庞大的情况下为减少计算量,实际上在计算机中计算方差是使用递推方法进行计算的.先计算前面k个数据的平均数和方差, 再计算前面k+1个数据的平均数和方,计算可利用递推式:,则______. 27.对于没有重复数据的样本,记这m个数的第k百分位数为.若在区间中的样本数据有且只有13个,则m的所有可能值的和为______. 考点五 样本数据特征与统计图表的综合 28.已知某地区甲、乙两所高中学校的六次联合模拟考试的数学平均分数(满分150分)的统计如图所示,则下列说法错误的是(   ) A.甲校的平均分均高于乙校的平均分 B.甲校六次平均分的方差小于乙校六次平均分的方差 C.甲校六次平均分的第25百分位数小于乙校六次平均分的第75百分位数 D.甲校的平均分极差小于乙校的平均分极差 29.(多选)(24-25高一下·福建福州·期末)某中学九年级在体能测试后,为分析学生的跳绳成绩,随机抽取了名学生的分钟跳绳的次数,将所得数据整理后,分为组画出如图频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这名学生中,跳绳次数位于的学生跳绳次数的方差为,跳绳次数位于的学生跳绳次数的方差为.(同一组中的数据以这组数据所在区间的中点值为代表)则下列正确的是(    ) A. B.估计该年级学生跳绳次数的分位数约为 C.估计该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为 D.估计该年级学生跳绳次数在次及以上的学生跳绳次数的方差为 30.(多选)某汽车配件工厂在生产过程中,随机抽取100件同款零件测得其综合指标值,并按,分成六组,得到如下频率分布直方图.规定:综合指标值小于60的为二等品,综合指标值不小于60的为一等品,则下列说法正确的是(    ) A. B.估计该厂所生产的该款零件的综合指标值的平均数为71(同一组数据用该组区间的中点值作代表) C.估计该厂所生产的该款零件的综合指标值的中位数为78 D.从该厂随机抽取20000件该款零件,则一等品约有15000件 31.(多选)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率即将患病者判为阴性的概率;误诊率即将未患病者判定为阳性的概率,以下说法正确的是(   ) A.某人的医学指标大于临界值c,那么他可能是患病者 B.在患病者中,其指标的中位数大于平均数 C.在未患病者中,指标的第25百分位数为76.5 D.指标临界值c越高,漏诊率越低,误诊率越高 32.(1)下表为12名毕业生的起始月薪: 毕业生 1 2 3 4 5 6 7 8 9 10 11 12 起始月薪 2850 2950 3050 2880 2775 2710 2890 3130 2940 3325 2920 2880 根据表中所给的数据,求这组数据的分位数; (2)从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图,求这500件产品质量指标值的样本平均数和样本方差(同一组数据用该区间的中点值作代表). 考点六 分层随机抽样中的平均数或方差 33.某AI公司有男性30人,女性10人,在一次知识竞技团建中,男性平均成绩为110分,方差为55,女性平均成绩为130分,方差为95,则在这次团建中,该公司的平均成绩和方差分别为(    ) A.120分,75 B.120分,20 C.115分,65 D.115分,140 34.高一某班有24名男生和40名女生,某次数学测试中,男生的平均分与女生的平均分之差为4,若男生分数的方差为94,全班分数的方差为84,则女生分数的方差为(   ) A.90 B.86 C.78 D.72 【答案】D 35.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为(    ) A. B. C. D. 36.(多选)某学校高一年级有500名学生,其中男生300人,女生200人,学校希望获得全体学生的身高信息,按比例分层抽取了容量为50的样本.经计算,男生样本均值为170cm,方差为;女生身高样本均值为160cm,方差为.下列说法中正确的是(    ) A.男生应当抽取30人 B.每个女生被抽到的概率均为 C.所有样本的均值为166cm D.所有样本的方差为 37.若一组样本数据的平均数为10,另一组样本数据的方差为8,则两组样本数据合并为一组样本数据后的平均数是__________,方差是__________. 38.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为,第j层的样本平均数为,样本方差为,,.记,则所有数据的样本方差为________. 考点七 统计中的决策问题 39.根据气象学上的标准,连续5天的日平均气温低于即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下: ①平均数; ②平均数且极差小于或等于3; ③平均数且标准差; ④众数等于5且极差小于或等于4. 则4组样本中一定符合入冬指标的共有(    ) A.1组 B.2组 C.3组 D.4组 40.某公司打算招聘一名职员.对甲、乙、丙三名应聘者进行了综合知识、工作经验、语言表达三方面的测试,他们的各项成绩如下表所示: 项目 应聘者 综合知识 工作经验 语言表达 甲 75 80 80 乙 85 80 70 丙 70 78 70 如果将每位应聘者的综合知识、工作经验、语言表达的成绩按5:2:3的比例计算其总成绩,并录用总成绩最高的应聘者,则被录用的是 . 41.某社区组织了以“奔向幸福,‘毽’步如飞”为主题的踢毽子比赛活动,初赛结束后有甲、乙两个代表队进入决赛,已知每队有5名队员,按团体总数排列名次,在规定时间内每人踢100个以上(含100)为优秀.下表是两队各队员的比赛成绩. 1号 2号 3号 4号 5号 总数 甲队 103 102 98 100 97 500 乙队 97 99 100 96 108 500 经统计发现两队5名队员踢毽子的总个数相等,按照比赛规则,两队获得并列第一. 学习统计知识后,我们可以通过考查数据中的其它信息作为参考,进行综合评定: (1)甲、乙两队的优秀率分别为_____________、________________; (2)甲队比赛数据的中位数为___________个;乙队比赛数据的中位数为__________个; (3)分别计算甲、乙两队比赛数据的方差; (4)根据以上信息,你认为综合评定哪一个队的成绩好?简述理由. 42.某果园试种了,两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记,两个品种各10棵的产量的平均数分别为和,方差分别为和. (单位:kg) 60 50 40 60 70 80 80 80 90 90 (单位:kg) 40 60 60 80 80 50 80 80 70 100 (1)求品种的10棵桃树产量的第80百分位数; (2)求,,,; (3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由. 43.2025年NBA选秀大会,我国选手杨瀚森将参加选秀,为备战选秀,运动员参加了联合试训,其中甲、乙两位运动员开展了队内三分投篮对抗赛.在对抗赛中两人每轮投篮10次,共进行10轮,每轮命中的成绩(个数)如下: 甲 4 7 6 5 4 9 10 7 8 10 乙 7 5 8 6 7 9 7 6 7 8 (1)求甲运动员的样本数据第75百分位数; (2)分别计算这两位运动员10轮投篮成绩的平均数和方差; (3)根据第二问结果回答下列问题:甲、乙两位运动员谁的发挥更稳定,为什么? 44.“十五五规划”是中共中央关于制定国民经济和社会发展第十五个五年规划.成都市为了解市民对“十五五规划”的认知程度,对不同年龄、不同职业的市民举办了一次“十五五规划”知识竞赛,满分为100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄大小分成5组,第一组:,第二组:,第三组:,第四组:,第五组:,得到如图所示的频率分布直方图,已知第一组有6人,从该市大学生、军人、医务人员、工人、个体户五种人群中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“十五五规划”知识竞赛,分别代表相应组的成绩,年龄组中组的成绩分别为93,96,97,94,90,职业组中组的成绩分别为93,98,94,95,90. (1)求抽取的x人的年龄的中位数(结果保留整数); (2)分别求5个年龄组和5个职业组成绩的平均数和方差,并以上述数据为依据,评价5个年龄组和5个职业组对“十五五规划”的认知程度. 考点八 统计与函数的综合 45.有一组样本数据,其中.已知,设函数.则的最小值为(    ) A.19 B.100 C.190 D.200 46.哈希表(HashTable)是一种利用键值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是“除留余数法”.例如,当除数为时,键值为的数据因余,应存放于位置中,从而可直接依据键值快速定位数据位置,多个数据可映射到同一位置(如键值和均映射到同一位置).现有一个容量为个位置(编号)的哈希表,以除留余数法(除数为)进行映射,需要存储个数据.设这个位置存放的数据个数分别为、、、、、、,则下列说法中正确的是(    ) A.至少有个位置存放了不少于个数据 B.若这个数据的键值恰好是间的所有奇数,则的中位数为 C.若的方差为,则的最小值为,最大值为 D.若的极差为,则最多有个位置没有存放数据 47.在一组样本数据中,正整数,,,出现的频率分别为,,,,且,,且,则下面四种情形中,对应样本的标准差最大的一组是(  ) A., B., C., D., 考点九 统计知识的综合应用 48.某中学举行了一次环保知识竞赛,为了了解本次竞赛的情况,从中抽取了名学生的成绩作为样本进行统计,将其成绩(满分:分)分成、、、六组,得到如图所示频率分布直方图. (1)求图中的值,并估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表); (2)若根据这次成绩,学校准备给成绩较高的前的学生颁发“环保小达人”荣誉证书,估计获得该荣誉证书的最低分数; (3)若落在中的样本数据的平均数是,方差是,落在中的样本数据的平均数是,方差是,求这两组数据的总平均数和方差. 49.甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示: (1)填写下表: 平均数 中位数 命中9环及以上 甲 7 ____________ 1 乙 ____________ ____________ 3 (2)请从四个不同的角度对这次测试进行分析:①结合平均数和方差,分析偏离程度;②结合平均数和中位数,分析谁的成绩好些;③结合平均数和命中9环以上(含9环)的次数,看谁的成绩好些;④结合折线图上两人射击命中环数及走势,分析谁更有潜力. 50.人工智能是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学.很多学校已经推出基于DeepSeek的人工智能通识课程,帮助学生深入了解人工智能的历史、关键技术及其在科学研究、社会发展中的高效应用,培养跨学科思维,推动人工智能技术在多领域的深度融合与创新.某探究小组利用DeepSeek解答了50份不同的模拟试卷(每份试卷包含文科、理科共30个题),收集其准确率,整理得到如下频率分布直方图. (1)求图中a的值; (2)求这组数据的中位数; (3)若将准确率不低于90%定义为“优秀表现”,且已知:①每份试卷中,文科题(语文、英语、历史)与理科题(数学、物理、化学)各占比50%,DeepSeek解答理科题的平均正确率比文科题高5%;②理科题每题6分,文科题每题4分,请计算: ①DeepSeek在“优秀表现”试卷中,理科题和文科题的平均正确率分别是多少? ②一份“优秀表现”的试卷,DeepSeek的平均得分是多少? 1.(2024·全国第七届章鱼杯竞赛)数据7,8,9,2,5,9,0,3,6,0的第60百分位数是(   ) A. B.5 C. D.7 2.(第九届“枫叶新希望杯”竞赛)某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,则更正后平均分和方差分别是(    ). A.70,50 B.70,75 C.70,72.5 D.65,70 3.(第七届“枫叶新希望杯”竞赛)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过8人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是(    ) A.甲地:总体均值为4,中位数为4 B.乙地:总体均值为2,总体方差大于0 C.丙地:总体均值为2,总体方差为3 D.丁地:中位数为2,众数为3 4.(第七届“枫叶新希望杯”竞赛)5个相异自然数的平均数为10,中位数为15,这5个自然数中最大的数最大可能是(    ) A.16 B.17 C.18 D.19 5.(2024全国第七届章鱼杯竞赛)设锐角满足,则数据的极差是(    ) A. B. C. D. 6.(2024·湖南邵阳竞赛)如果将一组数据5、4、6、5、4、13、5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数、平均数,下列说法正确的是(  ) A.中位数和众数都是5 B.众数是10 C.中位数是4 D.中位数、平均数都是5 7.(2024·山东潍坊竞赛)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为(   ) 随机数表如下0154  3287  6595  4287  5346 7953  2586  5741  3369  8324 4597  7386  5244  3578  6241 A.13 B.32 C.44 D.36 8.(2024·广东汕头竞赛)2023年10月3日第19届杭州亚运会跳水女子10米跳台迎来决赛,中国“梦之队”包揽了该项目的冠亚军.已知某次跳水比赛中运动员五轮的成绩互不相等,记为,平均数为,若随机删去其任一轮的成绩,得到一组新数据,记为,平均数为,下面说法正确的是(   ) A.新数据的极差可能等于原数据的极差 B.新数据的中位数可能等于原数据的中位数 C.若,则新数据的方差一定大于原数据方差 D.若,则新数据的第40百分位数一定大于原数据的第40百分位数 9.(2024·北京THUSSAT竞赛)某学校初、高中共有学生4800人,现采用分层抽样的方法从中抽取800人进行体能测试.若这800人中有300人是初中生,则该校高中生共有________人. 10.(第十届“枫叶新希望杯”竞赛)已知数据的平均数为6,标准差为,则数据的平均数的取值范围是______. 11.(2024高二·全国·竞赛)一组数据共有50个数,其中7个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这50个数中,且平均数大于中位数,那么这组数据中小于平均数的数据占这50个数据的百分比是______. 【答案】 12.(2023高二·全国·竞赛)有一组数据共有100个数,其中有20个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这100个数中,那么这组数据中小于平均数的数据占这100个数据的百分比是______. 13.(全国“枫叶新希望杯”竞赛)7个相异自然数的平均数为12,中位数为18,这7个自然数中最大的数最大可能是______. 14.(2025·山东潍坊竞赛)某大学为了解学生对两家餐厅的满意度情况,从在两家餐厅都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行满意指数打分(满意指数是指学生对餐厅满意度情况的打分,分数设置为分.根据打分结果按,分组,得到如图所示的频率分布直方图,其中餐厅满意指数在中有30人. (1)求餐厅满意指数频率分布直方图中的值; (2)利用样本估计总体的思想,估计餐厅满意指数和餐厅满意指数的平均数及方差(同一组中的数据用该组区间中点值作代表); 参考公式:,其中为的平均数,分别为对应的频率. (3)如果一名新来同学打算从两家餐厅中选择一个用餐,你建议选择哪个餐厅?说明理由. 1 / 43 学科网(北京)股份有限公司 学科网(北京)股份有限公司 $ 专题08统计 目录概览 A考点精研・竞赛考点专项攻坚 考点一 获取数据的途径 5 考点二 抽样方法 6 考点三 统计图表 8 考点四 样本数据特征的计算 12 考点五 样本数据特征与统计图表的综合 21 考点六 分层随机抽样中的平均数或方差 25 考点七 统计中的决策问题 28 考点八 统计与函数的综合 33 考点九 统计知识的综合应用 35 B实战进阶・竞赛选拔模拟特训(精选各地竞赛、强基试题14道) 【归纳重点知识】 知识点01 获取数据的途径 1.直接获取与间接获取 (1)直接获取是指通过社会调查或观察、试验等途径获取数据,直接获取的数据称为直接数据或一手数据. (2)间接获取是指借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据,间接获取的数据称为间接数据或二手数据. 2.普查与抽样调查 (1)普查是为了掌握调查对象的整体情况。 (2)一般地说,在调查过程中,有两种获取数据的方法:普查和抽样调查.从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况.这种抽取一部分对象的调查方式叫作抽样调查,简称抽查. 3.总体与样本 (1)总体:所考察问题涉及的对象全体. (2)个体:总体中的每个对象. (3)样本:抽取的部分对象. (4)样本容量∶一个样本中包含的个体数且. (5)普查∶对总体中每个个体都进行考察的方法(也称为全面调查) (6)抽样调查∶只抽取样本进行考察的方法. 知识点02 抽样方法 1.简单随机抽样 (1)概念:一般地,从元素个数为N的总体中逐个不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数法 (3)适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小. 2.分层抽样 (1)概念:当总体由有明显差别的几部分组成时,为使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. (2)总体由差异明显的几部分组成的情况; 分层后,在每一层抽样时可采用简单随机抽样或系统抽样. (3)特征:等比例抽样 知识点03 用样本估计总体 1.频率分布表 (1)定义:频率分布表是对大量数值型数据进行整理与分析的统计表格,通过将数据按 “等距区间” 分组,统计每组内数据的出现次数(频数),并计算每组频数占总数据的比例(频率),以此清晰呈现数据的分布特征. (2).频率分布表的核心构成 分组区间:将数据划分的等距范围; 频数:每组区间内包含的原始数据个数; 频率:每组频数与总数据个数的比值(公式:频率 = 频数 ÷ 总数据数). 2.频率分布直方图 (1)频率分布直方图的画法:求极差;决定组距和组数;将数据分组;列频率分布表;画频率分布直方图:纵轴表示, (2).频率分布直方图基础概念:①纵轴表示:,②频率:小长方形面积=频率. 3..频率、频数、样本容量的计算方法 (1)×组距=频率.(2)=频率,(3)=样本容量,(4)样本容量×频率=频数. 4.频率分布直方图性质 (1)最高的小长方形底边中点的横坐标即是众数. (2)频率分布直方图中各个小方形的面积总和等于1. (3)中位数左边和右边的小长方形的面积和是相等的. 设中位数为,利用左(右)侧矩形面积之和等于,即可求出. (4)平均数是频率分布直方图的“重心”, ,其中为每个小长方形底边的中点,为每个小长方形的面积. 5.频率分布折线图 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律. 知识点04 用样本估计总体的数字特征 1.众数、中位数、平均数. (1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平. (2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平. 若有奇数个数,则最中间的数是中位数; 若有偶数个数,则中间两数的平均数是中位数. (3)平均数:个样本数据的平均数为,反映了一组数据的平均水平. 公式变形:. 2.总体百分位数的估计 (1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. (2)计算一组个数据的的第百分位数的步骤 ①按从小到大排列原始数据. ②计算. ③若i不是整数而大于i的比邻整数j,则第p百分位数为第j项数据; 若i是整数,则第p百分位数为第i项与第i+1项数据的平均数. (3)四分位数 第25、50、75百分位数称为四分位数.它们把一组由小到大排列后的数据分成四等份. 3.标准差和方差 (1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示. 假设样本数据是,表示这组数据的平均数, 则标准差:. (2)方差:方差就是标准差的平方,即:s2=. 显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差. (3)数据特征 标准差、方差描述了一组数据围绕平均数波动程度的大小. 标准差、方差越大,则数据的离散程度越大; 标准差、方差越小,数据的离散程度越小. 反之亦可由离散程度的大小推算标准差、方差的大小. 4.平均数、方差的运算性质:如果数据的平均数为,方差为,标准差为,那么一组新数据: 的平均数为,方差是,标准差为. 5.分层抽样的平均数 (1)一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的平均数为,设上述两层构成的新样本中每层的平均数分别为 和于是, =+=+ 记,,,称为权重,则+ (2)推广:设样本中不同层的平均数和相应权重分别为,,…和,,…则这个样本的平均数为 +…为了简化表示,引进求和符号,记作 6.分层抽样的方差 (1).定义:一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的方差为,设 上述两层构成的新样本中每层的方差分别为,,于是,[+]+[+], 记,,,称为权重,则[+]+[+] 2)推广:设样本中不同层的方差和相应权重,及平均数分别为,,…和,,…,,,…则这个样本的方差为 [+]+[+]+[+]为了简化表示,引进求和符号,记作 【熟记重要结论(二级结论)】 1.频率分布直方图中的常见结论 ①众数的估计值为最高矩形底边的中点对应的横坐标. ②平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的和. ③中位数的估计值的左边和右边的小矩形的面积之和是相等的. 2.平均数、方差的公式推广 若数据x1,x2,…,xn的平均数为,方差为s2,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a,方差为m2s2. 考点一 获取数据的途径 1.下列调查中最适合采用全面调查(普查)的是(   ) A.了解某市小麦的根部生长情况 B.了解某品牌手机的防摔功能 C.了解某省高一学生坚持晨读的情况 D.对我国最新研发的“玄龙08战斗机”的各零部件质量情况的调查 【答案】D 【解析】选项A:了解某市小麦的根部生长情况,普查工作量巨大且有破坏性,适合抽样调查,故A错误; 选项B:了解某品牌手机的防摔功能,普查工作量巨大且有破坏性,适合抽样调查,故B错误; 选项C:了解某省高一学生坚持晨读的情况,普查工作量巨大,适合抽样调查,故C错误; 选项D:“玄龙08战斗机”的各零部件数量有限,且是精确度要求较高的调查, 适合全面调查(普查),故D正确. 故选:D 2.下列调查中,适合采用抽样调查的是(   ) A.调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况 B.重庆西站对乘坐高铁的旅客进行安检 C.为保证飞机飞行安全,工人对其零部件进行检查 D.调查重庆市中学生的周末作业完成时间 【答案】D 【解析】对于A,调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况:总体较小(仅50人),容易进行全面调查,不适合抽样调查, 对于B,重庆西站对乘坐高铁的旅客进行安检:安检涉及安全风险,必须对每位旅客进行全面检查,不适合抽样调查, 对于C,为保证飞机飞行安全,工人对其零部件进行检查:飞机零部件检查要求全面性,任何遗漏都可能造成安全事件,不适合抽样调查, 对于D,调查重庆市中学生的周末作业完成时间:调查对象是全市范围中学生,总体较大,适合抽样调查, 因此,适合采用抽样调查的是D, 故选:D. 3.(多选)从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是(   ) A.总体指的是该市参加升学考试的全体学生的数学成绩 B.样本是指1000名学生的数学成绩 C.样本量指的是1000名学生 D.个体指的是该市参加升学考试的每一名学生的数学成绩 【答案】ABD 【解析】总体指的是该市参加升学考试的全体学生的数学成绩,故A正确; 样本是指1000名学生的数学成绩,故B正确;样本量是1000,故C错误; 个体指的是该市参加升学考试的每一名学生的数学成绩,故D正确. 故选:ABD. 考点二 抽样方法 4.在孟德尔两对相对性状的豌豆杂交实验中,子二代豌豆性状表现型及理论比例为:黄色圆粒:黄色皱粒:绿色圆粒:绿色皱粒.现研究人员计划从大量该代豌豆种子中,随机抽取n粒豌豆作为样本进行研究.若希望样本中黄色皱粒豌豆的理论(期望)数量为30粒,则样本量n应为(   ) A.160 B.190 C.220 D.250 【答案】A 【解析】根据题意得,黄色皱粒豌豆所占总体比例为,所以样本量. 故选:A. 5.某工厂生产A,B两种型号的零件共10000件,其中A型号的零件6000件.质检员为了解这两种型号的零件的合格率,采用分层抽样的方法从这批零件中抽取500件进行质检,则B型号的零件被抽到的数量是(    ) A.240 B.200 C.300 D.100 【答案】B 【解析】由题意可得B型号的零件被抽到的数量是. 故选:B. 6.(多选)某社团有男生名,女生名,从中抽取一个容量为5的样本,恰好抽到2名男生和3名女生,则下列说法正确的为(   ) A.该抽样一定不是系统抽样 B.该抽样可能是随机抽样 C.该抽样不可能是分层抽样 D.男生被抽到的概率大于女生被抽到的概率 【答案】BC 【解析】由总体容量为,样本容量为5,抽样比为. 对于A:因为系统抽样是将总体分成均衡的若干部分,再按等距规则抽取个体. 只要符合等距规则,有可能抽到2名男生和3名女生, 所以一定不是系统抽样是错误,因此A不正确; 对于B:因为简单随机抽样是从总体中逐个抽取,每个个体被抽到的可能性相等的, 抽到2名男生和3名女生是随机事件,有可能发生,故B正确; 对于C:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样,且分层抽样的比例相同, 但现在某社团有男生名,女生名,抽取2名男生和3名女生,抽的比例不同, 所以不可能是分层抽样,故C正确; 对于D:在简单随机抽样中,总体中每个个体被抽到的概率都相等,均为, 因此男生和女生被抽到的概率相等,故D选项说法错误. 7.某校高一年级共有500名学生参加学校组织的活动(每人只参加一项活动),其中参加“党团队一体化公益实践活动”的有125人,参加“心理健康游园活动”的有人、参加“湿地奔跑活动”的有人,现用分层抽样的方法,从中抽取100名学生了解他们的健康情况;如果已知参加“心理健康游园活动”的学生抽取了56人,则参加“湿地奔跑活动”的学生要抽取的人数为________. 【答案】19 【解析】分层抽样中,总体共500名学生,抽取100人,因此抽样比为, 由题意得:,因此:, 根据抽样比得:,解得, 因此:, 故参加“湿地奔跑活动”抽取人数为. 8.2025年9月3日,以“铭记历史,开创未来”为核心的纪念中国人民抗日战争暨世界反法西斯战争胜利80周年阅兵在天安门广场隆重举行,已知从11000名甲校大学生,10000名乙校大学生和4000名丙校大学生中采用分层抽样方法抽取名大学生组成志愿者,若乙校大学生比丙校大学生多抽取60人,则_____. 【答案】 【解析】设甲校大学生抽取的人数为,丙校大学生抽取的人数为,则乙校大学生抽取的人数为, 所以,解得,, 从而. 考点三 统计图表 9.某实验室从“芯片算力,功耗控制,集成度,兼容性,稳定性”五个维度,对自研芯片,进行性能测评,评分结果的雷达图如下,则下列说法中正确的是(   ) A.在“稳定性”维度,芯片的评分为4分 B.在“功耗控制”维度,芯片的评分高于芯片的评分 C.在“芯片算力”维度,芯片的评分低于芯片的评分 D.芯片的性能评分的波动性低于芯片的性能评分的波动性 【答案】D 【分析】根据雷达图,逐项分析即可得解. 【解析】由雷达图可知,在“稳定性”维度,芯片的评分为8分,故A错误; 在“功耗控制”维度,芯片的评分与芯片的评分相同,故B错误; 在“芯片算力”维度,芯片的评分高于芯片的评分,故C错误; 由雷达图,芯片的各项性能评分比较均衡,其波动性低于芯片的性能评分的波动性,故D正确. 故选:D 10.为了加强学生身体素质,一学校拟开展篮球、乒乓球、足球三个项目的体育活动.经调查得知全年级有1000人参与该活动,且选择这三个活动项目的学生占比的饼状图如图①所示,各项目中男女生占比的条形图如图②所示,则下列结论正确的是(    )    A.选择足球的女生比选择篮球的女生多 B.选择篮球的女生比选择足球的男生多 C.选择足球的男生和选择乒乓球的男生一样多 D.选择乒乓球的同学比选择篮球的男生多 【答案】C 【解析】全年级有1000人参与该活动,由饼状图可知: 选择篮球的学生有: 人, 选择乒乓球的学生有: 人, 选择足球的学生有: 人, 由条形图可知: 选择篮球的学生中,女生 人,男生 人, 选择乒乓球的学生中,女生 人,男生 人, 选择足球的学生中,女生 人,男生 人. 故选:C. 11.为深入学习贯彻习近平新时代中国特色社会主义思想,某校于2026年1月组织高一、高二、高三三个年级共400名学生参加“青春心向党·奋进新征程”党史知识竞赛.如图,结合参赛学生的年级分布饼图与高一学生的排名分布频率条形图,下列命题中错误的是() A.这400名学生中,高一人数比高二人数多40 B.成绩前200名的高一学生有90人 C.成绩前100名的学生中,高三学生人数不超过64 D.成绩第101名到第200名的学生中,高二人数比高一人数多 【答案】D 【解析】由饼图可知,高一人数比高二人数多选项正确; 由条形图可知,成绩前200名中高一人数为人,B选项正确; 成绩前100名的学生中,高一人数为人, 故高三人数不超过人,C选项正确; 成绩第101名到第名的学生中,高一人数为人, 故高二最多有人,因此高二人数比高一少,D选项错误, 故选:D 12.(多选)某校高一年级开设了文学社、科创社、体育社、艺术社、辩论社五类社团,每名同学最多参加一个社团,对参加社团活动的情况进行统计调查,统计信息如图(1),(2),其中参加体育社和艺术社的人数相等,为了解社团活动开展情况,采用分层抽样的方法在参加社团活动的学生中任意抽取20名学生做问卷调查. 根据以上信息,下列说法正确的是(    ) A.艺术社的学生人数有120人 B.文学社和辩论社参加问卷调查的学生人数共有5人 C.从参加社团的学生中任选1人,已知该学生不是文学社成员,则该学生是科创社成员的概率为 D.调查结果显示文学社、科创社的满意率均为0.7,其他社团的满意率均为0.9,则社团活动总体满意率为0.81 【答案】ABD 【解析】对于A,因为文学社有60人占比为,所以五类社团总人数为人, 辩论社有90人,占比应为,所以体育社和艺术社共占比为, 又因为体育社和艺术社的人数相等,所以两社团分别占比为, 可知艺术社的学生人数有人,即A正确; 对于B,文学社和辩论社共人,分层抽样比为, 因此文学社和辩论社参加问卷调查的学生人数共有人,即B正确; 对于C,根据已有分析可知该学生不是文学社成员的概率为,又因为是科创社成员的概率为, 因此在该学生不是文学社成员的条件下,该学生是科创社成员的概率为,即C错误; 对于D,依题意可知社团活动总体满意率为,即D正确. 13.为了了解某校高三年级学生的体育成绩,随机选取名学生参加考核,将考核的成绩(满分分,成绩均为不低于分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.    (1)求频率分布直方图中的值; (2)在考核成绩为,,的三组学生中,用分层抽样的方法抽取人,则考核成绩在中的学生应抽取多少人? 【解析】(1)由频率分布直方图可得, 解得. (2)由频率分布直方图知,样本考核成绩在,,的三组学生有(人), 其中样本考核成绩在的市民人数为, 用分层抽样的方法应从考核成绩在的市民中抽取(人). 考点四 样本数据特征的计算 14.已知一组数据的方差为,甲同学将这组数据错看成,并求得错误数据的方差为,则正确数据的方差(    ) A.80 B.60 C.40 D.20 【答案】C 【解析】由于,故正确数据和错误数据的平均数相等,记为, 则, , 则, 则. 15.现有一组数据:1,1,3,7,若在这组数据中添加一个数据3,则不会发生变化的统计量是(   ) A.平均数 B.中位数 C.众数 D.方差 【答案】A 【解析】对于A:原数据平均数为,添加数据3后平均数为,故A正确; 对于B:原数据中位数为,添加数据3后中位数为3,故B错误; 对于C:原数据众数为1,添加数据3后众数为1和3,故C错误; 对于D:原数据方差为,添加数据3后方差为,故D错误. 16.若个数据的平均值为,方差为,现加入数据和,则这个数据的方差为(    ) A. B. C. D. 【答案】A 【解析】设这个数据为,依题意,, 则, 加入数据和后,这个数据的平均值为, 则方差为. 17.已知4个互不相等的正整数的平均数为3,极差为4,则这四个数的方差为(    ) A. B. C.3 D.2 【答案】A 【解析】设4个互不相等的正整数为:,满足: 平均数为3,则总和为; 极差为4,则; 且所有数为互不相等的正整数. 根据题意可得:,且,均为整数. 令,则,,且满足,即,且互不相等,和为6.所以,. 所以四个互不相等的正整数为1,2,4,5. 方差为:. 故选:A. 18.设样本数据的平均数为,方差为,设,样本数据的平均数为,方差为,则下列选项错误的是(    ) A. B. C. D. 【答案】D 【解析】对于A,,,移项得,故A正确; 对于B,,根据方差的线性性质得,故B正确; 对于C,, 由均值的性质得,得到, 则,故C正确; 对于D,由方差的定义得,则, 由题意得 ,故D错误. 故选:D. 19.已知样本数据的各项均不为0,这组样本数据的方差为,,样本数据的方差为.设甲:,乙:全为正数,或全为负数.则甲是乙的(   ) A.充分必要条件 B.充分不必要条件 C.必要不充分条件 D.既不充分也不必要条件 【答案】A 【解析】充分性:设的平均数为,的平均数为, ,, 因为,所以,所以, 其中,故, 由绝对值不等式得, 当且仅当同号,即全为正数,或全为负数,等号成立, 故充分性成立, 必要性:若全为正数,则,,显然, 若全为负数,则,, 设的平均数为,则的平均数为, ,, ,必要性成立, 综上,甲是乙充分必要条件. 故选:A 20.某药品企业研发了一个新药,其药效(单位:药物单位)与某活性成分AHH的含量(单位:mg)近似满足函数关系,为检查其质量,现抽查了8个样本,得到某活性成分AHH的含量的平均为4mg,标准差为2mg,则药效的平均值为(    ) A.8 B.6 C.5 D.4 【答案】A 【解析】由题意:, , 则 即, 所以. 所以 . 故选:A 21.在一组数3,3,8,11,28中插入两个整数,,使得新的一组数极差为原来极差的两倍,且众数和中位数保持不变,则的最大值为(    ) A.57 B.58 C.60 D.61 【答案】C 【解析】若插入两个整数后众数不变,则插入的数可以是“两个都是”,或是“一个为,另一个不是”, 或是“两个不等的且不是,,”. ①因为新的一组数极差加倍,所以插入的两个数不可能都是; ②因为中位数保持不变,若插入的数“一个为,另一个不是”,则一个为,另一个数不小于, 又因为极差加倍,则另一个数为,此时; ③若插入的两个数是不等的且不是,,,,且极差为,中位数保持不变, 则两个数可以为 ,,,,,,, 所以,的最大值为. 故选:C. 22.已知成对样本数据中互不相等,且所有样本点都在曲线上.若的平均值与方差均为5,则的平均值为__________.(其中) 【答案】 【解析】因为的平均值为5,即,所以, 因为的方差为5,即,解得. 因为所有样本点都在曲线上, 所以, 所以, 所以的平均值为, 故答案为:. 23.设为方程的任意一组正整数解,分别为的平均数和中位数,记所有正整数解对应的值的算术平均数为,某班的数学老师张老师拟对全班35名学生进行奖励,取的几何平均值作为金额数给每个学生买同样的一件小礼品,则张老师需要付出的总金额数约为__________.(注:,结果保留一位小数) 【答案】 【解析】由于,所以; 方程的正整数解总数可理解为:将个分成组,需要个隔板,则正整数解的组数为组, 不妨设这个数由小到大分别为,即则这三个数的 中位数为, 当时,则,,排列以后对应的组数为; 当时,则,,或,,排列以后对应的组数为; 当时,则,,或,,或,,排列以后对应的组数为; 当时,则,,排列以后对应的组数为; 故其中中位数为1,2,3,4的分别有3,9,13,3组, 所以,所以,所以张老师需要付出的总金额数约为. 24.给定素数(仅有1与本身是约数的数)p,若(即,且.其意为整除n,且不能整除n),记为,称是给定素数p的一个数论函数.则___________.当a,,且,则形如所有结果形成的样本数据的分位数是_________. 【答案】 【解析】因为,所以整除,且不能整除, 所以. 根据题意整除,且不能整除, 因为,所以的可能取值为:、、,所以, 所以根据已知条件有:、、、、、六种可能, 从小到大排序为、、、、、, 因为,所以样本数据的80%分位数是第个数. 25.一组单调不减的数据(即),满足.记这组数据的方差为;数据的方差为,数据的方差为;数据的方差为.给出下列四个结论: ①存在单调不减的数据,使得; ②存在单调不减的数据,使得; ③存在单调不减的数据,使得; ④对任意单调不减的数据,都有. 其中正确结论的序号是_____. 【答案】①②③ 【解析】对于①,令,,, 数据,,的平均数为, 由此可得:, 数据,的平均数为, ,所以, 所以存在单调不减的数据,使得,①正确; 对于②,令,,, 数据,的平均数为, 由此可得: , 数据,的平均数为, 由此可得:,, 所以存在单调不减的数据,使得,②正确; 对于③,令,,,, 数据,,的平均数为:, 由此可得:, 数据,的平均数为, 由此可得:,若, 则, 即, 整理得:,解得, 当时,有, 所以存在单调不减的数据,使得; 对于④,令,,,, 数据,,,的平均数为, 由此可得:, 数据,的平均数为, 由此可得:, 此时,,所以④错误. 故答案为:①②③ 26.在大数据时代,由于整合不同来源的数据需要以及在数据量庞大的情况下为减少计算量,实际上在计算机中计算方差是使用递推方法进行计算的.先计算前面k个数据的平均数和方差, 再计算前面k+1个数据的平均数和方,计算可利用递推式:,则______. 【答案】 【解析】前个数据的方差为:, 前个数据的平均数为:, 得, 则, 因为, 所以 结合题意得,, 故. 27.对于没有重复数据的样本,记这m个数的第k百分位数为.若在区间中的样本数据有且只有13个,则m的所有可能值的和为______. 【答案】 【解析】不妨假设,用表示不超过的最大整数. 若为正整数,即为正整数,则是5的倍数,此时必是正整数, 则, 则在区间的数据为, 所以,解得; 若都不是正整数,则, 则在区间的数据为, 所以,则, 解得. 综上,的可能取值有. 当时,在区间内的数据有,共个数,满足题意; 当时,在区间内的数据有,共个数,不满足题意; 当时,在区间内的数据有,共个数,不满足题意; 当时,在区间内的数据有,共个数,满足题意; 当时,在区间内的数据有,共个数,满足题意; 当时,在区间内的数据有,共个数,不满足题意; 当时,在区间内的数据有,共个数,满足题意; 当时,在区间内的数据有,共个数,满足题意; 当时,在区间内的数据有,共个数,不满足题意; 当时,在区间内的数据有,共个数,不满足题意; 故的可能取值有,. 考点五 样本数据特征与统计图表的综合 28.已知某地区甲、乙两所高中学校的六次联合模拟考试的数学平均分数(满分150分)的统计如图所示,则下列说法错误的是(   ) A.甲校的平均分均高于乙校的平均分 B.甲校六次平均分的方差小于乙校六次平均分的方差 C.甲校六次平均分的第25百分位数小于乙校六次平均分的第75百分位数 D.甲校的平均分极差小于乙校的平均分极差 【答案】A 【解析】对于A,甲校第2次考试的平均分低于乙校第2次考试的平均分,A错误; 对于B,由题图可知,甲校六次考试的平均分相对于乙校六次考试的平均分更加集中,说明数据更加稳定, 则甲校六次平均分的方差小于乙校六次平均分的方差,B正确; 对于C,,甲校六次考试的平均分按从小到大的顺序排列,第2个成绩为第25百分位数, 由题图可知,为第5次考试的平均分,约为90分; ,乙校六次考试的平均分按从小到大的顺序排列,第5个成绩为第75百分位数, 由题图可知,为第3次考试的平均分,高于90分; 甲校六次平均分的第25百分位数小于乙校六次平均分的第75百分位数,C正确; 对于D,由题图可知,甲校平均分的最高值和最低值的差明显小于乙校平均分最高值和最低值的差, 即甲校的平均分极差小于乙校的平均分极差,D正确. 故选:A. 29.(多选)(24-25高一下·福建福州·期末)某中学九年级在体能测试后,为分析学生的跳绳成绩,随机抽取了名学生的分钟跳绳的次数,将所得数据整理后,分为组画出如图频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这名学生中,跳绳次数位于的学生跳绳次数的方差为,跳绳次数位于的学生跳绳次数的方差为.(同一组中的数据以这组数据所在区间的中点值为代表)则下列正确的是(    ) A. B.估计该年级学生跳绳次数的分位数约为 C.估计该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为 D.估计该年级学生跳绳次数在次及以上的学生跳绳次数的方差为 【答案】BD 【解析】对于A,由频率分布直方图中各长方形面积和为,得,解得,故A错误; 对于B,根据百分位数的计算,假设该年级学生跳绳次数的分位数为,则,又,所以解得,故B正确; 对于C,该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为,故C错误; 对于D,该年级学生跳绳次数在次及以上的学生跳绳次数的方差为,故D正确. 故选:BD. 30.(多选)某汽车配件工厂在生产过程中,随机抽取100件同款零件测得其综合指标值,并按,分成六组,得到如下频率分布直方图.规定:综合指标值小于60的为二等品,综合指标值不小于60的为一等品,则下列说法正确的是(    ) A. B.估计该厂所生产的该款零件的综合指标值的平均数为71(同一组数据用该组区间的中点值作代表) C.估计该厂所生产的该款零件的综合指标值的中位数为78 D.从该厂随机抽取20000件该款零件,则一等品约有15000件 【答案】ABD 【解析】由,得,A正确; 平均数为, 所以可以估计该厂所生产的该款零件的综合指标值的平均数为71,B正确; 因为, 所以中位数在第4组, 设中位数为,则, 解得,所以可以估计该厂所生产的该款零件的综合指标值的中位数为73.33,C错误; 由频率分布直方图可知100件零件中二等品有件,一等品有件, 故从该厂随机抽取20000件该款零件,则一等品约有件,D正确. 故选:ABD. 31.(多选)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率即将患病者判为阴性的概率;误诊率即将未患病者判定为阳性的概率,以下说法正确的是(   ) A.某人的医学指标大于临界值c,那么他可能是患病者 B.在患病者中,其指标的中位数大于平均数 C.在未患病者中,指标的第25百分位数为76.5 D.指标临界值c越高,漏诊率越低,误诊率越高 【答案】ABC 【解析】根据临界值c的定义,将该指标大于c的人判定为阳性,所以A正确; 在患病者的该指标的频率分布直方图中, 可知,, 则中位数为,平均数为,所以B正确; 在未患病者的该指标的频率分布直方图中,可知,, 即第25百分位数为76.5,所以C正确; 当时,患病者该指标为,则的患病者为漏诊,的未患病者为误诊,根据该指标的频率分布直方图可知,c越高,漏诊率越高,误诊率越低,所以D错误;故选:ABC. 32.(1)下表为12名毕业生的起始月薪: 毕业生 1 2 3 4 5 6 7 8 9 10 11 12 起始月薪 2850 2950 3050 2880 2775 2710 2890 3130 2940 3325 2920 2880 根据表中所给的数据,求这组数据的分位数; (2)从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图,求这500件产品质量指标值的样本平均数和样本方差(同一组数据用该区间的中点值作代表). 【解析】(1)因为,第九个数是2950,第十个数是3050, 所以75%分位数是; (2)抽取产品质量指标值的样本平均数和样本方差分别为 , . 考点六 分层随机抽样中的平均数或方差 33.某AI公司有男性30人,女性10人,在一次知识竞技团建中,男性平均成绩为110分,方差为55,女性平均成绩为130分,方差为95,则在这次团建中,该公司的平均成绩和方差分别为(    ) A.120分,75 B.120分,20 C.115分,65 D.115分,140 【答案】D 【解析】因为某AI公司有男性30人,女性10人,男性平均成绩为110分,方差为55,女性平均成绩为130分,方差为95, 所以该公司的平均成绩为分, 该公司成绩的方差为. 34.高一某班有24名男生和40名女生,某次数学测试中,男生的平均分与女生的平均分之差为4,若男生分数的方差为94,全班分数的方差为84,则女生分数的方差为(   ) A.90 B.86 C.78 D.72 【答案】D 【解析】设男生分数为,男生分数均值为; 女生分数为,女生分数均值为; 则,总体均值为, 男生分数方差为,则, 全班分数方差为, 由方差得公式可知, 代入得,解得; 因为,所以, 化简得, 解得, 则女生方差为; 故选:D. 35.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为(    ) A. B. C. D. 【答案】D 【解析】设甲组数据分别为、、、,乙组数据分别为、、、, 甲组数据的平均数为,可得,方差为,可得, 乙组数据的平均数为,可得,方差为,可得, 混合后,新数据的平均数为, 方差为 . 故选:D. 36.(多选)某学校高一年级有500名学生,其中男生300人,女生200人,学校希望获得全体学生的身高信息,按比例分层抽取了容量为50的样本.经计算,男生样本均值为170cm,方差为;女生身高样本均值为160cm,方差为.下列说法中正确的是(    ) A.男生应当抽取30人 B.每个女生被抽到的概率均为 C.所有样本的均值为166cm D.所有样本的方差为 【答案】AC 【解析】对于A:抽样比为,所以男生应当抽取人,故A正确; 对于B:每个女生被抽到的概率等于抽样比,故B错误; 对于C:由分层抽样知,样本中男生有人,女生有人, 所有的样本均值为:,故C正确; 对于D:设男生样本为,女生样本为, 男生方差,女生方差, ,, 所有样本的方差 ,故D错误. 37.若一组样本数据的平均数为10,另一组样本数据的方差为8,则两组样本数据合并为一组样本数据后的平均数是__________,方差是__________. 【答案】 【解析】由题意可知,数据的平均数为, 所以,则, 所以数据、、、的平均数为, 方差为, 所以, 将两组数据合并后,得到新数据, 则其平均数为, 方差为. 38.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为,第j层的样本平均数为,样本方差为,,.记,则所有数据的样本方差为________. 【答案】 【解析】解:. ∴样本均值为. 又. 计算总体 又. . . 考点七 统计中的决策问题 39.根据气象学上的标准,连续5天的日平均气温低于即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下: ①平均数; ②平均数且极差小于或等于3; ③平均数且标准差; ④众数等于5且极差小于或等于4. 则4组样本中一定符合入冬指标的共有(    ) A.1组 B.2组 C.3组 D.4组 【答案】B 【解析】①举反例:,,,,,其平均数.但不符合入冬指标; ②假设有数据大于或等于10,由极差小于或等于3可知, 则此组数据中的最小值为,此时数据的平均数必然大于7, 与矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标; ③举反例:1,1,1,1,11,平均数,且标准差.但不符合入冬指标; ④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标. 故选:B. 40.某公司打算招聘一名职员.对甲、乙、丙三名应聘者进行了综合知识、工作经验、语言表达三方面的测试,他们的各项成绩如下表所示: 项目 应聘者 综合知识 工作经验 语言表达 甲 75 80 80 乙 85 80 70 丙 70 78 70 如果将每位应聘者的综合知识、工作经验、语言表达的成绩按5:2:3的比例计算其总成绩,并录用总成绩最高的应聘者,则被录用的是 . 【答案】乙 【解析】由题,对于甲,他的总成绩如下: , 对于乙,他的总成绩:, 对于丙,他的总成绩:, 比较三者总成绩,乙的成绩最高。 故答案为:乙 41.某社区组织了以“奔向幸福,‘毽’步如飞”为主题的踢毽子比赛活动,初赛结束后有甲、乙两个代表队进入决赛,已知每队有5名队员,按团体总数排列名次,在规定时间内每人踢100个以上(含100)为优秀.下表是两队各队员的比赛成绩. 1号 2号 3号 4号 5号 总数 甲队 103 102 98 100 97 500 乙队 97 99 100 96 108 500 经统计发现两队5名队员踢毽子的总个数相等,按照比赛规则,两队获得并列第一. 学习统计知识后,我们可以通过考查数据中的其它信息作为参考,进行综合评定: (1)甲、乙两队的优秀率分别为_____________、________________; (2)甲队比赛数据的中位数为___________个;乙队比赛数据的中位数为__________个; (3)分别计算甲、乙两队比赛数据的方差; (4)根据以上信息,你认为综合评定哪一个队的成绩好?简述理由. 【解析】(1)甲队的优秀率为:, 乙队的优秀率为:. 故答案为:;. (2)甲队5名队员比赛成绩按从小到大的顺序排列为:97,98,100,102,103, 所以甲队比赛数据的中位数为100; 乙队5名队员比赛成绩按从小到大的顺序排列为:96,97,99,100,108, 所以乙队比赛数据的中位数为99. 故答案为:100;99. (3)甲、乙两队比赛数据的平均数均为(个) . . (4)综合评定甲队的成绩好,理由如下: 因为甲队的优秀率比乙队高;甲队的中位数比乙队大;甲队的方差比乙队低,比较稳定,综合评定甲队比较好. 42.某果园试种了,两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记,两个品种各10棵的产量的平均数分别为和,方差分别为和. (单位:kg) 60 50 40 60 70 80 80 80 90 90 (单位:kg) 40 60 60 80 80 50 80 80 70 100 (1)求品种的10棵桃树产量的第80百分位数; (2)求,,,; (3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由. 【解析】(1)由题意将品种的棵桃树产量从小到大排列为:,,,,,,,,,; 且,则第百分位数为第位和第位数的平均数:. 故品种的棵桃树产量的第百分位数为. (2)由题意可得, 则 ; , . (3)种植品种,因为,但是,所以品种产量较稳定. 43.2025年NBA选秀大会,我国选手杨瀚森将参加选秀,为备战选秀,运动员参加了联合试训,其中甲、乙两位运动员开展了队内三分投篮对抗赛.在对抗赛中两人每轮投篮10次,共进行10轮,每轮命中的成绩(个数)如下: 甲 4 7 6 5 4 9 10 7 8 10 乙 7 5 8 6 7 9 7 6 7 8 (1)求甲运动员的样本数据第75百分位数; (2)分别计算这两位运动员10轮投篮成绩的平均数和方差; (3)根据第二问结果回答下列问题:甲、乙两位运动员谁的发挥更稳定,为什么? 【解析】(1)甲运动员的成绩从小到大排列为, ,故甲运动员的样本数据第75百分位数为9, (2)甲的平均数为, 方差为 乙的平均数为 方差为 (3)由(2)知:, 故乙发挥的更加稳定. 44.“十五五规划”是中共中央关于制定国民经济和社会发展第十五个五年规划.成都市为了解市民对“十五五规划”的认知程度,对不同年龄、不同职业的市民举办了一次“十五五规划”知识竞赛,满分为100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄大小分成5组,第一组:,第二组:,第三组:,第四组:,第五组:,得到如图所示的频率分布直方图,已知第一组有6人,从该市大学生、军人、医务人员、工人、个体户五种人群中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“十五五规划”知识竞赛,分别代表相应组的成绩,年龄组中组的成绩分别为93,96,97,94,90,职业组中组的成绩分别为93,98,94,95,90. (1)求抽取的x人的年龄的中位数(结果保留整数); (2)分别求5个年龄组和5个职业组成绩的平均数和方差,并以上述数据为依据,评价5个年龄组和5个职业组对“十五五规划”的认知程度. 【解析】(1)设中位数为a,∵第一组的频率为, 第二组的频率为,第三组的频率为, 又,,. 则,,则中位数为32岁. (2)5个年龄组成绩的平均数为, 方差. 5个职业组成绩的平均数为, 方差为. 所以从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定. 考点八 统计与函数的综合 45.有一组样本数据,其中.已知,设函数.则的最小值为(    ) A.19 B.100 C.190 D.200 【答案】C 【解析】因为, 而,则得. 所以当时,. 46.哈希表(HashTable)是一种利用键值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是“除留余数法”.例如,当除数为时,键值为的数据因余,应存放于位置中,从而可直接依据键值快速定位数据位置,多个数据可映射到同一位置(如键值和均映射到同一位置).现有一个容量为个位置(编号)的哈希表,以除留余数法(除数为)进行映射,需要存储个数据.设这个位置存放的数据个数分别为、、、、、、,则下列说法中正确的是(    ) A.至少有个位置存放了不少于个数据 B.若这个数据的键值恰好是间的所有奇数,则的中位数为 C.若的方差为,则的最小值为,最大值为 D.若的极差为,则最多有个位置没有存放数据 【答案】D 【解析】设为数据除以的余数为的数的个数, 对于A选项,, 不妨假设这个位置存放的数据个数分别为、、、、、、,A错; 对于B选项,由题意可知,这些奇数分别为、、、、、、、、、 、、、、、、、、、、、、, 这些数据除的余数分别为:、、、、、、、、、、、、、、 、、、、、、、, 所以,,,,,,,, 将这个数由小到大排列依次为、、、、、、,中位数为,B错; 对于C选项,由题意可知,这个数的平均数为, 且,, 因为,, 当这个数中有个,个时,取最小值, 即, 当这个数中有个,个时,取最大值, 即,C错; 对于D选项,不妨这个数依次为:、、、、、、, 满足极差为,此时,所有位置都有数据, 若存在一些位置没有数据,则这个数据中的最大值为,最小值为, 因为,此时,至少需要个位置存放数据,则至多有个位置没有存放数据,D对. 故选:D. 【点睛】关键点点睛:解决本题D选项,主要要对个位置是否存在空位进行讨论,利用特例法结合极差的定义进行判断. 47.在一组样本数据中,正整数,,,出现的频率分别为,,,,且,,且,则下面四种情形中,对应样本的标准差最大的一组是(  ) A., B., C., D., 【答案】B 【解析】样本数据的平均数, 结合选项可知,且, 所以, 样本数据的方差 . 因为,,则, 所以,所以,故, 所以最大时,方差最大,即标准差最大,故B正确. 故选:B. 考点九 统计知识的综合应用 48.某中学举行了一次环保知识竞赛,为了了解本次竞赛的情况,从中抽取了名学生的成绩作为样本进行统计,将其成绩(满分:分)分成、、、六组,得到如图所示频率分布直方图. (1)求图中的值,并估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表); (2)若根据这次成绩,学校准备给成绩较高的前的学生颁发“环保小达人”荣誉证书,估计获得该荣誉证书的最低分数; (3)若落在中的样本数据的平均数是,方差是,落在中的样本数据的平均数是,方差是,求这两组数据的总平均数和方差. 【解析】(1)由题意可得,解得, 平均数为. (2)设“获得该荣誉证书的最低分数”为, 由于分数介于的频率为、分数介于的频率为, 故获得该荣誉证书的最低分数介于之间, 则有,解得. (3)成绩位于的学生人数为, 成绩位于的学生人数为, 因为落在中的样本数据的平均数是,方差是, 落在中的样本数据的平均数是,方差是, 所以两组数据的总平均数, 总方差为. 49.甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示: (1)填写下表: 平均数 中位数 命中9环及以上 甲 7 ____________ 1 乙 ____________ ____________ 3 (2)请从四个不同的角度对这次测试进行分析:①结合平均数和方差,分析偏离程度;②结合平均数和中位数,分析谁的成绩好些;③结合平均数和命中9环以上(含9环)的次数,看谁的成绩好些;④结合折线图上两人射击命中环数及走势,分析谁更有潜力. 【解析】(1)甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9, 中位数为7环. 乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10, (环). 乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10, 中位数是(环). 于是填充后的表格,如图所示: 平均数 中位数 命中9环以上(含9环) 甲 7 7 1 乙 7 7.5 3 (2), . ①甲、乙的平均数相同,均为7,但,说明甲偏离平均数的程度小,而乙偏离平均数的程度大. ②甲、乙的平均数相同,而乙的中位数比甲大,说明乙射靶环数的优秀次数比甲多. ③甲、乙的平均数相同,而乙命中9环以上(含9环)的次数比甲多2次,可知乙的射靶成绩比甲好. ④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力. 50.人工智能是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学.很多学校已经推出基于DeepSeek的人工智能通识课程,帮助学生深入了解人工智能的历史、关键技术及其在科学研究、社会发展中的高效应用,培养跨学科思维,推动人工智能技术在多领域的深度融合与创新.某探究小组利用DeepSeek解答了50份不同的模拟试卷(每份试卷包含文科、理科共30个题),收集其准确率,整理得到如下频率分布直方图. (1)求图中a的值; (2)求这组数据的中位数; (3)若将准确率不低于90%定义为“优秀表现”,且已知:①每份试卷中,文科题(语文、英语、历史)与理科题(数学、物理、化学)各占比50%,DeepSeek解答理科题的平均正确率比文科题高5%;②理科题每题6分,文科题每题4分,请计算: ①DeepSeek在“优秀表现”试卷中,理科题和文科题的平均正确率分别是多少? ②一份“优秀表现”的试卷,DeepSeek的平均得分是多少? 【解析】(1)由频率分布直方图可得,解得; (2)设中位数为,前两个矩形的面积之和为, 前三个矩形的面积之和为, 所以,则,解得, 所以估计准确率的中位数为; (3)①设“优秀表现”试卷中文科题平均正确率为,则理科题平均正确率为, 优秀表现的准确率区间为, 其平均准确率为:, 则,解得, 则理科题平均正确率为; ②文科得分为,理科得分为, 则DeepSeek的平均得分为分. 1.(2024·全国第七届章鱼杯竞赛)数据7,8,9,2,5,9,0,3,6,0的第60百分位数是(   ) A. B.5 C. D.7 【答案】C 【解析】将这组数据从小到大排列为0,0,2,3,5,6,7,8,9,9, 由,故这组数据的第60百分位数是. 故选:C. 2.(第九届“枫叶新希望杯”竞赛)某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分却记成了50分,乙实得70分却记成了100分,则更正后平均分和方差分别是(    ). A.70,50 B.70,75 C.70,72.5 D.65,70 【答案】A 【解析】因为甲少记了30分,乙多记了30分,故平均分不变, 不妨设登记正确的46人成绩依次为,更正后的方差为, 则, 又, 两式相减,得, 解得.故选:A. 3.(第七届“枫叶新希望杯”竞赛)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过8人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是(    ) A.甲地:总体均值为4,中位数为4 B.乙地:总体均值为2,总体方差大于0 C.丙地:总体均值为2,总体方差为3 D.丁地:中位数为2,众数为3 【答案】C 【解析】A选项,总体均值为4,中位数为4, 数据可能为:,不符合. B选项,总体均值为,总体方差大于, 数据可能为:,不符合. C选项,总体均值为2,总体方差为3, 根据方差的计算公式可知,若丙地有一天超过8人,则方差必大于3, 所以C选项符合. D选项,中位数为2,众数为3, 数据可能为,不符合. 故选:C 4.(第七届“枫叶新希望杯”竞赛)5个相异自然数的平均数为10,中位数为15,这5个自然数中最大的数最大可能是(    ) A.16 B.17 C.18 D.19 【答案】C 【解析】若5个不同自然数从小到大依次为,要使最大的数最大, 又中位数为15,只需, 所以最大. 故选:C 5.(2024全国第七届章鱼杯竞赛)设锐角满足,则数据的极差是(    ) A. B. C. D. 【答案】B 【解析】因为,并且是锐角,所以, 得到,又对应四个数据(应用诱导公式)分别可写为, 所以极差为, 故选:B. 6.(2024·湖南邵阳竞赛)如果将一组数据5、4、6、5、4、13、5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数、平均数,下列说法正确的是(  ) A.中位数和众数都是5 B.众数是10 C.中位数是4 D.中位数、平均数都是5 【答案】A 【解析】将这组数据从小到大的顺序排列为4,4,5,5,5,6,13,处于中间位置的那个数是5, 每个数字重复写10次,5依然处于中间位置,由中位数的定义可知,这组新数据的中位数是5, 这组新数据中出现次数最多的数是5,出现了30次,所以众数为5,故A正确,BC错误. 平均数,故D错误. 故选:A 7.(2024·山东潍坊竞赛)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为(   ) 随机数表如下0154  3287  6595  4287  5346 7953  2586  5741  3369  8324 4597  7386  5244  3578  6241 A.13 B.32 C.44 D.36 【答案】C 【解析】根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,如下: 32,58,65,74,13,36,98,32,44;其中58,65,74, 98不在编号范围内,舍去, 再去除重复的,剩下的号码为:32, 13,36,44; 所以选取的第四个号码为44. 故选:C. 8.(2024·广东汕头竞赛)2023年10月3日第19届杭州亚运会跳水女子10米跳台迎来决赛,中国“梦之队”包揽了该项目的冠亚军.已知某次跳水比赛中运动员五轮的成绩互不相等,记为,平均数为,若随机删去其任一轮的成绩,得到一组新数据,记为,平均数为,下面说法正确的是(   ) A.新数据的极差可能等于原数据的极差 B.新数据的中位数可能等于原数据的中位数 C.若,则新数据的方差一定大于原数据方差 D.若,则新数据的第40百分位数一定大于原数据的第40百分位数 【答案】ABC 【解析】对于A中,若随机删去任一轮的成绩,恰好不是最高成绩和最低成绩,此时新数据的极差可能等于原数据的极差,所以A正确; 对于B中,不妨假设, 当时,若随机删去的成绩是,此时新数据的中位数等于原数据的中位数,所以B正确; 对于C中,若,即删去的数据恰为平均数,根据方差的计算公式,分子不变,分母变小,所以方差会变大,所以C正确; 对于D中,若,即删去的数据恰为平均数,在按从小到大的顺序排列的5个数据中, 因为,此时原数据的分位数为第二数和第三个数的平均数; 删去一个数据后的4个数据,从小到大的顺序排列,可得, 此时新数据的分位数为第二个数, 显然新数据的分位数小于原数据的分位数,所以D错误. 故选:ABC. 9.(2024·北京THUSSAT竞赛)某学校初、高中共有学生4800人,现采用分层抽样的方法从中抽取800人进行体能测试.若这800人中有300人是初中生,则该校高中生共有________人. 【答案】3000 【解析】抽取的样本中初中生与高中生的人数之比为,所以该校高中生的人数为, 10.(第十届“枫叶新希望杯”竞赛)已知数据的平均数为6,标准差为,则数据的平均数的取值范围是______. 【答案】 【解析】根据已知条件有:,得:,即, 设的平均数为,的平均数为,则, 结合方差定义:, 展开得:, 即,; 同理可得,, 即得,即, 化简有:,解得, 则数据的平均数的取值范围是, 故答案为: 11.(2024高二·全国·竞赛)一组数据共有50个数,其中7个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这50个数中,且平均数大于中位数,那么这组数据中小于平均数的数据占这50个数据的百分比是______. 【答案】 【解析】小于平均数的数有个,占. 故答案为:. 12.(2023高二·全国·竞赛)有一组数据共有100个数,其中有20个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这100个数中,那么这组数据中小于平均数的数据占这100个数据的百分比是______. 【答案】或 【解析】如果平均数小于中位数,那么小于平均数的数据有30个; 如果平均数大于中位数,那么小于平均数的数据就有70个, 所以这组数中小于平均数的数据占这100个数据的百分比是或. 故答案为:或. 13.(全国“枫叶新希望杯”竞赛)7个相异自然数的平均数为12,中位数为18,这7个自然数中最大的数最大可能是______. 【答案】24 【解析】设这7个自然数从小到大排列依次为,,,,,,, 则,, 当这7个自然数中最大的一个的可能值最大时, 其他5个自然数必取最小的可能值,,,,,, 此时,则. 故答案为:24. 14.(2025·山东潍坊竞赛)某大学为了解学生对两家餐厅的满意度情况,从在两家餐厅都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行满意指数打分(满意指数是指学生对餐厅满意度情况的打分,分数设置为分.根据打分结果按,分组,得到如图所示的频率分布直方图,其中餐厅满意指数在中有30人. (1)求餐厅满意指数频率分布直方图中的值; (2)利用样本估计总体的思想,估计餐厅满意指数和餐厅满意指数的平均数及方差(同一组中的数据用该组区间中点值作代表); 参考公式:,其中为的平均数,分别为对应的频率. (3)如果一名新来同学打算从两家餐厅中选择一个用餐,你建议选择哪个餐厅?说明理由. 【解析】(1)因为餐厅满意指数在中有30人,则有: 解得: 根据总的频率和为1,则有: 解得: 综上可得:, (2)设餐厅满意指数的平均数和方差分别为餐厅满意指数的平均数和方差分别为,则有: , , , , 综上可得:餐厅满意指数的平均数和方差分别为,;餐厅满意指数的平均数和方差分别, (3)答案一:餐厅满意指数的平均数为,方差为,餐厅满意指数的平均数为,方差为,因为,所以推荐餐厅; 答案二:餐厅满意指数在的频率为,在的频率为,餐厅满意指数在和的频率都为,所以推荐餐厅; (答案不唯一,符合实际情况即可) 1 / 43 学科网(北京)股份有限公司 学科网(北京)股份有限公司 $

资源预览图

专题08 统计(竞赛培优专项训练,8大考点+强基竞赛)高一数学人教A版全国通用
1
专题08 统计(竞赛培优专项训练,8大考点+强基竞赛)高一数学人教A版全国通用
2
专题08 统计(竞赛培优专项训练,8大考点+强基竞赛)高一数学人教A版全国通用
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。