专题强化08:统计【十大题型 培优】训练-2025-2026学年高一下学期数学人教A版必修第二册《考点•题型 •技巧》精讲与精练高分突破系列
2026-05-27
|
2份
|
59页
|
438人阅读
|
10人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版必修第二册 |
| 年级 | 高一 |
| 章节 | 第 九 章 统计 |
| 类型 | 题集-专项训练 |
| 知识点 | - |
| 使用场景 | 同步教学-单元练习 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 4.31 MB |
| 发布时间 | 2026-05-27 |
| 更新时间 | 2026-05-27 |
| 作者 | 启明数学物理探究室 |
| 品牌系列 | - |
| 审核时间 | 2026-05-27 |
| 下载链接 | https://m.zxxk.com/soft/58078814.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
**基本信息**
以“方法-题型-知识”三维架构系统整合统计专项,通过技巧归纳(如直方图绘制步骤、百分位数计算法则)与分层题型设计,构建从抽样到数据特征分析的完整逻辑链,培养数据意识与运算能力。
**专项设计**
|模块|题量/典例|方法提炼|知识逻辑|
|----|-----------|----------|----------|
|抽样方法|2题型(4典例)|简单随机抽样步骤、分层抽样比例计算|从数据收集方法切入,建立抽样公平性认知|
|统计图表|4题型(8典例)|直方图分点/高计算技巧、图表信息提取策略|图表类型与数据类型匹配,培养直观想象|
|数据特征|3题型(6典例)|三数/方差计算通法、数据变换影响规律|从集中趋势到离散程度,构建数据描述体系|
|综合应用|1题型(3典例)|多图表关联分析、跨知识点整合方法|抽样-图表-特征串联,提升综合解题能力|
内容正文:
专题强化08:统计
【题型归纳】
· 题型一:简单随机抽样
· 题型二:分层抽样
· 题型三:条形统计图
· 题型四:折线统计图
· 题型五:扇形统计图
· 题型六:频率分布直方图问题
· 题型七:百分数问题
· 题型八:众数 、平均数、中位数与方差
· 题型九:加减数据对平均数、方差的影响
· 题型十:统计的综合问题
【知识梳理】
知识点01:频率分布直方图
作频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的差.
2.决定组距与组数
将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组
4.列频率分布表:各小组的频率=.
5.画频率分布直方图
纵轴表示,实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×=频率.
技巧归纳:
(1)分点的决定方法:若数据为整数,则减去0.5作为分点数;若数据是小数点后一位的数,则减去0.05作为分点数;依次类推.
(2)画频率分布直方图中小矩形的高的方法:①小矩形的高=;②假设频数为1的小矩形的高为h,则频数为k的小矩形的高为kh.
(3)频率分布直方图的性质
①因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
②在频率分布直方图中,各小矩形的面积之和等于1.
③=样本容量.
(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
知识点02:常见统计图表的特点与区别
扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,条形图适用于描述离散型数据,直方图适用于描述连续型数据.折线图主要用于描述数据随时间的变化趋势.
知识点03:百分位数
1.百分位数定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.常用的百分位数
(1)四分位数:第25百分位数,第50百分位数,第75百分位数.
(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.
3.计算一组n个数据的第p百分位数的一般步骤如下:
第1步,按从小到大排列原始数据;
第2步,计算i=n×p%;
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
知识点04:众数、中位数、平均数
名称
概念
平均数
如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=(x1+x2+…+xn).
中位数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)叫做这组数据的中位数.
众数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)叫做这组数据的众数.
知识点05:总体集中趋势的估计
1.平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
2.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
知识点06:频率分布直方图中平均数、中位数、众数的求法
1.样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应相等.
3.将最高小矩形所在的区间中点作为众数的估计值.
知识点07:方差、标准差
13.方差和标准差
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,则这组数据的方差为.
这组数据的标准差为.
14.总体(样本)方差和总体标准差
(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差.
(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差:. 总体标准差:S=.
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称为样本方差,s=为样本标准差.
【题型探究】
题型一:简单随机抽样
【典例1】.(2026·上海金山·二模)为了了解申辉中学所有学生的每天平均体育运动时间,随机调查了该校100名学生,发现他们每天平均体育运动时间为h.这里的总体是( )
A.该校所有学生 B.该校所有学生的每天平均体育运动时间
C.所调查的100名学生 D.所调查的100名学生的每天平均体育运动时间
【变式1】.(25-26高一上·山东潍坊·期末)某学校举行了“我向航天员提问”的趣味活动,现从同学们提出的问题中初选个不同类型问题进行连续编号(每个编号都由两个数字组成):利用随机数表法从中抽取个问题回答.若从下列随机数表第行第个数字开始,每次从左向右选取两个数字,则选出的第个问题编号为( )
A. B. C. D.
【变式2】.(24-25高二下·上海·阶段检测)从101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中采用随机数表法抽取10个人,那么下列说法正确的是( )
A.这是一种科学的抽样方法
B.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
题型二:分层抽样
【典例2】.(24-25高一下·福建福州·期末)某校高一、高二、高三的学生志愿者人数分别为.按学生所在年级进行分层,用分层随机抽样的方法从中抽取5名学生去敬老院献爱心.从这5人中随机抽取2人作为负责人,则2名负责人至少有一名来自高二年级的概率为( )
A. B. C. D.
【变式1】.(25-26高一下·湖南衡阳·期中)“一尺一拳一寸间,科学用眼护双眼”,为保护青少年视力,培养科学健康的用眼习惯,某市疾控中心联合教育局开展“青少年视力健康监测与科学用眼宣传”.计划从全市三所高中(A校2400人、B校1800人、C校1200人)的所有学生中,按人数比例采用分层随机抽样的方法抽取270人进行视力检测与用眼习惯问卷调查,则A校应抽取的人数为( )
A.60 B.90 C.120 D.150
【变式2】.(25-26高一上·辽宁辽阳·期末)某中学学生可通过选课平台选择校本课程《能源材料与节能环保》《我们的汉字》《网球运动基础探秘》《软笔书法临习与创作》,若只统计选择其中一门课程的人数,则选择这四门校本课程的人数分别为1200,1600,800,1200.根据所选课程采用按比例分层随机抽样的方法,从这些学生中随机抽取24名学生进行座谈,则应从选择《我们的汉字》的学生中抽取的人数为( )
A.6 B.8 C.12 D.9
题型三:条形统计图
【典例3】.(2024·江西·二模)下图是我国2018~2023年纯电动汽车销量统计情况,下列说法错误的是( )
A.我国纯电动汽车销量呈现逐年增长趋势
B.这六年销量第60百分位数为536.5万辆
C.这六年增长率最大的为2019年至2020年
D.2020年销量高于这六年销量的平均值
【变式1】.(23-24高一下·四川内江·期末)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄的分布饼状图、90后从事互联网行业者的岗位分布条形图,则下列结论中不一定正确的是( )
A.互联网行业从事技术岗位的人数中,90后比80后多
B.90后互联网行业者中从事技术岗位的人数超过整个从事互联网行业者总人数的
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业从业人员中90后占一半以上
【变式2】.(23-24高一下·安徽阜阳·期末)随着科学技术的不断进步和人们环保意识的提升,全球新能源汽车市场愈发繁荣,近年来,我国在新能源汽车的研发以及产销量上取得了巨大的进步.下图是2016~2022年全球及中国新能源汽车销量情况统计图,则下列说法正确的是( )
A.全球新能源汽车销量数据的极差为456 B.中国新能源汽车销量逐年递增
C.2021年中国新能源汽车销量同比增长最快 D.2022年中国新能源汽车销量占全球销量的比重最大
题型四:折线统计图
【典例4】.(25-26高一上·河南南阳·期末)下图是国家统计局发布的2024年10月份至2025年10月份商品零售额与餐饮收入的同比增长速度折线图,下列说法错误的是( )
A.2025年10月份商品零售额同比增长速度为
B.2025年3-10月份商品零售额同比增长速度的极差为
C.2025年前四个月商品零售额与餐饮收入同比增速平均值不相同
D.2025年3-10月份餐饮收入同比增长速度的分位数为
【变式1】.(24-25高一下·贵州六盘水·期末)为了研究我市甲、乙两个旅游景点的游客情况,文旅局统计了今年4月到9月甲、乙两个旅游景点的游客人数(单位:万人),得到如图所示的折线图.根据两个景点的游客人数的折线图,下列说法错误的是( )
A.7,8,9月份的总游客人数甲景点比乙景点少
B.乙景点4月到9月的游客人数总体呈上升趋势
C.甲景点4月到9月游客人数的平均值在内
D.甲、乙两景点4月到9月中游客量的最高峰期都在8月
【变式2】.(24-25高一上·重庆长寿·期末)年月日时至次日时(次日的时间前加表示)重庆的温度走势
下列说法错误的是( )
A.月日时至时重庆气温逐渐升高,时到次日时重庆气温逐渐降低
B.月日时至次日时重庆的最低气温为,最高气温为
C.根据图象,这一天时所对应的温度为
D.根据图象,这一天时所对应的温度为
题型五:扇形统计图
【典例5】.(23-24高一下·吉林通化·阶段检测)2024年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
【变式1】.(22-23高一下·广东佛山·期末)某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中一定错误的是( )
A.丁险种参保人数超过五成 B.41岁以上参保人数超过总参保人数的五成
C.18-29周岁人群参保的总费用最少 D.人均参保费用不超过5000元
【变式2】.(23-24高一下·福建泉州·期中)某学校组建了合唱、朗诵、脱口秀、舞蹈、太极拳五个社团,该校共有2000名同学,每名同学依据自己的兴越爱好最多可参加其中一个,各个社团的人数比例的扇形图如图所示,其中参加朗诵社团的同学有8名,参加太极拳社团的有12名,则( )
A.这五个社团的总人数为100
B.脱口秀社团的人数占五个社团总人数的
C.这五个社团总人数占该校学生人数的
D.脱口秀社团在扇形统计图中所占圆心角的度数为
题型六:频率分布直方图问题
【典例6】.(25-26高一下·贵州遵义·期中)某城市交通部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的运行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照分成5组,制成如图所示的频率分布直方图.
(1)求图中的值;
(2)求这组数据的平均数与方差;
(3)已知满意度评分值在内的男性人数与女性人数的比为.若在满意度评分值为的人中随机抽取2人进行座谈,求恰有1名女性的概率.
【变式1】.(25-26高一上·江西抚州·期末)某学校组织全校学生进行了一次“两会知识知多少”的问卷测试,已知所有学生的测试成绩均位于区间,从中随机抽取了200名学生的测试成绩,绘制得到如图所示的频率分布直方图.
(1)求图中的值,并估算这200名学生的测试成绩的中位数和平均数;(同一组中的数据用该组区间的中点值作代表).
(2)若样本数据在的平均成绩,方差,在的平均成绩,方差,求在的平均成绩和方差;(方差精确到).
(3)现学校准备利用按比例的分层随机抽样方法,从和的学生中抽取7人组成两会知识宣讲团.从选定的7人中随机抽取2人对高一同学进行宣讲,设事件为“至多有1人测试成绩位于区间”,求事件发生的概率.
【变式2】.(25-26高一上·河北保定·期末)2024年10月13日,成都市将举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.成都市文体广电旅游局承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求的值;
(2)估计这100名候选者面试成绩的平均数和第80百分位数;
(3)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和50,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.
题型七:百分数问题
【典例7】.(24-25高一下·天津和平·期末)某人工智能公司为优化新开发的机器人模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,则图中____,根据直方图可知满意度计分的第三四分位数约为______.
20.(25-26高三上·上海长宁·期中)某运动员在某次男子气手枪射击比赛中12次的比赛得分数据单位:环为:,,,,,,,,,,,,则这组数据的第30百分位数为______ .
【变式1】.(24-25高一下·河北邢台·阶段检测)心理健康指数是通过科学方法量化评估个体或群体心理状态的指标.某机构研究人员为了解某社区居民的心理健康情况,随机从该社区抽取20名居民进行调查,得到他们的心理健康指数分别为7.2,7.3,7.5,7.8,7.9,8.0,8.5,8.5,8.6,8.6,8.7,8.7,9.1,9.1,9.3,9.4,9.5,9.7,10.0,10.0,则这组数据的第60百分位数是_________.
题型八:众数 、平均数、中位数与方差
【典例8】.(25-26高一上·辽宁·期末)在了解高一年级学生每月在校图书馆平均借阅了多少本文学书籍时,甲同学在物理组合班抽取了一个容量为的样本并算得样本的平均数为5,方差为8.乙同学在历史组合班抽取了一个容量为的样本,并算得样本的平均数为8,方差为.已知甲乙两同学抽取的样本合在一起,组成一个容量为的样本,那么合在一起后的样本平均数为__________,样本方差为__________.
【变式1】.(24-25高一下·黑龙江绥化·期末)有5人进行定点投篮游戏,每人投篮12次.这5人投中的次数形成一组数据,中位数为10,唯一众数为11,极差为3,则该组数据的第40百分位数是_________.
【变式2】.(24-25高一下·河北邯郸·期末)某工厂的三个车间生产同一种产品,产量占比分别为.现在用分层随机抽样方法按比例分配从这三个车间生产的该产品中,共抽取70件做使用寿命的测试,则车间应抽取___________件;若三个车间产品的平均使用寿命分别为200,220,210小时,方差分别为30,20,40,则该样本的方差为____________.
附:,其中为每层占比,为每层平均数,为每层标准差,为总体平均数.
题型九:加减数据对平均数、方差的影响
【典例9】.(2024·河南·三模)若一组数据的中位数为16,方差为64,则另一组数据的中位数为__________,方差为__________.
【变式1】.(23-24高一下·重庆·期末)已知,的平均数和方差分别是2, 1,若,则的平均数是___________,的方差是____________.
【变式2】.(23-24高一下·重庆巫山·期末)已知一组样本数据的样本平均数为3,方差为2,由生成一组新的样本数据,则新数据的平均数为______;样本方差为______.
题型十:统计的综合问题
【典例10】.(25-26高一下·安徽阜阳·阶段检测)某校高一年级和高二年级分别有学生3 000名和2 000名,该校为了了解本校高一和高二两个年级的学生在五一假期期间的课外阅读情况,利用简单随机抽样的方法在两个年级分别抽取100名学生,记录每人假期期间每天的平均阅读时间(单位:分钟),得到如图所示的频率分布直方图:
(1)求高一和高二两个年级的100名学生在五一假期期间阅读时间的第80百分位数(保留整数).
(2)两个年级的100名学生在五一假期期间平均每天阅读时间超过一个小时的百分比各是多少?
(3)从众数和平均数两个角度来分析两个年级的阅读情况(每组的值用该组的中点值作代表).
【变式1】.(25-26高一下·宁夏银川·期中)某校高一年级开设有羽毛球训练课,期末对学生进行羽毛球五项指标(正手发高远球、定点高远球、吊球、杀球以及半场计时往返跑)考核,满分100分.参加考核的学生有40人,考核得分的频率分布直方图如图所示.
(1)由频率分布直方图,求出图中的值,并估计考核得分的第60百分位数:
(2)现已知直方图中考核得分在内的平均数为75,方差为6.25,在内的平均数为85,方差为0.5,求得分在内的平均数和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,记两组数据总体的样本平均数为,则总体样本方差)
【变式2】.(25-26高一上·陕西渭南·期末)为了解学生对两家餐厅的满意度情况,现从在两家餐厅都用过餐的学生中随机抽取了50人,每人分别对这两家餐厅的满意度进行打分(分数区间为),将其分数记为满意指数.根据打分结果按分组,得到如图所示的频率分布直方图,其中餐厅的满意指数在内的学生有15人.
(1)求图中的值;
(2)利用样本估计总体的思想,比较两家餐厅满意指数的平均数的大小;
(3)若餐厅满意指数频率分布直方图中第三组满意指数的方差,第四组满意指数的方差,求在餐厅用过餐的第三组与第四组所有学生的满意指数的方差.
(注:本题计算平均数时同一组中的数据用该组区间的中点值作代表)
【专题强化】
1.(25-26高一下·安徽阜阳·阶段检测)下列调查中,最适合采用全面调查(普查)方式的是( )
A.对某市市民知晓“礼让行人”交通新规情况的调查
B.对某品牌手机电池待机时间的调查
C.对某校九年级(1)班学生视力情况的调查
D.对长江水质情况的调查
2.(25-26高一下·安徽阜阳·阶段检测)某学校高一年级共有1 500名学生,从中随机抽取300名学生以了解学生对四大名著的阅读情况,其中只阅读两本名著的有135人,至少阅读三本名著的有96人,请估计该校高一全体1 500名学生中,至多阅读一本名著的人数约为( )
A.350 B.345 C.450 D.485
3.(25-26高一下·安徽阜阳·阶段检测)某校对高一新生进行了数学摸底测试,现利用随机数表从中抽取60名学生进行成绩分析,先将全体900名学生编号为001,002,003,…,900,从中抽取60个样本,并提供了随机数表的第1行到第2行,如下所示.若从该随机数表中第1行第4列开始向右读取数据,则得到的第5个样本的编号为( )
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
A.175 B.866 C.751 D.615
4.(25-26高三下·江西·阶段检测)为了解某校学生的某次数学测试情况,随机抽取部分学生成绩(最低分为50分,满分100分),得到如图所示的频率分布直方图,则下列结论不正确的是( )
A.对应矩形的高度为0.016 B.样本众数估计值为75
C.样本平均数估计值为77.4 D.样本成绩的第70百分位数落在内
5.(25-26高一下·浙江温州·期中)为调查学生的体育达标情况,用简单随机抽样的方法,了解全校2026名学生的体育达标情况,抽取100名学生作为样本,第个()学生的体育达标情况记为变量值,则表示的含义是( )
A.全校学生体育达标的人数
B.样本学生体育达标的人数
C.全校学生体育达标率
D.全校学生体育达标率的估计值
6.(2026·四川资阳·三模)甲、乙两名运动员在一次射击训练中各射靶80次,命中环数的频率分布条形图如下:
设甲、乙命中环数的众数分别为,,方差分别为,,则( )
A., B.,
C., D.,
7.(2026·广东·一模)已知数据的平均数为1,方差为2,则数据的方差为( )
A.4 B.5 C.6 D.7
8.(25-26高一下·贵州遵义·阶段检测)引体向上是中小学体质健康测试男生的项目,主要测试学生上肢力量.在对某高中1000名高一、高二年级男生的引体向上成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名学生中高一年级男生有600人,且抽取的样本中高一男生成绩的平均数和方差分别为5.5和6.74,高二男生成绩的平均数和方差分别为6.5和5.34,则总体方差( )
(附:)
A.6.42 B.6.18 C.5.96 D.5.84
二、多选题
9.(25-26高一下·安徽阜阳·阶段检测)某公司欲对甲、乙、丙、丁四名实习生进行考核,考核规则为对连续五个工作日的工作情况进行打分,若每天的得分均不低于80分(所得分均为整数),则考核合格,否则视为不合格,四人连续五个工作日的得分记录如下.
甲:众数为83,平均数为82.
乙:中位数为82,众数为80.
丙:中位数为85,平均数为82.
丁:有个工作日得分为89,平均数为83,方差为9.2.
甲、乙、丙、丁四人中,考核一定合格的为( )
A.甲 B.乙 C.丙 D.丁
10.(25-26高一下·湖南衡阳·期中)为落实“健康中国”行动,某校关注学生体质健康,随机抽取高一年级100名学生,统计其日均体育锻炼时长(单位:分),将所有数据分成六组后,得到如图所示的频率分布直方图(每组均为左闭右开区间),则( )
A.样本中日均体育锻炼时长在内的学生人数为30
B.样本数据的极差一定小于100
C.样本数据的中位数约为53
D.估计日均体育锻炼时长不低于80分钟的学生人数占总人数的5%
11.(2026·江苏扬州·模拟预测)下列说法中正确的是( )
A.样本的方差,则这组样本数据总和等于60
B.若样本数据标准差为8,则数据的标准差为32
C.数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23
D.若一个样本容量为8的样本的平均数为5,方差为2,现样本中又加入一个新数据5,此时样本容量为9,平均数不变,方差变小
12.(25-26高二下·黑龙江·开学考试)某汽车配件工厂在生产过程中,随机抽取100件同款零件测得其综合指标值,并按,分成六组,得到如下频率分布直方图.规定:综合指标值小于60的为二等品,综合指标值不小于60的为一等品,则下列说法正确的是( )
A.
B.估计该厂所生产的该款零件的综合指标值的平均数为71(同一组数据用该组区间的中点值作代表)
C.估计该厂所生产的该款零件的综合指标值的中位数为78
D.从该厂随机抽取20000件该款零件,则一等品约有15000件
13.(25-26高三上·山东青岛·期末)已知点(,)与点(,)关于点对称,若的平均数为,中位数为,方差为,极差为,则满足( )
A.,,,…,的方差为
B.,,,…,的极差为
C.,,,…,的平均数为
D.,,,…,的中位数为
14.(25-26高一上·江西南昌·期末)学校进行某项测评,满分10分,学生得分均为整数,其中高一年级1班和2班两个班级学生的得分分布条形图如下:
则下列说法正确的有( )
A.1班学生得分的平均分小于2班学生得分的平均分
B.1班学生得分的方差小于2班学生得分的方差
C.1班学生得分的中位数小于2班学生得分的中位数
D.1班学生得分的第80百分位数等于2班学生得分的第80百分位数
三、填空题
15.(25-26高一下·甘肃兰州·期中)某企业8名员工的年收入(单位:万元)分别为5.2,6,6.4,7.5,8,8.3,9,10,则这组数据的第25百分位数为______万元.
16.(25-26高一下·宁夏银川·期中)现从编号为的支水笔中抽取支水笔进行书写长度检测,若从以下随机数表第个数字开始由左向右读取,则抽取的第支水笔的编号为__________.
17.(2026·上海杨浦·模拟预测)设总体由编号为00,01…,59的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为__________.
5044664421 6606580562 6165643502 4235489632 1452415248
2266221586 2663754199 5842367224 5837521851 0337183911
18.(25-26高一下·甘肃武威·阶段检测)某校组织全体学生参加知识竞赛,随机抽取了200名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组的取值区间均为左闭右开),画出频率分布直方图(如图),下列说法正确的是__________.
①在被抽取的学生中,成绩在区间内的学生有80人
②图中的值为0.020
③估计全校学生成绩的中位数为87
④估计全校学生成绩的
19.(2026·江西九江·一模)已知成对样本数据中互不相等,且所有样本点都在曲线上.若的平均值与方差均为5,则的平均值为__________.(其中)
四、解答题
20.(25-26高一下·新疆·阶段检测)2026年5月25日至5月31日将是第四届全国城市生活垃圾分类宣传周,为提高同学们的垃圾分类意识.某中学举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛的成绩情况,从中随机抽取了100名学生的竞赛成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计,将成绩进行整理后,按,,,,分为5组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)在这100名学生中,从这次竞赛成绩在内的学生中采用分层随机抽样的方法抽取27名学生进行调查,求这100名学生这次竞赛成绩在内被抽取的人数.
(3)估计这100名学生这次竞赛成绩的中位数与平均数;
21.(25-26高一下·甘肃酒泉·期中)近日,省足球青训中心建成投用,某校为了解学生对足球的热爱程度,随机抽取名学生对足球的“喜爱度”进行评分,将样本的成绩分成这五组,得到如图所示的频率分布直方图.
(1)估计样本成绩的平均数(同一组中的数据用该组区间的中点值作代表);
(2)求样本成绩的中位数(结果保留两位小数);
(3)已知落在内的平均成绩是分,方差是,落在内的平均成绩是分,方差是,求两组成绩合并后的平均数和方差.
附:设两组数据的样本量、样本平均数和样本方差分别为,记两组数据总体的样本平均数为,则总体的样本方差.
22.(25-26高一上·安徽·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取份作为样本,将样本的成绩(满分分,成绩均不低于分)分成六组:、、、,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)试估计样本成绩的平均数(同一组数据用该组数据的中间值代替)和中位数;
(3)已知落在的平均成绩是,方差是,落在的平均成绩为,方差是,求两组成绩合并后的平均数和方差.
23.(25-26高一上·河南南阳·阶段检测)为了解学生对A,B两家餐厅的满意度情况,现从在A,B两家餐厅都用过餐的学生中随机抽取了50人,每人分别对这两家餐厅的满意度进行打分(分数区间为),将其分数记为满意指数.根据打分结果按分组,得到如图所示的频率分布直方图,其中B餐厅的满意指数在内的学生有15人.
(1)求图中的值;
(2)利用样本估计总体的思想,比较A,B两家餐厅满意指数的平均数的大小;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(3)若B餐厅满意指数频率分布直方图中第三组满意指数的方差为2,第四组满意指数的方差为1,估计在B餐厅用过餐的第三组与第四组所有学生的满意指数的方差.(计算平均数时同一组中的数据用该组区间的中点值作代表)
附:若数据的平均数为,方差为,数据的平均数为,方差为,将这两组数据混合在一起得到一组新数据,设新数据的平均数为,则新数据的方差.
1
学科网(北京)股份有限公司
$
专题强化08:统计
【题型归纳】
· 题型一:简单随机抽样
· 题型二:分层抽样
· 题型三:条形统计图
· 题型四:折线统计图
· 题型五:扇形统计图
· 题型六:频率分布直方图问题
· 题型七:百分数问题
· 题型八:众数 、平均数、中位数与方差
· 题型九:加减数据对平均数、方差的影响
· 题型十:统计的综合问题
【知识梳理】
知识点01:频率分布直方图
作频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的差.
2.决定组距与组数
将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组
4.列频率分布表:各小组的频率=.
5.画频率分布直方图
纵轴表示,实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×=频率.
技巧归纳:
(1)分点的决定方法:若数据为整数,则减去0.5作为分点数;若数据是小数点后一位的数,则减去0.05作为分点数;依次类推.
(2)画频率分布直方图中小矩形的高的方法:①小矩形的高=;②假设频数为1的小矩形的高为h,则频数为k的小矩形的高为kh.
(3)频率分布直方图的性质
①因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
②在频率分布直方图中,各小矩形的面积之和等于1.
③=样本容量.
(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
知识点02:常见统计图表的特点与区别
扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,条形图适用于描述离散型数据,直方图适用于描述连续型数据.折线图主要用于描述数据随时间的变化趋势.
知识点03:百分位数
1.百分位数定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.常用的百分位数
(1)四分位数:第25百分位数,第50百分位数,第75百分位数.
(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.
3.计算一组n个数据的第p百分位数的一般步骤如下:
第1步,按从小到大排列原始数据;
第2步,计算i=n×p%;
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
知识点04:众数、中位数、平均数
名称
概念
平均数
如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=(x1+x2+…+xn).
中位数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)叫做这组数据的中位数.
众数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)叫做这组数据的众数.
知识点05:总体集中趋势的估计
1.平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
2.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
知识点06:频率分布直方图中平均数、中位数、众数的求法
1.样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应相等.
3.将最高小矩形所在的区间中点作为众数的估计值.
知识点07:方差、标准差
13.方差和标准差
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,则这组数据的方差为.
这组数据的标准差为.
14.总体(样本)方差和总体标准差
(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差.
(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差:. 总体标准差:S=.
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称为样本方差,s=为样本标准差.
【题型探究】
题型一:简单随机抽样
【典例1】.(2026·上海金山·二模)为了了解申辉中学所有学生的每天平均体育运动时间,随机调查了该校100名学生,发现他们每天平均体育运动时间为h.这里的总体是( )
A.该校所有学生 B.该校所有学生的每天平均体育运动时间
C.所调查的100名学生 D.所调查的100名学生的每天平均体育运动时间
【答案】B
【详解】根据总体的概念可得,这里的总体是该校所有学生的每天平均体育运动时间.故选项B正确.
【变式1】.(25-26高一上·山东潍坊·期末)某学校举行了“我向航天员提问”的趣味活动,现从同学们提出的问题中初选个不同类型问题进行连续编号(每个编号都由两个数字组成):利用随机数表法从中抽取个问题回答.若从下列随机数表第行第个数字开始,每次从左向右选取两个数字,则选出的第个问题编号为( )
A. B. C. D.
【答案】B
【分析】根据随机数表法的读数规则结合题意求出需选取符合条件的5个数字即可得解.
【详解】由题可知依次选取符合条件的5个数字为:.
所以选出的第个问题编号为11.
故答案为:B
【变式2】.(24-25高二下·上海·阶段检测)从101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中采用随机数表法抽取10个人,那么下列说法正确的是( )
A.这是一种科学的抽样方法
B.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【答案】A
【分析】先说明采用抽签法每个人被剔除概率都相等,都是,不被剔除的概率也相等,都是,即可判断B;然后采用随机数表法,在没被剔除的100人中被抽到概率都是,即可判断C,综合B,C,即可判断D;综和B,C,D即可判断A.
【详解】由于先采用抽签法,从101个人中剔除1个人,
对101个人中的每个人来说被抽到(即被剔除)概率都相等,都是,
不被剔除的概率也相等,都是,故B错误;
然后采用随机数表法,在剩余的100个人中抽取10个人,
如果被抽到,概率为,也是相等的,故C错误;
所以由B,C可知,每个人被剔除的概率都是相等的,都是;
没被剔除,然后被抽到的概率也是相等的,都是,故D错误;
所以综上可知这是一种科学的抽样方法,故A正确.
故选:A
题型二:分层抽样
【典例2】.(24-25高一下·福建福州·期末)某校高一、高二、高三的学生志愿者人数分别为.按学生所在年级进行分层,用分层随机抽样的方法从中抽取5名学生去敬老院献爱心.从这5人中随机抽取2人作为负责人,则2名负责人至少有一名来自高二年级的概率为( )
A. B. C. D.
【答案】D
【分析】先根据分层抽样的定义求出各年级所抽取的人数,然后利用列举法求概率即可.
【详解】由题意可知从高一学生中抽取人,记为,
从高二学生中抽取人,记为,
从高三学生中抽取人,记为,
则从这5人中抽取2人有:,10种情况,
其中至少有一名来自高二年级有,7种情况,
所以所求概率为.
故选:D.
【变式1】.(25-26高一下·湖南衡阳·期中)“一尺一拳一寸间,科学用眼护双眼”,为保护青少年视力,培养科学健康的用眼习惯,某市疾控中心联合教育局开展“青少年视力健康监测与科学用眼宣传”.计划从全市三所高中(A校2400人、B校1800人、C校1200人)的所有学生中,按人数比例采用分层随机抽样的方法抽取270人进行视力检测与用眼习惯问卷调查,则A校应抽取的人数为( )
A.60 B.90 C.120 D.150
【答案】C
【分析】根据分层随机抽样的比例分配原则求解即可.
【详解】因为A校2400人、B校1800人、C校1200人,
所以A校人数在三所高中人数中占比为,
所以按人数比例采用分层随机抽样的方法抽取270人时,A校应抽取的人数为.
【变式2】.(25-26高一上·辽宁辽阳·期末)某中学学生可通过选课平台选择校本课程《能源材料与节能环保》《我们的汉字》《网球运动基础探秘》《软笔书法临习与创作》,若只统计选择其中一门课程的人数,则选择这四门校本课程的人数分别为1200,1600,800,1200.根据所选课程采用按比例分层随机抽样的方法,从这些学生中随机抽取24名学生进行座谈,则应从选择《我们的汉字》的学生中抽取的人数为( )
A.6 B.8 C.12 D.9
【答案】B
【分析】先求出选择《我们的汉字》的学生人数占总人数的比例,然后再求出应从选择《我们的汉字》的学生中抽取的人数.
【详解】根据题意可得选择《我们的汉字》的学生人数占总人数的,
所以应从选择《我们的汉字》的学生中抽取的人数为.
故选:B.
题型三:条形统计图
【典例3】.(2024·江西·二模)下图是我国2018~2023年纯电动汽车销量统计情况,下列说法错误的是( )
A.我国纯电动汽车销量呈现逐年增长趋势
B.这六年销量第60百分位数为536.5万辆
C.这六年增长率最大的为2019年至2020年
D.2020年销量高于这六年销量的平均值
【答案】D
【分析】根据条形图,结合百分位数、平均数求法及各项描述判断正误即可.
【详解】A:由条形图知,我国纯电动汽车销量呈现逐年增长趋势,对;
B:由,故第60百分位数为2021年数据,为536.5万辆,对;
C:由图知:2019年到2020年增长率超过了100%,其它都不超过100%,对;
D:由,错;
故选:D
【变式1】.(23-24高一下·四川内江·期末)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄的分布饼状图、90后从事互联网行业者的岗位分布条形图,则下列结论中不一定正确的是( )
A.互联网行业从事技术岗位的人数中,90后比80后多
B.90后互联网行业者中从事技术岗位的人数超过整个从事互联网行业者总人数的
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业从业人员中90后占一半以上
【答案】A
【分析】利用整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图即可判断各选项的真假.
【详解】选项A;设整个互联网行业总人数为a,
互联网行业中从事技术岗位的90后人数为,小于80后的人数,
但80后中从事技术岗位的人数比例未知,故A错误.
选项B:设整个互联网行业总人数为a,90后从事技术岗位人数为56%×39.6%a,
而90后总人数的20%为,故B正确;
选项C:设整个互联网行业总人数为a,
互联网行业中从事运营岗位的90后人数为,
超过80前的人数6%a,且80前中从事运营岗位的人数比例未知,故C正确;
选项D: 由整个互联网行业从业者年龄分布饼状图得到互联网行业从业人员中90后占,故D正确.
故选:A.
【变式2】.(23-24高一下·安徽阜阳·期末)随着科学技术的不断进步和人们环保意识的提升,全球新能源汽车市场愈发繁荣,近年来,我国在新能源汽车的研发以及产销量上取得了巨大的进步.下图是2016~2022年全球及中国新能源汽车销量情况统计图,则下列说法正确的是( )
A.全球新能源汽车销量数据的极差为456 B.中国新能源汽车销量逐年递增
C.2021年中国新能源汽车销量同比增长最快 D.2022年中国新能源汽车销量占全球销量的比重最大
【答案】C
【分析】根据给定的条形图,逐项分析判断即可.
【详解】对于A,全球新能源汽车销量数据的极差为,A错误;
对于B,2019年中国新能源汽车销量比上一年小,B错误;
对于C,中国新能源汽车销量,2017年比2016年增长,2018年比2017年增长,
2019年比2018年增长,2020年比2019年增长,2021年比2020年增长,
2022年比2021年增长,因此2021年中国新能源汽车销量同比增长最快,C正确;
对于D,2016年中国新能源汽车销量占全球销量的比重超过,2022年不到,D错误.
故选:C
题型四:折线统计图
【典例4】.(25-26高一上·河南南阳·期末)下图是国家统计局发布的2024年10月份至2025年10月份商品零售额与餐饮收入的同比增长速度折线图,下列说法错误的是( )
A.2025年10月份商品零售额同比增长速度为
B.2025年3-10月份商品零售额同比增长速度的极差为
C.2025年前四个月商品零售额与餐饮收入同比增速平均值不相同
D.2025年3-10月份餐饮收入同比增长速度的分位数为
【答案】D
【分析】根据折线图逐一计算判断即可
【详解】对于A,2025年10月份商品零售额同比增长速度为,故A正确;
对于B,2025年3-10月份商品零售额同比增长速度的极差为,故B正确;
对于C,2025年前四个月商品零售额同比增速平均值为,
2025年前四个月商品餐饮收入同比增速平均值为,
故2025年前四个月商品零售额与餐饮收入同比增速平均值不相同,故C正确;
对于D,因为,
所以2025年3-10月份餐饮收入同比增长速度的分位数为,故D错误.
故选:D.
【变式1】.(24-25高一下·贵州六盘水·期末)为了研究我市甲、乙两个旅游景点的游客情况,文旅局统计了今年4月到9月甲、乙两个旅游景点的游客人数(单位:万人),得到如图所示的折线图.根据两个景点的游客人数的折线图,下列说法错误的是( )
A.7,8,9月份的总游客人数甲景点比乙景点少
B.乙景点4月到9月的游客人数总体呈上升趋势
C.甲景点4月到9月游客人数的平均值在内
D.甲、乙两景点4月到9月中游客量的最高峰期都在8月
【答案】D
【详解】对于A,由游客人数折线图可知,甲景点7,8,9月份的总游客人数为,乙景点的7,8,9月份的总游客人数为,,A正确;
对于B,根据乙景点的游客人数折线图可知,乙景点每月的游客人数逐月增多,所以总体呈上升趋势,故B正确;
对于C,甲景点游客人数的平均值为,,C正确;
对于D,由游客人数折线图可知,甲景点4月到9月中游客量的最高峰期在8月,乙景点4月到9月中游客量的最高峰期在9月,D错误.
故选:D.
【变式2】.(24-25高一上·重庆长寿·期末)年月日时至次日时(次日的时间前加表示)重庆的温度走势
下列说法错误的是( )
A.月日时至时重庆气温逐渐升高,时到次日时重庆气温逐渐降低
B.月日时至次日时重庆的最低气温为,最高气温为
C.根据图象,这一天时所对应的温度为
D.根据图象,这一天时所对应的温度为
【答案】C
【分析】根据折线图逐项判断.
【详解】A. 由折线图知:月日时至时重庆气温逐渐升高,时到次日时重庆气温逐渐降低,故正确;
B. 由折线图知:月日时至次日时重庆的最低气温为,最高气温为,故正确;
C.根据图象,这一天时所对应的温度约为,故错误;
D. 根据图象,这一天时所对应的温度为,故正确,
故选:C
题型五:扇形统计图
【典例5】.(23-24高一下·吉林通化·阶段检测)2024年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
【答案】D
【分析】由饼状图可计算出高一年级共90人,高二年级共60人,高三年级共50人,再由高一学生排名分布的频率条形图可计算出各排名段中高一年级学生的人数,由此即可判断出答案.
【详解】由饼状图可知,成绩在前200名的学生中,高一人数比高二人数多,A正确;
成绩在第名的学生中,高一人数为,因此高三最多有32人,B正确;
由条形图知高一学生的成绩在第名的人数为,
而高三的学生成绩在第名的人数最多为人,
故高一学生的成绩在第名的人数一定比高三的学生成绩在第名的人数多,C正确;
成绩在第名的学生中,高一人数为,
高二成绩在第名的人数最多为,
即成绩在第51~100名的学生中,高一的人数一定比高二的人数多,D错误.
故选:D.
【变式1】.(22-23高一下·广东佛山·期末)某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中一定错误的是( )
A.丁险种参保人数超过五成 B.41岁以上参保人数超过总参保人数的五成
C.18-29周岁人群参保的总费用最少 D.人均参保费用不超过5000元
【答案】B
【分析】利用统计图表一一分析选项即可.
【详解】对于A,由条形图可知丁险种参保比例为,
超过五成,故A正确;
对于B,由扇形图可知,41岁以上参保人数占比:,故B错误;
对于C,由扇形图与折线图可知18-29周岁人群参保人数占比,
人均参保费用在,而54岁及以上人群参保比例虽,
但人均参保费用在6000,所以18-29周岁人群参保的总费用最少,故C正确;
对于D,由扇形图与折线图可知,人均参保费用约
,
不超过5000元,故D正确.
故选:B
【变式2】.(23-24高一下·福建泉州·期中)某学校组建了合唱、朗诵、脱口秀、舞蹈、太极拳五个社团,该校共有2000名同学,每名同学依据自己的兴越爱好最多可参加其中一个,各个社团的人数比例的扇形图如图所示,其中参加朗诵社团的同学有8名,参加太极拳社团的有12名,则( )
A.这五个社团的总人数为100
B.脱口秀社团的人数占五个社团总人数的
C.这五个社团总人数占该校学生人数的
D.脱口秀社团在扇形统计图中所占圆心角的度数为
【答案】B
【分析】根据扇形图及有关数据得各个社团比例,计算人数判断各选项即可.
【详解】这五个社团的总人数为,,故A错误,C错误.
因为太极拳社团人数的占比为,
所以脱口秀社团人数的占比为,
所以脱口秀团在扇形统计图中所占圆心角的度数为,
故B正确,D错误.
故选:B
题型六:频率分布直方图问题
【典例6】.(25-26高一下·贵州遵义·期中)某城市交通部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的运行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照分成5组,制成如图所示的频率分布直方图.
(1)求图中的值;
(2)求这组数据的平均数与方差;
(3)已知满意度评分值在内的男性人数与女性人数的比为.若在满意度评分值为的人中随机抽取2人进行座谈,求恰有1名女性的概率.
【答案】(1)
(2)77;106
(3)
【分析】(1)根据频率分布直方图求各组频率,结合频率和为1运算求解;
(2)用每组区间的中点值为代表,结合平均数和方差公式运算求解;
(3)分析可知男生3人,女生2人,利用枚举法结合古典概型运算求解.
【详解】(1)由频率分布直方图可知各组频率依次为,
由,解得.
(2)用每组区间的中点值为代表,
则平均数,
方差.
(3)在的人数有人,其中男生3人,女生2人,
记三个男生分别为,两个女生分别为,
则从5人中随机抽取2人进行座谈所有样本点:
,,共10个;
恰有1名女生的样本点:,共6个;
所以从5人中随机抽取2人进行座谈恰有1名女生的概率为.
【变式1】.(25-26高一上·江西抚州·期末)某学校组织全校学生进行了一次“两会知识知多少”的问卷测试,已知所有学生的测试成绩均位于区间,从中随机抽取了200名学生的测试成绩,绘制得到如图所示的频率分布直方图.
(1)求图中的值,并估算这200名学生的测试成绩的中位数和平均数;(同一组中的数据用该组区间的中点值作代表).
(2)若样本数据在的平均成绩,方差,在的平均成绩,方差,求在的平均成绩和方差;(方差精确到).
(3)现学校准备利用按比例的分层随机抽样方法,从和的学生中抽取7人组成两会知识宣讲团.从选定的7人中随机抽取2人对高一同学进行宣讲,设事件为“至多有1人测试成绩位于区间”,求事件发生的概率.
【答案】(1),中位数,平均数 (2)88;46.57 (3)
【详解】(1)根据题意可得,
解得,
由的频率为:,
由的频率为:,
由的频率为:,
因为,,
所以中位数在内,设中位数为,
所以,解得,
平均数
.
(2)因为的人数为,
的人数为,
所以在平均成绩为,
在的成绩的方差为:
.
(3)因为和这两组的频率之比为,
所以在中抽5人,在中抽2人,
设从学生中抽取的5人为,
从学生中抽取的2人为,则这个试验的样本空间为:
,
故,
又因为,
则,
所以事件的概率为.
【变式2】.(25-26高一上·河北保定·期末)2024年10月13日,成都市将举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.成都市文体广电旅游局承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求的值;
(2)估计这100名候选者面试成绩的平均数和第80百分位数;
(3)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和50,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.
【答案】(1)
(2)平均数为69.5,第80百分位数为77.5.
(3).
【分析】(1)根据频率分布直方图中所有小矩形面积之和为得到方程,解得即可;
(2)根据平均数、百分位数的定义计算可得;
(3)根据根据分层抽样的方差公式计算可得.
【详解】(1)由图得,解得;
(2)根据题意知,
因为,,
设第百分位数为,所以,,
解得,
故这100名候选者面试成绩的平均数为,第80百分位数为.
(3)设第二组、第四组所有面试者的面试成绩的平均数、方差分别为
,,,,且两组的频率之比为,
则第二组和第四组所有面试者的面试成绩的平均数为,
第二组和第四组所有面试者的面试成绩的方差为
,
则第二组和第四组所有面试者的面试成绩的方差为.
题型七:百分数问题
【典例7】.(24-25高一下·天津和平·期末)某人工智能公司为优化新开发的机器人模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,则图中____,根据直方图可知满意度计分的第三四分位数约为______.
【答案】 0.03 85
【分析】根据频率分布直方图的面积和为1可得,确定第三四分位数所在的区间,根据概念计算即可.
【详解】由频率分布直方图可得,可得;
前三组的频率之和为,
前四组的频率之和为,所以满意度计分的第三四分位数,
所以,即满意度计分的第三四分位数约为85.
故答案为:0.03;85.
【变式1】.(25-26高三上·上海长宁·期中)某运动员在某次男子气手枪射击比赛中12次的比赛得分数据单位:环为:,,,,,,,,,,,,则这组数据的第30百分位数为______ .
【答案】
【分析】先对数据从小到大排序,再结合百分位数的定义,即可求解.
【详解】数据从小到大排序,,,,,,,,,,,,,共12个,
,故这组数据的第30百分位数为
故答案为:
【变式2】.(24-25高一下·河北邢台·阶段检测)心理健康指数是通过科学方法量化评估个体或群体心理状态的指标.某机构研究人员为了解某社区居民的心理健康情况,随机从该社区抽取20名居民进行调查,得到他们的心理健康指数分别为7.2,7.3,7.5,7.8,7.9,8.0,8.5,8.5,8.6,8.6,8.7,8.7,9.1,9.1,9.3,9.4,9.5,9.7,10.0,10.0,则这组数据的第60百分位数是_________.
【答案】8.9
【分析】根据百分位数定义计算求解.
【详解】因为,所以这组数据的第60百分位数为.
故答案为:
题型八:众数 、平均数、中位数与方差
【典例8】.(25-26高一上·辽宁·期末)在了解高一年级学生每月在校图书馆平均借阅了多少本文学书籍时,甲同学在物理组合班抽取了一个容量为的样本并算得样本的平均数为5,方差为8.乙同学在历史组合班抽取了一个容量为的样本,并算得样本的平均数为8,方差为.已知甲乙两同学抽取的样本合在一起,组成一个容量为的样本,那么合在一起后的样本平均数为__________,样本方差为__________.
【答案】 6
【分析】运用合并平均数公式和合并方差公式计算求解.
【详解】设甲同学的样本量为,平均数为,方差为,乙同学的样本量为,平均数为,方差为,
则,
合并后样本量为:,
合并后样本平均数为:,
甲同学的样本平方和为:,
乙同学的样本平方和为:,
合并后总平方和:,
合并后样本方差为:.
故答案为:.
【变式1】.(24-25高一下·黑龙江绥化·期末)有5人进行定点投篮游戏,每人投篮12次.这5人投中的次数形成一组数据,中位数为10,唯一众数为11,极差为3,则该组数据的第40百分位数是_________.
【答案】9.5
【分析】根据统计量计算中中位数、众位数、极差以及百分数的概念,结合多个条件构造符合条件的数据组求解.
【详解】设这5个数据从小到大为:
已知中位数为第三个数,故;
唯一众数为11,故d,e至少含11,且11出现次数至少2次,故;
极差为3,即;
若,则10和11均出现2次,众数不唯一;若,则8和11均出现2次,众数不唯一. 因此,.
综上,数据为:8,9,10,11,11.
根据百分位数公式:设数据个数为n,第百分位数的位置.
已知,,故.
当i为整数时,第百分位数位第项与第项的平均值,即
故答案为:9.5.
【变式2】.(24-25高一下·河北邯郸·期末)某工厂的三个车间生产同一种产品,产量占比分别为.现在用分层随机抽样方法按比例分配从这三个车间生产的该产品中,共抽取70件做使用寿命的测试,则车间应抽取___________件;若三个车间产品的平均使用寿命分别为200,220,210小时,方差分别为30,20,40,则该样本的方差为____________.
附:,其中为每层占比,为每层平均数,为每层标准差,为总体平均数.
【答案】
【分析】空:根据分层抽样按比例抽取即可得到车间应抽取的件数;空:由分层抽样的方差公式即可求解.
【详解】空:由分层抽样方法可得:抽取车间应抽取的件数为:;
空:样本的总体平均数为:,
样本的总体方差为:.
故答案为:;.
题型九:加减数据对平均数、方差的影响
【典例9】.(2024·河南·三模)若一组数据的中位数为16,方差为64,则另一组数据的中位数为__________,方差为__________.
【答案】
【分析】根据中位数和方差的关系求值.
【详解】因为数据的中位数为16,方差为64,
所以数据的中位数为4,方差为,
所以数据的中位数为,方差为4.
故答案为:3;4.
【变式1】.(23-24高一下·重庆·期末)已知,的平均数和方差分别是2, 1,若,则的平均数是___________,的方差是____________.
【答案】 3 /
【分析】代入平均数和方差公式,计算的平均数和方差,再利用性质求解.
【详解】的平均数是,
的方差,
即,
,即,
所以的方差,
,
所以的方差是.
故答案为:3;
【变式2】.(23-24高一下·重庆巫山·期末)已知一组样本数据的样本平均数为3,方差为2,由生成一组新的样本数据,则新数据的平均数为______;样本方差为______.
【答案】 7; 8.
【分析】由期望、方差性质直接计算即可.
【详解】因为数据的样本平均数为3,方差为2,
所以数据的样本平均数为,方差为.
故答案为:7;8
题型十:统计的综合问题
【典例10】.(25-26高一下·安徽阜阳·阶段检测)某校高一年级和高二年级分别有学生3 000名和2 000名,该校为了了解本校高一和高二两个年级的学生在五一假期期间的课外阅读情况,利用简单随机抽样的方法在两个年级分别抽取100名学生,记录每人假期期间每天的平均阅读时间(单位:分钟),得到如图所示的频率分布直方图:
(1)求高一和高二两个年级的100名学生在五一假期期间阅读时间的第80百分位数(保留整数).
(2)两个年级的100名学生在五一假期期间平均每天阅读时间超过一个小时的百分比各是多少?
(3)从众数和平均数两个角度来分析两个年级的阅读情况(每组的值用该组的中点值作代表).
【答案】(1)82,77
(2),
(3)答案见解析
【详解】(1)由题可知,,
所以.
设高一年级100名学生在五一假期期间阅读时间的第80百分位数为m,则,解得.
设高二年级100名学生在五一假期期间阅读时间的第80百分位数为n,
则,解得.
(2)高一年级100名学生在五一假期期间,阅读时间超过一个小时的百分比为,
高二年级100名学生在五一假期期间,阅读时间超过一个小时的百分比为.
(3)由频率分布直方图可知,高一年级100名学生在五一假期期间阅读时间的众数为75,
平均数为.
高二年级100名学生在五一假期期间阅读时间的众数为65,
平均数为.
由此可以看出,无论从阅读时间的众数来讲,还是从阅读的平均时间来看,高一年级都明显高于高二年级,所以高一学生的阅读情况要好于高二学生的阅读情况,这可能与高二的学业加重有关.
【变式1】.(25-26高一下·宁夏银川·期中)某校高一年级开设有羽毛球训练课,期末对学生进行羽毛球五项指标(正手发高远球、定点高远球、吊球、杀球以及半场计时往返跑)考核,满分100分.参加考核的学生有40人,考核得分的频率分布直方图如图所示.
(1)由频率分布直方图,求出图中的值,并估计考核得分的第60百分位数:
(2)现已知直方图中考核得分在内的平均数为75,方差为6.25,在内的平均数为85,方差为0.5,求得分在内的平均数和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,记两组数据总体的样本平均数为,则总体样本方差)
【答案】(1),85;
(2)得分在内的平均数为81,方差为26.8.
【分析】(1)首先根据频率和为1求出,再根据百分位数公式即可得到答案;
(2)计算出相关区间内的数据,代入分层抽样的方差公式计算即可.
【详解】(1)由题意得:,解得,
设第60百分位数为,则,
解得,第60百分位数为85.
(2)由题意知,落在区间内的数据有个,
落在区间内的数据有个.
由题意,,则.
根据方差的定义,
故得分在内的平均数为81,方差为26.8.
【变式2】.(25-26高一上·陕西渭南·期末)为了解学生对两家餐厅的满意度情况,现从在两家餐厅都用过餐的学生中随机抽取了50人,每人分别对这两家餐厅的满意度进行打分(分数区间为),将其分数记为满意指数.根据打分结果按分组,得到如图所示的频率分布直方图,其中餐厅的满意指数在内的学生有15人.
(1)求图中的值;
(2)利用样本估计总体的思想,比较两家餐厅满意指数的平均数的大小;
(3)若餐厅满意指数频率分布直方图中第三组满意指数的方差,第四组满意指数的方差,求在餐厅用过餐的第三组与第四组所有学生的满意指数的方差.
(注:本题计算平均数时同一组中的数据用该组区间的中点值作代表)
【答案】(1)
(2)
(3)
【分析】(1)根据频率分布直方图的频率和为1的性质,结合已知参数值求解;
(2)利用组中点值与对应频率的乘积和,计算两个餐厅满意指数的平均数,并比较大小;
(3)先确定两组数据的人数,再根据混合数据的平均数和方差公式分步计算.
【详解】(1)餐厅样本容量为50,区间频数为15,对应频率为,
频率分布直方图组距为2,故.
所有区间频率和为,
即,解得,
所以.
(2)餐厅满意指数平均数;
餐厅满意指数平均数.
因为,所以餐厅满意指数的平均数大于餐厅满意指数的平均数.
(3)餐厅第三组频率为0.4,人数为,平均数7,方差2;
第四组人数为,平均数9,方差1,
混合数据平均数,
方差
.
【专题强化】
1.(25-26高一下·安徽阜阳·阶段检测)下列调查中,最适合采用全面调查(普查)方式的是( )
A.对某市市民知晓“礼让行人”交通新规情况的调查
B.对某品牌手机电池待机时间的调查
C.对某校九年级(1)班学生视力情况的调查
D.对长江水质情况的调查
【答案】C
【分析】根据全面调查(普查)适合调查范围小、易实施、无破坏性的调查的特点,逐一分析四个选项的调查场景.
【详解】对于A:对某市市民知晓“礼让行人”交通新规情况的调查,人数众多,适合抽样调查;
对于B:对某品牌手机电池待机时间的调查,具有破坏性,适合抽样调查;
对于C:对某校九年级(1)班学生的视力情况的调查,人数较少,适合全面调查;
对于D:对长江水质情况的调查,范围广,适合抽样调查.
2.(25-26高一下·安徽阜阳·阶段检测)某学校高一年级共有1 500名学生,从中随机抽取300名学生以了解学生对四大名著的阅读情况,其中只阅读两本名著的有135人,至少阅读三本名著的有96人,请估计该校高一全体1 500名学生中,至多阅读一本名著的人数约为( )
A.350 B.345 C.450 D.485
【答案】B
【分析】先计算抽取的300名样本中至多阅读一本名著的人数,算出样本中该情况的频率,进而即得.
【详解】在这300人中,至多阅读一本名著的人数为(人),
则高一全体名学生中,至多阅读一本名著的人数约为.
3.(25-26高一下·安徽阜阳·阶段检测)某校对高一新生进行了数学摸底测试,现利用随机数表从中抽取60名学生进行成绩分析,先将全体900名学生编号为001,002,003,…,900,从中抽取60个样本,并提供了随机数表的第1行到第2行,如下所示.若从该随机数表中第1行第4列开始向右读取数据,则得到的第5个样本的编号为( )
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
A.175 B.866 C.751 D.615
【答案】A
【详解】从随机数表中第1行第4列开始向右读取数据,前5个数据依次是260,004,012,866,175,所以得到的第5个样本的编号为175.
4.(25-26高三下·江西·阶段检测)为了解某校学生的某次数学测试情况,随机抽取部分学生成绩(最低分为50分,满分100分),得到如图所示的频率分布直方图,则下列结论不正确的是( )
A.对应矩形的高度为0.016 B.样本众数估计值为75
C.样本平均数估计值为77.4 D.样本成绩的第70百分位数落在内
【答案】D
【分析】A选项利用矩形的面积之和为1列方程求解,B选项根据众数的定义以及直方图中最高的矩形条来判断,C选项根据平均值的公式计算,D选项判断样本数据在的频率和的频率,可得到70百分位数的范围.
【详解】设对应矩形的高度为,则,解得,A选项正确;
由图可知,的数据最多,众数的估计值为,B选项正确;
平均值为:,C选项正确;
样本数据的频率为,
样本数据的频率为,
故样本成绩的第70百分位数落在内,所以D选项错误.
5.(25-26高一下·浙江温州·期中)为调查学生的体育达标情况,用简单随机抽样的方法,了解全校2026名学生的体育达标情况,抽取100名学生作为样本,第个()学生的体育达标情况记为变量值,则表示的含义是( )
A.全校学生体育达标的人数
B.样本学生体育达标的人数
C.全校学生体育达标率
D.全校学生体育达标率的估计值
【答案】D
【详解】由题意知,表示抽取的100名学生中,达标的人数之和,
则表示这100名学生中体育达标的频率,即为全校学生体育达标率的估计值.
6.(2026·四川资阳·三模)甲、乙两名运动员在一次射击训练中各射靶80次,命中环数的频率分布条形图如下:
设甲、乙命中环数的众数分别为,,方差分别为,,则( )
A., B.,
C., D.,
【答案】A
【分析】观察给定的图表,利用众数的意义和方差的概念来判断运动员命中环数的集中与分散程度即可.
【详解】根据图表知,甲、乙命中环数的众数均为7环,则;
甲运动员命中的环数比较分散,乙运动员命中的环数比较集中,则.
7.(2026·广东·一模)已知数据的平均数为1,方差为2,则数据的方差为( )
A.4 B.5 C.6 D.7
【答案】B
【详解】因的平均数为1,方差为2,则,
于是数据的平均数为,
又,则,
于是数据的方差为:
.
8.(25-26高一下·贵州遵义·阶段检测)引体向上是中小学体质健康测试男生的项目,主要测试学生上肢力量.在对某高中1000名高一、高二年级男生的引体向上成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名学生中高一年级男生有600人,且抽取的样本中高一男生成绩的平均数和方差分别为5.5和6.74,高二男生成绩的平均数和方差分别为6.5和5.34,则总体方差( )
(附:)
A.6.42 B.6.18 C.5.96 D.5.84
【答案】A
【详解】依题意,在分层随机抽样的方法所抽取的100人中,高一男生有人,高二男生有40人,
记高一男生成绩的平均数和方差分别为和;
高二男生成绩的平均数和方差分别为和,
则样本平均数为,
样本总体方差 .
二、多选题
9.(25-26高一下·安徽阜阳·阶段检测)某公司欲对甲、乙、丙、丁四名实习生进行考核,考核规则为对连续五个工作日的工作情况进行打分,若每天的得分均不低于80分(所得分均为整数),则考核合格,否则视为不合格,四人连续五个工作日的得分记录如下.
甲:众数为83,平均数为82.
乙:中位数为82,众数为80.
丙:中位数为85,平均数为82.
丁:有个工作日得分为89,平均数为83,方差为9.2.
甲、乙、丙、丁四人中,考核一定合格的为( )
A.甲 B.乙 C.丙 D.丁
【答案】BD
【分析】分别结合甲、乙、丙、丁四人已知的众数、中位数、平均数、方差的统计性质,逐一验证是否存在得分低于分的可能性,由此判断哪名实习生一定满足五天得分均不低于分的合格要求.
【详解】对于A:若甲有四个工作日的得分为,则剩余的那个工作日的得分为,
故甲的考核不一定合格,A错误;
对于B:将得分排序后,第三个为,且至少有两个,这两个必然是最小的两个数,
因此所有得分均不低于,故乙的考核一定合格,B正确;
对于C:丙的中位数为,平均数为,其得分可以为,
故丙的考核不一定合格,C错误;
对于D,由于丁有一个工作日的得分为,且平均数为,
若有一个工作日的得分为,由,
可知其方差必超过了,所以丁连续五个工作日的得分均不低于,
故丁的考核一定合格,D正确.
10.(25-26高一下·湖南衡阳·期中)为落实“健康中国”行动,某校关注学生体质健康,随机抽取高一年级100名学生,统计其日均体育锻炼时长(单位:分),将所有数据分成六组后,得到如图所示的频率分布直方图(每组均为左闭右开区间),则( )
A.样本中日均体育锻炼时长在内的学生人数为30
B.样本数据的极差一定小于100
C.样本数据的中位数约为53
D.估计日均体育锻炼时长不低于80分钟的学生人数占总人数的5%
【答案】AC
【分析】由频率分布直方图依次分析各选项可得结果.
【详解】样本中日均体育锻炼时长在内的学生人数为(人),故A正确;
样本数据的分布在之间,且组距为20,所以极差不一定小于100,故B错误;
,(分),所以样本数据的中位数约为53,故C正确;
日均体育锻炼时长不低于80分钟的学生人数为(人),,
所以估计日均体育锻炼时长不低于80分钟的学生人数占总人数的10%,故D错误.
11.(2026·江苏扬州·模拟预测)下列说法中正确的是( )
A.样本的方差,则这组样本数据总和等于60
B.若样本数据标准差为8,则数据的标准差为32
C.数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23
D.若一个样本容量为8的样本的平均数为5,方差为2,现样本中又加入一个新数据5,此时样本容量为9,平均数不变,方差变小
【答案】AD
【分析】对于A,根据方差公式求得样本容量,样本平均数即可判断;对于B,根据方差与标准差,方差的公式求解判断;对于C,先将数据从小到大排序,再求解判断;对于D,结合样本方差与平均值的公式计算即可.
【详解】对于A,由样本的方差得样本容量,样本平均数,所以样本数据总和为,故正确;
对于B,样本数据标准差为8,故样本数据的方差为64,
所以数据的方差为,标准差为,故错误;
对于C,将数据从小到大排序后得12,13,14,15,17,19,23,24,27,30,共10个数,
所以,所以该组数据的第70百分位数是,故错误;
对于D,一个样本容量为8的样本的平均数为5,方差为2,
不妨记原始数据为,则 ,,即,
现样本中又加入一个新数据5,此时样本平均值为,
样本方差为,
所以加入一个新数据5,平均数不变,方差变小,故正确.
12.(25-26高二下·黑龙江·开学考试)某汽车配件工厂在生产过程中,随机抽取100件同款零件测得其综合指标值,并按,分成六组,得到如下频率分布直方图.规定:综合指标值小于60的为二等品,综合指标值不小于60的为一等品,则下列说法正确的是( )
A.
B.估计该厂所生产的该款零件的综合指标值的平均数为71(同一组数据用该组区间的中点值作代表)
C.估计该厂所生产的该款零件的综合指标值的中位数为78
D.从该厂随机抽取20000件该款零件,则一等品约有15000件
【答案】ABD
【分析】由频率分布直方图面积和为1,可判断A,由平均数计算公式可判断B,由中位数计算方法可判断C,由频率分布直方图确定频率,即可判断D.
【详解】由,得,A正确;
平均数为,
所以可以估计该厂所生产的该款零件的综合指标值的平均数为71,B正确;
因为,
所以中位数在第4组,
设中位数为,则,
解得,所以可以估计该厂所生产的该款零件的综合指标值的中位数为73.33,C错误;
由频率分布直方图可知100件零件中二等品有件,一等品有件,
故从该厂随机抽取20000件该款零件,则一等品约有件,D正确.
故选:ABD.
13.(25-26高三上·山东青岛·期末)已知点(,)与点(,)关于点对称,若的平均数为,中位数为,方差为,极差为,则满足( )
A.,,,…,的方差为
B.,,,…,的极差为
C.,,,…,的平均数为
D.,,,…,的中位数为
【答案】BC
【分析】根据平均数、极差、方差、中位数的二级结论判断.
【详解】由题意得,,则,
若的平均数为,中位数为,方差为,极差为,
则的平均数为,中位数为,方差为,极差为,
故,,,…,的方差为,极差为,故A错误,B正确;
,,,…,的平均数为,中位数为,故C正确,D错误.
故选:BC
14.(25-26高一上·江西南昌·期末)学校进行某项测评,满分10分,学生得分均为整数,其中高一年级1班和2班两个班级学生的得分分布条形图如下:
则下列说法正确的有( )
A.1班学生得分的平均分小于2班学生得分的平均分
B.1班学生得分的方差小于2班学生得分的方差
C.1班学生得分的中位数小于2班学生得分的中位数
D.1班学生得分的第80百分位数等于2班学生得分的第80百分位数
【答案】AC
【分析】先从条形图中提取1班和2班各分数的人数,再分别计算平均分、方差、中位数和第80百分位数,逐一判断选项.
【详解】从条形图中提取数据:
1班:5分4人,6分18人,7分10人,8分8人,9分6人,10分4人,总人数 人.
2班:5分0人,6分8人,7分12人,8分18人,9分8人,10分4人,总人数 人.
1班平均分:
2班平均分:
显然 ,A选项正确.
1班方差:
2班方差:
,故B错误.
1班:50人,故第25、26人均为7分,中位数为7;2班:故第25、26人均为8分,中位数为8.,故C正确.
1班:,第40人得分8分、第41人得分9分,故第80百分位数为.
2班:,第40、41人均为9分,第80百分位数为9.
,故D错误.
故选:AC
三、填空题
15.(25-26高一下·甘肃兰州·期中)某企业8名员工的年收入(单位:万元)分别为5.2,6,6.4,7.5,8,8.3,9,10,则这组数据的第25百分位数为______万元.
【答案】6.2
【详解】因为,所以这组数据的第25百分位数为万元.
16.(25-26高一下·宁夏银川·期中)现从编号为的支水笔中抽取支水笔进行书写长度检测,若从以下随机数表第个数字开始由左向右读取,则抽取的第支水笔的编号为__________.
【答案】
【分析】先确定起始位置,再从起始位置开始,按顺序每次读取两位数字,作为候选编号,最后按顺序筛选出的第个有效编号即可.
【详解】随机数表法
先从随机数表第个数字开始读取:
随机数表:
第个数字是(来自第一组 ),从左向右依次读取两位数字,并筛选出在范围内且不重复的编号:
第个: → 有效,对应编号 第个: → 无效(),跳过
第个: → 有效,对应编号 第个: → 无效(),跳过
第个: → 无效(),跳过 第个: → 有效,对应编号
所以,抽取的第支水笔的编号为.
17.(2026·上海杨浦·模拟预测)设总体由编号为00,01…,59的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为__________.
5044664421 6606580562 6165643502 4235489632 1452415248
2266221586 2663754199 5842367224 5837521851 0337183911
【答案】43
【详解】从该随机数表第1行的第6个数字6开始,由左到右依次选取两个数字,
读取的数字对依次为:64(大于59,舍去),42(选取,第1个),16(选取,第2个),
60(大于59,舍去),65(大于59,舍去),80(大于59,舍去),56(选取,第3个),
26(选取,第4个),16(重复,舍去),56(重复,舍去),43(选取,第5个),
故选出来的第5个个体的编号为43.
18.(25-26高一下·甘肃武威·阶段检测)某校组织全体学生参加知识竞赛,随机抽取了200名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组的取值区间均为左闭右开),画出频率分布直方图(如图),下列说法正确的是__________.
①在被抽取的学生中,成绩在区间内的学生有80人
②图中的值为0.020
③估计全校学生成绩的中位数为87
④估计全校学生成绩的
【答案】①③④
【分析】根据总人数乘以该频率可得到对应学生人数,计算判断①;结合频率分布直方图中所有矩形面积和为1,列出关于的方程,求解判断②;根据中位数是把频率分布直方图分成左右面积相等的点,找到中位数所在区间,再利用中位数计算公式求解,判断③;计算各区间累计频率,找到所在区间,再用百分位数公式求解,判断④.
【详解】频率分布直方图中,所有组的频率和为1,组距为10,
因此,
解得,故②错误;
成绩在的频率为,总抽取人数为200,
因此该区间人数为人,故①正确;
成绩分的频率:,
成绩分的累计频率:,
因此中位数在内,中位数为:,
估计全校中位数为87合理,故③正确;
累计频率到90分为,累计频率到100分为,
因此80百分位数在内:,④正确.
19.(2026·江西九江·一模)已知成对样本数据中互不相等,且所有样本点都在曲线上.若的平均值与方差均为5,则的平均值为__________.(其中)
【答案】
【分析】先根据已知条件求出与的值,再结合求出即可得解.
【详解】因为的平均值为5,即,所以,
因为的方差为5,即,解得.
因为所有样本点都在曲线上,
所以,
所以,
所以的平均值为,
故答案为:.
四、解答题
20.(25-26高一下·新疆·阶段检测)2026年5月25日至5月31日将是第四届全国城市生活垃圾分类宣传周,为提高同学们的垃圾分类意识.某中学举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛的成绩情况,从中随机抽取了100名学生的竞赛成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计,将成绩进行整理后,按,,,,分为5组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)在这100名学生中,从这次竞赛成绩在内的学生中采用分层随机抽样的方法抽取27名学生进行调查,求这100名学生这次竞赛成绩在内被抽取的人数.
(3)估计这100名学生这次竞赛成绩的中位数与平均数;
【答案】(1)
(2)
(3)中位数为,平均数为
【分析】(1)利用频率分布直方图中各小长方形面积之和等于1求出;
(2)先求出成绩在内、内的人数,再按分层随机抽样的比例求解;
(3)用各组的组中值分别乘对应人数,再除以总人数,求得平均数,利用面积和为可得中位数.
【详解】(1)由频率分布直方图可知,各组的组距都是,
各组对应的小长方形面积之和等于总频率1,所以,
化简得,即,即,即,
所以图中.
(2)由(1)知,
因此各组的频率分别为,
,
对应这名学生各组的人数分别为,
成绩在内的人数为,
成绩在内的人数为,
所以成绩在内的总人数为,
现从这45人中采用分层随机抽样的方法抽取27人,
则成绩在内被抽取的人数为,
所以这名学生这次竞赛成绩在内被抽取的人数为6.
(3)由(2)知,各组的人数分别为,
各组的组中值分别为,
则,
所以估计这名学生这次竞赛成绩的平均数为分.
由可得中位数位于中间,设为,
则.
21.(25-26高一下·甘肃酒泉·期中)近日,省足球青训中心建成投用,某校为了解学生对足球的热爱程度,随机抽取名学生对足球的“喜爱度”进行评分,将样本的成绩分成这五组,得到如图所示的频率分布直方图.
(1)估计样本成绩的平均数(同一组中的数据用该组区间的中点值作代表);
(2)求样本成绩的中位数(结果保留两位小数);
(3)已知落在内的平均成绩是分,方差是,落在内的平均成绩是分,方差是,求两组成绩合并后的平均数和方差.
附:设两组数据的样本量、样本平均数和样本方差分别为,记两组数据总体的样本平均数为,则总体的样本方差.
【答案】(1)
(2)分
(3)平均数,方差
【分析】(1)根据频率分布直方图中平均数的计算公式求解即得;
(2)先确定中位数所在的区间,然后根据频率分布直方图中中位数的求法,即可得答案;
(3)根据条件,分别求出两组数据的样本容量,平均数和方差,代入公式,整理计算,即可得答案.
【详解】(1)由频率分布直方图得,样本成绩的平均数为.
(2)设中位数为.由,,所以,
所以,解得,
所以样本成绩的中位数为分.
(3)第一组的样本容量,
第二组的样本容量,
所以合并后的平均数,
合并后的方差.
22.(25-26高一上·安徽·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取份作为样本,将样本的成绩(满分分,成绩均不低于分)分成六组:、、、,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)试估计样本成绩的平均数(同一组数据用该组数据的中间值代替)和中位数;
(3)已知落在的平均成绩是,方差是,落在的平均成绩为,方差是,求两组成绩合并后的平均数和方差.
【答案】(1)
(2)平均数为,中位数为
(3),
【分析】(1)利用频率分布直方图中所有直方图的面积之和为可求出的值;
(2)将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全部相加可得样本的平均数;设中位数为,根据中位数的定义可得出关于的等式,即可解出的值;
(3)利用总体的平均数和方差公式可求得和的值.
【详解】(1)由题意得,解得.
(2)平均数为
设中位数为,
因为成绩落在内的频率为,
落在内的频率为,
所以,则,解得,故中位数为75.
(3)由题意得,成绩在有人,成绩在有人,
则这两组成绩的总平均数为,
总方差为.
23.(25-26高一上·河南南阳·阶段检测)为了解学生对A,B两家餐厅的满意度情况,现从在A,B两家餐厅都用过餐的学生中随机抽取了50人,每人分别对这两家餐厅的满意度进行打分(分数区间为),将其分数记为满意指数.根据打分结果按分组,得到如图所示的频率分布直方图,其中B餐厅的满意指数在内的学生有15人.
(1)求图中的值;
(2)利用样本估计总体的思想,比较A,B两家餐厅满意指数的平均数的大小;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(3)若B餐厅满意指数频率分布直方图中第三组满意指数的方差为2,第四组满意指数的方差为1,估计在B餐厅用过餐的第三组与第四组所有学生的满意指数的方差.(计算平均数时同一组中的数据用该组区间的中点值作代表)
附:若数据的平均数为,方差为,数据的平均数为,方差为,将这两组数据混合在一起得到一组新数据,设新数据的平均数为,则新数据的方差.
【答案】(1),;
(2)餐厅满意指数的平均数大于餐厅满意指数的平均数
(3)
【详解】(1)B餐厅样本容量为50,区间频数为15,对应频率为.
频率分布直方图组距为2,故
所有区间频率和为,即,解得.
(2)餐厅满意指数平均数.
餐厅满意指数平均数.
故.
(3)B餐厅第三组频率为,人数为,平均数7,方差2;
第四组人数为,平均数9,方差1.
混合数据平均数.
方差.
1
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。