专题03 数据分析初步(暑假复习讲义)新九年级数学新教材浙教版
2026-06-10
|
2份
|
48页
|
161人阅读
|
2人下载
精品
资源信息
| 学段 | 初中 |
| 学科 | 数学 |
| 教材版本 | 初中数学浙教版八年级下册 |
| 年级 | 九年级 |
| 章节 | 小结与反思 |
| 类型 | 教案-讲义 |
| 知识点 | 数据分析 |
| 使用场景 | 寒暑假-暑假 |
| 学年 | 2026-2027 |
| 地区(省份) | 浙江省 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 7.32 MB |
| 发布时间 | 2026-06-10 |
| 更新时间 | 2026-06-10 |
| 作者 | 何小木老师 |
| 品牌系列 | 上好课·暑假轻松学 |
| 审核时间 | 2026-06-10 |
| 下载链接 | https://m.zxxk.com/soft/58286178.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
专题03 数据分析初步
内容导航
01 复习目标→ 明考向、知权重、晓关联、以目标导学,以考向定标
02 知识重构→ 系统讲解核心重难点,整合为专题知识体系
03 题型突破→ 汇总常考题型,举一反三,方法提炼
题型1 平均数的计算与应用
题型2 中位数与众数
题型3 平均数、中位数、众数的综合比较
题型4 方差的计算与应用
题型5 统计量综合应用与分析决策
04综合通关→ 综合演练,梯度设题;查漏补缺,闭环收官
05错题留痕→ 预留固定区域,记录错题题号、错因与正解
常考考点
命题风向
1.平均数、加权平均数、中位数与众数:掌握三种统计量的计算方法及实际意义,能够根据数据特征选择合适的统计量描述数据。
2.方差及其应用:掌握方差的计算方法,理解方差反映数据波动大小的意义,并能利用方差比较数据的稳定性。
3.统计图表与箱线图:能够从表格、统计图及箱线图中获取信息,分析数据的分布特征。
4.统计量综合分析:综合运用平均数、中位数、众数和方差分析数据特征,比较不同数据组之间的差异。
5.数据分析与决策:利用统计结果进行评价、比较和决策,解决实际情境中的数据分析问题。
1.基础统计量计算:以平均数、中位数、众数和方差的计算为载体,考查学生的数据处理能力。
2.统计量求参数:结合平均数、中位数、众数或方差,求未知数据或参数的值,是常见命题形式。
3.统计量比较分析:比较不同统计量的特点,判断数据的集中趋势和离散程度。
4.统计图表信息提取:结合表格、条形统计图、折线统计图等获取有效信息并进行分析计算。
5.统计量综合应用:将平均数、中位数、众数和方差结合起来分析数据特征,体现综合运用能力。
6.数据分析决策问题:根据统计结果评价方案优劣、成绩水平或产品质量,突出统计观念与应用意识。
7.真实情境应用:结合考试成绩、体育测试、市场调查等生活背景,考查利用数据分析解决实际问题的能力。
考情解码:本专题主要研究数据的收集、整理与分析,重点学习刻画数据集中趋势的统计量(平均数、中位数、众数)和刻画数据离散程度的统计量(方差),并了解加权平均数、箱线图等常用统计工具。通过本章学习,能够从数据中提取有效信息,理解数据所反映的规律与特征,逐步形成数据分析观念。
近年来试题更加注重统计知识的实际应用,常结合成绩分析、体育测试、市场调查等真实情境,考查平均数、中位数、众数、方差及统计图表的综合运用。其中,统计量的计算与比较、数据特征分析、统计图表信息提取以及数据分析决策问题是本章的核心考点。学习本专题时,应重点掌握“用数据说话”的思想,学会利用样本数据分析问题,并对总体情况作出合理判断。
知识点一 平均数
算术平均数:一般地,有个数,我们把叫作这个数的算术平均数,简称平均数,记作(读作“x拔”).
加权平均数:一组数据中,一个数的频数可以看作这个数的“权重”,简称权。一般地,对于一组数据,对应的权分别为(),则称为这组数据的加权平均数.
分布式计算:当样本容量较大时,可以把样本分成若干个子样本,分别统计出平均数,然后运用计算加权平均数的方法,求出整个样本数据的平均数。这种将大计算任务分解为小任务分别计算再汇总的计算方式称为分布式计算.
【易错提醒】
(1)加权平均数中,“权”越大,该数据对平均数的影响就越大。
(2)混淆算术平均数与加权平均数的适用场景,在已知数据权重(如比例、次数、子样本容量)的题目中,错误地直接求算术平均数,忽略了不同数据的重要程度差异。
(3)计算分组数据或分布式平均数时,用每组的端点代替“组中值”,或子样本平均数直接求平均而未按样本容量加权,导致结果偏差。
即时即练某学校举行了八年级学生演讲比赛,对参赛者的“内容”“表达”“逻辑”“台风”“互动”五个方面进行评分(各方面均为百分制).已知小明五项得分的算术平均数为87分,若将“内容”“表达”“逻辑”“台风”“互动”五个方面评分的权重分别设为,,,,,则小明五项得分的加权平均数为86分.那么以下结论中,正确的是( )
A.重新设置权重前,小明五项得分的总分是430分
B.重新设置权重前,小明的“内容”得分超过87分
C.重新设置权重前,小明的“内容”得分比“表达”得分高
D.重新设置权重前,小明的“内容”得分比“逻辑”得分高
知识点二 中位数和众数
中位数:将一组数据按从小到大(或从大到小)的顺序排列,位于中间位置的数值是中位数。
当数据个数为奇数时,中位数是位于最中间的一个数据;
当数据个数是偶数时,中位数是位于最中间两个数据的平均数。
众数:一组数据中出现次数最多的数据。
【易错提醒】
(1)计算中位数时,必须先将数据按从小到大(或从大到小)排序,未排序直接取中间数是高频错误。
(2)当数据个数为偶数时,中位数是最中间两个数据的平均数,不能只取其中一个中间数据。
(3)众数是一组数据中出现次数最多的数据值,不是该数据出现的次数,切勿混淆概念。
(4)一组数据的众数可能不唯一,也可能不存在(所有数据出现次数相同时无众数),不要默认众数只有一个。
即时即练一次“垃圾分类”知识竞赛中7名同学的分数分别为95,85,90,85,90,80,90,这组数据的中位数和众数分别是( )
A.85,95 B.85,90 C.90,95 D.90,90
知识点三 离差平方和与方差
离差平方和:样本中,各数据与平均数的差(又称离差)的平方和称为离差平方和,记为。
数据分组原则:将数据分为两组,设第1组和第2组的离差平方和分别为和,则有:
合理的分组原则:组内离差平方和最小(此时组间离差平方和最大),即同组内数据波动最小,不同组间数据差异最大。
方差:一组数据的各个离差的平方的平均数叫作这组数据的方差,记为
意义:方差越大,说明数据的波动越大,越不稳定;方差越小,说明数据的波动越小,越稳定。
标准差:一组数据的方差的算术平方根称为这组数据的标准差,即。
【易错提醒】
(1)混淆离差平方和与方差的概念,忽略方差是离差平方和除以数据个数的平均数,且不能直接用离差平方和比较两组数据的稳定性。
(2)错误理解方差的意义,误以为“方差越大,数据越稳定”,实际方差越大,数据波动越大、越不稳定。
(3)忽略方差与标准差的单位差异,方差的单位是原数据单位的平方,标准差的单位才与原数据一致,描述数据波动时应优先使用标准差。
即时即练一组数据4、5、6、7、8的方差为,另一组数据0、5、0、7、12的方差为,那么___________(填“>”、“”或“”).
知识点四 四分位数和箱线图
四分位数:在一组从小到大排列的数据中,这三个数值把所有数据分为个数相等的四个部分,这三个数叫作四分位数。
第25百分位数(下四分位数):,至少25%的数据≤,75%的数据≥。
第50百分位数(中位数):。
第75百分位数(上四分位数):,至少75%的数据≤,25%的数据≥。
箱线图
构成:水平的线从下至上依次表示最小值、(下四分位数)、(中位数)、(上四分位数)、最大值。图中的大长方形(即箱体)的高度等于与的差。
特征:箱体反映了中间50%数据的离散程度。箱体越扁,说明中间的数据越集中;箱体越高,说明中间的数据越分散。
应用:箱线图大多用于多组数据的比较。
【易错提醒】
(1)计算四分位数前,必须先将数据按从小到大的顺序排列,未排序直接计算是高频错误。
(2)易搞反第 25 百分位数和第 75 百分位数的位置,或忽略定义中的 “至少”“≤/≥”表述。
(3)箱线图的构成易记混:箱体的上下边界为(下四分位数)和(上四分位数),而非最大值、最小值;箱体高度为-,反映中间 50% 数据的离散程度。
(4)箱线图的解读易出错:箱体越扁,中间数据越集中;箱体越高,中间数据越分散,切勿搞反两者的对应关系;且箱线图无法直接反映平均数、众数。
(5)箱线图的应用场景易忽略:箱线图主要用于多组数据的分布特征比较,单组数据的箱线图信息有限。
即时即练一组数据的箱线图如图,这组数据的下四分位数是______.
题型1 平均数的计算与应用
例1.若一组数据10,,10,10,8的平均数和众数相等,则的值为__________.
例2.小马同学在假期实践活动中调查了某一小型智能公司员工的月收入情况如下表,则这家公司员工的平均月收入为_________.
月收入/元
50000
18000
10000
5000
3600
3000
人数
1
1
1
7
6
4
【易错提醒】
(1)求解平均数与众数综合题时,未完整统计各数据出现次数,错误判断众数;列平均数方程时,数错数据总个数,造成计算结果偏差。
(2)计算以人数、比例为权重的加权平均数时,直接套用算术平均数公式计算,忽略权重的作用。
(3)加权平均数的权重以连比形式给出时,不会将比例份数直接当作权重参与计算,混淆权重换算方法。
【变式训练1-1】一组数据1,2,6,7,,12的平均数为5,则这组数据的中位数是( )
A.2 B.3 C.4 D.5
【变式训练1-2】楚韵班评选优秀班干部,从“德”、“能”、“勤”、“绩”四个方面考核打分,各项满分均为10,若依次按照的比例确定成绩,小明这四项得分依次为9,8,7,6,则小明这四项综合得分为( )
A.8 B.7.7 C.7.5 D.7
题型2 中位数与众数
例3.2026年5月9日“苏超”第五轮无锡队主场3∶1战胜泰州队,首发阵容平均年龄为25的11名球员的年龄分别为19、28、19、22、22、28、33、21、29、32、22,则这组数据的中位数和众数分别为( )
A.28和3 B.28和22 C.33和3 D.22和22
例4.某商场上月空调的销售情况如表所示:商场经理决定本月增加库存时多加一些品牌空调,可用来解释这一决定的统计量是( )
品牌
销售量/台
260
140
300
480
A.平均数 B.中位数 C.众数 D.方差
【技巧总结】
(1)中位数计算:先排序,再定位
求解中位数必须先将一组数据按从小到大(或从大到小)的顺序排列;数据个数为奇数时,取最中间的单个数据;数据个数为偶数时,取中间两个数据的平均数。众数只需统计数据出现频次,找出出现次数最多的数据即可。
(2)实际应用/图表题型:区分统计量含义
结合生活场景、频数图表解题时,反映销量最高、最热门、出现最集中的问题选用众数;反映中等水平的问题选中位数;读取频数图时,频数最大值对应的数据就是众数,可结合总样本数量快速确定中位数的位置。
【变式训练2-1】某校九年级开展经典诵读比赛,随机抽取10名学生的参赛成绩(单位:分):85, 92, 90, 88, 92, 95, 92, 86, 90,92,则这组数据的众数和中位数分别是( )
A.92,90 B.92,91 C.90,92 D.92,92
【变式训练2-2】体育考试在即,小明随机调查了九年级若干名学生五一假期期间进行体育锻炼的情况,并将统计结果绘制成如图所示的统计图.下列说法不正确的是( )
A.被调查的学生人数是45 B.样本平均数是9
C.样本中位数是9 D.样本众数是18
题型3 平均数、中位数、众数的综合比较
例5.一鞋店试销一款女鞋,老板想了解哪些尺码的鞋最畅销,则下列关于尺码的统计量中最有参考意义的是( )
A.平均数 B.中位数
C.众数 D.极差(最大值与最小值的差)
例6.体育老师欲选小张参加学校跳绳比赛,对他的10次训练成绩进行统计分析,若要判断他的成绩是否稳定,则教练需要知道小张这10次成绩的( )
A.平均数 B.中位数 C.众数 D.方差
【变式训练3-1】下面特征量中不能刻画数据集中趋势的是( )
A.平均数 B.中位数 C.众数 D.最小值
【变式训练3-2】在一次招聘会上,某公司的李经理说:“我们公司的工资一半人在6000元以上.”李经理是从哪个角度描述( )
A.平均数 B.中位数 C.方差 D.众数
【易错提醒】
(1)混淆统计量功能:平均数、中位数、众数描述数据集中趋势;方差专门判断数据波动与稳定性;极差、最值只体现数据取值范围,无法刻画集中趋势,易出现判断稳定性时误用平均数、中位数、众数的情况。
(2)场景与统计量匹配失误:反映商品畅销度、出现频次最高的数据,应选用众数;描述中等水平、“一半数据高于/低于某一数值”,应选用中位数;体现整体平均水平,才选用平均数,不可凭直觉乱选。
题型4 方差的计算与应用
例7.某班有5名同学参加一分钟跳绳比赛,体育老师要将他们分成两组进行训练,使得同一组内同学的跳绳成绩尽量接近,便于统一安排训练强度.将5名同学的跳绳次数从小到大排序后分成两组,共有4种分组情况,各组对应的组内离差平方和如下表所示:
序号
分组情况
组内离差平方和
1
第一组1人,第二组4人
2
第一组2人,第二组3人
3
第一组3人,第二组2人
4
第一组4人,第二组1人
则5名同学跳绳成绩的最优分组序号是( )
A.1 B.2 C.3 D.4
例8.甲、乙、丙、丁四个小组的同学参加了班里组织的中华古诗词知识竞赛,四个小组的人数相同,竞赛成绩情况如下表,若要从中选择一个合适的小组参加年级的比赛,那么应选( )
甲
乙
丙
丁
平均数
95
95
90
90
方差
4
4.3
4
4.6
A.甲组 B.乙组 C.丙组 D.丁组
【变式训练4-1】为了比较甲、乙、丙三种小麦秧苗的长势,每种秧苗各随机抽取20株,分别量出每株高度,计算发现三组秧苗的平均高度一样,并且得到甲、乙、丙三组秧苗高度的方差分别是,由此可知_______种秧苗长势更整齐(填“甲”、“乙”或“丙”).
【变式训练4-2】某厂对一个班组生产的零件进行调查.该班组在16天中,生产出的次品数情况如下表:
次品数(个)
5
4
3
1
0
天数(天)
1
2
4
7
2
那么该班组在这16天中生产出的次品数的中位数与标准差分别是( )
A.与 B.与 C.与 D.与
【易错提醒】
(1)概念含义易记反:组内离差平方和、方差的数值越小,数据波动越小、组内数据越接近、整体状态越稳定;切勿错误认为数值越大,数据越整齐、越稳定。
(2)计算步骤易缺失:计算方差时,算出离差的平方和后,忘记除以数据总个数;标准差是方差的算术平方根,部分同学算出方差后直接当作最终标准差,遗漏开平方运算;带有频数的题型中,易忽略频数权重,导致平方和计算出错。
(3)择优判断逻辑混乱:多组数据筛选时,先比较平均数,优先选择平均水平更高的组别;当平均数相同时,再对比方差,选取方差更小、表现更稳定的组别,不要直接依据方差大小盲目选择。
题型5 统计量综合应用与分析决策
例9.八年级某班组织了一场一分钟跳绳比赛,参赛学生被分成了甲、乙两组,如图是甲、乙两组学生一分钟跳绳次数的箱线图,下列说法错误的是( )
A.甲组跳绳次数的波动比乙组大
B.乙组跳绳次数的中位数比甲组小
C.甲组跳绳次数的下四分位数大于180
D.乙组跳绳次数的最大值大于190
例10.某校组织校园安全知识竞赛,甲、乙两组的测试成绩如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1)求甲组数据的最小值、第一四分位数、中位数、第三四分位数和最大值;
(2)根据四分位数可绘制如图所示的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图.
(3)请根据你对箱线图和四分位数的理解,谈谈你对这两组成绩的看法.
【变式训练5-1】在箱线图中(如图1),箱体中部的粗实线表示中位数;中间箱体的上、下底,分别是数据的第三四分位数(75%分位数)和第一四分位数(25%分位数);整个箱体的高度为四分位距;位于最下面和最上面的实横线分别表示最小值和最大值(有时候箱子外部会有一些点,它们是数据中的异常值).图2为某地区今年5月和6月的空气质量指数(AQI)箱线图.AQI值越小,空气质量越好;AQI值超过200,说明污染严重.
(1)该地区今年5月有没有严重污染天气?
(2)该地区哪个月的AQI值比较集中?
【变式训练5-2】社区计划挑选一间阅览室,作为居民周末上午的固定阅读空间,现有A、B两间阅览室可供选择.工作人员收集了这两间阅览室过去10周周末上午的预约人数(单位:人),数据如下:
A阅览室:28,30,40,45,48,48,48,48,48,50
B阅览室:25,25,35,40,40,55,60,65,70,80
阅览室
平均数
众数
中位数
A
a
48
48
B
49.5
b
c
(1)上述表中,_______,_______,_______;
(2)小明计算出A阅览室预约人数的四分位数;并绘制了箱线图,请求出B阅览室预约人数的四分位数,并绘制箱线图;
(3)根据上述材料分析,社区应该挑选哪间阅览室?请说明你的理由.
【技巧总结】
(1)箱线图数据分析技巧
读懂箱线图五要素(最小值、、最大值),箱体宽度与数据整体跨度直接反映离散程度:箱体越窄、数据跨度越小,代表数据分布越集中、状态越稳定;反之则数据波动大、两极分化明显。可结合四分位数、中位数同步对比两组数据的整体水平。
(2)统计量综合决策技巧
实际场景做选择、决策时,不能仅凭单一统计量判断。若侧重稳定性、均衡性,优先参考箱线图离散特征、四分位距;若侧重普遍水平、主流情况,优先选用中位数、众数;平均数易受极端数据干扰,单独使用参考价值有限,需结合其他统计量综合分析。
A组 基础过关
1.某班体育老师为了解同学们一周参加课外体育锻炼的时长,随机调查了位同学,得到如表数据:这位同学一周参加课外体育锻炼时长的平均数是______小时.
时长(小时)
人数
2.某学校82班的数学兴趣小组有6名成员,身高(单位:)分别是162、165、170、170、168、172,现增加一名身高为的成员后,现在兴趣小组成员的身高与原来相比,平均数__________,中位数__________,众数__________(从“变小”、“变大”、“不变”中选择一项填空).
3.已知5个数、、、、的平均数是,则数据、、、、的平均数为( )
A. B. C. D.
4.为了调查丢弃塑料对环境造成的影响,某班环保小组六名同学记录了自己家中一周内丢弃的塑料袋数量,结果为(单位:个):27,25,26,28,25,31.如果该班有45名学生,那么根据提供的数据,估计本周全班同学各家总共丢弃塑料袋的数量约为( )
A.905个 B.1115个 C.1215个 D.1305个
5.小军周一至周日每天阅读时间变化情况如图所示,则他这7天平均每天的阅读时间是______小时.
B组 综合提升
6.在纪录片《魅力广安》中,广安盐皮蛋以其独特的风味深受百姓喜爱.该片播出后,某调查小组对广安美食节中顾客对盐皮蛋的评分(满分分)统计如下:.下列说法正确的是()
A.平均数为 B.方差为
C.众数为 D.中位数为
7.甲、乙两名同学5次数学成绩如图,他们成绩的方差和的大小关系是( )
A. B. C. D.无法确定
8.有6个水蜜桃测出了他们的值(糖度值,值越大越甜)如下:16、17、18、18、18、19;以下是计算各种情况的组内离差平方和表(精确到):
组序
分组情况
组内离差平方和
第1组
第2组
1
16
17、18、18、18、19
2
16、17
18、18、18、19
3
16、17、18
18、18、19
4
16、17、18、18
18、19
5
16、17、18、18、18
19
(1)将表格补充完整
(2)如果要将这组水蜜桃分为“优品”和“精品”,应该如何分,为什么?
9.某校从甲、乙两名优秀选手中选一名参加全市中小学生运动会的男子100米跑项目,该校预先对这两名选手测试了8次,测试成绩如下表:
1
2
3
4
5
6
7
8
甲的成绩(秒)
12
12.3
13
12.9
13.1
12.5
12.4
12.6
乙的成绩(秒)
12.1
12.4
12.8
13
12.2
12.7
12.3
12.5
为了衡量这两名选手100米跑的水平,你认为可进行怎样的数据分析?
10.2026年2月,《教育部关于全面推进健康学校建设的指导意见》在重点任务中明确提出:要加强学校体育工作,全面实施学生体质强健计划,健全体育竞赛和人才培养体系,引导学生养成良好锻炼习惯,助力学生至少掌握1项运动技能.某中学利用体育活动时间举行某项体育比赛,每位选手从预赛到决赛要进行五轮比赛,张老师对参加比赛的甲、乙、丙三位选手的得分(单位:分,满分10分)进行了数据的收集、整理和分析,信息如下:
a:甲、乙选手的得分折线图如图所示;
b:丙选手五轮比赛部分成绩:其中三轮得分分别是;
c:甲、乙、丙三位选手五轮比赛得分的平均数、中位数数据如下表所示:
统计量
甲
乙
丙
平均数
中位数
根据以上信息,解答下列问题:
(1)表中________,________;
(2)从甲、乙两位选手的得分折线图可知,甲、乙选手五轮得分的方差,的大小关系为_________(填“>”“=”或“<”);
(3)该校准备推荐一名手参加市级比赛,你认为应该推荐谁,并说明理由.
11.小明记录了自己10分钟内每分钟的心跳次数,并绘制了如图所示的统计图,则下列结论错误的是( )
A.下四分位数是80
B.平均数是79
C.中位数是80
D.10分钟内总心跳次数是790次
12.甲、乙、丙、丁四支排球队队员身高情况箱线图如图所示,身高最集中的是___队.
C组 挑战突破
13.人工智能是当前科技领域的热门话题,特别是上线后,在知识类任务上水平显著提升,生成速度大幅提高.某学校为了解该校学生对人工智能的关注程度,对全校学生进行问卷测试,结果采用百分制,结果越高,则表明对人工智能的关注程度就越高.现分别从八、九年级学生中随机抽取20名学生的测试成绩进行整理和分析(得分用x表示,且为整数,共分为5组:A组:,B组:,C组:,D组:,E组:),下面给出了部分信息:
八年级被抽取的学生测试得分的所有数据如下:
50,51,59,65,66,73,76,79,83,84,
84,84,84,86,88,88,92,93,97,98.
九年级被抽取的学生测试得分中D组包含的所有数据如下:
88,88,87,88,88,85,85,89.
八、九年级被抽取的学生测试得分统计表
平均数/分
众数/分
中位数/分
八年级
79
a
84
九年级
79
88
b
根据以上信息,解答下列问题:
(1)填空:上述图表中,____,____,_____.
(2)根据以上数据,你认为该校八、九年级哪个年级的学生对人工智能的关注程度更高?请说明理由.
14.某校组织七、八年级学生去石家庄研学,并在研学基地开展了传统文化教育活动.活动结束后组织了一场传统文化知识竞赛,竞赛满分为100分.现随机抽取七、八年级各人的竞赛成绩,统计整理并绘制了如下不完整的统计图表:
①将抽查的两个年级成绩(用表示)进行整理,并将成绩分为4个等级:
A.;B.;C.;D..
②八年级B等级学生成绩为:82,86,86,84,86,84,86,89,88,85;
分析数据:
年级
平均数
中位数
众数
方差
七年级
80
80
79
45.7
八年级
85
86
32.9
根据以上信息解答下列问题:
(1)补全条形统计图,题中________表格中________;
(2)若该校七年级有1200名学生,八年级有900名学生,请你估计该校七年级和八年级学生成绩达到A等级及以上的学生人数共________人;
(3)请从平均数、中位数、众数、方差中任选两个统计量评价哪个年级传统文化知识掌握情况较好?
15.为了解八年级学生每周参加科学教育的时间(单位:h),学校随机调查了该校八年级50名学生,得到了一组样本数据,根据统计的结果,绘制出如下的统计图.请根据相关信息,解答下列问题:
(1)在扇形统计图中, ,在箱线图中 ,
(2)本次调查样本中数据的众数为
(3)根据样本数据,若该校八年级共有学生600人,估计该校八年级学生每周参加科学教育的时间至少为的人数约为多少?
2 / 7
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题03 数据分析初步
内容导航
01 复习目标→ 明考向、知权重、晓关联、以目标导学,以考向定标
02 知识重构→ 系统讲解核心重难点,整合为专题知识体系
03 题型突破→ 汇总常考题型,举一反三,方法提炼
题型1 平均数的计算与应用
题型2 中位数与众数
题型3 平均数、中位数、众数的综合比较
题型4 方差的计算与应用
题型5 统计量综合应用与分析决策
04综合通关→ 综合演练,梯度设题;查漏补缺,闭环收官
05错题留痕→ 预留固定区域,记录错题题号、错因与正解
常考考点
命题风向
1.平均数、加权平均数、中位数与众数:掌握三种统计量的计算方法及实际意义,能够根据数据特征选择合适的统计量描述数据。
2.方差及其应用:掌握方差的计算方法,理解方差反映数据波动大小的意义,并能利用方差比较数据的稳定性。
3.统计图表与箱线图:能够从表格、统计图及箱线图中获取信息,分析数据的分布特征。
4.统计量综合分析:综合运用平均数、中位数、众数和方差分析数据特征,比较不同数据组之间的差异。
5.数据分析与决策:利用统计结果进行评价、比较和决策,解决实际情境中的数据分析问题。
1.基础统计量计算:以平均数、中位数、众数和方差的计算为载体,考查学生的数据处理能力。
2.统计量求参数:结合平均数、中位数、众数或方差,求未知数据或参数的值,是常见命题形式。
3.统计量比较分析:比较不同统计量的特点,判断数据的集中趋势和离散程度。
4.统计图表信息提取:结合表格、条形统计图、折线统计图等获取有效信息并进行分析计算。
5.统计量综合应用:将平均数、中位数、众数和方差结合起来分析数据特征,体现综合运用能力。
6.数据分析决策问题:根据统计结果评价方案优劣、成绩水平或产品质量,突出统计观念与应用意识。
7.真实情境应用:结合考试成绩、体育测试、市场调查等生活背景,考查利用数据分析解决实际问题的能力。
考情解码:本专题主要研究数据的收集、整理与分析,重点学习刻画数据集中趋势的统计量(平均数、中位数、众数)和刻画数据离散程度的统计量(方差),并了解加权平均数、箱线图等常用统计工具。通过本章学习,能够从数据中提取有效信息,理解数据所反映的规律与特征,逐步形成数据分析观念。
近年来试题更加注重统计知识的实际应用,常结合成绩分析、体育测试、市场调查等真实情境,考查平均数、中位数、众数、方差及统计图表的综合运用。其中,统计量的计算与比较、数据特征分析、统计图表信息提取以及数据分析决策问题是本章的核心考点。学习本专题时,应重点掌握“用数据说话”的思想,学会利用样本数据分析问题,并对总体情况作出合理判断。
知识点一 平均数
算术平均数:一般地,有个数,我们把叫作这个数的算术平均数,简称平均数,记作(读作“x拔”).
加权平均数:一组数据中,一个数的频数可以看作这个数的“权重”,简称权。一般地,对于一组数据,对应的权分别为(),则称为这组数据的加权平均数.
分布式计算:当样本容量较大时,可以把样本分成若干个子样本,分别统计出平均数,然后运用计算加权平均数的方法,求出整个样本数据的平均数。这种将大计算任务分解为小任务分别计算再汇总的计算方式称为分布式计算.
【易错提醒】
(1)加权平均数中,“权”越大,该数据对平均数的影响就越大。
(2)混淆算术平均数与加权平均数的适用场景,在已知数据权重(如比例、次数、子样本容量)的题目中,错误地直接求算术平均数,忽略了不同数据的重要程度差异。
(3)计算分组数据或分布式平均数时,用每组的端点代替“组中值”,或子样本平均数直接求平均而未按样本容量加权,导致结果偏差。
即时即练某学校举行了八年级学生演讲比赛,对参赛者的“内容”“表达”“逻辑”“台风”“互动”五个方面进行评分(各方面均为百分制).已知小明五项得分的算术平均数为87分,若将“内容”“表达”“逻辑”“台风”“互动”五个方面评分的权重分别设为,,,,,则小明五项得分的加权平均数为86分.那么以下结论中,正确的是( )
A.重新设置权重前,小明五项得分的总分是430分
B.重新设置权重前,小明的“内容”得分超过87分
C.重新设置权重前,小明的“内容”得分比“表达”得分高
D.重新设置权重前,小明的“内容”得分比“逻辑”得分高
【答案】C
【分析】本题考查了算术平均数,加权平均数.
根据题意即可判断A;设内容、表达、逻辑、台风、互动的得分分别为、、、、,求出即可判断C,根据已知条件无法判断B、D.
【详解】解:设内容、表达、逻辑、台风、互动的得分分别为、、、、.
根据题意:算术平均数为87分,故,故A错误;
加权平均数为86分,故,
将加权平均方程两边乘以100,得:
将算术平均方程两边乘以20,得:
两式相减,得:
,
即,故C正确;
根据已知条件无法判断B、D.
故选:C.
知识点二 中位数和众数
中位数:将一组数据按从小到大(或从大到小)的顺序排列,位于中间位置的数值是中位数。
当数据个数为奇数时,中位数是位于最中间的一个数据;
当数据个数是偶数时,中位数是位于最中间两个数据的平均数。
众数:一组数据中出现次数最多的数据。
【易错提醒】
(1)计算中位数时,必须先将数据按从小到大(或从大到小)排序,未排序直接取中间数是高频错误。
(2)当数据个数为偶数时,中位数是最中间两个数据的平均数,不能只取其中一个中间数据。
(3)众数是一组数据中出现次数最多的数据值,不是该数据出现的次数,切勿混淆概念。
(4)一组数据的众数可能不唯一,也可能不存在(所有数据出现次数相同时无众数),不要默认众数只有一个。
即时即练一次“垃圾分类”知识竞赛中7名同学的分数分别为95,85,90,85,90,80,90,这组数据的中位数和众数分别是( )
A.85,95 B.85,90 C.90,95 D.90,90
【答案】D
【分析】本题为统计题,考查的是众数和中位数,要注意,将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数)叫做这组数据的中位数;如果中位数的概念掌握得不好,不把数据按要求重新排列,就会出错.
中位数需将数据排序后取中间值,众数为出现次数最多的数,据此求解即可.
【详解】解:将数据从小到大排列:80, 85, 85, 90, 90, 90, 95.
∵数据个数为7,是奇数,
∴中位数为第4个数,即90.
∵90出现3次,次数最多,
∴众数为90.
∴中位数和众数均为90.
故选:D.
知识点三 离差平方和与方差
离差平方和:样本中,各数据与平均数的差(又称离差)的平方和称为离差平方和,记为。
数据分组原则:将数据分为两组,设第1组和第2组的离差平方和分别为和,则有:
合理的分组原则:组内离差平方和最小(此时组间离差平方和最大),即同组内数据波动最小,不同组间数据差异最大。
方差:一组数据的各个离差的平方的平均数叫作这组数据的方差,记为
意义:方差越大,说明数据的波动越大,越不稳定;方差越小,说明数据的波动越小,越稳定。
标准差:一组数据的方差的算术平方根称为这组数据的标准差,即。
【易错提醒】
(1)混淆离差平方和与方差的概念,忽略方差是离差平方和除以数据个数的平均数,且不能直接用离差平方和比较两组数据的稳定性。
(2)错误理解方差的意义,误以为“方差越大,数据越稳定”,实际方差越大,数据波动越大、越不稳定。
(3)忽略方差与标准差的单位差异,方差的单位是原数据单位的平方,标准差的单位才与原数据一致,描述数据波动时应优先使用标准差。
即时即练一组数据4、5、6、7、8的方差为,另一组数据0、5、0、7、12的方差为,那么___________(填“>”、“”或“”).
【答案】<
【分析】本题主要考查方差,熟练掌握方差公式是解题的关键;通过计算两组数据的方差进行比较即可.
【详解】解:对于第一组数据4、5、6、7、8,平均数为,
方差为;
对于第二组数据0、5、0、7、12,平均数为,方差为;
由于,故;故答案为:<.
知识点四 四分位数和箱线图
四分位数:在一组从小到大排列的数据中,这三个数值把所有数据分为个数相等的四个部分,这三个数叫作四分位数。
第25百分位数(下四分位数):,至少25%的数据≤,75%的数据≥。
第50百分位数(中位数):。
第75百分位数(上四分位数):,至少75%的数据≤,25%的数据≥。
箱线图
构成:水平的线从下至上依次表示最小值、(下四分位数)、(中位数)、(上四分位数)、最大值。图中的大长方形(即箱体)的高度等于与的差。
特征:箱体反映了中间50%数据的离散程度。箱体越扁,说明中间的数据越集中;箱体越高,说明中间的数据越分散。
应用:箱线图大多用于多组数据的比较。
【易错提醒】
(1)计算四分位数前,必须先将数据按从小到大的顺序排列,未排序直接计算是高频错误。
(2)易搞反第 25 百分位数和第 75 百分位数的位置,或忽略定义中的 “至少”“≤/≥”表述。
(3)箱线图的构成易记混:箱体的上下边界为(下四分位数)和(上四分位数),而非最大值、最小值;箱体高度为-,反映中间 50% 数据的离散程度。
(4)箱线图的解读易出错:箱体越扁,中间数据越集中;箱体越高,中间数据越分散,切勿搞反两者的对应关系;且箱线图无法直接反映平均数、众数。
(5)箱线图的应用场景易忽略:箱线图主要用于多组数据的分布特征比较,单组数据的箱线图信息有限。
即时即练一组数据的箱线图如图,这组数据的下四分位数是______.
【答案】60
【分析】根据箱线图的结构特征,识别出表示下四分位数的位置,即箱体的下底边,直接读取对应的数值即可.
【详解】解:观察题中所给的箱线图,可以看到矩形箱体的下底边对应的纵轴数值为,
因此,这组数据的下四分位数.
题型1 平均数的计算与应用
例1.若一组数据10,,10,10,8的平均数和众数相等,则的值为__________.
【答案】
【分析】根据众数的定义确定这组数据的众数,再利用平均数的计算公式,结合平均数与众数相等列方程求解.
【详解】解:这组数据中,已经出现次,出现次,无论取何值,都是这组数据中出现次数最多的数,
因此这组数据的众数为
由题意得,这组数据的平均数与众数相等,
因此可得
整理得 ,
解得 .
例2.小马同学在假期实践活动中调查了某一小型智能公司员工的月收入情况如下表,则这家公司员工的平均月收入为_________.
月收入/元
50000
18000
10000
5000
3600
3000
人数
1
1
1
7
6
4
【答案】元
【分析】根据加权平均数的定义,先计算总收入和总人数,再用总收入除以总人数得到平均月收入.
【详解】首先计算员工总人数:
再计算所有员工的月收入总和:,
根据加权平均数的计算方法,平均月收入为:(元).
【易错提醒】
(1)求解平均数与众数综合题时,未完整统计各数据出现次数,错误判断众数;列平均数方程时,数错数据总个数,造成计算结果偏差。
(2)计算以人数、比例为权重的加权平均数时,直接套用算术平均数公式计算,忽略权重的作用。
(3)加权平均数的权重以连比形式给出时,不会将比例份数直接当作权重参与计算,混淆权重换算方法。
【变式训练1-1】一组数据1,2,6,7,,12的平均数为5,则这组数据的中位数是( )
A.2 B.3 C.4 D.5
【答案】C
【分析】先根据平均数的定义求出未知数据,再将数据从小到大排序,根据中位数的定义计算得到结果.
【详解】∵ 这组数据共有个数,平均数为,
∴ 这组数据的总和为 ,
可得 ,
将数据从小到大排序为 ,
∵ 数据个数为偶数,中位数为排序后中间两个数的平均数,中间两个数为和,
∴ 中位数为 .
【变式训练1-2】楚韵班评选优秀班干部,从“德”、“能”、“勤”、“绩”四个方面考核打分,各项满分均为10,若依次按照的比例确定成绩,小明这四项得分依次为9,8,7,6,则小明这四项综合得分为( )
A.8 B.7.7 C.7.5 D.7
【答案】B
【分析】根据给定的权重比,按照加权平均数的计算方法求解即可.
【详解】解:∵ 四项得分的权重比为 ,总权重和为 ,
∴ 小明的综合得分为:.
题型2 中位数与众数
例3.2026年5月9日“苏超”第五轮无锡队主场3∶1战胜泰州队,首发阵容平均年龄为25的11名球员的年龄分别为19、28、19、22、22、28、33、21、29、32、22,则这组数据的中位数和众数分别为( )
A.28和3 B.28和22 C.33和3 D.22和22
【答案】D
【分析】先将数据按从小到大排序,再根据定义分别求出中位数和众数即可.
【详解】解:首先将这组数据从小到大排序,得 ,
∵这组数据共个,为奇数个,中位数是排序后最中间的数即第个数,
∴ 中位数为,
∵在这组数据中出现次数最多,
∴众数为,
因此这组数据的中位数和众数分别为和.
例4.某商场上月空调的销售情况如表所示:商场经理决定本月增加库存时多加一些品牌空调,可用来解释这一决定的统计量是( )
品牌
销售量/台
260
140
300
480
A.平均数 B.中位数 C.众数 D.方差
【答案】C
【分析】根据不同统计量所反映的数据特征:平均数反映平均水平,中位数反映中等水平,方差反映数据的波动程度,而众数反映的是数据中出现次数最多(即最热门,最集中)的情况,商场经理根据销量决定进货,关注的是销量最大的品牌,这与众数的定义相符,据此即可解答.
【详解】解:从表格数据可知,品牌空调的销售量(480台)高于其他所有品牌,是销量最高的品牌,众数表示一组数据中出现次数最多的数,对应本题情境中代表销量最高、最受欢迎的品牌,而平均数反映平均销售量,中位数反映销售量的中间水平,方差反映数据的波动程度,都无法直接体现哪个品牌最畅销,故经理的决定可以用众数解释.
【技巧总结】
(1)中位数计算:先排序,再定位
求解中位数必须先将一组数据按从小到大(或从大到小)的顺序排列;数据个数为奇数时,取最中间的单个数据;数据个数为偶数时,取中间两个数据的平均数。众数只需统计数据出现频次,找出出现次数最多的数据即可。
(2)实际应用/图表题型:区分统计量含义
结合生活场景、频数图表解题时,反映销量最高、最热门、出现最集中的问题选用众数;反映中等水平的问题选中位数;读取频数图时,频数最大值对应的数据就是众数,可结合总样本数量快速确定中位数的位置。
【变式训练2-1】某校九年级开展经典诵读比赛,随机抽取10名学生的参赛成绩(单位:分):85, 92, 90, 88, 92, 95, 92, 86, 90,92,则这组数据的众数和中位数分别是( )
A.92, 90 B.92, 91 C.90, 92 D.92, 92
【答案】B
【分析】根据定义先确定众数,再对数据排序后计算中位数即可得到结果.
【详解】∵ 在这组数据中,92共出现4次,出现次数最多,
∴ 这组数据的众数为92;
将这组数据从小到大排序得:85,86, 88, 90,90,92, 92,92,92,95,
∵ 数据个数为10,是偶数,中位数为排序后中间两个数的平均数,即第5个和第6个数的平均数,
∴ 中位数为;
因此这组数据的众数和中位数分别是92和91.
【变式训练2-2】体育考试在即,小明随机调查了九年级若干名学生五一假期期间进行体育锻炼的情况,并将统计结果绘制成如图所示的统计图.下列说法不正确的是( )
A.被调查的学生人数是45 B.样本平均数是9
C.样本中位数是9 D.样本众数是18
【答案】D
【分析】根据频数分布直方图,结合样本总数、平均数、中位数、众数的求解方式逐项判断即可.
【详解】解:被调查的学生人数是,故A正确,不符合题意;
样本平均数是,故B正确,不符合题意;
调查的学生人数是,则样本中位数是第23位数字,第23位为9,故C正确,不符合题意;
样本众数是9,故D错误,符合题意.
题型3 平均数、中位数、众数的综合比较
例5.一鞋店试销一款女鞋,老板想了解哪些尺码的鞋最畅销,则下列关于尺码的统计量中最有参考意义的是( )
A.平均数 B.中位数
C.众数 D.极差(最大值与最小值的差)
【答案】C
【分析】本题考查了平均数、中位数、众数和极差的统计意义.解题的关键是理解各统计量的含义,根据实际问题的需求选择合适的统计量.
分析各统计量的意义:平均数反映数据的平均水平;中位数反映数据的中间位置水平;众数是一组数据中出现次数最多的数据,能反映最集中的情况;极差反映数据的波动范围.老板想了解最畅销的鞋码,即出现次数最多的尺码,故应选择众数.
【详解】解:平均数是所有数据的平均水平,不能直接反映最畅销的尺码,选项A错误;
中位数是数据按大小排序后中间的数值,也无法体现最受欢迎的尺码,选项B错误;
众数是一组数据中出现次数最多的数值,能准确反映哪种尺码的鞋最畅销,选项C正确;
极差是最大值与最小值的差,反映的是数据的波动范围,与畅销尺码无关,选项D错误.
故选:C.
例6.体育老师欲选小张参加学校跳绳比赛,对他的10次训练成绩进行统计分析,若要判断他的成绩是否稳定,则教练需要知道小张这10次成绩的( )
A.平均数 B.中位数 C.众数 D.方差
【答案】D
【分析】此题考查了统计量的选择;注意:方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定.
要判断数据的稳定性,需使用方差.方差反映数据的波动程度,方差越小,成绩越稳定.
【详解】解:平均数反映数据的平均水平,中位数和众数反映数据的集中趋势,而方差衡量数据的波动情况.题目中需判断成绩是否稳定,即需比较数据的波动程度,因此应选择方差.
故选:D.
【变式训练3-1】下面特征量中不能刻画数据集中趋势的是( )
A.平均数 B.中位数 C.众数 D.最小值
【答案】D
【分析】本题考查数据集中趋势的特征量识别.集中趋势的统计量包括平均数、中位数、众数,而最小值属于描述数据范围的统计量.
根据中位数、众数、平均数和最小值的意义进行判断.
【详解】解:A、平均数是所有数据之和除以数据个数,反映数据的平均水平,是集中趋势的核心指标,故此选项不符合题意;
B、 中位数是将数据按大小排列后位于中间位置的数,不受极端值影响,体现数据中间位置的集中趋势,故此选项不符合题意;
C、众数是数据中出现次数最多的数,反映数据的集中分布情况,故此选项不符合题意;
D、最小值是数据中的最小数值,仅描述数据范围的下限,不能刻画数据集中趋势,故此选项符合题意;
故选:D.
【变式训练3-2】在一次招聘会上,某公司的李经理说:“我们公司的工资一半人在6000元以上.”李经理是从哪个角度描述( )
A.平均数 B.中位数 C.方差 D.众数
【答案】B
【分析】本题考查对平均数、中位数、方差、众数这几个统计量概念的理解.解题关键是准确把握各统计量的意义.
明确平均数、中位数、方差、众数各自的定义, 分析每个选项:平均数反映平均水平,与一半人在某数值以上无关;中位数将数据排序后可使一半数据比它大、一半比它小,符合“一半人在 6000 元以上”;方差衡量数据波动,与该描述无关;众数是出现次数最多的值,和此描述不相关, 据此确定正确选项.
【详解】A.平均数是一组数据的总和除以数据个数得到的值,它反映的是数据的平均水平,不能体现“一半人在某个数值以上” ,所以本选项错误,不符合题意;
B.中位数是将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数为中位数;如果数据的个数是偶数,则中间两个数的平均数为中位数.中位数将数据分为两部分,一半的数据比中位数大,一半的数据比中位数小.“公司的工资一半人在6000元以上”,说明6000元是这组工资数据的中位数,所以本选项正确,符合题意;
C.方差是用来衡量一组数据波动大小的量,与“一半人在某个数值以上”毫无关联 ,所以本选项错误,不符合题意;
D.众数是一组数据中出现次数最多的数据值,它体现的是数据中出现频率最高的数,和“一半人在某个数值以上”没有关系 ,所以本选项错误,不符合题意;
故选:B.
【易错提醒】
(1)混淆统计量功能:平均数、中位数、众数描述数据集中趋势;方差专门判断数据波动与稳定性;极差、最值只体现数据取值范围,无法刻画集中趋势,易出现判断稳定性时误用平均数、中位数、众数的情况。
(2)场景与统计量匹配失误:反映商品畅销度、出现频次最高的数据,应选用众数;描述中等水平、“一半数据高于/低于某一数值”,应选用中位数;体现整体平均水平,才选用平均数,不可凭直觉乱选。
题型4 方差的计算与应用
例7.某班有5名同学参加一分钟跳绳比赛,体育老师要将他们分成两组进行训练,使得同一组内同学的跳绳成绩尽量接近,便于统一安排训练强度.将5名同学的跳绳次数从小到大排序后分成两组,共有4种分组情况,各组对应的组内离差平方和如下表所示:
序号
分组情况
组内离差平方和
1
第一组1人,第二组4人
2
第一组2人,第二组3人
3
第一组3人,第二组2人
4
第一组4人,第二组1人
则5名同学跳绳成绩的最优分组序号是( )
A.1 B.2 C.3 D.4
【答案】B
【分析】根据题意,要使同一组内成绩尽量接近,组内离差平方和越小,说明组内成绩越接近,因此只需比较四种分组的组内离差平方和,找到最小值对应的分组序号即可.
【详解】解:∵ ,
∴序号2对应的组内离差平方和最小,为最优分组.
例8.甲、乙、丙、丁四个小组的同学参加了班里组织的中华古诗词知识竞赛,四个小组的人数相同,竞赛成绩情况如下表,若要从中选择一个合适的小组参加年级的比赛,那么应选( )
甲
乙
丙
丁
平均数
95
95
90
90
方差
4
4.3
4
4.6
A.甲组 B.乙组 C.丙组 D.丁组
【答案】A
【详解】解:∵甲和乙的平均数为,高于丙和丁的平均数,
∴先排除丙、丁,
又∵甲的方差小于乙的方差,
∴甲的成绩比乙更稳定,
因此应选甲组.
【变式训练4-1】为了比较甲、乙、丙三种小麦秧苗的长势,每种秧苗各随机抽取20株,分别量出每株高度,计算发现三组秧苗的平均高度一样,并且得到甲、乙、丙三组秧苗高度的方差分别是,由此可知_______种秧苗长势更整齐(填“甲”、“乙”或“丙”).
【答案】甲
【分析】方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小;据此比较方差大小即可求解.
【详解】解:,
甲种秧苗长势更整齐.
【变式训练4-2】某厂对一个班组生产的零件进行调查.该班组在16天中,生产出的次品数情况如下表:
次品数(个)
5
4
3
1
0
天数(天)
1
2
4
7
2
那么该班组在这16天中生产出的次品数的中位数与标准差分别是( )
A.与 B.与 C.与 D.与
【答案】C
【详解】解:∵总共有16个数据,中位数是从小到大排列后第8个和第9个数据的平均数. 将数据按从小到大排序,次品数0共2天,对应第1~2位;次品数1共7天,对应第3~9位;
∴第8位和第9位的次品数都是1, 即中位数为;
计算平均数: ;
计算方差: ,
∴标准差,
∴中位数为,标准差为,即选项C符合题意.
【易错提醒】
(1)概念含义易记反:组内离差平方和、方差的数值越小,数据波动越小、组内数据越接近、整体状态越稳定;切勿错误认为数值越大,数据越整齐、越稳定。
(2)计算步骤易缺失:计算方差时,算出离差的平方和后,忘记除以数据总个数;标准差是方差的算术平方根,部分同学算出方差后直接当作最终标准差,遗漏开平方运算;带有频数的题型中,易忽略频数权重,导致平方和计算出错。
(3)择优判断逻辑混乱:多组数据筛选时,先比较平均数,优先选择平均水平更高的组别;当平均数相同时,再对比方差,选取方差更小、表现更稳定的组别,不要直接依据方差大小盲目选择。
题型5 统计量综合应用与分析决策
例9.八年级某班组织了一场一分钟跳绳比赛,参赛学生被分成了甲、乙两组,如图是甲、乙两组学生一分钟跳绳次数的箱线图,下列说法错误的是( )
A.甲组跳绳次数的波动比乙组大
B.乙组跳绳次数的中位数比甲组小
C.甲组跳绳次数的下四分位数大于180
D.乙组跳绳次数的最大值大于190
【答案】C
【分析】根据箱线图的特征,分别观察甲、乙两组数据的极差(波动情况)、中位数位置、下四分位数位置及最大值位置,结合选项逐一判断即可.
【详解】解:由箱线图可知:甲组数据的极差约为,乙组数据的极差约为,且甲组箱体长度大于乙组,则甲组跳绳次数的波动比乙组大,故A选项说法正确;
甲组中位数(箱体内横线)约为180,乙组中位数约为170,
,
乙组跳绳次数的中位数比甲组小,
故B选项说法正确;
甲组下四分位数(箱体下边缘)对应数值约为170,
甲组跳绳次数的下四分位数小于180,
故C选项说法错误;
乙组最大值(上须顶端)对应数值约为195,
乙组跳绳次数的最大值大于190,
故D选项说法正确.
例10.某校组织校园安全知识竞赛,甲、乙两组的测试成绩如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1)求甲组数据的最小值、第一四分位数、中位数、第三四分位数和最大值;
(2)根据四分位数可绘制如图所示的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图.
(3)请根据你对箱线图和四分位数的理解,谈谈你对这两组成绩的看法.
【答案】(1)最小值是60,第一四分位数是70,中位数是,第三四分位数是96,最大值是100
(2)甲组的箱线图如图所示:
(3)根据箱线图和四分位数,可知甲组数据跨度大更分散,乙组数据紧凑更集中
【分析】(1)把甲的成绩从小到大排列,中位数是第个数据的平均数,第一四分位数为第3个数,第三四分位数为第8个数,即可求解最大值和最小值;
(2)将3个四分位数及最大和最小值在图中画出即可;
(3)结合箱线图及四分位数,比较成绩的离散程度即可.
【详解】(1)解:把甲组的成绩按从小到大的顺序排列为60,70,70,80,89,91,92,96,98,100,∴最小值是60,第一四分位数是70,中位数是,第三四分位数是96,最大值是100;
(2)如上图
(3)根据箱线图和四分位数,可知甲组数据跨度大更分散,乙组数据紧凑更集中
甲组成绩最小值为 60,最大值为 100,数据整体跨度大;第一四分位数为 70,第三四分位数为 96,四分位距较大,说明甲组中间 50% 的成绩也较为分散。
乙组成绩最小值为 70,最大值为 96,整体取值范围更小,箱线图箱体更紧凑,四分位距更小,代表乙组大部分成绩分布集中。 综上,甲组测试成绩两极分化明显,数据波动大;乙组测试成绩分布更集中、整体水平更稳定。
【变式训练5-1】在箱线图中(如图1),箱体中部的粗实线表示中位数;中间箱体的上、下底,分别是数据的第三四分位数(75%分位数)和第一四分位数(25%分位数);整个箱体的高度为四分位距;位于最下面和最上面的实横线分别表示最小值和最大值(有时候箱子外部会有一些点,它们是数据中的异常值).图2为某地区今年5月和6月的空气质量指数(AQI)箱线图.AQI值越小,空气质量越好;AQI值超过200,说明污染严重.
(1)该地区今年5月有没有严重污染天气?
(2)该地区哪个月的AQI值比较集中?
【答案】(1)该地区今年5月有严重污染天气
(2)该地区5月的AQI值比较集中
【详解】(1)解: 该地区今年5月空气质量指数()箱线图外部有点, 即有一个异常值超过200,该地区今年5月有严重污染天气;
(2)解:该地区今年5月和6月的空气质量指数(AQI)最小值相同,第一四分位数相同,中位数相同,但5月最大值和第三四分位数小于6月的最大值和第三四分位数,
该地区5月的AQI值比较集中.
【变式训练5-2】社区计划挑选一间阅览室,作为居民周末上午的固定阅读空间,现有A、B两间阅览室可供选择.工作人员收集了这两间阅览室过去10周周末上午的预约人数(单位:人),数据如下:
A阅览室:28,30,40,45,48,48,48,48,48,50
B阅览室:25,25,35,40,40,55,60,65,70,80
阅览室
平均数
众数
中位数
A
a
48
48
B
49.5
b
c
(1)上述表中,_______,_______,_______;
(2)小明计算出A阅览室预约人数的四分位数;并绘制了箱线图,请求出B阅览室预约人数的四分位数,并绘制箱线图;
(3)根据上述材料分析,社区应该挑选哪间阅览室?请说明你的理由.
【答案】(1),40和25,;
(2);
绘制箱线图如图所示:
(3)社区应该挑选阅览室A.
理由:因为阅览室A的众数和中位数大于阅览室B,且从箱线图看B阅览室预约人数的差距大,A阅览室预约人数的差距小,更稳定,所以社区应该挑选阅览室A.
【分析】(1)根据平均数、众数、中位数的定义,结合数据完成表格即可;
(2)结合数据和图表确定第25、50、75百分位数对应的位置,计算得到对应的四分位数,在B的位置标注最小值、下四分位数、中位数、上四分位数、最大值,画出箱线图即可;
【详解】(1)解:A阅览室预约人数的平均数;
根据数据, B阅览室预约人数为25和40的出现次数最多,因此众数b为25和40;
将B阅览室预约人数从小到大顺序排列,第5个数为40,第6个数为55,因此中位数为;
(2);绘制箱线图如上图所示:
(3)社区应该挑选阅览室A.
理由:因为阅览室A的众数和中位数大于阅览室B,且从箱线图看B阅览室预约人数的差距大,A阅览室预约人数的差距小,更稳定,所以社区应该挑选阅览室A.
【技巧总结】
(1)箱线图数据分析技巧
读懂箱线图五要素(最小值、、最大值),箱体宽度与数据整体跨度直接反映离散程度:箱体越窄、数据跨度越小,代表数据分布越集中、状态越稳定;反之则数据波动大、两极分化明显。可结合四分位数、中位数同步对比两组数据的整体水平。
(2)统计量综合决策技巧
实际场景做选择、决策时,不能仅凭单一统计量判断。若侧重稳定性、均衡性,优先参考箱线图离散特征、四分位距;若侧重普遍水平、主流情况,优先选用中位数、众数;平均数易受极端数据干扰,单独使用参考价值有限,需结合其他统计量综合分析。
A组 基础过关
1.某班体育老师为了解同学们一周参加课外体育锻炼的时长,随机调查了位同学,得到如表数据:这位同学一周参加课外体育锻炼时长的平均数是______小时.
时长(小时)
人数
【答案】
【分析】本题考查了求平均数.
根据平均数的运算法则计算即可.
【详解】解:这位同学一周参加课外体育锻炼时长的平均数是:
(小时)
故答案为:.
2.某学校82班的数学兴趣小组有6名成员,身高(单位:)分别是162、165、170、170、168、172,现增加一名身高为的成员后,现在兴趣小组成员的身高与原来相比,平均数__________,中位数__________,众数__________(从“变小”、“变大”、“不变”中选择一项填空).
【答案】 变大 变大 不变
【分析】本题考查了众数、中位数和算术平均数,根据平均数、中位数的意义、众数的定义,可得答案.【详解】解:,
原来的中位数是,
现在的身高从小到大排列为:、、、、、、,
现在的中位数是最中间的,
众数不变,依然是,
故增加一名身高为的成员后,现在兴趣小组成员的身高与原来相比,平均数变大,中位数变大,众数不变.故答案为:变大,变大,不变.
3.已知5个数、、、、的平均数是,则数据、、、、的平均数为( )
A. B. C. D.
【答案】B
【分析】根据数据、、、、比数据、、、、的和多15,可得数据、、、、的平均数比a多3,据此求解即可
【详解】解:a+ ÷5
=a+[1+2+3+4+5] ÷5
=a+15÷5
=a+3
故选:B
4.为了调查丢弃塑料对环境造成的影响,某班环保小组六名同学记录了自己家中一周内丢弃的塑料袋数量,结果为(单位:个):27,25,26,28,25,31.如果该班有45名学生,那么根据提供的数据,估计本周全班同学各家总共丢弃塑料袋的数量约为( )
A.905个 B.1115个 C.1215个 D.1305个
【答案】C
【分析】先求出6个家庭一周内丢弃的塑料袋的平均数量,即可认为是该周全班同学各家丢弃塑料袋的平均数,乘以总数45即为所求.
【详解】解:(个).
故选C.
5.小军周一至周日每天阅读时间变化情况如图所示,则他这7天平均每天的阅读时间是______小时.
【答案】
【分析】从统计图中得到数据,再利用平均数公式进行计算即可.
【详解】解:由折线统计图知,这7天平均每天的阅读时间为:
(小时).
B组 综合提升
6.在纪录片《魅力广安》中,广安盐皮蛋以其独特的风味深受百姓喜爱.该片播出后,某调查小组对广安美食节中顾客对盐皮蛋的评分(满分分)统计如下:.下列说法正确的是()
A.平均数为 B.方差为
C.众数为 D.中位数为
【答案】D
【分析】根据平均数、众数、中位数、方差分别计算各统计量,即可判断选项正误.
【详解】解:、先将数据从小到大排序得:,共有个数据,
∴平均数,该选项错误,不符合题意;
、方差
,该选项错误,不符合题意;
、∵数据中出现次数最多,
∴众数为,该选项错误,不符合题意;
、个数据排序后,中位数为第个数据,即,该选项正确,符合题意.
7.甲、乙两名同学5次数学成绩如图,他们成绩的方差和的大小关系是( )
A. B. C. D.无法确定
【答案】A
【分析】结合统计图可知,甲的成绩波动比较大,根据波动大的方差就大即可得到答案.
【详解】解:由统计图可知,甲选手的成绩波动较大,说明其成绩不稳定;乙选手的成绩的波动较小,说明其成绩比较稳定,∴.
8.有6个水蜜桃测出了他们的值(糖度值,值越大越甜)如下:16、17、18、18、18、19;以下是计算各种情况的组内离差平方和表(精确到):
组序
分组情况
组内离差平方和
第1组
第2组
1
16
17、18、18、18、19
2
16、17
18、18、18、19
3
16、17、18
18、18、19
4
16、17、18、18
18、19
5
16、17、18、18、18
19
(1)将表格补充完整
(2)如果要将这组水蜜桃分为“优品”和“精品”,应该如何分,为什么?
【答案】(1)见解析 (2)优品:16、17;精品:18、18、18、19;理由见解析
【分析】(1)根据组内离差平方和的计算公式,计算即可;
(2)小题核心是比较表格中5种分组方案的组内离差平方和的大小,要想将水蜜桃分为优品和精品两种,需要两个分组中值尽可能接近,使得分组合理,所以选出组内离差平方和最小即可.
【详解】(1)解:第1组数据为16、17,则平均数为,
第2组数据为:18、18、18、19,则平均数为,
∴组内离差平方和为:;
第1组数据为16、17、18,则平均数为,
第2组数据为:18、18、19,则平均数为,
∴组内离差平方和为:;
填报如下:
组序
分组情况
组内离差平方和
第1组
第2组
1
16
17、18、18、18、19
2
16、17
18、18、18、19
3
16、17、18
18、18、19
4
16、17、18、18
18、19
5
16、17、18、18、18
19
(2)解:因为前2个一组,后4个一组时的组内离差平方和为最小,所以分组如下:
优品:16、17
精品:18、18、18、19.
9.某校从甲、乙两名优秀选手中选一名参加全市中小学生运动会的男子100米跑项目,该校预先对这两名选手测试了8次,测试成绩如下表:
1
2
3
4
5
6
7
8
甲的成绩(秒)
12
12.3
13
12.9
13.1
12.5
12.4
12.6
乙的成绩(秒)
12.1
12.4
12.8
13
12.2
12.7
12.3
12.5
为了衡量这两名选手100米跑的水平,你认为可进行怎样的数据分析?
【答案】见解析
【分析】分别计算两名选手的平均数,中位数及方差即可.
【详解】为了衡量这两名选手米跑的水平,应选择平均数、方差、中位数这些统计量.
甲的平均数为:秒,
乙的平均数为:秒;
甲的中位数为秒,乙成绩的中位数为秒,
,
.
10.2026年2月,《教育部关于全面推进健康学校建设的指导意见》在重点任务中明确提出:要加强学校体育工作,全面实施学生体质强健计划,健全体育竞赛和人才培养体系,引导学生养成良好锻炼习惯,助力学生至少掌握1项运动技能.某中学利用体育活动时间举行某项体育比赛,每位选手从预赛到决赛要进行五轮比赛,张老师对参加比赛的甲、乙、丙三位选手的得分(单位:分,满分10分)进行了数据的收集、整理和分析,信息如下:
a:甲、乙选手的得分折线图如图所示;
b:丙选手五轮比赛部分成绩:其中三轮得分分别是;
c:甲、乙、丙三位选手五轮比赛得分的平均数、中位数数据如下表所示:
统计量
甲
乙
丙
平均数
中位数
根据以上信息,解答下列问题:
(1)表中________,________;
(2)从甲、乙两位选手的得分折线图可知,甲、乙选手五轮得分的方差,的大小关系为_________(填“>”“=”或“<”);
(3)该校准备推荐一名手参加市级比赛,你认为应该推荐谁,并说明理由.
【答案】(1); (2)
(3)推荐乙,理由:因为乙和丙的平均数相同且比甲高,但乙的中位数比丙高,所以推荐乙
【分析】(1)根据平均数与中位数的定义求解即可;
(2)根据统计图可知,乙的成绩的波动比甲的成绩的波动小,即可判断;
(3)从平均成绩,中位数和稳定性等角度出发进行描述即可.
【详解】(1)解:甲得分排列为:,
∴中位数为,
∴;
;
(2)解:由统计图可知,乙的成绩的波动比甲的成绩的波动小,则选手乙发挥的稳定性更好,
∴;
(3)从平均成绩,中位数和稳定性等角度出发进行描述即可.
11.小明记录了自己10分钟内每分钟的心跳次数,并绘制了如图所示的统计图,则下列结论错误的是( )
A.下四分位数是80
B.平均数是79
C.中位数是80
D.10分钟内总心跳次数是790次
【答案】A
【分析】下四分位数是将一组数据按照从小到大的顺序排列前半部分数据的中位数;算术平均数是指在一组数据中所有数据之和再除以数据的个数;中位数是将一组数据由小到大(由大到小)排序后,位于中间位置的数据,当有偶数个数据时,取中间两数的平均数.
【详解】解:A.由附图知,将数据按照从小到大的顺序排列为,
下四分位数是前半部分的中位数,即,故本选项结论错误,符合题意;
B.平均数为(次),故本选项结论正确,不符合题意;
C.将10个数据按从小到大排列后,第5、第6个数据都是80,
∴中位数是80次,故本选项结论正确,不符合题意;
D.∵(次),
∴10分钟内心跳总次数为790(次),故本选项结论正确,不符合题意;
故选:A.
12.甲、乙、丙、丁四支排球队队员身高情况箱线图如图所示,身高最集中的是___队.
【答案】乙
【分析】根据箱线图分析即可得到答案.
【详解】解:乙队队员的身高差距最小,身高较为集中.
C组 挑战突破
13.人工智能是当前科技领域的热门话题,特别是上线后,在知识类任务上水平显著提升,生成速度大幅提高.某学校为了解该校学生对人工智能的关注程度,对全校学生进行问卷测试,结果采用百分制,结果越高,则表明对人工智能的关注程度就越高.现分别从八、九年级学生中随机抽取20名学生的测试成绩进行整理和分析(得分用x表示,且为整数,共分为5组:A组:,B组:,C组:,D组:,E组:),下面给出了部分信息:
八年级被抽取的学生测试得分的所有数据如下:
50,51,59,65,66,73,76,79,83,84,
84,84,84,86,88,88,92,93,97,98.
九年级被抽取的学生测试得分中D组包含的所有数据如下:
88,88,87,88,88,85,85,89.
八、九年级被抽取的学生测试得分统计表
平均数/分
众数/分
中位数/分
八年级
79
a
84
九年级
79
88
b
根据以上信息,解答下列问题:
(1)填空:上述图表中,____,____,_____.
(2)根据以上数据,你认为该校八、九年级哪个年级的学生对人工智能的关注程度更高?请说明理由.
【答案】(1)84;85;40
(2)九年级的学生对人工智能的关注与了解程度更高.理由:
∵八、九年级被抽取的学生测试得分的平均数相同,但九年级测试得分的中位数、众数均大于八年级,
∴九年级的学生对人工智能的关注与了解程度更高.
【分析】(1)根据众数的定义确定八年级的众数a;根据中位数的定义确定九年级的中位数b;再求出九年级D组所占的百分比即可;
(2)根据平均数或中位数或众数的数据比较结果回答即可;
【详解】(1)解:八年级被抽取的学生测试得分的所有数据中,84出现4次是出现次数最多的数据,
.
九年级被抽取的学生测试得分,
A组有:(个),
B组有:(个),
C组有:(个),
九年级被抽取的学生测试得分的中位数是D组的第1、2个的平均数,
D组数据从小到大排序后为:85,85,87,88,88,88,88,89,
.
九年级被抽取的学生测试得分的中位数是D组共有8个数据,
D组占比.
.
(2)根据平均数或中位数或众数的数据比较结果回答即可
14.某校组织七、八年级学生去石家庄研学,并在研学基地开展了传统文化教育活动.活动结束后组织了一场传统文化知识竞赛,竞赛满分为100分.现随机抽取七、八年级各人的竞赛成绩,统计整理并绘制了如下不完整的统计图表:
①将抽查的两个年级成绩(用表示)进行整理,并将成绩分为4个等级:
A.;B.;C.;D..
②八年级B等级学生成绩为:82,86,86,84,86,84,86,89,88,85;
分析数据:
年级
平均数
中位数
众数
方差
七年级
80
80
79
45.7
八年级
85
86
32.9
根据以上信息解答下列问题:
(1)补全条形统计图,题中________表格中________;
(2)若该校七年级有1200名学生,八年级有900名学生,请你估计该校七年级和八年级学生成绩达到A等级及以上的学生人数共________人;
(3)请从平均数、中位数、众数、方差中任选两个统计量评价哪个年级传统文化知识掌握情况较好?
【答案】(1)如图所示:
,40 ; 86
(2)780
(3)八年级平均数大于七年级,说明八年级总体掌握情况比七年级好.八年级众数是86,七年级众数是79,所以八年级掌握情况比七年级好.(答案不唯一)
【分析】(1)根据八年级人数可得,然后求出七年级B等级的人数,进而可补全条形统计图,最后根据中位数的计算得到的值.
(2)根据样本百分比估算总体数量的方法即可求解;
(3)根据调查数据作决策即可.
【详解】(1)解:(人),
则七年级B等级的人数有:(人)
补全条形图略,
∵七、八年级各抽取了人,八年级组有人,组有人,组有人,组有人,
∴八年级的中位数为排序后第位同学成绩的平均数,
八年级等级学生成绩从大到小排序为:,
∴.
(2)解:(人),
答:该校七年级和八年级学生成绩达到A等级及以上的学生人数共约人,
(3)解:八年级的传统文化知识掌握情况较好,理由如下,
∵八年级平均数大于七年级,说明八年级总体掌握情况比七年级好.
八年级众数是86,七年级众数是79,所以八年级掌握情况比七年级好.
15.为了解八年级学生每周参加科学教育的时间(单位:h),学校随机调查了该校八年级50名学生,得到了一组样本数据,根据统计的结果,绘制出如下的统计图.请根据相关信息,解答下列问题:
(1)在扇形统计图中, ,在箱线图中 ,
(2)本次调查样本中数据的众数为
(3)根据样本数据,若该校八年级共有学生600人,估计该校八年级学生每周参加科学教育的时间至少为的人数约为多少?
【答案】(1)28,, (2) (3)120
【分析】(1)先由扇形图百分比和为算出;再用总人数50乘各占比,得各时长人数;最后根据箱线图四分位数定义,找到第12、13个数据(均为6)和第25、26个数据(均为7),得b、c的值;
(2)众数是数据中出现次数最多的数值.先根据扇形图各时长的百分比,算出对应人数:有6人、有8人、有12人、有14人、有6人、有4人.对比人数,的人数最多,则问题可求解;
(3)先找出每周参加科学教育时间的时长,即和;再将两者的百分比相加,得到总占比为;最后用总人数乘该占比,算出估计人数即可.
【详解】(1)解:扇形统计图中各部分百分比之和为,因此:,
根据样本容量50,
计算各时间段人数::(人),
:(人),
:(人),
:(人),
:(人),
:(人),
箱线图中,b为第一四分位数,c为中位数:
中位数:第25、26个数据的平均数,前个数据中,
第25、26个数据均为,
故;
第一四分位数:第12、13个数据的平均数,前个数据中,
第12、13个数据均为,故;
(2)解:众数是一组数据中出现次数最多的数,
由(1)中各时间段人数可知,对应的人数为14人,是所有时间段中人数最多的,
因此众数为;
(3)解:时间不少于的学生,对应和两个时间段,
总占比为:,
该校八年级共有600人,因此估计人数为:(人),
答:估计该校八年级学生每周参加科学教育的时间至少为的人数约为120人.
2 / 7
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。