内容正文:
第3章 数据分析初步
1.平均数的定义(公式):一般地,有n个数据x1,x2,x3,⋯,xn,我们把 叫作这n个数的算术平均数,简称平均数,记作。
2.加权平均数的定义(公式):一组数据中,一个数的频数可以看作这个数的权重,简称“权”,一般地,对于一组数据x1,x2,x3,⋯,xn,其权重分别为w1,w2,w3,⋯,wn, 则称 为这组数据的加权平均数。
3.分布式计算:当样本量较大时,我们可以把样本分成若干个子样本,分别计算出平均数,然后运用计算加权平均数的方法,求出整个样本组的平均数,将一个大的计算任务分解成若干个小的计算任务分别计算,再将结果汇总处理得到最终结果。这样的计算方式称为分布式计算。
4.将一组数据按从小到大(或从大到小)的顺序排列,位于 的数值是中位数。计算方法:当数据个数为奇数时,中位数是位于 的一个数据;当数据个数是偶数时,中位数是位于最中间两个数据的 。
5.一组数据中出现次数最多的数值叫作众数,众数可能不止 。
6.样本中,各数据与平均数的差(又称离差)的平方和称为离差平方和,记作D²。公式: 。离差平方和可以衡量数据的 。
7.离差平方和= +组间离差平方和,即:
8.组内离差平方和即 。组内离差平方和 ,分组后每组组内数据越相近。组间离差平方和即。
9.一般地,一组数据各个离差的平方的平均数叫作这组数据的方差,记作S²。公式: 。方差越大,说明数据波动 ,数据越 。
10.标准差:标准差是方差的 ,也能反映数据的稳定性,其单位与数据相同。
11.下四分位数:记作m25,表示数据中至少有 这个数;中位数:记作m50,表示数据中至少有50%小于或等于这个数;上四分位数:记作m75,表示数据中至少有 这个数。这三个数叫做四分位数。
12.箱线图结构:上边缘、须、 、下边缘、异常值。
13.箱线图反映数据的要素: 、上四分位数、中位数、下四分位数、 。
14.箱线图常用于多组数据的比较,箱体越扁,中间的须 ,数据越 。在分析比较时,必要时可以将箱线图结构解读为四分位数和最值,再进行比较。
1.根据图表信息求平均数
易错点:在解读统计表或者统计图时,注意:①各项及频数要一一对应;②注意项的名称和频数不要搞反,比如每天阅读2小时的人有7人,阅读3小时的人有4人,在计算总频数时为7+4而不是2+3.
例1 为了响应社区“节约用水”的号召,小明统计了去年的家庭用水情况,并绘成统计图,则小明家去年月平均用水量为___________吨.
2.求数据变化后的平均数
易错点:在已知一组数的平均数时,可以求出这组数的总和,然后再根据数据产生的变化求出新的总和,结果用新的平均数=新的总和÷新的数量计算出来即可。
例2 (24-25七年级下·重庆·自主招生)五个数的平均数是,如果把其中一个数改为,则这五个数的平均数变为,改动前这个数是___________.
3.求加权平均数
易错点:(1)两个注意,一是注意利用公式求解,二是注意每组数的权重不要对应错。
(2)若已知每一项数据在所有权重中的百分比,也可以用公式求解。
例3 (2025·山西·模拟预测)截至2025年底,国内某外卖平台已开通53条无人机航线,累计配送订单超45万单,为优化无人机配送系统,工作人员对A,B两种型号的无人机受不同因素影响的程度进行评分,数据如下(评分越高,影响程度越小,满分10分):
型号
影响因素
城市环境
山地地形
天气
障碍物识别
A型
8
B型
9
9
平台计划再购进一批无人机,将城市环境、山地地形、天气、障碍物识别四项得分按的比例确定无人机的综合得分,则平台应选择的无人机型号是______型(填“A”或“B”).
4.根据分组的平均数求所有数据的平均数
易错点:分布式计算是一个计算量比较大,数字比较复杂的计算,要仔细,要按部就班得计算。
例4 下表所示是八年级4个班上交的“科技百问”小测的最终成绩统计表。
班级
一班
二班
三班
四班
人数
48
50
45
57
平均分
86
83.5
85
84
优秀率(不低于85分)
60.42%
54%
57.78%
47.37%
(1)求出四个班成绩的平均分。
(2)求出四个班成绩的优秀率。
5.根据图表信息求中位数
易错点:与计算平均数类似,具体易错案例如下:
下表统计了某种植物平均每株开花数
开花数
3
4
5
6
7
数量
6
4
8
12
6
这组数的中位数不是5,也不是6,而是5.5,因为中位数为开花数从小到大排列后的第18和第19个数的平均数。而不是只看表中的数字就行。
例5 为了了解我校2020年初三学生体育测试成绩,从中随机抽取了50名学生的体育测试成绩如下表:
成绩(分)
38
39
40
41
42
43
44
45
46
47
48
49
50
人数
1
1
2
4
5
6
4
2
3
8
5
5
4
则这50名学生的体育测试成绩的中位数为_________.
6.已知中位数、众数或平均数的信息求数据中的字母参数
易错点:若已知平均数,可以列方程求字母参数;已知众数,可以通过频数最多推测出字母参数的值;但如果是已知中位数,需要注意可能要分类讨论,中位数还需注意并不一定出现在数据组中。
例6 (2024·湖北·一模)下列数据5,8,15,m,10,7,的中位数和平均数都相同,则m的值为________.
7.选择正确的数据分析一组数
易错点:在实际问题中,需要用平均数,中位数或众数来描述一组数据,这三个数据的作用都不相同。具体区别为:
(1)平均数表示数据的平均水平,对数据非常有代表性,在比较数据平均水平时,平均数是最直观的数,但如果一组数据中出现明显很大或者很小的数时,平均数将出现严重偏差,比如打分时出现9.5、7、6.5、6、7这样的成绩时,9.5分严重影响了实际水平,我们在生活中一般看到将其去掉;
(2)中位数表示数据的中间水平,但没办法反映一组数据头尾数据的情况。
(3)众数表示一组数据中出现频数最高的一个数,一定程度上代表大部分数据,但偏差很大,而且其他数据会变得没有意义,只有在作为众数的数的频率非常高时,具有很重要的意义,比如工厂员工的工资水平。
例7 (24-25九年级上·河北沧州·期中)某公司全体职工的月工资统计如下表:
月工资(元)
人数(人)
对于表格数据,公司的普通职工最关注的统计量是( )
A.中位数和众数 B.平均数和众数
C.平均数和中位数 D.平均数和方差
例8 (山西省2026学年中考数学一模试卷(2))某市为推动赋能教育,在全市范围内从八、九年级各随机抽取了名教师,对其使用教学水平进行打分.组织人员将八、九年级各名教师使用教学的成绩(成绩用表示,满分为分,所有成绩均不低于分且均为整数,单位:分)进行整理、描述和分析,过程如下:
数据收集与整理:八年级名教师使用教学的成绩为,,,,,,,,,,,,,,,,,,,.
九年级名教师使用教学的成绩在这一组的数据为,,,,,,.
九年级名教师使用教学的成绩,扇形统计图如下:
分组
成绩/分
A
B
C
D
数据分析:八、九年级各20名教师使用AI教学的成绩数据分析如下表:
年级
平均数/分
中位数/分
众数/分
方差
八年级
九年级
请认真阅读以上信息,回答下列问题:
(1)在这次调查活动中,采取的调查方式是_________(填“全面调查”和“抽样调查”)
(2)填空:_______,_______,________,________.
(3)根据上述信息,请你对两个年级的教师使用AI教学的成绩进行评价(任选两个统计量进行说明).
8.根据公式求离差平方和、方差和标准差
易错点:离差平方和、方差和标准差这些数据的公式比较复杂,在计算时不能出错。一般是先求平均数,然后根据公式求出离差平方和,再求方差和标准差。同样的,在熟悉了公式以后,我们还能从公式中读出一组数据的数量、平均数等。比如方差计算过程中可以知道,这组数有10个数,其平均数为6,第10个数(其中一个数)是2......
例9 某女子合唱组合的身高分别是164cm、166cm、159cm、160cm和166cm,那么这个合唱组合身高的离差平方和是 ;如果新加入一名成员的身高为163cm,新的组合身高的方差为 。
9.用方差分析数据
易错点:“方差越大,说明数据波动越大,数据越不稳定”,在一般情况下,只要求出方差,并进行比较,就能确定哪组数据更加稳定。在实际问题中,要先确定是否数量一致,是否平均数相等,以此为前提的方差的比较更有实际意义。
例10 (2026·湖南长沙·一模)甲、乙、丙、丁四名运动员参加射击项目选拔赛,每人射击次,成绩的平均数(单位:环)和方差如下表:
甲
乙
丙
丁
/环
根据表中数据,你认为应该推荐运动员________去参赛,更有把握赢得比赛.
例11 周末小明一家游览黔灵山公园,在通往弘福寺的石阶小路上,小明关注到甲、乙两段台阶的高度如图所示,(图中的数字表示每一级台阶的高度,单位:cm).
请根据上述信息填写下表:
平均数(cm)
方差(cm²)
中位数(cm)
众数(cm)
极差(cm)
甲
15
8
乙
15
2
在哪段台阶上行走会比较舒服?为什么?
10.计算组内离差平方和
易错点:组内离差平方和即求分组中每组离差平方和的总和,计算量比较大,在求平均数时,运用公式时都要谨慎计算,避免出错。
例12 (25-26八年级上·山西运城·期末)把5个数据分成和两组,则这种分组情况的组内离差平方和为__________.
11.比较组内离差平方和确定如何分组
易错点:如果题设已经将数据分组分好,只要将每种分组方案中的组内离差平方和计算后,比较大小,最小的即为分组最合理的情况;如果题设没有将数据进行分组,就要先从小到大排列,然后考虑所有可能的分组情况,再计算组内离差平方和,比较大小并得出最优解的结论。
例13 (25-26八年级上·江苏南通·期末)在引体向上测试中,5名同学完成的个数分别为13,15,7,9,12.要使个数相差较小的同学分在一组,下表是4种分法的组内离差平方和(结果保留小数点后一位)
分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第1个间隔
0
第2个间隔
2
第3个间隔
2
第4个间隔
0
根据组内离差平方和最小原则,把这5名同学引体向上的个数分为两组,下列分组正确的是( )
A.和 B.和
C.和 D.和
例14 在一分钟跳绳测试中,6名同学完成的次数分别为120,135,110,105,140,125.根据组内离差平方和最小的原则,把这6名同学跳绳次数分为两组.
12.求数据的四分位数
易错点:不要搞混上四分位数和下四分位数。在计算时,要从小到大排列。
例15 求下列各组数据的四分位数:
(1)6,47,49,15,42,41,7,39,43,40,36;
(2)25,12,18,20,15,8,31,28,22,35;
(3)36,28,15,11,3,20,26,23,32,18,7,9.
13.用四分位数分析数据
易错点:我们一般用小于或等于来描述结果,比如上四分位数m75,表示有75%的数小于或等于m75。我们主要通过四分位数来描述一组数据的四个平均分段的区间。
例16 (25-26八年级上·辽宁沈阳·期末)为调查八年级某班学生每天完成家庭作业所需的时间,在该班随机抽查了8名学生,他们每天完成作业所需时间(单位:)分别为:60,55,75,55,55,43,65,.
(1)这组数据的众数为______(直接填空);
(2)求这组数据的中位数和下四分位数;
(3)如果要求学生平均每天完成家庭作业时间不能超过,请估计该班学生是否符合这一要求?
14.学会画箱线图
易错点:先计算四分位数,然后按比例画好纵轴,按照画最值、四分位数表示的横线,再补充 成箱体,最后画须的顺序作图。在作画过程中,纵轴单位长度、四分位数表示的线是最重要的两个要素。
例17 (25-26八年级上·安徽宿州·期末)某校要从甲、乙两名选手中挑选一人参加第十四届创新应用科普活动,在最近的10次选拔赛中,他们的测试成绩(单位:分)如下:
甲:89,70,96,100,68,78,96,60,91,92;
乙:88,65,90,80,93,65,93,90,96,80.
(1)小明利用平均数、方差进行分析:通过计算平均数:(分), ;方差:,,可以看出, (填甲或乙)的测试更稳定;
(2)写出甲数据的四分位数: ; ; ;
(3)观察图中乙的箱线图,绘制甲的箱线图.
15.能根据箱线图比较多组数据并进行分析
易错点:会看箱线图,会比较箱线图中不同数据组的图象和表示的意义,能比较不同要素,比如四分位数、最值,数据的集中程度等等。 需要额外注意的是,只是箱体较扁无法完全体现数据更集中,而数据更集中也并不表示数据越大越优。
例18 (25-26八年级下·全国·课后作业)某老师绘制了一次数学小测验中甲、乙、丙三个班级学生得分的箱线图(如图),根据该图判断,下列说法错误的是( )
A.三个班级中,甲班分数的方差最小
B.三个班级中,乙班学生得分两极分化严重
C.丙班得分低于80分的学生人数多于得分高于80分的学生人数
D.若每班有42个学生,则三个班级的成绩按从高到低排列的第11名中,丙班的分数最高
例19 (2026·广西南宁·二模)某校为了评估八年级和九年级学生对人工智能(AI)基础知识的了解程度,进行了问卷调查,并将结果转化为0到100之间的分数.以下是随机抽取的八年级和九年级各10名学生的得分.
【收集数据】
八年级得分数据:70,75,80,85,85,90,90,90,95,100.
九年级得分数据:65,70,80,80,80,90,90,95,100,100.
【整理数据】
平均数
中位数
众数
八年级
a
87.5
c
九年级
85
b
80
(1)直接写出_____;_____;_____.
(2)该校八年级和九年级分别有400名和300名学生参加了此次问卷调查.根据样本数据,估算两个年级学生的平均得分.(结果保留一位小数)
(3)【描述数据】定义:把一组数据从小到大排序,用表示中位数,则把这组数据分为两部分,依次记为和.用和分别表示和的中位数,则所有数据中小于或等于的占,小于或等于的占.这样m,k,n把所有数据分成四部分,称为四分位数.箱线图是使用数据的五个统计量——最大值,最小值,m,k,n来描述比较数据的方法.表示方法如图1所示.
根据以上材料,可绘制八年级抽查数据的箱线图(如图2),请你绘制九年级数据的箱线图.
(4)【分析数据】根据箱线图,请你比较两组数据.(写出一条即可)
16.根据求得的数据来比较、分析多组数,进行开放式的问答
易错点:注意尽可能多的用平均数、中位数、众数、四分位数等来描述数据特征和表现出来的实际问题。用方差标准差来比较数据的稳定性,用组内离差平方和来合理分组...而箱线图作为同时体现稳定性、四分位数、最值和集中程度的综合图,要全面得分析出所有比较出来的结论。
例20 八年级(1)班共50人平均分为两组进行比拼,解一道满分为5分的数学题。得分结果绘制成两张统计图如图①。
姜老师要对两组比拼的得分结果进行点评,因此需要计算两组得分相关的统计数据,请你帮他完成:
(1)分别求出A组和B组得分的平均数,指出两组的众数和中位数。
(2)求出这两组数据的方差,并指出哪一组的数据更加稳定。
(3)绘制两组数据的四分位数表,并制作箱线图。通过箱线图总结本次比拼两组的得分情况。
①四分位数表(单位:分)和箱线图
②总结: 。
1.(25-26九年级下·四川成都·期中)在进行了一段时间的身体素质训练后,体育老师随机抽取班上10名男生进行立定跳远测试,其成绩(单位:cm)如下:235,205,237,235,240,239,216,245,235,257.这组数据的中位数和众数分别是( )
A.236,235 B.236,239 C.235,236 D.235,235
2.(河北省石家庄市2026年初中学业水平摸底练习(九年级)数学)“这么近,那么美,周末到河北”.某校组织了“古韵今传·最美河北”演讲比赛,比赛按照如图所示的占比进行评分,每一项满分分.已知嘉嘉的“演讲内容”、“语言表达”、“演讲技巧”三项得分分别是分,分,分,则嘉嘉的最终得分为( )
A.分 B.分 C.分 D.分
3.(25-26八年级下·全国·课后作业)某中学数学教师共有20人,他们的年龄分布如表所示:
年龄
62
50
43
32
30
28
25
人数
2
3
3
5
2
4
1
下列说法正确的是( )
A.29是这20人年龄的第一四分位数 B.29是这20人年龄的第三四分位数
C.31是这20人年龄的中位数 D.这20人年龄的众数是5
4.(23-24九年级下·湖北十堰·自主招生)高一某班有53人,老师对一次数学测试进行了统计分析.由于小王没有参加本次集体测试,因此计算其他52人的平均分为121分,方差.后来小王进行了补考,成绩为121分,关于该班成绩分析,下列说法正确的是( )
A.平均分不变,方差变大 B.平均分不变,方差变小
C.平均分和方差都不变 D.平均分和方差都改变
5.(25-26八年级上·陕西汉中·期末)某市12月某周空气质量指数()的箱线图如图所示,则这组数据的下四分位数为( )
A.102 B.98 C.114 D.106
6.(25-26八年级下·全国·课后作业)数据7,9,11,13,15按组内离差平方和最小原则分两组(一组2个、一组3个),正确分组是( )
A.{7,9}与{11,13,15} B.{7,11}与{9,13,15}
C.{7,15}与{9,11,13} D.{11,15}与{7,9,13}
7.(2022·浙江温州·模拟预测)某班10名男生在一次引体向上测试中,成绩如下(单位:个):9,5,7,10,13,12,9,10,8,15,这组数据的中位数是________个.
8.(2026·山西·一模)年中央一号文件发布后,某直播间借此机会开展了三场公益助农直播,各场农产品销售额及直播时长如表所示,这三场直播总的平均每小时销售额为________万元.
直播场次
销售额/万元
直播时长/h
第一场
第二场
第三场
9.(2026·湖南邵阳·一模)某团队对A,B,C,D四类新型气象卫星的信号回传速率(单位:)进行了5次测试,测试数据的统计结果如下表:
卫星型号
A
B
C
D
平均回传速率
60
63
58
63
回传速率方差
9.5
17.2
8.1
4.2
已知气象卫星对信号回传速率要求快且稳定,则性能最优的卫星是_________.(填“A”,“B”,“C”或“D”)
10.(25-26八年级下·全国·周测)在对一组样本数据进行分析时,小华列出了方差的计算公式为,则该样本的离差平方和是____________.
11.(25-26九年级下·辽宁鞍山·月考)一组数据1,2,的平均数为3,另一组数据,,1,2,的唯一众数为,则数据,,,1,2,4的中位数为________.
12.(25-26八年级上·山东菏泽·期末)如图是根据甲、乙组跳绳成绩(单位:次/分)在同一幅图中画出两组数据的箱线图.下面有四个结论:①甲组的中位数比乙组的大;②甲组最小数据和乙组相差不多;③乙组最大数据比甲组的明显大;④乙组数据的波动明显比甲组的大.其中正确的是______.(填四个结论的序号)
13.(2026·河北石家庄·模拟预测)某校开展以“持续弘扬长征精神”为主题的演讲比赛,选手的成绩由演讲内容、语言表达、临场表现三项组成,每项成绩均由7位评委打分,取平均分作为该项的实际成绩,再将演讲内容、语言表达、临场表现三项成绩按的比例计算出每人的总评成绩.其中,甲、乙两位选手的三项实际成绩和总评成绩(单位:分)如下表.
演讲内容
语言表达
临场表现
总评成绩
甲
86
76
82
81.4
乙
84
82
已知7位评委给乙的临场表现打出的分数(单位:分)为78、82、79、82、76、83、80.
(1)将7位评委给乙的临场表现打出的分数看作一组数据,则该组数据的中位数是__________分,众数是__________分;
(2)求乙临场表现的实际成绩;
(3)若根据总评成绩从高到低确定最终名次,则两位选手谁的最终名次比较靠前?
14.有6个水蜜桃测出了他们的Brix 值(糖度值,值越大越甜)如下:16、17、18、18、18、19;以下是计算各种情况的组内离差平方和表(精确到0.01):
组序
分组情况
组内离差平方和
第1组
第2组
1
16
17、18、18、18、19
2.00
2
16、17
18、18、18、19
3
16、17、18
18、18、19
4
16、17、18、18
18、19
3.25
5
16、17、18、18、18
19
3.20
(1)将表格补充完整
(2)如果要将这组水蜜桃分为“优品”和“精品”,应该如何分,为什么?
15.游泳培训中心特训班进行毕业考试,100米蛙泳24名成员的成绩如下(单位:秒):
158 149 145 128 140 135 142 150
155 132 136 150 142 152 130 136
140 144 166 142 144 150 132 138
据此回答:
(1)填写四分位数表
四分位数
m25
m50
m75
数值
说说本次成绩所反映的总体情况
(2)如下图所示,将这一年的成绩绘制成箱线图,并与去年的成绩进行比较,说说你对这一年成绩的评价。
2 / 16
学科网(北京)股份有限公司
$
第3章 数据分析初步
1.平均数的定义(公式):一般地,有n个数据x1,x2,x3,⋯,xn,我们把 叫作这n个数的算术平均数,简称平均数,记作。
2.加权平均数的定义(公式):一组数据中,一个数的频数可以看作这个数的权重,简称“权”,一般地,对于一组数据x1,x2,x3,⋯,xn,其权重分别为w1,w2,w3,⋯,wn, 则称 为这组数据的加权平均数。
3.分布式计算:当样本量较大时,我们可以把样本分成若干个子样本,分别计算出平均数,然后运用计算加权平均数的方法,求出整个样本组的平均数,将一个大的计算任务分解成若干个小的计算任务分别计算,再将结果汇总处理得到最终结果。这样的计算方式称为分布式计算。
4.将一组数据按从小到大(或从大到小)的顺序排列,位于中间位置的数值是中位数。计算方法:当数据个数为奇数时,中位数是位于最中间的一个数据;当数据个数是偶数时,中位数是位于最中间两个数据的平均数。
5.一组数据中出现次数最多的数值叫作众数,众数可能不止一个。
6.样本中,各数据与平均数的差(又称离差)的平方和称为离差平方和,记作D²。公式: 。离差平方和可以衡量数据的稳定性。
7.离差平方和=组内离差平方和+组间离差平方和,即:
8.组内离差平方和即。组内离差平方和越小,分组后每组组内数据越相近。组间离差平方和即。
9.一般地,一组数据各个离差的平方的平均数叫作这组数据的方差,记作S²。公式: 。方差越大,说明数据波动越大,数据越不稳定。
10.标准差:标准差是方差的算术平方根,也能反映数据的稳定性,其单位与数据相同。
11.下四分位数:记作m25,表示数据中至少有25%小于或等于这个数;中位数:记作m50,表示数据中至少有50%小于或等于这个数;上四分位数:记作m75,表示数据中至少有75%小于或等于这个数。这三个数叫做四分位数。
12.箱线图结构:上边缘、须、箱体、下边缘、异常值。
13.箱线图反映数据的要素:最大值、上四分位数、中位数、下四分位数、最小值。
14.箱线图常用于多组数据的比较,箱体越扁,中间的须越短,数据越集中。在分析比较时,必要时可以将箱线图结构解读为四分位数和最值,再进行比较。
1.根据图表信息求平均数
易错点:在解读统计表或者统计图时,注意:①各项及频数要一一对应;②注意项的名称和频数不要搞反,比如每天阅读2小时的人有7人,阅读3小时的人有4人,在计算总频数时为7+4而不是2+3.
例1 为了响应社区“节约用水”的号召,小明统计了去年的家庭用水情况,并绘成统计图,则小明家去年月平均用水量为___________吨.
【答案】
【分析】根据用水总量除以总月数即可求解.
【详解】解:由表格可得,(吨)
∴小明家去年月平均用水量为吨.
2.求数据变化后的平均数
易错点:在已知一组数的平均数时,可以求出这组数的总和,然后再根据数据产生的变化求出新的总和,结果用新的平均数=新的总和÷新的数量计算出来即可。
例2 (24-25七年级下·重庆·自主招生)五个数的平均数是,如果把其中一个数改为,则这五个数的平均数变为,改动前这个数是___________.
【答案】
【分析】本题考查了平均数的计算,五个数的前后平均数相差,这说明改后的这个数比改前大了,则改前这个数是.
【详解】解:改前后平均数的差:,
改的数前、后之差:,
.
答:改动前这个数是.
故答案为:.
3.求加权平均数
易错点:(1)两个注意,一是注意利用公式求解,二是注意每组数的权重不要对应错。
(2)若已知每一项数据在所有权重中的百分比,也可以用公式求解。
例3 (2025·山西·模拟预测)截至2025年底,国内某外卖平台已开通53条无人机航线,累计配送订单超45万单,为优化无人机配送系统,工作人员对A,B两种型号的无人机受不同因素影响的程度进行评分,数据如下(评分越高,影响程度越小,满分10分):
型号
影响因素
城市环境
山地地形
天气
障碍物识别
A型
8
B型
9
9
平台计划再购进一批无人机,将城市环境、山地地形、天气、障碍物识别四项得分按的比例确定无人机的综合得分,则平台应选择的无人机型号是______型(填“A”或“B”).
【答案】B
【分析】本题考查加权平均数的应用.根据加权平均数的计算公式分别计算A、B两种型号无人机的综合得分,再通过比较得分大小确定应选择的型号.
【详解】解:根据加权平均数的计算公式:
A型无人机的综合得分:(分)
B型无人机的综合得分:(分)
∵,且评分越高影响程度越小,
∴平台应选择B型无人机.
故答案为:B.
4.根据分组的平均数求所有数据的平均数
易错点:分布式计算是一个计算量比较大,数字比较复杂的计算,要仔细,要按部就班得计算。
例4 下表所示是八年级4个班上交的“科技百问”小测的最终成绩统计表。
班级
一班
二班
三班
四班
人数
48
50
45
57
平均分
86
83.5
85
84
优秀率(不低于85分)
60.42%
54%
57.78%
47.37%
(1)求出四个班成绩的平均分。
(2)求出四个班成绩的优秀率。
【答案】(1)84.58 (2)54.5%
【分析】本题考查的关于平均数的分布式计算的知识。第(1)小题主要先算出四个班级分数的总和,再求出人数总和,相除得到总体的平均分;第(2)小题可以先通过每个班级的优秀率求出每个班优秀的人数,再求出成绩优秀人数总和,除以总人数即可得到结果。
【详解】(1)解:4个班总分=48×86+50×83.5+45×85+57×84=16916分,48+50+45+57=200人。平均分为16916÷200=84.58分
(2)一班优秀人数=48×60.42%=29(人);二班优秀人数=50×54%=27(人);三班优秀人数=45×57.78%=26(人);四班优秀人数=57×47.37%=27(人),总优秀率=(29+27+26+27)÷200=54.5%。
5.根据图表信息求中位数
易错点:与计算平均数类似,具体易错案例如下:
下表统计了某种植物平均每株开花数
开花数
3
4
5
6
7
数量
6
4
8
12
6
这组数的中位数不是5,也不是6,而是5.5,因为中位数为开花数从小到大排列后的第18和第19个数的平均数。而不是只看表中的数字就行。
例5 为了了解我校2020年初三学生体育测试成绩,从中随机抽取了50名学生的体育测试成绩如下表:
成绩(分)
38
39
40
41
42
43
44
45
46
47
48
49
50
人数
1
1
2
4
5
6
4
2
3
8
5
5
4
则这50名学生的体育测试成绩的中位数为_________.
【答案】45.5
【详解】解:根据题意,样本容量为,是偶数,因此这组数据的中位数是从小到大排列后第个和第个数据的平均数,
成绩为45分时,累计人数为:,
因此第个数据为,第个数据为,
所以中位数为.
6.已知中位数、众数或平均数的信息求数据中的字母参数
易错点:若已知平均数,可以列方程求字母参数;已知众数,可以通过频数最多推测出字母参数的值;但如果是已知中位数,需要注意可能要分类讨论,中位数还需注意并不一定出现在数据组中。
例6 (2024·湖北·一模)下列数据5,8,15,m,10,7,的中位数和平均数都相同,则m的值为________.
【答案】0
【分析】本题考查了平均数及中位数,熟练掌握中位数的意义是解题的关键.
这一组数据的平均数为,因该组数据只有6个,故中位数应为将该组数据按从小到大顺序排列,处于最中间两个数的平均数,分情况讨论m的位置,分别求出m的值即可得到答案.
【详解】解:由题意得这组数据的平均数为:,
由题意可知分为三种情况,
将原数据除去m后从小到大排序为5, 7, 8, 10, 15;
①当时,排序后数据的中间两数为7, 8,则中位数为中位数为,
由题意得,解得,满足,故此情况成立;
②当时,排序后数据的中间两数为8, m,则中位数为,
由题意得:,解得,不满足,故此情况不成立;
③当时,排序后数据的中间两数为8, 10,则中位数为, 由题意得:,解得.不满足,故此情况不成立.
综上所述,m的值为0.
故答案为:0.
7.选择正确的数据分析一组数
易错点:在实际问题中,需要用平均数,中位数或众数来描述一组数据,这三个数据的作用都不相同。具体区别为:
(1)平均数表示数据的平均水平,对数据非常有代表性,在比较数据平均水平时,平均数是最直观的数,但如果一组数据中出现明显很大或者很小的数时,平均数将出现严重偏差,比如打分时出现9.5、7、6.5、6、7这样的成绩时,9.5分严重影响了实际水平,我们在生活中一般看到将其去掉;
(2)中位数表示数据的中间水平,但没办法反映一组数据头尾数据的情况。
(3)众数表示一组数据中出现频数最高的一个数,一定程度上代表大部分数据,但偏差很大,而且其他数据会变得没有意义,只有在作为众数的数的频率非常高时,具有很重要的意义,比如工厂员工的工资水平。
例7 (24-25九年级上·河北沧州·期中)某公司全体职工的月工资统计如下表:
月工资(元)
人数(人)
对于表格数据,公司的普通职工最关注的统计量是( )
A.中位数和众数 B.平均数和众数
C.平均数和中位数 D.平均数和方差
【答案】A
【分析】本题考查了统计量的选择的知识,根据中位数、众数、平均数及极差的意义分别判断后即可得到正确的选项,解题的关键是了解有关统计量的意义.
【详解】解:∵数据的极差较大,
∴平均数不能反映数据的集中趋势,
∴普通员工最关注的数据是中位数和众数,
故选:.
例8 (山西省2026学年中考数学一模试卷(2))某市为推动赋能教育,在全市范围内从八、九年级各随机抽取了名教师,对其使用教学水平进行打分.组织人员将八、九年级各名教师使用教学的成绩(成绩用表示,满分为分,所有成绩均不低于分且均为整数,单位:分)进行整理、描述和分析,过程如下:
数据收集与整理:八年级名教师使用教学的成绩为,,,,,,,,,,,,,,,,,,,.
九年级名教师使用教学的成绩在这一组的数据为,,,,,,.
九年级名教师使用教学的成绩,扇形统计图如下:
分组
成绩/分
A
B
C
D
数据分析:八、九年级各20名教师使用AI教学的成绩数据分析如下表:
年级
平均数/分
中位数/分
众数/分
方差
八年级
九年级
请认真阅读以上信息,回答下列问题:
(1)在这次调查活动中,采取的调查方式是_________(填“全面调查”和“抽样调查”)
(2)填空:_______,_______,________,________.
(3)根据上述信息,请你对两个年级的教师使用AI教学的成绩进行评价(任选两个统计量进行说明).
【答案】(1)抽样调查
(2),,,
(3)见解析
【分析】(1)根据题意可得采取的调查方式是抽样调查;
(2)根据平均数、众数和中位数的定义求得的值,根据扇形统计图求得的值;
(3)比较两个年级的平均数和中位数,即可求解.
【详解】(1)解:在这次调查活动中,采取的调查方式是抽样调查
(2)解:由八年级20名教师的成绩可得八年级成绩的众数为95,故;
九年级名教师测试成绩按从小到大排列
则中位数是第10个数和第个数,中位数出现在这一组中,故,
根据扇形统计图:,故;
(3)解:答案不唯一,例如,八年级教师使用AI教学的成绩的平均数与九年级教师使用AI教学的成绩的平均数相同,但八年级教师使用AI教学的成绩的中位数为91分,高于九年级教师使用AI教学的成绩的中位数89分,所以八年级教师使用AI教学的成绩更好.
8.根据公式求离差平方和、方差和标准差
易错点:离差平方和、方差和标准差这些数据的公式比较复杂,在计算时不能出错。一般是先求平均数,然后根据公式求出离差平方和,再求方差和标准差。同样的,在熟悉了公式以后,我们还能从公式中读出一组数据的数量、平均数等。比如方差计算过程中可以知道,这组数有10个数,其平均数为6,第10个数(其中一个数)是2......
例9 某女子合唱组合的身高分别是164cm、166cm、159cm、160cm和166cm,那么这个合唱组合身高的离差平方和是 ;如果新加入一名成员的身高为163cm,新的组合身高的方差为 。
【答案】44cm² cm²
【分析】要计算离差平方和,先求出平均数,再运用公式求出结果,注意带单位。要计算方差,注意现在人数从5个变成了6个,要除以6才行。
【详解】(164+166+159+160+166)÷5=163(cm),离差平方和D²=(164-163)²+(166-163)²+(159-163)²+(160-163)²+(166-163)²=44cm²;当新增一人的身高为163cm时,与平均数相等,因此离差平方和不变还是44cm²。方差为44÷(5+1)=cm².
9.用方差分析数据
易错点:“方差越大,说明数据波动越大,数据越不稳定”,在一般情况下,只要求出方差,并进行比较,就能确定哪组数据更加稳定。在实际问题中,要先确定是否数量一致,是否平均数相等,以此为前提的方差的比较更有实际意义。
例10 (2026·湖南长沙·一模)甲、乙、丙、丁四名运动员参加射击项目选拔赛,每人射击次,成绩的平均数(单位:环)和方差如下表:
甲
乙
丙
丁
/环
根据表中数据,你认为应该推荐运动员________去参赛,更有把握赢得比赛.
【答案】甲
【分析】本题考查平均数与方差的意义,先比较四名运动员的平均数,选择平均数较大的,再在平均数相同的运动员中比较方差,方差越小成绩越稳定,据此选出参赛人选.
【详解】解:由表格数据可知,甲和乙的平均数均为环,大于丙和丁的平均数,说明甲和乙的平均成绩更高,
甲的方差为,小于乙的方差,说明甲的成绩比乙更稳定,
综合平均成绩和发挥稳定性,应该推荐运动员甲去参赛.
例11 周末小明一家游览黔灵山公园,在通往弘福寺的石阶小路上,小明关注到甲、乙两段台阶的高度如图所示,(图中的数字表示每一级台阶的高度,单位:cm).
请根据上述信息填写下表:
平均数(cm)
方差(cm²)
中位数(cm)
众数(cm)
极差(cm)
甲
15
8
乙
15
2
在哪段台阶上行走会比较舒服?为什么?
【答案】填表见解析;在乙台阶上行走会比较舒服,理由见解析
【分析】根据平均数、中位数、方差、众数的概念以及计算方法,进行解答即可;通过计算甲、乙两段台阶高度数据的方差,且根据方差的大小即可判断.
【详解】解:将甲、乙两段台阶的高度值从小到大排列如下:
甲:10,12,15,17,18,18;
乙:14,14,15,15,16,16;
甲的中位数为,
甲的众数为,
乙的平均数为,
乙的方差为,
乙的众数为14,15,16,
故填表如下:
平均数(cm)
方差(cm²)
中位数(cm)
众数(cm)
极差(cm)
甲
15
16
18
8
乙
15
15
14,15,16
2
,
乙的方差远小于甲的方差,台阶高度变化更平缓,行走时更平稳,
在乙台阶上行走会比较舒服.
10.计算组内离差平方和
易错点:组内离差平方和即求分组中每组离差平方和的总和,计算量比较大,在求平均数时,运用公式时都要谨慎计算,避免出错。
例12 (25-26八年级上·山西运城·期末)把5个数据分成和两组,则这种分组情况的组内离差平方和为__________.
【答案】4
【分析】本题主要考查了求一组数据的离差平方和,分别计算两组数据的均值,再求每组数据与其均值之差的平方和,则可得到两组数据的离差平方和,再求和即可得到答案.
【详解】解:组的平均数为,
则组的离差平方和为,
组的平均数为,
则组的离差平方和为,
∴这种分组情况的组内离差平方和为,
故答案为:4.
11.比较组内离差平方和确定如何分组
易错点:如果题设已经将数据分组分好,只要将每种分组方案中的组内离差平方和计算后,比较大小,最小的即为分组最合理的情况;如果题设没有将数据进行分组,就要先从小到大排列,然后考虑所有可能的分组情况,再计算组内离差平方和,比较大小并得出最优解的结论。
例13 (25-26八年级上·江苏南通·期末)在引体向上测试中,5名同学完成的个数分别为13,15,7,9,12.要使个数相差较小的同学分在一组,下表是4种分法的组内离差平方和(结果保留小数点后一位)
分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第1个间隔
0
第2个间隔
2
第3个间隔
2
第4个间隔
0
根据组内离差平方和最小原则,把这5名同学引体向上的个数分为两组,下列分组正确的是( )
A.和 B.和
C.和 D.和
【答案】B
【分析】本题主要考查了利用离差平方和进行分组,解题的关键是掌握离差平方和的定义.
根据组内离差平方和最小原则,选取间隔,然后根据离差平方和逐项进行验证即可.
【详解】解:根据组内离差平方和最小原则,选取第2个间隔,
A. 的平均数为7,离差平方和为,的平均数为,
离差平方和为,组内离差平方和为;
B. 的平均数为,离差平方和为,的平均数为,
离差平方和为,组内离差平方和为;
C. 的平均数为,离差平方和为,的平均数为,
离差平方和为,组内离差平方和为;
D. 的平均数为,离差平方和为,的平均数是15,离差平方和为,
组内离差平方和为;根据组内离差平方和最小原则,可知B符合题意,其余均不符合题意,
故选:B.
例14 在一分钟跳绳测试中,6名同学完成的次数分别为120,135,110,105,140,125.根据组内离差平方和最小的原则,把这6名同学跳绳次数分为两组.
【答案】与
【分析】求出组内离差平方和最小值.
【详解】解:数据排序为105,110,120,125,135,140.分组列表如下:
分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第1个间隔
0
570
570
第2个间隔
250
第3个间隔
第4个间隔
250
第5个间隔
570
0
570
对比所有分组的总离差平方和发现,当按第3个间隔分组时,组内离差平方和最小,因此,按组内离差平方和最小的分法为与.
12.求数据的四分位数
易错点:不要搞混上四分位数和下四分位数。在计算时,要从小到大排列。
例15 求下列各组数据的四分位数:
(1)6,47,49,15,42,41,7,39,43,40,36;
(2)25,12,18,20,15,8,31,28,22,35;
(3)36,28,15,11,3,20,26,23,32,18,7,9.
【答案】(1)第一四分位数是15,第二四分位数是40,第三四分位数是43
(2)第一四分位数是15,第二四分位数是21,第三四分位数是28
(3)第一四分位数是10,第二四分位数是19,第三四分位数是27
【分析】本题考查了四分位数的计算,解题关键是先对数据排序,再根据位置公式确定四分位数的位置,注意整数位置时需取相邻两项的平均值.
先将数据从小到大排序,再根据四分位数的定义,使用位置公式(为百分位,为数据个数)确定四分位数的位置,若位置为整数则取该位置与下一个位置的平均值,若为小数则向上取整后对应的数据即为四分位数.
【详解】(1)解:把这组数据从小到大排列:6,7,15,36,39,40,41,42,43,47,49.
共个数据(奇数),
求中位数Q₂,中位数位置:,第6个数,,
求(下四分位数),下四分位数是前半部分数据的中位数(不包括中位数本身,因为n为奇数),
前半部分(中位数前的数据):6,7,15,36,39(共5个数),中位数位置,第3个数,,
求(上四分位数),后半部分(中位数后的数据):41,42,43,47,49(共5个数),中位数位置3,第3个数,.
.
这组数据的第一四分位数是15,第二四分位数是40,第三四分位数是43.
(2)解:把这组数据从小到大排列:8,12,15,18,20,22,25,28,31,35.
共个数据(偶数),
求中位数,中位数为第5和第6个数的平均值,第5个数为20,第6个数为22,,
求,下四分位数:前半部分为前个数:8,12,15,18,20,这5个数的中位数(第3个)为15,
,
求,后半部分为后5个数:22,25,28,31,35,中位数(第3个)为28,.
.
这组数据的第一四分位数是15,第二四分位数是21,第三四分位数是28.
(3)解:把这组数据从小到大排列:3,7,9,11,15,18,20,23,26,28,32,36.
共个数据(偶数),
求中位数,中位数为第6和第7个数的平均值,第6个数为18,第7个数为20,,
求,前半部分:前6个数:3,7,9,11,15,18,为这6个数的中位数,第3和第4个数的平均值,
求,后半部分:后6个数:20,23,26,28,32,36,为第3和第4个数的平均值,
∴.
这组数据的第一四分位数是10,第二四分位数是19,第三四分位数是27.
13.用四分位数分析数据
易错点:我们一般用小于或等于来描述结果,比如上四分位数m75,表示有75%的数小于或等于m75。我们主要通过四分位数来描述一组数据的四个平均分段的区间。
例16 (25-26八年级上·辽宁沈阳·期末)为调查八年级某班学生每天完成家庭作业所需的时间,在该班随机抽查了8名学生,他们每天完成作业所需时间(单位:)分别为:60,55,75,55,55,43,65,.
(1)这组数据的众数为______(直接填空);
(2)求这组数据的中位数和下四分位数;
(3)如果要求学生平均每天完成家庭作业时间不能超过,请估计该班学生是否符合这一要求?
【答案】(1)55;
(2)这组数据的中位数为55;下四分位数为49
(3)符合
【分析】本题主要考查了众数、中位数的概念,解题时要熟练掌握并能根据题意列出关系式是关键.
(1)依据题意,根据众数的概念可以判断得解;
(2)依据题意,由中位数、下四分位数的概念计算可以得解;
(3)依据题意,先求出样本中8名学生,他们每天完成作业平均所需时间,从而用样本估计总体,即可得解;
【详解】(1)解:数据中出现次数最多,
这组数据的众数为55,
故答案为:55;
(2)解:由题意,将题目中的数据按照从小到大排列是:40,43,55,55,55,60,65,75,
这组数据的中位数为,下四分位数为;
(3)由题意,样本中8名学生,他们每天完成作业平均所需时间,
,
估计该班学生符合每天完成家庭作业时间不超过的要求.
14.学会画箱线图
易错点:先计算四分位数,然后按比例画好纵轴,按照画最值、四分位数表示的横线,再补充 成箱体,最后画须的顺序作图。在作画过程中,纵轴单位长度、四分位数表示的线是最重要的两个要素。
例17 (25-26八年级上·安徽宿州·期末)某校要从甲、乙两名选手中挑选一人参加第十四届创新应用科普活动,在最近的10次选拔赛中,他们的测试成绩(单位:分)如下:
甲:89,70,96,100,68,78,96,60,91,92;
乙:88,65,90,80,93,65,93,90,96,80.
(1)小明利用平均数、方差进行分析:通过计算平均数:(分), ;方差:,,可以看出, (填甲或乙)的测试更稳定;
(2)写出甲数据的四分位数: ; ; ;
(3)观察图中乙的箱线图,绘制甲的箱线图.
【答案】(1)84,乙
(2)70,90,96
(3)见解析
【分析】本题主要考查了数据的分析,包括平均数、利用方差判定稳定性、四分位数以及箱线图,解题关键是掌握以上定义.
(1)根据平均数公式求出平均数,根据方差的意义判断稳定性即可;
(2)根据四分位数定义求解即可;
(3)根据四分位数画出甲的箱线图即可.
【详解】(1)解:(分),
∵,,且,
∴乙的测试更稳定;
故答案为:84,乙;
(2)解:将甲的成绩从小到大排列为60,68,70,78,89,91,92,96,96,100,
所以,,
故答案为:70,90,96;
(3)解:绘制甲的箱线图如下:
15.能根据箱线图比较多组数据并进行分析
易错点:会看箱线图,会比较箱线图中不同数据组的图象和表示的意义,能比较不同要素,比如四分位数、最值,数据的集中程度等等。 需要额外注意的是,只是箱体较扁无法完全体现数据更集中,而数据更集中也并不表示数据越大越优。
例18 (25-26八年级下·全国·课后作业)某老师绘制了一次数学小测验中甲、乙、丙三个班级学生得分的箱线图(如图),根据该图判断,下列说法错误的是( )
A.三个班级中,甲班分数的方差最小
B.三个班级中,乙班学生得分两极分化严重
C.丙班得分低于80分的学生人数多于得分高于80分的学生人数
D.若每班有42个学生,则三个班级的成绩按从高到低排列的第11名中,丙班的分数最高
【答案】C
【分析】本题主要考查箱线图的相关知识.通过箱线图中数据的分布情况,对各选项逐一进行分析判断即可解答.
【详解】解:、箱线图中,数据的离散程度可通过箱线图的宽度来判断,宽度越窄,数据越集中,方差越小.甲班箱线图的宽度相对较窄,说明甲班分数更集中,所以甲班分数的方差最小,该选项正确;
、由箱线图可知,乙班中最大值较另两个班更大,最小值较另两个班更小,故乙班分数的波动最大,该选项正确;
、由箱线图可知,丙班的中位数大于80,故丙班得分高于80分的学生人数多于得分低于80分的学生人数,说法错误;
、每班有42个学生,第11名的分数是按从高到低排序后的第11个数据,从箱线图看,丙班的分数最高,该选项正确;
故选:.
例19 (2026·广西南宁·二模)某校为了评估八年级和九年级学生对人工智能(AI)基础知识的了解程度,进行了问卷调查,并将结果转化为0到100之间的分数.以下是随机抽取的八年级和九年级各10名学生的得分.
【收集数据】
八年级得分数据:70,75,80,85,85,90,90,90,95,100.
九年级得分数据:65,70,80,80,80,90,90,95,100,100.
【整理数据】
平均数
中位数
众数
八年级
a
87.5
c
九年级
85
b
80
(1)直接写出_____;_____;_____.
(2)该校八年级和九年级分别有400名和300名学生参加了此次问卷调查.根据样本数据,估算两个年级学生的平均得分.(结果保留一位小数)
(3)【描述数据】定义:把一组数据从小到大排序,用表示中位数,则把这组数据分为两部分,依次记为和.用和分别表示和的中位数,则所有数据中小于或等于的占,小于或等于的占.这样m,k,n把所有数据分成四部分,称为四分位数.箱线图是使用数据的五个统计量——最大值,最小值,m,k,n来描述比较数据的方法.表示方法如图1所示.
根据以上材料,可绘制八年级抽查数据的箱线图(如图2),请你绘制九年级数据的箱线图.
(4)【分析数据】根据箱线图,请你比较两组数据.(写出一条即可)
【答案】(1)86,85,90
(2)85.6
(3)作图见解析
(4)见解析
【分析】(1)根据平均数,中位数,众数的定义解答;
(2)先求出两个年级的总分,再除以总人数即可;
(3)先确定,再确定最大值和最小值为100和65,画出箱线图即可;
(4)根据箱线图的特点解答即可.
【详解】(1)解:,,;
(2)解:,
所以这两个年级学生的平均得分是85.6分;
(3)解:如图所示;
(4)解:观察箱线图中箱子的中间一条线,八年级位于九年级上方,可知八年级的平均水平高;
八年级的箱子宽度小,且最大值和最小值比九年级的距离小,所以其数据波动小.
(选择任意一条即可,答案不唯一).
16.根据求得的数据来比较、分析多组数,进行开放式的问答
易错点:注意尽可能多的用平均数、中位数、众数、四分位数等来描述数据特征和表现出来的实际问题。用方差标准差来比较数据的稳定性,用组内离差平方和来合理分组...而箱线图作为同时体现稳定性、四分位数、最值和集中程度的综合图,要全面得分析出所有比较出来的结论。
例20 八年级(1)班共50人平均分为两组进行比拼,解一道满分为5分的数学题。得分结果绘制成两张统计图如图①。
姜老师要对两组比拼的得分结果进行点评,因此需要计算两组得分相关的统计数据,请你帮他完成:
(1)分别求出A组和B组得分的平均数,指出两组的众数和中位数。
(2)求出这两组数据的方差,并指出哪一组的数据更加稳定。
(3)绘制两组数据的四分位数表,并制作箱线图。通过箱线图总结本次比拼两组的得分情况。
①四分位数表(单位:分)和箱线图
②总结: 。
【答案】(1)A组平均数为3分,众数为3分,中位数为3分;B组平均数为3分,众数为4分,中位数为3分。
(2)B组成绩更稳定
(3)①图表见详解 ②两组的中位数相同,但A组出现了满分,说明从绝对成绩出发,A组发挥出色。但B组箱体比A组更加扁,说明25%~50%的分数更加集中,在上四分位数相同的情况下,B组中间成绩更稳定。
【分析】本题作为数据分析初步章节的综合性题目,主要考查和平均数、众数和中位数,方差,以及四分位数和箱线图等知识。第(1)小题根据计算方式求出A和B组的平均数、众数与中位数即可;第(2)小题利用方差公式求出两组的方差,方差越小,数据越稳定;第(3)小题先求出两组数据的四分位数,填写表格,再根据表格画箱线图,注意画图要标准,在第②小题总结时,主要比较最值、中位数和数据的集中程度。
【详解】(1)A组平均数为3分,众数为3分,中位数为3分;B组平均数为3分,众数为4分,中位数为3分。
(2)A组方差
B组方差
因为<,B组成绩更稳定。
(3)四分位数表如下:
组别
下四分位数
中位数
上四分位数
A组
2
3
4
B组
2.5
3
4
箱线图如下:
总结:两组的中位数相同,但A组出现了满分,说明从绝对成绩出发,A组发挥出色。但B组箱体比A组更加扁,说明25%~50%的分数更加集中,在上四分位数相同的情况下,B组中间成绩更稳定。
1.(25-26九年级下·四川成都·期中)在进行了一段时间的身体素质训练后,体育老师随机抽取班上10名男生进行立定跳远测试,其成绩(单位:cm)如下:235,205,237,235,240,239,216,245,235,257.这组数据的中位数和众数分别是( )
A.236,235 B.236,239 C.235,236 D.235,235
【答案】A
【分析】本题考查中位数和众数的定义,按照定义先对数据排序,再分别计算中位数和众数即可得到结果.
【详解】解:将这组数据从小到大排序,得:,
∵数据总个数为,是偶数,
∴中位数为排序后第个和第个数据的平均数,即中位数,
∵在这组数据中出现次数最多,共次,
∴众数为,
因此这组数据的中位数和众数分别是,故选A.
2.(河北省石家庄市2026年初中学业水平摸底练习(九年级)数学)“这么近,那么美,周末到河北”.某校组织了“古韵今传·最美河北”演讲比赛,比赛按照如图所示的占比进行评分,每一项满分分.已知嘉嘉的“演讲内容”、“语言表达”、“演讲技巧”三项得分分别是分,分,分,则嘉嘉的最终得分为( )
A.分 B.分 C.分 D.分
【答案】C
【分析】根据加权平均数的计算公式,列出算式,计算即可求解.
【详解】解:嘉嘉的最终得分(分).
3.(25-26八年级下·全国·课后作业)某中学数学教师共有20人,他们的年龄分布如表所示:
年龄
62
50
43
32
30
28
25
人数
2
3
3
5
2
4
1
下列说法正确的是( )
A.29是这20人年龄的第一四分位数 B.29是这20人年龄的第三四分位数
C.31是这20人年龄的中位数 D.这20人年龄的众数是5
【答案】A
【分析】本题考查了四分位数,众数,中位数.根据第一四分位数、第三四分位数、中位数、众数的定义及计算方法,逐一验证各选项即可.
【详解】解:依题意,第一四分位数即分位数,
需取年龄从小到大排列后第5个和第6个数据的平均数,
则年龄从小到大排列后,得
∴第5个数据为28,第6个数据为30,
∴ 第一四分位数为,故A选项正确
依题意,第三四分位数即分位数,,
∴需取年龄从小到大排列后第15个和第16个数据的平均数,
则第15个数据为43,第16个数据为50,平均数为,故B选项错误,
依题意,中位数即分位数,,
∴ 需取年龄从小到大排列后第10个和第11个数据的平均数,第10个和第11个数据均为32,平均数为32,故C选项错误
∵ 众数是出现次数最多的年龄,32出现的次数最多(5次),
∴众数是32,故D选项错误,
故选:A.
4.(23-24九年级下·湖北十堰·自主招生)高一某班有53人,老师对一次数学测试进行了统计分析.由于小王没有参加本次集体测试,因此计算其他52人的平均分为121分,方差.后来小王进行了补考,成绩为121分,关于该班成绩分析,下列说法正确的是( )
A.平均分不变,方差变大 B.平均分不变,方差变小
C.平均分和方差都不变 D.平均分和方差都改变
【答案】B
【分析】根据平均数,方差的定义计算即可判断结果.
【详解】解:∵小王的成绩和其他52人的平均分相同,都是121分,
∴该班53人的平均分为分,平均分不变;
该班53人的方差为 ,
∴方差变小.
5.(25-26八年级上·陕西汉中·期末)某市12月某周空气质量指数()的箱线图如图所示,则这组数据的下四分位数为( )
A.102 B.98 C.114 D.106
【答案】A
【分析】根据箱线图中间箱体的下底对应的数值即是这组数据的下四分位数(分位数)解答即可.
【详解】解:箱线图的箱体下底的对应值为102,所以这组数据的下四分位数是102.
6.(25-26八年级下·全国·课后作业)数据7,9,11,13,15按组内离差平方和最小原则分两组(一组2个、一组3个),正确分组是( )
A.{7,9}与{11,13,15} B.{7,11}与{9,13,15}
C.{7,15}与{9,11,13} D.{11,15}与{7,9,13}
【答案】A
【分析】根据离差平方和的定义,分别计算各选项中两组离差平方和的总和,总和最小的分组即为符合要求的分组
【详解】解:选项A、∵组{7,9}的平均数为,∴其离差平方和为,
∵组{11,13,15}的平均数为,∴其离差平方和为,
∴总离差平方和为;
选项B、∵ 组{7,11}的平均数为,∴其离差平方和为,
∵组{9,13,15}的平均数为,∴其离差平方和为,
∴总离差平方和为;
选项C、∵组{7,15}的平均数为,∴其离差平方和为,
∵组{9,11,13}的平均数为11,∴其离差平方和为,
∴总离差平方和为;
选项D、∵ 组{11,15}的平均数为,∴其离差平方和为,
∵组{7,9,13}的平均数为,∴其离差平方和为,
∴总离差平方和为,
∵,
∴选项A的总离差平方和最小,符合组内离差平方和最小原则
7.(2022·浙江温州·模拟预测)某班10名男生在一次引体向上测试中,成绩如下(单位:个):9,5,7,10,13,12,9,10,8,15,这组数据的中位数是________个.
【答案】
【分析】将数据按从小到大排序后,由于数据个数为偶数,中位数为中间两个数的平均值.
【详解】解:首先将数据从小到大排序:5,7,8,9,9,10,10,12,13, 15,
∵数据个数为,是偶数,
∴中位数为第5个数据和第6个数据的平均值,
即.
8.(2026·山西·一模)年中央一号文件发布后,某直播间借此机会开展了三场公益助农直播,各场农产品销售额及直播时长如表所示,这三场直播总的平均每小时销售额为________万元.
直播场次
销售额/万元
直播时长/h
第一场
第二场
第三场
【答案】
【分析】本题考查了算术平均数的计算,掌握相关知识点是解题的关键.
先求出三场直播的总销售额与总直播时长,再根据平均数的定义计算平均每小时的销售额,即可求解.
【详解】解:根据题意可得,
三场直播总销售额为(万元),
三场直播总时长为:(h),
则平均每小时的销售额为(万元).
故答案为:.
9.(2026·湖南邵阳·一模)某团队对A,B,C,D四类新型气象卫星的信号回传速率(单位:)进行了5次测试,测试数据的统计结果如下表:
卫星型号
A
B
C
D
平均回传速率
60
63
58
63
回传速率方差
9.5
17.2
8.1
4.2
已知气象卫星对信号回传速率要求快且稳定,则性能最优的卫星是_________.(填“A”,“B”,“C”或“D”)
【答案】D
【分析】根据平均回传速率可知B,D最大,根据方差越小越稳定可知D最稳定,综合可知性能最优的卫星是D.
【详解】解:根据平均回传速率可知:,
根据回传速率方差可知:,
则性能最优的卫星是D.
10.(25-26八年级下·全国·周测)在对一组样本数据进行分析时,小华列出了方差的计算公式为,则该样本的离差平方和是____________.
【答案】14
【分析】由方差计算公式可知,离差平方和即为公式中方括号内的部分,需先计算样本均值,再求各数据与均值之差的平方和.
【详解】解:样本数据为1,2,3,3,6,共5个数据,样本均值,
离差平方和为,
故答案为:14.
11.(25-26九年级下·辽宁鞍山·月考)一组数据1,2,的平均数为3,另一组数据,,1,2,的唯一众数为,则数据,,,1,2,4的中位数为________.
【答案】/
【分析】本题考查了平均数、众数及中位数的定义,解题的关键是正确的利用其定义求得未知数的值.
根据平均数求得的值,然后根据众数求得的值后再确定新数据的中位数.
【详解】解:∵1,2,的平均数为3,
∴,解得,
∴数据,,1,2,应为,,1,2,,
∵唯一众数为,故,
则数据,,,1,2,4应为数据,,,1,2,4,按从小到大排列为,,1,2,4,6,
∴中位数为.
12.(25-26八年级上·山东菏泽·期末)如图是根据甲、乙组跳绳成绩(单位:次/分)在同一幅图中画出两组数据的箱线图.下面有四个结论:①甲组的中位数比乙组的大;②甲组最小数据和乙组相差不多;③乙组最大数据比甲组的明显大;④乙组数据的波动明显比甲组的大.其中正确的是______.(填四个结论的序号)
【答案】①②③④
【分析】本题考查了箱线图,根据甲、乙组的箱线图,逐项分析判断,即可求解.
【详解】解:①甲组的中位数比乙组的大,故①正确;
②甲组最小数据和乙组相差不多,故②正确;
③乙组最大数据比甲组的明显大,故③正确;
④乙组数据的波动范围比甲组大,故④正确.
故答案为:①②③④.
13.(2026·河北石家庄·模拟预测)某校开展以“持续弘扬长征精神”为主题的演讲比赛,选手的成绩由演讲内容、语言表达、临场表现三项组成,每项成绩均由7位评委打分,取平均分作为该项的实际成绩,再将演讲内容、语言表达、临场表现三项成绩按的比例计算出每人的总评成绩.其中,甲、乙两位选手的三项实际成绩和总评成绩(单位:分)如下表.
演讲内容
语言表达
临场表现
总评成绩
甲
86
76
82
81.4
乙
84
82
已知7位评委给乙的临场表现打出的分数(单位:分)为78、82、79、82、76、83、80.
(1)将7位评委给乙的临场表现打出的分数看作一组数据,则该组数据的中位数是__________分,众数是__________分;
(2)求乙临场表现的实际成绩;
(3)若根据总评成绩从高到低确定最终名次,则两位选手谁的最终名次比较靠前?
【答案】(1)80,82
(2)80
(3)乙排在甲的前面
【分析】(1)把78,82,79,82,76,83,80,按从小到大的顺序排列找出中位数,众数;
(2)实际成绩是7位评委打分的平均分;
(3)利用加权平均数的计算方法计算乙的总评成绩,与甲的总成绩比较做出判断即可.
【详解】(1)解:把78,82,79,82,76,83,80,按从小到大的顺序排列:76,78,79,80,82,82,83,
∴中位数为80(分),
众数为82(分);
(2)解:实际成绩是7位评委打分的平均分:(分);
(3)解:乙的总评成绩为(分).
∵,
∴乙排在甲的前面.
14.有6个水蜜桃测出了他们的Brix 值(糖度值,值越大越甜)如下:16、17、18、18、18、19;以下是计算各种情况的组内离差平方和表(精确到0.01):
组序
分组情况
组内离差平方和
第1组
第2组
1
16
17、18、18、18、19
2.00
2
16、17
18、18、18、19
3
16、17、18
18、18、19
4
16、17、18、18
18、19
3.25
5
16、17、18、18、18
19
3.20
(1)将表格补充完整
(2)如果要将这组水蜜桃分为“优品”和“精品”,应该如何分,为什么?
【答案】(1)1.25 2.67
(2)优品:16、17
精品:18、18、18、19
【分析】本题第(1)小题考查的是组内离差平方和的计算,注意分组的方式,并根据公式计算和值即可。第(2)小题核心是比较表格中5种分组方案的组内离差平方和的大小,要想将水蜜桃分为优品和精品两种,需要两个分组中Brix值尽可能接近,使得分组合理。所以选出组内离差平方和最小即可。
【详解】 (1)解:1.25 2.67
(2)解:因为前2个一组,后4个一组时的组内离差平方和为1.25最小,所以分组如下:
优品:16、17
精品:18、18、18、19
15.游泳培训中心特训班进行毕业考试,100米蛙泳24名成员的成绩如下(单位:秒):
158 149 145 128 140 135 142 150
155 132 136 150 142 152 130 136
140 144 166 142 144 150 132 138
据此回答:
(1)填写四分位数表
四分位数
m25
m50
m75
数值
说说本次成绩所反映的总体情况
(2)如下图所示,将这一年的成绩绘制成箱线图,并与去年的成绩进行比较,说说你对这一年成绩的评价。
【答案】(1)填表如下:
四分位数
m25
m50
m75
数值
136
142
150
四分位数反映了本次考试成绩中,有不少于25%的学员的成绩在136秒及以内;有至少一半的学员的成绩在142秒及以内;但是还有不少于25%的学员的成绩至少有150秒,仍需努力。
(2)箱线图见详解,通过箱线图可知,今年总体成绩超过去年,不但最少用时和最多用时均比去年要短,而且中位数也提高了8秒。除此之外,25%~75%这一成绩段的学员成绩更加集中,表示了总体上成绩的集中体现。
【详解】解:(1)填表如下:
四分位数
m25
m50
m75
数值
136
142
150
四分位数反映了本次考试成绩中,有不少于25%的学员的成绩在136秒及以内;有至少一半的学员的成绩在142秒及以内;但是还有不少于25%的学员的成绩至少有150秒,仍需努力。
(2)箱线图如图所示:
通过箱线图可知,今年总体成绩超过去年,不但最少用时和最多用时均比去年要短,而且中位数也提高了8秒。除此之外,25%~75%这一成绩段的学员成绩更加集中,表示了总体上成绩的集中体现。
2 / 30
学科网(北京)股份有限公司
$