专题24.4 数据的四分位数与数据的分组(高效培优讲义)数学新教材人教版八年级下册
2026-05-27
|
2份
|
42页
|
172人阅读
|
1人下载
精品
资源信息
| 学段 | 初中 |
| 学科 | 数学 |
| 教材版本 | 初中数学人教版八年级下册 |
| 年级 | 八年级 |
| 章节 | 24.3 数据的四分位数,24.4 数据的分组 |
| 类型 | 教案-讲义 |
| 知识点 | 四分位数 |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 2.38 MB |
| 发布时间 | 2026-05-27 |
| 更新时间 | 2026-05-27 |
| 作者 | 阿宏老师 |
| 品牌系列 | 学科专项·举一反三 |
| 审核时间 | 2026-05-27 |
| 下载链接 | https://m.zxxk.com/soft/58066880.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
本初中数学讲义聚焦“数据的四分位数与数据的分组”核心内容,系统构建从百分位数定义到四分位数计算,再到箱线图绘制与解读,最终通过组内离差平方和实现数据合理分组的完整知识链条,为数据分布分析提供阶梯式学习支架。
资料以现实情境数据(如体育锻炼时长、考试成绩)为载体,通过即学即练与分层题型设计,培养学生用数学眼光观察数据特征、用数学思维分析离差平方和的推理能力,用箱线图等数学语言表达数据分布规律,课中助力教师突破重难点,课后便于学生巩固练习、查漏补缺,提升数据观念与应用意识。
内容正文:
专题24.4 数据的四分位数与数据的分组
教学目标
1. 掌握二次根式的除法运算,并能够熟练地进行运算。
2. 掌握商的算术平方根的性质,并能够结合二次根式的性质对二次根式进行化简。
3. 掌握二次根式的混合运算法则,并能够熟练地进行混合运算。
教学重难点
1. 重点
(1)二次根式的除法运算及其混合运算;
(2)商的算术平方根。
2. 难点
(1)结合二次根式的乘除法运算以及积与商的算术平方根的性质对二次根式进行计算化简;
(2)对二次根式进行混合运算,注意结果化到最简;
知识点01 百分位与四分位数
1. 百分位数的定义:
一组数据按照从小到大的顺行排列,中位数是从中间点把数据分成2等份,把数据分成100等份的每一个分点处的值叫做这组数据的百分位数。
相较于中位数,百分位数能更全面的反映数据的分布信息。
2. 四分位数:
把一组数据从小到大排好序后,把所有数据平均分成 4等份,处在三个分割点上的数值,就是四分位数。
中位数把所有数据分成2等份,所有数据中小于中位数的占 50 %,所以称为这组数据的50%分位数。在的左侧和右侧,还可以分别得到各自的中位数和,所有数据中小于这两个值的数据分别占 25 %和 75 %,所以被称为25%分位数和75%分位数。由于把这组由小到大排列的数据分成四等份,所有称他们为这组数据的四分位数,从小到大分别是 第一 四分位数(), 第二 四分位数(又叫 中位数 )以及 第三 四分位数。
【即学即练1】
1.求下列数据的四分位数:8,9,6,7,6,6,7,10,9,9,8,7.
【答案】下四分位数为6.5,中位数为7.5,上四分位数为9.
【解答】解:将数据按从小到大排序为:6,6,6,7,7,7,8,8,9,9,9,10,
中位数为:,
前6个数的中位数为:,
后6个数的中位数为:,
答:该组数据的下四分位数为6.5,中位数为7.5,上四分位数为9.
【即学即练2】
2.现有一组数据分别为:106,113,96,98,100,102,104,112,则上四分位数是( )
A.113 B.112 C.106 D.109
【答案】D
【解答】解:这8名同学每分钟跳绳的个数按从小到大的顺序排列为:
96,98,100,102,104,106,112,113,
则这组数据中“上四分位数”是第6个与第7个数的平均数,即109.
故选:D.
【即学即练3】
3.经调查八年级(1)班7位同学每周阅读时间(单位:min)分别为78,80,85,90,79,82,83,则这组数据的下四分位数为( )
A.80 B.82 C.85 D.79
【答案】D
【解答】解:先将数据从小到大排列,找到整体数据的中位数,下四分位数是前半部分数据的中位数可知:
数据重新排列78,79,80,82,83,85,90,
中位数即50%分位数为:m50=82min;
前半部分数据的中位数为整组数据的下四分位数,则:78,79,80中,
m25=79min.
故选:D.
知识点02 箱线图
1. 箱线图:
箱线图也叫箱形图、盒须图,主要是由矩形箱体和从箱体延伸出的两条水平线段(称为须线)构成。箱线图的最左侧与最右侧的竖直线段分别表示这组数据的 最小值 和 最大值 ,中间箱体的左端竖线表示 第一四分位数 ,箱体中部的竖线表示 第二四分位数(中位数) ,箱体右端竖线表示 第三四分位数 。整个箱体的长度表示第三四分位数与第一四分位数的差,称为 四分位距 。
如图:
在最小值和最大值之外的叫做异常值。
2. 画箱线图的一般步骤:
(1) 画数轴,起点比最小值稍小,终点比最大值稍大,选取合适的单位长度,与数轴的单位长度一致;
(2) 求数据的 第一四分位数 、 第二四分位数 、 第三四分位数 ;
(3) 画 最小值 、 第一四分位数 、 第二四分位数 、 第三四分位数 以及 最大值 对应的垂直于数轴的五条线段;
(4) 用实线连接表示第一四分位数与第三四分位数的线段端点形成箱子形状,再连接最小值与第一四分位数、第三四分位数与最大值线段的中点。
【即学即练1】
4.2024年初教育部体育卫生与艺术教育司将开展“义务教育阶段学生每天体育锻炼2小时试点”列入年度工作要点.为对比不同经济发展水平地区初中生体育锻炼时长差异,选取东部发达城市A市、中部地级市B市、西部县域C县作为样本地区.通过分层随机抽样各选取30名初二学生,记录其2024年9月第一周参加体育锻炼的有效时间(单位:时,剔除体育课强制锻炼时长),数据如下:
A市数据:3,4,5,5,6,6,7,7,7,8,8,9,9,10,10,11,12,12,14,15,15,16,16,17,18,18,19,20,21,22.
B市数据:2,3,4,4,5,5,6,6,7,7,8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15,16,17,25,28.
C县数据:1,2,3,3,4,4,5,5,6,6,7,7,8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,16,17,30.
请根据以上数据完成下列问题:
(1)分别计算A市、B市、C县数据的中位数、第25百分位数和第75百分位数.
(2)在同一个图中绘制A市、B市、C县30名初二学生参加体育锻炼有效时间的箱线图.
【答案】(1)A市:中位数是10.5,第25百分位数为7,第75百分位数为16;
B市:中位数是10,第25百分位数为6,第75百分位数为14;
C县:中位数为9,第25百分位数为5,第75百分位数为13;
(2).
【解答】解:(1)A市:把30个数据从小到大排列,第15和16个数据分别是10和11,
则中位数是(10+11)÷2=10.5,
第8个数据是7,则第25百分位数为7,
第23个数据是16,则第75百分位数为16;
B市:把30个数据从小到大排列,第15和16个数据都是10,
则中位数是(10+10)÷2=10,
第8个数据是6,则第25百分位数为6,
第23个数据是14,则第75百分位数为14;
C县:把30个数据从小到大排列,第15和 16个数据都是9,
则中位数为 (9+9)÷2=9,
第8个数据是5,则第25百分位数为5,
第23个数据是13,则第75百分位数为13.
(2)如图.
【即学即练2】
5.已知A,B两个班的人数相同,在一次测试中两个班成绩的箱线图如图所示(满分120分),则下列说法错误的是( )
A.这次考试A、B两个班都没有人考满分
B.A班的最低分比B班的最低分低
C.A班成绩的上四分位数与B班成绩的中位数相同
D.A班的成绩比B班的成绩更集中
【答案】D
【解答】解:根据箱线图的相关概念逐项分析判断如下:
A、由图可知A、B班的最高分都未达到1(20分),所以两班均没有满分,说法正确,不符合题意;
B、A班的最低分比B班的最低分低,说法正确,不符合题意;
C、A班成绩的上四分位数与B班成绩的中位数相同,说法正确,不符合题意;
D、B班的成绩比A班的成绩更集中,原说法错误,符合题意;
故选:D.
【即学即练3】
6.李老师根据期中考试的五科成绩,绘制了如下的箱线图.请你根据各科的统计图分析各科成绩情况.
【答案】见解答.
【解答】解:李老师根据期中考试的五科成绩,根据各科的统计图分析各科成绩情况.绘制了如下的箱线图.
语文最高分为92,最低分为60,成绩中位数为75,中位数接近箱体中心,说明成绩整体表现较为均衡.
英语最高分为98,最低分为70,成绩中位数为85,中位数接近箱体中心,说明成绩整体表现较为均衡.
数学最高分为100,最低分为61,成绩差异大,成绩中位数为70,整体偏低,又上须极长,说明少数学生成绩突出,但大部分学生集中在低分段;
历史最高分为95,最低分为60,成绩中位数为86,中位数靠近箱体上部,下须较长,大部分学生集中在高分段;
地理最高分为100,最低分为70,成绩中位数为80,上须较长,说明少数学生成绩突出.
知识点03 组内离差平方和与组间离差平方和
1. 组内离差平方和与组间离差平方和的定义:
若有个数据分别是,这组数据的离差平方和即为,如果把这组数据分成两组,前个数据为一组,后个数据为一组,两组的平均数分别记为和,离差平方和分别记为和,则 叫做组内离差平方和, 叫做组间离差平方和, 。
2. 利用组内离差平方和进行分组的一般步骤:
(1) 排序:将数据进行从小到大(或从大到小)排序;
(2) 分组:将所有数据按顺序进行分组,写出所有可能的分组情况;
(3) 计算:计算每一组分组情况的离差平方和;
(4) 比较:比较每一组分组情况的离差平方和;
(5) 结果:按照离差平方和最小的一组进行分组。
【即学即练1】
7.某小组的五名同学的身高(单位:cm)分别为160,170,167,165,178.把这5个数据从小到大排列后进行了分组,前3个数据分成一组,后2个数据分成另一组,可求得组内离差平方和为 58 ,组间离差平方和为 120 .
【答案】58,120.
【解答】解:把这5个数据从小到大排为160,165,167,170,178,第一组数据的平均数为:(160+165+167)÷3=164,
第二组数据的平均数为:(170+178)÷2=174,
所以组内离差平方和为:(160﹣164)2+(165﹣164)2+(167﹣164)2+(170﹣174)2+(178﹣174)2=58,分组前平均数为:(160+165+167+170+1781)=168,
所以组间离差平方和:3×(164﹣168)2+×(174﹣168)2=120.
所以组间离差平方和为:58,120.
【即学即练2】
8.某班有5名同学参加一分钟跳绳比赛,体育老师要将他们分成两组进行训练,使得同一组内同学的跳绳成绩尽量接近,便于统一安排训练强度.将5名同学的跳绳次数从小到大排序后分成两组,共有4种分组情况,各组对应的组内离差平方和如表所示:
序号
分组情况
组内离差平方和
1
第一组1人,第二组4人
18.75
2
第一组2人,第二组3人
10.67
3
第一组3人,第二组2人
12.50
4
第一组4人,第二组1人
14.75
则5名同学跳绳成绩的最优分组序号是( )
A.1 B.2 C.3 D.4
【答案】B
【解答】解:由题意可知,第2组的组内离差平方和最小,所以第2组的方差最小,即第2组同学的跳绳成绩最接近.
故选:B.
【即学即练3】
9.现有一批苹果,从中随机抽取10个,测得它们的直径(单位:mm)如下:
79,81,85,80,75,78,76,83,82,78.
根据直径的组内离差平方和最小的原则,把这10个苹果分为两组.
【答案】按照“组内离差平方和最小”的方法,把10个苹果按直径大小分成的两组是{75,76,78,78,79},{80,81,82,83,85}.
【解答】解:将10个数据由小到大排序:75,76,78,78,79,80,81,82,83,85.
把10个数据分成两组,共有9种情况:第一组1个数据{75},第二组9个数据{76,…,85};
第一组2个数据{75,76},第二组8个数据{78,…,85};
…;
第一组9个数据{75,…,83},第二组1个数据{85}.
∴计算9种分组情况的组内离差平方和,结果如下:
分组情况
组内离差平方和
第一组1个数,第二组9个数
63.56
第一组2个数,第二组8个数
44
第一组3个数,第二组7个数
39.53
第一组4个数,第二组6个数
30.08
第一组5个数,第二组5个数
25.6
第一组6个数,第二组4个数
26.08
第一组7个数,第二组3个数
31.53
第一组8个数,第二组2个数
41.88
第一组9个数,第二组1个数
56.89
计算结果表明,第4种情况的组内离差平方和最小.
因此,把10个苹果按直径大小分成的两组是{75,76,78,78,79},{80,81,82,83,85}.
题型01 求百分数或四分位数
【典例1】四分位数是在统计学中把所有数值由小到大排列并分成四等份后,处于三个分割点位置的数值.第一四分位数,又称”较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字,第二四分位数就是中位数.如果数据的个数是偶数,那么中位数是中间两个数的平均数,可用相似的处理方式计算第一、第三四分位数.九年级某小组的8名同学每分钟跳绳的个数分别为:165、182、136、112、145、171、155、93.这组数据中第一四分位数是( )
A.102.5 B.168 C.124 D.150
【答案】C
【解答】解:这8名同学每分钟跳绳的个数按从小到大的顺序排列为:
93、112、136、145、155、165、171、182,
则这组数据中第一四分位数是第2个与第3个数的平均数,即124.
故选:C.
【变式1】某校选拔14名学生参加济南市第一届运动会,测量心率的统计结果如下表所示:
心率/(次/分)
60
68
70
73
80
人数/名
2
3
4
4
1
则这组数据的下四分位数为 68 .
【答案】68.
【解答】解:这组数据重新排列为60,60,68,68,68,70,70,70,70,73,73,73,73,80,
前一组数据为60,60,68,68,68,70,70,
所以这组数据的上四分位数为68,
故答案为:68.
【变式2】数据组1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4,5,5,5,10的下四分位数、上四分位数分别为( )
A.2,4 B.3,4 C.2,3 D.2,5
【答案】A
【解答】解:下四分位数位于第25%个数据,取第5和第6个数据的平均值:,
上四分位数位于第75%个数据,取第15和第16个数据的平均值:,
故选:A.
【变式3】某市12月16﹣31日每日的最高气温(单位:℃)依次如下:
5,3,2,2,2,2,3,3,5,5,﹣2,﹣2,﹣5,﹣1,﹣1,﹣1.
求这组数据的四分位数m25,m50,m75.
【答案】m25=﹣1;m50=2;m75=3.
【解答】解:﹣5,﹣2,﹣2,﹣1,﹣1,﹣1,2,2,2,2,3,3,3,5,5,5,
∴第4和第5个数分别是﹣1,﹣1,
∴m25=﹣1;
∴第8和第9个数分别是2,2,
∴m50=2;
∴第13和第14个数分别是3,3,
∴m75=3.
题型02 箱线图的信息处理及求值
【典例1】小明记录了20名同学1min跳绳的次数,如下:(单位:个)
89 120 97 101 76 59 67 86 56 68 77 60 90 82 104 71 90 40 73 81
(1)求这20名同学1min跳绳次数的最小值、下四分位数、中位数、上四分位数和最大值;
(2)请根据上述四分位数绘制箱线图.
【答案】(1)最小值为40,最大值为120,下四分位数为67.5,中位数为79,上四分位数为90;
(2).
【解答】解:(1)把20名同学1min跳绳的次数从小到大排列为:40,56,59,60,67,68,71,73,76,77,81,82,86,89,90,90,97,101,104,120,
最小值为40,最大值为120,下四分位数为67.5,中位数为79,上四分位数为90;
(2)如图所示:
【变式1】有A,B两个跳远小组,每组12人.在某次跳远测试中,成绩(单位:m)统计如下:
A组:4.77,3.98,6.44,4.89,2.15,3.85,3.64,3.21,3.18,2.02,4.11,4.10.
B组:3.18,3.84,3.99,3.67,3.40,3.60,4.10,4.21,4.15,4.44,3.87,3.91.
(1)求这两组跳远成绩的四分位数,并绘制箱线图.
(2)根据(1)中绘制的箱线图,请比较A,B两组跳远的成绩,若要从中选一组参加比赛,你有何看法?
【答案】(1)A组:Q13.195,Q23.915,Q34.44;
B组:Q13.635,Q23.89,Q34.125.
绘制箱线图:
(2)从箱线图可以看出,B组成绩更稳定,整体更均衡,
∴从中选择一组,应优选B组.
【解答】解:(1)将A组数据从小到大排列:2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44,
∴Q13.195,Q23.915,Q34.44;
最小值:2.02,最大值:6.44;
将B组数据从小到大排列:3.18,3.40,3.60,3.67,3.84,3.87,3.91,3.99,4.10,4.15,4.21,4.44,
∴Q13.635,Q23.89,Q34.125.
最小值:3.18,最大值,4.44
绘制箱线图:
(2)从箱线图可以看出,B组成绩更稳定,整体更均衡,
∴从中选择一组,应优选B组.
【变式2】某老师绘制了一次数学小测验中甲、乙、丙三个班级学生得分的箱线图(如图),根据该图判断下列说法正确的是( )
A.三个班级中,甲班分数的方差最大
B.三个班级中,乙班学生得分两极分化最不明显
C.丙班学生得分的中位数高于甲班学生得分的中位数
D.若每班有42个学生,则三个班级中每班第11名的成绩相比较,甲班分数最高
【答案】C
【解答】解:A、箱线图中,数据的离散程度可通过箱线图的宽度来判断,宽度越窄,数据越集中,方差越小.甲班箱线图的宽度相对较窄,说明甲班分数更集中,所以甲班分数的方差最小,故错误;
B、由箱线图可知,乙班中最大值较另两个班更大,最小值较另两个班更小,故乙班分数的波动最大,故错误;
C、由箱线图可知,丙班的中位数大于80,故丙班得分高于80分的学生人数多于得分低于80分的学生人数,丙班学生得分的中位数高于甲班学生得分的中位数,故正确;
D、每班有42个学生,第11名的分数是按从高到低排序后的第11个数据,从箱线图看,丙班的分数最高,故错误;
故选:C.
【变式3】一组数据(都是整数):5,5,7,8,9,7,11,13,10,6,a,b.这组数据的箱线图如图所示.若数据中a<b,则a的值等于 7 .
【答案】7.
【解答】解:把已知的数从小到大排列为5,5,6,7,7,8,9,10,11,13,
因为数据(都是整数):5,5,7,8,9,7,11,13,10,6,a,b的中位数是7.5,下分四位数为6.5,a<b,
所以a=7,b=8,
故答案为:7.
题型03 组内(间)离差平方和及其应用
【典例1】将数据1,3,5,7,9分为{1,3}和{5,7,9}两组,则组内离差平方和为 10 .
【答案】10.
【解答】解:计算每组数据的均值,然后求每组数据与均值的离差平方和可知:
对于组{1,3},平均值,
离差平方和:S1=(1﹣2)2+(3﹣2)2=1+1=2;
对于组{5,7,9},平均值,
离差平方和:S2=(5﹣7)2+(7﹣7)2+(9﹣7)2=4+0+4=8;
总组内离差平方和S=S1+S2=2+8=10.
故答案为:10.
【变式1】某小组6名学生的数学考试成绩(单位:分)分别为88,98,90,92,90,96老师决定将这些成绩分为两组,以便更好地分析学生的成绩分布,若按照以下分组方式:第一组{88,90,90,92},第二组{96,98},则组内离差平方和为 10 .
【答案】10.
【解答】解:根据离差平方和是各组内数据与本组平均数之差的平方和,组内离差平方和为两组离差平方和之和,先分别计算两组的离差平方和,再求和如下:
第一组数据为{88,90,90,92},
第一组数据的平均数为:,
第一组的离差平方和为:(88﹣90)2+(90﹣90)2+(90﹣90)2+(92﹣90)2=4+0+0+4=8,
第二组数据为{96,98},
第二组数据的平均数为:,
第二组的离差平方和为:(96﹣97)2+(98﹣97)2=1+1=2,
因此组内离差平方和为8+2=10.
故答案为:10.
【变式2】按照“组内离差平方和最小”的方法将6个数据分成了两组,第一组是{2,4},第二组是{5,6,6,7},则该分组情况下的组内离差平方和是 4 .
【答案】4.
【解答】解:第一组:平均值为3,
组内离差平方和为(2﹣3)2+(4﹣3)2=2.
第二组:平均值为6,
组内离差平方和为(5﹣6)2+(6﹣6)2+(6﹣6)2+(7﹣6)2=2.总组内离差平方和:2+2=4.
故答案为:4.
【变式3】在大数据分析中,数据的分组是重要的方法之一.虽然有多种方法可以对数据进行分组,但是使得“组内离差平方和最小”的方法是最传统的,也是最合理的.下表是把1,2,3,4,5这5个数据从小到大排列后进行了分组.
分组情况
组内离差平方和
组间离差平方和
离差平方和
第一组数据
第二组数据
1
2,3,4,5
5
5
10
1,2
3,4,5
a
b
10
1,2,3
4,5
c
d
10
1,2,3,4
5
5
5
10
(1)求a,b的值.
(2)直接写出c,d的值.
(3)根据分组的情况,说明如何分组会比较合理.
【答案】(1)a=2.5,b=7.5;
(2)(2)c=2.5,d=7.5;
(3)分成{1,2}和{3,4,5}或{1,2,3}和{4,5},能使“组内离差平方和最小”,这样的分组比较合理.
【解答】解:(1)∵1.5,4,
∴,2,
∴a=0.5+2=2.5,
∵3,
∴b=2×(1.5﹣3)2+3×(4﹣3)2=7.5;
(2)c=2.5,d=7.5;
(3)由分组情况可知,把5个数分成{1,2}和{3,4,5}或{1,2,3}和{4,5},能使“组内离差平方和最小”,这样的分组比较合理.
1.某地有8个快递收件点,在某天接收到的快递个数分别为360,284,290,300,188,240,260,288,则这组数据的上四分位数为( )
A.290 B.295 C.300 D.330
【答案】B
【解答】解:这8个数按从小到大的顺序排列为:188,240,260,284,288,290,300,360,
则这组数据中“上四分位数”是6个与第7个数的平均数,即295.
故选:B.
2.九年级某小组的8名同学每分钟跳绳的个数分别为:165、182、136、112、145、171、155、93.这一数据中下四分位数是( )
A.102.5 B.168 C.124 D.150
【答案】C
【解答】解:这8名同学每分钟跳绳的个数按从小到大的顺序排列为:
93、112、136、145、155、165、171、182,
∴这组数据中第一四分位数是第2个与第3个数的平均数,即124.
故选:C.
3.将数据2,8,4,10,1,7按照组内差异最小的原则分为两组时,需对( )种分组方法分别进行组内离差平方和进行计算比较.
A.4 B.5 C.6 D.3
【答案】B
【解答】解:把数据从小到大排列:1,2,4,7,8,10,
把数据分组为:{1}和{2,4,7,8,10};
{1,2}和{4,7,8,10};
{1,2,4}和{7,8,10};
{1,2,4,7}和{8,10};
{1,2,4,7,8}和{10}.
共5种分组方法,
故选:B.
4.若把1,3,5,7分成1,3和5,7两组,则它们的组内离差平方和为( )
A.3.5 B.3.75 C.4 D.4.25
【答案】C
【解答】解:对于组{1,3},平均值2,
离差平方和:S1=(1﹣2)2+(3﹣2)2=1+1=2;
对于组{5,7},平均值6,
离差平方和:S2=(5﹣6)2+(7﹣6)2=1+1=2;
总组内离差平方和S=S1+S2=2+2=4.
故选:C.
5.小伟参加如弈围棋学生社团2025年度校园挑战赛,共进行了12场比赛.积分统计小组根据小伟这12场比赛的得分作了如图统计图,下列说法正确的是( )
A.比赛最高得分是50分
B.比赛得分的中位数是50分
C.比赛得分数据集中在44.25~50分之间
D.比赛得分的上四分位数是44.25分
【答案】C
【解答】解:由箱线图可知,
比赛最高得分是55分,故选项A说法错误,不符合题意;
比赛得分的中位数是45分,故选项B说法错误,不符合题意;
比赛得分数据集中在44.25~45分之间,说法正确,故选项C符合题意;
比赛得分的下四分位数是44.25分,故选项D说法错误,不符合题意.
故选:C.
6.校运动队统计男、女各5名队员的一周训练达标次数,数据整理如图,分析两组队员的达标情况,说法正确的是( )
A.男生训练达标次数的平均数高于女生
B.男、女生训练达标次数的离差平方和相等
C.男、女生训练达标次数的中位数均为4
D.男、女生训练达标次数平均数相同,女生达标情况更稳定
【答案】D
【解答】解:男生的平均数:5;
女生平均数:5,
∴男、女生训练达标次数的平均数相等,
故A错误;
男生的离差平方和:(4﹣5)2+(5﹣5)2+(2﹣5)2+(8﹣5)2+(6﹣5)2=1+0+9+9+1=20;
女生的离差平方和:(5﹣5)2+(3﹣5)2+(7﹣5)2+(6﹣5)2+(4﹣5)2=0+4+4+1+1=10;
∴男、女生训练达标次数的离差平方和不相等,
故B错误;
把男生训练达标次数从小到大排列:2,4,5,6,8,
∴中位数为5;
把女生训练达标次数从小到大排列:3,4,5,6,7,
∴中位数为5;
∴男、女生训练达标次数的中位数均为5,
故C错误;
男生训练达标次数的方差:[(4﹣5)2+(5﹣5)2+(2﹣5)2+(8﹣5)2+(6﹣5)2]20=4;
女生训练达标次数的方差:[(5﹣5)2+(3﹣5)2+(7﹣5)2+(6﹣5)2+(4﹣5)2]10=2;
∵2<4,
∴男、女生训练达标次数平均数相同,女生达标情况更稳定,
故D正确;
故选:D.
7.为了解哪个城市夏天更热,小星调查了贵阳市9月份的气温,并将每天的平均气温情况进行统计分析,将数据绘制成箱线图,则下列说法不正确的是( )
A.这组数据的下四分位数是23.5℃
B.这组数据的中位数是27.5℃
C.这组数据的上四分位数是29℃
D.这组数据的最小值是20℃,最大值是35℃
【答案】B
【解答】解:根据箱线图中各数据表示的意义逐项分析判断如下:
A.下四分位数是23.5℃,故该选项正确,不符合题意;
B.中位数是25.5℃,故该选项错误,符合题意;
C.上四分位数是29℃,故该选项正确,不符合题意;
D.最小值是20℃,最大值是35℃,故该选项正确,不符合题意;
故选:B.
8.如图为某工厂2025年11月和12月的日平均噪声强度(单位:分贝)箱线图.噪声强度越小,环境越安静,若噪声强度在65分贝以上,说明属于重度噪声污染.则下列说法错误的是( )
A.该工厂2025年12月有重度噪声污染日
B.该工厂2025年12月的日平均噪声强度分布比11月集中
C.该工厂2025年11月日平均噪声强度的下四分位数是40分贝
D.该工厂2025年11月日平均噪声强度的中位数低于12月日平均噪声强度的中位数
【答案】B
【解答】解:根据箱线图中的最小值、下四分位数、中位数、上四分位数、最大值逐项分析判断如下:
选项A:12月箱线图最大值为68分贝,属于重度噪声污染,正确,不符合题意;
选项B:11月的数据总跨度为58﹣39=19,12月的数据总跨度为68﹣37=31,表明12月的日平均噪声强度分布比11月分散,而不是集中,错误,符合题意;
选项C:11月日平均噪声强度的下四分位数是40分贝,正确,不符合题意;
选项D:11月的日平均噪声强度为46,12月的日平均噪声强度为50,11月的日平均噪声强度小于12月的日平均噪声强度,正确,不符合题意;
故选:B.
9.在统计学中经常用一组数据的最小值、下四分位数、中位数、上四分位数和最大值画出箱线图来反映数据的分布情况.如图1所示,在箱线图中,位于最下面和最上面的实横线分别表示下边缘(最小值)和上边缘(最大值),中间箱体的底端是下四分位数,箱体中部的“×”表示平均值,箱体的顶端是上四分位数.异常值是明显偏离样本的个别值.已知一班和二班人数相等,在一次考试中两班成绩的箱线图如图2所示,则下列说法正确的是( )
A.一班成绩比二班成绩集中
B.一班成绩的上四分位数是80
C.一班有同学的成绩超过140分
D.一班的平均分高于二班的平均分
【答案】C
【解答】解:对于A,由图可得二班成绩比一班成绩更集中,故A错误,
对于B,由图可得一班成绩的下四分位数是80,故B错误,
对于C,由图可得一班有异常值超过140分,故C正确,
对于D,由图可得一班的平均分低于二班的平均分,故D错误.
故选:C.
10.某班级10名学生的数学成绩(单位:分)如下:65,72,58,80,75,68,85,90,62,78.将这些数据按从小到大的顺序排列后,按组内离差平方和最小的分法为( )
A.{58,62,65,68}和{72,75,78,80,85,90}
B.{58,62,65,68,72}和{75,78,80,85,90}
C.{58,62,65,68,72,75}和{78,80,85,90}
D.{58,62,65,68,72,75,78}和{80,85,90}
【答案】B
【解答】解:A、对于{58,62,65,68},平均数为63.25,离差平方和为54.75;对于{72,75,78,80,85,90},平均数为80,离差平方和为218,
∴组内离差平方和为54.75+218=272.75;
B、对于{58,62,65,68,72},平均数为65,离差平方和为116;对于{75,78,80,85,90},平均数为81.6,离差平方和为141.2,
∴组内离差平方和为116+141.2=257.2;
C、对于{58,62,65,68,72,75},平均数为66.67,离差平方和为199.3;对于{78,80,85,90},平均数为83.25,离差平方和为86.75,
∴组内离差平方和为199.3+86.75=286.08;
D、对于{58,62,65,68,72,75,78},平均数为68.29,离差平方和为309.42;对于{80,85,90},平均数为85,离差平方和为50,
∴组内离差平方和为309.42+50=359.42.
综上可得,按组内离差平方和最小的分法为{58,62,65,68,72}和{75,78,80,85,90}.
故选:B.
11.某校举办了一次“我爱家乡”知识竞赛,已知一班和二班人数相等,此次竞赛中两班成绩的箱线图如图所示,则成绩比较集中的班级是 二 班.
【答案】二.
【解答】解:由箱线图可知,一班在50和140之间波动,二班在70和130之间波动,
所以成绩比较集中的班级是二班.
故答案为:二.
12.已知一组数据5,4,2,a,7,10的平均数为5,关于这组数据有下列说法:①众数为2;②中位数是4.5;③第75百分位数为7;④离差平方和为.其中,正确的是 ①②③ (填序号).
【答案】①②③.
【解答】解:由题意得:a=6×5﹣(5+4+2+7+10)=2,
将数据按照从小到大排列为:2,2,4,5,7,10,
故众数是2,中位数是4.5,第75百分位数为7,离差平方和为:2×(2﹣5)2+(4﹣5)2+(5﹣5)2+(7﹣5)2+(10﹣5)2=48,
所以正确的是①②③.
故答案为:①②③.
13.一组数据按从小到大的顺序排列为1、1、3、x、4、6.若这组数据的中位数为3,则这组数据的离差平方和是 18 .
【答案】18.
【解答】解:∵按从小到大的顺序排列为1,1,3,x,4,6,第3个数是3,第4个数为x,
∵这组数据的中位数为3,
∴3,
解得x=3,
∴这组数据的平均数是:(1+1+3+3+4+6)÷6=3,
∴这组数据的离差平方和:(1﹣3)2+(1﹣3)2+(3﹣3)2+(3﹣3)2+(4﹣6)2+(6﹣3)2=4+4+0+0+1+9=18,
故答案为:18.
14.某次体能检测中,第一小组5名同学做仰卧起坐的个数分别为28,38,35,48,46,按组内离差平方和最小的原则,将这5名同学仰卧起坐的个数分为两组为 {28,35,38} 和 {46,48} .
【答案】{28,35,38};{46,48}.
【解答】解:将5名同学完成个数按从小到大排列可得28,35,38,46,48,
将它们分成两组共有4种情况,分别计算组内离差平方和如下:
分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第1个间隔
0
116.75
116.75
第2个间隔
24.5
56
80.5
第3个间隔
52.67
2
54.67
第4个间隔
166.75
0
166.75
观察最后一列组内离差平方和可以发现,当按第3个间隔分组时,组内离差平方和最小,
因此,按组内离差平方和最小原则将这5名同学仰卧起坐的个数分为{28,35,38}和{46,48}.
故答案为:{28,35,38};{46,48}.
15.已知一组数据按从小到大排列如下:11,12,15,x,17,y,22,26.经计算,该组数据的中位数是16,上四分位数是20,则x= 15 ,y= 18 .
【答案】15;18.
【解答】解:∵该组数据的中位数是16,
∴16,
x+17=32,
解得x=15,
∵该组数据上四分位数是20,
∴20,
y+22=40,
解得y=18,
故答案为:15;18.
16.某数学兴趣小组收集了10个数据:10,12,14,16,18,20,22,24,26,28.现需将这些数据分成两组,每组5个数.两种分组方案如下:
方案一:A组={10,12,14,16,18}
B组={20,22,24,26,28}
方案二:C组={10,14,18,22,26}
D组={12,16,20,24,28}
(1)分别计算两种方案的组内离差平方和;
(2)根据组内离差平方和的大小,判断哪种分组方案更合理,并简要说明理由.
【答案】(1)方案一的组内离差平方和80;方案二的组内离差平方和320;
(2)方案一的分组更合理,理由:
组内离差平方和反应组内数据的离散程度,平方和越小,组内数据越集中,差异越小,
∵80<320,
∴方案一的分组更合理.
【解答】解:(1)方案一:A组={10,12,14,16,18},
14,
离差平方和:(10﹣14)2+(12﹣14)2+(14﹣14)2+(16﹣14)2+(18﹣14)2=16+4+0+4+16=40;
B组={20,22,24,26,28},
24,
离差平方和:(20﹣24)2+(22﹣24)2+(24﹣24)2+(66﹣24)2+(28﹣24)2=16+4+0+4+16=40;
方案一的组内离差平方和:40+40=80;
方案二:C组={10,14,18,22,26},
18,
离差平方和:(10﹣18)2+(14﹣18)2+(18﹣18)2+(22﹣18)2+(26﹣18)2=64+16+0+16+64=160;
D组={12,16,20,24,28},
20,
离差平方和:(12﹣20)2+(16﹣20)2+(20﹣20)2+(24﹣20)2+(28﹣20)2=64+16+0+16+64=160;
方案二的组内离差平方和:160+160=320;
(2)方案一的分组更合理,理由:
组内离差平方和反应组内数据的离散程度,平方和越小,组内数据越集中,差异越小,
∵80<320,
∴方案一的分组更合理.
17.为了解学生的晨读效率,学校从七、八年级各随机抽取12名学生的晨读打卡积分(单位:分)进行统计分析,并绘制了不完整的箱线图.
七年级积分:55,65,65,75,78,85,88,90,92,95,98,100;
八年级积分:68,75,77,82,86,88,90,91,91,93,94,96.
整理得到如下积分统计表:
年级
平均数
中位数
众数
七年级
81.5
m
65
八年级
85.2
n
P
(1)求统计表中m,n,p的值;
(2)补全七年级学生晨读打卡积分的箱线图,并通过对比两个年级的箱线图,初步判断哪个年级抽取的学生晨读打卡积分更集中、更稳定.
【答案】(1)m=86.5,n=89,p=91;
(2),从而箱线图可得抽取的学生晨读打卡积分更集中、更稳定.
【解答】解:(1)七年级积分排序:55,65,65,75,78,85,88,90,92,95,98,100,
∴中位数m86.5,
八年级积分排序:68,75,77,82,86,88,90,91,91,93,94,96,
∴中位数n89,众数p=91;
(2)七年级上四分位数m75为93.5,下四分位数m25为70,中位数为86.5,
补全七年级学生晨读打卡积分的箱线图如下:
∴从而箱线图可得抽取的学生晨读打卡积分更集中、更稳定.
18.甲、乙两组的测试成绩(单位:分)如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1)求甲组成绩的四分位数.
(2)根据四分位数可绘制如下的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图.
(3)根据箱线图和对四分位数的理解,谈谈对两组成绩的看法.
【答案】(1)m25=70,m50=90,m75=96;
(2)
(3)根据箱线图和四分位数可知甲组成绩的中位数和乙组相同,但甲组成绩明显比乙组的波动大.
【解答】解:(1)将甲组的成绩从小到大排列为 60,70,70,80,89,91,92,96,98,100,所以m25=70,,m75=96;
(2)根据甲组的四分位数绘制箱线图如下:
(3)根据箱线图和四分位数可知甲组成绩的中位数和乙组相同,但甲组成绩明显比乙组的波动大.
19.为了提升学生体质健康水平,学校组织学生进行排球垫球的活动.体育老师将八三班的12名女生平均分分为甲、乙两队,下面记录的是两队女生的垫球个数(垫球高度不低于2米的为有效垫球数,低于2米的为无效垫球数).
信息1:两个班级学生的有效垫球数
甲队垫球情况(单位:个):20,18,32,30,26,30;
乙队垫球情况(单位:个):24,26,22,26,28,30;
信息2:
信息3:技术统计表
队伍
平均垫球个数
垫球众数
垫球中位数
垫球数的方差
平均无效垫球数
甲队
26
30
m
2
乙队
26
n
27
5
根据以上信息,回答下到问题:
(1)表格中的m= 28 ,n= 26 , > (填“>”“=”或“<”);
(2)请补全信息2中甲队有效垫球数的箱线图?
(3)结合信息3的数据统计表,请同学们给甲队和乙队的女生分别提出一个改进的建议?
【答案】(1)28,26,>;
(2);
(3)甲队数据比较分散,建议加强稳定性练习,乙队数据比较集中,稳定性较好,建议整体提高垫球水平(答案不唯一).
【解答】解:(1)把甲队垫球的数据从小到大排列为:18,20,26,30,30,32,故甲队垫球的中位数为28,即m=28;
乙队垫球中26出现的次数最多,故众数n=26;
S2甲[(18﹣26)2+(20﹣26)2+(26﹣26)2﹣2×(30﹣26)2+(32﹣26)2]=28,
S2乙[(22﹣26)2+(24﹣26)2+2×(26﹣26)2+(28﹣26)2+(30﹣26)2].
28,
故S2甲>S2乙,
故答案为:28,26,>;
(2)甲队的下四分位数为20,上四分位数为30,中位数为28,最小值为18,最大值为32,补全信息2中甲队有效垫球数的箱线图如下:
(3)由箱线图可知,甲队数据比较分散,建议加强稳定性练习,乙队数据比较集中,稳定性较好,建议整体提高垫球水平(答案不唯一).
20.第九届亚洲冬季运动会于2025年2月7日至14日在哈尔滨举办,本届亚冬会吸引了来自亚洲34个国家和地区的1270余名运动员参赛.某校为了解学生对体育运动的了解程度,组织七、八年级全体学生进行了相关的知识竞赛,并抽样调查了七、八年级部分学生的竞赛成绩,过程如下:
【收集数据】从该校七、八年级学生中各随机抽取20名学生的成绩,其中八年级学生的成绩如下(单位:分):75,90,35,60,85,85,95,100,80,85,80,85,90,75,65,60,80,100,70,75.
【整理、描述数据】将抽取的七、八年级学生的竞赛成绩x(分)分组整理如表:
竞赛成绩x/分
x<60
60≤x<70
70≤x<80
80≤x<90
90≤x≤100
七年级人数
2
3
6
5
4
八年级人数
1
3
a
7
5
【分析数据】七、八年级学生竞赛成绩数据的平均数、中位数、下四分位数、上四分位数如表:
年级
平均数
中位数
下四分位数
上四分位数
七年级
78.5
75
71
86
八年级
78.5
b
c
d
根据以上提供的信息,解答下列问题.
(1)填空:a= 4 ,b= 80 ,c= 72.5 ,d= 87.5 .
(2)根据以上数据,你认为该校七、八年级学生在相关知识竞赛中,哪个年级学生对体育运动的了解程度更高?请就平均数及四分位数分析.
(3)已知该校七、八年级各有800名学生,为表扬在这次竞赛中表现优异的学生,该校决定给两个年级竞赛成绩在80分及以上的学生颁发奖状,请估计该校需要准备多少张奖状.
【答案】(1)4,80,72.5,87.5;
(2)八年级学生对体育运动的了解程度更高,理由见解析;
(3)估计该校需要准备约840张奖状.
【解答】解:(1)由题意可得:a=20﹣1﹣3﹣7﹣5=4,
将八年级20名学生的竞赛成绩按照从小到大的顺序排列:
35,60,60,65,70,75,75,75,80,80,、、80,85,85,85,85,90,90,95,100,100,
∴b80,c72.5,d87.5.
故答案为:4,80,72.5,87.5;
(2)八年级学生对体育运动的了解程度更高,理由如下:
因为两个年级的学生竞赛成绩的平均数相等,都是78.5,但八年级学生成绩的中位数、下四分位数和上四分位数均高于七年级,
所以八年级学生对体育运动的了解程度更高;
(3)800840(张),
答:估计该校需要准备约840张奖状.
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$
专题24.4 数据的四分位数与数据的分组
教学目标
1. 掌握二次根式的除法运算,并能够熟练地进行运算。
2. 掌握商的算术平方根的性质,并能够结合二次根式的性质对二次根式进行化简。
3. 掌握二次根式的混合运算法则,并能够熟练地进行混合运算。
教学重难点
1. 重点
(1)二次根式的除法运算及其混合运算;
(2)商的算术平方根。
2. 难点
(1)结合二次根式的乘除法运算以及积与商的算术平方根的性质对二次根式进行计算化简;
(2)对二次根式进行混合运算,注意结果化到最简;
知识点01 百分位与四分位数
1. 百分位数的定义:
一组数据按照从小到大的顺行排列,中位数是从中间点把数据分成2等份,把数据分成100等份的每一个分点处的值叫做这组数据的百分位数。
相较于中位数,百分位数能更全面的反映数据的分布信息。
2. 四分位数:
把一组数据从小到大排好序后,把所有数据平均分成 4等份,处在三个分割点上的数值,就是四分位数。
中位数把所有数据分成2等份,所有数据中小于中位数的占 %,所以称为这组数据的50%分位数。在的左侧和右侧,还可以分别得到各自的中位数和,所有数据中小于这两个值的数据分别占 %和 %,所以被称为25%分位数和75%分位数。由于把这组由小到大排列的数据分成四等份,所有称他们为这组数据的四分位数,从小到大分别是 四分位数, 四分位数(又叫 )以及 四分位数。
【即学即练1】
1.求下列数据的四分位数:8,9,6,7,6,6,7,10,9,9,8,7.
【即学即练2】
2.现有一组数据分别为:106,113,96,98,100,102,104,112,则上四分位数是( )
A.113 B.112 C.106 D.109
【即学即练3】
3.经调查八年级(1)班7位同学每周阅读时间(单位:min)分别为78,80,85,90,79,82,83,则这组数据的下四分位数为( )
A.80 B.82 C.85 D.79
知识点02 箱线图
1. 箱线图:
箱线图也叫箱形图、盒须图,主要是由矩形箱体和从箱体延伸出的两条水平线段(称为须线)构成。箱线图的最左侧与最右侧的竖直线段分别表示这组数据的 和 ,中间箱体的左端竖线表示 ,箱体中部的竖线表示 ,箱体右端竖线表示 。整个箱体的长度表示第三四分位数与第一四分位数的差,称为 。
如图:
在最小值和最大值之外的叫做异常值。
2. 画箱线图的一般步骤:
(1) 画数轴,起点比最小值稍小,终点比最大值稍大,选取合适的单位长度,与数轴的单位长度一致;
(2) 求数据的 、 、 ;
(3) 画 、 、 、 以及 对应的垂直于数轴的五条线段;
(4) 用实线连接表示第一四分位数与第三四分位数的线段端点形成箱子形状,再连接最小值与第一四分位数、第三四分位数与最大值线段的中点。
【即学即练1】
4.2024年初教育部体育卫生与艺术教育司将开展“义务教育阶段学生每天体育锻炼2小时试点”列入年度工作要点.为对比不同经济发展水平地区初中生体育锻炼时长差异,选取东部发达城市A市、中部地级市B市、西部县域C县作为样本地区.通过分层随机抽样各选取30名初二学生,记录其2024年9月第一周参加体育锻炼的有效时间(单位:时,剔除体育课强制锻炼时长),数据如下:
A市数据:3,4,5,5,6,6,7,7,7,8,8,9,9,10,10,11,12,12,14,15,15,16,16,17,18,18,19,20,21,22.
B市数据:2,3,4,4,5,5,6,6,7,7,8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15,16,17,25,28.
C县数据:1,2,3,3,4,4,5,5,6,6,7,7,8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,16,17,30.
请根据以上数据完成下列问题:
(1)分别计算A市、B市、C县数据的中位数、第25百分位数和第75百分位数.
(2)在同一个图中绘制A市、B市、C县30名初二学生参加体育锻炼有效时间的箱线图.
【即学即练2】
5.已知A,B两个班的人数相同,在一次测试中两个班成绩的箱线图如图所示(满分120分),则下列说法错误的是( )
A.这次考试A、B两个班都没有人考满分
B.A班的最低分比B班的最低分低
C.A班成绩的上四分位数与B班成绩的中位数相同
D.A班的成绩比B班的成绩更集中
【即学即练3】
6.李老师根据期中考试的五科成绩,绘制了如下的箱线图.请你根据各科的统计图分析各科成绩情况.
知识点03 组内离差平方和与组间离差平方和
1. 组内离差平方和与组间离差平方和的定义:
若有个数据分别是,这组数据的离差平方和即为,如果把这组数据分成两组,前个数据为一组,后个数据为一组,两组的平均数分别记为和,离差平方和分别记为和,则 叫做组内离差平方和, 叫做组间离差平方和, 。
2. 利用组内离差平方和进行分组的一般步骤:
(1) 排序:将数据进行从小到大(或从大到小)排序;
(2) 分组:将所有数据按顺序进行分组,写出所有可能的分组情况;
(3) 计算:计算每一组分组情况的离差平方和;
(4) 比较:比较每一组分组情况的离差平方和;
(5) 结果:按照离差平方和最小的一组进行分组。
【即学即练1】
7.某小组的五名同学的身高(单位:cm)分别为160,170,167,165,178.把这5个数据从小到大排列后进行了分组,前3个数据分成一组,后2个数据分成另一组,可求得组内离差平方和为 ,组间离差平方和为 .
【即学即练2】
8.某班有5名同学参加一分钟跳绳比赛,体育老师要将他们分成两组进行训练,使得同一组内同学的跳绳成绩尽量接近,便于统一安排训练强度.将5名同学的跳绳次数从小到大排序后分成两组,共有4种分组情况,各组对应的组内离差平方和如表所示:
序号
分组情况
组内离差平方和
1
第一组1人,第二组4人
18.75
2
第一组2人,第二组3人
10.67
3
第一组3人,第二组2人
12.50
4
第一组4人,第二组1人
14.75
则5名同学跳绳成绩的最优分组序号是( )
A.1 B.2 C.3 D.4
【即学即练3】
9.现有一批苹果,从中随机抽取10个,测得它们的直径(单位:mm)如下:
79,81,85,80,75,78,76,83,82,78.
根据直径的组内离差平方和最小的原则,把这10个苹果分为两组.
题型01 求百分数或四分位数
【典例1】四分位数是在统计学中把所有数值由小到大排列并分成四等份后,处于三个分割点位置的数值.第一四分位数,又称”较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字,第二四分位数就是中位数.如果数据的个数是偶数,那么中位数是中间两个数的平均数,可用相似的处理方式计算第一、第三四分位数.九年级某小组的8名同学每分钟跳绳的个数分别为:165、182、136、112、145、171、155、93.这组数据中第一四分位数是( )
A.102.5 B.168 C.124 D.150
【变式1】某校选拔14名学生参加济南市第一届运动会,测量心率的统计结果如下表所示:
心率/(次/分)
60
68
70
73
80
人数/名
2
3
4
4
1
则这组数据的下四分位数为 .
【变式2】数据组1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4,5,5,5,10的下四分位数、上四分位数分别为( )
A.2,4 B.3,4 C.2,3 D.2,5
【变式3】某市12月16﹣31日每日的最高气温(单位:℃)依次如下:
5,3,2,2,2,2,3,3,5,5,﹣2,﹣2,﹣5,﹣1,﹣1,﹣1.
求这组数据的四分位数m25,m50,m75.
题型02 箱线图的信息处理及求值
【典例1】小明记录了20名同学1min跳绳的次数,如下:(单位:个)
89 120 97 101 76 59 67 86 56 68 77 60 90 82 104 71 90 40 73 81
(1)求这20名同学1min跳绳次数的最小值、下四分位数、中位数、上四分位数和最大值;
(2)请根据上述四分位数绘制箱线图.
【变式1】有A,B两个跳远小组,每组12人.在某次跳远测试中,成绩(单位:m)统计如下:
A组:4.77,3.98,6.44,4.89,2.15,3.85,3.64,3.21,3.18,2.02,4.11,4.10.
B组:3.18,3.84,3.99,3.67,3.40,3.60,4.10,4.21,4.15,4.44,3.87,3.91.
(1)求这两组跳远成绩的四分位数,并绘制箱线图.
(2)根据(1)中绘制的箱线图,请比较A,B两组跳远的成绩,若要从中选一组参加比赛,你有何看法?
【变式2】某老师绘制了一次数学小测验中甲、乙、丙三个班级学生得分的箱线图(如图),根据该图判断下列说法正确的是( )
A.三个班级中,甲班分数的方差最大
B.三个班级中,乙班学生得分两极分化最不明显
C.丙班学生得分的中位数高于甲班学生得分的中位数
D.若每班有42个学生,则三个班级中每班第11名的成绩相比较,甲班分数最高
【变式3】一组数据(都是整数):5,5,7,8,9,7,11,13,10,6,a,b.这组数据的箱线图如图所示.若数据中a<b,则a的值等于 .
题型03 组内(间)离差平方和及其应用
【典例1】将数据1,3,5,7,9分为{1,3}和{5,7,9}两组,则组内离差平方和为 .
【变式1】某小组6名学生的数学考试成绩(单位:分)分别为88,98,90,92,90,96老师决定将这些成绩分为两组,以便更好地分析学生的成绩分布,若按照以下分组方式:第一组{88,90,90,92},第二组{96,98},则组内离差平方和为 .
【变式2】按照“组内离差平方和最小”的方法将6个数据分成了两组,第一组是{2,4},第二组是{5,6,6,7},则该分组情况下的组内离差平方和是 .
【变式3】在大数据分析中,数据的分组是重要的方法之一.虽然有多种方法可以对数据进行分组,但是使得“组内离差平方和最小”的方法是最传统的,也是最合理的.下表是把1,2,3,4,5这5个数据从小到大排列后进行了分组.
分组情况
组内离差平方和
组间离差平方和
离差平方和
第一组数据
第二组数据
1
2,3,4,5
5
5
10
1,2
3,4,5
a
b
10
1,2,3
4,5
c
d
10
1,2,3,4
5
5
5
10
(1)求a,b的值.
(2)直接写出c,d的值.
(3)根据分组的情况,说明如何分组会比较合理.
1.某地有8个快递收件点,在某天接收到的快递个数分别为360,284,290,300,188,240,260,288,则这组数据的上四分位数为( )
A.290 B.295 C.300 D.330
2.九年级某小组的8名同学每分钟跳绳的个数分别为:165、182、136、112、145、171、155、93.这一数据中下四分位数是( )
A.102.5 B.168 C.124 D.150
3.将数据2,8,4,10,1,7按照组内差异最小的原则分为两组时,需对( )种分组方法分别进行组内离差平方和进行计算比较.
A.4 B.5 C.6 D.3
4.若把1,3,5,7分成1,3和5,7两组,则它们的组内离差平方和为( )
A.3.5 B.3.75 C.4 D.4.25
5.小伟参加如弈围棋学生社团2025年度校园挑战赛,共进行了12场比赛.积分统计小组根据小伟这12场比赛的得分作了如图统计图,下列说法正确的是( )
A.比赛最高得分是50分
B.比赛得分的中位数是50分
C.比赛得分数据集中在44.25~50分之间
D.比赛得分的上四分位数是44.25分
6.校运动队统计男、女各5名队员的一周训练达标次数,数据整理如图,分析两组队员的达标情况,说法正确的是( )
A.男生训练达标次数的平均数高于女生
B.男、女生训练达标次数的离差平方和相等
C.男、女生训练达标次数的中位数均为4
D.男、女生训练达标次数平均数相同,女生达标情况更稳定
7.为了解哪个城市夏天更热,小星调查了贵阳市9月份的气温,并将每天的平均气温情况进行统计分析,将数据绘制成箱线图,则下列说法不正确的是( )
A.这组数据的下四分位数是23.5℃
B.这组数据的中位数是27.5℃
C.这组数据的上四分位数是29℃
D.这组数据的最小值是20℃,最大值是35℃
8.如图为某工厂2025年11月和12月的日平均噪声强度(单位:分贝)箱线图.噪声强度越小,环境越安静,若噪声强度在65分贝以上,说明属于重度噪声污染.则下列说法错误的是( )
A.该工厂2025年12月有重度噪声污染日
B.该工厂2025年12月的日平均噪声强度分布比11月集中
C.该工厂2025年11月日平均噪声强度的下四分位数是40分贝
D.该工厂2025年11月日平均噪声强度的中位数低于12月日平均噪声强度的中位数
9.在统计学中经常用一组数据的最小值、下四分位数、中位数、上四分位数和最大值画出箱线图来反映数据的分布情况.如图1所示,在箱线图中,位于最下面和最上面的实横线分别表示下边缘(最小值)和上边缘(最大值),中间箱体的底端是下四分位数,箱体中部的“×”表示平均值,箱体的顶端是上四分位数.异常值是明显偏离样本的个别值.已知一班和二班人数相等,在一次考试中两班成绩的箱线图如图2所示,则下列说法正确的是( )
A.一班成绩比二班成绩集中
B.一班成绩的上四分位数是80
C.一班有同学的成绩超过140分
D.一班的平均分高于二班的平均分
10.某班级10名学生的数学成绩(单位:分)如下:65,72,58,80,75,68,85,90,62,78.将这些数据按从小到大的顺序排列后,按组内离差平方和最小的分法为( )
A.{58,62,65,68}和{72,75,78,80,85,90}
B.{58,62,65,68,72}和{75,78,80,85,90}
C.{58,62,65,68,72,75}和{78,80,85,90}
D.{58,62,65,68,72,75,78}和{80,85,90}
11.某校举办了一次“我爱家乡”知识竞赛,已知一班和二班人数相等,此次竞赛中两班成绩的箱线图如图所示,则成绩比较集中的班级是 班.
12.已知一组数据5,4,2,a,7,10的平均数为5,关于这组数据有下列说法:①众数为2;②中位数是4.5;③第75百分位数为7;④离差平方和为.其中,正确的是 (填序号).
13.一组数据按从小到大的顺序排列为1、1、3、x、4、6.若这组数据的中位数为3,则这组数据的离差平方和是 .
14.某次体能检测中,第一小组5名同学做仰卧起坐的个数分别为28,38,35,48,46,按组内离差平方和最小的原则,将这5名同学仰卧起坐的个数分为两组为 和 .
15.已知一组数据按从小到大排列如下:11,12,15,x,17,y,22,26.经计算,该组数据的中位数是16,上四分位数是20,则x= ,y= .
16.某数学兴趣小组收集了10个数据:10,12,14,16,18,20,22,24,26,28.现需将这些数据分成两组,每组5个数.两种分组方案如下:
方案一:A组={10,12,14,16,18}
B组={20,22,24,26,28}
方案二:C组={10,14,18,22,26}
D组={12,16,20,24,28}
(1)分别计算两种方案的组内离差平方和;
(2)根据组内离差平方和的大小,判断哪种分组方案更合理,并简要说明理由.
17.为了解学生的晨读效率,学校从七、八年级各随机抽取12名学生的晨读打卡积分(单位:分)进行统计分析,并绘制了不完整的箱线图.
七年级积分:55,65,65,75,78,85,88,90,92,95,98,100;
八年级积分:68,75,77,82,86,88,90,91,91,93,94,96.
整理得到如下积分统计表:
年级
平均数
中位数
众数
七年级
81.5
m
65
八年级
85.2
n
P
(1)求统计表中m,n,p的值;
(2)补全七年级学生晨读打卡积分的箱线图,并通过对比两个年级的箱线图,初步判断哪个年级抽取的学生晨读打卡积分更集中、更稳定.
18.甲、乙两组的测试成绩(单位:分)如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1)求甲组成绩的四分位数.
(2)根据四分位数可绘制如下的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图.
(3)根据箱线图和对四分位数的理解,谈谈对两组成绩的看法.
19.为了提升学生体质健康水平,学校组织学生进行排球垫球的活动.体育老师将八三班的12名女生平均分分为甲、乙两队,下面记录的是两队女生的垫球个数(垫球高度不低于2米的为有效垫球数,低于2米的为无效垫球数).
信息1:两个班级学生的有效垫球数
甲队垫球情况(单位:个):20,18,32,30,26,30;
乙队垫球情况(单位:个):24,26,22,26,28,30;
信息2:
信息3:技术统计表
队伍
平均垫球个数
垫球众数
垫球中位数
垫球数的方差
平均无效垫球数
甲队
26
30
m
2
乙队
26
n
27
5
根据以上信息,回答下到问题:
(1)表格中的m= ,n= , (填“>”“=”或“<”);
(2)请补全信息2中甲队有效垫球数的箱线图?
(3)结合信息3的数据统计表,请同学们给甲队和乙队的女生分别提出一个改进的建议?
20.第九届亚洲冬季运动会于2025年2月7日至14日在哈尔滨举办,本届亚冬会吸引了来自亚洲34个国家和地区的1270余名运动员参赛.某校为了解学生对体育运动的了解程度,组织七、八年级全体学生进行了相关的知识竞赛,并抽样调查了七、八年级部分学生的竞赛成绩,过程如下:
【收集数据】从该校七、八年级学生中各随机抽取20名学生的成绩,其中八年级学生的成绩如下(单位:分):75,90,35,60,85,85,95,100,80,85,80,85,90,75,65,60,80,100,70,75.
【整理、描述数据】将抽取的七、八年级学生的竞赛成绩x(分)分组整理如表:
竞赛成绩x/分
x<60
60≤x<70
70≤x<80
80≤x<90
90≤x≤100
七年级人数
2
3
6
5
4
八年级人数
1
3
a
7
5
【分析数据】七、八年级学生竞赛成绩数据的平均数、中位数、下四分位数、上四分位数如表:
年级
平均数
中位数
下四分位数
上四分位数
七年级
78.5
75
71
86
八年级
78.5
b
c
d
根据以上提供的信息,解答下列问题.
(1)填空:a= ,b= ,c= ,d= .
(2)根据以上数据,你认为该校七、八年级学生在相关知识竞赛中,哪个年级学生对体育运动的了解程度更高?请就平均数及四分位数分析.
(3)已知该校七、八年级各有800名学生,为表扬在这次竞赛中表现优异的学生,该校决定给两个年级竞赛成绩在80分及以上的学生颁发奖状,请估计该校需要准备多少张奖状.
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。