24.4 数据的分组课件 2025-2026学年人教版八年级数学下册
2026-05-30
|
25页
|
86人阅读
|
1人下载
普通
资源信息
| 学段 | 初中 |
| 学科 | 数学 |
| 教材版本 | 初中数学人教版八年级下册 |
| 年级 | 八年级 |
| 章节 | 24.4 数据的分组 |
| 类型 | 课件 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | PPTX |
| 文件大小 | 2.97 MB |
| 发布时间 | 2026-05-30 |
| 更新时间 | 2026-05-30 |
| 作者 | 匿名 |
| 品牌系列 | - |
| 审核时间 | 2026-05-30 |
| 下载链接 | https://m.zxxk.com/soft/58127387.html |
| 价格 | 1.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该初中数学课件聚焦“数据的分组”,核心知识点为组内离差平方和最小的分组原则。通过生活分类现象(如超市商品分类、宾馆星级划分)导入,结合招聘笔试成绩实例,衔接已学的离差平方和知识,搭建从具体到抽象的学习支架。
其亮点在于以问题驱动(招聘成绩分组)培养数学眼光,通过公式推导(总离差平方和分解)发展数学思维,结合城市气温分组的跨学科实例(地理区域特征)强化数学语言表达。采用实例探究法,小结清晰,帮助学生提升数据分析能力,为教师提供可操作的教学流程。
内容正文:
24.4 数据的分组
人教版(2024)八年级下册
第二十四章 数据的分析
学习目标
1
了解数据分组的意义
2
经历数据分组的活动,会按照组内离差平方和最小的原则对数据进行分组
新知引入
在社会生活中,分类现象普遍存在.
在实际问题中,当面临的对象复杂多样时,分类往往可以为我们处理问题带来方便. 对于一组取值多样的数据,对其进行合理分组,也会有助于我们解决问题.
例如,超市里各种商品按用途不同分类摆放,
宾馆根据硬件设施、服务水平等分成不同的星级,等等.
探索新知
问题 一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试. 将 10 名应聘者的笔试成绩 (百分制) 按从小到大的顺序排列如下:
58 64 68 75 76 83 85 89 90 92
你认为哪一部分应聘者应当进入面试?
自然,应当选择笔试成绩好的应聘者进入面试.
那么笔试成绩怎样才算好呢?
可以有不同的标准.例如,前三名或 85 分及以上等,不管哪种标准,目的都是把笔试成绩分成好和差两组.
探索新知
对笔试成绩进行分组,上面提到的标准各有其合理性,在实际中也经常被采用.但这些标准都没有考虑数据自身的特点,这可能导致两个很接近的笔试成绩被分到不同的组.
58 64 68 75 76 83 85 89 90 92
例如,83 分与 85 分的差距很小,若以“85 分及以上”为好成绩的标准,则 85 分属于好成绩,而 83 分属于差成绩.而从公司确定面试应聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理的做法.
因此,笔试成绩可以根据组内差异最小的原则进行分组.
探索新知
将笔试成绩按从小到大的顺序排列,使相互最接近的笔试成绩都挨在了一起. 因此,要使分组后的组内差异最小,只需在已排序数据的基础上寻找分组方法. 可以发现,10 个笔试成绩按顺序排列形成 9 个间隔,如图所示.
58 64 68 75 76 83 85 89 90 92
每个间隔都可以把笔试成绩分成好和差两组,共有 9 种分法.
探索新知
思考
怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小?
在前面的学习中,我们知道,离差平方和可以刻画一组数据的离散程度.
下面我们利用离差平方和刻画组内数据的离散程度,进而对数据进行分组.
一般地,设有 n 个数据 x1,x2,,xn,其平均数记为 ,则离差平方和为
d2=(x1-)2+(x2-)2++(xn-)2.
探索新知
如果把这组数据分为两组,前 m(m<n) 个数据为一组,后 (n-m) 个数据为一组,它们的平均数分别记为 1 和 2,离差平方和分别为
d12=(x1-1)2+(x2-1)2++(xm-1)2,
d22=(xm+1-2)2+(xm+2-2)2++(xn-2)2,
那么
d2=(x1-)2+(x2-)2++(xn-)2
=(x1-1+1-)2+(x2-1+1-)2++(xm-1+1-)2+ (xm+1-2+2-)2+ (xm+2-2+2-)2++(xn-2+2-)2
=(x1-1)2+(x2-1)2++(xm-1)2+(xm+1-2)2+(xm+2-2)2++(xn-2)2+m(1-)2+(n-m)(2-)2
=d12+d22+m(1-)2+(n-m)(2-)2.
其中 d12+d22 称为组内离差平方和,表示两个组内数据的离散程度;
记
d122=m(1-)2+(n-m)(2-)2,
d122 是 m 个第一组数据平均数、(n-m) 个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异.
根据组内离差平方和最小的原则进行分组时,由于 d² 不变,既可以按
d12+d22 最小来分组,也可以按 d122 最大来分组.
探索新知
d2=d12+d22+m(1-)2+(n-m)(2-)2.
值越小,组内成绩越集中,组间差异越大
它反映了“两组分化的程度”;
值越大,两组平均数差距越明显
d² 是定值,最小化组内离差平方和
(d12+d22) 等价于最大化组间离差平方和
探索新知
这样,根据组内离差平方和最小的原则,能使笔试成绩相差较小的应聘者分在同一组.利用计算器或信息技术工具,可以计算出图中的 9 种分法的组内离差平方和 (结果保留小数点后一位),如表所示.
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第 1 个间隔 0 799.6 799.6
第 2 个间隔 18 503.5 521.5
第 3 个间隔 50.7 271.4 322.1
第 4 个间隔 152.8 170.8 323.6
第 5 个间隔 228.8 54.8 283.6
第 6 个间隔 411.3 26 437.3
第 7 个间隔 587.4 4.7 592.1
第 8 个间隔 819.5 2 821.5
第 9 个间隔 1 026.2 0 1 026.2
第1,8,9种分组属于极端情况,这三种分法组内差异较大,数据极端不平衡,离散程度高.
探索新知
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第 1 个间隔 0 799.6 799.6
第 2 个间隔 18 503.5 521.5
第 3 个间隔 50.7 271.4 322.1
第 4 个间隔 152.8 170.8 323.6
第 5 个间隔 228.8 54.8 283.6
第 6 个间隔 411.3 26 437.3
第 7 个间隔 587.4 4.7 592.1
第 8 个间隔 819.5 2 821.5
第 9 个间隔 1 026.2 0 1 026.2
观察最后一列组内离差平方和可以发现,当按第 5 个间隔分组时,组内离差平方和最小.
因此,按组内离差平方和最小的分法为
{58,64,68,75,76}和{83,85,89,99,92}.
典型例题
例 10 个城市某月的每日最高温度的平均数 (简称平均高温) 如表所示.
解:将表中的数据按从小到大排列,可得
-11 -3 3 3 9 10 12 17 21 22
城市 北京 石家庄 呼和
浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
根据平均高温的组内离差平方和最小的原则:把这 10 个城市分为两组.
典型例题
将它们分成两组共有 9 种情况,利用计算器或信息技术工具,分别计算组内离差平方和 (结果保留小数点后一位),如表所示.
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第 1 个间隔 0 584.2 584.2
第 2 个间隔 32 380.9 412.9
第 3 个间隔 98.7 285.7 384.4
第 4 个间隔 132 158.8 290.8
第 5 个间隔 228.8 113.2 342
第 6 个间隔 308.8 62 370.8
第 7 个间隔 397.4 14 411.4
第 8 个间隔 562 0.5 562.5
第 9 个间隔 789.6 0 789.6
典型例题
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第 1 个间隔 0 584.2 584.2
第 2 个间隔 32 380.9 412.9
第 3 个间隔 98.7 285.7 384.4
第 4 个间隔 132 158.8 290.8
第 5 个间隔 228.8 113.2 342
第 6 个间隔 308.8 62 370.8
第 7 个间隔 397.4 14 411.4
第 8 个间隔 562 0.5 562.5
第 9 个间隔 789.6 0 789.6
观察最后一列组内离差平方和可以发现,当按第 4 个间隔分组时,组内离差平方和最小.
因此,按组内离差平方和最小的分法为
{北京,石家庄,呼和浩特,哈尔滨}
和{上海,广州,海口,成都,贵阳,昆明}.
典型例题
结合地理课所学知识,说一说这样分组合理吗?
从地理区域特征上看:第一组(北京、石家庄、呼和浩特、哈尔滨) 均属于我国北方城市,在气候上普遍具有冬季寒冷、干燥等特征,地理位置偏北;第二组 (上海、广州、海口、成都、贵阳、昆明) 多为南方城市,整体气候更温暖湿润,且部分城市兼具南方地形的相似性.
这种分组结合了城市的地理位置与气候特征,组内城市在自然地理属性上具有较高相似性,因此分组合理.
当堂检测
当堂检测
C
当堂检测
当堂检测
4
当堂检测
24
当堂检测
当堂检测
当堂检测
本节课学习了哪些知识点呢?
组内离差平方和:d122=m(1-)2+(n-m)(2-)2
组内离差平方和最小原则:组内数据越集中,组间差异越清楚,分组才有意义
数据的分组
THANKS
1.下列说法中正确的是( )
A.小明所在班级学生的平均身高是,小亮所在班级学生的平均身高是,小颖说“小亮一定比小明矮”
B.已知A,B两家网站用户的日人均上网时间分别为和,这两家网站所有用户的日人均上网时间为
C.小军所在的篮球队队员身高的中位数是,他说“我身高,我的身高在篮球队里是中等偏上的”
D.在统计学里,分组的方法有很多,其中较常用的方法是使“组内离差平方和达到最大”
解析:A.平均数反映一组数据的整体平均水平,不能代表个体情况仅通过班级平均身高无法比较小明和小亮的具体身高,原说法错误,不符合题意;
B.计算两家网站所有用户的日人均上网时间,需用总上网时间除以总用户数,不能直接对两个日人均值取平均(两家用户数不一定相等),原说法错误,不符合题意;
C.中位数是将数据排序后位于中间位置的数,篮球队身高中位数为,说明至少一半队员身高,而,故小军的身高在队里中等偏上,原说法正确,符合题意;
D.统计学中常用分组方法是使“组内离差平方和达到最小”, 原说法错误,不符合题意;故选:C.
2.把5个数据分成和两组,则这种分组情况的组内离差平方和为______________.
解析:组的平均数为,
则组的离差平方和为,
组的平均数为,
则组的离差平方和为,
这种分组情况的组内离差平方和为,
故答案为:4.
3.某小组8名学生的数学考试成绩(单位:分)分别为88,98,87,92,92,90,91,96.老师决定将这些成绩分为两组,以便更好地分析学生的成绩分布.若按照以下分组方式:第一组,第二组.则组内离差平方和为______.
解析:第一组数据的平均数是90,第二组数据的平均数是97,故这种分组情况的组内离差平方和.
4.甲、乙、丙、丁四名学生竞赛成绩(单位:分)如下:15,18,15,24,按照“组内离差平方和最小”的方法,将竞赛成绩分成两组.
解析:将4个数据从小到大排序:15,15,18,24.把4个数据分成两组,共有3种情况:第一种情况,
第一组1个数据,组内离差平方和为0;
第二组3个数据,平均数是19,
组内离差平方和为,
故第一种情况的组内离差平方和为.
4.甲、乙、丙、丁四名学生竞赛成绩(单位:分)如下:15,18,15,24,按照“组内离差平方和最小”的方法,将竞赛成绩分成两组.
解析:将4个数据从小到大排序:15,15,18,24.把4个数据分成两组,共有3种情况:第二种情况,
第一组2个数据,平均数是15,组内离差平方和为0;
第二组2个数据,平均数是21,
组内离差平方和为,
故第二种情况的组内离差平方和为.
4.甲、乙、丙、丁四名学生竞赛成绩(单位:分)如下:15,18,15,24,按照“组内离差平方和最小”的方法,将竞赛成绩分成两组.
解析:将4个数据从小到大排序:15,15,18,24.把4个数据分成两组,共有3种情况:第三种情况,第一组3个数据,平均数是16,组内离差平方和为(;
第二组1个数据,组内离差平方和为0,故第三种情况的组内离差平方和为.
因为,所以第二种情况的组内离差平方和最小,所以将竞赛成绩分成的两组是,.
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。