内容正文:
20.5 数据分组
1
学习导航
学习目标
旧知回顾
自主学习
合作探究
当堂检测
课堂总结
1.理解组内离差平方和与组间离差平方和的概念;
2.会利用使“组内离差平方和最小”的方法对数据进行分组.(重点、难点)
一、学习目标
二、旧知回顾
数据的离散程度
离差平方和
方差
三、自主学习
知识点:组内离差平方和与组间离差平方和
一般地,假设有n个数据x1,x2,…,xn,若将其分成两组,其中前m个数据为一组(称为第一组),后(n-m)个数据为一组(称为第二组).
记
其中,
称为组内离差平方和,表达了两个组内数据的离散程度.
称为组间离差平方和,表达了两组数据之间的差异.
探究:数据分组
四、合作探究
问题提出:如图为10个苹果的直径,若想把这10个苹果分成两组,使每组苹果的“个头”差不多,你想怎么分?说说你分组的理由.
四、合作探究
问题探究:一般情况下,如果想把一组数据分成若干组,使每组组内的数据差距不大,且组与组之间的数据差别明显,那么你认为应遵循怎样的分组原则?
对数据分组的方法有很多,使“组内离差平方和最小”的方法是最常用的方法之一.
四、合作探究
问题解决:
解:按照“组内离差平方和达到最小”的方法,把图中的10个苹果按直径大小分成两组.
将10个数据由小到大排序:65, 69, 70, 75, 76, 76, 78, 80, 80, 81.把10个数据分成两组,共有9种情况:第一组1个数据{65},第二组9个数据{69, …, 81}; 第一组2个数据{65, 69}, 第二组8个数据{70, …,81}; ……; 第一组9个数据{65, …, 80}, 第二组1个数据{81}.
四、合作探究
四、合作探究
同理计算其他8种分组情况的组内离差平方和,结果如下:
分组情况 组内离差平方和
第一组1个,第二组9个 146.889
第一组2个,第二组8个 98
第一组3个,第二组7个 48
第一组4个,第二组6个 74.25
第一组5个,第二组5个 98
第一组6个,第二组4个 107.583
第一组7个,第二组3个 136.095
第一组8个,第二组2个 182.375
第一组9个第二组1个 218
计算结果表明,第3种情况的组内离差平方和最小。因此把10个苹果按直径大小分成的两组是{65, 69, 70}, {75, 76, 76, 78, 80, 80, 81}。
四、合作探究
对数据的分组有两步,第一步是排序,第二步是确定组数和各组内数据的个数,我们只讨论分两组的情形,如果一共有n个数据,要把较小的m个数据分为一组,把剩下的(n-m)个数据分为另一组.我们通过“组内离差平方和最小”的原则来确定m的大小.这样分组后,组内的差距可以达到最小,而组与组之间的差异可以达到最大.
归纳总结:
练一练
四、合作探究
小红同学为了在明年中考体育考试中取得好的成绩,每天自己在家里练习做一分钟仰卧起坐,妈妈统计了她连续六天内仰卧起坐的个数:28,25,30,27,30,26.按照“组内离差平方和达到最小”的方法分成两组,则组内离差平方和的最小值是 ( )
A
五、当堂检测
1.按照“组内离差平方和达到最小”的方法,小明将一组数据分成了两组{80,82}和{87,86,90,85},计算这两组数据的组内离差平方和为 .
16
五、当堂检测
2.为考查某品种小麦的长势,测量了8株麦苗的高(单位:cm),结果如下:21,21,22,23,23,24,25,25。按照“组内离差平方和达到最小”的方法,把这8个数据分成两组.
解:计算不同分组的组内离差平方和如下:
其中组内离差平方和最小的分组是{21,21,22},{23,23,24,25,25}和{21,21,22,23,23},{24,25,25}.
六、课堂总结
组内离差平方和计算公式:
组间离差平方和计算公式:
$