内容正文:
3. 3离差平方和与方差
第2课时 组内(间)离差平方和
第三章
数据初步分析
章节导读
3.1平均数
3.2 中位数与众数
3.3离差平方和与方差
3.4四分位数与箱线图
中位数与众数
离差平方和与方差
四分位数
箱线图
算术平均数与加权平均数
分布式计算
组
内(间)离
差
平
方
和
学 习 目 标
1
2
3
经历数据分类的活动,知道按照组内离差平方和最小的原则对数据进行分类的方法;
体会样本与总体的关系,能用样本方差估计总体方差;
感悟通过样本特征估计总体特征的思想,形成数据观念,发展模型观念.
复习回顾
离差平方和与方差的概念与计算公式:
方差:一般地,一组数据的各离差的平方的平均数叫作这组数据
的方差,记为 。
离差平方和:样本中,各数据与平均数的差(又称离差)的平方和称为离差平方和,记为 。
4
新知探究
小明所在学校的运动队有5名同学准备参加跳高比赛,他们的跳高最好成绩如下:
校运动队5名同学跳高最好成绩统计表
合作学习
为了让队员能更有效地进行赛前训练,教练计划将5名同学按他们的跳高成绩的高、低分成两组。
怎样分组比较合理呢?
5
新知探究
方法一:
合作学习
一起来试一试吧!
将5名队员的跳高成绩按从小到大排列:1.58,1.63,1.65,1.75,1.78。将这些数据表示在数轴上,如图。
可以把相对集中的数据分在一组,例如,分成{1.58,1.63,1.65},{1.75,1.78}两组。
方法二:
离差平方和可以用来表示一组数据与其
平均水平的偏离程度。可以通过计算离差平方和最小
进行分组,使得组内平均水平差不多。
6
新知探究
合作学习
5名队员的跳高成绩分成2组,共有4种情况,设各组内的离差平方和分别为,,计算
可以发现,将数据分成{1.58,1.63,1.65},{1.75,1.78}两组时,+最小。所以将队员分成{队员 1,队员 3,队员 4},{队员 2,队员 5}两组,组内同学的跳高水平最接近。
方法二:
7
归纳总结
通过计算可以得到:(+)[]
组内(间)离差平方和
一般地,设有个数据,,, ,,它们的平均数为 ,离差平方和为。如果把这些数据分为两组,第1组有 个数据,平均数为,离差平方和为;第2组有个数据,平均数为 ,离差平方和为,其中。
称为组内离差平方和
表达了两个组的组内数据的离散程度
称为组间离差平方和
表达了两个组之间的差异
8
归纳总结
组内(间)离差平方和
数据合理分组原则:
合理的分组原则是使 最小,同时使最大。
由于总离差平方和 不变,所以只需考虑 最小,即组内离差平方和最小即可。
注意: 在大数据分析中,数据分组是重要的方法之一。数据分组方法有许多种,其中使得“组内离差平方和最小”的方法最为常见。
9
典例分析
例1 国家有关部门根据各地的人均耕地面积数据进行分类研究,制定切合各地实际的政策。带着这个问题,统计学兴趣小组的同学收集了我国10个地区的人均耕地面积数据,如右表。
如果将这10个地区分成两组,尽可能使同组内各地区的人均耕地面积接近、不同组地区的人均耕地面积差异较大,应如何分组?
解:将这 10 个地区的人均耕地面积从小到大排列,依次为 0.1,0.2,0.3,0.6,0.6,1.8,2.0,2.3,3.2,4.2。
组内(间)离差平方和
10
典例分析
将这些数据分成两组,有以下 9 种情况,分别计算各种情况的组内离差平方和,得到下表:
组内(间)离差平方和
这里的计算量比较大,可以借助计算机软件或者自己设计算法、编写程序来解决。
计算结果表明,将数据分成{0.1,0.2,0.3,0.6,0.6}和{1.8,2.0,2.3,3.2,4.2}两组时,组内离差平方和最小,即组内人均耕地面积数据波动最小,两组之间数据差异最大。
所以将上海、广东、福建、江苏、安徽分在一组,其余地区分在另一组比较合理。
11
随堂练习
基础过关(P79)
1.将数据 2,3,4,8,9,10 分成前3个数据一组,后3个数据一组,则这两组数据的组内离差平方和为 。
4
步骤:
1.求第一组数据的平均数;
2.求第一组数据的离差平方和;
3.求第二组数据的平均数;
4.求第二组数据的离差平方和;
5.将两组离差平方和相加,即两组数据的组内离差平方和。
随堂练习
基础过关(P79)
2.某地一周的日平均气温分别为(单位:℃):8,9,18,15,17,19,20。 为了评估气温对农作物生长造成的影响,需要将这周的气温数据分 成两组,该怎么分比较合理?
解:将这组数据按从小到大排序:8,9,15,17,18,19,20.
观察发现9与15之间差距较大,故按照自然断点分组比较合理。
第一组:8,9;
第二组:15,17,18,19,20.
随堂练习
能力提升
3.小红同学为了在明年中考体育考试中取得好的成绩,每天自己在 家里练习做一分钟仰卧起坐,妈妈统计了她连续六天内仰卧起坐的个数:2,8,10,4,12按照“组内离差平方和达到最小”的方法分成两组,则组内离差平方和的最小值是 ( )
A.{2},{4,8,10,12} B.{2,4},{8,10,12}
C.{2,4,8},{10,12} D.{2,4,8,10},{12}
B
随堂练习
能力提升
4. 生物小组测量了10株新栽树苗的高度(单位:厘米),数据
按从小到大的顺序排列为12,15,18,20,22,25,28,30,33,
35。老师按照前5株(12∼22)、后5株(25∼35) 的方式将树苗分成了2组。
(1)请计算该分组下的组内离差平方和。
(2)请计算该分组下的组间离差平方和。
随堂练习
能力提升
4. 生物小组测量了10株新栽树苗的高度(单位:厘米),数据
按从小到大的顺序排列为12,15,18,20,22,25,28,30,33,
35。老师按照前5株(12∼22)、后5株(25∼35) 的方式将树苗分成了2组。
(1)请计算该分组下的组内离差平方和。
解: ,
, ,
随堂练习
能力提升
4. 生物小组测量了10株新栽树苗的高度(单位:厘米),数据
按从小到大的顺序排列为12,15,18,20,22,25,28,30,33,
35。老师按照前5株(12∼22)、后5株(25∼35) 的方式将树苗分成了2组。
(2)请计算该分组下的组间离差平方和。
因为 。
所以该分组下的组间离差平方和为 。
课堂小结
表达了两个组的组内数据的离散程度
表达了两个组之间的差异
组内离差平方和
组间离差平方和
分组原则:使组内离差平方和最小
感谢聆听!
$