内容正文:
第20章 数据的初步分析
20.1 数据的频数分布
“数据”可以是数值,也可以
不是数 值.例 如,某 次 数 学
测验 的 成 绩,可 以 是 分 数
(单 位:分),如 95,70,88
等;也可以用等级表示,如
A级、B级、C级、D级等.
频数、频率与数据总数的关系
频 率 =
频数
数据总数
,它 有 两
种变 形:① 频 数 = 数 据 总
数× 频 率;② 数 据 总 数 =
频数
频率.在 频 数、频 率 和 数 据
总数 中,已 知 其 中 的 两 个
量,就可以求得第三个量.
知识点一 频数分布表及其相关概念
频数
我们把一批数据中落在某个小组内数据的个数称为这
个组的频数.例如,一次数学测验中,有20人获得优秀
等次,那么优秀等次的频数就是20.
频率
如果一批数据共有n 个,而其中某一组数据是m 个,那
么
m
n
就是该组数据在这批数据中出现的频率.
注意: 频数、频率的特征
(1)一批数据中,各组数据的频数之和等于该批数
据的总数.
(2)频率是一个比值,没有单位,它可以用百分数、
小数或分数表示,频率p 的取值范围是0≤p≤1.一
批数据中,各组数据的频率之和等于1.
频数分布表
把一批数据进行适当分组,采用选举时唱票的方法,对
落在各个小组内的数据个数进行记录,算出每一个小
组的频数,就制成了频数分布表.
制作频数分布表的一般步骤
计 计算这批数据中最大数与最小数的差
分 决定组距和组数.组距是指每个小组的两个端点
间的距离,组数=
一批数据中最大数-最小数
组距
定 决定分点
列 列频数分布表
281
注意:(1)根据问题的需要,各组的组距可以相同或
不同,但一般情况下,各组的组距是相同的.
(2)确定组数时,若
一批数据中最大数-最小数
组距
是
小数或分数,通常用“进一法”确定组数.
【例1】在英语词组relativefrequency(相对频率)中,字
母“e”出现的频数和频率各是多少?
解:在词组relativefrequency中,一共有17个字母,其
中有4个字母e,因此,字母“e”出现的频数是4,频率
是
4
17.
求一组数据频率的步骤
第1步:数 出 该 批 数 据 的 总 数 和 这 一 组 数 据 的
频数;
第2步:直接代入频率计算公式“频率=
频数
数据总数
”
求解.
【例2】一支球队队员的年龄(单位:岁)分别为25,21,
23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,
25,26,28.请选择适当的组距,并制作频数分布表.
解:(1)这批数据的最大数是30,最小数是21,最大数与
最小数的差为30-21=9.
(2)选择组距为2,则这批数据的组数是
9
2=4.5≈5.
(3)决 定 分 点,将 这 批 数 据 从 205 岁 开 始,分 成
205~225,225~245,245~265,265~285,
285~305共5组.
一批数据中最大数与最小
数 的 差 称 为 这 批 数 据 的
极差.
(1)对数据进行分组时,可
以先确定组距再确定组数,
也可以先确定组数再确定
组距.
(2)组距和组数与这批数据
的数量有关.一般地,数 据
越多,分的组数也越多.当
数据在100个以内时,通常
分5~12组.
(3)决定分点时,为避免数
据正好落在分点上,一般把
表示分点的数比原数据多
取一位小