内容正文:
14.2 数据的表示
第 14 章 数据的收集
与表示
第1课时 频率分布直方图
八年级上册数学(华师版)
学习目标
1. 理解组距、组数等统计概念,能够利用直方图描述数据,从统计图中获取相关信息.
2. 从问题的解决过程中体会频数分布直方图的特点,感受统计图的作用.
3. 能够根据具体问题独立地利用频数分布直方图分析数据.
4. 培养学生运用统计图的能力以及用数据说话的习惯.
重点: 频数分布表和频数分布直方图的制作.
难点: 如何确定组数和组距.
金牌 银牌 铜牌
20
40
26
38
18
32
26
18
2016年里约 2020年东京
中国健儿在两届奥运会上获得的奖牌数统计图
身高(cm)
年龄(岁)
1 2 3 4 5 6
140120
100
80
60
40
20
0
小文1~6岁身高变化统计图
120
77
89
98
106
113
其他
30%
歌曲
25%
小品
20%
杂技
15%
相声
10%
六年级学生最喜欢的文艺节目统计图
我们学习了哪些统计图用来描述数据?分别说说这些统计图有什么特点.
条形统计图,折线统计图,扇形统计图.
复习回顾
扇形统计图是用整个圆代表所研究的总体,用圆中各个扇形代表组成总体的各个部分的统计图,它可以清晰地呈现总体的 100% 中各部分所占百分比的多少.
条形统计图是用宽度相同的条形的高低或长短来表示数据特征的统计图,它可以直观地反映出数据的数量特征,如果有两个研究对象,常常把它们相应的数据并列表示在同一幅条形统计图中.
折线统计图是用折线表示数量变化规律的统计图.如果关注的是某种现象随时间变化而发生的变化,常常以时间为水平放置的数轴,以折线的起伏直观地反映出数量随时间所发生的相应变化.
频数分布直方图的认识
问题1 20位同学的立定投篮比赛成绩记录如图所示.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
学号
987654321
0
命中次数
1
探究新知
请从图中读取以下信息:
(1)7号选手命中几个球?
7个
8 号命中次数最多,6 号和 9 号命中次数最少
4 号和 20 号的成绩与 14 号一样.
(4)有几个人命中了6个球?
(3)谁与14号选手的投篮成绩一样?
(2)谁命中的次数最多,谁命中的次数最少?
3 个同学命中了 6 个球
如果学校有 5 个篮球架,要按投篮成绩把这 20 位同学分成 5 组分别训练,分组方案如下表所示.
命中球数x 0≤x<2 2≤x<4 4≤x<6 6≤x<8 8≤x<10
各组人数(频数) 2 5 2 8 3
然后按表格中的数据画出下图:
987654321
0
2 4 6 8 10
2
5
2
8
3
20 位同学的整体投篮水平分布情况一目了然
思考 上面两幅图描述的是同样的数据,它们是为便于回答怎么的问题而设计的?请针对也提出几个问题来考考你的同伴.
第 1 幅图是为了展示各个同学的具体成绩,第 2 幅图展示的是全班同学投篮成绩的分布情况.
为了解这 20 位同学的整体投篮水平,像上表那样,把这 20 位同学的命中次数 x 分为相连的等长的 5 段,再清点命中次数落在各段上的人数(即频数),这样得到的统计表被称为频数分布表,相应的统计图被称为频数分布直方图.
它们可以直观地显示数据的分布情况,比如哪一段上人数(频数)最多或最少,数据集中于哪里,分布是否对称,等等.
知识要点
问题2 下表显示了 2021 年我国 31 个省市自治区(不含港澳台地区)人均 GDP 的数据,试据此设计一张频数分布表和相应的频数分布直方图来考察该年我国 31 个省市自治区(不含港澳台地区)各地人均GDP 的整体发展情况及差异.
如何绘制频率分布直方图
地区序号 1 2 3 4 5 6 7 8 9 10
人均GDP 183980 173630 137039 116939 113732 113032 98285 86879 86416 85422
2
地区序号 11 12 13 14 15 16 17 18 19 20
人均GDP 81 727 75 360 70 321 69440 65 560 65 026 64821 64326 63707 62549
地区序号 21 22 23 24 25 26 27 28 29 30 31
人均GDP 61725 59410 57686 56831 56398 55450 54172 50808 49206 47266 410
46
第一步,求出各地人均 GDP 的最大值与最小值之差: 183 980 - 41 046 = 142 934 (元).
这里,各地人均 GDP 的差距较大,超过 14 万元,所以我们考虑多分几组,比如 10 组,
组距是每组两个端点值的差,
即:142934÷10 = 14293.4 (元).
为方便计算,这里不妨取整,将组距定为 1.5 万元.
第二步,决定组数和组距.
通常情况下,我们可以将数据分为 5 至 12 组,
分组必须涵盖所有的值,所以第一组的左端点要比最小值略小一点,比如可以定为 4.1 万元,最后一组的右端点则要比最大值略大一点.
第三步,确定分点,列出频数分布表.
上表中,4.1≤ x <5.6 表示第一组包括所有人均 GDP 大于或等于 4.1 万元但小于 5.6 万元的省市自治区,
其他组的含义可类推.
数出各组所含的地区个数(频数),即可完成频数分布表.
人均GDP x(万元) 频数 人均GDP x(万元) 频数
4.1≤x<5.6 6 11.6≤x<13.1 1
5.6≤x<7.1 13 13.1≤x<14.6 1
7.1≤x<8.6 3 14.6≤x<16.1 0
8.6≤x<10.1 3 16.1≤x<17.6 1
10.1≤x<11.6 2 17.6≤x<19.1 1
2021年我国 31 个省市自治区(不含港澳台地区)
人均 GDP 的频数分布表
第四步,画频数分布直方图
横轴是人均 GDP ,纵轴是每个小组的频数,这样就得到了直观形象的频数分布直方图
频数
4.1 5.6 7.1 8.6 10.1 11.6 13.1 14.6 16.1 17.6 19.1
人均GDP(万元)
14
12
10
8
6
4
2
0
6
13
3
3
2
1
1
0
1
1
思考 根据上述频数分布直方图,回答以下问题:
①哪一组含有的地区数最多?该组人均GDP范围是什么?
②哪一组频数最小?该组人均 GDP 的范围是什么?
③ 人均 GDP 小于 7.1 万元的地区有多少个?它们占总体的百分数是多少?
第 2 组地区数最多,GDP 范围是5.6≤x<7.1
第 8 组地区数最小,GDP 范围是14.6≤x<16.1
一共有 19 个地区人均 GDP 小于 7.1 万元,占总体的百分数是 61.3%
⑤ 如果等距分组的方案1是分 10 组,方案 2 是只分 5 组,那么这两种分组方案所画出的频数分布直方图,其外观会改变吗?画一画,体会一下增、减组数对了解分布的整体形态有什么影响.
④ 31 个省市自治区(不含港澳台地区) 2021 年人均GDP 整体上是如何分布的?对称吗?集中在哪个范围内?
主要分布在前半段,不对称. 集中分布在 4.1≤x<7.1 之间.
外观会发生改变,增减组数会导致频数分布的范围变大.
我们发现,频数分布直方图能够直观、形象地反映大量数据整体的分布形态,如数据是否集中、分布是否对称等.
画直方图的关键步骤是确定组数和组距,它们与数据的分散程度、问题情境和数据分析对精度的要求等因素有关,没有统一的答案,可以进行尝试,找出满意的分组方案.
直方图中每个小长方形的宽度都相等,是一个距离单位,高度则是频数.
知识要点
例 为了解某地区新生儿体重状况,某医院随机调取了该地区 60 名新生儿出生体重,结果(单位:克)如下:
3850 3900 3300 3500 3315 3800 2550 3800 4150
2500 2700 2850 3800 3500 2900 2850 3300 3650
4000 3300 2800 2150 3700 3465 3680 2900 3050
3850 3610 3800 3280 3100 3000 2800 3500 4050
3300 3450 3100 3400 4160 3300 2750 3250 2350
3520 3850 2850 3450 3800 3500 3100 1900 3200
3400 3400 3400 3120 3600 2900
典例精析
将数据适当分组,并绘制相应的频数分布直方图,从图中反映出该地区新生儿体重状况怎样?
解:(1)确定所给数据的最大值和最小值:上述数据
中最小值是 1900,最大值是 4160;
(2)将数据适当分组:最大值和最小值相差
4160-1900 = 2260,考虑以 250 为组距,
2260÷250 = 9.04,可以考虑分成 10 组.
(3) 统计每组中数据出现的次数 (频数):
分组 人数 分组 人数
1750~2000 3000~3250
2000~2250 3250~3500
2250~2500 3500~3750
2500~2750 3750~4000
2750~3000 4000~4250
1
1
1
3
8
7
14
11
10
4
(4) 绘制频数分布直方图:
从图中可以看出该地区新生儿体重状况在 3250 ~ 3500 g 的人数最多.
1750 2000 2250 2500 2750 3000 3250 3500 3750 4000 4250
人数
体重/g
直方图 条形图
横轴
频数的
表示
长方形的排列方式
一般表示考察对象数据的变化范围
表示考察对象的类别
长方形的面积(只有等距分组时,才用长方形的高表示)
长方形的高
连续排列,没有空隙
联系:都用条形直观地表示数量,反映数据特点.
分开排列,有空隙
直方图与条形图的区别与联系
归纳总结
1. 某市今年中考数学学科开考时间是6月22日15
时,数串“06221500”中“0”出现的频数是 .
2. 一个样本中,数据的最大值为53,最小值为39,
若组距为3,则应分成 组.
3
5
3. 已知样本:7,12,11,10,13,8,7,14,9,
10,8,11,10,8,10,9,12,9,13,11,那么
这20个数据在8.5~11.5范围内的频数是( C )
A. 8
B. 9
C. 10
D. 11
C
当堂练习
4. 如图是某班45名同学爱心捐款额的频数分布直方
图(每组含前一个边界值,不含后一个边界值),则捐款人数最多的一组是( C )
A. 5~10元 B. 10~15元
C. 15~20元 D. 20~25元
C
5. 将50个数据分成五组,编成组号为①~⑤的五个
组,频数分布如下表:
组号 ① ② ③ ④ ⑤
频数 8 10 ■ 14 11
那么第③组的频数为( B )
A. 10 B. 7
C. 14 D. 13
B
决定组距和_____
计算最大值与最小值的___
频数分布表
直方图
频数分布直方图
列频数分布表
差
组数
画频数分布直方图
当堂小结
$