内容正文:
5.1.3 数据的直观表示
学习目标
了解柱形图、折线图、扇形图、茎叶图、频数分布直方图与频率分布直方图的特征,并能利用这些图形解决实际问题,培养数据分析和直观想象的核心素养.
1.柱形图
一般地,柱形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,柱形图中每一矩形都是等宽的.
思考1:柱形图可以形象地比较各种数据之间的关系吗?
答案:柱形图(也称条形图)可以形象地比较各种数据之间的数量关系.
2.折线图
一般地,如果数据是随时间变化的,想了解数据的变化情况,可将数据用折线图来表示.当然,折线图也可以用在其他合适的情形中.
3.扇形图
扇形图也叫饼图或饼形图,扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况.
思考2:扇形图中,每一个扇形的圆心角以及弧长,与这一部分表示的数据有何关系?
答案:扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
4.茎叶图
一般来说,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列,茎叶图也可以只表示一组数.
5.频数分布直方图与频率分布直方图
(1)画频率分布直方图的步骤:
①计算极差:最大值与最小值的差.
②决定组距与组数:组距与组数的确定没有固定标准,需要尝试、选择,力求有合适的组数,以能把数据的规律较清楚地呈现为准,太多或太少都不好,不利对数据规律的发现.组数应与样本的容量有关,样本容量越大,组数越多,如果数据的容量不超过100,按数据多少,通常分为5~12组.
③决定分点:分点要比数据多一位小数,便于分组,分组区间采用左闭右开,避免数据被重复计算.
④列频率分布表:一般分“分组区间”“个数累计”(可省略)“频数”“频率”四列,最后一行是“合计”.
⑤画出频率分布直方图:在画频率分布直方图时,纵轴表示“”.
(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以所有小长方形的面积之和等于1.纵坐标是.
思考3:绘制频率分布直方图时,应如何确定组距与组数?
答案:数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,通常分成5~12组.
思考4:解决与频率分布直方图有关问题的关系式有哪些?
答案:×组距=频率,=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
(1)频率分布直方图中的“众数”.根据众数的意义可知,在频率分布直方图中,最高矩形中的某个(些)点的横坐标可作为这组数据的众数的近似值.一般用最高矩形底边中点的横坐标近似代替.
(2)频率分布直方图中的“中位数”.根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”.平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与其所对应小矩形的面积的乘积之和近似代替.
(4)频率分布直方图中的“百分位数”.根据百分位数的意义可知,
①找出百分位数所在矩形区间[a,b),
②设组距为d,计算可得k%分位数等于a+d·.
柱形图与扇形图
[例1] 已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.200,20 B.100,20
C.200,10 D.100,10
解析:在扇形统计图中,根据抽取的比例计算样本容量,根据条形统计图计算抽取的高中生近视人数.
该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.故选A.
针对训练:如图是某足球队全年比赛情况统计图.
根据图中信息,该队全年胜了 场.
解析:全年比赛场次为10÷25%=40(场),胜场有40×(1-20%-25%)=40×55%=22(场).
答案:22
折线图
[例2] (多选题)(2021·山东寿光月考)中国冰雪产业快速发展,冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领户外用品行业市场增长.如图是2012年至2018年中国雪场滑雪人次(单位:万)与同比增长率的统计图,则下列结论正确的是( )
A.2013年至2018年,中国雪场滑雪人次同比增长率逐年增加
B.2013年至2018年,中国雪场滑雪人次逐年增加
C.2018年与2013年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人次也