内容正文:
5.4 数据的可视化表达
1
5.4 数据的可视化表达
2
数据可视化
是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。
作用:
把枯燥乏味的海量数据以丰富的视觉效果呈现数据所反映的本质问题,有效提升数据分析的效率。
5.4 数据的可视化表达
3
数据分析类型及其对应的可视化呈现
数据可视化表达的方式
5.4 数据的可视化表达
4
柱形图:
是一种以长方形的长度为变量的统计图表,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。亦可横向排列,或用多维方式表达。
5.4 数据的可视化表达
5
折线图:
是排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。
5.4 数据的可视化表达
6
饼图:
显示一个数据系列 (数据系列:在图表中绘制的相关数据点,这些数据源自数据表的行或列)。图表中的每个数据系列具有唯一的颜色或图案并且在图表的图例中表示。
5.4 数据的可视化表达
7
词云图:
词云图,一般多是用于重点突出文本数据中出现频率较高的“关键词”,特别适合突出关键词,让用户扫一眼就能看到主要的文本内容,因此也可以称之为文字云。
5.4 数据的可视化表达
8
实践探究
在python中 运行下面的程序制作《三国演义》词云。
5.4 数据的可视化表达
9
from scipy.misc import imread
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import jieba
import imageio
import numpy as np
text=open("sanguo.txt","rb").read()
text_jieba=" ".join(jieba.cut(text))
mask=np.array(image.open("2.png"))
wc =WordCloud(
font_path="C:\Windows\Fonts\SimHei.ttf",
background_color="white",
max_words=200,
m