内容正文:
数据可视化之词云图
年 级:高一 学 科:信息技术
1
01
在线体验词云图制作
02
认识数据可视化
03
Contents
目录
利用Python绘制词云图
高中信息技术
2
1 1
图表的表达力
问题:2023年世界GDP排名第六的国家?
美国在2023年的GDP增长至25万亿美元,再次创下历史新高,稳居全球首位。而中国则以19万亿美元的GDP紧随其后,位列世界第二。日本则以6万亿美元的GDP成为世界第三大经济体。紧随其后的前十名国家分别为德国、印度、法国、英国、巴西、意大利、加拿大。
一图顶千字
高中信息技术
省实深圳
广东实验中学深圳学校
3
数据可视化——词云图
01
高中信息技术
4
1 2
数据可视化
数据可视化
数据可视化是以图形、图像和动画等方式直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等,便于人们更好地理解数据。
高中信息技术
省实深圳
广东实验中学深圳学校
补全的过程,依然是用3句代码来实现。
第一句,读取文件,这句和之前相同,不多加解释。
第二句,筛选数据,用到了刚才老师介绍的筛选多列的方法。我们用列索引号组成的列表作为参数,筛选出这四列的数据。注意,city变量在代码中已定义了,就是北京。需要修改为自己所在城市的同学,请在代码中自行修改。
第三句,将筛选的数据保存为新文件。也不多加解释了。
下面,请大家参考老师给出的三句代码,将 活动2的代码补全,然后运行,看看筛选后的效果吧!
5
1 2
数据可视化
数据可视化——词云图
利用图表针对数字类数据的可视化
文本类数据怎么可视化呢?
高中信息技术
省实深圳
广东实验中学深圳学校
上节课我们通过网络或传感器采集到了数据,那么这些采集到的数据是否直接可以使用?
我们一起来看一下如图所示这部分原始数据,这是一些学生体质健康数据。仔细观察,该数据存在什么问题。
大家应该都观察到了,数据存在重复、空缺、数据单位不正确的情况。
6
1 2
数据可视化
数据可视化——词云图
词云是目前常用的关键词可视化形式,它能直接抽取文本中的关键词,并将其按照一定顺序和规律整齐美观地呈现在屏幕上。用词云可视化文本数据可以帮助人们快速地了解文本的内容和特征等信息
高中信息技术
省实深圳
广东实验中学深圳学校
7
在线体验词云图制作
02
高中信息技术
8
2 1
数据可视化
在线工具——易词云
高中信息技术
省实深圳
广东实验中学深圳学校
补全的过程,依然是用3句代码来实现。
第一句,读取文件,这句和之前相同,不多加解释。
第二句,筛选数据,用到了刚才老师介绍的筛选多列的方法。我们用列索引号组成的列表作为参数,筛选出这四列的数据。注意,city变量在代码中已定义了,就是北京。需要修改为自己所在城市的同学,请在代码中自行修改。
第三句,将筛选的数据保存为新文件。也不多加解释了。
下面,请大家参考老师给出的三句代码,将 活动2的代码补全,然后运行,看看筛选后的效果吧!
9
2 1
数据可视化
在线工具——易词云
高中信息技术
省实深圳
广东实验中学深圳学校
补全的过程,依然是用3句代码来实现。
第一句,读取文件,这句和之前相同,不多加解释。
第二句,筛选数据,用到了刚才老师介绍的筛选多列的方法。我们用列索引号组成的列表作为参数,筛选出这四列的数据。注意,city变量在代码中已定义了,就是北京。需要修改为自己所在城市的同学,请在代码中自行修改。
第三句,将筛选的数据保存为新文件。也不多加解释了。
下面,请大家参考老师给出的三句代码,将 活动2的代码补全,然后运行,看看筛选后的效果吧!
10
2 1
数据可视化
在线工具——易词云
高中信息技术
省实深圳
广东实验中学深圳学校
补全的过程,依然是用3句代码来实现。
第一句,读取文件,这句和之前相同,不多加解释。
第二句,筛选数据,用到了刚才老师介绍的筛选多列的方法。我们用列索引号组成的列表作为参数,筛选出这四列的数据。注意,city变量在代码中已定义了,就是北京。需要修改为自己所在城市的同学,请在代码中自行修改。
第三句,将筛选的数据保存为新文件。也不多加解释了。
下面,请大家参考老师给出的三句代码,将 活动2的代码补全,然后运行,看看筛选后的效果吧!
11
2 1
在线工具词云图可视化
热门旅游城市Top10
城市 热度 排名
北京 26 1
成都 22 2
上海 19 3
杭州 16 4
重庆 13 5
苏州 12 6
南京 9 7
武汉 6 8
长沙 5 9
贵阳 3 10
任务:结合表格内容,请你利用在线工具
绘制2024年五一热门城市的词云图
高中信息技术
省实深圳
广东实验中学深圳学校
12
Python词云图实践
03
高中信息技术
13
3 1
数据可视化
课堂实践任务
结合班级各位同学的旅游爱好,绘制出一份我们班级的旅游热门城市词云图。
高中信息技术
省实深圳
广东实验中学深圳学校
14
3 1
数据可视化
步骤一:数据采集
请同学们打开桌面上的调查问卷链接——“你理想中的旅游城市”,填写个人对应感兴趣的城市并提交,最少选2个,最多选3个。
高中信息技术
省实深圳
广东实验中学深圳学校
15
2 1
数据可视化
步骤二:数据整理——统计处理文本
#读取excel文件并处理
text = pd.read_excel(path) #读取班级同学统计数据
# 通过for循环将每个同学提交的城市进行分割
for i in range(len(text)):
text.loc[i,text.columns[-1]] = text[text.columns[-1]][i].replace("┋"," ")
#将所有同学提交的城市处理好保存到citys.txt文件中
file = open("./citys.txt",'w')
file.write(text.loc[:,text.columns[-1]].str.cat(sep=' '))
file.close()
text.loc[:,text.columns[-1]].str.cat(sep=' ')
高中信息技术
省实深圳
广东实验中学深圳学校
补全的过程,依然是用3句代码来实现。
第一句,读取文件,这句和之前相同,不多加解释。
第二句,筛选数据,用到了刚才老师介绍的筛选多列的方法。我们用列索引号组成的列表作为参数,筛选出这四列的数据。注意,city变量在代码中已定义了,就是北京。需要修改为自己所在城市的同学,请在代码中自行修改。
第三句,将筛选的数据保存为新文件。也不多加解释了。
下面,请大家参考老师给出的三句代码,将 活动2的代码补全,然后运行,看看筛选后的效果吧!
16
3 1
数据可视化
步骤三:数据可视化——词云图绘制
将需要绘制的内容复制
到这里
高中信息技术
省实深圳
广东实验中学深圳学校
17
3 1
数据可视化
步骤四:数据分析&作品展示
高中信息技术
省实深圳
广东实验中学深圳学校
18
4 1
数据可视化
小结
数据可视化
词云图的概念及用途
词云图的制作方式
在线词云图工具体验
python制作词云图
抽取文本中的关键词
文本关键词可视化
文本数据采集
文本数据处理及统计分析
词云图绘制及保存
高中信息技术
省实深圳
广东实验中学深圳学校
补全的过程,依然是用3句代码来实现。
第一句,读取文件,这句和之前相同,不多加解释。
第二句,筛选数据,用到了刚才老师介绍的筛选多列的方法。我们用列索引号组成的列表作为参数,筛选出这四列的数据。注意,city变量在代码中已定义了,就是北京。需要修改为自己所在城市的同学,请在代码中自行修改。
第三句,将筛选的数据保存为新文件。也不多加解释了。
下面,请大家参考老师给出的三句代码,将 活动2的代码补全,然后运行,看看筛选后的效果吧!
19
$$nullnull