内容正文:
数据与计算 学教案
5.4数据的可视化表达
【学习目标】:
1.能够了解数据可视化的两种类型;
2.能够学会选用恰当的工具可视化表达数据,揭示数据反映的本质问题, 提升数据分析的效率。
【重点和难点】:
重点:
选用恰当的工具可视化表达数据,揭示数据反映的本质问题,提升数据分析的效率。
难点:
选用恰当的工具可视化表达数据,揭示数据反映的本质问题,提升数据分析的效率。
【学法提示】:
讲授法、任务驱动法、体验探究法等
【课时安排】:1课时
【课前资料准备】:
词云图
“词云”就是通过形成“关键词云层”或“关键词渲染”,对文本中出现频率较高的“关键词”的视觉上的突出。“词云图”过滤掉大量的文本信息,使浏览者只要一眼扫过文本就可以领略文本的主旨。“词云图”是数据的可视化表达的一种方式。
【体验活动】
(活动一)
运行 Python 程序实现从文字数据转化为词云图
1.运行“程序 5-9-1 词云图(文具).py”,体验词云图可视化呈现分析
结果。
2. 解释“程序 5-9-1 词云图(文具).py”程序。
程序 5-9-1 词云图(两会).py 程序段:
#程序开始import jieba
import numpy as np
from PIL import Image
from wordcloud import WordCloud import matplotlib.pyplot as plt
pic_mask=np.array(Image.open("ty.jpg"))#获取词云形状的图片text=open(r'shangpin.txt',encoding='ansi')#获取分词数据mylist=list(text)
word_list=[" ".join(jieba.cut(sentence)) for sentence in mylist]#进行分词new_text=' '.join(word_list)
wordcloud=WordCloud(font_path='simhei.ttf',background_color="white", # 显示的字体和背景颜色
max_words=100,#出现次数最多的前 100 个分词
max_font_size=150,#显示的最大字号random_state=10,#分词颜色的随机配色方案数量mask=pic_mask) #词云形状
w=wordcloud.generate(new_text)#传入分词列表plt.imshow(w)#绘制词云图
plt.axis("off")#关闭坐标plt.show()#显示词云图
#程序结束
实践:
1. 学生用 IDLE (Python 3.6)运行“程序 5-9-2 商品名称词云图(笔).py”代码,即从淘宝网-实惠热卖-“笔”类别中爬取前三页的商品名称数据,再转化为词云图,观察以词云图的方式可视化呈现分析结果。(基本要求)
实践过程:
(1)在开始菜单里选择 IDLE (Python 3.6)打开“实践一”文件夹里“程序 5-9-2 商品名称词云图
(笔).py”;
(2)运行此程序,等待数秒后,出现了以词云图的方式可视化呈现的结果。
2. 以小组为单位,修改相应实惠热卖商品类别网址,相应网址复制粘贴到 url=后' '内,尝试修改对象参数,通过学习、交流,探究和实践,填写下表。(提高要求)
实践过程:
(1)先打开 Google Chrome 浏览器,复制程序 5-9-2 商品名称词云图(笔).py 中url' '内的网址(如下绿色网址):
https://re.taobao.com/search?
refpid=421019_1006&clk1=1c2aa7a411d324dc7d480f7d78dbe540&keyword=%E7%AC
%94&_input_charset=utf-8&page=0&isinner=0
到浏览器地址栏并且回车确定,就能看到数据的来源:淘宝网-实惠热卖-“笔”;
(2)再在“搜索框” 里输入自己小组想了解的其他商品名称进行“搜
索”查看相应商品情况,把浏览器地址栏里新网址复制替换掉程序 5-9-2 商品名称词云图(笔).py 中' '内的老网址再保存运行程序;
(3) 运行新程序,等待数秒后,出现了新的词云图,单击 “保存”此词云图到“实践一”
文件夹里。
完成表一填写。
填写下表(表一):
探究活动
实践一:通过学习、交流、探究和实践,结合自己小组想了解的其他商品名称查看
商品情况,修改程序里网址,最后以可视化的方式呈现数据。
知识与技能
你小组新“搜索”的商品是什么?
词云图(在下面插入词云图):
新“搜索”的商品为:
词云图结果分析结论: