内容正文:
2019沪教版高中信息技术——选择性必修3《数据管理与分析》
项目七 揭示网上书店图书销售情况
——分析、呈现并解释数据(1)
学习目标:
· 了解数据分析及可视化的常用工具,并了解各种工具的适用场景。
· 掌握常用图表的绘制方法,并能根据需要选择合适的图表。
· 理解相关性分析的概念,并能通过图表绘制或相关系数的计算发现变量的相关关系。
教学重点难点:
重点:Python的图表绘制方法。
难点:绘制图表前数据的整理,Python中用来绘制各种图表的函数的使用。
教学准备:
软硬件环境:计算机教室、anaconda、电子表格软件
教学素材:某市交通轨迹点数据、网上书店数据集
教学过程:
教学环节
导案
学案
设计意图
新课导入
引导学生观察网上书店销售数据集,讨论如何帮助商家了解图书销售情况以及制定销售策略,分析结构可以如何展示。
讨论如何分析图书销售数据,了解本课任务。
导入课题,了解本节课的学习目标。
了解数据分析的基本工作流程关于数据可视化
引导学生阅读教材,总结并提交数据分析的基本工作流程、数据可视化的概念及优势。
数据分析的基本流程:
数据可视化:
1、概念
数据可视化是指将数据分析的结构通过表格、图形或图像等形式显示出来,再进行交互处理的理论、方法和技术。
2、优势:
传递信息速度快
数据显示多维性
展示信息更直观
客服大脑记忆能力限制
常用数据分析工具:
1、WPS表格/Excel
2、SPSS
3、stata
4、SAS
5、Python
6、R
阅读教材,思考并交流数据分析的基本工作流程与数据可视化概念及优势。
了解数据分析的基本流程,掌握数据可视化的概念及优势。培养学生独立阅读能力。
绘制图表
引导学生使用Python分别绘制柱状图、饼图、折线图、箱线图、密度图、直方图、散点图、六边形箱式图,分析网上书店各数据集。
常见可视化图形:
1、直方图
2、折线图
3、密度图
4、箱线图
5、散点图
6、六边形箱式图
阅读教材76页,了解常见的可视化图形。
尝试编写程序,分析、呈现并解释网上书店图书销售数据。
直方图源代码:
import pandas as pd
import matplotlib.pyplot as plt
# 加载数据
sale_data = pd.read_csv('sale_data.csv')
# chocolate_distribution = sale_data.plot(kind='density')
a = sale_data[u'小说类'].plot(kind='hist', xticks=[40, 45, 50, 55, 60, 65, 70, 75, 80], xlim=[40, 80])
plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']
plt.title(u"图书销量直方图")
plt.ylabel(u"频率")
plt.xlabel(u"销量")
plt.show()
了解常见可视化图形,并使用Python编写程序,提高学生的程序书写能力。
思考与讨论
引导学生分析各种图表的适用场景,交流如何通过图表发现数据中的规律。
思考与讨论各种图表的使用情况。
小组交流,汇报交流结果。
培养学生思考问题能力。
完成活动7.1
引导学生绘制车辆运行时间分布密度的直方图,以及反映车辆运行时间和形式轨迹之间关系的散点图和六边形箱式图。
散点图源代码参考:
# 导入第三方库
import pandas as pd
import matplotlib.pyplot as plt
# 加载数据
sale_data = pd.read_csv('sale_data.csv')
groups = sale_data['groups']
# 绘制散点图
color_palette = {'1-50': "red", '51-100': "yellow", '101-150': "blue"}
colors = [color_palette[c] for c in groups]
simple_scatterplot =sale_data.plot(kind='scatter', x=0, y=1, c=colors)
plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']
plt.title(u"图书销量散点图")
plt.show()
尝试编写程序,分别绘制直方图、散点图和六边形箱式图,分析相关交通数据。
分四个小组,合作完成图形可视化。
1、绘制项目中车辆运行时间分布密度的直方图。
2、绘制项目中车辆运行时间和形式轨迹两类数据之间对