内容正文:
第五章 数据处理与可视化表达
信息技术 必修1
粤教版普通高中教科书
数据与计算
单元主题导入
同学们,你网购过吗?在你的周围,会经常遇到网购行为吗?为什么会选择网购?
单元主题导入
网络购物平台客户行为数据分析和可视化表达
网络购物中,消费者购物的任何行为细节都会被服务器所记录。通过大数据分析,商家可以了解消费者的偏好甚至预测其购买行为,如图5-1所示。
大数据分析使得商家可以追踪客户的行为并确定最有效的方式以提升客户对购物平台的忠诚度,根据客户的个性化需求提供相应的产品或服务以获得更大的市场占有率。
单元内容安排
网络购物平台客户行为数据分析和可视化表达
网购行为分析
网购数据的采集
网购数据的分析
网购数据的可视化表达
5.1
认识大数据
5.2
数据的采集
子项目主题
内容目录
5.3
数据的分析
5.4
数据的可视化表达
5.1 认识大数据
子项目一:网购行为分析
子项目一:
网购行为分析
问题:
什么是大数据?大数据有怎样的特征?大数据对日常生活有怎样的影响?
一、大数据的概念
1、什么是数据?
第一章知识回顾
2、什么是大数据?
大量的数据?
=
大数据
一、大数据的概念
2、什么是大数据?
大数据(BIG DATA)指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
一、大数据的概念
在一定时间范围内,用常规软件工具捕捉、管理和处理的数据不属于大数据
思考:这张电子表格中的数据属于大数据吗?
一、大数据的概念
大数据的概念
思考:淘宝数据属于大数据吗?
无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合
、凤阳中学期末考试之后,所有学生的考试成绩。
、十本《西游记》。
、网络购物平台一天所生成的数据量。
判断一下:下面哪些是大数据?
一、大数据的概念
探究活动一
3、大数据时怎样产生的?
大数据的产生是与人类日益普及的网络行为所伴生的,我们的日常工作和学习中,人们的一举一动基本都可以数字化,每一次出行每刷一次微博拨打一次电话逛一次淘宝叫一次外卖等等都产生了大量数据。
一、大数据的概念
3、大数据是怎样产生的?
物联网、云计算、移动互联网、手机、电脑以及遍布地球各个角落的传感器,无一不是数据的来源或是承载的方式。
一、大数据的概念
4、大数据的作用?
大数据已成为人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源。
一、大数据的概念
仔细阅读一下案例,小组协作分析大数据具有哪些特征?
二、大数据的特征
案例1:某市交通智能化分析平台的数据来源于道路交通、电信、地理信息系统等各行各业。例如,交通卡刷卡每天产生1900万条记录,手机定位数据每天产生1800万条,出租车运营数据每天产生100万条,电子停车收费系统数据每天产生50万条,等等。这些数据在体量和速度上都达到了大数据的规模。
案例2:搜索引擎公司通过跟踪网民对“感冒症状”以及“治疗”等关键词的搜索,发现某个时段在某个区域内搜索数量急剧增长,从而成功预测了甲型H1N1流感的暴发时间、地域。
案例3:目前,某基于大数据的网约车平台已覆盖全国400多个城市,涵盖出租车、快车、顺风车、代驾、专车、试驾以及租车等多项业务,为人们的出行带来极大的便利。我们只需在网约车APP上输入或者说出目的地,强大的智能系统就立刻分配订单,即时通知附近司机;借助定时定位系统,我们可以看到司机的大致位置以及预计到达时间。
探究活动二
1)互联网产生大数据角度
二、大数据的特征
特征
4V
B
D
C
A
Variety
多样
velocity
高速
Value
低价值密度
Volume
大量
1)互联网产生大数据角度
1)互联网产生大数据角度—大量(Volume)
二、大数据的特征
大范围:地球各个角落
长时间:每时每刻都在产生
多对象:物联网、云计算、移动互联网、车联网、手机、电脑、、、从TB级别跃升到PB、EB级别
1)互联网产生大数据角度—大量(Volume)
二、大数据的特征
1GB
1MB
1KB
1024B
1024KB
1024MB
1PB
1024TB
1B
8bit
传统电脑 GB/TB级别
硬盘 1TB/2TB/4TB
1TB
1024GB
1EB
1024PB
PB?
EB?
1)互联网产生大数据角度—多样(variety)
二、大数据的特征
数据类型繁多。如网络日志、音频、视频、图片、地理位置….
1)互联网产生大数据角度—价值密度低(value)
二、大数据的特征
2014年美国波士顿爆炸案,现场调取了10TB的监控数据(包括移动基站的通讯记录,附近商店、加油站、报摊