内容正文:
先来观看视频,谈谈你的想法
视频中营业员是如何掌握顾客的信息的?
你还见过哪些相似的场合?
大数据的获取、处理与分析
......
淘宝购物
抖音视频推介
超市营销
一个可以大规模生产、分享、应用数据的时代
正在进行!
长丰县素有"中国草莓之乡"的美誉,是我国著名的优质草莓产地。草莓是长丰县最具特色、最成规模、最有影响、最受关注、最聚人气的特色农业。
我们能否利用大数据来促进长丰草莓产业的发展呢?
本章项目探究主题:长丰草莓的数据分析和可视化表达
4
5.4 数据的可视化表达
5.1 认识大数据
5.3 数据的分析
5.2 数据的采集
第五章 数据处理与可视化表达
5
大数据
大数据的概念
大数据的特征
大数据对日常生活的影响
5.1 认识大数据
必修一 《数据与计算》
6
任务一:自主学习--大数据的概念与特征
要求:自主学习教材P101-102内容,完成下表,提交作业
1)大数据的概念
2)大数据的特征
判断角度 具体特征
从互联网产生的角度 大量、多样、价值密度低、变化速度快
指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产
从互联网思维的角度 样本渐趋于总体、精确让位于模糊、相关性重于因果
从存储与计算的角度 分布式存储与分布式并行计算
7
8
1、什么是数据
9
大量的数据?
=
大数据
2、什么是大数据
大数据(BIG DATA)指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
10
2、什么是大数据
在一定时间范围内,用常规软件工具捕捉、管理和处理的数据不属于大数据
思考:这张电子表格中的数据属于大数据吗?
11
思考:淘宝数据属于大数据吗?
无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合
、凤阳中学期末考试之后,所有学生的考试成绩。
、十本《西游记》。
、网络购物平台一天所生成的数据量。
判断一下:下面哪些是大数据?
13
大数据(BIG DATA)指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据的产生是与人类日益普及的网络行为所伴生的;
……
14
3、大数据是怎么产生的?
我们的日常工作和学习中,人们的一举一动基本都可以数字化,每一次出行每刷一次微博拨打一次电话逛一次淘宝叫一次外卖等等都产生了大量数据,
15
大数据已成为人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源。
16
4、大数据的价值是什么?
特征
4V
B
D
C
A
Variety
多样
velocity
高速
Value
低价值密度
Volume
大量
1)互联网产生大数据角度
5、大数据有怎样的特征呢?
17
大范围:地球各个角落
长时间:每时每刻都在产生
多对象:物联网、云计算、移动互联网、车联网、
手机、电脑、、、从TB级别跃升到PB、EB
级别
5、大数据有怎样的特征呢?
大量(Volume)
PB
EB
19
1GB
1MB
1KB
1024B
1024KB
1024MB
回顾一下
1PB
1024TB
1B
8bit
传统电脑 GB/TB级别
硬盘 1TB/2TB/4TB
1TB
1024GB
1EB
1024PB
20
多样(variety)
数据类型繁多。如网络日志、音频、视频、图片、地理位置….
2
大数据的特征
价值密度低(value)
低价值密度
2014年美国波士顿爆炸案,现场调取了10TB的监控数据(包括移动基站的通讯记录,附近商店、加油站、报摊的监控录像以及志愿者提供的影像资料),最终找到了嫌疑犯的一张照片。
刚刚过去的一分钟
数据世界里
发生了什么?
12306:1840张车票被卖出
Twitter:98000条推送被发出
Facebook:69.5万条状态被更新
Youtube:2880分钟的视频被上传
Google:200万次搜索请求被提交
email:Email:2.04亿封被发出
变化速度快(velocity)
样本趋于总体
精确让位于模糊
相关性重于因果
The activities of a company with buying and selling a product or service. The activities
The activ