内容正文:
《数据与大数据》
《数据与计算》第一章第六节
10101000101010010110
10101000110
目录
1.1 数据、信息与知识
1.2 数据采集与编码
1.3 数据管理与安全
1.4 数据与大数据
数据与大数据
思考:平凡的一天中,你会产生多少数据?中国人会产生多少数据?
据统计,微信用户每一分钟发布46.52万张图片;每一分钟发起22.91万次视频通话;每一分钟会有54.16万人进入朋友圈。百度用户每一分钟进行416.6万次搜索。每分钟会有6.94万次语音播报。美团每一分钟会有3.06万单。淘宝每一分钟会有658.8万人民币销售额。天猫每分钟会有767.59万销售额。滴滴每一分钟2.84万单。B站每分钟会有83.3万次播放。京东每分钟会有496.57万销售额。到2025年,全球每天预计会有463艾字节(EB)的数据产生,相当于每天产出相当于212,765,957张DVD碟。
大数据的概念和特征
大数据的概念和特征
1. 大数据的概念
大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。
大数据之“大”, 不仅指规模、速度和种类的特征,还意味着它超出以往常用的数据采集、组织、 管理和加工等软件的处理能力,要求新型集成技术从多元、复杂和巨量规模的数据集里洞察规律。
大数据的概念和特征
2. 大数据的特征
数据量大不一定就是大数据,用传统算法和数据库系统可以处理海量数据不能算“大数据”,大数据特征可用4V表示:
数量(Volume)
速度(Velocity)
多样( Variety )
价值( Value )
大数据的概念和特征
数量(Volume):数据体量大
1Byte
1
KB
1
MB
1
GB
1
TB
1PB
1EB
1ZB
1
YB
1PB相当人大脑能存储的信息
一般情况下,大数据是以PB、EB、ZB为单位进行计量的
1
PB
1
EB
1
ZB
1
YB
1
PB
1
EB
1
ZB
1EB相当于6626亿部《红楼梦》
大数据的概念和特征
数据产生的速度快,数据处理的速度快。
速度(Velocity)
大数据的概念和特征
多样(Variety):来源多;数据种类和格式多
人工产生:短信、微信、视频、语音、电子邮件等;
机器自动产生:生产检测、环境监测、交通检测、安防检测等。
大数据的概念和特征
价值密度低,大量的视频记录下来,有许多冗余。挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息。
价值(Value):大数据不仅仅是技术,关键是产生价值
某超市被偷窃的时间只有短短5分钟,店主需要从大量监控视频中找到有效信息
大数据思维
电商平台销售数据分析:某电商平台通过大数据分析客户的购买历史和浏览记录,发现很多客户在购物车添加了商品却没有购买。基于这个规律,电商平台可以向这些客户发送优惠券和推荐商品,以促进他们的购买行为,提高销售量。
沃尔玛通过分析消费者购物行为,尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。
都体现了
大数据思维!
大数据思维
大数据是一场变革, 改变的不仅是数据,还有人们的思维。
分析全体数据,而不是抽样数据
接受数据的混杂性,不再追求精确性
注重相关性,不强调因果性
大数据对社会的影响
大数据已经渗入到社会的各个层面,大数据让生活更便利,提高学习和
工作效率
大数据让决策更加精准
大数据带来新的就业机会
大数据带来新的社会问题
大数据带来新的就业需求
大数据对社会的影响
1.大数据让生活更便利
例如:人们可以通过城市热力图了解一个区域的人流量及拥挤情况,绿色部分显示的是人流量小或稀疏的地理区域。城市热力图通过手机基站来定位区域中的手机用户,根据用户数量渲染地图的颜色,来展示该区域的人流密度,为人们的出行提供参考。
城市热力图
大数据对社会的影响
2.大数据让决策更精准
大数据支持动态跟踪与全样本采集,为各种决策提供了第一手的材料,再加上可视化技术的应用,提高了数据分析的即时性,可以帮助管理者及时发现问题,进行即时干预。
例如:江西省上饶市教育局利用大数据动态收集农村孩子入学、辍学、父母陪伴等信息,及时发现留守儿童的学习问题,开展精准助学与帮扶;
又如,北京在共享单车运行一年后,重新调整了公交路线,正是共享单车所产生的大数据让交通部门发现了部分线路的公交站点缺失,从而精准地确定了更为利民的交通路线图。
大数据对社会的影响
3.大数据带来新的社会问题
大数据给生活带来便利的同时,也带来如信息泄露、数据安全、个人隐私甚至伦理道德等方面的社会问题。
用户在网上注册、网上购物等过程中,会留下个人信息。大数据的汇集不可避免地加大了用户隐私数据信息泄露的风险,如何保护个人的隐私成为亟待解决的问题。
各领域对于用户隐私保护有多方面的要求和特点,数据之间存在复杂的关联性和敏感性,针对传统关系型数据的隐私保护模型和算法,大部分都不能直接将其移植到大数据应用中。
大数据对社会的影响
4.大数据带来新的就业需求
随着大数据的发展,与之相关的职业需求也急剧增长。如,系统研发工程师、应用开发工程师、数据可视化工程师和数据分析师等职业,带来了成千上万的岗位。
课堂小结
全样而非抽样
效率而非精确
相关而非因果
大数据思维
数据体量大
速 度 快
数据类型多
价值密度低
大数据特征
4V
数据采集
数据导入
数据分析
处理过程
国家安全
社会安全
个人隐私
带来的问题
数据展示
Lavf58.45.100
Packed by Bilibili XCoder v2.0.2
$