内容正文:
5.1认识大数据
在日常工作、生活和学习等活动中,人们的一举动基本 上都可以数字化。例如,从家中出门到达工作地点选择的交通工具,路线和所用时间:每刷一次微博、 拨打一次电话、发送。 条短信、网上银行转账或者浏览相关网站,其至所在的地理位置信息等都产生了大量数据。
在第一章,我们已经介绍了数据的基本概念与特征,下面我们将学习大数据的基本概念与特征。
5.1.1 大数据
大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据的产生是与人类日益普及的网络行为所件生的:物联网、云计算、移动互联网、车联网、手机、电脑以及遍布地球各个角落的各种各样的传感器,无不是数据的来源或是承载的方式。互联网生成的数据量,不仅远超此前一切人类所生 成的数据量的总和,而且在以大爆发性的速度不断增长。
在天气预报、大气监测、地球物理探矿和天体运动观测等科学实验和科学观察等活动中,各种各样的传感器每时每则都在产生大量的数据。
大数据已成为人们提取信息、 做出决策的重要依据,是推动信息社会发展的重要资源。
5.1.2 大数据的特征
我们正处于一个大数据时代,大数据使人们的生活、工作与思维方式等都产生了巨大的变革。那么,大数据究竟具有哪些特征?
探究活动
分析
仔细阅读以下案例,分析大数据具有哪些特征。
案例1:某市交通智能化分析平台的数据来源于道路交通、电信、地理信息系统等各行各业。例如,交通卡刷卡每天产生1900万条记录,手机定位数据每天产生1800万条,出租车达营数据每天产生100万条,电子停车收费系统数据每天产生50万条。等等。这些数据在体量和速度上都达到了大数据的规模。
案例2:搜索引擎公司通过跟踪网民对“感冒症状"以及“治疗”等关键词的搜索,发现某个时段在某个区城内搜索数量急刷增长,从而成功预测了甲型HINI流感的基发时间,地城案例3:目前,某基于大数据的网约车平台已覆盖全国400多个城市,涵盖出租车、快车、顺风车、代驾、专车、试驾以及租车等多项业务,为人们的出行带来极大的便利。我们只需在网约车APP上输入或者说出目的地,强大的智能系统就立刻分配订单,即时通知附近司机:借助定时定位系统,我们可以看到司机的大致位置以及预计到达时间。
(1)从互联网产生大数据