内容正文:
5.1 认识大数据
一、选择题
1.某电商平台通过分析客户的爱好和消费行为及其趋势,为客户提供了更为精准的服务。这属于大数据的在哪个方面的应用( )
A.智慧城市 B.医疗健康 C.生活服务 D.社区管理
2.下列关于大数据的说法,正确的是( )
A.系统可以使用批处理计算对购票的实时数据进行分析
B.大数据指数据量庞大、价值密度高的数据
C.大数据应用不会泄露用户隐私信息
D.一般采用分治思想进行大数据分析
3.下列选项中,不属于大数据应用的是( )
A.电商网站搜集客户的社交数据 B.图书管理员手工整理图书
C.新零售线上线下购物体验 D.智慧导航随时呈现各条道路通畅情况
4.利用某平台的大数据进行气象预测,下列描述正确的是( )
A.气象预测所需的实时数据一般采用批处理方式
B.该系统对大数据进行计算的过程中依赖于规范的结构化数据
C.有关气象的大数据只有及时处理才能充分发挥价值
D.只有通过大数据分析出天气变化的原因,才能对气候预判越来越准
5.在被称为“死亡之组”的组淘汰赛中,日本队凭借救回一颗似乎已经出界了的球,成功破门反超西班牙把“四星德国”送回了家。该球用肉眼看确实已经到了界外。然而,通过AI裁判的最终数据显示,当时足球的投影与底线重合了1.88毫米,而根据规则,足球出界的定义是指球体正上方的垂直投影要完全越出底线,因此判定进球有效。下列关于数据、信息、知识说法不正确的是( )
A.当人们孤立地看 1.88 时它仅仅是一数据
B.从日本队破门反超西班牙推算出德国队淘汰这是知识的体现
C.人们热衷于观看直播体验足球运动带来的不确定性这是信息时效性的体现
D.球赛实时产生的大数据适合采用批处理计算方式处理
6.下列选项中未用到大数据技术的是( )
A.某网站利用可视化“迁徙”地图,分析各城市人口流动轨迹与特征
B.流感爆发时期,用户利用“城市热力图”提供的信息,避开人流密度高的地区
C.某平台以网民行为数据为基础,研究关键词搜索趋势,洞察网民消费特征
D.在超市、银行等场所,用手持测温仪测量入场人员的体温数据
7.2019年,实验室向全球发布了“殷契文渊——甲骨文大数据平台”。该平台集甲骨文著录库、文献库、字形库于一体。截至目前,平台数据库中共收录甲骨著录152部,种类数量为世界最多。通过这个平台,能让甲骨文被更多人所看到,并且还能借助“人机协同”的方式,通过智能化信息提取,帮助专家破译未释读的甲骨文。下列关于数据和大数据的说法不正确的是 ( )
A.甲骨文是数据
B.甲骨文是信息
C.大数据价值密度低,需要对其“提纯”才能获得用于帮助专家破译未解释的甲骨文
D.甲骨文著录库在计算机中一般是以二进制数存储
8.下列对关于大数据和人工智能的说法正确的是( )
A.大数据肯定可以用Hadoop来处理
B.对图结构的数据,一般采用流计算模式进行处理
C.扫地机器人在运动中不断从环境学习,属于行为主义人工智能
D.达·芬奇外科手术机器人,属于领域人工智能
9.某品牌牛奶企业的数字化,实现从牧场(grass)到杯中(glass)的大数据洞察。在该企业的牧场生态平台上,有许多可以开展数字化的工作,“比如说,如何配比黄金比例的饲料,帮助奶牛达到最大产奶量;奶牛的体温达到39°c”是否可以判断出生病了。”该案例中的牧场生态平台属于大数据管理平台,以下选项中描述错误的是( )
A.大数据管理平台需要容纳海量的数据
B.大数据管理平台提供数据采集,数据计算,数据存储,数据分析,数据可视化等大量开放能力
C.因为大数据管理平台中已有数据分析功能,所以不再需要考虑专家的建议
D.大数据管理平台一般都配备自动预警提示,对提升、异常、改善事件及时自动预警
10.下列关于大数据与大数据处理的说法,不正确的是( )
A.大数据价值密度低,“提纯”大数据可以让其发挥更大的价值
B.高速公路中实时产生的车流量数据属于静态数据
C.词频统计是文本数据处理中特征提取的一种方法
D.经过处理后的大数据,利用可视化技术,有助于快捷观察与追踪数据
11.大数据、人工智能的迅猛发展和普及,为杭州亚运会的筹备加入了许多数智化创新的元素。例如电竞中心运用全感知的5G数字基座,接入了设备数量超万台、数据类型达10万种以上的“数字驾驶舱”,可以实现场馆平时与赛时相结合的智能化管理,也可借助人行、车行设备系统实现对车辆数据、通行数据、检票数据的流量分析及预警。下列关于数据安全的说法,正确的是( )
A.在使用“数字驾驶舱”数据时,不需要考虑数据的安全性
B.通过对检票数据进行加密、校验等方法有助于提高数据的安全性
C.对“数字驾驶舱”中的数据进行管理时,可以采用传统的数据库管理技术
D.增强数据安全,重点应该提高数据本身的安全,存储数据介质的安全不太重要
12.以下关于大数据的说法,错误的是( )
A.大数据的处理离不开云计算
B.从网络上搜索得到的数据称为大数据
C.大数据在电商、电、金融等各行业都有巨大的社会价值和产业空间
D.大数据是指无法在可承受的时间范围内,用常规软件工具进行捕捉、管理和处理的数据集合
13.下列关于大数据的说法,正确的是( )
A.大数据要分析全体数据 B.大数据时代样本数据的分析已经不再使用
C.数据校验可以提高数据的保密性 D.互联网搜索到的信息都是真实可信的
14.以下属于大数据应用实例的是( )。
①某系统通过用户视频点播的基础数据如评分、播放、快进等,分析计算出用户可能喜爱的影片,并为他提供定制化的推荐
②某网站通过追踪用户在其网络的行为,识别用户在它的网络中的好友,从而给出新的好友推荐建议
③某交通流量数据公司依靠分析历史和实时路况数据,能给出及时的路况报告,以帮助司机避开正在堵车的路段,并且帮他们提前规划好行程
④某保险公司天都会对美国境内超过100万个地点、未来两年的天气情况进行超过1万次模拟,而后将根系结构和土壤孔隙度的相关数据,与模拟结果相结合,为成千上万的农民提供农作物保险
A.①②④ B.①②③ C.②③④ D.①②③④
15.关于大数据,以下说法错误的是( )
A.大数据之大,不仅指信息量大,还包括产生的速度快、种类多等特点
B.大数据的来源可以是人工产生的,也可以是机器自动产生的
C.大数据中,每个数据的价值都非常大,不能随意处理
D.大数据为生活带来便利的同时也带来了安全隐患
16.下列关于大数据的说法,正确的是( )
A.大数据指数据量庞大、价值密度高的数据
B.一般采用分治思想进行大数据分析
C.系统可以使用批处理计算对购票的实时数据进行分析
D.大数据应用不会泄露用户隐私信息
17.王明用邮箱绑定了某购物平台账号,发现只要在该购物平台浏览过某些商品,邮箱会不定期收到该购物平台推介相关商品。精准推送的实现是基于( )
A.虚拟现实技术 B.微电子技术 C.大数据技术 D.自然语言理解技术
18.下列关于大数据的说法,不正确的是( )
A.大数据追求数据的精确性,处理大数据时要保证每个数据准确无误
B.大数据一般具有数据规模大、处理速度快、数据类型多、价值密度低四个特征
C.大数据中各种结构化、半结构化和非结构化数据共存
D.大数据更加注重事物的相关性而不是因果关系
二、填空题
19.在大数据处理中,分布式计算框架如 和 被广泛应用。
20.大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的 。
21.从互联网产生的大数据角度来看,大数据具有4V特征,分别是 、 、 、 。
22.交通作为人类行为的重要组成和重要条件之一,对于大数据的感知也是最急迫的。近年来,我国的智能交通已实现了快速发展,许多技术手段都达到了国际领先水平。交通大数据的来源有交通卡的刷卡记录、道路的摄像头、车站机场的售票情况、各公园的人流情况以及历年的交通数据,等等。这说明的大数据特征中的 ;以上的每个数据来源每时每刻都产生大量数据,这说明了大数据特征中的 ;利用好这些大数据,可以提高社会的出行效率,节约社会资源,为社会创造财富,这说明大数据特征中的 。
三、判断题
23.数据价值密度高是大数据的主要特征之一。( )
24.大数据的特点有数据量大、数据类型多、数据产生的速度快、数据价值密度高。( )
25.大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合。是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产( )
26.大数据之大,不仅指信息量大,还包括产生的速度快、种类多等特点。( )
四、简答题
27.请描述什么是云计算,并简述其主要服务模式。
28.结合教材中的例子,说明数据、信息和知识之间的关系,并谈谈你对大数据的理解。
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.C
【详解】本题主要考查大数据的应用。某电商平台通过分析客户的爱好和消费行为及其趋势,为客户提供了更为精准的服务。这属于大数据在生活服务方面的应用,故本题选C选项。
2.D
【详解】本题考查大数据相关内容。A选项,静态数据适合批处理,流数据适合实时计算,选项错误。B选项,大数据具有数据体量大、速度快、数据类型多、价值密度低的特点,选项错误。C选项,大数据应用会泄露用户隐私,选项错误。D选项,大数据一般采用分治思想进行分析处理,选项正确。故本题答案是D选项。
3.B
【详解】本题考查的是大数据。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。图书管理员手工整理图书不属于大数据应用。故本题应选B。
4.C
【详解】本题主要考查大数据的描述。气象预测所需的实时数据一般采用流计算,静态数据采用批处理方式;大数据一般结合结构化、半结构化和非结构化数据;有关气象的大数据只有及时处理才能充分发挥价值;大数据不探求因果关系,而是注重数据关联,故本题选C选项。
5.D
【详解】本题主要考查数据、信息和知识的描述。当人们孤立地看 1.88 时它仅仅是一数据;从日本队破门反超西班牙推算出德国队淘汰这是知识的体现;人们热衷于观看直播体验足球运动带来的不确定性这是信息时效性的体现;大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。球赛实时产生的数据还达不到该级别,故本题选D选项。
6.D
【详解】本题主要考查大数据技术的应用。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。 大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。 适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。在超市、银行等场所,用手持测温仪测量入场人员的体温数据没有用到大数据技术,故本题选D选项。
7.B
【详解】本题主要考查数据和大数据的描述。数据是记录客观事物的、可鉴别的符号,甲骨文是数据,而非信息;大数据价值密度低,需要对其“提纯”才能获得用于帮助专家破译未解释的甲骨文;甲骨文著录库在计算机中一般是以二进制数存储,故本题选B选项。
8.C
【详解】本题主要考查大数据和人工智能技术。通过使用Hadoop,用户可以利用集群的存储和处理能力,并实现大数据的分布式处理,但不是肯定能处理;对图结构的数据,一般采用矩阵图,或者数组加链表来实现;扫地机器人在运动中不断从环境学习,属于行为主义人工智能;达·芬奇外科手术机器人,属于跨领域人工智能,故本题选C选项。
9.C
【详解】本题主要考查大数据的描述。大数据管理平台需要容纳海量的数据;大数据管理平台提供数据采集,数据计算,数据存储,数据分析,数据可视化等大量开放能力;虽然大数据管理平台中已有数据分析功能,但仍需要考虑专家的建议;大数据管理平台一般都配备自动预警提示,对提升、异常、改善事件及时自动预警,故本题选C选项。
10.B
【详解】本题考查的是大数据。高速公路中实时产生的车流量数据是不间断地、持续到达的,属于流数据。故选项B说法不正确。本题应选B
11.B
【详解】本题考查的是数据安全。在使用“数字驾驶舱”数据时,需要考虑数据的安全性;通过对检票数据进行加密、校验等方法有助于提高数据的安全性;“数字驾驶舱”中的数据属于大数据,无法采用传统的数据库管理;增强数据安全,重点应该提高数据本身的安全,存储数据介质的安全也很重要。故本题应选B。
12.B
【详解】本题主要考查大数据的描述。大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,所以从网络上搜索得到的数据称为大数据表述错误,故本题选B选项。
13.A
【详解】本题考查大数据。B选项错误,抽样数据分析是一种传统的常用数据分析方法;C选项错误,数据校验主要用于保证数据的完整性(安全性);D选项错误,互联网搜索到的信息不一定都是真实可信的。故答案为:A。
14.D
【详解】本题考查的是大数据相关知识。大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。故选项D正确。
15.C
【详解】本题考查的是大数据相关知识。大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据具有“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)。故本题应选C。
16.B
【详解】本题考查的是大数据的描述。大数据具有数据体量大、速度快、数据类型多、价值密度低的特点,A选项错误;静态数据适合批处理,流数据适合实时计算,图数据需要进行图计算,C选项错误;大数据应用会泄露用户隐私,D选项错误。故选B。
17.C
【详解】本题考查的是大数据技术应用。大数据技术是指大数据的应用技术,涵盖各类大数据平台、大数据指数体系等大数据应用技术。精准推送的实现是基于大数据技术。故本题应选C。
18.A
【详解】本题考查大数据。大数据不追求数据的精确性,因为大数据的数据量非常庞大,要保证每个数据准确无误是很难做到的,且在很多情况下,大数据更关注数据的整体趋势和模式。故答案为:A。
19. Hadoop Spark
【详解】本题考查大数据。Hadoop和Spark是目前最流行的分布式计算框架,它们能够处理TB甚至PB级别的数据,并提供高效的数据处理能力。故答案为:Hadoop、Spark。
20.数据集合
【详解】本题考查的是大数据描述。大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。
21. 大量 多样 低价值密度 高速
【详解】本题主要考查大数据的特征。从互联网产生的大数据角度来看,大数据具有4V特征,分别是:大量、多样、低价值密度、高速。
22. 多样性 巨量性 价值性
【详解】本题主要考查大数据的特征。①交通大数据的来源有交通卡的刷卡记录、道路的摄像头、车站机场的售票情况、各公园的人流情况以及历年的交通数据,等等。这说明的大数据特征中的多样性。②以上的每个数据来源每时每刻都产生大量数据,这说明了大数据特征中的巨量性。③利用好这些大数据,可以提高社会的出行效率,节约社会资源,为社会创造财富,这说明大数据特征中的价值性。
23.错误
【详解】本题考查大数据特征。大数据具有的特征是:数据体量巨大、速度快、数据类型多、价值密度低。故表述错误。
24.错误
【详解】本题考查大数据特点。大数据的特点有数据量大、数据类型多、数据产生的速度快、数据价值密度低,故表述错误。
25.正确
【详解】本题主要考查大数据的描述。大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合。是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,表述正确。
26.正确
【详解】本题主要考查大数据的描述。大数据之大,不仅指信息量大,还包括产生的速度快、种类多等特点,故表述正确。
27.云计算是一种通过互联网提供计算资源和服务的模式。它允许用户按需访问和使用存储、处理能力和软件应用。云计算的主要服务模式包括基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。
【详解】本题考查云计算。
云计算(Cloud Computing)是分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡等传统计算机和网络技术发展融合的产物。它基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云计算的核心理念是将计算资源、存储资源和网络资源封装成一个独立的虚拟环境,专为企业和用户提供各种计算资源和服务。
云计算的主要服务模式包括三种:基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。这三种服务模式在提供的功能、抽象层级和用户责任上有着明显的区别。
基础设施即服务(IaaS, Infrastructure as a Service)
定义:IaaS是云计算的一个基本服务模型,它提供了虚拟化的计算资源,包括虚拟服务器、存储和网络。用户可以根据需要租用这些资源,而无需关心底层的硬件和基础架构。
功能:提供虚拟化的计算、存储和网络资源。用户可以自定义配置操作系统、应用程序和中间件,按需付费。
抽象层级:在云服务的层次中较低,用户需要管理操作系统和应用程序,以及与虚拟机、存储和网络的交互。
用户责任:用户需要负责操作系统的安装、配置、维护,以及应用程序的部署和管理。云提供商负责基础设施的维护和管理。
典型例子:亚马逊AWS的EC2(弹性计算云服务)。
平台即服务(PaaS, Platform as a Service)
定义:PaaS是一种更高级别的云服务模型,它在IaaS的基础上,为开发者提供了更高层次的服务。PaaS为开发者提供了一个开发和部署应用程序的平台,包括操作系统、中间件、开发工具、数据库和运行时环境等。
功能:提供应用程序开发和部署的平台,包括开发工具和运行时环境。开发者可以专注于应用程序的开发,而无需关心底层的基础架构。
抽象层级:在云服务的层次中介于IaaS和SaaS之间,用户无需管理底层基础设施,但需要处理应用程序层面的事务。
用户责任:用户负责应用程序的开发、部署和管理,但无需关心底层的操作系统、服务器等细节。云提供商负责底层基础设施的自动化管理。
典型例子:Google App Engine、Microsoft Azure的App Service。
软件即服务(SaaS, Software as a Service)
定义:SaaS是一种最高层次的云服务模型,它提供了完整的应用程序作为服务。用户可以通过网络直接访问应用程序,而无需安装、维护或管理应用程序的基础设施。
功能:提供完整的应用程序作为服务,用户通过浏览器访问应用程序。无需安装、维护或管理应用程序的基础设施。
抽象层级:在云服务的层次中最高,用户只需使用应用程序,而无需关心底层的基础设施和操作系统。
用户责任:用户只需使用应用程序,无需关心应用程序的维护、更新和安全性等。云提供商负责应用程序的管理和维护。
典型例子:Salesforce(客户关系管理软件)、Google Workspace(办公协作套件)。
这三种服务模式各有特点,满足了不同用户从基础设施到软件服务的多元化需求。企业和开发者可以根据自身需求选择合适的服务模式,从而更加灵活地利用云计算的优势。
28.数据是对客观事物属性的描述,是记录下来的符号;信息是数据中所包含的意义,是对数据的解释;知识是经过人类归纳整理和验证后沉淀下来的规律。数据是信息和知识的来源,信息是经过加工的数据,知识是经过提炼的信息。大数据是体量巨大、处理速度快、来源多样、价值密度低的数据集合,它对生产、生活和治理产生了深远影响。
【详解】本题考查数据和信息。
1、数据、信息和知识之间的关系
在探讨数据、信息和知识之间的关系时,我们可以从它们各自的定义和相互转换的过程入手。数据是客观事实的记录,可以是数字、文字、图像等多种形式,它本身并没有特定的含义或价值。然而,当我们对这些数据进行处理和分析时,就能够从中提取出有价值的信息。信息是经过加工处理后的数据,它具有特定的含义和价值。例如,在市场调研中,我们收集的销售数据只是原始的数据,但当我们对这些数据进行统计分析后,就能够得出产品的销售情况、市场趋势等信息。这些信息不仅能够帮助我们了解市场的现状,还能够指导我们的决策和行为。进一步地,知识是在长期的学习和实践过程中积累起来的,是对信息的高度概括和总结。知识能够帮助我们更好地理解和应用信息,提高我们的认知水平和解决问题的能力。在教育领域,教师不仅需要掌握学科知识,还需要了解教育心理学、教学方法等方面的知识,以便更好地指导学生学习和成长。
综上所述,数据、信息和知识之间的关系是相互依存、相互促进的。数据是信息的基础,信息是知识的来源,知识是对信息的深入理解和应用。在实际应用中,我们需要充分利用这三者之间的关系,通过收集和分析数据、获取和处理信息、积累和应用知识,不断提高我们的认知水平和解决问题的能力。
2、对大数据的理解
大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。它具有数据量大、数据类型多样、价值密度低和产生处理速度快等特点。大数据技术的发展和应用,已经深刻地改变了我们的生活方式和工作模式。
首先,大数据的出现使得我们能够更全面地了解和分析事物。在传统的数据处理方式下,由于数据量有限,我们只能对部分数据进行处理和分析。然而,在大数据时代,我们可以收集和分析海量的数据,从而得出更加全面和准确的结论。
其次,大数据技术的应用可以帮助我们实现精准营销和个性化服务。通过对用户的行为和偏好进行分析,企业可以更加准确地了解用户的需求和喜好,从而提供更加个性化的产品和服务。同时,企业还可以根据用户的反馈和数据分析的结果,不断优化产品和服务,提高用户的满意度和忠诚度。
最后,大数据技术的发展也带来了新的挑战和机遇。由于大数据的复杂性和多样性,我们需要不断学习和掌握新的技术和方法,才能更好地处理和分析大数据。同时,我们也需要关注大数据的隐私和安全问题,确保用户的个人信息和数据安全。
总之,大数据技术的发展和应用已经深刻地改变了我们的生活和工作方式。在未来,我们需要更加深入地了解和应用大数据技术,以应对新的挑战和机遇。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$