内容正文:
3.2 数据采集与整理
一、选择题
1.在大数据处理中,MapReduce是一种什么样的数据处理模型( )
A.批处理模型 B.实时处理模型 C.流处理模型 D.图处理模型
2.日常生活中,下列措施不能防止数据丢失的是( )
A.定期备份数据 B.设置高强度系统口令
C.将计算机中的数据全部移动到移动硬盘上 D.安装防火墙
3.加密技术的主要用途是( )
A.提高数据存储容量 B.提升数据处理速度
C.保护数据隐私和安全 D.增加数据复杂性
4.下列有关数据采集的说法,不正确的是( )
A.互联网是目前人们日常所需数据的主要来源
B.现阶段数据的获取主要依靠手工方式进行
C.数据采集完成后,从中挖掘信息并为下一步的决策提供依据
D.智能手环获取人体心率、睡眠等数据主要是通过传感器进行采集
5.为了避免数据安全带来的威胁,我们应该( )
A.不在社交平台发布个人隐私信息 B.下载和安装未知软件
C.参与“扫一扫”送礼品 D.使用公共场所WiFi
6.数据处理的一般过程包括以下哪几个步骤?( )
A.数据采集、存储、加工、分析 B.数据采集、加工、分析、可视化
C.数据采集、存储、分析、表达 D.数据采集、加工、分析、决策
7.指纹考勤机(如下图所示)是通过提取指纹图像对人员的考勤进行管理,其工作流程可以分为:(1)指纹图像处理(2)指纹图像特征匹配(3)指纹图像采集(4)指纹图像特征提取,正确的顺序应该是( )
A.(1)(2)(3)(4) B.(3)(1)(2)(4)
C.(3)(1)(4)(2) D.(3)(4)(1)(2)
8.下列有关数据安全与大数据的说法,正确的是( )
A.大数据的数据类型多、数据处理速度快、价值密度高
B.大数据强调事物的因果关系,也注重数据之间的相关性
C.通过数据加密方法来提高数据的完整性
D.大数据带来便利的同时也会带来数据泄露、个人隐私等社会问题
9.下列做法中,能增强数据安全的是( )
A.为手机设置锁屏密码 B.下载软件后直接安装
C.在公用计算机上保存社交软件登录密码 D.解除手机上支付宝账号的手势密码
10.中华恐龙园是常州的景点之一,小华通过多种方式获得了中华恐龙园的相关数据,下列选项中属于直接数据的收集方法为( )
A.通过网络搜索中华恐龙园的景点介绍 B.通过某网上的宣传片了解中华恐龙园
C.通过访谈法获得游客们对旅游景点的看法 D.通过宣传手册了解中华恐龙园的景点
11.下列关于数据管理与安全的说法,不正确的是( )
A.计算机数据的管理先后经历了人工管理、文件管理、数据库管理三个阶段
B.为预防自然灾害造成数据损坏,可建设异地容灾系统
C.黑客入侵、病毒感染都可能造成数据的损坏
D.对于数据安全,重在提高数据本身的安全,存储数据的介质是否安全不重要
12.下列关于大数据及数据安全的说法,不正确的是( )
A.为了提高账户安全,不同的网站登录使用不同的密码
B.保护数据的安全不仅要提高数据本身的安全,也要保护存储数据的介质
C.基于大数据技术,个别数据不准确不会影响数据分析
D.大数据的数据规模大,因此分析数据只针对抽样数据,而不是全体数据
13.李军同学在做研究性学习时,想通过问卷调查了解人们垃圾分类的情况,遇到了以下难题,请你帮他完成。请根据以上情境,完成此题。
问卷的发放、填写、回收的过程主要属于数据处理的什么阶段( )
A.数据采集 B.数据分析 C.数据呈现 D.数据整理
14.随着技术的发展,数据量的增长速度越来越快,管理数据和保护数据安全显得尤为重要,下列关于数据管理与安全的说法,正确的是( )
A.为了预防自然灾害引起的数据损坏,一般采用安装磁盘阵列系统
B.为了保护个人数据在网络平台的安全,可以采取每天改变一次密码
C.安装防火墙和杀毒软件就不会再感染计算机病毒
D.急剧增长的数据需借助云计算与大数据等技术,以提高数据管理水平
15.作为一名大数据时代下的高中生,学习数据保护的方法是必不可少的,关于数据保护的方法,以下错误的是( )
A.可以将数据备份,以免设备发生故障时数据无法使用
B.连接无线网络时,可以随意选择信号源
C.合理配置智能终端的数据采集功能,保护个人隐私数据
D.连接其他设备时,认真阅读操作提示和安全事项
16.下列关于数据安全的说法,不正确的是( )
A.自然灾害不会导致数据安全问题
B.威胁数据安全的因素有操作失误、黑客入侵、感染计算机病毒等
C.通过数据加密和数据校验等方法,可以提高数据的保密性和完整性
D.保护数据的安全也需要保护存储数据的介质
二、填空题
17.数据清洗的主要目的是从数据集中移除 数据。
18.数据清洗的主要目的是 。
19.在 加密中,加密和解密使用不同的密钥。
20.在《数据与计算》中,数据处理是指对数据进行 、 、 、 和 的过程,它是调查研究的核心活动,有助于从原始数据中提取有价值的信息,形成结论和决策。
三、判断题
21.对商品上的条形码进行扫描,属于数据编码的过程。( )
22.数据处理的目的是将原始数据转换为有价值的信息。( )
23.中国国家互联网信息办公室(简称“国家网信办”)2021年7月2日发布公告暂停滴滴注册新用户。7月4日(间日)国家网信办进面要求应用商店将滴滴出行APP应用程序下架。我们使用的手机、计算机、网信用卡等信息科技都会产生数据,数据不存在泄露的风险。( )
24.高中生的个人数据泄密或丢失造成的损失和影响很小,可以不必在意数据的保护。( )
25.小军要完成对中学生心理健康状态的调查,他可以使用问卷星提供的问卷设计、调查回收、结果分析来完成。( )
26.信息系统有多种渠道收集数据,包括人工采集、自动采集和传感器采集。淘宝网购系统会根据用户的历史搜索、浏览、购买记录等行为数据,建立用户画像,并将相关的商品信息推荐给用户。采集行为数据的过程属于人工采集。( )
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.A
【详解】本题考查数据处理。MapReduce是一种批处理模型,它将大规模数据集划分为多个小块,然后并行处理这些小块的数据,最后将结果合并起来。故选A。
2.C
【详解】本题考查数据安全相关内容。定期备份数据可防止数据丢失;设置高强度系统口令和安装防火墙增加了数据的安全性,可防止数据被恶意盗取;将数据移动到移动硬盘上,数据并没有备份,不能防止数据的丢失。故本题答案是C选项。
3.C
【详解】本题考查加密技术。加密技术的主要用途是保护数据隐私和安全。通过对数据进行加密,可以防止未经授权的访问和数据泄露,从而确保数据的机密性和完整性。选项A、B和D都不是加密技术的主要用途。故选C。
4.B
【详解】本题考查数据采集相关内容。数据采集是指通过各种手段(如传感器、网络爬虫等)将现实世界中的各种数据信息获取到计算机系统中,以供后续处理和分析使用,数据可以是来自各种来源的原始数据,如传感器、数据库、日志文件、社交媒体等。数据采集可能需要数据抓取、API调用、文件上传等方式。互联网是目前人们日常所需数据的主要来源;现阶段数据的获取主要依靠自动采集方式进行;数据采集完成后,从中挖掘信息并为下一步的决策提供依据;智能手环获取人体心率、睡眠等数据主要是通过传感器进行采集。故本题答案是B选项。
5.A
【详解】本题考查的是数据安全。为了避免数据安全带来的威胁,我们应该不在社交平台发布个人隐私信息,不下载和安装未知软件;不随意参与“扫一扫”送礼品;不随意使用公共场所WiFi。故选A。
6.B
【详解】本题考查数据处理。
数据处理的一般过程包括以下步骤:
数据采集:这是数据处理的第一步,指的是从各种来源获取原始数据。数据来源可以是数据库、文件、传感器、网站等。数据的收集方式可以是手动输入、自动采集、网络爬取等。
数据清洗(加工):收集到的原始数据往往存在各种问题,如缺失值、错误值、重复值、不一致的数据格式等。数据清洗就是处理这些问题,确保数据的完整性和一致性。这包括缺失值处理(如删除、插值、预测等)、错误值处理(如规则校验、异常值检测等)、重复值处理(如去重算法)和数据格式统一等。
数据存储:将处理后的数据存储到数据库、文件等存储介质中,以便后续使用。
数据分析:对清洗和存储后的数据进行分析,提取有价值的信息。这包括统计分析(如均值、方差、相关性等)、数据可视化(使用图形、图表等工具来直观地展示数据)以及机器学习(使用机器学习模型来分析数据,发现数据中的规律和模式)。
数据可视化:将分析结果以图表、图形等方式展现,帮助用户直观地理解数据。数据可视化是数据分析的一个重要环节,它通过图形化的方式将数据呈现给用户,使得复杂的数据更易于理解和解释。
因此,数据处理的一般过程可以归纳为:数据采集、数据清洗(加工)、数据存储、数据分析和数据可视化。故正确答案为:选项B。
7.C
【详解】本题考查数据采集与处理相关内容。指纹识别一般过程:指纹图像采集——指纹图像处理——指纹图像特征提取——指纹图像特征的匹配。故本题答案是C选项。
8.D
【详解】本题考查数据安全和大数据相关内容。大数据的数据类型多、数据处理速度快、价值密度低,A选项错误;大数据关注数据的关联性,而非其精确性,关注相关关系,而非因果关系,B选项错误;数据加密方法是为了保护数据安全而采取的主动防护手段,不能提供数据完整性,C选项错误;大数据带来便利的同时也会带来数据泄露、个人隐私等社会问题,D选项正确。故本题答案是D选项。
9.A
【详解】本题考查数据安全。为手机设置锁屏密码可以阻止未经授权的用户访问手机中的数据,是能增强数据安全的做法。未经检查的软件可能包含恶意代码,这些代码可能会窃取数据或破坏系统;公用计算机可能被多个人使用,保存密码可能会导致密码泄露,进而危及账户安全;解除手势密码会降低应用的安全性,使账户更容易受到未经授权的访问。故选:A。
10.C
【详解】本题考查数据收集方法相关内容。ABD选项属于间接数据的收集方法。C选项,访谈法属于直接数据的收集方法。故本题答案是C选项。
11.D
【详解】本题考查数据安全相关内容。计算机数据的管理先后经历了人工管理、文件管理、数据库管理三个阶段,A选项正确。为预防自然灾害造成数据损坏,可建设异地容灾系统,B选项正确。黑客入侵、病毒感染都可能造成数据的损坏,C选项正确。数据安全需要考虑多个方面,如数据加密、访问控制、备份等,而不仅仅是关注数据本身的安全,保护数据安全首先需要保护存储介质的安全,D选项错误。故本题答案是D选项。
12.D
【详解】本题考查大数据及数据安全。为了提高账户安全,不同的网站登录使用不同的密码;保护数据的安全不仅要提高数据本身的安全,也要保护存储数据的介质;基于大数据技术,个别数据不准确不会影响数据分析;大数据的数据规模大,分析的对象是全体数据。故选D。
13.A
【详解】本题考查数据采集。数据采集是指人们根据需要获取数据,它是确保数据处理过程有效的基础。问卷的发放、填写、回收的过程主要属于数据处理中的数据采集阶段。故选A。
14.D
【详解】本题考查数据安全。磁盘阵列系统通常用于提高数据的冗余性和可用性,但它主要用于数据的冗余备份和快速访问,并不能防止自然灾害引起的数据损坏,A选项错误。改变密码的频率是一种安全实践,但仅仅每天改变一次密码可能不足以保护个人数据的安全,密码的复杂性和其他安全措施也很重要,B选项错误。安装防火墙和杀毒软件是防止计算机病毒的一部分,但它们不能保证绝对的安全,还需要定期更新和其他安全实践,C选项错误。数据管理与保护需要借助云计算和大数据等技术,以应对不断增长的数据量,并提高数据的可用性、冗余性和安全性,D选项正确。
15.B
【详解】本题主要考查数据的保护。无线网络不可以随意选择信号源,随意连接无线网络会存在数据安全隐患,故本题选B选项。
16.A
【详解】本题主要考查数据安全。自然灾害会导致数据安全问题;威胁数据安全的因素有操作失误、黑客入侵、感染计算机病毒等;通过数据加密和数据校验等方法,可以提高数据的保密性和完整性;保护数据的安全也需要保护存储数据的介质,故本题选A选项。
17.噪声
【详解】本题考查数据清洗。数据清洗的目的是移除数据集中的错误、不完整、不准确或不相关的部分,即噪声数据。故答案为:噪声。
18.提高数据质量
【详解】本题考查数据清洗。数据清洗的主要目的是提高数据质量,通过去除重复、错误或不完整的数据,确保数据的准确性和完整性。
19.非对称
【详解】本题考查加密技术。在加密技术中,这种使用不同密钥进行加密和解密的方法被称为非对称加密(或公钥加密)。非对称加密使用一对密钥:公钥和私钥。公钥用于加密数据,私钥用于解密数据。只有拥有私钥的人才能解密用公钥加密的数据,从而保证了数据的安全性。常见的非对称加密算法包括RSA、ECC等。
20. 数据采集 数据存储 数据加工 数据分析 数据表达
【详解】本题考查数据处理。数据处理的过程包括数据采集、数据存储、数据加工、数据分析和数据表达。这些步骤有助于从原始数据中提取有价值的信息,形成结论和决策。故正确答案为:①数据采集、②数据存储、③数据加工、④数据分析、⑤数据表达。
21.错误
【详解】本题考查信息采集。
对商品上的条形码进行扫描,并不直接等同于数据编码的过程。实际上,这一扫描过程是信息的采集。故题目说法错误。
22.正确
【详解】本题考查数据处理。数据处理的核心目的是将原始的、可能杂乱无章的数据转化为有意义、有价值的信息。这个过程通常涉及数据的收集、清洗、转换、分析和解释等步骤,以提取出能够用于决策支持、趋势预测、问题解决和业务优化的洞察。故正确答案为正确。
23.错误
【详解】本题考查数据安全相关内容。大数据时代公开数据中可能存在着极大的泄密隐患,已有的保密监管手段在应对这一新型的失泄密风险时面临新的挑战,需要采取一系列措施来降低泄密风险和减少不必要的损失。故本题答案是:错误。
24.错误
【详解】本题考查信息安全相关内容。高中生的个人数据具有丰富信息,包括姓名、年龄、住址、联系方式等,属于个人隐私。这些信息泄露后容易被用于实施网络诈骗、恶意攻击等犯罪行为,应严格保护高中生个人数据,防止泄密或丢失。故本题答案是:错误。
25.正确
【详解】本题主要考查数据采集及分析。小军要完成对中学生心理健康状态的调查,他可以使用问卷星提供的问卷设计、调查回收、结果分析来完成,表述正确。
26.错误
【详解】本题主要考查数据采集。信息系统有多种渠道收集数据,包括人工采集、自动采集和传感器采集。淘宝网购系统会根据用户的历史搜索、浏览、购买记录等行为数据,建立用户画像,并将相关的商品信息推荐给用户。采集行为数据的过程属于自动采集,故表述错误。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$