内容正文:
第4课 数据管理与安全 数据与大数据
第一章 数据与信息
——1.4 数据管理与安全 1.5数据与大数据,教材第25~32页
新课程目标
1.能选择合适的数据管理方式,能采取合适的数据保护措施。 2.能认识到数据和大数据对人们生活和社会发展的作用与价值。 3.能甄别信息获取方式的优势,具备信息安全意识。
目录
CONTENTS
教材整体感悟 知本与探源
01
02
命题整体感知 尝试与研析
01
教材整体感悟 知本与探源
教材整体感悟 知本与探源
1.数据管理
数据管理是利用__________________________对数据进行有效________、存储、________和应用的过程,其目的在于充分、有效地____________的作用。在大数据出现之前,计算机数据的管理已经经历了人工管理、____________和______________三个阶段。
(1)文件管理:在人们日常使用的计算机中,数据一般以______________存储。计算机一般采用_____________结构来管理文件。
(2)数据库管理:传统数据库技术基于______________开发,凭借其数据
计算机硬件和软件技术
收集
处理
发挥数据
文件管理
数据库管理
文件的形式
树形目录
结构化数据
教材整体感悟 知本与探源
独立性、数据可共享等特点,已经成为现代社会数据管理的主要方式。
教材整体感悟 知本与探源
2.数据安全及数据安全的保护措施
(1)数据安全
__________、网络化、__________已经上升至国家战略,数据的安全问题变得越来越重要。威胁数据安全的因素有很多,如硬盘驱动器损坏、操作失误、黑客入侵、感染计算机病毒、遭受自然灾害等,都有可能造成计算机中数据的损坏。
(2)数据安全的保护措施
数字化
智能化
教材整体感悟 知本与探源
①保护存储数据的介质:主要采用主动防护的手段,如通过_____________、数据备份、_____________等手段。
②提高数据本身的安全:如通过____________、_____________等方法来提高数据的保密性和完整性。常见的数据校验方法有__________、_________、SHA-1等。
磁盘阵列
异地容灾
数据加密
数据校验
MD5
CRC
教材整体感悟 知本与探源
3.数据与大数据
(1)大数据的概念
大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。数据量大并不一定就是大数据。
(2)大数据的特征
①________________:人类社会的数据量的量级单位不断刷新,已经从TB、PB级别跃升至EB、ZB级别。
数据体量巨大
教材整体感悟 知本与探源
②速度快:一是数据________的速度快,包括爆发式产生和累积产生;二是______________的速度快,高速率实时数据处理。
③______________:各种结构化、半结构化和非结构化数据共存是大数据的普遍现象。
④______________:大数据蕴含着巨大的价值,但因其数据庞大,可能发挥价值的仅是其中非常小的部分,价值密度相对较低。价值密度低不等于价值低。
(3)大数据思维
产生
数据处理
数据类型多
价值密度低
教材整体感悟 知本与探源
①大数据要分析的是____________,而不是抽样数据。
②对于数据__________________,而是能够接受数据的混杂性。
③不一定强调对事物因果关系的探求,而是更加注重它们的__________。
(4)大数据对社会的影响:大数据让生活更便利;大数据让决策更精准;大数据带来新的就业需求;大数据带来新的社会问题。
全体数据
不再追求精确性
相关性
教材整体感悟 知本与探源
1.在Windows操作系统中,可以用文件扩展名来表示特定的文件类型,如下表所示:
文件类型 常见扩展名
文本文件 .txt、.docx、.pdf、.wps
网页文件 .htm、.html
音频文件 .wav、.mp3
图像文件 .jpg、.bmp、.png、.gif、.tif、.psd
视频文件 .avi、.mp4、.mpg
教材整体感悟 知本与探源
2.结构化、非结构化和半结构化数据
(1)结构化数据,也称作行数据,是由二维表结构来进行逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。
(2)非结构化数据是数据结构不规则或不完整、没有预定义的数据模型、不方便用数据库二维逻辑表来表现的数据,包括各类格式的办公文档、文本、图片、HTML、各类报表、图像、音频、视频等。
教材整体感悟 知本与探源
(3)半结构化数据,就是介于结构化数据和非结构化数据之间的数据,具有一定的结构性。
3.大数据思维
(1)大数据要分析的是全体数据,而不是抽样数据。
(2)对于数据不再追求精确性,而是能够接受数据的混杂性。
(3)不一定强调对事物因果关系的探求,而是更加注重它们的相关性。
02
命题整体感知 尝试与研析
命题整体感知 尝试与研析
例1计算机一般采用树形目录结构来管理文件, 可用文件扩展名表示特定的文件类型。小王把今年校运会的资料根据文件类型归类到相应文件夹中,如图所示, 则文件“100m.mp4”和“shot.jpg”分别放入的文件夹是( )
A.①② B.②③
C.④① D.②④
【解析】 “100m.mp4”是视频文件,放入④;“shot.jpg”是图像文件,放入①,选项C正确。
C
命题整体感知 尝试与研析
例2下列关于数据管理与安全的说法中,不正确的是( )
A.安装磁盘阵列系统是常见的数据加密手段
B.CRC 是数据通信领域的一种查错校验算法
C.借助云计算与大数据等技术,能提高数据管理水平
D.为防止系统停止工作时造成数据丢失,可通过建立容灾系统来解决
【解析】 磁盘阵列是保护数据安全的措施,选项A错误。
A
命题整体感知 尝试与研析
变式1下列关于计算机数据管理与安全的说法中,不正确的是( )
A.计算机数据管理先后经历了文件管理、人工管理、数据库管理
B.安装正版的杀毒软件与防火墙有助于保护计算机的数据安全
C.计算机数据的完整性可以采用MD5、CRC、SHA——1 等校验方法来验证
D.为防止自然灾害引起计算机数据损坏,一般可采用异地容灾等手段
【解析】 计算机数据管理先后经历了人工管理、文件管理、数据库管理,选项A错误。
A
命题整体感知 尝试与研析
变式2[2024·龙泉一中检测]下列关于数据管理与安全的说法中,不正确的是( )
A.计算机文件管理一般采用树形目录结构,方便文件的组织和管理
B.传统的数据库技术善于处理半结构化、非结构化数据
C.保护数据安全不仅要保护数据及其存储介质的安全,也要提高个人数据安全意识
D.数据加密可提高数据的保密性,而数据校验可验证数据的完整性
【解析】 传统的数据库技术善于处理结构化数据,选项B错误。
B
命题整体感知 尝试与研析
例3下列关于大数据的说法中,正确的是( )
A.大数据采集的数据有结构化、半结构化和非结构化的
B.大数据分析的是抽样数据
C.用大数据进行数据处理时,必须保证每个数据都准确无误
D.在大数据时代,数据的主要来源还是人力
A
命题整体感知 尝试与研析
【解析】 选项B,大数据分析的是全体数据,而不是抽样数据,选项错误;选项C,大数据的价值密度低,在大数据中,发挥价值的仅是其中非常小的部分,不力求每个数据都准确无误,选项错误;选项D,在大数据时代,数据主要来源于传感器、互联网、智能终端等,选项错误。
命题整体感知 尝试与研析
变式1[2024·江山中学检测]下列关于大数据的说法中,不正确的是( )
A.大数据一般具有数据体量巨大、速度快、数据类型多、价值密度低四个特征
B.大数据追求数据的精确性,处理大数据时要保证每个数据准确无误
C.大数据中各种结构化、半结构化和非结构化数据共存
D.大数据更注重事物的相关性而不是因果关系
【解析】 大数据不追求数据的精确性,能够接受数据的混杂性。当数据量大到一定程度时,个别数据的不准确并不重要。选项B 错误。
B
命题整体感知 尝试与研析
变式2下列关于大数据的说法中,正确的是( )
A.某校汇总的新生学籍信息数据是大数据
B.大数据中的个别极端数据不会影响大数据的分析结果
C.大数据分析的是抽样数据,而不是全体数据
D.大数据价值密度低,不会造成个人隐私的泄露
【解析】 选项A,某校汇总的新生学籍信息数据不是大数据,选项错误;选项C,大数据分析的是全体数据,选项错误;选项D,大数据价值密度低,但也会造成个人隐私的泄露,选项错误。
B
命题整体感知 尝试与研析
例4[2024·丽水中学检测]下列关于数据与大数据的说法中,正确的是( )
A.人类对于数据的利用不需要依附于载体
B.数据具有价值,且价值不会发生变化
C.能用传统算法和数据库系统处理的海量数据不属于大数据
D.电商平台的“个性化推荐”是基于大数据精确分析了用户购买商品的原因
C
命题整体感知 尝试与研析
【解析】 数据是对客观事物的符号表示,单纯的数据是没有意义的。当数据在特定的环境中有了意义,便是信息,信息必须依附于载体,信息才具有价值,但信息的价值是相对的,对于不同的人群、不同的时间,其价值可能有所不同。选项A、B错误。大数据不再追求精确性,也不一定强调对事物因果关系的探求,选项D错误。
命题整体感知 尝试与研析
变式1下列关于数据与大数据的说法中,正确的是( )
A.计算机中的数据都以ASCII码方式进行存储
B.磁盘阵列、异地容灾等手段可以保护数据存储介质的安全
C.大数据的应用降低了用户隐私信息泄露的风险
D.大数据由于数据体量巨大,分析时往往采取抽样分析的方法
B
命题整体感知 尝试与研析
【解析】 选项A,计算机中的所有数据都是以二进制方式进行存储的,编码规则有很多种,选项错误;选项B,保护存储数据的介质的手段有磁盘阵列、数据备份、异地容灾等,选项正确;选项C,大数据的应用会带来信息泄露、数据安全、个人隐私甚至伦理道德方面的社会问题,选项错误;选项D,大数据要分析的是全体数据, 而不是抽样数据,选项错误。
命题整体感知 尝试与研析
变式2[2024·衢州二中检测]语音识别技术的目标是将人类的语音中的词汇内容转换为计算机可读的输入。语音识别的流程包括信号处理(模数转换等)、信号表征(特征提取等)、模式识别。其中特征提取、模式匹配和模型训练都离不开大量训练数据的积累和匹配, 大数据时代的来临带来了大量文本或语音方面的语料数据。语音识别技术还引入了深度神经网络技术,更逼近人脑的思维能力,同时借助大数据,语音识别的准确率得到了极大的提升。下列关于数据和大数据的说法中,不正确的是( )
A.识别的语音为模拟信号
B
命题整体感知 尝试与研析
B.语音识别结果在计算机内一般以十六进制的方式进行存储
C.大部分文本或语音方面的语料资源数据属于非结构化数据
D.大数据价值密度低,需要对其“提纯”才能获得用于训练的语料数据
【解析】 语音识别结果为数字信号且经过编码后在计算机内部以二进制方式进行存储,选项B错误。
命题整体感知 尝试与研析
|随|堂|检|测|
1.某地持续强降雨天气,给全市人民生命财产安全造成巨大损失。为了预防极端天气对数据安全造成的影响,应采用的防护手段是( )
A.安装防火墙 B.建设异地容灾系统
C.对数据进行加密 D.安装磁盘阵列系统
【解析】 异地容灾的作用:当一处系统因意外停止工作时,整个应用系统可以切换到另一处,使得系统可以继续正常工作,选项B符合题意。
B
命题整体感知 尝试与研析
2.下列关于数据安全的说法中,不正确的是( )
A.数据备份是保证数据安全的一种方式
B.通过MD5 数据校验可以提高数据的保密性
C.操作失误、黑客入侵均会威胁数据安全
D.磁盘阵列是保护数据安全的主动防护手段
【解析】 通过MD5 数据校验可以提高数据的完整性,选项B错误。
B
命题整体感知 尝试与研析
3.[2024·庆元中学检测]下列关于大数据的说法中,不正确的是( )
A.结构化、半结构化和非结构化数据共存是大数据的普遍现象
B.大数据分析的是全体数据,其价值密度非常高
C.大数据不再追求精确性,能够接受数据的混杂性
D.大数据给生活带来便利的同时也带来如信息泄露、数据安全等方面的社会问题
【解析】 大数据分析的是全体数据,其价值密度低,选项B错误。
B
命题整体感知 尝试与研析
4.下列关于大数据的说法中,不正确的是( )
A.大数据要分析的是抽样数据,而不是全体数据
B.大数据的速度快不仅指数据产生的速度快,还指数据处理的速度快
C.大数据不再追求个别数据的精确性,允许数据混杂
D.大数据价值密度的高低与数据总量的大小成反比
【解析】 大数据要分析的是全体数据,而不是抽样数据,选项A错误。
A
命题整体感知 尝试与研析
5. [2024·浦江中学检测]下列关于数据与大数据的说法中,正确的是( )
A.数据是指所有能输入到计算机且只能被计算机程序处理的符号总称
B.大数据的数据类型多,价值密度低
C.我们可通过数据加密和数据解密来提高数据的保密性和完整性
D.大数据要分析的是抽样数据,而不是全体数据
B
命题整体感知 尝试与研析
【解析】 选项A,数据是指所有能输入到计算机且能被计算机程序处理的符号总称,且不能被计算机程序处理,选项错误;选项C,我们可通过数据加密和数据解密来提高数据的保密性,用数据校验保证数据完整性,选项错误;选项D,大数据要分析的是全体数据,而不是抽样数据,选项错误。
温馨提示:请完成高效作业4
感谢聆听,再见!
$$