内容正文:
第1章 数据与信息(知识清单)
1.1感知数据
(1)定义:是对客观事物的符号表示。
(2)类型:数字、图像、图形、字母、文字、视频、音频
(3)特征:
①数据和关于数据的解释是密不可分的,单纯的数据是没有意义的。
②人类对数据的利用一定程度上依赖于载体。
③科学研究离不开数据,数据的客观性为科学研究提供了可靠的依据。
④人们在利用数据的同时,自身也在产生数据。
1.2数据、信息与知识
(1)信息
定义:信息是用来消除随机不确定性的东西。
特征:①载体依附性②时效性③共享性④可加工处理性、真伪性⑤价值性
(2)知识
①定义:人类在社会实践中所获得的认识和经验的总和,包括对事实、信息的描述以及在教育中和实践中获得的技能。
②特性:
知识的获得,是人利用自身已有的信息进行加工,进而将新的信息纳入自己的知识结构的过程知识的来源有很多知识可以继承和传递接收同样的信息不同人所构建的知识不同。
(3)智慧
定义:智慧是一种更高层次的综合能力,主要表现为收集、加工、应用、传播知识的能力,以及对知识发展的前瞻性看法。
(4)关系
数据是对客观事物属性的描述,具有客观性。信息是对数据的解释,是数据中包含的意义,是对数据进行加工的结果具有主观性。
信息和知识的来源是数据,是以数据为载体而存在的。信息是经过加工的数据,知识是经过人类归纳整理和反复验证后而呈现的规律。同时,相应的知识又是加工数据、提炼信息的基础,能帮助人理解信息。
1.3数据采集与编码
(1)数据采集方法与数据来源
传统:直接观察与实验,人工方式。
现代:使用传感器获得自然信源的数据,通过网络爬虫获得网络数据,以机器为主。
(2)传感器
概念:传感器是一种能感受被测量并按照一定的规律转换成可用输出信号的器件或装置,
通常由敏感元件和转换元件组成。
传感器可以持续不断地采集数据。
从互联网采集数据。
(3)模拟与数字信号
信息可以用数字信号或模拟信号表达,数字和模拟信号是可以相互转化的。
模拟信号
①定义:用连续变化的物理量所表达的信息。
②特点:幅度、频率或相位随时间作连续变化,如声音信号、图形信号等。
③波形
类型
表现
事例
简单波形
仅包括一个单一频率
单一钢琴定音器产生的声波
复杂波形
包含许多不同频率的组合
人类或管风琴的声音产生的声波
④优点:直观且容易实现。
⑤缺点:保密性差、抗干扰能力差、不适合远距离传输。
数字信号
①定义:离散时间信号的数字化表示。
②特点:自变量、因变量都是离散的。如,开关电路中输出电压和电流脉冲。
③呈现方式:有限位的二进制数。如,字长为2位的二进制数可表示00、01、10、11四种数字信号。
④优点:抗干扰能力强,有较强的保密性和可靠性。
⑤缺点:算法复杂、成本较高。
(3)采样和量化
采样:使用采样器,对模拟信号进行采样。对于同一模拟信号,采样时间间隔越小,采集到的样本数越多。每秒采集到的样本数叫做采样频率。
量化:量化是指将信号的连续取值近似为有限个离散值的过程。
(4)数制
数据在计算机内是以二进制方式存储和处理的。
两个基本要素:基和权
(5)编码
①字符编码:
※编码是信息按照某种规则或格式,从一种形式转换为另一种形式的过程。解码是编码的逆过程。
※常见的字符编码有ASCII、Unicode及各种汉字编码。
※ASCII码:基本的ASCII码共有128个,用1个字节(Byte)中的低7位编码。二进制范围为00000000~0111111,即十六进制的00~7F。
※汉字编码:汉字编码分为外码、交换码、机内码和字形码。汉字编码采用GB2312标准时,1个字符占2个字节。
※不管哪种形式的数据,在计算机中都采用二进制数进行编码。(3)1TB= 1024GB; 1GB= 1024MB; 1MB= 1024KB; 1KB= 1024B; 1B=8bit。
②条形码、二维码:
※条形码是将宽度不等的多个黑条(简称条)和白条(简称空),按照一定的编码规则排列,用以表达一组信息的图形标识符。
※二维条码/二维码是用某种特定的几何图形按一定规律在平面上(二维方向)分布的黑白相间的图形记录数据符号信息。
※相对于一维的条形码,二维码的信息存储量更大,功能也更加强大。
③声音编码:
※声音的保真度受到采样频率和量化位数的影响。
※常见的声音文件类型有Wave、MP3、WMA等。
※Wave格式音频文件的存储容量计算公式:
存储容量=采样频率(Hz)x量化位数( bit)x声道数x时长(s)(单位:位)
④图像编码
※数字图像包括矢量图形与位图图像。
矢量图形由指令集合或数学公式描述,色彩少,存储容量小,任意放大其清晰度不变。
位图图像通过像素点描述,色彩丰富,存储容量大,放大或缩小其清晰度会变化。
※图像的量化值用二进制表示,其长度称为颜色的位深度。如256种颜色的图像的位深度为8位。
※常见的图像文件格式有BMP、JPEG、GIF、PNG等。
※未经压缩的图像文件存储容量计算公式:
存储容量=总像素x颜色位深度(单位:位)
⑤视频编码
※静态图像连续播放形成视频。PAL制式每秒显示25帧,NTSC制式每秒显示30帧。
※视频的编码一般是指对视频进行压缩。常见的视频编码方式有MPEG-1、MPEG-2、MPEG-4等。
※常见的视频编码有AVI、MOV、MP4、FLV
※未经压缩的视频文件存储容量计算公式:
存储容量=帧图像存储容量x帧频x播放时长(s)(单位:位)
1.4数据管理与安全
(1)数据管理
①数据管理是利用计算机硬件和软件技术对数据进行有效收集、存储、处理和应用的过程,其目的在于充分、有效地发挥数据的作用。
②计算机数据的管理已经经历了人工管理、文件管理和数据库管理三个阶段。
③数据一般以文件的形式存储,文件格式有:文本、图像、音频等。(4)计算机采用树形目录结构管理文件。Windows系统中,采用更为形象的文件夹管理文件。
(2)数据安全
①威胁数据安全的因素:硬盘驱动器损坏、操作失误、黑客人侵、感染计算机病毒、遭受自然灾害等。
②保护数据安全的三个层面。
安全问题
层面
方法
自然灾害等
存储数据的介质
磁盘阵列、数据备份、异地容灾等
黑客入侵等
数据本身
数据加密(保密性)数据校验(完整性)
恶意盗号等
个人安全意识
提高数据安全意识,增强法律意识,及时备份数据
1.5数据与大数据
(1)大数据概念:大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。
(2)大数据特征:符合大数据概念的数据一般具有数据规模大、处理速度快、数据类型多、价值密度低四个特征。
(3)大数据思维
①大数据要分析的是全体数据,而不是抽样数据。
②对于数据不再追求精确性,而是能够接受数据的混杂性。③不一定强调对事物因果关系的探求,而是更加注重它们的相关性。
(4)大数据对社会的影响
①大数据让生活更便利。
②大数据让决策更精准。
③大数据带来新的就业需求。
④大数据带来新的社会问题。
1 / 6
学科网(北京)股份有限公司
$$