内容正文:
专题二 数据的采集与编码
思维导图
一、数据采集与信息数字化
1.数据采集方式
早期:采用观察、测量、实验、调查等人工方法。
现在:互联网、物联网下以传感器、网络爬虫等机器获取方法为主。
2.信息数字化
(1)信息可用模拟信号或数字信号表达。模拟信号以连续变化的物理量存在,模拟信号经过采样量化后可以得到数字信号。数字信号在取值上是离散的、不连续的信号,是可被计算机存储、处理的二进制数据。
(2)模拟信号与数字信号可相互转换,将模拟信号转换成数字信号的过程称为数字化,其中用到的主要设备是模数转换器(ADC)。
(3)将模拟信号转换为数字信号一般需要经过采样、量化与编码。
归纳提炼
二、数制
1.数据在计算机内部是以二进制方式进行存储和处理的。
2.常用进制有:二进制(B)、八进制(O)、十进制(D)、十六进制(H)等。
3.十进制转R进制的方法:除R取余,除到商为0,最后将得到的余数倒序连接。
4.R进制转十进制
【方法提炼】 常规方法:按位权展开求和法。二进制、十六进制转十进制的方法如下图所示。
【方法优化】 高效方法:标号法。二进制、十六进制转十进制的方法如
下图所示。
5.二进制与十六进制互换
【方法提炼】 二进制转十六进制:4位二进制数转换为1位十六进制数。
【方法提炼】 十六进制转二进制:1位十六进制数转换为4位二进制数。
三、编码
1.字符编码
(1)常见的字符编码有ASCII、Unicode及各种汉字编码。
(2)ASCII(美国信息交换标准代码):是现今最通用的单字节编码系统。基本的ASCII码共有128个,用1个字节中的低7位编码。二进制范围为00000000~01111111,即十六进制的00~7F。
【学习心得】 1个ASCII字符存储时占用1个字节。
(3)汉字编码:计算机中的汉字也是采用二进制进行编码的。汉字编码分为外码(输入码)、交换码、机内码和字形码。
【学习心得】 1个汉字存储时占用2个字节。
(4)UltraEdit查看字符内码(十六进制内码)
内码与对应的字符
【方法提炼】
①中文字符(含全角字符)对应内码中的两组编码,英文字符对应内码中的一组编码。
②英文字符(半角字符)对应的内码范围为00~7F。
2.声音编码
(1)模拟声音数字化的方法:采样、量化、编码。
(2)声音的保真度与采样频率、量化位数成正比;声音保真度越好,其存储
容量越大。
(3)录音的过程:将模拟信号转为数字信号。
播放的过程:将数字信号转为模拟信号。
(4)常见的声音文件格式:Wave、MP3、WMA、MID等。
(5)Wave格式音频文件的存储容量计算公式:存储容量=采样频率(Hz)×量化位数(bit)×声道数×时长(s)(单位:位)。
3.图像编码
(1)数字图像包括位图图像和矢量图形两种。
位图与矢量图的区别:
①位图图像(又称栅格图或点阵图)是通过像素来描述图像的,色彩丰富,
所需的存储空间较大,放大后会失真。
②矢量图形是指用点、直线或者多边形等基于数学方程的几何图元表示的图像。矢量图形与分辨率无关,任意放大矢量图形,不会丢失细节或影响清晰度。
(2)图像数字化的方法:采样、量化、编码。
(3)常见的图像文件格式:BMP、JPEG、GIF、PNG等。
(4)图像存储容量的计算公式:存储容量=总像素×颜色位深度(单位:位)。
4.视频编码
(1)组成视频的单位是帧,而一帧就是一幅静态的图像。
(2)PAL制式的视频每秒钟播放25帧图像,NTSC制式的视频每秒钟播放30帧
图像。
(3)数字电视采用了数字传输和存储技术,具有高清晰度、双向交互、多功能多业务等优势。
(4)常见的视频编码方式有MPEG-1、MPEG-2、MPEG-4等。
(5)常见的视频数据格式主要有:AVI、MPEG、MOV等。
(6)视频存储容量的计算公式:视频容量=1帧图像存储量×帧频×时间(秒)
(单位:位)。
[例1] 下列属于数据的采集方式的是( )
①观察 ②实验 ③互联网 ④物联网 ⑤传感器
A.①②③ B.①②③④ C.①②③⑤ D.①②③④⑤
典型例题
解析:数据的采集方式主要有观察、实验、互联网、物联网和传感器等,故答案为D。
D
[例2] 下列数字最大的是( )
A.111101B B.111011B C.3FH D.62D
解析:111101B=61D,111011B=59D,3FH=63D,最大的是3FH,故答案为C。
C
[例3] 下列有关进制的描述,错误的是( )
A.二进制数只有“0”和“1”两个数码
B.二进制数101101011101101转换为十六进制数为5AED
C.十进制数69转换为二进制数为1000101
D.十六进制数A2E转换为十进制数为2506
解析:十