内容正文:
3.1数据编码
第 2 单元
学习目标
1.2 数据的计算
★了解各类数据采集的基本方法。
★能够解释文本、音频等数据的编码原理。
★理解数据编码的意义和作用。
新课导入----各种数据的采集
在1.1的时候,我们学习了数据无处不在,无时不有。而我们的计算机是用来处理数据的工具,虽然我们所有的数据在计算机中最终都会以二进制的形式来表示。我们数据的表现形式可以有数字、文字、图像、声音、视频等,这些不同数据的编码的方式不同,因此在处理过程中也不一样
那么,我们思考一下来思考一下不同数据的采集方法?
新课导入----各种数据的采集
图像数据用什么采集呢?
照相机
手机
扫描仪
新课导入----各种数据的采集
视频数据用什么采集呢?
摄像机
手机
摄像头
新课导入----各种数据的采集
声音数据用什么采集呢?
录音笔
手机
话筒
新课导入----各种数据的采集
我们经常给人发微信,那么我们是怎么把这种语音数据转换到计算机中的呢?
模拟数据与数字数据
用传感器获得信号一般称为模拟信号,随时间连续变化的,波形光滑,这种信号称为模拟信号。
模拟信号的值称为模拟数据。
模拟数据
随时间变化的非连续的,这种信号称为数字信号。
数字信号的值即数字数据,直接用计算机所能理解的二进制表示。
数字数据
模拟数据转化为数字数据的过程
采样 。在时间轴上按照一定的时间间隔取一系列时刻,得到每个时刻对应的声波信号的瞬时振幅值。
第一步
模拟数据转化为数字数据的过程
量化。将第一步所得的振幅瞬时值往最接近的整数取整。每个对应的整数值即为坐标。
第二步
模拟数据转化为数字数据的过程
编码。将样本值用二进制表示的过程称为编码。
第三步
时刻 1 2 3 4 5 6 7 8 9 10
二进制数值 001
010
011
100
011
010
010
010
011
011
模拟数据转化为数字数据的过程
录音文件的大小
计算公式:文件大小=时间(秒)*采样率(赫兹)×量化位数(bit)*声道数
例如:15秒的的音频,采样率为44.1khz,量化位数16位,声道数为双声道,求该段音频文件的大小
15*44.1*1000*16*2=21168045(b)=2646000(B)≈2.52(MB)
进制转换
什么是十进制?
什么是二进制?
由0-9的数字构成
进数规则:逢十进一
由0、1两个数字构成
进数规则:逢二进一
进制转换
10010(2)=0*20+1*21+0*22+0*23+1*24=18(10)
权值
R进制数(R≥2)转换为十进制数:按权展开求和法
进制转换
2 18 余数
2 9 0 低位
2 4 1
2 2 0
2 1 0
0 1 高位
十进制数转换为R进制数:短除法(除R取余法)
进制转换
十六进制需要使用16个不同的基本数字,除了0到9外,一般用字母A到F依次表示后续数字,(相当于十进制数中的10~15)。
基本计数规则是逢十六进1,即F+1=10。
0 1 2 3 4 5 6 7 8 9 A B C D E F
16进制:
10进制:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
存储单位
计算机存储数据的最小单位是二进制位,用比特(bit)表示。
计算机存储数据的基本单位是字节(Byte,简写为B),8比特为一个字节。
字节单位太小,常用的存储单位有KB,MB,GB等。
1KB = 210B = 1024B
1MB = 210KB = 220B = 1048576B
1GB = 210MB = 220KB = 230B = 1073741824B
1比特能表示两种(21)状态(即0和1); 2比特能表示00、01、10、11四种(22)状态;
3比特能表示八种(23)状态; 1字节能表示28(256)种状态。
文本数据的编码
用于文本数据字符编码的方案有多种类型,其中ASCII码和unicode是典型的2种方案。
ASCII码
用7位或8位二进制数表示一个字符,集中定义了大小写英文字母,标点符号和数字等字符和符号,共128个。
计算机内部用一个字节来存放一个ASCII码字符,最高位用0表示,例如,“A”的ASCII码为01000001,即65。
ASCII码(十进制) 字符
0~31 控制字符或通信专用字符(不可见)
32 空格
48~57 数字0~9
65~90 大写英文字母A~Z
97~122 小