内容正文:
1.2 数据编码
1.2.1 模拟信号与数字信号
1.2.2 编码的基本方式
第一章 数据与信息
1
2024/3/25
文字编码
图像编码
声音编码
本节内容:
2
2024/3/25
计算机最主要的功能就是处理信息,信息在计算机中如何表示、存放、传递?
在计算机内部,信息只有经过数字化编码后转换成二进制数以后才能表示、存放和传递。
编码:用少量的基本符号,根据简单的组合规则,以表示大量复杂的信息。是用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。
编码
3
2024/3/25
文字编码
01
2024/3/25
4
文字编码
单字节码
双字节码
文字编码
国标码
统一码
ASCII码
摩尔斯码
繁体中文五大码
简体中文码
5
2024/3/25
1
罗列出来
按顺序排列
2
进行编号
编号转化为二进制
3
4
英文文字编码
ASCII码
American Standard Code for Information Interchange
美国标准信息交换码,1960年由香农创立。
数量 类别 位置
可见字符 95个 数字10个 (0.1.2.3.4.5.6.7.8.9)
大写字母26个(A.B.C……X.Y.Z)
小写字母26个(a.b.c……x.y.z)
标点符号33个(, . : ! + - 等) 32-126为95个可见字符
不可见字符 33个 控制字符33个 (CAN SUB ESC 等) 0-31、127为不可见字符
共128(27)个字符,转换为对应的二进制代码,合称为ASCII字符集。
6
2024/3/25
标准的ASCII码使用7位的二进制数来编码,即每一个字符对应着一个7位的二进制数。所以用标准的ASCII码可以表示2^7 = 128个字符,其中包含10个阿拉伯数字,52个英文大小字母,33个符号及33个控制字符。
7
2024/3/25
1个字节(B)
0 1 0 0 0 0 0 1
ASCII码是使用ASCII码是使用8位的二进制码表示的基本字符编码系统。即每一个字符都对应着一个唯一识别的代码:一个7位的二进制数,最高位用0来占位。
计算机存储的最小单位—— 二进制位,也叫比特(bit或b)
计算机存储的基本单位—— 字节(Byte或B)
1字节=8位 或 1B=8b
英文文字编码
8
位
用0占位
0 1 0 0 0 0 1 0
2024/3/25
欧洲文字编码
9
思考:如何解决欧洲人民的计算机字符需求呢?
Ä、ë、Æ...
$%#^@&&$...
利用ASCII中未被利用的最高位,令最高位为1,扩展出了128个新字符。128-255为扩展ASCII码(也称EASCII码),解决了欧洲的字符编码问题。
扩展ASCII码
2024/3/25
思考:中国文字成千上万,如何进行编码?
10
中文文字编码
我国在1980年制定了《信息交换用汉字编码字符集·基本集》作为国家标准GB2312编码字符集,称为国标码。
GB2312编码,编号127之前与ASCII编码相同,单字节。编号127之后,每个汉字采用双字节(十六位二进制数)表示,每字节最高位为1,理论上可以表示2^7* 2^7 + 128= 16384+128=16512个字符。现在使用7445个,包含6763个常用汉字和682个非汉字字符。是大多数输入法所采用的字符集。
思路1:根据字体结构
规定字根的编码,将构成这个字的字根的编码相组合。
思路2:根据拼音拼写
参照ASCII码对字母的编码,将构成这个字的拼音的编码相组合,并标记音调。
国标码
2024/3/25
输入码
机内码
字形码
11
中文文字编码
用于存储汉字的编码
GB2312-80——简称GB码,由两个字节组成,即存储一个汉字由16位二进制数组成,含6763个汉字。
如:11010100 11000110 云 11000100 11001111 南
港台地区的BIG5码——繁体字。
近来我国用的GB1300编码,含20902个汉字。
又叫“外码”,是用来将汉字输入到计算机中的一组键盘符号。
按照汉字的读音进行编码,例如:双拼、智能ABC、微软拼音输入法、紫光拼音输入法;
按照形状进行编码,例如:五笔、二笔、郑码、表形码;
又叫“输出码”或“字模”,是描述每个汉字形状的编码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中,即汉字显示的代码。
如:点阵法和矢量法16*16,24*24,32*32,48*48点阵
2024/3/25
12
文字编码
思考:每个国家都有自己的字符编码方式,跨国交