内容正文:
专题五 数字化信息编码与数据表示(二)
计算机基础
专题复习讲练测
掌握国家标准《机械制图》中有关图幅、比例、字体图线等基本规定。
考纲要求
一
4.理解计算机数制与机内编码形式,掌握数制转换(仅限整数)
知识点梳理
二
1.原码
定义:最高位为符号位:0 表示正数,1 表示负数,其余位为数值的绝对值。
示例:
+5 的 8 位原码:00000101
-5 的 8 位原码:10000101
特点:
直观易读:符号位与数值位分离,便于人类理解。
双零问题:存在 +0(00000000)和 -0(10000000),导致逻辑复杂性。
运算复杂:加减法需单独处理符号位,硬件实现复杂。
一.原码、反码和补码
知识点梳理
二
2.反码
定义:正数:与原码相同。负数:符号位不变,数值位逐位取反。
示例:
+5 的反码:00000101
-5 的反码:11111010
特点:
简化减法:减法可转换为加法,但需处理 循环进位(最高位进位需加到最低位)。
双零问题依然存在:+0(00000000)和 -0(11111111)。
应用局限:现代计算机中极少使用。
一.原码、反码和补码
知识点梳理
二
3.补码(Two's Complement)
定义:正数:与原码相同。负数:反码加 1。
示例:
+5 的补码:00000101
-5 的补码:11111011
特点:
唯一零表示:00000000,彻底解决双零问题。
运算统一性:加减法直接进行,无需特殊处理符号位。
扩展数值范围:8 位补码可表示 -128(10000000)至 +127(01111111)。
一.原码、反码和补码
知识点梳理
二
一.原码、反码和补码
正数:直接转换为二进制。
负数:取绝对值二进制 → 取反 → 加 1。
示例:-5 → 5(00000101)→ 取反(11111010)→ 加 1(11111011)。
十进制转补码
知识点梳理
二
一.原码、反码和补码
最高位为 0:直接转换为十进制。
最高位为 1:取反 → 加 1 → 转换为十进制后加负号。
溢出处理:
正溢出:结果超出正数范围(如 127 + 1 = -128)。
负溢出:结果超出负数范围(如 -128 - 1 = 127)。
补码转十进制:
知识点梳理
二
一.原码、反码和补码
知识点梳理
二
二.常用信息编码
西文字符是由拉丁字母、数字、标点符号及一些特殊符号所组成的,它们被统称为“字 符”。所有字符的集合叫作“字符集”。
SCII 码是基于拉丁字母的一套电脑编码系统,它使用 7 位二进制数来表示 128 种不同的字符,包括人们在计算机输入输出中最常用的十进制数字 0 - 9、大小写英文字母 A - Z 和 a - z、各种标点符号以及一些控制字符等,为计算机系统中字符的存储、传输和处理提供了统一的编码标准。
1. 西文字符的编码
知识点梳理
二
二.常用信息编码
控制字符:ASCII 码中的前 32 个码(0 - 31)和最后一个码(127)被定义为控制字符,用于表示一些特殊的功能或操作,比如换行(LF,代码为 10)、回车(CR,代码为 13)等,它们通常不对应可显示的字符,而是用于控制计算机设备的行为或数据传输的格式。
编码规则
知识点梳理
二
二.常用信息编码
可打印字符:从 32 到 126 这 95 个码对应的是可打印字符,包括数字、字母和各种标点符号、运算符等。其中,数字 0 - 9 的 ASCII 码值是连续的,从 48 到 57;大写字母 A - Z 的 ASCII 码值也是连续的,从 65 到 90;小写字母 a - z 的 ASCII 码值同样连续,从 97 到 122。
知识点梳理
二
二.常用信息编码
从汉字编码的角度看,计算机对汉字信息的处理过程实际上是各种汉字编码间的转换过程。
2. 汉字编码
知识点梳理
二
二.常用信息编码
汉字输入码就是为输入汉字而对汉字编制的代码。由于这种编码是供计算机外部的用 户使用的,故又称为汉字的外部码(或外码)。
汉字输入码根据其编码规则,依次分为流水码(将被编的汉字按一定的顺序进行编码,无重码)、音码(根据被编汉字的读音来确定汉字的编码)、形码(根据被编汉字的字形来确定该汉字的编码)、音形结合码(根据被编汉字的读音和字形来确定该汉字编码)等。
(1)汉字输入码
知识点梳理
二
二.常用信息编码
汉字的内码是为在计算机内部对汉字进行存储、处理和传输而编制的汉字代码。
①汉字信息交换码。
汉字信息交换码是用于汉字信息处理系统之间或者与通信系统之间进行信息交换的汉 字的代码,也称国标码。中国于1981年颁布的国家标准《信息交换用汉字编码字符集 —— 基本集》(代号 GB 2312-80)。
国标码采用2字节来表示一个汉字,共收集了7445个图形字符,其中一般符号、数字、 拉丁字母、希腊字母、汉字拼音等682个。汉字字符分为两级: 一级汉字3755个,二级汉字 3008个。
(2)汉字内码
知识点梳理
二
二.常用信息编码
②区位码。
区位码是利用国标码作为检索手段,将汉字、图形符号按照一定的规律排列,组成一个 94 行 94 列的二维代码表。每一行称为一个 “区”,每一列称为一个 “位”,这样就形成了一个有 94 个区(01 - 94 区)和 94 个位(01 - 94 位)的编码空间。每个汉字或符号都可以在这个表中通过它所在的区和位来唯一确定其编码,这种编码就叫做区位码。
编码规则
区码:在区位码表中,01 - 09 区为特殊符号、数字、拉丁字母等非汉字字符的编码区;16 - 55 区为一级汉字区,按照拼音顺序排列;56 - 87 区为二级汉字区,按部首笔画顺序排列。
位码:每一个区内的字符或汉字按照顺序从 01 开始编号,作为位码。例如,汉字 “啊” 在区位码表中的位置是 16 区 01 位,其区位码就是 1601。
(2)汉字内码
知识点梳理
二
二.常用信息编码
③机内码
机内码是指汉字信息处理系统内部标识汉字的编码。汉字机内码由国标码演化而来,把表示国标码的2字节的最高位都置“1”,就变成汉字机内码。
特点
唯一性:每个字符在特定的编码体系下都有唯一的机内码,确保计算机能够准确地区分和处理不同的字符。
兼容性:机内码需要与计算机系统的硬件和软件环境相兼容,能够在不同的计算机设备和操作系统之间进行正确的传输和处理。
高效性:机内码的设计要便于计算机进行存储、检索和运算等操作,以提高计算机处理字符信息的效率。
(2)汉字内码
知识点梳理
二
二.常用信息编码
④通用编码字符集
UCS(通用八位编码字符集),即 Unicode,是全球统一的字符编码标准,涵盖了世界上所有现代书面语言的字符。其表意文字部分采用 CJK 统一汉字编码,对中、日、韩等国字形相同的汉字(无论地域或字义差异)赋予唯一编码,确保跨语言、跨地区的字符兼容性和一致性。该标准解决了传统编码体系的地域局限性问题,成为国际通用的字符集规范。
(2)汉字内码
知识点梳理
二
二.常用信息编码
汉字字形码又称汉字字模,是表示汉字字形信息(结构、形状、笔画等)的编码,用于实现计算机对汉字的输出(显示、打印)。
表示方式:点阵形式和矢量形式
(3)汉字字形码
知识点梳理
二
二.常用信息编码
字库分类
显示字库:用于显示的字库,显示一个汉字一般采用 16×16 点阵或 24×24 点阵或 48×48 点阵等。
打印字库:用于打印的字库,其中的汉字比显示字库多,而且工作时也不像显示字库需调入内存。
汉字库类型
软字库:以文件的形式存放在硬盘上,现多用这种方式。
硬字库:则将字库固化在一个单独的存储芯片中,再和其它必要的器件组成接口卡,插接在计算机上,通常称为汉卡。
(3)汉字字形码
知识点梳理
二
二.进制转换
汉字地址码是汉字字库中存储汉字字形信息的逻辑地址编码。
功能作用:定位字形数据和连接机内码与字形码。
编码方式:顺序编码、哈希编码。
与其他编码关系
与机内码:机内码通过映射关系确定地址码,系统有专门模块或算法进行转换。
与字形码:地址码是获取字形码的关键,是字形码在字库中的 “索引”,决定能否正确输出汉字。
(4)汉字地址码
知识点梳理
二
二.常用信息编码
奇偶校验是一种简单检验方法,依据被传输的一组八位二进制代码中 “1” 的个数的奇偶性校验,分奇校验和偶校验。奇校验是在 7 位二进制代码最高位附加一位,让带附加位的字符编码中 “1” 的个数为奇数,若传送后 “1” 个数变为偶数则表明传输出错需重传;偶校验是用附加位使八位编码中 “1” 个数为偶数。一组二进制代码占一字节低七位,空缺的第八位可存奇偶校验码,使八位代码成整体用于存储和传输信息。
3. 奇偶校验码
高考真题
三
1.某数的值是ABH,当它表示机器字长为8位的有符号数时,其对应的补码是( )
A.10101011B. 11010100C. 11010101D.01101011
【答案】C
高考真题
三
2.已知某汉字的区位码为2083,则它的机内码是( )
A.3473H B. C123H
C. B4D6H D. B4F3H
【答案】D
高考真题
三
3.在GB2312一80国标字符集中,某字符国标码为3460H,它对应的区位码是( )
A.1440 B.2064
C. 1464 D. 5480
【答案】A
【解析】国标码与区位码的转换关系为:区位码(十六进制)= 国标码 - 2020H。
已知某字符国标码为 3460H,将其转换为区位码(十六进制),则区位码(十六进制) = 3460H - 2020H = 1440H。
高考真题
三
4.计算机处理汉字时,下列描述正确的是
A.根据汉字机内码取出对应国标码,再由点阵字形输出汉字
B.根据汉字机内码取出对应汉字字形码,再由点阵字形输出汉字
C.根据汉字字形码取出对应地址码,再由地址码输出汉字
D.根据汉字地址码取出对应机内码,再由机内码输出汉字
【答案】B
限时练习
四
1. 在计算机中,一个字节可以表示的最大无符号整数是( )
A. 127 B. 128
C. 255 D. 256
【答案】C
限时练习
四
2. 已知某字符的 ASCII 码值为65,则该字符是( )
A. 'A' B. 'a'
C. '0' D. '1'
【答案】A
【解析】在 ASCII 码表中,大写字母 'A' 的 ASCII 码值是65,大写字母 'B' 的 ASCII 码值是66,以此类推;小写字母 'a' 的 ASCII 码值是97;数字字符 '0' 的 ASCII 码值是48,'1' 的 ASCII 码值是49。所以当某字符的 ASCII 码值为65时,该字符是 'A',答案选 A。
限时练习
四
3.以下关于汉字机内码的说法,正确的有( )
A. 汉字机内码是计算机内部存储、处理汉字时使用的编码
B. 汉字机内码通常是在国标码的基础上加上8080H得到的
C. 汉字机内码的两个字节的最高位一定都是1
D. 不同的汉字输入法,输入同一汉字得到的机内码是相同的
【答案】ABCD
限时练习
四
4.下列编码中,用于表示字符的有( )
A. ASCII 码 B. 汉字机内码
C. 汉字区位码 D. 补码
【答案】ABC
【解析】补码是一种数值编码方式,主要用于在计算机中表示有符号整数,方便进行数值的运算和存储,而不是用于表示字符,D 选项错误。
内容小结
五
谢谢
$$