内容正文:
字符编码用途广
四年级上册
粤教版
字符编码的概念与意义
常见字符编码标准
汉字编码在中文信息处理中的作用
导 入 新 课
我们在电脑上可以轻松地输入这些字符,那你们知道计算机是怎么识别和存储它们的吗?
hello
你好
导 入 新 课
我们打开一个文件夹,为什么会出现这些奇怪的符号呢?这其实和字符编码有关,今天我们就来学习字符编码的知识。
新 知 讲 授
虽然数字设备的运算速度很快,但是它们却只认识0和1这两个数字。因此,如果人们想要正常与数字设备沟通,就需要将人类的语言进行编码,变为数字语言。例如,在计算机中,人们制定了一种叫作ASCII码的编码规则,通过8位二进制数给常用的字符进行编码。
小秘笈
字符编码的概念
字符编码是将字符集中的字符映射为特定的二进制代码的规则。计算机只能识别 0 和 1 组成的二进制信息,所以需要通过字符编码将我们熟悉的字符(如字母、数字、标点符号、汉字等)转换为计算机能处理的二进制数
字符编码的意义
字符编码使得计算机能够准确地存储、处理和传输文本信息。例如,我们在电脑上写文章、编辑文档、发送邮件等操作都依赖于字符编码。没有字符编码,计算机就无法理解我们输入的内容,也就无法完成各种信息处理任务
查一查
你知道常见的字符编码标准是哪些吗?
常见字符编码标准
ASCII 码:
ASCII 码是美国信息交换标准代码,它使用 7 位二进制数来表示 128 个常见的字符,包括英文字母(大小写)、数字、标点符号和一些控制字符。例如,字符 “A” 的 ASCII 码值是 65(二进制为 01000001),“0” 的 ASCII 码值是 48(二进制为 00110000)
常见字符编码标准
ASCII码的编码原理非常简单。每个字符都被赋予了一个唯一的7位二进制编码,这个编码值可以通过一个简单的公式计算得到:
编码值=字符的十进制ASCII值-64
例如,字母‘A的十进制ASCII为65,那么它的编码值为:编码值= 65-64= 1将编码值转换为7位二进制数,即可得到A的ASCII码: 01000001。
常见字符编码标准
汉字编码(以 GB2312 为例):
由于 ASCII 码无法表示汉字等非英文字符,我国制定了 GB2312 编码标准。GB2312 用两个字节来表示一个汉字,它收录了大量的常用汉字和符号。例如,汉字 “中” 在 GB2312 中有特定的编码值。
想一想
汉字编码在中文信息处理中的作用有什么?
汉字编码在中文信息处理中的作用
1.实现计算机对汉字的存储
计算机内部只能识别二进制数据。汉字编码将每个汉字转换为特定的二进制代码,使得计算机能够像存储英文字母等字符一样存储汉字。例如 GB2312 编码,它用两个字节来表示一个汉字。当我们在文档中输入一个 “中” 字时,计算机就会根据 GB2312 编码规则将其转换为对应的二进制数字序列存储在硬盘或内存中。
汉字编码在中文信息处理中的作用
2.确保汉字的正确显示和打印
当我们打开一个中文文档或者查看网页上的中文内容时,计算机需要根据汉字编码将存储的二进制代码转换回对应的汉字进行显示。如果没有汉字编码,计算机就不知道如何将这些二进制数据转换为我们能够理解的汉字,屏幕上可能会出现乱码。
汉字编码在中文信息处理中的作用
3.促进中文信息处理软件的开发
汉字编码为中文文字处理软件(如 WPS 文字、Microsoft Word 中文版等)、中文输入法软件(如搜狗输入法、微软拼音输入法等)的开发提供了基础。软件开发者可以依据汉字编码标准来设计软件的功能,例如,输入法软件根据汉字编码将用户输入的拼音转换为对应的汉字;文字处理软件根据汉字编码进行文字排版、字体设置等操作,从而为用户提供高效的中文信息处理环境。
常见字符编码标准
UTF - 8 是一种通用的字符编码标准,它可以用来表示世界上几乎所有的字符,包括各种语言的文字、符号等。UTF - 8 具有可变长度的编码方式,对于英文字符,它通常只使用 1 个字节,和 ASCII 码兼容;对于汉字等其他字符,根据字符的不同可能使用 2 个、3 个或更多字节来编码
拓 展 知 识
由于我们的汉字数量过于庞大,不可能像英文那样在键盘上为每一个汉字都造一个按键,因此在经历了长时间的探索后,逐渐产生了音码、形码、音形码等编码形式,这样中文输入也由只能输入单一汉字变为了整词、整句输入。
拓 展 知 识
例如,我们常用的拼音输入法就是一种基于音码规则编码的输入法。这种输入法不需要特殊记忆,只需要会拼音就可输入汉字。复用字特
拓 展 知 识
随着人工智能技术的飞速发展,手写输入、语言输入等智能输入法逐渐成了主流。但不论输入的形式如何变化,手写输入和语音输入等也要对字符进行特殊的编码,只是编码方式会更加复杂。
拓 展 知 识
常见的二维码,也是对字符的一种编码方式,只是很多时候它记录的是特定网址的编码,人们需要扫描才能知晓其包含.的内容。
拓 展 知 识
除了已有的编码规则,我们还可以根据需要,对字符规定新的编码规则。输入法中的自定义短语设置就是一种个性化编码方式。
拓 展 知 识
在图形化编程软件中,可以通过“变量”功能为一个或一段字符命名,也可以将其看作对字符的一种临时编码。
练 一 练
1.与同学一起创建编码规则,使用字母和数字来代表一些我们经常使用的短语,然后尝试使用这套自创的代码来进行沟通。
2.编写并运行左图程序,思考角色两次的发言代码相同而内容为什么会不同?
谢谢观看
$$