内容正文:
粤教版普通高中教科书
信息技术 必修2
1.2 数据编码
信息技术 王凤龙
回顾-数据的二进制特征
在计算机中,数据是以二进制的形式存储、加工和传输的
文本、数字、图形
图像、视频、音频
编码
0、1
数据
二进制
文字编码
图像编码
声音编码
数据编码就是将各种类型的数据转换为二进制0和1的过程
解码
数据编码就是将各种类型数据转换为二进制0和1的过程;
反之,将二进制解析成各种类型的数据成为解码,电脑中的数据
光信号:亮灭
电信号:高电平、低电平
回顾-数据的二进制特征
在计算机中,数据是以二进制的形式存储、加工和传输的
文本、数字、图形
图像、视频、音频
编码
0、1
数据
二进制
解码
二进制
编码
解码
图像数据
二进制
存储器
数据编码、解码示意图
图像数据
存
取
数据编码就是将各种类型数据转换为二进制0和1的过程;
反之,将二进制解析成各种类型的数据成为解码,电脑中的数据
学习内容
模拟信号
模拟信号是指用连续变化的物理量所表达的信息。如声音信号、图像信号、电信号等。
常见的模拟信号
湿度
温度
光照度
声音
电压
图像
模拟信号示意图
时间
值
时间和取值都是连续的
举例:广播电视、有线电话
电信号:电压、电流、电阻
通过各种各样的传感器可以检测到现实中的模拟信号,如光敏、声音、温度、湿度、热敏、烟雾、振动
模拟信号
模拟信号是指用连续变化的物理量所表达的信息。如声音信号、图像信号、电信号等。
优点:直观且容易实现
缺点:易受干扰、保密性差
应用:有线电话、无线广播电视等
声波
常见的模拟信号
温度
湿度
光照度
声音
电压
图像
我想告诉你我叫王凤龙,我直接声音传输就行,即直观也容易实现
缺点:容易受到环境的干扰(距离过程、有建筑物、噪音),容易被他人窃听(隔墙有耳)。
数字信号
数字信号是离散时间信号的数字化表示。在计算机中,数字信号的大小常用有限位的二进制数表示。
模拟信号
数字信号
时间
值
时间和取值都是连续的
通过电缆传输:高电平1,低电平0
通过光纤传输:高电平亮,低电平灭
数字信号
数字信号是离散时间信号的数字化表示。在计算机中,数字信号的大小常用有限位的二进制数表示。
时间
值
时间和取值都是离散的
0
147
10010010
-78
采样
量化
编码
模拟信号转为数字信号的过程
优点:抗干扰能力强、传输距离长、质量高
便于存储、加密和纠错,具有较强的保密性和可靠性
缺点:需要专门的模数和数模转换器
应用:计算机、移动终端、网络传输等
计算机:使用二进制存储、计算、传输。
在计算机中,数据是以二进制的形式存储、加工和传输的
数字信号如何传递?
电信号
高电平
低电平
光源亮
光源暗
高频率
低频率
光信号
无线信号
无线电波
计算机:使用二进制存储、计算、传输。
在计算机中,数据是以二进制的形式存储、加工和传输的
高电平:5v,低电平:接近0v
光纤:
wife 无线电波(电磁波):波是振动产生的,无线电波属于电磁波的一种,既然是振动,
就会涉及到一个重要的概念-频率(时间内完成周期性变化的次数),我们就可以通过振动频率的高低变化来传递数据1和0
高频:相同时间内,波的数量多,低频:相同时间内,波的数量少
学习内容
先学习
数据大小的表示与单位换算
10101011
00101011
01001101
1个二进制数称为1个位(bit),位是最小的数据单位。
8个二进制位称为1个字节(Byte),字节是最基本的数据单位。
24bit
3Byte
“右击”→“属性”可查看文件数据的大小
KB、MB、GB……
所有数据到了计算机中都会转换为二进制0和1的数学序列,这一串二进制数在计算机中占用的大小是多少呢?计算机存储数据又有哪些单位呢?
表示长度有长度单位m、cm
表示重量的有重量单位kg、g,同样,表示数据的也有数据单位。
但位实在太小了,所以我们日常生活中亦8个位作为一个基本单位。
数据大小的表示与单位换算
单位 换算关系 备注
b(bit)位 最小单位
B(Byte)字节 1B = 8b 最基本单位
KB 千字节 1KB = 210B = 1024B
MB 兆字节 1MB = 210KB = 1024KB
GB 吉字节 1GB = 210MB = 1024MB
TB 太字节 1TB = 210GB = 1024GB
PB、EB…… 更多单位均以1024即210为最基本进率
计算机中常见的数据存储单位与换算关系
表示长度有长度单位m、cm
表示重量的有重量单位kg、g,同样,表示数据的也有数据单位。
PB:拍字节,EB:艾字节。
数据大小的表示与单位换算
10101011
00101011
01001101
1个二进制数称为1个位(bit),位是最小的数据单位。
8个二进制位称为1个字节(Byte),字节是最基本的数据单位。
24bit
3Byte
b
B
KB
MB
GB
TB
……
1024(210)
8
简易换算关系表(抄写)
表示长度有长度单位m、cm
表示重量的有重量单位kg、g,同样,表示数据的也有数据单位。
数据单位练习
A. 位bit
B. 字节Byte
C. 千字节KB
D. 兆字节MB
1、在计算机中,数据存储的基本单位是 ( ) ?
B
A. 8,8
B. 1024,1024
C. 8,1000
D. 8,1024
2、在计算机中,1字节= ( )位,1GB = ( )MB?
A. 100
B. 128
C. 500
D. 512
3、若一张图片的大小约为4MB,则一个2GB的U盘理论上可以保存这样的图片大概( ) 张 ?
C
D
探讨二进制位数与其可表示不同二进制数之间的关系
位数 可表示的不同二进制数 个数
1 0、1 2
2 00、01、10、11 4
3 000、001、010、011
100、101、110、111 8
n …… ?
高中数学选择性必修三第六章 计数原理
2×2×2×……×2
n
2n
n个二进制位数可以表示2n个不同二进制数
000、001、010、011
100、101、110、111
00、01、10、11
0、1
2
4
8
……
?
探讨二进制位数与其可表示不同二进制数之间的关系
2个二进制位
可表示
4个二进制数
可对应
4个字母、汉字、颜色等
二进制 表示字母 表示汉字 表示颜色
00 A 赵 红■
01 B 钱 黄■
10 C 孙 蓝■
11 D 李 绿■
思考:若想要表示52个大小写英文字母,则至少需要多少个二进制位?
2n≥52 → n=6
2个二进制位
4个二进制数
4个字母、汉字、颜色等
可表示
可对应
二进制 表示字母 表示汉字 表示颜色
00 A 赵 红■
01 B 钱 黄■
10 C 孙 蓝■
11 D 李 绿■
恭喜你,你已掌握文字编码和图像编码的核心
使用一定位数的二进制数来表示文字和颜色
探讨二进制位数与其可表示不同二进制数之间的关系
恭喜你,你以掌握文字编码和图像编码的核心(即使用一定位数的二进制来表示文字、颜色
① 文字编码
美国信息交换标准代码(ASCII码)、国标码(GBK)、统一码/万国码(Unicode)
英文字母
阿拉伯数字
常见符号
ASCII码所有文字
中文汉字、符号
世界各国文字符号
UTF-8、UTF-16、UTF32
由于计算机有美国人发明,美国人使用英语为主要语言,因此先出现的是英文文字的编码方案——ASCII码
GBK对ASCII做了兼容
统一码是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
实现的编码方式UTF-8、UTF-16和UTF-32
Unicode是一种编码标准,UTF-8、UTF-16和UTF-32是这套标准的实现方式。
Unicode是“指导方针”、是理论知识,而UTF-8是这个“指导方针”的具体实现,也是其具体”行动“。
ASCII码
ASCII码是美国信息交换标准代码,用8位二进制位 (1个字节) 码为所有的英文字母(大小写52个)、阿拉伯数字(10个)和常用的不可见控制符(33个)以及标点符号、运算符号等(33个)共计128个文字符号建立了转换码,将符号转换为“0”和“1”构成的编码。
我使用9位二进制表示字符,其中“10000001”代表字母“A”……
用户B
我使用7位二进制表示字符,其中“0010001”代表字母“A”……
用户A
计算机
我懵了,我乱码了
28=256
在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了ASCII编码,统一规定了上述常用符号用哪些二进制数来表示。
28 = 256,27=128,其实7个刚好,但是你不确定后面是否会新加符号,所以留有余地拓展,同时,计算机也以1个字节作为基本单位,这样方便数据大小计算和表示。
表1-3 ASCII码表
高四位
低四位
英文字母A的二进制编码为01000001,转换为十进制数是65。
英文字母d的二进制编码是01100001,转换为十进制数是97。
(01000001)2 = 1×20 + 1×26
= 1 + 64 = (65)10
(01100100)2 = 1×22 + 1×25 + 1×26
= 4 + 32 + 64 = (97)10
01100100
97
中文编码
60370个汉字
ASCII码
8位二进制
256个不同字符
英文字母、数字、符号
1个字节
如果要设计一套汉字的编码系统,需要多少二进制位呢?
2个字节
16位二进制
65536个不同字符
中文汉字、符号 及 所有ASCII码
没什么是一发利箭不能解决,如果有那就两发
没有什么是一个甜甜圈搞不定的,一个不够,就来两个!
国标码
由于ASCII码只包含英文、数字和一些控制符号,并不能表示汉字,因此,我国设计了用于处理汉字的简体中文的GB码和用于繁体中文的BIG5码(大五码)。
1980年发布的《信息交换用汉字编码字符集》(GB 2312)一共收录了7445个字符,包括6763个汉字和682个其他符号。GB 2312主要分为两部分:编号127之前的符号跟ASCII码所表示的意义相同,使用单个字节表示;编号127之后的符号包含了几乎所有的简体中文字,统一使用两个字节表示。并且为了区分中文字符和ASCII码字符,规定了中文编码高字节的最高位不为0。
010000010100100111010110110100001011100111111010
A
I
中
国
汉字字符集编码查询链接:https://www.qqxiuzi.cn/bianma/zifuji.php
去答题
216=65536
GB 18030、GBK 1.0、GB18030
图像编码
矢量图 位图
组成 利用数学公式生成的点、线、多边形等几何元素 若干像素点
优点 放大不会失真、文件体积较小 色彩丰富、细节丰富、效果逼真、应用广泛
缺点 颜色不丰富、色彩不细腻、
只能处理简单图像、不适合表现真实细节 放大到一定程度会失真,文件体积较大
应用场景 插图、logo、图标、标志等 照片、海报、网络图片等大多数场景
矢量图
图片失真
位图
矢量图主要适用于表现简化的图像,对于需要表现真实细节的图像,如照片或者复杂的自然景物,矢量图的效果通常不如位图。
例如一天直线y=2x,理论上它是由无线个点组成,所以放大也不会失真,而位图是有有限个像素组成,方法会失真
位图图像编码
放大若干倍
位图图像放大到一定程度后会失真
位图图像有若干横纵排列的像素组成,每个像素有着唯一的颜色。因此只要将每个像素的颜色值对应一个二进制数即可完成位图图像的编码。
00
01
10
11
矢量图主要适用于表现简化的图像,对于需要表现真实细节的图像,如照片或者复杂的自然景物,矢量图的效果通常不如位图。
位图图像大小计算
2、图像量化位数(图像深度)
图像中每个像素点记录颜色所用二进制数的位数
(量化位数越多,可使用的颜色越多,色彩越丰富)
1、分辨率
图像水平方向的像素数×图像垂直方向的像素数
(分辨率越高,包含的像素越多,图像越清晰)
2量化位数 = 颜色个数
1位 = 2色
8位 = 256色
24位 = 16777216色
分辨率 = 8 × 8
拓展:RGB色彩模式
RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三种颜色的不同比例相互叠加从而形成各种颜色。
00000000~11111111
00000000~11111111
00000000~11111111
24位二进制
十进制范围:0~255
R
G
B
8位二进制
RGB(160,32,240)
101000000010000011110000
#A020F0
紫
111111111111111100000000
RGB(255,255,0)
#FFFF00
黄
在电脑“画图”软件中可体验RGB配色
RGB色彩模式的二进制表示
画图→编辑颜色
位图图像大小计算
图像分辨率×图像量化位数÷8 (B)
问:若右侧图片的量化位数为24位,则该图片所占用的空间大小是多少?
分辨率
量化位数
8 × 8 × 24 ÷ 8 = 192(B)
矢量图主要适用于表现简化的图像,对于需要表现真实细节的图像,如照片或者复杂的自然景物,矢量图的效果通常不如位图。
位图图像大小计算
图像分辨率×图像量化位数÷8 (B)
问:一副1024×768像素、16位色的图像所占用存储容量是 ( ) MB?
A. 0.8
A. 1.5
A. 2.4
A. 3.7
1MB = 1024KB
1KB = 1024B
解:图像大小
= 1024×768×16/8 (B)
= 1024×768×16÷8÷1024(KB)
= 1024×768×16÷8÷1024÷1024(MB)
= 1.5MB
B
矢量图主要适用于表现简化的图像,对于需要表现真实细节的图像,如照片或者复杂的自然景物,矢量图的效果通常不如位图。
拓展:视频编码
视频画面是由以一定的速度连续播放的一组静态图像形成的,这些静态图像被称为帧。当连续的图像变化超过24帧/s时,根据视觉暂留原理,就会形成比较流畅的视频画面了。因此视频数据的编码就可以看做多张图像的编码。
视频文件大小 = 单张图像大小 × 总张数
分辨率 × 量化位数 × 帧速率 × 时间(s) ÷ 8 (B)
灵璧儿子高一新生入学宣传视频
声音编码
采样
时间t
幅度y
量化
编码
声音模拟信号
视频大小 = 音频码率+视频码率
1、采样
采样就是把输入的模拟信号按适当的时间间隔得到各个时刻的样本值,对其进行离散化提取。其中每秒内对声音信号的采样次数称为采样频率,单位是赫兹 (Hz),采样频率越高,声音还原度越高,音质就就越好。
奈奎斯特采样定理:如果以一定时间间隔对某个信号进行采样,并且采样频率高于该信号最高频率的两倍,则采样值包含了原信号的全部信息。
44.1 kHz、22.05 kHz和11.025 kHz
每秒采集44100次
常用
人的声音频率是约为85Hz~1100H
声音是有物体振动产生的
声音频率:一秒钟之内振动的次数叫做频率
不同生物的声音频率是不一样的,人的声音频率是约为85Hz~1100H
我们最常用的采样频率是44.1kHz,它的意思是每秒取样44100次,也被简称为44.1KHz
2、量化
量化是把样值信号的无限多个可能的取值,近似地用有限个数的数值来表示。首先是将采样信号幅度划分为若干量化等级,然后将采样后的信号幅度与所划分的各个量化等级进行比较,向下取最接近的量化等级的数值。
量化位数:是指每个采样点值的二进制位数。量化位数越多,量化等级越多,量化值就会越接近采样值,声音的准确性和保真度就越好。
如量化位数=4,则分为24即16个等级,而量化位数=8,则分为28即256个等级(国标)。
量化位数决定量化等级,举例说明:量化位数为1时,划分两个等级,只能取两个值,量化值和采样值差距较大,如果是4个,差距就小,如果是16,差距更小。
国标声音量化等级分为256个,即28个
3、编码
编码是将量化后的采样值用二进制数码表示,并转换为由二进制编码0和1组成的数字信号。模拟信号采样后可用8位二进制数表示,最高位表示符号,正数为0,负数为1。
计算机→“程序员”模式
声音信号的数据编码
声音是有物体振动产生的
声音频率:一秒钟之内振动的次数叫做频率
不同生物的声音频率是不一样的,人的声音频率是约为85Hz~1100H
我们最常用的采样频率是44.1kHz,它的意思是每秒取样44100次,也被简称为44.1KHz
声音大小计算
采样频率(Hz)×量化位数×声道数×时间(s)÷8 (B)
音频处理软件GoldWave
左声道
右声道
问:采样频率为44.1 kHz、量化位数为16位的立体声,1秒声音所需字节数为?
= 44.1×1000×16×2×1÷8
= 176400(B)
解:声音大小
声道数也就是声音录制时的音源数量或回放时相应的扬声器数量,常用的是双声道,左声道对应左耳,右声道对应右耳,更立体,更真实。
总结
总结
单位 换算关系 备注
b(bit)位 最小单位
B(Byte)字节 1B = 8b 最基本单位
KB 千字节 1KB = 210B = 1024B
MB 兆字节 1MB = 210KB = 1024KB
GB 吉字节 1GB = 210MB = 1024MB
TB 太字节 1TB = 210GB = 1024GB
PB、EB…… 更多单位均以1024即210为最基本进率
计算机中常见的数据存储单位与换算关系
真题练习(1/2)
A. 数字信号
B. 模拟信号
C. 声音信号
D. 温度信号
1、使用二进制0和1表示的信号是 ( ) ?
A
A. 10
B. 100
C. 1000
D. 1024
2、在计算机中,1KB= ( )B ?
A. “a”
B. “9”
C. “学”
D. “+”
3、ASCII码表中不包含以下哪个字符 ( ) ?
C
C
真题练习(2/2)
A. 1
B. 2
C. 4
D. 8
4、国标码(GB2312)中规定,一个汉字是由 ( ) 个字节组成 ?
B
A. 8
B. 64
C. 128
D. 256
5、若图像的量化位数是8,则表示该图像最多可使用的颜色数量是 ( ) 种?
A. 采样、量化和编码
B. 量化、采样和编码
C. 编码、采样和量化
6、声音数字化的的三个步骤按顺序是 ( ) ?
D
A
拓展
为什么我们购买U盘的标注容量总比电脑实际显示的容量要小?
8GB
16GB
≈7.45GB
≈14.9GB
购买的标注容量
电脑实际显示的容量
主要原因:制造商和计算机系统的计算方式不一样
制造商:16GB = 16× 1000 × 1000 × 1000 B = 16000000000B
计算机:16000000000B ÷ 1024 ÷ 1024 ÷ 1024 ≈ 14.90GB
1GB = 1024 MB
1MB = 1024KB
1KB = 1024B
作业
利用思维导图软件整理本节课知识
第一章 数据与信息
电信号传输
0 → 灯灭
1 → 灯亮
15引脚
led灯
(发光二极管)
≈5V
≈0V
普中开发板:开发板是硬件开发的电路板,可以自己编写程序实现对硬件的控制,在嵌入式和物联网领域应用广泛。
如果是5V供电的数字电路,高电平就是5V,或接近5V。低电平就是'无’,就是0V或接近0V。
电子元器件:电子管、晶体管、中小规模集成电路、大规模和超大规模集成电路
晶体管包括二极管、三极管等,现在的集成电路上可以容纳几个亿的晶体管了。
光信号传输
光纤的传输原理——光的全反射
微细的光纤封装在塑料护套中,使得它能够弯曲而不至于断裂。通常,光纤的一端的发射装置使用发光二极管(light emitting diode,LED)或一束激光将光脉冲传送至光纤,光纤的另一端的接收装置使用光敏元件检测脉冲。
在日常生活中,由于光在光导纤维的传导损耗比电
无线电波传输
微细的光纤封装在塑料护套中,使得它能够弯曲而不至于断裂。通常,光纤的一端的发射装置使用发光二极管(light emitting diode,LED)或一束激光将光脉冲传送至光纤,光纤的另一端的接收装置使用光敏元件检测脉冲。
在日常生活中,由于光在光导纤维的传导损耗比电
本节课到此结束
$$