内容正文:
1.2 数据编码
粤版高中信息技术《数据与计算》
声音?
视频?
图片?
文字?
符号?
问题导入:人的感观信号 电信号
请同学们思考:
我们现实生活中的声音、影像、图片、文字、符号是怎样存储到我们的计算机中的呢?
粤版高中信息技术《数据与计算》
数据信号的类型
模拟信号
指在时间和数值上均有连续性的信号。
数字信号
离散时间信号的数字化表示,通过电压脉冲的变化来表示要传输的数据。
模拟信号就是用电信号来直接模拟了自然界各种物理量。
把模拟信号采样,用高低电压来表示
粤版高中信息技术《数据与计算》
一、模拟信号与数字信号比较
信号类型 优点 缺点
模拟信号 直观、真实且容易实现 (1)保密性差 ,易被窃听
(2) 抗干扰能力弱
数字信号 (1)保密性强,可靠性高
(2) 抗干扰能力强
(1)占用频道宽
(2) 技术要求高
远距离传送时用哪种信号比较好?
粤版高中信息技术《数据与计算》
文字编码(单字节,双字节)
粤版高中信息技术《数据与计算》
三、文本编码:单字节码
莫尔斯码
ASCII(American Standard Code for Information Interchange,美国信息交换标准码)是使用最广的文字编码。
标准的ASCII编码使用8个二进制数来表示128个符号,包括英文大小写字母、标点符号、数字和特殊控制符。
ASCII码
粤版高中信息技术《数据与计算》
文字编码
数字
字母
符号
1----49
(00110001)
A----65
a----97
中文?
粤版高中信息技术《数据与计算》
三、文本编码
其他文字编码
1)为了扩充ASCII编码,以用于显示本国的语言,不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码,又称为“MBCS”。在简体中文系统下,ANSI 编码代表 GB2312 编码,在日文操作系统下, ANSI 编码代表 JIS 编码,所以在中文 windows下要转码成gb2312只需要把文本保存为ANSI 编码即可。 不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。一个很大的缺点是,同一个编码值,在不同的编码体系里代表着不同的字。
2)BIG5,大五码是一种繁体中文汉字字符集,其中繁体汉字13053个,808个标点符号、希腊字母及特殊符号。大五码的编码码表直接针对存储而设计,每个字符统一使用两个字节存储表示。因为Big5的字符编码范围同GB2312字符的存储码范围存在冲突,所以在同一正文不能对两种字符集的字符同时支持。
3)如上ANSI编码条例中所述,世界上存在着多种编码方式,在ANSi编码下,同一个编码值,在不同的编码体系里代表着不同的字。如果有一种编码,将世界上所有的符号都纳入其中,无论是英文、日文、还是中文等,大家都使用这个编码表,就不会出现编码不匹配现象。每个符号对应一个唯一的编码,乱码问题就不存在了。这就是Unicode编码。
4)UTF-8
为了提高Unicode的编码效率,于是就出现了UTF-8编码。UTF-8可以根据不同的符号自动选择编码的长短1-4个字节。比如英文字母可以只用1个字节就够了。
UTF-8的编码是这样得出来的,以"汉"这个字为例:
"汉"字的Unicode编码是U+00006C49,然后把U+00006C49通过UTF-8编码器进行编码,最后输出的UTF-8编码是E6B189。
粤版高中信息技术《数据与计算》
1
2
3
4
5
6
ASCII
ANSI
GB2312
GBK
Unicode
UTF-8
BIG5
其他文字编码
单字节
双字节
汉字
繁体字
汉字延伸
统一不同国家语言
粤版高中信息技术《数据与计算》
图像编码(变换、编码、压缩)
矢量图 位图
与分辨率无关,
放大拉小不变化
色彩不丰富
文件大小:小 由像素点组成
放大图像时,
有马赛克现象
色彩丰富
文件大小:大
位图表现的色彩比较丰富,可以表现色彩丰富的图像,可逼真表现自然界各类实物;而矢量图形色彩不丰富,无法表现逼真的实物,矢量图常常用来表示标识、图标、Logo、几何图形等简单直接的图。
粤版高中信息技术《数据与计算》
三、位图图像编码
像素:
位图也叫点阵图或像素图,将图像无限放大,会发现图像是由许多颜色方块组成,这些小方块就是构成图像的最小单位“像素”(或叫光栅点)。
图像分辨率:
图像分辨率的表达方式为“水平像素数×垂直像素数”,也可以叫做图像大小、图像尺寸、像素尺寸。一张图片分辨率是100x80,就是说这张图片1:1显示时,水平方向由100个像素点组成,垂直方向由80个像素点组成。
我们常说的4000万像素相机,说明这张照片大约由4000万个像素单元组成,分辨率决定了位图图像细节的精细程度。
粤版高中信息技术《数据与计算》
位图编码
像素:
位图中会发现图像是由许多颜色方块组成,这些小方块就是构成图像的最小单位“像素”(或叫光栅点)。
图像分辨率(图像大小、尺寸):
图像分辨率= 水平像素数×垂直像素数
一张图片分辨率是100x80,就是说这张图片1:1显示时,水平方向由100个像素点组成,垂直方向由80个像素点组成。
每个像素点的颜色信息,颜色信息采用R位的二进制数表示,R称为图像的量化位数,R位可以表示2R种颜色,R越大,图像的色彩越丰富。
R=1,21种颜色,黑白图像
R=4, 24 =16种颜色
R=8, 28 = 256种颜色
R=24,224种颜色,真彩色
粤版高中信息技术《数据与计算》
三、位图文件大小 14页作业
BMP位图文件的大小(单位B)=
文件头(14)+信息头(40)+颜色表项(颜色数× 4,24位无颜色表项)+图像分辨率X图像量化位数÷8
举例:
1.一幅24位的BMP位图图像,分辨率为1024X800,其文件大小?
54+1024 × 800 × 24/8=2457654B
2.一幅256色(8位)的BMP位图图像,分辨率为1024X800,其文件大小呢?
54+256 × 4+1024 × 800 × 8/8=820278B
8位=1字节(B)
1024B=1MB
1024MB=1GB
粤版高中信息技术《数据与计算》
二、声音编码(采样、量化、编码)
模拟的连续声音信号转换为离散数字信号
采样频率高于该信号最高频率的两倍
采样频率:44.1、22.05、11.025kHz
粤版高中信息技术《数据与计算》
四、声音编码(编码)
编码是将量化后的采样值用二进制数码表示,并转换为由二进制编码0和1组成的数字信号。
例如8位量化位数的编码如右图,最高位0为正数,1为负数。
粤版高中信息技术《数据与计算》
四、声音编码(编码)
wav格式
Wav声音文件的大小(单位B)
=文件头(44B)+采样频率(HZ)X量化位数X 声道数X 时间(秒)÷8
举例:
1.采样频率为44.1kHz、量化位数为16的立体声(双声道),1分钟声音文件的大小?
44+44.1*1000*16*2*60/8=10584044B
(计算过程见右动图)
粤版高中信息技术《数据与计算》
四、声音编码(编码)
验证文件大小
GoldWave软件建立采样频率44.1kHz,双声道,1分钟的声音文件;
保存为16bit的wav格式
查看文件的属性,对照计算出来的结果,检查是否一致?
思考:
给这一分钟的声音录上不同的声音,对文件的大小是否有影响?为什么
注意此为声音文件,有44个字节的文件头,课本中求声音的存储空间忽略此44字节的空间。
验证方法
粤版高中信息技术《数据与计算》
四、声音编码(编码)
声音文件的大小(单位B)
=采样频率(HZ)X 量化位数 X 声道数 X 时间(秒)÷8
举例:
1.采样频率为44.1kHz、量化位数为16的立体声(双声道),1分钟声音文件的大小?
44.1 × 1000 × 16 × 2 × 60/8=10584044B
粤版高中信息技术《数据与计算》
$$