内容正文:
声音/图像数字化
认识数据编码
自然界的声音是如何转换为音频文件呢?
声音在空气中是以声波进行传播的,那么
模拟信号
数字信号
01.采样
P17
振幅
时间
1s
2s
3s
4s
5s
1.采样
采样即每隔一段时间在模拟声音信号的波形上采取一个振幅值。相隔时间相等的采样为均匀采样(又称为线性采样),相隔时间不相等的采样为不均匀采样(又称为非线性采样)。
每秒采集一次
在5秒的时间内就可以测5个采样点
1秒内测多少次声音模拟信号的值。
振幅
时间
1s
2s
3s
4s
5s
1
2
3
4
5
将5个采样点连接起来,就可以形成近似去表示原来连续变化的模拟信号。
1秒内测多少次声音模拟信号的值。
即确定用多少个采样点表示原来连续变化的波形。
思考:
在采样过程中,我们获得的采样点是越多还是越少我们的声音质量越好?
时间
1s
2s
3s
4s
5s
振幅
振幅
1s
2s
3s
4s
5s
时间
采样频率越高,即采样的时间间隔越短,则在单位时间内得到的声音样本数据越多,对声音信号波形的表示越精确,声音的保真度越高,同时记录的数据越多,存储容量越高。
采样频率:每秒采样声音的次数,单位为赫兹(Hz)
经过采样后取得的值依旧是连续变化的,如何将采样点的值进行分级量化呢?
02.量化
P17
2.量化
用二进制数表示采样所得到的幅度值的过程。将采样点的值分级量化,变化到最接近的数字。
时间
1s
2s
3s
4s
5s
量化值
0
1
2
3
1
2
3
2
2
1
0
0
0
1
思考:
在量化程中,分级越多还是越少质量越好?
量化位数越大,划分的级数越多,采样结果近似到某个级数值时产生的误差就越小。因此,量化位数越多,数字化精度越高,声音就越保真。
时间
1s
2s
3s
4s
5s
量化值
0
1
2
3
3
5
7
5
4
3
1
0
1
3
4
5
6
7
时间
1s
2s
3s
4s
5s
量化值
0
1
2
3
1
2
3
2
2
1
0
0
0
1
时间
1s
2s
3s
4s
5s
量化值
00
01
10
11
01
10
11
10
10
01
00
00
00
01
真题:学校要举办歌唱比赛,小明负责录制班级歌曲。他发现初次录制的效果不是很好,他可以 量化位数来增强录制效果。
增加
量化后的二进制值怎么存储至计算机中呢?
03.编码
P17
3.编码
按照一定 格式把经过采样和量化得到的离散数据记录下来,并在其基础上加入用于纠错、同步和控制的数据,最终转换成数字音频信号。
编码就类似于组装积木。
我们要考虑怎么组装才体积更小,更合理。不同的格式就可以代表不同的组装方式。
wav是最常见的未压缩的文件格式。声音质量高,所占存储容量较大。
MP3是最常见的音频有损压缩格式,可压缩到原来的1/10左右,而且仍具较高保真度。
数据量(单位:字节)=数据率×持续时间
=(采样频率×量化位数×声道数)÷8×持续时间
真题:录制一段时长为10秒、量化位数为16位、采样频率为50kHz、未经压缩的单声道音频,则该音频所占的存储容量为 字节.
1000000
未经压缩的音频文件的数据量计算方法
P23
1B=8b
1KB=1024B 1MB=1024KB
1GB=1024MB 1TB=1024GB
空间内存单位
真题:录制一段时长为10秒、量化位数为16位、采样频率为50kHz、未经压缩的单声道音频,则该音频所占的存储容量为 字节.
1000000
≈1MB
总结
P17
模拟声音
信号
采样
量化
编码
数字声音
信号
切割、采集模拟值
模拟值分等级
确定组装规则
声音的数字化
数据量(单位:字节)=图像分辨率×颜色深度÷8
P25
小华录制的歌曲时长为100秒,双声道,采样频率为44.1kHz,量化位数为16,计算该音乐的音频所占的存储容量。
小华为该音乐配备了一张图片,已知图片尺寸为90×72像素,颜色深度为24位,计算该图像所占的存储容量。
=(采样频率×量化位数×声道数)÷8×持续时间
=(44.1×1000×16×2)÷8×100
=17640000B
≈17MB
=图像分辨率×颜色深度÷8
=90×72×24÷8
=19440B
EVCapture5.0.5软件录制
Lavf58.33.100
本视频由湖南一唯信息科技开发的EV录屏软件录制, www.ieway.cn
$$