内容正文:
数据采集与编码
数据是如何采集的?
1.
数据采集
目录
2.
数字化
3.
数制
4.
编码
2
01
数据采集
计算机或手机中看到的各种数据从何而来?
物联网:传感器
互联网:网络爬虫
数据采集
4
物联网
5
智能手机里有哪些传感器?
6
1、摄像头
2、声音传感器
3、重力感应器、陀螺仪
4、光线传感器:根据光线强弱来改变屏幕亮度
5、温度传感器
6、磁场传感器:指南针、导航、运动速度、地理位置等
7
互联网:网络爬虫
数据采集
8
互联网上产生的数据数不胜数,如何在互联网上快速获得大量需要的数据?
网络爬虫:按照一定的规则,自动抓取网页上的数据的一种程序或脚本。
9
02
数字化
听到的声音、看到的图像如何存在手机中?
数字化
模拟信号转数字信号的过程称为数字化。
将模拟信号采样、量化后的信号,这种信号表示的数据是可被计算机存储和处理的二进制数据。
数字信号
现实生活中听到的、看到的信号或物理量的存在。
模拟信号
11
模拟信号与数字信号
编码
量化
采样
数字化过程
13
03
数制
生活中有哪些常见的数制?
数的进制
进制是一种计数方式,包含基和权。基数是数制的数码个数,权值是基数的若干次幂。
例:十进制的基数是10,二进制的基数是2;
十进制数254中的4权值是100,5是101,2是102
254可以表示为:2*102+5*101+4*100
二进制数10中1的权值是21,0是20
15
数的进制
16
进位规则:逢二进一
数码:0,1
基数:2
权值:20,21,22
计算机内部以二进制的方式进行存储和处理。
例:1101.01B
1*23+1*22+0*21+1*20+0*2-1+1*2-2
二进制
17
进位规则:逢八进一
数码:0,1,2,3,4,5,6,7
基数:8
权值:80,81,82
八进制
666o
= 6x82 + 6x81 + 6x80
18
进位规则:逢十六进一
数码:0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F
基数:16
权值:160,161,162
二进制在实际使用中,由于位数太长,不便于书写和记忆,所以人们常常采用十六进制来表示。
十六进制
B612CH
= 11x164 + 6x163 + 1x162 + 2x161 + 12x160
19
十进制与二进制的转换
20
十六进制与十进制转换
21
二进制和十六进制的转换
二转十六方法:从右侧开始,每4位二进制数转为一个十六进制数,
左侧高位不足用0补足
十六转二方法:每位十六进制数位用4位二进制数表示,
不足4位时高位用0补足。
1101011B = 110 1011 B = 6BH
B6H = B 6 H = 1011 110 B
0
十进制与二进制的转换
11(10) = (2)
25(10) = (2)
85(10) = (2)
128(10)= (2)
1011
11001
1010101
10000000
23
进制的转换
11(10) = (2)
25(10) = (2)
85(10) = (2)
128(10)= (2)
1011
11001
1010101
10000000
11(8) = (2)
25(8) = (2)
11(16) = (2)
25(16) = (2)
001001
010101
0001 0001
00100101
24
25
物联网:传感器
互联网:网络爬虫
数字化:模拟信号转数字信号的过程
进制:二进制、十进制、八进制、十六进制间的转换
课堂小结
04
编码
字符、汉字、图像和声音如何编码?
编码
编码是信息按照某种规则或格式,从一种形式转换为另一种形式的过程。解码是编码的逆过程。
生活中有哪些编码?
身份证、学籍号、车牌号……
数据的表现形式可以是文本、图像、图形、声音、视频等,但不管是哪种形式的数据,最终存储在计算机中的都是经过一定规则编码后的二进制数字。
计算机对信息进行存储、加工、传递等处理,实际上是对信息的载体——数据进行处理。
编码
字符编码
条形码
二维码
声音编码
图像编码
视频编码
ASCII、Unicode、汉字编码
我国普遍采用EAN13条形码,由13位数字组成,前3位数字表示国家代码,最后一位叫校验码
是用某种特定的几何图形按一定规律在平面上(二维方向)分布的黑白相间的图形记录数据符号信息
Wave格式音频文件的存储容量可以通过下面的公式进行计算
存储容量=采样频率(Hz)*量化位数(bit)*声道数*时长(s)/8B
数字图像包括矢量图形与位图图像,图像存储容量计算
存储容量=总像素数*颜色位深度/8B
PAL制式的视频每秒播放25帧,NTSC制式每秒播放30帧。常见的视频编码方式有MPEG1、MPEG2、MPEG4等
29
美国信息交换标准码,共128个,用一个字节的低7位编码,即:00000000~01111111,
00~7F(H)
ASCII码
1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB 1PB=1024TB 1EB=1024PB
1ZB=1024EB (1B=8bit)
字符编码
一个字符一个字节,一个汉字两个字节,一个字节8个位。
30
汉字编码
输入码,如拼音、五笔字型码。
外 码
国标码,GB-2312
交换码
每个汉字都有一个二进制代码,计算机内部用机内码。
机内码
16*16点阵来显示汉字。
字形码
31
声音是振动产生的声波,通过介质被人或动物听见。
声音的频率用赫兹表示,HZ,指每秒周期性振动的次数。
将模拟声音数字化需要采样、量化、编码。量化后会形成一系列数字信号,将数字信号按一定的方式进行编码,以文件的形式存在计算机中。
声音文件类型有:wave、mp3、wma
wave格式的文件存储容量计算方式:
存储容量=采样频率(Hz)*量化位数(bit)*声道数*时长(s)(单位:位)
声音编码
32
图像是人对视觉感知的物质在现,由光学设备获取,如:照相机、镜子、望远镜。
数字图像包括矢量图(放大不会影响清晰度)和位图(放大有马赛克,容易失真)。
文件类型:BMP、JPEG、GIF、PNG。
存储容量=总像素*颜色位深度(单位:位)
图像编码
33
小结
数据采集
数字化
人工方式
网络、器件
数模转换
数制
编码
进制转换
存储容量计算
34
课堂练习
1.计算机中的数据是用( C )表示的
A.字母 B. ASCII码 C.二进制代码 D.英文
2.下列工具中不能把模拟图像转换成数字图像的是( D )
A.扫描仪 B.数码相机 C.智能手机 D.打印机
35
课堂练习
3. ( D )不是将模拟音频数字化需要经过的步骤
A.采样 B.量化 C.编码 D.输入
D.需进入数字设备存储和加工
4. 7位二进制编码的ASCII码可表示的字符个数为( A )
A.128 B.130 C.127 D.64
36
课堂练习
5.十进制数71转换成二进制数是( A )
A.1000111 B.1110001 C.1001100 D.1000011
6.二进制数1111010换成十六进制数是( C )
A.6B B.7B C.7A D.710
37
课堂练习
图像素材中有一张“接力比赛.bmp”文件,它是分辨率1024*768的32位真彩色位图图像,该图像占用的存储空间大小是 B
1024*768*32/8
38
THANKS
39
$$