内容正文:
1.2数据编码
学校:___________姓名:___________班级:___________考号:___________
一、选择题
1.已知英文字母“o”的ASCII码是1101111,那么计算机内存储英文字母“m”的二进制编码为( )
A.1101101 B.1101001 C.1101110 D.1101010
2.使用凯撒密码进行加密,其密钥为5,将明文“carefully”加密后,密文为( )
A.hfwjkzqqd B.xvmzapggt C.gfwjkzqqx D.hjwjkzqqd
3.下列关于模拟声音信号的数字化过程的说法,不正确的是( )
A.将连续变化的信号转换为二进制数值的过程
B.将离散信号转换为连续变化信号的过程
C.需要经过采样、量化和编码三个过程
D.量化位数越大,则数字化后的声音文件也越大
4.某教室有6盏灯,且每盏灯都能正常工作,只有“开”和“关”两种状态,如果包括6盏灯全关的状态,则最多能表示开关状态的编码数为( )种。( )
A.12 B.6 C.64 D.32
5.ASCII码采用8位二进制编码,共表示( )个字符。
A.127 B.128 C.256 D.64
6.下列编码方式中,属于图像编码的是( )。
A.ASCII码 B.GBK
C.图像压缩 D.统一码
7.下列关于计算机信息编码的描述,不正确的是( )
A.ASCII 字符编码表包含 128 个字符
B.4 位二进制能表示的最大十进制数是 16
C.一个正整数的二进制数末尾增加一个“0”,这个数是原来数的 2 倍
D.网络爬虫、传感器都是常见的数据采集工具
8.CJK编码是Unicode中收集了( )等语言中的汉字子集。
A.汉语 B.英语 C.日语 D.韩语
9.十进制正整数n转换为二进制数,该二进制数共3位,下列说法正确的是( )
A.该二进制数末位数码对应权值是21
B.若该二进制数的首位为1,则n必大于4
C.若该二进制数的末位为1,则n+1一定为偶数
D.该二进制数首位去掉,转换为十进制数,所得的值是n\2
10.使用UltraEdit软件观察字符“2021加油!”的内码,部分界面如图所示。下列说法正确的是( )
A.字符“!”的内码保存占用2个字节
B.字符“2”的内码转换为二进制为“0000010”
C.字符“10”的内码十六进制显示为“3A”
D.上述字符“2021加油!”保存共占12b
11.对某幅图像进行数字化,该图像的颜色总数为100种,则颜色位深度最少是( )
A.100 B.10 C.8 D.7
12.以下关于十六进制数的描述中,说法正确的是 。
A.十六进制数的位权为16 B.十六进制数C代表13
C.十六进制可表示的数值范围比二进制大 D.每一位十六进制数对应4位二进制数
13.下列选项中,依次是二进制数、八进制数、十六进制数的是( )
A.10、 69、 11 B.11、 67、 5F C.12、 55、 16 D.13、 78、 19
14.如果(A5)16=(165)x,那么等式(85)x=( )8也成立.
A.125 B.25 C.85 D.205
15.计算机中的数字信号常用有限位的二进制数表示。字长为2位的二进制数可以表示( )种数字信号。
A.2 B.3 C.4 D.5
二、填空题
16.编码盘是一种通过直接编码进行测量的元件,它直接把被测转角或直线位移转换成相应的代码,指示其绝对位置。如图所示的编码盘是个循环码,每个代码用4位二进制表示,其特点为相邻两个代码间只有一位数变化。
(1)4位二进制编码表示的最大数用十进制表示是 。
(2)如图编码盘箭头所指区域的编码是0001,若将轮盘顺时针旋转90°则箭头所指区域编码是 。
(3)如果将该编码盘向外增加两圈,则需要 位二进制表示各块区域。
17.计算题。
(1)ABH-1001B+39D-FH= B
(2)Int (-26.5) mod -15\6-9mod 2^2*5/2= D
18.汉字编码中, 的主要用途是作为汉字信息交换码使用,使不同系统之间的汉字信息进行相互交换。
19.(5)10=( )2
20.(26A)16 =( )10
三、判断题
21.一个英文字符占用一个字节,一个中文汉字占用2个字节。( )
22.一个字节能够存储一个英文符号或者一个汉字。( )
23.原始信息称为明文,加密后的信息称为密文。( )
24.条码技术是在计算机应用和实践中产生并发展起来的一种自动识别技术,它将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。( )
25.声音和图像使用相同的编码方式。( )
四、操作题
26.近期chatgpt火爆,引发了小申对人工智能的浓厚学习兴趣。围绕人工智能的学习,请完成以下各题。
(1)以下应用了人工智能技术的场景是( )
A.使用诱导屏幕显示空余车位的数量 B.驾驶员通过指纹识别完成停车费用的支付
C.使用地磁传感器感知车位上车辆的存在 D.车辆入场时通过拍照识别车牌号码采集车牌信息
(2)对于计算机而言,无论字符、图像还是视频都是一串由'0'和'1'构成的序列。这是因为在计算机内部采用的是( )
A.二进制编码 B.十进制编码 C.十六进制编码 D.ASCII码
(3)如图所示,小申用第三方平台进行人脸标记的实验。“人脸标记.bmp”文件的大小是( )B。
A.351×245/8 B.351×245 C.351×245×24/8 D.351×245×24
(4)根据第三方平台返回的人脸定位信息画一个矩形框的代码如下所示:
draw.rectangle((left,top,left+width,top+height),outline=(255,127,63))
其中outline=(255,127,63)括号中的3个十制数依次对应三原色(Red,Green,Blue),用于指定边框线颜色。这3个十进制数用十六进制表示依次为:FF7F 。
(5)小申把“人脸标记.bmp”另存为jpeg格式,发现图像文件小了很多且质量有所损耗,但看起来图像没有很明显的变化。这是对图像进行了 【选填:无损压缩/有损压缩】;接着把“人脸标记.jpeg”又另存为bmp格式,图像质量 【选填:可以恢复/无法复原】
(6)目前的技术不仅让计算机具备有“视觉”,还有“听觉”。如图所示,这段音频时间是256秒,保存为WAV波形文件格式,那么这段声音文件的大小是( )KB。
A.44.1*1000*16*256/8/1024 B.44.1*1024*16*256/8/1024 C.44.1*1000*16*2*256/8/1024 D.44.1*1024*16*2*256/8/1024
(7)小申学习识别鸢尾花的人工智能算法时,利用150条带标记的数据拆分成训练集和测试集。这种数据带标记的机器学习是( )
A.专家系统 B.监督学习 C.非监督学习 D.半监督学习
(8)整理预测鸢尾花算法的步骤
①将最小值对应的鸢尾花类别判定为测试数据的分类
②将机器判定的分类与测试集中的标记分类进行对比,计算正确率
③计算每种鸢尾花的属性平均值
④计算测试数据与每种鸢尾花属性平均值之间的欧式距离的平方值,找到其中的最小值。
请将正确的流程步骤填写完整: → → →
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.A
【详解】本题考查字符编码相关内容。ASCII编码数字、字母是按顺序依次排列的,在计算机中存储时,占一个字节的空间。已知“o”的ASCII码是1101111,1101111-10=1101101,所以“m”的ASCII码是1101101,故本题答案是A选项。
2.A
【详解】本题主要考查字符编码。凯撒密码是一种替换加密的技术,明文中的所有字母都在字母表上向后(或向前)按照一个固定数目(密钥)进行偏移后被替换成密文 。故使用凯撒密码进行加密,其密钥为5,将明文“carefully”加密后,即每个字母向后移动5位,则密文为hfwjkzqqd,故本题选A选项。
3.B
【详解】本题考查模拟信号和数字信号。
将离散信号转换为连续变化信号的过程:这个说法是不正确的。模拟声音信号的数字化过程实际上是将连续信号转换为离散信号(包括时间和幅度上的离散),而不是将离散信号转换为连续信号。其它选项均正确,故正确答案为:选项B。
4.C
【详解】本题主要考查信息编码。只有“开”和“关”两种状态,如果包括6盏灯全关的状态,则最多能表示开关状态的编码数为2^6=64,故本题选C选项。
5.B
【详解】本题考查的是信息编码。n位二进制数可以表示:2n种状态,ASCII码是八位二进制,七位编码,共表示128个字符。选项B正确。
6.C
【详解】本题考查图像编码。
ASCII码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。GBK编码专门用来解决中文编码的。图像压缩属于图像编码。统一码,也叫万国码、单一码(Unicode)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。故本题选C选项
7.B
【详解】本题主要考查计算机信息编码。ASCII 字符编码表包含 128 个字符;4 位二进制能表示的最大十进制数是15;一个正整数的二进制数末尾增加一个“0”,这个数是原来数的 2 倍;网络爬虫、传感器都是常见的数据采集工具,故本题选B选项。
8.ACD
【详解】本题考查字符编码相关内容。CJK,是CJK Unified Ideographs的缩写,意思是“中日韩统一表意文字”,把分别来自中文、日文、韩文、越文中本质、意义相同、形状一样或稍异的表意文字赋予相同编码,其中主要为汉字,但也有仿汉字如日本国字、韩国独有汉字、越南的喃字等。这个字符集数量很大,大都可以使用汉字输入法直接输出,一般并不会通过查找Unicode码来显示,但其中包括一些偏旁部首、标点符号、特殊字符等,有时需要通过Unicode码来获取。故本题答案是:ACD。
9.C
【详解】本题主要考查进制数的转换。该二进制数末位数码对应权值是20;若该二进制数的首位为1,则n大于或等于4;若该二进制数的末位为1,则n一定为奇数,则n+1一定为偶数;若该二进制数为111,则n为7,首位去掉,所得的二进制数是11,对应十进制是3(不是n\2),故本题选C选项。
10.A
【详解】本题主要考查UltraEdit软件。有图可知,字符“!”的内码是“A3 A1”,占用两个字节;字符“2”的内码是“32”,转换为二进制为“110010”;字符“1”的内码是31,字符“0”的内码是30,则字符“10”的内码十六进制显示为“31 30”;上述字符“2021加油!”保存共占12B,故本题选A选项。
11.D
【详解】本题考查的是编码。某幅图像颜色总数为100种,那么需要2n>=100,即n>=7,故选D。
12.D
【详解】本题主要考查十六进制数。 十六进制数的第0位的权值为16的0次方,第1位的权值为16的1次方,第2位的权值为16的2次方…… ;十六进制数C代表12;十六进制、二进制数均是不同的表达方式,十六进制可表示的数值范围与二进制是一样的;每一位十六进制数对应4位二进制数,故本题选D选项。
13.B
【详解】本题考查数制相关内容。在计算机语言中常用的进制有二进制、八进制、十进制和十六进制,十进制是最主要的表达形式。二进制是一种使用两个基本符号(0和1)来表示数值的进制系统。八进制是一种使用八个基本符号(0-7)来表示数值的进制系统。十进制是一种使用十个基本符号(0-9)来表示数值的进制系统。十六进制是一种使用十六个基本符号(0-9和A-F)来表示数值的进制系统,其中,A-F代表十进制中的10-15。分析四个选项,B选项符合题目要求。故本题答案是B选项。
14.A
【详解】本题主要考查进制数的转换。十六进制数A5转换为十进制数是165(十六进制数可通过“按权展开、逐项相加”的方法转换为十进制),可知x是10,十进制85可通过“除8取余”的方法转换为八进制为125,故本题选A选项。
15.C
【详解】本题主要考查计算机信息编码。计算机中的数字信号常用有限位的二进制数表示。字长为2位的二进制数可以表示22=4种数字信号,故本题选C选项。
16. 15 0101 6
【详解】本题主要考查信息编码。(1)4位二进制编码表示的最大数是1111,通过“按权展开、逐项相加”的方法转换为十进制数是15。(2)如图编码盘箭头所指区域的编码是0001,若将轮盘顺时针旋转90°则箭头所指区域编码是0101。(3)图中每个代码用4位二进制表示,如果将该编码盘向外增加二圈,则需要6位二进制表示各块区域。
17.
【详解】本题考查进制运算和VB运算。(1)不同进制运算时,先将其转换为同一进制,ABH-1001B+39D-FH中,可以先将所有数字转换为十进制数。H代表十六进制,B代表二进制,D代表十进制。转换规则为,二进制数转换为十进制数二进制数第0位的权值是2的0次方,第1位的权值是2的1次方,以此类推,十六进制数转换为十进制数,16进制就是逢16进1,但我们只有0~9这十个数字,所以我们用A,B,C,D,E,F这六个字母来分别表示10,11,12,13,14,15。字母不区分大小写。十六进制数的第0位的权值为16的0次方,第1位的权值为16的1次方,第2位的权值为16的2次方,以此类推。所以,在第N(N从0开始)位上,如果是是数 X (X 大于等于0,并且X小于等于 15,即:F)表示的大小为 X * 16的N次方。ABH转为十进制是171,1001B转为十进制是9,FH转为十进制是15,运算得到十进制结果是186,再将其转为二进制。十进制转二进制,对于整数部分,用被除数反复除以2,除第一次外,每次除以2均取前一次商的整数部分作被除数并依次记下每次的余数。另外,所得到的商的最后一位余数是所求二进制数的最高位。故得到结果为10111010。(2)INT()函数,是VB数值函数的一种,是将一个要取整的实数(可以为数学表达式)向下取整为最接近的整数。利用INT函数可以返回一个小数的整数,如4.323,返回4,它不是四舍五入,而是舍尾法,即使4.987,也是返回4,而不是5。mod是取余数运算,\是取整数运算,^是乘幂,*是称号, -是取负。根据优先级,Int (-26.5) mod -15\6-9mod 2^2*5/2,先得到2^2*5/2=10,表达式变为Int (-26.5) mod -15\6-9mod 10,接着再运算-15\6,得到-2,表达式变为Int (-26.5) mod -2-9mod 10,最后继续运算得到结果,Int (-26.5) mod -2-9=-10。最后的结果为-10。
18.国标码
【详解】本题主要考查字符编码。汉字编码中,国标码的主要用途是作为汉字信息交换码使用,使不同系统之间的汉字信息进行相互交换。
19.101
【详解】本题主要考查进制数的转换。十进制数5可通过“除权取余”的方法转换为二进制数101。
20.618
【详解】本题考查的是进制数转换。将 n(任意整数)进制数转换为十进制数都可采用“按权展开、逐项相加”的方法。十六进制数:26A转换为十进制数为:10+6*16+2*16^2=618
21.正确
【详解】本题主要考查字符编码。一个英文字符占用一个字节,一个中文汉字占用2个字节,表述正确。
22.错误
【详解】本题考查编码。
一个汉字的存储至少需要两个字节。故题目说法错误。
23.正确
【详解】本题主要考查信息编码。原始信息称为明文,加密后的信息称为密文,表述正确。
24.正确
【详解】本题主要考查信息编码。条码技术是在计算机应用和实践中产生并发展起来的一种自动识别技术,它将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符,表述正确。
25.正确
【详解】本题主要考查信息编码。多媒体声音和图像是通过二进制数的形式进行存储和编码的,转化为二进制数形式的过程叫做信息的数字化或者信息的编码。故表述正确。
26. D A C 3F 有损压缩 无法复原 C B ③ ① ④ ②
【详解】本题考查人工智能技术、编码、图像与音频数字化。
(1)这个场景利用了图像识别技术,通过拍照识别车牌号码来自动采集车辆信息,属于人工智能在图像识别领域的应用。故答案为:D。
(2)计算机内部使用二进制编码,即由0和1组成的序列来表示数据和指令。故答案为:A。
(3)BMP图像文件大小的计算公式为图像宽度×图像高度×每像素的位数/8。对于本题中的24位色深(每像素RGB各8位),计算结果为351×245×24/8。故答案为:C。
(4)将每个十进制数转换为十六进制时,255对应FF,127对应7F,63对应3F。因此,完整的十六进制表示为FF7F3F。故答案为:3F。
(5)JPEG格式是有损压缩,它通过去除图像中的细节和冗余信息来减小文件大小,因此会导致图像质量的损失。当将JPEG图像再转为BMP格式时,由于损失的信息无法恢复,所以图像质量无法完全复原。故答案为:有损压缩、无法复原。
(6)WAV格式中音频文件大小的计算公式为:音频采样率×量化位数×声道数×时间长度/8/1024。根据题目给出的条件,采样率为44.1kHz,量化位数为16位,声道数为2(立体声),时间长度为256秒,代入计算得出文件大小为44.1*1000*16*2*256/8/1024KB。故答案为:C。
(7)监督学习是利用带有标记(标签)的数据作为训练样本,通过训练模型学习数据的规律,然后对未知数据进行预测和分类的机器学习方法。在这个情景下,使用带标记数据集进行训练集和测试集的拆分,属于监督学习的范畴。故答案为:B。
(8)③计算每种鸢尾花的属性平均值:首先计算每种鸢尾花的属性平均值作为分类依据。①将最小值对应的鸢尾花类别判定为测试数据的分类:根据距离最小的属性平均值确定测试数据的分类。④计算测试数据与每种鸢尾花属性平均值之间的欧式距离的平方值:用于衡量测试数据与各类别的相似度。②将机器判定的分类与测试集中的标记分类进行对比,计算正确率:最后验证机器学习模型的准确性。这些步骤组成了一个典型的监督学习算法的预测流程,用于识别和分类鸢尾花。故答案为:③①④②。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$