内容正文:
绝密※启用前
阿坝州2025春季高2027届期末质量检测
信息技术试题
本试卷满分100分,考试时间45分钟。
注意事项:
1.答题前, 务必将自己的姓名、准考证号填写在答题卡规定的位置上。
2.答选择题时,必须使用2B铅笔填涂对应题目的答案标号,如需改动,用橡皮擦擦干净后,再选涂其他答案标号。
3.答非选择题时,必须使用0.5毫米黑色签字笔,将答案书写在答题卡规定的位置上。
4.所有题目必须在答题卡上作答,在试题卷上答题无效。
5.考试结束后, 只将答题卡交回。
一、判断:本题共10小题,每小题3分,共30分。
1. 数据分析的目的是从数据中发现规律和趋势,为决策提供支持。( )
2. 当宝宝大声哭泣,智能床铃就开始播放音乐,应用了智能语音技术。( )
3. 数据是现实世界客观事物的符号记录,是信息的载体,不能用计算机进行加工。( )
4. 在Python中,if语句后的条件必须使用括号括起来。( )
5. 在Python语言中,range(4,9)中元素个数是4个。( )
6. 算术运算符中*、/的运算优先级高于//和%。( )
7. 算法有至少有一个输入,不一定有输出。( )
8. 用户自定义函数通过return语句只能返回一个数值。( )
9. 需求分析之后、程序设计之前,需要对系统进行总体设计和详细设计。总体设计就是在需求分析的基础上对模型细化、分解任务,明确程序由哪些模块组成。 ( )
10. 词云可以使得难以实现结构化的数据文本挖掘成为轻而易举的事情。( )
二、选择:本题共18小题,每小题2.5分,共45分。
11. 通过列举所有的可能进行密码破解,用到的算法是( )
A. 递推 B. 递归 C. 穷举 D. 分治
12. 聚类分析K-平均算法中,初始聚集中心的选择方式是什么?( )
A. 随机选择 B. 按照数据的分布规律选择
C. 根据数据的类型选择 D. 通过算法自动确定
13. 以下哪个选项是Python中print函数中指定字符串结束符为换行符的正确用法?( )
A. print("Hello,World!",end=';') B. print("Hello,World!",end='
')
C. print"Hello,World!"(不使用括号) D. print("Hello,World!",end=',')
14. 程序以( )代码的形式存放在存储器中,并采用( )作为数字计算机的数制基础。
A. 二进制 十进制 B. 二进制 二进制
C. 二进制 八进制 D. 二进制 十六进制
15. 华为Meta ERP是一款集成化的企业管理软件系统。它将企业的所有业务流程数字化,从采购、生产、销售到客户服务,实现端到端的全流程数字化管理,通过大数据、人工智能等技术,可为企业提供数据分析和预测,帮助企业实现智能化决策。下列关于大数据和人工智能的说法,正确的是( )
A. 该系统采用大数据技术,必须保证所有数据的准确性
B 该系统采用批处理计算对实时数据进行实时分析与计算
C. 该系统通过模仿人类大脑中神经元之间的复杂交互来进行认知推理,属于符号主义人工智能
D. 人工智能辅助企业进行智能化决策,属于混合增强人工智能
16. 智能搜索的核心是什么?( )
A. 算法 B. 数据 C. 模型 D. 状态空间
17. 下面关于用算法来解决问题的4个步骤,正确的顺序为( )。
①建立数学模型;②设计算法;③分析问题;④描述算法。
A. ①②③④ B. ③②①④ C. ①③②④ D. ③①②④
18. 以下程序是利用二分查找列表中数字14,程序运行结果是( )。
left=0
right=12
Is=[7,14,18,21,23,29,31,35,38,42,46,49,52] #列表索引号从0开始
x=14
step=0
while left<= right:
step= step+1
mid= (left+right)//2
if Is[mid]>x:
right= mid-1
elif Is[mid]<x:
left=mid+1
else:
break
print("查了",step,"次")
A. 查了3次 B. 查了4次 C. 查了5次 D. 查了6次
19. 某流程图如图所示。执行完该流程图后,以下各组数值中可能是a的值是( )
A. 123456 B. 902264 C. 987654 D. 222444
20. 下列属于大数据对日常生活负面影响的是( )
A. 方便支付 B. 信息泄露 C. 智慧出行 D. 远程看病
21. 多态允许( )
A. 一个类有多种继承 B. 一种接口,多种实现
C. 使用基类指针操作派生类对象 D. 方法的参数有多种类型
22. 如下图,这是算法的( )描述方法。
A. 流程图 B. 自然语言 C. 伪代码 D. 程序
23. 用计算机程序解决问题的基本过程是( )
A. 明确任务→建立表格→分析数据→形成报告
B. 确定主题→收集与选择素材→规划与设计→制作集成→评价修改
C. 需求分析→规划与设计→素材的采集与加工→作品集成→发布与评价
D. 分析问题→设计算法→编写程序→调试运行→检测结果
24. 十六进制数78的二进制编码是( )
A. 1101000 B. 1010100 C. 11101010 D. 1111000
25. 关于模拟信号和数字信号,下列说法错误是( )
A. 按照取值特征,可以将信号分为模拟信号和数字信号
B. 用传感器直接获得的信号一般为模拟信号
C. 模拟信号的值是随时间连续变化的,波形光滑,数字信号随时间的变化是非连续的
D. 用不同数字的组合表示的信号叫做数字信号
26. 与普通数据分析相比,大数据分析的特征主要体现在( )
A 数据量巨大 B. 分布式处理 C. 可视化表现 D. 更偏向于决策
27. 关于大数据采集技术,哪项描述是错误的?( )
A. 大数据采集主要依赖于传感器和网络系统
B. 在大数据环境下,数据的多样性和实时性尤为重要
C. 大数据采集仅适用于小规模的研究项目
D. 分布式计算在大数据采集和处理过程中扮演着重要角色
28. 有如下 Python程序段:
s=''AB18/31C5/D269/E7''
k=3
sum, j,c=0,0,0
flag=False
for ch in s:
if "0"<=ch<="9":
c=c*10+int(ch)
j+=1
elif ''A''<=ch<=''Z'':
flag=True
else:
if j==k and flag:
sum+=c
flag=False
j=0;c=0
程序运行后,sum的值是( )
A. 269 B. 330 C. 584 D. 609
三、操作:本题共3小题,共44分。
29. 小张对 2022 年结束的卡塔尔世界杯很感兴趣,收集了世界杯射手榜的部分数据存储在“世界杯射手榜.xlsx”文件中,如图 a 所示。
图 a
(1)通常对于收集到的数据需要先进行整理,以下关于数据整理的说法正确的有________(多选,填字母)。
A. 对于缺失的数据,最简单的处理方法是采用随机数来填充缺失值
B. 不同来源的数据可能存在格式不一致的情况,需要进行数据转换以便后续分析
C. 对于重复数据,可以在进一步审核的基础上进行合并或删除等处理
D. 异常数据一定就是要去掉的噪声,不包含任何重要信息
(2)要统计出进球数最多的三个国家并绘制如图 b 所示的图,请在画线处填入合适的代码。
图 b
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] # 正常显示中文字体
pd.set_option('display.unicode.east_asian_width',True) # 中英文对齐
df=pd.read_excel("世界杯射手榜.xlsx")
g=df.groupby("球队"). ①
g_sort= ②
x= ③
y=g_sort.进球[0:3]
plt.bar(x,y,label="球队进球数")
plt.title("进球个数最多的前三个国家")
plt.legend()
plt.show()
①___________________________
②___________________________
③___________________________
30. 数字0~9的盲文分别由3行*2列的点阵表示,若计算机中存储每个数字盲文由6位0、1字符序列构成.如图a所示,数字2用“101000”表示。
图a 图b
为解决一行数字盲文的识别问题,小华将多个数字盲文构成的图像转化为0、1序列分三行存入计算机。例如数字“6810”组成的点阵如图b所示,其第一行可用字符串“11101001”存储.编写程序实现读取三行字符串,输出其所代表数字。请回答下列问题:
(1)如图b所示的盲文,第二行0、1序列的字符串为____。
(2)将三行字符串存入变量data,若data=["0110","1100","0000"],则数字盲文为____个。
(3)实现上述功能的部分Python程序如下,请在划线处填入合适的代码。
d=["011100","100000","101000","110000","110100","100100","111000","111100","101100","011000"]
#读取n个数字盲文的三行字符串,保存在列表变量data中,代码略
n=len(data[0])//2
ans=""
for i in range(①____):
s=""
for j in range(3):
s=s+data[j][2*i]+②____
for k in range(len(d)):
if ③____:
ans+=str(k)
print(ans)
31. 某校使用智慧食堂系统实现从选餐到支付的智能化管理。食堂在盛菜碗碟中植入电子标签,并在系统中设定每个电子标签对应的菜品信息。师生将选好菜品的餐盘放在结算台的指定区域内,系统自动读取电子标签信息,结账软件快速完成餐品金额计算,系统支持刷脸、校园一卡通支付。各窗口结算台的数据传输至Web服务器,存储于数据库。
(1)该系统读取电子标签信息过程中,所使用的技术是______(单选,填字母)。
A.网络技术 B.射频识别 C.人工智能 D.红外线扫描
(2)下列关于该系统中数据管理的说法,正确的是______(单选,填字母)。
A.数据无法从服务器端传输至结算台 B.该系统的数据和程序都应存储在结算台中
C.查看学生消费历史数据需要访问数据库 D.餐品金额的计算只能在服务器端完成
(3)数据安全措施合理的是______(多选,填字母)。
A.人脸数据加密存储 B.只保存当天的消费记录
C.定时自动备份交易日志 D.非营业时段关闭防火墙
(4)该系统服务器端程序采用Flask Web框架编写,结算台的IP地址是192.168.10.200,端口号为5050,服务器的IP地址是192.168.10.10,端口号为8080,网站功能页面规划,如下表所示:
序号
访问地址
功能说明
1
/
主页
2
/room
餐厅管理
3
/class
菜品管理
4
/input?id=20230101&money=8
提交学生卡号和消费金额
5
……
……
若要进行餐厅管理,可在相应的子页面中进行操作,则访问该子页面的地址是http://______。
(5)将系统中9月的数据导出到文件data.xlsx中,部分数据如图a所示。现要由高到低输出三个食堂午餐消费总额(如图b所示)。
实现上述功能的部分Python程序如下:
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_excel("data.xlsx")
df1= ①
df1= ②
df2= ③
print(df2)
①②③处应填入的语句依次为______(选3项,填字母序列)
A.df1.groupby("食堂名称",as_index=False)["消费金额"].sum() #分组求和
B.df1.groupby("食堂名称",as_index=False)["消费金额"].count()
C.df.sort_values("消费金额",ascending=False) #降序排序
D.df1.sort_values("消费金额",ascending=False)
Edf[df["消费类型"]=="午餐"] #筛选
F.df1[df1.消费类型=="午餐"]
第1页/共1页
学科网(北京)股份有限公司
$
绝密※启用前
阿坝州2025春季高2027届期末质量检测
信息技术试题
本试卷满分100分,考试时间45分钟。
注意事项:
1.答题前, 务必将自己的姓名、准考证号填写在答题卡规定的位置上。
2.答选择题时,必须使用2B铅笔填涂对应题目的答案标号,如需改动,用橡皮擦擦干净后,再选涂其他答案标号。
3.答非选择题时,必须使用0.5毫米黑色签字笔,将答案书写在答题卡规定的位置上。
4.所有题目必须在答题卡上作答,在试题卷上答题无效。
5.考试结束后, 只将答题卡交回。
一、判断:本题共10小题,每小题3分,共30分。
1. 数据分析的目的是从数据中发现规律和趋势,为决策提供支持。( )
【答案】正确
【解析】
【详解】本题考查数据分析。数据分析的主要目的确实是从大量、多样和复杂的数据中挖掘出有意义的规律和趋势,从而为各种决策提供有力支持。数据分析师需要使用各种技术和工具,如数据挖掘、统计建模、机器学习、数据可视化等,来处理和分析数据。同时,他们还需要具备强大的业务洞察力、沟通能力和团队协作精神,以便将数据分析结果转化为有价值的商业见解。故题干说法正确。
2. 当宝宝大声哭泣,智能床铃就开始播放音乐,应用了智能语音技术。( )
【答案】错误
【解析】
【详解】本题考查人工智能。智能语音技术主要涉及语音识别(将语音转换为文本)、语音合成(将文本转换为语音)等技术。在题目所描述的场景中,智能床铃是根据宝宝的哭声这个声音信号来触发音乐播放,没有涉及对语音内容的识别、理解和合成等语音技术相关环节。它可能是利用了声音传感器来检测声音的强度或频率等物理特征,当这些特征达到一定阈值(宝宝大声哭泣)时,就启动音乐播放功能,和智能语音技术并无关联。
3. 数据是现实世界客观事物的符号记录,是信息的载体,不能用计算机进行加工。( )
【答案】×
【解析】
【详解】本题考查数据,信息的特征相关知识。数据是现实世界客观事物的符号记录,是信息的载体,也可以用计算机进行加工,故题干描述有误。
4. 在Python中,if语句后的条件必须使用括号括起来。( )
【答案】错误
【解析】
【详解】本题考查Python分支结构相关内容。在Python中,if语句后的条件并不需要使用括号括起来,虽然加上括号在某些情况下(比如条件表达式比较复杂时)可能会让代码看起来更清晰一些,但并不是必须的。故本题答案是:错误。
5. 在Python语言中,range(4,9)中元素的个数是4个。( )
【答案】错误
【解析】
【详解】本题考查Python函数的应用。range(start, stop, [step]),start:计数从 start 开始。默认是从 0 开始。例如range(5)等价于range(0, 5);stop:计数到 stop 结束,但不包括 stop。例如:range(0, 5) 是[0, 1, 2, 3, 4]没有5;step:步长,默认为1。例如:range(0, 5) 等价于 range(0, 5, 1)。故使用函数range(4,9)返回的整数序列是4,5,6,7,8。题干说法错误。
6. 算术运算符中*、/的运算优先级高于//和%。( )
【答案】错误
【解析】
【详解】本题考查的是Python算术符。在Python中算术运算符*、/、//和%运算优先级一样,故题干中的说法是错误的。
7. 算法有至少有一个输入,不一定有输出。( )
【答案】错
【解析】
【详解】本题考查的是算法特征。算法的五大特征:有穷性、确定性、能行性(可行性)、有 0 个或多个输入、有一个或多个输出。故题干中的说法是错误的。
8. 用户自定义函数通过return语句只能返回一个数值。( )
【答案】错误
【解析】
【详解】本题考查的是Python的自定义函数。用户自定义函数通过return语句可以返回多个数值。故题干中的说法是错误的。
9. 需求分析之后、程序设计之前,需要对系统进行总体设计和详细设计。总体设计就是在需求分析的基础上对模型细化、分解任务,明确程序由哪些模块组成。 ( )
【答案】对
【解析】
【详解】本题考查的是程序设计。需求分析之后、程序设计之前,需要对系统进行总体设计和详细设计。总体设计就是在需求分析的基础上对模型细化、分解任务,明确程序由哪些模块组成。题干说法正确。
10. 词云可以使得难以实现结构化的数据文本挖掘成为轻而易举的事情。( )
【答案】错误
【解析】
【分析】
【详解】本题考查的是词云知识点。词云可以使得难以实现非结构化的数据文本挖掘成为轻而易举的事情。
结构化数据,是高度组织和整齐格式化的数据。它是可以放入表格和电子表格中的数据类型。它可能不是人们最容易找到的数据类型,但与非结构化数据相比,无疑是两者中人们更容易使用的数据类型。
非结构化数据,本质上是结构化数据之外的一切数据。它可能是文本的或非文本的,也可能是人为的或机器生成的。非结构化数据不是那么容易组织或格式化的。收集,处理和分析非结构化数据也是一项重大挑战。
二、选择:本题共18小题,每小题2.5分,共45分。
11. 通过列举所有的可能进行密码破解,用到的算法是( )
A. 递推 B. 递归 C. 穷举 D. 分治
【答案】C
【解析】
【详解】本题考查算法相关内容。递推是通过计算前面的一些项来得出序列中的指定项的值。递归算法(recursion algorithm)在计算机科学中是指一种通过重复将问题分解为同类的子问题而解决问题的方法。穷举法的基本思想是根据题目的部分条件确定答案的大致范围,并在此范围内对所有可能的情况逐一验证,直到全部情况验证完毕。分治法就是将一个复杂的大问题分解成两个或者更多相同或者相似的子问题,再把子问题继续拆分成更小的子问题,直到子问题可以直接求解,然后原问题的解就是子问题的解的合并。通过列举所有的可能进行密码破解,用到的算法是穷举。故本题答案是C选项。
12. 聚类分析K-平均算法中,初始聚集中心的选择方式是什么?( )
A. 随机选择 B. 按照数据的分布规律选择
C. 根据数据的类型选择 D. 通过算法自动确定
【答案】A
【解析】
【详解】本题考查数据分析。K-平均算法中,初始聚集中心的选择是随机的,从数据点集合中选择K个点作为初始的聚集中心。故选A。
13. 以下哪个选项是Python中print函数中指定字符串结束符为换行符的正确用法?( )
A. print("Hello,World!",end=';') B. print("Hello,World!",end='
')
C. print"Hello,World!"(不使用括号) D. print("Hello,World!",end=',')
【答案】B
【解析】
【详解】本题考查Python输出函数。在Python中,print() 函数需要使用括号,并且end='
'是指定字符串结束符为换行符的正确用法。故选B。
14. 程序以( )代码的形式存放在存储器中,并采用( )作为数字计算机的数制基础。
A. 二进制 十进制 B. 二进制 二进制
C. 二进制 八进制 D. 二进制 十六进制
【答案】B
【解析】
【详解】本题考查的是计算机程序。计算机程序以二进制代码形式存放在存储器中,并采用二进制作为数字计算机的数制基础。这是因为二进制系统简单可靠,仅使用0和1两种状态,适合计算机的电路实现和逻辑设计。故选B。
15. 华为Meta ERP是一款集成化的企业管理软件系统。它将企业的所有业务流程数字化,从采购、生产、销售到客户服务,实现端到端的全流程数字化管理,通过大数据、人工智能等技术,可为企业提供数据分析和预测,帮助企业实现智能化决策。下列关于大数据和人工智能的说法,正确的是( )
A. 该系统采用大数据技术,必须保证所有数据的准确性
B. 该系统采用批处理计算对实时数据进行实时分析与计算
C. 该系统通过模仿人类大脑中神经元之间的复杂交互来进行认知推理,属于符号主义人工智能
D. 人工智能辅助企业进行智能化决策,属于混合增强人工智能
【答案】D
【解析】
【详解】本题考查大数据与人工智能。大数据技术不一定要求所有数据的准确性,更多关注的是数据的多样性和规模,A选项错误。批处理计算通常用于非实时数据处理,而实时数据分析与计算需要流处理技术,B选项错误。通过模仿人类大脑中神经元之间的复杂交互进行认知推理属于联结主义人工智能,而非符号主义人工智能,C选项错误。人工智能辅助企业进行智能化决策,结合了大数据分析和机器学习,属于混合增强人工智能,D选项正确。故答案为:D。
16. 智能搜索的核心是什么?( )
A. 算法 B. 数据 C. 模型 D. 状态空间
【答案】D
【解析】
【详解】本题考查智能搜索的描述。智能搜索的核心是状态空间,它用于表示问题的所有可能状态和状态之间的转换关系。故选D。
17. 下面关于用算法来解决问题的4个步骤,正确的顺序为( )。
①建立数学模型;②设计算法;③分析问题;④描述算法。
A. ①②③④ B. ③②①④ C. ①③②④ D. ③①②④
【答案】D
【解析】
【分析】
【详解】本题主要考查算法解决问题步骤。用算法解决问题步骤一般为③分析问题;①建立数学模型;②设计算法;④描述算法。因此D选项正确。
【点睛】
18. 以下程序是利用二分查找列表中数字14,程序运行结果是( )。
left=0
right=12
Is=[7,14,18,21,23,29,31,35,38,42,46,49,52] #列表索引号从0开始
x=14
step=0
while left<= right:
step= step+1
mid= (left+right)//2
if Is[mid]>x:
right= mid-1
elif Is[mid]<x:
left=mid+1
else:
break
print("查了",step,"次")
A. 查了3次 B. 查了4次 C. 查了5次 D. 查了6次
【答案】B
【解析】
【详解】本题主要考查二分查找及Python程序实现。分析程序可知,查找过程分别是:31、18、7、14,故查找了4次,故本题选B选项。
19. 某流程图如图所示。执行完该流程图后,以下各组数值中可能是a的值是( )
A. 123456 B. 902264 C. 987654 D. 222444
【答案】A
【解析】
【分析】
【详解】本题主要考查算法流程图执行。变量a赋值为1-10之间随机整数,因此B选项错误;单数次输出时,直接输出a,偶数次输出时,需要判断a是否大于了,成立时,方可输出,因此CD选项错误。
【点睛】
20. 下列属于大数据对日常生活负面影响的是( )
A. 方便支付 B. 信息泄露 C. 智慧出行 D. 远程看病
【答案】B
【解析】
【详解】本题考查的是大数据影响。方便支付、智慧出行、远程看病是大数据对日常生活积极影响,信息泄露是大数据对日常生活负面影响。故选B。
21. 多态允许( )
A. 一个类有多种继承 B. 一种接口,多种实现
C. 使用基类指针操作派生类对象 D. 方法的参数有多种类型
【答案】C
【解析】
【详解】本题考查面向对象编程。 使用基类指针操作派生类对象:这是指针多态的体现,通过基类指针可以指向派生类对象。故选C。
22. 如下图,这是算法的( )描述方法。
A. 流程图 B. 自然语言 C. 伪代码 D. 程序
【答案】C
【解析】
【详解】本题主要考查算法的描述方法。伪代码(Pseudocode)是一种非正式的,类似于英语结构的,用于描述模块结构图的语言。由图可知,这是算法的伪代码描述方法,故本题选C选项。
23. 用计算机程序解决问题的基本过程是( )
A. 明确任务→建立表格→分析数据→形成报告
B. 确定主题→收集与选择素材→规划与设计→制作集成→评价修改
C. 需求分析→规划与设计→素材的采集与加工→作品集成→发布与评价
D. 分析问题→设计算法→编写程序→调试运行→检测结果
【答案】D
【解析】
【详解】本题考查是计算机解决问题的一般过程。用计算机程序解决问题的基本过程:分析问题→设计算法→编写程序→调试运行→检测结果。故本题应选D。
24. 十六进制数78的二进制编码是( )
A 1101000 B. 1010100 C. 11101010 D. 1111000
【答案】D
【解析】
【详解】本题主要考查进制数的转换。十六进制数二进制数之间的转换:一个十六进制数分成四个二进制数;用四位二进制按权相加,最后得到一位十六进制。故十六进制数78,对应的二进制数是1111000。故本题应选D。
25. 关于模拟信号和数字信号,下列说法错误的是( )
A. 按照取值特征,可以将信号分为模拟信号和数字信号
B. 用传感器直接获得的信号一般为模拟信号
C. 模拟信号的值是随时间连续变化的,波形光滑,数字信号随时间的变化是非连续的
D. 用不同数字的组合表示的信号叫做数字信号
【答案】D
【解析】
【详解】本题考查模拟信号和数字信号的描述。数字信号指自变量是离散的、因变量也是离散的信号,这种信号的自变量用整数表示,因变量用有限数字中的一个数字来表示。数字信号不是简单的数字组合。故选D。
26. 与普通数据分析相比,大数据分析的特征主要体现在( )
A. 数据量巨大 B. 分布式处理 C. 可视化表现 D. 更偏向于决策
【答案】B
【解析】
【详解】本题考查的是大数据数据分析。由于大数据量巨大,无法在单一的计算机设备上进行处理,所以常采用分布式计算架构(如 Hadoop 等),将数据分散在多个节点进行处理。普通数据分析一般在单机或小规模集群即可完成,分布式处理是大数据分析适应其数据特点的典型特征。故选B。
27. 关于大数据采集技术,哪项描述是错误的?( )
A. 大数据采集主要依赖于传感器和网络系统
B. 在大数据环境下,数据的多样性和实时性尤为重要
C. 大数据采集仅适用于小规模的研究项目
D. 分布式计算在大数据采集和处理过程中扮演着重要角色
【答案】C
【解析】
【详解】本题考查大数据采集技术。A 选项正确,大数据采集依赖多种技术,传感器用于物理世界数据(如物联网),网络系统(如网络爬虫、API 接口)用于获取网络数据,是主要采集途径。B 选项正确,大数据的多样性(Variety)指数据类型多样(结构化、非结构化等),实时性(Velocity)指需处理高速生成的数据,均为大数据环境的核心要求。C 选项错误,大数据采集技术专为大规模、高复杂度数据设计(如 PB 级数据),适用于大规模研究项目或企业级应用。D 选项正确,分布式计算(如 Hadoop、Spark)通过集群处理海量数据,在采集(如分布式日志收集)和处理阶段均为关键技术。 因此,本题选择 C 选项。
28. 有如下 Python程序段:
s=''AB18/31C5/D269/E7''
k=3
sum, j,c=0,0,0
flag=False
for ch in s:
if "0"<=ch<="9":
c=c*10+int(ch)
j+=1
elif ''A''<=ch<=''Z'':
flag=True
else:
if j==k and flag:
sum+=c
flag=False
j=0;c=0
程序运行后,sum的值是( )
A. 269 B. 330 C. 584 D. 609
【答案】C
【解析】
【详解】本题考查的是Python程序调试与运行。阅读程序可知,逐个读取字符串中的字符,如果是数字则转换为数值类型;如果是大写字母,则标志位flag为真;如果不是大写字母也不是数字且标志位flag为真同时是三位数字,则将数字累加到sum,标志位flag为假,数字及个数初始为0。s=“AB18/31C5/D269/E7”,
读取到第一个“/”时,由于数字不满足三个标志位flag为假,数字及个数初始为0;
读取到第二个“/”时,由于数字为315满足三个,标志位flag为真(读取大写字母C),则将数字累加到sum=315;
读取到第三个个“/”时,由于数字为269满足三个,标志位flag为真(读取大写字母D),则将数字累加到sum=315+269=584。
后续数字不会满足三个,不会累加sum,故选C。
三、操作:本题共3小题,共44分。
29. 小张对 2022 年结束的卡塔尔世界杯很感兴趣,收集了世界杯射手榜的部分数据存储在“世界杯射手榜.xlsx”文件中,如图 a 所示。
图 a
(1)通常对于收集到的数据需要先进行整理,以下关于数据整理的说法正确的有________(多选,填字母)。
A. 对于缺失的数据,最简单的处理方法是采用随机数来填充缺失值
B. 不同来源的数据可能存在格式不一致的情况,需要进行数据转换以便后续分析
C. 对于重复数据,可以在进一步审核的基础上进行合并或删除等处理
D. 异常数据一定就是要去掉的噪声,不包含任何重要信息
(2)要统计出进球数最多的三个国家并绘制如图 b 所示的图,请在画线处填入合适的代码。
图 b
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] # 正常显示中文字体
pd.set_option('display.unicode.east_asian_width',True) # 中英文对齐
df=pd.read_excel("世界杯射手榜.xlsx")
g=df.groupby("球队"). ①
g_sort= ②
x= ③
y=g_sort.进球[0:3]
plt.bar(x,y,label="球队进球数")
plt.title("进球个数最多的前三个国家")
plt.legend()
plt.show()
①___________________________
②___________________________
③___________________________
【答案】 ①. BC ②. sum() ③. g.sort_values("进球",ascending=False) ④. g_sort.index[0:3](或 g_sort[0:3].index 或 g_sort.head(3).index)
【解析】
【详解】本题考查程序分析。
(1)对于缺失的数据,较好的方法是根据数据间的关联性估计较准确的缺失值,通过合适的方法对缺失值进行填充,不能采用随机数来填充缺失值;异常数据可能是要去掉的噪声,也可能是含有重要信息的数据对象。故正确答案为:BC。(2)要求统计出进球数最多的三个国家,故①空需先按球队进行分组然后利用 sum()进行各个国家进球数的求和。故正确答案为:sum()。
②空由图可知,需要根据进球数进行降序排序。故正确答案为:g.sort_values("进球",ascending=False)。
③空根据整理完的结果进行垂直柱形图的绘制,x表示进球数最多的三个国家。故正确答案为:g_sort.index[0:3](或 g_sort[0:3].index 或 g_sort.head(3).index)。
30. 数字0~9的盲文分别由3行*2列的点阵表示,若计算机中存储每个数字盲文由6位0、1字符序列构成.如图a所示,数字2用“101000”表示。
图a 图b
为解决一行数字盲文识别问题,小华将多个数字盲文构成的图像转化为0、1序列分三行存入计算机。例如数字“6810”组成的点阵如图b所示,其第一行可用字符串“11101001”存储.编写程序实现读取三行字符串,输出其所代表数字。请回答下列问题:
(1)如图b所示的盲文,第二行0、1序列的字符串为____。
(2)将三行字符串存入变量data,若data=["0110","1100","0000"],则数字盲文为____个。
(3)实现上述功能的部分Python程序如下,请在划线处填入合适的代码。
d=["011100","100000","101000","110000","110100","100100","111000","111100","101100","011000"]
#读取n个数字盲文的三行字符串,保存在列表变量data中,代码略
n=len(data[0])//2
ans=""
for i in range(①____):
s=""
for j in range(3):
s=s+data[j][2*i]+②____
for k in range(len(d)):
if ③____:
ans+=str(k)
print(ans)
【答案】 ①. 10110011 ②. 2 ③. n ④. data[j][2*i+1] ⑤. s==d[k]
【解析】
【详解】本题考查的是Python综合应用。
(1)数字2用“101000”,可知黑点表示1,没黑点表示0,故图b所示的盲文,第二行0、1序列的字符串为:10110011。
(2)若data=["0110","1100","0000"],则由三行四列,每个数字是3行*2列的点阵表示,故其数字盲文为2个。
(3)①处,每个数字是3行*2列点阵表示,由n=len(data[0])//2,可知n表示数字个数,逐个将数字读取出来,故此处应为:n;②处,j表示行数,s表示盲文6位二进制数,6位二进制数是从左到右,从上到下组成,故此处应为:data[j][2*i+1];③处,d列表中的元素是盲文的二进制数,索引为代码的数字,如果读取出来的盲文的二进制数s与d[k]相等,则k即为对应的数字,故此处应为:s==d[k]。
31. 某校使用智慧食堂系统实现从选餐到支付的智能化管理。食堂在盛菜碗碟中植入电子标签,并在系统中设定每个电子标签对应的菜品信息。师生将选好菜品的餐盘放在结算台的指定区域内,系统自动读取电子标签信息,结账软件快速完成餐品金额计算,系统支持刷脸、校园一卡通支付。各窗口结算台的数据传输至Web服务器,存储于数据库。
(1)该系统读取电子标签信息过程中,所使用的技术是______(单选,填字母)。
A.网络技术 B.射频识别 C.人工智能 D.红外线扫描
(2)下列关于该系统中数据管理的说法,正确的是______(单选,填字母)。
A.数据无法从服务器端传输至结算台 B.该系统的数据和程序都应存储在结算台中
C.查看学生消费历史数据需要访问数据库 D.餐品金额的计算只能在服务器端完成
(3)数据安全措施合理的是______(多选,填字母)。
A.人脸数据加密存储 B.只保存当天的消费记录
C.定时自动备份交易日志 D.非营业时段关闭防火墙
(4)该系统服务器端程序采用Flask Web框架编写,结算台的IP地址是192.168.10.200,端口号为5050,服务器的IP地址是192.168.10.10,端口号为8080,网站功能页面规划,如下表所示:
序号
访问地址
功能说明
1
/
主页
2
/room
餐厅管理
3
/class
菜品管理
4
/input?id=20230101&money=8
提交学生卡号和消费金额
5
……
……
若要进行餐厅管理,可在相应的子页面中进行操作,则访问该子页面的地址是http://______。
(5)将系统中9月的数据导出到文件data.xlsx中,部分数据如图a所示。现要由高到低输出三个食堂午餐消费总额(如图b所示)。
实现上述功能的部分Python程序如下:
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_excel("data.xlsx")
df1= ①
df1= ②
df2= ③
print(df2)
①②③处应填入的语句依次为______(选3项,填字母序列)
A.df1.groupby("食堂名称",as_index=False)["消费金额"].sum() #分组求和
B.df1.groupby("食堂名称",as_index=False)["消费金额"].count()
C.df.sort_values("消费金额",ascending=False) #降序排序
D.df1.sort_values("消费金额",ascending=False)
E.df[df["消费类型"]=="午餐"] #筛选
F.df1[df1.消费类型=="午餐"]
【答案】 ①. B ②. C ③. AC ④. 192.168.10.10:8080/room ⑤. EAD
【解析】
【详解】本题考查搭建信息系统和pandas数据分析。
(1)系统通过电子标签(RFID)读取信息,属于射频识别(RFID) 技术。网络技术(A)是数据传输基础,人工智能(C)是模拟智能行为,红外线扫描(D)是光学检测,均不符合。答案为B。
(2)A 错误:数据可双向传输(如结算台→服务器,服务器→结算台显示)。B 错误:程序和数据主要存储在服务器,结算台是终端。C 正确:消费历史存储在数据库,查看需访问数据库。D 错误:餐品金额计算可在结算台(本地)完成,再同步到服务器。答案为C。
(3)A 正确:人脸数据加密可防止泄露。B 错误:只保存当天记录无法追溯历史,不安全。C 正确:定时备份交易日志可防止数据丢失。D 错误:非营业时段关闭防火墙会暴露系统,增加风险。答案为AC。
(4)餐厅管理的访问地址是 /room,需拼接服务器 IP、端口和路径。服务器 IP 是 192.168.10.10,端口 8080,因此地址为: http://192.168.10.10:8080/room。
(5)①处:对df数据对象筛选 “消费类型 == 午餐” 的数据,选 E。②处:按 “食堂名称” 分组,求和 “消费金额”,选 A。③处:对分组结果df1按 “消费金额” 降序排序,选 D。
第1页/共1页
学科网(北京)股份有限公司
$