内容正文:
上大附中2025学年第一学期期末考试
高一年级信息技术试卷
(全卷分值100分;完卷时间60分钟)
考试说明
1.答题卡上六位数学号需准确填写无误。例:1班1号:2 5 0 1 0 1填写后并正确涂黑。
2.本试卷满分100分,共三道综合题。综合题一16小题,共36分;综合题二12小题,共36分;综合题三12小题,共28分。
3.部分函数卷尾有小贴士,考试期间严禁使用计算器。
1. 综合题一 学术节作品图文信息处理
秋意渐浓,附中校园的梧桐叶染上金黄,一场名为“青春创见场”的学术节却让这里暖意涌动、思潮交汇。作为学术节的组成部分,高一年级学术作品征集活动得到同学们的热烈响应,大家踊跃参与,以图文并茂的形式系统展示其在各学科中的学术素养与思维品质。
(1)本次活动展示作品共分“拾贝”“琢玉”“织网”“破局”“执棋”5类,每类作品的数量不超过16个,如果采用二进制分别对作品类别和每类作品的数量进行编码(编码需覆盖所有类别和最大数量),则至少需要( )位二进制数。
A.5 B.6 C.7 D.8
(2)学生作品的数据传输与处理中,不同类型的数据需要采用合适的编码方式。以下关于字符编码的描述,错误的是( )
A.标准ASCII码是7位二进制编码,存储时占用1个字节
B.汉字的输入码有音码、形码、音形码等多种类型
C.在GB18030中,大部分常用汉字采用双字节编码
D.Unicode字符集仅能用来解决汉字编码问题
(3)小沁同学为这次校园学术节活动设计了一张海报,海报的图像分辨率是3072×3072,保存为24位BMP彩色图像,那么这张海报文件的大小为____MB(直接填写运算结果)。
(4)制作海报时,小沁通过手写方式输入文字。手写文字识别算法通过对已标记样本的学习,能够快速地对手写文字进行识别。这属于机器学习中的( )
A.专家系统 B.聚类 C.监督学习 D.非监督学习
(5)为了呈现更好的效果,小沁为文字设置了独特的华康行书字体,但她发现在家里电脑上打开海报文档时显示正常,但在学校电脑上打开文档时却替换为了宋体。可能的原因是学校的电脑上没有( )
A.华康行书输入码 B.华康行书字形码 C.华康行书内码 D.华康行书区位码
(6)该张海报的图像格式为BMP,如果要在图像上增加文字,那么添加文字后,该张海报的文件大小将会( )
A.变大 B.变小 C.不变 D.不确定
(7)对海报进行处理时,发现某个颜色用RGB颜色模型表示为(100,128,255),则该颜色用十六进制数表示为( )
A.(32,40,7F) B.(C8,100,200) C.(64,80,FF) D.(60,7F,FE)
(8)由于海报原始文件占用的存储空间较大,为优化系统的存储,在不减少图像分辨率与颜色位数的前提下,减少图像冗余,降低文件数据量,请提出一个具体可行的压缩方案,并说明该方案的压缩原理。
使用____(有损/无损)压缩,将文件压缩成____格式。文件能够压缩的原因是____。
(9)新媒体部的几位同学为制作活动宣传微视频也提前做了很多准备工作,以下环节中包含有信息数字化过程的是( )
A.他们使用数码相机拍摄了一些彩排时活动花絮
B.他们在网上搜索了很多的素材,添加到微视频中
C.他们用视频编辑软件,为微视频添加了背景音乐
D.他们将制作好的视频,拷在U盘上交给老师审核
(10)音频采集时,需要借助声音传感器完成信号转换,其核心过程是将采集到的 信号转换成 信号,即通过 、 、编码的过程,完成转换才能让数字设备进行存储和处理( )
A.数字、模拟、采样、量化 B.模拟、数字、量化、采样
C.模拟、数字、采样、量化 D.数字、模拟、量化、采样
(11)同学们选用的宣传视频背景音乐,采样频率为192kHz,量化位数为8位,双声道,时长为6秒。则这段音频保存为WAV格式时的存储容量是( )
A.192×8×2×6÷1024 KB B.192000×8×2×6÷8÷1024 KB
C.192000×8×2×6÷1024 MB D.192×8×2×6÷1024 MB
(12)此次学术节的活动视频将在电子班牌上滚动播放,系统会通过算法自动识别视频中出现的学生笑脸画面,并标记精彩瞬间。该识别过程采用的机器学习方式与以下哪类应用是一致的?( )
A.用Word的拼写检查功能修正英文单词错误
B.购物APP根据用户历史订单推荐同类商品
C.交警部门通过监控视频自动识别闯红灯车辆的车牌
D.系统根据大量未分类的图片自动聚类为两组
(13)人脸检测、文字识别等人工智能技术已广泛应用于学术节作品展示与宣传。关于人工智能技术对社会的影响,以下表述正确的有( )
A.人工智能技术的普及提高了人们的工作效率和服务水平
B.人工智能技术衍生出了一些新工种,对从业者的素质不再有要求
C.在某些确定目标的任务中,人工智能表现出了更优秀的性能
D.人工智能技术的应用可能伴随隐私泄露风险,需重视个人信息安全保护
(14)人脸识别获取身份的算法流程描述正确的是( )
①如果大于阈值,则返回该特征对应的身份,否则返回“不在身份库中”
②连接人工智能平台,导入所拍摄的人脸图片
③找出一个与输入特征相似度较高的特征,并将该较高相似度值和预设的阈值进行比较
④将人脸特征数据与注册在库中的身份对应的特征进行逐个比对
⑤调用人工智能平台,获得人脸框及人脸关键点位相关特征数据
A.②⑤③④① B.②⑤④③① C.⑤②④①③ D.⑤②①④③
(15)同学们制作的海报和微视频在计算机内的存储形式是( )
A.ASCII码 B.二进制 C.Unicode编码 D.GB18030编码
(16)自管会的同学们通过校园官网、公众号、电子班牌等渠道宣传学术节活动,很快被全校师生所知晓。有人认为这体现了信息可以传播和存储;也有人认为这体现了信息可以被共享。下列判断正确的是( )
A.前者对,后者错 B.前者错,后者对 C.两者都错 D.两者都对
【答案】 ①. C ②. D ③. 27 ④. C ⑤. B ⑥. C ⑦. C ⑧. 无损 ⑨. PNG ⑩. 图像存在空间冗余、编码冗余等冗余信息,无损压缩通过编码优化的方式去除这些冗余信息以降低数据量,且解压后能完整还原原始图像信息,不会减少图像分辨率和颜色位数 ⑪. A ⑫. C ⑬. B ⑭. C ⑮. ACD ⑯. B ⑰. B ⑱. D
【解析】
【详解】本题考查数据编码。
(1)本题考查二进制编码位数的计算。首先要分别计算作品类别和作品数量所需的二进制位数再进行求和,作品类别共有5类,2的2次方为4小于5,2的3次方为8大于等于5,所以类别编码至少需要3位,每类作品的数量不超过16个,2的4次方为16刚好满足数量要求,数量编码至少需要4位,将两者相加3加4等于7位,这个位数能够覆盖所有的作品类别和最大的作品数量要求,因此该空答案为C。
(2)本题考查字符编码的相关知识,包含ASCII码、汉字编码、GB18030编码和Unicode字符集的特性。标准ASCII码是7位二进制编码,实际存储时会在高位补0,占用1个字节的存储空间,选项A的描述是正确的,汉字输入码是为了方便汉字输入设计的编码,按照编码规则可分为音码、形码、音形码等类型,选项B的描述是正确的,GB18030作为我国的汉字编码标准,兼容GB2312,其中大部分常用汉字采用双字节编码,生僻字采用多字节编码,选项C的描述是正确的,Unicode是通用字符集,其设计的目的是涵盖全球几乎所有语言的字符,并不是仅能用来解决汉字编码问题,选项D的描述错误,因此该空答案为D。
(3)本题考查24位BMP位图文件大小的计算。BMP位图文件大小的计算公式为文件大小(字节)=图像分辨率×颜色位深÷8,计算后还需要通过单位换算将字节转换为MB,其中1MB=1024KB,1KB=1024字节,将数据代入公式计算,3072×3072×24÷8=28311552字节,再进行单位换算,28311552÷1024÷1024=27MB,因此该空答案为27。
(4)本题考查机器学习的常见类型及特征。专家系统是基于预先设定的规则和知识库实现智能判断的人工智能系统,并不是通过样本学习的机器学习,排除选项A,聚类是无监督学习的典型应用,核心是对无标记的样本进行分组,排除选项B,监督学习的核心特征是利用已标记的样本训练模型,让模型学习样本的特征与标签的对应关系,从而对新样本进行判断,手写文字识别算法通过已标记的手写样本学习识别规则,符合监督学习的特征,选项C正确,非监督学习无需已标记的样本,仅对无标签样本进行特征分析和规律挖掘,排除选项D,因此该空答案为C。
(5)本题考查汉字编码的不同类型及功能。汉字输入码是用于将汉字输入计算机的编码,仅作用于输入环节,与文字的显示无关,排除选项A,汉字字形码是用于显示和打印汉字的编码,对应计算机中的字体文件,学校电脑未安装华康行书的字形码,无法调用该字体显示文字,因此会替换为默认的宋体,选项B正确,汉字内码是计算机内部存储和处理汉字时使用的编码,同一汉字的内码是固定的,与字体无关,排除选项C,区位码是汉字国标码的前身,是一种数字型输入码,与字体显示无关,排除选项D,因此该空答案为B。
(6)本题考查BMP位图文件的存储特性。BMP是未压缩的位图格式,其文件大小仅由图像分辨率和颜色位深两个因素决定,计算公式为分辨率×位深÷8,在海报上添加文字,只是修改了部分像素的颜色值,并未改变图像的像素总数也就是分辨率,也没有改变颜色位深,因此位图的核心存储数据量没有发生变化,文件大小也会保持不变,因此该空答案为C。
(7)本题考查RGB颜色模型中十进制数值转十六进制数值的计算。RGB颜色模型的红、绿、蓝三个分量均为0-255的十进制整数,转换为十六进制时,需要对每个分量分别进行除16取余、逆序排列的计算,若余数为10-15,分别用A-F表示,红色分量100计算为100÷16=6余4,结果为64,绿色分量128计算为128÷16=8余0,结果为80,蓝色分量255计算为255÷16=15余15,结果为FF,因此该颜色的十六进制表示为(64,80,FF),因此该空答案为C。
(8)本题考查图像压缩的类型、常用格式及压缩原理。题目要求不减少图像分辨率与颜色位数,也就是压缩后需要能完整恢复原始图像信息,因此需要使用无损压缩,无损压缩的常用图像格式为PNG,该格式能在去除图像冗余的同时,保证解压后图像无任何画质损失,图像能够被压缩的核心原因是存在大量冗余信息,包括空间冗余即相邻像素的颜色值相同或相近,无需重复存储、编码冗余即相同的颜色信息使用了重复的编码表示等,无损压缩通过编码优化的方式去除这些冗余信息,减少数据量,且解压后可还原原始冗余信息,恢复图像原貌,因此该空答案依次为:无损;PNG;图像存在空间冗余、编码冗余等冗余信息,无损压缩通过编码优化的方式去除这些冗余信息以降低数据量,且解压后能完整还原原始图像信息,不会减少图像分辨率和颜色位数。
(9)本题考查信息数字化的概念和实际应用。信息数字化是指将现实世界中的模拟信息如声音、图像、文字等连续的信息转换为计算机能识别和处理的二进制数字信息的过程,选项A中,数码相机拍摄彩排花絮,是将现实中的模拟图像信息转换为数字图像信息,属于信息数字化过程,选项B中,网上搜索的素材本身已是数字信息,直接添加没有数字化过程,选项C中,视频编辑软件添加背景音乐,是对数字音频和数字视频的处理,没有数字化过程,选项D中,将视频拷贝到U盘,是数字信息的存储和传输,没有数字化过程,因此该空答案为A。
(10)本题考查音频采集的信号转换过程和音频数字化的三个步骤。声音传感器采集的是现实中的声波信号,属于模拟信号也就是连续变化的信号,而计算机只能处理数字信号也就是离散的二进制信号,因此核心过程是将模拟信号转换为数字信号,音频数字化的完整过程为采样、量化、编码,采样是按固定频率采集模拟信号的样本值,量化是将采样得到的连续样本值转换为有限个离散的数值,编码是将量化后的数值转换为二进制编码,让计算机能够存储和处理,因此该空答案为C。
(11)本题考查WAV音频文件存储容量的计算。WAV是未压缩的音频格式,其存储容量计算公式为容量(字节)=采样频率(Hz)×量化位数(位)×声道数×时长(s)÷8,再根据需求换算为KB或MB,其中1KB=1024字节,1MB=1024KB,题目中采样频率为192kHz,需要先转换为192000Hz,要求计算KB单位的容量,因此公式为192000×8×2×6÷8÷1024 KB,选项A未将kHz转换为Hz,表述错误,选项B符合计算公式,表述正确,选项C单位为MB且缺少÷8的步骤,表述错误,选项D未转换单位且单位错误,表述错误,因此该空答案为B。
(12)本题考查监督学习的实际应用场景判断。视频中自动识别学生笑脸画面,是利用已标记的笑脸样本训练机器学习模型,让模型学习笑脸的视觉特征,属于监督学习的应用,需要找到同属监督学习的选项,选项A,Word拼写检查是基于预设的单词规则库实现的,并非机器学习,选项B,购物APP的商品推荐多基于协同过滤或用户行为分析,属于半监督或无监督学习,选项C,交警部门通过监控识别车牌,是利用已标记的车牌样本训练模型,让模型学习车牌的特征,属于监督学习,与笑脸识别的机器学习方式一致,选项D,无分类图片自动聚类是对无标记样本的分组,属于无监督学习,因此该空答案为C。
(13)本题考查人工智能技术对社会的多方面影响。人工智能技术能替代人类完成大量重复性、机械性的工作,有效提高人们的工作效率和各类服务的水平,选项A表述正确,人工智能技术衍生出了AI训练师、数据标注师、AI运维工程师等新工种,这些新工种对从业者的专业素质、综合能力要求更高,并非不再有要求,选项B表述错误,在确定目标的重复性任务中,如图像识别、数据计算、语音合成,人工智能具有精度高、速度快、不易出错的特点,表现出比人类更优秀的性能,选项C表述正确,人工智能技术的应用往往需要采集大量个人数据,如人脸、行为、消费记录等,若数据管理不当,极易引发隐私泄露问题,因此需要重视个人信息安全保护,选项D表述正确,因此该空答案为ACD。
(14)本题考查人脸识别的基本算法流程。人脸识别的核心逻辑是导入图像→提取特征→特征比对→相似度判断→返回结果,具体的步骤首先是连接人工智能平台,导入所拍摄的人脸图片,接着调用人工智能平台,获得人脸框及人脸关键点位相关特征数据,然后将人脸特征数据与注册在库中的身份对应的特征进行逐个比对,之后找出一个与输入特征相似度较高的特征,并将该较高相似度值和预设的阈值进行比较,最后如果大于阈值,则返回该特征对应的身份,否则返回“不在身份库中”,完整流程为②⑤④③①,因此该空答案为B。
(15)本题考查计算机中信息的统一存储形式。计算机内部的硬件结构决定了其只能识别和处理二进制数,因此无论是海报也就是图像、微视频也就是视频+音频,还是文字、音频等各类信息,在计算机内的存储形式均为二进制,ASCII码、Unicode编码、GB18030编码只是针对文字字符的特定编码方式,仅适用于文字信息的存储,无法用于图像和视频信息的存储,因此该空答案为B。
(16)本题考查信息的基本特征,包含传播性、存储性和共享性。信息的传播性指信息可以通过不同的载体和渠道进行传递,本次学术节活动信息通过校园官网、公众号、电子班牌等渠道宣传,体现了信息的传播性,信息的存储性指信息可以被存储在各类载体中,如官网、公众号的服务器,方便后续获取和传播,该宣传过程也体现了信息的存储性,信息的共享性指同一信息可以被多个接收者同时获取和使用,活动信息通过多渠道让全校师生知晓,多名师生可同时获取该信息,体现了信息的共享性,因此“体现了信息可以传播和存储”“体现了信息可以被共享”的说法均正确,因此该空答案为D。
2. 综合题二 水下机器人模块化设计与应用
研究性学习活动在校园内如火如荼开展,高一学生乐乐研发出一款智能水下机器人。该机器人创新性地采用模块化分段设计,模块间通过法兰结构紧固连接,不仅大幅降低设备维护难度,还显著提升生产制造效率。这款智能水下机器人可广泛应用于水下勘探、水面巡检和环境监测等领域,兼具科研价值与实用前景。
(1)乐乐为机器人设计了深度保持算法:设定最大调整次数为20次,当检测到当前深度偏离目标深度±1米时,启动推进器调整姿态。若调整20次后,深度稳定在目标范围,则算法终止;若20次后仍未稳定,也自动停止调整并反馈异常。该算法最能体现的特征是( )
A.有穷性 B.确定性 C.可行性 D.有输出
(2)以下Python代码实现水下机器人初始参数设置,程序执行后变量power的值为( )
voltage = 12
current = 5.2
power = voltage * current - 10
current = 6.0
A.52.4 B.62.4 C.72 D.50
(3)机器人根据水质传感检测的浊度值(单位:NTU)切换工作模式,浊度≤50为“高清拍摄”,50<浊度≤100为“普通探测”,浊度>100为“避障巡航”,实现该逻辑最适合的结构是( )
A.单分支结构 B.分支结构 C.多分支结构 D.循环结构
(4)机器人在执行“水下采样”任务时,需重复检测水质pH值,直到采集到3组有效数据(pH值在6.5~8.5之间),如下图,该循环逻辑适合用( )实现。
A.当循环 B.直到循环 C.顺序结构嵌套 D.多分支结构嵌套
(5)乐乐计划为机器人新增“水温预警”功能,完整的编程解决问题四个步骤的顺序应为( )
①编写Python程序 ②抽象与建模 ③调试运行 ④设计算法
A.②④①③ B.④②①③ C.②①④③ D.①②④③
(6)以下关于机器人控制程序的编程语言描述错误的是( )
A.机器语言由二进制代码组成,可直接被机器人处理器执行
B.Python属于高级语言,需编译后才能运行
C.机器语言可读性强,适合复杂程序的开发
D.Python程序必须转换为机器语言才能在机器人上运行
(7)机器人状态数据,module_type="front"(前模块)、battery=89.5(剩余电晕)、is_working=True(工作状态),这三个变量的数据类型依次是( )
A.整型、浮点型、布尔型 B.字符串型、浮点型、布尔型
C.字符串型、整型、布尔型 D.字符串型、浮点型、整型
(8)在机器人推进器功率监控程序中,需判断推进器是否满足“高效且安全”的工作条件,核心逻辑如下:已知公式:基础功率power = (voltage **2) / resistance判断条件:
①基础功率大于等于500W且小于等于800W;
②实时电流current小于15A或工作温度temp不高于60℃;
③最终需输出“是否满足高效且安全条件”的布尔结果。
请根据上述逻辑,选出以下能正确实现该判断的赋值语句( )
A.result = (power >=500 and power <=800) or (current <15 or temp <=60)
B.result = (power >=500 and power <=800) and (current <15 or temp <=60)
Cresult = (power >=500 or power <=800) or (current <15 or temp <60)
D.result = (power >=500 and power <=800) and current <15 or temp <=60
(9)在Python中,statistics库是处理基础统计计算的常用库,其中median()函数用于计算一组数值的中位数。乐乐需要计算水下机器人采集的5组能见度数据[12.5,15.8,9.7,14.2,11.8]的中位数,请将以下代码补充完整。
____ #导入库
result =____([12.5,15.8,9.7,14.2,11.8])
(10)机器人的设备编号为字符串device_id = "ROV-2025-058",若要提取年份“2025”,正确的操作是( )
A.device_id[4:8] B.device_id[3:8] C.device_id[4:7] D.device_id[3:7]
(11)机器人核心模块的温度监测系统中存储了部分部件的实时温度列表 temp = [28.3,30.1,29.7,31.2],执行以下Python语句后,列表temp的值为( )
temp = [28.330.1,29.7,31.2]
temp.remove(30.1)
temp.append(29.2)
temp[0] =28.5
A.[28.3,28.5,29.7,31.2] B.[28.3,28.5,29.7,29.2]
C.[28.5,29.2,29.7,31.2] D.[28.5,29.7,31.2,29.2]
(12)机器人通过枚举算法排查模块是否有故障,各个模块的工作状态存储在列表module_status里,0代表正常,1代表故障,如module_status=[0,1,0,…],列表长度未知。编程输出故障模块的数量,若没故障,输出“无故障”。
sum =0 #统计故障模块的个数
____
【答案】 ①. A ②. A ③. C ④. B ⑤. A ⑥. BC ⑦. B ⑧. B ⑨. import statistics ⑩. statistics.median ⑪. A ⑫. D ⑬. for status in module_status:
if status == 1:
sum += 1
if sum == 0:
print("无故障")
else:
print(sum)
【解析】
【详解】本题考查算法的描述,循环语句,分支语句。
(1)本题考查算法的基本特征。算法的有穷性是指算法必须在有限的步骤内结束,不会无限循环执行,确定性是指算法的每一步操作都有明确的定义,无歧义,可行性是指算法的每一步都能够通过有限的操作实现,有输出是指算法执行后必须有对应的结果反馈。题目中深度保持算法设定了最大调整次数为20次,无论最终深度是否稳定,20次调整后都会终止算法,不会出现无限调整的情况,这最能体现算法的有穷性,选项A符合,选项B确定性在题目中未重点体现,选项C可行性不是该算法最突出的特征,选项D有输出也不是本题强调的核心,因此该空答案为A。
(2)本题考查Python变量的赋值运算和数据计算顺序。在Python中,变量进行运算时,使用的是运算时刻该变量的当前取值,后续对变量的修改不会影响之前已经完成的运算结果。题目中首先定义voltage=12,current=5.2,然后计算power=voltage*current-10,此时代入数值计算为12*5.2-10,12乘以5.2等于62.4,再减去10得到52.4,之后将current修改为6.0,这个修改发生在power计算完成之后,不会对已经算出的power值产生影响,因此power的值是52.4,选项A正确,选项B是未减10的结果,选项C和D的计算逻辑错误,因此该空答案为A。
(3)本题考查Python程序的基本控制结构。单分支结构只有一个条件判断和对应的执行语句,仅处理一种特殊情况和默认情况,分支结构是包含单分支、双分支、多分支的统称,多分支结构用于处理多种互斥的条件情况,每种条件对应不同的执行逻辑,循环结构用于重复执行某一段代码,直到满足终止条件。题目中机器人根据浊度值的三个不同区间,对应三种不同的工作模式,这三种情况是互斥且并列的,需要通过多分支结构来实现不同条件下的逻辑切换,选项C最适合,选项A单分支无法处理三种情况,选项B分支结构范围过广,不是最精准的答案,选项D循环结构不适用该逻辑判断场景,因此该空答案为C。
(4)本题考查循环结构的类型及适用场景。当循环是先判断循环条件是否满足,再执行循环体,若初始条件不满足,循环体可能一次都不执行,直到循环是先执行一次循环体,再判断循环条件是否满足,循环体至少会执行一次,顺序结构嵌套是将顺序执行的代码嵌套在其他结构中,不涉及重复执行,多分支结构嵌套是将多分支结构嵌套在其他分支结构中,用于复杂条件判断,不涉及重复执行。题目中机器人需要重复检测水质pH值,直到采集到3组有效数据,也就是说需要先执行检测pH值的操作(循环体),再判断是否收集到了3组有效数据,符合直到循环“先执行、后判断”的特征,选项B正确,选项A当循环不符合该场景需求,选项C和D不属于循环结构,无法实现重复检测的逻辑,因此该空答案为B。
(5)本题考查编程解决实际问题的完整步骤。编程解决问题的四个核心步骤有着明确的逻辑顺序,首先是抽象与建模,即将实际的“水温预警”功能需求,转化为计算机能够处理的数学模型或数据模型,明确需要处理的参数、判断条件等;其次是设计算法,即规划实现水温预警功能的具体步骤,明确先做什么、再做什么,比如如何采集水温数据、如何设定预警阈值、预警时如何反馈等;然后是编写Python程序,即使用Python编程语言将设计好的算法转化为可执行的代码;最后是调试运行,即运行编写好的程序,排查其中的语法错误和逻辑错误,验证程序是否能够实现预期的水温预警功能,若有问题则进行修改优化。因此正确的顺序是②④①③,选项A正确,其他选项的步骤顺序均不符合编程解决问题的逻辑,因此该空答案为A。
(6)本题考查编程语言的相关知识,包含机器语言、高级语言以及Python语言的运行特性。选项A,机器语言是由0和1组成的二进制代码,能够直接被机器人的处理器识别和执行,该描述正确;选项B,Python属于高级编程语言,它是解释型语言,不需要提前进行整体编译,而是由解释器逐行解释并执行代码,并非需要编译后才能运行,该描述错误;选项C,机器语言是二进制代码,可读性极差,难以理解和编写,不适合进行复杂程序的开发,复杂程序通常使用可读性更强的高级语言进行开发,该描述错误;选项D,无论是哪种高级编程语言,其编写的程序最终都必须转换为机器语言,才能被计算机或机器人的硬件处理器执行,该描述正确。题目要求选择描述错误的选项,因此该空答案为BC。
(7)本题考查Python中的基本数据类型。在Python中,字符串型数据通常用单引号或双引号包裹起来,module_type="front"被双引号包裹,因此该变量的数据类型是字符串型;浮点型数据是带有小数点的数值,battery=89.5包含小数点,因此该变量的数据类型是浮点型;布尔型数据只有两个取值,分别是True和False,用于表示“是”或“否”的状态,is_working=True符合布尔型数据的特征,因此该变量的数据类型是布尔型。三个变量的数据类型依次是字符串型、浮点型、布尔型,选项B正确,其他选项的类型匹配均存在错误,因此该空答案为B。
(8)本题考查Python中的逻辑运算符(and、or)以及复合条件判断的实现。题目中要求判断推进器是否满足“高效且安全”的工作条件,首先明确各个条件之间的逻辑关系,“高效”对应的是条件①,即基础功率大于等于500W且小于等于800W,两个子条件之间是“且”的关系,需要用and运算符连接;“安全”对应的是条件②,即实时电流小于15A或工作温度不高于60℃,两个子条件之间是“或”的关系,需要用or运算符连接;而“高效”和“安全”之间是“且”的关系,即必须同时满足高效和安全两个要求,因此整体的逻辑应该是(条件①)and(条件②)。分析各个选项,选项A将高效和安全的关系用or连接,不符合题目要求;选项B准确实现了(条件①and条件②)的逻辑,符合要求;选项C中条件①的两个子条件用or连接,且工作温度判断为小于60℃,与题目中的“不高于60℃”不符,逻辑错误;选项D缺少括号,由于and运算符的优先级高于or运算符,会导致逻辑运算顺序出错,无法准确实现题目要求的复合条件判断,因此该空答案为B。
(9)本题考查Python中statistics库的导入以及median()函数的使用。要使用Python中的第三方库或内置标准库中的函数,首先需要导入对应的库,本题中需要使用statistics库中的median()函数,因此第一行需要补充导入库的语句import statistics;导入库之后,调用median()函数计算中位数时,需要指定库名和函数名,格式为库名.函数名(),因此第二行需要补充statistics.median,将数据列表传入该函数即可完成中位数计算。因此该空依次补充:import statistics;statistics.median。
(10)本题考查Python中字符串的切片操作。Python中的字符串索引是从0开始的,即字符串的第一个字符对应的索引为0,第二个字符对应的索引为1,以此类推,而字符串切片的格式为字符串[起始索引:结束索引],遵循“左闭右开”的原则,即包含起始索引对应的字符,不包含结束索引对应的字符。题目中device_id = "ROV-2025-058",逐个字符对应的索引如下:索引0为R,索引1为O,索引2为V,索引3为-,索引4为2,索引5为0,索引6为2,索引7为5,索引8为-,后续为0、5、8。要提取年份“2025”,对应的字符是索引4到索引7,按照切片“左闭右开”的原则,结束索引需要设置为8,因此正确的切片操作是device_id[4:8],选项A正确,其他选项的起始索引或结束索引设置错误,无法准确提取“2025”,因此该空答案为A。
(11)本题考查Python中列表的常用方法(remove()、append())以及列表元素的索引赋值。我们可以逐步分析列表的变化过程,首先初始列表temp = [28.3,30.1,29.7,31.2];执行temp.remove(30.1)语句,该语句的作用是删除列表中第一个出现的30.1,删除后列表变为[28.3,29.7,31.2];接着执行temp.append(29.2)语句,该语句的作用是在列表的末尾添加元素29.2,添加后列表变为[28.3,29.7,31.2,29.2];最后执行temp[0] =28.5语句,该语句的作用是将列表中索引为0的元素修改为28.5,修改后列表变为[28.5,29.7,31.2,29.2]。选项D与最终的列表结果一致,其他选项的列表结果均不符合步骤分析,因此该空答案为D。
(12)本题考查Python中列表的遍历、条件判断以及循环结构的应用。题目要求统计列表module_status中故障模块的数量(1代表故障),若无故障则输出“无故障”。首先在给定的sum=0基础上,需要遍历列表中的每一个元素,判断该元素是否为1,若是则将sum的值加1;遍历完成后,判断sum的值是否为0,若为0则输出“无故障”,否则输出故障模块的数量sum。补充完整的代码如下:
sum =0 #统计故障模块的个数
for status in module_status:
if status == 1:
sum += 1
if sum == 0:
print("无故障")
else:
print(sum)
3. 综合题三 PM2.5数据与气象要素的关联性分析
大气污染防控是生态环境保护的重要课题,PM2.5作为主要的大气污染物之一,其质量浓度变化不仅受污染源影响,还与气象要素密切相关。为探究不同城市PM2.5污染特征以及气象要素的影响机制,小玲、小菲和小柏组建了研究小组,选取我国五个典型城市(北京、广州、昆明、南京、西宁)作为观测站点,收集2015-2017年的PM2.5质量浓度数据和气象要素数据,经过数据预处理后,开展系统性分析。
数据文件说明:研究小组使用的数据集存储为"pm25.csv",数据为“城市-日期-PM2.5浓度”唯一对应的日综合数据(即:同一城市在同一日期下,PM2.5浓度为当日小时数据的平均值),部分数据片段如下:
城市
日期
PM2.5浓度
降雨量
平均气压
平均气温
平均相对湿度
平均风速
北京
2015-1-1
125.3μg/m3
0mm
102.3kPa
-2.5℃
65.2%
1.8m/s
北京
2015-1-1
125.3μg/m3
0mm
102.3kPa
-2.5℃
65.2%
1.8m/s
广州
2015-1-2
42.1μg/m3
5.2mm
101.1kPa
15.3℃
78.5%
2.3m/s
昆明
2015-1-3
28.7μg/m3
0mm
81.2kPa
8.6℃
58.3%
1.5m/s
南京
2015-1-4
76.9μg/m3
2.1mm
101.5kPa
3.2℃
72.6%
2m/s
西宁
2015-1-5
92.4μg/m3
0mm
77.8kPa
-5.1℃
45.8%
2.5m/s
(1)小玲在某些气象网站找到较多的可用数据。若要使用Python程序采集网页数据,首先需要获取该网页,以下主要用来实现该功能的第三方库是( )
A.requests B.turtle C.pandas D.numpy
(2)小玲先将采集得到的相关数据保存至" pm25.csv"数据集文件中,小菲导入Python相关库读取该文件。为实现该功能,请将以下代码补充完整。
import pandas as pd
df = pd.___ (" pm25.csv",encoding = " ANSI")
(3)数据采集过程中因设备重复上传导致的冗余数据,需通过去重处理保留一条有效记录。题干中“pm25.csv”的哪两个字段最适合作为重复值的判断依据( )
A.城市 B.日期 C.PM2.5浓度 D.降雨量
(4)小菲发现有些数值明显偏离其余数值,数据整理与分析中,一般使用( )能较清晰地观察到异常值的存在。
A柱状图 B.散点图 C.折线图 D.箱形图
(5)小菲想要从df中选取并显示“城市”“PM2.5浓度”“降雨量”三列数据,正确的Python代码是( )
A.df ["城市","PM2.5浓度","降雨量"]
B.df [["城市","PM2.5浓度","降雨量"]]
C.df.get ["城市","PM2.5浓度","降雨量"]
D.df.read_columns ["城市","PM2.5浓度","降雨量"]
(6)小菲想要计算北京2015年的PM2.5平均浓度,需筛选出“城市”为“北京”且“日期”是2015年的数据。下列Python代码中,能实现该功能的是( )
A.df [(df ["城市"]=="北京") & df ["日期"].str.contains("2015")]["PM2.5浓度"].mean()
B.df [(df ["城市"]=="北京" & df ["日期"].str.contains("2015"))["PM2.5浓度"].mean()
C.df [(df ["城市"]=="北京") and (df ["日期"].str.contains("2015"))["PM2.5浓度"].mean()
D.df [(df ["城市"]=="北京",df["日期"].str.contains("2015"))["PM2.5浓度"].mean()
(7)研究小组想比较五个城市1月1日PM2.5浓度值的差异,应采用的数据分析基本方法是( )
A.结构分析法 B.对比分析法 C.平均分析法 D.回归分析法
(8)若要呈现五个城市PM2.5浓度的季节分布占比,例如每个城市春季、夏季、秋季、冬季PM2.5浓度占全年的比例,最适合选择的可视化图表是( )
A.折线图 B.饼图 C.柱状图 D.散点图
(9)下列关于可视化图表作用的说法错误的是( )
A.散点图可分析PM2.5浓度与平均气温的相关关系
B.折线图可展示北京PM2.5浓度的日变化趋势
C.箱形图可呈现南京PM2.5浓度的分布及异常值
D.柱状图可用于预测未来某城市的PM2.5浓度值
(10)为保护数据中可能包含的个人隐私信息,研究小组对数据进行了脱敏处理,下列不属于数据脱敏操作的是( )
A.隐藏监测站点的详细地址
B.对“平均气压”数据保留1位小数
C.替换监测人员的姓名为“观测员A”“观测员B”
D.屏蔽部分敏感字段的中间几位数据
(11)小柏通过建立模型分析降雨量、温湿度等气象要素与PM2.5质量浓度的相关性,该模型主要用于研究一个因变量与多个自变量的线性关系,最终得到的模型公式如下:
y=-0.657x1-0.09x3-1.283x5+6.982x6-7.062x7+0.214x8+1.263x9+2.105x10-8.037x11-3.213x12+0.465x13+2.374
通过这一模型能够预测PM2.5质量浓度,这里使用的机器学习是( )
A.非监督学习 B.聚类 C.半监督学习 D.回归
(12)下图为PM2.5质量浓度与降雨等级的关系图,请你根据图表信息归纳得出结论。____
【答案】 ①. A ②. read_csv ③. AB ④. D ⑤. B ⑥. A ⑦. B ⑧. B ⑨. D ⑩. B ⑪. D ⑫. 降雨等级越高,PM2.5质量浓度越低。
【解析】
【详解】本题考查Python编程基础及数据分析能力。
(1)requests库是用于发送HTTP请求的库,可以获取网页内容。故答案为:A。
(2)pandas库用于数据处理,读取CSV文件的函数是read_csv。故答案为:read_csv。
(3)城市和日期字段可以唯一标识一条记录,因此最适合作为重复值判断依据。故答案为:A、B。
(4)箱形图常用于发现离群点/异常值,比散点图、柱状图、折线图对异常值的识别更直观。故答案为:D。
(5)pandas 选取多列一般用双重方括号,df[[“列1”,“列2”,“列3”]]。故答案为:B。
(6)pandas 中多条件筛选需使用 &,且每个条件都需放在小括号里。故答案为:A。
(7)结构分析法常用于分析各部分在总体中所占比重,平均分析法着眼于平均值,回归分析法用于因果关系的建模,对比分析法最直接用于比较不同样本的数值。故答案为:B。
(8)饼图用于展示部分与整体的百分比或占比关系。故答案为:B。
(9)柱状图不直接用于预测,预测往往需要建立模型或使用趋势图、回归分析等方法。故答案为:D。
(10)脱敏操作主要是隐藏/替换敏感信息或关键字段,将数值截断小数位更多是精度处理而非隐私脱敏。故答案为:B。
(11)由“一个因变量与多个自变量线性关系”的模型可知这是典型的回归分析。故答案为:D。
(12)根据图表信息,降雨等级越高,PM2.5质量浓度越低。故答案为:降雨等级越高,PM2.5质量浓度越低。
____________________________________________________________________________________________
Python帮助小贴士
1.pandas库
函数
简单示例
功能
pandas.read_csv()
pandas.read_csv('文件名.扩展名')
读取当前目录的csv文件
DataFrame.to_csv()
DataFrame.to_csv('文件名.扩展名')
存储当前目录的csv文件
2.Matplotlib.pyplot库
函数
简单示例
功能
matplotlib.pyplot.bar()
matplotlib.pyplot.bar(xy)
绘制柱状图
matplotlib.pyplot.plot()
matplotlib.pyplot.plot(x,y)
绘制折线图
matplotlib.pyplot.pie()
matplotlib.pyplot.pie(x)
绘制饼图
matplotlib.pyplot.scatter()
matplotlib.pyplot.scatter(x,y)
绘制散点图
matplotlib.pyplot.boxplot()
matplotlib.pyplot.boxplot(x)
绘制箱形图
matplotlib.pyplot.title()
matplotlib.pyplot.title('标题')
添加标题的名称
matplotlib.pyplot.xlabel()
matplotlib.pyplot.xlabel('x轴名称')
添加x轴的名称
matplotlib.pyplot.ylabel()
matplotlib.pyplot.ylabel('y轴名称')
添加y轴的名称
matplotlib.pyplot.show()
matplotlib.pyplot.show()
在本机显示图形
3.Python内置函数
函数
简单示例
功能
input()
input()
从键盘输入数据
print()
print(x)
输出x的值
len()
len(x)
返回x的长度或个数
range()
range(x,y,step)
返回一个区间为[x,y),步长为step的等差序列
round()
round(x,i)
数值x保留i位小数,四舍五入(不含五)
int()
int(x)
返回数值x的整数部分
第1页/共1页
学科网(北京)股份有限公司
$
上大附中2025学年第一学期期末考试
高一年级信息技术试卷
(全卷分值100分;完卷时间60分钟)
考试说明
1.答题卡上六位数学号需准确填写无误。例:1班1号:2 5 0 1 0 1填写后并正确涂黑。
2.本试卷满分100分,共三道综合题。综合题一16小题,共36分;综合题二12小题,共36分;综合题三12小题,共28分。
3.部分函数卷尾有小贴士,考试期间严禁使用计算器。
1. 综合题一 学术节作品图文信息处理
秋意渐浓,附中校园的梧桐叶染上金黄,一场名为“青春创见场”的学术节却让这里暖意涌动、思潮交汇。作为学术节的组成部分,高一年级学术作品征集活动得到同学们的热烈响应,大家踊跃参与,以图文并茂的形式系统展示其在各学科中的学术素养与思维品质。
(1)本次活动展示作品共分“拾贝”“琢玉”“织网”“破局”“执棋”5类,每类作品的数量不超过16个,如果采用二进制分别对作品类别和每类作品的数量进行编码(编码需覆盖所有类别和最大数量),则至少需要( )位二进制数。
A.5 B.6 C.7 D.8
(2)学生作品的数据传输与处理中,不同类型的数据需要采用合适的编码方式。以下关于字符编码的描述,错误的是( )
A.标准ASCII码是7位二进制编码,存储时占用1个字节
B.汉字的输入码有音码、形码、音形码等多种类型
C.在GB18030中,大部分常用汉字采用双字节编码
D.Unicode字符集仅能用来解决汉字编码问题
(3)小沁同学为这次校园学术节活动设计了一张海报,海报的图像分辨率是3072×3072,保存为24位BMP彩色图像,那么这张海报文件的大小为____MB(直接填写运算结果)。
(4)制作海报时,小沁通过手写方式输入文字。手写文字识别算法通过对已标记样本的学习,能够快速地对手写文字进行识别。这属于机器学习中的( )
A.专家系统 B.聚类 C.监督学习 D.非监督学习
(5)为了呈现更好的效果,小沁为文字设置了独特的华康行书字体,但她发现在家里电脑上打开海报文档时显示正常,但在学校电脑上打开文档时却替换为了宋体。可能的原因是学校的电脑上没有( )
A.华康行书输入码 B.华康行书字形码 C.华康行书内码 D.华康行书区位码
(6)该张海报的图像格式为BMP,如果要在图像上增加文字,那么添加文字后,该张海报的文件大小将会( )
A.变大 B.变小 C.不变 D.不确定
(7)对海报进行处理时,发现某个颜色用RGB颜色模型表示为(100,128,255),则该颜色用十六进制数表示为( )
A.(32,40,7F) B.(C8,100,200) C.(64,80,FF) D.(60,7F,FE)
(8)由于海报原始文件占用的存储空间较大,为优化系统的存储,在不减少图像分辨率与颜色位数的前提下,减少图像冗余,降低文件数据量,请提出一个具体可行的压缩方案,并说明该方案的压缩原理。
使用____(有损/无损)压缩,将文件压缩成____格式。文件能够压缩的原因是____。
(9)新媒体部的几位同学为制作活动宣传微视频也提前做了很多准备工作,以下环节中包含有信息数字化过程的是( )
A.他们使用数码相机拍摄了一些彩排时的活动花絮
B.他们在网上搜索了很多素材,添加到微视频中
C.他们用视频编辑软件,为微视频添加了背景音乐
D.他们将制作好的视频,拷在U盘上交给老师审核
(10)音频采集时,需要借助声音传感器完成信号转换,其核心过程是将采集到的 信号转换成 信号,即通过 、 、编码的过程,完成转换才能让数字设备进行存储和处理( )
A.数字、模拟、采样、量化 B.模拟、数字、量化、采样
C.模拟、数字、采样、量化 D.数字、模拟、量化、采样
(11)同学们选用的宣传视频背景音乐,采样频率为192kHz,量化位数为8位,双声道,时长为6秒。则这段音频保存为WAV格式时的存储容量是( )
A.192×8×2×6÷1024 KB B.192000×8×2×6÷8÷1024 KB
C.192000×8×2×6÷1024 MB D.192×8×2×6÷1024 MB
(12)此次学术节的活动视频将在电子班牌上滚动播放,系统会通过算法自动识别视频中出现的学生笑脸画面,并标记精彩瞬间。该识别过程采用的机器学习方式与以下哪类应用是一致的?( )
A.用Word的拼写检查功能修正英文单词错误
B.购物APP根据用户历史订单推荐同类商品
C.交警部门通过监控视频自动识别闯红灯车辆的车牌
D.系统根据大量未分类的图片自动聚类为两组
(13)人脸检测、文字识别等人工智能技术已广泛应用于学术节作品展示与宣传。关于人工智能技术对社会的影响,以下表述正确的有( )
A.人工智能技术的普及提高了人们的工作效率和服务水平
B.人工智能技术衍生出了一些新工种,对从业者的素质不再有要求
C.在某些确定目标的任务中,人工智能表现出了更优秀的性能
D.人工智能技术的应用可能伴随隐私泄露风险,需重视个人信息安全保护
(14)人脸识别获取身份的算法流程描述正确的是( )
①如果大于阈值,则返回该特征对应的身份,否则返回“不在身份库中”
②连接人工智能平台,导入所拍摄的人脸图片
③找出一个与输入特征相似度较高的特征,并将该较高相似度值和预设的阈值进行比较
④将人脸特征数据与注册在库中的身份对应的特征进行逐个比对
⑤调用人工智能平台,获得人脸框及人脸关键点位相关特征数据
A.②⑤③④① B.②⑤④③① C.⑤②④①③ D.⑤②①④③
(15)同学们制作的海报和微视频在计算机内的存储形式是( )
A.ASCII码 B.二进制 C.Unicode编码 D.GB18030编码
(16)自管会的同学们通过校园官网、公众号、电子班牌等渠道宣传学术节活动,很快被全校师生所知晓。有人认为这体现了信息可以传播和存储;也有人认为这体现了信息可以被共享。下列判断正确的是( )
A.前者对,后者错 B.前者错,后者对 C.两者都错 D.两者都对
2. 综合题二 水下机器人模块化设计与应用
研究性学习活动在校园内如火如荼开展,高一学生乐乐研发出一款智能水下机器人。该机器人创新性地采用模块化分段设计,模块间通过法兰结构紧固连接,不仅大幅降低设备维护难度,还显著提升生产制造效率。这款智能水下机器人可广泛应用于水下勘探、水面巡检和环境监测等领域,兼具科研价值与实用前景。
(1)乐乐为机器人设计了深度保持算法:设定最大调整次数为20次,当检测到当前深度偏离目标深度±1米时,启动推进器调整姿态。若调整20次后,深度稳定在目标范围,则算法终止;若20次后仍未稳定,也自动停止调整并反馈异常。该算法最能体现的特征是( )
A.有穷性 B.确定性 C.可行性 D.有输出
(2)以下Python代码实现水下机器人初始参数设置,程序执行后变量power的值为( )
voltage = 12
current = 5.2
power = voltage * current - 10
current = 6.0
A.52.4 B.62.4 C.72 D.50
(3)机器人根据水质传感检测的浊度值(单位:NTU)切换工作模式,浊度≤50为“高清拍摄”,50<浊度≤100为“普通探测”,浊度>100为“避障巡航”,实现该逻辑最适合的结构是( )
A.单分支结构 B.分支结构 C.多分支结构 D.循环结构
(4)机器人在执行“水下采样”任务时,需重复检测水质pH值,直到采集到3组有效数据(pH值在6.5~8.5之间),如下图,该循环逻辑适合用( )实现。
A.当循环 B.直到循环 C.顺序结构嵌套 D.多分支结构嵌套
(5)乐乐计划为机器人新增“水温预警”功能,完整的编程解决问题四个步骤的顺序应为( )
①编写Python程序 ②抽象与建模 ③调试运行 ④设计算法
A.②④①③ B.④②①③ C.②①④③ D.①②④③
(6)以下关于机器人控制程序的编程语言描述错误的是( )
A.机器语言由二进制代码组成,可直接被机器人处理器执行
B.Python属于高级语言,需编译后才能运行
C.机器语言可读性强,适合复杂程序的开发
D.Python程序必须转换为机器语言才能在机器人上运行
(7)机器人状态数据,module_type="front"(前模块)、battery=89.5(剩余电晕)、is_working=True(工作状态),这三个变量的数据类型依次是( )
A.整型、浮点型、布尔型 B.字符串型、浮点型、布尔型
C.字符串型、整型、布尔型 D.字符串型、浮点型、整型
(8)在机器人推进器功率监控程序中,需判断推进器是否满足“高效且安全”的工作条件,核心逻辑如下:已知公式:基础功率power = (voltage **2) / resistance判断条件:
①基础功率大于等于500W且小于等于800W;
②实时电流current小于15A或工作温度temp不高于60℃;
③最终需输出“是否满足高效且安全条件”的布尔结果。
请根据上述逻辑,选出以下能正确实现该判断的赋值语句( )
A.result = (power >=500 and power <=800) or (current <15 or temp <=60)
B.result = (power >=500 and power <=800) and (current <15 or temp <=60)
C.result = (power >=500 or power <=800) or (current <15 or temp <60)
D.result = (power >=500 and power <=800) and current <15 or temp <=60
(9)在Python中,statistics库是处理基础统计计算的常用库,其中median()函数用于计算一组数值的中位数。乐乐需要计算水下机器人采集的5组能见度数据[12.5,15.8,9.7,14.2,11.8]的中位数,请将以下代码补充完整。
____ #导入库
result =____([12.5,15.8,9.7,14.2,11.8])
(10)机器人的设备编号为字符串device_id = "ROV-2025-058",若要提取年份“2025”,正确的操作是( )
A.device_id[4:8] B.device_id[3:8] C.device_id[4:7] D.device_id[3:7]
(11)机器人核心模块的温度监测系统中存储了部分部件的实时温度列表 temp = [28.3,30.1,29.7,31.2],执行以下Python语句后,列表temp的值为( )
temp = [28.3,30.1,29.7,31.2]
temp.remove(30.1)
temp.append(29.2)
temp[0] =28.5
A.[28.328.5,29.7,31.2] B.[28.3,28.5,29.7,29.2]
C.[28.5,29.2,29.7,31.2] D.[28.5,29.7,31.2,29.2]
(12)机器人通过枚举算法排查模块是否有故障,各个模块的工作状态存储在列表module_status里,0代表正常,1代表故障,如module_status=[0,1,0,…],列表长度未知。编程输出故障模块的数量,若没故障,输出“无故障”。
sum =0 #统计故障模块的个数
____
3. 综合题三 PM2.5数据与气象要素的关联性分析
大气污染防控是生态环境保护的重要课题,PM2.5作为主要的大气污染物之一,其质量浓度变化不仅受污染源影响,还与气象要素密切相关。为探究不同城市PM2.5污染特征以及气象要素的影响机制,小玲、小菲和小柏组建了研究小组,选取我国五个典型城市(北京、广州、昆明、南京、西宁)作为观测站点,收集2015-2017年的PM2.5质量浓度数据和气象要素数据,经过数据预处理后,开展系统性分析。
数据文件说明:研究小组使用的数据集存储为"pm25.csv",数据为“城市-日期-PM2.5浓度”唯一对应的日综合数据(即:同一城市在同一日期下,PM2.5浓度为当日小时数据的平均值),部分数据片段如下:
城市
日期
PM2.5浓度
降雨量
平均气压
平均气温
平均相对湿度
平均风速
北京
2015-1-1
125.3μg/m3
0mm
102.3kPa
-2.5℃
65.2%
1.8m/s
北京
2015-1-1
125.3μg/m3
0mm
102.3kPa
-2.5℃
65.2%
1.8m/s
广州
2015-1-2
42.1μg/m3
5.2mm
101.1kPa
15.3℃
78.5%
2.3m/s
昆明
2015-1-3
28.7μg/m3
0mm
81.2kPa
8.6℃
58.3%
1.5m/s
南京
2015-1-4
76.9μg/m3
2.1mm
101.5kPa
3.2℃
72.6%
2m/s
西宁
2015-1-5
92.4μg/m3
0mm
77.8kPa
-5.1℃
458%
2.5m/s
(1)小玲在某些气象网站找到较多的可用数据。若要使用Python程序采集网页数据,首先需要获取该网页,以下主要用来实现该功能的第三方库是( )
A.requests B.turtle C.pandas D.numpy
(2)小玲先将采集得到的相关数据保存至" pm25.csv"数据集文件中,小菲导入Python相关库读取该文件。为实现该功能,请将以下代码补充完整。
import pandas as pd
df = pd.___ (" pm25.csv",encoding = " ANSI")
(3)数据采集过程中因设备重复上传导致的冗余数据,需通过去重处理保留一条有效记录。题干中“pm25.csv”的哪两个字段最适合作为重复值的判断依据( )
A.城市 B.日期 C.PM2.5浓度 D.降雨量
(4)小菲发现有些数值明显偏离其余数值,数据整理与分析中,一般使用( )能较清晰地观察到异常值的存在。
A.柱状图 B.散点图 C.折线图 D.箱形图
(5)小菲想要从df中选取并显示“城市”“PM2.5浓度”“降雨量”三列数据,正确的Python代码是( )
A.df ["城市","PM2.5浓度","降雨量"]
B.df [["城市","PM2.5浓度","降雨量"]]
C.df.get ["城市","PM2.5浓度","降雨量"]
D.df.read_columns ["城市","PM2.5浓度","降雨量"]
(6)小菲想要计算北京2015年的PM2.5平均浓度,需筛选出“城市”为“北京”且“日期”是2015年的数据。下列Python代码中,能实现该功能的是( )
A.df [(df ["城市"]=="北京") & df ["日期"].str.contains("2015")]["PM2.5浓度"].mean()
B.df [(df ["城市"]=="北京" & df ["日期"].str.contains("2015"))["PM2.5浓度"].mean()
C.df [(df ["城市"]=="北京") and (df ["日期"].str.contains("2015"))["PM2.5浓度"].mean()
D.df [(df ["城市"]=="北京",df["日期"].str.contains("2015"))["PM2.5浓度"].mean()
(7)研究小组想比较五个城市1月1日PM2.5浓度值的差异,应采用的数据分析基本方法是( )
A.结构分析法 B.对比分析法 C.平均分析法 D.回归分析法
(8)若要呈现五个城市PM2.5浓度的季节分布占比,例如每个城市春季、夏季、秋季、冬季PM2.5浓度占全年的比例,最适合选择的可视化图表是( )
A.折线图 B.饼图 C.柱状图 D.散点图
(9)下列关于可视化图表作用的说法错误的是( )
A.散点图可分析PM2.5浓度与平均气温的相关关系
B.折线图可展示北京PM2.5浓度的日变化趋势
C.箱形图可呈现南京PM2.5浓度的分布及异常值
D.柱状图可用于预测未来某城市的PM2.5浓度值
(10)为保护数据中可能包含的个人隐私信息,研究小组对数据进行了脱敏处理,下列不属于数据脱敏操作的是( )
A.隐藏监测站点的详细地址
B.对“平均气压”数据保留1位小数
C.替换监测人员的姓名为“观测员A”“观测员B”
D.屏蔽部分敏感字段的中间几位数据
(11)小柏通过建立模型分析降雨量、温湿度等气象要素与PM2.5质量浓度的相关性,该模型主要用于研究一个因变量与多个自变量的线性关系,最终得到的模型公式如下:
y=-0.657x1-0.09x3-1.283x5+6.982x6-7.062x7+0.214x8+1.263x9+2.105x10-8.037x11-3.213x12+0.465x13+2.374
通过这一模型能够预测PM2.5质量浓度,这里使用的机器学习是( )
A.非监督学习 B.聚类 C.半监督学习 D.回归
(12)下图为PM2.5质量浓度与降雨等级的关系图,请你根据图表信息归纳得出结论。____
____________________________________________________________________________________________
Python帮助小贴士
1.pandas库
函数
简单示例
功能
pandas.read_csv()
pandas.read_csv('文件名.扩展名')
读取当前目录csv文件
DataFrame.to_csv()
DataFrame.to_csv('文件名.扩展名')
存储当前目录的csv文件
2.Matplotlib.pyplot库
函数
简单示例
功能
matplotlib.pyplot.bar()
matplotlib.pyplot.bar(x,y)
绘制柱状图
matplotlib.pyplot.plot()
matplotlib.pyplot.plot(x,y)
绘制折线图
matplotlib.pyplot.pie()
matplotlibpyplot.pie(x)
绘制饼图
matplotlib.pyplot.scatter()
matplotlib.pyplot.scatter(x,y)
绘制散点图
matplotlib.pyplot.boxplot()
matplotlib.pyplot.boxplot(x)
绘制箱形图
matplotlib.pyplot.title()
matplotlib.pyplot.title('标题')
添加标题的名称
matplotlib.pyplot.xlabel()
matplotlib.pyplot.xlabel('x轴名称')
添加x轴的名称
matplotlib.pyplot.ylabel()
matplotlib.pyplot.ylabel('y轴名称')
添加y轴的名称
matplotlib.pyplot.show()
matplotlib.pyplot.show()
在本机显示图形
3.Python内置函数
函数
简单示例
功能
input()
input()
从键盘输入数据
print()
print(x)
输出x的值
len()
len(x)
返回x的长度或个数
range()
range(x,y,step)
返回一个区间为[x,y),步长为step的等差序列
round()
round(x,i)
数值x保留i位小数,四舍五入(不含五)
int()
int(x)
返回数值x的整数部分
第1页/共1页
学科网(北京)股份有限公司
$