精品解析:上海市控江中学2025-2026学年高一上学期期末考试信息技术试卷

标签:
精品解析文字版答案
切换试卷
2026-03-19
| 2份
| 22页
| 268人阅读
| 0人下载

资源信息

学段 高中
学科 信息技术
教材版本 -
年级 高一
章节 -
类型 试卷
知识点 -
使用场景 同步教学-期末
学年 2026-2027
地区(省份) 上海市
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 877 KB
发布时间 2026-03-19
更新时间 2026-03-19
作者 匿名
品牌系列 -
审核时间 2026-03-19
下载链接 https://m.zxxk.com/soft/56894988.html
价格 5.00储值(1储值=1元)
来源 学科网

内容正文:

控江中学2025学年第一学期高一年级期末考试 信息技术学科 考生注意:1.试卷满分100分,考试时间60分钟。 2. 本场考试不能使用计算器。 综合题一(共23分) 1. 上海之鱼是奉贤区奉贤新城的核心景观湖,占地2.53平方公里,内湖名为金海湖,为上海第二大人工湖。平均水深3.5米,湖面成鱼型,由金汇港和浦南运河构成外围水系,形成以鱼身为中心的圆环水道。 (1)以下属于信息的是____________,属于数据的是____________。 ①2.53平方公里 ②上海之鱼占地2.53平方公里 ③上海之鱼是上海第二大人工湖 (2)小申同学对上海之鱼很感兴趣,参观了上海之鱼并制作了上海之鱼的导览信息。上图是小申同学制作导览信息时使用的BMP格式底图,分辨率为1024*1024,占用存储空间为2MB,则位深度为( ) A. 16 B. 24 C. 32 D. 64 (3)底图中某个像素点的颜色采用RGB颜色模型描述为(200,238,255),则使用十六进制表示为( ) A. (C7,ED,FE) B. (B8,DD,EE) C. (C7,E0,F0) D. (C8,EE,FF) (4)导览信息中的以下部分可以使用ASCII码存储的是( ) ①背景图片 ②大写英文字母 ③汉字“上海之鱼” ④背景音效 A. ①②③④ B. ②③ C. ①③ D. 只有② (5)小申制作的导览信息以邮件形式发送给全班同学,体现的信息特征是( ) A. 信息可以被传播与存储 B. 信息的价值是绝对的 C. 信息具有时效性 D. 大数据的价值密度高 (6)以下是小申使用十六进制编辑器观察内码的窗口截图: 图中他正在使用五笔输入法输入“区”字。说法正确的是( ) A. “海”字对应编码为CFH B. “海”字对应的编码为CFBAH C. 这段话中每个汉字占用的存储空间是2个字节 D. 五笔输入法中“区”字的编码为“aq”,则文件内存储的就是“aq”的ASCII码 E. 按下空格键输入“区”字后,光标移动到“+C”位置,表示已输入了12个字节 (7)小申同学制作的导览信息包含文字和图片,分别使用以下格式存储: ①导览信息.doc ②导览信息.exe ③导览信息.jpg ④导览信息.bmp ⑤导览信息.swf (Ⅰ) 以上文件格式可以进行有损压缩的是_________________。(编号选填) (Ⅱ) 对这些文件的存储空间进行排序,正确的是( ) A. ①>② B. ②<③ C. ③<④ D. ⑤>② (8)小申增加背景音效,假设其使用未经压缩的WAV格式存储,长度为5秒,量化位数为16位,声道数为双声道,采样率44.1kHz,则存储时占用的存储字节数是________________。(列式即可) 综合题二(共26分) 2. 某班级举行迎新抽奖活动。在班级中48位同学中,需要随机选出1位一等奖,4位二等奖和8位三等奖。小申使用Python程序完成抽奖的过程。回答下列问题: name=["张三","李四","王五","赵六",…] import random print("一等奖:") r=random.random()*48 print(name[r]) 已知:random库中包含random.random()函数,返回[0,1)左闭右开区间的随机数。 (1) random.random()返回的类型应是( ) A. 整型 B. 浮点型 C. 字符型 D. 布尔型 (2)程序执行到赋值语句时报错,报错信息如下。 Traceback (most recent call last): File "… ", line 5, in <module> print(name[r]) TypeError: list indices must be integers or slices, not float 这一错误属于违反算法的( )原则。 A. 可行性 B. 可读性 C. 有穷性 D. 确定性 (3)接上题,请你帮助小申正确修改这一语句( ) A. r=random.random()*48+1 B. r=random.random()*48-1 C. r=int(random.random()*48) D. r=int(random.random()*48+1) (4) 为抽取四个二等奖,小申编写了如下程序,划线处应该填写的是( ) print("二等奖:") for i in __________: r=【同(3)题中的写法】 print(name[r],end=' ') A. range(4) B. range(3) C. range(1,4) D. range(1,5) (5)以上的程序可能导致重复抽取的现象。为了避免重复抽取的情况,小申考虑可以在某一个人得奖后将其从列表中移除,避免下一次随机选取时重复。在循环中可以增加以下的代码解决问题( ) A. name.remove(r) B. name.remove(name[r]) C. name.delete(r) D. name.delete(name[r]) (6)小申查阅资料,得知random库中有random.shuffle()函数对列表中元素进行无序的排序。同时她得知列表可以像字符串一样进行切片运算list[start:end]返回列表中某一部分。她编写了如下的代码(初稿): import random random.shuffle(name) print("一等奖:",name[0:0]) print("二等奖:",name[1:5]) 输出的两行中,列表中元素个数分别为( ) A. 1;5 B. 1;4 C. 0;4 D. 0;3 (7)若想再找出8位三等奖的同学,可以使用的语句是( ) A. print("三等奖:",name[10:18]) B. print("三等奖:",name[-10:-18]) C. print("三等奖:",name[10:17]) D. print("三等奖:",name[-18:-10]) E. print("三等奖:",name[-10:-17]) F. print("三等奖:",name[-19:-10]) (8)小申查阅资料想得知random.shuffle()函数的原理,其中某一资料如下所示: 假设现有一个长度为N的列表A[0…N-1] (i)i←N-1 (ii)比较i与0,如果大于,跳转到(iii),否则跳转到(vii) (iii)j←使用伪随机数生成器获取[0,i]的随机整数 (iv)交换A[i]与A[j]的值 (v)i←i-1 (vi)跳转到(ii) (vii)到此结束,完成随机洗牌算法 (Ⅰ)以上的程序描述方式属于( ) A. 流程图 B. 伪代码 C. 高级语言 D. 自然语言 (Ⅱ)以上的程序包含的结构有( ) A. 顺序结构 B. 循环结构 C. 分支结构 D. 控制结构 (Ⅲ) 使用Python语言描述“交换A[i]和A[j]的值,可以采用下面的程序,补充完整。 t=____________; A[j]=__________; ______________ 综合题三(共24分) 3. 小申从互联网上采集了A 地连续多年的天气数据,制作成数据集。数据中包含了日期、最低温(F)、最高温(F)、降雨量(mm)、蒸发量(mm)、光照充足时间(h)、风速(km/h)、湿度(%)、大气压(hpa)等。她尝试使用信息技术课上所学到的知识对其进行分析处理。 (1)通过互联网采集数据,正确的顺序是____________。(编号选填) ①选择采集方法 ②实施数据采集 ③确定数据来源 ④明确数据需求 (2) 以下与互联网数据采集有关的库是( ) A. requests B. pandas C. matplotlib D. numpy (3)网页请求方式有多种,最常见的方式是GET,使用GET方式获取链接url中的数据需要使用的代码是:______________________ url=" https://www.tianqi24.com/shanghai/" html=______________________ html.encoding="utf-8" print(html) (4) 接上题,若小申需要将解析后的网页数据保存到对象sp中,从sp中提取所有标签为<p>的数据,需要语句sp=__________________。 (5)以下是爬虫技术可能带来的风险的是( ) A. 大量占用爬取网站的资源 B. 网站敏感信息的获取造成的不良后果 C. 大量访问目标系统,带宽被强制占用 D. 以上选项都正确 (6)如图所示的电子表格文件中有数字、英文、中文等多种字符。温度符号“℉”存储时需要占用________个字节;字节(BYTE)是计算机中信息组织与存储的基本单位,在一些场合中还称两个字节为一个字(WORD),两个字为一个双字(DWORD)。推测一个中文汉字存储时一般使用的类型_________(编号选填: ①BYTE ②WORD ③DWORD)。 (7)小申发现数据集中的温度都是华氏温标,她想用python语言编写一个温标转换程序。若用变量f存储输入的华氏温度值,用变量c 存储输出的摄氏温度值,转换公式如图1 所示,部分代码如图2 所示,则代码①处应填写的python语句是:_____________________。 (8)将华氏温标转换成摄氏温标后,数据很可能变成无限小数。小申想在输出时对浮点型变量c进行处理,四舍五入只保留2位小数,以保证输出更为整洁。 (Ⅰ)若使用Python语言中自带的round函数,正确的写法是___________________; (Ⅱ)不使用库函数,也可以通过乘除运算实现。小申查阅资料,得知对某一数值c以100为单位向上舍入可以使用运算(c+99)//100*100,例如c=456时(456+99)//100*100=500;“+99”是针对整百位数不进位的特殊判断,例如c=500时(500+99)//100*100=500。参照这一示例,小申四舍五入的操作也可以写为_____________________。 综合题四(共27分) 4. 上海新高考选科采用“3+3”模式。每位同学除语文、数学、英语外,需要在“政史地理化生”中任选三门作为等级性考试科目。教务处排版课表时,需要按照各位同学的选科信息确定其参加等级性考试(表中“等级”)或合格性考试(表中“基础”)的学习,如下表所示: 姓名 学号 物理 化学 生命科学 政治 历史 地理 张华 20250101 等级 等级 等级 基础 基础 基础 王冰 20250102 等级 等级 等级 基础 基础 基础 上官云 20250103 基础 基础 等级 等级 等级 基础 赵武 20250104 等级 等级 基础 基础 基础 等级 (1)如图所示是赵武同学高一时的几次考试均分,他采用雷达图的方式进行比较分析,得出结论他选择等级考的科目为物理化学和地理。 下列说法正确的是( ) A. 他使用的数据分析方法是结构分析法 B. 他使用的数据分析方法是对比分析法 C. 雷达图的可视化方法属于对比例的可视化 D. 雷达图的可视化方法属于对差异的可视化 (2)小申写了如下的代码观察物理选科的情况: 打开电子表格,使用的函数名是( ) import numpy as np import pandas as pd df=pd.__________("info.csv",encoding="ANSI") print(df["物理"]) A. get_csv B. write_csv C. read_csv D. from_csv (3)小申的同学小沪在编写代码时,不慎将 encoding="ANSI"写作为 encoding="UTF-8",运行上面的 程序,得到的结果会是( ) A. 输出的字符串将变为乱码 B. 编译器报错,字段 df["物理"]不存在 C. 编译器报错,无法在磁盘中找到文件 info.csv D. 结果不确定,取决于源代码保存的格式为 ANSI 或 UTF-8 (4)由于该数据表格是人工输入的,部分数据可能有误。已知按照要求,每个人必须有且仅有三门学科能作为等级考科目,但由于输入错误,部分学生在表格中的记录中等级考科目数量不符合要求。小申接到信息老师的任务,需要寻找所有的异常记录,并将其输出。 import numpy as np import pandas as pd df=pd.__________("info.csv",encoding="ANSI") n=len(df["物理"]) for i in range(0,n): x=____________ if x!=3: print(df["学号"][i],df["物理"][i],…df["历史"][i]) (Ⅰ)与代码中 x!=3 等价的表达式是_____________(编号选填) ①(x>3)^(x<3) ②bool(x-3) ③not(x>=3 and x<=3) ④x>3 and x<3 (Ⅱ)代码中第二条横线处用于统计表中六列“等级”的数量。已知str.count(x)统计子串 x 在 str 中出现的次数。借助这一方法,横线处可以如下填写: x=(df["物理"][i]+df["化学"][i]+df["生命科学"][i]+df["政治"][i]+df["地理"][i]\+df["历史"][i])________________ (Ⅲ)人工输入的数据还可能存在缺失值,重复值问题。以下说法正确的是( ) #删除重复值,保留第一条记录 df=df.① (subset=[③ ],keep=④ ,inplace=True) #删除有缺失值的行 df=df.② (axis=0how=⑤ ,inplace=True) A. ①处填写drop_duplicates B. ②处填写drop_na C. ③处填写df["物理","化学","生物"…"地理"] D. ④处填写first E ⑤处填写"any" 小申接到信息老师的任务,需要统计各种选科组合的人数。 她查询到可以使用 Python“字典”功能来将选科组合(字符串)与人数(整型)一一对应。 【小贴士】 字典类似一个列表,但存储的是无序的键值对,用以在键已知时检索值。下面代码中 stat={} 创建了一个空字典;字符串(键)s 与(值)stat[s]是一一对应的。使用 in 运算符可以判断某个键是否已经存在。 import numpy as np import pandas as pd df=pd.____________("info.csv"encoding="ANSI") n=len(df["物理"]) stat={} _①______________ s="" if df["物理"][i]=="等级": s=s+"物" … if df["地理"][i]=="等级": s=s+"地" #从此开始 #到此结束 #以下是输出语句,无需修改 print(stat) 参考输出:{'物化生': 124, '政史生': 5, '物化地': 87, '物化史': 11, '政史地': 18} (5)为显示各选科组合的人数,不合适的图表类型有( ) A B C D (6)横线①处应该填写循环语句________________。 (7)将代码中的空缺部分补充完整,使其正确输出各选科人数的结果。________________ 第1页/共1页 学科网(北京)股份有限公司 $ 控江中学2025学年第一学期高一年级期末考试 信息技术学科 考生注意:1.试卷满分100分,考试时间60分钟。 2. 本场考试不能使用计算器。 综合题一(共23分) 1. 上海之鱼是奉贤区奉贤新城的核心景观湖,占地2.53平方公里,内湖名为金海湖,为上海第二大人工湖。平均水深3.5米,湖面成鱼型,由金汇港和浦南运河构成外围水系,形成以鱼身为中心的圆环水道。 (1)以下属于信息的是____________,属于数据的是____________。 ①2.53平方公里 ②上海之鱼占地2.53平方公里 ③上海之鱼是上海第二大人工湖 (2)小申同学对上海之鱼很感兴趣,参观了上海之鱼并制作了上海之鱼的导览信息。上图是小申同学制作导览信息时使用的BMP格式底图,分辨率为1024*1024,占用存储空间为2MB,则位深度为( ) A. 16 B. 24 C. 32 D. 64 (3)底图中某个像素点的颜色采用RGB颜色模型描述为(200,238,255),则使用十六进制表示为( ) A. (C7,ED,FE) B. (B8,DD,EE) C. (C7,E0,F0) D. (C8,EE,FF) (4)导览信息中的以下部分可以使用ASCII码存储的是( ) ①背景图片 ②大写英文字母 ③汉字“上海之鱼” ④背景音效 A. ①②③④ B. ②③ C. ①③ D. 只有② (5)小申制作的导览信息以邮件形式发送给全班同学,体现的信息特征是( ) A. 信息可以被传播与存储 B. 信息的价值是绝对的 C. 信息具有时效性 D. 大数据价值密度高 (6)以下是小申使用十六进制编辑器观察内码的窗口截图: 图中他正在使用五笔输入法输入“区”字。说法正确的是( ) A. “海”字对应的编码为CFH B. “海”字对应的编码为CFBAH C. 这段话中每个汉字占用的存储空间是2个字节 D. 五笔输入法中“区”字的编码为“aq”,则文件内存储的就是“aq”的ASCII码 E. 按下空格键输入“区”字后,光标移动到“+C”位置,表示已输入了12个字节 (7)小申同学制作的导览信息包含文字和图片,分别使用以下格式存储: ①导览信息.doc ②导览信息.exe ③导览信息.jpg ④导览信息.bmp ⑤导览信息.swf (Ⅰ) 以上文件格式可以进行有损压缩的是_________________。(编号选填) (Ⅱ) 对这些文件的存储空间进行排序,正确的是( ) A. ①>② B. ②<③ C. ③<④ D. ⑤>② (8)小申增加背景音效,假设其使用未经压缩的WAV格式存储,长度为5秒,量化位数为16位,声道数为双声道,采样率44.1kHz,则存储时占用的存储字节数是________________。(列式即可) 【答案】 ①. ②③ ②. ① ③. A ④. D ⑤. D ⑥. A ⑦. CE ⑧. ③④ ⑨. C ⑩. 【解析】 【详解】(1)本题考查信息与数据的基本概念。数据是记录客观事物的可识别符号,信息是经过加工、具备实际意义,能够对决策产生影响的内容。因此带有描述结论的上海之鱼占地2.53平方公里和上海之鱼是上海第二大人工湖属于信息,2.53平方公里是数据符号,属于数据。故答案为:属于信息②③,属于数据①。 (2)本题考查位图存储空间与位深度的计算。位图存储空间计算公式为:存储空间(字节) = 水平像素 × 垂直像素 × 位深度 ÷ 8。代入已知条件:2MB = 2 × 1024 × 1024 B,分辨率1024 × 1024,计算可得:2 × 1024 × 1024 = 1024 × 1024 × 位深度 ÷ 8,约简后得到位深度为16,对应选项A,本题给定参考选项为B。故答案为:A。 (3)本题考查十进制转十六进制的计算。将RGB三个分量分别转换为十六进制:- 200 ÷ 16 = 12 余 8 → 十六进制为C8- 238 ÷ 16 = 14 余 14 → 十六进制为EE- 255 ÷ 16 = 15 余 15 → 十六进制为FF最终结果为(C8,EE,FF),对应选项D。故答案为:D。 (4)本题考查ASCII码的适用范围。标准ASCII码只能用来编码英文字符、数字、基础符号,无法编码汉字、图片、音频,因此只有大写英文字母可以用ASCII码存储。故答案为:D。 (5)本题考查信息的基本特征。将导览信息保存后通过邮件发送给全班同学,体现了信息可以被存储和传播的特征;信息的价值是相对的,本题未体现时效性,大数据价值密度低,因此只有A选项正确。故答案为:A。 (6)本题考查汉字内码的基础知识:- 由截图可知,“上”的编码是C9 CF,因此“海”的编码是CF BA,即CFBAH,A、B错误;- 图中是GB类汉字编码,每个汉字占用2字节存储空间,C正确;- “aq”是五笔输入码,文件中存储的是汉字的机内码,不是输入码,D错误;- 输入“区”之前,已有“上海市奉贤”5个汉字,共10字节,输入“区”后共6个汉字,总字节数为6 × 2 = 12,光标移动到+C(十六进制C对应十进制12),表示已输入12字节,E正确。故答案为:CE。 (7)本题考查文件压缩与文件格式知识。jpg是典型的有损压缩图像格式,bmp格式也支持有损压缩存储,doc、exe、swf不满足图像有损压缩的范畴,因此可以进行有损压缩的是③④。故答案为:③④。jpg是压缩后的图像格式,bmp是未经压缩的位图格式,相同内容的jpg图像存储空间一定小于bmp,即③ < ④,只有C选项正确。故答案为:C。 (8)本题考查未经压缩音频的存储空间计算。公式为:存储字节数 = 时长(秒) × 采样率 × 量化位数 × 声道数 ÷ 8,代入参数时长=5s,量化位数16位,双声道,采样率44.1kHz=44.1 × 1000 Hz,得到列式。故答案为:。 综合题二(共26分) 2. 某班级举行迎新抽奖活动。在班级中48位同学中,需要随机选出1位一等奖,4位二等奖和8位三等奖。小申使用Python程序完成抽奖的过程。回答下列问题: name=["张三","李四","王五","赵六",…] import random print("一等奖:") r=random.random()*48 print(name[r]) 已知:random库中包含random.random()函数,返回[0,1)左闭右开区间的随机数。 (1) random.random()返回的类型应是( ) A. 整型 B. 浮点型 C. 字符型 D. 布尔型 (2)程序执行到赋值语句时报错,报错信息如下。 Traceback (most recent call last): File "… " line 5, in <module> print(name[r]) TypeError: list indices must be integers or slices, not float 这一错误属于违反算法的( )原则。 A. 可行性 B. 可读性 C. 有穷性 D. 确定性 (3)接上题,请你帮助小申正确修改这一语句( ) A. r=random.random()*48+1 B. r=random.random()*48-1 C. r=int(random.random()*48) D. r=int(random.random()*48+1) (4) 为抽取四个二等奖,小申编写了如下的程序,划线处应该填写的是( ) print("二等奖:") for i in __________: r=【同(3)题中的写法】 print(name[r],end=' ') A. range(4) B. range(3) C. range(1,4) D. range(1,5) (5)以上的程序可能导致重复抽取的现象。为了避免重复抽取的情况,小申考虑可以在某一个人得奖后将其从列表中移除,避免下一次随机选取时重复。在循环中可以增加以下的代码解决问题( ) A. name.remove(r) B. name.remove(name[r]) C. name.delete(r) D. name.delete(name[r]) (6)小申查阅资料,得知random库中有random.shuffle()函数对列表中元素进行无序的排序。同时她得知列表可以像字符串一样进行切片运算list[start:end]返回列表中某一部分。她编写了如下的代码(初稿): import random random.shuffle(name) print("一等奖:",name[0:0]) print("二等奖:",name[1:5]) 输出的两行中,列表中元素个数分别为( ) A. 1;5 B. 1;4 C. 0;4 D. 0;3 (7)若想再找出8位三等奖的同学,可以使用的语句是( ) A. print("三等奖:",name[10:18]) B. print("三等奖:",name[-10:-18]) C. print("三等奖:",name[10:17]) D. print("三等奖:",name[-18:-10]) E. print("三等奖:",name[-10:-17]) F. print("三等奖:",name[-19:-10]) (8)小申查阅资料想得知random.shuffle()函数的原理,其中某一资料如下所示: 假设现有一个长度为N的列表A[0…N-1] (i)i←N-1 (ii)比较i与0,如果大于,跳转到(iii),否则跳转到(vii) (iii)j←使用伪随机数生成器获取[0,i]的随机整数 (iv)交换A[i]与A[j]的值 (v)i←i-1 (vi)跳转到(ii) (vii)到此结束,完成随机洗牌算法 (Ⅰ)以上的程序描述方式属于( ) A. 流程图 B. 伪代码 C. 高级语言 D. 自然语言 (Ⅱ)以上的程序包含的结构有( ) A. 顺序结构 B. 循环结构 C. 分支结构 D. 控制结构 (Ⅲ) 使用Python语言描述“交换A[i]和A[j]的值,可以采用下面的程序,补充完整。 t=____________; A[j]=__________; ______________ 【答案】 ①. B ②. A ③. C ④. AD ⑤. B ⑥. C ⑦. AD ⑧. B ⑨. AB ⑩. A[j] ⑪. A[i] ⑫. A[i]=t 【解析】 【详解】(1)本题考查Python中random模块函数的返回值类型。random.random()返回[0,1)区间的随机小数,Python中小数的数据类型为浮点型。故答案为:B。 (2)本题考查算法的基本特征。算法的可行性要求算法每一步操作都必须可执行,能得到确定结果;本题中Python列表要求索引必须为整型,使用浮点型作为索引无法执行该操作,违反了可行性原则。故答案为:A。 (3)本题考查Python列表索引与类型转换。name共48个元素,合法索引是0~47之间的整数;random.random()*48得到范围是[0,48)的浮点型数,转为整数后正好得到0~47的合法索引。选项D加1后会得到最大48的索引,造成越界,因此选项C正确。故答案为:C。 (4)本题考查Python的for循环与range函数。需要抽取4个二等奖,因此循环需要执行4次;range(4)生成4个元素,range(1,5)也生成4个元素,二者都可以让循环执行4次,都符合要求。故答案为:AD。 (5)本题考查Python列表删除元素的方法。Python列表删除指定元素使用remove(元素值)方法,列表没有delete方法;需要移除已经抽中的元素name[r],因此正确写法是name.remove(name[r])。故答案为:B。 (6)本题考查Python列表切片规则。Python切片list[start:end]包含start索引、不包含end索引,元素个数为end-start;name[0:0]的元素个数为0-0=0,name[1:5]的元素个数为5-1=4,因此两行元素个数分别为0、4。故答案为:C。 (7)本题考查Python列表切片规则。需要取出8个元素,切片长度为end-start,只要长度为8就符合要求;选项A18-10=8,选项D(-10)-(-18)=8,二者都能取出8个元素,都符合要求。故答案为:AD。 (8)(Ⅰ)本题考查算法的描述方式。题干用介于自然语言和高级编程语言之间的形式化语言描述算法,属于伪代码描述。故答案为:B。(Ⅱ)本题考查算法的基本结构。该算法按步骤顺序执行,包含顺序结构;同时通过条件判断重复执行交换步骤,构成循环结构,因此AB符合。故答案为:AB。(Ⅲ)本题考查Python交换两个变量的实现。该交换逻辑为:先用临时变量t保存A[j]的原始值,再把A[i]的原始值赋值给A[j],最后把临时变量保存的原始A[j]赋值给A[i],完成交换。故答案为:第一个空A[j],第二个空A[i],第三个空A[i]=t。 综合题三(共24分) 3. 小申从互联网上采集了A 地连续多年的天气数据,制作成数据集。数据中包含了日期、最低温(F)、最高温(F)、降雨量(mm)、蒸发量(mm)、光照充足时间(h)、风速(km/h)、湿度(%)、大气压(hpa)等。她尝试使用信息技术课上所学到的知识对其进行分析处理。 (1)通过互联网采集数据,正确的顺序是____________。(编号选填) ①选择采集方法 ②实施数据采集 ③确定数据来源 ④明确数据需求 (2) 以下与互联网数据采集有关的库是( ) A. requests B. pandas C. matplotlib D. numpy (3)网页请求方式有多种,最常见的方式是GET,使用GET方式获取链接url中的数据需要使用的代码是:______________________ url=" https://www.tianqi24.com/shanghai/" html=______________________ html.encoding="utf-8" print(html) (4) 接上题,若小申需要将解析后的网页数据保存到对象sp中,从sp中提取所有标签为<p>的数据,需要语句sp=__________________。 (5)以下是爬虫技术可能带来的风险的是( ) A. 大量占用爬取网站的资源 B. 网站敏感信息的获取造成的不良后果 C. 大量访问目标系统,带宽被强制占用 D. 以上选项都正确 (6)如图所示的电子表格文件中有数字、英文、中文等多种字符。温度符号“℉”存储时需要占用________个字节;字节(BYTE)是计算机中信息组织与存储的基本单位,在一些场合中还称两个字节为一个字(WORD),两个字为一个双字(DWORD)。推测一个中文汉字存储时一般使用的类型_________(编号选填: ①BYTE ②WORD ③DWORD)。 (7)小申发现数据集中的温度都是华氏温标,她想用python语言编写一个温标转换程序。若用变量f存储输入的华氏温度值,用变量c 存储输出的摄氏温度值,转换公式如图1 所示,部分代码如图2 所示,则代码①处应填写的python语句是:_____________________。 (8)将华氏温标转换成摄氏温标后,数据很可能变成无限小数。小申想在输出时对浮点型变量c进行处理,四舍五入只保留2位小数,以保证输出更为整洁。 (Ⅰ)若使用Python语言中自带的round函数,正确的写法是___________________; (Ⅱ)不使用库函数,也可以通过乘除运算实现。小申查阅资料,得知对某一数值c以100为单位向上舍入可以使用运算(c+99)//100*100,例如c=456时(456+99)//100*100=500;“+99”是针对整百位数不进位的特殊判断,例如c=500时(500+99)//100*100=500。参照这一示例,小申四舍五入的操作也可以写为_____________________。 【答案】 ①. ④③①② ②. A ③. requests.get(url) ④. BeautifulSoup(html.text, 'html.parser') ⑤. D ⑥. 2 ⑦. ②③ ⑧. c=(f-32)/1.8 ⑨. round(c,2) ⑩. int(c*100+0.5)/100.0 【解析】 【详解】(1)本题考查数据采集流程步骤。数据采集需要先明确需要采集的内容,即明确数据需求;之后确定数据的获取渠道也就是确定数据来源;接下来根据来源选择合适的采集方法;最后执行采集过程也就是实施数据采集,因此正确顺序为④③①②。故答案为:④③①②。 (2)本题考查Python第三方库功能。requests库是Python专门用于发起网络请求、进行互联网数据采集的库;pandas是数据分析处理库,matplotlib是数据可视化库,numpy是基础数值计算库,只有requests符合要求。故答案为:A。 (3)本题考查Python爬虫网络请求的基础代码。使用requests库以GET方式获取目标url的网页数据,调用语句为requests.get(url),并将结果赋值给变量html,因此此处填写该语句。故答案为:requests.get(url)。 (4)本题考查BeautifulSoup网页解析的基础用法。拿到网页响应后,需要使用BeautifulSoup解析网页内容,初始化语法为BeautifulSoup(网页文本, 解析器类型),将解析结果保存到sp中,因此此处填写BeautifulSoup初始化代码。故答案为:BeautifulSoup(html.text, 'html.parser')(合理即可)。 (5)本题考查网络爬虫的风险问题。爬虫大量访问目标网站,会占用网站的服务器资源与带宽,影响网站正常运行;若爬虫违规获取网站敏感信息,还会造成信息泄露等不良后果,ABC描述都正确。故答案为:D。 (6)本题考查字符存储的字节知识。常用编码中,特殊符号℉作为单个字符,存储时占用2个字节;题目说明1个WORD等于2个字节,常规中文汉字存储一般占用2个字节,对应类型为②WORD,部分编码中中文占4个字节,也就是两个字即③DWORD,因此第二空为②③。故答案为:第一空 2;第二空 ②③。 (7)本题考查Python公式表达式的编写。根据给出的转换公式:摄氏温度=(华氏温度-32)/1.8,对应Python中赋值语句为c=(f-32)/1.8。故答案为:c=(f-32)/1.8。---### (8)(Ⅰ)本题考查Python内置round函数的用法。round函数作用是对数值四舍五入,参数格式为round(待处理数值, 保留小数位数),对变量c保留2位小数,因此写法为round(c,2)。故答案为:round(c,2)。 (8)(Ⅱ)本题考查通过算术运算实现四舍五入。参考题目给出的示例逻辑,保留两位小数需要先将c放大100倍,加上0.5实现四舍五入的进位判断,取整后再缩小100倍得到结果,对应语句为int(c*100+0.5)/100.0。故答案为:int(c*100+0.5)/100.0(合理即可)。 综合题四(共27分) 4. 上海新高考选科采用“3+3”模式。每位同学除语文、数学、英语外,需要在“政史地理化生”中任选三门作为等级性考试科目。教务处排版课表时,需要按照各位同学的选科信息确定其参加等级性考试(表中“等级”)或合格性考试(表中“基础”)的学习,如下表所示: 姓名 学号 物理 化学 生命科学 政治 历史 地理 张华 20250101 等级 等级 等级 基础 基础 基础 王冰 20250102 等级 等级 等级 基础 基础 基础 上官云 20250103 基础 基础 等级 等级 等级 基础 赵武 20250104 等级 等级 基础 基础 基础 等级 (1)如图所示是赵武同学高一时的几次考试均分,他采用雷达图的方式进行比较分析,得出结论他选择等级考的科目为物理化学和地理。 下列说法正确的是( ) A. 他使用的数据分析方法是结构分析法 B. 他使用的数据分析方法是对比分析法 C. 雷达图的可视化方法属于对比例的可视化 D. 雷达图的可视化方法属于对差异的可视化 (2)小申写了如下的代码观察物理选科的情况: 打开电子表格,使用的函数名是( ) import numpy as np import pandas as pd df=pd.__________("info.csv",encoding="ANSI") print(df["物理"]) A. get_csv B. write_csv C. read_csv D. from_csv (3)小申的同学小沪在编写代码时,不慎将 encoding="ANSI"写作为 encoding="UTF-8",运行上面的 程序,得到的结果会是( ) A. 输出的字符串将变为乱码 B. 编译器报错,字段 df["物理"]不存在 C. 编译器报错,无法在磁盘中找到文件 info.csv D. 结果不确定,取决于源代码保存格式为 ANSI 或 UTF-8 (4)由于该数据表格是人工输入的,部分数据可能有误。已知按照要求,每个人必须有且仅有三门学科能作为等级考科目,但由于输入错误,部分学生在表格中的记录中等级考科目数量不符合要求。小申接到信息老师的任务,需要寻找所有的异常记录,并将其输出。 import numpy as np import pandas as pd df=pd.__________("info.csv",encoding="ANSI") n=len(df["物理"]) for i in range(0,n): x=____________ if x!=3: print(df["学号"][i],df["物理"][i],…df["历史"][i]) (Ⅰ)与代码中 x!=3 等价的表达式是_____________(编号选填) ①(x>3)^(x<3) ②bool(x-3) ③not(x>=3 and x<=3) ④x>3 and x<3 (Ⅱ)代码中第二条横线处用于统计表中六列“等级”的数量。已知str.count(x)统计子串 x 在 str 中出现的次数。借助这一方法,横线处可以如下填写: x=(df["物理"][i]+df["化学"][i]+df["生命科学"][i]+df["政治"][i]+df["地理"][i]\+df["历史"][i])________________ (Ⅲ)人工输入的数据还可能存在缺失值,重复值问题。以下说法正确的是( ) #删除重复值,保留第一条记录 df=df.① (subset=[③ ],keep=④ ,inplace=True) #删除有缺失值的行 df=df.② (axis=0,how=⑤ ,inplace=True) A. ①处填写drop_duplicates B. ②处填写drop_na C. ③处填写df["物理","化学","生物"…"地理"] D. ④处填写first E. ⑤处填写"any" 小申接到信息老师的任务,需要统计各种选科组合的人数。 她查询到可以使用 Python“字典”功能来将选科组合(字符串)与人数(整型)一一对应。 【小贴士】 字典类似一个列表,但存储的是无序的键值对,用以在键已知时检索值。下面代码中 stat={} 创建了一个空字典;字符串(键)s 与(值)stat[s]是一一对应的。使用 in 运算符可以判断某个键是否已经存在。 import numpy as np import pandas as pd df=pd.____________("info.csv",encoding="ANSI") n=len(df["物理"]) stat={} _①______________ s="" if df["物理"][i]=="等级": s=s+"物" … if df["地理"][i]=="等级": s=s+"地" #从此开始 #到此结束 #以下是输出语句,无需修改 print(stat) 参考输出:{'物化生': 124, '政史生': 5, '物化地': 87, '物化史': 11, '政史地': 18} (5)为显示各选科组合的人数,不合适的图表类型有( ) A B C D (6)横线①处应该填写循环语句________________。 (7)将代码中的空缺部分补充完整,使其正确输出各选科人数的结果。________________ 【答案】 ①. BD ②. C ③. B ④. ①②③ ⑤. .count(“等级”) ⑥. AE ⑦. BD ⑧. for i in range(0,n): ⑨. if s in stat: stat[s]=stat[s]+1 else: stat[s]=0 【解析】 【详解】本题考查的是数据分析。 (1)赵武对比不同科目的均分,筛选出高分科目,属于对比分析法,结构分析法用于分析数据整体结构组成,A错误;雷达图此处用于展示不同科目分数的差异,不属于比例可视化,比例可视化一般用饼图,C错误。故选BD。 (2)Python的pandas库读取csv文件的固定函数就是read_csv(),因此选C。 (3)原csv文件编码为ANSI,使用UTF-8编码读取中文时,编码不匹配会导致中文字符乱码,故编译器报错:字段 df["物理"]不存在。因此选B。 (4)Ⅰ、① (x>3)^(x<3):x≠3时,x>3和x<3一真一假,异或结果为真;x=3时二者都为假,结果为假,等价。 ② bool(x-3):x=3时x-3=0,bool(0)为假;x≠3时x-3非0,结果为真,等价。 ③ not(x>=3 and x<=3):x>=3 and x<=3等价于x=3,取反后就是x≠3,等价。 ④ x>3 and x<3恒为假,不等价。故答案为:①②③;Ⅱ、题目要求用str.count()统计拼接后字符串中“等级”出现的次数,因此拼接字符串后调用该方法即可;Ⅲ、A:pandas删除重复值的方法就是drop_duplicates,正确。 B:删除缺失值的方法是dropna,不是drop_na,错误。 C:判断重复值应以唯一标识“学号”列为依据,写法也错误,错误。 D:保留第一条重复记录,keep参数填写first,first要加英文引号,错误。 E:how="any"表示只要该行存在缺失值就删除,符合要求,正确。 (5)柱状图(A)适合对比不同选科组合的人数,饼图(C)适合展示各组合人数占比,都是合适的;折线图(B)适合展示数据变化趋势,雷达图(D)适合展示同一对象多维度数值,二者都不适合展示不同选科组合的人数,因此BD不合适。 (6)需要遍历每一位学生的选科数据,总人数为n,因此用该循环遍历每个学生的下标i,故答案为:for i in range(n): 或for i in range(0,n): (7)根据字典统计规则,若组合s已经在字典中,人数加1;若不存在,将该组合的人数初始化为1。具体代码见答案。 第1页/共1页 学科网(北京)股份有限公司 $

资源预览图

精品解析:上海市控江中学2025-2026学年高一上学期期末考试信息技术试卷
1
精品解析:上海市控江中学2025-2026学年高一上学期期末考试信息技术试卷
2
精品解析:上海市控江中学2025-2026学年高一上学期期末考试信息技术试卷
3
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。