精品解析：上海市控江中学2025-2026学年高一上学期期末考试信息技术试卷

标签：

精品解析文字版答案

切换试卷

2026-03-19

| 2份

| 22页

| 268人阅读

| 0人下载

资源信息

学段	高中
学科	信息技术
教材版本	-
年级	高一
章节	-
类型	试卷
知识点	-
使用场景	同步教学-期末
学年	2026-2027
地区（省份）	上海市
地区（市）	-
地区（区县）	-
文件格式	ZIP
文件大小	877 KB
发布时间	2026-03-19
更新时间	2026-03-19
作者	匿名
品牌系列	-
审核时间	2026-03-19
下载链接	https://m.zxxk.com/soft/56894988.html
价格	5.00储值（1储值=1元）
来源	学科网

内容正文：

控江中学2025学年第一学期高一年级期末考试信息技术学科考生注意：1.试卷满分100分，考试时间60分钟。 2. 本场考试不能使用计算器。综合题一（共23分） 1. 上海之鱼是奉贤区奉贤新城的核心景观湖，占地2.53平方公里，内湖名为金海湖，为上海第二大人工湖。平均水深3.5米，湖面成鱼型，由金汇港和浦南运河构成外围水系，形成以鱼身为中心的圆环水道。（1）以下属于信息的是____________，属于数据的是____________。 ①2.53平方公里 ②上海之鱼占地2.53平方公里 ③上海之鱼是上海第二大人工湖（2）小申同学对上海之鱼很感兴趣，参观了上海之鱼并制作了上海之鱼的导览信息。上图是小申同学制作导览信息时使用的BMP格式底图，分辨率为1024*1024，占用存储空间为2MB，则位深度为（） A. 16 B. 24 C. 32 D. 64 （3）底图中某个像素点的颜色采用RGB颜色模型描述为(200,238,255)，则使用十六进制表示为（） A. (C7,ED,FE) B. (B8,DD,EE) C. (C7,E0,F0) D. (C8,EE,FF) （4）导览信息中的以下部分可以使用ASCII码存储的是（） ①背景图片 ②大写英文字母 ③汉字“上海之鱼” ④背景音效 A. ①②③④ B. ②③ C. ①③ D. 只有② （5）小申制作的导览信息以邮件形式发送给全班同学，体现的信息特征是（） A. 信息可以被传播与存储 B. 信息的价值是绝对的 C. 信息具有时效性 D. 大数据的价值密度高（6）以下是小申使用十六进制编辑器观察内码的窗口截图：图中他正在使用五笔输入法输入“区”字。说法正确的是（） A. “海”字对应编码为CFH B. “海”字对应的编码为CFBAH C. 这段话中每个汉字占用的存储空间是2个字节 D. 五笔输入法中“区”字的编码为“aq”，则文件内存储的就是“aq”的ASCII码 E. 按下空格键输入“区”字后，光标移动到“+C”位置，表示已输入了12个字节（7）小申同学制作的导览信息包含文字和图片，分别使用以下格式存储： ①导览信息.doc ②导览信息.exe ③导览信息.jpg ④导览信息.bmp ⑤导览信息.swf （Ⅰ）以上文件格式可以进行有损压缩的是_________________。（编号选填）（Ⅱ）对这些文件的存储空间进行排序，正确的是（） A. ①>② B. ②<③ C. ③<④ D. ⑤>② （8）小申增加背景音效，假设其使用未经压缩的WAV格式存储，长度为5秒，量化位数为16位，声道数为双声道，采样率44.1kHz，则存储时占用的存储字节数是________________。（列式即可）综合题二（共26分） 2. 某班级举行迎新抽奖活动。在班级中48位同学中，需要随机选出1位一等奖，4位二等奖和8位三等奖。小申使用Python程序完成抽奖的过程。回答下列问题： name=["张三","李四","王五","赵六",…] import random print("一等奖:") r=random.random()*48 print(name[r]) 已知：random库中包含random.random()函数，返回[0,1)左闭右开区间的随机数。（1） random.random()返回的类型应是（） A. 整型 B. 浮点型 C. 字符型 D. 布尔型（2）程序执行到赋值语句时报错，报错信息如下。 Traceback (most recent call last): File "… ", line 5, in <module> print(name[r]) TypeError: list indices must be integers or slices, not float 这一错误属于违反算法的（）原则。 A. 可行性 B. 可读性 C. 有穷性 D. 确定性（3）接上题，请你帮助小申正确修改这一语句（） A. r=random.random()*48+1 B. r=random.random()*48-1 C. r=int(random.random()*48) D. r=int(random.random()*48+1) （4）为抽取四个二等奖，小申编写了如下程序，划线处应该填写的是（） print("二等奖:") for i in __________: r=【同（3）题中的写法】 print(name[r],end=' ') A. range(4) B. range(3) C. range(1,4) D. range(1,5) （5）以上的程序可能导致重复抽取的现象。为了避免重复抽取的情况，小申考虑可以在某一个人得奖后将其从列表中移除，避免下一次随机选取时重复。在循环中可以增加以下的代码解决问题（） A. name.remove(r) B. name.remove(name[r]) C. name.delete(r) D. name.delete(name[r]) （6）小申查阅资料，得知random库中有random.shuffle()函数对列表中元素进行无序的排序。同时她得知列表可以像字符串一样进行切片运算list[start:end]返回列表中某一部分。她编写了如下的代码（初稿）： import random random.shuffle(name) print("一等奖：",name[0:0]) print("二等奖：",name[1:5]) 输出的两行中，列表中元素个数分别为（） A. 1；5 B. 1；4 C. 0；4 D. 0；3 （7）若想再找出8位三等奖的同学，可以使用的语句是（） A. print("三等奖：",name[10:18]) B. print("三等奖：",name[-10:-18]) C. print("三等奖：",name[10:17]) D. print("三等奖：",name[-18:-10]) E. print("三等奖：",name[-10:-17]) F. print("三等奖：",name[-19:-10]) （8）小申查阅资料想得知random.shuffle()函数的原理，其中某一资料如下所示：假设现有一个长度为N的列表A[0…N-1] (i)i←N-1 (ii)比较i与0，如果大于，跳转到(iii)，否则跳转到(vii) (iii)j←使用伪随机数生成器获取[0,i]的随机整数 (iv)交换A[i]与A[j]的值 (v)i←i-1 (vi)跳转到(ii) (vii)到此结束，完成随机洗牌算法（Ⅰ）以上的程序描述方式属于（） A. 流程图 B. 伪代码 C. 高级语言 D. 自然语言（Ⅱ）以上的程序包含的结构有（） A. 顺序结构 B. 循环结构 C. 分支结构 D. 控制结构（Ⅲ）使用Python语言描述“交换A[i]和A[j]的值，可以采用下面的程序，补充完整。 t=____________; A[j]=__________; ______________ 综合题三（共24分） 3. 小申从互联网上采集了A 地连续多年的天气数据，制作成数据集。数据中包含了日期、最低温（F）、最高温（F）、降雨量（mm）、蒸发量（mm）、光照充足时间（h）、风速（km/h）、湿度（%）、大气压（hpa）等。她尝试使用信息技术课上所学到的知识对其进行分析处理。（1）通过互联网采集数据，正确的顺序是____________。（编号选填） ①选择采集方法 ②实施数据采集 ③确定数据来源 ④明确数据需求（2）以下与互联网数据采集有关的库是（） A. requests B. pandas C. matplotlib D. numpy （3）网页请求方式有多种，最常见的方式是GET，使用GET方式获取链接url中的数据需要使用的代码是：______________________ url=" https://www.tianqi24.com/shanghai/" html=______________________ html.encoding="utf-8" print(html) （4）接上题，若小申需要将解析后的网页数据保存到对象sp中，从sp中提取所有标签为<p>的数据，需要语句sp=__________________。（5）以下是爬虫技术可能带来的风险的是（） A. 大量占用爬取网站的资源 B. 网站敏感信息的获取造成的不良后果 C. 大量访问目标系统，带宽被强制占用 D. 以上选项都正确（6）如图所示的电子表格文件中有数字、英文、中文等多种字符。温度符号“℉”存储时需要占用________个字节；字节（BYTE）是计算机中信息组织与存储的基本单位，在一些场合中还称两个字节为一个字（WORD），两个字为一个双字（DWORD）。推测一个中文汉字存储时一般使用的类型_________（编号选填： ①BYTE ②WORD ③DWORD）。（7）小申发现数据集中的温度都是华氏温标，她想用python语言编写一个温标转换程序。若用变量f存储输入的华氏温度值，用变量c 存储输出的摄氏温度值，转换公式如图1 所示，部分代码如图2 所示，则代码①处应填写的python语句是：_____________________。（8）将华氏温标转换成摄氏温标后，数据很可能变成无限小数。小申想在输出时对浮点型变量c进行处理，四舍五入只保留2位小数，以保证输出更为整洁。（Ⅰ）若使用Python语言中自带的round函数，正确的写法是___________________；（Ⅱ）不使用库函数，也可以通过乘除运算实现。小申查阅资料，得知对某一数值c以100为单位向上舍入可以使用运算(c+99)//100*100，例如c=456时(456+99)//100*100=500；“+99”是针对整百位数不进位的特殊判断，例如c=500时(500+99)//100*100=500。参照这一示例，小申四舍五入的操作也可以写为_____________________。综合题四（共27分） 4. 上海新高考选科采用“3+3”模式。每位同学除语文、数学、英语外，需要在“政史地理化生”中任选三门作为等级性考试科目。教务处排版课表时，需要按照各位同学的选科信息确定其参加等级性考试（表中“等级”）或合格性考试（表中“基础”）的学习，如下表所示：姓名学号物理化学生命科学政治历史地理张华 20250101 等级等级等级基础基础基础王冰 20250102 等级等级等级基础基础基础上官云 20250103 基础基础等级等级等级基础赵武 20250104 等级等级基础基础基础等级（1）如图所示是赵武同学高一时的几次考试均分，他采用雷达图的方式进行比较分析，得出结论他选择等级考的科目为物理化学和地理。下列说法正确的是（） A. 他使用的数据分析方法是结构分析法 B. 他使用的数据分析方法是对比分析法 C. 雷达图的可视化方法属于对比例的可视化 D. 雷达图的可视化方法属于对差异的可视化（2）小申写了如下的代码观察物理选科的情况：打开电子表格，使用的函数名是（） import numpy as np import pandas as pd df=pd.__________("info.csv",encoding="ANSI") print(df["物理"]) A. get_csv B. write_csv C. read_csv D. from_csv （3）小申的同学小沪在编写代码时，不慎将 encoding="ANSI"写作为 encoding="UTF-8"，运行上面的程序，得到的结果会是（） A. 输出的字符串将变为乱码 B. 编译器报错，字段 df["物理"]不存在 C. 编译器报错，无法在磁盘中找到文件 info.csv D. 结果不确定，取决于源代码保存的格式为 ANSI 或 UTF-8 （4）由于该数据表格是人工输入的，部分数据可能有误。已知按照要求，每个人必须有且仅有三门学科能作为等级考科目，但由于输入错误，部分学生在表格中的记录中等级考科目数量不符合要求。小申接到信息老师的任务，需要寻找所有的异常记录，并将其输出。 import numpy as np import pandas as pd df=pd.__________("info.csv",encoding="ANSI") n=len(df["物理"]) for i in range(0,n): x=____________ if x!=3: print(df["学号"][i],df["物理"][i],…df["历史"][i]) （Ⅰ）与代码中 x!=3 等价的表达式是_____________（编号选填） ①(x>3)^(x<3) ②bool(x-3) ③not(x>=3 and x<=3) ④x>3 and x<3 （Ⅱ）代码中第二条横线处用于统计表中六列“等级”的数量。已知str.count(x)统计子串 x 在 str 中出现的次数。借助这一方法，横线处可以如下填写： x=(df["物理"][i]+df["化学"][i]+df["生命科学"][i]+df["政治"][i]+df["地理"][i]\+df["历史"][i])________________ （Ⅲ）人工输入的数据还可能存在缺失值，重复值问题。以下说法正确的是（） #删除重复值，保留第一条记录 df=df.① (subset=[③ ],keep=④ ,inplace=True) #删除有缺失值的行 df=df.② (axis=0how=⑤ ,inplace=True) A. ①处填写drop_duplicates B. ②处填写drop_na C. ③处填写df["物理","化学","生物"…"地理"] D. ④处填写first E ⑤处填写"any" 小申接到信息老师的任务，需要统计各种选科组合的人数。她查询到可以使用 Python“字典”功能来将选科组合（字符串）与人数（整型）一一对应。【小贴士】字典类似一个列表，但存储的是无序的键值对，用以在键已知时检索值。下面代码中 stat={} 创建了一个空字典；字符串（键）s 与（值）stat[s]是一一对应的。使用 in 运算符可以判断某个键是否已经存在。 import numpy as np import pandas as pd df=pd.____________("info.csv"encoding="ANSI") n=len(df["物理"]) stat={} _①______________ s="" if df["物理"][i]=="等级": s=s+"物" … if df["地理"][i]=="等级": s=s+"地" #从此开始 #到此结束 #以下是输出语句，无需修改 print(stat) 参考输出：{'物化生': 124, '政史生': 5, '物化地': 87, '物化史': 11, '政史地': 18} （5）为显示各选科组合的人数，不合适的图表类型有（） A B C D （6）横线①处应该填写循环语句________________。（7）将代码中的空缺部分补充完整，使其正确输出各选科人数的结果。________________ 第1页/共1页学科网（北京）股份有限公司 $ 控江中学2025学年第一学期高一年级期末考试信息技术学科考生注意：1.试卷满分100分，考试时间60分钟。 2. 本场考试不能使用计算器。综合题一（共23分） 1. 上海之鱼是奉贤区奉贤新城的核心景观湖，占地2.53平方公里，内湖名为金海湖，为上海第二大人工湖。平均水深3.5米，湖面成鱼型，由金汇港和浦南运河构成外围水系，形成以鱼身为中心的圆环水道。（1）以下属于信息的是____________，属于数据的是____________。 ①2.53平方公里 ②上海之鱼占地2.53平方公里 ③上海之鱼是上海第二大人工湖（2）小申同学对上海之鱼很感兴趣，参观了上海之鱼并制作了上海之鱼的导览信息。上图是小申同学制作导览信息时使用的BMP格式底图，分辨率为1024*1024，占用存储空间为2MB，则位深度为（） A. 16 B. 24 C. 32 D. 64 （3）底图中某个像素点的颜色采用RGB颜色模型描述为(200,238,255)，则使用十六进制表示为（） A. (C7,ED,FE) B. (B8,DD,EE) C. (C7,E0,F0) D. (C8,EE,FF) （4）导览信息中的以下部分可以使用ASCII码存储的是（） ①背景图片 ②大写英文字母 ③汉字“上海之鱼” ④背景音效 A. ①②③④ B. ②③ C. ①③ D. 只有② （5）小申制作的导览信息以邮件形式发送给全班同学，体现的信息特征是（） A. 信息可以被传播与存储 B. 信息的价值是绝对的 C. 信息具有时效性 D. 大数据价值密度高（6）以下是小申使用十六进制编辑器观察内码的窗口截图：图中他正在使用五笔输入法输入“区”字。说法正确的是（） A. “海”字对应的编码为CFH B. “海”字对应的编码为CFBAH C. 这段话中每个汉字占用的存储空间是2个字节 D. 五笔输入法中“区”字的编码为“aq”，则文件内存储的就是“aq”的ASCII码 E. 按下空格键输入“区”字后，光标移动到“+C”位置，表示已输入了12个字节（7）小申同学制作的导览信息包含文字和图片，分别使用以下格式存储： ①导览信息.doc ②导览信息.exe ③导览信息.jpg ④导览信息.bmp ⑤导览信息.swf （Ⅰ）以上文件格式可以进行有损压缩的是_________________。（编号选填）（Ⅱ）对这些文件的存储空间进行排序，正确的是（） A. ①>② B. ②<③ C. ③<④ D. ⑤>② （8）小申增加背景音效，假设其使用未经压缩的WAV格式存储，长度为5秒，量化位数为16位，声道数为双声道，采样率44.1kHz，则存储时占用的存储字节数是________________。（列式即可）【答案】 ①. ②③ ②. ① ③. A ④. D ⑤. D ⑥. A ⑦. CE ⑧. ③④ ⑨. C ⑩. 【解析】【详解】（1）本题考查信息与数据的基本概念。数据是记录客观事物的可识别符号，信息是经过加工、具备实际意义，能够对决策产生影响的内容。因此带有描述结论的上海之鱼占地2.53平方公里和上海之鱼是上海第二大人工湖属于信息，2.53平方公里是数据符号，属于数据。故答案为：属于信息②③，属于数据①。（2）本题考查位图存储空间与位深度的计算。位图存储空间计算公式为：存储空间(字节) = 水平像素 × 垂直像素 × 位深度 ÷ 8。代入已知条件：2MB = 2 × 1024 × 1024 B，分辨率1024 × 1024，计算可得：2 × 1024 × 1024 = 1024 × 1024 × 位深度 ÷ 8，约简后得到位深度为16，对应选项A，本题给定参考选项为B。故答案为：A。（3）本题考查十进制转十六进制的计算。将RGB三个分量分别转换为十六进制：- 200 ÷ 16 = 12 余 8 → 十六进制为C8- 238 ÷ 16 = 14 余 14 → 十六进制为EE- 255 ÷ 16 = 15 余 15 → 十六进制为FF最终结果为(C8，EE，FF)，对应选项D。故答案为：D。（4）本题考查ASCII码的适用范围。标准ASCII码只能用来编码英文字符、数字、基础符号，无法编码汉字、图片、音频，因此只有大写英文字母可以用ASCII码存储。故答案为：D。（5）本题考查信息的基本特征。将导览信息保存后通过邮件发送给全班同学，体现了信息可以被存储和传播的特征；信息的价值是相对的，本题未体现时效性，大数据价值密度低，因此只有A选项正确。故答案为：A。（6）本题考查汉字内码的基础知识：- 由截图可知，“上”的编码是C9 CF，因此“海”的编码是CF BA，即CFBAH，A、B错误；- 图中是GB类汉字编码，每个汉字占用2字节存储空间，C正确；- “aq”是五笔输入码，文件中存储的是汉字的机内码，不是输入码，D错误；- 输入“区”之前，已有“上海市奉贤”5个汉字，共10字节，输入“区”后共6个汉字，总字节数为6 × 2 = 12，光标移动到+C（十六进制C对应十进制12），表示已输入12字节，E正确。故答案为：CE。（7）本题考查文件压缩与文件格式知识。jpg是典型的有损压缩图像格式，bmp格式也支持有损压缩存储，doc、exe、swf不满足图像有损压缩的范畴，因此可以进行有损压缩的是③④。故答案为：③④。jpg是压缩后的图像格式，bmp是未经压缩的位图格式，相同内容的jpg图像存储空间一定小于bmp，即③ < ④，只有C选项正确。故答案为：C。（8）本题考查未经压缩音频的存储空间计算。公式为：存储字节数 = 时长(秒) × 采样率 × 量化位数 × 声道数 ÷ 8，代入参数时长=5s，量化位数16位，双声道，采样率44.1kHz=44.1 × 1000 Hz，得到列式。故答案为：。综合题二（共26分） 2. 某班级举行迎新抽奖活动。在班级中48位同学中，需要随机选出1位一等奖，4位二等奖和8位三等奖。小申使用Python程序完成抽奖的过程。回答下列问题： name=["张三","李四","王五","赵六",…] import random print("一等奖:") r=random.random()*48 print(name[r]) 已知：random库中包含random.random()函数，返回[0,1)左闭右开区间的随机数。（1） random.random()返回的类型应是（） A. 整型 B. 浮点型 C. 字符型 D. 布尔型（2）程序执行到赋值语句时报错，报错信息如下。 Traceback (most recent call last): File "… " line 5, in <module> print(name[r]) TypeError: list indices must be integers or slices, not float 这一错误属于违反算法的（）原则。 A. 可行性 B. 可读性 C. 有穷性 D. 确定性（3）接上题，请你帮助小申正确修改这一语句（） A. r=random.random()*48+1 B. r=random.random()*48-1 C. r=int(random.random()*48) D. r=int(random.random()*48+1) （4）为抽取四个二等奖，小申编写了如下的程序，划线处应该填写的是（） print("二等奖:") for i in __________: r=【同（3）题中的写法】 print(name[r],end=' ') A. range(4) B. range(3) C. range(1,4) D. range(1,5) （5）以上的程序可能导致重复抽取的现象。为了避免重复抽取的情况，小申考虑可以在某一个人得奖后将其从列表中移除，避免下一次随机选取时重复。在循环中可以增加以下的代码解决问题（） A. name.remove(r) B. name.remove(name[r]) C. name.delete(r) D. name.delete(name[r]) （6）小申查阅资料，得知random库中有random.shuffle()函数对列表中元素进行无序的排序。同时她得知列表可以像字符串一样进行切片运算list[start:end]返回列表中某一部分。她编写了如下的代码（初稿）： import random random.shuffle(name) print("一等奖：",name[0:0]) print("二等奖：",name[1:5]) 输出的两行中，列表中元素个数分别为（） A. 1；5 B. 1；4 C. 0；4 D. 0；3 （7）若想再找出8位三等奖的同学，可以使用的语句是（） A. print("三等奖：",name[10:18]) B. print("三等奖：",name[-10:-18]) C. print("三等奖：",name[10:17]) D. print("三等奖：",name[-18:-10]) E. print("三等奖：",name[-10:-17]) F. print("三等奖：",name[-19:-10]) （8）小申查阅资料想得知random.shuffle()函数的原理，其中某一资料如下所示：假设现有一个长度为N的列表A[0…N-1] (i)i←N-1 (ii)比较i与0，如果大于，跳转到(iii)，否则跳转到(vii) (iii)j←使用伪随机数生成器获取[0,i]的随机整数 (iv)交换A[i]与A[j]的值 (v)i←i-1 (vi)跳转到(ii) (vii)到此结束，完成随机洗牌算法（Ⅰ）以上的程序描述方式属于（） A. 流程图 B. 伪代码 C. 高级语言 D. 自然语言（Ⅱ）以上的程序包含的结构有（） A. 顺序结构 B. 循环结构 C. 分支结构 D. 控制结构（Ⅲ）使用Python语言描述“交换A[i]和A[j]的值，可以采用下面的程序，补充完整。 t=____________; A[j]=__________; ______________ 【答案】 ①. B ②. A ③. C ④. AD ⑤. B ⑥. C ⑦. AD ⑧. B ⑨. AB ⑩. A[j] ⑪. A[i] ⑫. A[i]=t 【解析】【详解】（1）本题考查Python中random模块函数的返回值类型。random.random()返回[0,1)区间的随机小数，Python中小数的数据类型为浮点型。故答案为：B。（2）本题考查算法的基本特征。算法的可行性要求算法每一步操作都必须可执行，能得到确定结果；本题中Python列表要求索引必须为整型，使用浮点型作为索引无法执行该操作，违反了可行性原则。故答案为：A。（3）本题考查Python列表索引与类型转换。name共48个元素，合法索引是0~47之间的整数；random.random()*48得到范围是[0,48)的浮点型数，转为整数后正好得到0~47的合法索引。选项D加1后会得到最大48的索引，造成越界，因此选项C正确。故答案为：C。（4）本题考查Python的for循环与range函数。需要抽取4个二等奖，因此循环需要执行4次；range(4)生成4个元素，range(1,5)也生成4个元素，二者都可以让循环执行4次，都符合要求。故答案为：AD。（5）本题考查Python列表删除元素的方法。Python列表删除指定元素使用remove(元素值)方法，列表没有delete方法；需要移除已经抽中的元素name[r]，因此正确写法是name.remove(name[r])。故答案为：B。（6）本题考查Python列表切片规则。Python切片list[start:end]包含start索引、不包含end索引，元素个数为end-start；name[0:0]的元素个数为0-0=0，name[1:5]的元素个数为5-1=4，因此两行元素个数分别为0、4。故答案为：C。（7）本题考查Python列表切片规则。需要取出8个元素，切片长度为end-start，只要长度为8就符合要求；选项A18-10=8，选项D(-10)-(-18)=8，二者都能取出8个元素，都符合要求。故答案为：AD。（8）（Ⅰ）本题考查算法的描述方式。题干用介于自然语言和高级编程语言之间的形式化语言描述算法，属于伪代码描述。故答案为：B。（Ⅱ）本题考查算法的基本结构。该算法按步骤顺序执行，包含顺序结构；同时通过条件判断重复执行交换步骤，构成循环结构，因此AB符合。故答案为：AB。（Ⅲ）本题考查Python交换两个变量的实现。该交换逻辑为：先用临时变量t保存A[j]的原始值，再把A[i]的原始值赋值给A[j]，最后把临时变量保存的原始A[j]赋值给A[i]，完成交换。故答案为：第一个空A[j]，第二个空A[i]，第三个空A[i]=t。综合题三（共24分） 3. 小申从互联网上采集了A 地连续多年的天气数据，制作成数据集。数据中包含了日期、最低温（F）、最高温（F）、降雨量（mm）、蒸发量（mm）、光照充足时间（h）、风速（km/h）、湿度（%）、大气压（hpa）等。她尝试使用信息技术课上所学到的知识对其进行分析处理。（1）通过互联网采集数据，正确的顺序是____________。（编号选填） ①选择采集方法 ②实施数据采集 ③确定数据来源 ④明确数据需求（2）以下与互联网数据采集有关的库是（） A. requests B. pandas C. matplotlib D. numpy （3）网页请求方式有多种，最常见的方式是GET，使用GET方式获取链接url中的数据需要使用的代码是：______________________ url=" https://www.tianqi24.com/shanghai/" html=______________________ html.encoding="utf-8" print(html) （4）接上题，若小申需要将解析后的网页数据保存到对象sp中，从sp中提取所有标签为<p>的数据，需要语句sp=__________________。（5）以下是爬虫技术可能带来的风险的是（） A. 大量占用爬取网站的资源 B. 网站敏感信息的获取造成的不良后果 C. 大量访问目标系统，带宽被强制占用 D. 以上选项都正确（6）如图所示的电子表格文件中有数字、英文、中文等多种字符。温度符号“℉”存储时需要占用________个字节；字节（BYTE）是计算机中信息组织与存储的基本单位，在一些场合中还称两个字节为一个字（WORD），两个字为一个双字（DWORD）。推测一个中文汉字存储时一般使用的类型_________（编号选填： ①BYTE ②WORD ③DWORD）。（7）小申发现数据集中的温度都是华氏温标，她想用python语言编写一个温标转换程序。若用变量f存储输入的华氏温度值，用变量c 存储输出的摄氏温度值，转换公式如图1 所示，部分代码如图2 所示，则代码①处应填写的python语句是：_____________________。（8）将华氏温标转换成摄氏温标后，数据很可能变成无限小数。小申想在输出时对浮点型变量c进行处理，四舍五入只保留2位小数，以保证输出更为整洁。（Ⅰ）若使用Python语言中自带的round函数，正确的写法是___________________；（Ⅱ）不使用库函数，也可以通过乘除运算实现。小申查阅资料，得知对某一数值c以100为单位向上舍入可以使用运算(c+99)//100*100，例如c=456时(456+99)//100*100=500；“+99”是针对整百位数不进位的特殊判断，例如c=500时(500+99)//100*100=500。参照这一示例，小申四舍五入的操作也可以写为_____________________。【答案】 ①. ④③①② ②. A ③. requests.get(url) ④. BeautifulSoup(html.text, 'html.parser') ⑤. D ⑥. 2 ⑦. ②③ ⑧. c=(f-32)/1.8 ⑨. round(c,2) ⑩. int(c*100+0.5)/100.0 【解析】【详解】（1）本题考查数据采集流程步骤。数据采集需要先明确需要采集的内容，即明确数据需求；之后确定数据的获取渠道也就是确定数据来源；接下来根据来源选择合适的采集方法；最后执行采集过程也就是实施数据采集，因此正确顺序为④③①②。故答案为：④③①②。（2）本题考查Python第三方库功能。requests库是Python专门用于发起网络请求、进行互联网数据采集的库；pandas是数据分析处理库，matplotlib是数据可视化库，numpy是基础数值计算库，只有requests符合要求。故答案为：A。（3）本题考查Python爬虫网络请求的基础代码。使用requests库以GET方式获取目标url的网页数据，调用语句为requests.get(url)，并将结果赋值给变量html，因此此处填写该语句。故答案为：requests.get(url)。（4）本题考查BeautifulSoup网页解析的基础用法。拿到网页响应后，需要使用BeautifulSoup解析网页内容，初始化语法为BeautifulSoup(网页文本, 解析器类型)，将解析结果保存到sp中，因此此处填写BeautifulSoup初始化代码。故答案为：BeautifulSoup(html.text, 'html.parser')（合理即可）。（5）本题考查网络爬虫的风险问题。爬虫大量访问目标网站，会占用网站的服务器资源与带宽，影响网站正常运行；若爬虫违规获取网站敏感信息，还会造成信息泄露等不良后果，ABC描述都正确。故答案为：D。（6）本题考查字符存储的字节知识。常用编码中，特殊符号℉作为单个字符，存储时占用2个字节；题目说明1个WORD等于2个字节，常规中文汉字存储一般占用2个字节，对应类型为②WORD，部分编码中中文占4个字节，也就是两个字即③DWORD，因此第二空为②③。故答案为：第一空 2；第二空 ②③。（7）本题考查Python公式表达式的编写。根据给出的转换公式：摄氏温度=(华氏温度-32)/1.8，对应Python中赋值语句为c=(f-32)/1.8。故答案为：c=(f-32)/1.8。---### （8）（Ⅰ）本题考查Python内置round函数的用法。round函数作用是对数值四舍五入，参数格式为round(待处理数值, 保留小数位数)，对变量c保留2位小数，因此写法为round(c,2)。故答案为：round(c,2)。（8）（Ⅱ）本题考查通过算术运算实现四舍五入。参考题目给出的示例逻辑，保留两位小数需要先将c放大100倍，加上0.5实现四舍五入的进位判断，取整后再缩小100倍得到结果，对应语句为int(c*100+0.5)/100.0。故答案为：int(c*100+0.5)/100.0（合理即可）。综合题四（共27分） 4. 上海新高考选科采用“3+3”模式。每位同学除语文、数学、英语外，需要在“政史地理化生”中任选三门作为等级性考试科目。教务处排版课表时，需要按照各位同学的选科信息确定其参加等级性考试（表中“等级”）或合格性考试（表中“基础”）的学习，如下表所示：姓名学号物理化学生命科学政治历史地理张华 20250101 等级等级等级基础基础基础王冰 20250102 等级等级等级基础基础基础上官云 20250103 基础基础等级等级等级基础赵武 20250104 等级等级基础基础基础等级（1）如图所示是赵武同学高一时的几次考试均分，他采用雷达图的方式进行比较分析，得出结论他选择等级考的科目为物理化学和地理。下列说法正确的是（） A. 他使用的数据分析方法是结构分析法 B. 他使用的数据分析方法是对比分析法 C. 雷达图的可视化方法属于对比例的可视化 D. 雷达图的可视化方法属于对差异的可视化（2）小申写了如下的代码观察物理选科的情况：打开电子表格，使用的函数名是（） import numpy as np import pandas as pd df=pd.__________("info.csv",encoding="ANSI") print(df["物理"]) A. get_csv B. write_csv C. read_csv D. from_csv （3）小申的同学小沪在编写代码时，不慎将 encoding="ANSI"写作为 encoding="UTF-8"，运行上面的程序，得到的结果会是（） A. 输出的字符串将变为乱码 B. 编译器报错，字段 df["物理"]不存在 C. 编译器报错，无法在磁盘中找到文件 info.csv D. 结果不确定，取决于源代码保存格式为 ANSI 或 UTF-8 （4）由于该数据表格是人工输入的，部分数据可能有误。已知按照要求，每个人必须有且仅有三门学科能作为等级考科目，但由于输入错误，部分学生在表格中的记录中等级考科目数量不符合要求。小申接到信息老师的任务，需要寻找所有的异常记录，并将其输出。 import numpy as np import pandas as pd df=pd.__________("info.csv",encoding="ANSI") n=len(df["物理"]) for i in range(0,n): x=____________ if x!=3: print(df["学号"][i],df["物理"][i],…df["历史"][i]) （Ⅰ）与代码中 x!=3 等价的表达式是_____________（编号选填） ①(x>3)^(x<3) ②bool(x-3) ③not(x>=3 and x<=3) ④x>3 and x<3 （Ⅱ）代码中第二条横线处用于统计表中六列“等级”的数量。已知str.count(x)统计子串 x 在 str 中出现的次数。借助这一方法，横线处可以如下填写： x=(df["物理"][i]+df["化学"][i]+df["生命科学"][i]+df["政治"][i]+df["地理"][i]\+df["历史"][i])________________ （Ⅲ）人工输入的数据还可能存在缺失值，重复值问题。以下说法正确的是（） #删除重复值，保留第一条记录 df=df.① (subset=[③ ],keep=④ ,inplace=True) #删除有缺失值的行 df=df.② (axis=0,how=⑤ ,inplace=True) A. ①处填写drop_duplicates B. ②处填写drop_na C. ③处填写df["物理","化学","生物"…"地理"] D. ④处填写first E. ⑤处填写"any" 小申接到信息老师的任务，需要统计各种选科组合的人数。她查询到可以使用 Python“字典”功能来将选科组合（字符串）与人数（整型）一一对应。【小贴士】字典类似一个列表，但存储的是无序的键值对，用以在键已知时检索值。下面代码中 stat={} 创建了一个空字典；字符串（键）s 与（值）stat[s]是一一对应的。使用 in 运算符可以判断某个键是否已经存在。 import numpy as np import pandas as pd df=pd.____________("info.csv",encoding="ANSI") n=len(df["物理"]) stat={} _①______________ s="" if df["物理"][i]=="等级": s=s+"物" … if df["地理"][i]=="等级": s=s+"地" #从此开始 #到此结束 #以下是输出语句，无需修改 print(stat) 参考输出：{'物化生': 124, '政史生': 5, '物化地': 87, '物化史': 11, '政史地': 18} （5）为显示各选科组合的人数，不合适的图表类型有（） A B C D （6）横线①处应该填写循环语句________________。（7）将代码中的空缺部分补充完整，使其正确输出各选科人数的结果。________________ 【答案】 ①. BD ②. C ③. B ④. ①②③ ⑤. .count(“等级”) ⑥. AE ⑦. BD ⑧. for i in range(0,n): ⑨. if s in stat: stat[s]=stat[s]+1 else: stat[s]=0 【解析】【详解】本题考查的是数据分析。（1）赵武对比不同科目的均分，筛选出高分科目，属于对比分析法，结构分析法用于分析数据整体结构组成，A错误；雷达图此处用于展示不同科目分数的差异，不属于比例可视化，比例可视化一般用饼图，C错误。故选BD。（2）Python的pandas库读取csv文件的固定函数就是read_csv()，因此选C。（3）原csv文件编码为ANSI，使用UTF-8编码读取中文时，编码不匹配会导致中文字符乱码，故编译器报错：字段 df["物理"]不存在。因此选B。（4）Ⅰ、① (x>3)^(x<3)：x≠3时，x>3和x<3一真一假，异或结果为真；x=3时二者都为假，结果为假，等价。 ② bool(x-3)：x=3时x-3=0，bool(0)为假；x≠3时x-3非0，结果为真，等价。 ③ not(x>=3 and x<=3)：x>=3 and x<=3等价于x=3，取反后就是x≠3，等价。 ④ x>3 and x<3恒为假，不等价。故答案为：①②③；Ⅱ、题目要求用str.count()统计拼接后字符串中“等级”出现的次数，因此拼接字符串后调用该方法即可；Ⅲ、A：pandas删除重复值的方法就是drop_duplicates，正确。 B：删除缺失值的方法是dropna，不是drop_na，错误。 C：判断重复值应以唯一标识“学号”列为依据，写法也错误，错误。 D：保留第一条重复记录，keep参数填写first，first要加英文引号，错误。 E：how="any"表示只要该行存在缺失值就删除，符合要求，正确。（5）柱状图(A)适合对比不同选科组合的人数，饼图(C)适合展示各组合人数占比，都是合适的；折线图(B)适合展示数据变化趋势，雷达图(D)适合展示同一对象多维度数值，二者都不适合展示不同选科组合的人数，因此BD不合适。（6）需要遍历每一位学生的选科数据，总人数为n，因此用该循环遍历每个学生的下标i，故答案为：for i in range(n): 或for i in range(0,n): （7）根据字典统计规则，若组合s已经在字典中，人数加1；若不存在，将该组合的人数初始化为1。具体代码见答案。第1页/共1页学科网（北京）股份有限公司 $

精品解析：上海市控江中学2025-2026学年高一上学期期末考试信息技术试卷

资源信息

内容正文：

资源预览图