专题提升4-【学考一号】2025年高中信息技术学业水平复习方略精讲精练

2025-04-14

| 2份

| 6页

| 28人阅读

| 4人下载

金华市合创展教育图书有限公司

进店逛逛

资源信息

学段	高中
学科	信息技术
教材版本	-
年级	高三
章节	-
类型	题集
知识点	数据与计算，信息系统与社会，数据与数据结构
使用场景	高考复习-学业考试
学年	2025-2026
地区（省份）	全国
地区（市）	-
地区（区县）	-
文件格式	ZIP
文件大小	2.38 MB
发布时间	2025-04-14
更新时间	2025-04-14
作者	金华市合创展教育图书有限公司
品牌系列	学考一号·高中复习方略
审核时间	2025-02-19
下载链接	https://m.zxxk.com/soft/50520082.html
价格	2.00储值（1储值=1元）
来源	学科网

内容正文：

专题提升四一尧选择题 1. 下列关于数据整理的说法袁错误的是渊冤 A. 数据集中缺失的数据可以采用中间值来填充 B. 数据集中异常数据可能包含重要信息 C. 数据集中重复数据可进行合并删除处理 D. 数据集中格式不一致的数据袁一般保留一种格式的数据袁删除其他格式的数据 2. 下列关于数据管理的说法袁正确的是渊冤 A. 计算机管理的都是结构化数据 B. 计算机一般以软件的形式存储数据 C. 数据管理的目的是充分发挥数据的价值 D. 现在社会只能用计算机进行数据管理 3. 下列关于计算机数据管理阶段的描述袁不正确的是渊冤 A. 计算机数据管理的三个阶段都有它适用的场合 B. 在人工管理阶段袁人们主要依靠大脑管理和利用数据 C. 计算机数据管理的三个阶段为院人工管理尧文件管理尧数据库管理 D. 在文件管理阶段袁计算机的作用只是进行科学计算 4. 野cj.csv冶文件中数据包含野学号冶野姓名冶野信息冶野通用冶等字段及若干个数据行袁下列程序段执行后袁关于对象 cjdata中数据变化的说法正确的是渊冤 import pandas as pd cjdata=pd.read_csv("cj.csv",encoding="gbk") cjdata.drop("信息",axis=1) cjdata.sort_values("通用",inplace=True) A. 按野通用冶升序排列 B. 不再包含野信息冶数据列 C. 减少野通用冶数据列 D. 增加了一个数据行 5. Series和 DataFrame是 pandas模块中的数据结构袁下列说法不正确的是渊冤 A. DataFrame中的索引可以通过属性来显示 B. Series 的下标索引值是默认从 0 起递增的整数 C. Series是二维的袁DataFrame是一维的 D. 列表尧字典等可以用来创建 Series 数据结构 6. 下列有关 Series对象的说法袁错误的是渊冤 A. Series对象中必须指定 index B. 通过索引可以选取 Series对象中的值袁通过赋值语句修改 Series对象中的值 C. Series对象中的 index和 values长度必须一致 D. Series对象是一种一维的数据结构袁包含一个数组的数据和一个与数据关联的索引 7. 某 DataFrame 对象 df中包含野品牌冶野销量冶等手机月销售量的信息袁下列语句中能输出 df对象中品牌列的所有数据的是渊冤 A. print(df咱品牌暂) B. print(df.品牌) C. print(df.columns) D. print(df咱2:5暂) 8. 文件野st.xlsx冶第一张 Excel工作表存放了学生信息袁单元格 A1尧B1尧C1 的值分别为野姓名冶野性别冶野出生年月冶袁部分程序代码如下院 import pandas as pd s1越pd.read_excel("st.xlsx") s1.insert(0,column越"班级",value越"原(1)") s2越s1.sort_values("出生年月") 执行该程序代码后袁下列说法错误的是渊冤 A. 对象 s1中袁数据一定是按野出生年月冶升序排列的 136 B. 除索引列外袁对象 s1有 4列数据 C. 对象 s2中袁每一行的班级列的值均为原(1) D. 对象 s1中袁索引列的值是升序排列的 9. 有如下 Python程序段院 import pandas as pd s1=pd.Series(咱"学习","运动","睡觉","吃饭"暂, index=咱"01","02","03","04"暂) s1咱"03"暂="休息" bm=s1.index sub=s1.values time=咱40,90,79,30暂 num=咱13,2,10,3暂 col=咱"活动","时长","次数"暂 data={"活动":sub,"时长":time,"次数":num} df1=pd.DataFrame(data,index=bm,columns=col) print(df1咱df1咱"时长"暂*df1咱"次数"暂>120暂) 运行该程序段袁输出显示的结果为渊冤 A. 活动时长次数 01 学习 40 True 02 运动 90 True 03 休息 79 True 活动时长次数 01 学习 40 13 02 运动 90 2 03 休息 79 10 B. 01 02 03 活动学习 40 13 时长运动 90 2 次数休息 79 10 C. 活动时长次数学习 40 13 运动 90 2 休息 79 10 D. 10. 有如下 Python程序段院 import pandas as pd s2 =pd.Series (咱166,180,178暂,index =咱"s01", "s02","s03"暂) 下列选项中输出结果为 180的是渊冤 A. s1=s2.sort_values(ascending=True) print(s1咱0暂) B. s1=s2.sort_values(ascending=False) print(s1.head(1)) C. print(s2.max()) D. print(s2.values) 二尧非选择题 11. 高一年级渊9个班级冤进行野七选三冶预选科遥每个班一个 Excel文件渊如图 a 所示冤存储预选科数据遥数据表中野1冶代表学生选择该科目袁空白代表学生未选择该科目渊某班部分选科数据如图 b 所示冤遥请回答下列问题院渊1冤定义如下函数 check(dfs)检查选考科目数是否有误袁其中参数 dfs为 DataFrame对象袁由如图 b所示 Excel数据导入遥返回值 erlst为列表袁列表元素数据类型为整型袁表示错误数据行对应的学生序号渊例如第 6 行学生野戴 **跃冶的序号为 5冤遥 def check(dfs): erlst=咱暂 for i in range(len(dfs)): xk_sum=0 for j in dfs.columns咱2:暂: 图 a 图 b 137 dyg= 淤 if dyg==1: xk_sum+=dyg if xk_sum! =3: erlst.append( 于 ) return erlst 淤在程序中画线处填入的正确代码为渊单选袁填字母冤遥 A. dfs.at咱'i','j'暂 B. dfs.at咱'j','i'暂 C. dfs.at咱i,j暂 D. dfs.at咱j,i暂于请在画线处填入合适的代码院遥渊2冤读取每个班级的 Excel选科数据袁若检查无误袁则统计每个班级同时选报野物理冶和野化学冶学科的人数袁存储在字典 ans中遥实现该功能的 Python程序如下院 import pandas as pd ans={} for i in range(1,10): filename=str(i)+'.xlsx' df=pd.read_excel(filename) errlist=check(df) if errlist! =咱暂: print('请检查文件 ',filename,'中序号为 ',errlist,'的学生 ') else: 盂 #筛选同时选择物理和化学的数据记录存储在 df1中 ans咱str(i)+'班 '暂=咱榆暂 #形如{野1班冶:咱41暂} 盂在程序画线处应填入的正确代码段为渊多选袁填字母冤遥 A. df1=df咱df咱'物理 '暂==1暂 df1=df1咱df1咱'化学 '暂==1暂 B. df1=df咱df咱'物理 '暂==1暂 df1=df咱df咱'化学 '暂==1暂 C. df1=df咱df咱'化学 '暂==1暂 df1=df1咱df1咱'物理 '暂==1暂 D. df1=df咱df咱'化学 '暂==1暂 df1=df咱df咱'物理 '暂==1暂榆请在画线处填入合适的代码院遥渊3冤用字典 ans创建并转置的 DataFrame对象如图 c所示袁绘制柱形图如图 d所示遥实现该功能的 Python程序如下院 import matplotlib.pyplot as plt adf=pd.DataFrame(ans,index=咱'人数 '暂).T plt.bar( ) #设置绘图参数袁代码略 plt.show() 程序画线处应填入的正确代码为渊单选袁填字母冤遥 A. adf.人数,adf.班级 B. adf.班级,adf.人数 C. adf.人数,adf.index D. adf.index,adf.人数 12. 如图 1所示袁小明从票房网上收集了 2014要 2022年的票房前 50的数据袁存储在野票房. xlsx冶中遥渊1冤小明收集的数据存在一些问题袁需要进行数据整理袁下列说法合理的是渊单选袁填字母冤遥 A. 数据集中的缺失值一般用任意值填充 B. 数据集中的异常数据须直接删除或忽略 C. 数据集中的重复数据可以直接删除 D. 数据集中格式不一致的数据袁需要进行格式转换 8班7班6班5班3班2班1班 9班 40 35 30 25 20 15 10 5 0 各班级物化捆绑选报人数图 c 图 d 138 渊2冤RANK函数是排名函数袁常用于求某一个数值在某一区域内的排名遥例如院=RANK (E2,E2:E51)袁表示 E2在 E2:E51区域中的排名情况遥现在要求得票房排名袁且 H3:H51 均由 H2填充获得袁则 H2单元格中的公式应修改为遥渊3冤小明利用所学的 DataFrame和 matplotlib 对票房数据进行了分析袁最终算出了累计票房数前五的导演袁并绘制了垂直柱形图渊如图 2所示冤遥 import pandas as pd import matplotlib.pyplot as plt plt.rcParams咱"font.family"暂=咱"sans-serif"暂 plt.rcParams咱"font.sans-serif"暂=咱"SimHei"暂 #中文显示 df1=pd.read_excel("票房.xlsx") daoyan=咱暂 piaofang=咱暂 for i in df1.values: #一部电影可能存在多名导演 s=i咱2暂.split("尧") #按野尧冶分割导演名字 for j in s: daoyan.append(j) 淤 data={"daoyan":daoyan,"piaofang":piaofang} df2=pd.DataFrame(data) 于 #按导演姓名分组 t=t.sum() t=t.sort_values("piaofang",ascending=False) t咱0:5暂.plot(kind="bar",rot=0) plt.title("票房累计前五的导演(亿)") plt.show() 请在画线处填入合适的代码遥淤于 13. 老师收集了 5次技术考试成绩袁分别以考试名称为文件名存放在 5个文件中袁如图 1 所示遥每次考试的数据结构如图 2所示袁同一学生的学号相同袁某次考试不参加则无该学生记录遥所有学生数据存放在野名册. xlsx冶中袁如图 3所示袁考试数据和名册文件均按学号升序排列遥为分析每个学生考试名次的波动情况袁编写 Python程序袁请回答下列问题院图 1 陈凯歌徐峥林超贤陈思诚徐克 0 20 40 60 80 100 120 票房累计前五的导演渊亿冤图 2 piaofang daoyan 139 渊1冤定义 merge 函数袁功能为院读取各次考试的成绩袁合并到一个 DataFrame对象遥程序代码如下袁请在画线处填入合适的代码院遥 import pandas as pd def merge(df,tests): n=len(df) for test in tests: tmp=pd.read_excel(test+".x1sx") df咱test暂=0 #在 df最后插入一列袁值均为 0 i=j=0 while i<len(tmp): if tmp咱"学号"暂咱i暂==df咱"学号"暂咱j暂: i+=1 j+=1 return df 渊2冤计算每个同学各次考试的名次并绘制折线图袁如图 4 所示袁部分 Python 程序如下袁请在画线处填入合适的代码遥 import matplotlib.pyplot as plt plt.rc("font",family="kaiti") #显示中文 tests=咱"期中考","期末考","一模","二模", "三模"暂 #存储 5次考试名称 df=pd.read_excel("名册.xlsx") df=merge(df,tests) n=len(df) for test in tests: df咱test+"名次"暂=0 for i in range( 淤 ): s=0 for j in range(n): if df咱test暂咱j暂>df咱test暂咱1暂: s+=1 df咱test+"名次"暂咱i暂= 于 while True: no=input("输入学号") if no=="": break rec=df咱df.学号==int(no)暂 if len(rec)>0: plt.plot( 盂 ,rec.values咱0暂咱7:暂) plt.title(rec.values咱0暂咱1暂+"历次考试名次波动图") plt.show() 淤于盂渊3冤从图 4可以看出袁该同学成绩一次比一次渊选填院差/好冤遥图 4 三模二模一模期末考期中考 8 6 4 2 0 章 **历次考试名次波动图学号姓名成绩 1 章 ** 99 2 董 ** 96 3 赵 ** 88 6 杨 ** 91 5 陈 ** 94 学号姓名 1 章 ** 2 董 ** 6 杨 ** 5 陈 ** 3 赵 ** 4 孟 ** 图 1 图 2 图 3 140 值袁因此若 total咱item暂咱cno暂==0袁则表明人物 item 在章回号 cno 中出现的次数为 0袁故函数返回值为 False袁反之则返回 True遥专题提升四 1. D揖解析铱不同来源的数据可能存在格式不一致的情况袁需要进行数据转换袁以便形成一个适合后续分析和挖掘的描述形式遥 2. C揖解析铱计算机管理结构化尧非结构化和半结构化数据曰在计算机中一般以文件的形式存储数据曰管理数据的方式有多种遥 3. D揖解析铱在文件管理方面袁计算机还用于进行信息管理等方面遥 4. A揖解析铱语句 cjdata.drop("信息",axis=1)删除了野信息冶数据列袁返回一个新的 DataFrame对象袁但是没有改变 cjdata 对象的内容曰sort_values ("通用 " , inplace=True)按野通用冶升序排列袁改变了 cjdata对象中行的排列顺序遥 5. C揖解析铱Series是一种一维的数据结构袁包含一个数组的数据和一个与数据关联的索引渊index冤袁索引值默认是从 0起递增的整数遥列表尧字典等可以用来创建 Series数据结构袁与列表不同的是袁Series 的索引可以指定袁类型可以为字符串型遥 DataFrame 是一种二维的数据结构袁由一个索引列渊index冤和若干个数据列组成袁每个数据列可以是不同的类型遥 DataFrame中的索引尧列标题及值可以通过属性来显示袁columns属性用来存放各列的列标题遥 6. A揖解析铱Series 对象中可以省略 index袁index 值默认是从 0起递增的整数遥 7. B揖解析铱A选项中少了引号袁C选项显示列标题袁D 选项显示第 2至 4行数据遥 8. A揖解析铱该程序的功能是读入野st.xlsx冶中第一张工作表内容袁并在索引列前增加一列野班级冶袁值均为 “原(1)冶袁将 s1按出生年月升序排列后赋值给 s2袁因此 s1中的数据并未经过排序遥 9. B揖解析铱根据最后一行语句可知袁筛选的是时长和次数之积大于 120的数据遥根据倒数第二行语句可知袁索引是 bm袁列标题是 col遥 10. C揖解析铱选项 A袁对 s2中数据升序排序袁存储到 s1中 s1咱0暂值为 166曰选项 B袁降序排序袁但输出结果为野s02 180冶曰选项 C袁输出最大值为 180曰选项 D袁输出所有值遥 11. 渊1冤淤C 于 i+1 渊2冤盂AC 榆 len (df1)渊或 len(df1.index)冤渊3冤D 揖解析铱渊1冤由程序段可知袁xk_sum存储选科总数袁 dyg 存储当前索引 i 行袁j 列的值袁故答案为 dfs. at咱i,j暂遥如果 xk_sum!=3袁则说明选科总数不对袁需要把错误数据行对应的学生序号添加到 erlst中袁由 excel导入生成的 DataFrame 的对象中行索引从 0开始袁故于答案为 i+1遥渊2冤盂要筛选同时选物理和化学的数据袁需要先对物理进行筛选袁再对化学进行筛选曰或者先对化学进行筛选袁再对物理进行筛选遥B尧D错在筛选结果不叠加遥榆空需要统计同时选物理和化学的人数袁可以用 len(df1) 或 len(df1.index)遥渊3冤各班级作为索引袁因此绘图时袁代码为 adf.index,adf.人数遥 12. 渊1冤D 渊2冤=RANK(E2,$E$2:$E$51)渊或=RANK(E2, E$2:E$51)冤渊3冤淤piaofang.append(i咱4暂/10000) 于t=df2.groupby("daoyan")渊或 t=df2.groupby("daoyan", as_index=True)冤揖解析铱渊1冤数据的缺失值可忽略或采用平均值尧中间值或概率统计值填充曰异常数据有可能是要去掉的噪声袁也有可能是含有重要信息的数据对象袁需要仔细研判后决定曰重复数据须在进一步审核的基础上进行合并或删除遥渊3冤淤通过列表存储每个导演指导的电影的票房袁根据柱形图可知袁票房的数量单位是亿袁所以需要将万转换成亿遥于按导演姓名分组并且用变量 t进行存储遥 13. 渊1冤df.at咱j,test暂=tmp.at咱i,"成绩"暂渊2冤淤n 于s+1 盂tests 渊3冤差揖解析铱渊1冤由题意可知袁当下是要将每一次的成绩汇总到 df当中袁df初始只有学号尧姓名两列袁接下来在 for循环中依次添加咱野期中考冶,野期末考冶, 野一模冶,野二模冶,野三模冶暂列遥while循环的作用主要是防止有部分同学没有参加考试袁此时他的成绩是没有的袁当学号对上则说明有该同学袁需要将当前行列的同学的成绩添加上袁结合程序 df咱test暂 =0可知袁新列列标签为 test袁因此答案为 df.at咱j, test暂=tmp.at咱i,"成绩"暂遥渊2冤依次去求每一次考试的名次袁最外围的 for循环一共五次袁表示五次考试的名次列遥第二个 for循环表示每一位同学袁第三个 for循环用来求所有大于当前同学的成绩有多少个袁用 s来表示计数袁因此第一空答案为 n袁表示每一位同学袁第二空答案为 s+1袁表示当前同学的名次曰第三空用来画图表遥渊3冤由图表可知袁成绩名次越来越靠后袁由此得知成绩在变差遥专题提升五 1. A揖解析铱深度学习是基于数据驱动的人工智能袁需要大量数据袁不可脱离数据进行学习遥 2. C揖解析铱人脸识别属于联结主义的人工智能遥 3. B揖解析铱榆使用的是传感器技术袁虞使用的是网页的搜索功能遥 4. D揖解析铱大数据价值密度低袁不是价值低曰大数据处理全体数据曰处理静态数据使用批处理遥 5. C揖解析铱AlphaGo从围棋跨界到电力控制领域袁属于跨领域人工智能曰强化学习是一种问题引导下的人工智能学习方法曰人工智能的应用可能威胁到个人和公共信息安全遥 6. B揖解析铱通过模仿人类大脑中神经元之间的复杂交互来进行认知推理的是联结主义遥 210

资源预览图

所属专辑

教辅

【学考一号】2025年高中信息技术学业水平复习方略精讲精练

高三信息技术第三方合辑 29 份文档

454人已阅读