专题提升4-【学考一号】2025年高中信息技术学业水平复习方略精讲精练

2025-04-14
| 2份
| 6页
| 28人阅读
| 4人下载
金华市合创展教育图书有限公司
进店逛逛

资源信息

学段 高中
学科 信息技术
教材版本 -
年级 高三
章节 -
类型 题集
知识点 数据与计算,信息系统与社会,数据与数据结构
使用场景 高考复习-学业考试
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 2.38 MB
发布时间 2025-04-14
更新时间 2025-04-14
作者 金华市合创展教育图书有限公司
品牌系列 学考一号·高中复习方略
审核时间 2025-02-19
下载链接 https://m.zxxk.com/soft/50520082.html
价格 2.00储值(1储值=1元)
来源 学科网

内容正文:

专题提升四 一尧选择题 1. 下列关于数据整理的说法袁错误的是 渊 冤 A. 数据集中缺失的数据可以采用中间值来 填充 B. 数据集中异常数据可能包含重要信息 C. 数据集中重复数据可进行合并删除处理 D. 数据集中格式不一致的数据袁一般保留 一种格式的数据袁删除其他格式的数据 2. 下列关于数据管理的说法袁正确的是 渊 冤 A. 计算机管理的都是结构化数据 B. 计算机一般以软件的形式存储数据 C. 数据管理的目的是充分发挥数据的价值 D. 现在社会只能用计算机进行数据管理 3. 下列关于计算机数据管理阶段的描述袁不正 确的是 渊 冤 A. 计算机数据管理的三个阶段都有它适用 的场合 B. 在人工管理阶段袁人们主要依靠大脑管理 和利用数据 C. 计算机数据管理的三个阶段为院人工管 理尧文件管理尧数据库管理 D. 在文件管理阶段袁计算机的作用只是进 行科学计算 4. 野cj.csv冶文件中数据包含野学号冶野姓名冶野信 息冶野通用冶等字段及若干个数据行袁下列程 序段执行后袁关于对象 cjdata中数据变化的 说法正确的是 渊 冤 import pandas as pd cjdata=pd.read_csv("cj.csv",encoding="gbk") cjdata.drop("信息",axis=1) cjdata.sort_values("通用",inplace=True) A. 按野通用冶升序排列 B. 不再包含野信息冶数据列 C. 减少野通用冶数据列 D. 增加了一个数据行 5. Series和 DataFrame是 pandas模块中的数据 结构袁下列说法不正确的是 渊 冤 A. DataFrame中的索引可以通过属性来显示 B. Series 的下标索引值是默认从 0 起递增 的整数 C. Series是二维的袁DataFrame是一维的 D. 列表尧字典等可以用来创建 Series 数据 结构 6. 下列有关 Series对象的说法袁错误的是渊 冤 A. Series对象中必须指定 index B. 通过索引可以选取 Series对象中的值袁通 过赋值语句修改 Series对象中的值 C. Series对象中的 index和 values长度必须 一致 D. Series对象是一种一维的数据结构袁包含 一个数组的数据和一个与数据关联的索引 7. 某 DataFrame 对象 df中包含野品牌冶野销量冶 等手机月销售量的信息袁下列语句中能输出 df对象中品牌列的所有数据的是 渊 冤 A. print(df咱品牌暂) B. print(df.品牌) C. print(df.columns) D. print(df咱2:5暂) 8. 文件野st.xlsx冶第一张 Excel工作表存放了学 生信息袁单元格 A1尧B1尧C1 的值分别为野姓 名冶野性别冶野出生年月冶袁部分程序代码如下院 import pandas as pd s1越pd.read_excel("st.xlsx") s1.insert(0,column越"班级",value越"原(1)") s2越s1.sort_values("出生年月") 执行该程序代码后 袁下列说法错误的是 渊 冤 A. 对象 s1中袁数据一定是按野出生年月冶升 序排列的 136 B. 除索引列外袁对象 s1有 4列数据 C. 对象 s2中袁每一行的班级列的值均为原(1) D. 对象 s1中袁索引列的值是升序排列的 9. 有如下 Python程序段院 import pandas as pd s1=pd.Series(咱"学习","运动","睡觉","吃饭"暂, index=咱"01","02","03","04"暂) s1咱"03"暂="休息" bm=s1.index sub=s1.values time=咱40,90,79,30暂 num=咱13,2,10,3暂 col=咱"活动","时长","次数"暂 data={"活动":sub,"时长":time,"次数":num} df1=pd.DataFrame(data,index=bm,columns=col) print(df1咱df1咱"时长"暂*df1咱"次数"暂>120暂) 运行该程序段袁输出显示的结果为 渊 冤 A. 活动 时长 次数 01 学习 40 True 02 运动 90 True 03 休息 79 True 活动 时长 次数 01 学习 40 13 02 运动 90 2 03 休息 79 10 B. 01 02 03 活动 学习 40 13 时长 运动 90 2 次数 休息 79 10 C. 活动 时长 次数 学习 40 13 运动 90 2 休息 79 10 D. 10. 有如下 Python程序段院 import pandas as pd s2 =pd.Series (咱166,180,178暂,index =咱"s01", "s02","s03"暂) 下列选项中输出结果为 180的是 渊 冤 A. s1=s2.sort_values(ascending=True) print(s1咱0暂) B. s1=s2.sort_values(ascending=False) print(s1.head(1)) C. print(s2.max()) D. print(s2.values) 二尧非选择题 11. 高一年级渊9个班级冤进行野七选三冶预选科遥 每个班一个 Excel文件渊如图 a 所示冤存储 预选科数据遥 数据表中野1冶代表学生选择 该科目袁空白代表学生未选择该科目渊某班 部分选科数据如图 b 所示冤遥 请回答下列 问题院 渊1冤定义如下函数 check(dfs)检查选考科目 数是否有误袁其中参数 dfs为 DataFrame对 象袁由如图 b所示 Excel数据导入遥 返回值 erlst为列表袁列表元素数据类型为整型袁表 示错误数据行对应的学生序号渊例如第 6 行学生野戴 **跃冶的序号为 5冤遥 def check(dfs): erlst=咱暂 for i in range(len(dfs)): xk_sum=0 for j in dfs.columns咱2:暂: 图 a 图 b 137 dyg= 淤 if dyg==1: xk_sum+=dyg if xk_sum! =3: erlst.append( 于 ) return erlst 淤在程序中画线处填入的正确代码为 渊单选袁填字母冤遥 A. dfs.at咱'i','j'暂 B. dfs.at咱'j','i'暂 C. dfs.at咱i,j暂 D. dfs.at咱j,i暂 于请在画线处填入合适的代码院 遥 渊2冤读取每个班级的 Excel选科数据袁若检 查无误袁则统计每个班级同时选报野物理冶 和野化学冶学科的人数袁存储在字典 ans中遥 实现该功能的 Python程序如下院 import pandas as pd ans={} for i in range(1,10): filename=str(i)+'.xlsx' df=pd.read_excel(filename) errlist=check(df) if errlist! =咱暂: print('请检查文件 ',filename,'中序 号为 ',errlist,'的学生 ') else: 盂 #筛选同时选择物理 和化学的数据记录存储在 df1中 ans咱str(i)+'班 '暂=咱 榆 暂 #形如{野1班冶:咱41暂} 盂在程序画线处应填入的正确代码段为 渊多选袁填字母冤遥 A. df1=df咱df咱'物理 '暂==1暂 df1=df1咱df1咱'化学 '暂==1暂 B. df1=df咱df咱'物理 '暂==1暂 df1=df咱df咱'化学 '暂==1暂 C. df1=df咱df咱'化学 '暂==1暂 df1=df1咱df1咱'物理 '暂==1暂 D. df1=df咱df咱'化学 '暂==1暂 df1=df咱df咱'物理 '暂==1暂 榆请在画线处填入合适的代码院 遥 渊3冤用字典 ans创建并转置的 DataFrame对 象如图 c所示袁绘制柱形图如图 d所示遥 实 现该功能的 Python程序如下院 import matplotlib.pyplot as plt adf=pd.DataFrame(ans,index=咱'人数 '暂).T plt.bar( ) #设置绘图参数袁代码略 plt.show() 程序画线处应填入的正确代码为 渊单选袁填字母冤遥 A. adf.人数,adf.班级 B. adf.班级,adf.人数 C. adf.人数,adf.index D. adf.index,adf.人数 12. 如图 1所示袁小明从票房网上收集了 2014要 2022年的票房前 50的数据袁存储在野票房. xlsx冶中遥 渊1冤小明收集的数据存在一些问题袁需要进 行数据整理袁下列说法合理的是 渊单选袁填字母冤遥 A. 数据集中的缺失值一般用任意值填充 B. 数据集中的异常数据须直接删除或忽略 C. 数据集中的重复数据可以直接删除 D. 数据集中格式不一致的数据袁需要进行 格式转换 8班7班6班5班3班2班1班 9班 40 35 30 25 20 15 10 5 0 各班级物化捆绑选报人数 图 c 图 d 138 渊2冤RANK函数是排名函数袁常用于求某一 个数值在某一区域内的排名遥例如院=RANK (E2,E2:E51)袁表示 E2在 E2:E51区域中的排 名情况遥 现在要求得票房排名袁且 H3:H51 均由 H2填充获得袁则 H2单元格中的公式 应修改为 遥 渊3冤小明利用所学的 DataFrame和 matplotlib 对票房数据进行了分析袁最终算出了累计 票房数前五的导演袁并绘制了垂直柱形图 渊如图 2所示冤遥 import pandas as pd import matplotlib.pyplot as plt plt.rcParams咱"font.family"暂=咱"sans-serif"暂 plt.rcParams咱"font.sans-serif"暂=咱"SimHei"暂 #中文显示 df1=pd.read_excel("票房.xlsx") daoyan=咱暂 piaofang=咱暂 for i in df1.values: #一部电影可能存在多 名导演 s=i咱2暂.split("尧") #按野尧冶分割导演名字 for j in s: daoyan.append(j) 淤 data={"daoyan":daoyan,"piaofang":piaofang} df2=pd.DataFrame(data) 于 #按导演姓名分组 t=t.sum() t=t.sort_values("piaofang",ascending=False) t咱0:5暂.plot(kind="bar",rot=0) plt.title("票房累计前五的导演(亿)") plt.show() 请在画线处填入合适的代码遥 淤 于 13. 老师收集了 5次技术考试成绩袁分别以考 试名称为文件名存放在 5个文件中袁如图 1 所示遥每次考试的数据结构如图 2所示袁同 一学生的学号相同袁某次考试不参加则无 该学生记录遥 所有学生数据存放在野名册. xlsx冶中袁如图 3所示袁考试数据和名册文件 均按学号升序排列遥 为分析每个学生考试 名次的波动情况袁编写 Python程序袁请回答 下列问题院 图 1 陈凯歌徐峥林超贤陈思诚徐克 0 20 40 60 80 100 120 票房累计前五的导演渊亿冤 图 2 piaofang daoyan 139 渊1冤定义 merge 函数袁功能为院读取各次考 试的成绩袁合并到一个 DataFrame对象遥 程 序代码如下袁请在画线处填入合适的代码院 遥 import pandas as pd def merge(df,tests): n=len(df) for test in tests: tmp=pd.read_excel(test+".x1sx") df咱test暂=0 #在 df最后插入一列袁 值均为 0 i=j=0 while i<len(tmp): if tmp咱"学号"暂咱i暂==df咱"学 号"暂咱j暂: i+=1 j+=1 return df 渊2冤计算每个同学各次考试的名次并绘制 折线图袁如图 4 所示袁部分 Python 程序如 下袁请在画线处填入合适的代码遥 import matplotlib.pyplot as plt plt.rc("font",family="kaiti") #显示中文 tests=咱"期中考","期末考","一模","二模", "三模"暂 #存储 5次考试名称 df=pd.read_excel("名册.xlsx") df=merge(df,tests) n=len(df) for test in tests: df咱test+"名次"暂=0 for i in range( 淤 ): s=0 for j in range(n): if df咱test暂咱j暂>df咱test暂咱1暂: s+=1 df咱test+"名次"暂咱i暂= 于 while True: no=input("输入学号") if no=="": break rec=df咱df.学号==int(no)暂 if len(rec)>0: plt.plot( 盂 ,rec.values咱0暂咱7:暂) plt.title(rec.values咱0暂咱1暂+"历次考 试名次波动图") plt.show() 淤 于 盂 渊3冤从图 4可以看出袁该同学成绩一次比一 次 渊选填院差/好冤遥 图 4 三模二模一模期末考期中考 8 6 4 2 0 章 **历次考试名次波动图 学号 姓名 成绩 1 章 ** 99 2 董 ** 96 3 赵 ** 88 6 杨 ** 91 5 陈 ** 94 学号 姓名 1 章 ** 2 董 ** 6 杨 ** 5 陈 ** 3 赵 ** 4 孟 ** 图 1 图 2 图 3 140 值袁因此若 total咱item暂咱cno暂==0袁则表明人物 item 在章回号 cno 中出现的次数为 0袁故函数返回值 为 False袁反之则返回 True遥 专题提升四 1. D揖解析铱不同来源的数据可能存在格式不一致的 情况袁需要进行数据转换袁以便形成一个适合后续 分析和挖掘的描述形式遥 2. C揖解析铱计算机管理结构化尧非结构化和半结构化 数据曰在计算机中一般以文件的形式存储数据曰管 理数据的方式有多种遥 3. D揖解析铱在文件管理方面袁计算机还用于进行信息 管理等方面遥 4. A揖解析铱语句 cjdata.drop("信息",axis=1)删除了野信 息冶数据列袁返回一个新的 DataFrame对象袁但是没 有改变 cjdata 对象的内容 曰sort_values ("通用 " , inplace=True)按野通用冶升序排列袁改变了 cjdata对 象中行的排列顺序遥 5. C揖解析铱Series是一种一维的数据结构袁包含一个 数组的数据和一个与数据关联的索引渊index冤袁索 引值默认是从 0起递增的整数遥 列表尧字典等可以 用来创建 Series数据结构袁与列表不同的是袁Series 的索引可以指定袁类型可以为字符串型遥 DataFrame 是一种二维的数据结构袁由一个索引列渊index冤和 若干个数据列组成袁每个数据列可以是不同的类型遥 DataFrame中的索引尧列标题及值可以通过属性来 显示袁columns属性用来存放各列的列标题遥 6. A揖解析铱Series 对象中可以省略 index袁index 值默 认是从 0起递增的整数遥 7. B揖解析铱A选项中少了引号袁C选项显示列标题袁D 选项显示第 2至 4行数据遥 8. A揖解析铱该程序的功能是读入野st.xlsx冶中第一张工 作表内容袁并在索引列前增加一列野班级冶袁值均为 “原(1)冶袁将 s1按出生年月升序排列后赋值给 s2袁因 此 s1中的数据并未经过排序遥 9. B揖解析铱根据最后一行语句可知袁筛选的是时长和 次数之积大于 120的数据遥根据倒数第二行语句可 知袁索引是 bm袁列标题是 col遥 10. C揖解析铱选项 A袁对 s2中数据升序排序袁存储到 s1中 s1咱0暂值为 166曰选项 B袁降序排序袁但输出结 果为野s02 180冶曰选项 C袁输出最大值为 180曰选项 D袁输出所有值遥 11. 渊1冤淤C 于 i+1 渊2冤盂AC 榆 len (df1)渊或 len(df1.index)冤 渊3冤D 揖解析铱渊1冤由程序段可知袁xk_sum存储选科总数袁 dyg 存储当前索引 i 行袁j 列的值袁故答案为 dfs. at咱i,j暂遥 如果 xk_sum!=3袁则说明选科总数不对袁需 要把错误数据行对应的学生序号添加到 erlst中袁 由 excel导入生成的 DataFrame 的对象中行索引 从 0开始袁故于答案为 i+1遥 渊2冤盂要筛选同时选 物理和化学的数据袁需要先对物理进行筛选袁再 对化学进行筛选曰或者先对化学进行筛选袁再对 物理进行筛选遥B尧D错在筛选结果不叠加遥榆空需 要统计同时选物理和化学的人数袁可以用 len(df1) 或 len(df1.index)遥 渊3冤各班级作为索引袁因此绘图 时袁代码为 adf.index,adf.人数遥 12. 渊1冤D 渊2冤=RANK(E2,$E$2:$E$51)渊或=RANK(E2, E$2:E$51)冤 渊3冤淤piaofang.append(i咱4暂/10000) 于t=df2.groupby("daoyan")渊或 t=df2.groupby("daoyan", as_index=True)冤 揖解析铱渊1冤数据的缺失值可忽略或采用平均值尧 中间值或概率统计值填充曰异常数据有可能是要 去掉的噪声袁也有可能是含有重要信息的数据对 象袁需要仔细研判后决定曰重复数据须在进一步 审核的基础上进行合并或删除遥 渊3冤淤通过列表 存储每个导演指导的电影的票房袁根据柱形图可 知袁票房的数量单位是亿袁所以需要将万转换成 亿遥 于按导演姓名分组并且用变量 t进行存储遥 13. 渊1冤df.at咱j,test暂=tmp.at咱i,"成绩"暂 渊2冤淤n 于s+1 盂tests 渊3冤差 揖解析铱渊1冤由题意可知袁当下是要将每一次的成 绩汇总到 df当中袁df初始只有学号尧姓名两列袁接 下来在 for循环中依次添加咱野期中考冶,野期末考冶, 野一模冶,野二模冶,野三模冶暂列遥while循环的作用主要 是防止有部分同学没有参加考试袁此时他的成绩 是没有的袁当学号对上则说明有该同学袁需要将 当前行列的同学的成绩添加上袁结合程序 df咱test暂 =0可知袁新列列标签为 test袁因此答案为 df.at咱j, test暂=tmp.at咱i,"成绩"暂遥 渊2冤依次去求每一次考试 的名次袁最外围的 for循环一共五次袁表示五次考 试的名次列遥 第二个 for循环表示每一位同学袁第 三个 for循环用来求所有大于当前同学的成绩有 多少个袁用 s来表示计数袁因此第一空答案为 n袁 表示每一位同学袁第二空答案为 s+1袁表示当前同 学的名次曰第三空用来画图表遥 渊3冤由图表可知袁 成绩名次越来越靠后袁由此得知成绩在变差遥 专题提升五 1. A揖解析铱深度学习是基于数据驱动的人工智能袁需 要大量数据袁不可脱离数据进行学习遥 2. C揖解析铱人脸识别属于联结主义的人工智能遥 3. B揖解析铱榆使用的是传感器技术袁虞使用的是网页 的搜索功能遥 4. D揖解析铱大数据价值密度低袁不是价值低曰大数据 处理全体数据曰处理静态数据使用批处理遥 5. C揖解析铱AlphaGo从围棋跨界到电力控制领域袁属 于跨领域人工智能曰强化学习是一种问题引导下的 人工智能学习方法曰人工智能的应用可能威胁到个 人和公共信息安全遥 6. B揖解析铱通过模仿人类大脑中神经元之间的复杂 交互来进行认知推理的是联结主义遥 210

资源预览图

专题提升4-【学考一号】2025年高中信息技术学业水平复习方略精讲精练
1
专题提升4-【学考一号】2025年高中信息技术学业水平复习方略精讲精练
2
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。