第2节编程处理数据-【学考一号】2025年高中信息技术学业水平复习方略精讲精练

2025-03-18

| 2份

| 6页

| 65人阅读

| 7人下载

金华市合创展教育图书有限公司

进店逛逛

资源信息

学段	高中
学科	信息技术
教材版本	-
年级	高三
章节	-
类型	题集
知识点	数据与数据的组织
使用场景	高考复习-学业考试
学年	2025-2026
地区（省份）	全国
地区（市）	-
地区（区县）	-
文件格式	ZIP
文件大小	4.06 MB
发布时间	2025-03-18
更新时间	2025-03-18
作者	金华市合创展教育图书有限公司
品牌系列	学考一号·高中复习方略
审核时间	2025-02-19
下载链接	https://m.zxxk.com/soft/50520067.html
价格	2.00储值（1储值=1元）
来源	学科网

内容正文：

第二节编程处理数据一尧选择题 1. 有如下 Python程序段院 import pandas as pd s=pd.Series (咱2,6,8,10暂,index=咱"s01"," s02", "s03","s04"暂) a=s咱"s01"暂+s咱"s03"暂 b=s咱2暂+s咱3暂 print(a+b) 执行该程序段后袁输出的结果是渊冤 A. 22 B. 28 C. 19 D. 18 2. 有如下 Python程序段院 import pandas as pd data={"姓名":咱"小王","小张","小李"暂,"性别":咱"女","女","男"暂,"信息分数":咱28,46,37暂} df1=pd.DataFrame(data,columns=咱"姓名","信息分数","性别"暂) p=df1咱1:2暂 t=df1.at咱2,"姓名"暂 print(df1) 执行该程序段后袁下列说法正确的是渊冤 A. 变量 t的值为"小张" B. 输出结果中袁第 2列渊除索引列冤为野性别冶 C. 对象 p中只有一行记录 D. 执行语句野df1咱"信息分数"暂=40冶后袁第一个人的信息分数会被修改为 40 3. 有如下 Python程序段院 import pandas as pd data={"姓名":咱"张立","王强","朱明","李华"暂, "物理":咱90,66,80,78暂,"化学":咱92,86,75,80暂} df1=pd.DataFrame(data) df1.化学=咱94,88,83,86暂 ans=df1.化学.max()-df1.化学.min() print(ans) 执行该程序段后袁输出的结果是渊冤 A. 2 B. 11 C. 17 D. 19 4. 使用 Python 创建一个 DataFrame 对象 df1袁代码如下院 import random import pandas as pd name =咱"小张 ","小刘 ","小王 ","小陈 ","小黄","小李","小徐","小杨","小吴","小高"暂 n=len(name) #随机生成含有 n个元素的列表 sex =咱random.choice (咱"男 ","女 "暂) for i in range(n)暂 cla =咱random.choice (咱"A","B","C"暂) for i in range(n)暂 score=咱random.choice(range(50,101)) for i in range(n)暂 df1=pd.DataFrame({"班级 ":cla,"姓名 ":name, "性别":sex,"成绩":score}) print(df1) 要想得到不同班级不同性别的平均成绩袁应执行的操作语句是渊冤 A. print(df1.groupby(咱"性别"暂).mean()) B. print(df1.groupby(咱"班级"暂).mean()) C. print(df1.groupby(咱"班级","性别"暂).mean()) D. print(df1.groupby("班级","性别").mean()) 5. 某 DataFrame对象 df中包含野id冶野name冶等 8 个数据列袁22个数据行袁下列语句中能读取 df 对象中某些数据列中的所有数据的是渊冤 A. df咱"id"暂 B. df.tail(5) C. df.columns D. df咱2:5暂 6. 某 DataFrame对象 df中包含野准考证号冶野姓名冶野学校冶野语文冶野数学冶等数据列袁下列语句中袁可以以学校为单位袁统计各校学生野语文冶成绩平均值的是渊冤 A. df.groupby("学校").mean() B. df.groupby("准考证号").mean() C. df.groupby("语文").mean() D. df.groupby("语文").学校.mean() 7. 某 Python 程序运行结果如下袁以下四种代码中能得到同样结果的是渊冤 0 89 1 393 2 23 dtype:int64 97 A. import pandas as pd s1越pd.Series(咱89,393,23暂) B. s1越pd.Series(89,393,23) C. s1越pd.Series(咱89,393,23暂) print(s1) D. import pandas as pd s1越pd.Series(咱89,393,23暂) print(s1) 8. 有如下 Python程序段院 import pandas as pd s1=pd.Series(咱1,6,7,9暂) res=0 for i in s1.values: res+=i print(res) 执行程序后袁输出的结果是渊冤 A. 6 B. 14 C. 16 D. 23 9. 有如下 Python程序段院 import pandas as pd data ={"姓名 ":咱"小芳 ","小唐 ","小王 ","小明"暂,"性别":咱"女","男","女","男"暂,"剩余积分":咱16,12,13,10暂} df1=pd.DataFrame(data,columns=咱"姓名","性别","剩余积分"暂) df2=df1.head(2) df3=df1.tail(2) a=df2咱"剩余积分"暂.sum() b=df3咱"剩余积分"暂.sum() print(round(b/a,2)) 执行程序后袁输出的结果是渊冤 A. 0.10 B. 0.28 C. 0.61 D. 0.82 10. 有如下 Python程序段院 import pandas as pd import numpy as np #生成 5行 4列的数据袁值为咱60,100冤之间的随机整数 df2=pd.DataFrame(np.random.randint(60,100,(5, 4)),columns=list("ABCD"),index=list("abcde")) print(df2.sort_values("C")) 下列关于该程序段的说法袁不正确的是渊冤 A. 该程序段输出结果的列索引为 ABCD B. 该程序段输出结果的 C列为降序排列 C. 该程序段输出结果包含列索引共有 6行 D. 该程序段输出结果包含行索引共有 5列二尧非选择题 11. 某竞赛获奖名单已公布袁现要对获奖情况进行数据处理和分析遥请回答下列问题院渊1冤将获奖名单读取到 DataFrame 对象 df 中袁如图 a所示袁若要编写 pandas程序分析出浙江省内获得满分 400 分的总人数袁下列方法正确的是渊单选袁填字母冤遥 A. 从 df中筛选出省份为野浙江冶的数据 df1袁再从 df1 中筛选出总分为野400冶的数据 df2袁最后对 df2中的野姓名冶数据列使用 count()函数统计出总人数 B. 对 df中数据按野总分冶降序排列并保存到 df1中袁再从 df1中筛选出省份为野浙江冶的数据 df2袁最后对 df2 中的野姓名冶数据列使用 sum()函数统计出总人数 C. 对 df中数据按野总分冶为关键字进行分组袁并使用 count()函数统计出总人数袁得到数据 df1袁再从 df1中筛选出省份为野浙江冶的总人数渊2冤提取获奖名单中的部分数据列袁结果如图 b所示遥小陆想统计各省份一等奖获奖学生的准考证号袁存储在字典 dic 中袁h 为一等奖获奖分数线遥实现上述功能的部分 Python 程序如下袁请在画线处填入合适的代码遥 import pandas as pd #读取如图 b所示数据袁保存到 DataFrame 对象 df中袁代码略图 a 图 b 98 图 b图 a # 将 DataFrame 对象 df 转换为列表 lst袁代码略 #列表 lst的值为咱咱"北京","BJ-0032",400暂, 噎 ,咱"江苏","JS-0009",350暂,咱"四川","SC- 0003",384暂暂 h=int(input("输入一等奖获奖分数线")) i=0 s="" dic={} #字典 dic中的键为省份名称袁值为一等奖获奖学生的准考证号 while i<len(lst): if 淤 : city=lst咱i暂咱0暂 if city in dic: dic咱city暂+=","+lst咱i暂咱1暂 else: 于 i+=1 淤于渊3冤获奖名单新增野获奖等级冶数据列袁存储在文件野data.xlsx冶袁如图 c 所示袁小陆想分析出一等奖获奖人数最多的前 5 个省份渊没有并列情况冤袁并绘制如图 d 所示的柱形图袁实现该功能的部分 Python程序如下遥 import pandas as pd import matplotlib.pyplot as plt plt.rcParams咱"font.sans-serif"暂=咱"SimHei"暂 #设置图表显示中文字体 df=pd.read_excel("data.xlsx") df1= #选取相应的一等奖数据 df2=df1.groupby("省份",as_index=False). count() #分组统计总人数 df2.rename(columns={"姓名 ":"获奖人数"}, inplace=True) #更改列标题名称 g =df2.sort_values ("获奖人数 ",ascending = False).head(5) plt.title ("一等奖获奖人数最多的前 5 个省份") plt.bar( ) #绘制柱形图 plt.ylabel("获奖人数") plt.show() 淤请在画线处填入合适的代码院遥于程序的方框中应填入的正确代码为渊单选袁填字母冤遥 A. g.省份,g.获奖人数 B. df2咱"省份"暂,df2咱"获奖人数"暂 C. g.index,g.获奖人数 D. df2.index,df2.获奖人数 12. 某投资者将一段时间内的证券操作记录保存在文件野table.xlsx冶中袁部分界面如图 a所示遥该投资者为了总结投资经验袁编写如下程序袁对数据进行分析遥图 c 图 d 北京江苏山东广东浙江 2001751501251007550250 一等奖获奖人数最多的前 5个省份 99 import pandas as pd import matplotlib.pyplot as plt plt.rcParams咱"font.sans-serif"暂=咱"SimHei"暂 #使图形中的中文正常编码显示 df=pd.read_excel("table.xlsx") print( 淤 ) #筛选出所有盈利的证券操作记录 print( 于 ) #输出表格中所有操作的总盈亏 #以下代码功能为找出盈利最大的 10个证券袁并呈现如图 b所示的图表 g=df.groupby("证券名称",as_index=False) df1=g.盈亏.sum() df1= 盂 print(df1咱:10暂) plt.figure(figsize=(8,4)) plt.title("盈利前十的证券对比分析图") plt. 榆 (df1咱:10暂.证券名称,df1咱:10暂.盈亏,label="盈亏") plt.xlabel("证券名称") plt.ylabel("盈亏金额") plt.legend() plt.show() 请在画线处填入合适的代码遥淤于盂榆 13. 小红收集了某平台的销售数据袁部分数据如图 a所示遥为了在销售利润最高的野商品品类冶的客户中袁统计出不同年龄段的人数袁她编写 Python程序如下遥请回答下列问题院渊1冤计算订单野销售利润冶的规则为院销售利润=销售单价伊销售数-进货总价遥实现该计算的 Python程序如下袁请在画线处填入合适的代码院遥 import pandas as pd import matplotlib.pyplot as plt df=pd.read_excel("data.xlsx") df咱"销售利润"暂= 渊2冤找出销售利润总和最高的野商品品类冶并存储在 maxt中遥实现该功能的 Python程序如下袁请在画线处填入合适的代码遥 df1=df.groupby(" 淤 ").sum() maxt=df1.index咱0暂 for i in df1.index咱1:暂: pft=df1.at咱i,"销售利润"暂 if pft>df1.at咱maxt,"销售利润"暂: 于淤于渊3冤为统计 maxt 中不同客户年龄段的人数袁程序运行结果如图 b所示袁部分 Python 程序如下袁请在画线处填入合适的代码遥 nums=咱0暂*5;ages=咱30,40,50,60暂 df2=df咱df.商品品类==maxt暂.sort_values("客户年龄") j=0;n=len(df2) for i in range(0,4): st=j while j<n and df2.at咱df2.index咱j暂,"客户年龄"暂<=ages咱i暂: j=j+1 nums咱i暂= 淤 nums咱4暂=len(df2)-j xlabel=咱"30岁以下","31~40岁","41~50岁", "51~60岁","61岁以上"暂 plt.bar(xlabel, 于 ) plt.show() 淤于图 a 30岁以下 61岁以上51~60岁41~50岁31~40岁 5 000 4 000 3 000 2 000 1 000 0 图 b 100 flag=1袁因此该空应该为月份的判断是否为 2月份遥于空联系上下代码袁以及满足表达式后 check=False袁可明确该空需要填写表达式的功能是不能满足题目要求中的野对称日冶袁则首先需要检验 check==True袁因为第一个 if已经检验了 m的值袁月份已经满足要求袁故还需要检验每个月的天数是否符合要求袁每月的天数存放在列表 lst中袁可以用 d>lst咱m-1暂+ flag来表示遥盂空根据代码结构可知是为了返回调用函数的结果遥渊2冤根据上文可知 k1仅仅是年份值袁需要构造月份和日期袁同时根据题目要求的野对称日冶袁月份和日期刚好和年份相反遥 8. 渊1冤枚举渊2冤淤1,9 于9 盂d*1000+c*100+ b*10+a 揖解析铱渊1冤for循环遍历所有可能的解袁然后逐一判断每个答案是否符合条件袁属于枚举算法遥渊2冤淤a 的值只能是 1袁a若等于 2以上的数字乘以 9袁结果就会成为 5位数曰a是 1袁d只能是 9袁9*9个位数才能取到 1遥于根据 a==b or a==c得出 b的取值在 0~8之间袁若是和 a的值相同则跳过袁所以填写 9遥盂正读和翻转等值袁则输出结果遥 9. 渊1冤阴阴翌渊2冤淤x=i咱1:暂渊或 x=i咱1::暂或 x=咱1:len(i)暂或其他等价表达式冤于ca>=7 and cb>=7 盂y=score//5 揖解析铱渊2冤淤每个评审打分包括类型和分数两项袁需要从字符串中将分数 x 切片切出曰于题干中规定了两组评审中任意一组评审人数少于 7人则本轮无效袁所以需要判断 ca尧cb中统计的两组评审人数曰盂计算野阴冶的数量遥 10. 淤c=a咱j暂于sum-=int(n) 盂a咱i:j+1暂榆j+=1 揖解析铱淤根据下一行代码野sum+=int(c)冶可知袁此处要对变量 c进行赋值袁并且 c的值为字符串型袁易知变量 sum统计连续字串的和袁变量 j为数字字符串 a的索引袁故填入代码为 c=a咱j暂曰于当 sum 的值大于 s时袁需要减去连续字串中第一个累加到 sum中的值袁然后将连续字串向后移动一位袁变量 i表示连续字串的第一个位置索引袁代码野n= a咱i暂冶表示取出该字符存储在变量 n中袁故填入代码为 sum-=int(n)曰盂连续字串的第一个位置索引为 i袁最后一个位置索引为 j袁故填入代码为 a咱i:j+ 1暂曰榆变量 j为数字字符串 a的索引袁步长为 1袁故填入代码为 j+=1遥第四章数据处理与应用第一节常用表格数据的处理 1. C 2. A 3. C揖解析铱2月没有 30日遥 4. B揖解析铱绝对引用的符号需要放在字母和数字的前面遥 5. D揖解析铱相对引用随单元格变化袁绝对引用不随单元格变化遥 6. C揖解析铱数据缺失问题最简单的处理方法是忽略含有缺失值的实例或属性袁也可以采用平均值尧中间值或概率统计值来填充缺失值曰异常数据不能直接删除或忽略曰格式不一致的数据可根据后续分析和挖掘的需要进行数据转换遥 7. B揖解析铱数据的质量直接影响数据分析的结果遥 8. 渊1冤=AVERAGE(H34:H40) 渊2冤B1袁B10:B16袁I1袁 I10:I16 渊3冤ABD 揖解析铱渊3冤A34是合并单元格袁排序时不可选择袁C 错误遥第二节编程处理数据 1. B揖解析铱按照索引提取值遥 2. C揖解析铱A. df1对象的行索引 index为默认索引 0尧 1尧2袁df1.at咱2,"姓名"暂即选取 df1对象中第 3行渊行索引为 2冤野姓名冶列的值曰B. 输出结果中袁除索引列外袁第 1列是野姓名冶袁第 2列是野信息分数冶袁第 3 列是野性别冶曰C. dfl咱1:2暂查看指定的行数据袁包含起始值袁不包含终值曰D. 语句野df1咱"信息分数"暂= 40冶为赋值语句袁执行后袁所有的信息分数都会被修改为 40遥 3. B揖解析铱程序利用字典创建 DataFrame对象袁然后修改野化学冶列的值袁再计算野化学冶列的最大值与最小值之差袁即 ans=94-83=11遥 4. C揖解析铱groupby()函数表示对各列或各行中的数据进行分组袁然后对其中每一组数据进行不同的操作袁mean()函数表示求平均值袁要求不同班级不同性别的平均值袁groupby()函数的参数应为咱"班级"," 性别"暂遥 5. A揖解析铱df咱"id"暂用于查看 df对象的野id冶列数据曰 df.tail(5)用于查看 df对象的尾 5行数据曰df.columns 用于查看 df对象的列标题曰df咱2:5暂用于查看 df对象的第 2尧3尧4行遥 6. A揖解析铱df.groupby("学校 ").mean()是以学校为单位袁统计各校学生各列的成绩平均值袁包括野语文冶遥 7. D揖解析铱该运行结果属于一维的数据结构 Series袁需要运用 pandas模块遥此外袁为了得到运行结果袁算法必须包含至少一个输出遥 8. D揖解析铱该程序段创建了一个 Series对象 s1袁i遍历 s1中的各个值袁res=1+6+7+9=23遥 9. D揖解析铱DataFrame对象 df2为对象 df1的前两行数据袁对象 df3 为对象 df1 最后两行数据袁求出对象 df2中剩余积分的总和并赋值给 a袁求出对象 df3中剩余积分的总和并赋值给 b袁最后求出 round(b/a,2) 的值袁输出结果为 0.82遥 10. B揖解析铱sort_values()函数表示排序袁默认纵向升序排列袁若增加 ascending=False则表示降序排列遥 11. 渊1冤A 渊2冤淤lst咱i暂咱2暂>=h 于dic咱city暂=lst咱i暂咱1暂渊3冤淤df咱df.获奖等级=="一等奖"暂渊或 df咱df咱"获奖等级"暂=="一等奖"暂冤于C 揖解析铱渊1冤B. sum()函数用于统计数值袁因此对 202 野姓名冶数据列使用 sum()函数统计袁不能正确得出人数曰C. 对 df中数据按野总分冶为关键字进行分组袁并使用 count()函数统计出总人数后袁无法通过筛选省份得到浙江的总人数遥渊2冤遍历 lst列表切片取出分数与分数线 h比较袁超过分数线则需记录省份名称袁判断省份名称是否已存在于字典中袁如果在则将新的准考证号连接上去袁若不存在则新建一个键值对遥渊3冤淤选取相应的一等奖数据遥于结合上文 df2=df1.groupby("省份",as_index= False).count()可知袁野省份冶已经作为索引袁按照野获奖人数冶进行了降序排序袁选取前 5条记录袁存入 DataFrame对象 g中袁因此绘制图像时袁应该使用院g.index,g.获奖人数遥 12. 淤df咱df咱"盈亏"暂>0暂渊或 df咱df.盈亏>0暂冤于df.盈亏.sum()渊或 df咱"盈亏"暂.sum()冤盂df1.sort_values ("盈亏",ascending=False) 榆bar 揖解析铱淤筛选的条件为 df咱"盈亏"暂>0遥于该题为列求和袁df咱"列名"暂.sum()或者 df.列名.sum()遥盂该题为按列数据降序排序遥榆由图可知所得的图为垂直柱形图遥 13. 渊1冤df咱"销售单价"暂*df咱"销售数"暂-df咱"进货总价"暂渊2冤淤商品品类于maxt=i 渊3冤淤j-st 于nums 揖解析铱渊2冤淤其根据商品品类进行分类统计袁分类统计之后袁商品品类列变成了行索引遥于由上问可知袁其行索引为商品品类遥因此 maxt最后存储其最大值得行索引就为其结果袁其结果为 maxt= i遥渊3冤淤st记录小于当前年龄段开始的人数袁野while j<n and df2.at咱df2.index咱j暂,"客户年龄"暂<=ages 咱i暂:冶即依次寻找小于当前年龄段的人数渊包括前一年龄段冤袁nums咱i暂记录所有小于当前年龄段的人数减去小于前一年龄段的人数遥于y轴为 nums袁表示各个年龄段的人数遥第三节文本数据处理及大数据 1. D 2. C揖解析铱有关差异的可视化用来探寻多种变量的对象与同类之间的差异和联系袁常用雷达图表示遥 3. C揖解析铱利用可视化技术袁可以将处于不断变化中的数据生成实时变化的可视化图表曰不同的数据类型决定了可视化的表现形式曰展现时间趋势类的数据可采用柱形图和折线图遥 4. D揖解析铱大数据要分析全体样本而不是抽样调查袁大数据技术支持大数据的全样处理曰大数据商品个性化推荐中分析的是用户购买商品之间的关联性袁而不是用户购买该商品的原因曰文本数据处理的一般步骤是分词尧特征提取尧数据分析和结果呈现遥 5. A 6. D揖解析铱中文分词后须进行特征提取曰标签云用词频表现文本特征袁将关键词按照一定的顺序和规律排列袁不显示全部词语曰野得失冶比野初心冶出现的频率高遥 7. D揖解析铱随着时间的流逝袁流数据的价值一般会随之降低遥 8. D 9. D揖解析铱大数据时代袁数据的来源众多袁既有人工产生的袁也有机器自动产生的曰大数据要分析的是全体数据而不是抽样数据曰对于大数据的处理不再追求精确性袁而是能够接受数据的混杂性遥 10. C揖解析铱MapReduce是一种分布式并行计算模型袁当数据量很大时袁它的优势就体现出来了袁其核心处理思想是将任务分解并分发到多个节点上进行处理袁最后汇总输出遥 11. B 12. A 13. D揖解析铱数据贯穿在智能交通的感知尧处理尧应用等各个环节袁交通大数据是智能交通中野智能冶的基础遥 14. B揖解析铱静态数据使用批处理模式袁流计算模式用于处理流数据遥 15. 渊1冤盂于淤榆渊2冤A 渊3冤淤counts咱word暂+1 于1 揖解析铱渊1冤文本数据处理的一般流程为获取数据源寅分词寅特征提取寅数据分析寅结果呈现遥渊2冤jieba默认分词模式为精确模式袁全模式对应代码 jieba.lcut(text,ut_all=True)袁搜索引擎模式对应代码为 jieba.lcut_for_search(text)遥渊3冤counts是用来记录词频的字典袁若 word已经在字典中袁将其对应值加 1袁否则设置其值为 1袁故淤处和于处填入代码分别为 counts咱word暂+1和 1遥第五章人工智能及应用第一节人工智能的产生与发展 1. D揖解析铱传感器采集数据属于传感技术曰数据自动发送到服务器体现了数据输入与传输功能曰刷身份证识别用户信息属于射频识别技术曰指纹识别身份认证属于人工智能技术中的生物特征识别遥 2. A揖解析铱B属于跨领域人工智能曰人工智能都是需要数据的曰人工智能在改善人类生活尧促进经济发展的同时也会威胁人类安全遥 3. A揖解析铱问题引导下试错学习属于行为主义曰人类智能是智能回路的总开关曰人工智能发展会有两面性袁要重视负面的影响遥 4. C揖解析铱人工智能可以进行文本情感分析曰深度学习是联结主义的典型代表曰训练样本数量越多袁神经网络的性能不一定最好遥训练样本数据越多袁预测越好袁但是当训练样本量大袁如果网络层次太少袁特征训练不充分袁将会导致训练不充分袁性能不一定能同步增加遥 5. C揖解析铱行为主义需要在环境的交互中不断学习曰图灵测试是测试机器是否具有智能的一种方法袁不是唯一方法曰专家系统是符号主义的典型代表遥 203

资源预览图

所属专辑

教辅

【学考一号】2025年高中信息技术学业水平复习方略精讲精练

高三信息技术第三方合辑 29 份文档

485人已阅读

第2节 编程处理数据-【学考一号】2025年高中信息技术学业水平复习方略精讲精练

资源信息

内容正文：

资源预览图

第2节编程处理数据-【学考一号】2025年高中信息技术学业水平复习方略精讲精练