内容正文:
1.探究停车引导中的数据处理
一、选择题
1.有如下Python程序段:
import pandas as pd
data=[[120, 140, 135], [118, 145, 103], [110,132,98]]
xm, km=["小明","小军","小豪"],["语文","数学","英语"]
dfl=pd. DataFrame(data, index=xm, columns=km)
下列描述正确的是( )
A.print (dfl.英语)显示的第一行数据是:0 135
B.print (dfl["数学"])显示的第一行数据是:小豪 132
C.print (dfl[dfl.语文<120])显示的第一行数据是:小军 118 145 103
D.print(dfl.sort_values("语文"))显示的第一行数据是:小明 120 140 135
2.在小区里,有的垃圾箱垃圾太多而溢出,有的却很少。做了一些研究后,小明同学整理数据,将原因与建议写成文字,准备交给物业。这属于数据处理过程中的( )
A.撰写研究报告 B.数据整理
C.数据分析 D.数据可视化
3.下列关于Hadoop平台的说法正确的是( )
A.该平台只能处理结构化数据 B.处理信息必须通过可视化体现处理的结论
C.该平台中每台计算机都在处理相同的数据 D.该平台可以节省大型和复杂问题的处理时间
4.小张采集了运动会的报名数据录入到Excel文件,每位同学最多参加两个项目,部分界面如下图所示。他先使用Excel软件整理数据,存储为“运动会报名.xlsx”文件后,编写Python程序完成后续处理。小张对数据进行以下整理,操作恰当的是( )
A.发现高一(1)班陈易涵有两条相同的数据,删除一条
B.发现高一(3)班张怀沙的跳高一栏空着,填入数字“1”
C.发现第6行“高一(二)班”的格式与其他数据不一致,删除第6行数据
D.发现第8、9行都是高一(2)班李嘉佑的数据且都不完整,删除第8、9行数据
5.信息处理的三个步骤依次是( )
A.输入→输出→处理
B.输入→处理→输出
C.输出→处理→输入
D.处理→输入→输出
6.以下选项中,属于数据处理的目的的是( )
A.检测修正数据 B.整合数据资源
C.统一数据格式 D.提取有用信息
7.数据处理的一般过程是( )。
A.采集—分析—整理—可视化表达 B.采集—整理—可视化表达-分析
C.采集—整理—分析-可视化表达 D.采集—可视化表达—整理-分析
8.下列关于数据整理的说法,错误的是( )
A.数据集中缺失的数据可以采用中间值来填充
B.数据集中异常数据可能包含重要信息
C.数据集中的重复数据可进行合并删除处理
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
9.下列属于在线数据处理平台的有( )
A.腾讯问卷 B.图表秀 C.云表 D.BDP在线数据分析软件
10.学校高一年级的研究小组在调查同学们的上学方式,小组通过问卷收集了一些数据,张华负责将最终的结果做成一张饼图,那么张华所做的是数据处理的哪一步?( )
A.数据收集 B.数据整理 C.数据分析 D.数据呈现
11.下列数据处理中,不属于文本数据处理的是( )
A.根据白名单和黑名单机制,进行垃圾邮件的识别
B.在线客服通过自动应答技术回答问题
C.实时监测景区的人流数据,控制过多的游客进入景区
D.分析消费者的意见数据,挖掘用户观点,辅助运营决策
12.在教科书中利用Python探究电流和电压、电阻的关系实验里,除了可以通过书中的Jupyter Notebook外,处理数据还可以通过下列( )工具实现。
A.Python IDLE B.Xmind C.网络画板 D.几何画板
二、操作题
13.小红收集了部分城市202l年全年每大PM2.5、PM10、CO浓度数据。每大的数据分别保存在以8位日期字符串命名的CSV文件中,部分文件如图a所示,每个文件记录了一天24小时的监测数据。示例如图b所示。
为统计分析城市A全年各月份PM2.5的月平均浓度(当月的日平均浓度的平均值),编写Python程序。请回答下列问题:
(l)定义pmday函数,功能为:读取某天的CSV文件,返回城市A当天PM2.5的日平均浓度。函数代码如下,划线处应填入的代码为<单选,填字母)。
A.df['类型']= ='PM2.5 B.df['类型'=='PM2.5']
C.df[df['类型']]= ='PM2.5' D.df[df['类型']=='PM2.5']
import pandas as pd
def pmday(dayfile):
df=pd read_csv(dayfile) #读取文件dayfile中的数据
df=
return df['城市A'].mean() #返回城市A当天PM2.5的日平均浓度
(2)统计城市A各月份PM2.5的月平均浓度并绘制线型图。部分Python程序如下,请在划线处填写合适的代码:
import matplothb. pyplot as plt
def tstr(t):
if t<l0:
retrun '0'+str(t)
else:
retrun str(t)
pm=[0]*12
mdays=[31.28.31.30.31.30.31.31.30.31.30.31]
for m in range(12):
sm=0
mstr=tstr(m+1)
for d in range(① ):
dstr=tstr(d+l)
day file='202l'+mstr+ dstr+'.csv'
sd=pmday(dayfile)
②
pm[m]=sm/mdays[m]
x=[1,2,3,4,5,6,7,8,9,10,11,12]
y=③
plt. plot(x,y) #绘制线型图
#设置绘图参数,显示如图c所示线型图,代码略
(3)城市A 2021年PM2.5年平均浓度为34.6微克/立方米。由图c可知,城市A 2021年PM2.5月平均浓度超过年平均浓度的月份共 个。
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.C
2.A
3.D
4.A
5.B
6.D
7.C
8.D
9.BCD
10.D
11.C
12.A
13. D mdays[m] sm+=sd pm 5
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$