内容正文:
3.3 数据与系统
学校:___________姓名:___________班级:___________考号:___________
一、选择题
1.下列有关数据处理的一般过程,顺序正确的是( )
①收集数据 ②分析数据 ③确定数据需求 ④撰写分析报告
A.①②③④ B.①③②④ C.④①②③ D.③①②④
2.英语听力磁带属于( )
A.内部存储器 B.外部存储器 C.只读存储器 D.随机存储器
3.用来管理数据库的软件的是( )
A.数据库系统 B.数据库应用系统 C.数据库管理系统 D.数据库管理员
4.数据处理的一般过程包括以下哪几个步骤?( )
A.数据采集、存储、加工、分析 B.数据采集、加工、分析、可视化
C.数据采集、存储、分析、表达 D.数据采集、加工、分析、决策
5.下列哪种存储介质具有较好的数据读写速度和耐用性?( )
A.硬盘 B.光盘 C.U盘 D.SD卡
6.下列适合进行数据处理的软件是( )
A.Word B.Excel C.PPT D.Python
7.阅读下列程序代码,下列选择中错误的是( )
def query():
c=open("旅行线路.txt",'r')
var=c.readlines()
c.close
text.delete('0.0','end')
for i in var:
text.insert(INSERT,i)
Button(root, text="查询线路", command =query,relief="solid",width=10).pack()
text=Text(root,width=82, height=8)
text.pack()
A.c=open("旅行线路.txt",'r')是以只读模式打开文件“旅行线路.txt”
B.c.readlines()读取当前行字符串
C.command =query是指按钮响应执行函数query()
D.text.insert(INSERT,i)INSERT表示输入光标所在的位置
8.图中有几个字段( )
A.6 B.7 C.8 D.9
9.图中有几条记录( )
A.1 B.2 C.3 D.4
10.下列关于数据整理的说法,正确的是( )
A.数据集中的缺失值一般用平均值、中间值或概率统计值填充 B.数据集中的重复数据可直接进行合并或删除
C.数据集中逻辑错误的数据须直接删除或忽略 D.数据集中的异常数据是错误数据,一般需要转换后保留
11.文本数据处理的主要步骤包括:①数据分析;②特征提取;③分词;④结果呈现;⑤文本数据获取。下列文本数据处理顺序正确的是( )
A.①⑤②③④ B.②⑤③①④ C.⑤①③②④ D.⑤③②①④
12.典型的文本数据处理过程的正确顺序是( )
①数据分析②分词③结果呈现④特征提取
A.①②③④ B.②①④③ C.④②①③ D.②④①③
13.阅读下列Python访问mdb数据库语句,下列说法错误的是( )
import win32com.client
conn = win32com.client.Dispatch(r"ADODB.Connection")
DSN = 'PROVIDER = Microsoft.Jet.OLEDB.4.0;DATA SOURCE = 旅行小助手.mdb'
conn.Open(DSN)
rs = win32com.client.Dispatch(r'ADODB.Recordset')
tablename = '旅行线路表'
rs.Open('[' + tablename + ']', conn, 1, 3)
while not rs.EOF:
for i in range(rs.Fields.Count):
print(rs.Fields[i].Name, ":", rs.Fields[i].Value)
print(end='
')
rs.MoveNext()
print('该表有'+str(rs.Fields.Count)+'个字段')
print('该表有'+str(rs.RecordCount)+'条记录')
conn.Close()
A.conn.Open(DSN)用于连接数据文件“旅行小助手.mdb”,rs.Open('[' + tablename + ']', conn, 1, 3)语句用于打开数据文件中的表“旅行线路表”
B.for i in range(rs.Fields.Count)用于循环访问打开表中一条记录中的所有字段,print(rs.Fields[i].Name, ":", rs.Fields[i].Value) 用于打印字段名称,字段的数据
C.conn.Close()用于关闭访问,这个语句可以不需要
D.rs.MoveNext()用于移动到下一条记录
14.下列哪项不是数据存储的关键因素?( )
A.数据类型 B.数据容量 C.数据安全性 D.数据备份
15.有一种元素除首元素没有前驱元素、尾元素没有后继元素外,其它元素都只有一个前驱元素和一个后继元素。具有以上特点的数据结构是( )
A.树结构 B.选择结构 C.线性结构 D.网状结构
二、填空题
16.在现代程序设计中,我们用 建立计算机世界的实体与客观世界的实体相一致的映射关系,问题的解决方案可以用一些彼此交互的对象来 表示。
17.在《数据与计算》中,数据处理的一般过程包括数据采集、数据存储、数据加工、数据分析和数据表达等步骤。其中,数据加工是对采集到的原始数据进行清洗、转换和重组的过程,以确保数据的 和 ,为数据分析阶段提供高质量的数据输入
18.数据处理的流程一般经历数据采集、数据整理、数据分析和数据呈现等环节。各路口安装的24小时监控摄像头,将获取的数据传输到交警的监控中心,此过程属于数据处理流程中的 。
19.文件是指存储在 中的 。
20.Access数据库表间查询表达式一般包含 个部分: 名 名 、 。
三、判断题
21.简单地查找某个字段为特定值的记录,只要在该字段对应的“条件”栏中输入该值即可;复杂查找方法是,在准则中可以使用表达式,在表达式中可通过操作符设置查询范围。 ( )
22.数据元素之间是一对一的关系的是线性数据结构。( )
23.数据处理的目的是将数据转换为信息,以便于人们理解和使用。( )
24.数据处理的目的是为了将数据转换为信息,帮助人们更好地理解数据。( )
25.数据处理是指对数据进行采集、存储、加工、分析和表达的过程。( )
四、操作题
26.小张获取了《三国演义》的小说,存储为“三国演义.txt”,他想利用jieba模块对该小说进行文本分析,查看该小说中词频最高的前10个词。
(1)文本数据处理的主要步骤包括:①结果呈现;②特征提取;③分词;④数据分析;⑤文本数据获取。正确的顺序是 (单选,填字母)。
A.⑤②④① B.⑤③①④ C.⑤③②④① D.⑤①③②④
(2)完成词频统计的程序代码如下所示,请在画线处填入合适的代码。
import jieba #导入jieba分词
import pandas as pd #导入pandas模块,并设置别名pd
f=open("三国演义.txt","r",encoding="utf-8") #以只读的方式打开文件
txt=f.read() #读取文件内容
words=jieba.lcut(txt,cut_all=True) #全模式分词
counts={}
for name in words:
if ① : #过滤掉单字分词
if name in counts:
② #已经出现过,出现次数累加
else:
③ #未出现过,出现次数设为1
f.close()
df=pd.DataFrame(list(counts.items()),columns=["词","次数"])
df=df.sort_values("次数",ascending=④ )
df.to_excel("词频结果.xlsx")
print(df)
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.D
【详解】本题考查数据处理。
① 收集数据:这是数据处理的起始步骤。没有数据,后续的分析、处理等工作都无法进行。收集数据是根据已经确定的数据需求来执行的,它是整个数据处理流程的基础。
② 分析数据:在收集到足够的数据之后,下一步是对这些数据进行分析。分析数据的目的是为了从原始数据中提取出有价值的信息,这可能包括趋势、模式、关联等,以便为后续的决策或研究提供支持。
③ 确定数据需求:明确数据需求是确保收集到的数据能够满足后续分析、决策等需求的关键。没有清晰的数据需求,数据收集和分析就可能变得盲目和无效。
④ 撰写分析报告:在数据分析完成后,需要将分析结果整理成报告形式,以便向相关人员或机构展示。分析报告是对整个数据处理流程的总结和呈现,它应该清晰地反映出数据分析的结果和结论。
故正确答案为:选项D。
2.B
【详解】本题考查存储器相关内容。内部存储器(Internal Storage)是指设备或系统内部存储数据和程序的空间,不依赖外部介质(如硬盘或闪存盘)。外部存储器是一种独立于计算机的内存以及CPU的缓存之外的存储器。只读存储器(Read-Only Memory,ROM)是一种计算机存储器,用于存储计算机程序和数据,其主要特点是允许用户读取存储在其中的信息,但无法直接修改或写入新数据。随机存储器(Random Access Memory,缩写为RAM),也称为随机存取存储器,是一种内部存储器,与CPU直接交换数据。英语听力磁带可以读写,属于外部存储器。故本题答案是B选项。
3.C
【详解】本题考查数据库相关内容。数据库系统是指由数据库、数据库管理系统(DBMS)和相关应用程序组成的集成系统。数据库应用系统是在数据库管理系统(DBMS)支持下建立的计算机应用系统。数据库管理系统(DBMS)是一种用于创建、使用和维护数据库的大型软件系统。数据库管理员(DBA)是专门负责管理和维护数据库管理系统(DBMS)的专业人员。故本题答案是C选项。
4.B
【详解】本题考查数据处理。
数据处理的一般过程包括以下步骤:
数据采集:这是数据处理的第一步,指的是从各种来源获取原始数据。数据来源可以是数据库、文件、传感器、网站等。数据的收集方式可以是手动输入、自动采集、网络爬取等。
数据清洗(加工):收集到的原始数据往往存在各种问题,如缺失值、错误值、重复值、不一致的数据格式等。数据清洗就是处理这些问题,确保数据的完整性和一致性。这包括缺失值处理(如删除、插值、预测等)、错误值处理(如规则校验、异常值检测等)、重复值处理(如去重算法)和数据格式统一等。
数据存储:将处理后的数据存储到数据库、文件等存储介质中,以便后续使用。
数据分析:对清洗和存储后的数据进行分析,提取有价值的信息。这包括统计分析(如均值、方差、相关性等)、数据可视化(使用图形、图表等工具来直观地展示数据)以及机器学习(使用机器学习模型来分析数据,发现数据中的规律和模式)。
数据可视化:将分析结果以图表、图形等方式展现,帮助用户直观地理解数据。数据可视化是数据分析的一个重要环节,它通过图形化的方式将数据呈现给用户,使得复杂的数据更易于理解和解释。
因此,数据处理的一般过程可以归纳为:数据采集、数据清洗(加工)、数据存储、数据分析和数据可视化。故正确答案为:选项B。
5.A
【详解】本题考查存储介质相关内容。硬盘作为计算机的主要存储介质,具有较大的容量、较快的数据读写速度和较好的耐用性。光盘的主要特性包括大存储容量、低价格、不怕电磁干扰、存取速度快,以及具有多次读出和写入的能力。U盘的主要特性包括容量小、体积小、速度快和方便。SD卡的最大特点是容量大、抗震防潮、性能稳定,能永久保存数据且无噪音和寻道错误。故本题答案是A选项
6.B
【详解】本题考查数据处理。
Excel是一款强大的电子表格软件,广泛应用于数据处理和分析领域。它提供了丰富的数据处理功能,如数据录入、计算、排序、筛选、汇总等,并且支持复杂的公式和函数。Excel还具备强大的图表制作能力,可以将数据以直观、可视化的方式展示出来,非常适合用于报告制作和数据分析结果的展示。因此,Excel是进行数据处理的理想工具之一。选项A,适合图文混排。选项C,适合制作演示文稿。选项D,适合程序设计。故正确答案为:选项B。
7.B
【详解】本题考查程序分析。选项B,readlines()方法用于读取所有行,并不是当前行。故说法错误。其他选项说法正确。故正确答案为选项B。
8.C
【详解】本题考查数据库相关内容。在数据库中,大多数时,表的“列”称为“字段” ,每个字段包含某一专题的信息。观察图示,共有8个字段。故本题答案是C选项。
9.D
【详解】本题考查数据库的基本概念。在数据表中,行是记录,列是字段,由图可知,共有4条记录。故选D。
10.A
【详解】本题考查数据整理。A选项正确,缺失值是指数据集中某些字段或条目缺少数值或信息的情况,通常需要进行填充以保证数据的完整性和可用性。B选项错误,重复数据指的是数据集中存在完全相同的记录或条目,可以通过合并或删除来清理数据。C选项错误,逻辑错误的数据是指与数据集的定义或逻辑规则不符的数据,应该尽早进行清理,以保证数据分析的准确性和可靠性。D选项错误,异常数据是指与数据集中其他数据相比具有明显不同的值,有时候可能是错误的数据,但有时候也可能包含有用的信息,需要进行分析和处理。故答案为:A。
11.D
【详解】本题考查文本数据处理。文本数据处理首先需要获取文本数据,即⑤;然后进行分词操作,将文本分割成词语,即③;接着进行特征提取,从分词后的文本中提取有代表性的特征,即②;再进行数据分析,对提取的特征进行分析和处理,即①;最后将处理结果呈现出来,即④。故答案为:D。
12.D
【详解】本题考查数据处理。典型的文本数据处理过程是文本数据源→分词→特征提取→数据分析→结果呈现。故答案为:D。
13.C
【详解】本题考查数据库操作。数据库访问结束后,一定要调用close方法关闭连接,否则会占用系统资源,不利于数据库的安全。C选项,conn.Close()用于关闭访问,这个语句可以不需要,说法错误。其他选项说法正确,故正确答案为选项C。
14.D
【详解】本题考查数据存储相关内容。虽然数据备份对于保护数据很重要,但它不是数据存储的关键因素。数据存储的关键因素包括数据类型、数据容量和数据安全性等。故本题答案是D选项。
15.C
【详解】本题考查数据结构。线性结构是一个有序数据元素的集合。常用的线性结构有:线性表,栈,队列,双队列,串。除最后元素之外,其它数据元素均有唯一的后继,除第一元素之外,其它数据元素均有唯一的前驱。故本题选项C为正确选项。
16. 对象 形象化
【详解】本题考查程序设计相关知识。在现代程序设计中,我们用对象建立计算机世界的实体与客观世界的实体相一致的映射关系,问题的解决方案可以用一些彼此交互的对象来形象化表示。
17. 正确性 一致性
【详解】本题考查数据处理。在《数据与计算》或数据科学领域,数据处理的一般过程确实包括数据采集、数据存储、数据加工、数据分析和数据表达等关键步骤。数据加工是这一流程中的核心环节,因为它直接决定了后续数据分析的质量和效果。数据加工的主要任务就是对采集到的原始数据进行清洗、转换和重组,以确保数据的正确性和一致性。故正确答案为:①正确性、②一致性。
18.数据采集
【详解】本题考查的是数据处理。各路口安装的24小时监控摄像头,将获取的数据传输到交警的监控中心,此过程属于数据处理流程中的数据采集。
19. 外存储设备 相关数据的集合
【详解】本题考查文件相关知识。文件是指存储在外存储设备中的相关数据的集合。
20. 3 SELECT字段 FROM表 [关联 表名 ON 关系] WHERE条件
【详解】本题考查ACCESS相关知识。Access数据库表间查询表达式一般包含3个部分:SELECT字段名,FROM表名,[关联 表名 ON 关系],WHERE条件。
21.对
【详解】本题考查的是查询相关知识。单地查找某个字段为特定值的记录,只要在该字段对应的“条件”栏中输入该值即可;复杂查找方法是,在准则中可以使用表达式,在表达式中可通过操作符设置查询范围。题干的说法是正确的。
22.对
【详解】本题考查数据结构。线性数据结构就是数据元素之间是一对一的关系。题干说法正确。
23.正确
【详解】本题考查数据处理。数据处理的目的是将原始数据转换为有用的信息,帮助人们理解和使用数据。故正确答案为正确。
24.正确
【详解】本题考查数据处理。数据处理的目的是将原始数据转换为有用的信息,帮助人们理解和利用数据。故正确答案为:正确。
25.正确
【详解】本题考查数据处理。数据处理确实包括采集、存储、加工、分析和表达的过程。故正确答案为正确。
26. C len(name)!=1 counts[name]+=1 counts[name]=1 False
【详解】本题考查Python综合应用。
(1)文本数据处理首先需要获取文本数据(⑤),接着对文本进行分词(③),然后提取文本的特征(②),再对数据进行分析(④),最后将结果呈现(①)。所以正确的顺序是⑤③②④①。故答案为:C。
(2)①处要过滤掉单字分词,所以条件是len(name)!= 1,判断分词后的词的长度不等于1。故答案为:len(name)!=1。②处当词已经出现过时,需要将其出现次数累加,所以是counts[name]+=1。故答案为:counts[name]+=1。③处当词未出现过时,将其出现次数设为1,所以是counts[name]=1。故答案为:counts[name]=1。④处要得到词频最高的前10个词,需要按照次数降序排列,所以ascending=False。故答案为:False。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$