内容正文:
高中信息技术沪科版(2019)3.加工、分析和可视化数据
一、选择题
1.下列选项中,较适合表达各年龄段上网人数占总人数的百分比的是( )
A.表格 B.饼图 C.折线图 D.计算公式
2.下列数据分析中可能涉及文本情感分析的是( )
A.对城市地理位置的分析 B.对影评内容的分析
C.对道路设施的分析 D.对大学男女比例的分析
3.一次期末考试,某班有15人数学得满分,有12人语文得满分,并且有4人语、数都是满分,那么这个班至少有一门得满分的同学有多少人?( )
A.23 B.21 C.20 D.22
4.对采集到的数据进行分类整理、提取与发现其中有价值信息的过程,称为( )
A.数据分析 B.数据采集 C.数据加密 D.数据发布
5.下列选项中,不属于实时数据可视化的应用是( )
A.导航地图 B.实时卫星云图 C.思维导图 D.股票动态走势图
6.在数据分析中,以下哪项不是数据预处理的常见任务?( )
A.数据清洗 B.数据转换 C.数据增强 D.数据集成
7.如图所示为我国城乡居民的人均可支配收入情况,通过对比可以得出我国2015年至2019年间城镇居民的可支配收入高于居民人均水平,农村居民的可支配收入低于居民人均水平,以上采用的数据分析方法是( )
A.平均分析和交叉分析 B.对比分析和交叉分析
C.平均分析和对比分析 D.对比分析和结构分析
8.词云是对网络文本的内容进行可视化表达的一种手段,对下图所示词云理解正确的是( )
A.所提供的文字信息量较少,不能体现核心内容 B.核心内容是“乌镇世界互联网大会”
C.仅仅是宣传画,与会议内容无关 D.词云中出现的文字位置是随机摆布的
9.下列关于信息加工的叙述,错误的是
A.信息加工在于发掘信息的价值
B.信息加工包括对采集的信息进行判别、筛选、分类、排序、分析等加工过程
C.通过信息加工,可以产生出新的信息
D.信息加工只能依赖计算机来完成
10.属于数字化可视化表达工具的是( )
A.演示文稿 B.平板电脑 C.电子词典 D.编程软件
11.小北利用python中的jieba分词模块对“大数据.txt”进行处理,创建了如图所示的标签云,下列说法正确的是( )
A.该中文分词算法是基于规则的分词方法
B.标签云中必须显示该文本中包含的全部词语
C.从标签云中可以推测,“数据”、“数据库”等词语是该文本的重点词语
D.文本内容是结构化数据,需要转化才能被计算机处理
12.如图展示了两位同学的成绩对比。这是使用( )进行数据可视化。
A.柱形图 B.折线图 C.气泡图 D.雷达图
13.下表是某企业销售部门的数据,如果要比较每组的销售总额,下列做法最合适的是( )
A
B
C
1
组别
产品名称
销售额(万元)
2
第一组
电视机
69.94
3
第二组
电视机
64.74
4
第三组
电视机
64.16
5
第一组
冰箱
56.07
6
第二组
冰箱
76.30
7
第三组
冰箱
75.72
A.先按产品名称排序,再以组别为分类依据,对销售额以“求和”方式进行分类汇总
B.先按组别排序,再以组别为分类依据,对销售额以“求和”方式进行分类汇总
C.直接按销售额进行排序
D.直接按产品名称进行排序
14.某APP利用强大的算法对用户观看内容的大数据进行分析,为用户提供适合用户需求的内容。其算法在数据处理的过程属于( )
A.数据采集 B.数据分析 C.数据分类 D.数据可视化
15.交通部门对高速公路运营大数据进行对比,预测出高速公路车流量及承受能力等数据。这属于数据处理过程中的( )
A.数据搜索 B.数据分析 C.数据加工 D.数据采集
二、填空题
16.词云是对文本数据进行分析处理后的可视化形式。某同学采集微信好友签名制作了如图所示的词云。观察词云图,分析并写出至少三个出现频率较高的词语 。
17.在数据分析中, 是一种用于预测未来趋势或行为的分析方法。
18.北斗卫星导航系统。古有北斗七星辨明方向,今有北斗卫星定位九州。我国自主建设、独立运行的全球卫星导航系统--北斗卫星导航系统,将为全球用户提供全天候、全天时、高精度的定位、导航和授时服务。在数据处理过程中,需要运用一定的分析方法进行整理分析,挖掘出内在的结构和规律,从而提取有价值的、有意义的数据。对比分析是将两个或两个以上的数据进行比较,分析他们的差异,从而揭示这些数据所代表的事物的发展变化情况和规律。聚类分析能够从样本数据出发,自动进行数据分类。下图是某城市公共交通运营里程的分析结果,这是运用了 分析方法。
19.数据之间有三种基本关系,分别是线性关系和 、网状关系。
三、操作题
20.某“学校图书管理系统”由书籍管理、借阅管理和用户管理等模块组成。其中,借阅管理模块可以实现用户借书、用户还书和借书统计等功能。每本书籍的内页已经贴上了条形码,用户的借书卡已经植入了电子标签。用户将借书卡放在读卡器上,通过对书籍的条码进行扫描实现借书操作,系统自动完成登记,
(1)在设计“学校图书管理系统”的前期准备中,需要对该系统的进行模块结构设计,这一过程属于 (单选,填字母:A.需求分析 / B.概要设计 / C.详细设计)。
(2)该系统服务端程序采用Flask Web框架编写,若用户编号uid为10101,书籍编号bid为2023,提交数据到Web服务器的URL为http://192.168.1.2:5000/input?uid=10101&bid=2023,则服务器端应用实例app中与该URL关联的路由设置语句是@app.route(' ')
(3)小明体验了该系统后,想进行优化设计,以下设计思路不恰当的一项是( )
A.将每位学生的指纹录入到系统中,每次使用指纹借/还图书
B.开发移动端APP,实现新书和热门书推荐功能
C.增加电子图书的印刷和出售功能
D.在借阅管理模块中,增加逾期未还的学生短信提醒功能
(4)将系统数据库中一周的借书数据导出为文件“data.xlsx”,部分数据如图a所示,并制作图表如图b所示,部分程序代码如下,划线①处填入合适的代码 ,(单选,填字母:A.sum()/ B.count() / C.mean()),划线②处填入合适的代码 。
图a 图b
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_excel("data.xlsx") #读取Excel文件中的数据
df["借阅次数"]=[0]*len(df) #插入新的列用来保存各类书籍的借阅次数
df1=df.groupby("书籍类别",as_index=False).借阅次数.①
df2=df1.sort_values("借阅次数",ascending=False)).head(3)
x=df2["书籍类别"]
y=②
plt.title("本周最受欢迎图书前3类") #设置图表标题
plt.bar(x,y) #绘制柱形图
plt.show()
四、简答题
21.测量大气压值的著名实验是由托里拆利设计完成的。他将一根长度为1米的玻璃管灌满水银,然后用手指顶住管口,将其倒插进装有水银的水银槽里,放开手指后,可见管内部顶上的水银已下落,留出空间来了,而下面的部分则仍充满水银。
任务:利用水银气压计测量不同海拔高度的大气压数值如下表所示,分析这些数据,通过数字化学习方式探究大气压与海拔高度的关系,形成可视化报告。
22.请解释什么是数据挖掘,并讨论它在现代数据分析中的作用。
23.《数据与计算》中介绍了数据可视化的概念和方法,请简述数据可视化的过程和意义,并解释它如何帮助我们更有效地分析和理解数据。
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.B
2.B
3.A
4.A
5.C
6.C
7.C
8.B
9.D
10.A
11.C
12.D
13.B
14.B
15.B
16.祖国 努力 爱 富强 分享等
17.预测分析
18.对比
19.树型关系
20. B /input C B df2.借阅次数
21.
从图中可以清晰的看出,海拔与大气压成反比关系
22.数据挖掘是从大量数据中通过算法寻找模式和知识的过程,它帮助组织从数据中获得洞察并做出决策。
23.数据可视化是将数据分析结果通过图表、地图、动画等直观形式展现出来的过程。它的意义在于帮助人们更直观地理解数据,发现数据之间的关系和规律。数据可视化的过程包括数据选择、视觉编码、图形生成和结果解释四个步骤。首先,选择需要可视化的数据集;然后,将数据属性映射到视觉元素(如颜色、形状、大小等);接着,生成图形,如条形图、散点图等;最后,解释图形所表达的意义,为决策提供依据。数据可视化工具如Excel、Tableau等使得这一过程更加便捷和高效。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$