内容正文:
3.加工、分析和可视化数据
一、选择题
1.下列可用于分析数据趋势的是( )
A.折线图 B.词云图 C.饼图 D.动态热力图
2.下列数据分析中可能涉及文本情感分析的是( )
A.对城市地理位置的分析 B.对影评内容的分析
C.对道路设施的分析 D.对大学男女比例的分析
3.《数据与计算》中提到了数据可视化的重要性,它可以帮助我们更直观地理解数据。以下哪个选项不是数据可视化的一种常见形式?( )
A.条形图 B.折线图 C.饼图 D.表格
4.数据可视化的呈现类型有( )
A.探索型 B.试探型 C.逻辑型 D.布尔型
5.下列语言中不属于主流数据分析语言的是( )
A.Python语言 B.MATLAB语言 C.C语言 D.R语言
6.下表是某企业销售部门的数据,如果要比较每组的销售总额,最合适的是( )
A
B
C
1
组别
产品名称
销售额(万元)
2
第一组
电视机
69.94
3
第二组
电视机
64.74
4
第三组
电视机
64.16
5
第一组
冰箱
56.07
6
第二组
冰箱
76.30
7
第三组
冰箱
75.72
A.先按产品名称排序,再以产品名称为分类依据,对销售额以“求和”方式做分类汇总
B.先按组别排序,再以组别为分类依据,对销售额以“求和”方式做分类汇总
C.按销售额进行排序
D.直接按产品名称分类汇总
7.词云图是一种数据可视化表达方式。下列不适合用词云图来呈现的是( )
A.《西游记》中人物出现的次数
B.《唐诗三百首》中常用的词语
C.政府某年度工作报告中的关键词
D.某学生期末考试分数成绩
8.下列选项中,可以实现实时数据可视化的是( )
A.导航地图 B.标签云图 C.思维导图 D.统计图表
9.标签云(词云)用词频表现文本特征,将关键词按照一定的顺序和规律排列,并以文字大小的 形式代表词语的重要性。下列不适合用标签云(词云)来呈现的是( )
A.政府年度工作报告中的关键词
B.学生期末考试成绩
C.《全唐诗》常用的词语
D.《红楼梦》中人物出现的次数
10.下列选项中,应用了实时数据可视化的手机 App是( )
A.花小猪打车 B.抖音 C.讯飞语记 D.传图识字
11.以下不属于数据可视化应用的是( )
A.高德地图 B.掌上公交 C.图表新闻 D.美团外卖
12.下图是对文本数据进行处理生成的“词云”图。图中的词语显示有大有小,显示较大的是因为这个词( )
A.比较重要 B.出现次数较多 C.比较关键 D.比较流行
13.下列选项中,不属于数据可视化应用的是( )
A.滴滴出行 B.掌上公交 C.高德地图 D.百度网盘
14.我们可以使用软件工具将数据分析的结果以表格、图形、图表的形式直观呈现出来,这种方式称为数据的( )
A.分析 B.整理 C.报告 D.可视化
15.在《数据与计算》中,关于数据可视化的描述,以下哪项是错误的?( )
A.数据可视化是将数据分析结果通过图表等形式展示出来
B.数据可视化可以帮助人们更直观地理解数据
C.数据可视化没有交互性
D.数据可视化可以揭示数据之间的关系和趋势
二、填空题
16.在《数据与计算》中,数据可视化是数据分析的重要环节,它通过图形、图像等形式直观展示数据,帮助人们理解数据内涵和发现数据背后的规律。数据可视化常用的图表类型包括条形图、折线图、饼图、散点图和 图等。
17.数据可视化表达的呈现类型主要分为探索和 两种不同的类型。
18.数据之间有三种基本关系,分别是线性关系和 、网状关系。
三、判断题
19.词云可以使得难以实现结构化的数据文本挖掘成为轻而易举的事情。( )
四、操作题
20.某校为了支持学生的学习进步,特设补弱支持,每位学生可以根据自身学习情况,从语数英物 化生政史地技这10门科目中,选择不超过两门科目作为自己的补弱科目,这些选择的数据已存储于“student.xlsx”文件中,部分数据如1图所示:
1图
2图
(1)首先,需要对数据进行整理,筛选出那些补弱科目数不符合学校规定(超出两门)的学生记 录,以便通知他们重新选择补弱科目,Python 程序如下:
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams[font.sans-serif]=['KaiTi','SimHei','FangSong']#设置中文字体
df=pd.read_excel("student.xlsx")
df_err =df[ ]
请在▲处填入合适的代码
(2)数据整理并修正后,分析各班各科目的选择人数,以及各科目选择人数占总人数比例。 km=[" 语文","数学","英语","物理","化学","生物","政治","历史","地理","技术"]
dfl=df.groupby(" 班级").
print(dfl) # 2图所示
#删除“姓名”和“科目数”列
df2=dfl.drop(["姓名","科目数"],axis=1)
g=df2.sum()#g 为 Series 对象
#统计各科目的人数占总人数的比例
for k in km:
per = /len(df)*100
print(k," 比例为:",round(per,2),"%")
x =
y=g.values
plt.bar(x,y) # 3 图所示
plt.title("各科补弱人数对比")
plt.show0
3图
五、简答题
21.测量大气压值的著名实验是由托里拆利设计完成的。他将一根长度为1米的玻璃管灌满水银,然后用手指顶住管口,将其倒插进装有水银的水银槽里,放开手指后,可见管内部顶上的水银已下落,留出空间来了,而下面的部分则仍充满水银。
任务:利用水银气压计测量不同海拔高度的大气压数值如下表所示,分析这些数据,通过数字化学习方式探究大气压与海拔高度的关系,形成可视化报告。
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.A
2.B
3.D
4.A
5.C
6.B
7.D
8.A
9.B
10.A
11.D
12.B
13.D
14.D
15.C
16.热力图
17.解释
18.树型关系
19.错误
20. df.科目数>=3 或 df.科目数>2 或 df["科目数"]>=3 或 df["科目数"]>2 count( ) g[k] g.index 或 km
21.
从图中可以清晰的看出,海拔与大气压成反比关系
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$