内容正文:
第五章数据处理和可视化表达2023—2024学年高中信息技术粤教版(2019)必修1
一、选择题
1.数据可视化的作用不包括以下哪一项?( )
A.直观展示数据 B.隐藏数据关系 C.传递数据信息 D.发现数据规律
2.以下哪个不是数据分析过程中可能遇到的问题?( )
A.数据缺失 B.数据不一致 C.数据过时 D.数据过多
3.同学们到图书馆借书需要刷卡或刷脸,这个“刷”的过程属于( )
A.数据分析 B.数据分类 C.数据采集 D.数据可视化表达
4.以下关于对大数据特点的叙述中不正确的是( )
A.数据价值密度高 B.数据类型多样 C.数据处理速度快 D.数据规模大
5.暑假期间,班主任想快速收集学生外出活动信息。下列比较便捷的方式是( )
A.在线文档收集 B.电话逐个询问 C.入户登记 D.电子邮件交流
6.下列最适合反映比例关系的可视化图表是( )
A.饼图 B.散点图 C.热力图 D.折线图
7.下列关于大数据的说法,正确的是( )
A.大数据的数据体量巨大,价值密度高
B.处理大数据时,一般采用分治思想
C.大数据接受数据混杂,主要探求数据间的因果关系
D.大数据的应用,避免了用户隐私信息泄露的风险
8.下列语言中不属于主流数据分析语言的是( )
A.Python语言 B.MATLAB语言 C.C语言 D.R语言
9.关于大数据的作用,以下叙述不合理的是( )
A.大数据可以反映社会现象 B.大数据可以预测发展趋势
C.大数据可以指导决策的制订 D.大数据分析可达100%的准确率
10.下列属于大数据对人们日常生活产生的负面影响的是( )
A.增加生活便利性 B.提高决策的准确性
C.病毒发作频繁 D.增加了个人信息泄露的风险
11.监控不间断地录制视频产生了大量的视频数据,而有用的数据可能仅有十几秒,这体现了大数据的( )特征。
A.数据类型繁多 B.资源可共享 C.价值密度低 D.变化速度快
12.为了预测工业用电量并做好应急预案,电力部门对历年的数据进行对比。这属于数据处理过程中的( )
A.数据加密 B.数据表达 C.数据分析 D.数据测评
13.下列关于数据与大数据的说法,不正确的是( )
A.大数据中各种结构化、半结构化和非结构化的数据共存
B.大数据不必追求数据的精确性,不必保证每个数据都准确无误
C.大数据不一定强调事物的因果关系,而是更注重他们的相关性
D.数据量大的一定是大数据,因为大数据的数据体量大
14.POI数据的聚类分析通常基于( )进行。
A.用户评价 B.地理位置信息 C.商品价格 D.商家评分
15.在本次春节联欢晚会中首次使用了我国自主研发的8K超高清摄像机参与摄制,高清摄像机属于数字化工具中的( )
A.数据采集工具 B.信息检索工具 C.三维设计工具 D.信息交流工具
16.浙江某中学准备充分利用现今的科学技术,举办一场盛大的运动会。为配合运动会顺利进行,学校计算机社团开发了一套运动会管理系统,实现运动员报名、比赛数据传输、气候预判、成绩排名等功能。为体现公平公正公开原则,所有运动员检录由人工智能进行人脸识别,自动登记入场信息。利用某平台的大数据进行气象预测,下列描述正确的是( )
A.气象预测所需的实时数据一般采用批量处理方式
B.该系统对大数据进行计算的过程依赖于规范的结构化数据
C.有关气象的大数据只有及时处理才能充分发挥价值
D.只有通过大数据分析出天气变化的原因,才能对气候预判越来越准
二、填空题
17.数据分析应用对象主要有 分析、 分析和 分析。
18.平均分析就是运用 的方法,来反映总体在一定时间、地点条件下某一数量特征的 。
19.请列举出五个数据可视化表达的常见图表名称 。
20.数据管理设计主要负责与具体数据管理系统相衔接,包括数据采集、 、 和呈现等方面,为系统中需要长久存储的数据对象提供数据存储的方案。
21.在数据分析中, 是用来衡量数据分布离散程度的一种统计量。
22.浮点数的表示通常包括三个部分:符号位、指数位和 位。
三、判断题
23.大数据对我们的意义在于,我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。 ( )
24.容量是1GB的存储卡,相当于1000MB。( )
25.大数据其实就是大型数据库系统。( )
26.数据可视化是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。( )
27.大数据由于数据量大,服务器一般采用分布式文件存储或数据库存储。( )
四、操作题
28.将某餐厅信息管理系统数据库中一周订单数据导出为文件“week.xlsx”,如图a所示,并制作图表如图b所示,部分程序代码如下,请在画线处填入合适的代码。
图a
图b
import pandas as pd
import matplotlib.pyplot as plt
#图表显示中文字体,代码略
df=pd.① ("week.xlsx") #读取Excel文件中的数据
df1=df.② ("菜品",as_index=False).sum() #按“菜品”分组求和
df2=df1.sort_values("份数",ascending=False).head(5) #按“份数”排序并取前5行
x=③
y=df2["份数"]
plt.title("一周餐厅最佳菜品(单位:份数)") #设置图表标题
plt.④ (x,y) #绘制柱形图
plt.show()
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.B
【详解】本题考查数据可视化。数据可视化的作用是直观展示数据、传递信息和发现数据规律,不是隐藏数据关系。故正确答案为:选项B。
2.D
【详解】本题考查数据分析。在数据分析中,数据缺失会导致信息不完整,影响分析结果的准确性和可靠性;数据不一致可能导致分析结果的矛盾和错误;数据过时则不能反映当前的真实情况,使分析结果失去时效性和参考价值。而数据过多一般不是问题,通过合理的筛选、处理和分析方法,可以从大量数据中提取有价值的信息。故答案为:D。
3.C
【详解】本题考查数据处理的相关内容。数据处理一般是指对数据进行采集、整理、分析和可视化的表达的过程。数据采集是指人们根据需要获取数据,它是确保数据处理过程有效的基础。这个“刷”的过程属于数据采集。故答案为:C。
4.A
【详解】本题主要考查大数据的特点。大数据的特点有:数据价值密度低、数据类型多样、数据处理速度快、数据规模大,故本题选A选项。
5.A
【详解】本题考查信息收集。通过发布在线文档,学生可以自行填写相关信息,不仅省去了逐一登记的过程,而且可以实现快速的信息收集。故本题应选A。
6.A
【详解】本题考查的是图表功能。折线图用于描述数据趋势;饼图用于描述整体与部分的占比;柱形图用于描述数据之间的比较;热力图(Heatmap)是一种用颜色表达数据密度的可视化工具,它将数据以不同颜色的热点形式呈现在二维空间中,用于展示数据的分布情况和集中程度,从而帮助我们观察数据的趋势和模式。故本题应选A。
7.B
【详解】本题考查大数据相关内容。大数据的数据体量巨大,价值密度低;大数据强调对事物相关关系的探求;大数据的应用提高了个人隐私泄露的风险;大数据一般采用分治思想处理。ACD选项说法错误,B选项说法正确。故本题答案是B选项。
8.C
【详解】本题考查的是数据分析工具。R是用于统计分析、绘图的语言和操作环境。MATLAB语言是数值计算和科学编程语言,可进行各种数值计算、数据分析、图形绘制和模拟等。Python语言可以利用第三方库进行数据分析。故本题应选C。
9.D
【详解】本题考查的知识点是大数据相关知识。叙述不合理的是:大数据分析可达100%的准确率。首先,大数据确实可以反映社会现象和指导决策的制订,这是通过收集和分析大量数据来揭示隐藏在数据背后的规律和趋势,从而帮助人们更好地理解和解决实际问题。其次,大数据也可以预测发展趋势,这是通过分析历史数据和当前情况来预测未来的趋势和结果,从而帮助人们做出更好的决策和规划。然而,大数据分析的准确率并不是100%。虽然大数据分析可以提供很多有用的信息和洞见,但由于数据的质量、完整性、多样性等因素的影响,其结果可能存在误差和不确定性。因此,我们应该将大数据分析视为一种工具,而不是绝对真理的代表。在使用大数据分析时,我们应该保持谨慎和客观的态度,同时结合其他因素和信息来综合考虑和分析问题。故答案为D选项。
10.D
【详解】本题考查大数据的影响。大数据的收集和分析可能涉及大量个人信息,如果不受到有效的隐私保护和安全措施,有可能增加个人信息泄露的风险。故答案为:D。
11.C
【详解】本题主要考查大数据的特征。数据规模大、数据规模类型多样、数据处理速度快、数据价值密度低均是大数据的特征。监控不间断地录制视频产生了大量的视频数据,而有用的数据可能仅有十几秒,这体现了大数据的价值密度低特征,故本题选C选项。。
12.C
【详解】本题考查数据分析。为了预测工业用电量并做好应急预案,电力部门对历年的数据进行对比。这属于数据处理过程中的数据分析。故选C。
13.D
【详解】本题考查大数据。数据量大不一定意味着数据就是大数据。大数据强调的是数据的多样性,包括结构化、半结构化和非结构化数据,以及数据的高速生成和处理等特征。数据量的大小只是大数据的一个方面,而不是其唯一特点。故答案为D选项。
14.B
【详解】本题考查POI数据。POI数据的聚类分析通常基于地理位置信息进行,通过分析POI的地理位置分布,可以识别出热点区域、商业聚集区等信息。故选择B。
15.A
【详解】本题主要考查数字化工具。在本次春节联欢晚会中首次使用了我国自主研发的8K超高清摄像机参与摄制,高清摄像机属于数字化工具中的数据采集工具,故本题选A选项。
16.C
【详解】本题考查大数据相关内容。A选项,气象预测所需的实时数据一般采用流计算,静态数据采用批处理方式,选项错误;B选项,大数据一般结合结构化、半结构化和非结构化数据,选项错误;C选项,有关气象的大数据只有及时处理才能充分发挥价值,选项正确;D选项,大数据不探求因果关系,而是注重数据关联,选项错误。故本题答案是C选项。
17. 现状 原因 预测
【详解】本题考查的是数据分析。数据分析应用对象主要有应用对象主要有现状分析、原因分析和预测分析。
18. 计算平均值 一般水平
【详解】本题考查的是数据分析。平均分析就是运用计算平均值的方法,来反映总体在一定时间、地点条件下某一数量特征的一般水平。
19.饼图、条形图、折线图、散点图、雷达图、词云图、热力图等。
【详解】本题主要考查数据可视化。数据可视化表达的常见图表名称有:饼图、条形图、折线图、散点图、雷达图、词云图、热力图等。
20. 传输 存储
【详解】本题考查数据管理相关内容。数据管理设计主要负责与具体数据管理系统相衔接,包括数据采集、数据传输、数据存储和数据呈现。数据采集:从各种来源收集数据,确保数据的来源可靠和准确。数据传输:保证数据在传输过程中的安全和效率,避免数据在传输过程中丢失或被篡改。数据存储:设计合理的数据库结构,确保数据可以高效、安全地存储,同时满足数据的访问和查询需求。数据呈现:以用户友好的方式展示数据,使用户能够方便地获取和理解所需信息。通过这些步骤,数据管理设计确保了数据的完整性、一致性和准确性,为组织的决策提供了坚实的基础。同时,这也涉及到数据的质量管理,包括数据的准确性、一致性、完整性和安全性等方面,这些都是确保数据可靠性的关键因素。故本题答案分别是:传输、存储。
21.方差
【详解】本题考查数据分析。方差是用来衡量数据分布离散程度的一种统计量。它表示数据点与均值之间的平均平方差,反映了数据的波动程度。方差越大,数据分布越分散;方差越小,数据分布越集中。
22.尾数
【详解】本题考查浮点数。浮点数的表示包括符号位、指数位和尾数位,其中尾数位用于存储有效数字。故答案为:尾数。
23.对
【详解】本题考查的是大数据。大数据指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据对我们的意义在于,我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。题干中的说法正确。
24.错误
【详解】本题考查存储容量相关内容。容量基本单位为字节B,字节向上分别为KB、MB、GB、TB,其中,1KB=1024Byte,1MB=1024KB,1GB=1024MB。容量是1GB的存储卡,相当于1024MB。故本题答案是错误。
25.错误
【详解】本题主要考查大数据的描述。大数据和数据库系统是两个概念,大数据平台主要以分布式存储和分布式计算两大基础技术来展开,其中分布式存储就涉及到数据库系统,故表述错误。
26.正确
【详解】本题考查的是数据的可视化表达。
27.√
【详解】本题考查大数据存储相关知识点
大数据由于数据量大,服务器一般采用分布式文件存储或数据库存储。表述正确
28. read_excel groupby df2["菜品"](或df2.菜品) bar
【详解】本题考查Python数据分析。①读取Excel文件,使用read_excel()。故正确答案为:read_excel。②分组函数为groupby()。故正确答案为:groupby。③对于df分组后,菜品作为数据列,分析图表中x轴的数据为菜品名称,故x=df2["菜品"]或df2.菜品。故正确答案为:df2["菜品"](或df2.菜品)。④绘制垂直柱形图使用bar()函数。故正确答案为:bar。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$