内容正文:
第四章 数据处理与应用
一、选择题
1.下列关于数据整理的描述,正确的是( )
A.某些缺失的数据可以自己随意估计一个值进行补充
B.Excel表格中的异常数据可以直接删除或忽略
C.Excel表格中的重复数据可以进行合并或删除
D.Excel中格式不一致的数据,一般只保留一种格式的数据,删除其他格式的数据
2.国内某电商平台会对客户的消费行为做统计分析,该电商平台在用大数据技术统计分析购买“空调”用户的消费行为时,下列选项中不是研究重点的是( )
A.顾客为什么会购买空调 B.顾客购买空调的品牌取向、参数性能
C.顾客购买空调的同时,还会购买什么商品 D.顾客对购买空调的偏好和特殊要求
3.在Excel某列单元格中,快速填充2022—2024年每月最后一天日期的最优操作方法是( )
A.在第一个单元格中输入“2022-01-31”,然后使用MONTH函数填充其余35个单元格
B.在第一个单元格中输入“2022-01-31”,拖动填充柄,然后使用智能标记自动填充其余35个单元格
C.在第一个单元格中输入“2022-01-31”,然后使用格式刷直接填充其余35个单元格
D.在第一个单元格中输入“2022-01-31”,然后执行“开始”选项卡中的“填充”命令
4.如图所示,若要计算高一一班的平均分,下列函数使用正确的是( )
A.SUM(B3:D3) B.AVG(B3:D3) C.SUM(B3:B6) D.AVG(B3:B6)
5.小西同学要用 Excel 制作国庆假期天气温度的变化趋势图,他应该选择的图表类型是( )
A.柱形图 B.条形图 C.折线图 D.饼图
6.抖音可以根据个人的喜好,实时推荐视频,这主要是用到了大数据的( )技术。
A.对静态数据的批处理 B.对流数据的实时计算
C.对图结构数据的图计算 D.其他数据处理
7.在WPS表格中,下列地址为绝对地址的是( )
A.F$1 B.$D2 C.D5 D.$E$7
8.小北利用python中的jieba分词模块对“大数据.txt”进行处理,创建了如图所示的标签云,下列说法正确的是( )
A.该中文分词算法是基于规则的分词方法
B.标签云中必须显示该文本中包含的全部词语
C.从标签云中可以推测,“数据”、“数据库”等词语是该文本的重点词语
D.文本内容是结构化数据,需要转化才能被计算机处理
9.在WPS表格中,下列单元格地址行、列均能绝对引用的是( )
A.A7 B.$A7 C.A$7 D.$A$7
10.在WPS表格中,要计算C5到E5之间所有单元格中数据的平均值。下列选项中对函数的使用正确的是( )
A.AVERAGE(C5:E5) B.=AVERAGE(C5:E5) C.SUM(C5+E5) D.=SUM(C5+E5)/3
11.SUM(B1:D4 C2:D4)参与SUM运算的单元格有( )个
A.2 B.4 C.6 D.8
12.在WPS表格中使用AVERAGE()函数计算C3到C23之间所有单元格中数据的平均值,正确的是( )
A.=AVERAGE(C3+C23) B.AVERAGE(C3:C23) C.AVERAGE(C3+C23) D.=AVERAGE(C3:C23)
13.数据可视化可以帮助人们快速获取想要的信息,以下图表更能表示每部分所占比例的是( )
A.柱形图 B.折线图 C.饼图 D.条形图
14.用某个条件对数据清单进行“自动筛选”后,不符合条件的数据将被( )
A.隐藏 B.彻底删除 C.单独显示 D.撤销
15.下列对于数据采集描述不正确的是( )
A.数据采集在大数据分析中占有非常重要的地位,它是大数据分析的最后环节
B.可以通过采集到的数据测量一些物理现象
C.数据采集也是为了用科学的方法研究数据
D.可以将采集的数据放入计算机集群中,寻找相应的模型和算法,来发现新模式、新规律
16.下列技术应用使用大数据的是( )
①为了避免堵车,利用高德地图
②利用人脸识别打开门禁道闸,进入校园
③额温枪显示温度30℃
④全民K歌提示你打败了全国90%的人
⑤微信运动显示你和你的好友每天所走的步数
A.①②③④ B.①②③④⑤ C.①②④⑤ D.①③④⑤
二、填空题
17.电子表格软件中, 功能允许用户对数据进行排序、筛选和汇总。
18.单击“ ”按钮,删除分类汇总。
19.数据透视里每个字段中的数据的 必须一致。
20.在Excel中20231220用科学记数法表示为 。(保留两位小数)
21.社会实践活动中,某小组负责调查研究山西省近三十年经济发展状况,为了更加直观地展示经济发展变化趋势,最适合使用的图表类型是 。
三、操作题
22.近年来,很多网络平台会在年底为用户生成专属的个人报表,显示一年内该用户在该平台上的各种使用行为数据。
(1)这类个人报表是利用大数据技术收集用户的个人行为数据,并通过分类和计算获得。由此可见( )
A.大数据采集的数据必须准确无误 B.大数据的数据采集主要还是人工方式
C.大数据分析的是抽样数据 D.大数据分析能发现数据间的相关性
(2)某数据公司统计了2016-2020年全球每年产生的数据量及其增速,结果如图。
此统计主要采用的数据分析方法是( ),使用了( )和( )两种图表来组合进行可视化呈现。( )
A.聚类分析、饼图、条形图 B.对比分析、折线图、柱形图
C.结构分析、饼图、条形图 D.平均分析、折线图、柱形图
(3)该网站可实现对数据的加密解密,界面如图。该应用服务架构体系属于( )
A.B/S B.P2P C.C/S D.B/C
(4)此网站的加密功能是对输入的明文(由字母、数字或其他字符组成的字符串)中的每个字符进行处理。算法规则如下:
①将明文中所有的小写字母转换为大写字母,例如:a→A;
②将明文中所有的数字加上1变成另一个数字,例如0→1,9→0;
③明文中除了小写字母和数字字符外均不进行转换;
④将加密后的数据倒序输出,例如“abc”→“cba”,即为该明文的密文。
那么,明文为“An95”得到的密文为( )
A.59nA B.69nA C.60NA D.60nA
(5)以上加密算法,如果用Python语言实现,为方便处理,明文和密文一般都被抽象为( )数据类型的数据。
A.数值 B.字符串 C.列表 D.元组
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.C
【详解】本题考查电子表格操作相关内容。数据缺失问题最简单的处理方法是忽略含有缺失值的实例或属性,也可以采用平均值、中间值或概率统计值来填充缺失值;异常数据不能直接删除或忽略;格式不一致的数据可根据后续分析和挖掘的需要进行数据转换;重复数据可以进行合并或删除。故本题答案是C选项。
2.A
【详解】本题考查大数据。顾客为什么会购买空调,这更多是一种心理层面的深层次原因,难以直接转化为具体的销售策略和行动,且在实际的大数据分析中,这种主观心理原因较难准确获取和量化分析。大数据时代不再强调对事物因果关系的探求,而是更加注重它们的相关性。故答案为:A。
3.B
【详解】本题考查Excel。A 选项,使用MONTH函数填充不能直接实现按每月最后一天日期的填充要求,此方法不合适。B 选项,在第一个单元格中输入“2022 - 01 - 31”,拖动填充柄后,使用智能标记可以自动识别填充序列规律,自动填充其余35个单元格,能够快速准确地实现2022-2024年每月最后一天日期的填充,是最优操作方法。C 选项,格式刷主要用于复制单元格的格式设置,不能用于填充不同的日期数据,此方法无法达到要求。D 选项,“开始”选项卡中的“填充”命令,不能智能地按照每月最后一天日期的规律进行填充。故答案为:B。
4.B
【详解】本题考查电子表格函数相关内容。SUM函数指的是返回某一单元格区域中数字、逻辑值及数字的文本表达式之和。AVG用于计算一个表格或查询结果集合中某一列的数值平均值。B3:D3为计算平均值的数据域,B选项正确。故本题答案是B选项。
5.C
【详解】本题考查Excel图表的应用。饼图适用于部分与整体的占比情况,柱形图适用于数据间的比较,折线图适用于描述趋势。故选C。
6.B
【详解】本题考查大数据技术相关内容。大数据技术是指为更经济地从高频率的、大容量的、不同结构和类型的数据中获取价值而设计的新一代架构和技术。大数据包括对静态数据的批处理、对流数据的实时计算和对图结构数据的图计算。抖音可以根据个人的喜好,实时推荐视频,这主要是用到了大数据的对流数据的实时计算技术。故本题答案是B选项。
7.D
【详解】本题考查WPS单元格引用相关内容。相对引用,引用单元格的相对地址,即引用单元格的位置关系是相对的,默认情况下,新公式使用的是相对引用。绝对引用是引用单元格的实际地址,单元格之间的位置关系是绝对的,表示方法:在相对引用单元格的行号与列标前面加“$”。故本题答案是D选项。
8.C
【详解】本题考查的是标签云。jieba分词综合了基于字符串匹配的算法和基于统计的算法,选项A说法错误;标签云中不需要显示该文本中包含的全部词语,选项B说法错误;从标签云中可以推测,“数据”、“数据库”等词语是该文本的重点词语,选项C说法正确;文本内容是非结构化数据,故选项D说法错误。故本题应选C。
9.D
【详解】本题考查表格的使用。"$A$7"表示对单元格A7的绝对引用,即无论公式被复制到其他位置,都会保持引用的是A列和7行的单元格。故答案为:D。
10.B
【详解】本题考查表格函数。在WPS表格中,使用AVERAGE函数来计算指定单元格范围的平均值,函数的格式为=AVERAGE(单元格范围)。故答案为:B。
11.C
【详解】本题考查电子表格单元格运算相关内容。由“B1:D4”、“C2:D4”知,参与SUM运算的单元格是“C2:D4”,共6个单元格,故本题答案是C选项。
12.D
【详解】本题考查WPS公式应用相关内容。公式的使用以“=”开始,求C3到C23之间所有单元格中数据的平均值,可以将所有单元格相加后取平均值,也可以表示成区域C3:C23,故正确的选项是=AVERAGE(C3:C23),故本题答案是D选项。
13.C
【详解】本题考查的知识点是常见的统计图。柱形图用于显示一段时间内的数据变化或显示各项之间的比较情况。折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的变化趋势。饼图表示每部分所占比例。条形图显示各个项目之间的比较情况。故答案为C选项。
【点睛】
14.A
【详解】本题考查的知识点是筛选功能应用。用某个条件对数据清单进行“自动筛选”后,不符合条件的数据将被隐藏。这意味着这些数据仍然存在于数据清单中,但是它们被暂时隐藏起来,以便只显示符合条件的数据。因此,答案是A选项。
15.A
【详解】本题主要考查大数据采集。数据采集在大数据分析中占有非常重要的地位,它是大数据分析的首要环节,并不是最后的环节,故本题选A选项。
16.C
【详解】本题考查的是大数据应用。大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。额温枪显示温度30℃没有应用大数据,故本题应选C。
17.数据透视表
【详解】本题考查电子表格。数据透视表功能可以方便地对大量数据进行排序、筛选和汇总操作。它能够快速整合和分析数据,帮助用户从复杂的数据中提取有价值的信息,以不同的视角和维度来查看和理解数据。故答案为:数据透视表,
18.全部删除
【详解】本题考查电子表格相关内容。在“分类汇总”对话框下面有个“全部删除”按钮,此按钮的作用就是用来删除分类汇总的。故本题答案是:全部删除。
19.类型
【详解】本题考查数据透视相关内容。数据透视里每个字段中的数据的类型必须保持一致。故本题答案是:类型。
20.2.02E+07
【详解】本题考查Excel电子表格相关内容。Excel中科学记数法,以数字E+或-数字形式显示,E前的为1~10之间的数值,E后为10的多少次方,如2×10^8,显示为2E+08;当数值较小,为小于1的纯小数,E后的指数,即为负数,比如:0.0000002,就为2E-07;当输入单元格的数值比较大,超过11位时,也会以科学记数法显示。故20231220用科学记数法表示为:2.02E+07。
21.折线图
【详解】本题考查图表相关内容。图表种类有:柱形图,用于显示一段时间内的数据变化或显示各项之间的比较情况;折线图,可以显示随时间(根据常用比例设置)而变化的连续数据;饼图,常用于统计学模块;条形图,显示各个项目之间的比较情况;要直观地展示经济发展变化趋势,最合适的图表类型是折线图。故本题答案是:折线图。
22. D B A C B
【详解】本题考查数据与大数据相关内容。结合题目内容可知:
(1)这类个人报表是利用大数据技术收集用户的个人行为数据,并通过分类和计算获得,说明大数据分析能发现数据间的相关性。故本题答案是:D。
(2)①聚类分析就是将研究对象根据一些特征指标,把比较相似的研究对象,按一定的方式归为同类。②对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性,对比分析可分为静态比较和动态比较两大类:静态比较也叫横向对比,是同一时间下对不同指标的对比;动态比较也叫纵向对比,是同一总体条件对不同时期指标数值的比较。③结构分析法指分析总体内的各部分与总体之间进 行对比的分析方法及总体内各部分 占总体的比例,属于相对指标,一般某部分的比例越大,说明其重要程度越高,对总体的影响越大。④平均分析法是运用计算平均数的方法来反映总体在一定时间/地点条件下某一数量特征的一般水平,平均指标可用于同一现象在不同地区/不同部门或单位间的对比,还可用于同一现象在不同时间的对比。该图展示了2016-2020年全球每年产生的数据量及其增速,属于对比分析,使用了柱形图和折线图。故本题答案是:B。
(3)用户通过浏览器实现各种操作,属于B/S架构。故本题答案是:A。
(4)由加密规则可知,明文“An95”中:“A”保持不变,“n”转换为“N”,“9”转换为“0”,“5”转换为“6”,逆序排列即为密文:“60NA”,故本题答案是:C。
(5)用Python语言实现该加密算法,为方便处理,明文和密文一般都被抽象为字符串类型的数据。故本题答案是:B。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$