内容正文:
3.4 数据分析报告与应用
学校:___________姓名:___________班级:___________考号:___________
一、选择题
1.下列有关pandas-Series的说法错误的是( )
A.包含一个数组的数据和一个与数据关联的索引,是二维数据结构
B.其索引值默认是从0起递增的整数
C.可用列表、字典等创建Series数据结构
D.其索引可以指定,类型可以为字符串型
2.数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。下列关于数据分析报告的说法中,不正确的是( )
A.数据分析报告中要明确数据分析的目的和背景
B.数据分析报告要阐述目前存在的问题及通过分析希望解决的问题
C.数据分析报告中的数据必须全部用文字的形式进行呈现
D.数据分析报告要呈现数据分析的过程、结论和建议
3.下列关于大数据及其处理的说法,不正确的是( )
A.大数据蕴含巨大的价值,但因其数据量庞大,所以“提纯”数据是人们一直努力的目标
B.电商的个性化精准推荐,是因为知道了人们都买某些商品的原因
C.处理大数据时,一般采用分治思想
D.HBase 是采用基于列的存储方式,具有良好的横向扩展能力
4.下列不属于大数据分析报告应遵循的原则的是( )
A.规范性 B.前瞻性 C.重要性 D.谨慎性
5.想通过分析某同学各学科历次考试成绩的分数情况,预测他的下一次考试成绩,其基本步骤是( )
①数据整理 ②数据采集 ③ 撰写分析报告 ④ 数据分析与可视化
A.②④①③ B.②①③④ C.②①④③ D.②③①④
6.通过访问国家统计局网站,可以查阅相关数据报告,下列关于撰写数据分析报告说法不正确的是( )
A.不能采用专业术语,篇幅较长 B.内容客观,分析准确
C.呈现数据分析的过程、结论和建议 D.引用资料要加注释
7.大数据和人工智能是当今科技领域最为热门的话题之一。在大数据的支撑下,人工智能正不断加速渗透到我们生活的方方面面。比如在零售、智能医疗、金融、交通运输,城市管理等诸多领域得到广泛应用。人工智能将会变得更加个性化和智能化,提供更加高效和精准的服务。下列关于大数据和大数据处理说法,正确的是( )
A.大数据的数据量庞大,其价值密度高
B.大数据给生活带来便利,不会带来信息泄露、数据安全等方面的问题
C.处理大数据时需要分析的是全体数据
D.银行的数据处理系统在生成每位用户年度账单报告时,需要使用流计算
8.想通过分析某同学语文历次考试成绩的分数情况,预测他的语文下一次考试成绩,其基本步骤是( )。
①数据预处理 ②数据采集 ③分析报告 ④数据分析 ⑤可视化表达
A.②④①⑤③ B.②①⑤③④ C.②①④⑤③ D.②③①⑤④
9.数据分析报告通常由( )等组成。
A.正文 B.标题、目录 C.结论 D.前言
10.云计算的核心技术包括( )
A.云平台管理技术 B.海量数据分布存储技术 C.虚拟化技术 D.海量数据管理技术
11.大数据的战略意义不在于庞大的数据量,而在于对这些数据( )
A.存储处理 B.速度处理 C.专业化处理 D.内容处理
12.下列不是HDFS优点的是( )
A.高容错性 B.适合单线程处理 C.适合大数据处理 D.流式文件访问
13.下列关于数据分析报告的说法不正确的是( )
A.数据分析报告一般的结构是总-分-总
B.关注数据质量是做好数据分析报告的前提
C.数据分析报告中的数据必须用文字的形式呈现
D.数据分析报告的常见类型有专题分析报告、综合分析报告、日常数据通报等
14.图结构中的每个顶点( )与其他顶点有边相连,数据元素之间是( )的关系。
A.都可以;一对多 B.都可以;多对多 C.不都可以;多对多 D.不都可以;一对多
15.数据分析报告的基本组成部分包括( )
A.标题页、前言、正文、结论和建议 B.标题页、正文、结论和建议、附录
C.前言、正文、结论和建议 D.标题页、前言、正文、结论和建议、附录
16.通过数据分析报告,可以将分析结果、可行性建议及其他有价值的信息传递给使用者,以下因素中哪一项不是数据分析报告必须具备的基本组成部分( )
A.标题面 B.正文 C.网站地址 D.结论建议
17.数据分析报告是整个数据分析过程的成果。对数据分析报告的要求不包括( )
A.数据分析必须全部基于权威部门公开发布的数据
B.数据分析的推理要有很强的逻辑性和严谨性
C.数据分析报告要有数据分析的结论
D.分析报告要有较强的可读性
18.某调查机构准备做一份关于《在校学生视力情况数据分析报告》,下列说法正确的是( )
A.该报告中涉及的数据呈现方式必须用图表 B.该报告报告重点呈现数据分析的过程,可以没有结论
C.该报告要重点呈现数据分析过程、结论和建议 D.学生视力情况分析的目的与背景在报告中可以忽略
19.Hadoop生态系统中,用于处理大规模数据集的并行计算框架是( )
A.HDFS B.MapReduce C.Hive D.Pig
20.“某地一月第一周最高气温”数据如下表所示,小东编写Python 程序代码如下,则程序执行后输出的图表是( )
A. B. C. D.
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.A
【详解】 本题考查的是Series对象相关知识。Series对象是一种一维的数据结构,包含一个数组的数据和一个与数据关联的索引。故本题应选A。
2.C
【详解】本题考查的是数据分析报告书写。数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。在数据分析报告中,首先需要明确数据分析的目的和背景,阐述目前存在的问题及通过分析希望解决的问题;其次需要描述数据来源和数据分析的思路、方法和模型;最后需要重点呈现数据分析的过程、结论和建议。数据的呈现方式多种多样,应根据数据的特点选择合适的数据呈现方式,选项C说法错误。故本题应选C。
3.B
【详解】本题考查大数据相关内容。大数据的特征是数据量大、速度快、数据类型多、价值密度低。A选项, 大数据来源广泛多样,数据标准不统一,指标口径杂乱,数据整合和衔接困难,而应用和处理大数据要求强大的机器算法能迅速地完成数据的价值“提纯”,这是大数据区分于传统数据挖掘最显著的特征,选项正确。B选项,电商平台个性化推荐系统是基于大数据挖掘、处理、清洗、分析的一种智能商务平台,不是基于大数据精确分析了用户购买商品的原因,选项错误。C选项,处理大数据时,一般采用分治思想,选项正确。D选项,HBase是一个分布式的、面向列的开源数据库,该技术来源于Fay Chang所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”,HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库,并且是基于列而不是基于行的模式,选项正确。故本题答案是B选项。
4.B
【详解】本题考查大数据分析相关内容。数据分析报告是一种有结构的文档,目的在于根据特定目标受众的需求,总结、解释和以可视化的方式呈现数据分析的结果。大数据分析报告应遵循的原则的是:(1)谨慎性原则:数据分析报告在撰写的过程中一定要谨慎,避免出现数据错误、不切合数据分析核心等不必要的问题,应该体现出实事求是、完整、科学、合理、可靠等特点。(2)规范性原则:数据分析报告中所使用的名词术语一定要专业、规范,并且全报告的格式应该统一,避免出现文不对题、前后不一致的情况。(3)重要性原则:数据分析报告一定要体现项目分析的重点,应该选取真实性、合法性指标,构建相关模型,科学专业地进行分析。(4)鼓励创新原则:如今科学技术发展迅速,必然能创新出便捷的、更好的研究模型和分析方法。在数据分析撰写报告的过程中,可以将这些创新的想法记录下来,发扬光大,增添数据报告的价值。前瞻性不属于大数据分析报告应遵循的原则。故本题答案是B选项。
5.C
【详解】本题主要考查数据分析。想通过分析某同学各学科历次考试成绩的分数情况,预测他的下一次考试成绩,其基本步骤是②数据采集①数据整理④ 数据分析与可视化③ 撰写分析报告,故本题选C选项。
6.A
【详解】本题考查数据分析相关内容。数据分析报告不仅是对整个数据处理过程的总结与展示,更能为决策提供参考。正文是报告的主体部分,包含所有数据分析事实和观点,要系统地展示数据分析的过程和结果,正文各部分之间应具有清晰的逻辑关系,条理清楚,可通过数据图表和相关的文字结合进行分析,帮助使用者理解。报告结尾部分应根据数据分析结果进行总结和提炼,给出明确的结论、具体建议或解决方案,这部分是整个报告的重点,能够帮助使用者深入思考。附录是对全文的补充,可以将不便于在正文中体现的内容放在这里,包括名词解释、数据收集方式、调查问卷、分析方法说明和参考资料等。分析4个选项,BCD说法正确,A选项说法不正确。故本题答案是A选项。
7.C
【详解】本题考查的是大数据与大数据处理。大数据的数据量庞大,其价值密度低;大数据给生活带来便利,同时也会带来信息泄露、数据安全等方面的问题;流计算:实时获取来自不同数据源的海量数据经过实时分析处理,获取有价值的信息,银行的数据处理系统在生成每位用户年度账单报告时,不适合使用流计算。故选C。
8.C
【详解】本题考查数据分析步骤的相关知识点
首先是数据采集,然后是数据预处理,其次是数据分析,再可视化表达,最后分析报告。故本题选C选项
9.ABCD
【详解】本题考查数据分析报告。标题清晰地概括报告的主题和内容。目录列出报告各个部分的标题,便于读者快速浏览。前言介绍报告的背景、目的和分析方法。正文详细阐述数据分析的过程和结果,包括数据来源、分析步骤、发现的模式和规律等。结论总结分析结果,提出建议或未来展望。这些组成部分可以帮助报告更加结构化和条理清晰,使读者能够快速了解报告的核心内容和主要发现。在实际撰写过程中,报告的具体结构和内容可能会根据分析目的和受众需求而有所不同。故正确答案为ABCD
10.ABCD
【详解】本题考查云计算。虚拟化技术是云计算的基础,通过将物理资源抽象为虚拟资源,实现资源的动态分配和弹性扩展。海量数据分布存储技术能够将数据分散存储在多个节点上,提高存储系统的容量和可靠性。海量数据管理技术能够有效管理和处理大量的数据,支持云计算的数据分析和计算需求。云平台管理技术能够统一管理和调度云计算平台的各种资源,实现资源的自动化配置和弹性伸缩。故正确答案为ABCD。
11.C
【详解】本题考查大数据相关内容。大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理,换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。故本题答案是C选项。
12.B
【详解】本题考查大数据处理。HDFS 是一种分布式文件系统,具有高容错性,通过数据冗余和副本机制可以在节点出现故障时保证数据的可靠性;HDFS 适合处理大规模的大数据,能够存储和管理海量的数据;支持流式文件访问,一次写入、多次读取,适合批处理式的大数据处理。然而,HDFS 是为了处理大规模数据的批处理任务而设计的,并不适合单线程处理这种小规模、交互性强的任务。故答案为:B。
13.C
【详解】本题考查数据分析相关内容。ABD选项说法正确。C选项,数据分析报告中的数据可以用文本、表格、图形等多种形式呈现,说法错误。故本题答案是C选项。
14.B
【详解】本题主要考查数据结构。图结构中的每个顶点都可以与其他顶点有边相连,数据元素之间是多对多的关系,故本题选B选项。
15.D
【详解】本题主要考查数据分析的描述。数据分析报告的基本组成部分包括标题页、前言、正文、结论和建议、附录,故本题选D选项。
16.C
【详解】本题主要考查数据分析报告的描述。数据分析报告的基本组成部分包括标题页、前言、正文、结论和建议、附录,故本题选C选项。
17.A
【详解】本题考查数据分析报告相关内容。数据分析报告是一种有结构的文档,目的在于根据特定目标受众的需求,总结、解释和以可视化的方式呈现数据分析的结果。此类报告通常包括数据描述、分析方法、结果和结论,并提供洞察以解决问题或支持决策。数据分析的推理要有很强的逻辑性和严谨性,应该具有可读性强、信息准确、清晰明了的特点,以帮助受众理解和应用数据的洞察。数据分析不必全部基于权威部门公开发布的数据。故本题答案是A选项。
18.C
【详解】本题主要考查数据处理与应用。数据分析报告应遵循以下原则:规范性原则、重要性原则、谨慎性原则、鼓励创新原则。故这份报告要重点呈现数据分析过程、结论和建议,选项C正确。数据的呈现方式多种多样,应根据数据的特点选择合适的数据呈现方式,故选项A说法错误。一份数据分析报告应给出结论,选项B说法错误。数据分析的目的是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律,故选项D说法错误。故选C。
19.B
【详解】本题考查Hadoop。Hadoop生态系统中,MapReduce是一个用于处理大规模数据集的并行计算框架,它将计算任务分发到集群中的各个节点上并行处理。故选择B。
20.A
【详解】本题考查Python数据分析相关内容。plt.rcParams是Matplotlib中一个强大而灵活的工具,它允许我们轻松地定制图形的样式和外观。plt.plot()是Matplotlib库中用于绘制线图(折线图)的主要函数之一,它的作用是将一组数据点连接起来,以可视化数据的趋势、关系或模式。plt.rcParams['font.family']=['simhei']将字体设置为'simhei'(黑体),故本题答案是A选项。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$