3.4数据分析报告与应用2024—2025学年高中信息技术人教/中图版(2019)必修1

2024-08-24
| 13页
| 179人阅读
| 0人下载

资源信息

学段 高中
学科 信息技术
教材版本 高中信息技术人教/中图版必修1 数据与计算
年级 -
章节 3.4 数据分析报告与应用
类型 作业-同步练
知识点 数据的分析,大数据分析和处理
使用场景 同步教学-单元练习
学年 2024-2025
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 DOCX
文件大小 482 KB
发布时间 2024-08-24
更新时间 2024-08-24
作者 匿名
品牌系列 -
审核时间 2024-08-24
下载链接 https://m.zxxk.com/soft/46989427.html
价格 0.50储值(1储值=1元)
来源 学科网

内容正文:

3.4 数据分析报告与应用2024—2025学年高中信息技术人教/中图版(2019)必修1 一、选择题 1.要直观地展示某同学高二学年连续几次考试成绩的变化的情况 ,最合适的图表类型是(    ) A.条形 B.柱状图 C.饼图 D.折线图 2.数据分析报告通常由(   )等组成。 A.正文 B.标题、目录 C.结论 D.前言 3.下列关于数据分析报告的说法不正确的是(  ) A.数据分析报告是项目研究结果的展示 B.数据分析报告可以为决策者提供科学、严谨的决策依据 C.数据分析报告中的数据可以用文本、表格、图形等多种形式呈现 D.数据分析报告中只能体现出数据分析结果,不能展示数据分析的起因和过程 4.晓洁在撰写数据分析报告时,梳理了以下几个环节应该需要注意的事项,错误的是(   ) A.标题页——包含标题、作者、报告日期,标题还应短小精悍,体现数据分析的核心内容 B.前言——包含分析背景、分析目的、分析思路 C.正文——包含数据分析事实的观点、给出明确的结论、具体建议或解决方案 D.附录——包括名词解释、数据收集方式、调查问卷、分析方法说明和参考资料等 5.通过访问国家统计局网站,可以查阅相关数据报告,下列关于撰写数据分析报告说法不正确的是(  ) A.不能采用专业术语,篇幅较长 B.内容客观,分析准确 C.呈现数据分析的过程、结论和建议 D.引用资料要加注释 6.下列关于大数据及其处理的说法,不正确的是(   ) A.大数据蕴含巨大的价值,但因其数据量庞大,所以“提纯”数据是人们一直努力的目标 B.电商的个性化精准推荐,是因为知道了人们都买某些商品的原因 C.处理大数据时,一般采用分治思想 D.HBase 是采用基于列的存储方式,具有良好的横向扩展能力 7.下列关于大数据和大数据处理说法正确的是(   ) A.大数据蕴含着巨大的价值,价值密度高 B.相比数据之间的相关性,大数据处理更关注背后的因果关系 C.车载导航系统一般以流计算方式处理交通大数据,为用户提供更好的导航服务 D.由于大数据数据体量大,所以大数据处理的是抽样数据 8.数据分析的目的不包括以下哪一项(   ) A.描述研究对象 B.发现数据规律 C.预测未来趋势 D.创造新的数据 9.从横向和纵向两个方向来计算两个或多个有联系的变量在交叉点的统计值,这种数据分析方法称为(   ) A.交叉分析 B.双向分析 C.个体分析 D.变量分析 10.下列不是HDFS优点的是(   ) A.高容错性 B.适合单线程处理 C.适合大数据处理 D.流式文件访问 11.数据分析报告中需要描述数据来源和数据分析的思路、方法和(   ) A.模型 B.过程 C.结论 D.建议 12.一份优秀的数据分析报告需要结构清晰、主次分明、图文并茂,在撰写数据分析报告时,我们(   ) A.不需要考虑使用者的知识水平、理解能力,按照我们的想法去撰写即可 B.可以不用事实说话 C.应该使报告中的内容有逻辑性,注意衔接 D.若引用他人资料,不必说明资料的来源 13.大数据时代数据组织的关键挑战不包括(   ) A.数据量巨大 B.数据类型单一 C.数据处理速度需求高 D.数据分布广泛 14.撰写数据分析报告的原则不包括(   ) A.需要通过各种方法采集到的原始数据 B.要图文并茂,让读者一目了然,富有启发性 C.确保分析过程科学严谨,分析方法选择恰当 D.得出明确的结论,针对问题提出建议和解决方案 15.下列关于数据分析报告的表述正确的是(  ) A.数据分析要基于可靠的数据源 B.数据分析报告就是数据分析流程工作汇报 C.基于相同的数据一定能得到完全相同的分析结果 D.数据分析报告只宜对大数据进行分析 16.HDFS和MapReduce作为Hadoop的核心组件,下列对它们的描述错误的是(   ) A.HDFS是具有高容错性的分布式文件系统,适合部署在普通的机器上 B.HDFS特别适合那些需要多次写入、多次读取的超大规模数据集的应用程序 C.MapReduce是一种并行编程模型,帮助用户编写处理大规模数据集的并行运算 D.MapReduce隐藏了分布式并行编程的底层实现细节,提升了应用的开发效率 二、填空题 17.通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来,更为决策者提供科学、严谨的决策依据。    ( ) 18.对数据进行分析,首先要根据分析的目标 ,然后选择恰当的 进行分析, 是否正确,继而得出相应的结论。 19.以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为 表达。 20.数据分析报告是项目 的展示,也是数据分析结论的有效承载形式。在数据分析报告中,首先需要明确数据分析的 ,阐述目前 及通过分析希望解决的问题;其次需要描述数据来源和数据分析的 、 和 ;最后需要重点呈现数据分析的 、 和 。 21.分析题 1、从折线图可以看出:汇入汇款,汇出汇款,电子转发,分报四种业务所耗时间变化波动最小的是哪一个? ________________________________ 2、四种业务中,哪种业务工作效率提高很快,服务时间最短? _______________________________ 3、四种业务中,那种业务所耗时间容易反弹,需要加强控制? ________________________________ 22.数据分析是指用恰当的 方法对收集来的数据进行 ,从而得出有意义的结论的技术。 三、判断题 23.数据分析的目的是发现数据之间的关联和趋势。( ) 24.数据分析的方法主要有对比分析、平均分析。对比分析是指将两个或两个以上的数据进行比较,分析它们的差异,来反映总体在一定时间、地点条件下某一数量特征的一般水平。    ( ) 25.云存储是一种新型的互联网存储技术,它采用了集群应用、网格技术和分布式文件系统等。( ) 26.数据分析的目的是从数据中发现规律和趋势,为决策提供支持。( ) 四、操作题 27.小明收集了超市2022年1月的线上订单数据,存储在“超市销售数据.xlsx”中,部分界面如图1。 图1 (1)当前原始数据中存在哪些需要进行更改的数据问题? 应如何修改?(写出一种即可) 。 (2)当前excel表中需要计算订单中每种商品的销售金额(销售金额=销售数量×商品单价),在J2单元格中应填写的是 ,并自动填充到下方的单元格中。 (3)小明想要求出销售数量最多的10项洗化类的商品,运用Python处理数据后的效果如图2。 部分Python代码如下,请完成代码片段的填空。 。 import pandas as pd import matplotlib. pyplot as plt df=pd.read excel("超市销售数据. xlsx") plt.rc("font",* * {"family":"SimHei"})#设置字体 df=df[df["商品类别"]=="洗化"]#筛选出洗化用品 g=df. groupby("商品名称").sum() plt.title("最畅销10 大洗化用品") plt.xlabel("洗化用品") plt.ylabel("销售数量") plt.show() 试卷第1页,共3页 试卷第1页,共3页 学科网(北京)股份有限公司 参考答案: 1.D 【详解】本题考查图表。图表种类:柱形图,柱形图用于显示一段时间内的数据变化或显示各项之间的比较情况。折线图,折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布。饼图,常用于统计学模块。条形图,条形图显示各个项目之间的比较情况。面积图,面积图强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。要直观地展示某同学高二学年连续几次考试成绩的变化的情况 ,最合适的图表类型是折线图。故本题选D。 2.ABCD 【详解】本题考查数据分析报告。标题清晰地概括报告的主题和内容。目录列出报告各个部分的标题,便于读者快速浏览。前言介绍报告的背景、目的和分析方法。正文详细阐述数据分析的过程和结果,包括数据来源、分析步骤、发现的模式和规律等。结论总结分析结果,提出建议或未来展望。这些组成部分可以帮助报告更加结构化和条理清晰,使读者能够快速了解报告的核心内容和主要发现。在实际撰写过程中,报告的具体结构和内容可能会根据分析目的和受众需求而有所不同。故正确答案为ABCD 3.D 【详解】本题主要考查数据分析的描述。数据分析报告中能体现出数据分析结果,也能展示数据分析的起因和过程,故本题选D选项。 4.C 【详解】本题考查数据分析报告相关内容。数据分析报告是一种有结构的文档,目的在于根据特定目标受众的需求,总结、解释和以可视化的方式呈现数据分析的结果。此类报告通常包括数据描述、分析方法、结果和结论,并提供洞察以解决问题或支持决策。它应该具有可读性强、信息准确、清晰明了的特点,以帮助受众理解和应用数据的洞察。数据分析报告包括标题、目录、前言、正文、结论、附录等部分。标题是对数据分析报告的高度概括。标题不仅要体现数据分析的主题,并且能够激发读者的阅读兴趣。前言是数据分析报告的一个重要组成部分,主要阐述分析的背景和目的、需要解决的问题、运用的分析思路和方法、预期的效果或结论等。正文是数据分析报告的核心部分,正文要系统地闻述数据分析的过程与结果,其中给出的事实、观点及分析论证必须严谨合理、逻辑性强。结论是对整个数据分析报告的总结,应包括依据数据分析结果得出的结论、建议和解决问题的方案等,结论要和正文相互衔依据数相互呼应。ABD选项说法正确,C选项说法错误。故本题答案是C选项。 5.A 【详解】本题考查数据分析相关内容。数据分析报告不仅是对整个数据处理过程的总结与展示,更能为决策提供参考。正文是报告的主体部分,包含所有数据分析事实和观点,要系统地展示数据分析的过程和结果,正文各部分之间应具有清晰的逻辑关系,条理清楚,可通过数据图表和相关的文字结合进行分析,帮助使用者理解。报告结尾部分应根据数据分析结果进行总结和提炼,给出明确的结论、具体建议或解决方案,这部分是整个报告的重点,能够帮助使用者深入思考。附录是对全文的补充,可以将不便于在正文中体现的内容放在这里,包括名词解释、数据收集方式、调查问卷、分析方法说明和参考资料等。分析4个选项,BCD说法正确,A选项说法不正确。故本题答案是A选项。 6.B 【详解】本题考查大数据相关内容。大数据的特征是数据量大、速度快、数据类型多、价值密度低。A选项, 大数据来源广泛多样,数据标准不统一,指标口径杂乱,数据整合和衔接困难,而应用和处理大数据要求强大的机器算法能迅速地完成数据的价值“提纯”,这是大数据区分于传统数据挖掘最显著的特征,选项正确。B选项,电商平台个性化推荐系统是基于大数据挖掘、处理、清洗、分析的一种智能商务平台,不是基于大数据精确分析了用户购买商品的原因,选项错误。C选项,处理大数据时,一般采用分治思想,选项正确。D选项,HBase是一个分布式的、面向列的开源数据库,该技术来源于Fay Chang所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”,HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库,并且是基于列而不是基于行的模式,选项正确。故本题答案是B选项。 7.C 【详解】本题考查大数据。大数据虽然价值巨大,但价值密度低,A选项错误;大数据处理更关注数据之间的相关性而非背后的因果关系,B选项错误;车载导航系统一般以流计算方式处理交通大数据,为用户提供更好的导航服务,C选项正确;大数据处理的是全体数据而非抽样数据,D选项错误。故答案为:C。 8.D 【详解】本题考查数据分析的描述。数据分析作用:剖析事物的发展历程、了解事物的现状、预测事物的未来走向。不包括创造新的数据。故选D。 9.A 【详解】本题考查数据分析。 交叉分析法是一种用于分析两个或多个变量之间相互关系的基本数据分析法。它通过将统计分析数据制作成二维交叉表格,将具有一定联系的变量分别设置为行变量和列变量,两个变量在表格中的交叉结点即为变量值,通过表格体现变量之间的关系。这种方法在市场调研项目中应用广泛,因为它能让复杂的数据关系简单化,便于理解和分析。故正确答案为:选项A。 10.B 【详解】本题考查大数据处理。HDFS 是一种分布式文件系统,具有高容错性,通过数据冗余和副本机制可以在节点出现故障时保证数据的可靠性;HDFS 适合处理大规模的大数据,能够存储和管理海量的数据;支持流式文件访问,一次写入、多次读取,适合批处理式的大数据处理。然而,HDFS 是为了处理大规模数据的批处理任务而设计的,并不适合单线程处理这种小规模、交互性强的任务。故答案为:B。 11.A 【详解】本题考查数据分析报告。数据分析通常需要建立模型来进行,这些模型可以是统计模型、机器学习模型或其他类型的模型。模型在数据分析中扮演着关键的角色,它们用来描述数据之间的关系、预测未来趋势、识别模式等。因此,在数据分析报告中描述数据来源和分析思路方法的同时,解释所使用的模型也是非常重要的,因为模型的选择和应用直接影响到分析的结果和结论。故答案为:A。 12.C 【详解】本题考查数据分析相关内容。数据分析报告是一种有结构的文档,目的在于根据特定目标受众的需求,总结、解释和以可视化的方式呈现数据分析的结果。此类报告通常包括数据描述、分析方法、结果和结论,并提供洞察以解决问题或支持决策。它应该具有可读性强、信息准确、清晰明了的特点,以帮助受众理解和应用数据的洞察。A选项,数据分析报告的撰写要考虑使用者的知识水平、理解能力,选项错误。B选项,数据分析报告要用事实说话,选项错误。C选项,数据分析报告中的内容要有逻辑性,注意衔接,选项正确。D选项,数据分析报告的撰写引用他人资料时,需要说明资料的来源,选项错误。故本题答案是C选项。 13.B 【详解】本题考查大数据。大数据时代面临的关键挑战之一就是数据类型多样,不仅包括传统的结构化数据,还有半结构化和非结构化数据,因此选项B不包括在关键挑战中。故选择B。 14.A 【详解】本题考查的是数据分析报告。撰写数据分析报告的原则包括:要图文并茂,让读者一目了然,富有启发性;确保分析过程科学严谨,分析方法选择恰当;得出明确的结论,针对问题提出建议和解决方案。但不包括需要通过各种方法采集到的原始数据。故本题应选A。 15.A 【详解】本题考查数据分析报告相关内容。数据分析是在一大批杂乱无章的数据中,运用数字化工具和技术,探索数据内在的结构和规律,构建数学模型,并进行可视化表达,通过验证将模型转化为知识,为诊断过去、预测未来发挥作用。数据分析报告不仅是对整个数据处理过程的总结与展示,更能为决策提供参考。通过数据分析报告,可以将分析结果、可行性建议及其他有价值的信息传递给使用者。基于相同的数据不一定能得到完全相同的分析结果。BCD选项表述不正确,A选项表述正确。故本题答案是A选项。 16.B 【详解】本题考查大数据处理。HDFS主要功能是将大规模海量数据以文件的形式、用多个副本保存在不同的存储节点上,并用分布式系统进行管理。采用一次写入、多次读取的访问模式。故答案为:B。 17.对 【详解】本题考查数据报告相关知识。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来,更为决策者提供科学、严谨的决策依据。题干说法正确。 18. 提出假设 分析方法 验证假设 【详解】本题考数据分析。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。对数据进行分析,首先要根据分析的目标提出假设,然后选择恰当的分析方法进行分析,验证假设是否正确,继而得出相应的结论。 19.数据可视化 【详解】本题考查的是数据分析。以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为数据可视化表达。 20. 研究结果 目的和背景 存在的问题 思路 方法 模型 过程 结论 建议 【详解】本题考查的是数据分析。数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。在数据分析报告中,首先需要明确数据分析的目的和背景,阐述目前存在的问题及通过分析希望解决的问题;其次需要描述数据来源和数据分析的思路、方法和模型;最后需要重点呈现数据分析的过程、结论和建议。 21.(1)分报(2)汇入汇款(3)电子转发 【详解】本题考查图表分析。 (1)分报的折线图对比其它折线图表现出几乎接近平滑的直线,故可知波动最小。故正确答案为:分报。 (2)折线图可知,汇入汇款折线图到03二季的服务时间的数据点最低,故服务时间最短。故正确答案为:汇入汇款。 (3)电子转发02二季服务时间为5小时,到了02三季服务时间反弹到接近15小时,相对其它业务比较容易反弹。故正确答案为:电子转发。 22. 统计分析 计算、处理 【详解】本题考查的是数据分析相关知识。数据分析是指用适当的统计分析方法对收集来的大量数据进行计算、处理,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 23.正确 【详解】本题考查数据分析。数据分析的一个核心目的是发现数据之间的关联和趋势。通过仔细分析数据,研究人员、商业分析师和决策者可以识别出数据中的模式、趋势、异常和相关性,从而做出更明智的决策。故正确答案为正确。 24.错 【详解】本题考查数据分析。对比分析法的定义 对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。映总体在一定时间、地点条件下某一数量特征的一般水平是平均分析,题干概念混乱,说法错误。 25.正确 【详解】本题考查云存储。云存储是一种新型的互联网存储技术,云存储通常采用大规模的分布式存储集群,利用多台服务器协同工作来提供存储服务。云存储利用网格计算技术,将存储资源虚拟化,形成一个统一的存储池。云存储通常基于分布式文件系统架构,将数据分散存储在多个节点上,提高可靠性和扩展性。云存储可根据用户需求动态分配存储资源,实现按需使用和按量付费。这些特点使得云存储能够提供海量、弹性、低成本的存储服务,广泛应用于个人、企业和政府等各个领域。云存储技术的发展也推动了新的商业模式和应用场景的出现。 26.正确 【详解】本题考查数据分析。数据分析的主要目的确实是从大量、多样和复杂的数据中挖掘出有意义的规律和趋势,从而为各种决策提供有力支持。数据分析师需要使用各种技术和工具,如数据挖掘、统计建模、机器学习、数据可视化等,来处理和分析数据。同时,他们还需要具备强大的业务洞察力、沟通能力和团队协作精神,以便将数据分析结果转化为有价值的商业见解。故题干说法正确。 27. 问题一:“单位”列中的单位内容没有统一,有些是“KG”,有些是“千克”。 做法:将所有的“KG”都更改成“千克”。 问题二:部分数据缺失,例如G8单元格、F15单元格等。 做法:按照内容核实后补齐。 问题三:部分数据异常,例如I11单元格,商品单价为99999。 做法:按照内容核实后进行更改。 =H2*I2 g=g. sort values("销售数量", ascending=False)[0:10] plt. bar(g. index,g["销售数量"]) 或 g=g. sort values("销售数量", ascending=False). head(10) plt. bar(g. index,g.销售数量) 【详解】本题考查的是数据分析。 (1)由图1可知当前原始数据中存在以下问题数据: 问题一:“单位”列中的单位内容没有统一,有些是“KG”,有些是“千克”。 做法:将所有的“KG”都更改成“千克”。 问题二:部分数据缺失,例如G8单元格、F15单元格等。 做法:按照内容核实后补齐。 问题三:部分数据异常,例如I11单元格,商品单价为99999。 做法:按照内容核实后进行更改。 (2)销售金额=销售数量×商品单价,故在J2单元格中应填写的是:=H2*I2。 (3)根据题意需求出销售数量最多的前10项洗化类的商品,因此在筛选出洗化类产品后,需要按照销售数量进行降序排序,同时绘制柱形图。故代码为: g=g. sort values("销售数量", ascending=False)[0:10] plt. bar(g. index,g["销售数量"]) 或 g=g. sort values("销售数量", ascending=False). head(10) plt. bar(g. index,g.销售数量) 答案第1页,共2页 答案第1页,共2页 学科网(北京)股份有限公司 $$

资源预览图

3.4数据分析报告与应用2024—2025学年高中信息技术人教/中图版(2019)必修1
1
3.4数据分析报告与应用2024—2025学年高中信息技术人教/中图版(2019)必修1
2
3.4数据分析报告与应用2024—2025学年高中信息技术人教/中图版(2019)必修1
3
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。