内容正文:
2023-2024学年高一上学期人教/中图版(2019)必修一3.4 数据分析报告与应用
一、选择题
1.撰写数据分析报告应注意的问题不包括( )
A.考虑报告使用者 B.行文流畅,通俗易懂,简明扼要
C.内容客观,分析准确 D.引用资料可不加注释
2.下列关于大数据及其处理的说法,不正确的是( )
A.大数据蕴含巨大的价值,但因其数据量庞大,所以“提纯”数据是人们一直努力的目标
B.电商的个性化精准推荐,是因为知道了人们都买某些商品的原因
C.处理大数据时,一般采用分治思想
D.HBase 是采用基于列的存储方式,具有良好的横向扩展能力
3.在小区里,有的垃圾箱垃圾太多而溢出,有的却很少。做了一些研究后,小明同学整理数据,将原因与建议写成文字,准备交给物业。这属于数据处理过程中的( )
A.撰写研究报告 B.数据整理
C.数据分析 D.数据可视化
4.撰写数据分析报告时,应注意一些问题,以下说法错误的是( )
A.报告中的内容要有逻辑性,注意衔接
B.分析问题和阐述结论要客观准确,合理利用图表等形式是表达的内容清晰、直观
C.分析报告中引用他人资料,可不用注明资料的来源
D.提出的措施、方案或行动策略,应当积极且具有建设性
5.下列不属于大数据分析报告应遵循的原则的是( )
A.规范性 B.前瞻性 C.重要性 D.谨慎性
6.数据分析报告的基本组成部分包括( )
A.标题页、前言、正文、结论和建议 B.标题页、正文、结论和建议、附录
C.前言、正文、结论和建议 D.标题页、前言、正文、结论和建议、附录
7.数据分析报告的要素一般不包括( )
A.数据分析方法的文献研究 B.数据分析的目的、背景和问题
C.数据来源、分析思路和方法 D.数据分析的过程、结果和建议
8.在大数据分析中,以下哪个技术不是用于处理大规模数据集?( )
A.分布式计算 B.内存计算 C.云计算 D.单线程计算
9.通过访问国家统计局网站,可以查阅相关数据报告,下列关于撰写数据分析报告说法不正确的是( )
A.不能采用专业术语,篇幅较长 B.内容客观,分析准确
C.呈现数据分析的过程、结论和建议 D.引用资料要加注释
10.大数据的战略意义不在于庞大的数据量,而在于对这些数据( )
A.存储处理 B.速度处理 C.专业化处理 D.内容处理
11.下列不是HDFS优点的是( )
A.高容错性 B.适合单线程处理 C.适合大数据处理 D.流式文件访问
12.想通过分析某同学各学科历次考试成绩的分数情况,预测他的下一次考试成绩,其基本步骤是( )
①数据整理 ②数据采集 ③ 撰写分析报告 ④ 数据分析与可视化
A.②④①③ B.②①③④ C.②①④③ D.②③①④
13.以下描述的场景与处理方法使用不恰当的是( )
A.分析去年的地铁客流数据优化地铁运行采用批处理计算
B.淘宝“双十一”通过实时分析用户行为实现商品的推荐采用流计算
C.图计算为腾讯超大规模社交网络图数据的各类计算提供支撑
D.分析近十年高考的数学试卷梳理常考知识点采用流计算
14.大数据时代数据组织的关键挑战不包括( )
A.数据量巨大 B.数据类型单一 C.数据处理速度需求高 D.数据分布广泛
15.小申根据如图所示的七月份日平均风速异常情况检测可视化图形撰写数据分析报告,他对该图的分析正确的是( )
A.该月的日平均风速数据中存在异常值
B.可以进一步分析用小圆圈表示的这个数据
C.必须立即删除用小圆圈表示的这个数据
D.该月的日平均风速数据中存在缺失值
二、填空题
16.分析题
1、从折线图可以看出:汇入汇款,汇出汇款,电子转发,分报四种业务所耗时间变化波动最小的是哪一个?
________________________________
2、四种业务中,哪种业务工作效率提高很快,服务时间最短?
_______________________________
3、四种业务中,那种业务所耗时间容易反弹,需要加强控制?
________________________________
17.以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为 表达。
18.对数据进行分析,首先要根据分析的目标 ,然后选择恰当的 进行分析, 是否正确,继而得出相应的结论。
19.通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来,更为决策者提供科学、严谨的决策依据。 ( )
三、操作题
20.人工智能(AI)在医疗健康领域中的应用已经成为了业内关注的焦点。随着人工智能技术的不断发展,AI已经在医疗诊断、治疗、预防以及管理等方面取得了显著的成果。图1的柱状图反映了2017至2021年中国医疗机器人规模变化趋势,图2的饼图反映了2019年中国医疗机器人应用领域结构。观察图1、图2,回答以下问题:
图1 图2
(1)常见的数据分析方法有很多,诸如对比分析法、平均分析法、结构分析法等。请分析图1和图2使用的数据分析基本方法并简述它们的适用场景。
(2)如下是绘制其中一个分析图表的代码片段。请根据代码,分析它是绘制哪一个图表的代码片段。
for i in range(len(x_data)):
plt.bar(x_data[i],y_data[i])
四、简答题
21.以下数据为1945年—2015年间登陆我国的台风数据记录。按数据流计算,尝试使用数据分析的方法,建立模型推测下一次台风登陆我国的地点及时间,并阐述你的理由。
图1
图2
图3
22.解释大数据分析中的“4V”模型。
23.根据下图,请分析共享单车骑行人数随时间的变化情况,至少说出两点。
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.D
2.B
3.A
4.C
5.B
6.D
7.A
8.D
9.A
10.C
11.B
12.C
13.D
14.B
15.AB
16.(1)分报(2)汇入汇款(3)电子转发
17.数据可视化
18. 提出假设 分析方法 验证假设
19.对
20.(1)图1使用的数据分析基本方法是对比分析法,适用场景是把两个相互联系的数据进行比较,从数量上展示和说明差异如体重的变化等。
图2使用的数据分析基本方法是结构分析法,适用场景是整体与部分之间的关系如不同性别的占比。
(2)该代码片段绘制的是图1柱状图。
21.下一次台风登陆我国的广东,2016年7月上旬(根据出现频率的推断)
22.“4V”模型指的是大数据分析的四个关键维度:数据量(Volume)、数据速度(Velocity)、数据多样性(Variety)和数据价值密度(Value)。
23.①工作日时早上上班和傍晚下班时间段平均骑行人数较多,②节假日时中午骑行平均人数最多。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$