内容正文:
3.2 数据采集与整理2024—2025学年高中信息技术人教/中图版(2019)必修1
一、选择题
1.下列哪项不是数据存储的关键因素?( )
A.数据类型 B.数据容量 C.数据安全性 D.数据备份
2.下列设备中属于数据采集工具的是( )
A.声卡 B.思维导图 C.U盘 D.3D打印机
3.下列有关数据管理与数据安全的说法不正确的是( )
A.计算机一般采用树形目录结构来管理文件
B.文件管理相对于数据库管理,更易造成数据冗余
C.保护数据安全只需要提高数据本身的安全
D.数据加密和数据校验都可以提高数据安全性
4.下列关于数据安全的说法正确的是( )
A.保护数据安全无需考虑存储设备 B.保护数据安全无需考虑原始数据
C.数据加密可以提高数据的保密性 D.互联网搜索到的信息都是真实可信的
5.有关数据安全的说法,下列正确的是( )
A.因用户操作失误导致的数据丢失,可以通过磁盘阵列恢复数据
B.重要数据可以通过加密与数据校验提升安全性,不必备份
C.数据交互双方可以通过数据校验,保障数据的完整性
D.强密码非常安全,因此可以在多个应用中使用统一的强密码
6.要记录大象活动的过程,可选择的数字化采集工具是( )
A.电冰箱 B.打印机 C.扫描仪 D.摄像机
7.下面做法不利于提高数据安全的措施是( )
A.使用用户具有排他性的自然特征(如指纹、人脸等)作为身份验证依据
B.使用生日或姓名作为密码
C.拒绝简单的密码
D.限制密码尝试次数
8.下列密码中,你认为最安全的是( )
A.1234 B.ab*12&34 C.denglu D.admin
9.下列不属于采集信息的工具的是( )。
A.打印机
B.摄像机
C.扫描仪
D.照相机
10.数据处理的一般过程包括以下哪几个步骤?( )
A.数据采集、存储、加工、分析 B.数据采集、加工、分析、可视化
C.数据采集、存储、分析、表达 D.数据采集、加工、分析、决策
11.在2022年冬奥会上,各大赛场赛场安装了多个高清摄像机,实时记录比赛情况,以确保公正制裁。摄像机记录信息的过程属于( )
A.数据可视化表达 B.数据分类 C.数据分析 D.数据采集
12.以下不属于数据采集设备的是( )
A.录音笔 B.摄像头 C.音箱 D.扫描仪
13.小新是学校学生会会长,在开学初,他和学生会成员想要制作一期关于预防新冠状病毒的宣传栏,小新可能会通过下面哪种方法采集信息( )
①通过网络,去权威网站查找关于病毒的科普知识以及预防知识
②采访一个武汉市民
③采访当地一名专业医生
A.①③ B.②③ C.①② D.①②③
14.数据采集的基本方法包括( )
A.系统日志采集法
B.网络数据采集法
C.其他数据采集方法
D.以上都对
15.某智慧教学系统的部分功能是:课前教师通过管理网页将预习资料上传到服务器中,学生可在家中通过人脸识别登录移动终端进行预习;课中教师将任务下发到学生的移动终端,学生的作答情况能实时同步到教师的终端上,学生可通过拍照、截图记录关键内容;课后系统收集学生作业数据,生成作业报告、错题本,还可以实现线上提问与答疑的功能。下列关于材料中数据与数据处理的说法,不正确的是( )
A.个人用户收集的原始错题数据是大数据 B.作业报告可以用Python语言实现可视化
C.终端拍照的过程中进行了数据的模数转换 D.截图中添加的批注是数据的一种表现形式
16.下列措施,无法对数据进行有效保护的是( )
A.磁盘碎片整理 B.数据加密 C.可移动存储设备备份 D.网络备份
二、填空题
17.2023年春节期间,西安文化旅游行业全面复苏,重点景区人气爆棚。西安市监测的15家重点旅游景区累计接待游客27.79万人次,件随着信息技术的发展与应用,数据采集越来越高效,数据来源广泛、类型更加多样。虽然技术使数据采集变得快捷可靠,但是数据采集的基本流程没有发生变化,其正确流程为 。(填写排序后序号,例:ABCD))
A.选择采集方法 B.确定数据来源 C.明确数据要求 D.实施数据采集
18.在《数据与计算》中,数据处理是指对数据进行 、 、 、 和 的过程,它是调查研究的核心活动,有助于从原始数据中提取有价值的信息,形成结论和决策。
19.数据清洗的主要目的是 。
20.在《数据与计算》中,数据处理的一般过程包括数据采集、数据存储、数据加工、数据分析和数据表达等步骤。其中,数据加工是对采集到的原始数据进行清洗、转换和重组的过程,以确保数据的 和 ,为数据分析阶段提供高质量的数据输入
21.数据组织的核心目的是使数据易于 和 。
22.在本教材中,通过 智能停车场的案例,我们学习了数据采集、加工、分析和可视化的方法,掌握了使用电子表格软件进行数据处理的工具。
三、判断题
23.由于学校计算机教室的服务器硬盘损坏,导致学生微电影作品丢失。该案例中的数据安全威胁属于个人失误。( )
24.计算机病毒传播的途径主要有网络、光盘、移动存储设备,其中通过网络传播的速度最快。( )
25.信息系统有多种渠道收集数据,包括人工采集、自动采集和传感器采集。淘宝网购系统会根据用户的历史搜索、浏览、购买记录等行为数据,建立用户画像,并将相关的商品信息推荐给用户。采集行为数据的过程属于人工采集。( )
26.数据是现实世界原始事物现象的运动过程,是信息的载体。( )
27.问卷是调查、访谈时常见的数据采集工具。( )
四、操作题
28.某项运动计分规则如下:由7名评委给每个选手打分(最高分10分,最低分0分)。为客观公正,计分时,先去掉一个最高分和一个最低分,将剩余的5个评委的分数求和作为“有效分”,最后结合难度系数计算实际得分,实际得分=(有效分×难度系数)÷5×3。
(1)小美收集了该运动某次比赛的评委打分并进行数据整理。数据整理目的是 (多选,填字母:A.检测和修正错漏的数据/B.分析数据特征/C.整合数据资源/D.统计计算总分/E.规整数据格式提高数据质量)。
图1
图2
(2)小美使用Python结合pandas导入数据(如图1所示),计算实际得分并排序,选出前三名制作图表,如图2所示。
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_excel('ts.xlsx')
shiji=[] #shiji 存储每位选手实际得分
for line in df.values:
maxs,mins,s=-1,11,0
for i in range(1,len(line)-1):
if line[i]>maxs:
maxs=line[i]
if line[i]<mins:
mins=line[i]
①
s=s-maxs-mins
s=s*line[i+1]/5*3
shiji.append(s)
df['实际得分']=shiji
#新增“实际得分”列
df=df.② ('实际得分',ascending=False)
#按“实际得分”降序排列
x=df['选手'][0:3]
y=③
plt.title('本次比赛前三名')
plt.xlabel('前三名选手')
plt.ylabel('实际得分')
plt.rcParam['font.sans-serif']=['SimHei']
#显示中文
plt.bar(x,y)
plt.show()
请在画线处填入合适的代码。
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.D
【详解】本题考查数据存储相关内容。虽然数据备份对于保护数据很重要,但它不是数据存储的关键因素。数据存储的关键因素包括数据类型、数据容量和数据安全性等。故本题答案是D选项。
2.A
【详解】本题考查的是数据采集。声卡可以采集音频数据。思维导图是信息加工工具;U盘是数据存储设备;3D打印机是输出设备。故因选A。
3.C
【详解】本题考查数据管理与数据安全的描述。保护数据安全包括两方面:数据本身的安全和数据防护的安全。因此保护数据安全不只需要提高数据本身的安全。故选C。
4.C
【详解】本题考查数据安全相关内容。数据安全是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。要保证数据处理的全过程安全,数据处理,包括数据的收集、存储、使用、加工、传输、提供、公开等。AB选项说法错误,C选项说法正确,D选项,网络上的信息不都是真实可信的,应该学会辨别真假,选项说法错误。故本题答案是C选项。
5.C
【详解】本题主要考查数据安全。磁盘阵列解决的是物理上丢失,人工删除的的恢复不了。故因用户操作失误导致的数据丢失,不可以通过磁盘阵列恢复数据;重要数据可以通过加密与数据校验提升安全性,必须要备份;数据交互双方可以通过数据校验,保障数据的完整性;强密码非常安全,但不可以在多个应用中使用统一的强密码,故本题选C选项。
6.D
【详解】本题考查的是数字化采集工具。扫描仪是扫描图像,摄像机可以采集数字视频。故本题应选D。
7.B
【详解】本题主要考查数据安全。结合选项可知,使用生日或姓名作为密码不利于提高数据安全,故本题选B选项。
8.B
【详解】本题主要考查数据安全。一般密码同时包含数字、字母及特殊字符,则安全性越高,故本题选B选项。
9.A
【详解】本题主要考查信息采集工具。打印机是计算机输出设备,摄像机、扫描仪、照相机均属于采集信息的工具,故本题选A选项。
10.B
【详解】本题考查数据处理。
数据处理的一般过程包括以下步骤:
数据采集:这是数据处理的第一步,指的是从各种来源获取原始数据。数据来源可以是数据库、文件、传感器、网站等。数据的收集方式可以是手动输入、自动采集、网络爬取等。
数据清洗(加工):收集到的原始数据往往存在各种问题,如缺失值、错误值、重复值、不一致的数据格式等。数据清洗就是处理这些问题,确保数据的完整性和一致性。这包括缺失值处理(如删除、插值、预测等)、错误值处理(如规则校验、异常值检测等)、重复值处理(如去重算法)和数据格式统一等。
数据存储:将处理后的数据存储到数据库、文件等存储介质中,以便后续使用。
数据分析:对清洗和存储后的数据进行分析,提取有价值的信息。这包括统计分析(如均值、方差、相关性等)、数据可视化(使用图形、图表等工具来直观地展示数据)以及机器学习(使用机器学习模型来分析数据,发现数据中的规律和模式)。
数据可视化:将分析结果以图表、图形等方式展现,帮助用户直观地理解数据。数据可视化是数据分析的一个重要环节,它通过图形化的方式将数据呈现给用户,使得复杂的数据更易于理解和解释。
因此,数据处理的一般过程可以归纳为:数据采集、数据清洗(加工)、数据存储、数据分析和数据可视化。故正确答案为:选项B。
11.D
【详解】本题主要考查数据采集。各大赛场赛场安装了多个高清摄像机,实时记录比赛情况,以确保公正制裁。摄像机记录信息的过程属于数据采集,故本题选D选项。
12.C
【详解】本题考查数据采集。音箱是用于播放声音的设备,不是用于采集数据的设备。故答案为:C。
13.A
【详解】本题考查信息采集的相关知识点
②采访一个武汉市民是不具有代表性的,故本题选A选项
14.D
【详解】本题主要考查数据采集的基本方法。数据采集可使用系统日志采集法、网络数据采集法和其他数据采集方法,因此D选项正确。
15.A
【详解】本题考查大数据与数据处理。个人用户收集的原始错题数据量相对较小,不属于大数据。故答案为:A。
16.A
【详解】本题主要考查数据保护。磁盘碎片整理是整理磁盘中一些分散的、不连续的扇区空间,以提高磁盘的读写速度,无法对数据进行有效保护,故本题选A选项。
17.CBAD
【详解】本题主要考查数据的采集。数据采集的基本流程是:明确数据要求→确定数据来源→选择采集方法→实施数据采集,故填CBAD。
18. 数据采集 数据存储 数据加工 数据分析 数据表达
【详解】本题考查数据处理。数据处理的过程包括数据采集、数据存储、数据加工、数据分析和数据表达。这些步骤有助于从原始数据中提取有价值的信息,形成结论和决策。故正确答案为:①数据采集、②数据存储、③数据加工、④数据分析、⑤数据表达。
19.提高数据质量
【详解】本题考查数据清洗。数据清洗的主要目的是提高数据质量,通过去除重复、错误或不完整的数据,确保数据的准确性和完整性。
20. 正确性 一致性
【详解】本题考查数据处理。在《数据与计算》或数据科学领域,数据处理的一般过程确实包括数据采集、数据存储、数据加工、数据分析和数据表达等关键步骤。数据加工是这一流程中的核心环节,因为它直接决定了后续数据分析的质量和效果。数据加工的主要任务就是对采集到的原始数据进行清洗、转换和重组,以确保数据的正确性和一致性。故正确答案为:①正确性、②一致性。
21. 理解 访问
【详解】本题考查数据组织。数据组织的核心目的是使数据易于理解和访问,通过合理的结构和表示方式,方便用户快速准确地找到所需的信息。
22.模拟
【详解】本题考查数据处理。在本教材中,通过模拟智能停车场的案例,我们学习了数据采集、加工、分析和可视化的方法,并掌握了使用电子表格软件(如Microsoft Excel、WPS表格等)进行数据处理的工具。故正确答案为模拟。
23.错误
【详解】本题主要考查数据安全。由于学校计算机教室的服务器硬盘损坏,导致学生微电影作品丢失。该案例中的数据安全威胁属于硬件损坏,不属于个人失误,故表述错误。
24.正确
【详解】本题考查计算机病毒相关知识。计算机病毒是编制者在计算机程序中插入的破坏计算机功能或者数据的代码,能影响计算机使用,能自我复制的一组计算机指令或者程序代码。计算机病毒传播的途径主要有网络、光盘、移动存储设备,其中通过网络传播的速度最快。题目说法正确。
25.错误
【详解】本题主要考查数据采集。信息系统有多种渠道收集数据,包括人工采集、自动采集和传感器采集。淘宝网购系统会根据用户的历史搜索、浏览、购买记录等行为数据,建立用户画像,并将相关的商品信息推荐给用户。采集行为数据的过程属于自动采集,故表述错误。
26.×
【详解】本题考查数据相关知识。数据是现实世界原始事物现象的符号记录,是信息的载体。故题干说法有误。
27.正确
【详解】本题主要考查数据采集。问卷是调查、访谈时常见的数据采集工具,表述正确。
28. ACE s=s+line[i](或s+=line[i]) sort_values df['实际得分'][0:3](或df['实际得分'].head(3))
【详解】本题考查Python以及数据处理。
(1)数据整理的目的通常包括检测和修正错漏的数据(A选项),以确保数据的准确性;整合数据资源(C选项),将相关数据集中以便处理和分析;规整数据格式提高数据质量(E选项),使数据更易于处理和分析。故答案为:ACE。
(2)在计算有效分时,需要将除最高分和最低分之外的分数累加。之前已经找到了最高分maxs和最低分mins,现在要将其他分数累加到s中,所以使用s=s+line[i](或s+=line[i])。故答案为:s=s+line[i](或s+=line[i])。sort_values是pandas中用于对数据进行排序的方法,通过指定列名和排序方式(ascending=False表示降序),可以实现按照“实际得分”列降序排列数据。故答案为:sort_values。要获取前三名的实际得分用于绘制图表,需要从df中提取“实际得分”列的前三个值,所以使用df['实际得分'][0:3]或df['实际得分'].head(3)。故答案为:df['实际得分'][0:3](或df['实际得分'].head(3))。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$