内容正文:
第1单元 初识数据与计算
一、选择题
1.下列描述你认为错误的是( )
A.某人提出了“榨菜指数”,旨在通过榨菜销售份额的变化推测人口流动趋势,以制定出对应政策,其中体现了数据、信息和知识三者的有机联系
B.“联结点越多、联络人越多,价值也就越大”反映的是信息时代的麦特卡尔夫定律
C.每秒拍摄1次得到1张照片,每秒拍摄24次,照片就成了电影,而大数据也是由数据量变积累达到质变的结果
D.“样本等于全部”是社会科学研究中常用的抽样调查法,抽样调查法得到的数据往往是十分准确并且全面的
2.下列有关大数据的说法中,不正确的是( )
A.大数据的速度快不仅仅指处理速度快,还体现在产生速度快
B.大数据的数据体量大,在处理时需采用分治思想
C.大数据的价值密度的高低与数据总量的大小成正比
D.大数据要分析的是全体数据而不是抽样数据
3.关于数据、信息与知识有这样一个直观描述“①18-22,②今天的气温是18-22C,③根据以往经验,当温度在20C左右时,人体感受比较舒适,所以今天的气温很舒适”。下列判断中,正确的是( )
A.①②③均是数据 B.①是数据,②是信息,③是知识
C.①②③均是知识 D.①是知识,②是信息,③是数据
4.下列有关数据的说法正确的是( )
A.数据只能用数字表示
B.数据是客观存在的,不需要载体
C.大多数数据会随着时间的推移而变化
D.计算机的诞生提高了人们的数据处理能力,其数据都是真是可信的
5.下列关于数据和信息的说法,正确的是( )
A.数据是对客观事物的符号表示,单纯的数据没有意义
B.同一信息只能依附于一种载体
C.信息的价值包括显性价值和隐性价值,隐性价值是指信息内容本身隐含的价值
D.数据是信息经过存储、分析及解释后所产生的意义
6.某慈善总会将接收的捐赠物资清单使用电子表格软件进行数据处理,若要统计“分类捐助总量”的数据,统计“N95口罩”的总量可修改F4单元格中的公式,并对G4: H4 进行自动填充,统计出“84 消毒液”和“医用防护服”的总量,则F4单元格中的公式应修改为( )
提示:SUMIF函数用于对区域中满足条件的单元格求和。例如:=SUMIF(B3:B3126,F3, C3: C3126) 表示求 B3: B3126 区域中所有“N95口罩”的总量]
A.=SUMIF( $B3:$B3126, F3,$C3:$C3126) B.=SUMIF(B3:B3126,F3,C3:C3126
C.=SUMIF(B3:B3126,F3,C3:C3126 D.=SUMIF(B3:B3126,F3,C3:C3126)
7.我们每天都在跟各类软件打交道:聊天、购物、看新闻和短视频每一次我们的点击和滑动都会成为 数据的一部分,有关组织通过数据的搜集、存储、分析和可视化技术,解决大数据海量、高速、多变、价值密度低的 问题,使数据从散乱的信息变成知识和智慧,帮助组织解决发展中遇到的实际问题。
对于上述描述,下列说法不正确的是()
A.你的每次上网行为及点击数据可能会被采集
B.你在上网时的每次操作,蕴含着巨大的价值
C.你在聊天、购物、看新闻和短视频等过程中,有可能泄露个人隐私
D.网站提供给你的“个性化推荐”,依赖于你的上网行为
8.下列有关数据与信息的说法,正确的是( )
A.数据就是数字,是对客观事物的符号表示
B.信息是数据经过储存、分析及解释后所产生的意义
C.信息具有载体依附性,同一信息只能依附于同一种载体
D.信息的加工和处理必须使用计算机才能完成
9.数据的记录形式是多种多样的。下列属于数据的是( )
A.年平均气温 B.实验报告册 C.行车记录仪 D.旅客身份证
10.在“成绩表”的B列至E到分别存放的是考生的语文、数学、英语和物理成绩,在F3单元格中输入“=COUNT(B3:E3),返回的结果是下面的( )
A.返回非空数字单元格的个数 B.返回非零单元格的个数
C.返回单元格区域中的最大值 D.返回数字8
11.据《第5次全国未成年人互联网使用情况调查报告》显示,2022年未成年网民规模已突破1.93亿,未成年人互联网普及率增长到97.2%。其中“97.2%”属于( )
A.数据 B.信息 C.知识 D.智慧
12.下列选项中,属于信息的是( )
A.台风预警报道 B.校园广播电台
C.刻着铭文的青铜器 D.行车记录仪
13.数据的基本单位是( )
A.数据项 B.数据结构 C.数据包 D.数据源
14.下列说法正确的是( )
A.计算机存储数据的基本单位是 bit
B.计算机的硬盘容量越大则其运行速度越快
C.杀毒软件滞后于计算机病毒,因此对计算机病毒以预防为主
D.信息的常用表达技术有文字、语言、图形、图像、声音和形体动作等
15.下列有关数据、信息和知识的关系表述不正确的是( )
A.数据、信息和知识是人类对客观事物感知的三个不同阶段
B.数据是对事物属性的客观记录,信息是经过组织的有结构的数据
C.知识是经过人的思维整理过的信息、数据、形象、价值标准以及社会的其他符号化产物
D.数据、信息、知识依赖于语境、依赖于接受者本身,三者之间的区别泾渭分明
16.下列关于数据、信息与知识的说法,正确的是( )
A.不同的人获取了相同的信息,就会构建相同的知识体系
B.存储信息的载体遭到破坏,其承载的信息会消失
C.所有的字符在计算机中以 ASCII码存储
D.经过数字化的数据才能被存储和处理
17.以下关于数据、信息、知识的说法不正确的是( )
A.数据是信息的一种表现形式,数据是信息的载体
B.信息经过提炼和归纳后,可以内化为知识
C.信息可以用来消除接受者认识上的不确定性
D.不同的人对于同样的信息,所形成的知识也是相同的
二、填空题
18. 是现实世界客观事物的符号记录,是信息的载体。
19.产生式规则表示法中的“前提”和“结论”分别对应于条件和 。
20.matplotlib模块是一个 。matplotlib的绘图原理很简单,利用 画线函数就可以在直角平面内轻松地将 坐标点对连接成平滑曲线。
21.若变量a = 5,b = 4,c = 3,d = 2,则表达式not 3>2*b and (b>c+1 or c<>3)的值是 。
22.按照获取数据的渠道,可以将数据分为 和 。
23.若要求你对本班同学喜欢看的书籍进行数据分析,并得出结论,请选择下面一个项目主题,应用所学知识,完成项目要求。
(1)对本班学生阅读书籍的类别进行数据分析,并得出结论。
(2)对本班学生阅读书籍的时长分配(小时)进行数据分析,并得出结论。
(3)对本班学生书籍阅读量与学业成绩之间的关系进行数据分析,并得出结论。
三、判断题
24.数据就是信息。 ( )
25.视频和音频都可以是数据。( )
26.知识是人们运用大脑对获取或积累的信息进行系统化地提炼、研究和分析的结果,能够精确地反映事物的本质。( )
27.数据对象是具有相同性质的数据元素的集合。( )
28.人们对信息和知识进行处理后,就可以获得数据。( )
29.数据是现实世界原始事物现象的运动过程,是信息的载体。( )
四、操作题
30.让绿色生活成为新时尚,上海于2019年7月1日开始推动垃圾分类工作。为了提高垃圾回收的效率,在有些小区里安装了具有“用户识别”“自动称重”“满溢提醒”等功能的智能垃圾回收机,如下图所示。居民投递的可回收物送到分拣工厂后经机器人精细分类,最终进入相应的再生产工厂变废为宝。
(1)智能垃圾回收机放置在小区公共位置,屏幕上滚动显示可回收物类别等内容,以便广大居民了解相关信息。这主要体现的信息特征是 (选填:价值是相对的/具有时效性/具有共享性)。
(2)在小区没有安装智能垃圾回收机之前,我们在投放垃圾时需要自己分好类:废报纸属于可回收垃圾、坏的灯泡属于有害垃圾、过期的食物属于厨余垃圾……,这些描述的内容属于 (数据/信息/知识)
(3)这款智能垃圾回收机有语音交互功能模块,方便用户进行功能选择、报修、意见收集等任务的实现。语音交互功能模块在工作时借助于内置的声2023.1线上音传感器,将采集到的___________信号转换为___________信号,即通过___________、___________、编码的过程,完成转换后才能让数字设备进行存储和处理( )。
A.数字 模拟 采样 量化 B.模拟 数字 量化 采样
C.模拟 数字 采样 量化 D.数字 模拟 量化 采样
(4)机器内置的SD卡用于存储收集的语音反馈和留言。若已知SD卡的剩余容量为64G,每个用户允许最多录制2分钟的语音,声音的格式如下图,则最多还能支持 名用户的录制。(每人录满2分钟)
(5)为了鼓励更多人使用智能垃圾回收机进行垃圾分类和回收,该机器可以对每次合理的分类投放给予一定的积分奖励。具体做法是:投放前可扫脸或输入手机号及密码进行登录。从数据安全防护的角度来看,输入手机号及密码的方式才能登录,是采用了 方法进行了用户数据的保护;登录成功后个人的界面(如下图)则采用了 方法进行了用户的数据安全防护。
(6)下图所示的是一张可回收物图片及其属性信息,一张这样的图片需要占用 MB空间;
(7)若对图片(上图)进行压缩,以下关于压缩的描述,正确的是( )。
A.将此文件用WinRAR软件进行压缩属于无损压缩
B.将此文件另存为jpg格式属于无损压缩
C.将此文件重命名为玻璃瓶.zip属于有损压缩
D.将此文件扩展名改为.bmp属于无损压缩
(8)如下图所示的易拉罐图片采用RGB颜色模型来描述颜色,其中某像素点的R、G、B原色用十进制数表示分别是230、58、70,将其转换为十六进制表示应为# 。
(9)已知可回收物的当前回收价格为0.8元/公斤,单次投递超过20公斤最多按20公斤结算。若设计算法来实现某次投递所获金额的计算,算法描述如下:将称重重量赋值给x,如果x小于20,输出金额为0.8*x元,否则输出金额为0.8*20元,这种算法的描述方法属于( )。
A.程序设计语言 B.流程图 C.伪代码 D.自然语言
(10)小申用流程图设计了某次投递所获金额的算法(如下图),虚线框中算法的基本控制结构是 ,若可回收物的重量是20kg,表达式x>=20的值是 。
试卷第1页,共3页
试卷第1页,共3页
学科网(北京)股份有限公司
参考答案:
1.D
【详解】本题考查数据与大数据相关内容。数据是对客观事物的符号表示,数据可以是文字、数字、符号、表格、图像、语音、视频等,它直接来源于事实的记录,可以通过原始的观察或者度量获得。信息是有意义的数据,是对数据进行解释、整理、归纳后的产物。信息能够消除不确定性,为决策提供依据。知识是信息的升华,是我们在现实生活中进行判断和决策的重要依据。通过不断学习和实践,我们可以积累更多的知识,提高自己的认知水平和解决问题的能力,为个人发展做出更大的支持。麦特卡尔夫定律是指网络价值以用户数量的平方的速度增长。ABC选项说法正确。D选项,抽样调查是一种统计学方法,通过从总体中随机选取一部分样本进行调查,然后根据样本结果推断总体情况,抽样调查被认为是非全面调查方法中最完善、最有科学根据的调查方法,选项说法错误。故本题答案是D选项。
2.C
【详解】本题考查大数据。大数据的速度快不仅仅指处理速度快,还体现在产生速度快,选项A正确;大数据的数据体量大,在处理时需采用分治思想,选项B正确;大数据的价值密度的高低与数据总量的大小成反比,选项C错误;大数据要分析的是全体数据而不是抽样数据,选项D正确。
3.B
【详解】本题考查数据、信息与知识相关内容。数据是信息的来源,信息是经过加工的数据,知识是归纳提炼出来的有价值的信息。故本题答案是B选项。
4.C
【详解】本题主要考查数据的描述。数据可以用数字、文字、图片等表示;数据需要载体;大多数数据会随着时间的推移而变化;计算机的诞生提高了人们的数据处理能力,其数据并非都是真是可信的,故本题选C选项。
5.A
【详解】本题考查数据、信息与知识。数据是对客观事物的符号表示,单纯的数据没有意义,需要经过处理和解释才能成为有价值的信息,A选项正确;同一信息可以依附于多种不同的载体,B选项错误;信息的价值包括显性价值和隐性价值,显性价值是指信息内容本身直接呈现的价值,隐性价值是指信息在使用过程中可能产生的潜在价值,C选项错误;信息是数据经过存储、分析及解释后所产生的意义,D选项错误;故答案为:A。
6.A
【详解】本题考查Excel函数应用。对G4: H4 进行自动填充,即向右填充,在填充过程中,B列和C的引用范围不能发生变化,也就是B列和C列需要绝对引用。故答案为A选项。
7.B
【详解】本题考查数据的概念及特点
上网时的每次操作,不一定都有价值。故本题选B选项
8.B
【详解】本题考查的是数据与信息相关知识。数据可以是数字、文字等,故选项A说法错误;信息是数据经过储存、分析及解释后所产生的意义,选项B说法正确;同一信息可以依附于不同的载体,故选项C说法错误;简单的信息处理和加工也可以使用手工,故选项D说法错误。本题应选B。
9.A
【详解】本题考查的是数据的描述。数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材。年平均气温属于数据,故本题选A选项。
10.A
【详解】本题考查的是表格函数。函数COUNT在计数时,将把数值型的数字计算进去;但是错误值、空值、逻辑值、文字则被忽略。故本题应选A。
11.A
【详解】本题考查数据、信息、知识和智慧的描述。数据可以是原始的、未加工的,也可以是通过某种方式处理或加工过的。信息则是数据的解释或含义,是数据经过加工处理后得到的对客观世界产生影响的数据。“97.2%”属于数据。故本题应选A。
12.A
【详解】本题考查的是信息的描述。信息是经过加工处理的、有意义的数据。信息是指数据、信号、消息中所包含的意义。信息本身是抽象的,必须通过载体才能体现。校园广播电台、刻着铭文的青铜器、行车记录仪是信息的载体,故本题应选A。
13.A
【详解】本题主要考查数据的描述。数据的基本单位是数据元素,故本题选A选项。
14.C
【详解】本题考查计算机基础知识。大部分杀毒软件是滞后于计算机病毒的,因此对计算机病毒以预防为主,选项C正确。计算机存储数据的基本单位是B(字节),选项A错误。硬盘容量与计算机的速度没有关系,选项B错误。信息的常用表达方式有文字、语言、图形、图像、声音和形体动作等,选项D错误。
15.D
【详解】本题考查的是数据、信息和知识的关系。数据、信息和知识可以看作人类对客观事物感知的三个不同阶段。数据是对事物属性的客观记录,信息是经过组织的有结构的数据,知识是经过人的思维整理过的信息、数据、形象、价值标准以及社会的其他符号化产物。数据、信息和知识的转换还依赖于它们使用的环境和应用者的知识结构。故本题应选D。
16.B
【详解】本题考查的是数据、信息与知识的描述。信息的价值是相对的,对于不同的人群、不同的时间,其价值可能有所不同;信息具有载体依附性,存储信息的载体遭到破坏,其承载的信息会消失;汉字在计算机中不是以ASCⅡ码存储;在计算机中经过数字化的数据才能被存储和处理。故本题应选B。
17.D
【详解】本题考查的是数据、信息、知识的定义。数据是客观世界符号记录,是信息的载体。信息是具有意义的数据,可以用来消除接受者认识上的不确定性。知识是对获取或累积的信息进行系统化地提炼、研究和分析的结果。信息具有价值相对性,故不同的人对于同样的信息,所形成的知识不相同的。本题应选D。
18.数据
【详解】本题主要考查数据的描述。数据是现实世界客观事物的符号记录,是信息的载体。
19.结果
【详解】本题考查知识的表示。在产生式规则表示法中,“前提”对应于条件,而“结论”对应于结果。产生式规则通常以“如果…那么…”的形式表示,其中“如果”部分是条件,“那么”部分是结果。
20. 绘图库 plot (x,y)
【详解】本题考查matplotlib模块。Matplotlib是一个 Python的2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。matplotlib模块是一个绘图库。matplotlib的绘图原理很简单,利用plot画线函数就可以在直角平面内轻松地将(x,y)坐标点对连接成平滑曲线。
21.F
【详解】本题考查的知识点是计算表达式的值。
已知a = 5,b = 4,c = 3,d = 2,带入表达式not 3>2*b and (b>c+1 or c<>3),此时表达式变为not 3>2*4 and (4>3+1 or 3<>3)。根据优先级,先计算算数运算,即计算2*4,得出结果为8;计算3+1,得出结果为4,此时表达式为not 3>8 and (4>4 or 3<>3),再计算关系运算,即计算3>8,得出结果为假,计算4>4,得出结果为假,计算3<>3,得出结果为假,此时表达式为not 假 and (假 or 假),最后计算逻辑运算,有小括号先计算小括号里面的,即计算假 or 假,得出结果为假,计算not假,得出结果为真,此时表达是真 and 假,得出其结果为假,故该表达式的值是假。
故表达式not 3>2*b and (b>c+1 or c<>3)的值是F。
22. 直接数据 间接数据
【详解】本题考查数据相关知识。数据的来源主要有两种渠道:一种是通过直接的调查获得的原始数据,一般称为第一手或直接的数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称之为第二手或间接的数据。故答案是:直接数据、间接数据。
23. 需要采集的项目数据。例如:书名、图书类别、出版时间、来源(网购、书店购买、图书馆借阅、向他人借阅)、同学姓名、性别、选择图书的理由、阅读图书的时间分布、、、 文件共享、在线文档、网络调查问卷等方式采集。 能根据项目需求选择恰当的数据分析方法。通过关联分析,分析出个体阅读偏好、性格特征,提出关联图书建议或为职业规划给出建议;通过数据聚类或数据分类等方法分析同学喜欢数据的类别;通过关联分析,分析阅读量与学业成绩之间的关系,判断其学业发展趋势等…
【详解】本题考查数据分析。第一题填写需要采集的项目数据。例如:书名、图书类别、出版时间、来源(网购、书店购买、图书馆借阅、向他人借阅)、同学姓名、性别、选择图书的理由、阅读图书的时间分布、、、第二题填写利用文件共享、在线文档、网络调查问卷等方式采集;第三题填写能根据项目需求选择恰当的数据分析方法。通过关联分析,分析出个体阅读偏好、性格特征,提出关联图书建议或为职业规划给出建议;通过数据聚类或数据分类等方法分析同学喜欢数据的类别;通过关联分析,分析阅读量与学业成绩之间的关系,判断其学业发展趋势等…
24.错
【详解】本题考查的是数据相关知识。数据是现实世界客观事物的符号记录,是信息的载体,是计算机加工的对象。故题干中的说法是错误的。
25.正确
【详解】本题考查数据。数据是信息的表现形式和载体,可以是数值、文字、图像、声音、视频等各种形式。视频是由一系列的图像画面组成,音频是声音的数字化表示,它们都能通过一定的方式进行数字化存储和传输,所以它们都属于数据的范畴。
26.正确
【详解】本题考查的知识点是知识的概念。知识是人类通过大脑对获取或积累的信息进行系统化地提炼、研究和分析的结果。它是对经验、事实、规律、理论等进行深入理解和总结的产物,能够精确地反映事物的本质和规律。知识是人类智慧的结晶,是人们不断探索和积累的结果。它不仅是对现有知识的总结和归纳,也是对未来发展的预测和指导。故答案为正确。
27.正确
【详解】本题主要考查数据的描述。数据对象是具有相同性质的数据元素的集合,表述正确。
28.错误
【详解】本题考查数据、信息和知识。人们对数据和信息进行处理后,人类就可以获得知识。故错误。
29.×
【详解】本题考查数据相关知识。数据是现实世界原始事物现象的符号记录,是信息的载体。故题干说法有误。
30. 具有共享性 知识 C 6492 身份认证 隐蔽技术 0.56 A E63A46 D 分支结构 True
【详解】本题主要考查信息技术的综合应用。(1)智能垃圾回收机放置在小区公共位置,屏幕上滚动显示可回收物类别等内容,以便广大居民了解相关信息。这主要体现的信息特征是具有共享性。(2)知识是人们运用大脑对所获取或积累的信息进行的提炼、研究和分析的结果,能够精确的反应事物的本质。废报纸属于可回收垃圾、坏的灯泡属于有害垃圾、过期的食物属于厨余垃圾……,这些描述的内容属于知识。(3)将采集到的模拟信号转换为数字信号,即通过采样、量化、编码的过程,完成转换后才能让数字设备进行存储和处理,故选C选项。(4)声音容量=采样频率*量化位数*声道数*时长/8,根据题干,则最多还能支持用户数是64*1024*1024*1024*8/(22.050*1000*16*2*2*60)=6492名。(5)从数据安全防护的角度来看,输入手机号及密码的方式才能登录,是采用了身份认证方法进行了用户数据的保护;登录成功后个人的界面(如下图)则采用了隐蔽技术方法进行了用户的数据安全防护,中间位用星号显示。(6)图像文件容量=分辨率*颜色深度/8=512*384*24/8/1024/1024=0.56MB。(7)将此文件用WinRAR软件进行压缩属于无损压缩,其他说法均错误,故本题选A选项。(8)十进制数230、58、70分别通过“除权取余、逆序排列”的方法转换为十六进制数是E6、3A、46,故填E63A46。(9)分析题干可知,这种算法的描述方法属于自然语言,故本题选D选项。(10)由图可知,若可回收物的重量是20kg,则满足判断条件,因此表达式x>=20的值是True。
答案第1页,共2页
答案第1页,共2页
学科网(北京)股份有限公司
$$