内容正文:
浙江良品图书有限公司
精彩三年1学考尖峰 信息技术 2022浙江
专题集训11 大数据处理及人工智能
单击此处编辑母版文本样式
1
1.目前,网盘的底层一般采用的文件系统是( )
A.HDFS B.Ext4
C.FAT32 D.NTFS
解析 网盘采用流数据存储数据,借助分布式存储系统格式,
以HDFS为底层。
A
单击此处编辑母版文本样式
2.下列关于分布式数据库HBase的理解,错误的是( )
A.HBase是谷歌Big Table数据库的开源实现
B.底层存储采用建立在HDFS基础上
C.采用基于列的存储方式,可管理PB级的大数据
D.仅用于存储结构化和半结构化数据
解析 分布式数据库HBase可用于存储结构化和半结构化数据
以及非结构化数据。
D
单击此处编辑母版文本样式
3.下列不属于图计算中的图处理软件的是( )
A.InfiniteGraph B.Photoshop
C.OrientDB D.Neo4j
解析 Photoshop为图像编辑软件。
B
单击此处编辑母版文本样式
4. 要构建一个电子商务平台,需实时向用户推送相关产品信息,
推荐该平台底层采用的文件系统和数据处理平台是( )
A.HDFS Google Pregel B.Ex14 Heron
C.HDFS Storm D.HDFS Hadoop
解析 针对电子商务平台,需处理海量数据,则需采用分布式
文件格式HDFS,以及流数据处理平台Storm。
C
单击此处编辑母版文本样式
5.实时处理与批处理整合的优势有( )
①缩短了批处理计算和流计算之间的切换延时
②降低了使用成本
③可以在同一个平台做批处理计算和流计算
④减少了系统开销
A.①②③④ B.①②④
C.①③④ D.②③④
A
单击此处编辑母版文本样式
6.下列有关DataFrame说法正确的是( )
A.DataFrame中值的类型可以不一致
B.columns可以添加之前不存在的行索引
C.用index可以获取DataFrame中一列数组
D.使用嵌套字典构建DataFrame时,外层词典的键作为行,
内层词典的键作为列
解析 选项B,columns设置的是DataFrame中的列索引;选项
C,index指向DataFrame的行索引;选项D,使用嵌套字典构
建DataFrame时,外层词典的键作为列,内层词典的键作为行
A
单击此处编辑母版文本样式
7.文件student.xlsx第一张Excel工作表存放了学生信息,单元格
A1,B1,C1的值分别为“姓名”“性别”“出生日期”,部分程序
代码如下:
import pandas as pd
s1=pd.read_excel(”student.xlsx” )
s1.insert(0,column=”班级”,value=”-(1)”)
s2=s1.sort_values(出生日期)
执行该程序代码后,下列说法错误的是( )
A
单击此处编辑母版文本样式
A.对象s1中对象一定是按“出生日期”升序排列
B.除索引列外,对象s1有4列数据
C.对象s2中,每一行的班级列的值均为-(1)
D.对象s1中,索引列的值是升序排列的
解析 对象s2中对象一定是按“出生日期”升序排列。
单击此处编辑母版文本样式
8.某公司在全国有六大营业区,下列可以最清晰地展现各大营
业区“季度销售额”占比的图表是( )
A.地图 B.雷达图
C.折线图 D.饼图
解析 用于显示各数据的比例关系的是饼图。
D
单击此处编辑母版文本样式
9.网上购物,快递物流等待时间与其心情愉快程度有关联,等
待的时间越长,其心情愉快程度越低,为了体现这些数据关
系,应采用的图表是( )
A.饼图 B.散点图 C.柱形图 D.雷达图
解析 有关关系的可视化,用于变量之间的关联性和分布关
系,采用散点图表示。
B
单击此处编辑母版文本样式
10.下列数据处理中,不属于文本数据处理的是( )
A.将中文翻译成其他国家的文字
B.解析大量合同文档,有效监控风险条款,节省人力和时
间成本
C.检测的论文内容与对比库中的资料进行对比,检测论文
可信度
D.输入姓名、单位等信息,制作通讯录
解析 输入姓名、单位等信息,制作通讯录,属于文本输入
计算机系统,并非处理。
D
单击此处编辑母版文本样式
11.下列关于文本数据处理的说法,正确的是( )
A.文本数据处理不能应用在自动校对方面
B