第六章 大数据时代数据的组织(单元测试)信息技术浙教版2019选择性必修1

2025-10-30
| 2份
| 18页
| 192人阅读
| 0人下载

资源信息

学段 高中
学科 信息技术
教材版本 高中信息技术浙教版选修1 数据与数据结构
年级 高二
章节 第六章 大数据时代数据的组织
类型 作业-单元卷
知识点 实时查询系统中数据的组织,POI数据的组织与应用
使用场景 同步教学-单元练习
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 1.25 MB
发布时间 2025-10-30
更新时间 2025-06-30
作者 wuhao1987
品牌系列 上好课·上好课
审核时间 2024-11-28
下载链接 https://m.zxxk.com/soft/48986413.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

第6章 大数据时代数据的组织 单元测试 姓名: 班级: 分数: (满分:100分 时间:90分钟) 题型 选择题 填空题 总计 题数 20 11 31题 分数 60 40 100分 得分 一、单项选择题(每题3分,共60分) 1.某算法的时间复杂度是〇(n),表明该算法()。 A.问题规模是n B.问题规模与n成正比 C.执行时间等于n D.执行时间与n成正比 2.递归算法的函数调用时,处理参数和返回地址,通常使用的数据结构是() A.数组 B.链表 C.队列 D.栈 3.算法的时间复杂度是指什么?() A.算法执行所需的时间 B.算法中语句的数量 C.算法所需内存空间 D.算法执行所需时间随输入规模增长的趋势 4.若数据库中有10万条记录以链表形式有序存放,现要在原链表基础上增设关键节点创建索引,若以二分的形式创建每一级索引,则最多需要创建索引的级数是() A.8 B.17 C.100 D.1000 5.POI 数据主要描述了哪些信息?() A.空间位置、名称、电话 B.空间位置、类别、价格 C.名称、地址、销量 D.空间位置、名称地址、联系方式 6.不属于衡量POI数据价值的指标是() A.空间位置的准确性 C.空间位置的数量 B.空间位置的面积大小 D.空间位置的覆盖率 7.下列哪种数据结构最适合用于表示POI数据?() A. 链表 B. 栈 C. 图 D. 队列 8. GeoHash算法主要用于解决什么问题?() A. 数据压缩 B. 地理位置的快速检索 C. 图像识别 D. 数据分析 9.在POI数据的存储中,以下哪种数据库类型不适用于存储大量的POI数据?() A. MySQL B. PostgreSQL C. MongoDB D. Excel 10.在基于POI数据的推荐系统中,协同过滤算法主要利用了什么信息?() A. 用户的地理位置 B. POI的类型 C. 用户的历史行为和偏好 D. POI的价格 11.以下哪种算法常用于路径规划中的最短路径计算?() A. A*算法 B. 冒泡排序算法 C. 二分查找算法 D. 归并排序算法 12.POI数据的质量对以下哪个应用的影响最大?() A. 文本编辑器 B. 导航软件 C. 图像查看器 D. 音乐播放器 13.在大数据环境下,处理海量POI数据时,以下哪种技术最为关键?() A. 传统的关系型数据库管理 B. 简单的文件存储系统 C. 单机数据处理模式 D. 分布式计算框架(如Hadoop) 14.以下不属于POI数据的组织采用空间索引目的的是() A.快速访问空间对象 B,缩短空间查询时间 C.缩小空间搜索范围 D.提供海量存储空间 15.下列关于POI数据的组织和表示的说法,正确的是() A.Hadoop提供超大规模、高可靠性、高可扩展性的存储及计算海量数据的框架 B.采用Hadoop作为地理信息存储与计算的基础框架,基于MapReduce存储空间影像数据 C.POI空间索引的建立一般使用基于树结构的空间索引技术 D.空间索引是一种计算POI数据的索引算法 16.POI数据的组织主要涉及空间索引问题。下列有关空间索引问题的描述中错误的是() A.空间索引是一种特殊的数据结构 B.空间索引可以使空间操作快速访问对象 C.空间索引技术大致分为基于链表结构和基于图结构两种 D.经常使用网格空间索引来对POI建立空间 17.通过以下 Python 程序段,转换为原链表的逆序链表,即头指针 head=1,L=[[30,2],[10,3],[20,-1],[15,4],[21 ,0]]。 q=-1 p = head #head 为原链表头指针 while p!=-1: tmp =L[p][1] head = q 上述程序段中方框处可选的语句为: ①p = tmp ③L[p][1] =q ②q=p 则方框处语句依次为 A.③②① B.③①② C.①③② D.①②③ 18.使用Python的二维列表来模拟单向链表,如下代码创建一个拥有4个节点的链表a a = [[“cat“,1],[“dog“,2],[“pig“,-1],[“rabbit“,0]] head =3 依次输出各节点数据域的值,内容为( ) A.“cat“,“dog“,“pig“,“rabbit“ B.“pig“,“rabbit“,“cat“,“dog“ C.“pig“,“dog“,“cat“,“rabbit“ D.“rabbit“,“cat“,“dog“,“pig“ 19.arr=[1,3,4,5,6,8,9,12,15,0] #0表示该位置未存储元素 num=int(input("输入需要插入的数据:")) for i in range(len(arr)): if arr[i]>num: for j in range(len(arr)-1,i-1,-1): arr[j]=arr[j-1] arr[i]=num break else: arr[-1]=num print(arr) 执行该程序段后,输入数字9,则位置下标发生改变的数据个数是() A.3 B.2 C.1 D.0 20.下列Python程序的功能是在数据有序的链表中插入一个整数,使链表中的数据仍保持有序. a=[[8,3],[6,0],[2,1],[11,4],[15,-1]] n-int(input("请输入一个整数:")) p=q=head=2 if n<=a[head][0]: a.append([n,head]) ① else: while p!=-1 and ②: q=p p=a[p][1] a.append([n,p]) a[q][1]=1en(a)-1 划线处应填入的代码是() A.①head=a[p][1] ②n>a[p][0] B.①head=a[p][1] ②n>a[q][0] C.①head=len(a)-1 ②n>a[p][0] D.①head=len(a)-1 ②n>a[q][0] 2、 填空题(每空2分,共计40分) 1.POI数据中的“POI”全称是__________。 2.在POI数据中,常见的属性包括名称、地址、__________和类型等。 3.GeoHash算法是一种将__________信息转换为字符串的编码方式。 4.四叉树索引结构通过不断__________空间来提高查询效率。 5.R树索引是一种用于空间访问的树数据结构,它按__________和最小外接矩形来组织数据。 6.在POI数据的存储中,关系型数据库使用表格形式来组织数据,而非关系型数据库则常采用__________形式。 7.为了提高POI数据的查询速度,可以建立__________来加速检索过程。 8.在POI数据的应用中,路径规划算法(如A*算法)常用于计算两点之间的__________。 9.基于POI数据的推荐系统可以根据用户的历史行为和偏好,为其推荐感兴趣的__________或活动。 10.杨辉三角是二项式系数在三角形中的一种几何排列,在我国南宋数学家杨辉1261年所编写的《详解九章算法》一书中出现。我们可以把杨辉三角看作这样的图形:最左侧一列数字和右边的斜边数字均为1,内部其他位置上的每个数字均为上一行同一列的数字与上一行前一列数字之和,前10行的杨辉三角如图2-1所示。 (1)为了在计算机中存储和处理如图2-1所示的数据,可用如图2-2所示的二维数组来表示。从图2-2中可知数字“6”存储在数组元素pas[4][2]中,其值由数组元素 和 相加得到。 (2) 在程序设计时,先将数组pas中的数据元素均赋初值为1,然后从数组元素 开始进行计算(数字“1”无须再次计算)。 (3)实现输出该图形的代码如下,在程序划线处填入适当的语句或表达式。 n = int(input("请输入行数n-")) #输出n行的杨辉三角 pas =[[1 for i in range(n)] for j in range(n)] for i in range(2,n): for j in range( l,i): pas[i][i] = pas[i-1][j-1]+ ① for i in range(n): s=[] #定义列表s用于输出每一行所需数据 for j in range( ② ): s.append(pas[i][i]) print(s) 程序中划线①处应填人 。 程序中划线②处应填人 。 11.POI兴趣点搜索:兴趣点查询是通用搜索引擎发展到一定阶段,为满足用户的个性化服务需求而出现的搜索方式,可按用户的兴趣选择相应类别,查询相关的POI信息。对于LBS(基于位置的服务)用户面言,可以通过输入关键字进行属性查询,如查询名为“XXX”的中学;也可以按范围和类别进行查询,如查询5km范围内的加油站。兴趣点查询方法类似Web搜索方法,可采用布尔逻辑模型、向量空间模型和概率模型等数学模型来建立查询检索模型。 (1)观察图6-4和图6-5,图6-5中的“地名关键词”和“搜索区域”之间的逻辑关系是 (选填:与/非)。 (2)若搜索过程中查找到的数据有1万条,而系统仅能显示1000条记录,请设计数据结构或算法使得选取记录能符合用户搜索的期望值。 期望值的指标可以是 。 仅显示1000条记录的优选算法: 。 (3)POI数据的组织和存储可以使用空间索引技术。图6-6为搜索某区域中学时显示的若干个数据点,可使用类似图6-7所示的网格对数据进行索引。 其索引项对应如图6-8所示。 若需要检索图中“职教中心”(47号网格)附近的学校,则搜索的网格区域越多,搜索的范围就越 (选填:大/小);若图中网格区域的边长为2km,现需要检索“职教中心”3km范围内的中学,检索的网格区域可以是 个(以图中数据为例);通过网络检索,列出空间索引技术的缺点(至少1个): 。 原创精品资源学科网独家享有版权,侵权必究! 学科网(北京)股份有限公司 学科网(北京)股份有限公司 学科网(北京)股份有限公司 $$ 第6章 大数据时代数据的组织 单元测试 姓名: 班级: 分数: (满分:100分 时间:90分钟) 题型 选择题 填空题 总计 题数 20 11 31题 分数 60 40 100分 得分 一、单项选择题(每题3分,共60分) 1.某算法的时间复杂度是〇(n),表明该算法()。 A.问题规模是n B.问题规模与n成正比 C.执行时间等于n D.执行时间与n成正比 【答案】D [解析]算法的时间复杂度是〇(n),这是设定问题规模为n的分析结果,所以A、B都不对;它也不表明执行时间等于n,它只表明算法的执行时间T(n)≤cXn(c为比例常数)。有的算法,如nXn矩阵的转置,时间复杂度为〇(n),不表明问题规模是n。 2.递归算法的函数调用时,处理参数和返回地址,通常使用的数据结构是() A.数组 B.链表 C.队列 D.栈 【答案】D [解析]本题主要考查的是递归算法。计算机在执行递归程序时,是通过栈结构的调用来实现的,因此答案为D。 3.算法的时间复杂度是指什么?() A.算法执行所需的时间 B.算法中语句的数量 C.算法所需内存空间 D.算法执行所需时间随输入规模增长的趋势 【答案】A [解析]所谓算法的时间复杂度,是指执行算法所需要的计算:工作量。为了能够比较客观地反映出一个算法的效率,在度量一个算法的工作量时,不仅应该与所使用的计算机、程序设计语言以及程序编制者无关,而且还应该与算法实现过程中的许多细节无关。为此,可以用算法在执行过程叶,所需基本运算的执行次数米度量.算法的工作量。故选:A。 4.若数据库中有10万条记录以链表形式有序存放,现要在原链表基础上增设关键节点创建索引,若以二分的形式创建每一级索引,则最多需要创建索引的级数是() A.8 B.17 C.100 D.1000 【答案】B [解析]二分查找最多的查找次数为[log2n]+1。 5.POI 数据主要描述了哪些信息?() A.空间位置、名称、电话 B.空间位置、类别、价格 C.名称、地址、销量 D.空间位置、名称地址、联系方式 【答案】D [解析]POI作为可以在电子地图中查询到的信息点要素,它描述了空间实体或者区域的空间位置、名称地址等信息,基本信息包括名称、类别、空间坐标信息(经纬度)、地址、电话、邮政编码等,涵盖了政府机构、学校、商业、金融、餐饮、娱乐、景点、加油站等最为基础的信息。衡量POI数据价值的指标有:空间位置的准确性和覆盖率、空间位置的数量。故选D。 6.不属于衡量POI数据价值的指标是() A.空间位置的准确性 C.空间位置的数量 B.空间位置的面积大小 D.空间位置的覆盖率 【答案】B [解析]本题考查衡量POI数据价值的指标。衡量POI数据价值的指标有。空间位置的准确性和覆盖率,空间位置的数量,与函积大小无关。 7.下列哪种数据结构最适合用于表示POI数据?() A. 链表 B. 栈 C. 图 D. 队列 【答案】C [解析]POI数据通常包含位置信息和相互关系,图结构能够很好地表示这种复杂的数据关系。链表、栈和队列不适合表示具有复杂关系的POI数据。 8. GeoHash算法主要用于解决什么问题?() A. 数据压缩 B. 地理位置的快速检索 C. 图像识别 D. 数据分析 【答案】B [解析]GeoHash算法通过将地理位置编码为字符串,便于快速检索和比较地理位置数据。 9.在POI数据的存储中,以下哪种数据库类型不适用于存储大量的POI数据?() A. MySQL B. PostgreSQL C. MongoDB D. Excel 【答案】D [解析]Excel不适合存储大量的结构化或半结构化数据,而MySQL、PostgreSQL和MongoDB都是常用的数据库系统,适用于存储POI数据。 10.在基于POI数据的推荐系统中,协同过滤算法主要利用了什么信息?() A. 用户的地理位置 B. POI的类型 C. 用户的历史行为和偏好 D. POI的价格 【答案】C [解析]协同过滤算法主要利用用户的历史行为和偏好信息来推荐相似的或相关的POI给用户。 11.以下哪种算法常用于路径规划中的最短路径计算?() A. A*算法 B. 冒泡排序算法 C. 二分查找算法 D. 归并排序算法 【答案】A [解析]A*算法是一种启发式搜索算法,常用于计算图中两点之间的最短路径。冒泡排序、二分查找和归并排序与路径规划无直接关联。 12.POI数据的质量对以下哪个应用的影响最大?() A. 文本编辑器 B. 导航软件 C. 图像查看器 D. 音乐播放器 【答案】B [解析]导航软件依赖于准确的POI数据来计算路线和提供导航服务,因此POI数据的质量对其影响最大。文本编辑器、图像查看器和音乐播放器与POI数据的关联性较小。 13.在大数据环境下,处理海量POI数据时,以下哪种技术最为关键?() A. 传统的关系型数据库管理 B. 简单的文件存储系统 C. 单机数据处理模式 D. 分布式计算框架(如Hadoop) 【答案】D [解析]在大数据环境下,处理海量POI数据需要高效的分布式计算框架来支持数据的存储、处理和分析。传统的关系型数据库管理、简单的文件存储系统和单机数据处理模式无法满足大数据处理的需求。 14.以下不属于POI数据的组织采用空间索引目的的是() A.快速访问空间对象 B,缩短空间查询时间 C.缩小空间搜索范围 D.提供海量存储空间 【答案】D [解析]本题考查POI数据的组织与表示。空间索引可以使空间操作快速访问对象,缩短空间 查询时间,缩小空间搜索范围,从而提高效率。 15.下列关于POI数据的组织和表示的说法,正确的是() A.Hadoop提供超大规模、高可靠性、高可扩展性的存储及计算海量数据的框架 B.采用Hadoop作为地理信息存储与计算的基础框架,基于MapReduce存储空间影像数据 C.POI空间索引的建立一般使用基于树结构的空间索引技术 D.空间索引是一种计算POI数据的索引算法 【答案】A [解析]基于MapReduce的计算能力对地理信息中的各种数据进行搭建,对地理信息专题数据进行信息提取,基于HDFS文件系统的高容错性和高吞吐量特点存储空间影像数据;经常使用网格空间索引对POI建立空间索引;空间索引是指依据空间对象的位置和形状或者空间对象之间的某种空间关系,按一定的顺序排列的一种数据结构。 16.POI数据的组织主要涉及空间索引问题。下列有关空间索引问题的描述中错误的是() A.空间索引是一种特殊的数据结构 B.空间索引可以使空间操作快速访问对象 C.空间索引技术大致分为基于链表结构和基于图结构两种 D.经常使用网格空间索引来对POI建立空间 【答案】C [解析]本题主要考查POI数据的组织中的空间索引问题。空间索引技术大致分为基于树结构、基于网格划分等。 17.通过以下 Python 程序段,转换为原链表的逆序链表,即头指针 head=1,L=[[30,2],[10,3],[20,-1],[15,4],[21 ,0]]。 q=-1 p = head #head 为原链表头指针 while p!=-1: tmp =L[p][1] head = q 上述程序段中方框处可选的语句为: ①p = tmp ③L[p][1] =q ②q=p 则方框处语句依次为 A.③②① B.③①② C.①③② D.①②③ 【答案】A [解析]考查数据结构中链表的知识。将原链表转换为逆序链表,需要将原链表遍历一遍,记录链表指向,并进行交换逆向输出。观察代码,head为原链表头指针且p=head,当P值不为1即链表不为空时,执行tmp=L[p][1],将当前链表位指向临时放人p 并给其赋值为q,再将p赋值给q,然后将tmp赋值给p,准备下一轮赋值给q。如此循环,直到原链表的最后一位结束,最后 head 就是最后一次的位置。因此方框中可选的语句顺序是:L[p][1]=q-->q=p-->p =tmp。故选 A。 18.使用Python的二维列表来模拟单向链表,如下代码创建一个拥有4个节点的链表a a = [[“cat“,1],[“dog“,2],[“pig“,-1],[“rabbit“,0]] head =3 依次输出各节点数据域的值,内容为( ) A.“cat“,“dog“,“pig“,“rabbit“ B.“pig“,“rabbit“,“cat“,“dog“ C.“pig“,“dog“,“cat“,“rabbit“ D.“rabbit“,“cat“,“dog“,“pig“ 【答案】D [解析]根据引用域的排列顺序可知[“rabbit“,0][“cat“,1],[“dog“,2],[“pig“,-1],列表是这样的顺序。故选:D。 19.arr=[1,3,4,5,6,8,9,12,15,0] #0表示该位置未存储元素 num=int(input("输入需要插入的数据:")) for i in range(len(arr)): if arr[i]>num: for j in range(len(arr)-1,i-1,-1): arr[j]=arr[j-1] arr[i]=num break else: arr[-1]=num print(arr) 执行该程序段后,输入数字9,则位置下标发生改变的数据个数是() A.3 B.2 C.1 D.0 【答案】B [解析]当数组arr中的元素arr[i]大于新数据num时,则将位置i及其之后的数据都向后移动,所以当输入的数字为9时,12大于num,则12和15的位置下标将发生改变。 20.下列Python程序的功能是在数据有序的链表中插入一个整数,使链表中的数据仍保持有序. a=[[8,3],[6,0],[2,1],[11,4],[15,-1]] n-int(input("请输入一个整数:")) p=q=head=2 if n<=a[head][0]: a.append([n,head]) ① else: while p!=-1 and ②: q=p p=a[p][1] a.append([n,p]) a[q][1]=1en(a)-1 划线处应填入的代码是() A.①head=a[p][1] ②n>a[p][0] B.①head=a[p][1] ②n>a[q][0] C.①head=len(a)-1 ②n>a[p][0] D.①head=len(a)-1 ②n>a[q][0] 【答案】C [解析]本题考查Python程序。首先分析程序逻辑,程序要在有序链表中插入一个整数n并保持有序。如果n小于等于表头元素的值,就在表头插入。否则,通过循环找到合适的插入位置。对于①处,如果n小于等于表头元素,要更新表头指针,应将表头指针指向新插入元素,即head=len(a)-1。对于②处,在循环中要判断n是否大于当前指针所指元素的值,即n>a[p][0]。故答案为: C。 2、 填空题(每空2分,共计40分) 1.POI数据中的“POI”全称是__________。 【答案】Point of Interest(兴趣点) [解析]POI代表的是兴趣点,通常指的是地图上或地理位置数据中的一个特定位置,如商店、餐馆、景点等。 2.在POI数据中,常见的属性包括名称、地址、__________和类型等。 【答案】经纬度坐标 [解析]经纬度坐标用于唯一标识一个地理位置,在POI数据中是必不可少的属性之一。 3.GeoHash算法是一种将__________信息转换为字符串的编码方式。 【答案】地理 [解析]GeoHash通过将经纬度信息转换为字符串形式,便于存储和检索地理位置数据。 4.四叉树索引结构通过不断__________空间来提高查询效率。 【答案】分割 [解析]四叉树索引结构通过递归地将空间分割成四个象限,从而快速定位目标区域。 5.R树索引是一种用于空间访问的树数据结构,它按__________和最小外接矩形来组织数据。 【答案】面积 [解析]R树索引根据区域的面积和最小外接矩形来划分空间,以优化空间查询。 6.在POI数据的存储中,关系型数据库使用表格形式来组织数据,而非关系型数据库则常采用__________形式。 【答案】文档 [解析]非关系型数据库(如MongoDB)通常使用灵活的文档形式来存储数据,便于处理不规则数据。 7.为了提高POI数据的查询速度,可以建立__________来加速检索过程。 【答案】索引 [解析]索引是数据库中的一种数据结构,用于快速查找和访问数据记录。 8.在POI数据的应用中,路径规划算法(如A*算法)常用于计算两点之间的__________。 【答案】最短路径 [解析]路径规划算法通过计算两点之间的最短路径来提供导航服务。 9.基于POI数据的推荐系统可以根据用户的历史行为和偏好,为其推荐感兴趣的__________或活动。 【答案】地点 [解析]推荐系统利用POI数据中的用户行为和偏好信息,为用户推荐可能感兴趣的地点或活动。 10.杨辉三角是二项式系数在三角形中的一种几何排列,在我国南宋数学家杨辉1261年所编写的《详解九章算法》一书中出现。我们可以把杨辉三角看作这样的图形:最左侧一列数字和右边的斜边数字均为1,内部其他位置上的每个数字均为上一行同一列的数字与上一行前一列数字之和,前10行的杨辉三角如图2-1所示。 (1)为了在计算机中存储和处理如图2-1所示的数据,可用如图2-2所示的二维数组来表示。从图2-2中可知数字“6”存储在数组元素pas[4][2]中,其值由数组元素 和 相加得到。 (2) 在程序设计时,先将数组pas中的数据元素均赋初值为1,然后从数组元素 开始进行计算(数字“1”无须再次计算)。 (3)实现输出该图形的代码如下,在程序划线处填入适当的语句或表达式。 n = int(input("请输入行数n-")) #输出n行的杨辉三角 pas =[[1 for i in range(n)] for j in range(n)] for i in range(2,n): for j in range( l,i): pas[i][i] = pas[i-1][j-1]+ ① for i in range(n): s=[] #定义列表s用于输出每一行所需数据 for j in range( ② ): s.append(pas[i][i]) print(s) 程序中划线①处应填人 。 程序中划线②处应填人 。 【答案】(1) pas[3][1]pas[3][2] (2) pas[2][1] (3) ①pas[i-1][j]②i+l [解析](1)本题使用了二维数组来存储每一行的数据,根据图2-2所示的二维数组的行、列下 标,可知数字“6”位于第5行第3列(pas[4][2]),其值通过上一行前一列元素pas[3][1]和上一行同一列元素pas[3][2]计算可得。 (2)根据图2-2所示,数组元素初始化为1后,可从数字“2”开始计算,数字“2”所在的数组元素为pas[2][1]。 (3)下三角部分位置上的每个数字均为上一行同一列的数字与上一行前一列的数字之和,pas[i-1][j-1]为上一行前一列数据,则①划线处的代码应该为上一行同一列的数据,即 pas[i-1][i]。根据二维数组下标的规律,第i行的列下标的值为0到i-1,注意题图中的行数是1到10行,行列的数组元素下标从0开始编号,每一行需要输出的数据只包含图2-2中的下三角部分,因此②划线处的代码为i+1。 11.POI兴趣点搜索:兴趣点查询是通用搜索引擎发展到一定阶段,为满足用户的个性化服务需求而出现的搜索方式,可按用户的兴趣选择相应类别,查询相关的POI信息。对于LBS(基于位置的服务)用户面言,可以通过输入关键字进行属性查询,如查询名为“XXX”的中学;也可以按范围和类别进行查询,如查询5km范围内的加油站。兴趣点查询方法类似Web搜索方法,可采用布尔逻辑模型、向量空间模型和概率模型等数学模型来建立查询检索模型。 (1)观察图6-4和图6-5,图6-5中的“地名关键词”和“搜索区域”之间的逻辑关系是 (选填:与/非)。 (2)若搜索过程中查找到的数据有1万条,而系统仅能显示1000条记录,请设计数据结构或算法使得选取记录能符合用户搜索的期望值。 期望值的指标可以是 。 仅显示1000条记录的优选算法: 。 (3)POI数据的组织和存储可以使用空间索引技术。图6-6为搜索某区域中学时显示的若干个数据点,可使用类似图6-7所示的网格对数据进行索引。 其索引项对应如图6-8所示。 若需要检索图中“职教中心”(47号网格)附近的学校,则搜索的网格区域越多,搜索的范围就越 (选填:大/小);若图中网格区域的边长为2km,现需要检索“职教中心”3km范围内的中学,检索的网格区域可以是 个(以图中数据为例);通过网络检索,列出空间索引技术的缺点(至少1个): 。 【答案】(1)与 (2)①期望值指标:其他用户的搜索热度,该数据点被搜索的活跃度、数据点用户的评价等。 ②优选算法:可以对数据进行排序,排序的依据可以是期望值指标、搜索名称的精确度。 (3)①大、②9、 ③缺点:索引数据存在冗余、存储空间较浪费以及网格大小和查找效率较难平衡等问题。 [解析]通过图中数据的逻辑关系可知两者属于“与”的关系。搜索的区间范围在地图上以该 点为中心的圆形区域,结合图6-10所示的空间区域,则该圆形区间落在类似九宫格的区域。 原创精品资源学科网独家享有版权,侵权必究! 学科网(北京)股份有限公司 学科网(北京)股份有限公司 学科网(北京)股份有限公司 $$

资源预览图

第六章 大数据时代数据的组织(单元测试)信息技术浙教版2019选择性必修1
1
第六章 大数据时代数据的组织(单元测试)信息技术浙教版2019选择性必修1
2
第六章 大数据时代数据的组织(单元测试)信息技术浙教版2019选择性必修1
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。