内容正文:
第六章│大数据时代数据的组织
——6.1 实时查询系统中数据的组织
6.2 POI数据的组织与应用,教材P165~176
第20课 大数据时代数据的组织
新课程目标
1.了解实时查询系统中的数据结构和处理方式。 2.了解POI数据的组织与应用。
目录
CONTENTS
教材整体感悟 知本与探源
01
02
命题整体感知 尝试与研析
01
教材整体感悟 知本与探源
教材整体感悟 知本与探源
1.实时查询系统中数据的组织
(1)大数据背景下的数据组织、存储和处理采用分布式存储技术。
(2)分布式存储系统
分布式存储系统利用分布在不同物理位置的服务器来分担系统存储任务,既能提高数据存储的安全性,又能提升系统数据访问的速度,同时也具有较好的可扩展性。
(3)实时查询系统中的数据业务特点:能实现上千个请求的实时响应;支持后续商品信息的更改。
教材整体感悟 知本与探源
(4)为了减轻磁盘数据库访问的负担,可事先将数据库中的信息读取出来并保存在内存中,大大提高了数据读取的速度。
(5)基于数据间线性关系的数据结构设计
读取数据库中的数据并保存在内存中,可采用数组或链表结构来组织和存储。使用数组和链表的方式进行数据查找和插入的特点:
数据结构 查找 插入
数组 采用二分查找算法,时间复杂度为O(log2n),速度较快 数据移动较多,时间复杂度O(n),速度较慢
链表 需要从链表一端依次遍历,时间复杂度为O(n),速度较慢 时间复杂度为O(1),速度较快
教材整体感悟 知本与探源
(6)基于链表的数据结构和算法优化设计
①减少查找插入位置过程中的比较次数。
②借鉴二分查找算法的思想。
(7)跳跃表:在有序链表的基础上,增加多级索引(耗费存储空间),借鉴二分查找的算法思想实现快速查找,算法的时间复杂度为O(log2n)。
教材整体感悟 知本与探源
(8)其他数据组织与处理方法
①减少对磁盘的访问。
②对数据进行分级存储。
③采用改进后的数据结构来组织、存储数据。
教材整体感悟 知本与探源
2.POI数据的组织与应用
(1)POI是“Point of Interest”的缩写,可以翻译成“兴趣点”,描述了空间实体或者区域的空间位置、名称、类别、空间坐标信息(经纬度)、地址、电话、邮政编码等信息。电子地图上一般用气泡图标来表示POI。
(2)衡量POI数据价值的指标:空间位置的准确性和覆盖率;空间位置的数量。
(3)POI数据的组织与表示
教材整体感悟 知本与探源
①POI数据的存在形式:一般以表记录或点状数据集的形式存在。
②POI数据处理:采用Hadoop作为地理信息存储与计算的基础框架。
③网格索引的空间索引技术。
02
命题整体感知 尝试与研析
命题整体感知 尝试与研析
例1下列系统中,属于实时查询系统的是( )
A.某学校的学生学籍管理系统
B.某航空公司的在线订票系统
C.某广告公司的计算机辅助设计系统
D.某印刷厂的计算机激光排版系统
B
命题整体感知 尝试与研析
【解析】 实时查询系统具有一定的时间约束,能够对在线数据进行有效的处理。学校学籍管理系统是对学生的学籍信息进行查询、添加、修改等操作的系统,其处理的数据可以是离线的静态数据;计算机辅助设计系统和计算机激光排版系统对数据时效性的要求并不高,允许用户离线处理数据;而航空订票系统需要实时查询获取当前机票的数量、价格等信息,是一个实时查询系统。故选项B正确。
命题整体感知 尝试与研析
例2大数据背景下的数据组织、存储和处理通常采用的技术是( )
A.传统存储系统 B.云存储系统
C.分布式存储系统 D.集中式存储系统
【解析】 大数据背景下的数据组织、存储和处理采用的是分布式存储系统,分布式存储系统具有优秀的可扩展能力,在性能、维护性和容灾性等方面也具有不同程度的优势,选项C正确。
C
命题整体感知 尝试与研析
变式1下列关于分布式存储系统的说法中,不正确的是( )
A.分布式存储系统能提高数据存储的安全性
B.分布式存储系统能提升系统数据访问的速度
C.当用户提出访问请求时,系统根据元数据服务器将访问定位到目标数据的服务器上
D.分布式存储技术将数据保存在同一个服务器中
D
命题整体感知 尝试与研析
【解析】 分布式存储技术将所有的数据分别保存在不同的服务中,需要时从中提取并进行合并,就可以满足海量数据的存储与处理需求,选项D错误。
命题整体感知 尝试与研析
例3有如下跳跃表:
若要原链表中插入元素7,则数据元素需要比较的次数为( )
A.1次 B.3次
C.4次 D.5次
【解析】 该跳跃表中增设了关键节点,插入新元素时,只要让插入元素依次与关键节点比较。即元素7依次与关键节点2、5、8比较。因此,共比较3次就找到插入位置,选项B正确。
B
命题整体感知 尝试与研析
变式1下列关于跳跃表的说法中,不正确的是( )
A.跳跃表借鉴的是顺序查找的思想
B.关键节点包含原链表的一半节点
C.关键节点在使用过程中需要动态调整
D.对于较多节点的链表可以建立多级索引方便查找
【解析】 跳跃表借鉴的是二分查找的思想,选项A错误。
A
命题整体感知 尝试与研析
例3下列关于POI数据的说法中,正确的是 ( )
A.数据也称“兴趣点”
B.数据只用于地图显示
C.数据可以描述空间实体的所有信息
D.数据的数量与系统价值无关
C
命题整体感知 尝试与研析
【解析】POI数据在社会各个领域都有广泛的应用;POI数据可以描述空间实体的一些基础信息,但不能够完全描述;POI数据的数量在一定程度上代表着整个系统的价值,选项A正确。
命题整体感知 尝试与研析
变式1POI数据的组织主要涉及空间索引问题。下列关于空间索引问题的说法中,不正确的是( )
A.空间索引是一种特殊的数据结构
B.空间索引可以使空间操作快速访问对象
C.空间索引技术大致分为基于链表结构和基于图结构两种
D.经常使用网络空间索引来对POI建立空间索引
C
命题整体感知 尝试与研析
【解析】空间索引技术大致分为基于树结构、基于网格划分等,选项C错误。
命题整体感知 尝试与研析
|随|堂|检|测|
1.下列关于分布式存储系统的说法中,不正确的是( )
A.分布式存储系统需要使用多台服务器共同存储数据
B.分布式存储系统需要多台服务器同时工作
C.分布式存储系统中的多台服务器通过网络进行连接
D.在有服务器出现故障的情况下,分布式存储系统不可用
C
命题整体感知 尝试与研析
【解析】分布式存储系统需要使用多台服务器共同存储数据,但随着服务器数量的增加,服务器出现故障的概率也会不断增加。为了保证在有服务器出现故障的情况下系统仍然可用,分布式存储系统一般采用把一个数据分成多份存储在不同的服务器中的方法来解决。因此,在有服务器出现故障的情况下分布式存储系统仍可用,选项D正确。
命题整体感知 尝试与研析
2.[2023·金华一中检测]在链表中设立关键节点可以提高系统的查找效率,有链表及其关键节点如下,则它的二级索引包含的节点有( )
A.9,15 B.4,9
C.4,15 D.9,29
【解析】头节点4需要存在二级索引中,根据二分查找的思想,将关键节点15提取到二级索引中,选项C正确。
C
命题整体感知 尝试与研析
3.POI是“Point`of`Interest”的缩写,通常称作( )
A.兴趣点 B.气泡点
C.位置点 D.定位点
【解析】POI是“Point`of`Interest”的缩写,通常称作“兴趣点”,有时候也叫作“信息点(Point`of`Information)”。选项A正确。
A
感谢聆听,再见!
$$