内容正文:
6.2 POI数据的组织与应用 1课时(教学设计)
年级
高二年级
授课时间
1课时
课题
6.2 POI数据的组织与应用
教学
目标
1.熟悉 POI数据的特点与应用。
2.了解空间索引技术,熟悉POI数据典型的数据组织与处理方式,初步分析POI数据处理过程中的算法效率。
3.理解数据结构与算法的迭代性。
教学
重难点
重点:
1.了解 POI数据的特点与应用
2.熟悉POI数据的组织与处理
难点:
1.了解空间索引技术,简单分析POI数据处理过程中的算法
教学
准备
多媒体课件、多媒体教室、课本教材
教学过程
教师活动
学生活动
新
课
导
入
一、课堂导入
1.情境导入:(1)展示地理信息服务图片:
随着计算机技术、通信技术和3S技术(遥感技术RS、地理信息系统GIS、全球定位系统GPS的统称)的发展融合,互联网环境中的地理信息服务已经成为人们网络生活的重要组成部分。
网络地理信息服务离不开POI的支持。
以生活实际为例,吸引学生参与课堂,抛出问题,让学生思考并观看教师的PPT课件上的图片提示,从而引出本堂课的主题。
新 知 讲 授
一、POI数据的概念
1.概念
POI是“Point of Interest” 的 缩 写, 可 以翻译成“兴趣点”,有些时候也叫作“Point of Information”,即“信息点”。电子地图上一般用气泡图标来表示POI。
导航地图中显示的兴趣点
描述了空间实体或者区域的空间位置、名称地址等
基本信息:名称、类别、空间坐标信息(经纬度)、地址、电话、邮政编码等
衡量POI数据价值:空间位置的准确性和覆盖率、空间位置的数量
2.应用
POI数据在社会各个领域都得到了广泛的应用。
地铁、公交动态数据--行进线路名称、站点名称、到站时间等
哈啰单车停车点
为城市公交线路设置提供科学依据。
3.探讨与讨论
(1)不属于衡量POI数据价值的指标是( )
A.空间位置的准确性
C.空间位置的数量
B.空间位置的面积大小
D.空间位置的覆盖率
二、POI数据的组织与表示
POI数据一般以表记录或点状数据集的形式存在,如以表结构形式储存于Oracle的大型数据库中。
1.数据结构主要包含下列数据:
①点要素属于的矩形分幅的网格号
②唯一标识号
③点的POI分类编码
④POI名称
⑤POI电话
⑥POI地址
⑦POI的经纬度坐标
针对这样的大数据进行处理,可以用什么技术来实现呢?
2.探讨与讨论
如何根据自己所在位置来查询附近50米的POI?(如商家、景点)
枚举算法:计算位置与所有POI的距离,并保留距离小于50米的POI
经纬度计算公式复杂
算法效率低
3.Hadoop
(1)提供了一种超大规模、高可靠性、高可扩展性的存储及计算海量数据的框架,可降低成本
(2)基于HDFS文件系统的高容错性和高吞吐量特点存储空间影像数据
(3)基于HBase的存储可靠性强、检索性能高、存储列可按需增加的特点存储地理信息专题数据
(4)基于MapReduce的计算能力对地理信息中的各种数据进行搭建,对地理信息专题数据进行信息提取,提取有效信息
POI数据的组织主要涉及空间索引问题,空间索引是指依据空间对象的位置和形状或者空间对象之间的某种空间关系,按一定的顺序排列的一种数据结构。
(1)包含空间对象的概要信息,如:标识、外接矩形、指针
(2)使空间操作快速访问对象,缩短查询时间
(3)基于树结构
(4)基于网格划分
考虑到POI数据本身为点信息,一个数据仅可能出现在一个索引位置中,因此经常使用网格空间索引来对POI建立空间索引。
4.网格空间索引
将一副地图的地理范围均等划分为M行N列的二维空间数据,得到M×N个小矩形网格区域。
判断哪些信息点落在矩形框中只需对A,B,C,D,E运算即可
※不建立空间索引,所有POI遍历一遍
※建立索引使得查询次数下降很多
如果一个图层有10万个POI,不建立空间索引,任何地图操作都将对整个图层的所有POI遍历一次,也就是要循环10万次;建立索引将使得程序循环的次数下降很多,效率也随之提高。
5.探讨与讨论
在大数据环境下,处理海量POI数据时,以下哪种技术最为关键?( )
A. 传统的关系型数据库管理
B. 简单的文件存储系统
C. 单机数据处理模式
D. 分布式计算框架(如Hadoop)
三、POI数据处理中的数据结构与算法分析
1.POI数据操作
(1)连接POI数据库,将POI数据写入索引数据库。
将POI的名称、地址、电话、分类、经纬度坐标写入索引数据
将兴趣点信息“名称:浙江大学(玉泉校区);地址:浙江省杭州市西湖区浙大路38号;分类:教育;经纬度坐标:120.129649, 30.270072”写入索引数据库。
(2)根据关键字进行查询,存储符合条件的记录,获得结果集。
在获得结果集的前提下,如果要根据某个点的坐标在海量的数据点中找到该坐标所在的区域或者最接近的点
①二分查找:不适用与经纬度
②B 树查找:查找效率没有提高
(3)增加了对地理坐标优化的空间索引算法
高效查找临近点
R树、K-D树、四叉树
缺点:存在数据冗余、不稳定的查改效率
抛开时间效率、空间效率以及算法复杂度等因素,用了这些数据结构也就意味着放弃了使用现成强大的数据库而需要自己编写数据查改系统。
GeoHash算法:二维的信息转化为一维的数据、用于空间检索、用于POI数据查询的算法、良好的稳定性和拓展性
GeoHash算法:二维-->一维
能够广泛引用与空间检索,尤其是POI数据查询的算法
2.拓展链接:GeoHash算法
GeoHash算法由古斯塔沃·尼迈尔(Gustavo Niemeyer)大概于2013年提出,目的是为地球上的每一个点(根据经纬度)确定一条短的URL作为唯一的标识。
GeoHash算法把一个坐标点映射到一个字符串上,每一个字符串代表的就是一个以经纬度划分的矩形区域。比如右图展现了北京地区所在的九个区域,分别是WX4ER、WX4G2、WX4G3等。
(1)GeoHash算法特性
①层级空间数据结构,将地理位置用矩形网格划分,同一网格内地理编码相同;
②可以表示任意精度的地理位置坐标,只要编码长度足够长;
③编码前缀匹配的越长,地理位置越邻近
GeoHash算法用类似四叉树的方法来寻求一个点,对经度和纬度不断地进行二分,最终确定到想要的精度。
(2)GeoHash算法
GeoHash算法用类似四叉树的方法来寻找一个点,对经度和纬度不断地进行二分,最终确定到想要的精度,划分的过程如下:
每5位为一组,用0—9,b—z(去掉a, i, l, o)进行Base32编码,即可得到该区域经过编码后的GeoHash值。
编码结果
在坐标写入数据库的同时,将程序计算出坐标的GeoHash值并一起入库。
3.探讨与讨论
下列关于POI数据处理中的数据结构与算法的说法,不正确的是( )
A.使用 R树来存储数据可以做到高效地查找临近点
B.GeoHash算法能把一个一维的信息转化为二维的数据加以存储
C.四叉树存在数据冗余,不稳定的查改效率等缺点
D.可以使用二分查找找到指定坐标所在的区域或者最接近的点①一方面将增加系统的负担,甚至在访问量增大的瞬间出现系统崩溃;
四、课堂小练
五、小结
1.POI数据的概念
(1)概念(2)应用
2.POI数据的组织与表示
(1)数据结构(2)Hadoop
(3)空间索引(4)网格空间索引
3.POI数据处理中的数据结构与算法分析
(1)POI数据操作
(2)GeoHash算法
①特性②规则(3)采用改进后的数据结构来组织、存储数据
提出什么是POI,通过地图展示,让学生们先了解什么是POI,在后面的课堂中,将该概念更好的融入到教学中。
在提出POI的概念后,从基本信息和衡量其数据价值等几方面来强调POI,然后在此基础上延伸POI 的应用场景,从我们生活中常见的现象中举出POI的运用,让同学们更好的从生活的例子中去理解。
讲完一个小的知识点后,马上通过课堂练习,加深同学们对POI的理解。
理解了POI的概念后,马上加强对其的深入理解,从一个表格中引入POI数据的组织与表示,从表格中得出数据结构主要包含哪些数据。
抛出一个问题,让同学们讨论一下,从而引出另外一个概念:Hadoop。有了对比之后,大家对Hadoop就有了更加深入的理解。
有了对POI的初步理解,现在从空间索引问题来讲解,同样也是在对比中进行讲解,体现空间索引问题在实际应用中的不同。
讲完一个小的知识点后,马上通过课堂练习,加深同学们对POI的理解。
引入实际案,对POI数据操作的讲解,从两个方面来对比讲解,然后引出GeoHash算法。
在拓展链接中,着重的讲解GeoHash算法,从算法特性和算法过程循序渐进的讲解,让学生深入浅出的理解其用法。
通过案例的讲解,同学们已经有了一个逐步递进的学习过程,从POI→Hadoop→GeoHash算法,从这三个方面来更好的理解本节课的内容:POI数据的组织与应用。
通过课堂练习,加深同学们对POI数据的组织与应用的理解。
课
堂
练
习
(有题有答案有解析)
1. POI是“ ” 的缩写,可以翻译成“ ”,有些时候也叫作“Point ofInformation”,即“ ”。
2.电子地图上一般用 来表示POI。
3.衡量POI数据价值的指标有: 和 、 。
4.POI数据一般以 或 的形式存在,如以表结构形式储存于racle的大型数据库中,其数据结构主要包含下列数据: 、 、 、 、 、 和 等。
5.POI数据的组织主要涉及空间索引问题,空间索引是指依据 或者 的某种空间关系,按一定的 的一种数据结构。
6.空间索引技术大致分为基于 、基于 划分等。
7.用 、 或者是 之类的数据结构来存储这些点可以做到高效地查找临近点。
8.GeoHash算法把一个 映射到一个 上,每一个字符串代表的就是一个以 划分的矩形区域。
9.POI 的全称是什么?( )
A.Point of Information
B.Place of lmportance
C.Position on Internet
D.Point of Interest
10.POI 数据主要描述了哪些信息?()
A.空间位置、名称、电话
B.空间位置、类别、价格
C.名称、地址、销量
D.空间位置、名称地址、联系方式
参考答案:
1.Point of Interest、兴趣点、信息点
2.气泡图标
3.空间位置的准确性、覆盖率、空间位置的数量
4.表记录、点状数据集、、点要素属于的矩形分幅的网格号、唯一标识号、点的POI分类编码、POI名称、POI电话、POI地址、POI的经纬度坐标
5.空间对象的位置和形状、空间对象之间、顺序排列
6.空树结构、网格
7.R树、K-D树、四叉树
8.坐标点、字符串、经纬度
9.【答案】D
[解析]POI是“Point of Interest” 的 缩 写, 可 以 翻译成“兴趣点”,有些时候也叫作“Point of Information”,即“信息点”。电子地图上一般 用气泡图标来表示POI。对于一个地理信息系统来说,POI的 数量在一定程度上代表着整个系统的价值。故选D。
10、【答案】D
[解析]POI作为可以在电子地图中查询到的信息点要素,它描述了空间实体或者区域的空间位置、名称地址等信息,基本信息包括名称、类别、空间坐标信息(经纬度)、地址、电话、邮政编码等,涵盖了政府机构、学校、商业、金融、餐饮、娱乐、景点、加油站等最为基础的信息。衡量POI数据价值的指标有:空间位置的准确性和覆盖率、空间位置的数量。故选D。
课
堂
小
结
课堂小结
1.POI数据的概念
(1)概念(2)应用
2.POI数据的组织与表示
(1)数据结构(2)Hadoop
(3)空间索引(4)网格空间索引
3.POI数据处理中的数据结构与算法分析
(1)POI数据操作
(2)GeoHash算法
①特性②规则(3)采用改进后的数据结构来组织、存储数据
作
业
设
计
1.GeoHash算法是一种将__________信息转换为字符串的编码方式。
2.四叉树索引结构通过不断__________空间来提高查询效率。
3.R树索引是一种用于空间访问的树数据结构,它按__________和最小外接矩形来组织数据。
4.在POI数据的存储中,关系型数据库使用表格形式来组织数据,而非关系型数据库则常采用__________形式。
5.为了提高POI数据的查询速度,可以建立__________来加速检索过程。
6.在POI数据的应用中,路径规划算法(如A*算法)常用于计算两点之间的__________。
7.基于POI数据的推荐系统可以根据用户的历史行为和偏好,为其推荐感兴趣的__________或活动。
8.不属于衡量POI数据价值的指标是()
A.空间位置的准确性
C.空间位置的数量
B.空间位置的面积大小
D.空间位置的覆盖率
9.下列哪种数据结构最适合用于表示POI数据?()
A. 链表
B. 栈
C. 图
D. 队列
10. GeoHash算法主要用于解决什么问题?()
A. 数据压缩
B. 地理位置的快速检索
C. 图像识别
D. 数据分析
11.在POI数据的存储中,以下哪种数据库类型不适用于存储大量的POI数据?()
A. MySQL
B. PostgreSQL
C. MongoDB
D. Excel
12.以下哪种索引结构最适合用于范围查询?()
A. B+树
B. 哈希表
C. R树
D. 红黑树
13.POI数据的更新通常涉及哪些方面?()
A. 增加新的POI
B. 删除过时的POI
C. 修改现有POI的信息
D. 以上全部
14.在基于POI数据的推荐系统中,协同过滤算法主要利用了什么信息?()
A. 用户的地理位置
B. POI的类型
C. 用户的历史行为和偏好
D. POI的价格
参考答案:
1.【答案】地理
[解析]GeoHash通过将经纬度信息转换为字符串形式,便于存储和检索地理位置数据。
2.【答案】分割
[解析]四叉树索引结构通过递归地将空间分割成四个象限,从而快速定位目标区域。
3.【答案】面积
[解析]R树索引根据区域的面积和最小外接矩形来划分空间,以优化空间查询。
4.【答案】文档
[解析]非关系型数据库(如MongoDB)通常使用灵活的文档形式来存储数据,便于处理不规则数据。
5.【答案】索引
[解析]索引是数据库中的一种数据结构,用于快速查找和访问数据记录。
6.【答案】最短路径
[解析]路径规划算法通过计算两点之间的最短路径来提供导航服务。
7.【答案】地点
[解析]推荐系统利用POI数据中的用户行为和偏好信息,为用户推荐可能感兴趣的地点或活动。
8.【答案】B
[解析]本题考查衡量POI数据价值的指标。衡量POI数据价值的指标有。空间位置的准确性和覆盖率,空间位置的数量,与函积大小无关。
9.【答案】C
[解析]POI数据通常包含位置信息和相互关系,图结构能够很好地表示这种复杂的数据关系。链表、栈和队列不适合表示具有复杂关系的POI数据。
10. 【答案】B
[解析]GeoHash算法通过将地理位置编码为字符串,便于快速检索和比较地理位置数据。
11.【答案】D
[解析]Excel不适合存储大量的结构化或半结构化数据,而MySQL、PostgreSQL和MongoDB都是常用的数据库系统,适用于存储POI数据。
12.【答案】C
[解析]R树索引结构专为空间数据设计,支持高效的范围查询。B+树、哈希表和红黑树虽然也是常用的索引结构,但它们不专门针对空间数据的范围查询进行优化。
13.【答案】D
[解析]POI数据的更新可能涉及增加新的POI、删除过时的POI以及修改现有POI的信息等多个方面。
14.【答案】C
[解析]协同过滤算法主要利用用户的历史行为和偏好信息来推荐相似的或相关的POI给用户。
反
思
评
价
本堂课讲解的是理论实践方面的知识,比较枯燥难懂,只有通过大量的举例来充实课堂。通过典型案例的剖析,使学生能感受、理解数据的组织与应用的思想。通过典型案例的剖析,使学生了解POI数据的组织与应用。
原创精品资源学科网独家享有版权,侵权必究!
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$