阿里鱼总经理应宏:gis原理十一
来源:百度文库 编辑:中财网 时间:2024/09/19 10:00:32
§2.7 空间数据库的设计、建立和维护
空间数据库也叫地图数据库,是地理信息系统的重要组成部分。在数据获取过程中,空间数据库用于存储和管理地理信息;在数据处理、分析和数据输出阶段,它是地理信息的提供者。数据库设计的合理性关系到整个地理信息系统工程的成败。
一、空间数据库的设计:
主要介绍空间数据库设计包括的需求分析、结构设计、和数据层设计三部分。
二、空间数据库的建立和维护:
介绍空间数据库的建立过程和维护方法。
一、空间数据库的设计
数据库因不同的应用要求会有各种各样的组织形式。数据库的设计就是根据不同的应用目的和用户要求,在一个给定的应用环境中,确定最优的数据模型、处理模式、存贮结构、存取方法,建立能反映现实世界的地理实体间信息之间的联系,满足用户要求,又能被一定的DBMS接受,同时能实现系统目标并有效地存取、管理数据的数据库。简言之,数据库设计就是把现实世界中一定范围内存在着的应用数据抽象成一个数据库的具体结构的过程。
空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。主要包括需求分析、结构设计、和数据层设计三部分。
1、需求分析
需求分析是整个空间数据库设计与建立的基础,主要进行以下工作:
1)调查用户需求:了解用户特点和要求,取得设计者与用户对需求的一致看法。
2)需求数据的收集和分析:包括信息需求(信息内容、特征、需要存储的数据)、信息加工处理要求(如响应时间)、完整性与安全性要求等。
3)编制用户需求说明书:包括需求分析的目标、任务、具体需求说明、系统功能与性能、运行环境等,是需求分析的最终成果。
需求分析是一项技术性很强的工作,应该由有经验的专业技术人员完成,同时用户的积极参与也是十分重要的。
在需求分析阶段完成数据源的选择和对各种数据集的评价。
数据源的选择和对各种数据集的评价
1、数据源的选择:一个实用GIS系统的开发,通常其数据库开发的造价占整个系统造价的70%--80%,所以数据库内数据源的选择对整个系统格外重要。数据来源有地图、遥感影象、GPS数据及已有数据。
2、对各种数据集的评价:
GIS数据来源多种,质量不同,需要评价。从以下三个方面进行:
1)数据的一般评价,包括数据是否为电子版、是否为标准形式、是否可直接被GIS使用、是否为原始数据、是否可可替代数据、是否与其他数据一致(指覆盖地区、比例尺、投影方式、坐标系等);
2)数据的空间特性,包括空间特征的表示形式是否一致,如GPS点、大地控制测量点、认为划分的地理位置点等;空间地理数据的系列性,如不同地区信息的衔接、边界匹配问题等;
3)属性数据特征的评价,包括属性数据的存在性、属性数据与空间位置的匹配性、属性 数据的编码系统及属性数据的现势性等。
2、结构设计
指空间数据结构设计,结果是得到一个合理的空间数据模型,是空间数据库设计的关键。空间数据模型越能反映现实世界,在此基础上生成的应用系统就越能较好地满足用户对数据处理的要求。
空间数据库设计的实质是将地理空间实体以一定的组织形式在数据库系统中加以表达的过程,也就是地理信息系统中空间实体的模型化问题。主要过程是见图2-7-1。
1)概念设计
概念设计是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。
具体是对需求分析阶段所收集的信息和数据进行分析、整理,确定地理实体、属性及它们之间的联系,将各用户的局部视图合并成一个总的全局视图,形成独立于计算机的反映用户观点的概念模式。概念模式与具体的DBMS无关,结构稳定,能较好地反映用户的信息需求。
表示概念模型最有力的工具是E-R模型,即实体-联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点,在地理数据库设计中得到了广泛应用。(图2-7-2)
2)逻辑设计
在概念设计的基础上,按照不同的转换规则将概念模型转换为具体DBMS支持的数据模型的过程,即导出具体DBMS可处理的地理数据库的逻辑结构(或外模式),包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。导出的逻辑结构是否与概念模式一致,能否满足用户要求,还要对其功能和性能进行评价,并予以优化。
从E—R模型向关系模型转换的主要过程为:
①确定各实体的主关键字;
②确定并写出实体内部属性之间的数据关系表达式,即某一数据项决定另外的数据项;
③把经过消冗处理的数据关系表达式中的实体作为相应的主关键字
④根据②、③形成新的关系。
⑤完成转换后,进行分析、评价和优化。
3)物理设计
物理设计是指有效地将空间数据库的逻辑结构在物理存储器上实现,确定数据在介质上的物理存储结构,其结果是导出地理数据库的存储模式(内模式)。主要内容包括确定记录存储格式,选择文件存储结构,决定存取路径,分配存储空间。
物理设计的好坏将对地理数据库的性能影响很大,一个好的物理存储结构必须满足两个条件:一是地理数据占有较小的存储空间;二是对数据库的操作具有尽可能高的处理速度。在完成物理设计后,要进行性能分析和测试。
数据的物理表示分两类:数值数据和字符数据。数值数据可用十进制或二进制形式表示。通常二进制形式所占用的存贮空间较少。字符数据可以用字符串的方式表示,有时也可利用代码值的存贮代替字符串的存储。为了节约存贮空间,常常采用数据压缩技术。
物理设计在很大程度上与选用的数据库管理系统有关。设计中应根据需要,选用系统所提供的功能。
4)数据层设计
大多数GIS都将数据按逻辑类型分成不同的数据层进行组织。数据层是GIS中的一个重要概念。GIS的数据可以按照空间数据的逻辑关系或专业属性分为各种逻辑数据层或专业数据层,原理上类似于图片的叠置。例如,地形图数据可分为地貌、水系、道路、植被、控制点、居民地等诸层分别存贮。将各层叠加起来就合成了地形图的数据。在进行空间分析、数据处理、图形显示时,往往只需要若干相应图层的数据。
数据层的设计一般是按照数据的专业内容和类型进行的。数据的专业内容的类型通常是数据分层的主要依据,同时也要考虑数据之间的关系。如需考虑两类物体共享边界(道路与行政边界重合、河流与地块边界的重合)等,这些数据间的关系在数据分层设计时应体现出来。
不同类型的数据由于其应用功能相同,在分析和应用时往往会同时用到,因此在设计时应反映出这样的需求,即可将这些数据作为一层。例如,多边形的湖泊、水库,线状的河流、沟渠,点状的井、泉等,在GIS的运用中往往同时用到,因此,可作为一个数据层。
二、空间数据库的建立和维护
1、空间数据库的建立
在完成空间数据库的设计之后,就可以建立空间数据库。建立空间数据库包括三项工作,即建立数据库结构、装入数据和试运行。
1)建立空间数据库结构
利用DBMS提供的数据描述语言描述逻辑设计和物理设计的结果,得到概念模式和外模式,编写功能软件,经编译、运行后形成目标模式,建立起实际的空间数据库结构。
2)数据装入
一般由编写的数据装入程序或DBMS提供的应用程序来完成。在装入数据之前要做许多准备工作,如对数据进行整理、分类、编码及格式转换(如专题数据库装入数据时,采用多关系异构数据库的模式转换、查询转换和数据转换)等。装入的数据要确保其准确性和一致性。最好是把数据装入和调试运行结合起来,先装入少量数据,待调试运行基本稳定了,再大批量装入数据。
3)调试运行
装入数据后,要对地理数据库的实际应用程序进行运行,执行各功能模块的操作,对地理数据库系统的功能和性能进行全面测试,包括需要完成的各功能模块的功能、系统运行的稳定性、系统的响应时间、系统的安全性与完整性等。经调试运行,若基本满足要求,则可投入实际运行。
由以上不难看出,建立一个实际的空间数据库是一项十分复杂的系统工程。
2、空间数据库的维护
建立一个空间数据库是一项耗费大量人力、物力和财力的工作,都希望能应用得好,生命周期长。而要做到这一点,就必须不断地对它进行维护,即进行调整、修改和扩充。空间数据库的重组织、重构造和系统的安全性与完整性控制等,就是重要的维护方法。
1)空间数据库的重组织
指在不改变空间数据库原来的逻辑结构和物理结构的前提下,改变数据的存储位置,将数据予以重新组织和存放。因为一个空间数据库在长期的运行过程中,经常需要对数据记录进行插入、修改和删除操作,这就会降低存储效率,浪费存储空间,从而影响空间数据库系统的性能。所以,在空间数据库运行过程中,要定期地对数据库中的数据重新进行组织。DBMS一般都提供了数据库重组的应用程序。由于空间数据库重组要占用系统资源,故重组工作不能频繁进行。
2)空间数据库的重构造
指局部改变空间数据库的逻辑结构和物理结构。这是因为系统的应用环境和用户需求的改变,需要对原来的系统进行修正和扩充,有必要部分地改变原来空间数据库的逻辑结构和物理结构,从而满足新的需要。数据库重构通过改写其概念模式(逻辑模式)的内模式(存储模式)进行。具体地说,对于关系型空间数据库系统,通过重新定义或修改表结构,或定义视图来完成重构;对非关系型空间数据库系统,改写后的逻辑模式和存储模式需重新编译,形成新的目标模式,原有数据要重新装入。空间数据库的重构,对延长应用系统的使用寿命非常重要,但只能对其逻辑结构和物理结构进行局部修改和扩充,如果修改和扩充的内容太多,那就要考虑开发新的应用系统。
3)空间数据库的完整性、安全性控制
空间数据库的完整性,指数据的正确性、有效性和一致性,主要由后映象日志来完成,它是一个备份程序,当发生系统或介质故障时,利用它对数据库进行恢复。安全性指对数据的保护,主要通过权限授予、审计跟踪,以及数据的卸出和装入来实现。