理论教育 空间数据库技术应用-空间数据库的建立

空间数据库技术应用-空间数据库的建立

时间:2023-08-18 理论教育 版权反馈
【摘要】:在完成空间数据库的设计之后,就可以建立空间数据库。数据库的建立是一个费时间、费人力、成本高的工作,通常会耗费大量的精力。为有效地组织和管理空间数据,在建立空间数据库时,首先应根据需要建立硬件系统,以便后续数据采集和数据装入数据库系统。图4.7 空间数据库建库流程①空间数据输入/输出设备。空间数据库系统数据存储设备的选择必须满足空间数据的安全高效存储以及大容量存储。数据库的活动将参照这些信息进行。

空间数据库技术应用-空间数据库的建立

在完成空间数据库的设计之后,就可以建立空间数据库。数据库的建立是一个费时间、费人力、成本高的工作,通常会耗费大量的精力。一般要经过资料准备和预处理、数据采集、数据处理、数据库建库等阶段。每个阶段又可分若干详细步骤,具体流程如图4.7所示。

4.2.1 空间数据库的基本组成与建设方法

1. 空间数据库的基本组成

要建立空间数据库,不仅要建立数据库本身,还要准备包括相应的计算机硬件系统、操作系统、计算机网络结构、数据库管理系统、空间数据库管理系统和空间数据库管理人员等。

(1)空间数据库

空间数据库中的数据是按一定的数据模型组织描述和存储的,具有较小的冗余,较高的数据独立性和易扩展性,并可为各类用户共享。空间数据库从应用上说可分为基础地理空间数据库和专题数据库。基础地理空间数据库包括数字线划图(DLG)、数字高程模型(DEM)、数字正射影像图(DOM)以及相应的元数据(MD)。专题数据库(TD)包括土地利用数据、地籍数据、规划管理数据、道路数据等。

(2)空间数据库硬件系统

空间数据的获取、处理和存储都涉及一系列的硬件设备,包括影像数据的扫描、地图扫描、图形输出等。为有效地组织和管理空间数据,在建立空间数据库时,首先应根据需要建立硬件系统,以便后续数据采集和数据装入数据库系统

图4.7 空间数据库建库流程

①空间数据输入/输出设备。输入/输出设备配置要求能满足空间数据获取和成果输出的各种需要。主要的空间数据输入设备有大幅面扫描仪、小幅面扫描仪、高精度航摄像片扫描仪、数字像机、GPS接收机、全站仪测距仪、解析立体测图仪、数字摄影测量工作站等。空间数据获取及输入设备和技术指标见表4.4。

表4.4 主要空间数据采集及输入设备和技术指标

空间数据输出设备包括: 图形显示终端、喷墨绘图仪、笔式绘图仪、胶片记录仪、刻图机、投影仪、激光照排机、打印机、立体观测系统、数据交换设备等。主要空间数据输出设备和技术指标见表4.5。

表4.5 主要空间数据输出设备和技术指标

续表

②空间数据处理设备。空间数据种类繁多、空间数据量庞大、数据模型复杂,因此整个空间数据库系统对硬件资源提出了较高的要求,这些要求是: 有足够大的内存以存放操作系统; 有足够大的磁盘等直接存取设备存放数据; 有足够的磁带(或软盘、光盘和U盘)作数据备份; 要求系统有较高的通道能力,以提高数据传送率。系统中用来支持空间数据获取、数据处理和数据显示的数据处理设备可分为: 服务器、图形工作站和微机等。

a. 服务器。一般应提供网络管理功能、数据库服务、文件服务和输入/输出服务等,应满足速度、内存容量、磁盘容量及输入/输出能力和可靠性等。服务器可以是一台高档微机、专门的图形工作站专用服务器等,内存一般在1024M以上,硬盘存储空间在30G以上。最好采用两个以上的CPU来加快处理速度,采用电源、冗余磁盘阵列、双机热备份或容错计算机等手段来保证机器的可靠性,还可利用集群技术来进一步提高服务器的吞吐量

b. 图形工作站。图形工作站这类计算机要求有高分辨率和大尺寸的图形显示器高速CPU和硬件图形加速器、先进的内部系统总线和快速存储系统,可以满足复杂的几何图形处理。需要三维图形图像数据处理可配置三维硬件加速卡。工作站是空间数据处理的主要平台,常见的图形工作站有: 运行在UNIX环境下的SGI、SUN、IMB、HP等。

c. 微机。微机主要完成空间数据的采集工作和研究开发任务。这类计算机品种繁多。

③存储及其他设备。

a. 存储设备。空间数据库系统数据存储设备的选择必须满足空间数据的安全高效存储以及大容量存储。冗余磁盘阵列可以满足大存储量、高速度和高可靠性,是高档服务器的必选设备,双机热备份是更保险的方法。存储设备还有: CD-ROM光盘库、磁带机和CD-R刻盘机等。

b. 电源设备。系统应采用不间断电源和隔离变压器联合的方式供电。不间断电源要选用在线式,要具有与计算机通信接口以便计算机动态监测电源情况。不间断电源的相数取决于系统的容量需求,还要考虑断电后的维持时间。

c. 机房其他设备。为保证电子设备的正常运行,要求机房要配置空气调节系统,保证机房的湿度、温度、清洁度、离子浓度等指标达到国家标准。

(3)建立或配置合适的空间数据库操作系统

操作系统是在底层与计算机硬件交互的软件,管理各种应用软件间计算机资源的共享。操作系统是计算机系统中运行权限最高的软件成分,它需要基本的硬件支持中断和定时器,以便对运行程序施加控制。操作系统提供以下服务: ①硬件管理(中断处理和定时器管理); ②进程管理; ③资源分配(调度,分派); ④存储管理和访问(I/O); ⑤内存管理; ⑥文件管理; ⑦系统和用户资源的管理。

(4)数据字典

数据库除了包含应用数据外,还涉及很多非应用数据,诸如模式、子模式的内容,数据项的类型和长度,记录类型用户标示符和口令等,这些非应用数据是整个数据库系统的规范化解释机制。将这些非应用数据专门地组织起来,形成所谓的数据字典。

数据字典也叫数据目录,它是数据库设计与管理的有利工具。在数据的收集、规范化和管理等方面都要用到数据字典。虽然数据字典并非数据库所独有,但对于数据资源多、关系复杂和多用户共享的数据库来说,数据字典起着重要的作用。数据字典的主要内容是关于数据类型的登记表,给出数据的名字、定义、组成和属性。数据库的活动将参照这些信息进行。由于数据字典的内容比较复杂,显然也要对它进行严密的组织,为此也要用数据模型来予以描述。这种描述也有源形式和目标形式。包括模式表、子模式表、用户表、物理文件或区域表、内码与自然语言对照表、同义词的定义与表示等。由此看来,需要为数据字典设立一个询问机制,对数据字典中的信息进行查询、插入、修改、删除等操作,从而给数据字典赋予“数据库”的本质,即它是关于数据描述信息的一种特殊的数据库。由于数据字典中存储的主要是关于应用数据的定义数据,这种关于数据的数据是元数据(metadata),因而,作为特殊数据库的数据字典又称为元数据库,或叫做关于数据库的数据库。

(5)建立或选择合适的空间数据库管理系统

空间数据库管理系统是空间数据库的核心,是用户与操作系统之间的一层数据管理软件。现有的空间数据库管理系统一般由以下八个基本模块组成,如图4.8所示。

(6)空间数据管理员

在数据库的建立与使用过程中,数据库管理员一直是重要的组成部分,他们负责开发、管理和使用空间数据库系统。具体划分主要有: 空间数据库管理员、系统分析员、应用程序员和最终用户。空间数据库管理员负责全面地管理和控制空间数据库系统。

(7)空间数据库用户

数据库用户是数据库的最终使用者,他们通过应用系统的用户接口使用数据库。系统为不同类型的用户设计了不同类型的用户界面。空间数据库的用户可以分为三种不同类型。

①空间数据采集人员。空间数据采集人员一般是测绘专业人员,使用先前已经写好的应用程序与系统进行交互,主要完成空间数据的采集工作。常用的接口方式有菜单驱动、表格操作、图形显示编辑和报表等。

②应用程序人员。编写程序的应用程序人员一般是计算机或地理信息系统专业人员。他们根据系统提供应用开发软件接口和空间数据库管理系统提供的内部数据模型进行应用系统开发。常用的开发软件接口有数据库开发环境、空间数据引擎等。

③专业用户。与地学有关的不同专业的用户,如林业水利环保地质、土地、房产以及规划等部门,将空间信息作为基础地理信息,加上本专业的专题信息构成本部门的信息系统。通过数据挖掘工具,从不同的途径检索空间数据、知识库和专家系统构成不同的辅助决策系统。

图4.8 基础地理空间数据库

2. 选取空间数据库建设方法

空间数据来源不同,生产方法根据数据源的条件和建库区域不同而灵活选用。空间数据库建设的流程也不相同。基本原则如下:

①对于无图区域,采用基于解析测图仪的数字测图或全数字测图测制数字地形。

②对于地貌变化不大而地物变化很大的老地形图,应采用基于解析测图仪的数字测图、全数字测图或基于正射影像的地物要素采集重新测制数字地形图和地物要素层。

③对于地貌变化小而地物变化也不大的地形图,应采用地形图扫描矢量化或地形图更新的方法。

④已有新的大比例地形图时应采用缩编方法。

根据资料现状和可能获得的数据源,生产实施过程中作业方法的选择见表4.6。

表4.6 不同数据源数据建库作业方法

4.2.2 资料准备与预处理

1. 资料准备

根据空间数据库建立的需要,尽可能收集工作区范围内已取得的全部图件和资料,选用最新成果。大致包括: 各种比例尺的地形图、地质图、矿产图及其文字报告; 专题研究成果图件资料; 物探、化探和遥感成果图件和报告; 原始数据; 天然和人工重新测量的成果图件和鉴定数据; 同位素地质年龄样品分析数据资料等。

GIS的数据类型随应用领域的不同而有所差异,但与管理信息系统相比都有数据类型繁多、数据量大的特点。从数据源的种类来分,可包括以下几种:

①实测数据。如野外实地勘测、量算数据,台站的观测记录数据,遥测数据等。

②分析数据。利用物理和化学方法分析获取的数据。

③图形数据。各种类型的专题地图以及地形图的图形记录资料等。

统计调查数据。各种类型的统计报告、社会调查数据等。

⑤遥感/GPS数据。利用遥感/GPS技术获得的大量模拟或数字资料等。

资料是获取数字地形图数据的基础,对资料的分析和选择是否正确,直接影响数字地形图数据的质量。因此数字化作业前需要收集下列资料:

①最新出版的地形图、航片、卫片和影像资料;

②最新出版的中华人民共和国行政区划代码、世界各国和地区名称代码、行政区划简册、数字化区域的地名录;

③最新出版的交通资料和国家公布的交通信息;

④实测或编绘出版的最新基本比例尺地形图及有关现势资料;

⑤国家、省、县、乡公路线路名称和编码;

⑥中华人民共和国铁路路线名称代码;

⑦中华人民共和国铁路车站站名代码;

⑧全国河流名称代码;

⑨成图区域内的测量控制点成果。

2. 对建库资料的要求

数据源的质量对GIS数据库的数据质量有重大影响。不论建设何种GIS数据库,都需要保证建库基础资料的质量,包括数据内容、精度、现势性等各个方面。以土地利用数据库建设为例,建库资料应满足下述要求。

①资料内容: 选择内容详尽、完整的标准分幅图,具有标准分幅图图廓点和千米网格点控制的分乡图以及图、数统一的表格等原始资料。与外业调查同步建库的可以采用经过内部验收合格后的图件资料,土地资源调查结束后建库的必须采用经过正式验收合格后的图件资料。

②资料精度: 数据精度必须满足建库要求。新建设的大比例尺土地利用数据库往往要求开展新的土地详查,以获取高精度的土地利用数据。另外,要求图纸变形小,选择图幅控制点对原始图形进行纠正后,纠正中误差应小于0.1mm。

③资料现势性: 与数据库建设要求的时期一致。

④资料介质: 图形资料优先选择变形小的聚醋薄膜介质的,纸介质的次之,也可根据情况选用正射影像图。

⑤资料形式: 优先选择数字形式的资料,非数字的次之。

3. 资料分析

资料分析要从以下几个方面着手:

①地图资料要查明地图的出版机关、出版年代、比例尺、成图方法、精度、采用资料的来源、数学基础(包括坐标系、高程系、等高距)、各要素内容与现状的符合程度、采用的图式及特点说明等;

②航片、卫片和影像资料要查明摄影参数;

③对参考资料分析着重研究资料来源的可信度、内容的现势性和完整性,以确定这些资料的使用程度,补充或修改原图的内容;

④对补充资料分析着重研究出版机关、年代和特点及转标这些内容的方法,如政区图、交通图、水利图等现势资料;

⑤掌握成图区域的地理景观和地理特征,通过对文字、图表及样图的分析,规定一些处理原则,使作业人员掌握成图区域特点,以保证数字地形图数据模型与实地地理特点相适应及各要素层的合理表达。

4. 资料预处理

资料预处理主要包括对不同类型的资料的处理,这里主要介绍对数字化资料、非数字化资料及影像资料的预处理。

对于数字化资料、现有数据或数据库的预处理,需要根据空间数据库的设计,对现有数据库的数据项进行选择,对数据项项名、类型、字长等定义进行调整,对数据记录格式进行转换等。

对于需要进行数字化的资料,预处理工作的内容根据所选资料本身的情况而定,主要内容包括以下两个方面。

(1)数字化底图的检校

全面了解数字化区域情况及作业时应注意的事项。检查数字化底图是否符合要求。检查数字化底图与相邻图幅的接边情况; 线状要素的连续性(如道路、河流、境界的走向、命名、级别是否一致); 检查地理要素之间的关系是否正确。例如,等高线是否连续、相接,与水系的关系是否正确等。检查面状要素(如水域、植被、街区、土质、沼泽等)是否闭合,按背景要素进行闭合处理; 根据现势资料校正行政村以上地名。将图面预处理中发现的重大问题及处理意见记录在图例簿中。

(2)数字化底图的图面预处理

在数字化前,需进行必要的图面处理,如将不清晰或遗漏的图廓角点标绘清楚,为数据的精确配准奠定基础,将模糊不清的各种线状图件进行加工,以减少数字化和数据编辑处理的工作量。主要包括以下内容:

①添补不完整的线划,将模糊不清或因模拟形式的局限而中断的各种线状图形进行加工。例如,被注记符号等压盖而间断的线划,境界线以双线河、湖泊为界的部分,道路遇居民地中断部分,均以线划连接,以便作为一条连续完整的线来采集。

②标出同一条线上具有不同属性内容线段的分界点等,以便数字化时赋予不同的属性值。

③将不清晰或遗漏的图廓角点标绘清楚,以便于图幅配准。

④对图面上的各种注记标示清楚,包括图廓内外各种注记。例如,土地利用图中有文字注记、地类注记、水系注记、道路注记、地形注记和图廓注记等。

对于影像数据处理: 当原始影像资料为像片时,要进行影像扫描数字化,获取数字影像数据。在进行影像扫描数字化时,要选用经检验合格的扫描仪,必要时要对扫描仪的扫描精度和扫描影像质量等技术指标重新进行鉴定。扫描影像像元的大小应根据像片比例尺的大小确定,由影像像元大小和摄影比例尺计算出的像元地面分辨率。扫描影像的清晰度、反差、亮度以及几何精度等都应满足人工判读和量测的要求,其影像质量不得明显低于原始像片的影像质量。扫描影像数据以IBMPC非压缩tif格式(或其他标准格式)保存。影像定向包括内定向和后方交会。内定向的目的是确定扫描坐标系同像片坐标系的关系,同时解算像片主点的坐标。后方交会的目的是利用一定数量的地面控制点及其在像片上的相应像点坐标解算像片在曝光瞬间的空间位置和姿态参数。

在进行影像定向作业时,要求点的量测精度对应图面输出不超过0.1mm,要有多余量测。平差后的余差,内定向控制在一个像素内,后方交会控制在三个像素内,后方交会最好直接利用内业立体加密成果。

当原始影像资料为卫星影像时,卫星影像定向参考航空影像作业方法进行。此外,在卫星影像的空间后方交会中,由于要求解12个外方位元素,故必须有9个以上控制点,均匀分布在四周。正射影像图定向是为了确定正射影像坐标与地面坐标之间的关系。定向时,要在影像4个角各选一个定向点(一般为图廓点),要求定向点误差不得大于5m(地面坐标)。

4.2.3 数据采集

1. 数据采集原则

数据采集必须首先制定基础地理信息要素分类与编码规范和空间数据库建立作业细则。对于数字化资料,要根据数据库标准,对原数据库进行补充和转换,防止数据转换中的数据丢失和误差,并及时给予纠正。地理空间数据获取主要是矢量结构的地理空间数据获取,包括空间位置数据和属性数据的获取。

在空间数据采集时一般要遵循以下原则:

①内图廓线、方里网应由理论值生成。当内图廓线为多边形边线时,应采集内图廓线使多边形闭合。数字化图廓点的顺序为左下角点、右下角点、右上角点、左上角点。线状要素采集其中心线或定位线。有方向的线状要素将辅助要素放在数字化前进方向的右侧。线状要素被其他要素隔断时(如河流、公路遇桥梁等),应保持线状要素的连续,采集时不间断。

②线、面状要素数字化的采点密度以线、面状要素的几何形状不失真为原则,采点密度随着曲率的增大而增加,曲线不得有明显变形和折线。线状要素中的曲线段和折线段应分开采集。曲线中的平直线段应作为直线采集,不作曲线采集,但曲线与直线连接处变化应自然。如铁路、公路的直线段。

③点状要素采集符号的定位点。有方向的点状要素还应采集符号的方向点,其中第一点采集符号定位点,第二点采集符号方向点。

④面状要素采集轮廓线或范围线。所有面域多边形都必须有且仅有一个面标识点。对于面状要素,如果其边线不具备其他线状要素的特征,在没有特殊说明的情况下,其边线属性码采用由面属性决定的边线编码,作为背景的面状要素赋要素层背景面编码。面状要素被线状要素分割时,原则上作为一个多边形采集(如居民地被铁路分割、河流被桥梁分割等),被双线河或其他面状地物分割时,应根据实际情况处理为一个或多个多边形。

⑤具有多种属性的公共边,只数字化一次(如河流与境界共线、堤与水域边线共线),其他层坐标数据用拷贝生成,并各自赋相应的属性代码或图内面域强制闭合线编码。同一层中面要素的公共边不需拷贝。

⑥凡地形图上没有边线的面状要素,其边界属性编码用图内面域强制闭合线编码(如沼泽、沙漠等)。

⑦所有图幅都要接边,包括跨带接边。当接边差小于0.3mm(实地15m)时,可只移动一方接边。原图不接边的要进行合理处理,如果两边都有要素且接边误差小于1.5mm时,则两边各移一半强行接边,接边时要保持关系合理。如果只有一边有要素,则不接边。

在同一要素层中建立拓扑关系。要素层与要素层之间不建立拓扑关系。同一要素层中不同平面的空间实体不建立拓扑关系。需建立拓扑关系的要素包括: 所有面状要素、交通层中的公路、水系层中的单线河流等。

⑧当要素分类不详时,输入要素的大类码; 分类明确时,输入要素的小类码。如陡岸分类不详时,输入陡岸编码; 分类明确时,输入石质和土质陡岸编码。

2. 数据采集方法

在空间数据采集时,会根据建立数据库的需要,采用不同设备的技术,对多种来源空间数据进行编辑处理与录入。空间数据获取方法主要有四种: 利用扫描数字化地图进行空间数据自动或半自动采集; 利用遥感影像提取空间数据来建立数据库; 利用卫星定位系统和测量仪器外业数据采集; 利用空间数据编辑处理功能以人机交互方式采集空间数据同时录入必要的属性数据。

(1)数字化方式

目前,较常使用的数字化方式有手扶跟踪数字化、扫描数字化和屏幕数字化三种。表4.7从设备要求、使用要求和使用时的注意事项三个方面对三种数字化方式进行比较。

表4.7 三种常用数字化方式的比较

(2)手扶跟踪数字化

是把图形数字化成矢量数据。数字化仪输入方式,按划分好的图层和已标识的用户标识号顺序逐一数字化。具体如何操作和注意事项见相应的操作说明。

(3)扫描数字化

扫描数字化是利用扫描数字化地图进行空间数据自动或半自动采集,将扫描数字化地图(以栅格格式)作为地图图像层中的图像块进行存储,输入必要的控制点信息,进行配准和图像式样调整等处理,在地图图像层的基础上进行空间数据采集。

利用遥感影像提取空间数据来更新数据库,将遥感影像进行正射影像改正,以正射影像形式作为图像块背景进行存储,输入必要的控制点信息,进行配准和图像式样调整等处理。在遥感影像基础上进行空间数据提取。

在显示扫描数字化地图和遥感影像条件下利用地理数据编辑与处理功能以人机交互方式采集空间数据,同时录入必要的属性数据。

在扫描数字化地图和遥感影像为底图背景显示的基础上,利用点、线、面地理空间实体进行空间数据采集,采集的数据作为一个矢量数据层来存储。

原始资料采用分版地形图,若无分版地形图,可用纸质地形图来代替。通过扫描仪的CCD线阵传感器对图形进行扫描分割,生成二维阵列像元,经图像处理,图幅定向、几何校正、分块形成一幅由计算机处理的数字栅格图。通过人工或自动跟踪矢量化、空间关系建立、属性输入等获取矢量空间数据。地形图制作流程图如图4.9所示。

图4.9 地形图数字化流程图(www.daowen.com)

3. 主要空间数据的获取方法

(1)测量控制点

各级测量控制点均应采集,并作为实体点空间实体数字化。测量控制点的名称、等级、高程、比高、理论横坐标、理论纵坐标作属性输入。测量控制点名称在图上不注出时,注记编码为“O”。测量控制点与山峰同名时,注记编码赋山峰注记编码,山峰名称不单独采集。独立地物作为控制点时,分别在相应要素层中采集控制点和独立地物。作为控制点采集时,在类型中加“独立地物”说明。

(2)居民地

采集要素有街区,依比例表示的突出房屋、高层房屋、独立房屋和破坏的房屋。街区中的突出房屋、高层房屋不区分性质,统一用街区符号表示。

选取的要素有小居住区、独立房屋和窑洞。多个独立房屋构成的居民地,选择其主要位置(逻辑中心)的房屋赋地名,其他独立房屋不赋地名,有名称的居民地应采集,分散且无名称的独立房屋和窑洞可适当舍去。不依比例尺表示的独立房屋、突出房屋、小居住区及窑洞按有向点数字化。半依比例尺表示的独立房屋按线空间实体数字化。成排的窑洞按线空间实体数字化,窑洞符号在数字化前进方向的右侧。

依比例表示的独立房屋、突出房屋、高层房屋、街区按面空间实体数字化。街区式居民地采集外围轮廓线,赋街区边线属性,街区面域赋普通街区属性编码,街区中的广场空地面积大于8mm2应采集,街区边线可作为其范围线,以道路或街道为边线时,以图内面域强制闭合线使面域闭合。运动场、水域等面状要素在街区中应空出。街道或道路两侧均为街区时,街区边线不采集; 街道或道路一侧有街区另一侧没有街区时,街区边线应在有街区一侧自行封闭。街道在交通层中采集。

(3)陆地交通

采集要素有标准轨复线铁路和单线铁路(含电气化铁路和高速铁路)、窄轨铁路、铁路车站、建筑中的铁路、国道、省道、县乡公路及其他公路、建筑中的各级公路、主要街道、地铁出入口、隧道、加油站、机场、能起降飞机的公路路段。选取的要素有次要街道、大车路、乡村路、小路、山隘、桥梁、渡口。公路属性应输入编码、名称、铺面类型、技术等级、国道编号、省道编号、路面宽度和铺面宽度等。

公路编号用大写字符半角输入,县及县以下公路可不输入名称和编号,公路名称和编码依据《国家干线公路线路名称和编码》和交通图现势资料确定。

两条以上公路汇合的重复路段。只表示高级道路的名称和编码,同级道路拷贝几何数据,分别表示各自的名称和编码。

公路交叉点和属性变换点(如水泥路面和沥青路面交界点)均为公路线空间实体的分割节点,属性变换点位置应根据图上居民地和道路附属物等合理确定,一般以居民地或道路附属物作为属性变换点。

(4)境界与政区

采集的要素有已定国界、未定国界、省(含自治区、直辖市)界、地区(含地级市、自治州、盟)界、县(含自治县、旗、自治旗、县级市)界、特别行政区界; 县(含自治县、旗、自治旗、县级市)政区、特别行政区; 界碑、界桩、界标。各级境界按连续的线空间实体数字化,一般应组成封闭的多边形。对延伸到海部的境界线,拷贝海岸线数据使面域闭合,赋图内面域强制闭合线属性,延伸到图廓线的境界,以图廓强制闭合线闭合。若境界在海湾或河流入海口中部,汇合点应选择海岸线与境界线最接近之处,海岸线与境界线之间加图内面域强制闭合线,使其闭合。穿过海岸线延伸到海部的境界,作为线空间实体数字化,不必形成封闭面域。海洋中的分段国界,按图上的线段位置中心线数字化,不必形成封闭面域。境界以单线河、道路等线状地物为界时,拷贝相应线状地物坐标数据,赋相应境界代码。境界以河流中心线、主航道线或共有河为界时,按图形(或影像)中心线或主航道数字化,地图上沿河流两侧跳绘的境界不再数字化,并在境界类型说明中输入“中心线”、“主航道”或“共有河”。

(5)植被

选取的要素有植被: 选取图上面积大于1cm2的套色植被。植被只输入类型属性。植被用航测方法更新边界,根据航片和地形图判定属性,新增加植被属性判读不清时,输入森林属性。地类界作为植被面域的分界线数字化时,必须赋地类界属性。植被范围线与地类界相交处均应作为节点,被其他线状地物(如河流、公路、铁路等)所取代的地类界,应从相应层拷贝其坐标到植被层,赋图内面域强制闭合线属性。植被面域不闭合的地方,应根据地类界(或其他线状地物)的延伸方向将其闭合。

4.2.4 数据处理

空间数据处理主要包括对空间数据的编辑与处理、拓扑编辑与处理、坐标变换、图幅拼接处理、图形投影变换、图形的几何纠正及属性数据的录入。

空间数据编辑内容主要包括扫描影像图数据的编辑处理,包括彩色校正、几何纠正等; 空间数据的精度检查、影像图数据的匹配、节点平差、图幅拼接、拐点匹配、行政界编辑、权属编辑、地类界编辑、数据的几何校正、投影变换、接边处理和要素分层等; 属性数据的记录完整性和正确性检查与修改等; 在数据编辑处理阶段,应该建立和完善图形数据与属性数据之间的对应连接关系。

1. 数据编辑与处理

分幅数字化完成后,作业员对完成的图幅进行检查,发现错误及时编辑改正。图形要素和注记中可能存在的错误类型主要有:

①线要素遗漏、采集不完整或重复。不完整的表现包括线要素未闭合到边界或者有间断。改正方法是补充采集遗漏的线要素、填补不完整的线划、删除重复的线划或者重复的部分。

②线要素的位置不正确。产生的原因可能是拷贝错了附近的一条线,或者手工绘。

③线要素的要素代码不正确。改为正确的要素代码。

④变形。采用扫描数字化或手扶数字化时,图纸变形会导致数据误差。应采用控制点纠正变形。

⑤注记遗漏、重复或参照比例尺不正确。

⑥注记的要素代码不正确。改为正确的要素代码。

⑦注记的字体、大小、颜色和间距不正确。我们使用自编程序根据要素代码自动纠正。

无论采用哪种数字化方式,上述错误都不可能完全避免。因此,数据检查与错误改正是非常必要的。上述错误的检查方法为:

①在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误。

②把数字化的结果绘图输出在透明材料上,然后与原图叠加以便发现错漏。

③使用不同符号区分要素代码不同的线要素,以检查线要素的要素代码赋值是否正确。

④对于等高线,依据等高距关系,编制软件来检查高程的赋值是否正确。

⑤对于面状要素,使用拓扑检查工具来检查其是否闭合。

⑥对于注记要素,检查其参照比例尺是否正确,或者观察它在设定的比例尺下是否有正确的字体大小。

⑦注记要素的要素代码检查,通过关闭所有其他要素代码值的注记来发现错误。因为注记的属性决定了它的显示特征,其显示特征不能随意调整,因此只能逐个注记类进行检查。

2. 拓扑编辑与处理

在空间数据库中空间拓扑关系的核心是建立点(或称节点)、线(或称弧段)、面(或称多边形)的关联关系,这里归结为点、线拓扑关系的自动建立和多边形拓扑关系的自动建立。如何根据原始地理空间数据正确、自动、快速地建立地理实体之间的拓扑关系,是空间数据库管理系统的重要功能之一。所获取的点、线、面地理实体数据的空间关系建立,可采用手工编辑和自动生成两种方法。复杂的空间关系,一般采用人工输入方法; 在二维平面上简单的点-线、线-面拓扑关系可以基于数学算法由计算机自动生成。

矢量化后的各图层,利用GIS软件提供的功能建立拓扑关系,在建立拓扑关系时会发现图形数据错误,要进行编辑、修改,再重新建立拓扑关系,这一过程可能要做多次,直到数据正确为止。

(1)拓扑检查与编辑

空间客体除具有位置、形状等图形特征外,还有重要的空间关系特点,必须使用软件功能对空间对象的拓扑特征进行检查,消除不合理的悬挂弧段,对多边形边界进行闭合处理。以土地利用图为例,行政区划、权属区、图斑界线应该完全闭合,没有欠头或出头的悬挂弧段。Arc GIS集成了拓扑功能,可以在建立拓扑的基础上,验证拓扑关系并标出所有拓扑错误。在Arc Catalog环境下建立拓扑,在Arc Map环境下显示并纠正拓扑错误。除线状地物外,行政区划、权属区、图斑界线都不允许有悬挂弧段。隐藏线状地物之后,显示出的其他拓扑错误必须全部纠正。Arc/Info等其他软件也能进行拓扑关系的检查和处理。

(2)多边形生成

地图数字化过程中通常不直接生成多边形,而是采集多边形的边界线,生成要素层。在拓扑检查并闭合多边形边界线的基础上,可以使用软件功能由边界线生成多边形。Arc GIS可以方便地使用已有的线要素类,生成新的多边形要素类。土地利用数据库建设中,多边形生成应在完成拓扑检查和数据分层(线状地物应分离出去)之后进行。每个多边形要素层可以使用若干个线要素层来创建。例如,如果行政区划、权属区和图斑界线三个要素类单独存在,生成图斑多边形要素类时应该使用这三个线要素类来生成。线状地物、图廓外线要素不参与多边形生成,应事先分离出去。生成多边形之前,应事先进行拓扑处理,纠正所有拓扑错误,以保证生成多边形的质量。通过拓扑编辑处理,消除所有不合理的出头或欠头的悬挂弧段,使多边形严格闭合,然后生成多边形。

多边形生成的技术要点是:

①设置编辑环境,显示所有悬挂弧段。

②删除所有弧段出头造成的悬挂弧段。

③延伸所有短的弧段欠头造成的悬挂弧段,使其闭合到其他边线。

④使用拓扑处理命令建立多边形。

(3)点—线拓扑关系生成

点—线拓扑关系是最常用的要素拓扑关系,如道路网络拓扑关系,也是建立线-多边形关系的基础。建立点-线关系常见的方法是节点匹配算法。首先根据地理空间数据的精度选择合适的匹配限差(如0.1m),计算机自动把满足匹配限差的线段首末点归结为一点,然后建立点与线段的拓扑关系。

(4)线—多边形拓扑关系生成

多边形是地理空间数据中的基本图形类型,常用来描述面状分布的地理要素。平面上一条不相交的有向封闭线所形成的图形为多边形,该线即为多边形的边界。按左手法则,若边界的前进方向左侧为多边形区域,则该方向为多边形边界的正向。如果线的采集方向与多边形边界的正向一致,线段方向记为正,反之记为负。一般情况下,一条线分别为两个不同多边形的边界,在这个多边形中为正,在另外一个多边形中肯定为负。多边形自动生成是空间数据组织管理的重要功能。多边形生成的基本思想是: 从点与线段的拓扑关系中的第一节点对应的第一线段开始,沿逆时针方向搜索它所对应的多边形,通过对该线段下一节点所对应的其他线段的计算方位角的判断,确定该多边形的下一后继线段; 再以该后继线段的下一节点判断其后继线段,直到回到起始节点。然后跳转点与线段的拓扑关系中的第一节点所对应的下一线段,重新开始搜索另一多边形,直到第一节点所对应的线段全部搜索完毕。在转入点与线段的拓扑关系中的下一个节点,按上述规则重新开始,直到生成了完整而不重复的线-多边形拓扑关系。

(5)拓扑关系检查

由于空间位置数据采集误差和匹配失误(匹配限差选择不当),出现部分线段的首末点与其他线段无邻接关系,导致某些多边形不封闭。这些误差最有效的检查手段是图形可视化。“连通性搜索”可完成拓扑连接的初步或概略检查; “显示节点的度”可完成拓扑连接的精确检查; “指定点”、“搜索最短路”可计算任意两点间最短路径,用以对照图形进行检查。利用可视化方法检查空间拓扑关系。

通过拓扑检查或其他检查方式发现的问题,要对相应的图形进行编辑和修改,修改后的图形必须重新进行拓扑。对拓扑的结果还需进行再次细致检查,此过程要反复多次,直至基本无问题。另外还要通过图形编辑,如加内点、移内点等操作对照底图图像做进一步修饰,使图形达到既有精度又尽量美观的效果。

3. 坐标变换

纠正地图在进行数字化时产生的整体变形,或者要把数字化仪坐标、扫描影像坐标变换到投影坐标系,或两种不同的投影坐标系之间进行变换时,需要进行相应的坐标系统变换,这个过程统称为坐标几何变换。

坐标变换包括数字化仪坐标和扫描影像的坐标与大地坐标的变换,以及两个不同的大地坐标系的变换。

(1)相似变换

相似变换主要解决两个坐标系之间的变换,如数字化仪坐标到投影坐标之间的变换。例如设XOY为新的平面直角坐标系如地面大地坐标系,xo'y为旧的平面直角坐标系如数字化仪坐标系,两个坐标系之间的夹角为,xo'y相对于XOY坐标系的平移距离为A0,B0,两坐标系之间坐标的比例因子为m,则根据坐标变换原理,可写出变换公式为:

则上式可简化为:

X=A0+A1x-B1y

Y=B0+B1x+A1y (4-2)

计算这种变换,至少需要对应的坐标系的两个对应控制点,计算四个变换参数。

(2)仿射变换

如果坐标在X,Y方向上的比例因子不一致,如图纸存在仿射变形,此时需要采用仿射变换公式。令m1和m2分别表示X和Y方向的比例尺,则变换公式为:

X=m1(xcosα-ysinα) +A0

Y=m2(xsinα+ycosα) +B0 (4-3)

则上式简化为

X=A0+A1x+A2y

Y=B0+B1x+B2y (4-4)

在数字化仪定向和扫描地图定向中,一般总是多于两个或三个定向点,以便提高定向精度和发现定向点的误差。因此计算这种变换,至少需要对应坐标系的三个对应控制点,计算六个变换参数。

4. 图幅接边处理

在数字化地图时,有时由于图幅较大,或者使用的是小型的数字化仪,就需要分幅进行数字化操作。在GIS的应用中,在数字化输入后,为了建立无缝图层,就需要将分幅的数字化地图进行合并,以保持图面数据空间连续。数据接边就是把被相邻图幅分割开的同一图形对象不同部分拼接成一个逻辑上完整的对象。

由于图幅的拼接总是在相邻两图幅之间进行的。要将相邻两图幅之间的数据集中起来,就要求相同实体间的线段或弧段的坐标数据相互衔接,在图形接边的同时要注意保持与属性数据的一致性,图幅接边处理主要有以下四个步骤:

(1)逻辑一致性的处理

由于人工操作的失误,两个相邻的图幅的空间数据库在结合处可能出现当一个地物在一幅图的数据文件中具有地物编码A,而在另一幅图中的数据文件却具有地物编码B,或者同一个地物在两个数据文件中具有不同的属性,被称为逻辑裂隙。此时,必须使用交互编辑方法,使两相邻图斑的属性相同,取得逻辑一致性。

(2)识别和检索相邻图幅

将待拼接的图幅数据按图幅进行编号,编号有两位,其中十位数指示图幅的横向顺序,个位指示纵向顺序,并记录图幅的长宽标准尺寸。因此,当进行横向图幅拼接时,总是将十位数编号相同的图幅数据收集在一起; 进行纵向图幅拼接时,将个位数编号相同的图幅数据收集在一起,如图4.10所示。

其次,图幅数据的边缘匹配处理主要是针对跨越相邻图幅的弧段或弧而言的,为了减少数据容量,提高处理速度,一般只提取图幅边界2cm范围内的数据作为匹配和处理的目标。同时要求,图幅内空间实体的坐标数据已经进行过投影转换。

图4.10 图幅编号及接图范围

(3)相邻图幅边界点坐标数据的匹配

相邻图幅边界点坐标数据的匹配采用追踪拼接法。追踪拼接有四种情况,只要符合下列条件,两条线段或两条弧段即可匹配衔接; 相邻图幅边界两条线段或弧段的左右码各自相同或相反; 相邻图幅同名边界点坐标在某一允许范围内(如±0.5mm)。

匹配衔接时是以一条弧段或线段为处理单元,因此,当边界点位于两个节点之间时,需分别取出相关的两个节点,然后按照节点之间线段方向一致性原则进行数据的记录和存储。

(4)相同属性多边形公共边界的删除

当图幅内图形数据完成拼接后,相邻图斑会有相同的属性。因此,应将相同属性的两个或多个相邻图斑合并成一个图斑,即消除公共边界,并对共同属性进行合并。

多边形公共边界的删除,可以通过构成每一面域的线段坐标链,删去其中共同的线段,然后建立合并多边形的线段链表。对于多边形的属性表,除多边形的面积和周长需要重新计算外,其余属性保留其中之一图斑的属性即可。

图幅接边要在限差范围内进行。以土地利用分幅为例,相同比例尺之间的数据接边,限差为图面单位的1cm所代表的实地距离。不同比例尺的数据接边时需要根据不同的比例尺的接边限差来接边。不同比例尺的接边限差如表4.8所示。

表4.8 数据接边限差表

注: 引自《县(市)级土地利用数据库建设技术规范》

5. 地图投影转换

空间数据库中的数据大多来自于各种类型的地图资料,这些不同的地图资料根据成图的目的与需要的不同采用不同的地图投影,同一工作区可能利用不同比例、不同投影的图件,在拼接图层之前应先进行投影转换,使最终形成的图层均投影到一个坐标系统。另外,图幅的投影不符合规定时也需进行投影变换。例如,按国家规范要求,县(市)级土地利用数据库的数据投影方式采用3°分带的高斯投影。其中,当行政区域跨过两个以上3°带时需平移中央经线,取整得3°分带的高斯投影。如果数据源的投影方式与要求不吻合,也需要进行投影转换。通过投影变换,用共同的地理坐标系统和直角坐标系统作为参照来记录存储各种信息要素的地理位置和属性,保证同一空间数据库内的信息数据能够实现交换、配准和共享。

投影转换的方法可以采用: 正解变换、反解变换和数值变换。

(1)正解变换

通过建立一种投影变换为另一种投影的严密或近似的解析关系式,直接由一种投影的数字化坐标 x,( )y 变换到另一种投影的直角坐标(X,Y)。

(2)反解变换

即由一种投影的坐标反解出地理坐标(x,y)→(B,L),然后将地理坐标代入另一种投影的坐标公式中(B,L)→(X,Y),从而实现由一种投影的坐标到另一种投影坐标的变换(x,y)→(X,Y)。

(3)数值变换

根据两种投影在变换区内的若干同名数字化点,采用插值法、有限差分法、有限无法或待定系数法等,从而实现由一种投影的坐标到另一种投影坐标的变换。

6. 几何纠正

图形数据在进入地理数据库之前还需进行几何纠正,以纠正由纸张变形所引起的数字化数据的误差。几何纠正要以控制点的理论坐标和数字化坐标为依据来进行,最后应显示平差结果。现有的几种商业GIS软件一般都具有仿射变换/相似变换、二次变换等几何纠正功能。仿射变换是GIS数据处理中使用最多的一种几何纠正方法。它的主要特性为: 同时考虑到x和y方向上的变形,因此,纠正后的坐标数据在不同方向上的长度比将发生变化。

①由于受地形图介质及存放条件等因素的影响,使地形图的实际尺寸发生变形。

②在扫描过程中,工作人员的操作会产生一定的误差,如扫描时地形图或遥感影像没被压紧、产生斜置或扫描参数的设置等因素都会使被扫入的地形图或遥感影像产生变形,直接影响扫描质量和精度。

③遥感影像本身就存在着几何变形。

④由于所需地图图幅的投影与资料的投影不同,或需将遥感影像的中心投影或多中心投影转换为正射投影等。

⑤由于扫描时,受扫描仪幅面大小的影响,有时需将一幅地形图或遥感影像分成几块扫描,这样会使地形图或遥感影像在拼接时难以保证精度。对扫描得到的图像进行纠正,主要是建立要纠正的图像与标准的地形图或地形图的理论数值或纠正过的正射影像之间的变换关系。目前,主要的变换函数有: 双线性变换、平方变换、双平方变换、立方变换、四阶多项式变换等,具体采用哪一种,则要根据纠正图像的变形情况、所在区域的地理特征及所选点数来决定。

7. 属性数据录入

通常在数据分层和拓扑处理之后录入属性数据。对于多边形空间对象,显然只有在多边形生成之后才可能录入其属性数据。键入法和光学识别技术是属性录入的两种基本方法。键入法最常用,大多数属性数据都是手工录入的。属性数据一般采用批量录入的方式,分要素类批量录入该要素的各个实体的属性信息,然后使用关键字(如图斑编号)连接图形对象与属性记录,其作业效率相对较高。例如,对于土地利用数据库,在图斑多边形生成之后,以镇、街道办事处为单位,以外业调绘记录表为依据批量录入各个地类图斑的属性数据,然后使用关键字连接图形和属性信息。

4.2.5 空间数据库建库

以土地利用规划数据库为例,其以记录坐标的方式来表示点、线、面、体的位置及空间关系,包括了空间数据库和属性数据库,两者可通过内部唯一的标识码进行连接。具体涉及了土地利用规划数据库内容、存储方式、交换格式、土地利用规划信息的分类与代码、规划数据文件的命名规则、规划要素的分层、数据结构及元数据等方面。利用所选的GIS基础软件的数据库管理功能,将经过编辑处理的图形数据进行入库处理,建成数据库实体。数据库内容包括: 数据字典、数据索引、分层数据。其中,数字字典和数据索引是辅助数据,分层数据是主体。

建库过程可分为五个步骤:

①数据字典和数据索引的生成。数据字典是关于数据库中对相关属性字段名和字段值以及数据描述等以统一规定的形式进行定义并建立的定义数据库。建立数据字典的目的是保证数据的规范性、高效性和可维护性,方便数据管理。数据字典也叫数据目录,它是数据库设计与管理的有利工具。

数据索引是指对土地利用数据库建立的空间索引,目的是为了提高数据检索的效率。数据索引可分为分幅索引和分行政区索引,以方便对各个图幅内数据检索和对各个行政区划单元的数据检索。

②图形与属性数据库的建立。把数据装入库,在装入数据之前要做许多准备工作,如对数据进行整理、分类、编码及格式转换等。装入的数据要确保其准确性和一致性。通过入库处理,将分层数据导入到目标数据库中,根据数据库设计要求,按空间单元划分(分幅或者分行政单元)存储单元建立各个子数据库,或者将所有数据合并为一个存储单元建立无缝数据库。

③设立用户密码、规定用户使用权限。为保证数据的安全和保密,在建立数据库实体时,应当同时建立密码和设定权限,控制对数据库的读、写、修改等操作。

④软件系统与数据的融合检查。

装入数据库的数据要确保其准确性和一致性。数据入库以后,要进行严格的数据逻辑检查。如发现错误或矛盾之处,要即时记录并修改。因缺乏依据无法修改的要说明原因并提出解决方法。最好是把数据装入和调试运行结合起来,先装入少量数据,待调试运行基本确定了,再大批量装入数据。

⑤数据库系统试运行测试。装入数据后,要对空间数据库的实际应用程序进行运行,执行各功能模块的操作,对数据库系统的功能和性能进行全面测试,包括需要完成的各功能模块的功能、系统运行的稳定性、系统的响应时间、系统的安全性与完整性等。经调试运行,如果基本满足要求,则可投入实际运行。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈