第29卷第3期 2O06年06月 测绘与空间地理信息 GEOMATICS&SPATIAL lNFoRMAT|oN TECHNOLOGY V01.29.No.3 Jun.,2006 基于元数据和数据集管理的 空间数据 共享研究 牛晓琳,季 民,赵志刚 (山东科技大学地球信息科学与工程学院,山东青岛266510) 摘要:以实现地理空间数据的标准化为前提,实现数据共享及发布为目的,指出传统的基于数据集的共享模式 存在着弊端,需要建立基于元数据和数据集相结合的管理机制,同时提出了元数据库设计的思想,这对于解决数 据共享中的异地、异构存储是有借鉴意义的,该思想可以在数字山东的数据共享中得以实施和应用。 关键词:元数据;数据共享;数据集 中图分类号:P208 文献标识码:B 文章编号:1672—5867(2006)03-0019一O3 Research on Spatial Data Sharing Based on Metadata and Dataset Management NIU Xiao一]in,儿Min,ZHAO Zhi—gang (School of Geosciences and Engineering,Shandong cSience and Technology University,Qingdao 266510,China) Abstract:This paper aims at realizing the standard of spatial data.It poi.ts out that sharing data is the prerequisite and there are drawbacks in tradiitonal data sharing mode.It is necessary to set up sharing mechanism of data management on the basis of metadata nad dataset.Meanwhile,it puts forward the metadata tactics ofdata management.It is helpful to solve the dificulyt ofdata sharing in diferent structure and 哪ce.This idea Can be implemented at oiig ̄Shandong for metadata sharing. Key words:metadata;data sharing;dataeet O 引 言 了基于Web下的元数据管理模式,以及在这种模式下发 布空间数据,建立元数据索引机制,较好的解决数据共享 在数字中国乃至数字地球的建设过程中,海量空间 方面存在的问题。 数据的收集、组织、管理正成为数据生产者和用户们的最 突出问题,用户越来越紧迫地要求提供现势性强、精度 l预备知识 高、易管理和易访问的地理空间数据,需要更快、更加全 1.1元数据的定义 面和有效的方法,以便从数字地球的海量数据中快速、准 元数据,简言之就是关于数据的数据,是指地理空间 确地发现、访问、获取和使用所需的数据。然而,在我国发 相关数据集和信息资源的描述信息,它是对空间特征的 展GIS的过程中,标准化工作未得到应有的重视,给GIS 概括和抽取。元数据信息可提供空间数据集的特征资料 系统间的兼容、异地、异构、数据共享带来极大的困难,因 ,数据用户可据此来确定该数据的名称、来源、组织结构、 此在基于不同软硬件环境的信息系统问交换数据时、在 适用范围等 J。 网络环境下实现信息共享时,必须制定统一的标准。… 1.2元数据标准在国内外的研究现状 目前,山东正在建设数字化省份,其目标是实现地理 目前,国际上对空间元数据标准进行研究的组织主 空间数据的共享,最大限度地节省资源,实现全省的信息 要有3个,它们分别是欧洲标准化委员会(CEN/TC 287)、 化管理。以前传统的数据管理模式在实现空间数据共享 美国联邦地理数据委员会(FCDC)和国际标准化组织地 上存在着弊端,造成资源上的浪费,为了使空间数据能够 理信息、地球信息技术委员会(ISO/TC 211)。按照国际 重复利用,本文从实现地理信息共享的必要性出发,提出 标准化组织(tSO)地理信息元数据标准方案,元数据可以 收稿日期:2005—07—15 作者简介:牛晓琳(1982一),女,山东泰安人,山东科技大学硕士研究生,研究方向:数字城市技术,GIS开发与应用等。 维普资讯 http://www.cqvip.com
测绘与空间地理信息 分为两个层次,即核心元数据和全集元数据。 美国联邦地理数据委员会(Federal Geographic Data Committee.FGDC)1994年8月发布第一版元数据内容 标准(CSDGM),从1995年开始执行这一标准,并利用自 动索引和服务机制,为用户提供通过因特网访问其数据 库的服务。FGDC于1997年完成第二版CSDGM,并于 1998年6月认可了该标准(FGDC—STD一001—1998)。 根据最新的FGDC的用户手册,标准中定义了三类元 2006年 2数据共享的管理模式 2.1传统的共享模式 在传统的共享管理模式下,是以数据集为中心进行 管理的(如图2所示),元数据只是对单个数据集的说明, 用户只有通过访问数据集才能获得相应的元数据,这样 就造成了元数据与数据集的关联性好,但是元数据与元 数据之间缺乏联系,给数据共享带来困难,在一个复杂的 素: ①子集(Sections):标准中主要的章节被称为子集,其 实它也是复合元素。 ②复合元素(Compound Element):一组相关的数据 元素或者其他复合元素。 ③数据元素(Data Element):从逻辑上不可再分割的 数据项。 图1是FGDC元数据标准的各个子集的示意图。其 中1~7是主要子集,而8~1O属于次要子集,它们不能单 独存在,只能在主要子集中被引用。 主要子集(不重复使用) 图1 FGDC元数据标准中的子集 Fig.1 The sub dataset of FGDC metadata standard 通过对美国等一些国家元数据标准体系的分析,以 及对整个数字地理信息标准化理论前提的认真研究,我 们国家提出了一套基于国家空间信息基础设施关键技术 的元数据标准体系。该体系共由12个部分组成,其中标 准化内容包括标识信息、数据质量信息、数据集继承信 息、空间数据表示信息、空间参照系信息、实体和属性信 息、发行信息、以及元数据参考信息等8个方面的内容,另 外还有4个部分是标准化部分中必须引用的信息,它们为 引用信息、时间范围信息、联系信息及地址信息。。 。 元数据标准的制定是为了使数据可以有效地共享, 但是我们传统的空间元数据在数据的共享及入库管理上 存在着困难,首先是缺乏统一的空间元数据标准规范,其 次元数据信息的数据项不一致,再次元数据内部的关系 复杂,缺乏统一的管理。 数据库应用环境中,需要不同的数据库系统,对异地、异 构的数据集直接访问是很困难的,面对数据类型复杂的 地理数据,访问也是不现实的。所以要求我们必须建立 统一的元数据标准对空间数据进行管理、存储、查询、分 析等功能(如图2所示)。 图2基于数据集的管理模式 Fig.2 The management mode based on dataset 2.2基于Web的共享模式 目前随着intemet和web的迅速发展,元数据技术逐 渐成为分布式信息计算的核心技术之一,受到广泛重视。 在基于web的数据共享解决方案中,地理元数据已经成 为从一种数据描述与索引的方法扩展到包括数据发现、 数据转换、数据管理和数据使用的整个网络信息过程中 不可或缺的工具和方法之一。 基于元数据管理的数据共享首先根据行业或学科的 元数据标准,建立相应的元数据库,在该元数据库中每一 个数据集对应一个全局惟一标识,可以理解为元数据中 的一条记录对应于一个数据集,对数据集的访问是基于 对元数据记录的访问。以元数据的集中存储、集中管理 已经逐步取代以数据集为核心的传统共享模式。 基于元数据管理的数据共享模式(图3),最大限度地 发挥了元数据的优势,同时有效地利用Web service的设 计思想,有效地解决了传统共享管理方式中的异构、异地 数据库访问问题。元数据是实现数字地球中地理空间信 息共享的前提条件和基本保障。可以说,没有元数据就 没有信息的网络共享和全球共用。只有实现了信息的收 集、存储、管理、维护、发布、销售等一系列的元数据化,才 能真正实现全球信息共享,才能充分发挥数字地球的全 维普资讯 http://www.cqvip.com
第3期 牛晓琳等:基于元数据和数据集管理的空间数据共享研究 21 球信息化作用(如图3所示)。 图3基于元数据的管理模式 Fig.3 The management mode based On metadata 在建立元数据的过程中,应首先建立地学元数据库, 然后再扩展为其他学科模式的元数据,元数据不仅仅是 解决我们在处理地理空间数据共享时遇到的问题,同时 还要解决我们在其他领域存在的数据共享困难的问题。 例如,在一个企业中,每年都有大量的数据,面对这样大 量的、繁杂的数据,难以进行有效的管理,我们可以建立 数据仓库,把数据转化为有用、可信赖的信息,支持商业 决策。建立数据仓库一个重要的工作是元数据管理,元 数据就是关于数据的数据,用于建立、管理、维护和使用 数据库。元数据库保证了数据仓库数据的一致性和准确 性,为企业进行数据质量管理提供数据依据。 3元数据库的设计思想 在数字山东共享项目中,我们根据数据库建库和数 据生产的特点,系统按照数据的管理属性设计了三种空 间数据库:一是向用户提供的现势性最好的成果管理数 据库;二是被更新下来的历史数据库;三是为了实现对成 果数据在线检索而制作的信息服务数据库。成果数据库 中元数据内容主要包括基础地理数据的元数据和数据入 库元数据。 3.1成果库管理元数据 成果库管理元数据主要用于管理4D产品入库情况 的元数据信息,与成果库管理系统存放在一起,数据形式 为Access数据库中的表,该元数据表主要用于描述在 ArcSDE Geodatabase空间数据库中的数据集(FeatureData. sets)的具体含义,其含义包括以下几部分内容:4D产品类 别、比例尺、专题类别、行政区域。主要内容包括:路径、成 果库名称(即存放数据的文件夹名称)、数据类型(区分 4D产品)、比例尺、行政区划编码、行政区划名称。 3.2 山东省行政区划索引表 山东省行政区划索引表以Table的形式存放在per- sonal Geodatabase,用来记录基础数据的入库情况,主要内 容包括:新图幅号,旧图幅号,行政区划编码,行政区划名 称。当进行基础地理数据入库、检索、更新等操作时。该表 就要进行相应的记录增加、检索、删除等操作。 3.3成果索引元数据 不同比例尺的基础地理数据都有一个成果索引元数 据,在personal Geodatabase内存储为一个要素类,具体数 据结构中要包括新旧图幅分幅编号。 3.4图幅元数据文件 图幅元数据文件以XML文件的形式,存放在对应图 幅的图幅根目录下,每一个图幅对应一个XML文件,具体 元数据内容严格按照国家标准执行。 4元数据输入界面应用层范例 根据以上元数据管理的设计思想,我们可以采用AO (ArcObjects)开发技术,实现空间元数据的入库管理,由 于大部分数据生产者都是以word形式提供元数据的,为 了便于用户阅读元数据,我们提供了word形式和xml格 式相互转换的功能,在这个平台下,主要是实现元数据的 入库、查询、分析等功能。用户可以对各种数据格式的元 数据内容进行输入,(图4是以元数据入库为例),在以下 界面中,我们可以输入元数据内容,对元数据进行入库, 还可以生成xml文件,并可以转换成word文件,同时我们 将核心元数据放在Oracle中,通过ADO(ActiveX Data Ob. jects)实现对核心元数据的管理。所有的元数据都要放在 元数据库中,通过ArcIMS发布空间信息,再建立元数据索 引机制查询符合条件的数据。 图4元数据输入管理 Fig.4 The management of metadata inputting 5结语 数据共享及发布研究的重点和焦点是元数据,以元 数据管理为核心建立起来的空间数据索引机制可以利用 Web技术解决数据冗余以及空间资源的浪费,很好地解 决了资源的共享问题。最主要的问题是建立统一的共享 平台,制定相应的政策、法规规范,应当借鉴国际元数据 标准研制的经验,注意与国际标准的接轨,从标准到系 统,使元数据库设计成为现实。 (下转第3o页I 维普资讯 http://www.cqvip.com
测绘与空间地理信息 间关系随时间不断发生变化,而用户却需现实性强的地 理空间框架数据及其相应的历史数据,因此必须解决以 下4个问题。 2.1 持续更新的问题 要解决基础地理数据的持续更新首先是变化发现, 2.4 多时相数据集成问题 2006年 随着基础地理数据的13积月累,将形成丰富的时空 数据资源,它不仅反映着人类社会发展和资源环境的现 实分布,也记录了变迁状况及有关作用过程。因此,应加 快历史图件资料的数字化工作,有效地保存时序数据,开 发多时相数据产品。 其次是数据更新。对数据更新可采用1.2节中所述方案 进行,而变化区域的发现则可采用以下几种方法:一是直 接组织专业队伍在野外进行巡视(包含竣工和放样);二 是利用遥感技术,即将遥感影像与DLG进行叠加显示找 出变化区域;三是通过地图发布的形式,即将地图在Inter- net上发布,由公众确定变化区域而后反馈给数据中心,这 3 结束语 为了满足城市信息化、经济建设和社会发展对基础 地理信息资源不断增长的需求,今后将从2维地理空间框 架数据向多维、动态地理空间框架数据发展,逐步地向用 种方法能发挥全民参与共享数据的建设,但它的前提条 件是发布的地图需做安全保密处理及公众的社会责任性 强。 户提供真3维、多时态、高精度(时间精度和空间精度)的 基础地理空间数据资源;同时,组织研究多比例尺数据联 动协同更新、多尺度框架数据集成、历史数据保存和时态 数据组织、海量空间数据管理等方面的问题很有必要。 2.2 时空变化的有效记录和管理问题 时空变化记录可采用STO(Spatio—temporal Object) 参考文献: [1] 沈琳琳,陈洪亮.地理信息系统发展前沿展望[J].微型电脑 应用,1999,(6):5—7. 模型,STO认为世界是由一个时空原子(Spatio—temporal Atom)组成,时空原子为时间、空间和属性相同的均质实 体,该模型中时间维是与空间维(在此模型中为2维)垂 直的,它可表示实体在空间和属性上的变化,但没有涉及 对渐变实体(如连续的天气观测等)的表示。 2.3 数据库一致性问题 [2】唐新明,吴岚.时空数据库模型和时间地理信息系统框架 [J].遥感信息,1999,(1):11—15. [3]陈军.构建多维动态地理空间框架数据[N].中国测绘报, 2004. 由于广大用户在使用基础地理数据的过程中往往添 加了大量的属性数据或专题数据。若以批量方式提供最 新地理空间快照数据时,需要研究因用户数据规格不同 而可能产生的语义冲突、数据库模式不一致、信息转换等 问题;而以增量方式提供变化要素数据时,需要研究新要 [4] 曹学礼.宁波市大比例尺数字测绘地方标准的初探[J].测绘 标准化,2005,(4):3—5. [5]陈恒,等.宁波市l:2 000 DEM和DOM制作的研究[J].测 绘标准化,2004,(1):33—37. 【责任编辑:栾丽杰】 素与所替代要素、客户数据库一致性控制等一系列问题。 【上接第2l页) TC211/1101—1200/1141一l142.zip 参考文献: [1] 李琦,陈爱军,杨超伟.数字地球中的空间信息共享解决方案 【J].电子科技导报,1999,(5):15—16. [2]常原飞,王伟.城市基础地理信息集成的元数据平台开发[J]. 遥感学报,2003,(6):l一3. [4]姚艳敏,姜作勤,严泰来.国土资源信息核心元数据的研究 [J].测绘学报,2001,(4):2—4. 【5]国际元数据标准的发展和研究现状【EB/OL].http://www. sdinfo.net.cn/ngcc/sdinfo/prodtectddoc/mtI.htm [6] 中国可持续发展信息共享元数据标准方案[EB/OL].http:// www.sdinfo.net.cn/ngcc/ [3]ISO/TC 21l secretariat.Text for DIS 19115 Geographic informa- tion—Metadata[EB/OL].http://www.gisstandard.org.uk/ [责任编辑:栾丽杰]
因篇幅问题不能全部显示,请点此查看更多更全内容