元数据的互操作研究


盛小平 (湘潭工学院图书馆 湖南湘潭 41120)

    

    
〔关键词〕 元数据 互操作 资源描述框架 可扩展标记语言 数字图 书馆



   元数据(metadata)是关于数据的数据,是用于提供某种资源相关信息的结构化数据。元数据 互操作是访问互联网上信息资源的基本要求,也是数字图书馆建设和发展必须解决的关键问 题。 

1 元数据匹配 

目前数字信息资源比较常用的元数据格式有:艺术作品描述类目(Categories for the Desc ription of Works of Art,CDWA)、建筑文献基础/建筑图样咨询组格式(Foundation for Do cuments of Architecture/Architectural Drawings Advisory Group,FDA/ADAG)、美国可 视资料协会核心类目(Visual Resource Association Core Categories,VRA)、美国机读目 录格式(US Machine-Readable Cataloging format,USMARC)、都柏林核心数据(Dublin Core ,DC)、博物馆信息计算机交换标准框架(A Standards Framework for the Computer Interc hange of Museum Information,CIMI)、编码文档描述(Encoding Archival Description,EA D)、艺术与文化遗产数据输出格式(Record Export for Art and Cultural Heritage,REACH )、元内容框架(Meta Content Framework,MCF)、通用标准标记语言(Standard Generalized Markup Language,SGML)、可扩展标记语言(Extensible Markup Language,XML)、文本编码 计划标题(the Text Encoding Initiative Header,TEI Header)、统一资源特征(Uniform R esource Characteristics,URCs)等〔1〕。国外已经有人对CDWA、CIMI、FDA、VRA、 USMARC、Dublin Core、Object ID、EAD八种元数据单元进行了匹配。〔2〕 

2 元数据互操作机制 

怎样实现各种元数据单元的互操作呢?这里提出一种基于资源描述框架模式(RDF Schema)和 可扩展标记语言模式(XML Schema)相结合的元数据互操作机制。 

2.1 资源描述框架——RDF 

在W3C(World Wide Web Consortium)主持下发展起来的资源描述框架RDF(Resource Descrip tion Framework)是一种能实现元数据编码、交换和再使用的基础结构。该基础结构通过设 计一种能支持语义、语法、结构的通用惯例的机制来实现元数据的互操作。RDF并不为每个 资源描述团体(如都柏林核心DC)规定语义,而是为这些团体提供根据需要定义元数据单元的 能力。David Bearman等人认为RDF是实现元数据互操作的通用语法模型〔3〕。 

2.1.1 RDF数据对象 

RDF包含三种对象类型:资源(Resources)、属性(Properties)和声明(Statements)。所有由 RDF表达式描述的对象都是资源。一种资源可以是单个网页、单个网页中的一部分、整个网 站或不能直接通过网络访问的对象如印刷型书刊。每种资源都利用唯一资源标识符URI(Unif orm Resource Identifier)来标识;属性是用来描述一种资源的一个特定方面、特征或关系 。每种属性有特定的含义,且定义了其允许的属性值、所描述的资源类型和与其它属性的关 系;资源及其属性和属性值结合在一起就成为一个RDF声明。 

2.1.2 RDF容器 

RDF应用容器(Container)把同类的事物集中起来。RDF定义了三种类型容器对象:包(Bag)、 序列(Sequence)和交替(Alternative)。包和序列是一个字符、文字或资源的列表,包和序 列用来说明某个属性有多个属性值。包允许给定属性值之间没有次序,而序列中属性值次序 很重要。交替说明某个属性有多个可以相互替代的值。这三种容器对象非常适合于各种元数 据的语义表现。 

2.1.3 RDF规范语法 

以RDF数据模型为基础,把RDF基本语法、模式(Schemas)和容器语法组合起来,就可形成如 下一套完整的RDF规范语法〔4〕。这套RDF规范语法适应于各种元数据,不仅有助于 结合使用各种元数据来描述数字信息资源,而且有利于实现各种元数据的互操作。 

2.2 RDF和XML缝合机制 

RDF和XML是两种定义特定元数据元素集应用的模式语言。它们各有优缺点:RDF虽然提供丰 富的语义描述支持,但对本地使用约束规格只提供有限的支持;XML虽然提供明显结构、基 数和数据类型约束的支持,但是只提供很少的语义知识支持,而这种语义知识对于实现元数 据域的可扩展动态变换是十分必要的。因此,最合理的途径是利用RDF模式和XML模式的互补 性并结合使用它们实现元数据的互操作。但是在结合使用两种模式语言中会遇到两个相关问 题: 

在RDF模式和XML模式中存在一定程度的功能重叠。这体现:① 在RDF模式范围约束与XML模 式类型约束之间;②在RDF模式域约束与XML模式类型和单元的内容定义之间;③定义细目表 或限制的团体词汇过程中;④在RDF模式说明与XML模式注释之间。 

至今没有建立某种机制来有效地咬合RDF模式和XML模式。 

为解决这两个问题,本文采用的途径是RDF模式只包含语义定义,而用有关XML模式文档来表 示RDF模式中类(域)和属性值(范围)约束;同样地,XML模式有关语义责任委托给RDF模式,X ML模式只包含本地使用约束,而没有诸如注释中的语义描述和文献标识等语义定义。由于基 础语义比语法相对稳定,因此我们可以选择RDF模式为基本模式,并用特定应用XML模式指向 基本RDF模式,图1说明了这种途径的逻辑关系。下面将介绍两种方法来实现RDF模式语义和X ML模式本地约束的结合。 


图1 从多种XML模式定义到一个RDF 


共用基本库的连接 

2002年第2期(No2,2002)     盛小平:元数据的互操作 研究 把本地RDF语义埋置在XML注释中,即把本地RDF模式组、子组、 属性和子属性定义迁入XML 文档。追加这些内容到XML且不能丢失一致性的唯一方法是利用XML注释和附加信息单元。这 种途径虽然有利于在单一文档中结合语义定义和结构与语法约束,同时保持XML模式一致性 。但是,它与第二种途径相比在区分元数据单元语义与使用约束时弹性较小,而且要求:① 开发一个RDF/XML语法分析程序以解析所埋置的特定RDF定义;②应用一个可扩展传输语言( Extensible Style Transformation Language,XSLT)来摘录RDF模式定义,并组成一个独立 的能够用现有RDF语法分析程序解析的RDF文档。这个途径主要局限性是这些在XML注释中已 经清晰定义了的RDF类和属性只是本地定义,不能被其它模式反复使用,这与我们利用RDF模 式来促进元数据语义互操作是相矛盾的。因此,这个途径是不理想的。 

把外部RDF定义连接到XML模式,即利用XML连接语言(XLink)和 及其标记名控制(Xlink Mar kup Name Control)——名字空间(namespace)把远程独立文档中的RDF模式定义连接到XML模 式。根据XML的开放性,我们可用“语义”属性来扩展XML的模式类型定义,并用另一个名字 空间来说明这种“语义”属性,所得到的语义属性值就是RDF属性或者是能够定义每个简单 或复杂类型语义的类目。这种途径可通过如下例子来说明: 3 元数据互操作实例 

Jane Hunter和Carl Lagoze联合提出了一种元数据互操作通用实体——MetaNet〔5〕 。MetaNet实质上是一个元数据词典,包含能满足多数主要元数据模型/词汇/标准的规范词 、对应词(ET)、上位词(BT)和下位词(NT)。它的目标是提供语义知识,这些语义知识用来保 证计算机识别不同域元数据单元的同类和等级关系。MetaNet能够执行“WordNet”元数据检 索。例如,利用“作用者(Agent)”这个核心词,能够检索包括演员(actor)、投稿人(Contr ibutor)、演奏者(player)、行动家(doer)、工作者(worker)、表演者(performer)在内的对 应词,也能检索到包括创作者(creator)、作者(author)、作曲家(composer)、艺术家(arti st)、音乐家(musician)等在内的下位词。 

MetaNet利用Java程序把MetaNet的语义信息与执行元数据单元变换的XSLT程序连接起来,并 由Java函数“readMetaNet”来决定MetaNet词典中输出域的对应词。MetaNet元数据变换流 程如图2所示。 


图2 MetaNet元数据变换流程图 >    而描述Java函数“readMetaNet”执行元数据变换的高级算法如下: 




   


 


参考文献:
.盛小平.论元数据在数字图书馆信息组织中的应用.图书情报工作,2001(7):43~45,31 

2.A crosswalk of metadata element sets for art,architecture,and cultural heritag e information and online resources.http://www.getty.edu/research/institute/stand ards/intrometadata/3_crosswalks/index.html 

3.David Bearman.Etc.A common model to support interoperable metadata:progress re port on reconciling metadata requirements from the Dublin Core and INDECS/DOI Co mmunities.D/Lib Magazine,1999(1).http://www.dlib.org/dlib/january99/bearman/01 b earman.html 

4.Resource Description Framework (RDF)model and syntax specification:W3C recomme ndation 22 February 1999.http://www.w3.org/TR/REC-rdf-syntax/ 

5.Jane Hunter,Carl Lagoze.Combining RDF and XML Schemas to enhance interoperabil ity between metadata application profiles.http://archive.dstc.edu.au/RDU/staff/j ane-hunter/www10/paper.html 




<<上一记录 下载显示的记录 打印显示的记录 推荐给你的朋友 下一记录>>

 

 湘ICP备000012  版权所有:湖南图书馆