摘要 文章认为基于XML的Dublin Core是建设数字图书馆的一种技术趋势;Dublin Core与XML相结合有利于在网络环境下采用通用的搜索引擎等软件工具,通过多种途径检索到网上目标文献,为实现真正的数字图书馆奠定了坚实的基础。
关键词 数字图书馆 XML标准 Dublin Core
XML是基于网络环境的处理电子信息资源新技术,Dublin Core与XML相结合是现代图书馆的发展趋势。图书馆长期使用MARC格式进行书目数据的交换,但是,它仅仅适用于图书馆系统间数据交换,必须借助Z39.50协议,在网络环境中有局限性。以Internet为背景的全球性信息资源要求数据及文档实现根本性的格式化和标准化,同时还要保持灵活的自定义空间,XML恰好满足了这个要求。Dublin Core与XML相结合有利于在网络环境下采用通用的搜索引擎等软件工具,通过多种途径检索到网上目标文献,为实现真正的数字图书馆奠定了坚实的基础。
1.Dublin Core与MARC
Dublin Core是3年前国际组织Dublin Core Metadata Intiative拟定的用于标识电子资源的一种简要目录模式。它一出现就被北美、欧洲、亚洲和澳洲20多个国家认同,不仅图书馆、博物馆,不少政府机构、商业组织也正在或准备采用。它的产生,是由于制订者从传统的图书馆读者通过卡片目录查询,借到所需图书的办法得到启示:在网络上检索电子资源,也可以借助于反映这些电子资源的目录信息。于是Dublin Core的拟定者们参照图书馆卡片目录的模式,制定了15项元数据(Metadata)。
Dublin Core与MARC都是Metadata,它们所要达到的目标都是将信息资源格式化。由于产生的时代不同,造成了它们先天的区别:
(1)著录对象不同:Dublin Core是为数字化的网络信息资源而设计的,其著录对象以电子资源为主;MARC格式比较适用于著录印刷型出版物等相对固定载体的文献,随着856字段的引入,目前也可以描述电子资源。
(2)数据格式不同:Dublin Core具有15个基本著录项;MARC格式有头标区和几百个著录项。
(3)著录程度不同:Dublin Core的著录比较简洁有弹性;MARC的编目规则细致而详尽。
(4)显示形式不同:Dublin Core的著录结果可以直接在Internet上浏览,也可以保留自己的著录系统;MARC格式必须在各自的软件系统中编目,输出著录结果,不能直接应用于网络检索。
由此,Dublin Core更适合应用于数字图书馆建设,Dublin Core与XML相结合是现代图书馆的发展趋势。
2.Dublin Core与XML语言
20世纪60年代JBM推出通用标识语言GML。而后,美国国家标准局ANSI将GML规范为SGML标准。由于SGML过于复杂,不适合Web开发,在Internet广泛应用的背景下,产生了超文本标记语言HTML。HTML是初期WWW建立链接的超文本语言,具有简单易用的特点。随着Web文件的内容增多和形式多变,HTML越来越不能满足应用的需求,主要是因为HTML过于单一、缺乏灵活性。1996年11月,波士顿SGML年会上,新的数据描述语言XML可扩展标记语言公布于世;1998年2月,XML成为W3C的推荐标准。
XML具有先天的优势,它继承了SGML的可扩展性、结构性等特征。与目前我们工作中常使用的HTML语言相比,它在以下几个方面具有优越性:
(1)在XML中,用户能够根据需要自定义标识和属性,这样就能充分体现出语言的灵活性,同时也符合自然语言的特点;HTML不允许用户自定义标识和属性。
(2)在XML中,用户能够根据需要将文件结构嵌套,可以复杂到任意程度;HTML不支持深层的结构描述。
(3)在XML中,包括一个语法描述,应用程序可以对文件进行校验;HTML不提供规范文件以支持应用软件的校验。
(4)XML与HTML的功能不同:HTML用来显示数据;XML用来描述数据语义,可以由其他应用软件进行深入处理。
(5)在超级链接方面,HTML只能产生单向且固定的链接;XML可以建立多重链接。
基于XML的Dublin Core经过几年的发展,已成为一个使用相当广泛的标准,在国际上得到了广泛的应用。目前,在国内也引起了相当的重视与应用研究。数字图书馆管理的对象是多媒体信息资源,对内容进行管理是数字图书馆建设最重要的一项工作,也是整个数字图书馆实施的基石。目前,基于XML的管理模式是实现统一的、开放的管理,使内容管理不因资源对象的变化而变化,也不因系统实施的软硬件平台的不同而不同的最好工具。不仅在内容管理领域,XML在电子商务、WEB应用等诸多领域都有着广泛的前景,它几乎肯定成为下一代因特网信息管理的基本方法与基本元素。Microsoft公司公布的下一代网络操作系统也是基于XML的。
3.Dublin Core的基本模式
〈?xml version=“1.0”?〉
〈rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22—rdf—syntax—ns,’
xmlns:dc=“http://purl.org/dc/elements/1.1/”〉(www.daowen.com)
〈rdf:Description〉
〈dc:creator〉a〈/dc:creator〉
〈dc:contributor〉b〈/dc:contributor〉
〈dc:publisher〉c〈/dc:publisher〉
〈dc:subject〉d〈/dc:subject〉
〈dc:description〉e〈/dc:description)
〈dc:identifier〉f〈/dc:identifier〉
〈dc:relation〉g〈/dc:relation〉
〈dc:source〉h〈/dc:source〉
〈dc:rights〉i〈/dc:rights〉
〈dc:format〉j〈/dc:format〉
(dc:type)k〈/dc:type)
(dc:title)l〈/dc:title)
(dc:date)m〈/dc:date)
(dc:coverage)n〈/dc:coverage)
(dc:anguage)o〈/dc:language)
〈/rdf:Description)
由此可见,Dublin Core的著录结果可以直接在Internet上浏览。而我们现在所使用的MARC格式必须在各自的软件系统中编目,输出著录结果,不能直接应用于网络检索。
因此,基于XML的Dublin Core是建设数字图书馆的一种技术趋势。
参考文献:
1.http://Dublin Core.org/documents/1999/07/02/dces/
2.http://www.w3.org
3.http://Dublincore.org/documents/2002/07/31/dcmes xml/dcmes xmldtd.shtml
(原载2004年第1期)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。