标准体系的划分方法,例如管理标准和业务标准,国际标准、国家标准和行业标准等。其中,国际标准,例如以PDF作为归档和保存文件的国际标准格式(ISO/DIS 19005-1:2005);国家标准,例如《电子文件归档与管理规范》(GB/T 18894—2002);行业标准,例如《文书类电子文件元数据方案》(DA/T 46—2009)。中国核工、石油、航天、航空、银行、电信、电力、钢铁等重要行业的一些大中型企业也制定了一些与电子文件管理有关的企业标准,例如,中国石油天然气集团公司制定了本企业的《电子文件元数据规范》《档案数字化技术规范》《归档电子文件格式规范》等。
数字档案资源建设和服务要经历档案信息的采集、整理、加工到著录、存储、保管,再到检索、服务的整个流程,构建完备的标准体系就要贯穿整个过程,保障各个环节的工作都能做到标准化。此处重点从数字档案采集标准、管理标准、存储标准和利用服务标准四个关键方面进行论述。
10.3.2.1 数字档案信息采集标准的完善
数字档案信息采集主要涉及数字档案信息的数据格式、结构、内容和背景信息。目前,与数字档案信息采集相关的标准有数据格式标准、格式转换标准和元数据相关标准。数据格式标准是指文本、图像、音频、视频等数据内容的格式规定,主要有:PDF、PS、HTML、XTML或XML文本格式;BMP、XBM、PCX、GIF、JPEG、TIFF以及适应Internet的图像格式PNG等图像格式;MP3、DAT、MIDI、WAV、AIFF、Apple QuickTime、MS Real Video、Flic、Microsoft AVI、Microsoft ASF、RealMedia、DV、DVCam、DVCPro、DigiBeta等视频格式标准[36]。格式转换标准有《纸质档案数字化技术规范》(DA/T 31—2005)、《缩微胶片数字化技术规范》(DA/T 43—2009)。元数据相关标准有《数据字典—静态数字图像技术元数据》(NISO Z39.87:2006)、《文书类电子文件元数据方案》(DA/T 46—2009)、《信息与文献 文件管理过程文件元数据第1部分:原则》(GB/T 26163.1—2010)等。
尽管数字档案信息采集已有一些标准规范予以参考,但随着外部信息环境的不断变化和档案信息化的深入发展,还需要从以下几个方面继续完善相关标准。
(1)纸质档案内容的数字化
纸质档案内容的数字化,是进一步改变其馆藏档案结构的需要,同时更是利用网络技术和虚拟技术实现档案信息资源共享的关键性环节。现阶段,信息资源数字化的主导方式包括键盘录入和光学字符识别扫描两种。由于档案信息是海量的,因此档案信息数字化加工系统要采用高速扫描仪,快速地将档案信息数字化,并能根据档案馆和用户的要求实现进一步的信息加工,以解决纸质档案难以保存、流通和查阅的问题。这方面需要制定和完善《纸质档案数字化标准》《声像档案信息数字化标准》等。
(2)数字档案信息的收集
数字档案信息的收集主要是对其背景信息、内容信息和元数据的收集。所谓“背景信息”是指描述文件形成的背景信息,文件形成和被利用期间的功能与活动,明显影响文件的形成和维护的历史环境等。所谓“元数据”是关于数据的数据,对电子文件而言,就是与电子文件的制作形成、运转、处理存储、检索、传输和利用有关的数据。它是在上述过程中自动随机、在人的帮助下产生的,可以独立于文件之外记录、积累、保存和利用的信息。人们可以通过它来帮助记录电子文件形成时的背景信息和软件硬件环境,记录文件的结构以及形成、处理和存储、检索利用的全过程。因而它是管理和利用电子文件的工具。依靠这些数据才有可能保证电子文件的可读性和可理解性,同时确保并且证明电子文件的原始性、真实性和证据价值。可以说背景信息和元数据是电子文件不可缺少的“生命线”[37]。这方面需要制定和完善《电子文件元数据标准》《电子文件鉴定标准》《电子文件归档标准》《电子文件移交标准》等。
(3)网络档案资源的采集
网络是最主要的信息载体之一,是全球最大的信息资源库,网络信息资源是人类不可或缺的重要文化遗产,而网络档案资源也是信息时代丰富数字档案资源建设和提供公众利用的重要部分。网络档案资源的采集是对网络档案资源进行长期保存和有效利用的起点,决定着保存和利用的内容、质量和可用性。网络档案资源的采集包括采集内容的确定、网络资源版权的评价和许可、采集模式的选择、网络资源质量的考量等方面。采集内容的确定涉及网络资源的完整性、特色性和准确性,这就需要相应的网络信息格式标准;采集网络信息要受到版权法的制约,所以在采集前要采取不同的授权许可措施以避免可能引发的纠纷,这就需要相应的呈缴制度予以保障;采集模式分为自动采集、选择采集和综合采集模式,其中自动采集主要利用机器人(robot)、爬虫(crawler)等网络搜索工具来自动进行,这方面涉及一定的技术标准,选择采集主要根据网络信息的价值有选择性地收集,这方面涉及网络资源的选择标准;网络资源质量的考量涉及完整性、功能性和冗余性等指标,这就需要相应的评价标准进行参考[38]。
10.3.2.2 数字档案信息管理标准的完善
档案著录是档案信息管理和开发利用的基础性、工具性工作,它是对档案信息进行分析、加工、组织,使之转换为适合于计算机加工处理统一规范数据形式的过程,是对数字档案信息标准化的一般处理。制订档案信息著录标准,是为了建立和健全我国统一的档案检索体系,便于档案信息的检索利用。目前,该类标准主要有《档案著录规则》(DA/T 18—1999)。
在网络环境下对档案数据的前处理也需要统一的规范,当前在网络环境下档案著录的流行标准是EAD(Encoded Archival Description),即档案编码著录(或称档案置标著录)。EAD的研究开始于美国加州大学伯克利分校图书馆(The University of California,Berkeley,Library)1993年的一个研究项目,是国际标准通用标识语言SGML在档案领域的应用,是以SGML为标准建构的EAD DTD(档案置标著录文档类型定义语言)为基础的网络环境下的档案著录标准。该标准制定的目的是为了缓解档案信息资源的分散性与用户对档案信息资源利用的统一性之间的矛盾,是为实现计算机网络的联机检索而设置的著录标准[39]。
除了上述档案著录相关标准外,数字档案信息管理的相关标准还有:《档案主题标引规则》(DA/T 19—1999)、《文献叙词标引规则》(GB/T 3860—1995)、《档案分类标引规则》(GB/T 15418—1994)、《CAD电子文件光盘存储、归档与档案管理要求》(GB/T 17678—1999)、《电子文件归档与管理规范》(GB/T 18894—2002)、《基于XML的电子文件封装规范》(DA/T 48—2009)等。
要保障数字档案资源建设和管理的质量,还要继续完善数字档案信息管理标准,构建数字档案信息管理标准体系,形成对电子文件、数字档案信息资源进行管理的一整套规则。主要加强《计算机安全法规与标准》《电子文件传输标准》《数字档案信息资源真实性的维护标准》《数字档案信息安全管理标准》《数字档案馆用户及设备管理规范》等标准规范的制定和完善。只有这样,才能保障数字档案信息管理各流程的科学、合理、有序、受控,从而满足社会公众对档案信息的安全、规范利用的需求。
10.3.2.3 数字档案信息存储标准的完善
数字档案信息的存储介质主要有磁带、硬盘、光盘和缩微胶片等。与之相关的标准有:
(1)《磁性载体档案管理与保护规范》(DA/T 15—95)
该标准规范规定了磁性载体档案的定义,主要类型(如计算机磁带、软磁盘、录像带、录音带),指出了磁性载体文件的储存要求(包括储存的磁带性能要求、物理环境要求和防护技术要求等),并引用了相关标准(GB 1989—80信息处理交换用七位编码字符集在9磁道12.7mm磁带上的表示方法;GB 7309—87盒式录音磁带总技术条件;GB 7574—87信息处理—信息交换用的磁带标号和文卷结构;GB 8566—88计算机软件开发规范;GB 8567—88计算机软件产品开发文件编制指南;GB 9385—88计算机软件需求说明编制指南;GB 9386—88计算机软件测试文件编制规范;GB 9416.1—88信息处理数据交换用130mm改进调频制记录的位密度为7958磁道翻转/弧度、道密度为1.9道/毫米的双面软磁盘第一部分:尺寸、物理性能和磁性能;GB 11956—89高速复制录音磁带;GB/T 14306—93VHS盒式录像磁带;GB 14307—93录像磁带性能测量方法)。
(2)《档案缩微品制作记录格式和要求》(DA/T 29—2002)(www.daowen.com)
该标准规定了档案缩微品制作记录的定义,制作缩微品的设备名称、种类、型号以及技术状况、参数选择、调节设定等情况,以及制作缩微品的依据和技术标准(GB/T 6159.1缩微摄影技术词汇第一部分:一般术语[GB/T 6159.1—1985,neq ISO 6196-1:1980];GB/T 17292缩微摄影技术第一代银-明胶型缩微品的质量要求;DA/T 21档案缩微品保管规范)。
(3)纸质档案数字化技术规范(DA/T 31—2005)
该标准规定了纸质档案数字化的主要技术要求和存储格式要求(采用黑白二值模式扫描的图像文件,一般采用TIFF[G4]格式存储,采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储,提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式;目录建库应选择通用的数据格式,所选定的数据格式应能直接或间接通过XML文档进行数据交换),并规范性引用相关技术标准(GB/T 17235.1—1998信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南;GB/T 17235.2—1998信息技术 连续色调静态图像的数字压缩及编码第2部分:一致性测试;GB/T 18894—2002电子文件归档与管理规范)。
(4)CAD电子文件光盘存储、归档与档案管理要求第二部分:光盘信息组织结构(GB/T 17678.2—1999)
该标准规定了CAD电子文件在光盘中的组织结构,对光盘信息、类目表和著录文件进行了定义,规定了说明文件、数据字段和CAD电子文件的标准格式,并引用了相关技术标准(GB/T 1988—1989信息处理交换用七位编码字符集[eqv ISO 646:1983];GB 2312—1980信息交换用汉字编码字符集基本集;GB 13000.1—1993信息技术通用多八位编码字符集[UCS]第一部分:体系结构与基本多文种平面[idt ISO/IEC 10646.1—1993])。
(5)CAD电子文件光盘存储归档一致性测试(GB/T 17679—1999)
该标准规定了CAD电子文件光盘存储归档一致性测试的基本框架和测试方法。适用于CAD电子文件光盘存储格式的一致性测试,也适用于CAD电子文件光盘存储、归档与档案管理系统的一致性测试。本标准不涉及CAD电子文件以外的光盘存储和归档管理测试。
今后,数字档案信息存储需要加强三个方面的标准:一是格式规范,电子文件的发展对电子文件的格式、元数据的封装及其管理提出了很高的要求,而要实现档案信息的长期保存和可读就需要规范电子文件或数字档案信息的存储格式,具体可以制定《电子文件存储和压缩格式标准》《数字档案信息长期保存格式规范》等;二是存储期限,数字档案信息也将按照数字档案的价值状况进行鉴定和保存,这就需要针对电子文件的特点制定《电子文件保管期限表》;三是长期保存,长期维护电子文件作为数字信息资源的有用性,在尽可能长的时间内确保其真实性、可靠性、完整性,将会有效保障数字档案信息的长期利用,这方面可参考《开放档案信息系统参考模型(OAIS)》(ISO 14721:2002)制定《数字档案信息长期保存标准》。
10.3.2.4 数字档案信息服务标准的完善
数字档案信息服务标准主要体现在信息检索、信息开放存取、信息利用等方面,目前与之相关的标准主要有Z39.50协议和开放文档先导协议OAI。Z39.50协议是一个基于客户机/服务器的信息检索标准,它规定了一些过程和格式,支持计算机使用一种标准的、相互可理解的方式进行通信,并支持不同数据结构、内容、格式的系统之间的数据传输,实现跨平台异构系统之间的互联与数据库查询[40]。开放文档先导协议OAI是一种独立于应用的、能够扩大Web上资源共享范围、提高Web上资源共享能力的互操作协议标准,该协议标准目前已应用于图书馆、档案馆服务等领域。
数字档案信息资源建设要充分满足公众需求,除了要扩大档案服务内容和提升档案服务能力外,也要在馆舍建设、服务资源、服务质量和服务效率等方面制定和推行标准来保障其实现。
档案馆舍建筑方面,可以依据《档案馆建设标准》(建标103—2008)、《档案馆建筑设计规范》(JGJ 25—2000)、《数字档案馆建设指南》等标准规范,设置布局合理、安全节能的档案利用服务功能区,加强服务功能区的环境建设,为用户提供人性化的服务。
在服务资源方面,可以依照《中华人民共和国档案法》《各级国家档案馆开放档案办法》《各级国家档案馆馆藏档案解密和划分控制范围的暂行规定》等制定相应的鉴定标准和开放办法,如《档案网络信息检索标准》《开放档案信息系统国际标准》《档案信息提供利用标准》《档案检索系统建立标准》等,将可以向社会开放的档案及时解密开放,完善配套的开放检索工具,保证用户对数字档案资源的利用[41]。
在服务质量和服务效率等与公众满意度相关的方面,可以根据国家的相关规章制度制定《档案网络资源提供利用标准》《综合档案馆绩效评估指标体系》《数字档案馆服务效果评价指标》等,通过服务设施的改进和评价机制的激励,全面提升档案资源满足公众需求的服务质量和服务效率。
上述仅仅是对现有的档案资源建设与服务的标准进行了评析,事实上,完善面向公众需求的档案资源建设与服务的标准,还需要从如下方面着手:
第一,需要建立面向公众需求的档案资源建设与服务标准体系,形成覆盖面向公众需求、档案资源建设、档案服务三个层面的标准体系。
第二,完善现有标准的内容,实现现有标准的科学化。
第三,与本领域的国际标准、国外先进标准以及国内相关行业标准进行有效衔接,形成切实可行、具有前瞻性的标准体系。
总之,我国档案资源建设和服务的标准体系制定和推行需要建立统一的领导和组织机制,实行统一的宏观掌控和协调,使标准体系的研究和制定更加集中化,更具有连续性和系统性。可以说,只有我国档案资源建设和服务的标准体系建设实现系统化和有序化,才能在更大程度上保障我国档案资源的建设进程,才能更好地满足公众的各种需求。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。