电子文件的长期保存,是指旨在保障电子文件可在所需时间段里被持续访问的一系列必要的管理工作,长期保存是电子文件保管工作的核心和关键。
(一)影响电子文件长期保存的因素
1.软硬件易过时
信息技术硬件设备和软件产品多以2-5年的周期更新换代,因此电子文件的生成、读取、存储、检索手段变更迅速。需要对技术变革可能产生的各种冲击进行评估预测,甚至在文件创建之前就通过各种措施来缓解软硬件过时导致的不利影响。
2.载体脆弱
传统的档案载体,从甲骨金石到简帛纸张,在保存环境适当的情况下都能做到长久保存,以至于有“纸寿千年”的说法。但新型载体在设计和生产时并未对其持久性做充分考虑,其保存寿命都远远短于纸张,同时载体本身对其生产原材料、设备、软件、驱动程序的依赖,导致所保存的电子文件无法读取。
3.电子文件的类型复杂
电子文件类型的丰富与复杂在一定程度上增加了其保存的难度。由于类型不同,保存的技术方法可能存在巨大差异,尤其涉及到技术更新时更是如此,如数据库、GIS信息、三维设计图等复杂类型的文件。
(二)电子文件保存的基本要求
电子文件保存的基本要求要服从于电子文件管理的基本目标,即保证电子文件的真实、完整、可靠、可用。具体而言,基本要求包括:
1.载体有效性
载体有效性是电子文件保存的最基本要求,要求保证电子文件载体的足够安全,因此需要对载体的物理特性、技术规格、使用方法和保护措施等有详细的了解与掌握,以便于进行有效维护。然而由于电子文件载体的寿命有限,且升级换代频率加快,需要采用适当的技术方法保护文件载体的有效性,如必要的更新和迁移操作等。
2.信息可用性
可用性是指电子文件能够通过现有的软硬件技术,以人可以接受的方式展示相关信息。可用性要求电子文件保存系统能够对所保存的二进制内容进行转换, 并准确地恢复原貌,以人们能够直观理解与习惯阅读的格式进行还原显示,如显示在屏幕上的文本与图像,或是通过计算机播放的声音或视频等。
电子文件可用性并不强求用其原始的生成环境来再现,事实上经过一定时期保存的电子文件,其原始的软硬件环境大多已不存在。一般来说,能够通过其他第三方工具实现信息再现,即使其呈现形式与原始形式有所差异,只要该差异不影响对文件信息真实性的判断都是可以接受的。
3.信息可理解性
可理解性是指电子文件的信息能够按照其本身的意图被正确理解。它是信息可用性的深化要求,是语义层面上的要求。只有那些能被人理解并且表达正确的文件才能够提供利用,然而对一份具体文件的内容而言,常有不被人理解的地方,这就需要结合其关联文件、元数据描述、背景注释等信息的辅助。
4.来源真实性
电子文件长期保存不同于一般数字信息长期保存的地方就是对于真实性有很高的要求,要求电子文件始终作为业务活动的真实记录而存在。为了同时满足上述载体有效、信息有用等方面的要求,电子文件无法通过自身的不变来实现真实的目标。因此,对于长期保存过程的电子文件,其真实性要求就不再强调形式的不变,而是强调其来源的真实性和保存过程的合规性,这通常通过一系列规章制度和完整的元数据来实现。(www.daowen.com)
(三)电子文件长期保存策略
电子文件长期保存过程中,同样要采取本章上述的若干存储管理方法、信息维护关键技术。为了确保在信息系统频繁更新、升级背景下电子文件信息可被持续访问的能力,还需要有条件地选用如下策略:
1.更新
更新是在新载体上拷贝电子文件信息来替换旧载体的方法,也称载体更新。载体更新前后载体的类型并不发生变化,这是一种相对简单、成本低廉的长期保存策略。
2.迁移
迁移是随技术变化转换数据的一种处理过程,可使数据从某一硬件或软件配置向目标硬件或软件配置转换。简单地说,迁移就是不同信息格式之间的转化,很多时候还涉及整个系统配置的改变,视具体的信息类型而定。其目的在于保护数字信息的完整性,针对不断的技术进步,保留用户对数字信息的检索能力、显示能力与使用能力。迁移是电子文件长期保存的必要措施,其中格式迁移是最为普遍应用的长期保存策略。
3.仿真
仿真就是在新的系统环境下重建一个兼容原始数据、设备及其管理系统的运行环境,使得原来的数据、设备和系统能在现行的软硬件系统上运行。仿真实际上是通过模拟电子文件形成时的原始环境来保障数字信息内容的可利用性。
4.保存原始软硬件
即将产生电子文件的原始的软硬件保存下来,这种方法保全了电子文件的形成环境,看上去这是种简单而有效的方法。不过,这种方法对企业的要求比较高, 要求有专门人员和机构负责收集、维护原始技术环境。
5.采用多格式阅读软件
所谓多格式阅读软件是指一种阅读软件,能支持多种格式的输出。该种软件一般只能浏览不能编辑电子文件,符合档案管理要求,缺陷在于其能够打开的文件格式是有限的。目前不少电子文件管理系统、档案管理系统中配置有多格式阅读软件的插件。
6.格式规范化
格式规范化将电子文件的存储格式转化为标准的(规范化)的存储格式。这是档案界最为关心、使用得最为广泛的一种长期保存策略。目前,我国也颁布了档案行业标准《版式电子文件长期保存格式需求》(DA/T47-2009),标准没有指定具体可用的格式,而是以版式文件为例对如何选择格式提出了要求。
据现有标准和实践表明:电子文件长期保存格式应该是开放的、常用的、低依赖性、标准化的。所谓格式开放,即要求有公开发表的相应标准和技术规范、没有专利和许可的限制、厂商中立、有与产品无关的专家组、标准化组织和产业联盟等维护和支持该格式等。所谓常用,即存在常见的、容易为用户获得的阅读工具。常用性可能和其他几个尺度存在一定的矛盾,需要加以权衡。所谓低依赖性,即不绑定软硬件能被多种操作系统和硬件平台支持、文件的阅读不依赖于特定的阅读软件。所谓标准化,即格式经历了较为严格的正式标准化过程。
任何一种格式都存在生命周期,所以格式选择仅是电子文件长期保存中解决格式问题的第一步,对于需要长久保存电子文件的企业而言,需要开展完整的格式管理活动。包括登记、识别电子文件的格式、验证格式的合规性、风险评估、格式迁移等。
7.封装
封装是将电子文件以及有关的元数据以信息包形式保存起来的方法。封装信息包既能够保存电子文件的存储格式,以及封装本身使用的格式;也能描述电子文件保存历史及其与其他电子文件的关联,还可以通过比对元数据描述与电子文件是否相符来验证电子文件在封装时是否被修改。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。