理论教育 数字图书馆技术研究与应用:数据安全保障

数字图书馆技术研究与应用:数据安全保障

时间:2023-11-27 理论教育 版权反馈
【摘要】:50%以上的数据丢失是由于硬件故障或软件错误造成的,30%以上的数据丢失是由人为错误操作造成的,病毒和自然灾害造成的数据丢失不到15%。数据恢复就是将数据恢复到事故之前的状态。当系统中的数据量不大时,采用完全备份最可靠。

数字图书馆技术研究与应用:数据安全保障

2.3.9 数据的安全措施

1.容灾包括数据容灾和应用容灾两类

数据容灾是指建立一个异地的数据系统,该数据是本地生产数据的完全实时拷贝。在本地数据及整个应用系统出现灾难时,系统至少在异地保存一份可用的关键业务的数据。容灾地点选择在距离本地不小于20km的范围内,采用与本地磁盘阵列相同的配置,通过光纤以双冗余方式接入SAN网络中,实现本地关键应用数据的实时同步复制。

应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地系统相当的备份应用系统(也可以是互为备份)。后者比前者复杂得多,但一旦数据灾难发生,它可以立即接管对外数据服务,这是大型数字图书馆建设非常值得考虑的问题。

2.建立RAID备份系统

建立RAID(redundant array of independent disks)备份系统。在存储系统中,磁盘失效的潜在危险随着所使用的磁盘数的增长而线性增长,而磁盘失效将直接导致数据的不可用。因此,应采用RAID5技术来实现提供容错功能的冗余磁盘系统,以提高系统的可靠性。RAID5通过条带化存储和奇偶校验两个措施来实现其冗余和容错的目标,在数据写入时,通过在一组排列的数据上执行异或操作来计算这组数据的校验值,并同时将数据和校验值分散存储在所有成员磁盘上。当系统中的某一磁盘驱动器发生故障时,配置的热备盘就会替换掉失效磁盘,并且通过对剩余成员磁盘中的数据执行异或操作以重建失效磁盘上的数据,同时将数据恢复至热备盘中。通常RAID5最适合于事务性处理应用,如ERP、CRM、E-mail等。

所有RAID级别都仅能防止由于阵列中的某个磁盘失败而导致的数据丢失。也就是说,如果发生两个磁盘同时失效,数据将丢失。但RAID6就引进了提供两级冗余的概念,其目标是保证阵列中即使出现两个磁盘同时失效时,阵列仍然能够继续工作。目前RAID6控制器设计复杂,实现代价昂贵,主要用于要求数据绝对不能出错的场合。通过对表2-9的分析比较,依据自己的图书馆馆情,选择适合自己的备份方式。

目前市面的许多存储设备都支持RAID0、RAID1、RAID0+1、RAID5、RAID6。但真正获得广泛应用的只有RAID0+1、RAID10以及READ5。需要说明的是,有些文献把RAID0+1等同于RAID10。这里我们倾向于对这两个级别区别对待:RAID0+1对物理磁盘实现RAID1(镜像)而RAID10对虚拟磁盘实现RAID1,同样情况下,RAID0+1通常比RAID10有更好的容错能力。

表2-9 RAID备份系统

img22

RAID0+1结合了RAID1和RAID0的优点。RAID首先用两块硬盘建立镜像,做好多个镜像后,再做条带化(即RAID0)。这个阵列的数据将同时被写入两个RAID中,如果主阵列损坏,仍可继续运作,既保证了数据的安全,又提高了性能。但由于其中含有RAID1模式,所以整体磁盘利用率仍然为1/2。

3.理解备份与恢复的概念

备份就是保留一套后备系统,做到有备无患。数据备份就是保存数据的副本。数据备份的目的是为了预防事故(如自然灾害、病毒破坏和人为损坏等)造成的数据损失。

据统计,硬件故障、软件错误和人为错误操作等是数据丢失的最主要原因。50%以上的数据丢失是由于硬件故障或软件错误造成的,30%以上的数据丢失是由人为错误操作造成的,病毒和自然灾害造成的数据丢失不到15%。

数据恢复就是将数据恢复到事故之前的状态。数据恢复总是与备份相对应,实际上可以看成备份操作的逆过程。备份是恢复的前提,恢复是备份的目的,无法恢复的备份是没有意义的。

(1)数据备份有许多种划分方法。比如:

①根据备份设备与系统的相对位置可分为本地备份和远程(异地)备份。(www.daowen.com)

②根据备份介质的不同可分为磁带备份、磁盘备份和光盘备份等。

③根据备份时间的不同,可分为即时备份(立刻进行备份)和定时备份。

④根据备份的自动化程度,可分为手工备份和自动备份。自动备份包括按照备份时间计划的定时自动备份和满足备份条件的自动备份。

⑤按照备份数据的在线状态和备份的实时性,可分为冷备份(离线备份、非实时备份)和热备份(在线备份、实时备份)。

⑥根据备份对象不同,可分为文件备份和映像备份。

(2)除了上述划分方法外,还有两种重要的划分方法,下面重点介绍。

①完全备份、增量备份和差异备份

按照备份数据的具体方法,可分为完全备份(Full Backup)、增量备份(Incremental Backup)和差异备份(Differential Backup)等三种类型。具体说明如表2-10所示。

表2-10 各类备份的比较

img23

(续表)

img24

完全备份所需时间最长,但恢复时间最短,操作最方便。当系统中的数据量不大时,采用完全备份最可靠。

②增量备份只备份上一次备份后新增加的和修改过的数据。其优点很明显,由于没有重复的备份数据,既节省磁带空间,又缩短了备份时间。但是一旦发生灾难,恢复数据则比较麻烦,因而实际应用中一般不采用这种方式。

③差异备份吸收完全备份和增量备份的优点,克服其不足。无须每天都做系统完全备份,因此备份所需时间短,并节省空间;灾难恢复方便,系统管理员只需两份数据,就可以将系统完全恢复。

在构建SAN时还应结合图书馆实际情况,选择数据备份的实现方式,比如是采用局域网进行LAN备份,还是采用在SAN中进行LAN-FREE备份;是采用增量备份、差异备份还是采用完全备份都是图书馆在构建SAN前需要确定的,找出现有各自的优点和不足,结合需实现的目标,定能构建成SAN的安全、高效、稳定的系统。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈