(一)地方文献资源数字化的意义
1.更好地保存特色地方文献
地方文献资料中有很多老报纸、老照片、老家谱、民间散件(如契约、戏单、书信等)等较为珍贵的特色资料。这些资料相对于普通书刊在使用和保存上更为复杂,需要更好的保存条件和保护技术。这些资料数字化以后,可以长久保存,方便利用和开发,减少对文献的搬移和翻动,降低珍贵地方文献资料的破损和遗失的可能性,从而对文献起到更好的保护作用。
2.更好地发挥其利用价值
将地方文献资料数字化后,地方文献的内容及其相关属性具备了可检索性,读者可以按照书名、作者、年代等多维度对地方文献进行查找,甚至还可以根据文献中的某些字词进行精准查找,为读者利用地方文献提供了极大的方便。同时,数字化的地方文献资源可以放到网络上,以便更多读者使用,能更好地发挥地方文献资料的利用价值。
3.更好地丰富馆藏数字资源
地方文献资源数字化后,数据可以进一步制作成地方文献特色数字资源库,极大地丰富、完善馆藏数字资源。目前图书馆的数字资源通常由外购的数字资源和自建的特色数字资源组成,外购的数字资源对各家图书馆而言都是千篇一律,真正反映图书馆数字资源特点的一定是图书馆独特的特色数字资源库。因此,地方文献数字化能大力提升图书馆数字资源的结构和影响力,对各图书馆构建特色鲜明的数字资源体系具有重要意义。
(二)地方文献资源数字化的主要方式
地方文献资源数字化成果一般都是以地方文献数据库方式呈现,按照数据库表现方式及内容的不同大致可分为书目数据库、专题全文数据库、专题多媒体数据库。
1.书目数据库
书目数据库主要提供地方文献的题名、作者、出处等基本书目信息。书目数据库又分为文摘索引数据库和文献目录数据库。
文摘索引数据库主要是简单记录某一时期发表的相关文章,供读者检索和查询。它提供文献确定的来源信息,但一般不提供原始文献的馆藏信息。(www.daowen.com)
文献目录数据库除了记录文献题名、作者、出处等外表特征的描述信息外,还有许多管理信息、馆藏信息等附加信息,数据内容相对比较详细。
2.专题全文数据库
专题全文数据库即收录有某一专题的原始文献全文的数据库,由于直接提供全文,因此深受读者喜爱。目前地方文献数字化全文数据库的比例较大,是主流的建设方式。专题全文数据库,根据全文的数据格式又可以分为图像型全文数据库和文本型全文数据库。
(1)图像型全文数据库
主要是指将文献正文扫描为图像文件,经过格式转换处理后,通常以PDF文件提供给读者浏览访问,同时将文献的书目信息进行元数据著录,为读者提供字段检索。图像型全文数据库建设相对简单,建设周期较短,而且保持了原文原貌,是当前比较受欢迎的地方文献数据库建设模式。图像型全文数据库的主要缺点是不能进行全文信息检索,即无法进行字、词、句、段的检索,只能通过元数据描述的信息进行相应检索。
(2)文本型全文数据库
主要是指文献正文不仅仅是扫描的图像文件,而且经过光学字符识别(Optical Character Recognition,OCR)转换或者专门组织人员录入,使文献正文转换为可编辑、可检索的文本数据。因此,该种方式的数据库建设成本高、周期长,但是具有强大的检索功能,主要表现在它能提供丰富的检索点,允许读者从多个角度进行单项检索或多项组配检索,甚至可对文本中任意句、段、节、章进行检索。此外还具有布尔逻辑检索、字符的位置检索、截词检索等功能。文本型全文数据库还具有一定的信息分析、计量功能,可对文本中的关键词等进行频率统计并排序。
3.多媒体数据库
地方文献资源种类繁多,既有图书、杂志、报纸等纸质文献,也有照片、影片、图片、唱片、契约等相关实物。对于后者的数字化通常会以多媒体数据库的方式进行呈现。多媒体数据库是指包括文本、图片、声音和图像等多种媒体形式的数据库。由于媒体形式多样性,多媒体数据库中数据的组织、存储以及查询设计较之文本类型数据库更复杂一些。
地方文献的多媒体数据库多以地方戏曲、老照片、契约文书等为主要内容,涉及音频、视频、图片等不同形式资源的数字化,相对于全文数据库建设难度更大,但是由于其表现力强,更易吸引读者,加之软硬件系统的快速发展,多媒体数据库建设也正逐渐成为不少图书馆地方文献数字化的选择。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。