图书、档案等文化机构的合作在世界范围内广泛地开展。合作的动机在于文化遗产分散保存在不同的文化机构,复杂的因素导致了文化引产分散保存的状态。对于用户来讲,通常他们并不明确地知道到哪种类型的文化机构或者网络系统去准确查找他们所需要的资源。用户的利用行为存在较强的路径依赖,当遇到类似问题的时候,他们会用他们最为熟悉或者最常利用的机构,即使在其他类型的机构中他们的需求会得到更好的满足。丹麦学者曾这样描述,如果用户希望查找某个机构成立的信息,在博物馆中他可能会找到重要周年庆典的奖章或锦旗;在档案馆中会找到关于该组织成立各种有价值的原始记录;在图书馆中也许能找到相关的出版物。这种描述说明,用户通常会通过不同的渠道去检索他们所需要的信息,而事实上在不同文化机构保存的各种各样的实物、图片、录音、视频资料已经比书籍等资源丰富得多。然而,用户要全面地搜索到这些信息是非常耗费时间和精力的。用户希望一种能够有效整合不同文化机构馆藏内容的服务方式。
网络环境下,用户比以往任何时候都更关注于信息内容的有效性,而并不关注信息来自哪种类型的机构。在这样的背景下,我们设计了基于馆藏内容的信息检索与知识服务模式。该模式主要由查询模块、描述模块、匹配模块、提取(输出)模块和验证模块构成。查询模块为用户提供多样的查询手段,最常用的方法是关键词检索,查询界面通常嵌入数字字段的智能联想功能,帮助用户进一步明确其查询需求。描述模块的功能是将用户的需求转变为系统可识别的特征描述,这种描述包括文本信息和图像信息的特征。匹配模块是检索的过程,将用户描述的内容特征按照一定的规则在资源库中进行查找,按照设定的测度进行匹配和排序。排序的方式非常多样化,最常用的是按照关联程度、时间、来源等。提取模块也叫输出模块,提供给用户一个结果的展示列表,供用户选择和使用。验证模块主要用于评估检索内容是否满足用户的需求。
基于馆藏内容的检索与服务模式有以下几个特点:①近似匹配寻优。在现有的技术条件下,对文本和图像信息的描述是一种近似与确定型的表达,系统会通过不断地缩小检索范围来确定匹配结果,这种结果通常比较准确。②交互性强。基于内容的检索用户的参与程度较高,用户提供检索需求,对检索结果进行评估,及时反馈对检索结果的满意程度,如果系统不能满足,用户还可以借助专业馆员,寻求进一步的帮助。(www.daowen.com)
实时高速检索。检索的速度一方面取决于技术的先进性,另一方面取决于数据库的结构化程度。经过重构的数据库能够满足高速实时检索的需求。基于馆藏内容的知识服务模式的效果主要取决于两个层次。一是图书、档案资源整合的知识化;二是人工服务的知识化。图书、档案资源整合的目的是提高单一资源的系统性、全面性和知识性。图书、档案资源整合的关键在于按照一定的主题类别将分散保存在不同馆藏系统中的相关知识单元进行虚化和重构,构建基于主题内容的知识库。通常情况下,用户可以通过系统进行自主式的信息检索与利用。当系统满足不了用户的需求时,则需要借助人工智能,充分发挥图书、档案馆员的参考咨询服务。在基于内容的检索与知识服务模式下,用户所获取的信息形式不再是条目式,而是经过系统整合的知识集合,这是从信息服务向知识服务过渡的一个重大飞跃。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。