旅游搜索引擎既是一种信息产品,又是一种信息服务。作为信息产品,旅游搜索引擎的主要功能是根据用户的提问从网上查找信息,满足用户的信息需求。从这个角度出发,旅游搜索引擎的性能表现为它满足用户信息需求的程度,基本上等同于其检索效率。除这些直接表征旅游搜索引擎检索性能的指标外,数据库范围、索引方式、匹配算法、排序机制等因素也决定了检索性能的高低,因而可以作为影响旅游搜索引擎检索性能的间接指标。作为信息服务商,旅游搜索引擎的服务性能主要表现在服务速度快、用户使用方便、提供多种服务形式供用户选择等方面,具体而言包括界面的友好性、检索方式的多样性、对用户提问的响应速度、系统的稳定性等指标。
1.衡量检索结果质量的指标
除了查全率和查准率这两个指标外,其他衡量旅游搜索引擎检索结果质量的指标还包括:结果重复率——指旅游搜索引擎返回的检索结果有多少结果与其他结果重复,是衡量旅游搜索引擎对检索结果去重能力的指标;结果新颖性——指旅游搜索引擎返回的检索结果是否是最新的网页;链接可访问率——指旅游搜索引擎返回的检索结果中有多少因为死链接或指向收费的网页数量;页面无法访问——指链接的有效性与索引数据库的质量有着直接的关系。如果在检索结果中发现大量的死链接,说明巡视软件未能及时更新数据库的内容,剔除已经不存在的文件。而收费网页虽然不是死链接,但对普通用户而言也是无法访问的。
2.衡量服务质量的指标
衡量旅游搜索引擎服务质量的指标可以从旅游搜索引擎系统与用户交互的角度概括为三个方面:
界面的友好性和“帮助”是否完备。用户对旅游搜索引擎的第一印象来自旅游搜索引擎的界面,界面友好能使用户很快地适应系统的操作方式,完备的帮助信息将帮助用户更好地使用旅游搜索引擎提供的各种服务,最大限度地发挥旅游搜索引擎的检索效能。用户与旅游搜索引擎的第一次真正交互来自用户输入检索提问。这时,旅游搜索引擎应该提供的服务是帮助用户以最方便的方式尽可能充分地表达检索需求,因此衡量这方面服务质量的指标有是否支持多种检索方式、是否同时支持简单查询和高级查询、是否允许用户以自然语言提问、是否支持用户以母语(或多语种)提问(包括是否支持中文多内码处理)、是否支持Web信息以外的信息检索(如FTP信息)、是否支持对多媒体信息的检索等等。(www.daowen.com)
返回检索结果。旅游搜索引擎应提供的服务是首先尽可能迅速地进行检索并将结果返回给用户,提供多种结果显示方式供用户选择,还应该允许用户对检索结果进行处理。相应的衡量指标有响应时间,指用户向系统递交查询请求和收到检索结果之间的这一段时间,包括系统的检索时间和网络传输时间。由于网络的特征,时间长了网络系统会自动停止搜索,造成链接不上的局面,因此系统开发者应该特别重视系统响应时间问题。检索结果显示方式的多样性与可选性,包括是否允许用户自定义显示检索结果的数目,是否显示检索用时,是否显示结果总数,是否显示结果最近更新日期,是否集中来自同一站点的结果,检索结果是否显示网页标题、URL、关键词和摘要,是否提供检索结果的相关性排序等。
对检索结果的处理能力,包括是否支持进阶检索(Refine Query),是否支持相似检索(More Like This)以及是否允许用户对检索结果集进行二次检索等。
3.影响检索质量的指标
影响旅游搜索引擎检索质量的主要因素在于索引器和查询器的功能。考查索引器的设计可以从索引数据库规模的大小、标引方式(是自动标引还是手工标引或是用户登录)、标引深度(是进行全文标引还是只对标题或首段进行标引)、标引准确率(特别是对中文网页能否自动分词以及自动分词的正确率)、索引数据库更新频率(直接决定死链接率和新颖率)等多个角度进行。影响查询器功能的主要因素是它采用的匹配和排序算法。此外,是否支持相关性反馈也是影响旅游搜索引擎检索质量的因素之一。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。