搜索引擎是指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。因特网上的信息浩瀚万千,而且毫无秩序,而搜索引擎为用户绘制了一幅一目了然的信息地图,供用户随时查阅。从广义上讲,搜索引擎是用于对网络信息资源管理和检索的一系列软件,在Internet上查找信息的工具或系统,是由计算机、软件、算法、规则等共同组成的综合体
搜索引擎的功能一般包括以下3个方面。
(1)信息搜集。每个搜索引擎都有多个蜘蛛(Spider)或机器人(Robots)这样的“页面搜索软件”在众多的网页中分布爬行,它们访问网络中公开区域的站点,并记录这些站点的网址链接,将这些网址链接带回到搜索引擎,从而创建出一个十分详细的网络目录。因为网络中的文档在不断变化,蜘蛛或机器人也不断把以前已经分类组织的目录进行更新。(www.daowen.com)
(2)信息处理。搜索引擎将蜘蛛或机器人带回的信息进行分类处理,建立搜索引擎数据库,并定时更新数据库内容。在进行信息分类处理阶段,不同的搜索引擎在搜索结果的数量和质量上存在明显差异。有一些搜索引擎把“网页搜索软件”发往每一个站点,记录下每一页上的所有文本内容,并收入数据库中,从而形成全文搜索引擎。这种搜索方式方便、简捷,并容易获得所有相关信息,但搜索到的信息过于庞杂,用户需要逐一浏览并甄别出所需信息。有些搜索引擎则是基于多个搜索引擎结果并对之整合处理的二次搜索方式,从而形成元搜索引擎,它引导全文搜索引擎进一步改善。不同的搜索引擎,数据库大小也不相同,但重要的是数据库的内容必须经常更新、重建,以保持与信息世界的同步发展。
(3)信息查询。每个搜索引擎都必须向用户提供一个良好的信息查询界面,一般包括分类目录和关键词两种信息查询方式。分类目录查询是以资源结构为线索,将网上的信息资源按内容进行层次分类,使用户能依线性结构逐层逐类检索信息。关键词查询是利用建立的网络资源索引数据库向网上用户提供查询“引擎”。用户把想要查找的关键词或短语输入查询框中,单击“搜索”按钮,搜索引擎就会根据输入的关键词,在索引数据库中查找相应的词语,并进行必要的逻辑运算,最后给出查询结果。用户只要通过搜索引擎提供的链接就可以访问相关信息。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。