理论教育 搜索引擎的分类与优势

搜索引擎的分类与优势

时间:2023-05-21 理论教育 版权反馈
【摘要】:虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。搜索引擎与目录索引有相互融合渗透的趋势。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。

搜索引擎的分类与优势

1.索引擎概述

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。其中,详细介绍以下几种搜索引擎。

(1)全文索引:搜索引擎分类部分提到过全文搜索引擎,即从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种:一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库;另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。随着搜索引擎索引规则发生很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。

当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。这种引擎的特点是搜全率比较高。

(2)目录索引:也称为分类检索。

目录索引是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。目录索引无须输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。

虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。

与全文搜索引擎相比,目录索引有许多不同之处。

首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。

其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功;而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。此外,在登录搜索引擎时,一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。

最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以从用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。

搜索引擎与目录索引有相互融合渗透的趋势。一些纯粹的全文搜索引擎也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而一些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如中国的搜狐新浪网易等;而另外一些则默认的是网页搜索。这种引擎的特点是准确率比较高。

(3)元搜索:元搜索引擎(METASearch Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。

2.搜索引擎工作原理

(1)第一步:爬行。

搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”,也被称为“机器人”。搜索引擎“蜘蛛”的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。

(2)第二步:抓取存储。

搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中,页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。

(3)第三步:预处理。

搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。

①提取文字;

②中文分词;

③去停止词;

④消除噪音(搜索引擎需要识别并消除这些噪声,比如版权声明文字、导航条、广告等);

⑤正向索引;

⑥倒排索引;

⑦链接关系计算;

⑧特殊文件处理。

除了HTML文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如PDF、Word、WPS、XLS、PPT、TXT文件等。我们在搜索结果中也经常会看到这些文件类型。但搜索引擎还不能处理图片、视频、Flash这类非文字内容,也不能执行脚本和程序。(www.daowen.com)

(4)第四步:排名。

用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动。但是,由于搜索引擎的数据量庞大,虽然能达到每日都有小的更新,但是一般情况搜索引擎的排名规则都是根据日、周、月阶段性不同幅度的更新。

3.搜索引擎优化

搜索引擎优化(Search Engine Optimization,SEO)是一种方式,即利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名。目的是为网站提供生态式的自我营销解决方案,让其在行业内占据领先地位,获得品牌收益。SEO包含站外SEO和站内SEO两方面。为了从搜索引擎中获得更多的免费流量,从网站结构、内容建设方案、用户互动传播、页面等角度进行合理规划,还会使搜索引擎中显示的网站相关信息对用户来说更具有吸引力。

通过SEO获取的网站流量,具有以下三个特征。

(1)用户针对性较强的流量:其他的网络推广方法造成用户本身并没有访问网站的需求;而来自搜索引擎的用户是在主动寻找网站,目标精准,转化率较高。

(2)低成本流量:与其他的网络推广方法比,SEO的成本相对来说较低,通过SEO技术,从搜索引擎中可获取源源不断的免费流量。

(3)长期稳定的流量:网站的网络广告、PPC一旦停止投放,流量就会截止;但通过正规的SEO技术,在搜索引擎上保持良好排名,网站可获得长期稳定的流量。

SEO包括站内SEO和站外SEO。

顾名思义,站内SEO是指网站内部优化,即网站本身内部的优化。站内SEO包括代码标签优化、内容优化和URL优化等。

通俗来讲,站外优化就是增加外部链接,使更多的站外网站留下自己要推广的网站链接或有效联系方式等,包括问答推广、贴吧、百科、信息平台、论坛推广、博客推广、友情链接等。

4.搜索引擎营销

搜索引擎营销(Search Engine Marketing,SEM)就是根据用户使用搜索引擎的方式,利用用户检索信息的机会尽可能将营销信息传递给目标用户。简单来说,搜索引擎营销就是基于搜索引擎平台的网络营销,利用人们对搜索引擎的依赖和使用习惯,在人们检索信息的时候将信息传递给目标用户。搜索引擎营销的基本思想是让用户发现信息,并通过点击进入网页,进一步了解所需要的信息。企业通过搜索引擎付费推广,让用户可以直接与公司客服进行交流、了解,实现交易。

搜索引擎营销的基本思想是让用户发现信息,并通过(搜索引擎)搜索点击进入网站/网页进一步了解他所需要的信息。企业通过搜索引擎付费推广,让用户主动找到企业,并点击企业的广告,最终和企业产生联系或下单。SEM的方法包括搜索引擎优化(SEO)(前面已讲过)、竞价排名、关键词广告。

竞价排名的基本特点是按点击付费,推广信息出现在搜索结果中(一一般是靠前的位置),如果没有被用户点击,则不收取推广费。在同一关键词的广告中,支付每次点击价格最高的广告排列在第一位,其他位置同样按照广告主自己设定的广告点击价格来决定广告的排名位置。

关键词广告是指显示在搜索结果页面的网站链接广告。它属于CPC(costper-click)收费制,即按点击次数收取广告费。关键词广告本质上属于网络广告的范畴,是网络广告的一种特殊形式。关键词广告具有较高的定位程度,可以提供即时的点击率效果,可以随时修改关键词,收费也比较合理,因而逐渐成为搜索引擎营销的常用形式。关键词广告可以通过网盟推广和搜索引擎展现。

点击付费广告(Pay Per Click,PPC)是大公司(如搜狐、新浪)、搜索引擎(如Google和百度),以及其他浏览量较大的网站。

5.SEO与SEM的区别和联系

(1)目的不同。

SEO主要以搜索引擎排名结果为主要目的,排名达到客户预期目标即可。它一般不会太多关注网站流量,关键词通常由客户直接提供,它只需要做到使客户满意的标准即可。而SEM的最终目的是通过网络推广宣传的方式来吸引更多的客户,最终实现销售,签约订单。广泛地讲,SEM做网站,就是在做一个网站的流量。

(2)人员的构成不同。

一个SEO公司的人员组成为:网站编辑、网站外链员、网站主管等。通常都是一人身兼多职。一个SEM公司的人员组成为:网站编辑、数据分析师、SEM化师、网站宣传人员等。分析师主要负责网站流量分析、数据的细致分析,可以更好地提高网站的用户体验等。

(3)网站更新与建设不同。

SEO与SEM在网站内容更新及外链建设方面存在很大的区别。SEO人员一般会关注内容的收录与否,外链的增长如何;而对于SEM人员,则要注重关键词质量度、创意的吸引度、点击价格、排名位置、展现方式、竞争对手分析等。

(4)网站流量来源不同。

SEO人员主要通过网站排名首页给网站带来流量,而对于一个SEM人员,其不仅需要关心来自搜索引擎目标的关键词流量,还要关心长尾关键词及其他方式的流量,如信息平台、微博平台、企业博客、QQ群推广、邮件推广等。从这种意义上来讲,SEM包含SEO,SEO是SEM中的一部分。

(5)展示的位置不同。

SEO般出现在网页的中部;而SEM一般出现在网页的上部、下部、右侧,会在搜索结果的左侧或后侧被标注为“广告”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈