从Aliweb到Bing——搜索引擎领域基于技术、特性与体验的发展
武汉东湖学院传媒与艺术设计学院 徐 兴
搜索引擎是随着Web信息的迅速增加,从1995年开始逐渐发展起来的技术。全球目前的网页超过8亿,有效数据超过9T,并且仍以每4个月翻一番的速度增长。用户要在如此浩瀚的信息海洋里寻找信息,必然会很困难。搜索引擎正是为了解决这个问题而出现的技术。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。一个产品的发展是严格按照“产品进化论”的原则来进行的,并且在这一原则中,用户的需求是最主要的方面。搜索引擎的发展就遵照了技术、特性和体验,尤其是对体验的重视,才有了现在不断蓬勃发展的搜索引擎技术和产品。
“当你开始处理一个看似十分简单的问题,你可能没有真正意识到其复杂性。当逐渐深入后,发现其复杂之处,随之而来的则是很多复杂的解决方案。其实这只走到一半,这也是大部分人止步的地方……但是真正睿智的人会继续寻找答案问题的本质,然后提出优雅、漂亮的解决方案。这正是我们在Mac上所想做的。
——斯蒂夫·乔布斯
用户体验(User Experience)是一个在测试产品的满意度与使用度的过程中常用的词汇,它的产生是从西方产品设计理论中发展出来的,目的是找到产品如何与外界发生联系并发挥作用,了解人们如何“接触”和“使用”产品。斯蒂夫•乔布斯(Steve Paul Jobs),苹果公司创始人,在Ipod诞生之初就提出“产品进化论”:技术—特性—体验(图1所示)。这是一种以用户体验概念(User Experience Design,简称UE Design)为中心的设计流程。这套流程完整的包括了技术的发展与回馈、新特性的开发、目标使用者即用户的功能和互动研究。
图1 产品进化论
User-Centered Design,简称UCD,基于用户为中心的设计,是一种创建引人注目的、高效率的用户体验的方法。核心思想就是:在开发产品的每一个步骤过程中,都要把用户列为考虑的范围。UCD是“产品进化论”的核心。
有别于其他的设计哲学,“产品进化论”在理念上寻求产品的发展,围绕新产品与用户如何能够完成工作和需要工作来优化用户与产品的交互,而不是强迫用户改变他们的使用习惯来适应产品的改良。
基于互联网和电脑技术发展起来的搜索引擎就是完全按照用户的要求发展起来的。
搜索引擎(Web search engine)是一种自动从因特网搜集信息,经过一定的处理以后提供给用户进行查询的系统。每时每刻,因特网上的信息都在不断更新,种类浩瀚万千,毫无秩序。搜索引擎的目的,就是为用户提供他们所需的信息地图。
搜索引擎的工作原理大致可以分为以下几个方面。
(1)搜集信息:搜索引擎的信息搜集基本都是自动的。
(2)整理信息:搜索引擎整理信息的过程称为“建立索引”。
(3)接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。
1990年初,W3技术还未出现,资料文件分散在各个主机当中,为了便于搜索和查询,Archie和Gopher等相应的开发出了最初的搜索工具(图2所示)。随着互联网的迅速发展,基于HTTP访问的Web技术迅速普及,这些搜索引擎就不再适应用户的需求。在1994年1月,第一个正规意义上的既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)引擎上线。同年4月,Yahoo诞生。随着用户需求的增大、访问量和收录链接数的增长,新开发的搜索引擎已经可以开始支持简单的数据库查询,这就是早期的目录导航系统。但它们的缺点是网站收录和更新都要靠人工来维护,所以在信息量剧增的条件下,这些就不再变得受用了。
图2 早期的Archie和Gopher搜索引擎
1994年7月,Lycos推出了Robot技术,支持搜索结果相关性排序。1995年,元搜索引擎出现。该收索引擎由华盛顿大学开发,用户只需提交一次搜索请求,元搜索引擎便会将搜索结果处理后提交给预先选定的独立引擎,并把返回的所有查询结果,集中处理后返回给用户。
1995年12月,Alta Vista推出了大量的创新功能,使它成为当时搜索引擎领域的佼佼者。它是第一个支持自然语言搜索的搜索引擎,而且具备了对网页内容的分析和智能处理的能力;是第一个实现了高级搜索语法的搜索引擎,同时还支持对新闻、图片等的搜索功能,因此具有划时代的意义。
1997年8月,Northernlight第一个支持对搜索结果进行自动分类,也是当时拥有最大数据库的搜索引擎之一。
1998年10月,Google诞生(图3所示),它是目前世界上最流行的搜索引擎之一,具备很多独特而且优秀的功能,并且在界面上实现了革命性创新。
图3 早期Google版本的截图预览
1999年5月,Fast(AllTheWeb)公司发布了AlTheWeb,它能够利用ODP自动分类,支持Flash和PDF搜索,支持多语言搜索,提供新闻、图像、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。它曾经是最流行的搜索引擎之一,但在2003年2月被Overture收购。
在中文搜索引擎领域,搜狐公司是最早涉及搜索引擎的公司,但是由于人工分类提交的局限性,因为网络信息的暴增,逐渐被Robot自动抓取智能分类信息技术取代。台湾中正大学GAIS实验室于1998年1月创立了Openfind中文搜索引擎,这是最早开发的中文智能搜索引擎,采用GAIS实验室推出多元排序(Poly Rank TM)核心技术。
2000年1月,超链分析专利发明人、前Infoseek资深工程师李彦宏和好友徐勇创立了百度中文搜索。2003年11月,Yahoo全资收购3721公司。2004年8月3日,搜狐公司推出中文搜索引擎搜狗。(www.daowen.com)
2005年8月,阿里巴巴和Yahoo达成战略合作,全资收购雅虎中国,更名为阿里巴巴雅虎,并将业务重点全面转向搜索领域。
2006年9月,微软公司正式推出了拥有自主研发技术的Live Search,宣布进军搜索引擎市场,挑战Google在网络搜索领域的霸主地位。同年12月,网易公司推出中文搜索引擎有道。
2009年6月1日,微软正式上线原名为Kumo的搜索引擎Bing(图4所示),中文名“必应”。
由搜索引擎的发展可以看出,技术、特性和体验在不断促进搜索引擎的发展(图5所示)。从2007年开始,搜索引擎的使用者增加了88%,但搜索满意度却从77%下降到65%。信息的繁衍加重了信息库的库存容量,网站在不断的发展,搜索引擎也只好无奈的膨胀,全球搜索领域面临着共同的问题,这被称为“搜索过度综合症”。搜索引擎不应该只重视网页的数量,而应该简化用户肉眼甄别信息的过程。新的技术与特性的增加和发展,往往并没有给新产品带来好的用户体验,产品的技术和特性的发展在没能重视体验的情况下,还有可能造成负面影响。
图4 Bing Image Archive 站点
图5 搜索引擎与技术、性能、体验的关系
新的搜索引擎的开发有可能融入了很多新算法,并且增加了对视频、购物、旅游、SNS、地理等多元信息类型的搜索效率,但是更重要的是能够帮助用户有效地完成搜索行为,做出信息筛选。
根据ComScore研究公司的调查,目前主流的搜索引擎有多达30%的搜索请求被最终放弃,没有能为用户提供满意的结果,而剩下的约2/3的搜索需要完善搜索关键词或重新输入关键词。很多时候,用户搜到一半信息越来越模糊,而新的搜索逻辑和算法的创新改变了这一问题。新的信息检索机制除了统计和排名因素外,最重要的是最终能够给用户提交最有效的相关信息,简化用户的搜索任务,这是对于用户来讲最完美的用户体验。这是信息时代搜索引擎都在努力完善的技术与性能,也是还原搜索的本性。
参照互联网的发展,现在的搜索引擎技术还处于发展初期。不同类型的创新、多元化的竞争也为用户提供了更多的选择,是用户的需求推动着搜索引擎的快速进化。
搜索引擎的研发是一个非常漫长且复杂的工作,最耗费精力的准备工作在于需要不断调整对于信息检索的未来的认知、对于用户行为的分析和商业模式的探索,自动分析用户搜索的目的性意图,让使用者很快能够找到需要的信息,有效提高最终信息检索体验的易用性。
产品都需要一种超越技术和特性的量子式进化,目的是达到一种满意的用户体验。搜索引擎的发展必须真实、深刻地了解用户和他们的能力、需求与期望,并且牢记于心。当做到这一点时,就能够与用户达到一种“心领神会”的境界,这样提供的搜索引擎产品才是最完美的,因为体验才是用户真正唯一关心的。
【参考文献】
[1]UCDChina.UCD火花集[M].北京:人民邮电出版社,2009.
[2]胡飞.聚焦用户:UCD观念与实务[M].北京:中国建筑工业出版社,2009.
[3][美]汤姆·凯利.创新的十个面孔[M].刘金海等译.北京:知识产权出版社,2007.
[4][美]Peter Merholz等.应需而变——设计的力量[M].吴隽辰译.北京:机械工业出版社,2009.
[5][美]Garrett.J.J..用户体验的要素[M].范晓燕译.北京: 机械工业出版社,2007.
[6][美]Steve Mulder,Ziv Yaar.赢在用户[M].范晓燕译.北京:机械工业出版社,2008.
[7]卢亮.搜索引擎原理、实践与应用[M].北京:电子工业出版社,2007.
[8][美]Yin,R.K..案例研究:设计与方法[M].周海涛,李永,李虔译.重庆:重庆大学出版社,2004.
[9][美]弗莱茨·施耐德.Internet第一搜索引擎[M].杨廷郊等译.沈阳:辽宁科学技术出版社,2005.
附 录
1993—2009 年搜索引擎发展年表
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。