51学通信技术论坛

 找回密码
 立即注册
搜索
查看: 3236|回复: 0

搜索引擎的发展历程及发展趋势 [复制链接]

Rank: 9Rank: 9

懒

发表于 2013-10-1 19:05:36 |显示全部楼层
一键分享 一键分享

德州学院计算机系 :吴昊 秦丽




摘要:我们已经步入信息时代,网络时时刻刻影响着我们的生活。现在又处在一个信息爆炸的时代,如何从这浩如烟海的资料中找到自己所需要的文件,是每个人要面对的问题。而搜索引擎有力的解决了这一问题。本文介绍了第一代搜索引擎、元搜索引擎和第二代搜索引擎的发展历程,浅谈了第三代搜索引擎向智能化、个性化、社区化、专业化、商业化、集成化、多媒体化的发展趋势。

关键词:搜索引擎,元搜索引擎,发展趋势

项目来源:德州市社会科学研究基地项目

一、第一代搜索引擎

第一代搜索引擎是基于万维网的搜索引擎,1994年4月世界第一个搜索引擎WebCraw-ler出现,随后,Lycos、Yahoo也相继诞生。而1995年12月AltaVista的出现为搜索引擎带来了新设计和新思维。它是第一个支持自然语言和高级搜索语法的搜索引擎。第一代搜索引擎以Yahoo和AltaVista为代表,当时搜索引擎均以反馈结果的多少来衡量搜索结果的好坏。这也使得第一代搜索引擎存在搜索结果相关性差的问题,并且排序不好,用户无法有效找到满意答案。于是第一代搜索引擎逐渐退出了历史舞台。

二、元搜索引擎

1995年,第一个元搜索引擎Metacrawler问世。元搜索引擎是指用户的搜索命令,经过中介搜索引擎处理,传给多个独立搜索引擎,再将结果回收,经处理后返回给用户。

元搜索引擎根据功能划分为集成搜索引擎和多线索式搜索引擎。集成搜索引擎,亦称为“多引擎同步检索系统”。这类搜索没有统一的全局web格式,而是直接将各搜索引擎以检索模式直接面对用户。从本质上说它算不上是元搜索引擎,但因其技术简单,维护也很容易,在一些专业(如Flash,MP3)的搜索上深受特定用户的喜欢。多线程式搜索引擎,指的是以统一的界面实现对多个搜索引擎的调度,并以统一的格式输出的网络检索工具。它有以下三个特征:统一检索界面、检索指令转换、统一结果集的组织和显示。

元搜索引擎根据运行方式的差异可以分为桌面型元搜索引擎和基于web的元搜索引擎。桌面型搜索引擎以程序的方式提供给用户。而基于web的元搜索引擎是以web的方式提供给用户。

按照工作方式,元搜索引擎又分为并行处理式和串行处理式两大类。并行处理式将搜索请求同时发往各个调用搜索引擎。而串行处理式将搜索请求依次发往各个调用搜索引擎中,再依次进行查询。

元搜索引擎的局限性也十分明显,如:只能调用有限的几个主要搜索引擎;限制使用高级搜索语法;无法对搜索结果进行很好的排序;搜索结果有一定的局限性等。元搜索引擎作为搜索引擎的一种,时至今日依旧有着巨大的活力。

三、第二代搜索引擎

随着google的诞生,第二代搜索引擎也横空出世。所谓的第二代搜索引擎与第一代搜索引擎有很大的差别。就google而言,它使用了数据挖掘技术和网站评级技术,使得搜索出的结果在相关性,准确性上有很大的提高。它的特点为搜索迅速,界面简洁。所以google一诞生,就很快变成了搜索引擎界的霸主。但随着时代发展,它的缺点也逐渐显露出来。如:查全率低;查准率低;对一些新型的查询如气味等不支持。这使得人们越来越期盼拥有新的搜索引擎来改变这一情况。因此第三代搜索引擎也呼之欲出了。

四、第三代搜索引擎

2003年8月20日,中国搜索的CEO陈沛首次提出了第三代搜索引擎的概念,2004年12月,中搜推出的网络猪3.0被陈沛看做第三代搜索引擎的开始。2005年9月,美国政府提出要研制第三代搜索引擎。2005年10月,微软公布了第三代搜索引擎的构想。

第三代搜索引擎的发展理念可以分为两种:一种是以Google为代表的技术驱动型,另一种是以Jwm guagua(精武门呱呱)为代表的服务驱动型。“技术驱动型”的理念认为第三代搜索引擎需要解决自然语言理解、可视化数据输出等一系列问题。而“服务驱动型”的理念认为第三代搜索引擎是应该在提高搜索引擎技术的基础上,进一步寻找更大的服务空间,再集合所有的资源,形成统一的搜索引擎系统产业链。

第三代搜索引擎有五个发展趋势。

(1)智能化

第三代搜索引擎将拥有更多人工智能的成分。现在的第三代搜索引擎的智能化呈现以下几个功能。一是具有智能词组效应和编辑功能。它试图从用户输入的词组中挖掘用户的真正意图。目前,施乐公司和Powerset以及总部设在悉尼的一些搜索引擎例如Lexxe正在试图在这方面做出突破。二是具有整合搜索能力。比如当你输入“刘德华”时,搜索引擎将呈现有关刘德华的所有内容,包括他的歌、电影、书以及新闻等等。三是具有引导查询能力,即可以根据你输入的关键词,主动提示来缩小范围。现在的搜索引擎完全实现智能化有一定的难度,还要继续行走下去。

(2)个性化

所谓的个性化是指在搜索同一信息时,搜索引擎会根据不同的人呈现不同的页面。其本质就是根据用户的喜好来判断不同页面的权重进而选择排序。现在这也被认为是搜索引擎的发展趋势。目前已有很多搜索引擎有了个性化搜索这项服务。其运用的技术包含网络信息挖掘技术、Agent技术、信息推送技术等。

(3)社区化

社区化是第三代搜索引擎的另一特征,它主要体现在公众参与。比较典型的有美国的维基百科,它是由各国的人们一起编纂的,是一个开放的百科全书网络项目。中国的百度百科就是以它为原形的。在这方面还有新浪爱问和百度知道做的也不错。

(4)专业化

专业化的搜索引擎是指搜索特定专业领域的搜索引擎。这种搜索引擎有效地解决了普通搜索引擎返回结果多而杂的缺点,其主要特点为;1、采用了聚焦、实时和可管理的网页采集技术。该技术对动态网页采集的优先级比较高,且层次深,返回结果精确。2、具有从非结构化内容到结构化数据的网页解析技术。它不仅能够对标题和正文进行解析,同时还对时间、来源、作者等其他数据进行解析。3、联合检索和精、准、全的全文索引技术。该技术支持支持结构化和非结构化的联合检索,同时也真正实现了全文搜索,并且支持按内容相关度排序,或按时间,来源排序。4、高度智能化的文本挖掘技术。这主要体现在处理上,比如自动分类,自动聚类,自动排重等等。虽然技术还是不够成熟,但已经有了很好的应用效果。

(5)商业化、集成化、多媒体化

现在搜索引擎的商业化并不完全,商业化不是单用竞价排名就可以了,而应该是全面的商业化,实现盈利。而集成化,实际指的就是元搜索引擎,它被视为搜索引擎的一个重要的发展方向。多媒体化,即指的是对多媒体文件的搜索。

五、结论

搜索引擎已经变成网络世界与现实世界之间的窗口,它的诞生让世界上人们的联系更加紧密。搜索引擎的过去是辉煌的,人们应用搜索引擎实现了在网络世界的畅游。而搜索引擎的未来是未知的,但必然是光明的,它会更智能化,更人性化,搜索效率更高,更加符合人们的需要,而第三代搜索引擎的发展正在轰轰烈烈的进行着,搜索引擎未来会发挥越来越大的作用。

参考文献:

[1]原福永,梁顺攀.元搜索引擎的现状与发展[J].计算机工程与设计.2005,26(12).

[2]罗丽姗.垂直搜索引擎发展概述[J].图书馆学研究.2006.12.

[3]第三代搜索引擎的研究现状及其发展趋向探析[J].情报理论与实践.2008,31(5),

[4]俞平,肖南峰,甘志刚.第三代搜索引擎研究[J].南京信息工程大学学报:自然科学版.2009,1(2):169-174.

[5]周霞,卓志宏.个性化网络信息检索方法与技巧探讨[J].企业技术开发.2010.10,29(19).



《电子商务》2013年第06期


www.gprshome.com: GPRS及移动通信技术学习交流分享平台。
您需要登录后才可以回帖 登录 | 立即注册

站长邮箱|Archiver|51学通信 ( 粤ICP备11025688 )

GMT+8, 2024-3-28 23:12 , Processed in 0.026659 second(s), 14 queries .

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部