当前位置:>> 首页 >> 网络信息资源检索
返回上一层
4.3  常用搜索引擎的介绍
阅读人数:6316       

 
4.3.1目录型搜索引擎

1.中文Yahoo!(http://www.yahoo.com.cn)目前,Yahoo已成为全球搜索领域的霸主,中文Yahoo!(雅虎)于1999年9月正式开通,是雅虎在全球的第20个网站,是目录式搜索引擎的代表,收录了全球资讯网上数·以万计的中文网站,站点目录分为多个大类,每个大类又链接细分若干小类,检索简单、方便。如图,4-2所示。
1)检索途径:中文Yahoo!以其详尽明确的分类为用户提供强大的检索功能。可通过分类及关键词两种检索途径来完成用户的检索需求。
作为目录型搜索引擎的代表,中文。Yahoo!主要依靠主题式分类目录来查询信息。中文Yahoo!将其收录的信息分为艺术与人文、新闻与媒体、商业与经济、休闲与运动、电脑与因特网、教育、科学、娱乐、政府、参考资料、国家与地区、社会科学、社会与文化、健康与医药14个大类,各个大类下设若干小类,用户可以通过分类目录逐级接近检索主题。每一类目链接它的一个首页,内容更加丰富。
除了按照分类目录进行检索外,中文Yahoo!主页面和各分类搜索页面还提供关键词检索。用户只需在检索输入框内键人要搜索的关键词,单击"搜索"按钮,雅虎搜索引擎就在其数据库中搜索出含有该关键词的信息,反馈给检索用户。另外,中文Yahoo!又增加了高级检索功能,可以实现对"文档格式"、"时间"等的限定,提高查准率。
pic
2)检索方法和技巧
1)中文Yahoo!支持布尔逻辑检索。用户通过使用布尔逻辑关系构造逻辑检索式来精确检索结果。但需注意:雅虎只支持"逻辑与"(AND)和"逻辑非"(NOT)关系检索,不支持"逻辑或"(OR)的检索。
2)检索式中可以使用"",使检索结果始终是一个完整的词组而不被分开。如果希望某些词一定要出现在检索结果中,则可在该词前面加上"+";相反,如果希望某些词一定不出现在检索结果中,则可在该词前面加上"-"。
3)指定关键字出现的段落。在关键字前加t:搜索引擎仅会查询网站名称;在关键字前加u:搜索引擎仅会查询网址(URL)。
4)雅虎搜索引擎不区分英文字母大小写。无论您输入大写还是小写字母都可以得到相同的搜索结果。例如:输入"yahoo"或"YAHOO",结果都是一样的。
3)检索结果:雅虎在检索结果输出页上,根据所选的检索方式不同,,其结果输出页面也略有不同。当用户选择浏览雅虎分类目录时,选择符合条件的类目直接进入的相关页面,单击分类网站中"相关信息"链点来浏览符合条件的相关信息,同时,中文Yahoo!主界面和分类搜索网站都提供有关键词的检索,通过检索人口进行关键词的相关检索,且结果页面中用户可选择"相关类目"、"相关网站"、"相关网页"、"相关新闻"等来得到同一检索式的不同结果,如图43所示为检索输出结果。
雅虎会根据分类类目及网站信息与关键字串的相关程度来排列出相关的Yahoo!中文类目和网站。相关度越高越排在前面。影响网站相关程度的主要因素有:网页中与关键字串相同越多,相关程度越高;网页中与关键字串完全符合的高于部分符合的相关程度;网站名称(或新闻标题)符合关键字串者的高于网址(或新闻内文)符合关键字串的网站相关程度。
4)其他功能:目前,Yahoo!中国搜索引擎和Goode合作,使得Yahoo!中国的搜索功能更加强大。当用户使用Yahoo!中国进行搜索时,所得到的检索结果将是中文Yahoo!本身的数据库与Goode所指向数据库中的相关内容。如果用户检索的关键字词在Yahoo!中国的数据库内,那么检索结果会在"相关类目"和'"相关网站"中;如果用户检索的关键字词在Goode的数据库中,那么检索结果会在"相关网页"中。
 
4.3.2机器人检索(全文检索)
1。Google搜索引擎(http://www.google.com)Google成立于1997年,几年间迅速发展成为规模最大的搜索引擎,目前Google每天处理的搜索请求已多达2亿次。 Google数据库存有30亿个Web文件,属全文搜索引擎。允许以多种语言进行搜索,同时还可在多达40多个国别专属引擎中进行选择。 Google搜索引擎主页如图49所示:
1)检索方法:google的首页很清爽,具有界面简洁、检索精确度高、质量高等特点。
在检索输入框上方排列了多个大功能模块:网页、图片、新闻、论坛和网页目录等,可根据
需要任意切换,默认是网页搜索。
基本搜索,用户只需在搜索框内输入所要检索内容的关键词,根据需要选择"所有网站"、"中文网页"或"简体中文网页",回车或单击[Google搜索]按钮即可得到检索结果。Google严谨认真,对查询要求÷字不差。如对"饭店"的搜索和对"酒店"的搜索,会出现不同的结果。因此在搜索时要选用不同的关键词。
Goode查询时不需要使用"AND",Google会在关键词之间自动添加"AND",Google会提供符合检索用户全部查询条件的网页。想逐步缩小搜索范围时,只需输入更多的关键词,并在两个及多个关键词之间加空格,。或在想删除的内容前加上"-"号(切记要在减号前留一空格),即可缩小搜索范围。
Google不支持"OR"搜索,所以Goode无法接受"或者包含词儿或者包含词语B"的网页,要查询"牛奶"或"鸡蛋",就必须分两次查询,一次查"牛奶",一次查"鸡蛋"。
Google不支持词干法和通配符(截词检索)。这就要求输入的关键词完整、准确。例如,查询"google"或"goodl*",不会得到类似"Gooder"或"goodlin"的结果。
Google检索还不区分英文字母大小写,所有字母默认为小写。
2)检索技巧
1)使用忽略词语。如Google通常忽略"http"、"com"等字符,以及数字和单字。此类字过于频繁出现于大部分网页,不仅元助于查询,而且大大降低搜索速度。
2)使用专用语查询。在专用语上加双引号,可以实现准确检索。这种方法在查找明言警句或专用名词时显得格外有用。
3)支持使用短语连接符,如标点符号"-"、"飞"、"+"、"="、","等。如moth-er-iplow一词尽管没有加引号,也可作为专用语看待。
4)某些词面添加冒号。如查询link:〈网址〉,可以查找链接到此网址的所有网页。但此方法不能与关键词查询联合使用。
5)用"+"可将这些字词强加于搜索项,但"+"之前必须留一空格。
除利用上述运算符构造检索式进行检索外,也可利用Google的高级检索功能进行更直观的深层检索。如可对检索语言、文件格式、时间、检索词在结果中的位置等进行检索结果的限定。图4-10所示为Google高级检索界面。
除了搜索之外,Google还支持新闻组的WEB方式的浏览和张贴功能。具有目录服务、PDI文档搜索、地图搜索、电话搜索、工具条、搜索结果翻译J搜索结果过滤等更多的功能。
3)Google的特殊功能:Google提供了一些全新的功能,如"手气不错"、"网页快照"和"类似网页"等。
1)手气不错。输入关键词后,按下[手气不错]按钮将自动进入Goode查询到的第一个网页。您将完全看不到其他的搜索结果。例如,要查找Starlfod大学的主页,只需在搜索字段中输入"Stanford",然后单击[手气不错]按钮。 Google将直接带您进入Stantod大学的官方主页mw-stanford-eduo又如,要查找"北京大学",只需输入"北京大学",再单击[手气不错]按钮,Goode就直接带您到北京大学的首页(http://www.pku.edu.cn)。
2)网页快照。当搜索内容站点或网页不存在时,用户可以调用Google事先为用户储存的大量应急网页,经Goode处理后,搜索项均用不同颜色标明;另外还有标题信息说明其存档时间日期,并提醒用户这只是存档资料。实际上Google将检索的网页都做了一番"快照",然后放在自己的服务器上,这样做的好处是不仅下载速度极快,而且可以获得互联网上已经删除的网页。
3)相似网页。单击[相似网页]按钮链接时,Google侦察兵便开始寻找与这一网页性质类似的网页,一般都是同一级别的网页。例如:若当前页是某大学的首页,那么Google侦察兵就会寻找其他大学的首页;如果该当前页是某大学计算机科学系,Google侦察兵就去找其他大学的计算机科学系,而不是其他大学的首页。 Goode侦察兵可以"一兵多用"。如果检索者对某一网站的内容很感兴趣,但又觉得信息量不够时,Google侦察兵会帮您找到其他有类似资料的网站;如果检索者需要寻找某种产品的信息,Google侦察兵会提供相关信息,供用户比较,做出选择;如果检索者在某一领域做学问,Google侦察兵会帮助您快速找到大量资料。
除上述功能外,还有计算器、查询电话号码、股票报价、查找字典释意、查找地图、页面翻译、单词纠正、繁简转换等功能。我们可以借助于Google帮助中心的特色服务进行学习。
2。Baidu一一百度搜索引擎(http://www.baidu.com)百度是国内最大的商业化全文搜索引擎,在中文搜索支持方面有些地方甚至超过了Google,是目前国内技术水平最高的搜索引擎。目前全国已有36家大型网站采用了百度引擎,如新浪、搜狐、263、Tom、炎黄在线、等。其搜索界面如图4-11所示。
1)检索方法:关键词检索:只需在搜索框内输入所要检索内容的关键词,单击[百度搜索]按钮即可得到检索结果。同时,可根据用户需要进行不同功能模块一一新闻、网页、贴吧、MP3、图片和目录的任意切换,在无功能选择时默认为网页搜索。
如用鼠标单击[更多]按钮,进入功能模块全页面显示,可任意选择。如单击[网站]进入百度网站检索界面,它是一个类似于图书馆分类方式的主题目录。百度网站导航也采用主题分类的方法,人工维护、更新,及时为您推荐最优秀的网络资源,是您在互联网上查找信息的快速指南。目前百度网站导航总共分为5个大类,70多个子类目O用户可以根据需要选择页面左边的分类目录进行检索,也可直接链接右边的相关检索网站。也可进行关键词检索,其检索界面如图4-12所示。
单击主页面"高级检索",进入高级检索界面,如图4-13所示。
利用百度搜索引擎的高级检索功能,可以更直观地在各输入框内键入检索范围限定,包括时间、语言、地区、关键词位置等,同时还可以对结果显示加以限定。所有限定一次到位,不失为一种非常方便的检索方法。
2)检索技巧
1)支持布尔逻辑1ND"、"OR"、"OR"的检索。使用时应注意:
①使用"AND"时,以空格代替"AND"或"+"通配符。
②使用"-"限定其后的检索词不用加空格。例如搜索"计算机编程语言"但不包含"C#1"的信息,可在检索输入框内输入"计算机编程语言-C#1"即可。
③用通配符"/"来表示"OR"的关系,如要查询"世界杯"或者"意甲联赛"相关资料,只需在检索输入框内键入检索式"世界杯J意甲联赛",单击[搜索]按钮即可。
2)百度提供相关检索。如果用户无法确定输入什么词语才能找到满意的资料,可以试用相关度检索。即先输入一个简单词语搜索,然后,百度搜索引擎会为您提供"其他用户搜索过的相关搜索词语"作参考。这时,只需单击其中一个相关搜索词,就能得到那个相关搜索词的搜索结果。
3)百度搜索引擎不区分英文字母大小写,所有字母均作小写处理。同时百度提供中文繁、简体的检索,只要用户输入标准编码的繁体中文或简体中文,就可以同时搜到繁体中文和简体中文网页。并且,搜索结果中的繁体网页摘要信息会自动转成简体中文,方便用户阅读。
4)百度搜索引擎支持搜索位置的限定。检索时,在一个网址前加"site:",可以限定只搜索某个具体的网站或某个域名内的网页,需要注意的是,在输入时,关键词与"site:"之间必须用一个空格进行分隔;在一个或几个关键词前加"intitle:",可以限定只搜索网页标题中含有这些关键词的网页。
3)其他特殊功能
1)百度快照是一个广受用户欢迎的特色功能,解决了用户上网访问经常遇到死链接的问题:百度搜索引擎己先预览各网站,拍下网页的快照,为用户储存大量应急网页。即使用户不能链接上所需网站时,百度为用户暂存的网页也可救急。而且通过百度快照寻找资料往往要比常规方法的速度快得多。
2)百度还具有中文搜索自动纠错的功能,:如果用户误输入错别字,可以自动给出正确关键词提示。
3)百度搜霸是一款免费的浏览器工具条,下载后安装在IE浏览器的工具列内,用户无需登录百度搜索引擎,即可利用该工具条进行即时检索。
 
4.3.3专业搜索引擎
专业搜索引擎就是服务于专门领域的信息查询工具,如查电话、域名、人名、邮件、地
址、房产、旅游、地图、图片等。这种搜索引擎有专门的,如免费资源AAAFREESTUFF、
地图MAPBLAST、图行天下、城市旅游交通图,也有在其他大型搜索引擎上附带的,如Ya-hoo!、Sohu、Galaxy等。各类专业搜索引擎的主要代表汇集如下。
1)查询地址、人物、电话、邮编等内容搜索引擎。
网易黄页——http://114.163.com
中华大黄页——http://www.chinabig.com
工商黄页——http://www.hotels.com.tw
Yahoo!People search——http://people.yahoo.com
Whowhere——http://www.whowhere.lycos.com
Switchboard——http://www.switchboard.com
2)查询地图地区信息等内容的搜索引擎。
城市交通旅游电子地图——http://www.afmap.com.cn
中华地图网——http://www.hua2.com
图行天下——http://www.go2map.com
中国交通信息图一http://www.transdate.com.cn
MapBlast——http://www.mapblast.com
MapQuest——http://www.mapquest.com