元搜索引擎
元搜索引擎(Meta Search Engine)是建立在獨立搜索引擎之上的搜索引擎。它利用下層的若干個獨立搜索引擎提供的服務(wù)集中提供統(tǒng)一的檢索服務(wù)。元搜索引擎在接受到用戶查詢請求時,同時在其他多個引擎上進行搜索,并將結(jié)果按照一定的規(guī)則排名返回給用戶。
國際著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具有代表性的有Jopee元搜搜索引擎。在搜索結(jié)果排列方面,有的按自定的規(guī)則重新排列組合返回結(jié)果,如Vivisimo;有的則直接按來源引擎排列搜索結(jié)果,如Dogpile、MetaCrawler等。所示為Dogpile搜索結(jié)果排列,都有調(diào)用的搜索引擎說明,在各個搜索引擎排名都好的網(wǎng)頁在Dogpile 中也會有好的排名。
通常元搜索引擎主要由3個部分組成:請求提交代理、檢索接口代理及結(jié)果顯示代理。
(1)請求提交代理負責選擇調(diào)用哪些獨立搜索引擎,檢索返回結(jié)果數(shù)量限制等。
(2)檢索接口代理將用戶的檢索請求按不同的格式發(fā)送到各個獨立搜索引擎。
(3)結(jié)果顯示代理負責各個獨立搜索引擎檢索結(jié)果的去重、合并及顯示。
現(xiàn)在由于元搜索引擎技術(shù)得到高度的發(fā)展,已經(jīng)能在一定程度上智能化處理用戶的搜索請求。用戶的行為信息是提高元搜索引擎用戶體驗的基礎(chǔ)。所示為元搜索引擎用戶行為搜索模型,在用戶的搜索時,元搜索引擎會調(diào)用搜集的用戶行為信息等控制選擇的獨立搜索引擎,然后將該搜索引擎結(jié)果返回給用戶。
元搜索引擎一般有兩種分類方法,分別是按功能劃分與按運行方式的差異劃分。(1)按功能劃分,元搜索引擎包括多線索式搜索引擎和All-in-One式搜索引擎。多線索式搜索引擎是指利用同一個檢索界面,對多個獨立搜索引擎數(shù)據(jù)庫進行檢索,然后返回統(tǒng)一格式的結(jié)果,如Metacrawler等。All-in-One式搜索引擎是指將各個搜索引擎的查詢結(jié)
果分開展示,如Albany等。
(2)按運行方式的差異劃分,可分為在線搜索引擎和桌面搜索引擎。在線搜索引擎是以網(wǎng)頁形式進行搜索操作,而桌面搜索引擎則是以桌面工具軟件的形式進行搜索操作。
元搜索引擎和全文搜索引擎有一定不同,主要體現(xiàn)在以下兩個方面。
(1)全文搜索引擎都擁有索引數(shù)據(jù)庫,索引數(shù)據(jù)庫中的文件是通過蜘蛛機器人爬行抓取的;而元搜索引擎是調(diào)用其他獨立搜索引擎的數(shù)據(jù),更不可能有蜘蛛機器人爬行網(wǎng)絡(luò)。
(2)全文搜索引擎的數(shù)據(jù)只來自一個搜索引擎數(shù)據(jù)庫;元搜索引擎本身的特點就是多種搜索引擎數(shù)據(jù)的集合,所以搜索結(jié)果通常來自于多個獨立搜索引擎。
元搜索引擎結(jié)果是多個搜索引擎的數(shù)據(jù),所以結(jié)果更豐富;而全文搜索引擎之間的算法不同,收錄的網(wǎng)頁內(nèi)容也可能有差別,內(nèi)容就沒有元搜索引擎結(jié)果豐富。
元搜索引擎是為彌補傳統(tǒng)搜索引擎的不足而出現(xiàn)的一種輔助檢索工具。元搜索引擎有很多傳統(tǒng)搜索引擎所不具備的優(yōu)勢,但是元搜索引擎依賴于數(shù)據(jù)庫選擇技術(shù)、文本選擇技術(shù)、查詢分派技術(shù)和結(jié)果綜合技術(shù)等。用戶界面的改進、調(diào)用策略的完善、返回信息的整合以及最終檢索結(jié)果的排序仍然是未來元搜索引擎不斷進步的方向。
由于元搜索引擎并沒有自己的索引數(shù)據(jù)庫,查詢的結(jié)果是調(diào)用其他搜索引擎數(shù)據(jù),所以并不能成為網(wǎng)站SEO的優(yōu)化方向。但是由于有些元搜索引擎有一定用戶量,也有的元搜索引擎有自己的排名規(guī)則,因此可以做一些了解。
|