全文搜索引擎
全文搜索引擎(Full Text Search Engine)是目前使用最廣泛的搜索引擎。它的工作原理是計算機索引程序,通過(guò)掃描文章中的每一個(gè)詞,對每一個(gè)詞建立一個(gè)索引,注明該詞在文章中出現的次數和位置,并對它進(jìn)行預排名處理。當用戶(hù)查詢(xún)關(guān)鍵詞時(shí),檢索程序會(huì )根據事先建立的索引進(jìn)行查找,并將查找的結果反饋給用戶(hù),檢索過(guò)程類(lèi)似于通過(guò)字典中的檢索字表查字的過(guò)程。
簡(jiǎn)單地說(shuō),全文搜索引擎就是用戶(hù)最常用的,使用關(guān)鍵詞進(jìn)行網(wǎng)頁(yè)搜索的搜索引擎(如Google、百度等)都屬于全文搜索引擎。Google全文搜索引擎。
全文搜索引擎的檢索方式通常分為按字檢索和按詞檢索兩種。按字檢索是指對文章中的每一個(gè)字都建立索引,檢索時(shí)將詞分解為字的組合;按詞檢索指對文章中的詞(語(yǔ)義單位)建立索引,檢索時(shí)按詞檢索,并且可以處理同義項等。英文搜索引擎按字檢索和按詞檢索時(shí)都有空格區分,切分詞就非常輕松;中文搜索引擎則是按字檢索和按詞檢索完全不一樣。按詞檢索中文詞時(shí),需要以詞義和語(yǔ)義切分字詞,才能正確建立詞的索引,難度比英文搜索引擎大很多,這是擁有對中文優(yōu)勢的百度能戰勝?lài)H搜索巨頭Google最重要的原因之一。全文搜索引擎檢索方式。

根據搜索結果來(lái)源的不同,全文搜索引擎可以分為兩類(lèi):一類(lèi)擁有自己的檢索程序(Indexer),俗稱(chēng)“蜘蛛”(Spider)程序或“機器人”(Robot)程序,能自建網(wǎng)頁(yè)數據庫,搜索結果直接從自身的數據庫中調用,上面提到的Google、百度就屬于此類(lèi);另一類(lèi)則是租用其他搜索引擎的數據庫,并按自定的格式排列搜索結果,如Lycos搜索引擎,目前Lycos主要是通過(guò)與雅虎合作,以交易的方式提供給用戶(hù)。
從全文搜索引擎的抓取和檢索方式可以看出,全文搜索引擎的信息量巨大,也是用戶(hù)需求最大的搜索引擎,占據了絕大部分的搜索市場(chǎng)。這也使全文搜索引擎成為SEO主要針對的搜索引擎類(lèi)型,不過(guò)全文搜索引擎也并非SEO的全部,目錄索引和元搜索引擎對網(wǎng)站優(yōu)化也有很大的幫助。
|