搜索引擎指自動(dòng)從英特網(wǎng)搜集信息,經(jīng)過(guò)一定整理以后,提供給用戶(hù)進(jìn)行查詢(xún)的系統(tǒng)。搜索引擎的工作原理大致可以分為:
- 搜集信息:搜索引擎的信息搜集基本都是自動(dòng)的。搜索引擎利用稱(chēng)為網(wǎng)絡(luò)蜘蛛(spider)的自動(dòng)搜索機(jī)器人程序來(lái)連上每一個(gè)網(wǎng)頁(yè)上的超連結(jié)。機(jī)器人程序根據(jù)網(wǎng)頁(yè)鏈到其他中的超鏈接,就象日常生活中所說(shuō)的“一傳十,十傳百……”一樣,從少數(shù)幾個(gè)網(wǎng)頁(yè)開(kāi)始,連到數(shù)據(jù)庫(kù)上所有到其他網(wǎng)頁(yè)的鏈接。理論上,若網(wǎng)頁(yè)上有適當(dāng)?shù)某B結(jié),機(jī)器人便可以遍歷絕大部分網(wǎng)頁(yè)。
- 整理信息:搜索引擎整理信息的過(guò)程稱(chēng)為“建立索引”。搜索引擎不僅要保存搜集起來(lái)的信息,還要將它們按照一定的規(guī)則進(jìn)行編排。這樣,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的資料。想象一下,如果信息是不按任何規(guī)則地隨意堆放在搜索引擎的數(shù)據(jù)庫(kù)中,那么它每次找資料都得把整個(gè)資料庫(kù)完全翻查一遍,如此一來(lái)再快的計(jì)算機(jī)系統(tǒng)也沒(méi)有用。
- 接受查詢(xún):用戶(hù)向搜索引擎發(fā)出查詢(xún),搜索引擎接受查詢(xún)并向用戶(hù)返回資料。搜索引擎每時(shí)每刻都要接到來(lái)自大量用戶(hù)的幾乎是同時(shí)發(fā)出的查詢(xún),它按照每個(gè)用戶(hù)的要求檢查自己的索引,在極短時(shí)間內(nèi)找到用戶(hù)需要的資料,并返回給用戶(hù)。目前,搜索引擎返回主要是以網(wǎng)頁(yè)鏈接的形式提供的,這些通過(guò)這些鏈接,用戶(hù)便能到達(dá)含有自己所需資料的網(wǎng)頁(yè)。通常搜索引擎會(huì)在這些鏈接下提供一小段來(lái)自這些網(wǎng)頁(yè)的摘要信息以幫助用戶(hù)判斷此網(wǎng)頁(yè)是否含有自己需要的內(nèi)容。