|
|
當前位置:首 頁 > 搜索引擎的技術發展趨勢 |
|
搜索引擎的技術發展趨勢 |
發布日期:2007-5-25 |
關鍵詞:發展趨勢 |
搜索引擎經過幾年的發展和摸索,越來越貼近人們的需求,搜索引擎的技術也得到了很大的發展。搜索引擎的最新技術發展包括以下幾個方面:
一、提高搜索引擎對用戶檢索提問的理解
為了提高搜索引擎對用戶檢索提問的理解,就必須有一個好的檢索提問語言,為了克服關鍵詞檢索和目錄查詢的缺點,現在已經出現了自然語言智能答詢。用戶可以輸入簡單的疑問句,比如“how can kill virus of computer?”。搜索引擎在對提問進行結構和內容的分析之后,或直接給出提問的答案,或引導用戶從幾個可選擇的問題中進行再選擇。自然語言的優勢在于,一是使網絡交流更加人性化,二是使查詢變得更加方便、直接、有效。就以上面的例子來講,如果用關鍵詞查詢,多半人會用“virus”這個詞來檢索,結果中必然會包括各類病毒的介紹、病毒是怎樣產生的等等許多無效信息,而用“how can kill virus of computer?”,搜索引擎會將怎樣殺病毒的信息提供給用戶,提高了檢索效率。
二、對檢索結果進行處理
1)基于鏈接評價的搜索引擎
基于鏈接評價的搜索引擎的優秀代表是Googel(http://www.googel.com),它獨創的“鏈接評價體系”是基于這樣一種認識,一個網頁的重要性取決于它被其它網頁鏈接的數量,特別是一些已經被認定是“重要”的網頁的鏈接數量。這種評價體制與《科技引文索引》的思路非常相似,但是由于互聯網是在一個商業化的環境中發展起來的,一個網站的被鏈接數量還與它的商業推廣有著密切的聯系,因此這種評價體制在某種程度上缺乏客觀性。
2)基于訪問大眾性的搜索引擎
基于訪問大眾性的搜索引擎的代表是direct hit,它的基本理念是多數人選擇訪問的網站就是最重要的網站。根據以前成千上萬的網絡用戶在檢索結果中實際所挑選并訪問的網站和他們在這些網站上花費的時間來統計確定有關網站的重要性 排名,并以此來確定哪些網站最符合用戶的檢索要求。因此具有典型的趨眾性特點。這種評價體制與基于鏈接評價的搜索引擎有著同樣的缺點。
3)去掉檢索結果中附加的多余信息
有調查指出,過多的附加信息加重了用戶的信息負擔,為了去掉這些過多的附加信息,可以采用用戶定制、內容過濾等檢索技術。
三、確定搜索引擎信息搜集范圍,提高搜索引擎的針對性
1)垂直主題搜索引擎
網上的信息浩如煙海,網絡資源以十倍速的增長,一個搜索引擎很難收集全所有主題的網絡信息,即使信息主題收集得比較全面,由于主題范圍太寬,很難將各主題都做得精確而又專業,使得檢索結果垃圾太多。這樣以來,垂直主題的搜索引擎以其高度的目標化和專業化在各類搜索引擎中占據了一系席之地,比如象股票、天氣、新聞等類的搜索引擎,具有很高的針對性,用戶對查詢結果的滿意度較高。作者認為,垂直主題有著極大的發展空間。
2)非www信息的搜索
提供FTP等類信息的檢索
3)多媒體搜索引擎
多媒體檢索主要包括聲音、圖像的檢索。
四、將搜索引擎的技術開發重點放在對檢索結果的處理上,提供更優化的檢索結果
1)純凈搜索引擎
這類搜索引擎沒有自己的信息采集系統,利用別人現有的索引數據庫,主要關注檢索的理念、技術和機制等。
2)元搜索引擎
現在出現了許多的搜索引擎,其收集信息的范圍、搜索機制、算法等都不同,用戶不得不去學習多個搜索引擎的用法。每個搜索引擎平均只能涉及到整個www資源的30-50%(search engine watch數據),這樣導致同一個搜索請求在不同搜索引擎中獲得的查詢結果的重復率不足34%,而每一個搜索引擎的查準率不到45%。
元搜索引擎(metasearch enging)是將用戶提交的檢索請求到多個獨立的搜索引擎上去搜索,并將檢索結果集中統一處理,以統一的格式提供給用戶,因此有搜索引擎之上的搜索引擎之稱。它的主要精力放在提高搜索速度、智能化處理搜索結果、個性搜索功能的設置和用戶檢索界面的友好性上,查全率和查準率都比較高。目前比較成功的元搜索引擎有metacrawler、dopile、ixquick等。
| |
|
上一條:
互聯網需要全文檢索 |
|
下一條:
主要中文網頁搜索引擎介紹
|
|
|
|