目前個性化搜索的不足點

總體而言,應用於搜索引擎中的Web個性化信息推薦服務可以借鑒傳統電子商務領域中的Web個性化信息推薦服務。但是,具有和現代電子商務領域中個性化推薦系統相似功能的搜索引擎卻很少受到人們的註意。也就是說,現代搜索引擎尚不能廣泛地提供個性化搜索結果,對不同用戶的一個相同查詢的搜索結果總是相同的,它與提交查詢的用戶無關。因此,由於在檢索階段忽略瞭用戶的個性化需求特征,所以對特定用戶而言,搜索引擎經常返回大量的無用信息。造成這種現象的主要原因在於現代搜索引擎面臨一些和傳統個性化信息推薦系統相似的問題,具體如下。

首先,用戶需求難以有效表達。這主要有兩個原因:一方面,由於一般非專業用戶都缺乏需求表達的訓練,所以不能有效理解和表達自己的信息需求,產生的後果就是用戶的主觀理解往往就並不明確。形象地說,這種現象就是用戶無法描述他要找什麼,除非讓他看到想找的東西。另一方面,這也來自於系統無法正確地獲取相關用戶個性化信息,這主要是由於網絡信息檢索系統中通常不具有主動獲取用戶個性化特征的功能,同時也沒有要求用戶必須提交個性化信息才能使用的限制。上述兩個方面的最終效果都會產生系統無法有效獲取用戶個性化特征信息的現象。

其次,檢索結果準確化和檢索快速化之間存在矛盾。在處理搜索引擎的海量數據時,很多傳統的個性化推薦技術通常會產生嚴重的性能問題,這些主要適用於傳統小型商務網站中的個性化算法和技術往往缺乏良好的縮放性。當然,人們也提出瞭一些解決方法,如維數約減、聚類分析和貝葉斯網絡等,雖然在一定程度上能夠解決縮放性問題,然而這些技術往往是通過在離線階段抽取出原始數據中的模式信息,並於在線階段使用這些模式來得到推薦集合,所以這些方法雖然可以減少在線的處理開銷,但是常常產生推薦結果不準確的情況,同時在線計算的復雜度也會隨著模式的增多而增加。

最後,現代搜索引擎的檢索智能化水平仍然較低。由於搜索引擎無法真正理解網頁內容的語義,所以單純地利用詞語匹配和統計分析方法,在一定程度上會造成不可避免的理解錯誤。應該說,即使是能夠使用某些智能語義分析功能,也由於處理時間和空間的耗費驚人,所以在商用搜索引擎系統中尚不能廣泛普及。 (思億歐.cn)