到現在為止個性化搜索的不充足點

  總體而言,應用於搜索引擎網站中的Web個性化信息引薦服務可以吸收傳統電子商業上的事務領域中的Web個性化信息引薦服務。不過,具備和現代電子商業上的事務領域中個性化引薦系統相仿功能的搜索引擎網站卻很少遭受許多人的注意。也就是說,現代搜索引擎網站尚不可以廣泛地供給個性化搜索最後結果,對不一樣用戶的一個相同查問的搜索最後結果老是相同的,它與提交處理查問的用戶無關。因為這個,因為在檢索階段疏忽了用戶的個性化需要特點標志,所以對特別指定用戶而言,搜索引擎網站常常回返數量多的無用信息。導致這種現象的主要端由在於現代搜索引擎網站面對一點和傳統個性化信息引薦系統相仿的問題,具體如下所述。

  首先,用戶需要難於管用表現。這主要有兩個端由:一方面,因為普通非專業用戶都匱缺需要表現的訓練,所以來不得效了解和表現自個兒的信息需要,萌生的後果就是用戶的主觀了解往往就並不明確。形象地說,這種現象就是用戶沒有辦法描寫他要找啥子,錯非讓他看見想找的物品。另一方面,這也來自於系統沒有辦法准確地取得有關用戶個性化信息,這主要是因為網絡信息檢索系統中一般不具備主動取得用戶個性化特點標志的功能,同時也沒有要求用戶務必提交處理個性化信息能力運用的限止。上面所說的兩個方面的最後效果都會萌生系統沒有辦法管用取得用戶個性化特點標志信息的現象。

  其次,檢索最後結果正確化和檢索迅速化之間存在矛盾。在處置搜索引擎網站的海量數值時,眾多傳統的個性化引薦技術通例會萌生嚴重的性能問題,這些個主要適合使用於傳統小規模商業上的事務網站中的個性化算法和技術往往匱缺令人滿意的縮放性。當然,許多人也提出了一點解決辦法,如維數約減、聚類剖析和貝葉斯網絡等,固然在一定程度上能夠解決縮放性問題,不過這些個技術往往是經過在離線階段抽抽取原始數值中的標准樣式信息,並於在線階段運用這些個標准樣式來獲得引薦聚齊,所以這些個辦法固然可以減損在線的處置開銷,不過每常萌生引薦最後結果不正確的事情狀況,同時在線計算的復雜度也會隨著標准樣式的增多而增加。

  最終,現代搜索引擎網站的檢索智能化水准還是較低。因為搜索引擎網站沒有辦法真正了解網頁內部實質意義的語義,所以天真地利用詞和詞組般配和計數剖析辦法,在一定程度上會導致必然性的了解不正確。應當說,縱然是能夠運用某些智能語義剖析功能,也因為處置時間和空間的浪費令人吃驚,所以在商用搜索引擎網站系統中尚不可以廣泛普及。

  筆者: 杭州思億歐網絡科學技術有限企業

  原載: .cn

  版權聲明:原創編品,准許過載,過載時請必須以超鏈接方式標見於文字章 原始來源 、筆者信息和本

  聲明。否則將追究法律責任。