基於用戶瀏覽記錄的網頁rank思考的線索

  


  Google的pagerank就無幾紹介了,一個能權衡網頁關緊程度的算法,實質上是網頁互相投票的最後結果,基於這個特別的性質,我們可以經過運用sitemap讓搜索引擎網站盡有可能瀏覽到多的網站內部實質意義,也可以經過多做外鏈來增長網站的PR值,達到SEO的目標。

  市場上大部分數搜索引擎網站都在運用pagerank大致相似的辦法,且為了保障中允性,都認為合適而使用純機器運行的形式,經過網頁爬行動物來遍歷網站,這就顯露出來了一點有趣兒的問題:

  1、一個網頁的內部實質意義是很棒的,不過因為外鏈太少,爬行動物在設定的深度閾值下有可能沒有辦法爬到它,變成了少人問津的暗內部實質意義

  2、局部網站由於PR值頎長,縱然過載的內部實質意義或是價值不高的內部實質意義,也有可能有美好的檢索名次,縱然技術領先的搜索引擎網站認為合適而使用語義網絡的辦法辨別優質內部實質意義,效果依舊不夠好

  為了躲避以上問題,引入用戶數值來判定勝負網頁內部實質意義的關緊性及品質,是一個可研討方向,怎麼做呢?

  如果: 瀏覽行徑趁早長是對網頁品質的最好判定勝負,相當於用戶示明,在大規模數值的事情狀況下,效果應優於機器

  原理:

  1、經過瀏覽器或其它客戶端軟件,最好的防火牆或其它安全軟件,取得用戶瀏覽日記,上傳給搜索引擎網站的爬行動物數值庫,即是獲得用戶瀏覽數值

  2、爬行動物般配已有引得庫,找到未引得內部實質意義,爬之

  3、利用用戶日記給網頁投票,瀏覽時間越長權重越高,計算出網頁的rank

  欠缺:

  1、倚賴客戶端

  2、有用戶隱私問題

  躲避:

  1、提出雲殺毒、雲抗御、雲安全,讓用戶答應上傳瀏覽記錄

  2、偷偷上傳,將瀏覽記錄(其它文件也可以)加密並分拆上傳,在服務器端組合恢復

  好了,思考的線索說完了,來給它起個響當當深奥姓名:peoplerank

  最終,我這是很莊嚴地說技術

  Via i黑馬 By sluke陸蔚青 原文地址:http://luplusplus.com/peoplerank-modle