墨明棋妙話搜索:看看淘寶網的『私服』現象

  在百度搜索引擎網站又發生了有趣兒的事物,搜索私服傳奇私服新開傳奇私服等網站關鍵詞,淘寶網女人頻帶均排在盛大的位置(見下述圖片PS:周一早兒上起來看,發覺此現象已經消逝!暫不知是為算法變更,仍然人工過問)。這個消息兒在站長圈子裡炸開了鍋,數量多的站長朋友對此現象提出了自個兒的疑問,下邊墨明棋妙在此對這個現象做出自個兒的詮釋,也針對性的解釋回答一下子比較典型的一點疑問。

  很多同學看見這個現象後的第1反響是:淘寶去掉消除了對百度的robots屏蔽,被百度收錄了。在這處墨明棋妙首先匡正這個不正確的講法。淘寶並沒有去掉消除對百度的屏蔽,我們敞開淘寶網的robots頁面http://taobao.com/robots.txt,我們看見淘寶網的robots設置如下所述:

  User-agent: Baiduspider

  Disallow: /

  User-agent: baiduspider

  Disallow: /

  可以表面化的看出,淘寶網屏蔽百度蛛蛛抓取全站信息,那末,在百度搜索為何還能seo看見淘寶的頁面呢?

  在這處,首先要詮釋兩個表名稱的詞,抓取和引得。百度蛛蛛抓取是指蛛蛛爬行動物在互聯網上爬動、過訪頁面並取得頁面內部實質意義回返數值庫。而引得則是將數值庫中的內部實質意義展覽在搜索引擎網站中供用戶過訪。很多SEO朋友常常有疑問,百度蛛蛛天天兒來我的站抓取數值,為何收錄數仍然那末少?這本質上是由於蛛蛛抓取後並沒有作為數值樹立引得的端由。蛛蛛抓取數值後不盡然引得,而搜索引擎網站引得數值一樣不盡然需求抓取。這本質上是百度搜索引擎網站為優化用戶體驗認識而認為合適而使用的一種策略。對於不准許被百度抓取的網站,假如其它站點對其施行描寫和指向,那末百度會利用其它站點所獲悉的信息經過自身的策略對該站點施行引得,並參加到搜索引擎網站網站關鍵詞排序中。而淘寶網女性頻帶,這是因為這種端由,顯露出來在了百度的引得中,一樣,淘寶網很多其它的頁面被百度引得,也是出於這個端由。

  那末,為何在搜索傳奇私服等網站關鍵詞時,淘寶網為何會以私服類的題目顯露出來呢?這還得歸結到百度自身的策略上。不少SEOer都曉得,在幾年初,就有百度等搜索引擎網站將DMOZ對網站的題目描寫內部實質意義植入引得中供用戶搜索的例子。這種現象一般表如今網站屏蔽抓取、網站沒有辦法過訪、網站性質,題目,內部實質意義顯露出來大規模的改動 等幾種事情狀況下。搜索引擎網站融會貫通過其外鏈指向半自動為其挑選一個與現時搜索煩請最有關的題目展覽。淘寶網的題目現象,正是出於此種端由。

  實際上大家最關心注視的,仍然淘寶網為何在這些個網站關鍵詞上獲得了這麼優秀的名次。我覺得,會有朋友給出如下所述解釋回答:有數量多的外部鏈接指向淘寶網女人頻帶,造成這個頁面權重極高,所以在題目表達為傳奇私服的時刻能獲得十分好的名次。我覺得這種講法只是對了二分之一,並沒有抓到最實質的端由。

  本質上,這種基於鏈接關系的搜索引擎網站排序主要有賴幾大算法:超鏈接導向搜索(HITS)算法、TF-IDF算法(有關性算法)和PR算法。由於PR算法得出的數值在時期內是比較牢穩的,所以剖析這個現象,我們並不必將PR算法做過多的思索問題。下邊紹介一下子HITS算法:HITS算法基本思想是利用頁面之間的援用鏈來開鑿隱含在那裡面的有用信息(如權威性),具備計算簡單且速率高的獨特的地方。HITS算法經過兩個名聲權值——內部實質意義權威度(Authority)和鏈接權威度(Hub)來對網頁品質施行評估。內部實質意義權威度與網頁自身直接供給內部實質意義信息的品質有關,被越多網頁所援用的網頁,其內部實質意義權威度越高;鏈接權威度與網頁供給的超鏈接頁面的品質有關,援用越多高品質頁面的網頁,其鏈接權威度越高。HITS算法覺得對每一個網頁應當將其內部實質意義權威度和鏈接權威度分開來思索問題,在對網頁內部實質意義權威度做出名聲的基礎上再對頁面的鏈接權威度施行名聲,而後給出該頁面的綜合名聲。經過這段詮釋,我們可以看見的是,淘寶網女人頻帶是有著極高的內部實質意義權威度的。

  而這,還並不完全可以讓淘寶網女性頻帶達到這麼優秀的名次,國內比淘寶網女性頻帶外鏈大量的仍然有眾多,而其它站點卻並沒有在此網站關鍵詞上獲得名次。這是為何呢?

  說到這處,感到只得提一下子正題漂移現象,正題漂移現象是指對於一點大站,其自身權重極高在這以後,造成只要其網頁顯露出來的網站關鍵詞,都能獲得美好的名次的一種現象,這種現象在早期的搜索引擎網站中常常顯露出來,而如今,絕大部分數搜索引擎網站都認為合適而使用了各自的算法對此現象施行了美好的遏制,主要思考的線索即為:判斷網站的正題,給與正題越有關的網站關鍵詞越高的權重,與正題有關度越低該網站關鍵詞權重越低,再將這個值與HITS算法最後結果施行加權,因此減低低有關度的網站關鍵詞名次。即所謂TF-IDF算法(有關性算法)。比如我的博客,正題為深圳SEO,在這個詞上,也有不賴的權重,而搜索深圳趕街網,卻沒有不論什麼名次,我的首頁也顯露出來了趕街網,本質上這是和我的博客有關度極低的詞,所以在這個詞上權重得分極低,所以也就不會有名次。話說歸來,對於淘寶網女人頻帶呢?這個頻帶自身是屏蔽百度搜索引擎網站的,那末百度是沒有辦法經過取得其內部實質意義來判斷指向它的站與它的有關性的,那末,百度是怎麼樣判斷的呢?

  墨明棋妙覺得,百度在沒有辦法獲悉網頁內部實質意義的事情狀況下,將綜合網站全部外鏈指向的文本信息,以資作為網頁內部實質意義來和任一外鏈相比較因此判斷有關性,那末顯而易見的是,越多相同錨文本相同的詞指向淘寶網女人頻帶,該網站關鍵詞將取得越高名次,那末得出的論斷是:有朋友開了個小小的玩笑,利用私服類網站關鍵詞給淘寶網女人頻帶做了較多的外鏈,造成此頻帶在私服類網站關鍵詞名次極端急速上昇。

  一個小小的BUG,卻也顯露出百度一點技術方面的不充足,回望Google,仿佛好象並沒顯露出來這個現象。搜索的路子,還有很長。本文站長供稿!墨明棋妙的中國搜索引擎網站優化交流團體(QQ群號142437034)熱烈歡迎大家參加,並肩探尋搜索引擎網站的神秘!