百度“觀察盒”原理分析

天刃在和很多站長朋友聊天時,大傢經常會提到這樣的情況:對網站某個頁面做瞭改動之後,百度的排名大降,有的甚至幹脆直接沒有瞭記錄(一些朋友稱之為的被K), 之後便不知也不敢對該頁面做任何改動瞭,但是幾天之後, 發現百度裡又重新出現瞭這個頁面,或是排名又莫名其妙的恢復瞭,大傢對這個問題大惑不解;還有就是對於剛做的新站,經常看到一些朋友在落伍和站長網抱怨為什麼百度還不收錄我的站?,或是看到有的站長欣喜若狂的我的站四天就被百度收錄瞭,或是一些站長充滿疑惑的怎麼百度今天才收錄的,而快照時間卻是一個星期前呢?等等問題,天刃今天就給大傢簡單的解釋一下百度這些情況出現的原因。

以前就和大傢討論過,百度索引和釋放之間有個時間差,對於新站的收錄這個現象最明顯,但是對於一些重視網站優化的站長來說,某個關鍵詞排名跳動異常,甚至一些優化的不是很嚴重的頁面隻是做瞭很小的改動之後便從百度裡消失瞭,提心吊膽幾日後卻又無緣無故的又出現瞭,對於這種情況用索引和釋放的時間差來解釋,似乎有些不通。這樣,天刃用一個天刃自己的概念:百度觀察盒,來給大傢解釋一下這個現象。因為中國國情的特殊,網絡輿論在一定情況下受到國傢政策的約束,所以百度對新站采取的都是先審核再收錄的原則,根據網站的類型(論壇、資訊發佈或是什麼其他網站)、網站的定位(娛樂的,行業的,時政的)不同,審核的嚴格程度也不同,所以就會導致新站被百度收錄的時間沒有一個標準。對於這些新站,百度有沒有一個物理的歸類呢?這裡天刃告訴大傢,有。至於應該叫什麼,我們這裡就暫且把它稱為百度觀察盒。對於新站,百度首先將索引到的內容放入觀察盒,審核通過後將其放出,納入到正常索引的地址庫中,所以有的朋友疑惑為什麼今天百度才收錄,而快照的時間卻是一個星期前的就很好解釋瞭。對於某些網站,或是某些頁面沒理由的被百度從結果裡刪除,而不久後又恢復正常,就像今年6月初百度的大更新,一夜之間數萬網站站長叫苦自己的網站無緣無故被百度K瞭,而幾天之後大部分網站又恢復瞭收錄,排名也基本沒有多大變動。準確的說,這是百度的一次大審核,將所有嫌疑比較大的網站(網址)全部列入到百度的觀察盒中,這樣很多網站就在百度的搜索結果中消失瞭,百度對這些網站進行審核後,確實有作弊嫌疑或違法違規站的,直接K掉,對沒有嚴重作弊的網站,又重新放回到正常網址庫中。

除瞭這樣大規模的審核外,百度會將頁面優化細節明顯的網頁,以及內容修改頻繁的網頁放入觀察盒,確定該頁不存在作弊,百度便會將其放出正常按算法排序,如果該頁有優化細節但不嚴重,便會被適當降權然後放出。

天刃的這個百度觀察盒叫法不一定合適,但其具體的工作模式應該沒有太大出入。希望能為有上述疑問的站長朋友解開疑雲。