解讀百度的收錄和清除站點規則

  在網上見到一網友發的一個帖子,要求百度制定搜索收錄規則,而實際上百度早就已經制定瞭名為百度與站長的建站指南,公佈瞭如何讓網站被百度收錄,什麼樣的網站會被百度拒絕收錄或拋棄等相關條款。在我的《百度反作弊手段失去公信力》一文中,我提到:這些條款太過籠統,而在實際中可以被其意解釋和曲解,並無實際的操作意義。那麼,本文,石頭就針對百度對應的拒絕收錄和懲罰站點的相關條款進行分析.以讓更多的人瞭解百度的相關規則。

  百度相關規則的全文見於《百度與站長》,仔細閱讀完畢,可以得出,一個站點被百度拒絕收錄或懲罰的可能原因有如下幾條(註意:每一條後面加上瞭對應的分析):

  1、在標題中堆積與正文無關的關鍵詞。

  強調瞭標題和網站內容的相互呼應,如果標題中涉及到某一關鍵詞,而實際網站內容中與該關鍵詞無關的話,那麼可能會百度刪除.這一條款反映瞭百度的嚴格.但值得思考的是,百度是用什麼方法去判斷網站的內容與標題關鍵詞的相關性呢?是不是標題出現瞭某關鍵詞,正文就一定要出現呢???如果不是,那麼百度目前的搜索技術難道能象人一樣,會從意義和邏輯上去分析?比如機器能不能判斷區標題中的亞克力跟正文中提到的有機玻璃是同一個意思呢?當然,如果百度全部采用人工審核站點,那麼這一條就非常好,非常有操作性!但是這樣又出現一個問題,人工審核相關不相關,以誰的說法為準?

  2、使用自動跳轉的頁面,可能會被百度丟棄。

  這一條不需多評論,主要針對一些作弊行為采用的跳轉.大多數搜索引擎都會有類似的條款.

  3、在同一個頁面上,不要有過多鏈接。在那些站點地圖類型的頁面上,請把重要的內容給出鏈接,  而不是所有細枝末節。鏈接太多,也可能會導致無法被百度收錄.

  究竟多少連接,才算過多??Google好呆還建議最好不要超過100個,百度呢?百度憑這一條就可以任意的懲罰大部分的大型站點,大部分的大型站點首頁都有瞭那麼好幾十個甚至好幾百個連接的.

  4、如果您的站點做瞭很多針對百度的優化,但卻給用戶帶來大量負面體驗,那麼,您的站點最終可能還是會受到百度的冷落。

  什麼叫過多針對百度的優化呢?能不能有詳細一點的標準?雖然這句話的意思是非常好,似乎任何一個有良知的網民都應該叫好,但是關鍵問題在於具體操作標準是什麼?過度優化和負面體念,任何人都有不同的看法。比如我就是覺得百度搜索結果第一頁全是廣告,影響瞭我的感受,是不是該刪除?

  5、對於已經被重復瞭千百遍的內容,百度可能會不予收錄。

  這一點,不做評論。隻是提醒大傢復制內容也要找一點有新意的。

  相關閱讀:

  百度與站長