張壽錦:淺析百度不收錄內容頁面的四大因素

現如今,相信每一個SEOer都知道一個網站的主要流量來自於不同的長尾關鍵詞的集合。而長尾關鍵詞卻都分佈在網站的內容頁面裡,因此對於一個網站而言,百度不收錄內容頁面也就意味著長尾關鍵詞無法得到良好的排名,也會意味網站無法獲得更多的流量。百度不收錄內容頁面對於現在來說已經是常見的問題瞭,那麼是什麼原因導致百度不收錄內容頁面呢?下面小編根據自己所知道的來說說自己的看法。 內容相識度過多 隨著這幾年SEOer的軍隊越來越大,因此內容對於百度自身而言已經不再像以前那麼缺乏瞭。作為一名合格的SEOer而言除去其他瑣碎的優化外,每天更新內容是必不可少的一件功課。那麼我們是否有考慮到自己所更新的內容百度會收錄呢?大傢都知道百度喜歡原創的內容,因此我們也不斷的追隨的百度的步伐,每天較勁腦汁的在寫原創來維護網站。然而我們會忽略的百度對內容的抓取判斷能力,所有有時候即使我們是一字一句的碼上去,但是對於百度而言我們辛苦碼出來的文章依舊還是屬於偽原創,這也是導致如今很多網站內容頁面不收錄的問題之一。 網站結構相識度過多 許多SEOer並不懂得代碼這些東西,即使懂得那也是懂一些簡單的HTML語句而已。而作為一些苦逼的站長們而已,請人設計網站似乎需要太大的金錢來損耗,這是一個苦逼站長不願意去做的事情。因此大傢都開始在百度裡尋找自己中意的模板來套用。殊不知相同的一種模板框架在互聯網上已經被使用瞭千萬遍,百度對於這類網站的判斷能力現在也開始關註起來瞭。試問下一種模板框架風格分瞭成千上萬的網站出來,讓百度如何判斷那個不叫好呢?應該收錄那個比較好?對於這類情況筆者也曾經測試過,因此大膽的猜測出來,不相信的你也可以自己去測試下的! 抄襲采集過多 對於一個企業網站來說,大部分的站長不願意去采集內容。因為對於優化一個企業網站來說,前期的優化工作做好之後,每天更新的內容量並不大,往往隻需要1-3篇的文章就可以滿足瞭。如果連這個都要采集的話,除非兩張情況。一、說得不好聽點的就是腦殘、二、可能是這個站長每天的工作量過多,沒時間來完成,因此才會去采集。而對於一個大量網站來說,筆者也建議每天都以原創的內容去更新維護,如果做不到這點的話,可以采集部分內容,自己手動原創一部分去更新維護,這樣會比較好一點。雖然筆者不怎麼喜歡采集別人的文章,但是也是無可奈何的。而抄襲采集回來的內容也是難以被百度收錄的,因此建議大傢不要去采集別人的文章內容。 網站外鏈質量因素 外鏈對於優化來說至今還是至關重要的一個環節,一個網站沒有外鏈的支撐根本的無法獲得排名和權重的,更得不到推廣的效果。而外鏈的質量卻是決定網站能否得到權重的傳遞因素。一個好的外鏈可以得到大量的權重傳遞以及百度友好的爬行。相反,一個垃圾的灌水外鏈,不僅得不到權重的傳遞更 不會讓百度去爬行你的這條連接,因為同一頁面出現無數條連接,百度是很少會爬行抓取的。而能不能爬行到你的鏈接,這個就是另外一回事瞭。所有網站外鏈的質量也是導致百度不收錄內容頁面的關鍵之一。 以上是張壽錦親自測試後猜測出來的結果,雖然看上去都是一些老生常談的問題,然而也是很多SEOer經常會忽略的一些問題,筆者更希望大傢在優化前能夠清晰的知道自己應該需要做那些方面的工作內容。 最後本文由小資女/創始人張壽錦譯稿,歡迎大傢一起來參與探討,轉載內容請珍惜別人勞動成果註明文章來源出處!