解析百度不收錄內頁的端由

　　如今谷歌已經離我們漸行漸遠，百度就變成我們站長的最大的山頭。在網站優化戰爭中，牢穩的收錄直接影響了網站的流量、收益。為什麼網站首頁快照更新很快，可就是不收錄內頁?

　　以下總結概括了幾點網站內頁百度不收錄的端由剖析與對策，和大家一塊兒商議，研討。

　　端由1：robots設置錯誤造成內頁不受引擎蛛蛛爬動引得

　　舉例：嚴禁搜索引擎網站收錄網站的某些目次：

　　User-agent: *

　　Disallow: /目次名1/

　　Disallow: /目次名2/

　　Disallow: /目次名3/

　　對策：查緝是否語法不正確屏蔽了蛛蛛爬動，那裡面涵蓋meta robots與nofollow等標簽的的設置。

　　端由2：百度已經引得了但還未放出來名次。百度對文章的收錄需求一段審查核定時間，蛛蛛抓取成功引得內部實質意義錄入數值庫，需求通過二次檢查核對是否為SPAM而後纔放出參加名次，放出的時間與網站權重高低有著直接的關系，百度周期更新纔放出收錄是新站最為常見的現象。

　　對策：我們要做的辦公就是保障定期定量的更新、仔細查看網站日記，只要蛛蛛正常爬動，就靜心等待著，一定會有欣喜的。

　　端由3：網站內裡鏈接存在問題，譬如有數量多不正確鏈接、不好的網站鏈接，蛛蛛爬吃不開暢沒有辦法抓取，不好網址鏈接造成網站降權。

　　對策：針對首頁、頻帶等各個關緊頁面做不正確鏈接查緝(可以仔細查看谷歌站長工具的抓取不正確)，查緝留言板、述評等網友相互作用功能的不好鏈接，防止與不好網站互鏈。

　　端由4：文章原創度問題，頭部標簽的設置造成頁面大致相似重復，還是搜集頁面非常多，因百度數值庫中已經存在數量多的相仿信息而不收錄，長時期地操作會造成百度降權。

　　對策：應當維持文章的原創度(偽原創信任朋友們都知道得清楚)，品質比數目更關緊，最好是能每日定時更新讓百度對你網站抓取也有守時的好習性。

　　由原創，過載請注明來源。

The Blog